BRPI0707784A2

BRPI0707784A2 - xilanases, ácidos nucléicos que as codificam e métodos para produzì-las e usá-las

Info

Publication number: BRPI0707784A2
Application number: BRPI0707784-0A
Authority: BR
Inventors: David Weiner; David Blum; Alexander Varvak; Shaun Healey; Kristine Chang; Geoff Hazlewood; Thomas Todaro; Grace Desantis; Hwai Chang; Connie Jo Hansen; Scott W Beaver; Thomas Woodward; Charles Hancock
Original assignee: Verenium Corp
Priority date: 2006-02-14
Filing date: 2007-02-14
Publication date: 2011-04-26
Also published as: DK1989302T3; BRPI0707784B1; WO2007095398A2; US20090155238A1; TR201809912T4; EP1989302A2; CA2946924A1; USRE45660E1; PL1989302T4; US8043839B2; US20150139977A1; CA2638801A1; EP1989302A4; EP2548956A1; ES2682284T3; EP2548954A1; WO2007095398A3; EP1989302B1; PL1989302T3; EP2548955A1

Abstract

XILANASES, áCIDOS NUCLéICOS QUE AS CODIFICAM E MéTODOS PARA PRODUZI-LAS E USá-LAS A presente invenção refere-se a enzimas que têm atividade de xilanase, mananase e/ou glicanase, por exemplo, catalisar a hidrólise de li- gações <225>-1 ,4-xilosídicas internas ou ligações de endo-<225>-1 ,4-glicanase; e/ou degradar um polissacarídeo beta-1 ,4-xiíano linear em xilose. Dessa forma, ainvenção fornece métodos e processos para quebrar hemicelulose, que é um componente principal da parede celular de plantas, incluindo métodos e processos para hidrolisar hemiceluloses em qualquer planta ou madeira ou pro-duto de madeira, resíduo de madeira, polpa de papel, produto de papel ou resíduo ou subproduto de papel. Além disso, métodos de desenhar as novas xilanases, mananases e/ou glicanases e métodos de uso dessas também são fornecidos. As xilanases, mananases e/ou glicanases têm atividade e estabilidade aumentadas em pH e temperatura aumentados.

Description

Relatório Descritivo da Patente de Invenção para "XILANASES,ÁCIDOS NUCLÉICOS QUE AS CODIFICAM E MÉTODOS PARA PRODU-ZI-LAS E USÁ-LAS".

SUBMISSÃO EM DISCO COMPACTO

O conteúdo dessa submissão em disco compacto estáincorporado aqui por referência na sua totalidade: Uma forma legível porcomputador (CRF) da Listagem de Seqüência em disco compacto (nome doarquivo: 564462007967, data da gravação: 14 de fevereiro de 2007,tamanho: 1.851.392 bytes); uma cópia da triplicata do disco compacto daListagem de Seqüências (CÓPIA 1) (nome do arquivo: 564462007967, datada gravação: 14 de fevereiro de 2007, tamanho: 1.851.392 bytes); uma cópiada triplicata do disco compacto da Listagem de Seqüências (CÓPIA 2)(nome do arquivo: 564462007967, data da gravação: 14 de fevereiro de2007, tamanho: 1.851.392 bytes); uma cópia da triplicata do disco compactoda Listagem de Seqüências (CÓPIA 3) (nome do arquivo: 564462007967,data da gravação: 14 de fevereiro de 2007, tamanho: 1.851.392 bytes).

CAMPO DA INVENÇÃO

Essa invenção refere-se geralmente a enzimas, polinucleotídeosque codificam as enzimas, o uso de tais polinucleotídeos e polipeptídeos emais especificamente a enzimas que têm atividade de xilanase, porexemplo, que catalisam a hidrólise de ligações p-1,4-xilosídicas internas ouligações endo-β-1,4-glicanase; e/ou que degradam um polissacarídeo beta-1,4-xilano linear em xilose; ou uma atividade de glicanase, por exemplo, umaatividade de endoglicanase, por exemplo, catalisam a hidrólise de ligaçõesendo-β-1,4- e/ou 1,3-glicanase internas, uma atividade de xilanase e/ou umaatividade de mananase. Assim, a invenção fornece métodos e processospara quebrar hemicelulose, que é um componente importante'da paredecelular de plantas, incluindo métodos e processos para hidrolisarhemiceluloses em qualquer composto orgânico, planta ou madeira ouproduto ou subproduto de madeira, resíduo de madeira, polpa de papel,produto de papel ou resíduo ou subproduto de papel.ANTECEDENTES

Xilanases (por exemplo, endo-1,4-beta-xilanase, EC 3.2.1.8)hidrolisam ligações β-1,4-xilosídicas internas em xilano para produzir xilosee xilo-oligômeros de peso molecular menor. Xilanos são polissacarídeosformados a partir de D-xilopiranoses 1,4-p-glicosídeo-ligada. Xilanases sãode considerável valor comercial, sendo usadas na indústria da alimentação,para cozimento e processamento de frutas e vegetais, degradação deresíduo agrícola, na produção de ração animal e na produção de polpa epapel. Xilanases são formadas por fungos e bactérias.

Arabinoxilanos são importantes polissacarídeos não-amiláceosde cereais representando 2,5 a 7,1% p/p dependendo da variedade econdições de cultivo. As propriedades físico-químicas desse polissacarídeosão tais que ele dá origem a soluções viscosas ou até mesmo géis sobcondições oxidativas. Além disso, arabinoxilanos têm grande capacidade dese ligar a água e podem ter um papel na estabilidade de espuma deproteína. Todas essas características apresentam problemas para váriasindústrias incluindo cervejarias, panificação, nutrição animal e fabricação depapel. Em cervejarias, a presença de xilano resulta em problemas defiltrabilidade do malte e formação de opacidade. Em panificação(especialmente para biscoitos e bolachas), esses arabinoxilanos criammassas pegajosas que são difíceis de processar e reduzem o tamanho dobiscoito. Além disso, esse carboidrato está implicado na rápida reidrataçãodo produto assado resultando em perda da crocância e vida útil reduzida.Para fabricação na alimentação de animal monogástrico com dieta decereais, arabinoxilano é um importante fator que contribui para a viscosidadedo conteúdo intestinal e através disso afeta adversamente a digestibilidadedo alimento e a taxa de crescimento do animal. Para animais ruminantes,esses polissacarídeos representam componentes substanciais de ingestãode fibra e a digestão mais completa de arabinoxilanos pode facilitar maioreficiência ná conversão do alimento.Xilanases se mostraram úteis no bioalvejamento e tratamento depolpas químicas (veja, por exemplo, Patente U.S. N°. 5.202.249),bioalvejamento e tratamento de polpas de madeira ou papel (veja, porexemplo, Patente U.S. Nos. 5.179.021, 5.116.746, 5.407.827, 5.405.769,5.395.765, 5.369.024, 5.457.045, 5.434.071, 5.498.534, 5.591.304,5.645.686, 5.725.732, 5.759.840, 5.834.301, 5.871.730 e 6.057.438), emreduzir a Iignina na madeira e modificar madeira (veja, por exemplo, PatenteU.S. Nos. 5.486.468 e 5.770.012) como beneficiadores de farinha, massa epão (veja, por exemplo, Patente U.S. Nos. 5.108.765 e 5.306.633), comoaditivos e/ou suplementos alimentares, como descrito acima (veja, porexemplo, Patente U.S. Nos. 5.432.074, 5.429.828, 5.612.055, 5.720.971,5.981.233, 5.948.667, 6.099.844, 6.132.727 e 6.132.716), na produção desoluções de celulose (veja, por exemplo, Patente U.S. N°. 5.760.211).

Composições detergentes que têm atividade de xilanase são usadas parafruta, vegetais e/ou compostos de barro e argila (veja, por exemplo, PatenteU.S. N°. 5.786.316). Xilanases também podem ser usadas na hidrólise dehemicelulose para a qual é seletiva, particularmente na presença decelulose. Além disso, o retentado rico em celulase é adequado para ahidrólise de celulose (veja, por exemplo, Patente U.S. N°. 4.725.544).

Permanece uma necessidade na técnica por xilanases para serusadas na indústria de papel e polpa, por exemplo, onde a enzima é ativa nafaixa de temperatura de 659C a 75eC em um pH de aproximadamente 10.Além disso, uma enzima útil na indústria de papel e polpa poderia diminuir anecessidade de branqueadores químicos, tal como dióxido de cloro.

SUMÁRIO DA INVENÇÃO

A invenção fornece enzimas que têm: atividade de xilanase, porexemplo, que catalisam a hidrólise de ligações p-1,4-xilosídicas internas ouligações endo-β-1,4-glicanase; e/ou que têm uma atividade de glicanase, porexemplo, uma atividade de endoglicanase, por exemplo, que catalisam ahidrólise de ligações internas endo-β-1,4- e/ou 1,3-glicanase, uma atividadede xilanase e/ou uma atividade de mananase; e ácidos nucléicos quecodificam as mesmas, vetores e células que compreendem as mesmas,sondas para amplificar e identificar esses ácidos nucléicos que codificamxilanase e métodos para fazer e usar esses polipeptídeos e peptídeos.

Por exemplo, a invenção fornece enzimas que têm atividade dexilanase e composições e métodos que compreendem as mesmas, parahidrolisar ligações β-1,4-xilosídicas internas ou ligações endo-p-1,4-glicanase ou hemiceluloses, em madeira, produto de madeira, polpa depapel, produto de papel ou resíduo de papel. Em um aspecto, a atividade dexilanase compreende catalisar a hidrólise de xilano, por exemplo, degradarum polissacarídeo beta-1,4-xilano linear em uma xilose. Assim a invençãofornece métodos e processos para decompor uma composição quecompreende xilano e/ou uma hemicelulose, que é um componenteimportante da parede celular de plantas.

Em um aspecto, a atividade de glicanase de um polipeptídeo oupeptídeo da invenção (que inclui uma proteína ou peptídeo codificado porum ácido nucléico da invenção) compreende uma atividade deendoglicanase, por exemplo, atividade de endo-1,4- e/ou 1,3-beta-D-glican4-glicano hidrolase. Em um aspecto, a atividade de endoglicanasecompreende catalisar a hidrólise de ligações 1,4-beta-D-glicosídicas. Em umaspecto, a atividade de glicanase, por exemplo, endoglicanase, compreendeuma atividade de endo-1,4- e/ou 1,3-beta-endoglicanase ou atividade deendo-β-1,4-glicanase. Em um aspecto, a atividade de glicanase (porexemplo, atividade de endo-1,4-beta-D-glican 4-glicano hidrolase)compreende a hidrólise de ligações 1,4-beta-D-glicosídicas em celulose,derivados de celulose (por exemplo, carbóxi metil celulose e hidróxi etilcelulose), liquenina, ligações beta-1,4 em beta-1,3 glicanos mistas, taiscomo beta-D-glicanos de cereais e outro material de planta contendo partescelulósicas. Em um aspecto, a atividade de glicanase, xilanase ou mananasecompreende hidrolisar um glicano ou outro polissacarídeo para produzir umpolissacarídeo ou oligômero de menor peso molecular. Em um aspecto, oglicano compreende um beta-glicano, tal como um beta-glicano solúvel emágua.

A invenção fornece enzimas, composições, métodos eprocessos para hidrolisar hemiceluloses em qualquer matéria orgânica,incluindo células, plantas e/ou madeira ou produtos de madeira, resíduos demadeira, polpa de papel, produtos de papel ou resíduos ou subprodutos depapel.

Em outro aspecto, a invenção fornece polipeptídeos que têmatividade lignocelulotíca (lignocelulósica), por exemplo, uma atividadeligninolítica e celulolítica, incluindo, por exemplo, que têm uma atividade dehidrolase, por exemplo, uma atividade de glicosil hidrolase, incluindoatividade de celulase, glicanase, xilanase e/ou mananase e ácidos nucléicosque codificam os mesmos e métodos para fazê-los e usá-los. A invençãofornece enzimas para a bioconversão de qualquer biomassa, por exemplo,um resíduo lignocelulósico em açúcares fermentáveis ou polissacarídeos; eesses açúcares ou polissacarídeos podem ser usados como matéria-primaquímica para a produção de álcoois tais como etanol, propanol, butanol e/oumetanol e na produção de combustíveis, por exemplo, biocombustíveis taiscomo gases ou líquidos sintéticos, tais como gás de síntese.

Em um aspecto, as enzimas da invenção têm uma taxa catalíticaaumentada para melhorar o processo de hidrólise do substrato (por exemplo,um resíduo lignocelulósico, celulose, bagaço). Essa eficiência aumentada nataxa catalítica leva a uma eficiência aumentada na produção de açúcares oupolissacarídeos, o que pode ser úteis em aplicações industriais, agrícolas oumédicas, por exemplo, para fazer um biocombustível ou um álcool tal comoetanol, propanol, butanol e/ou metanol. Em um aspecto, os açúcaresproduzidos pela hidrólise usando enzimas dessa invenção podem serusados por microrganismos para a produção de álcool (por exemplo, etanol,propanol, butanol e/ou metanol) e/ou produção de combustível (por exemplo,biocombustível).

A invenção fornece aplicações industriais, agrícolas ou médicas:por exemplo, biomassa para biocombustível, por exemplo, etanol, propanol,butanol e/ou metanol, usando enzimas da invenção que têm custosdiminuídos com enzimas, por exemplo, custo diminuído em biomassa paraprocessos de conversão de biocombustível. Assim, a invenção forneceprocessos eficazes para a produção de bioalcóois, biocombustíveis e/oucomposições que compreendem bicombustível (por exemplo, bioetanol,propanol, butanol e/ou metanol), incluindo combustíveis sintéticos, líquidosou gás compreendendo um bioálcool, de qualquer biomassa.

Em um aspecto, enzimas da invenção, incluindo os "coquetéis" deenzimas da invenção ("coquetéis" significando misturas de enzimas quecompreendem pelo menos uma enzima dessa invenção), são usadas parahidrolisar os componentes principais de uma biomassa lignocelulósica, ou dequalquer composição que compreende celulose e/ou hemicelulose(biomassa lignocelulósica também compreende lignina), por exemplo,sementes, grãos, tubérculos, resíduo de planta (tal como uma forragem oupalha, por exemplo, palha de arroz ou uma palha de trigo, ou qualquer talossecos de qualquer cereal) ou subprodutos de processamento de alimento ouprocessamento industrial (por exemplo, talos), milho (incluindo espigas,palha e semelhantes), gramíneas (por exemplo, grama Indiana, tal comoSorghastrum nutans; ou "switchgrass", por exemplo da espécie Panicum, talcomo Panicum virgatum), madeira (incluindo lascas de madeira, resíduo deprocessamento, tal como resíduo de madeira), papel, polpa, papel reciclado(por exemplo, jornal); também incluindo um monocotiledôneo oudicotiledôneo ou milho monocotiledôneo, cana-de-açúcar ou partes destes(por exemplo, pontas da cana), arroz, trigo, cevada, "switchgrass" ouMiscanthus; ou uma cultura de semente oleaginosa de dicotiledônea, soja,canola, colza, linho, algodão, óleo de palma, beterraba, amendoim, árvore,álamo ou tremoceiro; ou madeiras ou subprodutos de processamento demadeira, tais como resíduo de madeira, por exemplo, no processamento damadeira, indústria de polpa e/ou papel, indústria têxtil e em agentes delimpeza doméstica e industrial e/ou no processamento de resíduo debiomassa.Em um aspecto, enzimas da invenção são usadas parahidrolisar celulose que compreende uma cadeia linear de porções de glicoseβ-1,4-ligadas e/ou hemicelulose como uma estrutura complexa que varia deplanta para planta. Em um aspecto, as enzimas da invenção são usadaspara hidrolisar hemiceluloses que contêm uma cadeia principa de moléculasde xilose β-1,4-ligadas com ramificações intermitentes de arabinose,galactose, ácido glicurônico e/ou manose. Em um aspecto, as enzimas dainvenção são usadas para hidrolisar hemicelulose que contêm constituintesnão-carboidratos tais como grupos acetila em xilose e ésteres de ácidoferúlico em arabinose. Em um aspecto, as enzimas da invenção são usadaspara hidrolisar hemiceluloses covalentemente ligadas à Iignina e/ouacopladas a outros filamentos de hemicelulose através de ligações cruzadasde diferulato.

Em um aspecto, as composições e métodos da invenção sãousados na digestão enzimática de biomassa e podem compreender o uso devárias enzimas diferentes, incluindo celulases e hemicelulases. Enzimasligocelulósicas usadas na prática da invenção podem digerir celulose paraaçúcares monoméricos, incluindo glicose. Em um aspecto, as composiçõesusadas para praticar a invenção podem incluir misturas de enzimas, porexemplo, glicosil hidrolases, glicose oxidases, xilanases, xilosidases (porexemplo, β-xilosidases), celobioidrolases e/ou arabinofuranosidases ououtras enzimas que podem digerir a hemicelulose até açúcaresmonoméricos. Misturas da invenção podem compreender, ou consistir em,apenas enzimas dessa invenção, ou podem incluir pelo menos uma enzimadessa invenção e outra enzima que também pode ser uma enzimaiignocelulósica e/ou qualquer outra enzima.

Em um aspecto, as enzimas da invenção têm uma atividade deglicanase, por exemplo, uma endoglicanase, por exemplo, que catalisa ahidrólise de ligações endo^-1,4- e/ou p-1,3-glicanase internas. Em umaspecto, a atividade de endoglicanase (por exemplo, atividade de endo-1,4-beta-D-glican 4-glicano hidrolase) compreende a hidrólise de ligações 1,4-e/ou β-1,3- beta-D-glicosídicas em celulose, derivados de celulose (porexemplo, carbóxi metil celulose e hidróxi etil celulose), liquenina, ligaçõesbeta-1,4 em beta-1,3 glicanos mistos, tais como beta-D-glicanos ouxiloglicanos de cereal e outros materiais de planta que contêm partescelulósicas.

Em modalidades alternativas, a invenção fornece polipeptídeos(e os ácidos nucléicos que codificam os mesmos) que têm pelo menos umasubstituição de aminoácido conservativa e que retêm sua atividade dexilanase, mananase ou glicanase; ou em que pelo menos uma substituiçãode aminoácido conservativa compreende substituir um aminoácido por outroaminoácido de características semelhantes; ou uma substituiçãoconservativa compreende: substituição de um aminoácido alifático por outroaminoácido alifático; substituição de uma Serina por uma Treonina ou vice-versa; substituição de um resíduo ácido por outro resíduo ácido; substituiçãode um resíduo que carrega um grupo amida por outro resíduo que carregaum grupo amida; troca de um resíduo básico por outro resíduo básico; ousubstituição de um resíduo aromático por outro resíduo aromático.

Em modalidades alternativas, a invenção fornece polipeptídeos(e os ácidos nucléicos que codificam os mesmos) que têm atividade dexilanase, mananase e/ou glicanase, mas que não têm uma seqüência desinal, um domínio prepro, um domínio de doquerina e/ou um módulo deligação a carboidrato (CBM); e em um aspecto, o módulo de ligação acarboidrato (CBM) compreende, ou consiste em, um módulo de ligação aoxilano, um módulo de ligação à celulose, um módulo de ligação à lignina, ummódulo de ligação à xilose, um módulo de ligação à mananase, um móduloespecífico para xiloglicano e/ou um módulo de ligação àarabinofuranosidase.

Em modalidades alternativas, a invenção fornece polipeptídeos(e os ácidos nucléicos que codificam os mesmos) que têm atividade dexilanase, mananase e/ou glicanase compreendendo ainda uma seqüênciaheteróloga; e em um aspecto, a seqüência heteróloga compreende, ouconsiste em, uma seqüência que codifica: (i) uma seqüência de sinalheteróloga, um módulo de ligação a carboidrato heterólogo, um domínio dedoquerina heterólogo, um domínio cataiítico heterólogo (CD) ou umacombinação desses; (ii) a seqüência de (ii) em que a seqüência de sinalheteróloga, módulo de ligação a carboidrato ou domínio catalítico (CD) éderivado de uma enzima heteróloga; ou (iii) um sinalizador, um epitopo, umpeptídeo direcionador, uma seqüência clivável, uma porção detectável ouuma enzima; e em um aspecto, o módulo de ligação a carboidrato (CBM)heterólogo compreende, ou consiste em, um módulo de ligação ao xilano,um módulo de ligação à celulose, um módulo de ligação à lignina, ummódulo de ligação à xilose, um módulo de ligação à mananase, um móduloespecífico para xiloglicano e/ou um módulo de ligação à arabinofu-ranosidase; e em um aspecto, a seqüência de sinal heteróloga direciona aproteína codificada para um vacúolo, para o retículo endoplasmático, paraum cloroplasto ou para um grânulo de amido.

A invenção fornece ácidos nucléicos isolados, sintéticos ourecombinantes que compreendem um ácido nucléico que codifica pelomenos um polipeptídeo que tem atividade de xilanase, mananase e/ouglicanase, em que o ácido nucléico compreende uma seqüência que tempelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%,59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%,72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%,85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,98%, 99%, ou mais ou identidade de seqüência completa (100%) àseqüência de (homologia) a uma seqüência de ácido nucléico exemplar dainvenção, incluindo a seqüência de SEQ ID NO:1, SEQ ID NO:3, SEQ IDNO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ IDNO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33,SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ IDNO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQID ΝΟ:53, SEQ ID ΝΟ:55, SEQ ID ΝΟ:57, SEQ ID ΝΟ:59, SEQ ID ΝΟ:61,SEQ ID ΝΟ:63, SEQ ID ΝΟ:65, SEQ ID ΝΟ:67, SEQ ID ΝΟ:69, SEQ IDΝΟ:71, SEQ ID ΝΟ:73, SEQ ID ΝΟ:75, SEQ ID ΝΟ:77, SEQ ID ΝΟ:79, SEQID ΝΟ:81, SEQ ID ΝΟ:83, SEQ ID ΝΟ:85, SEQ ID ΝΟ:87, SEQ ID ΝΟ:89,SEQ ID ΝΟ:91, SEQ ID ΝΟ:93, SEQ ID ΝΟ:95, SEQ ID ΝΟ:97, SEQ IDΝΟ:99, SEQ ID Ν0:101, SEQ ID Ν0:103, SEQ ID Ν0:105, SEQ ID Ν0:107,SEQ ID NQ:109, SEQ ID ΝΟ:111, SEQ ID ΝΟ:113, SEQ ID ΝΟ:115, SEQ ID

ΝΟ:117, SEQ ID ΝΟ:119, SEQ ID ΝΟ:121, SEQ ID ΝΟ:123, SEQ ID ΝΟ:125, SEQ ID ΝΟ:127, SEQ ID NO: 129, SEQ ID Ν0:131, SEQ ID NO: 133, SEQ ID ΝΟ:135, SEQ ID ΝΟ:137, SEQ ID ΝΟ:139, SEQ ID ΝΟ:141, SEQ ID NO: 143, SEQ ID ΝΟ:145, SEQ ID ΝΟ:147, SEQ ID NO: 149, SEQ ID ΝΟ:151, SEQ ID ΝΟ:153, SEQ ID ΝΟ:155, SEQ ID ΝΟ:157, SEQ ID NO: 199, SEQ ID ΝΟ:161, SEQ ID NO: 163, SEQ ID ΝΟ:165, SEQ ID ΝΟ:167, SEQ ID ΝΟ:169, SEQ ID ΝΟ:171, SEQ ID NO: 173, SEQ ID ΝΟ:175, SEQ ID ΝΟ:177, SEQ ID ΝΟ:179, SEQ ID ΝΟ:181, SEQ ID NO: 183, SEQ ID ΝΟ:185, SEQ ID ΝΟ:187, SEQ ID NO: 189, SEQ ID ΝΟ:191, SEQ ID NO: 193, SEQ ID ΝΟ:195, SEQ ID ΝΟ:197, SEQ ID ΝΟ:199, SEQ ID Ν0:201, SEQ ID Ν0:203, SEQ ID Ν0:205, SEQ ID Ν0:207, SEQ ID Ν0:209, SEQ ID Ν0:211, SEQ ID ΝΟ:213, SEQ ID ΝΟ:215, SEQ ID ΝΟ:217, SEQ ID ΝΟ:219, SEQ ID ΝΟ:221, SEQ ID ΝΟ:223, SEQ ID ΝΟ:225, SEQ ID ΝΟ:227, SEQ ID ΝΟ:229, SEQ ID ΝΟ:231, SEQ ID ΝΟ:233, SEQ ID ΝΟ:235, SEQ ID ΝΟ:237, SEQ ID ΝΟ:239, SEQ ID ΝΟ:241, SEQ ID ΝΟ:243, SEQ ID ΝΟ:245, SEQ ID ΝΟ:247, SEQ ID NO:249, SEQ ID ΝΟ:251, SEQ ID ΝΟ:253, SEQ ID ΝΟ:255, SEQ ID ΝΟ:257, SEQ ID ΝΟ:259, SEQ ID ΝΟ:261, SEQ ID ΝΟ:263, SEQ ID ΝΟ:265, SEQ ID ΝΟ:267, SEQ ID ΝΟ:269, SEQ ID ΝΟ:271, SEQ ID ΝΟ:273, SEQ ID ΝΟ:275, SEQ ID ΝΟ:277, SEQ ID ΝΟ:279, SEQ ID ΝΟ:281, SEQ ID ΝΟ:283, SEQ ID ΝΟ:285, SEQ ID ΝΟ:287, SEQ ID ΝΟ:289, SEQ ID ΝΟ:291, SEQ ID ΝΟ:293, SEQ ID ΝΟ:295, SEQ ID ΝΟ:297, SEQ ID ΝΟ:299, SEQ ID Ν0:301, SEQ ID Ν0:303, SEQ ID Ν0:305, SEQ ID Ν0:307, SEQ IDΝ0:309, SEQ ID ΝΟ:311, SEQ ΝΟ:317, SEQ ID ΝΟ:319, SEQ ΝΟ:325, SEQ ID ΝΟ:327, SEQ ΝΟ:333, SEQ ID ΝΟ:335, SEQ ΝΟ:341, SEQ ID ΝΟ:343, SEQ ΝΟ:349, SEQ ID ΝΟ:351, SEQ ΝΟ:357, SEQ ID ΝΟ:359, SEQ ΝΟ:365, SEQ ID ΝΟ:367, SEQ ΝΟ:373, SEQ ID ΝΟ:375, SEQ ΝΟ:381, SEQ ID ΝΟ:383, SEQ ΝΟ:389, SEQ ID ΝΟ:391, SEQ ΝΟ:397, SEQ ID ΝΟ:399, SEQ Ν0:405, SEQ ID Ν0:407, SEQ ΝΟ:413, SEQ ID ΝΟ:415, SEQ ΝΟ:421, SEQ ID ΝΟ:423, SEQ ΝΟ:429, SEQ ID ΝΟ:431, SEQ ΝΟ:437, SEQ ID ΝΟ:439, SEQ ΝΟ:445, SEQ ID ΝΟ:447, SEQ ΝΟ:453, SEQ ID ΝΟ:455, SEQ ΝΟ:461, SEQ ID ΝΟ:463, SEQ ΝΟ:469, SEQ ID ΝΟ:471, SEQ ΝΟ:477, SEQ ID ΝΟ:479, SEQ ΝΟ:485, SEQ ID ΝΟ:487, SEQ ΝΟ:493, SEQ ID Νθ:495, SEQ Ν0:501, SEQ ID Ν0:503, SEQ Ν0:509, SEQ ID ΝΟ:511, SEQ ΝΟ:517, SEQ ID ΝΟ:519, SEQ ΝΟ:525, SEQ ID ΝΟ:527, SEQ ΝΟ:533, SEQ ID ΝΟ:535, SEQ ΝΟ:541, SEQ ID ΝΟ:543, SEQ ΝΟ:549, SEQ ID ΝΟ:551, SEQ

ID ΝΟ:313, SEQ ID ΝΟ:315, SEQ IDID ΝΟ:321, SEQ ID ΝΟ:323, SEQ IDID ΝΟ:329, SEQ ID ΝΟ:331, SEQ IDID ΝΟ:337, SEQ ID ΝΟ:339, SEQ IDID ΝΟ:345, SEQ ID ΝΟ:347, SEQ IDID ΝΟ:353, SEQ ID ΝΟ:355, SEQ IDID ΝΟ:361, SEQ ID ΝΟ:363, SEQ IDID ΝΟ:369, SEQ ID ΝΟ:371, SEQ IDID ΝΟ:377, SEQ ID ΝΟ:379, SEQ IDID ΝΟ:385, SEQ ID NO:387, SEQ IDID ΝΟ:393, SEQ ID ΝΟ:395, SEQ IDID Ν0:401, SEQ ID Ν0:403, SEQ IDID Ν0:409, SEQ ID ΝΟ:411, SEQ IDID ΝΟ:417, SEQ ID ΝΟ:419, SEQ IDID ΝΟ:425, SEQ ID ΝΟ:427, SEQ IDID ΝΟ:433, SEQ ID ΝΟ:435, SEQ IDID ΝΟ:441, SEQ ID ΝΟ:443, SEQ IDID NO:449, SEQ ID ΝΟ:451, SEQ IDID ΝΟ:457, SEQ ID ΝΟ:459, SEQ IDID ΝΟ:465, SEQ ID ΝΟ:467, SEQ IDID ΝΟ:473, SEQ ID ΝΟ:475, SEQ IDID ΝΟ:481, SEQ ID ΝΟ:483, SEQ IDID ΝΟ:489, SEQ ID ΝΟ:491, SEQ IDID ΝΟ:497, SEQ ID ΝΟ:499, SEQ IDID Ν0:505, SEQ ID Ν0:507, SEQ IDID ΝΟ:513, SEQ ID ΝΟ:515, SEQ IDID ΝΟ:521, SEQ ID ΝΟ:523, SEQ IDID ΝΟ:529, SEQ ID ΝΟ:531, SEQ IDID ΝΟ:537, SEQ ID ΝΟ:539, SEQ IDID ΝΟ:545, SEQ ID ΝΟ:547, SEQ IDID ΝΟ:553, SEQ ID ΝΟ:555, SEQ IDNO:557, SEQ ID NO:559, SEQ ID NO:561, SEQ ID NO:563, SEQ IDNO:565, SEQ ID NO:567, SEQ ID NO:569, SEQ ID NO:571, SEQ IDNO:573, SEQ ID NO:575, SEQ ID NO:577, SEQ ID NO:579, SEQ IDNO:581, SEQ ID NO:583, SEQ ID NO:585, SEQ ID NO:587, SEQ IDNO:589, SEQ ID NO:591, SEQ ID NO:593, SEQ ID NO:595, SEQ IDNO:597, SEQ ID NO:599, SEQ ID N0:601, SEQ ID N0:603, SEQ IDN0:605, SEQ ID N0:607, SEQ ID N0:609, SEQ ID NO:611, SEQ IDNO:613, SEQ ID NO:615, SEQ ID NO:617, SEQ ID NO:619, SEQ IDNO:621, SEQ ID NO:623, SEQ ID NO:625, SEQ ID NO:627, SEQ IDNO:629, SEQ ID NO:631, SEQ ID NO:633 e/ou SEQ ID NO:635 (ou, daqui

por diante referidas como as SEQ ID NOs. ímpares entre SEQ ID NO:1 eSEQ ID NO:635, ou as seqüências de ácido nucléico exemplares dainvenção), ao longo de uma região de pelo menos cerca de 10, 15, 20, 25,30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600,650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250,1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850,1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 oumais resíduos ou da extensão completa de um cDNA, transcrito (mRNA) ougene, em que o ácido nucléico codifica pelo menos um polipeptídeo que tematividade de xilanase, mananase e/ou glicanase ou que codifica umaproteína que pode gerar um anticorpo específico para um polipeptídeo dessainvenção, tal como epitopos ou imunógenos (daqui por diante coletivamentereferidos como ácidos nucléicos da invenção) ou ao longo de uma regiãoque consiste na região codificante da proteína (por exemplo, o cDNA) ou aseqüência genômica; e todas essas seqüências de ácidos nucléicos e ospolipeptídeos que elas codificam abrangem "seqüências da invenção". Emum aspecto (opcionalmente) as identidades de seqüência são determinadaspela análise com um algoritmo de comparação de seqüência ou porinspeção visual, e em um aspecto (opcionalmente) o algoritmo decomparação de seqüência é um algoritmo BLAST versão 2.2.2 onde umajuste de filtro é ajustado para blastall-p blastp-d "nr pataa"-F F e todas asoutras opções são ajustadas para o padrão.

A invenção fornece ácidos nucléicos isolados, sintéticos ourecombinantes que compreendem um ácido nucléico que codifica pelomenos um polipeptídeo que tem atividade de xilanase, mananase e/ouglicanase, em que o ácido nucléico compreende uma seqüência quehibridiza sob condições estringentes a um ácido nucléico que compreendeuma seqüência de ácido nucléico exemplar da invenção (isto é, seqüênciascomo descritas em SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, etc.,incluindo todas as SEQ ID Nos. ímpares entre SEQ ID NO:1 e SEQ IDNO:635), e em um aspecto (opcionalmente) as condições estringentescompreendem uma etapa de lavagem que compreende uma lavagem emSSC 0,2X em uma temperatura de cerca de 65SC por cerca de 15 minutos eem um aspecto (opcionalmente) o ácido nucléico tem pelo menos cerca de25, 50, 75, 100, 125, 150, 175, 200, 225, 300, 350, 400, 450, 500, 600, 700,800, 900, 1000 ou mais resíduos de extensão ou a extensão completa dogene ou transcrito.

A invenção fornece ácidos nucléicos isolados, sintéticos ourecombinantes que compreendem um ácido nucléico que codifica pelomenos um polipeptídeo que tem atividade de xilanase, mananase e/ouglicanase, em que o polipeptídeo tem uma seqüência como descrita em SEQID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID N0:10, SEQID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID N0:20,SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ IDN0:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQID N0:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48,SEQ ID N0:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ IDNO:58, SEQ ID N0:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQID NO:68, SEQ ID N0:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76,SEQ ID NO:78, SEQ ID N0:80, SEQ ID NO:82, SEQ ID NO:84, SEQ IDNO:86, SEQ ID NO:88, SEQ ID NQ:90, SEQ ID NO:92, SEQ ID NO:94, SEQID ΝΟ:96, SEQ ID ΝΟ:98, SEQ ID Ν0:100, SEQ ID Ν0:102, SEQ IDNO: 104, SEQ ID Ν0:106, SEQ ID Ν0:108, SEQ ID Ν0;110, SEQ IDΝΟ:112, SEQ ID ΝΟ:114, SEQ ID ΝΟ:116, SEQ ID ΝΟ:118, SEQ IDΝ0:120, SEQ ID ΝΟ:122, SEQ ID ΝΟ:124, SEQ ID ΝΟ:126, SEQ IDΝΟ:128, SEQ ID Ν0:130, SEQ ID ΝΟ:132; SEQ ID ΝΟ:134; SEQ IDNO: 136; SEQ ID ΝΟ:138; SEQ ID Ν0:140; SEQ ID ΝΟ:142; SEQ IDNO: 144; ΝΟ:146, SEQ ID ΝΟ:148, SEQ ID Ν0:150, SEQ ID ΝΟ:152, SEQID Ν0:154, SEQ ID Ν0:156, SEQ ID ΝΟ:158, SEQ ID Ν0:160, SEQ ID

ΝΟ:162, SEQ ID ΝΟ:164, SEQ ID ΝΟ:166, SEQ ID ΝΟ:168, SEQ IDΝ0:170, SEQ ID Ν0:172, SEQ ID Ν0:174, SEQ ID ΝΟ:176, SEQ IDΝΟ:178, SEQ ID Ν0:180, SEQ ID Ν0:182, SEQ ID ΝΟ:184, SEQ IDΝΟ:186, SEQ ID Ν0:188, SEQ ID Ν0:190, SEQ ID ΝΟ:192, SEQ IDΝ0:194, SEQ ID ΝΟ:196, SEQ ID ΝΟ:198, SEQ ID Ν0:200, SEQ IDΝ0:202, SEQ ID Ν0:204, SEQ ID Ν0:206, SEQ ID Ν0:208, SEQ IDΝ0:210, SEQ ID ΝΟ:212, SEQ ID ΝΟ:214, SEQ ID ΝΟ:216, SEQ IDΝΟ:218, SEQ ID Ν0:220, SEQ ID ΝΟ:222, SEQ ID ΝΟ:224, SEQ IDΝΟ:226, SEQ ID ΝΟ:228, SEQ ID Ν0:230, SEQ ID ΝΟ:232, SEQ IDΝΟ:234, SEQ ID ΝΟ:236, SEQ ID ΝΟ:238, SEQ ID Ν0:240, SEQ IDΝΟ:242, SEQ ID ΝΟ:244, SEQ ID ΝΟ:246, SEQ ID ΝΟ:248, SEQ IDΝ0:250, SEQ ID ΝΟ:252, SEQ ID ΝΟ:254, SEQ ID ΝΟ:256, SEQ IDΝΟ:258, SEQ ID Ν0:260, SEQ ID ΝΟ:262, SEQ ID Ν0.264, SEQ IDΝΟ:266, SEQ ID ΝΟ:268, SEQ ID Ν0:270, SEQ ID ΝΟ:272, SEQ IDΝΟ:274, SEQ ID ΝΟ:276, SEQ ID ΝΟ:278, SEQ ID Ν0:280, SEQ IDΝ0.282, SEQ ID ΝΟ:284, SEQ ID ΝΟ:286, SEQ ID ΝΟ:288, SEQ IDΝ0:290, SEQ ID ΝΟ:292, SEQ ID ΝΟ:294, SEQ ID ΝΟ:296, SEQ IDΝΟ:298, SEQ ID Ν0:300, SEQ ID Ν0:302, SEQ ID Ν0:304, SEQ IDΝ0:306, SEQ ID Ν0:308, SEQ ID Ν0:310, SEQ ID ΝΟ:312, SEQ IDΝΟ:314, SEQ ID ΝΟ:316, SEQ ID ΝΟ:318, SEQ ID Ν0:320, SEQ IDΝΟ:322, SEQ ID ΝΟ:324, SEQ ID ΝΟ:326, SEQ ID ΝΟ:328, SEQ IDΝ0:330, SEQ ID ΝΟ:332, SEQ ID ΝΟ:334, SEQ ID ΝΟ:336, SEQ IDΝΟ:338, SEQ ID Ν0:340, SEQ ID ΝΟ:342, SEQ ID ΝΟ:344, SEQ IDΝΟ:346, SEQ ID ΝΟ:348, SEQ ID Ν0:350, SEQ ID ΝΟ:352, SEQ IDΝΟ:354, SEQ ID ΝΟ:356, SEQ ID ΝΟ:358, SEQ ID Ν0:360, SEQ IDΝΟ:362, SEQ ID ΝΟ:364, SEQ ID ΝΟ:366, SEQ ID ΝΟ:368, SEQ IDΝ0:370, SEQ ID ΝΟ:372, SEQ ID ΝΟ:374, SEQ ID ΝΟ:376, SEQ IDΝΟ:378, SEQ ID Ν0:380, SEQ ID ΝΟ:382, SEQ ID ΝΟ:384, SEQ IDΝΟ:386, SEQ ID ΝΟ:388, SEQ ID Ν0:390, SEQ ID ΝΟ:392, SEQ IDΝΟ:394, SEQ ID ΝΟ:396, SEQ ID ΝΟ:398, SEQ ID Ν0:400, SEQ IDΝ0:402, SEQ ID Ν0:404, SEQ ID Ν0:406, SEQ ID Ν0:408, SEQ IDΝ0:410, SEQ ID ΝΟ:412, SEQ ID ΝΟ:414, SEQ ID ΝΟ:416, SEQ IDΝΟ:418, SEQ ID Ν0:420, SEQ ID ΝΟ:422, SEQ ID ΝΟ:424, SEQ IDΝΟ:426, SEQ ID ΝΟ:428, SEQ ID Ν0:430, SEQ ID ΝΟ:432, SEQ IDΝΟ:434, SEQ ID ΝΟ:436, SEQ ID ΝΟ:438, SEQ ID Ν0:440, SEQ IDΝΟ:442, SEQ ID ΝΟ:444, SEQ ID ΝΟ:446, SEQ ID ΝΟ:448, SEQ IDΝ0:450, SEQ ID ΝΟ:452, SEQ ID ΝΟ:454, SEQ ID ΝΟ:456, SEQ IDΝΟ:458, SEQ ID Ν0:460, SEQ ID ΝΟ:462, SEQ ID ΝΟ:464, SEQ IDΝΟ:466, SEQ ID ΝΟ:468, SEQ ID Ν0:470, SEQ ID Ν0.472, SEQ IDΝΟ:474, SEQ ID ΝΟ:476, SEQ ID ΝΟ:478, SEQ ID Ν0:480, SEQ IDΝΟ:482, SEQ ID ΝΟ:484, SEQ ID ΝΟ:486, SEQ ID ΝΟ:488, SEQ IDΝ0:490, SEQ ID ΝΟ:492, SEQ ID ΝΟ:494, SEQ ID ΝΟ:496, SEQ IDΝΟ:498, SEQ ID Ν0:500, SEQ ID Ν0:502, SEQ ID Ν0:504, SEQ IDΝ0:506, SEQ ID Ν0:508, SEQ ID Ν0:510, SEQ ID ΝΟ:512, SEQ IDΝΟ:514, SEQ ID ΝΟ:516, SEQ ID ΝΟ:518, SEQ ID Ν0:520, SEQ IDΝΟ:522, SEQ ID ΝΟ:524, SEQ ID ΝΟ:526, SEQ ID ΝΟ:528, SEQ IDΝ0:530, SEQ ID ΝΟ:532, SEQ ID ΝΟ:534, SEQ ID ΝΟ:536, SEQ IDΝΟ:538, SEQ ID Ν0:540, SEQ ID ΝΟ:542, SEQ ID ΝΟ:544, SEQ IDΝΟ:546, SEQ ID ΝΟ:548, SEQ ID Ν0:550, SEQ ID ΝΟ:552, SEQ IDΝΟ:554, SEQ ID ΝΟ:556, SEQ ID ΝΟ:558, SEQ ID NQ:560, SEQ IDΝΟ:562, SEQ ID ΝΟ:564, SEQ ID ΝΟ:566, SEQ ID ΝΟ:568, SEQ IDΝ0:570, SEQ ID ΝΟ:572, SEQ ID ΝΟ:574, SEQ ID ΝΟ:576, SEQ IDΝΟ:578, SEQ ID Ν0:580, SEQ ID ΝΟ:582, SEQ ID ΝΟ:584, SEQ IDΝΟ:586, SEQ ID ΝΟ:588, SEQ ID Ν0:590, SEQ ID ΝΟ:592, SEQ IDΝΟ:594, SEQ ID ΝΟ:596, SEQ ID ΝΟ:598, SEQ ID Ν0:600, SEQ IDΝ0:602, SEQ ID Ν0:604, SEQ ID Ν0:606, SEQ ID Ν0:608, SEQ IDΝ0:610, SEQ ID ΝΟ:612, SEQ ID ΝΟ:614, SEQ ID ΝΟ:616, SEQ IDΝΟ:618, SEQ ID Ν0:620, SEQ ID ΝΟ:622, SEQ ID ΝΟ:624, SEQ IDΝΟ:626, SEQ ID ΝΟ:628, SEQ ID Ν0:630, SEQ ID ΝΟ:632, SEQ ID ΝΟ:634e/ou SEQ ID ΝΟ:636, ou fragmentos enzimaticamente ativos destas,incluindo as seqüências descritas nas Tabelas 1 a 4, e na Listagem deSeqüências (todas essas seqüências são "enzimas/polipeptídeosexemplares da invenção") e subseqüências (fragmentos) enzimaticamenteativas destas e/ou subseqüências imunologicamente ativas destas (tal comoepitopos ou imunógenos) (todos "peptídeos da invenção") e variantes destas(todas essas seqüências que abrangem seqüências de polipeptídeo epeptídeo da invenção) (ou, referidas daqui por diante como, as SEQ ID NOs.pares entre SEQ ID NO:2 e SEQ ID NO:636; ou as seqüências depolipeptídeo exemplares da invenção).

A invenção fornece ácidos nucléicos isolados, sintéticos ourecombinantes que compreendem seqüências completamentecomplementares a todas essas seqüências de ácido nucléico da invenção(seqüências complementares (não-codificantes) e codificantes também,daqui por diante, são coletivamente referidas como seqüências de ácidonucléico da invenção).

Em um aspecto, a identidade de seqüência é de pelo menoscerca de 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%,62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%,75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%,88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou100% (completa) de identidade de seqüência (homologia). Em um aspecto, aidentidade de seqüência é ao longo de uma região com pelo menos cerca de150, 175, 200, 225, 250, 275, 300, 350, 400, 450, 500, 550, 600, 650, 700,750, 800, 850, 900, 950, 1000, 1050, 1100, 1150 ou mais resíduos ou aextensão completa de um gene ou transcrito. Por exemplo, a invençãofornece ácidos nucléicos isolados, sintéticos ou recombinantes quecompreendem uma seqüência de ácido nucléico descrita em qualquer umadas SEQ ID Nos. ímpares entre SEQ ID NO:1 e SEQ ID NO:635 (asseqüências de polinucleotídeo exemplares dessa invenção). A invençãofornece ácidos nucléicos isolados, sintéticos ou recombinantes quecodificam um polipeptídeo que compreende uma seqüência descrita emqualquer uma das SEQ ID NOs. pares entre SEQ ID NO:2 e SEQ ID NO:636(as seqüências de polinucleotídeo exemplares dessa invenção) e fragmentosenzimaticamente ativos destas.

A invenção fornece ácidos nucléicos isolados, sintéticos ourecombinantes que codificam um polipeptídeo que tem atividade de xilanase,mananase e/ou glicanase, em que o ácido nucléico tem pelo menos umamodificação de seqüência de uma seqüência exemplar da invenção ouqualquer seqüência da invenção.

A invenção fornece ácidos nucléicos isolados, sintéticos ourecombinantes que codificam um polipeptídeo que tem atividade de xilanase,mananase e/ou glicanase, em que o ácido nucléico tem pelo menos umamodificação de seqüência de um ácido nucléico exemplar da invenção, emque a modificação de seqüência compreende pelo menos uma, duas, três,quatro, cinco, seis, sete, oito, nove, dez, onze, doze, treze, quatorze, quinze,dezesseis, dezessete, dezoito, dezenove ou todas as seguintes alterações:os nucleotídeos que correspondem aos resíduos 10 a 12 de SEQ ID NO:383são alterados para CCT, TTA, TTG, CTC, CTA ou CTG, os nucleotídeos quecorrespondem aos resíduos 25 a 27 de SEQ ID NO:383 são alterados paraCCC, CCG, CCA ou CCT, os nucleotídeos que correspondem aos resíduos28 a 30 de SEQ ID NO:383 são alterados para TCA, TCC, TCT, TCG, AGTou AGC, os nucleotídeos que correspondem aos resíduos 37 a 39 de SEQID NO:383 são alterados para TTT ou TTC, os nucleotídeos quecorrespondem aos resíduos 37 a 39 de SEQ ID NO:383 são alterados paraTAC ou TAT, os nucleotídeos que correspondem aos resíduos 37 a 39 deSEQ ID NO:383 são alterados para ATA, ATT ou ATC, os nucleotídeos quecorrespondem aos resíduos 37 a 39 de SEQ ID NO:383 são alterados paraTGG1 os nucleotídeos que correspondem aos resíduos 40 a 42 de SEQ IDNO:383 são alterados para CAC ou CAT, os nucleotídeos que correspondemaos resíduos 52 a 54 de SEQ ID NO:383 são alterados para TTC ou TTT, osnucleotídeos que correspondem aos resíduos 73 a 75 de SEQ ID NO:383são alterados para GAG ou GAA, os nucleotídeos que correspondem aosresíduos 73 a 75 de SEQ ID NO:383 são alterados para CCC, CCG1 CCA ouCCT, os nucleotídeos que correspondem aos resíduos 88 a 90 de SEQ IDNO:383 são alterados para GTG1 GTC, GTA ou GTT, os nucleotídeos quecorrespondem aos resíduos 100 a 102 de SEQ ID NO:383 são alteradospara TGT ou TGC1 os nucleotídeos que correspondem aos resíduos 100 a102 de SEQ ID NO:383 são alterados para CAT ou CAC1 os nucleotídeosque correspondem aos resíduos 100 a 102 de SEQ ID NO:383 são alteradospara TTG, TTA, CTT, CTC, CTA ou CTG1 os nucleotídeos quecorrespondem aos resíduos 103 a 105 de SEQ ID NO:383 são alteradospara GAG ou GAA, os nucleotídeos que correspondem aos resíduos 103 a105 de SEQ ID NO:383 são alterados para GAT ou GAC, os nucleotídeosque correspondem aos resíduos 211 a 213 de SEQ ID NO:383 são alteradospara ACA, ACT1 ACC ou ACG, os nucleotídeos que correspondem aosresíduos 211 a 213 de SEQ ID NO:383 são alterados para TGT ou TGC1 ouos nucleotídeos que correspondem aos resíduos 508 a 582 de SEQ IDNO:383 são alterados para CAT ou CAC.

A invenção fornece ácidos nucléicos isolados, sintéticos ourecombinantes que codificam um polipeptídeo que tem atividade de xilanase,mananase e/ou glicanase, em que o ácido nucléico tem pelo menos umamodificação de seqüência de SEQ ID NO:383, ou o equivalente de pelomenos uma modificação de seqüência de SEQ ID NO:383, e a pelo menosuma modificação de SEQ ID NO:383 compreende uma alteração em: osnucleotídeos nos resíduos 10 a 12 são CCT1 TTA, TTG1 CTC, CTA ou CTG1os nucleotídeos nos resíduos 25 a 27 são CCC, CCG, CCA ou CCT, osnucleotídeos nos resíduos 28 a 30 são TCA, TCC, TCT1 TCG, AGT ou AGC,os nucleotídeos nos resíduos 37 a 39 são TTT ou TTC1 os nucleotídeos nosresíduos 37 a 39 são TAC ou TAT, os nucleotídeos nos resíduos 37 a 39 sãoATA, ATT ou ATC, os nucleotídeos nos resíduos 37 a 39 são TGG1 osnucleotídeos nos resíduos 40 a 42 são CAC ou CAT, os nucleotídeos nosresíduos 52 a 54 são TTC ou TTT1 os nucleotídeos nos resíduos 73 a 75 sãoGAG ou GAA, os nucleotídeos nos resíduos 73 a 75 são CCC, CCG1 CCAou CCT, os nucleotídeos nos resíduos 88 a 90 são GTG, GTC1 GTA ouGTT.os nucleotídeos nos resíduos 100 a 102 são TGT ou TGC1 osnucleotídeos nos resíduos 100 a 102 são CAT ou CAC, os nucleotídeos nosresíduos 100 a 102 são TTG1 TTA1 CTT1 CTC1 CTA ou CTG1 os nucleotídeosnos resíduos 103 a 105 são GAG ou GAA1 os nucleotídeos nos resíduos 103a 105 são GAT ou GAC1 os nucleotídeos nos resíduos 211 a 213 são ACA1ACT1 ACC ou ACG1 os nucleotídeos nos resíduos 211 a 213 são TGT ouTGC1 ou os nucleotídeos nos resíduos 508 a 582 são CAT ou CAC. Emaspectos alternativos, a modificação de seqüência compreende pelo menosduas das alterações, pelo menos três das alterações, pelo menos quatro dasalterações, ou pelo menos cinco, seis, sete, oito, nove, dez, onze, doze,treze, quatorze, quinze, dezesseis, dezessete, dezoito, dezenove ou todasas alterações.

Em um aspecto, a invenção também fornece ácidos nucléicoscodificantes de enzima com uma inovação em comum, na qual elescodificam um novo subgrupo de xilanases ou um ciado, compreendendo o"módulo X14" (J Bacteriol. 2002 Agosto; 184(15): 4124-4133). Em umaspecto, a invenção também fornece ácidos nucléicos codificantes deenzimas com uma inovação em comum na qual eles codificam um novosubgrupo de xilanases, ou um ciado, compreendendo o "módulo X14". Osmembros de xilanase que compreendem X14 deste ciado estão listados naTabela 9 abaixo. Dessa forma, em um aspecto, a invenção fornece um novogênero de xilanases que compreende os membros de xilanase do ciadolistado na Tabela 9, abaixo e enzimas relacionadas (por exemplo, xilanasesque têm uma identidade de seqüência a uma enzima exemplar da invenção,conforme listado na Tabela 9 abaixo).

Em um aspecto (opcionalmente), os ácidos nucléicos isolados,sintéticos ou recombinantes da invenção têm atividade de xilanase,mananase e/ou glicanase, por exemplo, em que a atividade de xilanasecompreende catalisar a hidrólise de ligações internas β-1,4-xilosídicas;compreende uma atividade de endo-1,4-beta-xilanase; compreendehidrolisar um xilano ou arabinoxilano para produzir xilose e xilo-oligômero demenor peso molecular; compreende hidrolisar um polissacarídeo quecompreende uma D-xilopiranose 1,4-p-glicosídeo-ligada; compreendehidrolisar uma celulose ou hemicelulose; compreende hidrolisar umacelulose ou hemicelulose em uma madeira, produto de madeira, polpa depapel, produto de papel, ou resíduo de papel; compreende catalisar ahidrólise de um xilano ou um arabinoxilano em uma ração ou produtoalimentício; ou compreende catalisar a hidrólise de um xilano ouarabinoxilano em uma célula microbiana ou uma célula de planta. Em umaspecto, a atividade de xilanase compreende hidrolisar polissacarídeos quecompreendem D-xilopiranoses 1,4-p-glicosídeo-ligadas ou hidrolisarhemiceluloses, por exemplo, hidrolisar hemiceluloses em madeira, produtode madeira, polpa de papel, produto de papel ou resíduo de papel. Em umaspecto, o arabinoxilano é um arabinoxilano de cereal, tal comoarabinoxilano de trigo.

Em um aspecto, a atividade de xilanase, mananase e/ouglicanase compreende catalisar a hidrólise de polissacarídeos, por exemplo,mananas ou xilanos, em uma ração ou produto alimentício, tal como raçãoanimal a base de cereal, um mosto ou uma cerveja, um leite ou produto deleite, uma fruta ou vegetal. Em um aspecto, a atividade de xilanase,mananase e/ou glicanase compreende catalisar a hidrólise depolissacarídeos, por exemplo, mananas ou xilanos, em uma célulamicrobiana ou célula de planta.Em um aspecto, a atividade de xilanase, mananase e/ouglicanase é termoestável, por exemplo, onde o polipeptídeo retém aatividade de xilanase, mananase e/ou glicanase sob condições quecompreendem uma faixa de temperatura entre cerca de 1-C a cerca de 5-C,entre cerca de 5-C a cerca de 15-C, entre cerca de 15-C a cerca de 25-C,entre cerca de 25-C a cerca de 37-C, 37-C a cerca de 959C, ou entre cercade 55SC a cerca de 859C, ou entre cerca de 70-C a cerca de 75-C, ou entrecerca de 70-C a cerca de 95-C, entre cerca de 90-C a cerca de 95-C, entrecerca de 95-C a cerca de 105-C, ou entre cerca de 95-C a cerca de 110-C.Em um aspecto, o polipeptídeo retém a atividade de xilanase, mananasee/ou glicanase sob condições que compreendem uma faixa de temperaturaentre cerca de I9C a cerca de 5-C, entre cerca de 5-C a cerca de 15-C,entre cerca de 159C a cerca de 25-C, entre cerca de 25-C a cerca de 37-C.Em um aspecto, polipeptídeos da invenção retêm atividade em temperaturasacima de 909C, 919C, 929C, 939C, 949C, 959C, 969C, 97-C, 98-C, 99-C,100-C, 101-C 102-C, 1039C, 103,5-C, 104-C, 105-C, 107-C, 108-C, 109-Cou 1109C, ou mais; em outro aspecto, os polipeptídeos da invenção retêmatividade após exposição a temperaturas acima de 90-C, 91-C, 92-C, 93-C,94-C, 95-C, 96-C, 97-C, 98-C, 99-C, 100-C, 101-C, 102-C, 1039C, 103.5-C,104-C, 105-C, 107-C, 108-C, 109-C ou 110-C, ou mais.

Em um aspecto, a atividade de xilanase, mananase e/ouglicanase é termotolerante, por exemplo, onde o polipeptídeo retém aatividade de xilanase, mananase e/ou glicanase após exposição a umatemperatura na faixa de mais do que 37-C a cerca de 95-C, ou entre cercade 55-C a cerca de 85-C, ou entre cerca de 70-C a cerca de 75-C, ou entrecerca de 70-C a cerca de 95-C, entre cerca de 90-C a cerca de 95-C, entrecerca de 95-C a cerca de 105-C, ou entre cerca de 959C a cerca de 110-C.Em um aspecto, o polipeptídeo retém a atividade de xilanase, mananasee/ou glicanase após exposição a condições que compreendem uma faixa detemperatura entre cerca de I-C a cerca de 5-C, entre cerca de 5-C a cercade 15-C, entre cerca de 15-C a cerca de 25-C, entre cerca de 25-C a cercade 37-C. Em um aspecto, polipeptídeos da invenção podem reter atividadede xilanase, mananase e/ou glicanase após exposição a uma temperaturaacima de 909C, 919C, 929C, 939C, 949C, 959C, 96°-C, 97°-C, 989C, 999C,1009C, 101ÕC, 102SC, 1039C, 103.59C, 1049C, 1059C, 1079C, 1089C, 1099Cou 11 OsC1 ou mais.

Em um aspecto, a atividade de xilanase, mananase e/ouglicanase de polipeptídeos codificados pelos ácidos nucléicos da invençãoretém atividade sob condições ácidas compreendendo cerca de pH 6.5, pH6, pH 5.5, pH 5, pH 4.5 ou pH 4 ou menos (mais ácido); ou retém atividadede xilanase, mananase e/ou glicanase sob condições básicascompreendendo cerca de pH 7, pH 7.5 pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10,pH 10.5, pH 11, pH 11.5, pH 12, pH 12.5 ou mais (mais básico) ou retématividade de xilanase, mananase e/ou glicanase após exposição a condiçõesbásicas que compreendem cerca de pH 7, pH 7.5 pH 8.0, pH 8.5, pH 9, pH9.5, pH 10, pH 10.5, pH 11, pH 11.5, pH 12, pH 12.5 ou mais (mais básico).

Em um aspecto, atividade de xilanase, mananase e/ou glicanase depolipeptídeos codificados pelos ácidos nucléicos da invenção retématividade em uma temperatura de pelo menos cerca de 80°C, 81 °C, 82°C,83°C, 84°C, 85°C, 86°C, 87°C, 88°C, 89°C, 909C, 919C, 92eC, 939C, 949C,95°C, 969C, 979C, 98eC, 999C, 10O2C, 1019C, 1029C, 1039C, 103.59C, 1049C,1059C, 1079C, 1089C, 1099C ou 1109C, ou mais, e um pH básico de pelomenos cerca de pH 7.5 pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH 10.5, pH 11,pH 11.5, pH 12, pH 12.5 ou mais (mais básico).

A invenção fornece cassetes de expressão, veículos declonagem ou um vetor (por exemplo, vetores de expressão) quecompreendem um ácido nucléico que compreende uma seqüência dainvenção. O veículo de clonagem pode compreender um vetor viral, umplasmídeo, um fago, um fagomídeo, um cosmídeo, um fosmídeo, umbacteriófago ou um cromossomo artificial. O vetor viral pode compreenderum vetor de adenovírus, um vetor retroviral ou um vetor viral adeno-associado. O veículo de clonagem pode compreender um cromossomoartificial que compreende um cromossomo bacteriano artificial (BAC), umvetor derivado de bacteriófago P1 (PAC)1 um cromossomo artificial delevedura (YAC) ou um cromossomo artificial de mamífero (MAC).

A invenção fornece sondas de ácido nucléico para identificar umácido nucléico que codifica um polipeptídeo com atividade de xilanase,mananase e/ou glicanase, em que a sonda compreende pelo menos cercade 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 100, 125, 150, 175,200, 225, 250, 275, 300 ou mais bases consecutivas de um ácido nucléicoque compreende uma seqüência exemplar da invenção ou qualquerseqüência da invenção (como definido aqui), em que em um aspecto(opcionalmente), a sonda compreende um oligonucleotídeo que compreendepelo menos entre cerca de 10 a 300, cerca de 25 a 250, cerca de 10 a 50,cerca de 20 a 60, cerca de 30 a 70, cerca de 40 a 80, cerca de60 a 100 oucerca de 50 a 150 ou mais bases consecutivas.

A invenção fornece pares de iniciadores de amplificação paraamplificar um ácido nucléico que codifica um polipeptídeo que tem atividadede xilanase, mananase e/ou glicanase, em que o par de iniciadores é capazde amplificar um ácido nucléico que compreende uma seqüência exemplarda invenção ou qualquer seqüência da invenção (como definido aqui) ouuma subseqüência desta, em que opcionalmente, um membro do par deseqüências de iniciadores de amplificação compreende um oligonucleotídeoque compreende pelo menos cerca de 10 a 50 bases consecutivas daseqüência ou cerca de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23,24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 ou mais bases consecutivas daseqüência. A invenção fornece pares de iniciadores de amplificação em queo par de iniciadores compreende um primeiro membro que tem umaseqüência descrita por cerca dos primeiros (a 5') 10, 11, 12, 13, 14, 15, 16,17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 OUmais resíduos de uma seqüência exemplar da invenção ou qualquerseqüência da invenção (como definidas nesse) e um segundo membro quetem uma seqüência descrita por cerca dos primeiros (a 5') 10, 11, 12, 13, 14,15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,35 ou mais resíduos da fita complementar do primeiro membro.

A invenção fornece ácidos nucléicos que codificam uma xilanasee/ou uma glicanase gerados por amplificação de um polinucleotídeo usandoum par de iniciadores de amplificação da invenção, em que, opcionalmente,a amplificação é por reação em cadeia da polimerase (PCR). Em umaspecto, o ácido nucléico é gerado por amplificação de uma bibliotecagenômica, em que em um aspecto (opcionalmente) a biblioteca genômica éuma biblioteca ambiental. A invenção fornece xilanases e/ou glicanasesisoladas, sintéticas ou recombinantes codificadas por um ácido nucléico quecodifica uma xilanase e/ou glicanase gerado por amplificação de umpolinucleotídeo usando um par de iniciadores de amplificação da invenção. Ainvenção fornece métodos para amplificar um ácido nucléico que codifica umpolipeptídeo que tem atividade de xilanase, mananase e/ou glicanase, osmétodos compreendendo a etapa de amplificação de um ácido nucléicomolde com um par de seqüências de iniciadores de amplificação capaz deamplificar uma seqüência de ácido nucléico exemplar da invenção ouqualquer seqüência da invenção (como definido aqui) ou uma subseqüênciadestas.

A invenção fornece cassetes de expressão, um vetor ou veículode clonagem que compreendem uma seqüência da invenção, em queopcionalmente o veículo de clonagem compreende um vetor viral, umplasmídeo, um fago, um fagomídeo, um cosmídeo, um fosmídeo, umbacteriófago ou um cromossomo artificial. O vetor viral pode compreenderum vetor de adenovírus, um vetor retroviral ou um vetor viral adeno-associado ou, o cromossomo artificial compreende um cromossomobacteriano artificial (BAC), um vetor derivado de bacteriófago P1 (PAC), umcromossomo artificial de levedura (YAC) ou um cromossomo artificial demamífero (MAC).

A invenção fornece células transformadas que compreendemum ácido nucléico ou vetor da invenção ou um cassete de expressão ouveículo de clonagem da invenção. A célula transformada pode ser umacélula bacteriana, uma célula de mamífero, uma célula de fungo, uma célulade levedura, uma célula de inseto ou uma célula de planta.

A invenção fornece animais transgênicos não-humanos quecompreendem uma seqüência da invenção. O animal transgênico não-humano pode ser um camundongo, um rato, um coelho, uma ovelha, umporco, uma galinha, uma cabra, um peixe, um cão ou uma vaca. A invençãofornece plantas transgênicas que compreendem uma seqüência dainvenção, por exemplo, em que a planta é uma planta de milho, uma plantade sorgo, uma planta de batata, uma planta de tomate, uma planta de trigo,uma planta de semente oleaginosa, uma planta de colza, uma planta desoja, uma planta de arroz, uma planta de cevada, grama ou uma planta detabaco. A invenção fornece sementes transgênicas que compreendem umaseqüência da invenção, por exemplo, em que a semente é uma semente demilho, uma semente de trigo, uma semente oleaginosa, uma semente decolza, uma semente de soja, uma semente de palma, uma semente degirassol, uma semente de gergelim, uma semente de planta de arroz,cevada, amendoim ou tabaco.

A invenção fornece oligonucleotídeos anti-sentido quecompreendem uma seqüência de ácido nucléico complementar a ou capazde hibridizar sob condições estringentes a uma seqüência da invenção(incluindo, por exemplo, seqüências exemplares da invenção), ou umasubseqüência desta, em que opcionalmente o oligonucleotídeo anti-sentidotem cerca de 10 a 50, cerca de 20 a 60, cerca de 30 a 70, cerca de 40 a 80,ou cerca de 60 a 100 bases de extensão, e em um aspecto (opcionalmente)as condições estringentes compreendem uma etapa de lavagem quecompreende uma lavagem em SSC 0,2X em uma temperatura de cerca de65°C por cerca de 15 minutos.

A invenção fornece métodos de inibir a tradução de umamensagem de xilanase, mananase e/ou glicanase em uma célula quecompreende administrar à célula ou expressar na célula um oligonucleotídeoanti-sentido que compreende uma seqüência de ácido nucléicocomplementar a ou capaz de hibridizar sob condições estringentes a umaseqüência da invenção (incluindo, por exemplo, seqüências exemplares dainvenção).

A invenção fornece moléculas de RNA inibidor (RNAi) de fitadupla que compreendem uma subseqüência de uma seqüência da invenção(incluindo, por exemplo, seqüências exemplares da invenção). A moléculade RNA inibidor (RNAi) de fita dupla pode ter cerca de 10, 11, 12, 13, 14, 15,16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, ou 30 ou maisnucleotídeos de dúplex de extensão. A invenção fornece métodos de inibir aexpressão de uma xilanase, uma mananase e/ou uma glicanase em umacélula que compreendem administrar à célula ou expressar na célula umRNA inibidor (RNAi) de fita dupla, em que o RNA compreende umasubseqüência de uma seqüência da invenção (incluindo, por exemplo,seqüências exemplares da invenção).

A invenção fornece polipeptídeos isolados, sintéticos ourecombinantes que tem uma atividade de xilanase, uma mananase e/ouglicanase ou polipeptídeos capazes de gerar uma resposta imune específicapara uma xilanase, uma mananase e/ou glicanase (por exemplo, umepitopo), (i) compreendendo uma seqüência de aminoácidos que tem pelomenos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%,60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%,73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%,86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%,99%, ou mais, ou tem 100% (completa) de identidade de seqüência a umaseqüência de aminoácidos exemplar da invenção (por exemplo, SEQ IDNO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ IDNO:12, ... SEQ ID NO:636, etc., como descrito aqui), ao longo de umaregião de pelo menos cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 75,100, 125, 150, 175, 200, 225 ou 250 ou mais resíduos, em que em umaspecto (opcionalmente) as identidades de seqüência são determinadaspela análise com um algoritmo de comparação de seqüência ou porinspeção visual, ou (ii) compreendendo uma seqüência de aminoácidoscodificada por uma seqüência de ácido nucléico da invenção (incluindo, porexemplo, seqüências exemplares da invenção). Seqüências de polipeptídeoou peptídeo da invenção incluem polipeptídeos ou peptídeosespecificamente ligados por um anticorpo da invenção (por exemplo,epitopos) ou polipeptídeos ou peptídeos que podem gerar um anticorpo dainvenção (por exemplo, um imunógeno).

A invenção fornece polipeptídeos isolados, sintéticos ourecombinantes que compreendem uma seqüência como descritas emqualquer uma das seqüências pares entre SEQ ID N0:2 e SEQ ID NO:636(a seqüência do polipeptídeo exemplar da invenção) e fragmentosenzimaticamente ativos dessas e variantes dessas, por exemplo: emmodalidades alternativas, enzimas variantes de xilanase, mananase e/ouglicanase da invenção compreendem as seqüências de: SEQ ID NO:384(três resíduos de aminoácidos foram então removidos da extremidadecarbóxi terminal do polipeptídeo de SEQ ID NO:382, resultando em SEQ IDNO:384) e SEQ ID NO:482 (veja abaixo). A invenção fornece polipeptídeosisolados, sintéticos ou recombinantes que têm uma atividade de xilanase,uma mananase e/ou glicanase, em que o polipeptídeo tem uma seqüênciaque compreende uma modificação de seqüência de uma seqüênciaexemplar da invenção (por exemplo, SEQ ID NO:2, SEQ ID NO:4, SEQ IDNO:6, SEQ ID NO:8, SEQ ID N0:10, SEQ ID NO:12, ... SEQ ID NO:636,etc., como descrito aqui), em que a modificação de seqüência compreendepelo menos uma, duas, três, quatro, cinco, seis, sete, oito, nove, dez, onze,doze, treze, quatorze, quinze, dezesseis, dezessete, dezoito, dezenove outodas as seguintes alterações: o aminoácido que corresponde à treonina noresíduo 4 de SEQ ID NO:384 é leucina, o aminoácido que corresponde àserina no resíduo 9 de SEQ ID NO:384 é prolina, o aminoácido quecorresponde à glutamina no resíduo 10 de SEQ ID NO:384 é serina, oaminoácido que corresponde à treonina no resíduo 13 de SEQ ID NO:384 éfenilalanina, o aminoácido que corresponde à treonina no resíduo 13 de SEQID NO:384 é tirosina, o aminoácido que corresponde à treonina no resíduo13 de SEQ ID NO:384 é isoleucina, o aminoácido que corresponde àtreonina no resíduo 13 de SEQ ID NO:384 é triptofano, o aminoácido quecorresponde à asparagina no resíduo 14 de SEQ ID NO:384 é histidina, oaminoácido que corresponde à tirosina no resíduo 18 de SEQ ID NO:384 éfenilalanina, o aminoácido que corresponde à serina no resíduo 25 de SEQID NO:384 é ácido glutâmico, o aminoácido que corresponde à serina noresíduo 25 de SEQ ID NO:384 é prolina, o aminoácido que corresponde àasparagina no resíduo 30 de SEQ ID NO:384 é valina, o aminoácido quecorresponde à glutamina no resíduo 34 de SEQ ID NO:384 é cisteína, oaminoácido que corresponde à glutamina no resíduo 34 de SEQ ID NO:384é histidina, o aminoácido que corresponde à glutamina no resíduo 34 deSEQ ID NO:384 é leucina, o aminoácido que corresponde à serina noresíduo 35 de SEQ ID NO:384 é ácido glutâmico, o aminoácido quecorresponde à serina no resíduo 35 de SEQ ID NO:384 é ácido aspártico, oaminoácido que corresponde à serina no resíduo 71 de SEQ ID NO:384 étreonina, o aminoácido que corresponde à serina no resíduo 71 de SEQ IDNO:384 é cisteína, ou o aminoácido que corresponde à serina no resíduo194 de SEQ ID NO:384 é histidina.

A invenção fornece polipeptídeos isolados, sintéticos ourecombinantes que tem uma atividade de xilanase, uma mananase e/ouglicanase, em que o polipeptídeo tem uma seqüência que compreende umou mais das seguintes modificações na seqüência de aminoácidos de SEQID NO:384: a treonina na posição de aminoácido 4 é leucina, a serina naposição de aminoácido 9 é prolina, a glutamina na posição de aminoácido 10é serina, a treonina na posição de aminoácido 13 é fenilalanina, a treoninana posição de aminoácido 13 é tirosina, a treonina na posição de aminoácido13 é isoleucina, a treonina na posição de aminoácido 13 é triptofano, aasparagina na posição de aminoácido 14 é histidina, a tirosina na posição deaminoácido 18 é fenilalanina, a serina na posição de aminoácido 25 é ácidoglutâmico, a serina na posição de aminoácido 25 é prolina, a asparagina naposição de aminoácido 30 é valina, a glutamina na posição de aminoácido34 é cisteína, a glutamina na posição de aminoácido 34 é histidina, aglutamina na posição de aminoácido 34 é leucina, a serina na posição deaminoácido 35 é ácido glutâmico, a serina na posição de aminoácido 35 éácido aspártico a serina na posição de aminoácido 71 é treonina, a serina naposição de aminoácido 71 é cisteína, ou a serina na posição de aminoácido194 é histidina. Em aspectos alternativos, a alteração de seqüênciacompreende pelo menos duas das alterações, pelo menos três dasalterações, pelo menos quatro das alterações ou a alteração da seqüênciacompreende pelo menos cinco, seis, sete, oito, nove, dez, onze, doze, treze,quatorze, quinze, dezesseis, dezessete, dezoito, dezenove ou todas asalterações.

Em um aspecto, os peptídeos isolados, sintéticos ourecombinantes da invenção têm uma atividade de xilanase, por exemplo, emque a atividade de xilanase compreende catalisar a hidrólise de ligações β-1,4-xilosídicas internas; compreende uma atividade de endo-1,4-beta-xilanase; compreende hidrolisar um xilano ou um arabinoxilano para produziruma xilose e xilo-oligômero de peso molecular menor; compreende hidrolisarum polissacarídeo que compreende uma D-xilopiranose 1,4-p-glicosídeo-ligada; compreende hidrolisar uma celulose ou uma hemicelulose;compreende hidrolisar uma celulose ou uma hemicelulose em uma madeira,produto de madeira, polpa de papel, produto de papel ou resíduo de papel;compreende catalisar a hidrólise de um xilano ou um arabinoxilano em umaração ou um produto alimentício; ou, compreende catalisar a hidrólise de umxilano ou um arabinoxilano em uma célula microbiana ou uma célula deplanta. O xilano pode compreender um arabinoxilano, por exemplo, umarabinoxilano solúvel em água, por exemplo, um arbinoxilano solúvel emágua em uma massa ou produto de pão.

Em um aspecto, a atividade de xilanase, mananase e/ouglicanase compreende hidrolisar polissacarídeos, por exemplo,compreendendo D-xilopiranoses 1,4-p-glicosídeo-ligadas ou hidrolisarhemiceluloses, por exemplo, hidrolisar hemiceluloses em uma madeira,produto de madeira, polpa de papel, produto de papel ou resíduo de papel.

Em um aspecto, a atividade de xilanase, mananase e/ouglicanase compreende catalisar a hidrólise de polissacarídeos, por exemplo,xilanos, em uma ração ou produto alimentício, tal como uma ração animalbaseada em cereal, um mosto ou cerveja, leite ou produto de leite, uma frutaou um vegetal. Em um aspecto, a atividade de xilanase compreendecatalisar a hidrólise de xilanos em uma célula microbiana ou célula de planta.

Em um aspecto, a atividade de xilanase, mananase e/ouglicanase é termoestável, por exemplo, onde o polipeptídeo retém aatividade de xilanase, mananase e/ou glicanase sob condições quecompreendem uma faixa de temperatura entre cerca de 37eC a cerca de959C, ou entre cerca de 559C a cerca de 859C, ou entre cerca de 709C acerca de 759C, ou entre cerca de 709C a cerca de 959C, entre cerca de 90SCa cerca de 959C, entre cerca de 959C a cerca de 1059C, ou entre cerca de95SC a cerca de 110SC. Em um aspecto, o polipeptídeo retém a atividade dexilanase, mananase e/ou glicanase sob condições que compreendem umafaixa de temperatura entre cerca de 1 sC a cerca de 59C, entre cerca de 59Ca cerca de 159C, entre cerca de 15SC a cerca de 259C, entre cerca de 259Ca cerca de 379C. Em um aspecto, polipeptídeos da invenção retêm atividadede xilanase, mananase e/ou glicanase em temperaturas acima de 1009C,1019C, 1029C, 1039C, 103.59C, 1049C, 1059C, 1079C, 1089C, 1099C ou1109C.

Em um aspecto, a atividade de xilanase, mananase e/ouglicanase é termotolerante, por exemplo, onde o polipeptídeo retém aatividade de xilanase, mananase e/ou glicanase após exposição a umatemperatura na faixa de mais do que 379C a cerca de 95QC, ou entre cercade 55eC a cerca de 859C, ou entre cerca de 709C a cerca de 759C, ou entrecerca de 709C a cerca de 959C, entre cerca de 909C a cerca de 959C, entrecerca de 959C a cerca de 1059C, ou entre cerca de 959C a cerca de 1109C.Em um aspecto, polipeptídeos da invenção podem reter atividade dexilanase, mananase e/ou glicanase após exposição a uma temperaturaacima de IOO2C1 101 eC1 1025C, 103eC, 103.5QC, 104eC, 105SC, 107eC,108SC, 109SC ou 1109C.

A invenção fornece polipeptídeos isolados, sintéticos ourecombinantes que compreendem um polipeptídeo da invenção e que nãotêm uma seqüência de sinal ou uma seqüência prepro. A invenção fornecepolipeptídeos isolados, sintéticos ou recombinantes que compreendem umpolipeptídeo da invenção e que têm uma seqüência de sinal heteróloga ouuma seqüência prepro heteróloga.

Em um aspecto, um polipeptídeo da invenção tem atividade dexilanase, mananase e/ou glicanase que compreende uma atividadeespecífica em cerca de 375C na faixa entre cerca de 100 a cerca de 1000unidades por miligrama de proteína, entre cerca de 500 a cerca de 750unidades por miligrama de proteína, entre cerca de 500 a cerca de 1200unidades por miligrama de proteína ou entre cerca de 7500 a cerca de 1000unidades por miligrama de proteína. Em um aspecto, unidades são definidascomo 0,1 a 20 unidades/g de polpa, onde uma unidade eqüivale a umol dexilose liberado por minuto por mg de enzima, usando arabinoxilano como umsubstrato como descrito no ensaio de Nelson Somogy, descrito em detalheabaixo. Em aspectos alternativos, polipeptídeos da invenção têm atividadede xilanase, mananase e/ou glicanase na faixa entre cerca de 0,05 a 20unidades por grama de polpa ou 0,05, 0,10, 0,20, 0,30, 0,40, 0,50, 0,60,0,70, 0,80, 0,90, 1,0, 1,5, 2,0, 2,5, 3,0, 3,5, 4,0, 4,5, 5,0, 5,5, 6,0, 6,5, 7, 8, 9,10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 ou mais unidades por grama depolpa (onde uma unidade eqüivale a umol de xilose liberado por minuto pormg de enzima, usando arabinoxilano como um substrato como descrito noensaio de Nelson Somogy).

Em um aspecto, a termotolerância compreende a retenção depelo menos metade da atividade específica de xilanase, mananase e/ouglicanase a 37QC após ser aquecida até uma temperatura elevada. Atermotolerância pode compreender retenção de atividade específica a 37eCna faixa entre cerca de 500 a cerca de 1200 unidades por miligrama deproteína após ser aquecida até uma temperatura elevada.

Em um aspecto, os polipeptídeos da invenção podemcompreender pelo menos um sítio de glicosilação ou ainda compreender umpolissacarídeo. A glicosilação pode ser uma glicosilação N-ligada, porexemplo, em que o polipeptídeo é glicosilado após ser expresso em P.pastoris ou S. pombe.

Em um aspecto, a atividade de xilanase, mananase e/ouglicanase de polipeptídeos da invenção retém atividade sob condiçõesácidas que compreendem cerca de pH 6.5, pH 6, pH 5.5, pH 5, pH 4.5 ou pH4 ou menos (mais ácido), ou retém atividade de xilanase, mananase e/ouglicanase após exposição à condições ácidas que compreendem cerca depH 6.5, pH 6, pH 5.5, pH 5, pH 4.5 ou pH 4 ou menos (mais ácido); ou retématividade sob condições básicas que compreendem cerca de pH 7, pH 7.5pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH 10.5, pH 11, pH 11.5, pH 12, pH12.5 ou mais (mais básico) ou retém atividade de xilanase, mananase e/ouglicanase após exposição a condições básicas que compreendem cerca depH 7, pH 7.5 pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH 10.5, pH 11, pH 11.5,pH 12, pH 12.5 ou mais (mais básico). Em um aspecto, a atividade dexilanase, mananase e/ou glicanase de polipeptídeos da invenção retématividade em uma temperatura de pelo menos cerca de 80°C, 81 °C, 82°C,83°C, 84°C, 85°C, 86°C, 87°C, 88°C, 89°C ou 90°C e um pH básico de pelomenos cerca de pH 7.5 pH 8.0, pH 8.5, pH 9, pH 9.5, pH 10, pH 10.5, pH 11,pH 11.5, pH 12, pH 12.5 ou mais (mais básico).

A invenção fornece preparação de proteína que compreende umpolipeptídeo da invenção, em que a preparação de proteína compreende umlíquido, uma pasta, um sólido ou um gel. A invenção fornece heterodímerosque compreendem um polipeptídeo da invenção e um segundo domínio. Osegundo domínio pode ser um polipeptídeo e o heterodímero é uma proteínade fusão. O segundo domínio pode ser um epitopo ou um sinalizador.A invenção fornece homodímeros ou heterodímeros quecompreendem o polipeptídeo da invenção. A invenção fornece polipeptídeosimobilizados, em que os polipeptídeos compreendem uma seqüência dainvenção ou uma subseqüência desta, ou um polipeptídeo codificado por umácido nucléico da invenção ou um polipeptídeo que compreende umpolipeptídeo da invenção e um segundo domínio, por exemplo, em que opolipeptídeo está imobilizado sobre ou dentro de uma célula, uma vesícula,um lipossomo, uma película, uma membrana, um metal, uma resina, umpolímero, uma cerâmica, um vidro, um microeletrodo, uma partícula degrafite, uma esfera, uma placa, um arranjo, um tubo capilar, um cristal, umcomprimido, uma pílula, uma cápsula, um pó, um aglomerado, umasuperfície, uma estrutura porosa, ou materiais tais como lascas de madeira,polpa marrom, polpa, papel e materiais derivados destes.

As xilanases e/ou glicanases da invenção podem ser usadas ouformuladas sozinhas ou como uma mistura (um "coquetel") de xilanases e/ouglicanases e outras enzimas hidrolíticas tais como celulases, mananases,proteases, lipases, amilases, ou enzimas redox tais como lacases,peroxidases, catalases, oxidases, ou redutases. Elas podem ser usadasformuladas em uma forma sólida tal como um pó, uma preparação liofilizada,um grânulo, um comprimido, uma barra, um cristal, uma cápsula, uma pílula,um pelete, ou em forma líquida tal como uma solução aquosa, um aerossol,um gel, uma pasta, uma pasta fluida, uma emulsão água/óleo, um creme,uma cápsula ou em suspensão vesicular ou micelar. As formulações dainvenção podem compreender qualquer um ou uma combinação dosseguintes ingredientes: polióis tal como um polietileno glicol, umpolivinilálcool, um glicerol, um açúcar tal como uma sacarose, um sorbitol,uma trealose, uma glicose, uma frutose, uma maltose, uma manose, umagente gelificante tal como goma guar, carragena, alginato, dextranos, umderivado celulósico, uma pectina, um sal tal como um cloreto de sódio, umsulfato de sódio, um sulfato de amônio, um cloreto de cálcio, um cloreto demagnésio, um cloreto de zinco, sulfato de zinco, um sal de um ácido graxoou um derivado de um ácido graxo, um quelante de metal tal como EDTA,EGTA, um citrato de sódio, um agente antimicrobiano tal como um ácidograxo ou derivado de ácido graxo, um parabeno, um sorbato, um benzoato,um composto modulador adicional para bloquear o impacto de uma enzimatal como uma protease, uma conjunto de proteínas tal como BSA, umhidrolisado de trigo, um composto de borato, um aminoácido ou umpeptídeo, um composto modulador de pH ou temperatura apropriado, umemulsificante tal como um detergente não-iônico e/ou iônico, um agenteredox tal como uma cistina/cisteína, uma glutationa, uma glutationa oxidada,um composto reduzido ou um antioxidante tal como um ácido ascórbico ouum dispersante. Reticulação e modificação de proteína tal como peguilação,modificação com ácido graxo, glicosilação podem também ser usados paramelhorar a estabilidade da enzima.

A invenção fornece arranjos que compreendem polipeptídeo(s)imobilizado(s) e/ou ácidos nucléicos da invenção e arranjos quecompreendem um oligonucleotídeo imobilizado da invenção. As enzimas,fragmentos destas e ácidos nucléicos que codificam as enzimas ou sondasda invenção e fragmentos destas, podem ser fixadas a um suporte sólido; eessas modalidades podem ser econômicas e eficientes no uso de enzimas eácidos nucléicos da invenção em processos industriais, médicos, depesquisa, farmacêuticos, alimentícios e de ração e suplementos alimentíciose para ração e outras aplicações e processos. Por exemplo, uma associaçãoou coquetel de enzimas (ou fragmentos ativos destas), que são usadas emuma reação química específica, pode ser acoplado a um suporte sólido eimerso em um tanque de processamento. A reação enzimática pode ocorrer.Então, o suporte sólido pode ser retirado do tanque, junto com as enzimasafixadas a ele, para uso repetido. Em uma modalidade da invenção, o ácidonucléico isolado é fixado a um suporte sólido. Em outra modalidade, osuporte sólido é selecionado a partir do grupo de um gel, uma resina, umpolímero, uma cerâmica, um vidro, um microeletrodo e qualquer combinaçãodestes.Por exemplo, suportes sólidos úteis nessa invenção incluemgéis. Alguns exemplos de géis incluem sefarose, gelatina, glutaraldeído,glutaraldeído tratado com quitosana, albumina-glutaraldeído, quitosana-Xantana, gel toyopearl (gel polimérico), alginato, alginato-polilisina,carragena, agarose, glioxil agarose, agarose magnética, dextran-agarose,hidrogel de poli(Carbamoil Sulfonato), hidrogel de BSA-PEG, álcoolpolivinílico fosforilado (PVA), monoaminoetil-N-aminoetil (MANA), amino, ouqualquer combinação destes. Outros suportes sólidos úteis na presenteinvenção são resinas ou polímeros. Alguns exemplos de resinas oupolímeros incluem celulose, acrilamida, náilon, raiom, poliéster, resina detroca de ânion, AMBERLITE® XAD-7, AMBERLITE® XAD-8, AMBERLITE®IRA-94, AMBERLITE® IRC-50, polivinil, poliacrílico, polimetacrilato, ouqualquer combinação destes. Outro tipo de suporte sólido útil na presenteinvenção é a cerâmica. Alguns exemplos incluem cerâmica não porosa,cerâmica porosa, SiO2, AI2O3. Outro tipo de suporte sólido útil na presenteinvenção é o vidro. Alguns exemplos incluem vidro não poroso, vidro poroso,vidro de aminopropila ou qualquer combinação destes. Outro tipo de suportesólido que pode ser usado é um microeletrodo. Um exemplo é umamagnetita coberta com polietilenoimina. Partículas de grafite também podemser usadas como um suporte sólido. Outro exemplo de um suporte sólido éuma célula, tal como uma célula vermelha do sangue.

Há vários métodos que são conhecidos de um versado natécnica para imobilizar enzimas ou fragmentos destas, ou ácidos nucléicossobre um suporte sólido. Alguns exemplos de tais métodos incluem geraçãode gotas eletrostáticas, meios eletroquímicos, através de adsorção, atravésde ligação covalente, através de reticulação, através de uma reação ouprocesso químico, através de encapsulamento, através de aprisionamento,através de alginato de cálcio, ou através de poli(2-hidroxietil metacrilato).

Métodos semelhantes são descritos em Methods in Enzymology,Immobilized Enzymes and Cells, Parte C. 1987. Academic Press. Editadopor S. P. Colowick & N. O. Kaplan. Volume 136; e Immobilization ofEnzymes and Cells. 1997. Humana Press. Editado por G. F. Bickerstaff.Série: Methods in Biotechnology, Editada por: J. M. Walker.

A invenção fornece anticorpos isolados, sintéticos ourecombinantes que se ligam especificamente a um polipeptídeo da invenção.

O anticorpo pode ser um anticorpo monoclonal ou policlonal, ou é umanticorpo de cadeia única. A invenção fornece hibridomas quecompreendem um anticorpo que se liga especificamente a um polipeptídeoda invenção.

A invenção fornece métodos de isolar ou identificar umpolipeptídeo com uma atividade de atividade de xilanase, mananase e/ouglicanase compreendendo as etapas de: (a) fornecer um anticorpo dainvenção; (b) fornecer uma amostra que compreende polipeptídeos; e (c)colocar a amostra da etapa (b) em contato com um anticorpo da etapa (a)sob condições em que o anticorpo pode se ligar especificamente aopolipeptídeo, dessa forma isolando ou identificando um polipeptídeo que temuma atividade de xilanase, mananase e/ou glicanase. A invenção fornecemétodos de fazer um anticorpo antixilanase e/ou antiglicanase quecompreende administrar a um animal não-humano um ácido nucléico dainvenção, ou uma subseqüência deste, em uma quantidade suficiente paragerar uma resposta imune humoral, fazendo assim um anticorpo antixilanasee/ou antiglicanase. A invenção fornece métodos de fazer um anticorpoantixilanase e/ou antiglicanase que compreende administrar a um animalnão-humano um polipeptídeo da invenção, ou uma subseqüência deste, emuma quantidade suficiente para gerar uma resposta imune humoral, fazendoassim um anticorpo antixilanase e/ou antiglicanase.

A invenção fornece métodos de produzir um polipeptídeorecombinante que compreende as etapas de: (a) fornecer um ácido nucléicooperativamente ligado a um promotor, em que o ácido nucléico compreendeuma seqüência da invenção; e (b) expressar o ácido nucléico da etapa (a)sob condições que permitem a expressão do polipeptídeo, produzindo assimum polipeptídeo recombinante, O método pode ainda compreendertransformar uma célula hospedeira com o ácido nucléico da etapa (a)seguido por expressar o ácido nucléico da etapa (a), produzindo assim umpolipeptídeo recombinante em uma célula transformada.

A invenção fornece métodos para identificar um polipeptídeoque tem uma atividade de xilanase, mananase e/ou glicanase quecompreende as seguintes etapas: (a) fornecer um polipeptídeo da invenção;(b) fornecer um substrato de xilanase, mananase e/ou glicanase; e (c)colocar o polipeptídeo em contato com o substrato da etapa (b) e detectaruma diminuição na quantidade de substrato ou um aumento na quantidadede um produto da reação, em que uma diminuição na quantidade dosubstrato ou um aumento na quantidade do produto de reação detecta umpolipeptídeo que tem uma atividade de xilanase, mananase e/ou glicanase.

A invenção fornece métodos para identificar um substrato dexilanase, mananase e/ou glicanase que compreende as seguintes etapas:(a) fornecer um polipeptídeo da invenção; (b) fornecer um substrato de teste;e (c) colocar o polipeptídeo da etapa (a) em contato com o substrato de testeda etapa (b) e detectar uma diminuição na quantidade de substrato ou umaumento na quantidade de produto de reação, em que uma diminuição naquantidade do substrato ou um aumento na quantidade de um produto dereação identifica o substrato de teste como um substrato de xilanase,mananase e/ou glicanase.

A invenção fornece métodos de determinar se um composto deteste se liga especificamente a um polipeptídeo, compreendendo asseguintes etapas: (a) expressar um ácido nucléico ou um vetor quecompreende o ácido nucléico sob condições permissivas para tradução doácido nucléico para um polipeptídeo, em que o ácido nucléico tem umaseqüência da invenção; (b) fornecer um composto de teste; (c) colocar opolipeptídeo em contato com o composto de teste; e (d) determinar se ocomposto de teste da etapa (b) se liga especificamente ao polipeptídeo.

A invenção fornece métodos de determinar se um composto deteste se liga especificamente a um polipeptídeo, compreendendo asseguintes etapas: (a) fornecer um polipeptídeo da invenção; (b) fornecer umcomposto de teste; (c) colocar o polipeptídeo em contato com o composto deteste; e (d) determinar se o composto de teste da etapa (b) se ligaespecificamente ao polipeptídeo.

A invenção fornece métodos para identificar um modulador deuma atividade de xilanase, mananase e/ou glicanase que compreende asseguintes etapas: (a) fornecer um polipeptídeo da invenção; (b) fornecer umcomposto de teste; (c) colocar o polipeptídeo da etapa (a) em contato com ocomposto de teste da etapa (b) e medir uma atividade de xilanase,mananase e/ou glicanase, em que uma alteração na atividade de xilanase,mananase e/ou glicanase medida na presença do composto de testecomparada com a atividade na ausência do composto de teste fornece umadeterminação de que o composto de teste modula a atividade de xilanase,mananase e/ou glicanase. A atividade de xilanase, mananase e/ou glicanasepode ser medida por fornecer um substrato de xilanase, mananase e/ouglicanase e detectar uma diminuição na quantidade do substrato ou umaumento na quantidade de um produto de reação, ou, um aumento naquantidade do substrato, ou uma diminuição na quantidade de um produtode reação. Em um aspecto, uma diminuição na quantidade do substrato ouum aumento na quantidade de um produto de reação com o composto deteste quando comparado com a quantidade do substrato ou do produto dereação sem o composto de teste identifica o composto de teste como umativador de uma atividade de xilanase, mananase e/ou glicanase. Em umaspecto, um aumento na quantidade do substrato ou uma diminuição naquantidade do produto de reação com o composto de teste quandocomparado com a quantidade do substrato ou do produto de reação sem ocomposto de teste identifica o composto de teste como um inibidor daatividade de uma xilanase, mananase e/ou glicanase.

A invenção fornece sistemas de computador que compreendemum processador e um dispositivo de armazenamento de dados em que o ditodispositivo de armazenamento de dados tem armazenado nele umaseqüência de polipeptídeo ou uma seqüência de ácido nucléico, em que aseqüência de polipeptídeo compreende uma seqüência da invenção, umpolipeptídeo codificado por um ácido nucléico da invenção. Os sistemas decomputador compreendem ainda um algoritmo de comparação de seqüênciae um dispositivo de armazenamento de dados que tem pelo menos umaseqüência de referência armazenada nele. Em outro aspecto, o algoritmo decomparação de seqüência compreende um programa de computador queindica polimorfismos. Em um aspecto, o sistema de computador pode aindacompreender um identificador que identifica uma ou mais características nadita seqüência. A invenção fornece meios de leitura em computador que têmarmazenada neles uma seqüência de polipeptídeo ou uma seqüência deácido da invenção. A invenção fornece métodos para identificar umacaracterística era uma seqüência que compreendem as etapas de: (a) ler aseqüência usando um programa de computador que identifica uma ou maiscaracterísticas em uma seqüência, em que a seqüência compreende umaseqüência de polipeptídeo ou uma seqüência de ácido nucléico da invenção;e (b) identificar uma ou mais características na seqüência com o programade computador. A invenção fornece métodos para comparar uma primeiraseqüência a uma segunda seqüência, compreendendo as etapas de: (a) lera primeira seqüência e a segunda seqüência através do uso de umprograma de computador que compara seqüências, em que a primeiraseqüência compreende uma seqüência de polipeptídeo ou uma seqüênciade ácido nucléico da invenção; e (b) determinar as diferenças entre aprimeira seqüência e a segunda seqüência com o programa de computador.A etapa de determinar diferenças entre a primeira seqüência e a segundaseqüência compreende ainda a etapa de identificar polimorfismos. Em umaspecto, o método pode ainda compreender um identificador que identificauma ou mais características em uma seqüência. Em outro aspecto, ométodo pode compreenderr ler a primeira seqüência usando um programade computador e identificar uma ou mais características na seqüência.A invenção fornece métodos para isolar ou recuperar um ácidonucléico que codifica um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase a partir de uma amostra do ambiente quecompreende as etapas de: (a) fornecer um par de seqüências de iniciadoresde amplificação para amplificar um ácido nucléico que codifica umpolipeptídeo que tem uma atividade de xilanase, mananase e/ou glicanase,em que o par de iniciadores é capaz de amplificar um ácido nucléico dainvenção; (b) isolar um ácido nucléico da amostra do ambiente ou tratar aamostra do ambiente tal que o ácido nucléico na amostra seja acessível parahibridização ao par de iniciadores de amplificação da etapa (a); e (c)combinar o ácido nucléico da etapa (b) com o par de iniciadores deamplificação da etapa (a); e amplificar o ácido nucléico a partir da amostrado ambiente, dessa forma isolando ou recuperando um ácido nucléico quecodifica um polipeptídeo que tem uma atividade de xilanase, mananase e/ouglicanase da amostra do ambiente. Um ou cada membro do par deseqüências de iniciadores de amplificação pode compreender umoligonucleotídeo que compreende pelo menos cerca de 10 a 50 basesconsecutivas de uma seqüência da invenção. Em um aspecto, o par deseqüências de iniciadores de amplificação é um par de amplificação dainvenção.

A invenção fornece métodos para isolar ou recuperar um ácidonucléico que codifica um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase a partir de uma amostra do ambiente quecompreende as etapas de: (a) fornecer uma sonda de polinucleotídeo quecompreende um ácido nucléico da invenção ou uma subseqüência deste; (b)isolar um ácido nucléico da amostra do ambiente ou tratar a amostra doambiente tal que o ácido nucléico na amostra seja acessível parahibridização a uma sonda de polinucleotídeo da etapa (a); (c) combinar oácido nucléico isolado ou a amostra do ambiente tratada da etapa (b) com asonda de polinucleotídeo da etapa (a); e (d) isolar um ácido nucléico quehibridiza especificamente com a sonda de polinucleotídeo da etapa (a),dessa forma isolando ou recuperando um ácido nucléico que codifica umpolipeptídeo que tem uma atividade de xilanase, mananase e/ou glicanase apartir de uma amostra do ambiente. A amostra do ambiente podecompreender uma amostra de água, uma amostra de líquido, uma amostrade solo, uma amostra de ar, ou uma amostra biológica. Em um aspecto, aamostra biológica pode ser derivada de uma célula bacteriana, uma célulade protozoário, uma célula de inseto, uma célula de levedura, uma célula deplanta, uma célula de fungo, ou uma célula de mamífero.

A invenção fornece métodos de gerar uma variante de um ácidonucléico que codifica um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase que compreende as etapas de: (a) fornecer umácido nucléico molde que compreende um ácido nucléico da invenção; e (b)modificar, deletar ou adicionar um ou mais nucleotídeos na seqüênciamolde, ou uma combinação destes, para gerar uma variante do ácidonucléico molde. Em um aspecto, o método pode compreender aindaexpressar o ácido nucléico variante para gerar um polipeptídeo de xilanase,a mananase e/ou a glicanase variante. As modificações, adições oudeleções podem ser introduzidas por um método que compreende "error-prone" PCR, embaralhamento, mutagênese sítio-direcionada, "assembly"PCR, mutagênese por PCR sexual, mutagênese in vivo, mutagênese decassete, mutagênese de agrupamentos repetitivos, mutagênese deagrupamento exponencial, mutagênese sítio-específica, reagrupamento degenes (por exemplo, GeneReassembIy, veja, por exemplo, Patente U.S. N°.6.537.776), Mutagênese por Saturação do Sítio do Gene (Gene SiteSaturation Mutagenesis (GSSM)), reagrupamento por ligação sintética(.synthetic Iigation reassembiy (SLR)) ou uma combinação destes. Em outroaspecto, as modificações, adições ou deleções são introduzidas por ummétodo que compreende recombinação, recombinação de seqüênciarepetitiva, mutagênese de DNA modificado por fosfotioato, mutagênese demolde contendo uracila, mutagênese de dúplex interrompido, mutagênesede reparo de mal-pareamentos pontuais, mutagênese por cepas dohospedeiro deficientes em reparo, mutagênese química, mutagêneseradiogênica, mutagênese por deleção, mutagênese por seleção de restrição,mutagênese por purificação de restrição, síntese de gene artificial,mutagênese de agrupamentos, criação de multímero de ácido nucléicoquimérico e uma combinação destes.

Em um aspecto, o método pode ser repetido iterativamente atéque uma xilanase, uma mananase e/ou uma glicanase que tem umaatividade alterada ou diferente ou uma estabilidade alterada ou diferentedaquela de um polipeptídeo codificado pelo ácido nucléico é produzida. Emum aspecto, o polipeptídeo de xilanase, mananase e/ou glicanase variante étermotolerante, e retém alguma atividade após ser exposto a umatemperatura elevada. Em outro aspecto, o polipeptídeo de xilanase,mananase e/ou glicanase tem glicosilação aumentada quando comparado àxilanase, à mananase e/ou à glicanase codificada pelo ácido nucléico molde.

Alternativamente, o polipeptídeo de xilanase, mananase e/ou glicanasevariante tem uma atividade de xilanase, mananase e/ou glicanase sob umaalta temperatura, em que a xilanase, mananase e/ou glicanase codificadapelo ácido nucléico molde não é ativa sob a alta temperatura. Em umaspecto, método pode ser repetido iterativamente até que uma seqüênciacodificante de xilanase, mananase e/ou glicanase que tem um uso de códondiferente daquele do ácido nucléico molde é produzida. Em outro aspecto, ométodo pode ser repetido iterativamente até que um gene de xilanase,mananase e/ou glicanase que tem um nível maior ou menor de expressãode mensagem ou estabilidade do que aquele do ácido nucléico molde éproduzido. Em outro aspecto, a formulação do produto final de xilanase,mananase e/ou glicanase permite um aumento ou modulação dodesempenho da xilanase, mananase e/ou glicanase no produto.

A invenção fornece métodos para modificar códons em um ácidonucléico que codifica um polipeptídeo que tem uma atividade de xilanase, mananase e/ou glicanase para aumentar sua expressão em uma célulahospedeira, o método compreendendo as seguintes etapas: (a) fornecer umácido nucléico da invenção que codifica um polipeptídeo que tem umaatividade de xilanase, mananase e/ou glicanase; e, (b) identificar um códonnão-preferido ou menos preferido no ácido nucléico da etapa (a) e substituí-lo por um códon preferido ou usado de forma neutra que codifica o mesmoaminoácido que o códon substituído, em que um códon preferido é super-representado em seqüências codificantes em genes na célula hospedeira eum códon não preferido ou menos preferido é sub-representado emseqüências codificantes em genes na célula hospedeira, modificando assimo ácido nucléico para aumentar sua expressão em uma célula hospedeira.

A invenção fornece métodos para modificar códons em um ácidonucléico que codifica um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase, o método compreendendo as seguintes etapas:(a) fornecer um ácido nucléico da invenção; e (b) identificar um códon noácido nucléico da etapa (a) e substituí-lo por um códon diferente que codificao mesmo aminoácido que o códon substituído, modificando assim códonsem um ácido nucléico que codifica uma xilanase, mananase e/ou glicanase.

A invenção fornece métodos para modificar códons em um ácidonucléico que codifica um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase para aumentar sua expressão em uma célulahospedeira, o método compreendendo as seguintes etapas: (a) fornecer umácido nucléico da invenção que codifica um polipeptídeo de xilanase,mananase e/ou glicanase; e, (b) identificar um códon não preferido oumenos preferido no ácido nucléico da etapa (a) e substituí-lo por um códonpreferido ou usado de forma neutra que codifica o mesmo aminoácido que ocódon substituído, em que um códon preferido é um códon super-representado em seqüências codificantes em genes na célula hospedeira eum códon não-preferido ou menos preferido é um códon sub-representadoem seqüências codificantes em genes na célula hospedeira, modificandoassim o ácido nucléico para aumentar sua expressão em uma célulahospedeira.A invenção fornece métodos para modificar um códon em umácido nucléico que codifica um polipeptídeo que tem uma atividade dexilanase, mananase e/ou glicanase para diminuir sua expressão em umacélula hospedeira, o método compreendendo as seguintes etapas: (a)fornecer um ácido nucléico da invenção; e (b) identificar pelo menos umcódon preferido no ácido nucléico da etapa (a) e substituí-lo por um códonnão-preferido ou menos preferido que codifica o mesmo aminoácido que ocódon substituído, em que um códon preferido é um códon super-representado em seqüências codificantes em genes em uma célulahospedeira, e um códon não-preferido ou menos preferido é um códon sub-representado em seqüências codificantes em genes na célula hospedeira,modificando assim o ácido nucléico para diminuir sua expressão em umacélula hospedeira. Em um aspecto, a célula hospedeira pode ser uma célulabacteriana, uma célula de fungo, uma célula de inseto, uma célula delevedura, uma célula de planta ou uma célula de mamífero.

A invenção fornece métodos para produzir uma biblioteca deácidos nucléicos que codifica uma pluralidade de sítios ativos ou sítios deligação de substrato modificados de xilanase, mananase e/ou glicanase, emque os sítios ativos ou sítios de ligação de substrato modificados sãoderivados de um primeiro ácido nucléico que compreende uma seqüênciaque codifica um primeiro sítio ativo ou um primeiro sítio de ligação desubstrato, o método compreendendo as seguintes etapas: (a) fornecer umprimeiro ácido nucléico que codifica um primeiro sítio ativo ou um primeirosítio de ligação de substrato, em que a primeira seqüência de ácido nucléicocompreende uma seqüência que hibridiza sob condições estringentes a umaseqüência da invenção, ou uma subseqüência desta, e o ácido nucléicocodifica um sítio ativo de xilanase, mananase e/ou glicanase ou um sítio deligação de substrato de xilanase, mananase e/ou glicanase; (b) fornecer umconjunto de oligonucleotídeos mutagênicos que codificam variantes deaminoácido de ocorrência natural em uma pluralidade de códons alvo noprimeiro ácido nucléico; e (c) usar o conjunto de oligonucleotídeosmutagênicos para gerar um conjunto de ácidos nucléicos variantescodificantes de sítio ativo ou codificantes de sítio de ligação de substrato quecodificam uma gama de variações de aminoácido em cada códon deaminoácido que foi mutagenizado, produzindo assim uma biblioteca deácidos nucléicos que codifica uma pluralidade de sítios ativos ou sítios deligação de substrato de xilanase, mananase e/ou glicanase. Em um aspecto,o método compreende mutagenizar o primeiro ácido nucléico da etapa (a)por um método que compreende um sistema de evolução dirigida otimizado,Mutagênese por Saturação do Sítio do Gene (GSSM), ou reagrupamento porligação sintética (SLR). Em um aspecto, o método compreende mutagenizaro primeiro ácido nucléico da etapa (a) ou variantes por um método quecompreende "error-prone" PCR, embaralhamento, mutagênese sítiodirecionada, "assembly" PCR, mutagênese por PCR sexual, mutagênese invivo, mutagênese de cassete, mutagênese de agrupamentos repetitivos,mutagênese de agrupamento exponencial, mutagênese sítio-específica,reagrupamento de genes (GeneReassembly, Patente U.S. N0. 6.537.776),Mutagênese por Saturação do Sítio do Gene (GSSM), reagrupamento porligação sintética (SLR) e uma combinação destes. Em um aspecto, o métodocompreende mutagenizar o primeiro ácido nucléico da etapa (a) ou variantespor um método que compreende recombinação, recombinação de seqüênciarepetitiva, mutagênese de DNA modificado por fosfotioato, mutagênese demolde contendo uracila, mutagênese de dúplex interrompido, mutagênesede reparo de mal-pareamentos pontuais, mutagênese por cepas dohospedeiro deficientes em reparo, mutagênese química, mutagêneseradiogênica, mutagênese por deleção, mutagênese por seleção de restrição,mutagênese por purificação de restrição, síntese de gene artificial,mutagênese de agrupamentos, criação de multímero de ácido nucléicoquimérico ou uma combinação destes.

A invenção fornece métodos para fazer uma pequena moléculaque compreende as seguintes etapas: (a) fornecer uma pluralidade deenzimas biossintéticas capazes de sintetizar ou modificar uma pequenamolécula, em que uma das enzimas compreende uma xilanase, mananasee/ou glicanase codificada por um ácido nucléico da invenção; (b) fornecerum substrato para pelo menos uma das enzimas da etapa (a); e (c) reagir osubstrato da etapa (b) com as enzimas sob condições que facilitam umapluralidade de reações biocatalíticas para gerar uma pequena molécula poruma série de reações biocatalíticas. A invenção fornece métodos paramodificar uma pequena molécula que compreende as seguintes etapas: (a)fornecer uma enzima xilanase, mananase e/ou glicanase, em que a enzimacompreende um polipeptídeo da invenção, ou um polipeptídeo codificado porum ácido nucléico da invenção; ou uma subseqüência deste; (b) forneceruma pequena molécula; e (c) reagir a enzima da etapa (a) com a pequenamolécula da etapa (b) sob condições que facilitam uma reação enzimáticacatalisada pela enzima xilanase, mananase e/ou glicanase, modificandoassim uma pequena molécula por uma reação enzimática de xilanase,mananase e/ou glicanase. Em um aspecto, o método pode compreenderuma pluralidade de substratos de pequenas moléculas para a enzima daetapa (a), gerando assim uma biblioteca de pequenas moléculasmodificadas produzidas por pelo menos uma reação enzimática catalisadapela enzima xilanase, mananase e/ou glicanase. Em um aspecto, o métodopode compreender uma pluralidade de enzimas adicionais que facilitam umapluralidade de reações biocatalíticas pelas enzimas para formar umabiblioteca de pequenas moléculas modificadas produzidas pela pluralidadede reações enzimáticas. Em outro aspecto, o método pode aindacompreender a etapa de testar a biblioteca para determinar se uma pequenamolécula modificada em particular que exibe uma atividade desejada estápresente dentro da biblioteca. A etapa de testar a biblioteca pode aindacompreender as etapas de eliminar sistematicamente todas menos uma dasreações biocatalíticas usadas para produzir uma porção da pluralidade daspequenas moléculas modificadas dentro da biblioteca por testar a porção dapequena molécula modificada quanto à presença ou ausência da pequenamolécula modificada em particular com uma atividade desejada, e identificarpelo menos uma reação biocatalítica que produz a pequena moléculamodificada particular de atividade desejada.

A invenção fornece métodos para determinar um fragmentofuncional de uma enzima xilanase, mananase e/ou glicanase quecompreende as etapas de: (a) fornecer uma enzima xilanase, mananasee/ou glicanase, em que a enzima compreende um polipeptídeo da invenção,ou um polipeptídeo codificado por um ácido nucléico da invenção, ou umasubseqüência deste; e (b) deletar uma pluralidade de resíduos deaminoácido da seqüência da etapa (a) e testar a subseqüênciaremanescente quanto a uma atividade de xilanase, mananase e/ouglicanase, determinando assim um fragmento funcional de uma enzimaxilanase, mananase e/ou glicanase. Em um aspecto, a atividade de xilanase,mananase e/ou glicanase é medida por fornecer um substrato de xilanase,mananase e/ou glicanase e detectar uma diminuição na quantidade dosubstrato ou um aumento na quantidade de um produto de reação.

A invenção fornece métodos para a manipulação de célulasinteiras de fenótipos novos ou modificados pelo uso de análise de fluxometabólico em tempo real, o método compreendendo as seguintes etapas:(a) fazer uma célula modificada por modificar a composição genética de umacélula, em que a composição genética é modificada pela adição à célula deum ácido nucléico da invenção; (b) cultivar a célula modificada para geraruma pluralidade de células modificadas; (c) medir pelo menos um parâmetrometabólico da célula por monitorar a cultura celular da etapa (b) em temporeal; e (d) analisar os dados da etapa (c) para determinar se o parâmetromedido difere de uma medida comparável em uma célula não modificadasob condições similares, identificando assim um fenótipo manipulado nacélula usando análise de fluxo metabólico em tempo real. Em um aspecto, acomposição genética da célula pode ser modificada por um método quecompreende deleção de uma seqüência ou modificação de uma seqüênciana célula, ou nocaute da expressão de um gene. Em um aspecto, o métodoainda pode compreender selecionar uma célula que compreende umfenótipo recentemente manipulado. Em outro aspecto, o método podecompreender ainda cultivar a célula selecionada, gerando assim uma novalinhagem celular que compreende um fenótipo recentemente manipulado.

A invenção fornece seqüências de sinal isoladas, sintéticas ourecombinantes que consistem em, ou compreendem, uma seqüênciadescrita nos resíduos 1 a 12, 1 a 13, 1 a 14, 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1a 19, 1 a 20, 1 a 21, 1 a 22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a28, 1 a 30, 1 a 31, 1 a 32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a40, 1 a 41, 1 a 42, 1 a 43 ou 1 a 44 de um polipeptídeo da invenção,incluindo seqüências de polipeptídeo exemplares da invenção. A invençãofornece seqüências de sinal isoladas, sintéticas ou recombinantes queconsistem em, ou compreendem seqüências descritas na Tabela 4 abaixo.

A invenção fornece polipeptídeos quiméricos que compreendempelo menos um primeiro domínio que compreende um peptídeo de sinal (SP)e pelo menos um segundo domínio que compreende um polipeptídeo oupeptídeo heterólogo que compreende uma seqüência da invenção, ou umasubseqüência desta, em que o polipeptídeo ou peptídeo heterólogo não estáassociado naturalmente com o peptídeo de sinal (SP). Em um aspecto, opeptídeo de sinal (SP) não é derivado de uma xilanase, mananase e/ouglicanase. O polipeptídeo ou peptídeo heterólogo pode ser amino terminal a,carbóxi terminal a, ou estar em ambas as extremidades do peptídeo de sinal(SP) ou de um domínio catalítico (CD) de uma xilanase, mananase e/ouglicanase. A invenção fornece ácidos nucléicos isolados, sintéticos ourecombinantes que codificam um polipeptídeo quimérico, em que opolipeptídeo quimérico compreende pelo menos um primeiro domínio quecompreende um peptídeo de sinal (SP) e pelo menos um segundo domínioque compreende um polipeptídeo ou peptídeo heterólogo que compreendeuma seqüência da invenção, ou uma subseqüência desta, em que opolipeptídeo ou peptídeo heterólogo não está naturalmente associado com opeptídeo de sinal (SP).A invenção fornece métodos de aumentar a termotolerância outermoestabilidade de um polipeptídeo de xilanase, mananase e/ou glicanase,o método compreendendo glicosilar um polipeptídeo de xilanase, mananasee/ou glicanase, em que o polipeptídeo compreende pelo menos trintaaminoácidos contíguos de um polipeptídeo da invenção; ou um polipeptídeocodificado por uma seqüência de ácido nucléico da invenção, aumentandoassim a termotolerância ou termoestabilidade do polipeptídeo de xilanase,mananase e/ou glicanase. Em um aspecto, a atividade especifica dexilanase, mananase e/ou glicanase pode ser termoestavel ou termotoleranteem uma temperatura na faixa de mais do que cerca de 37°C a cerca de85°C, 909C, 95SC, 979C ou mais.

A invenção fornece métodos para superexpressar umpolipeptídeo de xilanase, mananase e/ou glicanase recombinante em umacélula, compreendendo expressar um vetor que compreende um ácidonucléico da invenção ou uma seqüência de ácido nucléico da invenção, emque as identidades de seqüência são determinadas por análise com umalgoritmo de comparação de seqüência ou por inspeção visual, em que asuperexpressão é afetada pelo uso de um promotor de alta atividade, umvetor bicistrônico, ou por amplificação gênica do vetor.

A invenção fornece métodos de fazer uma planta e sementestransgênicas, compreendendo as seguintes etapas: (a) introduzir umaseqüência de ácido nucléico heteróloga na célula, em que a seqüência deácido nucléico heterólogo compreende uma seqüência de ácido nucléico dainvenção, produzindo assim uma célula de planta ou semente transformada;e (b) produzir uma planta transgênica a partir da célula ou sementetransformada. Em um aspecto, a etapa (a) pode ainda compreenderintroduzir a seqüência de ácido nucléico heterólogo por eletroporação oumicroinjeção de protoplastos de célula de planta. Em outro aspecto, a etapa(a) pode ainda compreender introduzir a seqüência de ácido nucléicoheterólogo diretamente em um tecido de planta por bombardeio de partículasde DNA. Alternativamente, a etapa (a) pode ainda compreender introduzir aseqüência de ácido nucléico heterólogo no DNA da célula de planta usandoum hospedeiro de Agrobacterium tumefaciens. Em um aspecto, a célula deplanta pode ser uma célula de batata, milho, arroz, trigo, tabaco, ou cevada.

A invenção fornece métodos de expressar uma seqüência deácido nucléico heterólogo em uma célula de planta que compreende asseguintes etapas: (a) transformar a célula de planta com uma seqüência deácido nucléico heterólogo operativamente ligada a um promotor, em que aseqüência de ácido nucléico heterólogo compreende um ácido nucléico dainvenção; (b) cultivar a planta sob condições em que a seqüência de ácidonucléico heterólogo seja expressa na célula de planta. A invenção fornecemétodos de expressar uma seqüência de ácido nucléico heterólogo em umaplanta, compreendendo as seguintes etapas: (a) transformar a célula deplanta com uma seqüência de ácido nucléico heterólogo operativamenteligada a um promotor, em que a seqüência de ácido nucléico heterólogocompreende uma seqüência da invenção; (b) cultivar a planta sob condiçõesem que a seqüência de ácido nucléico heterólogo seja expressa na célula deplanta.

A invenção fornece métodos para hidrolisar, quebrar ou romperuma composição que compreende xilano, compreendendo as seguintesetapas: (a) fornecer um polipeptídeo da invenção que tem uma atividade dexilanase, mananase e/ou glicanase, ou um polipeptídeo codificado por umácido nucléico da invenção; (b) fornecer uma composição que compreendeum xilano; e (c) colocar o polipeptídeo da etapa (a) em contato com acomposição da etapa (b) sob condições em que a xilanase, mananase e/ouglicanase hidrolisa, quebra ou rompe a composição que compreende xilano.Em um aspecto, a composição compreende uma célula de planta, umacélula bacteriana, uma célula de levedura, uma célula de inseto, ou umacélula de animal. Dessa forma, a composição pode compreender qualquerplanta ou parte de planta, qualquer alimento ou ração que contém xilano, umproduto residual e semelhantes.A invenção fornece métodos para liqüefazer ou remover umacomposição que compreende xilano, compreendendo as seguintes etapas:(a) fornecer um polipeptídeo da invenção que tem uma atividade de xilanase,ou um polipeptídeo codificado por um ácido nucléico da invenção; (b)fornecer uma composição que compreende um xilano; e (c) colocar opolipeptídeo da etapa (a) em contato com a composição da etapa (b) sobcondições em que a xilanase remover, amolece ou liqüefaz a composiçãoque contém xilano.

A invenção fornece composições detergentes quecompreendem um polipeptídeo da invenção ou um polipeptídeo codificadopor um ácido nucléico da invenção, em que o polipeptídeo tem umaatividade de xilanase, mananase e/ou glicanase. A xilanase pode ser umaxilanase, mananase e/ou glicanase sem atividade na superfície, ou umaxilanase, mananase e/ou glicanase com atividade de superfície. A xilanase,mananase e/ou glicanase pode ser formulada em uma composição líquidanão-aquosa, um sólido moldado, uma forma granular, uma formaparticulada, um tablete comprimido, uma forma em gel, uma pasta ou umaforma de pasta fluida. A invenção fornece métodos para lavar um objeto quecompreende as seguintes etapas: (a) fornecer uma composição quecompreende um polipeptídeo que tem uma atividade de xilanase, mananasee/ou glicanase, ou um polipeptídeo codificado por um ácido nucléico dainvenção; (b) fornecer um objeto; e (c) colocar a o polipeptídeo da etapa (a)com o objeto da etapa (b) sob condições em que a composição pode lavar oobjeto.

A invenção fornece têxteis ou tecidos, incluindo, por exemplo,fios, que compreendem um polipeptídeo da invenção, ou um polipeptídeocodificado por um ácido nucléico da invenção. Em um aspecto, os têxteis outecidos compreendes fibras que contêm xilano. A invenção fornece métodospara tratar um têxtil ou tecido (por exemplo, remover uma mancha de umacomposição) compreendendo as seguintes etapas: (a) fornecer umacomposição que compreende um polipeptídeo da invenção que tem umaatividade de xilanase, mananase e/ou glicanase, ou um polipeptídeocodificado por um ácido nucléico da invenção; (b) fornecer um têxtil ou tecidoque compreende um xilano; e (c) colocar o polipeptídeo da etapa (a) emcontato com a composição da etapa (b) sob condições em que a xilanase,mananase e/ou glicanase possa tratar o têxtil ou tecido (por exemplo,remover a mancha). A invenção fornece métodos para melhorar oacabamento de um tecido compreendendo as seguintes etapas: (a) forneceruma composição que compreende um polipeptídeo da invenção que temuma atividade de xilanase, mananase e/ou glicanase, ou um polipeptídeocodificado por um ácido nucléico da invenção; (b) fornecer um tecido; e (c)colocar o polipeptídeo da etapa (a) em contato com o tecido da etapa (b) sobcondições em que o polipeptídeo possa tratar o tecido melhorando assim oacabamento do tecido. Em um aspecto, o tecido é lã ou seda. Em outroaspecto, o tecido é uma fibra celulósica ou uma mistura de uma fibra naturale uma fibra sintética.

A invenção fornece rações ou alimentos que compreendem umpolipeptídeo da invenção, ou um polipeptídeo codificado por um ácidonucléico da invenção. A invenção fornece métodos para hidrolisar xilanos emuma ração ou alimento antes do consumo por um animal compreendendo asseguintes etapas: (a) obter um material de ração que compreende umaxilanase, mananase e/ou glicanase da invenção, ou uma xilanase,mananase e/ou glicanase codificada por um ácido nucléico da invenção; e(b) adicionar o polipeptídeo da etapa (a) ao material de ração ou alimentoem uma quantidade suficiente por um período de tempo suficiente paracausar hidrólise do xilano e formação de um alimento ou ração tratada,hidrolisando assim os xilanos no alimento ou na ração antes do consumopelo animal. Em um aspecto, a invenção fornece métodos para hidrolisarxilanos em uma ração ou alimento após o consumo por um animal,compreendendo as seguintes etapas: (a) obter um material de ração quecompreende uma xilanase, mananase e/ou glicanase da invenção, ou umaxilanase, mananase e/ou glicanase codificada por um ácido nucléico dainvenção; e (b) adicionar o polipeptídeo da etapa (a) ao material de ração oualimento; e (c) administrar o material de ração ou alimento ao animal, emque após o consumo, a xilanase, mananase e/ou glicanase causa hidrolisede xilanos na ração ou alimento no trato digestivo do animal. O alimento ou aração pode ser, por exemplo, um cereal, um grão, milho, semelhantes.

A invenção fornece produtos de massa de farinha ou pão quecompreendem um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase, em que o polipeptídeo compreende umaseqüência da invenção, ou o polipeptídeo é codificado por um ácido nucléicoque compreende uma seqüência da invenção, ou um fragmentoenzimaticamente ativo desse. A invenção fornece métodos de acondicionarmassa de farinha que compreendem colocar uma massa de farinha ou umproduto de pão em contato com pelo menos um polipeptídeo que tem umaatividade de xilanase, mananase e/ou glicanase, em que o polipeptídeocompreende uma seqüência da invenção, ou o polipeptídeo é codificado porum ácido nucléico que compreende uma seqüência da invenção, ou umfragmento enzimaticamente ativo desse, sob condições suficientes paraacondicionar a massa de farinha.

A invenção fornece bebidas que compreendem um polipeptídeoque tem uma atividade de xilanase, mananase e/ou glicanase, em que opolipeptídeo compreende uma seqüência da invenção, ou o polipeptídeo écodificado por um ácido nucléico que compreende uma seqüência dainvenção. A invenção fornece métodos de produção de bebida quecompreendem a administração de pelo menos um polipeptídeo que tem umaatividade de xilanase, mananase e/ou glicanase, em que o polipeptídeocompreende uma seqüência da invenção, ou o polipeptídeo é codificado porum ácido nucléico que compreende uma seqüência da invenção, ou umfragmento enzimaticamente ativo desse, a uma bebida ou precursor debebida sob condições suficientes para diminuir a viscosidade da bebida, emque em um aspecto (opcionalmente) bebida ou o precursor de bebida é ummosto ou uma cerveja.A invenção fornece alimentos ou suplementos nutricionais paraum animal, que compreendem um polipeptídeo da invenção, por exemplo,um polipeptídeo codificado por um ácido nucléico da invenção. Em umaspecto, o polipeptídeo no alimento ou suplemento nutricional pode serglicosilado. A invenção fornece matrizes de liberação de enzima comestíveisque compreendem um polipeptídeo da invenção, por exemplo, umpolipeptídeo codificado pelo ácido nucléico da invenção. Em um aspecto, amatriz de liberação compreende um pélete. Em um aspecto, o polipeptídeopode ser glicosilado. Em um aspecto, a atividade de xilanase, mananasee/ou glicanase é termotolerante. Em outro aspecto, a atividade de xilanase,mananase e/ou glicanase é termoestável.

A invenção fornece um alimento, uma ração ou suplementonutricional que compreende um polipeptídeo da invenção. A invençãofornece métodos para utilizar uma xilanase, mananase e/ou glicanase comoum suplemento nutricional em uma dieta animal, o método compreendendo:preparar um suplemento nutricional contendo uma enzima xilanase,mananase e/ou glicanase que compreende pelo menos trinta aminoácidoscontíguos de um polipeptídeo da invenção; e administrar o suplementonutricional a um animal para aumentar a utilização de um xilano contido emuma ração ou alimento ingerido pelo animal. O animal pode ser um serhumano, um ruminante ou um animal monogástrico. A enzima xilanase,mananase e/ou glicanase pode ser preparada pela expressão de umpolinucleotídeo que codifica a xilanase, mananase e/ou glicanase em umorganismo selecionado a partir do grupo que consiste em uma bactéria, umalevedura, uma planta, um inseto, um fungo e um animal. O organismo podeser selecionado a partir do grupo que consiste em S. pombe, S. cerevisiae,Pichia pastoris, Pseudomonas sp. E. coli, Streptomyces sp., Bacillus sp. eLactobacillus sp.

A invenção fornece matriz de liberação de enzima comestívelque compreende uma enzima xilanase, mananase e/ou glicanaserecombinante termoestável, por exemplo, um polipeptídeo da invenção. Ainvenção fornece métodos para liberar um suplemento de xilanase,mananase e/ou glicanase a um animal, o método compreendendo: prepararuma matriz de liberação de enzima comestível na forma de péletes quecompreendem um veículo granulado comestível e uma enzima xilanase,mananase e/ou glicanase recombinante termoestável, em que os péletesdispersam facilmente a enzima xilanase, mananase e/ou glicanase neles emmeio aquoso, e administrar a matriz de liberação de enzima comestível aoanimal. A enzima xilanase, mananase e/ou glicanase recombinante podecompreender um polipeptídeo da invenção. O veículo comestível granuladocompreende um veículo selecionado a partir do grupo que consiste em umgerme de grão, um germe de grão que tem o óleo extraído, um feno, umaalfafa, grama (Timothy), uma casca de soja, uma farinha de semente degirassol, e um farelo de trigo. O veículo comestível pode compreender germede grão que tem o óleo extraído. A enzima xilanase, a mananase e/ou aglicanase pode ser glicosilada para fornecer termoestabilidade em condiçõesde peletização. A matriz de liberação pode ser formada por peletizar umamistura que compreende um germe de grão e uma xilanase, mananase e/ouglicanase. As condições de peletização podem incluir aplicação vapor. Ascondições de peletização podem compreender a aplicação de umatemperatura acima de cerca de 809C por cerca de 5 minutos e a enzimaretém uma atividade específica de pelo menos 350 a cerca de 900 unidadespor miligrama de enzima.

A invenção fornece métodos para melhorar a textura e sabor deum produto lácteo, compreendendo as seguintes etapas: (a) fornecer umpolipeptídeo da invenção que tem uma atividade de xilanase, mananasee/ou glicanase, ou uma xilanase, uma mananase e/ou uma glicanasecodificada por um ácido nucléico da invenção; (b) fornecer um produtolácteo; e (c) colocar o polipeptídeo da etapa (a) em contato com o produtolácteo da etapa (b) sob condições em que a xilanase, mananase e/ouglicanase possa melhorar a textura ou o sabor de um produto lácteo. Em umaspecto, o produto lácteo compreende um queijo ou um iogurte. A invençãofornece produtos lácteos que compreendem uma xilanase, uma mananàsee/ou uma glicanase da invenção, ou que é codificada por um ácido nucléicoda invenção.

A invenção fornece métodos para melhorar a extração de óleode uma planta rica em óleo, compreendendo as seguintes etapas: (a)fornecer um polipeptídeo da invenção que tem uma atividade de xilanase,mananase e/ou glicanase, ou uma xilanase, uma mananase e/ou umaglicanase codificada por um ácido nucléico da invenção; (b) fornecer materialde uma planta rica em óleo; (c) colocar o polipeptídeo da etapa (a) emcontato com o material da planta rica em óleo. Em um aspecto, o material daplanta rica em óleo compreende uma semente rica em óleo. O óleo pode serum óleo de soja, um óleo de oliva, um óleo de colza (canola) ou um óleo degirassol.

A invenção fornece métodos para preparar um suco, xarope,purê ou extrato de fruta ou vegetal, compreendendo as seguintes etapas: (a)fornecer um polipeptídeo da invenção que tem uma atividade de xilanase,mananase e/ou glicanase, ou uma xilanase, uma mananase e/ou umaglicanase codificada por um ácido nucléico da invenção; (b) fornecer umacomposição ou um líquido que compreende um material de fruta ou vegetal;e (c) colocar o polipeptídeo da etapa (a) em contato com a composição,preparando assim o suco, xarope, purê ou extrato de fruta ou vegetal.

A invenção fornece papéis ou produtos de papel ou polpa depapel que compreendem uma xilanase, uma mananase e/ou uma glicanaseda invenção, ou um polipeptídeo codificado por um ácido nucléico dainvenção. A invenção fornece métodos de tratar um papel ou uma polpa depapel ou madeira compreendendo as seguintes etapas: (a) fornecer umpolipeptídeo da invenção que tem uma atividade de xilanase, mananasee/ou glicanase, ou uma xilanase, uma mananase e/ou uma glicanasecodificada por um ácido nucléico da invenção; (b) fornecer uma composiçãoque compreende um papel ou uma polpa de papel ou madeira; e (c) colocaro polipeptídeo da etapa (a) em contato com a composição da etapa (b) sobcondições em que uma xilanase, uma mananase e/ou uma glicanasepossam tratar o papel ou polpa de papel ou madeira.

A invenção fornece métodos para reduzir a quantidade deIignina (deslignificação), ou solubilizar uma lignina, em um papel ou produtode papel, um resíduo de papel, uma madeira, polpa de madeira, ou produtode madeira, ou uma composição de reciclagem de madeira ou papel, quecompreende colocar o papel ou produto de papel, madeira, polpa demadeira, ou produto de madeira, ou composição de reciclagem de madeiraou papel em contato com um polipeptídeo da invenção, ou um fragmentoenzimaticamente ativo deste.

A invenção fornece métodos para hidrolisar hemiceluloses emuma madeira, produto de madeira, polpa de papel, produto de papel ouresíduo de papel, compreendendo colocar a madeira, produto de madeira,polpa de papel, produto de papel ou resíduo de papel em contato com umpolipeptídeo da invenção, ou um fragmento enzimaticamente ativo deste.

A invenção fornece métodos para alvejante enzimático de polpade papel, cânhamo ou linho, que compreendem colocar a polpa de papel,cânhamo ou linho em contato com uma xilanase, mananase e/ou glicanase eum agente de alvejamento, em que a xilanase, mananase e/ou glicanasecompreende um polipeptídeo da invenção, ou um fragmentoenzimaticamente ativo deste. O agente de alvejamento pode compreenderoxigênio ou peróxido de hidrogênio.

A invenção fornece métodos para o alvejante de uma polpa delingocelulose, que compreendem colocar a polpa de Iignocelulose emcontato com uma xilanase, mananase e/ou glicanase, em que a xilanase,mananase e/ou glicanase compreende um polipeptídeo da invenção, ou umfragmento enzimaticamente ativo deste.

A invenção fornece métodos para remoção enzimática de tintasde papel, resíduo de papel, produto reciclado de papel, remoção de toner depapéis usados impressos sem contato ou misturas de papéis usadosimpressos por contato e sem contato, compreendendo colocar em contato opapel, resíduo de papel, produto reciclado de papel, papel usado impressosem contato ou papel usado impresso por contato com uma xilanase,mananase e/ou glicanase, em que a xilanase, mananase e/ou glicanasecompreende um polipeptídeo da invenção, ou um fragmentoenzimaticamente ativo deste.

A invenção fornece métodos para alvejar uma linha, tecido, fio,roupa ou têxtil, compreendendo colocar o tecido, fio, roupa ou têxtil emcontato com uma xilanase, mananase e/ou glicanase sob condiçõesadequadas para produzir um alvejante do têxtil, em que a xilanase,mananase e/ou glicanase compreende um polipeptídeo da invenção, ou umfragmento enzimaticamente ativo deste. A linha, tecido, fio, roupa ou têxtilpode compreender uma linha, tecido, fio, roupa ou têxtil celulósico semalgodão. A invenção fornece tecidos, fios, roupas ou têxteis quecompreendem um polipeptídeo que tem uma seqüência da invenção, ou umpolipeptídeo codificado por um ácido nucléico que compreende umaseqüência da invenção, ou um fragmento enzimaticamente ativo destes, emque em um aspecto (opcionalmente) o tecido, fio, roupa ou têxtilcompreende um tecido, fio, roupa ou têxtil celulósico sem algodão.

A invenção fornece métodos para alvejar ou remover tinta dejornais compreendendo colocar o jornal em contato com uma xilanase,mananase e/ou glicanase, em que a xilanase, a mananase e/ou a glicanasecompreende um polipeptídeo da invenção, ou um fragmentoenzimaticamente ativo desse.

A invenção fornece madeira, lascas de madeira, polpa demadeira, produtos de madeira, polpas de papel, produtos de papel, jornaisou resíduo de papel que compreende um polipeptídeo da invenção, ou umfragmento enzimaticamente ativo deste. A invenção fornece linha, tecido, fio,roupa ou têxtil que compreende um polipeptídeo da invenção, ou umfragmento enzimaticamente ativo deste.

A invenção fornece métodos para reduzir Iignina em umamadeira ou produto de madeira que compreende colocar a madeira ouproduto de madeira em contato com um polipeptídeo que tem uma atividadede xilanase, mananase e/ou glicanase, em que o polipeptídeo tem umaseqüência da invenção, ou o polipeptídeo é codificado por um ácido nucléicoque compreende uma seqüência da invenção, ou um fragmentoenzimaticamente ativo deste.

A invenção fornece métodos para reduzir Iignina em umamadeira, uma polpa de madeira, uma polpa Kraft, um papel, um produto depapel ou uma polpa de papel sob condições de alta temperatura e pHbásico, o método compreendendo as seguintes etapas: (a) fornecer pelomenos um polipeptídeo que tem uma atividade de xilanase, mananase e/ouglicanase, em que o polipeptídeo retém uma atividade de xilanase,mananase e/ou glicanase sob condições que compreendem umatemperatura de pelo menos cerca de 80°C, 85°C, 90°C ou mais e um pHbásico de pelo menos cerca de pH 10.5, pH 11, pH 12, pH 12.5 ou mais(básico) em que o polipeptídeo compreende uma xilanase, uma mananasee/ou uma glicanase que tem uma seqüência da invenção, ou a xilanase,mananase e/ou glicanase é codificada por um ácido nucléico quecompreende uma seqüência da invenção, ou um fragmento enzimaticamenteativo deste; (b) fornecer uma madeira, polpa de madeira, polpa Kraft, papel,produto de papel ou polpa de papel; que compreende lignina; e (c) colocar amadeira, polpa de madeira, polpa Kraft, papel, produto de papel ou polpa depapel em contato com o polipeptídeo da etapa (a) sob condições quecompreendem uma temperatura de pelo menos cerca de 80°C, 85°C, 90°Cou mais, e um pH básico de pelo menos cerca de pH 10.5, pH 11, pH 12, pH12.5 ou mais (básico), em que o polipeptídeo reduz a lignina na madeira,polpa de madeira, polpa Kraft, papel, produto de papel ou polpa de papel.

A invenção fornece métodos para tratar uma madeira, umapolpa de madeira, uma polpa Kraft, um produto de papel, um papel ou umapolpa de papel sob condições de alta temperatura e pH básico, o métodocompreendendo as seguintes etapas: (a) fornecer pelo menos umpolipeptídeo que tem uma atividade de xilanase, mananase e/ou glicanase,em que o polipeptídeo retém uma atividade de xilanase, mananase e/ouglicanase sob condições que compreendem uma temperatura de pelo menoscerca de 80°C, 85°C, 90°C ou mais, e um pH básico de pelo menos cerca depH 10.5, pH 11, pH 12, pH 12.5 ou mais (básico), em que o polipeptídeocompreende uma xilanase, uma mananase e/ou uma glicanase que tem umaseqüência da invenção, ou a xilanase, mananase e/ou glicanase é codificadapor um ácido nucléico que compreende uma seqüência da invenção, ou umfragmento enzimaticamente ativo deste; (b) fornecer uma madeira, umapolpa de madeira, uma polpa Kraft, um papel, um produto de papel ou umapolpa de papel; e (c) colocar a madeira, polpa de madeira, polpa Kraft,papel, produto de papel ou polpa de papel em contato com polipeptídeo daetapa (a) sob condições que compreendem uma temperatura de pelo menoscerca de 80°C, 85°C, 90°C ou mais, e um pH básico de pelo menos cerca depH 10.5, pH 11, pH 12, pH 12.5 ou mais (básico), em que o polipeptídeocatalisa a hidrólise de compostos na madeira, polpa de madeira, polpa Kraft,papel, produto de papel ou polpa de papel, e em que em um aspecto(opcionalmente), a madeira, polpa de madeira, polpa Kraft, papel, produto depapel ou polpa de papel compreende uma madeira mole e madeira dura, oua madeira, polpa de madeira, polpa Kraft, papel ou polpa de papel éderivada de uma madeira mole e madeira dura; e em que em um aspecto(opcionalmente), após o tratamento a polpa tem uma consistência de pelomenos cerca de 10%, ou de pelo menos cerca de 32%.

A invenção fornece métodos para descolorir uma madeira, umapolpa de madeira, uma polpa Kraft, um papel, um produto de papel ou umapolpa de papel sob condições de alta temperatura e pH básico, o métodocompreendendo as seguintes etapas: (a) fornecer pelo menos umpolipeptídeo que tem uma atividade de xilanase, mananase e/ou glicanase,em que o polipeptídeo retém uma atividade de xilanase, a mananase e/ou aglicanase sob condições que compreendem uma temperatura de pelo menoscerca de 80°C, 85°C, 90°C ou mais, e um pH básico de pelo menos cerca depH 10.5, pH 11, pH 12, pH 12.5 ou mais (básico), em que o polipeptídeocompreende uma xilanase, mananase e/ou glicanase que tem umaseqüência da invenção, ou a xilanase, mananase e/ou glicanase é codificadapor um ácido nucléico que compreende uma seqüência da invenção, ou umfragmento enzimaticamente ativo deste; (b) fornecer uma madeira, umapolpa de madeira, uma polpa Kraft, um papel, um produto de papel ou umapolpa de papel; e (c) colocar a madeira, polpa de madeira, polpa Kraft,papel, produto de papel ou polpa de papel em contato com o polipeptídeo daetapa (a) sob condições que compreendem uma temperatura de pelo menoscerca de 80°C, 85°C, 90°C, 919C, 929C, 939C, 949C, 959C, 969C, 979C, 989C,999C, 1009C, 1019C, 1029C, 1039C, 103,59C, 1049C, 1059C, 1079C, 1089C,1099C ou 1109C e um pH básico de pelo menos cerca de pH 9.5, pH 10.0,pH 10.5, pH 11, pH 12, pH 12.5 ou mais (básico), em que o polipeptídeocatalisa a hidrólise de compostos na madeira, polpa de madeira, polpa Kraft,papel, produto de papel ou polpa de papel, branqueando assim a madeira,polpa de madeira, polpa Kraft, papel, produto de papel ou polpa de papel.

A invenção fornece métodos para reduzir o uso de químicosbranqueadores em um processo de alvejante de madeira, polpa de madeira,polpa Kraft, papel, produto de papel ou polpa de papel sob condições de altatemperatura e pH básico, o método compreendendo as seguintes etapas: (a)fornecer pelo menos um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase, em que o polipeptídeo retém uma atividade dexilanase, a mananase e/ou a glicanase sob condições que compreendemuma temperatura de pelo menos cerca de 80°C, 85°C, 90°C, 919C, 929C,939C, 949C, 959C, 969C, 979C, 989C, 999C, IOO9C1 1019C, 1029C, 1039C,103,59C, 1049C, 1059C, 1079C, 108SC, 1099C ou 1109C, ou mais, e um pHbásico de pelo menos cerca de pH 10.5, pH 11, pH 12, pH 12.5 ou mais(básico), em que o polipeptídeo compreende uma xilanase, uma mananasee/ou uma glicanase que tem uma seqüência da invenção, ou a xilanase,mananase e/ou glicanase é codificada por um ácido nucléico quecompreende uma seqüência da invenção, ou um fragmento enzimaticamenteativo deste; (b) fornecer uma madeira, uma polpa de madeira, uma polpaKraft1 um papel, um produto de papel ou uma polpa de papel; e (c) colocar amadeira, polpa de madeira, polpa Kraft, papel, produto de papel ou polpa depapel em contato com o polipeptídeo da etapa (a) sob condições quecompreendem uma temperatura de pelo menos cerca de 80°C, 85°C, 86°C,87°C, 88°C, 89°C, 90°C, 919C, 929C, 939C, 949C, 959C, 96SC, 979C, 989C,999C, 1009C, 1019C1 1029C, 1039C, 103,59C, 1049C, 1059C, 1079C, 1089C,1099C ou 1109C, ou mais, e um pH básico de pelo menos cerca de pH 10.5,pH 11, pH 12, pH 12.5 ou mais (básico), em que o polipeptídeo catalisa ahidrólise de compostos na madeira, polpa de madeira, polpa Kraft, papel,produto de papel ou polpa de papel, bioalvejando assim a madeira, polpa demadeira, polpa Kraft, papel, produto de papel ou polpa de papel e reduzindoo uso de químicos branqueadores no processo de alvejante; em que em umaspecto (opcionalmente), o químico branqueador compreende cloro, dióxidode cloro, um cáustico, um peróxido ou qualquer combinação desses.

A invenção fornece métodos para remoção de tinta de papel oupolpa sob condições de alta temperatura e pH básico, o métodocompreendendo as seguintes etapas: (a) fornecer pelo menos umpolipeptídeo que tem uma atividade de xilanase, mananase e/ou glicanase,em que o polipeptídeo retém uma atividade de xilanase, a mananase e/ou aglicanase sob condições que compreendem uma temperatura de pelo menoscerca de 80°C, 85°C, 86°C, 87°C, 88°C, 89°C, 90°C, 919C, 92eC, 939C,94SC, 959C, 969C, 979C, 989C, 999C, 1009C, 1019C, 1029C, 1039C, 103,59C,104SC, 1059C, 1079C, 1089C, 1099C ou 1109C, ou mais, e um pH básico depelo menos cerca de pH 10.5, pH 11, pH 12, pH 12.5 ou mais (básico), emque o polipeptídeo compreende uma xilanase, mananase e/ou glicanase quetem uma seqüência da invenção, ou a xilanase, mananase e/ou glicanase écodificada por um ácido nucléico que compreende uma seqüência dainvenção, ou um fragmento enzimaticamente ativo deste; (b) fornecer umamadeira, polpa de madeira, polpa Kraft, papel, um produto de papel ou polpade papel com tinta; e (c) colocar a madeira, polpa de madeira, polpa Kraft,papel, produto de papel ou polpa de papel em contato com o polipeptídeo daetapa (a) sob condições que compreendem uma temperatura de pelo menoscerca de 85°C e um pH básico de pelo menos cerca de pH 11, em que opolipeptídeo catalisa a hidrólise de compostos na madeira, polpa demadeira, polpa Kraft, papel ou polpa de papel, facilitando assim a remoçãoda tinta da madeira, polpa de madeira, polpa Kraft, papel, produto de papelou polpa de papel.

A invenção fornece métodos para liberar Iignina de umamadeira, uma polpa de madeira, uma polpa Kraft, um papel, um produto depapel ou uma polpa de papel sob condições de alta temperatura e pHbásico, o método compreendendo as seguintes etapas: (a) fornecer pelomenos um polipeptídeo que tem uma atividade de xilanase, mananase e/ouglicanase, em que o polipeptídeo retém uma atividade de xilanase, amananase e/ou a glicanase sob condições que compreendem umatemperatura de pelo menos cerca de 80°C, 85°C, 86°C, 87°C, 88°C, 89°C,90°C, 919C, 92eC, 939C, 949C, 95SC, 969C, 979C, 98ÕC, 999C, 100eC, 101 sC,102eC, 1039C, 103,5°C, 104SC, 1059C, 1079C, 108SC, 1099C ou 1105C, OUmais, e um pH básico de pelo menos cerca de pH 11, em que o polipeptídeocompreende uma xilanase, mananase e/ou glicanase que tem umaseqüência da invenção, ou uma xilanase, mananase e/ou glicanase écodificada por um ácido nucléico que compreende uma seqüência dainvenção, ou um fragmento enzimaticamente ativo deste; (b) fornecer umamadeira, polpa de madeira, polpa Kraft, papel, produto de papel ou polpa depapel que compreende lignina; e (c) colocar a madeira, polpa de madeira,polpa Kraft, papel, produto de papel ou a polpa de papel da etapa (b) emcontato com o polipeptídeo da etapa (a) sob condições que compreendemuma temperatura de pelo menos cerca de 80°C, 85°C, 86°C, 87°C, 88°C,89°C, 90°C, 91 sC, 929C, 939C, 94eC, 959C, 969C, 979C, 989C, 999C, IOO9C,1019C, 1029C, 1039C, 103,59C, 1049C, 1059C, 1079C, 108eC, 1099C ou1109C, ou mais, e um pH básico de pelo menos cerca de pH 11, em que opolipeptídeo catalisa a hidrólise de compostos na madeira, polpa demadeira, polpa Kraft, papel, produto de papel ou polpa de papel, facilitandoassim a liberação de Iignina da madeira, polpa de madeira, polpa Kraft,papel, produto de papel ou polpa de papel; em que em um aspecto(opcionalmente) após o tratamento a polpa tem uma consistência de cercade 10%.

A invenção fornece composições que compreendem umamadeira, a polpa de madeira, uma polpa Kraft, um papel, um produto depapel ou uma polpa de papel compreendendo um polipeptídeo que tem umaatividade de xilanase, mananase e/ou glicanase^em que o polipeptídeo temuma seqüência da invenção, ou o polipeptídeo é codificado por um ácidonucléico que compreende uma seqüência da invenção, ou um fragmentoenzimaticamente ativo deste, em que em um aspecto (opcionalmente), amadeira, polpa de madeira, polpa Kraft, papel, produto de papel ou polpa depapel compreende uma madeira mole e uma madeira dura, ou a madeira,polpa de madeira, polpa Kraft, papel, produto de papel ou polpa de papel éderivado de uma madeira mole e de uma madeira dura.

A invenção fornece métodos para fazer etanol que compreendecolocar uma composição que compreende amido em conato com umpolipeptídeo que tem uma atividade de xilanase, mananase e/ou glicanase,em que o polipeptídeo tem uma seqüência da invenção, ou o polipeptídeo écodificado por um ácido nucléico que compreende uma seqüência dainvenção, ou um fragmento enzimaticamente ativo deste. A invenção fornececomposições que compreendem um etanol e um polipeptídeo que tem umaatividade de xilanase, mananase e/ou glicanase, em que o polipeptídeo temuma seqüência da invenção, ou o polipeptídeo é codificado por um ácidonucléico que compreende uma seqüência da invenção, ou um fragmentoenzimaticamente ativo desse. A invenção fornece métodos para fazer etanolsob condições de alta temperatura e pH básico, o método compreendendoas seguintes etapas: (a) fornecer pelo menos um polipeptídeo que tem umaatividade de xilanase, mananase e/ou glicanase, em que o polipeptídeoretém uma atividade de xilanase, mananase e/ou glicanase sob condiçõesque compreendem uma temperatura de pelo menos cerca de 80°C, 85°C,86°C, 87°C, 88°C, 89°C, 90°C, 912C1 92SC, 93SC, 94SC, 959C, 969C, 979C,98-C, 999C, 1009C, 101 eC, 1029C, 1039C, 103,59C, 104SC, 1059C, 1079C,108SC, 1099C ou 11 OqC1 ou mais, e um pH básico de pelo menos cerca depH 11, em que o polipeptídeo compreende uma xilanase, uma mananasee/ou uma glicanase que tem uma seqüência da invenção, ou a xilanase,mananase e/ou glicanase é codificada por um ácido nucléico quecompreende uma seqüência da invenção, ou um fragmento enzimaticamenteativo desse; (b) fornecer uma composição que compreende amidocompreendendo uma madeira, polpa de madeira, polpa Kraft, papel, umproduto de papel ou polpa de papel; e (c) colocar a composição da etapa (b)em contato com o polipeptídeo da etapa (a) sob condições quecompreendem uma temperatura de pelo menos cerca de 80°C, 85°C, 86°C,87°C, 88°C, 89°C, 90°C, 91 eC, 92SC, 93SC, 94SC, 959C, 96SC, 979C, 989C,99°C, 100°C, 101 °C, 102C, 103C, 103,5C, 104C, 105C, 107C, 108C,109C ou 11 OsC, ou mais, e um pH básico de pelo menos cerca de pH 11,em que o polipeptídeo catalisa a hidrólise de compostos na madeira, polpade madeira, polpa Kraft, papel ou polpa de papel, gerando assim etanol apartir da madeira, polpa de madeira, polpa Kraft, papel, produto de papel oupolpa de papel.

A invenção fornece composições farmacêuticas quecompreendem um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase, em que o polipeptídeo compreende umaseqüência da invenção, ou o polipeptídeo é codificado por um ácido nucléicoque compreende uma seqüência da invenção, ou um fragmentoenzimaticamente ativo desse. Em um aspecto, a invenção fornece métodospara eliminar, ou proteger animais de, um microorganismos que compreendeum xilano compreendendo administrar um polipeptídeo da invenção. Omicroorganismo pode ser uma bactéria que compreende um xilano, porexemplo, Salmonella.

Em um aspecto, a composição farmacêutica age como umauxiliar digestivo ou um antimicrobiano (por exemplo, contra Salmonella).Em um aspecto, o tratamento é profilático. Em um aspecto, a invençãofornece produtos de cuidado oral que compreendem um polipeptídeo dainvenção que tem uma atividade de xilanase, mananase e/ou glicanase, ouuma xilanase, uma mananase e/ou uma glicanase codificada por um ácidonucléico da invenção. O produto de cuidado oral pode compreender umapasta de dentes, um creme dental, um gel, ou um pó para os dentes, umaodôntico, um enxaguatório bucal, uma formulação de limpeza pré- ou pós-escovação, uma goma de mascar, uma pastilha, ou uma bala. A invençãofornece composições de limpeza de lentes de contato que compreendem umpolipeptídeo da invenção que tem uma atividade de xilanase, mananasee/ou glicanase ou uma xilanase, uma mananase e/ou uma glicanasecodificada por um ácido nucléico da invenção.

A invenção fornece glicosidases, xilanases e/ou glicanasesquiméricas que compreendem uma seqüência de polipeptídeo (por exemplo,uma xilanase, uma mananase e/ou uma glicanase) da invenção e pelomenos um módulo de ligação a carboidrato (CBM) heterólogo, em que emum aspecto (opcionalmente) o CBM compreende um CBM3a, CBM3b,CBM4, CBM6, CBM22 ou X14 ou um CBM listado e discutido abaixo. Ainvenção também fornece glicosidases, xilanases e/ou glicanasesquiméricas que compreendem pelo menos um módulo de ligação acarboidrato (CBM) heterólogo, em que o CBM compreende umasubseqüência de ligação a carboidrato de uma seqüência de xilanase dainvenção, ou uma subseqüência de ligação a carboidrato que compreendeum X14 descrito na Tabela 9. A invenção fornece métodos para desenharuma glicosidase, uma xilanase, uma mananase e/ou uma glicanasequimérica que tem uma nova especificidade de ligação a carboidrato ou umaespecificidade de ligação a carboidrato aumentada, compreendendo inserirum módulo de ligação a carboidrato (CBM) heterólogo ou endógenoadicional em glicosidases, xilanases e/ou glicanases, em que o CBMcompreende uma subseqüência de ligação a carboidrato de uma seqüênciade glicosidase, xilanase, mananase e/ou glicanase da invenção, ou umasubseqüência de ligação a carboidrato que compreende um X14 descrito naTabela 9, ou alternativamente, um CBM heterólogo, ou um CBM endógenoadicional, é inserido em uma seqüência de xilanase, mananase e/ouglicanase da invenção.

A invenção fornece misturas ou "coquetéis" de enzimas quecompreendem pelo menos uma enzima da invenção e uma ou mais outrasenzimas(s) que podem ser outra xilanase, mananase e/ou glicanase, ouqualquer outra enzima; por exemplo, os "coquetéis" da invenção, além depelo menos uma enzima dessa invenção, podem compreendem qualqueroutra enzima tal como xilanase (não desta invenção), celulases, lipases,esterases, proteases, ou endoglicosidases, endo-beta.-1,4-glicanases, beta-glicanases, endo-beta-1,3(4)-glicanases, cutinases, peroxidases, catalases,lacases, amilases, glicoamilases, pectinases, redutases, oxidases,fenoloxidases, ligninases, pululanases, arabinanases, hemicelulases,mananases, xiloglicanases, xilanases, pectina acetil esterases,ramnogalacturonano acetil esterases, poligalacturonases,ramnogalacturonases, galactanases, pectina liases, pectina metilesterases,celobioidrolases e/ou transglutaminases, para citar apenas alguns exemplos.Em modalidades alternativas, as misturas de enzimas, ou "coquetéis" quecompreendem pelo menos uma enzima da invenção podem ser usados emqualquer processo ou método da invenção, ou composição da invenção, porexemplo, em alimentos ou rações, suplementos de alimentos ou de rações,têxteis, papéis, madeiras processadas, etc. e métodos de fazer os mesmos,e em composições e métodos para tratar papel, polpa, madeira, resíduos ousubprodutos de papel, polpa ou madeira, e semelhantes, e nos produtosfinais destes.

Os detalhes de uma ou mais modalidades da invenção sãodescritos nos desenhos anexos e na descrição abaixo. Outrascaracterísticas, objetivos e vantagens da invenção serão evidentes a partirda descrição e desenhos, e a partir das reivindicações.Todas as publicações, patentes, pedidos de patente, seqüênciasdo GenBank e depósitos da ATCC, citados aqui estão expressamenteincorporados aqui por referência para todas as finalidades.

BREVE DESCRIÇÃO DOS DESENHOS

Os desenhos a seguir são ilustrativos de aspectos da invenção enão são pretendidos para limitar o escopo da invenção conforme abrangidopelas reivindicações.

O arquivo da patente ou pedido contém pelo menos um desenhoem cores. Cópias dessa publicação de patente ou pedido de patente comdesenho(s) em cores serão fornecidas pelo Escritório mediante solicitação epagamento da taxa necessária.

A figura 1 é um diagrama de blocos de um sistema decomputador.

A figura 2 é um fluxograma ilustrando um aspecto de umprocesso para comparar uma nova seqüência de nucleotídeo ou proteínacom uma base de dados de seqüências a fim de determinar os níveis dehomologia entre a nova seqüência e as seqüências na base de dados.

A figura 3 é um fluxograma ilustrando um aspecto de umprocesso em um computador para determinar se duas seqüências sãohomólogas.

A figura 4 é um fluxograma ilustrando um aspecto de umprocesso identificador 300 para detectar a presença de uma característicaem uma seqüência.

A figura 5 é um gráfico que compara a atividade da seqüênciatipo selvagem (SEQ ID NOS: 189 e 190) ao mutante 8x (SEQ ID NOS: 375,376), uma combinação de mutantes D, F, H, If S, V, X e AA na Tabela 1.

A figura 6A ilustra os nove mutantes de um único sítio de ami-noácido de SEQ ID NO: 378 (codificada por SEQ ID NO: 377) gerados porMutagênese por Saturação do Sítio do Gene (GSSM) de SEQ ID NO: 190(codificada por SEQ ID NO:189), como descrito em detalhe no Exemplo 5,abaixo.A figura 6B ilustra o desenovelamento de SEQ ID N0:190 eSEQ ID NO:378 em experimentos do ponto médio da transição da tempera-tura de fusão (Tm) conforme determinado por Calorimetria Exploratória Dife-rencial (DSC) para cada enzima, como descrito em detalhes no Exemplo 5,abaixo.

A figura 7A ilustra os perfis de atividade em pH e temperaturapara as enzimas SEQ ID NO: 190 e SEQ ID NO:378, como descrito em deta-lhe no Exemplo 5, abaixo.

A figura 7B ilustra a taxa/atividade da temperatura ótima para asenzimas SEQ ID N0.190 e SEQ ID NO:378, como descrito em detalhe noExemplo 5, abaixo.

A figura 7C ilustra a tolerância térmica/ atividade residual paraas enzimas SEQ ID N0:190 e SEQ ID NO:378, como descrito em detalhe noExemplo 5, abaixo.

A figura 8A ilustra a biblioteca de GeneReassembIy de todas ascombinações possíveis das 9 mutações pontuais de GSSM que foi construí-da e rastreada quanto a variantes com tolerância térmica e atividade melho-radas, como descrito em detalhe no Exemplo 5, abaixo.

A figura 8B ilustra a atividade relativa da variante "6X-2" e davariante "9X" (SEQ ID NO:378) em comparação com SEQ ID NQ:190 ("tiposelvagem") em uma temperatura ótima e pH 6.0, como descrito em detalheno Exemplo 5, abaixo.

A figura 9A ilustra as impressões digitais obtidas após hidrólisede oligoxilanos (Xyl)3, (Xyl)4, (Xyl)5 e (Xyl)6 pelas enzimas SEQ ID NO: 190("tipo selvagem") e a variante "9X" (SEQ ID NO:378), como descrito em deta-lhe no Exemplo 5, abaixo.

A figura 9B ilustra as impressões digitais obtidas após hidrólisede xilano de madeira de faia (beechwood) pelas enzimas SEQ ID N0.190("tipo selvagem") e a variante "9X" (SEQ ID NO:378), como descrito em deta-lhe no Exemplo 5, abaixo.A figura 10A é um diagrama esquemático que ilustra o nível demelhora na estabilidade térmica (representado por Tm) em relação a SEQ IDN0:190 ("tipo selvagem") obtido por evolução de GSSM, como descrito emdetalhe no Exemplo 5, abaixo.

A figura 10B ilustra um "diagrama de aptidão" (fitness diagram)da melhora da enzima na forma de SEQ ID NO:378 e SEQ ID N0:380, con-forme obtido por combinar as tecnologias de GSSM e GeneReassembIy,como descrito em detalhe no Exemplo 5, abaixo.

A figura 11 é um fluxograma esquemático de um protocolo derastreamento de rotina exemplar para determinar se uma xilanase da inven-ção é útil no pré-tratamento de polpa de papel, como descrito em detalhe noExemplo 6, abaixo.

A figura 12 ilustra graficamente os resultados de um estudo de"bioalvejamento" usando xilanases exemplares da invenção, como descritoem detalhe, abaixo.

A figura 13 ilustra um resumo de alterações feitas à seqüênciaSEQ ID NO:382 exemplar da invenção, como descrito em detalhe, abaixo.

A figura 14 ilustra um processo industrial de bioalvejamento dainvenção, como descrito em detalhe no Exemplo 9, abaixo.

A figura 15 é uma tabela que resume dados demonstrando aatividade enzimática de enzimas exemplares da invenção, como descrito emdetalhe no Exemplo 10, abaixo.

A figura 16, figura 17, figura 18 e figura 19 são tabelas ilustrandograficamente a atividade de SEQ ID NO:382 sobre Madeira Mole do Sul(SSWB) sob várias condições, e resumindo esses dados, como descrito emdetalhe no Exemplo 11, abaixo.

A figura 20 é uma tabela ilustrando graficamente a atividade deSEQ ID NO:382 sobre Madeira Dura do Norte (NHW) pós-02 em váriasfaixas de pH, como descrito em detalhe no Exemplo 11, abaixo.A figura 21 ilustra graficamente os resultados de um ensaio deazo-xilano usando enzimas exemplares da invenção, como descrito emdetalhe no Exemplo 12, abaixo.

A figura 22 e a figura 23 ilustram graficamente os resultados deum ensaio de atividade enzimática exemplar usando as enzimas exemplaresda invenção sobre arabinoxilano de trigo usando em ensaio de Nelson-Somogyi, como descrito em detalhe no Exemplo 12, abaixo.

A figura 24 e a figura 25 ilustram graficamente os resultados deum ensaio de termotolerância exemplar para xilanases usando um ensaio deazo-xilano, como descrito em detalhe no Exemplo 12, abaixo.

A figura 26 ilustra graficamente os resultados de um ensaio determotolerância exemplar para enzimas, um método de atividade residual,como descrito em detalhe no Exemplo 12, abaixo.

A figura 27A e a figura 27B ilustram dados que mostram ainativação térmica da xilanase exemplar "tipo selvagem" da invenção SEQ IDNO:382, e da xilanase exemplar variante ou "mutante" da invenção SEQ IDNO:482, como descrito em detalhe no Exemplo 14 abaixo.

A figura 28 ilustra dados mostrando a diferença na energia deinativação de SEQ ID NO:382 e SEQ ID NO:482 exemplares, onde ainativação térmica foi medida em várias temperaturas e os dados foramusados para construir um gráfico de Arrhenius, como descrito em detalhe noExemplo 14 abaixo.

Símbolos de referência semelhantes nos vários desenhosindicam elementos semelhantes.

DESCRIÇÃO DETALHADA DA INVENÇÃO

A invenção fornece glicosil hidrolases, incluindo xilanases e/ouglicanases, e polinucleotídeos que codificam as mesmas e métodos de fazere usar as mesmas. Glicosil hidrolase, incluindo atividade de xilanase,mananase e/ou glicanase dos polipeptídeos da invenção, abrange enzimasque têm atividade de hidrolase, por exemplo, enzimas capazes de hidrolisarligações glicosídicas em um polissacarídeo, por exemplo, uma ligaçãoglicosídica presente em xilano, por exemplo, catalisar hidrólise de ligaçõesβ-1,4-xilosídicas internas. As xilanases e/ou glicanases da invenção podemser usadas para fazer e/ou processar alimentos, rações, suplementosnutricionais, têxteis detergentes e semelhantes. As xilanases e/ou glicanasesda invenção podem ser usadas em composições farmacêuticas e auxiliaresdietéticos.

As xilanases e/ou glicanases da invenção são particularmenteúteis em processos de cozimento, ração animal, bebida e madeira, polpa demadeira, polpa Kraft, papel, produto de papel, ou polpa de papel. Em umaspecto, uma enzima da invenção é termotolerante e/ou tolerante a altastemperaturas e/ou condições de pH baixo. Por exemplo, em um aspecto,uma xilanase, mananase e/ou glicanase da invenção retém atividade sobcondições que compreendem uma temperatura de pelo menos cerca de80°C, 85°C, 86°C, 87°C, 88°C, 89°C, 90°C, 91 eC, 929C, 939C, 949C, 959C,969C, 97-C, 98SC, 999C, 1009C, 1019C, 1029C, 1039C, 103,59C, 1049C,1059C, 1079C, 108SC, 109QC ou 1109C, ou mais, e um pH básico de pelomenos cerca de pH 11, ou mais.

A invenção fornece variantes de polinucleotídeos oupolipeptídeos da invenção, que compreendem seqüências modificadas emum ou mais pares de base, códons, íntrons, éxons, ou resíduos deaminoácido (respectivamente), mas que ainda retêm a atividade biológica deuma xilanase, mananase e/ou glicanase da invenção. Variantes podem serproduzidas por qualquer meio incluindo métodos tais como, por exemplo,"error-prone" PCR, embaralhamento, mutagênese sítio-direcionada,"assembly" PCR, mutagênese por PCR sexual, mutagênese in vivo,mutagênese de cassete, mutagênese de agrupamentos repetitivos,mutagênese de agrupamento exponencial, mutagênese sítio-específica,reagrupamento de genes (por exemplo, GeneReassembIy1 veja Patente U.S.N°. 6.537.776), GSSM e qualquer combinação desses.

A tabela 1 e tabela 2 listam variantes obtidas por mutar SEQ IDNO: 189 (que codifica SEQ ID NQ:190) por GSSM. A invenção forneceácidos nucléicos que tem uma ou mais, ou todas as seqüências descritasnas Tabelas 1 e 2, isto é, ácidos nucléicos que têm seqüências que sãovariantes de SEQ ID NO: 189, onde as variações são descritas na Tabela 1 eTabela 2, e os polipeptídeos que são codificados por estas variantes.

As variantes de GSSM (descritas nas Tabelas 1 e 2) foram tes-tadas quanto à tolerância térmica (veja Exemplos abaixo). Os mutantes D, F,G, Η, I, J, K, S, T1 U, V, W, Χ, Υ, Z, AA1 DD e EE foram observados tendo amaior tolerância térmica entre os mutantes da Tabela 1. Os mutantes tam-bém podem ser combinados para formar um mutante "maior" (isto é, um po-lipeptídeo da invenção que tem múltiplas variações de seqüência, veja tam-bém, por exemplo, a Tabela 10 abaixo). Por exemplo, os mutantes D, F, Η, I,S, V, X e AA da Tabela 1 foram combinados para formar um mutante maiorchamado "8x" com uma seqüência descrita em SEQ ID NO:375 (ácido nu-cléico codificante do polipeptídeo) e SEQ ID NO:376 (seqüência de aminoá-cido). A figura 5 é um gráfico que compara a atividade da seqüência tipo sel-vagem (SEQ ID NOS: 189 e 190) com a da seqüência mutante 8x (SEQ IDNOS: 259 e 260). Ao comparar a tipo selvagem com a mutante 8x, foi des-coberto que a temperatura ótima para ambas era de 65°C e que o pH ótimopara ambas era de 5.5. A seqüência tipo selvagem foi observada mantendosua estabilidade por menos do que 1 minuto a 65°C, enquanto que a mutan-te 8x (SEQ ID NOS:375, 376) foi observada mantendo sua estabilidade pormais do que 10 minutos a 85°C. O substrato usado foi azo-xilano (por exem-plo, espelta de aveia, por exemplo, de Megazyme International Ireland Ltd).Em um aspecto, a mutante 8x (SEQ ID NOS:375, 376) foi evoluída porGSSM. Em outro aspecto, a tipo selvagem é um precursor de GSSM paraevolução de tolerância térmica.

Tabela 1

<table>table see original document page 74</column></row><table><table>table see original document page 75</column></row><table>

As variantes de códon descritas na Tabela 2 que produziramvariantes (de SEQ ID NO:189) com a melhor variação ou "melhora" em tole-rância térmica sobre a "tipo selvagem" (SEQ ID NO:189) estão destacadas.Como observado acima, a invenção fornece ácidos nucléicos, e os polipeptí-deos que codificam os mesmos, que compreendem uma, várias ou todas asvariações descritas na Tabela 2 e na Tabela 1.

Tabela 2

<table>table see original document page 76</column></row><table>

Em um aspecto, a seqüência de aminoácido ácido de uma se-qüência de aminoácido (SEQ ID NO: 208) de seqüências de aminoácido dainvenção é modificada por uma única mutação de aminoácido. Em um as-pecto específico, esta mutação é uma mutação de asparagina para ácidoaspártico. A seqüência de aminoácido resultante e a seqüência de ácido nu-cléico correspondente são descritas como SEQ ID NO:252 e SEQ IDNO:251, respectivamente. Mutações de um único aminoácido com uma me-lhora no pH ótimo da enzima, tal como a mutação de SEQ ID N0:208, forammostradas na técnica com relação a xilanases. (Veja, por exemplo, Joshi,M., Sidhu, G., Pot, I., Brayer, G., Withers, S., Mclntosh, L., J. Mol. Bio. 299,255-279 (2000)). Também é observado que em tais mutações de um únicoaminoácido, porções das seqüências podem ser removidas no processo desubclonagem. Por exemplo, SEQ ID N0.207 e SEQ ID NO:251 diferem emapenas um nucleotídeo, ao longo da área em que as seqüências se alinham.

Entretanto, observa-se que uma área de 78 nucleotídeos na terminação-Nde SEQ ID N0:207 foi removida da terminação-N de SEQ ID NO:251 nasubclonagem. Adicionalmente, os três primeiros nucleotídeos em SEQ IDNO:251 foram trocados para ATG e então a mutação pontual foi feita no sex-to nucleotídeo em SEQ ID NO:251.

O termo "mutagênese por saturação", "mutagênese por satura-ção do sítio do gene" ou "GSSM" inclui um método que usa iniciadores deoligonucleotídeo degenerados para introduzir mutações pontuais em um po-linucleotídeo, como descrito em detalhe abaixo.

O termo "sistema de evolução dirigida otimizado" ou "evoluçãodirigida otimizada" inclui um método de reagrupar fragmentos de seqüênciasde ácido nucléico relacionadas, por exemplo, genes relacionados, e é expli-cado em detalhe, abaixo.

O termo "reagrupamento por ligação sintética" ou "SLR" incluium método de ligar fragmentos de oligonucleotídeo de uma maneira não-estocástica, e é explicado abaixo em detalhe.

Gerando e Manipulando Ácidos Nucléicos

A invenção fornece ácidos nucléicos (por exemplo, ácidos nu-cléicos que codificam polipeptídeos que têm uma atividade de glicosil hidro-lase, por exemplo, uma atividade de xilanase, mananase e/ou glicanase;incluindo enzimas que têm pelo menos uma modificação de seqüência deuma seqüência de ácido nucléico exemplar da invenção (como definido aci-ma), em que a modificação de seqüência compreende pelo menos uma, du-as, três, quatro, cinco, seis, sete, oito, nove, dez, onze, doze, treze, quator-ze, quinze, dezesseis, dezessete, dezoito, dezenove ou todas as seguintesalterações: os nucleotídeos que correspondem aos resíduos 10 a 12 de SEQID NO:383 são alterados para CCT, TTA, TTG, CTC1 CTA ou CTG, os nu-cleotídeos que correspondem aos resíduos 25 a 27 de SEQ ID NO:383 sãoalterados para CCC, CCG, CCA ou CCT, os nucleotídeos que correspondemaos resíduos 28 a 30 de SEQ ID NO:383 são alterados para TCA1 TCC,TCT, TCG, AGT ou AGC, os nucleotídeos que correspondem aos resíduos37 a 39 de SEQ ID NO:383 são alterados para TTT ou TTC, os nucleotídeosque correspondem aos resíduos 37 a 39 de SEQ ID NO:383 são alteradospara TAC ou TAT, os nucleotídeos que correspondem aos resíduos 37 a 39de SEQ ID NO:383 são alterados para ATA, ATT ou ATC, os nucleotídeosque correspondem aos resíduos 37 a 39 de SEQ ID NO:383 são alteradospara TGG, os nucleotídeos que correspondem aos resíduos 40 a 42 de SEQID NO:383 são alterados para CAC ou CAT1 os nucleotídeos que correspon-dem aos resíduos 52 a 54 de SEQ ID NO:383 são alterados para TTC ouTTT, os nucleotídeos que correspondem aos resíduos 73 a 75 de SEQ IDNO:383 são alterados para GAG ou GAA, os nucleotídeos que correspon-dem aos resíduos 73 a 75 de SEQ ID NO:383 são alterados para CCC,CCG, CCA ou CCT, os nucleotídeos que correspondem aos resíduos 88 a90 de SEQ ID NO:383 são alterados para GTG, GTC, GTA ou GTT, os nu-cleotídeos que correspondem aos resíduos 100 a 102 de SEQ ID NO:383são alterados para TGT ou TGC1 os nucleotídeos que correspondem aosresíduos 100 a 102 de SEQ ID NO:383 são alterados para CAT ou CAC, osnucleotídeos que correspondem aos resíduos 100 a 102 de SEQ ID NO:383são alterados para TTG, TTA, CTT, CTC, CTA ou CTG, os nucleotídeos quecorrespondem aos resíduos 103 a 105 de SEQ ID NO:383 são alterados pa-ra GAG ou GAA1 os nucleotídeos que correspondem aos resíduos 103 a 105de SEQ ID NO:383 são alterados para GAT ou GAC, os nucleotídeos quecorrespondem aos resíduos 211 a 213 de SEQ ID NO:383 são alterados pa-ra ACA1 ACT, ACC ou ACG, os nucleotídeos que correspondem aos resí-duos 211 a 213 de SEQ ID NO:383 são alterados para TGT ou TGC, ou osnucleotídeos que correspondem aos resíduos 508 a 582 de SEQ ID NO:383são alterados para CAT ou CAC), incluindo cassetes de expressão tais comovetores de expressão, que codificam os polipeptídeos da invenção.

A invenção também inclui métodos para descobrir novas se-qüências de xilanase, mananase e/ou glicanase usando os ácidos nucléicosda invenção. A invenção também inclui métodos para inibir a expressão degenes, transcritos e polipeptídeos de xilanase, mananase e/ou glicanaseusando os ácidos nucléicos da invenção. Também são fornecidos métodospara modificar os ácidos nucléicos da invenção, por exemplo, por reagrupa-mento por ligação sintética, sistema de evolução dirigida otimizado e/ou mu-tagênese por saturação.

Os ácidos nucléicos da invenção podem ser feitos, isolados e/oumanipulados, por exemplo, por clonagem e expressão de bibliotecas de cD-NA, amplificação de mensagem ou DNA genômico por PCR, e semelhantes.

Por exemplo, as seguintes seqüências exemplares da invenção foram deri-vadas inicialmente das seguintes fontes:

Tabela 3

<table>table see original document page 79</column></row><table>113, 114115,116117, 118119,120121,122123, 124125, 126127, 128129, 13010 13,14131, 132133, 134135, 136137, 13815 139, 140141,142143, 144145, 146147, 14820 149, 15015, 16151,152153, 154155, 15625 157, 158159, 160161, 162163, 164165, 16630 167,168169, 170

AmbienteAmbienteAmbienteAmbienteAmbienteAmbienteAmbienteAmbienteBactériasAmbienteAmbienteAmbienteAmbienteAmbienteAmbienteAmbienteBactériasEucariotoAmbienteAmbienteAmbienteAmbienteAmbienteAmbienteAmbienteAmbienteAmbienteAmbienteAmbienteAmbienteAmbiente17, 18- Bactérias 171, 172 Ambiente 173, 174 Ambiente 175, 176 Ambiente 177, 178 Ambiente 179, 180 Ambiente 181, 182 Ambiente 183, 184 Ambiente 185, 186 Ambiente 187, 188 Ambiente 189, 190 Ambiente 19, 20 Ambiente 191, 192 Ambiente 193, 194 Ambiente 195, 196 Ambiente 197, 198 Ambiente 199, 200 Ambiente 201, 202 Ambiente 203, 204 Ambiente 205, 206 Ambiente 207, 208 Ambiente 209, 210 Ambiente 21, 22 Ambiente 211, 212 Ambiente 213, 214 Ambiente 215, 216 Ambiente 217, 218 Ambiente 219, 220 Ambiente 221, 222 Ambiente 223, 224 Ambiente 225, 226 Ambiente227 228 Ambiente 229 230 Ambiente 23,24 Ambiente 231 232 Bactérias 233 234 Ambiente 235 236 Ambiente 237 238 Ambiente 239 240 Ambiente 241 242 Ambiente 243 244 Ambiente 245 246 Ambiente 247 248 Ambiente 249 250 Ambiente 25, 26 Ambiente 251 252 Ambiente 253 254 Ambiente 255 256 Ambiente 257 258 Ambiente 259 260 Ambiente 261 262 Ambiente 263 264 Ambiente 265 266 Ambiente 267 268 Bactérias 269 270 Ambiente 27, 28 Ambiente 271 272 Ambiente 273 274 Ambiente 275 276 Ambiente 277 278 Ambiente 279 280 Ambiente 281 282 Ambiente283, 284 Ambiente 285, 286 Ambiente 287, 288 Ambiente 289, 290 Ambiente 29, 30 Archaea 291, 292 Ambiente 293, 294 Ambiente 295, 296 Ambiente 297, 298 Ambiente 299, 300 Ambiente 3,4 Ambiente 301, 302 Ambiente 303, 304 Ambiente 305, 306 Bactérias 307, 308 Ambiente 309, 310 Ambiente 31, 32 Ambiente 311, 312 Ambiente 313, 314 Bactérias 315, 316 Ambiente 317, 318 Ambiente 319, 320 Ambiente 321, 322 Ambiente 323, 324 Ambiente 325, 326 Ambiente 327, 328 Ambiente 329, 330 Ambiente 33, 34 Ambiente 331, 332 Ambiente 333, 334 Ambiente 335, 336 Ambiente337 338 Ambiente 339 340 Ambiente 341 342 Ambiente 343 344 Ambiente 345 346 Ambiente 347 348 Ambiente 349 350 Ambiente 35, 36 Ambiente 351 352 Ambiente 353 354 Ambiente 355 356 Ambiente 357 358 Ambiente 359 360 Ambiente 361 362 Ambiente 363 364 Ambiente 365 366 Ambiente 367 368 Ambiente 369 370 Ambiente 37, 38 Ambiente 371 372 Ambiente 373 374 Ambiente 375 376 Artificial 377 378 Artificial 39, 40 Ambiente 41, 42 Ambiente 43, 44 Ambiente 45, 46 Ambiente 47, 48 Ambiente 49, 50 Ambiente 5, 6 Ambiente 51, 52 Ambiente53 54 Bactérias 55 56 Ambiente 57 58 Ambiente 59 60 Ambiente 61 62 Ambiente 63 64 Ambiente 65 66 Ambiente 67 68 Ambiente 69 70 Ambiente 7,8 Ambiente 71 72 Ambiente 73 74 Ambiente 75 76 Ambiente 77 78 Ambiente 79 80 Ambiente 81 82 Ambiente 83 84 Ambiente 85 86 Bactérias 87 88 Ambiente 89 90 Bactérias 9, 10 Ambiente 91 92 Ambiente 93 94 Ambiente 95 96 Ambiente 97 98 Ambiente 99 100 Ambiente

Em um aspecto, a invenção também fornece ácidos nucléicosque codificam xilanase, mananase e/ou glicanase com uma inovação emcomum, em que eles são derivados de uma fonte ambiental, ou de uma fon-te bacteriana, ou de uma fonte de Archaea.Ao praticar os métodos da invenção, genes homólogos podemser modificados por manipular um ácido nucléico molde, como descrito aqui.A invenção pode ser praticada junto com qualquer método ou protocolo ouequipamento conhecido na técnica, que estão descritos na literatura científi-ca e de patente.

Um aspecto da invenção é um ácido nucléico que compreendeuma das seqüências da invenção e seqüências substancialmente idênticas aelas, as seqüências complementares a elas, ou um fragmento que compre-ende pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400,ou 500 bases consecutivas de uma das seqüências de uma Seqüência dainvenção (ou das seqüências complementares a elas). Os ácidos nucléicosisolados, podem compreender DNA, incluindo cDNA, DNA genômico, e DNAsintético. O DNA pode ser de fita dupla ou de fita única, e se for de fita única,pode ser a fita codificante ou a fita não-codificante (anti-senso). Alternativa-mente, os ácidos nucléicos isolados podem compreender RNA.

Conseqüentemente, outro aspecto da invenção é um ácido nu-cléico isolado que codifica um dos polipeptídeos da invenção, ou fragmentosque compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou150 aminoácidos consecutivos de um dos polipeptídeos da invenção. As se-qüências codificantes desses ácidos nucléicos podem ser idênticas a umadas seqüências codificantes de um dos ácidos nucléicos da invenção, ou umfragmento deste ou podem ser seqüências codificantes diferentes que codifi-cam um dos polipeptídeos da invenção, seqüências substancialmente idênti-cas a elas e fragmentos que tem pelo menos 5, 10,15, 20, 25, 30, 35, 40, 50,75, 100, ou 150 aminoácidos consecutivos de um dos polipeptídeos da in-venção, como um resultado da redundância ou degeneração do código ge-nético. O código genético é bem-conhecido dos versados na técnica e podeser obtido, por exemplo, na página 214 de B. Lewin, Genes VI, Oxford Uni-versity Press, 1997.

O ácido nucléico isolado que codifica um dos polipeptídeos dainvenção e seqüências substancialmente idênticas a ele, pode incluir, masnão se limita a: apenas a seqüência codificante de um ácido nucléico da in-venção, seqüências substancialmente idênticas a ela e seqüências codifi-cantes adicionais, tais como seqüências líder ou seqüências de pró-proteína,e seqüências não codificantes, tal como íntrons ou seqüências não codifi-cantes 5' e/ou 3' da seqüência codificante. Dessa forma, como usado aqui, otermo "polinucleotídeo que codifica um polipeptídeo" abrange um polinucleo-tídeo que inclui apenas a seqüência codificante para o polipeptídeo assimcomo um polinucleotídeo que inclui seqüências codificantes é/ou não-codificantes adicionais.

Alternativamente, as seqüências de ácido nucléico da invençãoe seqüências substancialmente idênticas a elas, podem ser mutagenizadasusando técnicas convencionais, tal como mutagênese sítio-direcionada, ououtras técnicas familiares daqueles versados na técnica, para introduzir alte-rações silenciosas nos polinucleotídeos da invenção e seqüências substan-cialmente idênticas a eles. Como usado aqui, "alterações silenciosas" inclu-em, por exemplo, alterações que não alteram a seqüência de aminoácidocodificada pelo polinucleotídeo. Tais alterações podem ser desejáveis a fimde aumentar o nível do polipeptídeo produzido por células hospedeiras quecontêm um vetor que codifica o polipeptídeo por introduzir códons ou paresde códons que ocorrem freqüentemente no organismo hospedeiro.

A invenção também refere-se a polinucleotídeos que têm altera-ções de nucleotídeo que resultam em substituições adições, deleções, fu-sões, e truncamentos de aminoácido nos polipeptídeos da invenção e se-qüências substancialmente idênticas a elas. Tais alterações de nucleotídeopodem ser introduzidas usando técnicas, tais como, mutagênese sítio-direcionada, mutagênese química aleatória, deleção por exonuclease Ill eoutras técnicas de DNA recombinante. Alternativamente, tais alterações denucleotídeo podem ser variantes alélicas que ocorrem naturalmente que sãoisoladas por identificar ácidos nucléicos que hibridizam especificamente asondas que compreendem pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100,150, 200, 300, 400, ou 500 bases consecutivas de uma das seqüências dainvenção e seqüências substancialmente idênticas a elas (ou as seqüênciascomplementares a elas) sob condições que estringência alta, moderada, oubaixa, como fornecido aqui.

Técnicas gerais

Os ácidos nucléicos usados para praticar essa invenção, quersejam RNAm iRNA ácido nucléico anti-senso, cDNA, DNA genômico, veto-res, vírus, ou híbridos destes, podem ser isolados a partir de uma variedadede fontes, podem ser manipulados geneticamente, amplificados e/ou ex-pressos /gerados recombinantemente. Polipeptídeos recombinantes (porexemplo, glicosil hidrolases da invenção) gerados a partir desses ácidos nu-cléicos podem ser isolados individualmente ou clonados e testados quanto auma atividade desejada. Qualquer sistema de expressão recombinante podeser usado, incluindo sistemas de expressão bacterianos, de mamífero, leve-dura, inseto ou célula de planta.

Alternativamente, esses ácidos nucléicos podem ser sintetiza-dos in vitro por técnicas de síntese química bem-conhecidas, como descrito,por exemplo, em Adams (1983) J. Am. Chem. Soe. 105:661; Belousov(1997) Nucleic Acids Res. 25:3440-3444; Frenkel (1995) Free Radie. Biol.Med. 19:373-380; Blommers (1994) Biochemistry 33:7886-7896; Narang(1979) Meth. Enzymol. 68:90; Brown (1979) Meth. Enzymol. 68:109;Beaucage (1981) Tetra. Lett. 22:1859; Patente U.S. N°. 4.458.066.

Técnicas para a manipulação de ácidos nucléicos, tal como, porexemplo, subclonagem, sondas de marcação (por exemplo, marcação deiniciador aleatório usando a polimerase de Klenow, tradução por cortes (nicktranslation), amplificação), seqüenciamento, hibridização, e semelhantesestão bem descritos na literatura científica e de patente, veja, por exemplo,Sambrook1. ed., MOLECULAR CLONING: A LABORATORY MANUAL (2ãED.), Vols. 1-3, Cold Spring Harbor Laboratory, (1989); CURRENT PROTO-COLS IN MOLECULAR BIOLOGY, Ausubel, ed. John Wiley & Sons, Inc.,Nova Iorque (1997); LABORATORY TECHNIQUES IN BIOCHEMISTRYAND MOLECULAR BIOLOGY: HYBRIDIZATION WITH NUCLEIC ACIDPROBES, Parte I. Theory and Nucleic Acid Preparation, Tijssen, ed. Elsevi-er, N.Y. (1993).

Outro meio útil de obter e manipular ácidos nucléicos usadospara praticar os métodos da invenção é clonar a partir de amostras genômi-cas, e, se desejado, rastrear e re-clonar insertos isolados ou amplificados apartir, por exemplo, de clones genômicos ou clones de cDNA. Fontes de áci-dos nucléicos usados nos métodos da invenção incluem bibliotecas de cDNAou genômicas contidas, por exemplo, em cromossomos artificiais de mamífe-ro (MACs), veja por exemplo, Patente U.S. N°. 5.721.118; 6.025.155; cro-mossomos humanos artificiais, veja, por exemplo, Rosenfeld (1997) Nat.Genet. 15:333-335; cromossomos artificiais de levedura (YAC); cromosso-mos artificiais bacterianos (BAC); cromossomos artificiais P1, veja por e-xemplo, Woon (1998) Genomics 50:306-316; vetores derivados de P1(PACs), veja, por exemplo, Kern (1997) Biotechniques 23:120-124; cosmí-deos, vírus recombinantes, fagos ou plasmídeos.

Em um aspecto, um ácido nucléico que codifica um polipeptídeoda invenção é agrupado em fase apropriada com uma seqüência líder capazde direcionar a secreção do polipeptídeo traduzido ou fragmento deste.

A invenção fornece proteínas de fusão e ácidos nucléicos quecodificam as mesmas. Um polipeptídeo da invenção pode ser fundido a umpeptídeo ou polipeptídeo heterólogo, tais como peptídeos de identificação N-terminal que conferem características desejadas, tal como estabilidade au-mentada ou purificação simplificada. Peptídeos e polipeptídeos da invençãotambém podem ser sintetizados e expressos como proteínas de fusão comum ou mais domínios adicionais ligados a elas, por exemplo, para produzirum peptídeo mais imunogênico, para isolar mais facilmente um peptídeo sin-tetizado recombinantemente, para identificar e isolar anticorpos e células Bque expressam anticorpos, e semelhantes. Domínios que facilitam a detec-ção e purificação incluem, por exemplo, peptídeos quelantes de metal, taiscomo tratos de poli-histidina e módulos de histidina-triptofano que permitema purificação sobre metais imobilizados, domínios de proteína A que permi-tem a purificação sobre imunoglobulina imobilizada, e o domínio utilizado nosistema de purificação por extensão/afinidade FLAGS (Immunex Corp, Seat-tle WA). A inclusão de seqüências Iigantes cliváveis tal como Fator Xa ouenteroquinase (Invitrogen, San Diego CA) entre um domínio de purificação eo peptídeo ou polipeptídeo que compreende o motivo para facilitar purifica-ção. Por exemplo, um vetor de expressão pode incluir uma seqüência deácido nucléico codificante de um epitopo ligada a seis resíduos de histidinaseguidos por um sítio de clivagem de tireodoxina e enteroquinase (veja, porexemplo, Williams (1995) Biochemistry 34:1787-1797; Dobeli (1998) ProteinExpr. Purif. 12:404-414). Os resíduos de histidina facilitam a detecção e puri-ficação enquanto que o sítio de clivagem de enteroquinase fornece um meiopara purificar o epitopo do restante da proteína de fusão. Tecnologia relativaa vetores que codificam proteínas de fusão e aplicação de proteínas de fu-são está bem descrita na literatura científica e de patente, veja, por exemplo,Kroll (1993) DNA Cell. Biol., 12:441-53.

As expressões "ácido nucléico" ou "seqüência de ácido nucléi-co", como usadas aqui, referem-se a um oligonucleotídeo, nucleotídeo, poli-nucleotídeo, ou a um fragmento de qualquer um desses, a DNA, ou RNA deorigem genômica ou sintética que pode ser de fita única ou fita dupla e po-dem representar uma fita de sentido ou anti-senso, a ácido peptídeo nucléico(PNA), ou a qualquer material semelhante a DNA ou semelhante a RNA, deorigem sintética ou natural. As expressões "ácido nucléico" ou "seqüência deácido nucléico" incluem oligonucleotídeo, nucleotídeo, polinucleotídeo, ouum fragmento de qualquer um destes, DNA ou RNA (por exemplo, mRNA,rRNA, tRNA, iRNA) de origem genômica ou sintética que pode ser de fitaúnica ou de fita dupla e pode representar uma fita de sentido ou anti-senso,ácido peptídeo nucléico (PNA), ou qualquer material semelhante a DNA ousemelhante a RNA, de origem sintética ou natural, incluindo por exemplo,iRNA, ribonucleoproteínas (por exemplo, iRNAs de fita dupla, por exemplo,iRNPs). O termo abrange ácidos nucléicos, isto é, oligonucleotídeos, con-tendo análogos conhecidos de nucleotídeos naturais. O termo também a-brange estruturas semelhantes a ácidos nucléicos com arcabouços sintéti-cos, veja, por exemplo, Mata (1997) Toxicol. Appl. Pharmacol. 144:189-197;Strauss-Soukup (1997) Biochemistry 36:8692-8698; Samstag (1996)Antisense Nucleic Acid Drug Dev 6:153-156. "Oligonucleotídeo" inclui umpolidesoxinucleotídeo de fita única ou duas fitas de polidesoxinucleotídeoscomplementares que podem ser sintetizadas quimicamente. Tais oligonucle-otídeos sintéticos não tem 5' fosfato e assim não se ligarão a outro oligonu-cleotídeo sem a adição de um fosfato com um ATP na presença de uma qui-nase. Um oligonucleotídeo sintético pode se ligar a um fragmento que nãofoi desfosforilado.

Uma "seqüência codificante de" ou uma "seqüência de nucleotí-deo que codifica" um polipeptídeo ou proteína em particular, é uma seqüên-cia de ácido nucléico que é transcrita e traduzida em um polipeptídeo ou pro-teína quando colocada sob o controle de seqüências regulatórias apropria-das.

O termo "gene" significa o segmento de DNA envolvido na pro-dução de uma cadeia de polipeptídeo; ele inclui regiões anteriores e posteri-ores à região codificante (líder e trailer) assim como, onde aplicável, se-qüências intervenientes (íntrons) entre segmentos codificantes individuais(éxons). Operativamente ligado" como usado aqui refere-se a uma relaçãofuncional entre dois ou mais segmentos de ácido nucléico (por exemplo,DNA). Tipicamente, se refere à relação funcional de uma seqüência regula-tória transcricional a uma seqüência transcrita. Por exemplo, um promotor éoperativamente ligado a uma seqüência codificante, tal como um ácido nu-cléico da invenção, se ele estimula ou modula a transcrição da seqüênciacodificante em uma célula hospedeira apropriada ou outro sistema de ex-pressão. Geralmente, seqüências regulatórias transcricionais promotorasque são operativamente ligadas a uma seqüência transcrita são fisicamentecontíguas à seqüência transcrita, isto é, elas são cis-atuantes. Entretanto,algumas seqüências regulatórias transcricionais, tais como intensificadores,não precisam estar fisicamente contíguas ou localizadas próximo das se-qüências codificantes cuja transcrição é aumentada por elas.

O termo "cassete de expressão" como usado refere-se a umaseqüência de nucleotídeo que é capaz de afetar a transcrição de um geneestrutural (isto é, uma seqüência codificante de proteína, tal como uma xila-nase, uma mananase e/ou uma glicanase da invenção) em um hospedeirocompatível com tais seqüências. Cassetes de expressão incluem pelo me-nos um promotor operativamente ligado com a seqüência codificante de po-lipeptídeo; e em um aspecto, com outras seqüências, por exemplo, sinais determinação de transcrição. Fatores adicionais necessários ou auxiliares emefetuar a expressão também podem ser usados, por exemplo, intensificado-res. Dessa forma, cassetes de expressão também incluem plasmídeos, veto-res de expressão, vírus recombinantes, qualquer forma de vetor de "DNA nu"recombinante, e semelhantes. Um "vetor" compreende um ácido nucléicoque pode infectar, transfectar, transduzir transitoriamente ou permanente-mente uma célula. Será identificado que um vetor pode ser um ácido nucléi-co nu, ou um ácido nucléico complexado com proteína ou lipídio. O vetor, emum aspecto, compreende ácidos nucléicos e/ou proteínas e/ou membranasvirais ou bacterianas (por exemplo, uma membrana celular, um envelopelipídico viral, etc.). Vetores incluem, mas não são limitados a replicons (porexemplo, replicons de RNA, bacteriófagos) aos quais fragmentos de DNApodem ser ligados e se tornar replicados. Vetores incluem, mas não são limi-tados a RNA, DNA ou RNA circular ou linear auto-replicante autônomo (porexemplo, plasmídeos, vírus, e semelhantes, veja, por exemplo, Patente U.S.N°. 5.217.879), e incluem plasmídeos de expressão e não-expressão). Ondeum microorganismo recombinante ou cultura celular é descrita como hospe-dando um "vetor de expressão" isso inclui DNA circular e linear extra-cromossômico e DNA que foi incorporado no(s) cromossomo(s) do hospe-deiro. Onde um vetor está sendo mantido por uma célula hospedeira, o vetorpode estar sendo replicado estavelmente pelas células durante a mitose co-mo uma estrutura autônoma, ou estar incorporado dentro do genoma dohospedeiro.

Como usado aqui, o termo "promotor" inclui todas as seqüênciascapazes de direcionar a transcrição de uma seqüência codificante em umacélula, por exemplo, uma célula de planta. Dessa forma, promotores usadosnos construtos da invenção incluem elementos de controle transcricional cis-atuantes e seqüências regulatórias que estão envolvidas na regulação oumodulação do momento e/ou taxa de transcrição de um gene. Por exemplo,um promotor pode ser um elemento de controle transcricional cis-atuante,incluindo um intensificador, um promotor, um terminador de transcrição, umaorigem de replicação, uma seqüência de integração cromossômica, regiões5' e 3' não traduzidas, ou uma seqüência intrônica, que estão envolvidas naregulação transcricional. Essas seqüências cis-atuantes interagem tipica-mente com proteínas ou outras biomoléculas para efetuar (iniciar, parar, re-guiar, modular, etc.) a transcrição. Promotores "constitutivos" são aquelesque direcionam a expressão continuamente sob a maioria das condiçõesambientais e estados de desenvolvimento ou diferenciação celular. Promoto-res "induzíveis" ou "reguláveis" direcionam a expressão do ácido nucléico dainvenção sob a influência de condições ambientais ou condições de desen-volvimento. Exemplos de condições ambientais que podem afetar a transcri-ção por promotores induzíveis incluem condições anaeróbicas, temperaturaelevada, seca, ou a presença de luz.

Promotores "tecido-específicos" são elementos de controletranscricional que são ativos apenas em células ou tecidos ou órgãos parti-culares, por exemplo, em plantas ou animais. Regulação tecido-específicapode ser obtida por certos fatores intrínsecos que garantem que genes quecodificam proteínas específicas para um dado tecido sejam expressas. Taisfatores são conhecidos por existir em mamíferos e plantas a fim de permitirque tecidos específicos se desenvolvam.

Como usado aqui, o termo "isolado" significa que o material (porexemplo, um ácido nucléico, um polipeptídeo, uma célula) é removido de seuambiente natural (por exemplo, o ambiente natural se ele ocorrer natural-mente). Por exemplo, um polinucleotídeo ou polipeptídeo que ocorre natu-ralmente presente em um animal vivo não está isolado, mas o mesmo poli-nucleotídeo ou polipeptídeo, separado de algum ou todos os materiais co-existentes no sistema natural, está isolado. Tais polinucleotídeos poderiamfazer parte de um vetor e/ou tais polinucleotídeos ou polipeptídeos poderiamfazer parte de uma composição e ainda serem isolados já que tal vetor oucomposição não faz parte de seu ambiente natural. Como usado aqui, o ter-mo "purificado" não requer pureza absoluta; ao invés disso, ele é pretendidocomo uma definição relativa. Ácidos nucléicos individuais obtidos a partir deuma biblioteca foram convencionalmente purificados até homogeneidadeeletroforética. As seqüências obtidas a partir desses clones não poderiamser obtidas diretamente a partir da biblioteca ou de DNA humano total. Osácidos nucléicos purificados da invenção foram purificados do restante doDNA genômico no organismo por pelo menos IO4-IO6 vezes. Entretanto, otermo "purificado" também inclui ácidos nucléicos que foram purificados dorestante do DNA genômico ou de outras seqüências em uma biblioteca ou ou-tro ambiente por pelo menos uma ordem de magnitude, tipicamente duas, outrês ordens e mais tipicamente quatro ou cinco ordens de magnitude

Como usado aqui, o termo "recombinante" significa que o ácidonucléico está ao lado de um ácido nucléico da "cadeia principal" que não estáao lado dele no seu ambiente natural. Adicionalmente, para serem "enriqueci-dos" os ácidos nucléicos deverão representar 5% ou mais do número de inser-tos de ácidos nucléicos em uma população de moléculas da cadeia principalde ácidos nucléicos. Moléculas da cadeia principal de acordo com a invençãoincluem ácidos nucléicos tais como vetores de expressão, ácidos nucléicosauto-replicantes, vírus, ácidos nucléicos de integração e outros vetores ou áci-dos nucléicos usados para manter ou manipular um inserto de ácido nucléicode interesse. Tipicamente, os ácidos nucléicos enriquecidos representam 15%ou mais do número de insertos de ácido nucléico na população de moléculasda cadeia principal recombinantes. Mais tipicamente, os ácidos nucléicos enri-quecidos representam 50% ou mais do número de insertos de ácido nucléicona população de moléculas da cadeia principal recombinantes. Em um aspec-to, os ácidos nucléicos enriquecidos representam 90% ou mais do número deinsertos de ácido nucléico na população de moléculas da cadeia principal re-combinantes.

"Plasmídeos" são designados por um "p" minúsculo precedidoe/ou seguido por letras maiúsculas e/ou números. Os plasmídeos iniciais aquicontidos são disponíveis comercialmente, disponíveis publicamente de formairrestrita, ou podem ser construídos a partir de plasmídeos disponíveis de a-cordo com procedimentos publicados. Além disso, plasmídeos equivalentesàqueles descritos aqui são conhecidos na técnica e serão claros para o versa-do na técnica. "Plasmídeos" podem ser disponíveis comercialmente, disponí-veis publicamente de forma irrestrita, ou podem ser construídos a partir deplasmídeos disponíveis de acordo com procedimentos publicados. Plasmídeosequivalentes àqueles descritos aqui são conhecidos na técnica e serão clarospara o versado na técnica.

"Digestão" de DNA refere-se à clivagem catalítica de DNA comuma enzima de restrição que age apenas em certas seqüências no DNA. Asvárias enzimas de restrição usadas aqui são disponíveis comercialmente esuas condições de reação, co-fatores e outras necessidades foram usadascomo é conhecido do versado na técnica. Para fins analíticos, tipicamente 1 pgde plasmídeo ou fragmento de DNA é usado com cerca de 2 unidades de en-zima em cerca de 20 μΙ de solução tampão. Para a finalidade de isolar frag-mentos de DNA para a construção de plasmídeos, tipicamente 5 a 50 pg deDNA são digeridos com 20 a 250 unidades de enzima em um volume maior.

Tampões e quantidades de substratos apropriados para enzimas de restriçãoem particular são especificados pelo fabricante. Tempos de incubação de cer-ca de 1 hora a 37°C são geralmente usados, mas podem variar de acordo comas instruções do fabricante. Após a digestão, eletroforese em gel pode ser rea-Iizada para isolar o fragmento desejado."Hibridização" refere-se ao processo pelo qual uma fita de ácidonucléico se une a uma fita complementar através de pareamento de bases.Reações de hibridização podem ser sensíveis e seletivas para que uma se-qüência particular de interesse possa ser identificada mesmo em amostras nasquais ela está presente em concentrações baixas. Condições estringentes a-dequadas podem ser definidas, por exemplo, pelas concentrações de sal ouformamida nas soluções de pré-hibridização e hibridização, ou pela temperatu-ra de hibridização e são bem-conhecidas na técnica. Em particular, a estrin-gência pode ser aumentada por reduzir a concentração de sal, aumentar aconcentração de formamida, ou aumentar a temperatura de hibridização. Emaspectos alternativos, ácidos nucléicos da invenção são definidos por sua ha-bilidade de hibridizar sob várias condições de estringência (por exemplo, alta,média e baixa), como descrito aqui.

Por exemplo, hibridização sob condições de alta estringência po-deria ocorrer em cerca de 50% de formamida a cerca de 37°C a 42°C. A hibri-dização poderia ocorrer sob condições de estringência reduzida em cerca de35% a 25% de formamida a cerca de 30°C a 35°C. Em particular, a hibridi-zação poderia ocorrer sob condições de estringência alta a 42°C em 50% deformamida, SSPE 5X, SDS 0,3% e 200 n/ml de DNA de esperma de salmãocortado e desnaturado. A hibridização poderia ocorrer sob condições de es-tringência reduzida como descrito acima, mas em 35% de formamida emuma temperatura reduzida de 35°C. A faixa de temperatura que correspondea um nível de adstringência particular pode ser ainda diminuída pelo cálculoda proporção de purina para piridimina do ácido nucléico de interesse e con-seqüente ajuste da temperatura. Variações nas faixas e condições acimasão bem-conhecidas na técnica.Seqüências de controle transcricional e traducional

A invenção fornece seqüências de ácido nucléico (por exemplo,DNA) da invenção operativamente ligadas a seqüência(s) de controle de ex-pressão (por exemplo, transcricional ou traducional), por exemplo, promoto-res ou intensificadores, para direcionar ou modular a síntese/expressão deRNA. A seqüência de controle de expressão pode estar em um vetor de ex-pressão. Promotores bacterianos exemplares incluem Iacl, IacZ, T3, 17, gpt,PR lambda, PL e trp. Promotores eucarióticos exemplares incluem precoceimediato de CMV, timidina quinase de HSV1 precoce e tardio de SV40, LTRsde retrovírus, e metalotioneína I de camundongo. Uma seqüência promotoraestá "operativamente ligada a" uma seqüência codificante quando a RNApolimerase que inicia a transcrição no promotor transcreverá a seqüênciacodificante em mRNA.

Promotores adequados para expressar um polipeptídeo em bac-térias incluem os promotores Iac ou trp de E. coli, o promotor IacZ, o promo-tor T3, o promotor T7, o promotor gpt, o promotor PR lambda, o promotor PLlambda, promotores de óperons que codificam enzimas glicolíticas tal como3-fosfoglicerato quinase (PGK), e o promotor de fosfatase ácida. Promotoreseucarióticos incluem o promotor precoce imediato de CMV, o promotor detimidina quinase de HSV1 promotores de choque térmico, o promotor preco-ce e tardio de SV40, LTRs de retrovírus, e o promotor de metalotioneína-l decamundongo. Outros promotores conhecidos para controlar a expressão degenes em células procarióticas ou eucarióticas ou seus vírus também podemser usados. Promotores adequados para expressar o polipeptídeo ou frag-mento deste em bactérias incluem os promotores de Iac ou trp de E. coli, opromotor lacl, o promotor IacZ, o promotor T3, o promotor 77, o promotorgpt, promotor lambda Pr, o promotor lambda PL, promotores de óperons quecodificam enzimas glicolíticas tais como 3-fosfoglicerato quinase (PGK) e opromotor de fosfatase ácida. Promotores fúngicos incluem o promotor defator V. Promotores eucarióticos incluem o promotor precoce imediato deCMV, o promotor de timidina quinase de HSV, promotores de choque térmi-co, o promotor precoce e tardio de SV40, LTRs de retrovírus e o promotor demetalotioneína de camundongo. Outros promotores conhecidos por controlara expressão de genes em células procarióticas ou eucarióticas ou seus vírustambém podem ser usados.

Promotores de Planta Tecido-esoecíficosA invenção fornece cassetes de expressão que podem ser ex-pressos de uma maneira tecido-específica, por exemplo, que podem expres-sar uma xilanase, mananase e/ou glicanase da invenção de uma maneiratecido-específica. A invenção também fornece plantas ou sementes que ex-pressam uma xilanase, mananase e/ou glicanase da invenção de uma ma-neira tecido-específica. A especificidade tecidual pode ser especificidade porsemente, especificidade por caule, especificidade por folha, especificidadepor raiz, especificidade por fruto e semelhantes.

Em um aspecto, um promotor constitutivo tal como o promotor35S de CaMV pode ser usado para expressão em partes especificas daplanta ou semente ou por toda a planta. Por exemplo, para superexpressão,pode ser empregado um fragmento de promotor de planta que direcionará aexpressão de um ácido nucléico em alguns ou todos os tecidos de uma plan-ta, por exemplo, uma planta regenerada. Tais promotores são referidos aquicomo promotores "constitutivos" e são ativos sob a maioria das condiçõesambientais e estados de desenvolvimento ou diferenciação celular. Exem-plos de promotores constitutivos incluem a região de início de transcrição35S do vírus do mosaico da couve-flor (CaMV), o promotor-1' ou -2' derivadode T-DNA de Agrobacterium tumefaciens, e outras regiões de início detranscrição de vários genes de planta conhecidos dos versados. Tais genesincluem, por exemplo, ACT11 de Arabidopsis (Huang (1996) Plant Moi Biol.33:125-139); Cat3 de Arabidopsis (GenBank No. U43147, Zhong (1996) MoLGeri. Genet. 251:196-203); o gene que codifica a proteína desaturase trans-portadora de estearoil-acil de Brassica napus (Genbank No. X74782, Solo-combe (1994) Plant Physioi 104:1167-1176); GPcI de milho (GenBank No.X15596; Martinez (1989) J. Moi Biol 208:551-565); o Gpc2 de milho (Gen-Bank No. U45855, Manjunath (1997) PIantMoi Bioi 33:97-112); promotoresde planta descritos nas Patente U.S. Nos 4.962.028; 5.633.440.

A invenção usa promotores constitutivos ou tecido-específicosderivados de vírus que podem incluir, por exemplo, o promotor subgenômicode tobamovírus (Kumagai (1995) Proc. Natl. Acad. Sei. USA 92:1679-1683; ovírus baciliforme do tungro do arroz (RTBV), que se replica apenas em célu-las do floema em plantas de arroz infectadas, com seu promotor que direcio-na forte expressão de gene repórter floema-específico; o promotor do vírusdo mosaico da nervura da mandioca (CVMV), com atividade mais alta noselementos vasculares, em células de mesófilo de folha, e extremidades daraiz (Verdaguer (1996) Plant Mol. Biol. 31:1129-1139).

Alternativamente, o promotor de planta pode direcionar a ex-pressão de um ácido nucléico que expressa xilanase e/ou glicancase em umtecido, órgão ou tipo celular específico (isto é, promotores tecido-específicos) ou pode estar sob controle ambiental ou de desenvolvimentomais preciso ou sob o controle de um promotor induzível. Exemplos de con-dições ambientais que podem afetar a transcrição incluem condições anae-róbicas, temperatura elevada, a presença de luz, ou pulverização com quí-micos/hormônios. Por exemplo, a invenção incorpora o promotor induzidopor seca de milho (Busk (1997) supra); o promotor induzido por calor, seca ealta concentração de sal de batata (Kirch (1997) Plant Mol. Biol. 33:897 909).

Promotores tecido-específicos podem promover a transcriçãoapenas dentro de certo período de tempo do estágio de desenvolvimentodentro daquele tecido. Veja, por exemplo, Blazquez (1998) Plant Cell10:791-800, que caracteriza o promotor do gene LEAFY de Arabidopsis. Ve-ja também Cardon (1997) Plant J ^ 2:367-77, que descreve o fator de trans-crição SPL3, que reconhece um motivo de seqüência conservado na regiãodo promotor do gene de identidade do meristema floral AP1 de A. thaliana; eMandei (1995) Plant Molecular Biology, Vol. 29, pp. 995-1004, que descreveo promotor de meristema elF4. Promotores tecido-específicos que são ativospor todo o ciclo de vida de um tecido particular podem ser usados. Em umaspecto, os ácidos nucléicos da invenção são operativamente ligados a umpromotor ativo primariamente apenas em células de fibra de algodão. Em umaspecto, os ácidos nucléicos da invenção são operativamente ligados a umpromotor ativo primariamente durante os estágios de alongamento da célulada fibra do algodão, por exemplo, como descrito por Rinehart (1996) supra.Os ácidos nucléicos podem ser operativamente ligados ao promotor do geneFbl2A para serem expressos preferivelmente em células de fibra de algodão(Ibid). Veja também, John (1997) Proc. Natl. Acad. Sei. USA 89:5769-5773;John, et ai, Patente U.S. Nos. 5.608.148 e 5.602.321, que descrevem promo-tores específicos de fibras de algodão e métodos para a construção de plan-tas transgênicas. Promotores específicos da raiz também podem ser usadospara expressar os ácidos nucléicos da invenção. Exemplos de promotoresespecíficos da raiz incluem o promotor do gene de álcool desidrogenase(DeLisle (1990) Int. Rev. Cytol. 123:39-60). Outros promotores que podemser usados para expressar os ácidos nucléicos da invenção incluem, por e-xemplo, promotores tegumento-específicos promotores específicos do reves-timento da semente ou alguma combinação destes; um promotor folha-específico (veja, por exemplo, Busk (1997) Plant J. 11:1285 1295, que des-creve um promotor folha-específico em milho); o promotor ORF13 de Agro-bacterium rhizogenes (que exibe alta atividade em raízes, veja por exemplo,Hansen (1997) supra); um promotor específico de pólen (veja, por exemplo,Guerrero (1990) Mol. Gen. Genet. 224:161 168); um promotor de tomate ati-vo durante o amadurecimento do fruto, senescência e queda de folhas e, emuma menor proporção, de flores, pode ser usado (veja, por exemplo, Blume(1997) Plant J. 12:731 746); um promotor pistilo-específico do gene SK2 debatata (veja, por exemplo, Ficker (1997) Plant Mol. Biol. 35:425 431); o geneBlec4 de ervilha, que é ativo em tecido epidérmico de ápices radiculares ve-getativos e florais de alfafa transgênica, tornando-o uma ferramenta útil paradirecionar a expressão de genes estranhos para camada epidérmica de raí-zes ou fibras que estão crescendo ativamente; o gene BEL1 óvulo-específico(veja, por exemplo, Reiser (1995) Cell 83:735-742, GenBank No. U39944);e/ou, o promotor em Klee, Patente U.S. N°. 5.589.583, que descreve umaregião de promotor de planta que é capaz de conferir altos níveis de trans-crição em tecido meristemático e/ou células que se dividem rapidamente.

Alternativamente, promotores de planta que são induzíveis porexposição a hormônios de planta, tais como auxinas, são usados para ex-pressar os ácidos nucléicos da invenção. Por exemplo, a invenção pode usaro fragmento do promotor E1 dos elementos de resposta à auxina (AuxREs)em soja (Glycine maxL) (Liu (1997) Plant Physiol. 115:397-407); o promotorGST6 de Arabidopsis de resposta à auxina (que também responde ao ácidosalicílico e peróxido de hidrogênio) (Chen (1996) Plant J. 10: 955-966); opromotor parC induzível por auxina de (Sakai (1996) 37:906-913); um ele-mento de resposta à biotina de plantas (Streit (1997) Mol. Plant Microbe Inte-ract. 10:933-937); e, o promotor que responde ao hormônio de estresse áci-do abscíssico (Sheen (1996) Science 274:1900-1902).

Os ácidos nucléicos da invenção também podem ser operativa-mente ligados a promotores de planta que são induzíveis por exposição areagentes químicos que podem ser aplicados à planta, tais como herbicidasou antibióticos. Por exemplo, o promotor ln2-2 de milho, ativado por herbici-das protetores de benzenosulfonamida, pode ser usado (De Veylder (1997)Plant Cell Physiol. 38:568-577); aplicação de diferentes herbicidas protetoresinduz padrões de expressão gênica distintos, incluindo expressão na raiz,hidatódeos, e meristema radicular apical. A seqüência codificante pode estarsob o controle, por exemplo, de um promotor induzido por tetraciclina, porexemplo, como descrito com plantas de tabaco transgênicas que contêm ogene de arginina descarboxilase de Avena sativa L. (aveia) (Masgrau (1997)Plant J. 11:465-473); ou, um elemento de resposta ao ácido salicílico (Stan-ge (1997) Plant J. 11:1315-1324). Usando promotores induzidos quimica-mente (por exemplo, por hormônios ou pesticidas), isto é, promotor respon-sivo a um químico que pode ser aplicado à planta transgênica no campo, aexpressão de um polipeptídeo da invenção pode ser induzida em um estágioparticular do desenvolvimento da planta. Dessa forma, a invenção tambémfornece plantas transgênicas que contêm um gene induzível que codificapolipeptídeos da invenção cuja variação de hospedeiro é limitada para dire-cionar espécies de planta, tais como milho, arroz, cevada, trigo, batata ououtros cultivos, induzíveis em qualquer estágio do desenvolvimento do cultivo.Um versado na técnica reconhecerá que um promotor de plantatecído-específico pode direcionar a expressão de seqüências operativamen-te ligadas em tecidos diferentes do tecido alvo. Dessa forma, um promotortecido-específico é um que direciona a expressão preferencialmente no teci-do ou tipo celular alvo, mas também pode causar alguma expressão em ou-tros tecidos.

Os ácidos nucléicos da invenção também podem ser operativa-mente ligados a promotores de planta que são induzíveis por exposição areagentes químicos. Esses reagentes incluem, por exemplo, herbicidas, au-xinas sintéticas, ou antibióticos que podem ser aplicados, por exemplo, pul-verizados, sobre as plantas transgênicas. Expressão induzível dos ácidosnucléicos produtores de xilanase e/ou glicanase da invenção permitirá que oagricultor selecione plantas com a expressão e/ou atividade ótima de xilana-se, mananase e/ou glicanase. O desenvolvimento de partes de planta podeser então controlado. Dessa forma, a invenção fornece os meios para facili-tar a colheita de plantas e partes de planta. Por exemplo, em várias modali-dades, o promotor ln2-2 de milho, ativado por herbicidas protetores de ben-zenosulfonamida, é usado (De Veylder (1997) Plant Cell Physiol.38:568-577); aplicação de diferentes herbicidas protetores induz padrões deexpressão gênica distintos, incluindo expressão na raiz, hidatódeos, e meris-tema radicular apical. Seqüências codificantes da invenção também estãosob o controle de um promotor induzido por tetraciclina, por exemplo, comodescrito com plantas de tabaco transgênicas que contêm o gene de argininadescarboxilase de Avena sativa L. (aveia) (Masgrau (1997) Plant J.11:465-473); ou, um elemento de resposta ao ácido salicílico (Stange (1997)Plant J. 11:1315-1324).

Em alguns aspectos, expressão apropriada do polipeptídeo po-de requerer uma região de poliadenilação na extremidade 3' da região codi-ficante. A região de poliadenilação pode ser derivada do gene natural, deuma variedade de outros genes de planta (ou de animal ou outros), ou degenes no T-DNA de Agrobacteria.O termo "planta" (por exemplo, como em uma planta transgênicaou semente de planta dessa invenção, ou promotor de planta usado em umvetor da invenção) inclui plantas inteiras, partes de planta (por exemplo, fo-lhas, caules, flores, raízes, etc.), protoplastos de planta, sementes e célulasde planta e progênie da mesma; as classes de planta que podem ser usadaspara praticar essa invenção (incluindo composições e métodos) podem tãovariadas quanto a classe de plantas superiores, incluindo plantas receptivasa técnicas de transformação, incluindo angiospermas (plantas monocotiledô-neas e dicotiledôneas), assim como gimnospermas; também incluindo partesde planta de uma variedade de níveis de ploidia, incluindo poliplóide, diplói-de, haplóide e estados hemizigotos. Como usado aqui, o termo "plantatransgênica" inclui plantas ou células de planta dentro das quais uma se-qüência de ácido nucléico heteróloga foi inserida, por exemplo, os ácidosnucléicos e vários construtos recombinantes (por exemplo, cassetes de ex-pressão, tais como vetores) da invenção. Plantas transgênicas da invençãotambém são discutidas abaixo.

Vetores de expressão de veículos de clonagem

A invenção fornece vetores de expressão e veículos de clona-gem que compreendem os ácidos nucléicos da invenção, por exemplo, se-qüências que codificam as xilanases e/ou glicanases da invenção. Vetoresde expressão e veículos de clonagem da invenção podem compreender par-tículas virais, baculovírus, fagos, plasmídeos, fagomídeos, cosmídeos, fos-mídeos, cromossomos bacterianos artificiais, DNA viral (por exemplo, vací-nia, adenovírus, avipoxvírus, pseudo-raiva, e derivados de SV40), cromos-somos artificiais baseados em P1, plasmídeos de levedura, cromossomosartificiais de levedura, e qualquer outro vetor específico para hospedeirosespecíficos de interesse (tal como bacilos, Arpergillus e levedura. Vetores dainvenção podem incluir seqüências cromossômicas, não-cromossômicas, esintéticas Grandes números de vetores adequados são conhecidos daque-Ies versados na técnica, e são disponíveis comercialmente. Vetores exem-plares incluem: bacterianos: vetores pQE (Qiagen), plasmídeos pBluescript,vetores pNH, (vetores Iambda-ZAP (Stratagene); ptrc99a, pKK223-3, p-DR540, pRIT2T (Pharmacia); Eucarióticos: pXT1, pSG5 (Stratagene),pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). Entretanto, qualquer outroplasmídeo ou outro vetor pode ser usado contanto que eles sejam replicá-veis e viáveis no hospedeiro. Vetores com baixo número de cópias ou altonúmero de cópias podem ser empregados com a presente invenção.

O vetor de expressão pode compreender um promotor, um sítiode ligação de ribossomo para início da tradução e um terminador de trans-crição. O vetor também pode incluir seqüências apropriadas para amplificara expressão. Vetores de expressão de mamífero podem compreender umaorigem de replicação, quaisquer sítios de ligação de ribossomo necessários,um sítio de poliadenilação, sítios doadores e aceptores de splice, seqüênciasde terminação transcricional, e seqüências não-transcritas flanqueadoras 5'.Em alguns aspectos, seqüências de DNA derivadas dos sítios de poliadeni-lação e splice de SV40 podem ser usadas para fornecer os elementos gené-ticos não-transcritos necessários.

Em um aspecto, os vetores de expressão contêm um ou maisgenes marcadores selecionáveis para permitir a seleção de células hospe-deiras contendo o vetor. Tais marcadores selecionáveis incluem genes quecodificam diidrofolato redutase ou genes que conferem resistência à neomi-cina para cultura de célula eucariótica, genes que conferem resistência àtetraciclina ou ampicilina em E. coli, e o gene TRP1 de S. cerevisiae. Regi-ões promotoras podem ser selecionadas a partir de qualquer gene desejadousando vetores de cloranfenicol transferase (CAT) ou outros vetores commarcadores selecionáveis.

Vetores para expressar o polipeptídeo ou fragmento deste emcélulas eucarióticas também podem conter intensificadores para aumentaros níveis dé expressão. Intensificadores são elementos cis-atuantes deDNA, geralmente de cerca de 10 a cerca de 300 pb de extensão que agemsobre um promotor para aumentar sua transcrição. Exemplos incluem o in-tensificador de SV40 no lado tardio da origem de replicação pb 100 a 270, ointensificador do promotor precoce de citomegalovírus, o intensificador depolioma no lado tardio da origem de replicação e os intensificadores de ade-novírus.

Uma seqüência de ácido nucléico pode ser inserida em um vetorpor uma variedade de procedimentos. Em geral, a seqüência é ligada à po-sição desejada no vetor após digestão do inserto e do vetor com endonucle-ases de restrição apropriadas. Alternativamente, extremidades cegas no in-serto e no vetor podem ser ligadas. Uma variedade de metodologias de clo-nagem é conhecida na técnica, por exemplo, como descrito em Ausubel &Sambrook. Tais procedimentos e outros são considerados estando dentro doescopo daqueles versados na técnica.

O vetor pode estar na forma de um plasmídeo, uma partículaviral ou um fago. Outros vetores incluem seqüências de DNA cromossômi-cas, não-cromossômicas, e sintéticas, derivadas de SV40; plasmídeos bac-terianos, DNA de fago, baculovírus, plasmídeos de levedura, vetores deriva-dos de combinações de plasmídeos e DNA de fago, DNA viral tal como va-cínia, adenovírus, avipoxvírus, e pseudo-raiva. Uma variedade de vetores declonagem e expressão para uso com hospedeiros procarióticos e eucarióti-cos é descrita, por exemplo, por Sambrook.

Vetores bacterianos particulares que podem ser usados incluemos plasmídeos disponíveis comercialmente que compreendem elementosgenéticos dos vetores de clonagem bem-conhecidos pBR322 (ATCC 37017),pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Suécia), GEM1 (PromegaBiotec, Madison, Wl, USA) pQE70, pQE60, pQE-9 (Qiagen), pD10, psiX174pBluescript Il KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), ptrc99a,PKK223-3, pKK233-3, DR540, pRIT5 (Pharmacia), pKK232-8 e pCM7. Veto-res eucarióticos particulares incluem pSV2CAT, pOG44, pXT1, pSG (Strata-gene) pSVK3, pBPV, pMSG, e pSVL (Pharmacia). Entretanto, qualquer outrovetor pode ser usado contanto que ele seja replicável e viável na célula hos-pedeira.Os ácidos nucléicos da invenção podem ser expressos em cas-setes de expressão, vetores ou vírus e expressos transitoriamente ou esta-velmente em células e sementes de plantas. Um sistema de expressão tran-sitória exemplar usa sistemas de expressão epissomais, por exemplo, RNAviral de vírus do mosaico da couve-flor (CaMV) gerado no núcleo por trans-crição de um minicromossomo epissomal contendo DNA superespiralizado,veja por exemplo, Covey (1990) Proc. Natl. Acad. Sei. USA 87:1633-1637.

Alternativamente, seqüências codificantes, isto é, seqüências inteiras da in-venção, ou subfragmentos das mesmas, podem ser inseridas em um geno-ma de célula de planta hospedeira se tornando uma parte integral do DNAcromossômico do hospedeiro. Transcritos senso e anti-senso podem serexpressos dessa maneira. Um vetor que compreende as seqüências (porexemplo, promotores ou regiões codificantes) de ácidos nucléicos da inven-ção pode compreender um gene marcador que confere fenótipo selecionávelem uma célula de planta ou uma semente. Por exemplo, o marcador podecodificar resistência à um biocida, particularmente resistência à antibióticos,tal como resistência à canamicina, G418, bleomicina, higromicina, ou resis-tência à um herbicida tal como resistência à clorosulfuron ou Basta.

Vetores de expressão capazes de expressar ácidos nucléicos eproteínas em plantas são bem-conhecidos na técnica e podem incluir, porexemplo, vetores de Agrobacterium spp., vírus X da batata (veja, por exem-plo, Angell (1997) EMBO J. 16:3675-3684), vírus do mosaico do tabaco (ve-ja, por exemplo, Casper (1996) Gene 173:69-73), vírus bushy stunt do toma-te (veja, por exemplo, Hillman (1989) Virology 169:42-50), vírus etch do ta-baco (veja, por exemplo, Dolja (1997) Virology 234:243-252), vírus do mo-saico dourado do feijão (veja, por exemplo, Morinaga (1993) Microbiol Im-munol. 37:471-476), vírus do mosaico da couve-flor (veja, por exemplo, Cec-chini (1997) Mol. Plant Microbe Interact. 10:1094-1101), elemento transponí-vel Ac/Ds de milho (veja, por exemplo, Rubin (1997) Mol. Cell. Biol.17:6294-6302; Kunze (1996) Curr. Top. Microbiol. Immunol. 204:161-194), eo elemento transponível supressor-mutator (Spm) de milho (veja, por exem-plo, Schlappi (1996) Plant Mol. Biol. 32:717-725); e derivados destes.

Em um aspecto, o vetor de expressão pode ter dois sistemas dereplicação para permitir que ele seja mantido em dois organismos, por e-xemplo, em células de mamífero ou inseto para expressão e em um hospe-deiro procariótico para clonagem e amplificação. Além disso, para vetores deexpressão de integração, o vetor de expressão pode conter pelo menos umaseqüência homóloga ao genoma da célula hospedeira. Ele pode conter duasseqüências homólogas que flanqueiam o construto de expressão. O vetor deintegração pode ser direcionado para um lócus específico na célula hospe-deira por selecionar a seqüência homóloga apropriada para inclusão no ve-tor. Construtos para vetores de integração são bem-conhecidos na técnica.

Vetores de expressão da invenção também podem incluir umgene marcador selecionável para permitir a seleção de cepas bacterianasque foram transformadas, por exemplo, genes que tornam a bactéria resis-tente a fármacos, tais como ampicilina, cloranfenicol, eritromicina, canamici-na, neomicina, e tetraciclina. Marcadores selecionáveis também podem in-cluir genes biossintéticos, tais como aqueles nas vias biossintéticas da histi-dina, triptofano e leucina.

A seqüência de DNA no vetor de expressão é operativamenteligada a seqüência(s) de controle de expressão (promotor) apropriada(s) pa-ra direcionar a síntese de RNA. Promotores bacterianos particulares men-cionados incluem lacl, IacZ, T3, T7, gpt, Iambda Pr, Pl e trp. Promotoreseucarióticos incluem precoce imediato de CMV, timidina quinase de HSV1precoce e tardio de SV40, LTRs de retrovírus e metalotioneína-l de camun-dongo. A seleção do vetor e promotor apropriados está dentro do conheci-mento do versado na técnica. O vetor de expressão também contém um sítiode ligação de ribossomo para iniciar a tradução e um terminador de transcri-ção. O vetor também pode incluir seqüências apropriadas para amplificar aexpressão. Regiões promotoras podem ser selecionadas a partir de qualquergene desejado usando vetores de cloranfenicol transferase (CAT) ou outrosvetores com marcadores selecionáveis. Além disso, os vetores de expressãocontêm preferivelmente um ou mais genes marcadores selecionáveis parafornecer uma característica fenotípica para seleção de células hospedeirastransformadas tal como resistência à diidrofolato redutase ou neomicina parauma cultura de célula eucariótica ou tal como resistência à tetraciclina ouampicilina em E. coli.

Vetores de expressão de mamífero também podem compreen-der uma origem de replicação, qualquer sítio de ligação de ribossomo ne-cessário, um sítio de poliadenilação, sítios doadores e aceptores de splice,seqüências de terminação da transcrição e seqüências não-transcritas flan-queadoras 5'. Em alguns aspectos, seqüências de DNA derivadas dos sítiosde splice e poliadenilação de SV40 podem ser usadas para fornecer os ele-mentos genéticos não-transcritos necessários.

Vetores para expressar o polipeptídeo ou fragmento deste emcélulas eucarióticas podem conter também intensificadores para aumentaros níveis de expressão. Intensificadores são elementos cis-atuantes deDNA1 geralmente de cerca de 10 a cerca de 300 pb de extensão que agemsobre um promotor para aumentar sua transcrição. Exemplos incluem o in-tensificador de SV40 no lado tardio da origem de replicação pb 100 a 270, ointensificador do promotor precoce de citomegalovírus, o intensificador depolioma no lado tardio da origem de replicação e os intensificadores de ade-novírus.

Além disso, os vetores de expressão contêm tipicamente um oumais genes marcadores selecionáveis para permitir a seleção de célulashospedeiras contendo o vetor. Tais marcadores selecionáveis incluem genesque codificam diidrofolato redutase ou genes que conferem resistência à ne-omicina a uma cultura de célula eucariótica, genes que conferem resistênciaà tetraciclina ou ampicilina em E. colie gene TRP1 de S. cerevisiae.

Em alguns aspectos, o ácido nucléico que codifica um dos poli-peptídeos da invenção e seqüências substancialmente idênticas a ele, oufragmentos que compreendem pelo menos cerca de 5, 10, 15, 20, 25, 30, 35,40, 50, 75, 100, ou 150 aminoácidos consecutivos deste é montado em faseapropriada com uma seqüência líder capaz de direcionar a secreção do poli-peptídeo traduzido ou fragmento deste. O ácido nucléico pode codificar umpolipeptídeo de fusão no qual um dos polipeptídeos da invenção e seqüên-cias substancialmente idênticas a eles, ou fragmentos que compreendempelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidosconsecutivos destes, são fundidos a peptídeos ou polipeptídeos heterólogos,tais como peptídeos de identificação N-terminais que conferem característicasdesejadas, tal como estabilidade aumentada ou purificação simplificada.

A seqüência de DNA apropriada pode ser inserida no vetor poruma variedade de procedimentos. Em geral, a seqüência de DNA é ligada àposição desejada no vetor após digestão do inserto e do vetor com endonucle-ases de restrição apropriadas. Alternativamente, extremidades cegas no inser-to e no vetor podem ser ligadas. Uma variedade de técnicas de clonagem sãodescritas em Ausubel et al. Current Protocols in Molecular Biology, John Wiley503 Sons, Inc. 1997 e Sambrook et al., Molecular Clonina: A LaboratoryManual 2a Ed., Cold Spring Harbor Laboratory Press (1989). Tais procedimen-tos e outros são considerados estando dentro do escopo daqueles versadosna técnica.

O vetor pode estar, por exemplo, na forma de um plasmídeo, umapartícula viral, ou um fago. Outros vetores incluem seqüências de DNA cro-mossômicas, não-cromossômicas e sintéticas, derivadas de SV40; plasmídeosbacterianos, DNA de fago, baculovírus, plasmídeos de levedura, vetores deri-vados de combinações de plasmídeos e DNA de fago, DNA viral tal como va-cínia, adenovírus, avipoxvírus e pseudo-raiva. Uma variedade de vetores clo-nagem e expressão para uso com hospedeiros procarióticos e eucarióticos sãodescritos por Sambrook, et al., Molecular Clonina: A Laboratorv Manual, 2gEd., Cold Spring Harbor, N.Y., (1989).

Células hospedeiras e células transformadas

A invenção também fornece células transformadas que compre-endem uma seqüência de ácido nucléico da invenção, por exemplo, umaseqüência que codifica uma xilanase, uma mananase e/ou uma glicanase dainvenção, ou um vetor da infecção. A célula hospedeira pode ser de qual-quer uma das células hospedeiras familiares daqueles versados na técnica,incluindo células procarióticas, células eucarióticas, tais como células bacte-rianas, células fúngicas, células de levedura, células de mamífero, células deinseto e/ou células de planta. Células bacterianas exemplares incluem E.coli, Streptomyces, Bacillus subtilis, Salmonella typhimurium e várias espé-cies dentro dos gêneros Pseudomonas, Streptomyces, e Staphylococcus.Células de inseto exemplares incluem Drosophila S2 e Spodoptera Sf9. Cé-lulas de animais exemplares incluem CHO1 COS ou melanoma de Bowes ouqualquer linhagem celular humana ou de camundongo. A seleção de umhospedeiro apropriado está dentro das habilidades do versado na técnica.Técnicas para transformar uma grande variedade de espécies de plantassuperiores são bem-conhecidas e descritas na literatura técnica e científica.Veja, por exemplo, Weising (1988) Ann. Rev. Genet. 22:421-477; PatenteU.S. N°. 5.750.870.

O vetor pode ser introduzido nas células hospedeiras usandoqualquer uma de uma variedade de técnicas, incluindo transformação, trans-fecção, transdução, infecção viral, armas de genes, ou transferência de genemediada por Ti. Métodos particulares incluem transfecção com fosfato decálcio, transfecção mediada por DEAE-Dextrano, lipofecção, ou eletropora-ção (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology,(1986)).

Em um aspecto, os ácidos nucléicos ou vetores da invenção sãointroduzidos nas células para rastreamento, dessa forma, os ácidos nucléi-cos entram nas células de uma maneira adequada para expressão subse-qüente do ácido nucléico. O método de introdução é amplamente ditado pelotipo de célula atingido. Métodos exemplares incluem precipitação com Ca-PO4, fusão de lipossoma, lipofecção (por exemplo, LIPOFECTIN®), eletropo-ração, infecção viral, etc. Os ácidos nucléicos candidatos podem se integrarestavelmente no genoma da célula hospedeira (por exemplo, com introduçãoretroviral) ou podem existir transitoriamente ou estavelmente no citoplasma(isto é, através do uso de plasmídeos tradicionais, utilizando seqüências re-gulatórias usuais, marcadores de seleção, etc). Já que muitos rastreamentosfarmaceuticamente importantes requerem alvos celulares de mamífero hu-mano ou modelo, vetores retrovirais capazes de transfectar tais alvos podemser usados.

Onde apropriado, as células hospedeiras manipuladas podemser cultivadas em meios nutrientes convencionais modificados como apro-priado para ativar promotores, selecionar transformantes ou amplificar osgenes da invenção. Após a transformação de uma cepa hospedeira adequa-da e cultivo da cepa hospedeira para uma densidade celular apropriada, opromotor selecionado pode ser induzido por meios apropriados (por exem-plo, mudança de temperatura ou indução química) e as células podem sercultivadas por um período adicional para permitir que elas produzam o poli-peptídeo desejado ou fragmento deste.

As células podem ser coletadas por centrifugação, rompidas pormeios físicos ou químicos, e o extrato bruto resultante é retido para purifica-ção adicional. Células microbianas empregadas para expressão de proteínaspodem ser rompidas por qualquer método conveniente, incluindo ciclos decongelamento-descongelamento, sonicação, rompimento mecânico, ou usode agentes de Iise celular. Tais métodos são bem-conhecidos dos versadosda técnica. O polipeptídeo expresso ou fragmento deste pode ser recupera-do e purificado das culturas de células recombinantes por métodos que in-cluem precipitação com sulfato de amônio ou etanol, extração com ácido,cromatografia de troca de ânion ou cátion, cromatografia em fosfocelulose,cromatografia de interação hidrofóbica, cromatografia de afinidade, cromato-grafia de hidroxilapatita e cromatografia de lectina. Etapas de reenovelamen-to de proteína podem ser usados, conforme necessário, em completar a con-figuração do polipeptídeo. Se desejado, cromatografia líquida de alta eficiên-cia (HPLC) pode ser empregada para as etapas finais de purificação.Os construtos nas células hospedeiras podem ser usados deuma maneira convencional para produzir o produto gênico codificado pelaseqüência recombinante. Dependendo do hospedeiro empregado em umprocedimento de produção recombinante, os polipeptídeos produzidos pelascélulas hospedeiras que contêm o vetor podem ser glicosilados ou podemser não-glicosilados. Polipeptídeos da invenção podem ou não incluir umresíduo de aminoácido metionina inicial.

Sistemas de tradução sem células também podem ser empre-gados para produzir um polipeptídeo da invenção. Sistemas de traduçãosem células podem usar mRNAs transcritos a partir de um construto de DNAque compreende um promotor operativamente ligado a um ácido nucléicoque codifica o polipeptídeo ou fragmento deste. Em alguns aspectos, o cons-truto de DNA pode ser Iinearizado antes da condução de uma reação detranscrição in vitro. O mRNA transcrito é então incubado com um extrato detradução sem célula apropriado, tal como um extrato de reticulócito de coe-lho, para produzir o polipeptídeo desejado ou fragmento deste.

Os vetores de expressão podem conter um ou mais genes mar-cadores selecionáveis para fornecer uma característica fenotípica para sele-ção de células hospedeiras transformadas, tal como, resistência à diidrofola-to redutase ou neomicina para uma cultura de célula eucariótica, ou resis-tência à tetraciclina ou ampicilina em E. coli.

Células hospedeiras que contêm os polinucleotídeos de interes-se, por exemplo, ácidos nucléicos da invenção, podem ser cultivadas emmeios nutrientes convencionais modificados conforme apropriado para ativarpromotores, selecionar transformantes ou amplificar genes. As condições decultura, tal como temperatura, pH e semelhantes, são aquelas usadas previ-amente com a célula hospedeira selecionada para expressão e serão claraspara o versado na técnica. Os clones que são identificados como tendo aatividade enzimática especificada podem então ser seqüenciados para iden-tificar a seqüência de polinucleotídeo que codifica uma enzima que tem aatividade aumentada.A invenção fornece um método para superexpressar uma xila-nase, mananase e/ou glicanase recombinante em uma célula que compre-ende expressar um vetor que compreende um ácido nucléico da invenção,por exemplo, um ácido nucléico que compreende uma seqüência de ácidonucléico com pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 5.6%,57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%,83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,96%, 97%, 98%, 99%, ou mais de identidade de seqüência a uma seqüênciada invenção ao longo de uma região de pelo menos cerca de 100 resíduos,em que as identidades de seqüência são determinadas por análise com umalgoritmo de comparação de seqüência ou por inspeção visual, ou, um ácidonucléico que hibridiza sob condições estringentes a uma seqüência de ácidonucléico da invenção, ou uma subseqüência desta. A superexpressão podeser feita por qualquer meio, por exemplo, uso de um promotor de alta ativi-dade, um vetor bicistrônico, ou por amplificação gênica do vetor.

Os ácidos nucléicos da invenção podem ser expressos ou su-perexpressos em qualquer sistema de expressão in vitro ou in vivo. Qualquersistema de cultura de célula pode ser empregado para expressar ou super-expressar proteína recombinante, incluindo culturas bacterianas, de inseto,de levedura, fúngicas, ou de mamífero. A superexpressão pode ser realizadapela escolha apropriada de promotores, intensificadores, vetores (por exem-plo, uso de vetores de replicon, vetores bicistrônicos (veja, por exemplo,Gurtu (1996) Biochem. Biophys. Res. Commun. 229:295-8), meios, sistemasde cultura e semelhantes. Em um aspecto, amplificação gênica usando mar-cadores de seleção, por exemplo, glutamina sintetase (veja, por exemplo,Sanders (1987) Dev. Biol. Stand. 66:55-63), em sistemas celulares são usa-dos para superexpressar os polipeptídeos da invenção.

Detalhes adicionais com relação a essa abordagem estão naliteratura púbica e/ou são conhecidos do versado na técnica. Em um exem-plo não Iimitante particular, tal literatura pubicamente disponível inclui EP0659215 (W0 9403612 Α1) (Nevalainen et ai.)·, Lapidot, A., Mechaly, A.,Shoham, Y., "Overexpression and single-step purification of a thermostablexylanase from Bacillus stearothermophilus T-6," J. Biotechnol. Nov 51:259-64(1996); Lüthi, E., Jasmat, N.B., Bergquist, P.L., "Xylanase from the extremelythermophilic bacterium Caldocellum saccharolyticum: overexpression of thegene in Escherichia coli and characterization of the gene product," Appl. En-viron. Microbiol. Sep 56:2677-83 (1990); e Sung, W.L., Luk1 C.K., Zahab,D.M., Wakarchuk, W., Overexpression of the Bacillus subtilis and circulansxylanases in Eseheriehia coli," Protein Expr. Purif. Jun 4:200-6 (1993), embo-ra essas referências não demonstrem as enzimas inventivas do presentepedido.

A célula hospedeira pode ser qualquer uma das células hospe-deiras familiares daqueles versados na técnica, incluindo células procarióti-cas, células eucarióticas, células de mamífero, células de inseto, ou célulasde planta. Como exemplos representativos de hospedeiros apropriados, po-dem ser mencionados: células bacterianas, tais como E. coli, Streptomyces,Bacillus subtilis, Salmonella typhimurium e várias espécies dentro dos gêne-ros Pseudomonas, Streptomyces e Staphylococcus, células de fungos, talcomo levedura, células de inseto tal como Drosophila S2 e Spodoptera Sf9,células de animais tal como CHO, COS ou melanoma de Bowes e adenoví-rus. A seleção de um hospedeiro apropriado está dentro das habilidades da-queles versados na técnica.

O vetor pode ser introduzido dentro das células hospedeiras u-sando qualquer uma de variedade de técnicas, incluindo transformação,transfecção, transdução, infecção viral, armas de gene, ou transferência degene mediada por Ti. Métodos particulares incluem transfecção com fosfatode cálcio, transfecção mediada por DEAE-Dextrano, lipofecção ou eletropo-ração (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology,(1986)).

Onde apropriado, as células hospedeiras manipuladas podemser cultivadas em meio nutriente convencional modificado conforme apropri-ado para ativar promotores, selecionar transformantes ou amplificar os ge-nes da invenção. Após transformação de uma cepa hospedeira adequada ecultivo da cepa hospedeira para uma densidade celular apropriada, o promo-tor selecionado pode ser induzido por meios apropriados (por exemplo, mu-dança de temperatura ou indução química) e as células podem ser cultiva-das por um período adicional para permitir que elas produzam o polipeptídeodesejado ou fragmento deste.

As células são tipicamente coletadas por centrifugação, rompi-das por meios físicos ou químicos, e o extrato bruto resultante é retido parapurificação adicional. Células microbianas empregadas para expressão deproteínas podem ser rompidas por qualquer método conveniente, incluindociclos de congelamento-descongelamento, sonicação, rompimento mecâni-co, ou uso de agentes de Iise celular. Tais métodos são bem-conhecidos dosversados da técnica. O polipeptídeo expresso ou fragmento deste pode serrecuperado e purificado das culturas de células recombinantes por métodosque incluem precipitação com sulfato de amônio ou etanol, extração comácido, cromatografia de troca de ânion ou cátion, cromatografia em fosfoce-lulose, cromatografia de interação hidrofóbica, cromatografia de afinidade,cromatografia de hidroxilapatita e cromatografia de lectina. Etapas de reeno-velamento de proteína podem ser usadas, conforme necessário, na finaliza-ção da configuração do polipeptídeo. Se desejado, cromatografia líquida dealta eficiência (HPLC) pode ser empregada para as etapas finais de purificação.

Vários sistemas de expressão de mamífero podem ser empre-gados para expressar proteína recombinante. Exemplos de sistemas de ex-pressão de mamífero incluem as linhagens COS-7 de fibroblastos de rim demacaco (descritas por Gluzman, Cell1 23:175, 1981) e outras linhagens celu-lares capazes de expressar proteínas a partir de um vetor compatível, talcomo as linhagens celulares C127, 3T3, CHO, HeLa e BHK.

Os construtos em células hospedeiras podem ser usados deuma maneira convencional para produzir o produto gênico codificado pelaseqüência recombinante. Dependendo do hospedeiro empregado em umprocedimento de produção recombinante, os polipeptídeos produzidos pelascélulas hospedeiras contendo o vetor podem ser glicosilados ou podem sernão-glicosilados. Polipeptídeos da invenção podem ou não incluir um resí-duo de aminoácido metionina inicial.

Alternativamente, os polipeptídeos de seqüências de aminoáci-do da invenção, ou fragmentos que compreendem pelo menos 5, 10, 15, 20,25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes, podemser produzidos sinteticamente por sintetizadores de peptídeos convencio-nais. Em outros aspectos, fragmentos ou porções dos polipeptídeos podemser empregados para produzir o polipeptídeo de extensão completa corres-pondente por síntese química; portanto, os fragmentos podem ser emprega-dos como intermediários para produzir os polipeptídeos de extensão comple-ta.

Sistemas de tradução sem célula também podem ser emprega-dos para produzir um dos polipeptídeos de seqüências de aminoácido dainvenção, ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30,35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes usando mRNAstranscritos a partir de um construto de DNA que compreendem um promotoroperativamente ligado a um ácido nucléico que codifica o polipeptídeo oufragmento deste. Em alguns aspectos, o construto de DNA pode ser Iineariza-do antes da condução de uma reação de transcrição in vitro apropriada. OmRNA transcrito é então incubado com um extrato de tradução sem célula a-propriado, tal como um extrato de reticulócito de coelho, para produzir o poli-peptídeo desejado, ou fragmento deste.

Amolificacão de Ácidos Nucléicos

Na prática da invenção, ácidos nucléicos da invenção e ácidosnucléicos que codificam as xilanases e/ou glicanases da invenção, ou ácidosnucléicos modificados da invenção, podem ser reproduzidos por amplificação.Amplificação também pode ser usada para clonar ou modificar os ácidos nu-cléicos da invenção. Dessa forma, a invenção fornece pares de seqüências deiniciadores de amplificação para amplificar ácidos nucléicos da invenção. Umversado na técnica pode desenhar pares de seqüências de iniciadores de am-plificação para qualquer parte ou para a extensão completa dessas seqüên-cias.

Em um aspecto, a invenção fornece um ácido nucléico amplificadopor um par de iniciadores da invenção, por exemplo, um par de iniciadoresdescrito por cerca dos primeiros (a 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, ou 25 resíduos de um ácido nucléico da invenção, e cerca dos (a5') 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, ou 25 resíduos da fita complementar.

A invenção fornece um par de seqüências de iniciadores de am-plificação para amplificar um ácido nucléico que codifica um polipeptídeo quetem uma atividade de xilanase, mananase e/ou glicanase, em que o par deiniciadores é capaz de amplificar um ácido nucléico que compreende umaseqüência da invenção, ou fragmentos ou subseqüências desta. Um ou cadamembro do par de seqüências de iniciadores de amplificação pode compre-ender um oligonucleotídeo que compreende pelo menos cerca de 10 a 50bases consecutivas da seqüência, ou cerca de 12, 13, 14, 15, 16, 17, 18, 19,20, 21, 22, 23, 24, ou 25 bases consecutivas da seqüência. A invenção for-nece pares de iniciadores de amplificação em que o par de iniciadores com-preende um primeiro membro que tem uma seqüência descrita por cerca dosprimeiros (a 5') 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, ou 25 resí-duos de um ácido nucléico da invenção, e um segundo membro que temuma seqüência descrita por cerca dos (a 5') 12, 13, 14, 15, 16, 17, 18, 19,20, 21, 22, 23, 24, ou 25 primeiros resíduos da fita complementar do primeiromembro. A invenção fornece xilanases e/ou glicanases geradas por amplifi-cação, por exemplo, reação em cadeia da polimerase (PCR), usando um parde iniciadores de amplificação da invenção. A invenção fornece métodos defazer uma xilanase, mananase e/ou glicanase por amplificação, por exemplo,reação em cadeia da polimerase (PCR), usando um par de iniciadores deamplificação da invenção. Em um aspecto, o par de iniciadores de amplifica-ção amplifica um ácido nucléico a partir de uma biblioteca, por exemplo, umabiblioteca de genes, tal como uma biblioteca ambiental.

Reações de amplificação também podem ser usadas para quan-tificar a quantidade de ácido nucléico em uma amostra (tal como a quantida-de de mensagem em uma amostra celular), marcar o ácido nucléico (porexemplo, aplicá-lo a um arranjo ou blot), detectar o ácido nucléico, ou quanti-ficar a quantidade de um ácido nucléico específico em uma amostra. Em umaspecto da invenção, mensagens isoladas de uma célula ou biblioteca decDNA são amplificadas.

O versado na técnica pode selecionar e desenhar iniciadores deamplificação de oligonucleotídeo adequados. Métodos de amplificação tam-bém são conhecidos na técnica, e incluem, por exemplo, reação em cadeiada polimerase, PCR (veja, por exemplo, PCR PROTOCOLS, A GUIDE TOMETHODS AND APPLICATIONS, ed. Innis, Academic Press, N.Y. (1990) ePCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., N.Y., reação emcadeia da Iigase (LCR) (veja, por exemplo, Wu (1989) Genomics 4:560; Lan-degren (1988) Science 241:1077; Barringer (1990) Gene 89:117); amplifica-ção por transcrição (veja, por exemplo, Kwoh (1989) Proc. Natl. Acad. Sei.USA 86:1173); e, replicação de seqüência auto-sustentável (veja, por exem-pio, Guatelli (1990) Proc. Natl. Acad. Sei. USA 87:1874); amplificação pelareplicase Q Beta (veja, por exemplo, Smith (1997) J. Clin. Microbiol.35:1477-1491), ensaio automático de amplificação pela replicase Q-beta (ve-ja, por exemplo, Burg (1996) Mol. Cell. Probes 10:257-271) e outras técnicasmediadas por RNA polimerase (por exemplo, NASBA, Cangene, Mississau-ga, Ontario); veja também Berger (1987) Methods Enzymol. 152:307-316;Sambrook; Ausubel; Patente U.S. Nos. 4.683.195 e 4.683.202; Sooknanan(1995) Biotechnology 13:563-564.

Determinando o grau de identidade de seqüência

A invenção fornece ácidos nucléicos que compreendem se-qüências que têm pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%,56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%,69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%,95%, 96%, 97%, 98%, 99%, ou mais ou identidade de seqüência completa(100%) a um ácido nucléico exemplar da invenção (como definido acima) aolongo de uma região de pelo menos cerca de 50, 75, 100, 150, 200, 250,300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000,1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550 ou maisresíduos. A invenção fornece polipeptídeos que compreendem seqüênciasque têm pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%,58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%,71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%,84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%,97%, 98%, 99% ou mais, ou identidade de seqüência completa (100%) a umpolipeptídeo exemplar da invenção. A proporção de identidade de seqüência(homologia) pode ser determinada usando qualquer programa de computa-dor e parâmetros associados, incluindo aqueles descritos aqui, tal comoBLAST 2.2.2. ou FASTA versão 3.0t78, com os parâmetros predefinidos.

Como usado aqui, os termos "computador", "programa de com-putador" e "processador" são usados nos seus contextos gerais mais amplose incorporam todos os aparelhos, descritos em detalhe, abaixo. Uma "se-qüência codificante de" ou uma "seqüência que codifica" um polipeptídeo ouproteína em particular, é uma seqüência de ácido nucléico que é transcrita etraduzida em um polipeptídeo ou proteína quando colocada sob o controlede seqüências regulatórias apropriadas.

A expressão "substancialmente idêntico" no contexto de doisácidos nucléicos ou polipeptídeos refere-se a duas ou mais seqüências quetêm, por exemplo, pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%,56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%,69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%,82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%,95%, 96%, 97%, 98%, 99%, ou mais identidade de resíduos de aminoácido(seqüência) quando comparados e alinhados para correspondência máxima,como medido usando um dos algoritmos de comparação de seqüência co-nhecidos ou por inspeção visual. Tipicamente, existe identidade substancialao longo de uma região de pelo menos cerca de 100 resíduos e o mais co-mumente as seqüências são substancialmente idênticas ao longo de pelomenos cerca de 150-200 resíduos. Em alguns aspectos, as seqüências sãosubstancialmente idênticas ao longo de toda a região codificante.

Adicionalmente, uma seqüência de aminoácido "substancial-mente idêntica" é uma seqüência que difere de uma seqüência de referênciapor uma ou mais substituições de aminoácido conservativas ou não-conservativas, deleções, ou inserções, particularmente quando tal substitui-ção ocorre em um local que não o sítio ativo da molécula e contanto que talpolipeptídeo retenha essencialmente suas propriedades funcionais. Umasubstituição de aminoácido conservativa, por exemplo, substitui um aminoá-cido por outro da mesma classe (por exemplo, substituição de um aminoáci-do hidrofóbico, tal como isoleucina, valina, Ieucina ou metionina, por outro,ou substituição de um aminoácido polar por outro, tal como uma substituiçãode arginina por lisina, ácido glutâmico por ácido aspártico ou glutamina porasparagina). Um ou mais aminoácidos podem ser deletados, por exemplo,de um polipeptídeo de xilanase, mananase e/ou glicanase, resultando emuma modificação da estrutura do polipeptídeo, sem alterar significativamentesua atividade biológica. Por exemplo, aminoácidos amino- ou carbóxi-terminais que não são necessários para a atividade biológica de xilanase,mananase e/ou glicanase podem ser removidos. Seqüências de polipeptídeomodificadas da invenção podem ser testadas quanto a uma atividade bioló-gica de xilanase, mananase e/ou glicanase por vários métodos, incluindocolocar a seqüência de polipeptídeo modificada em contato com um substra-to de xilanase, mananase e/ou glicanase, e determinar se o polipeptídeomodificado diminui a quantidade de substrato específico no ensaio ou au-menta os bioprodutos da reação enzimática de um polipeptídeo de xilanase,mananase e/ou glicanase funcional com o substrato.Seqüências de ácido nucléico da invenção podem compreenderpelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou500 nucleotídeos consecutivos de uma seqüência exemplar da invenção eseqüências substancialmente idênticas a elas. Seqüências de ácido nucléicoda invenção podem compreender seqüências homólogas e fragmentos deseqüências de ácido nucléico e seqüências substancialmente idênticas aelas, se referindo a uma seqüência que tem pelo menos 50%, 51%, 52%,53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%,66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%,79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%,92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou mais identidade de se-qüência (homologia) a essas seqüências. A homologia pode der determina-da usando qualquer programa de computador e parâmetros descritos aqui,incluindo FASTA versão 3.0t78 com os parâmetros predefinidos. Seqüênciashomólogas também incluem seqüências de RNA nas quais uridinas substitu-em as timinas nas seqüências de ácido nucléico da invenção. As seqüênciashomólogas podem ser obtidas usando qualquer um dos procedimentos des-critos aqui ou podem resultar da correção de um erro de seqüenciamento.

Será observado que as seqüências de ácido nucléico da invenção e seqüên-cias substancialmente idênticas a elas podem ser representadas no formatotradicional de um caractere (veja a parte interna da capa de trás de Stryer,Lubert. Biochemistry, 3ã Ed., W. H Freeman & Co., Nova Iorque) ou emqualquer outro formato que registre a identidade dos nucleotídeos em umaseqüência.

Vários programas de comparação de seqüência identificados emoutros locais nesse relatório de patente são particularmente contempladospara uso nesse aspecto da invenção. Homologias de seqüência de proteínae/ou ácido nucléico podem ser avaliadas usando qualquer um de uma varie-dade de algoritmos e programas de comparação de seqüência conhecidosna técnica. Tais algoritmos e programas incluem, mas, de nenhuma formasão limitados a, TBLASTN, BLASTP, FASTA, TFASTA e CLUSTALW (Pear-son & Lipman, Proc. Natl. Acad. Sei. USA 85(8):2444-2448, 1988; Altschul etal., J. Mol. Biol. 215(3):403-410, 1990; Thompson et al., Nucleie Aeids Res.22(2):4673-4680, 1994; Higgins et ai, Methods Enzymol. 266:383-402, 1996;AItsehuI et al., J. Mol. Biol. 215(3):403-410, 1990; Altsehul et al., NatureGenetics 3:266-272, 1993).

Homologia ou identidade é freqüentemente medida usando umprograma de análise de seqüência (por exemplo, Sequence Analysis Softwa-re Package do Genetics Computer Group, Centro de Biotecnologia da Univer-sidade de Wisconsin, 1710 University Avenue, Madison, Wl 53705). Tal pro-grama pareia seqüências similares por designar graus de homologia a váriasdeleções, substituições e outras modificações. Os termos "homologia" e "iden-tidade" no contexto de duas ou mais seqüências de ácido nucléico ou polipep-tídeo, referem-se a duas ou mais seqüências ou subseqüências que são asmesmas ou têm uma porcentagem especificada de resíduos de aminoácido ounucleotídeos que são os mesmos quando comparados e alinhados para cor-respondência máxima ao longo de uma janela de comparação ou região de-signada conforme medido usando qualquer número de algoritmos de compa-ração de seqüência ou por alinhamento manual e inspeção visual.

Para comparação de seqüência, tipicamente uma seqüência agecomo uma seqüência de referência à qual as seqüências de testes são compa-radas. Quando se usa um algoritmo de comparação de seqüência, as seqüên-cias de teste e de referência são digitadas em um computador, as coordena-das de subseqüência são designadas, se necessário, e os parâmetros do pro-grama do algoritmo de seqüência são designados. Os parâmetros predefinidosdo programa podem ser usados, ou parâmetros alternativos podem ser desig-nados. O algoritmo de comparação de seqüência então calcula o percentual deidentidade de seqüência para as seqüências de teste em relação à seqüênciade referência, com base nos parâmetros do programa.

Uma "janela de comparação", como usado aqui, inclui referência aum segmento de qualquer uma das várias posições contíguas selecionadas apartir do grupo que consiste em 20 a 600, geralmente de cerca de 50 a cercade 200, mais geralmente cerca de 100 a cerca de 150 nas quais uma seqüên-cia pode ser comparada a uma seqüência de referência do mesmo número deposições contíguas após as duas seqüências serem otimamente alinhadas.

Métodos de alinhamento de seqüência para comparação são bem-conhecidosna técnica. O alinhamento ótimo de seqüências para comparação pode serconduzido, por exemplo, pelo algoritmo de homologia local de Smith & Water-man, Adv. Appl. Math. 2:482, 1981, pelo algoritmo de alinhamento por homolo-gia de Needleman & Wunsch, J. Mol. Biol 48:443, 1970, pela pesquisa pelométodo de similaridade de Person & Lipman, Proc. Natl. Acad. Sei. USA85:2444, 1988, por implementações computadorizadas desses algoritmos(GAP, BESTFIT, FASTA e TFASTA no Wisconsin Genetics Software Package,Genetics Computer Group, 575 Science Dr., Madison, Wl), ou por alinhamentomanual e inspeção visual. Outros algoritmos para determinar homologia ouidentidade incluem, por exemplo, além do programa BLAST (Basic LocalAlignment Search Tool no National Center for Biological Information), ALIGN,AMAS (Analysis of Multiply Aligned Sequences), AMPS (Protein MultipleSequence Alignment), ASSET (Aligned Segment Statistical Evaluation Tool),BANDS, BESTSCOR, BIOSCAN (Biological Sequence Comparative AnalysisNode), BLIMPS (BLocks IMProved Searcher), FASTA, Intervals & Points,BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS,WCONSENSUS, algoritmo de Smith-Waterman, DARWIN, algoritmo de LasVegas, FNAT (Forced Nucleotide Alignment Tool), Framealign,Framesearch, DYNAMIC, FILTER, FSAP (Fristensky Sequence AnalysisPackage), GAP (Global Alignment Program), GENAL, GIBBS, GenQuest,ISSC (Sensitive Sequence Comparison), LALIGN (Local SequenceAlignment), LCP (Local Content Program), MACAW (Multiple AlignmentConstruction & Analysis Workbench), MAP (Multiple Alignment Program),MBLKP, MBLKN1 PIMA (Pattern-lnduced Multi-sequence Alignment), SAGA(Sequence Alignment by Genetic Algorithm) e WHAT-IF. Tais programas dealinhamento também podem ser usados para rastrear bases de dados dogenoma para identificar seqüências de polinucleotídeo que têm seqüênciassubstancialmente idênticas. Várias bases de dados do genoma estão dispo-níveis, por exemplo, uma porção substancial do genoma humano está dis-ponível como parte do Projeto de Seqüenciamento do Genoma Humano.Pelo menos vinte e um outros genomas já foram seqüenciados, incluindo,por exemplo, M. genitalium (Fraser et al., 1995), M. jannaschii (Bult et al.,1996), H. influenzae (Fleischmann et al., 1995), E. coli {Blattner et al., 1997) elevedura (S. cerevisiae) (Mewes et ai, 1997) e D. melanogaster (Adams et ai,2000). Progresso significativo também foi feito no seqüenciamento dos geno-mas de organismos modelo, tais como camundongo, C. elegans e Arabadop-sis sp. Várias bases de dados contendo informação genômica comentadoscom alguma informação funcional são mantidas por diferentes organizações esão acessíveis pela Internet.

Um exemplo de um algoritmo útil são os algoritmos BLAST eBLAST 2.0, que são descritos em Altschul et al., Nuc. Acids Res. 25:3389-3402, 1977 e Altschul et al., J. Mol. Biol. 215:403-410, 1990, respectivamen-te. Programas para realizar análises BLAST são disponíveis publicamenteatravés do National Center for Biotechnology Information. Esse algoritmoenvolve primeiro identificar pareamentos de seqüência com alto escore(HSPs) por identificar pequenas palavras de extensão W na seqüência deentrada, que sejam iguais ou satisfaçam um escore limiar T de valor positivoquando alinhadas com uma palavra da mesma extensão em uma seqüênciada base de dados. T é referido como o limiar do escore de palavras vizinhas(Altschul et al., supra). Essas combinações de palavras vizinhas iniciais a-gem como sementes para iniciar buscas para encontrar HSPs mais longascontendo as mesmas. As combinações das palavras são estendidas em am-bas as direções ao longo de cada seqüência até o ponto em que o escorecumulativo do alinhamento pode ser aumentado. Escores cumulativos sãocalculados usando, para seqüências de nucleotídeo, os parâmetros M (esco-re de recompensa para um par de resíduos pareados; sempre > 0). Paraseqüências de aminoácidos, uma matriz de escores é usada para calcular oescore cumulativo. A extensão das combinações de palavras em cada dire-ção é interrompida quando: o escore cumulativo do alinhamento diminui pelaquantidade X do seu valor máximo atingido; o escore cumulativo vai parazero ou menor, devido ào acúmulo de um ou mais alinhamentos de resíduoscom escore negativo; ou o final de qualquer uma das seqüências tenha sidoatingido. Os parâmetros W1 T e X do algoritmo BLAST determinam a sensibi-lidade e velocidade do alinhamento. O programa BLASTN (para seqüênciasde nucleotídeo) usa como pré-definições um comprimento de palavra (W) de11, uma expectativa (E) de 10, M=5, N=-4 e uma comparação de ambas asfitas. Para seqüências de aminoácido, o programa BLASTP usa como pré-definições um comprimento de palavra de 3 e expectativas (E) de 10 e a ma-triz de escore BLOSUM62 (veja Henikoff & Henikoff, Proc. Natl. Acad. Sei.USA 89:10915, 1989) alinhamentos (B) de 50, expectativa (E) de 10, M=5,N= -4 e uma comparação de ambas as fitas.

O algoritmo BLAST também realiza uma análise estatística dasimilaridade entre as duas seqüências (veja, por exemplo, Karlin & Altschul1Proc. Natl. Acad. Sei. USA 90:5873, 1993). Uma medida de similaridade for-necida pelo algoritmo BLAST é a menor probabilidade de soma (P(N)), quefornece uma indicação da probabilidade pela qual um pareamento entre du-as seqüências de ácido nucléico ou aminoácido possam ocorrer ao acaso.

Por exemplo, um ácido nucléico é considerado similar a uma seqüência dereferência se a menor probabilidade de soma em uma comparação do ácidonucléico de teste ao ácido nucléico de referência for menor do que cerca de0,2, mais preferivelmente menor do que cerca de 0,01 e o mais preferivel-mente menor do que cerca de 0,001.

Em um aspecto, homologias de seqüência de proteína e ácidonucléico são avaliadas usando o Basic Local Alignment Search Tool("BLAST"). Em particular, cinco programas BLAST são usados para realizara seguinte tarefa:

(1) BLASTP e BLAST3 comparam uma seqüência deaminoácido de entrada contra uma base de dados de seqüências deproteína;(2) BLASTN compara uma seqüência de nucleotídeo de entradacontra uma base de dados de seqüências de nucleotídeos;

(3) BLASTX compara os produtos conceituais da tradução emseis fases de uma seqüência de nucleotídeo de entrada (ambas as fitas)contra uma base de dados de seqüência de proteína;

(4) TBLASTN compara uma seqüência de proteína de entradacontra uma seqüência de nucleotídeo traduzida em todas as seis dases deleitura (ambas as fitas); e

(5) TBLASTX compara as traduções das seis fases de leitura deuma seqüência de nucleotídeo de entrada contra as traduções das seisfases de uma base de dados de seqüências de nucleotídeo.

Os programas BLAST identificam seqüências homólogas poridentificar segmentos similares, que são referidos aqui como "pareamentosde segmentos com alto escore" entre uma seqüência de aminoácido ouácido nucléico de entrada e uma seqüência de teste obtida preferivelmente apartir de uma base de dados de proteína ou ácido nucléico. Pareamentos desegmentos com alto escore são preferivelmente identificados (isto é,alinhados) por meio de uma matriz de escore, muitas das quais sãoconhecidas na técnica. Preferivelmente, a matriz de escore usada é a matrizBLOSUM62 (Gonnet et ai, Science 256:1443-1445, 1992; Henikoff &Henikoff, Proteins 17:49-61, 1993). Menos preferivelmente, as matrizes PAMou PAM250 também podem ser usadas (veja, por exemplo, Schwartz &Dayhoff, eds., 1978, Matrices for Detecting Distance fíelationships: Atlas ofProtein Sequence and Structure, Washington: National Biomedical ResearchFoundation). Os programas BLAST são acessíveis através U.S. NationalLibrary of Medicine.

Os parâmetros usados com os algoritmos acima podem seradaptados dependendo do comprimento da seqüência e do grau dehomologia estudado. Em alguns aspectos, os parâmetros podem ser osparâmetros predefinidos usados pelos algoritmos na ausência de instruçõesdo usuário.Sistemas de computador e produtos de programa de computador

Para determinar e identificar identidades de seqüência,homologias estruturais, motivos e semelhantes in silico, uma seqüência deácido nucléico ou polipeptídeo da invenção pode ser armazenada, gravada emanipulada em qualquer mídia que pode ser lida e acessada por umcomputador.

Conseqüentemente, a invenção fornece computadores, siste-mas de computador, meios para leitura em computador, produtos de pro-gramas de computador e semelhantes, e gravadas ou armazenadas nelesas seqüências de ácido nucléico e polipeptídeo da invenção. Como usadasaqui, as palavras "gravado" e "armazenado" referem-se a um processo paraarmazenar informação em uma mídia de computador. Um versado na técni-ca pode facilmente adotar qualquer método conhecido para gravar informa-ção em uma mídia para leitura em um computador para gerar fabricaçõesque compreendem uma ou mais das seqüências de ácido nucléico e/ou poli-peptídeo da invenção.

Os polipeptídeos da invenção incluem as seqüências exempla-res da invenção, e seqüências substancialmente idênticas a elas e fragmen-tos de qualquer uma das seqüências anteriores. Seqüências de polipeptídeosubstancialmente idênticas, ou homólogas referem-se a uma seqüência depolipeptídeo que tem pelo menos 50%, 51%, 52%, 53%, 54%, 55%, 56%,57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%,70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%,83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%,96%, 97%, 98%, 99%, ou mais, ou identidade de seqüência completa(100%) a uma seqüência exemplar da invenção, por exemplo, seqüências depolipeptídeo da invenção.

Homologia pode ser determinada usando qualquer um dos pro-gramas de computador e parâmetros descritos aqui, incluindo FASTA versão3.0t78 com os parâmetros predefinidos ou com qualquer parâmetro modifica-do. As seqüências homólogas podem ser obtidas usando qualquer um dosprocedimentos descritos aqui ou podem resultar da correção de um erro deseqüenciamento. Os fragmentos de polipeptídeo compreendem pelo menoscerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350,400, 450, 500 ou mais aminoácidos consecutivos dos polipeptídeos da inven-ção e seqüências substancialmente idênticas a eles. Será observado que oscódigos de polipeptídeo de seqüências de aminoácido da invenção e seqüên-cias substancialmente idênticas a elas, podem ser representados no formatotradicional de um caractere ou no formato de três letras (veja, Stryer, Lubert.Biochemistrv, 3- Ed.. supra) ou em qualquer outro formato relacionado com aidentidade dos polipeptídeos em uma seqüência.

Uma seqüência de ácido nucléico ou polipeptídeo da invençãopode ser gravada, armazenada e manipulada em qualquer mídia que pode serlida e acessada por um computador. Como usado aqui, as palavras "gravado"e "armazenado" referem-se a um processo para armazenar informação emuma mídia de computador. Um versado na técnica pode adotar facilmentequalquer um dos métodos atualmente conhecidos para gravar informação emuma mídia para leitura em computador para gerar fabricações que compreen-dem uma ou mais das seqüências de ácido nucléico da invenção e seqüênciassubstancialmente idênticas a elas, uma ou mais das seqüências de polipeptí-deo da invenção e seqüências substancialmente idênticas a elas. Outro aspec-to da invenção é uma mídia para leitura em computador que tem gravado nelapelo menos 2, 5,10,15, ou 20 ou mais seqüências de ácido nucléico da inven-ção e seqüências substancialmente idênticas a elas.

Outro aspecto da invenção é uma mídia para leitura em computa-dor que tem gravada nela uma ou mais das seqüências de ácido nucléico dainvenção e seqüências substancialmente idênticas a elas. Outro aspecto dainvenção é uma mídia para leitura em computador que tem gravada nela umaou mais das seqüências de polipeptídeo da invenção e seqüências substanci-almente idênticas a elas. Outro aspecto da invenção é uma mídia para leituraem computador que tem gravada nela pelo menos 2, 5, 10, 15, ou 20 ou maisdas seqüências descritas acima.Mídias para leitura em computador incluem mídias legíveis mag-neticamente, mídias legíveis opticamente, mídias legíveis eletronicamente, euma mídia magnética/óptica. Por exemplo, as mídias legíveis em computadorpodem ser um disco rígido, um disco flexível, uma fita magnética, CD-ROM,disco digital versátil (DVD), memória de acesso aleatório (RAM), ou memóriasomente de leitura (ROM) assim como outros tipos de meios conhecidos da-queles versados na técnica.

Aspectos da invenção incluem sistemas (por exemplo, sistemasbaseados na internet), particularmente sistemas de computador que armaze-nam a manipulam a informação da seqüência descrita aqui. Um exemplo deum sistema de computador 100 é ilustrado na forma de diagrama de blocos naFigura 1. Como usado aqui, um "sistema de computador" refere-se componen-tes de hardware, componentes de programas (software) e componentes dearmazenamento de dados usados para analisar uma seqüência de nucleotídeode uma seqüência de ácido nucléico da invenção e seqüências substancial-mente idênticas a ela, ou uma seqüência de polipeptídeo como descrita nasseqüências de aminoácido da invenção. O sistema de computador 100 incluitipicamente um processador para processar, acessar e manipular os dados daseqüência. O processador 105 pode ser qualquer tipo bem-conhecido de uni-dade de processamento central, tal como por exemplo, Pentium Ill da IntelCorporation, ou processador similar de Sun, Motorola, Compaq, AMD ou Inter-national Business Machines.

Tipicamente, o sistema de computador 100 é um sistema parafinalidades gerais que compreende o processador 105 e um ou mais compo-nentes de armazenamento de dados internos 110 para armazenar dados e umou mais dispositivos de recuperação para recuperar os dados armazenadosnos componentes de armazenamento de dados. Um versado na técnica podeobservar facilmente que qualquer um dos sistemas de computador disponíveisatualmente é adequado.

Em um aspecto particular, o sistema de computador 100 inclui umprocessador 105 conectado a um barramento que é conectado a uma memóriacentral 115 (preferivelmente implementada como RAM) e um ou mais disposi-tivos de armazenamento de dados internos 110, tal como um disco rígido e/ououtra mídia legível em computador que tem dados armazenados. Em algunsaspectos, o sistema de computador 100 ainda inclui um ou mais dispositivosde recuperação de dados 118 para ler os dados armazenamos nos dispositi-vos de armazenamento de dados internos 100.

O dispositivo de recuperação de dados 118 pode representar, porexemplo, uma unidade de disco flexível, uma unidade de disco compacto, umaunidade de fita magnética, ou um modem capaz de conexão a um sistema dearmazenamento de dados remoto (por exemplo, através da internet), etc. Emalguns aspectos, o dispositivo de armazenamento de dados interno 110 é umamídia para leitura em computador removível tal como um disco flexível ou umdisco compacto, uma fita magnética, etc. contendo lógica de controle e/ou da-dos gravados nela. O sistema de computador 100 pode incluir vantajosamenteou ser programado por programas apropriados para leitura da lógica de contro-le e/ou dados do componente de armazenamento de dados uma vez inseridosno dispositivo de recuperação de dados.

O sistema de computador 100 inclui uma tela 120 que é usadapara exibir a informação para um usuário do computador. Deve ser observadoque o sistema de computador 100 pode ser ligado a outros sistemas de com-putador 125a-c em uma rede ou rede de área ampliada para fornecer acessocentralizado ao sistema de computador 100.

Programas para acessar e processar as seqüências de nucleotí-deo de uma seqüência de ácido nucléico da invenção e seqüências substanci-almente idênticas a elas, ou uma seqüência de polipeptídeo da invenção e se-qüências substancialmente idênticas a elas (tais como ferramentas de busca,ferramentas de comparação e ferramentas de modelagem, etc.) podem estarna memória principal 115 durante a execução.

Em alguns aspectos, o sistema de computador 100 pode aindacompreender um algoritmo de comparação de seqüência para comparar umaseqüência de ácido nucléico da invenção e seqüências substancialmente idên-ticas a ela, ou uma seqüência de polipeptídeo da invenção e seqüências subs-tancialmente idênticas a elas, armazenadas em uma mídia de leitura por com-putador a seqüência(s) de nucleotídeo ou polipeptídeo de referência armaze-nada(s) em uma mídia legível em computador. Um "algoritmo de comparaçãode seqüência" refere-se a um ou mais programas que são implementados (lo-calmente ou remotamente) no sistema de computador 100 para comparar umaseqüência de nucleotídeo com outras seqüências de nucleotídeo e/ou compos-tos armazenados dentro de um meio de armazenamento de dados. Por exem-plo, o algoritmo de comparação de seqüência pode comparar as seqüênciasde nucleotídeo de uma seqüência de ácido nucléico da invenção e seqüênciassubstancialmente idênticas a ela, ou uma seqüência de polipeptídeo da inven-ção e seqüências substancialmente idênticas a ela, armazenadas em uma mí-dia legível em computador, a seqüências de referência armazenadas em umamídia legível em computador para identificar homologias ou motivos estrutu-rais.

A figura 2 é um fluxograma ilustrando um aspecto de um processo200 para comparar uma nova seqüência de nucleotídeo ou proteína com umabase de dados de seqüências a fim de determinar os níveis de homologia en-tre a nova seqüência e as seqüências na base de dados. A base de dados deseqüências pode ser uma base de dados particular armazenada dentro do sis-tema de computador 100, ou uma base de dados pública tal como GENBANKque é disponível pela internet.

O processo 200 começa em um estado de início 201 e então pas-sa para um estado 202 em que a nova seqüência a ser comparada é armaze-nada em uma memória em um sistema de computador 100. Como discutidoacima, a memória poderia ser qualquer tipo de memória, incluindo RAM ou umdispositivo de armazenamento interno.

O processo 200 então passa para um estado 204 em que umabase de dados de seqüências é aberta para análise e comparação. O proces-so 200 então passa para um estado 206 em que a primeira seqüência arma-zenada na base de dados é lida em uma memória no computador. Uma com-paração é então realizada em um estado 210 para determinar se a primeiraseqüência é igual à segunda seqüência. É importante observar que essa etapanão está limitada a realizar uma comparação exata entre a nova seqüência e aprimeira seqüência na base de dados. Métodos bem-conhecidos são conheci-dos daqueles versados na técnica para comparar duas seqüências de nucleo-tídeo ou proteína, mesmo se elas não forem idênticas. Por exemplo, intervalospodem ser introduzidos em uma seqüência a fim de aumentar o nível de ho-mologia entre as duas seqüências testadas. Os parâmetros que controlam seintervalos ou outras características são introduzidos em uma seqüência duran-te a comparação são normalmente inseridos pelo usuário do sistema de com-putador.

Uma vez que a comparação das duas seqüências tenha sido rea-lizada no estado 210, é determinado, em um estado de decisão 210, se as du-as seqüências são iguais. Logicamente, o termo "igual" não é limitado a se-qüências que são absolutamente idênticas. Seqüências que estão dentro dosparâmetros de homologia inseridos pelo usuário serão marcadas como "iguais"no processo 200.

Se for determinado que as duas seqüências são iguais, o proces-so 200 passa para um estado 214 em que o nome da seqüência da base dedados é exibido para usuário. Esse estado notifica o usuário de que a seqüên-cia com o nome exibido satisfaz as restrições de homologia que foram inseri-das. Uma vez que o nome da seqüência armazenada é exibido para o usuário,o processo 200 passa para um estado de decisão 218 em que é determinadose existem mais seqüências na base de dados. Se não existirem mais se-qüências na base de dados, então o processo 200 termina em um estado final220. Entretanto, se existirem mais seqüências na base de dados, então o pro-cesso 200 passa para um estado 224 em que um indicador é movimentadopara a seqüência seguinte na base de dados a fim de que ela possa ser com-parada à nova seqüência. Dessa maneira, a nova seqüência é alinhada ecomparada com cada seqüência na base de dados.Deve ser observado que se foi determinado no estado de decisão212 que as seqüências não são homólogas, então o processo 200 deve pas-sar imediatamente para o estado de decisão 218 a fim de determinar se algu-ma outra seqüência está disponível na base de dados para comparação.

Conseqüentemente um aspecto da invenção é um sistema decomputador que compreende um processador, um dispositivo de armazena-mento de dados que tem armazenado nele uma seqüência de ácido nucléicoda invenção e seqüências substancialmente idênticas a ela, ou uma seqüênciade polipeptídeo da invenção e seqüências substancialmente idênticas a ela,um dispositivo de armazenamento de dados que tem armazenadas nele, deforma recuperável, seqüências de nucleotídeo ou seqüências de polipeptídeode referência para serem comparadas a uma seqüência de ácido nucléico dainvenção e seqüências substancialmente idênticas a ela, ou uma seqüência depolipeptídeo da invenção e seqüências substancialmente idênticas a ela, e umcomparador de seqüência para conduzir a comparação. O comparador de se-qüência pode indicar um nível de homologia entre as seqüências comparadasou identificar motivos estruturais no código de ácido nucléico acima de se-qüências de ácido nucléico da invenção e seqüências substancialmente idênti-cas a ela, ou uma seqüência de polipeptídeo da invenção e seqüências subs-tancialmente idênticas a ela, ou ele pode identificar motivos estruturais em se-qüências que são comparados a esses códigos de ácido nucléico e códigos depolipeptídeo. Em alguns aspectos, o dispositivo de armazenamento de dadospode ter armazenado nele as seqüências de pelo menos 2, 5, 10, 15, 20, 25,30 ou 40 ou mais das seqüências de ácido nucléico da invenção e seqüênciassubstancialmente idênticas a ela, ou seqüências de polipeptídeo da invenção eseqüências substancialmente idênticas a ela.

Outro aspecto da invenção é um método para determinar o nívelde homologia entre uma seqüência de ácido nucléico da invenção e seqüên-cias substancialmente idênticas a ela, ou uma seqüência de polipeptídeo dainvenção e seqüências substancialmente idênticas a ela, e uma seqüência denucleotídeo de referência. O método inclui ler o código do ácido nucléico ou ocódigo do polipeptídeo e a seqüência de nucleotídeo ou de polipeptídeo dereferência através do uso de um programa de computador que determina osníveis de homologia e determinar homologia entre o código do ácido nucléicoou o código do polipeptídeo e a seqüência de nucleotídeo ou de polipeptídeode referência com o programa de computador. O programa de computadorpode ser qualquer um de vários programas de computador para determinarníveis de homologia, incluindo aqueles especificamente citados aqui, (por e-xemplo, BU\ST2N com os parâmetros predefinidos ou com qualquer parâme-tro modificado). O método também pode ser implementado usando ós siste-mas de computador descritos acima. O método também pode ser realizado porler pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das seqüências de ácidonucléico da invenção, ou das seqüências de polipeptídeo da invenção descri-tas acima através do uso do programa de computador e determinar a homolo-gia entre os códigos do ácido nucléico ou códigos do polipeptídeo e as se-qüências de nucleotídeo ou seqüências de polipeptídeo de referência.

A figura 3 é um fluxograma que ilustra um aspecto de um proces-so 250 em um computador para determinar se duas seqüências são homólo-gas. O processo 250 começa em um estado de início 252 e então passa paraum estado 254 em que uma primeira seqüência a ser comparada é armazena-da em uma memória. A segunda seqüência a ser comparada é então armaze-nada em uma memória em um estado 256. O processo 250 passa então paraum estado 260 em que o primeiro caractere na primeira seqüência é lido e en-tão para um estado 262 em que o primeiro caractere de uma segunda seqüên-cia é lido. Deve ser compreendido que se a seqüência for uma seqüência denucleotídeo, então o caractere normalmente será A, T, C, G ou U. Se a se-qüência for uma seqüência de proteína, então ela estará preferivelmente nocódigo de aminoácido de uma letra para que a primeira e a segunda se-qüências possam ser facilmente comparadas.

É então determinado em um estado de decisão 264 se os doiscaracteres são iguais. Se eles forem iguais, então o processo 250 passa pa-ra um estado 268 em que os próximos caracteres nas primeira e na segundaseqüência são lidos. Então é determinado se os próximos caracteres sãoiguais. Se forem, então o processo 250 continua esse ciclo até que dois ca-racteres não sejam iguais. Se for determinado que os próximos dois caracte-res não são iguais, o processo 250 passa para um estado de decisão 274para determinar se há mais caracteres em alguma das seqüências para se-rem lidos.

Se não houver mais caracteres para serem lidos, então o pro-cesso 250 passa para um estado 276 em que o nível de homologia entre aprimeira e a segunda seqüência é determinado pelo cálculo da proporção decaracteres entre as seqüências que eram iguais do número total de seqüên-cias na primeira seqüência. Dessa forma, se cada caractere em uma primei-ra seqüência de 100 nucleotídeos alinhou com cada caractere em uma se-gunda seqüência, o nível de homologia seria 100%.

Alternativamente, o programa de computador pode ser um pro-grama de computador que compara as seqüências de nucleotídeo de umaseqüência de ácido nucléico descrita na invenção, a uma ou mais seqüên-cias de nucleotídeo de referência a fim de determinar se o código de ácidonucléico de uma seqüência de ácido nucléico da invenção, e seqüênciassubstancialmente idênticas a ela, difere de uma seqüência de ácido nucléicode referência em uma ou mais posições. Em um aspecto, tal programa gravao comprimento e identidade de nucleotídeos inseridos, deletados ou substi-tuídos com relação à seqüência da seqüência de polinucleotídeo ou de ácidonucléico de referência da invenção e seqüências substancialmente idênticasa elas. Em um aspecto, o programa de computador pode ser um programaque determina se uma seqüência de ácido nucléico da invenção e seqüên-cias substancialmente idênticas a ela contêm um polimorfismo de nucleotí-deo único (SNP) com relação a uma seqüência de nucleotídeo de referência.

Outro aspecto da invenção é um método para determinar seuma seqüência de ácido nucléico da invenção e seqüências substancialmen-te idênticas a ela diferem em um ou mais nucleotídeos de uma seqüência denucleotídeo de referência, compreendendo as etapas de ler o código de áci-do nucléico e a seqüência nucleotídeo de referência através do uso de umprograma de computador que identifica diferenças entre seqüências de ácidonucléico, e identificar diferenças entre o código de ácido nucléico e a se-qüência de nucleotídeo de referência com o programa de computador. Emalguns aspectos, o programa de computador é um programa que identificapolimorfismos de um único nucleotídeo. O método pode ser implementadopelos sistemas de computador descritos acima e o método ilustrado na figu-ra 3. O método também pode ser realizado por ler pelo menos 2, 5, 10, 15,20, 25, 30, ou 40 ou mais das seqüências de ácido nucléico da invenção e se-qüências substancialmente idênticas a ela, e as seqüências de nucleotídeo dereferência através do uso do programa de computador e identificar diferençasentre os códigos de ácido nucléico e as seqüências de nucleotídeo de referên-cia com o programa de computador.

Em outros aspectos, o sistema baseado em computador podeainda compreender um identificador para identificar características dentro deuma seqüência de ácido nucléico da invenção ou uma seqüência de polipeptí-deo da invenção e seqüências substancialmente idênticas a ela.

Um "identificador" refere-se a um ou mais programas que identi-ficam certas características dentro de uma seqüência de ácido nucléico dainvenção e seqüências substancialmente idênticas a ela, ou uma seqüênciade polipeptídeo da invenção e seqüências substancialmente idênticas a ela.Em um aspecto, o identificador pode compreender um programa que identifi-ca uma fase aberta de leitura em uma seqüência de ácido nucléico da inven-ção e seqüências substancialmente idênticas a ela.

A figura 4 é um fluxograma ilustrando um aspecto de um pro-cesso identificador 300 para detectar a presença de uma característica emuma seqüência. O processo 300 começa em um estado de início 302 e en-tão passa para um estado 304 em que uma primeira seqüência que deve serchecada quanto às características é armazenada em uma memória 115 nosistema de computador 100. O processo 300 então passa para um estado306 em que uma base de dados de seqüências é aberta. Tal base de dadosdeve incluir uma lista de atributos de cada característica junto com o nomeda característica. Por exemplo, um nome da característica poderia ser "có-don de início" e o atributo seria "ATG". Outro exemplo seria o nome da ca-racterística "TAATAA Box" e o atributo da característica seria "TAATAA". Umexemplo de tal base de dados é produzido pelo University of Wisconsin Ge-netics Computer Group. Alternativamente, as características podem ser mo-tivos estruturais do polipeptídeo, tais como alfa hélices, folhas beta, ou moti-vos funcionais do polipeptídeo, tais como sítios enzimáticos ativos, motivoshélice-volta-hélice ou outros motivos conhecidos daqueles versados na técnica.

Uma vez que a base de dados de características é aberta noestado 306, o processo 300 passa para um estado 308 em que a primeiracaracterística é lida da base de dados. Uma comparação do atributo da pri-meira característica com a primeira seqüência é então feita num estado 310.Então é determinado em um estado de decisão 316 se atributo da caracte-rística foi encontrado na primeira seqüência. Se o atributo foi encontrado,então o processo 300 passa para um estado 318 em que o nome da caracte-rística encontrada é apresentado ao usuário.

O processo 300 passa então para um estado de decisão 320 emque é determinado se há mais características na base de dados. Se não e-xistirem mais características, então o processo 300 termina em um estadofinal 324. Entretanto, se existirem mais características na base de dados,então o processo 300 lê a próxima característica da seqüência em um esta-do 326 e volta para o estado 310 em que o atributo da próxima característicaé comparado novamente com a primeira seqüência. Deve ser observado,que se o atributo da característica não for encontrado na primeira seqüênciano estado de decisão 316, o processo 300 passa diretamente para o estadode decisão 320 a fim de determinar se existem mais características na basede dados.

Conseqüentemente, outro aspecto da invenção é um método deidentificar uma característica dentro de uma seqüência de ácido nucléico dainvenção e seqüências substancialmente idênticas a ela, ou uma seqüênciade polipeptídeo da invenção e seqüências substancialmente idênticas a ela,compreendendo ler o(s) código(s) de ácido nucléico ou código(s) de polipep-tídeo através do uso de um programa de computador que identifica caracte-rísticas nelas, e identificar características dentro do(s) código(s) do ácidonucléico com o programa de computador. Em um aspecto, o programa decomputador compreende um programa de computador que identifica fasesabertas de leitura. O método pode ser realizado por ler uma única seqüênciaou pelo menos 2, 5, 10, 15, 20, 25, 30, ou 40 das seqüências de ácido nucléi-co da invenção e seqüências substancialmente idênticas a elas, ou das se-qüências de polipeptídeo da invenção e seqüências substancialmente idênti-cas a elas, através do uso do programa de computador e identificar caracte-rísticas dentro dos códigos de ácido nucléico ou códigos de polipeptídeocom o programa de computador.

Uma seqüência de ácido nucléico da invenção e seqüênciassubstancialmente idênticas a ela, ou uma seqüência de polipeptídeo da in-venção e seqüências substancialmente idênticas a ela podem ser armaze-nadas e manipuladas em uma variedade de programas processadores dedados em uma variedade de formatos. Por exemplo, uma seqüência de áci-do nucléico da invenção e seqüências substancialmente idênticas a ela, ouuma seqüência de polipeptídeo da invenção e seqüências substancialmenteidênticas a ela podem ser armazenadas como texto em um arquivo de pro-cessamento de palavras, tal como um arquivo de Microsoft WORD® ouWORDPERFECT® ou como um arquivo ASCII em uma variedade de progra-mas de base de dados familiares daqueles versados na técnica, tais comoDB2®, SYBASE®, ou ORACLE®. Além disso, vários programas e bases de da-dos de computador podem ser usados como algoritmos de comparação deseqüências, identificadores, ou fontes de seqüências de nucleotídeo ou se-qüências de polipeptídeo de referência a ser comparadas a uma seqüência deácido nucléico da invenção e seqüências substancialmente idênticas a ela,ou uma seqüência de polipeptídeo da invenção e seqüências substancial-mente idênticas a ela. A seguinte lista não é pretendida para limitar a inven-ção, mas fornecer sugestões de programas e bases de dados que podemser úteis com as seqüências de ácido nucléico da invenção e seqüênciassubstancialmente idênticas a ela, ou seqüências de polipeptídeo da invençãoe seqüências substancialmente idênticas a ela.

Os programas e bases de dados que podem ser usados incluem,mas não são limitados a: MacPattern (EMBL), DiscoveryBase (Molecular Ap-plications Group), GeneMine (Molecular Applications Group), Look (MolecularApplications Group), MacLook (Molecular Applications Group), BLAST eBLAST2 (NCBI), BLASTN e BLASTX (Altschul et al, J. Mol. Biol. £15: 403,1990), FASTA (Pearson & Lipman, Proc. Natl. Acad. Sei. USA, 85: 2444,1988), FASTDB (Brutlag et al. Comp. App. Biosci. 6:237-245, 1990), Catalyst(Molecular Simulations Inc.), Catalyst/SHAPE (Molecular Simulations Inc.),Cerius2. DBAccess (Molecular Simulations Inc.), HypoGen (Molecular Simulati-ons Inc.), Insight II, (Molecular Simulations Inc.), Discover (Molecular Simulati-ons Inc.), CHARMm (Molecular Simulations Inc.), Felix (Molecular SimulationsInc.), DeIPhi, (Molecular Simulations Inc.), QuanteMM, (Molecular SimulationsInc.), Homology (Molecular Simulations Inc.), Modeler (Molecular SimulationsInc.), ISIS (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Si-mulations Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explo-rer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.),SeqFoId (Molecular Simulations Inc.), a base de dados MDL Available Chemi-cals Directory, a base de dados MDL Drug Data Report, a base de dadosComprehensive Medicinal Chemistry, a base de dados Derwents's World DrugIndex, a base de dados BioByteMasterFiIe, a base de dados Genbank e a ba-se de dados Genseqn. Vários outros programas e bases de dados ficarão cla-ros para o versado na técnica na presente descrição.

Motivos que podem ser detectados usando os programas acimaincluem seqüências que codificam zíperes de leucina, motivos de hélice-volta-hélice, sítios de glicosilação, sítios de ubiquitinação, alfa hélices, e folhas beta,seqüências de sinal que codificam peptídeos de sinal que direcionam a secre-ção das proteínas codificadas, seqüências implicadas na regulação da trans-crição tais como homeoboxes, extensões ácidas, sítios de enzimáticos ativos,sítios de ligação de substrato e sítios de clivagem enzimática.

Hibridizacão de ácidos nucléicos

A invenção fornece ácidos nucléicos isolados, sintéticos ou re-combinantes que hibridizam sob condições estringentes a uma seqüência e-xemplar da invenção. As condições estringentes podem ser altamente estrin-gentes, condições de estringência média e/ou condições de baixa estringência,incluindo as condições de estringência alta e reduzida descritas aqui. Em umaspecto, é a estringência das condições de lavagem que estabelecem as con-dições que determinam se um ácido nucléico está dentro do escopo da inven-ção, como discutido abaixo.

Em aspectos alternativos, ácidos nucléicos da invenção, definidosaqui por sua habilidade de hibridizar sob condições estringentes, podem terentre cinco resíduos e a extensão completa do ácido nucléico da invenção, porexemplo, eles podem ter pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60,65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600,650, 700, 750, 800, 850, 900, 950, 1000, ou mais resíduos de extensão. Áci-dos nucléicos mais curtos do que a extensão completa também estão incluí-dos. Esses ácidos nucléicos podem ser úteis, por exemplo, somo sondas dehibridização, sondas de marcação, sondas de oligonucleotídeos de PCR,iRNA (de fita única ou dupla), seqüências anti-sentido ou que codificam pep-tídeos de ligação de anticorpo (epitopos), motivos, sítios ativos, e semelhantes.

Em um aspecto, ácidos nucléicos da invenção são definidos porsua habilidade de hibridizar sob condições de alta estringência que compre-endem condições de cerca de 50% de formamida a cerca de 37°C a 42°C.

Em um aspecto, ácidos nucléicos da invenção são definidos por sua habili-dade de hibridizar sob condições de estringência reduzida que compreen-dem condições a cerca de 35% a 25% de formamida em cerca de 30°C a 35°C.Alternativamente, ácidos nucléicos da invenção são definidospor sua habilidade de hibridizar sob condições de alta estringência que com-preendem condições a 42°C em 50% de formamida, SSPE 5X, SDS 0,3%, eum ácido nucléico bloqueador de seqüências repetitivas, tal como DNA decot-1 ou de esperma de salmão (por exemplo, 200 n/ml de DNA de espermade salmão fragmentado e desnaturado). Em um aspecto, ácidos nucléicosda invenção são definidos por sua habilidade de hibridizar sob condições deestringência reduzida que compreendem 35% de formamida em uma tempe-ratura reduzida de 35°C.

Em reações de hibridização de ácidos nucléicos, as condiçõesusadas para se obter um nível particular de estringência variarão, depen-dendo da natureza dos ácidos nucléicos que estão sendo hibridizados. Porexemplo, o comprimento, grau de complementaridade, composição da se-qüência de nucleotídeo (por exemplo, conteúdo de GC vs. AT) e tipo de áci-do nucléico (por exemplo, RNA vs. DNA) das regiões de hibridização dosácidos nucléicos podem ser considerados ao selecionar as condições dehibridização. Uma consideração adicional é se um dos ácidos nucléicos estáimobilizado, por exemplo, em um filtro.

A hibridização pode ser executada sob condições de estringên-cia baixa, estringência moderada ou estringência alta. Como um exemplo dehibridização de ácido nucléico, uma membrana polimérica contendo ácidosnucléicos desnaturados imobilizados é primeiro pré-hibridizada por 30 minu-tos a 45°C em uma solução que consiste em NaCI 0,9 M, NaH2PO4 50 mM,pH 7.0, Na2EDTA 5,0 mM, SDS 0,5%, Denhardt 10X e 0,5 mg/ml de ácidopolirriboadenílico. Aproximadamente 2 X 107 cpm (atividade específica de 4a 9 X 108 cpm/ug) de sonda de oligonucleotídeo com a extremidade marca-da com 32P são então adicionados à solução. Após 12 a 16 horas de incuba-ção, a membrana é lavada por 30 minutos em temperatura ambiente emSET 1X (NaCI 150 mM, cloridrato de Tris 20 mM, pH 7.8, Na2EDTA 1 mM)contendo SDS 0,5%, seguido por uma lavagem de 30 minutos em SET 1Xfresco a Tm-IOnC para a sonda de oligonucleotídeo. A membrana é entãoexposta a um filme auto-radiográfico para detecção de sinais de hibridiza-ção.

Todas as hibridizações anteriores serão consideradas como es-tando sob condições de alta estringência.

Após a hibridização, um filtro pode ser lavado para removerqualquer sonda detectável não ligada especificamente. A estringência usadapara lavar os filtros também pode ser alterada dependendo da natureza dosácidos nucléicos sendo hibridizados, do comprimento dos ácidos nucléicossendo hibridizados, do grau de complementaridade, da composição da se-qüência de nucleotídeos (por exemplo, conteúdo de GC vs. AT) e do tipo deácido nucléico (por exemplo, RNA vs. DNA). Exemplos de lavagens em con-dições de estringência progressivamente maiores são como segue: SSC 2X,SDS 0,1% em temperatura ambiente por 15 minutos (estringência baixa); SSC0,1 X, SDS 0,5% em temperatura ambiente por 30 minutos a 1 hora (estringên-cia moderada); SSC 0,1 X, SDS 0,5% por 15 a 30 minutos entre a temperaturade hibridização e 68°C (estringência alta); e NaCI 0,15M por 15 minutos a 72°C(estringência muito alta). Uma lavagem final de baixa estringência pode serconduzida em SSC 0,1 X em temperatura ambiente. Os exemplos acima sãomeramente ilustrativos de um conjunto de condições que podem ser usadaspara lavar filtros. Um versado na técnica saberá que há vários protocolos paralavagens de diferentes estringências. Outros exemplos são dados abaixo.

Ácidos nucléicos que hibridizaram à sonda são identificados porautoradiografia ou outras técnicas convencionais.

O procedimento acima pode ser modificado para identificar ácidosnucléicos que têm níveis decrescentes de homologia à seqüência da sonda.Por exemplo, para obter ácidos nucléicos de níveis decrescentes de homologiaà sonda detectável, condições menos estringentes podem ser usadas. Por e-xemplo, a temperatura de hibridização pode ser reduzida em incrementos de5°C de 68°C a 42°C em um tampão de hibridização que tem uma concentra-ção de Na+ de aproximadamente 1M. Após a hibridização, o filtro pode serlavado com SSC 2X, SDS 0,5% na temperatura de hibridização. Essas condi-ções são consideradas como sendo condições "moderadas" acima de 50°C econdições "baixas" abaixo de 50°C. Um exemplo específico de condições dehibridização "moderadas" é quando a hibridização acima é conduzida a 55°C.

Um exemplo específico de condições de hibridização de "estringência baixa" équando a hibridização acima é conduzida a 45°C.

Alternativamente, a hibridização pode ser executada em tampões,tal como SSC 6X, contendo formamida em uma temperatura de 42°C. Nessecaso, a concentração de formamida no tampão de hibridização pode ser redu-zida em incrementos de 5% de 50% a 0% para identificar clones que têm ní-veis decrescentes de homologia com a sonda. Após a hibridização, o filtro po-de ser lavado com SSC 6X, SDS 0,5% a 50°C. Essas condições são conside-radas como sendo condições "moderadas" acima de 25% de formamida econdições "baixas" abaixo de 25% de formamida. Um exemplo específico decondições de hibridização "moderada" é quando a hibridização acima é condu-zida em 30% de formamida. Um exemplo específico de condições de hibridi-zação de "baixa estringência" é quando a hibridização acima é conduzida em10% de formamida.

Entretanto, a seleção de um formato de hibridização não é crítico- é a estringência das condições de lavagem que estabelecem as condiçõesque determinam se um ácido nucléico está dentro do escopo da invenção.

Condições de lavagem usadas para identificar ácidos nucléicos dentro do es-copo da invenção incluem, por exemplo, uma concentração de sal de cerca de0,02 molar em pH 7 e uma temperatura de pelo menos cerca de 50°C oucerca de 55°C a cerca de 60°C; ou, uma concentração de sal de cerca deNaCI 0,15 M a 72°C por cerca de 15 minutos; ou, uma concentração de salde cerca de SSC 0,2X em uma temperatura de cerca de 50°C ou cerca de55°C e cerca de 60°C por cerca de 15 a cerca de 20 minutos; ou o complexode hibridização é lavado duas vezes com uma solução com uma concentra-ção de sal de cerca de SSC 2X contendo SDS 0,1% em temperatura ambi-ente por 15 minutos e então lavado duas vezes por SSC 0,1 X contendo SDS0,1% a 68-C por 15 minutos; ou, condições equivalentes. Veja, Sambrook,Tijssen e Ausubel para uma descrição de tampão SSC e condições equiva-lentes.

Esses métodos podem ser usados para isolar ácidos nucléicosda invenção. Por exemplo, os métodos anteriores podem ser usados paraisolar ácidos nucléicos que têm uma seqüência com pelo menos cerca de97%, pelo menos 95%, pelo menos 90%, pelo menos 85%, pelo menos80%, pelo menos 75%, pelo menos 70%, pelo menos 65%, pelo menos60%, pelo menos 55%, ou pelo menos 50% de homologia a uma seqüênciade ácido nucléico selecionada a partir do grupo que consiste em uma dasseqüências da invenção e seqüências substancialmente idênticas a ela, oufragmentos que compreendem pelo menos cerca de 10, 15, 20, 25, 30, 35,40, 50, 75, 100, 150, 200, 300, 400, ou 500 bases consecutivas dessa e asseqüências complementares a eles. A homologia pode ser medida usando oalgoritmo de alinhamento. Por exemplo, os polinucleotídeos homólogos podemter uma seqüência codificante que é uma variante alélica de ocorrência naturalde uma das seqüências codificantes descritas aqui. Tais variantes alélicas po-dem ter uma substituição, deleção ou adição de um ou mais nucleotídeosquando comparados com os ácidos nucléicos da invenção ou as seqüênciascomplementares a eles.

Adicionalmente, os procedimentos acima podem ser usados paraisolar ácidos nucléicos que codificam polipeptídeos que têm pelo menos cercade 99%, 95%, pelo menos 90%, pelo menos 85%, pelo menos 80%, pelomenos 75%, pelo menos 70%, pelo menos 65%, pelo menos 60%, pelo me-nos 55%, ou pelo menos 50% de homologia a um polipeptídeo que tem aseqüência de uma das seqüências de aminoácido da invenção, ou fragmen-tos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100,ou 150 aminoácidos consecutivos destas como determinado usando um algo-ritmo de alinhamento de seqüência (por exemplo, tal como o algoritmo FASTAversão 3.0t78 com os parâmetros predefinidos).

Sondas de oliaonucleotídeos e métodos para usar as mesmasA invenção também fornece sondas de ácidos nucléicos quepodem ser usadas, por exemplo, para identificar ácidos nucléicos que codifi-cam um polipeptídeo com uma atividade de xilanase, mananase e/ou glica-nase da invenção ou fragmentos destes ou para identificar genes de xilana-se, mananase e/ou glicanase. Em um aspecto, a sonda compreende pelomenos 10 bases consecutivas de um ácido nucléico da invenção. Alternati-vamente, uma sonda da invenção pode ter pelo menos cerca de 5, 6, 7, 8, 9,10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 30,35, 40, 45,50, 60, 70, 80, 90, 100, 110, 120, 130, 150 ou cerca de 10 a 50, cerca de 20a 60 cerca de 30 a 70, bases consecutivas de uma seqüência descrita emum ácido nucléico da invenção. As sondas identificam um ácido nucléico porligação e/ou hibridização. As sondas podem ser usadas em arranjos da in-venção, veja a discussão abaixo, incluindo, por exemplo, arranjos capilares.

As sondas da invenção também podem ser usadas para isolar outros ácidosnucléicos ou polipeptídeos.

Os ácidos nucléicos isolados da invenção e seqüências subs-tancialmente idênticas a eles, as seqüências complementares a eles, ou umfragmento que compreende pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75,100, 150, 200, 300, 400, ou 500 bases consecutivas de uma das seqüênciasda invenção e seqüências substancialmente idênticas a elas, ou as seqüênciascomplementares a elas, também podem ser usadas como sondas para deter-minar se uma amostra biológica, tal como uma amostra de solo, contém umorganismo que tem uma seqüência de ácido nucléico da invenção ou um or-ganismo a partir do qual o ácido nucléico foi obtido. Em tais procedimentos,uma amostra biológica que carrega potencialmente o organismo a partir doqual o ácido nucléico foi obtido foi isolado é obtida e ácidos nucléicos são obti-dos a partir da amostra. Os ácidos nucléicos são colocados em contato com asonda sob condições que permitem que a sonda hibridize especificamente aqualquer seqüência complementar que esteja presente nela.

Onde necessário, condições que permitem que a sonda hibridizeespecificamente a seqüências complementares podem ser determinadas porcolocar a sonda em contato com seqüências complementares de amostrasconhecidas por conter a seqüência complementar assim como seqüências decontrole que não contêm a seqüência complementar. As condições de hibridi-zação, tal como a concentração de sal do tampão de hibridização, a concen-tração de formamida do tampão de hibridização, ou a temperatura de hibridi-zação, podem ser alterados para identificar condições que permitem que asonda hibridize especificamente a ácidos nucléicos complementares.

Se a amostra contém o organismo a partir do qual o ácido nucléi-co foi isolado, hibridização específica da sonda é então detectada. A hibridiza-ção pode ser detectada por marcar a sonda com um agente detectável tal co-mo um isótopo radioativo, um corante fluorescente ou enzima capaz de catali-sar a formação de um produto detectável.

Vários métodos para usar as sondas marcadas para detectar apresença de ácidos nucléicos complementares em uma amostra são familia-res daqueles versados na técnica. Esses incluem Southern Blots, NorthernBlots, procedimentos de hibridização de colônia e dot blots. Protocolos paracada um desses procedimentos são fornecidos em Ausubel et al. CurrentProtocols in Molecular Bioloqy, John Wiley 503 Sons, Inc. (1997) e Sambrooket al., Molecular Clonina: A Laboratorv Manual 2g Ed., Cold Spring HarborLaboratory Press (1989).

Alternativamente, mais de uma sonda (pelo menos uma das quaisé capaz de hibridizar especificamente a qualquer seqüência complementar queestá presente na amostra de ácido nucléico), pode ser usada em uma reaçãode amplificação para determinar se a amostra contém um organismo contendouma seqüência de ácido nucléico da invenção (por exemplo, um organismo doqual o ácido nucléico foi isolado). Tipicamente, as sondas compreendem oligo-nucleotídeos. Em um aspecto, a reação de amplificação pode compreenderuma reação de PCR. Protocolos de PCR são descritos em Ausubel & Sam-brook, supra. Alternativamente, a reação de amplificação pode compreenderuma reação em cadeia da ligase, 3SR, ou reação de deslocamento de fita(veja, Barany, F., 'The Ligase Chain Reaction in a PCR World", PCR Methodsand Applications 1:5-16, 1991; Ε. Fahy et ai, "Self-sustained Sequence Repli-cation (3SR): An Isothermal Transcription-based Amplification System Alterna-tive to PCR", PCR Methods and Applications 1:25-33, 1991; e Walker G.T. etai, "Strand Displaeement Amplifieation-an Isothermal in vitro DNA AmplifieationTechnique", Nucleic Acid Research 20:1691 -1696, 1992). Em tais procedimen-tos, os ácidos nucléicos na amostra são colocados em contato com as sondas,a reação de amplificação é realizada e qualquer produto de amplificação resul-tante é detectado. O produto de amplificação pode ser detectado por realizareletroforese em gel dos produtos da reação e corar o gel com um intercalantetal como brometo de etídio. Alternativamente, uma ou mais das sondas podemser marcadas com um isótopo radioativo e a presença de um produto de ampli-ficação radioativo pode ser detectada por autoradiografia após eletroforese em gel.

Sondas derivadas de seqüências próximas das extremidades dasseqüências da invenção e seqüências substancialmente idênticas a elas, tam-bém podem ser usadas em procedimentos de caminhada cromossômica paraidentificar clones que contêm seqüências genômicas localizadas adjacentes àsseqüências da invenção e seqüências substancialmente idênticas a elas. Taismétodos permitem o isolamento de genes que codificam proteínas adicionaisdo organismo hospedeiro.

Os ácidos nucléicos isolados da invenção e seqüências substan-cialmente idênticas a eles, e seqüências complementares a eles, ou um frag-mento que compreende pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100,150, 200, 300, 400, ou 500 bases consecutivas de uma das seqüências dainvenção e seqüências substancialmente idênticas a elas, ou as seqüênciascomplementares a elas podem ser usados como sondas para identificar eisolar ácidos nucléicos relacionados. Em alguns aspectos, os ácidos nucléi-cos relacionados podem ser cDNAs ou DNAs genômicos de organismos di-ferentes daquele a partir do qual o ácido nucléico foi isolado. Por exemplo,os outros organismos podem ser organismos relacionados. Em tais procedi-mentos, uma amostra de ácido nucléico é colocada em contato com a sondasob condições que permitem que a sonda hibridize especificamente a se-qüências relacionadas. A hibridização da sonda aos ácidos nucléicos do or-ganismo relacionado é então detectada usando qualquer um dos métodosdescritos acima.

Por variar a estringência das condições de hibridização usadaspara identificar ácidos nucléicos, tais como cDNAs ou DNAs genômicos, quehibridizam à sonda detectável, ácidos nucléicos que têm níveis diferentes dehomologia com a sonda podem ser identificados e isolados. A estringênciapode ser alterada por conduzir a hibridização em temperaturas variadas a-baixo das temperaturas de fusão das sondas. A temperatura de fusão, Tm, éa temperatura (sob força iônica e pH definidos) na qual 50% da seqüência alvohibridiza a uma sonda perfeitamente complementar. Condições muito estrin-gentes são selecionadas para serem iguais a, ou cerca de 5°C mais baixasque, a Tm para uma sonda particular. A temperatura de fusão da sonda podeser calculada usando as seguintes fórmulas:

Para sondas entre 14 e 70 nuçleotídeos de extensão a temperatu-ra de fusão (Tm) é calculada usando a fórmula: Tm= 81,5 + 16,6(log [Na+]) +0,41 (fração de G+C)-(600/N) onde N é o comprimento da sonda.

Se a hibridização for realizada em uma solução contendo forma-mida, a temperatura de fusão pode ser calculada usando a equação: Tm= 81,5+ 16,6(log [Na+]) + 0,41 (fração de G+C)-(0,63% formamida)-(600/N) onde N é

o comprimento da sonda.

Pré-hibridização pode ser executada em SSC 6X, reagente deDenhardt 5X, SDS 0,5%, 100Dg de DNA de esperma de salmão fragmentadoe desnaturado, ou SSC 6X, reagente de Denhardt 5X, SDS 0,5%, 100Dg deDNA de esperma de salmão fragmentado e desnaturado, 50% de formamida.As fórmulas para as soluções SSC e Denhardt estão listadas em Sambrook etai, supra.

A hibridização é conduzida por adicionar a sonda detectável àssoluções de pré-hibridização listadas acima.Quando a sonda compreender DNA de fita dupla, ele é desnatu-rado antes da adição à solução de hibridização. O filtro é colocado em contatocom a solução de hibridização por um período de tempo suficiente para permi-tir que sonda hibridize a cDNAs ou DNAs genômicos contendo seqüênciascomplementares a ela ou homólogas a ela. Para sondas com mais de 200 nu-cleotídeos de extensão, a hibridização pode ser executada 15-25DC abaixo daTm. Para sondas mais curtas, tais como sondas de oligonucleotídeos, a hibridi-zação pode ser conduzida 5-10°C abaixo da Tm. Tipicamente, Para hibridiza-ções em SSC 6X, a hibridização é conduzida a aproximadamente 68°C. Ge-ralmente, para hibridizações em soluções contendo 50% de formamida, a hi-bridização é conduzida a aproximadamente 42°C.

Inibindo a expressão de alicosil hidrolases

A invenção fornece ácidos nucléicos complementares a (por e-xemplo, seqüências anti-sentido para) os ácidos nucléicos da invenção, porexemplo, ácidos nucléicos que codificam xilanase e/ou glicanase. Seqüênciasanti-sentido são capazes de inibir o transporte, splicing ou transcrição genesque codificam xilanase e/ou glicanase. A inibição pode ser feita por atingir oDNA genômico ou RNA mensageiro. A transcrição ou a função do ácido nu-cléico atingido pode ser inibida, por exemplo, por hibridização ou clivagem. Umconjunto particularmente útil de inibidores fornecido pela presente invençãoinclui oligonucleotídeos que são capazes de se ligar ao gene ou mensagem dexilanase, mananase e/ou glicanase, em um ou outro caso, impedindo ou ini-bindo a produção ou função da uma xilanase, mananase e/ou glicanase. Aassociação pode ser através de hibridização específica da seqüência. Outraclasse útil de inibidores inclui oligonucleotídeos que causam a inativação ouclivagem da mensagem de xilanase, mananase e/ou glicanase. O oligonucleo-tídeo pode ter atividade enzimática que causa tal clivagem, tais como ribozi-mas. O oligonucleotídeo pode ser modificado quimicamente ou conjugado auma enzima ou composição capaz de clivar o ácido nucléico complementar.

Um grupo de vários desses oligonucleotídeos diferentes pode ser rastreadopor aqueles com a atividade desejada. Dessa forma, a invenção fornece váriascomposições para a inibição da expressão de xilanase, mananase e/ou glica-nase no nível de ácido nucléico ou de proteína, por exemplo, anti-sentido, iR-NA e ribozimas que compreendem seqüências de xilanase, mananase e/ouglicanase da invenção e os anticorpos antixilanase, antimananase e/ou antigli-canase da invenção.

A inibição da expressão de xilanase, mananase e/ou glicanasepode ter uma variedade de aplicações e processos industriais, médicos, far-macêuticos, de pesquisa, alimentos e ração, e processamento de suplementosalimentares, e outros. Por exemplo, a inibição da expressão de uma xilanase,mananase e/ou glicanase pode reduzir ou evitar decomposição. A decomposi-ção pode ocorrer quando polissacarídeos, por exemplo, polissacarídeos estru-turais, são degradados enzimaticamente. Isso pode levar à deterioração, oupodridão, de frutas e vegetais. Em um aspecto, o uso de composições da in-venção que inibem a expressão e/ou atividade de xilanases e/ou glicanases,por exemplo, anticorpos, oligonucleotídeos anti-sentido, ribozimas e RNAi, sãousados para reduzir ou evitar decomposição. Dessa forma, em um aspecto, ainvenção fornece métodos e composições que compreendem a aplicação so-bre uma planta ou produto da planta (por exemplo, um cereal, um grão, umfruto, uma semente, raiz, folha, etc.) anticorpos, oligonucleotídeos anti-sentido,ribozimas e RNAi da invenção para reduzir ou evitar a decomposição. Essascomposições também podem ser expressas pela planta (por exemplo, umaplanta transgênica) ou outro organismo (por exemplo, uma bactéria ou outromicroorganismo transformado com um gene de xilanase, mananase e/ou gli-canase da invenção).

As composições da invenção para inibição da expressão de umaxilanase, mananase e/ou glicanase (por exemplo, anti-sentido, iRNA, ribozi-mas, anticorpos) podem ser usadas como composições farmacêuticas, porexemplo, como agentes antipatógenos ou em outras terapias, por exemplo,como antimicrobianos para, por exemplo, Salmonella.

Oligonucleotídeos anti-sentidoA invenção fornece oligonucleotídeos anti-sentido capazes de seligar a uma mensagem de xilanase, mananase e/ou glicanase, o que podeinibir a atividade de xilano hidrolase (por exemplo, catalisar hidrólise de liga-ções β-1,4-xilosídicas internas) por atingir o mRNA. Estratégias para dese-nhar oligonucleotídeos anti-sentido são bem descritas na literatura científicae de patente, e o versado na técnica pode desenhar tais oligonucleotídeosde xilanase, mananase e/ou glicanase usando os novos reagentes da inven-ção. Por exemplo, protocolos de gene walking /mapeamento de RNA para ras-trear por oligonucleotídeos anti-sentido eficazes são bem-conhecidos na técni-ca, veja, por exemplo, Ho (2000) Methods Enzymol. 314:168-183, que des-creve um ensaio de mapeamento de RNA, que se baseia em técnicas mole-culares tradicionais para fornecer um método fácil e seguro para potente se-leção de seqüência anti-sentido. Veja também, Smith (2000) Eur. J. Pharm.Sei. 11:191-198.

Ácidos nucléicos de ocorrência natural são usados como oligo-nucleotídeos anti-sentido. Os oligonucleotídeos anti-sentido podem ser dequalquer comprimento; por exemplo, em aspectos alternativos, os oligonu-cleotídeos anti-sentido tem entre cerca de 5 a 100, cerca de 10 a 80, cercade 15 a 60, cerca de 18 a 40. O comprimento ótimo pode ser determinadopor rastreamento de rotina. Os oligonucleotídeos anti-sentido podem estarpresentes em qualquer concentração. A concentração ótima pode ser de-terminada por rastreamento de rotina. Uma grande variedade de análogosde ácido nucléico e nucleotídeo sintéticos, que não ocorrem naturalmente,são conhecidos, os quais podem dirigir-se a esse potencial problema. Porexemplo, ácidos peptídeo nucléicos (PNA) contendo arcabouços não-iônicos, tais como unidades de N-(2-aminoetil) glicina podem ser usados.Oligonucleotídeos anti-sentido que tem ligações de fosforotioato tambémpodem ser usados, como descrito nos WO 97/03211; WO 96/39154; Mata(1997) Toxicol Appl Pharmacol 144:189-197; Antisense Therapeutics, ed.Agrawal (Humana Press, Totowa, N.J., 1996). Oligonucleotídeos anti-sentidoque têm análogos da cadeia principal de DNA sintético fornecidos pela in-venção podem incluir também ácidos nucléicos de fosforo-ditioato, metilfos-fonato, fosforamidato, alquil fosfotriéster, sulfamato, 3'-tioacetal, metile-no(metilimino), 3'-N-carbamato, e morfolino carbamato, como descrito acima.

Metodologia de química combinatória pode ser usada para criarvastos números de oligonucleotídeos que podem ser rastreados rapidamen-te por oligonucleotídeos específicos que têm afinidades de ligação apropria-das e especificidades frente a qualquer alvo, tais como as seqüências dexilanase, mananase e/ou glicanase anti-sentido da invenção (veja, por e-xemplo, Gold (1995) J. of Biol. Chem. 270:13581-13584).

Ribozimas inibitórias

A invenção fornece ribozimas capazes de se ligar a uma men-sagem de xilanase, mananase e/ou glicanase. Essas ribozimas podem inibira atividade de xilanase, mananase e/ou glicanase, por exemplo, por atingir omRNA. Estratégias para desenhar ribozimas e selecionar a seqüência anti-sentido específica de xilanase, de mananase e/ou de glicanase para direcio-namento estão bem descritas na literatura científica e de patente, e o versa-do na técnica pode desenhar tais ribozimas usando os novos reagentes dainvenção. Ribozimas agem por se ligar a um RNA alvo através da porção deligação do RNA alvo de uma ribozima que é mantida em proximidade a umaporção enzimática do RNA que cliva o RNA alvo. Dessa forma, a ribozimareconhece e se liga a um RNA alvo através de pareamento de bases com-plementares, e uma vez ligadas ao local correto, age enzimaticamente paraclivar e inativar o RNA alvo. A clivagem de um RNA alvo de tal maneira des-truirá sua habilidade de direcionar a síntese de uma proteína codificada se aclivagem ocorrer na seqüência codificante. Após uma ribozima ter se ligadoe clivado seu RNA alvo, ele pode ser liberado daquele RNA para se ligar eclivar novos alvos repetidamente.

Em alguns casos, a natureza enzimática de uma ribozima podeser vantajosa sobre outras tecnologias, tal como a tecnologia anti-sentido(onde uma molécula de ácido nucléico simplesmente se liga a um alvo deácido nucléico para bloquear sua transcrição, tradução ou associação comoutra molécula) já que a concentração eficaz de uma ribozima necessáriapara realizar um tratamento terapêutico pode ser menor do que aquela deum oligonucleotídeo anti-sentido. Essa potencial vantagem reflete a habili-dade da ribozima agir enzimaticamente. Dessa forma, uma única moléculade ribozima é capaz de clivar muitas moléculas de RNA alvo. Além disso,uma ribozima é tipicamente um inibidor altamente específico, com a especi-ficidade de inibição dependendo não apenas do mecanismo de ligação porpareamento de bases, mas também do mecanismo pelo qual a moléculainibe a expressão do RNA ao qual ela se liga. Isto é, a inibição é causadapor clivagem do RNA alvo e assim a especificidade é definida como a razãoda taxa de clivagem do RNA alvo sobre a taxa de clivagem de RNA não-alvo. Esse mecanismo de clivagem depende de fatores adicionais àquelesenvolvidos no pareamento de bases. Dessa forma, a especificidade de açãode uma ribozima pode ser maior do que aquela de ligação de oligonucleotí-deo anti-sentido ao mesmo sítio de ligação de RNA.

A ribozima da invenção, por exemplo, uma molécula de RNAribozima enzimática pode ser formada em um motivo de cabeça de martelo,um motivo em forma de grampo, um motivo de vírus da hepatite delta, ummotivo do íntron do grupo I e/ou um RNA semelhante a RNaseP em associ-ação com uma seqüência guia de RNA. Exemplos de motivos de cabeça demartelo são descritos, por exemplo, por Rossi (1992) Aids Research andHuman Retroviruses 8:183; motivos em forma de grampo por Hampel (1989)Biochemistry 28:4929, e Hampel (1990) Nuc. Acids Res. 18:299; o motivo dovírus da hepatite delta por Perrotta (1992) Biochemistry 31:16; o motivo daRNaseP por Guerrier-Takada (1983) Cell 35:849; e o íntron do grupo I porCech Patente U.S. N°. 4.987.071. A recitação desses motivos específicosnão é pretendida para ser limitante. Aqueles versados na técnica reconhece-rão que uma ribozima da invenção, por exemplo, uma molécula de RNA en-zimática dessa invenção pode ter um sítio de ligação de substrato específicocomplementar a uma ou mais das regiões de RNA do gene alvo. Uma ribo-zima da invenção pode ter uma seqüência de nucleotídeo dentro ou circun-dando este sítio de ligação do substrato que confere uma atividade de cliva-gem de RNA à molécula.

Interferência de RNA (RNAi)

Em um aspecto, a invenção fornece uma molécula inibidora de5 RNA, assim chamada molécula de "RNAi", que compreende uma seqüênciada enzima xilanase, mananase e/ou glicanase da invenção. A molécula deRNAi pode compreender uma molécula de RNA de fita dupla (dsRNA), porexemplo, siRNA, rniRNA e/ou pequenas moléculas de RNA em forma degrampo (shRNA). A molécula de RNAi, por exemplo, siRNA (pequeno RNAinibidor) pode inibir a expressão de um gene de enzima xilanase, mananasee/ou glicanase, e/ou miRNA (micro RNA) pode inibir a tradução de umamensagem de xilanase, mananase e/ou glicanase. Em um aspecto, a molé-cula de RNAi, por exemplo, siRNA e/ou miRNA, tem cerca de 11, 12, 13, 14,15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 ou mais nucleotídeosde dúplex de extensão. Embora a invenção não seja limitada a nenhum me-canismo de ação em particular, o RNAi pode entrar em uma célula, e causara degradação de um RNA fita única (ssRNA) de seqüências similares ouidênticas, incluindo mRNAs endógenos. Quando uma célula é exposta aRNA de fita dupla (dsRNA), o mRNA do gene homólogo é seletivamente de-gradado por um processo chamado interferência de RNA (RNAi). Um meca-nismo básico possível por trás de RNAi é a quebra de um RNA de fita dupla(dsRNA) que pareia com uma seqüência gênica específica em pequenospedaços chamados pequenos RNAs de interferência, que disparam a degra-dação de mRNA que pareia com sua seqüência. Em um aspecto, os RNAi'sda invenção são usados em terapias de silenciamento gênico, veja por e-xemplo, Shuey (2002) Drug Discov. Today 7:1040-1046. Em um aspecto, ainvenção fornece métodos para degradar seletivamente RNA usando as mo-léculas de RNAi, por exemplo, siRNA e/ou miRNA, da invenção. O processopode ser praticado in vitro, ex vivo ou in vivo. Em um aspecto, as moléculasde RNAi da invenção podem ser usadas para gerar uma mutação de perdade função em uma célula, um órgão ou um animal.Em um aspecto, a introdução intracelular do RNAi é por interna-lização de um ligante específico da célula alvo ligado a uma proteína de liga-ção de RNA que compreende um RNAi (por exemplo, microRNA) adsorvido.O ligante é específico para um único antígeno da superfície da célula alvo. Oligante pode ser internalizado espontaneamente após a ligação ao antígenoda superfície da célula. Se o único antígeno da superfície da célula alvo nãofor naturalmente internalizado após ligação ao seu ligante, a internalizaçãopode ser promovida pela incorporação de um peptídeo rico em arginina, ououtro peptídeo permeável à membrana, na estrutura do ligante ou proteínade ligação de RNA ou ligação de tal peptídeo ao ligante ou proteína de Iiga-ção de RNA. Veja, por exemplo, Publicações de Pedido de Patente U.S. Nos.20060030003; 20060025361; 20060019286; 20060019258. Em um aspecto,a invenção fornece formulações à base de lipídios para liberar, por exemplo,introduzir ácidos nucléicos da invenção como partículas de ácido nucléico-lipídio que compreendem uma molécula de RNAi a uma célula, por exemplo,veja, Publicação de Pedido de Patente U.S. 20060008910.

Métodos para fazer e usar moléculas de RNAi, por exemplo,siRNA e/ou miRNA, para degradar seletivamente RNA são bem-conhecidosna técnica, veja, por exemplo, Patente U.S. N°. 6.506.559; 6.511.824;6.515.109; 6.489.127.

Modificação de ácidos nucléicos

A invenção fornece métodos de gerar variantes dos ácidos nu-cléicos da invenção, por exemplo, aqueles que codificam uma xilanase, ma-nanase e/ou glicanase. Esses métodos podem ser repetidos ou usados emvárias combinações para gerar xilanases e/ou glicanases que têm atividadediferente ou alterada ou estabilidade diferente daquela de uma xilanase, ma-nanase e/ou glicanase codificada pelo ácido nucléico molde. Esses métodostambém podem ser repetidos ou usados em várias combinações, por exem-plo, para gerar variações na expressão de gene/mensagem, tradução demensagem ou estabilidade de mensagem. Em outro aspecto, a composiçãogenética de uma célula é alterada, por exemplo, pela modificação de um ge-ne homólogo ex vivo, seguida por sua reinserção na célula.

Um ácido nucléico da invenção pode ser alterado por qualquermeio. Por exemplo, métodos aleatórios ou estocásticos, ou métodos não-estocásticos ou de "evolução dirigida", veja, por exemplo, Patente U.S. N°.6.361.974. Métodos para mutação aleatória de genes são bem-conhecidosna técnica, veja, por exemplo, Patente U.S. N°. 5.830.696. Por exemplo, mu-tágenos podem ser usados para mutar aleatoriamente um gene. Mutágenosincluem, por exemplo, luz ultravioleta ou irradiação gama, ou um agente mu-tagênico químico, por exemplo, mitomicina, ácido nitroso, psoralenos fotoati-vados, sozinhos ou em combinação, para induzir quebras no DNA suscetí-veis a reparo por recombinação. Outros mutágenos químicos incluem, porexemplo, bissulfito de sódio, ácido nitroso, hidrozilamina, hidrazina ou ácidofórmico. Outros mutágenos são análogos de precursores de nucleotídeo, porexemplo, nitrosoguanidina, 5-bromouracila, 2-aminopurina, ou acridina. Es-ses agentes podem ser adicionados a uma reação de PCR no lugar do pre-cursor de nucleotídeo mutando assim a seqüência. Agentes intercalantestais como proflavina, acriflavina, quinacrina e semelhantes também podemser usados.

Qualquer técnica em biologia molecular pode ser usada, por e-xemplo, mutagênese aleatória por PCR1 veja, por exemplo, Rice (1992)Proc. Natl. Acad. Sei. USA 89:5467-5471; ou, mutagênese combinatória decassete múltiplo, veja, por exemplo, Crameri (1995) Biotechniques 18:194-196. Alternativamente, ácidos nucléicos, por exemplo, genes, podem serreagrupados após fragmentação aleatória, ou "estocástica", veja, por exem-plo, Patente U.S. Nos. 6.291.242; 6.287.862; 6.287.861; 5.955.358;5.830.721; 5.824.514; 5.811.238; 5.605.793. Em aspectos alternativos, modi-ficações, adições ou deleções são introduzidas por "error-prone" PCR, em-baralhamento, mutagênese sítio-direcionada, "assembly" PCR, mutagênesepor PCR sexual, mutagênese in vivo, mutagênese de cassete, mutagênesede agrupamentos repetitivos, mutagênese de agrupamento exponencial, mu-tagênese sítio-específica, reagrupamento de genes (por exemplo, GeneRe-assembly, veja, por exemplo, Patente U.S. N°. 6.537.776), Mutagênese porSaturação do Sítio do Gene (GSSM), reagrupamento por ligação sintética(SLR), recombinação, recombinação de seqüência repetitiva, mutagênesede DNA modificado por fosfotioato, mutagênese de molde contendo uracila,mutagênese de dúplex interrompido, mutagênese de reparo de mal-pareamentos pontuais, mutagênese por cepas do hospedeiro deficientes emreparo, mutagênese química, mutagênese radiogênica, mutagênese por de-leção, mutagênese por seleção de restrição, mutagênese por purificação derestrição, síntese de gene artificial, mutagênese de agrupamentos, criaçãode multímero de ácido nucléico quimérico e/ou uma combinações desses eoutros métodos.

As seguintes publicações descrevem uma variedade deprocedimentos de recombinação repetitiva e/ou métodos que podem serincorporados nos métodos da invenção: Stemmer (1999) "Molecularbreeding of viruses for targeting and other clinicai properties" TumorTargeting 4:1-4; Ness (1999) Nature Biotechnology 17:893-896; Chang(1999) "Evolution of a cytokine using DNA family shuffling" NatureBiotechnology 17:793-797; Minshull (1999) "Protein evolution by molecularbreeding" Current Opinion in Chemical Biology 3:284-290; Christians (1999)"Directed evolution of thymidine kinase for AZT phosphorylation using DNAfamily shuffling" Nature Biotechnology 17:259-264; Crameri (1998) "DNAshuffling of a family of genes from diverse species accelerates directedevolution" Nature 391:288-291; Crameri (1997) "Molecular evolution of anarsenate detoxification pathway by DNA shuffling," Nature Biotechnology15:436-438; Zhang (1997) "Directed evolution of an effective fucosidase froma galactosidase by DNA shuffling and screening" Proc. Natl. Acad. Sei. USA94:4504-4509; Patten et al. (1997) "Applications of DNA Shuffling toPharmaceuticals and Vaccines" Current Opinion in Biotechnology 8:724-733;Crameri et al. (1996) "Construction and evolution of antibody-phage Iibrariesby DNA shuffling" Nature Medicine 2:100-103; Gates et al. (1996) "Affinityselective isolation of Iigands from peptide Iibraries through display on a Iacrepressor ^headpiece dimerM1 Journal of Molecular Biology 255:373-386;Stemmer (1996) "Sexual PCR and Assembly PCR" In: The Encyclopedia ofMolecular Biology. VCH Publishers1 Nova Iorque, pp.447-457; Crameri &Stemmer (1995) "Combinatorial multiple cassette mutagenesis creates ali thepermutations of mutant and wildtype cassettes" BioTeehniques 18:194-195;Stemmer et al. (1995) "Single-step assembly of a gene and entire plasmidform Iarge numbers of oligodeoxyribonucleotides" Gene, 164:49-53;Stemmer (1995) "The Evolution of Molecular Computation" Science 270:1510; Stemmer (1995) "Searching Sequence Space" Bio/Technology 13:549-553; Stemmer (1994) "Rapid evolution of a protein in vitro by DNA shuffling"Nature 370:389-391; e Stemmer (1994) "DNA shuffling by randomfragmentation and reassembly: In vitro recombination for molecularevolution." Proc. Natl. Acad. Sei. USA 91:10747-10751.

Métodos mutacionais de gerar diversidade incluem, por exem-plo, mutagênese sítio-direcionada (Ling et al. (1997) " Approaches to DNAmutagenesis: an overview" Anal Biochem. 254(2): 157-178; Dale et al.(1996) "Oligonucleotide-directed random mutagenesis using thephosphorothioate method" Methods Mol. Biol. 57:369-374; Smith (1985) "Invitro mutagenesis" Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1985)"Strategies and applications of in vitro mutagenesis" Science 229:1193-1201;Carter (1986) "Site-directed mutagenesis" Biochem. J. 237:1-7; e Kunkel(1987) "The efficiency of oligonucleotide directed mutagenesis" em NucleicAcids & Molecular Biology (Eckstein, F. & Lilley, D. M. J. eds., SpringerVerlag, Berlim)); mutagênese usando moldes contendo uracila (Kunkel(1985) "Rapid and efficient site-specific mutagenesis without phenotypicselection" Proc. Natl. Acad. Sei. USA 82:488-492; Kunkel et al. (1987) "Rapidand efficient site-specific mutagenesis without phenotypic selection" Methodsin Enzymol. 154, 367-382; e Bass et al. (1988) "Mutant Trp repressors withnew DNA-binding specificities" Science 242:240-245); mutagênese dirigidapor oligonucleotídeo (Methods in Enzymol. 100: 468-500 (1983); Methods inEnzymol. 154: 329-350 (1987); Zoller (1982) "Oligonucleotide-directed muta-genesis using M13-derived vectors: an efficient and general procedure forthe production of point mutations in any DNA fragment" Nucleic Acids Res.10:6487-6500; Zoller & Smith (1983) Oligonucleotide-directed mutagenesisof DNA fragments cloned into M13 vectors" Methods in Enzymol. 100:468-500; e Zoller (1987) Oligonucleotide-directed mutagenesis: a simple methodusing two oligonucleotide primers and a single-stranded DNA tèmplate" Me-thods in Enzymol. 154:329-350); mutagênese de DNA modificado por fosfo-rotioato (Taylor (1985) "The use of phosphorothioate-modified DNA in restric-tion enzyme reactions to prepare nicked DNA" Nucl. Acids Res. 13: 8749-8764; Taylor (1985) "The rapid generation of oligonucleotide-directed mutati-ons at high frequency using phosphorothioate-modified DNA" Nucl. AcidsRes. 13: 8765-8787 (1985); Nakamaye (1986) "Inhibition of restriction endo-nuclease Nci I cleavage by phosphorothioate groups and its application tooligonucleotide-directed mutagenesis" Nucl. Acids Res. 14: 9679-9698; Sa-yers (1988) "Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis" Nucl. Acids Res. 16:791-802; e Sayers et al. (1988)"Strand specific cleavage of phosphorothioate-containing DNA by reactionwith restriction endonucleases in the presence of ethidium bromide" Nucl.Acids Res. 16: 803-814); mutagênese usando DNA com dúplex interrompido(Kramer et al. (1984) "The gapped dúplex DNA approach to oligonucleotide-directed mutation construction" Nucl. Acids Res. 12: 9441-9456; Kramer &Fritz (1987) Methods in Enzymol. "Oligonucleotide-directed construction ofmutations via gapped dúplex DNA" 154:350-367; Kramer (1988) "Improvedenzymatic in vitro reactions in the gapped dúplex DNA approach to oligonu-cleotide-directed construction of mutations" Nucl. Acids Res. 16: 7207; e Fritz(1988) "Oligonucleotide-directed construction of mutations: a gapped dúplexDNA procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16:6987-6999).

Protocolos adicionais que podem ser usados para praticar a in-venção incluem reparo de mal-pareamento pontual (Kramer (1984) "PointMismatch Repair" Cell 38:879-887), mutagênese usando cepas de hospedei-ro deficientes em reparo (Carter et al. (1985) "Improved oligonucleotide site-directed mutagenesis using M13 vectors" Nucl. Acids Res. 13: 4431-4443; eCarter (1987) "Improved oligonucleotide-directed mutagenesis using M13vectors" Methods in Enzymol. 154: 382-403), mutagênese por deleção (Egh-tedarzadeh (1986) "Use of oligonucleotides to generatè Iarge deletions" Nucl.Acids Res. 14: 5115), seleção de restrição e seleção de restrição e purifica-ção de restrição (Wells et al. (1986) "Importance of hydrogen-bond formationin stabilizing the transition state of subtilisin" Phil. Trans. R. Soe. Lond. A317: 415-423), mutagênese por síntese total do gene (Nambiar et al. (1984)"Total synthesis and cloning of a gene coding for the ribonuclease S protein"Science 223: 1299-1301; Sakamar & Khorana (1988) "Total synthesis andexpression of a gene for the a-subunit of bovine rod outer segment guaninenucleotide-binding protein (transducin)" Nucl. Acids Res. 14: 6361-6372;Wells et al. (1985) "Cassette mutagenesis: an efficient method for generationof multiple mutations at defined sites" Gene 34:315-323; e Grundstrom et al.(1985) "Oligonucleotide-directed mutagenesis by microscale ^shot-gun genesynthesis" Nucl. Acids Res. 13: 3305-3316), reparo de quebra de fita dupla(Mandecki (1986); Arnold (1993) "Protein engineering for unusual environ-ments" Current Opinion in Biotechnology 4:450-455. "Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a methodfor site-specific mutagenesis" Proc. Natl. Acad. Sei. USA, 83:7177-7181).Detalhes adicionais sobre vários dos métodos acima podem ser encontradosno Volume 154 de Enzymology1 que também descreve controles úteis paraidentificação e solução de com vários métodos de mutagênese.

Protocolos que podem ser usados para praticar a invenção sãodescritos, por exemplo, nas Patentes U.S. Nos. 5.605.793 para Stemmer(Feb. 25, 1997), "Methods for In Vitro Recombination;" Patente U.S. N°.5.811.238 to Stemmer et al. (Sep. 22, 1998) "Methods for Generating Poly-nucleotides having Desired Characteristics by Iterative Selection and Re-combination;" Patente U.S. N°. 5.830.721 para Stemmer et al. (Nov. 3,1998), "DNA Mutagenesis by Random Fragmentation and Reassembly;" Pa-tente U.S. N°. 5.834.252 para Stemmer, et al. (Nov. 10, 1998) "End-Complementary Polymerase Reaction;" Patente U.S. N°. 5.837.458 paraMinshull, et al. (17 Nov., 1998), "Methods and Compositions for CellularandMetabolic Engineering;" WO 95/22625, Stemmer & Crameri, "Mutagenesisby Random Fragmentation and Reassembly;" WO 96/33207 por Stemmer &Lipsehutz "End Complementary Polymerase Chain Reaetion;" WO 97/20078por Stemmer & Crameri "Methods for Generating Polynucleotides havingDesired Charaeteristies by Iterative Seleetion and Reeombination;" WO97/35966 por Minshull & Stemmer, "Methods and Compositions for Cellularand Metabolie Engineering;" WO 99/41402 por Punnonen etal. "Targeting ofGenetie Vaeeine Veetors;" WO 99/41383 por Punnonen et al. "Antigen Li-brary Immunization;" WO 99/41369 by Punnonen et al. "Genetic VaeeineVeetor Engineering;" WO 99/41368 por Punnonen etal. "Optimization of Im-munomodulatory Properties of Genetic Vaeeines;" EP 752008 por Stemmerand Crameri, "DNA Mutagenesis by Random Fragmentation and Reassem-bly;" EP 0932670 por Stemmer "Evolving Cellular DNA Uptáke by ReeursiveSequenee Reeombination;" WO 99/23107 por Stemmer etal., "Modificationof Virus Tropism and Host Range by Viral Genome Shuffling;" WO 99/21979por Apt et al.," Human Papillomavirus Veetors;" WO 98/31837 por dei Carda-yre et al. "Evolution of Whole Cells and Organisms by Reeursive SequeneeReeombination;" WO 98/27230 por Patten & Stemmer, "Methods and Com-positions for Polypeptide Engineering;" WO 98/27230 por Stemmer et al.,"Methods for Optimization of Gene Therapy by Reeursive Sequenee Shuf-fling and Selection," WO 00/00632, "Methods for Generating Highly DiverseLibraries," WO 00/09679, "Methods for Obtaining in Vitro Reeombined Poly-nucleotide Sequenee Banks and Resulting Sequences," WO 98/42832 porArnold etal.,"Reeombination of Polynucleotide Sequences Using Random orDefined Primers," WO 99/29902 por Arnold et al., "Method for Creating Poly-nucleotide and Polypeptide Sequences," WO 98/41653 por Vind, "An in VitroMethod for Construction of a DNA Library," WO 98/41622 por Borehert et al.,"Method for Constructing a Library Using DNA Shuffling," e WO 98/42727 porPati & Zarling, "Sequence Alterations using Homologous Recombination."

Protocolos que podem ser usados para praticar a invenção (for-necendo detalhes com relação a vários métodos de geração de diversidade)são descritos, por exemplo, no pedido de Patente U.S. N0. de série (USSN)09/407.800, "SHUFFLING OF CODON ALTERED GENES" por Patten et al.depositado em 28 de setembro de 1999; "EVOLUTION OF WHOLE CELLSAND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION" pordei Cardayre et al., Patente dos Estados Unidos No. 6.379.964; "OLIGONU-CLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION" por Crameri etal., Patentes dos Estados Unidos Nos. 6.319.714; 6.368.861; 6.376.246;6.423.542; 6.426.224 e PCT/US00/01203; "USE OF CODON-VARIED OLI-GONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING" por Welchet al., Patente dos Estados Unidos No. 6.436.675; "METHODS FOR MA-KING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDESHAVING DESIRED CHARACTERISTICS" por Selifonov et al., depositadoem 18 de janeiro de 2000, (PCT/USOO/01202) e, por exemplo, "METHODSFOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLY-PEPTIDES HAVING DESIRED CHARACTERISTICS" por Selifonov et al.,depositado em 18 de julho de 2000 (U.S. No. Ser. 09/618.579); "METHODSOF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARYSIMULATIONS" por Selifonov & Stemmer, depositado em 18 de janeiro de2000 (PCT/US00/01138); e "SINGLE-STRANDED NUCLEIC ACID TEM-PLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENTISOLATION" por Affholter, depositado em 6 de setembro de 2000 (U.S. No.Ser. 09/656.549); e Patentes dos Estados Unidos Nos. 6.177.263;6.153.410.

Métodos não-estocásticos, ou de "evolução dirigida" incluem,por exemplo, mutagênese de saturação (GSSM), reagrupamento de ligaçãosintética (SLR), ou uma combinação desses e são usados para modificar osácidos nucléicos da invenção para gerar xilanases e/ou glicanases com pro-priedades novas ou alteradas (por exemplo, atividade sob condições alta-mente ácidas ou alcalinas, temperaturas altas ou baixas, e semelhantes).Polipeptídeos codificados pelos ácidos nucléicos modificados podem serrastreados por uma atividade antes de testar quanto à atividade de hidrólisede xilano ou outra. Qualquer modalidade ou protocolo de teste pode ser u-sado, por exemplo, usando uma plataforma de arranjo capilar. Veja, por e-xemplo, Patente U.S. Nos. 6.361.974; 6.280.926; 5.939.250.Mutaaênese por Saturação do Sítio do Gene, ou. GSSM

A invenção também fornece métodos para fazer enzimas usan-do mutagênese por Saturação do Sítio do Gene, ou GSSM, como descrito/ que, e também nas Patentes U.S. Nos. 6.171.820 e 6.579.258. Em um as-pecto, iniciadores de códon contendo uma seqüência N,N,G/T degeneradasão usados para introduzir mutações pontuais em um polinucleotídeo, porexemplo, uma xilanase, mananase e/ou glicanase ou um anticorpo da inven-ção, a fim de gerar um conjunto de polipeptídeos de progênie nos quais umagama completa de substituições de um único aminoácido esteja representa-da em cada posição de aminoácido, por exemplo, um resíduo em um sítioativo de uma enzima ou sítio de ligação ao Iigante direcionado para ser mo-dificado. Esses oligonucleotídeos podem compreender uma primeira se-qüência homóloga contígua, uma seqüência N,N,G/T degenerada, e, em umaspecto, uma segunda seqüência homóloga. Os produtos traducionais deprogênie à jusante originados do uso de tais oligonucleotídeos incluem todasas alterações de aminoácido possíveis em cada local de aminoácido ao lon-go do polipeptídeo, porque a degeneração da seqüência N,N,G/T inclui có-dons para todos os 20 aminoácidos. Em um aspecto, tal oligonucleotídeodegenerado (compreendido de, por exemplo, um cassete de N,N,G/T dege-nerado) é usado para submeter cada códon original em um molde de polinu-cleotídeo precursor a um gama completa de substituições de códon. Em ou-tro aspecto, pelo menos dois cassetes degenerados são usados - no mes-mo oligonucleotídeo ou não, para submeter pelo menos dois códons origi-nais em um molde de polinucleotídeo precursor a uma gama completa desubstituições de códon. Por exemplo, mais de uma seqüência N,N,G/T podeestar contida em um oligonucleotídeo para introduzir mutações de aminoáci-do em mais de um local. Essas várias seqüências N,N,G/T podem estar dire-tamente contíguas, ou separadas por uma ou mais seqüência(s) de nucleo-tídeo adicional(is). Em outro aspecto, oligonucleotídeos úteis para introduziradições e deleções podem ser usados sozinhos ou em combinação com oscódons que contêm uma seqüência N,N,G/T, para introduzir qualquer com-binação ou permutação de adições, deleções e/ou substituições de aminoácido.

Em um aspecto, a mutagênese simultânea de duas ou mais po-sições de aminoácido contíguas é feita usando um oligonucleotídeo que con-tém trincas de N,N,G/T contíguas, isto é, uma seqüência (N,N,G/T)n degene-rada. Em outro aspecto, cassetes degenerados que têm menos degenera-ção do que a seqüência N,N,G/T são usados. Por exemplo, pode ser dese-jável em alguns casos usar (por exemplo, em um oligonucleotídeo) uma se-qüência de trinca degenerada compreendida apenas de um N, onde tal Npode estar na primeira, segunda ou terceira posição da trinca. Quaisqueroutras bases, incluindo quaisquer combinações e permutações destas po-dem ser usadas nas duas posições restantes da trinca. Alternativamente,pode ser desejável, em alguns casos, usar (por exemplo, em um oligo) umaseqüência de trinca Ν,Ν,Ν degenerada.

Em um aspecto, o uso de trincas degeneradas (por exemplo,trincas de N,N,G/T) permite geração sistemática e fácil de uma gama com-pleta de aminoácidos naturais possíveis (para um total de 20 aminoácidos)em cada e todas as posições de aminoácido em um polipeptídeo (em aspec-tos alternativos, os métodos também incluem degeneração de menos do quetodas as substituições possíveis por posição de resíduo de aminoácido, oucódon). Por exemplo, para um polipeptídeo de 100 aminoácidos, 2000 espé-cies distintas (isto é, 20 aminoácidos possíveis por posição X 100 posiçõesde aminoácido) podem ser geradas. Através do uso de um oligonucleotídeoou um conjunto de oligonucleotídeos contendo uma trinca N,N,G/T degene-rada, 32 seqüências individuais podem codificar todos os 20 aminoácidosnaturais possíveis. Dessa forma, em um frasco de reação, no qual uma se-qüência de polinucleotídeo precursora é submetida a mutagênese de satura-ção usando pelo menos um tal oligonucleotídeo, são gerados 32 polinucleo-tídeos de progênie distintos que codificam 20 polipeptídeos distintos. Emcontraste, o uso de um oligonucleotídeo não degenerado em mutagênesesítio direcionada leva apenas a um produto de polipeptídeo de progênie porfrasco de reação. Oligonucleotídeos não degenerados podem, em um as-pecto, ser usados em combinação com iniciadores degenerados descritos;por exemplo, oligonucleotídeos não degenerados podem ser usados paragerar mutações pontuais específicas em um polinucleotídeo de trabalho. Is-so fornece um meio de gerar mutações pontuais específicas silenciosas, mu-tações pontuais que levam a alterações de aminoácido correspondentes, emutações pontuais que causam a geração de códons de parada e a expres-são correspondente de fragmentos de polipeptídeo.

Em um aspecto, cada frasco de reação de mutagênese de satu-ração contém polinucleotídeos que codificam pelo menos 20 moléculas depolipeptídeo de progênie (por exemplo, xilanases e/ou glicanases) tal quetodos os 20 aminoácidos naturais estejam representados em uma posiçãode aminoácido específica que corresponde à posição do códon mutageniza-do no polinucleotídeo precursor (outros aspectos usam menos do que todasas 20 combinações naturais). Os polipeptídeos de progênie degenerados 32vezes gerados a partir de cada frasco de reação de mutagênese de satura-ção podem ser submetidos à amplificação clonal (por exemplo, clonados emum hospedeiro adequado, por exemplo, hospedeiro de E. coli, usando, porexemplo, um vetor de expressão) e submetidos à rastreamento de expres-são. Quando um polipeptídeo de progênie individual é identificado por ras-treamento como apresentando uma alteração de propriedade favorável(quando comparado ao polipeptídeo precursor, tal como atividade de hidróli-se de xilano aumentada sob condições alcalinas ou ácidas), ele pode serseqüenciado para identificar a substituição de aminoácido correspondente-mente favorável contida nele.

Em um aspecto, por mutagenizar cada e todas as posições deaminoácido em um polipeptídeo precursor usando mutagênese de satura-ção, como descrito aqui, alterações de aminoácido favoráveis podem seridentificadas em mais de uma posição de aminoácido. Uma ou mais molécu-las de progênie podem ser geradas contendo uma combinação de todas ouparte dessas substituições de aminoácido favoráveis. Por exemplo, se 2 alte-rações de aminoácido favoráveis são identificadas em cada uma das 3 posi-ções de aminoácido em um polipeptídeo, as permutações incluem 3 possibi-lidades em cada posição (nenhuma alteração do aminoácido original, e cadauma das duas alterações favoráveis) e 3 posições. Dessa forma, 3 χ 3 χ 3 ou27 possibilidades totais, incluindo 7 que foram examinadas anteriormente - 6mutações pontuais únicas (isto é, 2 em cada uma das três posições) e ne-nhuma alteração em qualquer posição.

Em outro aspecto ainda, mutagênese por saturação do sítio po-de ser usada junto com embaralhamento, quimerização, recombinação eoutros processos mutagenizantes, junto com rastreamento. Essa invençãofornece o uso de qualquer(isquer) processo(s) mutagenizantes, incluindomutagênese de saturação,de uma maneira repetitiva. Em um exemplo, o usorepetido de qualquer(isquer) processo(s) mutagenizantes é usado em com-binação com rastreamento.

A invenção também fornece o uso de iniciadores de códon pa-tenteados (contendo uma seqüência Ν,Ν,Ν degenerada) para introduzir mu-tações pontuais em um polinucleotídeo, a fim de gerar um conjunto de poli-peptídeos de progênie nos quais uma gama completa de substituições deaminoácido único está representada em cada posição de aminoácido (muta-gênese por saturação do sítio do gene (GSSM)). Os oligos usados são com-preendidos contiguamente de uma primeira seqüência homóloga, uma se-qüência Ν,Ν,Ν degenerada e preferivelmente, mas não necessariamente,uma segunda seqüência homóloga. Os produtos traducionais de progênie àjusante originados do uso de tais oligos incluem todas as alterações de ami-noácido possíveis em cada local do aminoácido aó longo do polipeptídeo,porque a degeneração da seqüência Ν,Ν,Ν inclui códons para todos os 20aminoácidos.

Em um aspecto, tal oligo degenerado (compreendido de umcassete Ν,Ν,Ν degenerado) é usado para submeter cada códon original emum molde de polinucleotídeo precursor a uma gama completa de substitui-ções de códon. Em outro aspecto, pelo menos dois cassetes de Ν,Ν,Ν de-generados são usados - no mesmo oligo ou não, para submeter pelo menosdois códons originais em um molde de polinucleotídeo precursor a uma ga-ma completa de substituições de códon. Dessa forma, mais de uma seqüên-cia Ν,Ν,Ν pode estar contida em um oligo para introduzir mutações de ami-noácido em mais do que um local. Essa pluralidade de seqüências Ν,Ν,Νpode ser diretamente contígua, ou separada por uma ou mais seqüência(s)adicional(is). Em outro aspecto, oligos úteis para introduzir adições e dele-ções podem ser usados sozinhos ou em combinação com os códons quecontêm uma seqüência Ν,Ν,Ν, para introduzir qualquer combinação ou per-mutação de adições, deleções e/ou substituições de aminoácidos.

Em uma exemplificação particular, é possível mutagenizar simul-taneamente duas ou mais posições de aminoácido contíguas usando umoligo que contém trincas Ν,Ν,Ν contíguas, isto é, uma seqüência (N,N,N)ndegenerada.

Em outro aspecto, a presente invenção fornece o uso de casse-tes degenerados que têm menos degeneração do que a seqüência Ν,Ν,Ν.Por exemplo, pode ser desejável em alguns casos, usar (por exemplo, emum oligo) uma seqüência de trinca degenerada compreendida de apenas umN, onde o N pode estar na primeira, segunda ou terceira posição da trinca.Qualquer outra base incluindo qualquer combinação e permutação destaspode ser usada nas duas posições restantes da trinca. Alternativamente,pode ser desejável em alguns casos, usar (por exemplo, em um oligo) umaseqüência de trinca de Ν,Ν,Ν degenerada, uma seqüência de trinca deN1N1GyT, N,N, G/C.

É observado, entretanto, que o uso de uma trinca degenerada(tal como uma seqüência de trinca de N,N,G/T ou N,N, G/C) como descritona presente invenção é vantajoso por várias razões. Em um aspecto, essainvenção fornece um meio de gerar sistematicamente e de forma relativa-mente fácil a substituição da gama completa de aminoácidos possíveis (paraum total de 20 aminoácidos) em cada e todas as posições de aminoácido emum polipeptídeo. Dessa forma, para um polipeptídeo de 100 aminoácidos, ainvenção fornece uma forma de gerar sistematicamente e de forma relativa-mente fácil 2000 espécies distintas (isto é, 20 aminoácidos possíveis porposição vezes 100 posições de aminoácido). É observado que é fornecidoatravés do uso de um oligo que contém uma seqüência de tripla de N,N,G/Tou N,N, G/C degenerada, 32 seqüências individuais que codificam 20 ami-noácidos possíveis. Dessa forma, em um frasco de reação no qual uma se-qüência de polinucleotídeo precursor é submetida a mutagênese de satura-ção usando tal oligo, são gerados 32 polinucleotídeos de progênie distintosque codificam 20 polipeptídeos distintos. Em contraste, o uso de um oligonão degenerado em mutagênese sítio direcionada leva a apenas um produtode polipeptídeo de progênie por frasco de reação.

Essa invenção também fornece uso de oligos não degenerados,que podem, em um aspecto, ser usados em combinação com iniciadoresdegenerados descritos. É observado que em algumas situações, é vantajosousar oligos degenerados para gerar mutações pontuais específicas em umpolinucleotídeo de trabalho. Isso fornece um meio de gerar mutações pontu-ais específicas silenciosas, mutações pontuais que levam a alterações deaminoácido correspondentes e mutações pontuais que causam e geração decódons de parada e a expressão correspondente de fragmentos de polipeptídeo.

Dessa forma, em um aspecto dessa invenção, cada frasco dereação de mutagênese de saturação contém polinucleotídeos que codificampelo menos 20 moléculas de polipeptídeo de progênie tal que todos os 20aminoácidos estejam representados em uma posição de aminoácido especí-fica que corresponde à posição do códon mutagenizado no polinucleotídeoprecursor. Os polipeptídeos da progênie degenerados 32 vezes gerados decada frasco de reação de mutagênese de saturação podem ser submetidosà amplificação clonal (por exemplo, clonados em um hospedeiro de E. coliadequado usando um vetor de expressão) e submetidos à rastreamento deexpressão. Quando um polipeptídeo de progênie individual é identificado porrastreamento como apresentando uma alteração de propriedade favorável(quando comparado ao polipeptídeo precursor), ele pode ser seqüenciadopara identificar a substituição de aminoácido correspondentemente favorávelcontida nele.

É observado que por mutagenizar cada e todas as posições deaminoácido em um polipeptídeo precursor usando mutagênese de satura-ção, como descrito aqui, alterações de aminoácido favoráveis podem seridentificadas em mais de uma posição de aminoácido. Uma ou mais novasmoléculas da progênie podem ser geradas contendo uma combinação detodas ou parte dessas substituições de aminoácido favoráveis. Por Por e-xemplo, se 2 alterações de aminoácido favoráveis específicas são identifica-das em cada uma das 3 posições de aminoácido em um polipeptídeo, aspermutações incluem 3 possibilidades em cada posição (nenhuma alteraçãodo aminoácido original e cada uma das duas alterações favoráveis) e 3 posi-ções. Dessa forma, há 3 χ 3 χ 3 ou 27 possibilidades totais, incluindo 7 queforam examinadas anteriormente - 6 mutações pontuais únicas (isto é, 2 emcada uma das três posições) e nenhuma alteração em qualquer posição.

Dessa forma, em um exemplo não limitante, essa invenção for-nece o uso de mutagênese de saturação em combinação com processos demutagenização adicionais, tal como um processo onde dois ou mais polinu-cleotídeos relacionados são introduzidos em uma célula hospedeira adequa-da tal que um polinucleotídeo híbrido seja gerado por recombinação e rea-grupamento redutor.Além de realizar mutagênese ao longo de toda a seqüência deum gene, a presente invenção proporciona que a mutagênese possa ser u-sada para substituir cada uma de qualquer número de bases em uma se-qüência de polinucleotídeo, em que o número de bases a ser mutagenizadoé preferivelmente todos os inteiros entre 15 a 100.000. Dessa forma, ao in-vés de mutagenizar cada posição ao longo da molécula, pode-se submetercada ou um número pequeno de bases (preferivelmente um conjunto totali-zando 15 a 100.000) à mutagênese. Preferivelmente, um nucleotídeo sepa-rado é usado para mutagenizar cada posição ou grupo de posições ao longode uma seqüência de polinucleotídeo. Um grupo de 3 posições a ser muta-genizado pode ser um códon. As mutações são introduzidas preferivelmenteusando um iniciador mutagênico, contendo um cassete heterólogo, tambémreferido como um cassete mutagênico. Cassetes exemplares podem ter de 1a 500 bases. Cada posição de nucleotídeo em tais cassetes heterólogos po-de ser N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/GÍT, A/C/T,A/C/G, ou E, onde E é qualquer base exceto A, C, G, ou T (E pode ser refe-rido como um oligoprojetado).

Em um sentido geral, mutagênese de saturação é compreendidapor mutagenizar um conjunto completo de cassetes mutagênicos (em quecada cassete tem preferivelmente cerca de 1 a 500 bases de extensão) emuma seqüência de polinucleotídeo definida a ser mutagenizada (em que aseqüência a ser mutagenizada tem preferivelmente cerca de 15 a 100.000bases de extensão). Dessa forma, um grupo de mutações (variando de 1 a100 mutações) é introduzido em cada cassete a ser mutagenizado. Um a-grupamento de mutações a serem introduzidas em um cassete pode ser di-ferente ou pode ser o mesmo de um segundo agrupamento de mutações aserem introduzidas em um segundo cassete durante a aplicação de um ciclode mutagênese de saturação. Tais agrupamentos são exemplificados pordeleções, adições, agrupamentos de códons particulares e agrupamentos decassetes de nucleotídeo particulares.Seqüências definidas a serem mutagenizadas incluem um geneinteiro, uma via, um cDNA, uma fase aberta de leitura (ORF) e um promotorinteiro, intensificador, repressor/transativador, origem de replicação, íntron,operador, ou qualquer grupo funcional de polinucleotídeo. Geralmente, "se-qüências definidas" para essa finalidade podem ser qualquer polinucleotídeoque é uma seqüência de polinucleotídeo de 15 bases e seqüências de poli-nucleotídeo de extensões entre 15 bases e 15.000 bases (essa invençãonomeia especificamente todos os inteiros entre essa faixa). Consideraçõesna escolha dos agrupamentos de códons incluem tipos de aminoácidos codi-ficados por um cassete mutagênico degenerado,

Em um exemplo de um agrupamento de mutações que podemser introduzidas em um cassete mutagênico, essa invenção fornece especi-ficamente substituições de códon degeneradas (usando oligos degenerados)que codificam 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 e 20aminoácidos em cada posição em uma biblioteca de polipeptídeos codificadadessa forma.

Reaarupamento por ligação sintética (SLR)

A invenção fornece um sistema de modificação gênica não-estocástico chamado "reagrupamento por ligação sintética", ou simplesmen-te "SLR", um processo de "evolução dirigida", para gerar polipeptídeos, porexemplo, xilanases e/ou glicanases, ou anticorpos da invenção, com propri-edades novas ou alteradas.

SLR é um método de ligar fragmentos de oligonucleotídeo juntosnão-estocasticamente. Esse método difere de embaralhamento de oligonu-cleotídeo estocástico em que os blocos de construção do ácido nucléico nãosão embaralhados, concatenados ou quimerizados aleatoriamente, mas aoinvés disso, eles não reagrupados não-estocasticamente. Veja por exemplo,Patente U.S. Nos. 6.773.900; 6.740.506; 6.713.282; 6.635.449; 6.605.449;6.537.776. Em um aspecto, SLR compreende as seguintes etapas: (a) for-necer um polinucleotídeo molde, em que o polinucleotídeo molde compreen-de uma seqüência que codifica um gene homólogo; (b) fornecer uma plurali-dade de polinucleotídeos de blocos de construção, em que os polinucleotí-deos de blocos de construção são desenhados para reagrupar por ligaçãocruzada com o polinucleotídeo molde em uma seqüência predeterminada, eum polinucleotídeo de bloco de construção compreende uma seqüência queé uma variante do gene homólogo e uma seqüência homóloga ao polinucleo-tídeo molde que flanqueia a seqüência variante; (c) combinar um polinucleo-tídeo de bloco de construção com um polinucleotídeo do molde tal que o po-linucleotídeo fundamental se reagrupe por ligação cruzada com o polinucleo-tídeo molde para gerar polinucleotídeos que compreendem variações da se-qüência do gene homólogo.

SLR não depende da presença de altos níveis de homologiaentre os polinucleotídeos sendo rearranjados. Dessa forma, esse métodopode ser usado par gerar não-estocasticamente bibliotecas (ou conjuntos)de moléculas de progênie compreendidas de mais de IO100 quimeras dife-rentes. SLR pode ser usada para gerar bibliotecas compreendidas de maisdo que IO1000 quimeras de progênie diferentes. Dessa forma, aspectos dapresente invenção incluem métodos não-estocásticos de produzir um con-junto de moléculas de ácido nucléico quiméricas finalizadas que partilhamuma ordem reagrupada geral que é escolhida intencionalmente. Esse méto-do inclui as etapas de gerar intencionalmente uma pluralidade de blocos deconstrução de ácido nucléico específicos que tem extremidades ligáveis mu-tuamente compatíveis úteis, e reagrupar esses blocos de construção de áci-do nucléico, tal que uma ordem de reagrupamento geral projetada seja obtida.

As extremidades ligáveis mutuamente compatíveis dos blocosde construção de ácidos nucléicos sendo agrupados são consideradas "ú-teis" para esse tipo de agrupamento ordenado se elas permitirem que osblocos de construção sejam acoplados em ordens predeterminadas. Dessaforma, a ordem de agrupamento geral na qual os blocos de construção deácido nucléico podem ser acoplados é especificada pelo desenho das ex-tremidades ligáveis. Se mais de uma etapa de agrupamento for usada, entãoa ordem de agrupamento geral na qual os blocos de construção de ácidonucléico podem ser acoplados também será especificada pela ordem se-qüencial da(s) etapa(s) de agrupamento. Em um aspecto, as peças de cons-trução aneladas são tratadas com uma enzima, tal como uma Iigase (porexemplo, T4 DNA ligase), para se obter a ligação covalente das peças deconstrução.

Em um aspecto, o desenho dos blocos de construção de oligo-nucleotídeo é obtido por analisar um conjunto de moldes de seqüencias deácido nucléico progenitoras que servem como uma base para produzir umconjunto de progênie de polinucleotídeos quiméricos finalizados. Esses mol-des de oligonucleotídeos precursores servem então como uma fonte de in-formação de seqüência que auxilia no desenho dos blocos de construção deácido nucléico que serão mutagenenizados, por exemplo, quimerizados ouembaralhados. Em um aspecto deste método, as seqüências de vários mol-des de ácidos nucléicos precursores são alinhadas a fim de selecionar umou mais pontos de demarcação. Os pontos de demarcação podem estar lo-calizados em uma área de homologia, e são compreendidos de um ou maisnucleotídeos. Esses pontos de demarcação são preferivelmente comparti-lhados por pelo menos dois dos moldes progenitores. Os pontos de demar-cação podem então ser usados para delinear os limites de blocos de cons-trução de oligonucleotídeos a ser gerados a fim de rearranjar os polinucleo-tídeos precursores. Os pontos de demarcação identificados e selecionadosnas moléculas progenitoras servem como pontos de quimerização potenciaisno agrupamento das moléculas de progênie quiméricas finais. Um ponto dedemarcação pode ser uma área de homologia (compreendida de pelo menosuma base de nucleotídeo homóloga) compartilhada por pelo menos duasseqüências de polinucleotídeo precursores. Alternativamente, um ponto dedemarcação pode ser uma área de homologia que é compartilhada por pelomenos metade das seqüências de polinucleotídeo precursor, ou ela pode seruma área de homologia que é compartilhada por pelo menos dois terços dasseqüências de polinucleotídeo precursor. Ainda mais preferivelmente, umponto de demarcação útil é uma área de homologia que é compartilhada porpelo menos três quartos das seqüências de polinucleotídeo precursor, ou elapode ser compartilhada por quase todas as seqüências de polinucleotídeoprecursor. Em um aspecto, um ponto de demarcação é uma área de homo-logia que é compartilhada por todas as seqüências de polinucleotídeo pre-cursor.

Em um aspecto, um processo de reagrupamento por ligação érealizado exaustivamente a fim de gerar uma biblioteca completa de polinu-cleotídeos quiméricos de progênie. Em outras palavras, todas as combina-ções ordenadas possíveis dos blocos de construção de ácido nucléico sãorepresentadas no conjunto de moléculas de ácido nucléico quiméricas finali-zadas. Ao mesmo tempo, em outro aspecto, a ordem de agrupamento (istoé, a ordem de agrupamento de cada bloco de construção na seqüência de 5'para 3' de cada ácido nucléico quimériço finalizado) em cada combinação éintencional (ou não-estocástica) como descrito acima. Devido à naturezanão-estocástica dessa invenção, a possibilidade de produtos secundáriosindesejados é grandemente reduzida.

Em outro aspecto, o método de reagrupamento por ligação érealizado sistematicamente. Por exemplo, o método é realizado a fim de ge-rar uma biblioteca sistematicamente compartimentalizada de moléculas deprogênie, com compartimentos que podem ser rastreados sistematicamente,por exemplo, um a um. Em outras palavras, essa invenção proporciona que,através do uso seletivo e criterioso de blocos de construção de ácido nucléi-co específicos, acoplado com o uso seletivo e criterioso de reações de agru-pamento seqüencialmente gradativas, pode ser obtido uma estrutura ondeconjuntos específicos de produtos de progênie são feitos em cada um dosvários frascos de reação. Isso permite que um procedimento de exame erastreamento sistemático seja realizado. Dessa forma, esses métodos permi-tem que um número potencialmente muito grande de moléculas de progênieseja examinado sistematicamente em grupos menores. Devido à sua habili-dade de realizar quimerizações de uma maneira que é altamente flexívelainda que exaustiva e sistemática, particularmente quando há um nível baixode homologia entre as moléculas progenitoras, esses métodos fornecem ageração de uma biblioteca (ou conjunto) compreendida de um grande núme-ro de moléculas de progênie. Devido à natureza não-estocástica da presenteinvenção de reagrupamento por ligação, as moléculas de progênie geradascompreendem preferivelmente uma biblioteca de moléculas de ácido nucléi-co quiméricas finalizadas que têm uma ordem de agrupamento geral que éescolhida intencionalmente. Os métodos de mutagênese por saturação evo-lução dirigida otimizada também podem ser usados para gerar diferentesespécies moleculares de progênie. É observado que a invenção fornece Ii-berdade de escolha e controle com relação à seleção de pontos de demar-cação, tamanho e número dos blocos de construção de ácido nucléico, e dotamanho e desenho dos acoplamentos. É observado, ainda, que a necessi-dade por homologia intermolecular é altamente diminuída para a operabili-dade dessa invenção. De fato, pontos de demarcação podem ainda ser es-colhidos em áreas de pouca ou nenhuma homologia intermolecular. Por e-xemplo, devido à oscilação de códons, isto é, a degeneração de códons,substituições de nucleotídeo podem ser introduzidas nos blocos de constru-ção de ácidos nucléicos sem alterar o aminoácido originalmente codificadono molde progenitor correspondente. Alternativamente, um códon pode seralterado tal que a codificação para um aminoácido original seja alterada. Es-sa invenção proporciona que tais substituições possam ser introduzidas nobloco de construção de ácido nucléico a fim de aumentar a incidência depontos de demarcação homólogos intermoleculares e assim permitir que umnúmero de acoplamentos aumentado seja obtido entre os blocos de constru-ção, que por sua vez, permite que um maior número de moléculas de progê-nie seja gerado.

Reagrupamento sintético de gene

Em um aspecto, a presente invenção fornece um método não-estocástico chamado reagrupamento sintético de gene (por exemplo, Gene-Reassembly, veja, por exemplo, Patente U.S. N°. 6.537.776), que difere doembaralhamento estocástico em que os blocos de construção de ácido nu-cléico não são embaralhados ou concatenados ou quimerizados aleatoria-mente, mas não invés disso, são agrupados não-estocasticamente.

O método de reagrupamento sintético de gene não depende dapresença de um alto nível de homologia entre os polinucleotídeos a ser em-baralhados. A invenção pode ser usada para gerar não-estocasticamentebibliotecas (ou conjuntos) de moléculas de progênie compreendidas de maisde 101000 quimeras de progênie diferentes. De forma concebível, o reagru-pamento de gene sintético pode ainda ser usado para gerar bibliotecas com-preendidas de mais do que 101000 quimeras de progênie diferentes.

Dessa forma, em um aspecto a invenção fornece um métodonão estocástico de produzir um conjunto de moléculas de ácido nucléicoquiméricas finalizadas que têm uma ordem de agrupamento geral que é es-colhida intencionalmente, cujo método é compreendido das etapas de gerarintencionalmente uma pluralidade de blocos de construção de ácido nucléicoespecíficos que têm extremidades ligáveis mutuamente compatíveis úteis eagrupar esses blocos de construção de ácidos nucléicos, tal que uma ordemde agrupamento geral planejada seja obtida.

Em um aspecto, reagrupamento de gene sintético compreendeum método e: 1) preparar uma geração de progênie de molécula(s) (incluin-do uma molécula que compreende uma seqüência de polinucleotídeo, porexemplo, uma molécula que compreende uma seqüência codificante de poli-peptídeo), que é mutagenizada para se obter pelo menos uma mutação pon-tual, adição, deleção e/ou quimerização, a partir de um ou mais molde(s) degeração ancestral ou precursor; 2) rastrear a(s) molécula(s) da geração deprogênie, por exemplo, usando um método de alta produtividade, por pelomenos uma propriedade de interesse (tal como uma melhora na atividadeenzimática); 3) em um aspecto, obter e/ou catalogar informação estruturale/ou funcional com relação às moléculas da geração de progênie e 4) em umaspecto, repetir qualquer uma das etapas 1) a 3). Em um aspecto, é gerada(por exemplo, de um molde de polinucleotídeo precursor), no que é chamado"mutagênese por saturação do sítio do códon", uma geração de progênie depolinucleotídeos, cada uma tendo pelo menos um conjunto de até três muta-ções pontuais contíguas (isto é, bases diferentes compreendendo um novocódon), tal que todos os códons (ou todas as famílias de códons degenera-dos que codificam o mesmo aminoácido) estejam representados em cadaposição de códon. Correspondendo a, e codificada por essa geração de pro-gênie de polinucleotídeos, também é gerado um conjunto de polipeptídeos,cada um tendo pelo menos uma única mutação de aminoácido pontual. Emum aspecto, é gerada, em que é chamado "mutagênese por saturação dosítio do aminoácido", um mutante de polipeptídeo para cada uma das 19substituições de alfa-aminoácido formadoras de polipeptídeo codificadasnaturalmente em cada e todas as posições de aminoácido ao longo do poli-peptídeo. Isso gera, para cada e toda posição de aminoácido ao longo dopolipeptídeo precursor, um total de 20 polipeptídeos de progênie distintosincluindo o aminoácido original, ou potencialmente mais do que 21 polipeptí-deos de progênie distintos se aminoácidos adicionais forem usados ao invés,ou além, dos 20 aminoácidos codificados naturalmente.

Dessa forma, em outro aspecto, essa abordagem também é útilpara gerar mutantes contendo, além de e/ou em combinação com os 20 alfa-aminoácidos formadores de polipeptídeo codificados naturalmente, outrosaminoácidos e derivados de aminoácidos raros e/ou não codificados natu-ralmente. Em outro aspecto ainda, essa abordagem também é útil para gerarmutantes pelo uso de, ou em adição a e/ou em combinação com sistemasde reconhecimento de códon natural ou inalterado de hospedeiros adequa-dos, sistemas de reconhecimento de códons alterados, mutagenizados e/ouplanejados (tal como em uma célula hospedeira com uma ou mais moléculasde tRNA alteradas).

Em outro aspecto ainda, essa invenção refere-se à recombina-ção e mais especificamente a um método para preparar polinucleotídeos quecodificam um polipeptídeo por um método de rearranjo de seqüências depolinucleotídeo contendo regiões de homologia parcial, agrupando os poli-nucleotídeos para formar pelo menos um polinucleotídeo e rastrear os poli-nucleotídeos quanto à produção de polipeptídeo(s) que têm uma proprieda-de útil.

Em outro aspecto ainda, esse invenção é útil para analisar ecatalogar, com relação a qualquer propriedade molecular (por exemplo, umaatividade enzimática) ou combinação de propriedades permitidas pela tecno-logia atual, os efeitos de qualquer alteração mutacional obtida (incluindo par-ticularmente mutagênese por saturação). Dessa forma, um método abran-gente é fornecido para determinar o efeito de altera cada aminoácido em umpolipeptídeo precursor em cada um de pelo menos 19 possíveis substitui-ções. Isso permite que cada aminoácido em um polipeptídeo precursor sejacaracterizado e catalogado de acordo com seu espectro de potenciais efei-tos sobre uma propriedade mensurável do polipeptídeo.

Em um aspecto, um íntron pode ser introduzido em uma molécu-Ia de progênie quimérica através de um bloco de construção de ácido nucléi-co. íntrons freqüentemente têm seqüências consenso em ambas as termina-ções a fim de torná-los operacionais. Além de permitir o splicing de genes,os íntron podem servir para um propósito adicional por fornecer sítios dehomologia a outros ácidos nucléicos para permitir recombinação homóloga.

Para essa finalidade, e potencialmente outras, pode ser algumas vezes de-sejável gerar um grande bloco de construção de ácido nucléico para introdu-zir um íntron. Se o tamanho for excessivamente grande não sendo geradofacilmente por síntese química direta de dois oligos de fita única, tal bloco deconstrução de ácido nucléico especializado também pode ser gerado porsíntese direta de mais do que dois oligos de fita única ou pelo uso de umareação de amplificação baseada em polimerase.

As extremidades ligáveis mutuamente compatíveis dos blocosde construção de ácido nucléico a ser agrupados são consideradas "úteis"para esse tipo de agrupamento ordenado se elas permitirem que os blocosde construção sejam acoplados em ordens predeterminadas. Dessa forma,em um aspecto, a ordem de agrupamento geral na qual os blocos de cons-trução de ácido nucléico podem ser acoplados é especificada pelo desenhodas extremidades ligáveis e, se mais do que uma etapa de agrupamento forusada, então a ordem de agrupamento geral na qual os blocos de constru-ção de ácido nucléico podem ser acoplados também será especificada pelaordem seqüencial das etapas de agrupamento. Em um aspecto da invenção,as peças de construção aneladas são tratadas com uma enzima, tal comouma Iigase (por exemplo, T4 DNA ligase) para se obter a ligação covalentedas peças de construção.

O acoplamento pode ocorrer de uma forma que não faz uso detodos os nucleotídeos em uma projeção participante. O acoplamento particu-larmente terá probabilidade de se manter (por exemplo, em um hospedeirotransformado) se o acoplamento for reforçado pelo tratamento com uma en-zima ligase para formar o que pode ser referido como uma "ligação de inter-valos" ou uma "ligação intervalada". Esse tipo de acoplamento pode contri-buir para a geração de produto(s) inespecíficos indesejados, mas ele tam-bém pode ser usado vantajosamente para aumentar a diversidade da biblio-teca de progênie gerada pelo reagrupamento de ligação projetada. Certasprojeções são capazes de sofrer auto-acoplamento para formar um acopla-mento palindrômico. Um acoplamento é substancialmente fortalecido se elefor reforçado pelo tratamento com uma enzima ligase. A falta de fosfatos 5'nessas projeções pode ser usada vantajosamente para evitar esse tipo auto-ligação palindrômica. Conseqüentemente, essa invenção proporciona queestes blocos de construção de ácido nucléico possam ser feitos quimicamen-te (ou ordenados) sem um grupo fosfato 5'. Alternativamente, eles podemser removidos, por exemplo, por tratamento com uma enzima fosfatase, talcomo uma fosfatase alcalina intestinal de bovino (CIAP), a fim de evitar auto-ligações palindrômicas em processos de reagrupamento por ligação.

Em outro aspecto, o desenho de blocos de construção de ácidosnucléicos é obtido pode análise das seqüências de um conjunto de moldesde ácido nucléico progenitores que servem como uma base para produzirum conjunto de progênie de moléculas de ácido nucléico quiméricas finaliza-das. Esses moldes de ácido nucléico progenitores servem então como a fon-te de informação da seqüência que auxilia no desenho dos blocos de cons-trução de ácido nucléico que devem ser mutagenizados, isto é, quimerizadosou embaralhados.

Em um exemplo, a invenção fornece a quimerização de umafamília de genes relacionados e sua família codificada de produtos relacio-nados. Em um exemplo particular, os produtos codificados são enzimas. Asxilanases e/ou glicanases da presente invenção podem ser mutagenizadasde acordo com os métodos descritos aqui.

Dessa forma, de acordo com um aspecto da invenção, as se-qüências de vários moldes de ácido nucléico progenitores (por exemplo, po-linucleotídeos da invenção) são alinhadas a fim de selecionar um ou maispontos de demarcação, cujos pontos de demarcação podem estar localiza-dos em uma área de homologia. Os pontos de demarcação podem ser usa-dos para delinear os limites dos blocos de construção de ácido nucléico aser gerados. Dessa forma, os pontos de demarcação identificados e selecio-nados nas moléculas progenitoras servem como pontos de quimerizaçãopotenciais no agrupamento de moléculas de progênie.

Tipicamente, um ponto de demarcação útil está em uma área dehomologia (compreendida de pelo menos uma base de nucleotídeo homólo-ga) partilhada por pelo menos dois moldes de progenitores, mas o ponto dedemarcação pode estar em uma área de homologia que é partilhada por pe-lo menos metade dos moldes progenitores, pelo menos dois terços dos mol-des progenitores, pelo menos três quartos dos moldes progenitores e prefe-rivelmente quase todos os moldes progenitores. Ainda mais preferivelmente,um ponto de demarcação ainda útil é uma área de homologia que é partilha-da por todos os moldes progenitores.

Em um aspecto, o processo de reagrupamento de gene é reali-zado exaustivamente a fim de gerar uma biblioteca completa. Em outras pa-lavras, todas as combinações ordenadas possíveis dos blocos de construçãode ácido nucléico são representadas no conjunto de moléculas de ácido nu-cléico quiméricas finalizadas. Ao mesmo tempo, a ordem de agrupamento(isto é, a ordem de agrupamento de cada bloco de construção na seqüênciade 5' para 3' de cada ácido nucléico quimérico finalizado) em cada combina-ção é intencional (ou não-estocástica). Devido à natureza não-estocástica dométodo, a possibilidade de produtos secundários indesejados é grandemen-te reduzida.

Em outro aspecto, o método proporciona que o processo de re-agrupamento de gene seja realizado sistematicamente, por exemplo, paragerar uma biblioteca sistematicamente compartimentalizada, com comparti-mentos que podem ser rastreados sistematicamente, por exemplo, um a um.Em outras palavras, essa invenção proporciona que, através do uso seletivoe criterioso de blocos de construção de ácido nucléico específicos, acopladocom o uso seletivo e criterioso de reações de agrupamento seqüencialmentegradativas, pode ser obtida uma estrutura onde conjuntos específicos deprodutos de progênie são feitos em cada um dos vários frascos de reação.Isso permite que um procedimento de exame e rastreamento sistemáticoseja realizado. Dessa forma, isso permite que um número potencialmentemuito grande de moléculas de progênie seja examinado sistematicamenteem grupos menores.

Devido à sua habilidade de realizar quimerizações de uma ma-neira que é altamente flexível ainda que exaustiva e sistemática, particular-mente quando há um nível baixo de homologia entre as moléculas progenito-ras, a presente invenção fornece a geração de uma biblioteca (ou conjunto)compreendida de um grande número de moléculas de progênie. Devido ànatureza não-estocástica da presente invenção de reagrupamento de gene,as moléculas de progênie geradas compreendem preferivelmente uma bi-blioteca de moléculas de ácido nucléico quiméricas finalizadas que têm umaordem de agrupamento geral que é escolhida intencionalmente. Em um as-pecto particular, tal biblioteca gerada é compreendida de mais do que 103 amais do que 101000 espécies moleculares de progênie diferentes.Em um aspecto, um conjunto de moléculas de ácido nucléicoquiméricas finalizadas, produzido como descrito, é compreendido de um po-linucleotídeo que codifica um polipeptídeo. De acordo com um aspecto, essepolinucleotídeo é um gene, que pode ser um gene feito pelo homem. De a-cordo com um aspecto esse polinucleotídeo é um gene, que pode ser umgene feito pelo homem. De acordo com outro aspecto, esse polinucleotídeoé uma via gênica, que pode ser uma via gênica feita pelo homem. Essa in-venção proporciona que um ou mais genes feitos pelo homem gerados pelainvenção possam ser incorporados em uma via gênica feita pelo homem, talcomo uma via operável em um organismo eucariótico (incluindo uma planta).

Em outro exemplo, a natureza sintética da etapa na qual os blo-cos de construção são gerados permite o desenho e introdução de nucleotí-deos (por exemplo, um ou mais nucleotídeos, que podem ser, por exemplo,códons ou íntrons ou seqüências regulatórias) que mais tarde podem, emum aspecto, ser removidas em um processo in vitro (por exemplo, por muta-gênese) ou em um processo in vivo (por exemplo, pela utilização da habili-dade de splicing e gene de um organismo hospedeiro). É observado que emmuitos casos a introdução desses nucletideos também pode ser desejávelpor muitas outras razões além do beneficio potencial de criar um ponto dedemarcação útil.

Dessa forma, de acordo com outro aspecto, a invenção propor-ciona que um bloco de construção de ácido nucléico possa ser usado paraintroduzir íntrons. Dessa forma, a invenção proporciona que íntrons funcio-nais possam ser introduzidos em um gene feito pelo homem da invenção. Ainvenção também proporciona que íntrons funcionais possam ser introduzi-dos em uma via gênica feita pelo homem. Conseqüentemente, a invençãofornece a geração de um poiinucieotíaeo quimérico que é um gene feito pelohomem que contém um (ou mais) íntrons introduzidos artificialmente.

Conseqüentemente, a invenção também fornece a geração deum polinucleotídeo quimérico que é uma via gênica feita pelo homem quecontém um (ou mais) íntrons introduzidos artificialmente. Preferivelmente,o(s) íntron(s) introduzido(s) artificialmente (é)são funcional(is) em uma oumais células hospedeiras para splicing de gene, a título de que íntrons queocorrem naturalmente servem funcionalmente no splicing de genes. A inven-ção fornece um processo de produzir polinucleotídeos contendo íntrons fei-tos pelo homem para serem introduzidos em organismos hospedeiros pararecombinação e/ou splicing.

Um gene feito pelo homem produzido usando a invenção tam-bém pode servir como um substrato para recombinação com outro ácido nu-cléico. Da mesma forma, uma via de gene feito pelo homem produzida u-sando a invenção também pode servir como um substrato para recombina-ção com outro ácido nucléico. Em um aspecto, a recombinação é facilitadapor, ou ocorre em áreas de homologia entre o gene contendo íntron, feitopelo homem e um ácido nucléico, que serve como um parceiro de recombi-nação. Em um aspecto, o parceiro de recombinação também pode ser umácido nucléico gerado pela invenção, incluindo um gene feito pelo homem,ou via e gene feito pelo homem. A recombinação pode ser facilitada por, oupode ocorrer em áreas de homologia que existem em um (ou mais) íntronintroduzido artificialmente no gene feito pelo homen.

O método de reagrupamento sintético de gene da invenção utili-za uma pluralidade de blocos de construção de ácido nucléico, cada um dosquais tem preferivelmente duas extremidades ligáveis. As duas extremida-des ligáveis em cada bloco de construção de ácido nucléico podem ser duasextremidades cegas (isto é, cada uma tendo uma projeção de zero nucleotí-deo) ou, preferivelmente, uma extremidade cega e uma projeção ou maispreferivelmente ainda duas projeções.

Uma projeção útil para essa finalidade pode ser uma projeção 3'ou uma projeção 5'. Dessa forma, um bloco de construção de ácido nucléicopode ter uma projeção 3' ou alternativamente uma projeção 5' ou alternati-vamente duas projeções 3' ou alternativamente duas projeções 5'. A ordemgeral na qual os blocos de construção de ácido nucléico são agrupados paraformar uma molécula de ácido nucléico quimérica finalizada é determinadapor desenho experimental proposto e não é aleatório.

Em um aspecto, um bloco de construção de ácido nucléico égerado pela síntese química de dois ácidos nucléicos de fita única (tambémreferidos como oligos de fita única) e colocá-los em contato para permitir queanelem para formar um bloco de construção de ácido nucléico de fita dupla.

Um bloco de ácido nucléico de fita dupla pode ser de tamanhovariável. Os tamanhos desses blocos de construção podem ser pequenos ougrandes. Tamanhos exemplares para blocos de construção variam de 1 parde base (não incluindo nenhuma projeção) a 100.000 pares de base (nãoincluindo nenhuma projeção). Outras variações exemplares que tem limitesinferiores de 1 pb a 10.000 pb (incluindo todos os valos inteiros na interme-diários) e limites superiores de 2 pb a 100.000 pb (incluindo todos os valoresinteiros intermediários).

Existem vários métodos úteis para a invenção pelos quais umbloco de construção de ácido nucléico de fita dupla pode ser gerado; e essessão conhecidos na técnica e podem-ser facilmente executados pelo versadona técnica.

De acordo com um aspecto, um bloco de construção de ácidonucléico de fita dupla é gerado por primeiro gerar dois ácidos nucléicos defita única e permitir que eles anelem para formar um bloco de construção deácido nucléico de fita dupla. As duas fitas de um bloco de construção de áci-do nucléico de fita dupla podem ser complementares em todos os nucleotí-deos com exceção de qualquer um que forme a projeção; dessa forma, nãocontendo nenhum mal-pareamento exceto nas projeções. De acordo comoutro aspecto, as duas fitas de um bloco de construção de ácido nucléico defita dupla são complementares em menos do que todos os nucleotídeos ex-ceto de qualquer um que forme a projeção. Dessa forma, de acordo comesse aspecto, um bloco de construção de ácido nucléico de fita dupla podeser usado para introduzir degeneração de códon. A degeneração de códondescrita aqui, usando um ou mais cassetes de N1N,G/T ou alternativamenteusando um ou mais cassetes de Ν,Ν,Ν.

O método de recombinação in vivo da invenção pode ser deforma cega em um conjunto de híbridos desconhecidos ou alelos de um po-linucleotídeo ou seqüência desconhecidas. Entretanto, não é necessário co-nhecer a seqüência de DNA ou RNA real do polinucleotídeo específico.

A abordagem de usar recombinação dentro de uma populaçãomista de genes pode ser útil para a geração de proteínas úteis, por exemplo,interleucina I, anticorpos, tPA e hormônio do crescimento. Essa abordagempode ser usada para gerar proteínas que têm especificidade ou atividadealterada. A abordagem também pode ser útil para a geração de seqüênciasde ácido nucléico híbridas, por exemplo, regiões promotoras, íntrons, éxons,seqüências intensificadoras, 31 regiões não traduzidas ou 51 regiões nãotraduzidas de genes. Dessa forma, essa abordagem pode ser usada paragerar genes que têm taxas de expressão aumentadas. Essa abordagemtambém pode ser útil no estudo de seqüências de DNA repetitivas. Final-mente, essa abordagem pode ser útil para mutar ribozimas Ou aptâmeros.

Em um aspecto a invenção descrita aqui é direcionada ao usode ciclos repetidos de rearranjo redutor, recombinação e seleção que permi-tem a evolução moléculas dirigida de seqüências lineares complexas, taiscomo DNA, RNA ou proteínas através de recombinação.

Sistema de Evolução Dirigida Otimizada

A invenção fornece um sistema não-estocástico de modificaçãode gene chamado "sistema de evolução dirigida otimizada" para gerar poli-peptídeos, por exemplo, xilanases e/ou glicanases, ou anticorpos da inven-ção, com propriedades novas ou alteradas. Evolução dirigida otimizada édirecionada ao uso de ciclos repetidos de rearranjo redutor, recombinação eseleção que permitem a evolução molecular dirigida de ácidos nucléicos a-través de recombinação. A evolução dirigida otimizada permite a geração deuma grande população de seqüências quiméricas evoluídas, em que a popu-lação gerada é significativamente enriquecida com seqüências que tem umnúmero predeterminado de eventos de cruzamento.

Um evento de cruzamento é um ponto em uma seqüência qui-mérica onde ocorre uma alteração na seqüência de uma variante precursorapara outra variante precursora. Tal ponto é normalmente a junção de ondeos oligonucleotídeos de dois parentes são ligados juntos para formar umaúnica seqüência. Esse método permite o cálculo das concentrações corretasde seqüências de oligonucleotídeos para que a população quimérica final deseqüências seja enriquecida para o número escolhido de eventos de cruza-mento. Isso fornece mais controle sobre a escolha de variantes quiméricasque têm um número predeterminado de eventos de cruzamento.

Além disso, o método fornece um meio conveniente para explo-rar uma grande quantidade do possível espaço da variante de proteína emcomparação com outros sistemas. Anteriormente, se fosse gerado, por e-xemplo, 1013 moléculas quiméricas durante uma reação, seria extremamentedifícil testar tal alto número de variantes quiméricas para uma atividade par-ticular. Além disso, uma porção significativa da população de progênie teriaum número muito alto de eventos de cruzamento que resultaria em proteínasque seriam menos prováveis de ter níveis aumentados de uma atividade par-ticular. Dessa forma, embora ainda seja possível gerar 1013 moléculas qui-méricas durante uma reação, cada uma das moléculas escolhidas para aná-lise posterior, terá provavelmente, por exemplo, apenas três eventos de cru-zamento. Devido ào fato de que a população de progênie resultante podeser distorcida para ter um número predeterminado de eventos de cruzamen-to, os limites na variedade funcional entre as moléculas quiméricas são re-duzidos. Isso fornece um número mais controlável de variáveis quando secalcula qual oligonucleotídeo dos polinucleotídeos precursores originais po-de ter sido o responsável por afetar uma característica particular.

Um método para criar uma seqüência de polinucleotídeo de pro-gênie quimérica é criar oligonucleotídeos que correspondem a fragmentosou porções de cada seqüência precursora. Cada oligonucleotídeo inclui pre-ferivelmente uma única região de superposição para que a mistura dos oli-gonucleotídeos resulte em uma nova variante que tem cada um dos frag-mentos de oligonucleotídeo agrupados na ordem correta. Informação adicio-nal pode ser encontrada, por exemplo, em USSN 09/332.835; Patente U.S.N°. 6.361.974.

O número de nucleotídeos gerados para cada variante precurso-ra tem uma relação com o número total de cruzamentos resultantes na mo-lécula quimérica que é criada no final. Por exemplo, três variantes de se-qüência de nucleotídeo precursor podem ser fornecidas para sofrer uma re-ação de ligação a fim de encontrar uma variante quimérica que tem, por e-xemplo, maior atividade em alta temperatura. Como um exemplo, um conjun-to de 50 seqüências de oligonucleotídeo pode ser gerado correspondendo acada porção de cada variante precursora. Conseqüentemente, durante oprocesso de reagrupamento por ligação poderia haver até 50 eventos decruzamento dentro de cada uma das seqüências quiméricas. A probabilidadede cada um dos polinucleotídeos quiméricos gerados conter oligonucleotí-deos de cada variante precursora em ordem alternada é muito alta. Se cadafragmento de oligonucleotídeo estiver presente na reação de ligação namesma quantidade molar, é provável que em algumas posições oligonucleo-tídeos do mesmo polinucleotídeo precursor se liguem próximo ao outro eassim isso não resulte em um evento de cruzamento. Se a concentração decada oligonucleotídeo de cada precursor for mantida constante durantequalquer etapa de ligação nesse exemplo, há 1/3 de chance (considerando 3precursores) de que um oligonucleotídeo da mesma variante precursora seligue dentro da seqüência quimérica e não produza cruzamento.

Conseqüentemente, uma função de densidade de probabilidade(PDF) pode ser determinada para prever a população de eventos de cruza-mento que são prováveis de ocorrer durante cada etapa em uma reação deligação dado um número estabelecido de variantes precursoras, um númerode oligonucleotídeos que correspondem a cada variante, e as concentraçõesde cada variante durante cada etapa na reação de ligação. Os cálculos esta-tísticos e matemáticos por trás da determinação da PDF são descritas abai-xo. Por utilizar esses métodos, pode-se calcular tal função de densidade deprobabilidade, e assim enriquecer a população de progênie quimérica paraum número predeterminado de eventos de cruzamento que resultam de umareação de ligação em particular. Além disso, um número alvo de eventos decruzamento pode ser predeterminado, e o sistema então programado paracalcular as quantidades iniciais de cada oligonucleotídeo precursor durantecada etapa na reação de ligação para resultar em uma função de densidadede probabilidade que se concentra no número predeterminado de eventos decruzamento. Esses métodos são direcionados para o uso de ciclos repetidosde rearranjo redutor, recombinação e seleção que permitem a evolução mo-lecular dirigida de um ácido nucléico que codifica um polipeptídeo através derecombinação. Esse sistema permite a geração de uma grande populaçãoseqüências quiméricas evoluídas, em que a população gerada é significati-vãmente enriquecida para seqüências que têm um número predeterminadode eventos de cruzamento. Um evento de cruzamento é um ponto em umaseqüência quimérica onde ocorre uma alteração na seqüência de uma vari-ante precursora para outra variante precursora. Tal ponto é normalmente ajunção de onde os oligonucleotídeos de duas seqüências precursoras sãoligados para formar uma única seqüência. O método permite o cálculo dasconcentrações corretas de seqüências de oligonucleotídeo para que a popu-lação quimérica final de seqüências seja enriquecida para o número escolhi-do de eventos de cruzamento. Isso fornece mais controle sobre a escolha devariantes quiméricas que tem um número predeterminado de eventos decruzamento.

Além disso, esses métodos fornecem um meio conveniente paraexplorar uma grande quantidade do possível espaço da variante proteína emcomparação a outros sistemas. Pelo uso dos métodos descritos aqui, a po-pulação de moléculas quiméricas pode ser enriquecida com aquelas varian-tes que têm um número particular de eventos de cruzamento. Dessa forma,embora ainda seja possível gerar 1013 moléculas quiméricas durante umareação, cada uma das moléculas escolhida para análise posterior, terá pro-vavelmente, por exemplo, apenas três eventos de cruzamento. Devido àofato de que a população de progênie resultante pode ser distorcida para terum número predeterminado de eventos de cruzamento, os limites na varie-dade funcional entre as moléculas quiméricas são reduzidos. Isso forneceum número mais controlável de variáveis quando se calcula que oligonucleo-tídeo dos polinucleotídeos precursores originais pode ter sido responsávelpor afetar uma característica particular.

Em um aspecto, o método cria uma seqüência de polinucleotí-deo de progênie quimérica por criar oligonucleotídeos que correspondem a1 fragmentos ou porções de cada seqüência precursora. Cada oligonucleotí-deo inclui preferivelmente uma única região de superposição para que a mis-tura dos oligonucleotídeos resulte em uma nova variante que tem cadafragmento de oligonucleotídeo reunido na ordem correta. Veja tambémUSSN 09/332.835.

Determinando eventos de cruzamento

Aspectos de invenção incluem um sistema e um programa querecebem uma função de densidade de probabilidade de cruzamento (PDF),e o número de genes precursores a serem rearranjados, e o número defragmentos no rearranjo como dados de entrada. O dado de saída desseprograma é uma "PDF de fragmento" que pode ser usada para determinaruma fórmula para produzir genes rearranjados, e a PDF de cruzamento es-timada desses genes. O processamento descrito aqui é preferivelmente rea-lizado em MATLAB® (The Mathworks, Natick, Massachusetts) uma Iingua-gem de programação e ambiente de desenvolvimento para computação técnica.

Processos iterativos

Na prática da invenção, esses processos podem ser repetidositerativamente. Por exemplo, um ácido nucléico (ou, o ácido nucléico) res-ponsável por um fenótipo de xilanase, mananase e/ou glicanase alterado ounovo é identificado, reisolado, modificado novamente, retestado quanto àatividade. Esse processo pode ser repetido iterativamente até que um fenó-tipo desejado seja manipulado. Por exemplo, toda a via bioquímica anabólicaou catabólica pode ser manipulada em uma célula, incluindo, por exemplo,uma atividade de xilanase, mananase e/ou glicanase.:

Similarmente, se for determinado que um oligonucleotídeo parti-cular não tem nenhum efeito sobre a característica desejada (por exemplo,um novo fenótipo de xilanase, mananase e/ou glicanase), ele pode ser re-movido como uma variável por sintetizar oligonucleotídeos precursores mai-ores que incluem a seqüência a ser removida. Já que a incorporação da se-qüência dentro de uma seqüência maior evita qualquer evento de cruzamen-to, não haverá mais nenhuma variação dessa seqüência nos polinucleotí-deos de progênie. Essa prática iterativa de determinar quais oligonucleotí-deos são os mais relacionados com a característica desejada, e quais nãosão relacionados, permite uma exploração mais eficaz de todas as variantesde proteína possíveis que podem ser fornecidas com uma característica ouatividade particular.

Embaralhamento in vivo

O embaralhamento in vivo de moléculas é usado em métodosda invenção que fornecem variantes de polipeptídeo da invenção, por exem-pio, anticorpos, xilanases e semelhantes. Embaralhamento in vivo pode serrealizado utilizando a propriedade natural de células de recombinar multíme-ros. Embora a recombinação in vivo tenha fornecido o principal caminho na-tural para a diversidade molecular, a recombinação genética permanece umprocesso relativamente complexo que envolve 1) o reconhecimento de ho-mologias; 2) clivagem da fita, invasão da fita, e etapas metabólicas que le-vam à produção de quiasma recombinante; e finalmente 3) a separação doquiasma em moléculas recombinadas distintas. A formação de quiasma re-quer o reconhecimento de seqüências homólogas.

Em outro aspecto, a invenção inclui um método para produzirum polinucleotídeo híbrido a partir de pelo menos um primeiro polinucleotí-deo e um segundo polinucleotídeo. A invenção pode ser usada para produzirum polinucleotídeo híbrido por introduzir pelo menos um primeiro polínucleo-tídeo e um segundo polinucleotídeo que compartilha pelo menos uma regiãode homologia de seqüência parcial em uma célula hospedeira adequada. Asregiões de homologia parcial de seqüência promovem processos que resul-tam em reorganização da seqüência produzindo um polinucleotídeo híbrido.O termo "polinucleotídeo híbrido", como usado aqui, é qualquer seqüênciade nucleotídeo híbrida que resulta do método da presente invenção e quecontém seqüências de pelo menos duas seqüências de polinucleotídeo ori-ginais. Tais polinucleotídeos híbridos podem resultar de eventos de recom-binação intermolecular que promovem integração de seqüência entre molé-culas de DNA. Além disso, tais polinucleotídeos híbridos podem resultar deprocessos de rearranjo redutor intramolecular que utilizam seqüências repe-tidas para alterar uma seqüência de nucleotídeo dentro de uma molécula deDNA.

O rearranjo in vivo é focado em processos "inter-moleculares"coletivamente referidos como "recom binação" que, em bactérias, é geral-mente visto como um fenômeno "dependente de RecA". A invenção podecontar com processos de recombinação de uma célula hospedeira para re-combinar e rearranjar seqüências, ou a capacidade das células de mediarprocessos redutores para diminuir a complexidade de seqüências quase-repetidas na célula por deleção. Esse processo de "rearranjo redutor" ocorrepor um processo "intra-moleculare" independentes de RecA.

Portanto em outro aspecto da invenção, novos polinucleotídeospodem ser gerados pelo processo de rearranjo redutor. O método envolve ageração de construtos contendo seqüências consecutivas (seqüências codi-ficantes originais), sua inserção em um vetor apropriado e sua subseqüenteintrodução em uma célula hospedeira apropriada. O rearranjo das identida-des moleculares individuais ocorre pode processos combinatórios entre asseqüências consecutivas no construto que possuem regiões de homologia,ou entre unidades quase-repetidas. O processo de rearranjo recombina e/oureduz a complexidade e extensão das seqüências repetidas e resulta naprodução de novas espécies moleculares. Vários tratamentos podem seraplicados para aumentar a taxa de rearranjo. Eles podem incluir tratamentocom luz ultravioleta, ou químicos que danificam o DNA e/ou o uso de linha-gens celulares hospedeiras que apresentam níveis aumentados de "instabili-dade genética". Dessa forma o processo de rearranjo pode envolver a re-combinação homóloga ou a propriedade natural de seqüências quase-repetidas direcionarem sua própria evolução.

Seqüências repetidas ou "quase-repetidas" desempenham umpapel na instabilidade genética. Na presente invenção, "quase-repetições"são repetições que não são restritas a sua unidade estrutural original. Uni-dades quase-repetidas podem ser apresentadas como um arranjo de se-qüências em um construto; unidades consecutivas de seqüências similares.

Uma vez ligadas, as junções entre as seqüências consecutivas se torna es-sencialmente invisível ao nível molecular. O processo de deleção que a célu-Ia realiza para reduzir a complexidade do construto resultante funciona entreas seqüências quase-repetidas. As unidades quase-repetidas fornecem umrepertório praticamente ilimitado de moldes pelos quais eventos de erro po-dem ocorrer. Os construtos contendo as unidades quase-repetidas fornecemeficazmente assim elasticidade molecular suficiente para que eventos dedeleção (e potencialmente inserção) possam ocorrem virtualmente em qual-quer local dentro das unidades quase-repetidas.

Quando as seqüências quase-repetidas estão todas ligadas namesma orientação, por exemplo, cabeça para cauda ou vice-versa, a célulanão pode distinguir unidades individuais. Conseqüentemente, o processoredutor pode ocorrer ao longo de toda a seqüência. Ao contrário, quando,por exemplo, as unidades são apresentadas cabeça para cabeça, ao invésde cabeça para cauda, a inversão delineia os pontos finais da unidade adja-cente para que a formação de deleção favoreça a perda de unidades distin-tas. Dessa forma, é preferível com o presente método que as seqüênciasestejam na mesma orientação. Orientação aleatória de seqüências quase-repetidas oferecerá a maior eficácia. Entretanto, embora ter uma quantidademenor das seqüências contíguas na mesma orientação diminua a eficácia,isso pode fornecer ainda elasticidade suficiente para a recuperação eficaz denovas moléculas. Os construtos podem ser feitos com as seqüências quase-repetidas na mesma orientação para permitir maior eficácia.

As seqüências podem ser agrupadas em uma orientação de ca-beça para cauda usando qualquer um de uma variedade de métodos, inclu-indo os seguintes:

a) Iniciadores que incluem uma cabeça poli-A e uma cauda poli-Aque quando transformados em fita única forneceriam orientação podem serutilizados. Isso é obtido por ter as primeiras poucas bases dos iniciadoresfeitas de RNA e portanto facilmente removíveis por RNAseH.

b) Iniciadores que incluem sítios de clivagem de restrição únicospodem ser utilizados. Múltiplos sítios, uma bateria de seqüências únicas esíntese repetida e etapas de ligação poderiam ser necessários.

c) As poucas bases internas do iniciador podariam ser tioladas euma exonuclease usada para produzir moléculas com a cauda apropriada.

A recuperação das seqüências rearranjadas conta com a identificação devetores de clonagem com um índice repetitivo (RI) reduzido. As seqüênciascodificantes rearranjadas podem então ser recuperadas por amplificação. Osprodutos são reclonados e expressos. A recuperação de vetores de clona-gem com Rl reduzida pode ser afetada por:

1) o uso de vetores mantidos apenas estavelmente quando oconstruto é reduzido em complexidade.

2) A recuperação física de vetores encurtados por procedimentosfísicos. Nesse caso, o vetor de clonagem poderia ser recuperado usandoprocedimentos de isolamento de plasmídeo usuais e fracionado portamanhão em um gel de agarose ou coluna com um ponto de corte de pesomolecular baixo utilizando procedimentos usuais.

3) A recuperação de vetores contendo genes interrompidos quepodem ser selecionados quando o tamanho do inserto diminui.4) O uso de técnicas de seleção direta com um vetor de expressãoe a seleção apropriada.

Seqüências codificantes (por exemplo, genes) de organismosrelacionados podem demonstrar um alto grau de homologia e codificar pro-dutos protéicos bem diversos. Esses tipos de seqüências são particularmen-te úteis na presente invenção como quase-repetições. Entretanto, embora osexemplos ilustrados abaixo demonstrem o rearranjo de seqüências codifi-cantes originais aproximadamente idênticas (quase-repetições), esse pro-cesso não é limitado a tais repetições aproximadamente idênticas.

O seguinte exemplo demonstra um método da invenção. Se-qüências de ácido nucléico codificantes (quase-repetições) derivadas de três(3) espécies únicas são descritas. Cada seqüência codifica uma proteínacom um conjunto distinto de propriedades. Cada uma das seqüências diferepor um único, ou poucos, pares de base em uma única posição na seqüên-cia. As seqüências quase-repetidas são amplificadas separadamente ou co-letivamente e ligadas em agrupamentos aleatórios tal que todas as permuta-ções e combinações possíveis estejam disponíveis na população de molécu-las ligadas. O número de unidades quase-repetidas pode ser controlado pe-las condições de agrupamento. O número médio de unidades quase-repetidas em um construto é definido como o índice repetitivo (RI).

Uma vez formados, os construtos podem ou não ser fracionadospor tamanho e um gel de agarose de acordo com protocolos publicados, in-seridos em um vetor de clonagem e transfectados em uma célula hospedeiraapropriada. As células são então propagadas e "rearranjo redutor" é realiza-do. A taxa do processo de rearranjo redutor pode ser estimulada pela intro-dução de dano no DNA, se desejado. É indiferente se a redução em Rl formediada por formação de deleção entre seqüências repetidas por um meca-nismo "inter-molecular", ou for mediada por eventos semelhantes a recombi-nação através de mecanismos "inter-moleculares". O resultado final é umrearranjo das moléculas em todas as combinações possíveis.Em um aspecto (opcionalmente), o método compreende a etapaadicional de rastrear os membros da biblioteca do grupo embaralhado paraidentificar membros embaralhados individuais da biblioteca que têm a habili-dade de se ligar ou interagir de outra forma, ou catalisar uma reação em par-ticular (por exemplo, tal como um domínio cataiítico de uma enzima) comuma macromolécula predeterminada, tal como, por exemplo, um receptor deproteína, um oligossacarídeo, vírion, ou outro composto ou estrutura prede-terminada.

Os polipeptídeos que são identificados a partir de tais bibliotecaspodem ser usados para fins terapêuticos, diagnósticos, de pesquisa e rela-cionados (por exemplo, catalisadores, solutos para aumentar a osmolaridadede uma solução aquosa e semelhantes) e/ou podem ser submetidos à um oumais ciclos adicionais de embaralhamento e/ou seleção.

Em outro aspecto, é previsto que antes ou durante a recombina-ção, ou rearranjo, os polinucleotídeos gerados pelo método da invençãopossam ser submetidos à agentes ou processos que promovam a introduçãode mutações nos polinucleotídeos originais. A introdução de tais mutaçõesaumentaria a diversidade de polinucleotídeos híbridos resultantes e polipep-tídeos codificados a partir deles. Os agentes ou processos que promovemmutagênese podem incluir, mas não são limitados a: (+)-CC-1065, ou umanálogo sintético tal como (+)-CC-1065-(N3-Adenina (veja Sun & Hurley,(1992); um aducto de 4'-fluro-4-aminobifenil N-acetilado ou desacetilado ca-paz de inibir a síntese de DNA (veja por exemplo, van de Poll et ai. (1992));ou um aducto de 4-aminobifenil N-acetilado ou desacetilado capaz de inibir asíntese de DNA (veja também van de Poll et al. (1992), pp. 751-758); umaducto de DNA de cromo trivalente, de um sal de cromo trivalente, de umhidrocarboneto aromático policíclico (PAH) capaz de inibir a replicação doDNA, tal como 7-bromometol-benz[a]antraceno ("BMA"), tris(2,3-dibromopropil)fosfato ("Tris-BP"), 1,2-dibromo-3-cloropropano ("DBCP"), 2-bromoacroleína (2BA), benzo[a]pireno-7,8-diidrodiol-9-10-epóxido ("BPDE"),um sal de halogênio de platina(ll), N-hidróxi-2-amino-3-metilimidazo[4,5-/]-quinolina ("N-hidróxi-IQ") e N-hidróxi-2-amino-1-metil-6-fenilimidazo[4,5-fl-piridina ("N-hidróxi-FIP"). Meios exemplares para reduzir ou interromper aamplificação por PCR consistem em luz UV (+)-CC-1Ò65 e (+)-CC-1065-(N3-Adenina). Meios particularmente abrangidos são aductos de DNA ou polinu-cleotídeos que compreendem os aductos de DNA dos polinucleotídeos ougrupo de polinucleotídeos, que podem ser liberados ou removidos por umprocesso que inclui aquecer a solução que compreende os polinucleotídeosantes de processamento adicional.

Outro aspecto da invenção é direcionado para um método deproduzir proteínas recombinantes que têm uma atividade biológica por trataruma amostra que compreende polinucleotídeos molde de fita dupla que codi-ficam uma proteína tipo selvagem sob condições de acordo com a invençãoque fornecem a produção de polinucleotídeos híbridos ou rearranjados.

Produzindo variantes de seqüência

A invenção também fornece métodos adicionais para fazer vari-antes de seqüência das seqüências de ácido nucléico (por exemplo, xilana-se) da invenção. A invenção também fornece métodos adicionais para isolarxilanases usando os ácidos nucléicos e polipeptídeos da invenção. Em umaspecto, a invenção fornece variantes de uma seqüência codificante de xila-nase (por exemplo, um gene, cDNA ou mensagem) da invenção, que podeser alterada por qualquer meio, incluindo por exemplo, por métodos aleató-rios ou estocásticos, ou métodos não-estocásticos, ou de "evolução dirigida",como descrito acima.

As variantes isoladas podem ser de ocorrência natural. A varian-te também pode ser criada in vitro. Variantes podem ser criadas usando téc-nicas de manipulação genética tais como mutagênese sítio-direcionada, mu-tagênese química aleatória, procedimentos de deleção por exonucleoase III,e técnicas de clonagem usuais. Alternativamente, tais variantes, fragmentos,análogos, ou derivados podem ser criados usando síntese química ou pro-cedimentos de modificação. Outros métodos de fazer variantes também sãofamiliares daqueles versados na técnica. Esses incluem procedimentos nosquais seqüências de ácido nucléico obtidas de isolados naturais são modifi-cadas para gerar novos ácidos nucléicos que codificam polipeptídeos quetêm características que aumentam seu valor em processos e aplicações in-dustriais, médicas, de laboratório (pesquisa), farmacêuticas, de alimentos erações e suplementos alimentares e de rações e outros. Em tais procedi-mentos, um grande número de seqüências variantes que têm uma ou maisdiferenças de nucleotídeo com relação à seqüência obtida do isolado naturalsão geradas e caracterizadas. Essas diferenças de nucleotídeo podem resul-tar em alterações de aminoácido com relação aos polipeptídeos codificadospelos ácidos nucléicos dos isolados naturais.

Por exemplo, variantes podem ser criadas usando a técnica de"error prone" PCR. Na "error prone" PCR, a PCR é realizada sob condiçõesonde a fidelidade de cópia da DNA polimerase é baixa, tal que uma alta taxade mutações pontuais é obtida ao longo de toda a extensão do produto dePCR. "Error prone" PCR é descrita, por exemplo, em Leung, D.W., et ai,Technique, 1:11-15, 1989) e Caldwell, R. C. & Joyce G.F., PCR MethodsApplic., 2:28-33, 1992. Resumidamente, em tais procedimentos, os ácidosnucléicos a ser mutagenizados são misturados com iniciadores de PCR,tampão de reação, MgCI2, MnCI2, Taq polimerase e uma concentração apro-priada de dNTPs para se obter uma alta taxa de mutação pontual ao longode toda a extensão do produto de PCR. Por exemplo, a reação pode ser e-xecutada usando 20 fmoles de ácido nucléico a ser mutagenizado, 30 pmo-les de cada iniciador de PCR, um tampão de reação que compreende KCI50mM, Tris HCI 10mM (pH 8.3) e gelatina 0,01%, MgCI2 7mM, MnCI20,5mM, 5 unidades de Taq polimerase, dGTP 0,2mM, dATP 0,2mM, dCTP1mM, e dTTP 1mM. PCR pode ser executada por 30 ciclos de 94°C por 1min, 45°C por 1 min, e 72°C por 1 min. Entretanto, será observado que es-ses parâmetros podem ser alterado conforme apropriado. Os ácidos nucléi-cos mutagenizados são clonados em um vetor apropriado e as atividadesdos polinucleotídeos codificados pelos ácidos nucléicos mutagenizados sãoavaliadas.As variantes também podem ser criadas usando mutagênesedirecionada por oligonucleotídeo para gerar mutações sítio-específicas emqualquer DNA clonado de interesse. Mutagênese por oligonucleotídeo édescrita, por exemplo, Reidhaar-Olson (1988) Science 241:53-57. Resumi-damente, em tais procedimentos uma grande quantidade de oligonucleotí-deos de fita dupla carregando uma ou mais mutações a ser introduzidas noDNA clonado são sintetizados e inseridos no DNA clonado a ser mutageni-zado. Clones contendo o DNA mutagenizado são recuperados e as ativida-des dos polinucleotídeos que eles codificam são avaliadas.

Outro método para gerar variantes é "assembly" PCR. "Assem-bly" PCR envolve o agrupamento de um produto de PCR de uma mistura depequenos fragmentos de DNA. Um grande número de diferentes reações dePCR ocorrem um paralelo no mesmo frasco, com os produtos de uma rea-ção iniciando os produtos de outra reação. "Assembly" PCR é descrita, porexemplo, na Patente U.S. N°. 5.965.408.

Outro método ainda de gerar variantes é mutagênese por PCRsexual. Na mutagênese por PCR sexual, recombinação homóloga forçadaocorre entre moléculas de DNA de uma seqüência de DNA diferente, masaltamente relacionada in vitro, como um resultado de fragmentação aleatóriada molécula de DNA baseada em homologia de seqüência, seguido por fixa-ção do cruzamento por extensão do iniciador em uma reação de PCR. Mu-tagênese por PCR sexual é descrita, por exemplo, em Stemmer (1994) Proc.Natl. Acad. Sei. USA 91:10747-10751. Resumidamente, em tais procedimen-tos uma pluralidade de ácidos nucléicos a serem recombinados são digeri-dos com DNAse para gerar fragmentos que têm um tamanho médio de 50 a200 nucleotídeos. Fragmentos do tamanho médio desejado são purificados eressuspensos em uma mistura de PCR. A PCR é conduzida sob condiçõesque facilitam a recombinação entre os fragmentos de ácido nucléico. Porexemplo, a PCR pode ser executada por ressuspender os fragmentos purifi-cados em uma concentração de 10 a 30ng/pl em uma solução de 0,2mM decada dNTP, 2,2mM de MgCI2, 50mM de KCL, 10mM de Tris HCI, pH 9.0, eTriton X-100 0,1%. 2,5 unidades de Taq polimerase por 100:1 da mistura dereação é adicionada e PCR é executada usando o seguinte regime: 94°Cpor 60 segundos, 94°C por 30 segundos, 50 a 55°C por 30 segundos, 72°Cpor 30 segundos (30 a 45 vezes) e 72°C por 5 minutos. Entretanto, será ob-servado que esses parâmetros podem ser alterados como apropriado. Emalguns aspectos, os oligonucleotídeos podem ser incluídos nas reações dePCR. Em outros aspectos, o fragmento de Klenow da DNA polimerase I po-de ser usado em um primeiro grupo de reações de PCR e Taq polimerasepode ser usada em um grupo subseqüente de reações de PCR. Seqüênciasrecombinantes são isoladas e as atividades dos polipeptídeos que elas codi-ficam são avaliadas.

Variantes também podem ser criadas por mutagênese in vivo.Em alguns aspectos, mutações aleatórias em uma seqüência de interessesão geradas por propagar a seqüência de interesse em uma cepa bacteria-na, tal como uma cepa de E. coli, que carrega mutações em uma ou maisdas vias de reparo de DNA. Tais cepas "mutantes" têm uma taxa de muta-ção maior do que aquela de um precursor tipo selvagem. Propagar o DNAem uma dessas cepas eventualmente irá gerar mutações aleatórias dentrodo DNA. Cepas mutantes adequadas para uso em mutagênese in vivo sãodescritas na Publicação PCT N0. WO 91/16427, publicada em 31 de outubrode 1991, intitulado "Methods for Phenotype Creation from Multiple Gene Po-pulations".

Variantes também podem ser geradas usando mutagênese decassete. Na mutagênese de cassete uma pequena região de uma moléculade DNA de fita dupla é substituída por um "cassete" de oligonucleotídeo sin-tético que difere da seqüência nativa. O oligonucleotídeo contém freqüente-mente seqüência nativa completamente e/ou parcialmente randomizada.

Mutagênese de agrupamentos repetitivos também pode ser u-sada para gerar variantes. Mutagênese de agrupamentos repetitivos é umalgoritmo para manipulação de proteína (mutagênese de proteína) desenvol-vido para produzir diversas populações de mutantes fenotipicamente rela-cionados cujos membros diferem na seqüência de aminoácido. Esse métodousa um mecanismo de retroalimentação para controlar rodadas sucessivasde mutagênese de cassete combinatória. Mutagênese de agrupamentos re-petitivos é descrita em Arkin, A.P. & Youvan, D.C., PNAS, USA, 89:7811-7815, 1992.

Em alguns aspectos, são criadas variantes usando mutagênesede agrupamento exponencial. Mutagênese de agrupamento exponencial éum processo para gerar bibliotecas combinatórias com uma alta porcenta-gem de mutantes únicos e funcionais, em que pequenos grupos de resíduossão randomizados em paralelo para identificar, em cada posição alterada, osaminoácidos que levam a proteínas funcionais. A mutagênese de agrupa-mento exponencial é descrita em Delegrave, S. & Youvan, D.C., Biotechno-Iogy Research, IJ.: 1548-1552, 1993. Mutagênese aleatória e sítio-direcionada são descritos em Arnold, F.H., Current Opinion in Biotechnology,4:450-455, 1993.

Em alguns aspectos, as variantes são criadas usando procedi-mentos de embaralhamento em que porções de uma pluralidade de ácidosnucléicos que codificam polipeptídeos distintos são fundidos juntos para criarseqüências de ácido nucléico quiméricas que codificam polipeptídeos quimé-ricos como descrito na Patente U.S. N0. 5.965.408, depositada em 9 de julhode 1996, intitulada, "Method of DNA Reassembly by Interrupting Synthesis" ePatente U.S. N°. 5.939.250, depositada em 22 de maio de 1996, intitulada,"Production of Enzymes Having Desired Activities by Mutagenesis.

As variantes dos polipeptídeos da invenção podem ser variantesnas quais um ou mais dos resíduos de aminoácido dos polipeptídeos da in-venção são substituídos por um resíduo de aminoácido conservado ou não-conservado (preferivelmente um resíduo de aminoácido conservado) e talresíduo de aminoácido substituído pode ou não ser um codificado pelo códi-go genético.

Substituições conservativas são aquelas que substituem um da-do aminoácido em um polipeptídeo por outro aminoácido de característicassemelhantes. Tipicamente vistas como substituições conservativas são asseguintes substituições: substituições de um aminoácido alifático tal comoAlanina, Valina, Leucina e Isoleucina por outro aminoácido alifático; substitu-ição de uma Serina por uma Treonina ou vice-versa; substituição de um re-síduo ácido tal como ácido Aspártico e ácido Glutâmico por outro resíduoácido; substituição de um resíduo que carrega um grupo amida, tal comoAsparagina e Glutamina1 por outro resíduo que carrega um grupo amida;troca de um resíduo básico tal como Lisina e Arginina por outro resíduo bá-sico; e substituição de um resíduo aromático por tal como Fenilalanina, Tiro-sina por outro resíduo aromático.

Outras variantes são aquelas nas quais um ou mais dos resí-duos de aminoácido dos polipeptídeos da invenção inclui um grupo substitu-inte.

Outras variantes ainda são aquelas nas quais o polipeptídeoestá associado com outro composto, tal como um composto para aumentar ameia vida do polipeptídeo (por exemplo, polietileno glicol).

Variantes adicionais são aquelas nas quais aminoácidos adicio-nais são fundidos ao polipeptídeo tal como uma seqüência líder, uma se-qüência secretária, uma seqüência de pró-proteína ou uma seqüência quefacilita a purificação, enriquecimento, ou estabilização do polipeptídeo.

Em alguns aspectos, os fragmentos, derivados e análogos retêma mesma função biológica ou atividade que os polipeptídeos da invenção eseqüências substancialmente idênticas a elas. Em outros aspectos, o frag-mento, derivado, ou análogo inclui uma pró-proteína, e tal que o fragmento,derivado ou análogo possa ser ativado por clivagem da porção de pró-proteína para produzir para produzir um polipeptídeo ativo.Otimizando códons para obter altos níveis de expressão de proteína emcélulas hospedeiras

A invenção fornece métodos para modificar ácidos nucléicosque codificam xilanase para modificar o uso de códon. Em um aspecto, ainvenção fornece métodos para modificar códons em um ácido nucléico quecodifica uma xilanase para aumentar ou diminuir sua expressão em umacélula hospedeira. A invenção também fornece ácidos nucléicos quecodificam uma xilanase modificada para aumentar sua expressão em umacélula hospedeira, xilanase assim modificada e métodos de fazer asxilanases modificadas. O método compreende identificar um códon "não-preferido" ou "menos preferido" em um ácido nucléico que codifica xilanase esubstituir um ou mais desses códons não-preferidos ou menos preferidos porum "códon preferido" que codifica o mesmo aminoácido que o códonsubstituído e pelo menos um códon não-preferido ou menos preferido noácido nucléico foi substituído por um códon preferido que codifica o mesmoaminoácido. Um códon preferido é super-representado em seqüênciascodificantes em genes na célula hospedeira e um códon não-preferido oumenos preferido é um códon sub-representado em seqüências codificantesem genes na célula hospedeira.

Células hospedeiras para expressar os ácidos nucléicos,cassetes de expressão e vetores da invenção incluem bactérias, levedura,fungos, células de planta ou células de mamífero. Dessa forma, a invençãofornece métodos para otimizar o uso de códon em todas essas células,ácidos nucléicos alterados e polipeptídeos feitos pelos ácidos nucléicos comcódon alterado. Células hospedeiras exemplares incluem bactérias gram-negativas, tal como Escherichia coli e Pseudomonas fíuorescens·, bactériasgram positivas, tais como Streptomyces diversa, Laetobaeillus gasseri,Laetococeus laetis, Lactoeoceus eremoris, Baeillus subtilis. Célulashospedeiras exemplares também incluem organismos eucarióticos, porexemplo, várias leveduras, taiscomo Saccharomyees sp., incluindoSaccharomyces eerevisiae, Schizosaeeharomyces pombe, Piehia pastoris, eKluyveromyces laetis, Hansenula polymorpha, Aspergillus niger, e células elinhagens celulares de mamífero e células e linhagens celulares de inseto.

Dessa forma, a invenção também inclui ácidos nucléicos e polipeptídeosotimizados para expressão nesses organismos e espécies.Por exemplo, os códons de um ácido nucléico que codifica umaxilanase isolada de uma célula bacteriana são modificados para que o ácidonucléico seja otimamente expresso em uma célula bacteriana diferente dabactéria da qual a xilanase foi derivada, uma levedura, um fungo, uma célulaplanta ou uma célula de inseto ou uma célula de mamífero. Métodos paraotimizar códons são bem-conhecidos na técnica, veja, por exemplo, PatenteU.S. 5.795.737; Baca (2000) Int. J. Parasitol. 30:113-118; Hale (1998)Protein Expr. Purif. 12:185-188; Narum (2001) Infect. Immun. 69:7250-7253.Veja também Narum (2001) Infect. Immun. 69:7250-7253, que descreveotimização de códons em sistemas de camundongo; Outchkourov (2002)Protein Expr. Purif. 24:18-24, que descreve otimização de códons emlevedura; Feng (2000) Biochemistry 39:15399-15409, que descreveotimização de códons em E. colr, Humphreys (2000) Protein Expr. Purif.20:252-264, que descreve otimização de uso códon que afeta secreção emE.coli.

Animais transqênicos não-humanos

A invenção fornece animais não-humanos transgênicos quecompreendem um ácido nucléico, um polipeptídeo (por exemplo, uma xila-nase), um cassete de expressão ou um vetor ou uma célula transfectada outransformada da invenção. A invenção também fornece métodos de fazer eusar esses animais transgênicos não humanos.

Os animais transgênicos não-humanos podem ser, por exemplo,cabras, coelhos, ovelha, porcos, vacas, ratos, cavalos, cachorros, peixe ecamundongos, compreendendo os ácidos nucléicos da invenção. Esses a-nimais podem ser usados, por exemplo, como modelos in vivo para estudaratividade de xilanase, ou como modelos para rastrear por agentes que alte-ram a atividade de xilanase in vivo. As seqüências codificantes para os poli-peptídeos a ser expressos nos animais transgênicos não-humanos podemser desenhados para ser constitutivos, ou sob o controle de fatores regulató-rios transcricionais tecido-específicos, específicos do desenvolvimento ouinduzíveis. Animais transgênicos não-humanos podem ser projetados e ge-rados usando qualquer método conhecido na técnica; veja, por exemplo,Patentes U.S. Nos. 6.211.428; 6.187.992; 6.156.952; 6.118.044; 6.111.166;6.107.541; 5.959.171; 5.922.854; 5.892.070; 5.880.327; 5.891.698;5.639.940; 5.573.933; 5.387.742; 5.087.571, que descrevem fazer e usarcélulas e ovos transformados em camundongos, ratos, coelhos, ovelhas,porcos, galinhas, cabras, peixe e vacas. Veja também, por exemplo, Pollock(1999) J. Immunol. Methods 231:147-157, que descreve a produção de pro-teínas recombinantes no leite de animais produtores de leite; Baguisi (1999)Nat. Biotechnol. 17:456-461, que demonstra a produção de cabras transgê-nicas. Patente U.S. N°. 6.211.428, descreve fazer e usar mamíferos trans-gênicos não humanos que expressam nos seus cérebros um construto deácido nucléico que compreende uma seqüência de DNA. A Patente U.S. N°:5.387.742, descreve injetar seqüências de DNA clonado e recombinante emovos de camundongo fertilizados, implantar os ovos injetados em fêmeaspseudo-grávidas, e criar até o nascimento camundongos transgênicos cujascélulas expressam proteínas relacionadas com a patologia da doença deAlzheimer. Patente U.S. N°. 6.187.992, descreve fazer e usar um camun-dongo transgênico cujo genoma compreende uma quebra do gene que codi-fica a proteína precursora de amilóide (APP).

"Animais knockout' também podem ser usados para praticar osmétodos da invenção. Por exemplo, em um aspecto, os animais transgêni-cos ou modificados da invenção compreendem um "animal knockout", porexemplo, um "camundongo knockout", manipulado para não expressar umgene endógeno, que é substituído por um gene que expressa uma xilanaseda invenção, ou, uma proteína de fusão que compreende uma xilanase dainvenção.

Plantas e sementes transaênicas

A invenção fornece plantas e sementes transgênicas que com-preendem um ácido nucléico, um polipeptídeo (por exemplo, uma xilanase),um cassete de expressão ou um vetor ou célula transfectada ou transforma-da da invenção. A invenção também fornece produtos ou sub-produtos deplanta, por exemplo, frutas, óleos, sementes, folhas, extratos e semelhantes,incluindo qualquer parte de planta, que compreende um ácido nucléico e/oupolipeptídeo (por exemplo, uma xilanase) da invenção, por exemplo, em queo ácido nucléico ou polipeptídeo da invenção é heterólogo para a planta, par-te de planta, semente etc. A planta transgênica (que inclui partes de planta,frutas, sementes, etc) pode ser dicotiledônea (dicot.) ou monocotiledônea(monocot.). A invenção também fornece métodos de fazer e usar essas plan-tas e sementes transgênicas. A planta ou célula de planta transgênica ex-pressando um polipeptídeo da presente invenção pode ser construída deacordo com quaisquer métodos conhecidos na técnica. Veja, por exemplo,1 Patente U.S. N°. 6.309.872.

Ácidos nucléicos e construtos de expressão da invenção podemser introduzidos em uma célula de planta por qualquer meio. Por exemplo,ácidos nucléicos ou construtos de expressão podem ser introduzidos no ge-noma de um hospedeiro de planta desejado, ou, os ácidos nucléicos ouconstrutos de expressão podem ser epissomas. A introdução no genoma deuma planta desejada por ser tal que a produção de xilanase do hospedeiro éregulada por elementos de controle transcricional ou traducional endógenos.

A invenção também fornece "plantas knockout" onde a inserção da seqüên-cia do gene, por exemplo, por recombinação homóloga, interrompe a ex-pressão do gene endógeno. Meios para gerar plantas "knockout" são bem-conhecidos na técnica, veja, por exemplo, Strepp (1998) Proc Natl. Acad.Sei. USA 95:4368-4373; Miao (1995) Plant J 7:359-365. Veja discussão so-bre plantas transgênicas, abaixo.

Os ácidos nucléicos da invenção podem ser usados para confe-rir características desejadas a essencialmente qualquer planta, por exemplo,plantas produtoras de amido, tais como batata, trigo arroz, cevada, e seme-lhantes. Ácidos nucléicos da invenção podem ser usados para manipularvias metabólicas de uma planta a fim de otimizar ou alterar a expressão dexilanase do hospedeiro. Os ácidos nucléicos podem alterar a atividade dexilanase em uma planta. Alternativamente, uma xilanase da invenção podeser usada na produção de uma planta transgênica para produzir um compos-to não produzido naturalmente por aquela planta. Isso pode reduzir os cus-tos de produção ou criar um novo produto.

Em um aspecto, a primeira etapa na produção de uma plantatransgênica envolve fazer um construto de expressão para expressão umacélula de planta. Essas metodologias são bem-conhecidas na técnica. Elaspodem incluir selecionar e clonar um promotor, uma seqüência codificantepara facilitar a ligação eficaz de ribossomos ao mRNA e selecionar as se-qüências gênicas terminadoras apropriadas. Um exemplo de promotor cons-titutivo é CaMV35S, do vírus do mosaico da couve flor, que geralmente re-sulta em um alto grau de expressão em plantas. Outros promotores são maisespecíficos e respondem a sinais no ambiente interno ou externo da planta.Um exemplo de promotor induzível por luz é o promotor do gene cab, quecodifica a proteína de ligação de clorofila a/b principal.

Em um aspecto, o ácido nucléico é modificado para obter maiorexpressão em uma célula de planta. Por exemplo, uma seqüência da inven-ção provavelmente terá uma porcentagem maior de pares de nucleotídeo A-T em comparação com a vista em uma planta, algumas das quais preferempares de nucleotídeos G-C. Portanto, nucleotídeos A-T na seqüência codifi-cante podem ser substituídos por nucleotídeos G-C sem alterar significati-vamente a seqüência de aminoácido para aumentar a produção do produtodo gene em células de planta.

Genes marcadores selecionáveis podem ser adicionais ao cons-truto do gene para identificar células de planta ou tecidos que se integraramcom sucesso ao transgene. Isso pode ser necessário porque alcançar incor-poração e expressão de genes em células de planta é um evento raro, queocorre em apenas um baixo percentual de células ou tecidos atingidos. Ge-nes marcadores selecionáveis codificam proteínas que fornecem resistênciaà agentes que são normalmente tóxicos para plantas, tais como antibióticosou herbicidas. Apenas células de planta que integraram o gene marcadorselecionável irão sobreviver quando cultivadas em um meio que contém oantibiótico ou herbicida apropriado. Da mesma forma que para outros genesinseridos, genes marcadores também requerem seqüências promotoras eterminadoras para função apropriada.

Em um aspecto, fazer plantas transgênicas ou sementes com-preende incorporar seqüências da invenção e, em um aspecto (opcional-mente), genes marcadores em um construto de expressão alvo (por exem-plo, um plasmídeo), junto com posicionamento do promotor e das seqüên-cias terminadoras. Isso pode envolver transferir o gene modificado para den-tro da planta através de um método adequado. Por exemplo, um construtopode ser introduzido diretamente no DNA genômico da célula de planta u-sando técnicas tais como eletroporação e microinjeção de protoplastos decélula de planta, ou os construtos podem ser introduzidos diretamente aotecido da planta usando métodos balísticos, tal como bombardeio de partícu-la de DNA. Por exemplo, veja Christou (1997) Plant Mol. Biol. 35:197-203;Pawlowski (1996) Mol. Biotechnol. 6:17-30; Klein (1987) Nature 327:70-73;Takumi (1997) Genes Genet. Syst. 72:63-69, que discutem o uso de bom-bardeio de partículas para introduzir transgenes em trigo; e Adam (1997)supra, para o uso de bombardeio de partículas para introduzir YACs em cé-lulas de planta. Por exemplo, Rinehart (1997) supra, usou bombardeio departículas para gerar plantas de algodão transgênicas. Equipamentos paraacelerar partículas são descritos Patente U.S. N°. 5.015.580; e, instrumentode aceleração de partícula PDS-2000 BioRad (BioIistics) disponível comerci-almente; veja, por exemplo, John, Patente U.S. N°. 5.608.148; e Ellis, Paten-te U.S. N°. 5.681.730, que descrevem transformação de gimnospermas me-diada por partícula.

Em um aspecto, protoplastos podem ser imobilizados e injeta-dos com ácidos nucléicos, por exemplo, um construto de expressão. Emboraa regeneração da planta a partir de protoplastos não seja fácil com cereais, aregeneração da planta é possível em legumes usando embriogênese somá-tica de calos derivados de protoplastos. Tecidos organizados podem sertransformados com DNA nu usando técnica de arma de genes, onde o DNAé revestido em microprojéteis de tungstênio, bala de 1/100 do tamanho dascélulas, que carregam o DNA para dentro de células e organelas. Tecidotransformado é então induzido a se regenerar, geralmente por embriogênesesomática. Essa técnica foi bem sucedida em várias espécies de cereal inclu-indo milho e arroz.

Ácidos nucléicos, por exemplo, construtos de expressão, tam-bém podem ser introduzidos em células de planta usando vírus recombinan-tes. Células de planta podem ser transformadas usando vetores virais, taiscomo, por exemplo, vetores derivados do vírus do mosaico do tabaco (Rou-wendal (1997) Plant MoL Biol. 33:989-999), veja Porta (1996) "Use of viralreplicons for the expression of genes in plants," Mol. Biotechnol. 5:209-221.

Alternativamente, ácidos nucléicos, por exemplo um construtode expressão, podem ser combinados com regiões flanqueadoras de T-DNAadequadas e introduzidos em um vetor hospedeiro de Agrobacterium tume-faciens. As funções de virulência do hospedeiro de Agrobacterium tumefaci-ens direcionarão a inserção do construto e marcador adjacente para o DNAda célula de planta quando a célula for infectada pela bactéria. Técnicas detransformação mediada Agrobacterium tumefaciens, incluindo desarmamen-to e uso de vetores binários, são bem descritas na literatura científica. Vejapor exemplo, Horsch (1984) Science 233:496-498; Fraley (1983) Proc. NatLAcad. Sei. USA 80:4803 (1983); Gene Transfer to Plants, Potrykus, ed. (S-pringer-Verlag, Berlin 1995). O DNA em uma célula de A. tumefaciens estácontido no cromossomo bacteriano assim como em outra estrutura conheci-da como um plasmídeo Ti (indutor de tumor). O plasmídeõ Ti contém umaextensão de DNA chamada T-DNA (-20 kb de comprimento) que é transferi-da para a célula de planta no processo de infecção e uma série de genes vir(virulência) que direcionam o processo de infecção. A. tumefaciens podeinfectar uma planta apenas através de feridas: quando uma raiz ou caule daplanta é ferido ele libera certos sinais químicos, em resposta aos quais, osgenes vir de A. tumefaciens se tornam ativados e direcionam uma série deeventos necessários para a transferência do T-DNA do plasmídeo Ti para ocromossomo da planta. O T-DNA então entra na célula da planta através daferida. Uma especulação é que o T-DNA espere até que o DNA da plantaesteja sendo replicado ou transcrito, então se insere no DNA exposto. A fimde usar A. tumefaciens como um vetor de transgene, a seção indutora detumor de um T-DNA tem que ser removida, enquanto se mantém as regiõesde borda do T-DNA e os genes vir. O transgene é então inserido entre asregiões de borda do T-DNA, onde ele é transferido para a célula da planta ese torna integrado aos cromossomos da planta.

A invenção fornece a transformação de plantas monocotiledô-neas usando os ácidos nucléicos da invenção, incluindo cereais importantes,veja Hiei (1997) Plant Mol. Biol. 35:205-218. Veja também, por exemplo,Horsch, Science (1984) 233:496; Fraley (1983) Proc. Natl. Acad. Sci USA80:4803; Thykjaer (1997) supra; Park (1996) Plant Mol. Biol. 32:1135-1148,que discutem a integração de T-DNA no DNA genômico. Veja tambémD1HaIIuin1 Patente U.S. N°. 5.712.135, que descreve um processo para aintegração estável de um DNA que compreende um gene que é funcional emuma célula de um cereal, ou outra planta monocotiledôneav-

Em um aspecto, a terceira etapa pode envolver seleção e rege-neração de plantas inteiras capazes de transmitir o gene alvo incorporadopara a próxima geração. Tais técnicas de regeneração contam com a mani-pulação de certos fitormônios em um meio de crescimento de cultura de te-cido, contando tipicamente com um marcador de biocida e/ou herbicida quefoi introduzido junto com as seqüências de nucleotídeo desejadas. A regene-ração de planta de protoplastos cultivados é descrita em Evans et al., Proto-plasts Isolation and Culture, Handbook of Plant Cell Culture, pp. 124-176,MacMiIIiIan Publishing Company, Nova Iorque, 1983; e Binding, Regenerati-on of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985. Aregeneração também pode ser obtida de calos, explantes, órgãos de plantaou partes destes. Tais técnicas de regeneração são descritas geralmente emKlee (1987) Ann. Rev. of Plant Phys. 38:467-486. Para obter plantas inteirasde tecidos transgênicos tais como embriões imaturos, eles podem ser culti-vados sob condições ambientais controladas em uma série de meios con-tendo nutrientes e hormônios, um processo conhecido como cultura de teci-do. Uma vez que plantas inteiras são geradas e produzem semente, a avali-ação da progênie começa.

Após o cassete de expressão estar integrado estavelmente emplantas transgênicas, ele pode ser introduzido em outras plantas por cruza-mento sexual. Quaisquer de várias técnicas de reprodução usuais podemser usada, dependendo da espécie a ser cruzada. Já que expressão trans-gênica dos ácidos nucléicos da invenção leva a alterações fenotípicas, plan-tas que compreendem os ácidos nucléicos recombinantes da invenção po-dem ser cruzadas sexualmente com uma segunda planta para obter um pro-duto final. Dessa forma, a semente da invenção pode ser derivada de umcruzamento entre duas plantas transgênicas da invenção, ou um cruzamentoentre uma planta da invenção e outra planta. Os efeitos desejados (por e-xemplo, expressão dos polipeptídeos da invenção para produzir uma plantana qual o comportamento de floração é alterado) podem ser aumentadosquando ambas as plantas, progenitoras expressam os polipeptídeos (por e-xemplo, uma xilanase) da invenção. Os efeitos desejados podem ser passa-dos para gerações de plantas futuras por meios de propagação usuais.

Os ácidos nucléicos e polipeptídeos da invenção são expressosou inseridos em qualquer planta ou semente. Plantas transgênicas da inven-ção podem ser dicotiledôneas ou monocotiledôneas. Exemplos de plantastransgênicas monocotiledôneas dã invenção são gramas, tais como capimdo campo (blue grass, Poá), grama de forragem tais como festuca, azevem,grama temperada, tal como Agrostis, e cereais, por exemplo, trigo, aveia,centeio, cevada, arroz, sorgo, e milho graúdo (milho). Exemplos de plantastransgênicas dicotiledôneas da invenção são tabaco, legumes, tais comotremoceiro, batata, beterraba, ervilha, feijão e soja, e plantas crucíferas (fa-mília Brassicaceae), tais como couve-flor, colza, e o organismo modelo inti-mamente relacionado Arabidopsis thaliana. Dessa forma, as plantas e se-mentes transgênicas da invenção incluem uma ampla gama de plantas, in-cluindo, mas não limitados a, espécies dos gêneros Anacardium, Arachis,Asparagus, Atropa, Avena, Brassica, Citrus, Citrullus, Capsicum, Carthamus,Cocos, Coffea, Cucumis, Cucurbita, Daueus, Elaeis, Fragaria, Glycine,Gússypium, Helianthus, Heterocallis, Hordeum, Hyoscyamus, Lactuca, Li-num, Loiium, Lupinus, Lycopersicon, Malus, Manihot, Majorana, Medicago,Nicotiana, Olea, Oryza, Panieum, Pannisetum, Persea, Phaseolus, Pistachia,Pisum, Pyrus, Prunus, Raphanus, Rieinus, Secale, Senecio, Sihapis, Sola-num, Sorghum, Theobromus, Trigonella, Triticum, Vicia, Vitis, Vigna, e Zea.Plantas e sementes transgênicas da invenção podem ser qualquer monocoti-ledônea ou dicotiledônea, por exemplo, um milho monocotiledôneo, cana-de-açúcar, arroz, trigo, cevada, "switchgrass" ou Miseanthus; ou um cultivo dedicotiledônea de semente oleosa, soja, canola, semente de colza, linho, al-godão, óleo de palma, cana-de-açúcar, amendoim, árvores, álamo ou tremo-ceiro.

Em modalidades alternativas, os ácidos nucléicos da invençãosão expressos em plantas (e/ou suas sementes) que contêm células fibro-sas, incluindo, por exemplo, algodão, árvore do algodão de seda (sumaúma,Ceiba pentandra), salgueiro do deserto, arbusto de creosoto, "winterfat", paude balsa, rami, kenaf, cânhamo, hibisco, juta, sisal, abacá, e linho. Em mo-dalidadés alternativas, as plantas transgênicas da invenção podem sermembros do gênero Gossypium, incluindo membros de qualquer uma dasespécies Gossypium, tais como G. arboreum;. G. herbaeeum, G. barbaden-se, e G. hirsutum.

A invenção também fornece plantas transgênicas (e/ou suassementes) para serem usadas para produzir grandes quantidades dos poli-peptídeos (por exemplo, uma xilanase ou anticorpo) da invenção. Por exem-plo, veja Palmgren (1997) Trends Genet. 13:348; Chong (1997) TransgenicRes. 6:289-296 (que produz proteína beta-caseína de leite humano em plan-tas de batata transgênica usando um promotor de manopina sintase(masl',21) bidirecional induzido por auxina com métodos de transformaçãode disco foliar mediados por Agrobaeterium tumefaeiens).Usando procedimentos conhecidos, um versado na técnica podepesquisar plantas (e/ou suas sementes) da invenção por detectar o aumentoou diminuição de mRNA ou proteína de transgene em plantas transgênicas.Meios para detectar e quantificar mRNAs ou proteínas são bem-conhecidosna técnica.

Polipeptídeos e peptídeos

Em um aspecto, a invenção fornece polipeptídeos e peptídeosisolados, sintéticos ou recombinantes que têm uma atividade de xilanase,mananase e/ou glicanase, ou polipeptídeos e peptídeos capazes de gerarum anticorpo que se liga especificamente a uma xilanase ou uma glicanase,incluindo uma enzima dessa invenção, incluindo as seqüências deaminoácido da invenção, que incluem aquelas que têm pelo menos 50%,51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%,64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%,77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%,90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais, ou 100%de identidade de seqüência (completa) a um polipeptídeo exemplar dainvenção (como definido acima), por exemplo, qualquer uma das seqüênciasexemplares da invenção - que são todas as seqüências pares entre SEQ IDNO:2 e SEQ ID NO:636 (veja a listagem de seqüência); e fragmentosenzimaticamente ativos destas.

Várias características e propriedades de polipeptídeosexemplares da invenção são descritos nos Exemplos 13 a 15, abaixo.

A invenção também fornece ácidos nucléicos codificantes deenzima com uma inovação em comum, na qual eles codificam um novosubgrupo de xilanases ou um ciado, compreendendo o "módulo X14". Emum aspecto, a invenção também fornece ácidos nucléicos codificantes deenzimas com uma inovação em comum na qual eles codificam um ciado quecompreende o "módulo X14" (J Bacteriol., Agosto de 2002; 184(15): 4124-4133). Os membros de xilanase que compreendem X14 deste ciado estãolistados na Tabela 9 abaixo. Dessa forma, em um aspecto, a invençãofornece um novo gênero de xilanases que compreende os membros dexilanase do ciado listado na Tabela 9, abaixo e enzimas relacionadas (porexemplo, xilanases que têm 50% de identidade de seqüência ou mais a umaenzima exemplar da invenção, conforme listado na Tabela 9 abaixo). Asseqüências no ciado descrito na Tabela 9 abaixo, são únicos em que todoseles contêm um módulo X14 semelhante a CBM, que é muito similar entretodas as xilanases no ciado descrito.

Tabela 9

<table>table see original document page 213</column></row><table>

Em um aspecto, a invenção fornece enzimas quiméricas,incluindo xilanases, glicanases e/ou glicosidades, que têm módulos deligação a carboidrato (CBMs) heterólogos, por exemplo, para uso nosprocessos da invenção e em várias aplicações e processos industriais,médicos, farmacêuticos, de pesquisa, de alimentos e rações, e suplementoalimentício e de ração e outros. Por exemplo, em um aspecto, a invençãofornece enzimas, por exemplo, hidrolases, incluindo glicosil hidrolases (taiscomo xilanases, glicanases) que compreendem um ou mais CBMs de umaenzima da invenção, incluindo o módulo X14 semelhante a CBM discutidoacima, como resumido na tabela 9. Em outro aspecto, CBMs, por exemplo,módulos X14, entre diferentes enzimas da invenção podem ser trocados; oualternativamente, um ou mais CBMs de uma ou mais enzimas da invençãopodem ser unidos em uma enzima, por exemplo, uma hidrolase, porexemplo, qualquer glicosil hidrolase, tal como uma xilanase.

Glicosil hidrolases que utilizam substratos insolúveis sãomodulares, compreendendo geralmente módulos catalíticos unidos a um oumais módulos de ligação a carboidrato (CBMs) não catalíticos. Na natureza,acredita-se que CBMs promovam a interação da glicosil hidrolase com seupolissacarídeo substrato alvo. Por exemplo, como discutido acima, X14 é ummódulo de ligação ao xilano. Dessa forma, a invenção fornece enzimasquiméricas tendo substratos heterólogos não-naturaís; incluindo enzimasquiméricas tendo múltiplos substratos pela natureza de suas CBMsheterólogas "splicèd-in", por exemplo, um módulo X14 "spliced-in" dainvenção - dando assim à enzima quimérica uma nova especificidade porxilano e galactano, ou ligação aumentada ao xilano e galactano. Os CBMsheterólogos das enzimas quiméricas da invenção podem ser projetados paraserem modulares, isto é, para estarem unidos a um módulo catalítico oudomínio catalítico (por exemplo, um sítio ativo, que também pode ser ,heterólogo ou pode ser homólogo à enzima.

A utilização apenas do módulo catalítico de uma xilanase ouuma glicanase (por exemplo, uma enzima da invenção) se mostrou eficaz.

Dessa forma, a invenção fornece peptídeos e polipeptídeos que consistemem, ou compreendem em módulos de sítio ativo/CBM modulares (porexemplo, X14, veja a Tabela 9), que pode ser homologamente pareado ouunido como pares CBM-sítio ativo (heterólogos) quiméricos. Dessa forma,esses polipeptídeos/peptídeos quiméricos da invenção podem ser usadospara melhorar ou alterar o desempenho de uma enzima artificial, porexemplo, uma enzima xilanase. O módulo catalítico quimérico da invenção(compreendendo, por exemplo, pelo menos um CBM da invenção, porexemplo, X14) pode ser projetado para atingir a enzima para regiõesparticulares de um substrato, por exemplo, a regiões particulares de umapolpa. Por exemplo, em um aspecto, isso é obtido por fazer fusões daxilanase e vários CBMs (uma xilanase da invenção com um CBM heterólogo,ou um CBM da invenção com outra enzima, por exemplo, hidrolase, tal comouma xilanase. Por exemplo, CBM4, CBM6, e CBM22 são conhecidas por seligar ao xilano e podem aumentar a eficácia da xilanase em bioalvejamentode polpa (veja por exemplo, Czjzek (2001) J. Biol. Chem. 276(51 ):48580-7,que observa que CBM4, CBM6, e CBM22 são relacionados e CBMinteragem primariamente com o xilano). Em outra modalidade, a fusão dexilanase e CBM3a ou CBM3b, que se liga à celulose cristalina, pode ajudar axilanase penetrar na complexa matriz de polissacarídeo da polpa e atingirxilanos inacessíveis. Qualquer CBM pode ser usado para praticar a presenteinvenção, por exemplo, como revisado por Boraston (2004) Biochem. J.382:769-781:

Família Proteína Código PDB

CBM1 Celulase 7A (Trichoderma reesei) 1CBH

CBM2 Xilanase 10A (Cellulqmonas fimi) 1EXG

Xilanase 11A (Cellulõmonás fimi) 2XBD

Xilanase 11A (Cellulomonas fimi) 1HEHCBM3 Estrutural (scaffolding) (Clostridium cellulolyticum) 1G43

Estrutural (Clostridium thermocellum) 1NBC

Celulase 9A (Thermobifidafusca) 1TF4

CBM4 Laminarinase 16A (Thermotoga marítima) 1GUI

Celulase 9B (CelIuIomonasfimi) 1ULO;1GU3

Celulasè 9B (Cellulómonas fimi) 1CX1

Xilanase 10A (Rhodothermus marinus) 1K45CBM5 Celulase 5Α (Erwiniachrysantheml) 1AIW

QuitinaseB (Serratiamarcescens) 1Ε15

CBM6 Xilanase 11A (Clostridium thermocellum) 1UXX

XiIanaseHA (Clostridiumstercorarium) 1ΝΑΕ

Xilanase 11A (Clostridium stercorarium) 1UY4

Endoglicanase 5Α (Cellvibrio mixtus) 1UZO

CBM9 Xilanase 10A (Thermotoga marítima) 1I8A

CBM10 Xilanase 10A (Cellvibriojaponicus) 1QLD

CBM12 Quitinase Chi 1 (Baeillus eireulans) 1ED7

CBM13* Xilanase 10A (Streptomyees olivaeeoviridis) 1XYF

Xilanase 10A (Streptomyees lividans) 1MC9

Cadeia B da toxina ricina (Rieinus eommunis) 2AAI

Abrina (Abrus preeatorius) 1ABR

CBM14 Taquicitina (Taehypleus tridentatus) 1DQC

CBM15 Xilanase 10C (Cellvibriojaponicus) 1GNY

CBM17 Celulase 5A (Clostridium eellulovorans) 1J83

CBM18* Aglutinina (Tritieum aestivum) 1WGC

Peptídeo antimicrobiano (Amaranthus eaudatus) 1MMC

Quitinase/aglutinina (Urticadioiea) 1 EIS

CBM20* Glicoamilase (Aspergillus ηΐςβή 1AC0

β-amilase (Baeillus eereus) 1CQY

CBM22 Xilanase 10B (Clostridium thermocellum) 1DYO

CBM27 Mananase 5A (Thermotoga marítima) 10F4

CBM28 Celulase 5A (Baeillus sp. 1139) 1UWW

CBM29 Proteína 1 não catalítica (Pyromyees equi) 1GWK

CBM32 Sialidase 33A (Mieromonospora viridifaeiens) 1EUU

Galaetose oxidase (Cladobotryum dendroides) 1GOF

CBM34* a-Amilase 13A (Thermoaetinomyees vulgaris) 1UH2Neopululanase (Geobaeillus stearothermophilus) 1J0H

CBM36 Xilanase 43A (PaenibacilluspoIymyxa) 1UX7

* Essas famílias contêm registros de estrutura numerosos demais para quetodos sejam listados, dessa forma são mostrados apenas representantes.

Dessa forma, a invenção fornece hidrolases quiméricas dainvenção, por exemplo, uma fusão de uma glicosidase com CBMs diferentes(por exemplo, heterólogos) para direcionar a enzima para polissacarídeos..insolúveis particulares para aumentar o desempenho em uma aplicação. Emum aspecto, a glicosidade quimérica compreende uma enzima da invenção.Em um aspecto, a enzima quimérica compreende fusões de CBMsdiferentes para aumentar o desempenho do bioalvejamento de polpa, porexemplo, para obter maior redução da porcentagem de químicosbranqueadores. A invenção também fornece métodos que compreendemrecombinar diferentes CBMs com diferentes xilanases (por exemplo, CBMsda invenção e/ou xilanases da invenção) e rastrear os quiméricos resultantespara encontrar a melhor combinação para uma aplicação ou substratoparticular.

Em um aspecto, um polipeptídeo da invenção compreende umaproteína que tem uma seqüência descrita em SEQ ID NO:382, onde aseqüência de sinal da xilanase que tem uma seqüência descrita em SEQ IDNO: 160 (codificada por exemplo, por SEQ ID NO:159) foi removida (aseqüência de sinal removida era MISLKRVAALLCVAGLGMSAAN), o"módulo de ligação a carboidrato" (CBM) foi removido, e uma metioninainicial foi adicionada. Essa versão truncada da xilanase da invenção que temuma seqüência descrita em SEQ ID NO:382 (codificada, por exemplo, porSEQ ID NO:381).

Três resíduos de aminoácido foram então removidos daextremidade carbóxi terminal do polipeptídeo SEQ ID NO:382, resultando emSEQ ID NO:384 (codificado por SEQ ID NO:383). Um desses resíduos eraum glutamato que quando removido aumentou o pl da proteína. Essadeleção causou um aumento da habilidade da enzima alvejar polpa demadeira em um pH alcalino quando comparado com a enzima tiposelvagem. Em outro aspecto, três resíduos de aminoácido são removidos dáextremidade carbóxi terminal de uma variante de GSSM de SEQ ID NO:382,por exemplo, polipeptídeo SEQ ID NO:482 (veja abaixo).

Dessa forma, a invenção fornece um método para aumentar odesempenho de uma xilanase, por exemplo, em pH alto, por remoção dosresíduos de aminoácido "EGG" (ou equivalentes) próximos da extremidadeC1 terminal de uma seqüência de xilanase. Em um aspecto, "EGG" (ou oequivalente) é removido logo (imediatamente) após o domínio de glicosilhidrolase da xilanase a ser modificada.

Outras variações também estão dentro do escopo dessainvenção, por exemplo, onde um, dois, três, quatro ou cinco ou maisresíduos são removidos das extremidades carbóxi ou amino terminais dequalquer polipeptídeo da invenção. Outra variação inclui modificar qualquerresíduo para aumentar ou diminuir o pl de um polipeptídeo, por exemplo,remover ou modificar (por exemplo, para outro aminoácido) um glutamato.Esse método foi usado como um esquema geral para melhorar aspropriedades da enzima sem criar problemas regulatórios já que nenhumaminoácido foi mutado; e esse esquema geral pode ser usado com qualquerpolipeptídeo da invenção

O polipeptídeo SEQ ID NO:384 foi ainda evoluído usandoGSSM, como está resumido na Tabela 11:

<table>table see original document page 218</column></row><table>O polipeptídeo SEQ ID NO:384 foi ainda evoluído usando GSSMpara gerar SEQ ID NO:482, codificado, por exemplo, por SEQ ID NO:481:

MAQTCLTSPQTGFHNGFFYSFWKDSPGTVNFCLLEGGRYTSNWSGINNWVGGKGWQTGSRRNITYSGSFNTPGNGYLALYGWTTNPLVEYYVVDSWGSWRPPGSDGTFLGTVNSDGGTYDIYRAQRVNAPSIIGNATFYQYWSVRQSKRVGGTITTGNHFDAWASVGLNLGTHNYQIMATEGYQSSGSSDITVS (SEQ ID NO:482)

ATGGCCCAGACCTGCCTCACGTCGCCCCAAACCGGCTTTCACAATGGCTTCTTCTATTCCTTCTGGAAGGACAGTCCGGGCACGGTGAATTTTTGCCTGTTGGAGGGCGGCCGTTACACATCGAACTGGAGCGGCATCAACAACTGGGTGGGCGGCAAGGGATGGCAGACCGGTTCACGCCGGAACATCACGTACTCGGGCAGCTTCAATACACCGGGCAACGGCTACCTGGCGCTTTACGGATGGACCACCAATCCACTCGTCGAGTACTACGTCGTCGATAGCTGGGGGAGCTGGCGTCCGCCGGGTTCGGACGGAACGTTCCTGGGGACGGTCAACAGCGATGGCGGAACGTATGACATCTATCGCGCGCAGCGGGTCAACGCGCCGTCCATCATCGGCAACGCCACGTTCTATCAATACTGGAGCGTTCGGCAGTCGAAGCGGGTAGGTGGGACGATCACCACCGGAAACCACTTCGACGCGTGGGCCAGCGTGGGCCTGAACCTGGGCACTCACAACTACCAGATCATGGCGACCGAGGGCTACCAAAGCAGCGGCAGCTCCGACATCACGGTGAGTTGA (SEQ ID NO:481)

Diferenças entre SEQ ID NO:382 e SEQ ID NO:482:

Primeiro, três aminoácidos foram removidos da terminação-C deSEQ ID NO:382. Isso foi feito a fim de aumentar o desempenho de pH daenzima. Segundo, sete aminoácidos foram alterados a fim de aumentar odesempenho da enzima em alta temperatura em um alto pH. Dessa forma aenzima ativa SEQ ID NO:482 no produto compreende um domínio catalíticoSEQ ID NO:382 levemente modificado.

Resumo de alterações feitas à seqüência exemplar SEQ ID NO:382

Um resumo das alterações feitas à seqüência exemplar SEQ IDNO:382 da invenção está relacionado na Figura 13; em que a figura ilustra aremoção da seqüência EGG C-terminal para dar desempenho aumentadoem pH alto; seguida por uma alteração em sete (7) resíduos de aminoácido- esse produto tendo desempenho aumentado em pH alto e altatemperatura; o produto final tem a seqüência de SEQ ID NO:482.

Detalhes das alterações de aminoácido entre SEQ ID NO:382 e SEQ IDNO:482:

<table>table see original document page 220</column></row><table>

Dessa forma, a invenção fornece polipeptídeos isolados,sintéticos ou recombinantes que têm atividade de xilanase, em que opolipeptídeo tem uma modificação de seqüência de qualquer polipeptídeo dainvenção, incluindo qualquer seqüência de aminoácido exemplar dainvenção (como definido acima, incluindo todas as seqüências pares entreSEQ ID NO:2 a SEQ ID NO:636 - veja a listagem de seqüência), em que amodificação de seqüência compreende pelo menos uma, duas, três, quatro,cinco, seis, sete, oito, nove, dez, onze, doze, treze, quatorze, quinze,dezesseis, dezessete, dezoito, dezenove ou todas as seguintes alterações: oaminoácido que corresponde à treonina no resíduo 4 de SEQ ID NO:384 éleucina, o aminoácido que corresponde à serina no resíduo 9 de SEQ IDNO:384 é prolina, o aminoácido que corresponde à glutamina no resíduo 10de SEQ ID NO:384 é serina, o aminoácido que corresponde à treonina noresíduo 13 de SEQ ID NO:384 é fenilalanina, o aminoácido que correspondeà treonina no resíduo 13 de SEQ ID NO:384 é tirosina, o aminoácido quecorresponde à treonina no resíduo 13 de SEQ ID NO:384 é isoleucina, oaminoácido que corresponde à treonina no resíduo 13 de SEQ ID NO:384 étriptofano, o aminoácido que corresponde à asparaginá no resíduo 14 deSEQ ID NO:384 é histidina, o aminoácido que corresponde à tirosina noresíduo 18 de SEQ ID NO:384 é fenilalanina, o aminoácido que correspondeà serina no resíduo 25 de SEQ ID NO:384 é ácido glutâmico, o aminoácidoque corresponde à serina no resíduo 25 de SEQ ID NO:384 é prolina, oaminoácido que corresponde à asparagina no resíduo 30 de SEQ ID NO:384é valina, o aminoácido que corresponde à glutamina no resíduo 34 de SEQID NO:384 é cisteína, o aminoácido que corresponde à glutamina no resíduo34 de SEQ ID NO:384 é histidina, o aminoácido que corresponde àglutamina no resíduo 34 de SEQ ID NO:384 é leucina, o aminoácido quecorresponde à serina no resíduo 35 de SEQ ID NO:384 é ácido glutâmico, oaminoácido que corresponde à serina no resíduo 35 de SEQ ID NO:384 éácido aspártico, o aminoácido que corresponde à serina no resíduo 71 deSEQ ID NO:384 é treonina, o aminoácido que corresponde à serina noresíduo 71 de SEQ ID NO:384 é cisteína, ou o aminoácido que correspondeà serina no resíduo 194 de SEQ ID NO:384 é histidina. A(s) alteração(ões)de seqüência também pode(m) compreender qualquer modificação deaminoácido para alterar o pl de um polipeptídeo, por exemplo, deleção oumodificação de um glutamato, ou troca de um glutamato por outro resíduo.

A invenção também fornece polipeptídeos isolados, sintéticos ourecombinantes que têm atividade de xilanase, em que o polipeptídeo tem aseqüência que compreende um, dois, três, quatro, cinco, seis, sete, oito,nove, dez, onze, doze, treze, quatorze, quinze, dezesseis, dezessete,dezoito, dezenove ou todas as seguintes alterações à seqüência deaminoácido de SEQ ID NO:384: a treonina na posição de aminoácido 4 éleucina, a serina na posição de aminoácido 9 é prolina, a glutamina naposição de aminoácido 10 é serina, a treonina na posição de aminoácido 13é fenilalanina, a treonina na posição de aminoácido 13 é tirosina, a treoninana posição de aminoácido 13 é isoleucina, a treonina na posição deaminoácido 13 é triptofano, a asparagina na posição de aminoácido 14 éhistidina, a tirosina na posição de aminoácido 18 é fenilalanina, a serina naposição de aminoácido 25 é ácido glutâmico, a serina na posição deaminoácido 25 é prolina, a asparagina na posição de aminoácido 30 é valina,a glutamina na posição de aminoácido 34 é cisteína, a glutamina na posiçãode aminoácido 34 é histidina, a glutamina na posição de aminoácido 34 éleucina, a serina na posição de aminoácido 35 é ácido glutâmico, a serina naposição de aminoácido 35 é ácido aspártico, a serina na posição deaminoácido 71 é treonina, a serina na posição de aminoácido 71 é cisteína,ou a serina na posição de aminoácido 194 é histidina.

A invenção ainda fornece polipeptídeos isolados, sintéticos ourecombinantes que tem uma identidade de seqüência (por exemplo, pelomenos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%,60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%,73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%,86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%,99%, ou mais, ou identidade de seqüência completa (100%) a umaseqüência exemplar da invenção.

Em um aspecto, o polipeptídeo tem uma atividade de xilanaseou glicanase; por exemplo, em que a atividade de xilanase podecompreender hidrolisar uma ligação glicosídica em um polissacarídeo, porexemplo, um xilano. Em um aspecto, o polipeptídeo tem uma atividade dexilanase compreendendo catalisar a hidrólise de ligações β-1,4-xilosídicasinternas. Em um aspecto, a atividade de xilanase compreende uma atividadede endo-1,4-beta-xilanase. Em um aspecto, a atividade de xilanasecompreende hidrolisar um xilano para produzir uma xilose ou xilo-oligômerode menor peso molecular. Em um aspecto, o xilano compreende umarabinoxilano, tal como um arabinoxilano solúvel em água.

A invenção fornece polipeptídeos que têm atividade deglicanase, por exemplo, o polipeptídeo que tem a seqüência de SEQ IDNO:564, codificado por exemplo, por SEQ ID NO:563. Em um aspecto, aatividade de glicanase de um polipeptídeo ou peptídeo da invenção (queinclui proteína ou peptídeo codificado por um ácido nucléico da invenção)compreende uma atividade de endoglicanase, por exemplo, atividade deendo-1,4- e/ou 1,3-beta-D-glucan 4-glicano hidrolase. Em um aspecto, aatividade de endoglucanase compreende catalisar a hidrólise de ligações1,4-beta-D-glicosídicas. Em um aspecto, a atividade de glicanase, porexemplo, endoglicanase, compreende uma atividade de endo-1,4- e/ou 1,3-beta-endoglicanase ou atividade de endo-p-1,4-glicanase. Em um aspecto, aatividade de glicanase (por exemplo, atividade de endo-1,4-beta-D-glucan 4-glicano hidrolase) compreende a hidrólise de ligações 1,4-beta-D-glicosídicas em celulose, derivados de celulose (por exemplo, carbóxi metilcelulose e hidróxi etil celulose) liquenina, ligações beta-1,4 em beta-1,3glicanos mistos, tais como beta-D-glicanos de cereais e outro material deplanta que contém partes celulósicas. Em um aspecto, a atividade deglicanase, xilanase, ou mananase compreende hidrolisar uma glicano ououtro polissacarídeo para produzir um beta-glicano, tal como beta-glicanosolúvel em água.

A invenção fornece polipeptídeos que têm atividade demananase (por exemplo, endo-1,4-beta-D-mananase), por exemplo,catalisar a hidrólise de uma beta-1,4-manana, por exemplo, uma beta-1,4-manana linear não substituída. A determinação da atividade de mananasepode ser feita usando qualquer método conhecido, por exemplo, o métodode Congo Red, como descrito, por exemplo, por Downie (1994) "A newassay for quantifying endo-beta-mannanase activity using Congo red dye.Phytochemistry, julho de 1994, vol. 36, no. 4, p. 829-835; ou como descritona Patente U.S. N°. 6.060.299, por exemplo, por aplicar uma solução a sertestada a orifícios de 4mm de diâmetro perfurados em placas de ágar 0,2%de AZCL galactomanana (alfarroba) ou qualquer substrato para o teste deendo-1,4-beta-D-mananase.

Qualquer teste de xilanase, glicanase e/ou mananase conhecidona técnica pode ser usado para determinar se um polipeptídeo tem atividadede xilanase, glicanase e/ou mananase e está dentro do escopo da invenção.

Por exemplo, ensaios de redução de açúcar, tal como o método de Nelson-Somogy ou o método de ácido dinitrosalicílico (DNS) pode ser usado paratestar os produtos de açúcar (e assim, a atividade de xilanase). Em umaspecto, as reações são realizadas pela mistura e incubação de umadiluição da preparação da enzima com uma quantidade conhecida desubstrato em um pH tamponado e temperatura ajustada. Testes de xilanasessão similares aos testes de celulase exceto que uma solução de xilano (porexemplo, espelta de aveia ou bétula) é substituída por CMC ou papel defiltro. O teste de DNS é mais fácil de usar do que o teste de Nelson-Somogy.O teste de DNS é satisfatório para atividades de celulase, mas tende asuperestimar a atividade de xilanase. O procedimento de Nelson-Somogy émais preciso na determinação de açúcares redutores, para medir atividadesespecíficas e para quantificar a quantidade total de xilanase produzida emcondições de crescimento otimizadas, veja, por exemplo, Breuil (1985)Comparison of the 3, 5-dinitrosalicylic acid and Nelson-Somogyi methods ofassaying for reducing sugars and determining cellulase activity, EnzymeMicrob. Technol. 7:327-332; Somogyi, M. 1952, Notes on sugardetermination, J. Biol. Chem. 195:19-23. A invenção incorpora o uso dequalquer ensaio de redução de açúcar, por exemplo, por Nelson-Somogy,por exemplo, baseado nas referências Nelson, N. (1944) J. Biol. Chem.153:375-380, e Somogyi, M. (1952) J. Biol. Chem. 195:19-23.

Foi demonstrado que a xilanase que tem uma seqüênciadescrita em SEQ ID NO:182 (codificada, por exemplo, por SEQ ID NO:181)("SEQ ID NO:181/182") e a xilanase que tem uma seqüência descrita emSEQ ID NO:382 (codificada, por exemplo por SEQ ID NO:381) ("SEQ IDNO:381/382") aumenta o alvejante da polpa em pH 8 em uma quantidademaior do que outras enzimas. O aumento do alvejante é similar para ambasas enzimas quando elas são dosadas em quantidades de unidades iguais.Esses dois desempenhos superiores diferem quando testados em pH 10com SEQ ID NO:182 (codificada, por exemplo, por SEQ ID NO:181) ("SEQID NO: 181/182") resultando em níveis de alvejante maiores do que com SEQID NO:381/382. SEQ ID NO:181/182 tem um pl de 8.8 e SEQ ID NO:382(codificada, por exemplo por SEQ ID NO:381) tem um pl de 7.9. SEQ IDNO:381/382 tem 197 aminoácidos de extensão. Quando E195, G196 e G194são removidos, resultando em SEQ ID NO:384 (codificada pela SEQ IDNO:383), o pl torna-se 8.5. Esse construto tem melhor atividade em pH altopor que o pl da proteína é próximo ao da SEQ ID NO:181/182 no construtotruncado.

Os três genes, SEQ ID NO:182 (codificada, por exemplo, porSEQ ID N0:181), SEQ ID NO:382 (codificada, por exemplo, por SEQ IDNO:381) e SEQ ID NO:384 (codificada, por exemplo, por SEQ ID NO:383),foram expressos e os produtos gênicos foram testados usando o ensaio deredução de açúcar de Nelson-Somogy para determinar a U/ml de enzimaonde uma unidade é a quantidade de enzima que liberará 1 pmole de xilosemin"1. As enzimas foram dosadas em 2 U/g de polpa OD (seca no forno) etestadas de acordo com as aplicações do protocolo de bioalvejamento,descritas no Exemplo 8 abaixo.

Os resultados do estudo de "bioalvejamento", mostrados naFigura 12 são: em pH=8: SEQ ID NO:382 e SEQ ID NO: 182 agiram melhordo que o controle, C-0,21, como visto anteriormente; em pH=10: SEQ IDNO:382 o desempenho foi abaixo do controle C-0,21, como vistoanteriormente; em pH=10, SEQ ID NO:182 NÃO agiu abaixo do controle, C-0,21, como visto anteriormente; SEQ ID NO:384 se agiu melhor do que SEQID NO:382 e SEQ ID NO:182 em pH=8; o desempenho de SEQ ID NO:384em pH=10 não foi abaixo do controle, C-0,21 e foi comparável àquele deSEQ ID NO:182. Esses resultados indicam que SEQ ID NO:384 truncada(codificada, por exemplo, por SEQ ID NO:383) agiu tão bem quanto SEQ IDNO: 182 (codificada, por exemplo, por SEQ ID NO:181) em pH 10 enquantoque SEQ ID NO:382 agiu pobremente sob essas condições. As enzimasforam usadas para tratar SSWB com um Fator Kappa de 0,18. Na Figura 12,as linhas pretas representam os níveis de alvejante do controle em 0,18(linha inferior) e 0,21 (linha superior). Esse estudo de "bioalvejamento"demonstra o uso de truncamento de gene para melhorar as propriedades deenzimas xilanases. Esse estudo de "bioalvejamento" também demonstra queo pl aumentado de uma xilanase leva a um desempenho melhorado dePolpa Marrom de Pinho de Madeira Mole do Sul (SSWB).Os polipeptídeos da invenção incluem xilanases em uma formaativa ou inativa. Por exemplo, os polipeptídeos dá invenção incluem pró-proteínas antes da "maturação" ou o processamento de seqüências prepro,por exemplo, por uma enzima de processamento de pró-proteína, tal como apró-proteína convertase para gerar uma proteína "madura" ativa. Ospolipeptídeos da invenção incluem xilanases inativas por outras razões, porexemplo, antes da "ativação" por um evento de processamento pós-traducional, por exemplo, uma ação de endo ou exo-peptidase ouproteinase, um evento de fosforilação, uma amidação, uma glicosilação ouuma sulfatação, um evento de dimerização e semelhantes. Os polipeptídeosl da invenção incluem todas as formas ativas, incluindo subseqüências ativas,por exemplo, domínios catalíticos ou sítios ativos, da xilanase.

Métodos para identificar seqüências de domínio "prepro" eseqüências de sinal são bem-conhecidos na técnica, veja, por exemplo, Vande Ven (1993) Crit. Rev. Oncog. 4(2):115-136. Por exemplo, para identificaruma seqüência prepro, a proteína é purificada no espaço extracelular e aseqüência N-terminal da proteína é determinada e comparada com a formanão processada.

A invenção inclui polipeptídeos com ou sem uma seqüência desinal e/ou uma seqüência prepro. A invenção inclui polipeptídeos comseqüências de sinal heterólogas e/ou seqüências prepro. A seqüência prepro(incluindo uma seqüência da invenção usada como domínio preproheterólogo) pode estar localizada na extremidade amino terminal ou carbóxiterminal da proteína. A invenção também inclui seqüências de sinal,seqüências prepro e domínios catalíticos (por exemplo, "sítios ativos")isolados, sintéticos ou recombinantes que compreendem as seqüências dainvenção.

O percentual de identidade de seqüência pode ser ao longo daextensão completa do polipeptídeo ou a identidade pode ser ao longo deuma região de pelo menos cerca de 50, 60, 70, 80, 90, 100, 150, 200, 250,300, 350, 400, 450, 500, 550, 600, 650, 700 ou mais resíduos. Polipeptídeosda invenção podem ser mais curtos do que a extensão completa depolipeptídeos exemplares. Em aspectos alternativos, a invenção fornecepolipeptídeos (peptídeos, fragmentos) que variam em tamanho entre cercade 5 e a extensão completa de um polipeptídeo, por exemplo, uma enzimatal como uma xilanase; extensões exemplares sendo de cerca de 5, 10, 15,20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125, 150, 175,200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 ou mais resíduos, porexemplo, resíduos contíguos de um exemplar de xilanase da invenção.

Peptídeos da invenção (por exemplo, uma subseqüência de umpolipeptídeo exemplar da invenção) podem ser úteis como, por exemplo,sondas de marcação, antígenos, toleragenos, motivos, sítios ativos dexilanase (por exemplo, "domínios catalíticos"), seqüências de sinal e/oudomínios prepro.

Polipeptídeos e peptídeos da invenção podem ser isolados defontes naturais, podem ser sintéticos ou podem ser polipeptídeos geradosrecombinantemente. Peptídeos e proteínas podem ser expressosrecombinantemente in vitro ou in vivo. Os peptídeos e polipeptídeos dainvenção podem ser feitos e isolados usando qualquer método conhecido natécnica. Polipeptídeos e peptídeos da invenção também podem sersintetizados, como um todo ou em parte, usando métodos químicos bem-conhecidos na técnica. Veja, por exemplo, Caruthers (1980) Nucleic AcidsRes. Symp. Ser. 215-223; Horn (1980) Nucleic Acids Res. Symp. Ser. 225-232; Banga, A.K., Therapeutic Peptides and Proteins, Formulation,Processing and Delivery Systems (1995) Technomic Publishing Co.,Lancaster, PA. Por exemplo, a síntese de peptídeos pode ser realizadausando várias técnicas em fase sólida (veja, por exemplo, Roberge (1995)Science 269:202; Merrifield (1997) Methods Enzymol. 289:3-13) e a sínteseautomatizada pode ser obtida, por exemplo, usando o ABI 431A PeptideSynthesizer (Perkin Elmer) de acordo com as instruções fornecidas pelofabricante.Polipeptídeos e peptídeos da invenção também podem ser gli-cosilados. A glicosilação pode ser adicionada pós-traducionalmente quimi-camente ou por mecanismos biossintéticos celulares, em que o último incor-pora o uso de motivos de glicosilação conhecidos, que podem ser nativos àseqüência ou podem ser adicionados como um peptídeo ou adicionados naseqüência codificante de ácido nucléico. A glicosilação pode ser O-Iigada ouN-ligada.

"Aminoácido" ou "seqüência de aminoácido" como usado aquirefere-se a um oligopeptídeo, peptídeo, polipeptídeo, ou seqüência de prote-ína ou a um fragmento, porção ou subunidade de qualquer uma dessas mo-léculas que ocorrem naturalmente ou sintéticas. "Aminoácido" ou "seqüênciade aminoácido" inclui um oligopeptídeo, peptídeo, polipeptídeo, ou seqüên-cia de proteína ou um fragmento, porção ou subunidade de qualquer umdesses, e moléculas que ocorrem naturalmente ou sintéticas. O termo "poli-peptídeo" como usado aqui, refere-se a aminoácidos ligados uns aos outrospor ligações peptídicas ou ligações peptídicas modificadas, isto é, isoésteresde peptídeo e podem conter aminoácidos modificados diferentes dos 20 a-minoácidos codificados por genes. Os polipeptídeos podem ser modificadospor processos naturais, tal como processamento pós-traducional, ou por me-todologias de modificação química que são bem-conhecidas na técnica. Asmodificações podem ocorrer em qualquer lugar no polipeptídeo, incluindo acadeia principal do peptídeo, as cadeias laterais de aminoácidos e as termi-nações amino e carboxila. Será observado que o mesmo tipo de modificaçãopode estar presente no mesmo ou em graus variáveis em vários locais emum dado polipeptídeo. Um dado polipeptídeo também pode ter vários tiposde modificações. Modificações incluem acetilação, acilação, ADP-ribosilação, amidação, ligação covalente de flavina, ligação covalente deuma porção heme, ligação covalente de um nucleotídeo ou derivado de nu-cleotídeo, ligação covalente de um lipídeo ou derivado de lipídeo, ligaçãocovalente de um fosfitidilinositol, ciclização por ligação cruzada, formação deligação de dissulfeto, desmetiláção, formação de ligações cruzadas covalen-tes, formação de cisteína, formação de piroglutamato, formilação, gama-carboxilação, glicosilação, formação de âncora de GPI, hidroxilação, iodina-ção, metilação, miristoliação, oxidação, peguilação, processamento de xilanohidrolase, fosforilação, prenilação, racemização, selenoilação, sulfatação eadição de aminoácidos mediada por RNA de transferência à proteína tal co-mo arginilação. (Veja Creighton, T.E., Proteins - Structure and MolecularProperties 2- Ed., W.H. Freeman & Company, Nova Iorque (1993); Post-translational Covalent Modification of Proteins, B.C. Johnson, Ed., AcademicPress, Nova Iorque, pp. 1-12 (1983)). Os peptídeos e polipeptídeos da in-venção também incluem todas as formas "miméticas" e "peptidomiméticas",como descrito em detalhes adicionais abaixo.

Polipeptídeos ou proteínas "recombinantes" referem-se a poli-peptídeos ou proteínas produzidos por técnicas de DNA recombinante, istoé, produzidos por células transformadas por um construto de DNA exógenoque codifica o polipeptídeo ou proteína desejada. Polipeptídeos ou proteínas"sintéticas" são aquelas preparadas por síntese química. Métodos de síntesequímica de peptídeo em fase sólida também podem ser usados para sinteti-zar o polipeptídeo ou fragmentos da invenção. Tal método é conhecido natécnica desde o início dos anos de 1960 (Merrifield, R. B., J. Am. Chem. Soc.,85:2149-2154, 1963) (veja também Stewart, J. M. & Young, J. D., Solid PhasePeptide Svnthesis, 2g Ed.. Pierce Chemical Co., Rockford, Ill., pp. 11-12)) erecentemente foram empregados kits laboratoriais de desenho e síntese depeptídeo comercialmente disponíveis (Cambridge Research Biochemicals).Tais kits de laboratório comercialmente disponíveis utilizaram geralmente osensinamentos de Η. M. Geysen et ai, Proc. Natl. Acad. Sci., USA, 81:3998(1984) e possibilitam síntese de peptídeos nas extremidades de uma varieda-de de "hastes" ou "pinos" todos os quais conectados a uma única placa. Quan-do tal sistema é utilizado, uma placa de hastes ou pinos é invertida e inseridaem uma segunda placa de reservatórios ou cavidades correspondentes, quecontêm soluções para a ligação ou ancoragem de um aminoácido apropriadonas extremidades do pino ou haste. Pela repetição de tal etapa do processo,isto é, invertendo e inserindo as extremidades do pino ou haste em soluçõesapropriadas, os aminoácidos são montados nos peptídeos desejados. Alémdisso, vários sistemas de síntese de peptídeo FMOC estão disponíveis. Porexemplo, a montagem de um polipeptídeo ou fragmento pode ser executadasobre um suporte sólido usando um sintetizador automatizado de peptídeoApplied Biosystems, Inc. Modelo 431 A. Tal equipamento fornece rápido acessoaos peptídeos da invenção, tanto por síntese direta quanto por síntese de umasérie de fragmentos que podem ser acoplados usando outras técnicas conhe-cidas.

"Fragmentos", como usado aqui, são uma porção de uma proteína/ que ocorre naturalmente que podem existir em pelo menos duas conforma-ções diferentes. Fragmentos podem ter a mesma ou substancialmente a mes-ma seqüência de aminoácidos que a proteína que ocorre naturalmente. "Subs-tancialmente a mesma" significa que a seqüência de aminoácidos é ampla-mente, mas não inteiramente, a mesma, mas retém pelo menos uma atividadefuncional da seqüência com a qual está relacionada. Em geral, duas seqüên-cias de aminoácidos são "substancialmente as mesmas" ou "substancialmentehomólogas" se elas forem pelo menos cerca de 85% idênticas. Fragmentosque têm estruturas tridimensionais diferentes da proteína que ocorre natural-mente também são incluídos. Um exemplo disso é uma molécula "pró-forma",tal como uma pró-proteína de baixa atividade que pode ser modificada por cli-vagem para produzir uma enzima madura com atividade significativamentemaior.

Os peptídeos e polipeptídeos da invenção, como definidos acima,incluem todas as formas "miméticas" e "peptidomiméticas". Os termos "miméti-co" e "peptidomimético" referem-se a um composto químico sintético que temsubstancialmente as mesmas características estruturais e/ou funcionais dospolipeptídeos da invenção. O mimético pode ser inteiramente composto deanálogos sintéticos, não-naturais de aminoácidos ou, é uma molécula quiméri-ca de aminoácidos de peptídeo parcialmente naturais e análogos parcialmentenão-naturais de aminoácidos. O mimético também pode incorporar qualquerquantidade de substituições de aminoácidos conservativas naturais desde quetais substituições também não alterem substancialmente a estrutura e/ou ativi-dade do mimético. Da mesma forma que com polipeptídeos da invenção, quesão variantes conservativas, experimentação de rotina determinará se um mi-mético está dentro do escopo da invenção, isto é, que sua estrutura e/ou fun-ção não está substancialmente alterada. Assim, em um aspecto, uma compo-sição de mimético está dentro do escopo da invenção se ela tiver uma ativida-de de xilanase.

Composições miméticas de polipeptídeos da invenção podemconter qualquer combinação de componentes estruturais não-naturais. Emum aspecto alternativo, composições miméticas da invenção incluem um outodos os três grupos estruturais seguintes: a) grupos de ligação de resíduodiferentes das ligações de amida natural ("ligação peptídica"); b) resíduosnão-naturais no lugar de resíduos de aminoácido que ocorrem naturalmente;ou c) resíduos que induzem mimetismo estrutural secundário, isto é, induzirou estabilizar uma estrutura secundária, por exemplo, conformação em voltabeta, volta gama, folha beta, alfa hélice e semelhantes. Por exemplo, umpolipeptídeo da invenção pode ser caracterizado como um mimético quandotodos ou alguns de seus resíduos estão ligados por meios químicos diferen-tes de ligações peptídicas naturais. Resíduos peptidomiméticos individuaispodem ser ligados por ligações peptídicas, outras ligações químicas ou mei-os de acoplamento, tais como, por exemplo, glutaraldeído, ésteres de N-hidroxissuccinimida, maleimidas bifuncionais, N,N'-dicicloexilcarbodiimida(DCC) ou Ν,Ν'-diisopropilcarbodiimida (DIC). Grupos de ligação que podemser uma alternativa para as ligações de amida tradicionais ("ligação peptídi-ca") incluem, por exemplo, cetometileno (por exemplo, -C(=0)-CH2- para -C(=0)-NH-), aminometileno (CH2-NH), etileno, olefina (CH=CH), éter (CH2-O), tioeter (CH2-S), tetrazol (CN4-), tiazol, retroamida, tioamida, ou éster (ve-ja, por exemplo Spatola (1983) em Chemistry and Biochemistry of AminoAcids, Peptides and Proteins, Vol. 7, pp 267-357, "Peptide Backbone Modifi-cations," Marcell Dekker, NY).Um polipeptídeo da invenção também pode ser caracterizadocomo um mimético por conter todos ou alguns dos resíduos não-naturais nolugar de resíduos de aminoácidos que ocorrem naturalmente. Resíduos não-naturais estão bem descritos na literatura científica e de patente; alguns e-xemplares de composições não-naturais úteis como miméticos de resíduosde aminoácido naturais e orientações estão descritos abaixo. Miméticos deaminoácidos aromáticos podem ser gerados pela substituição de, por exem-plo, D- ou L- nafilalanina; D- ou L- fenilglicina; D- ou L-2 tieneilalanina; D- ouL-1, -2, 3-, ou 4- pireneilalanina; D- ou L-3 tieneilalanina; D- ou L-(2-piridinil)-alanina; D- ou L-(3-piridinil)-alanina; D- ou L-(2-pirazinil)-alanina; D- ou L-(4-isopropil)-fenilglicina; D-(trifluorometil)-fenilglicina; D-(trifluorometil)-fenilalanina; D-p-fluoro-fenilalanina; D- ou L-p-bifenilfenilalanina; D- ou L-p-metoxi-bifenilfenilalanina; D- ou L-2-indol (alquil)alaninas; e, D- ou L-alquilalaninas, onde alquila pode ser metila, etila, propila, hexila, butila, penti-Ia, isopropila, iso-butila, sec-isotila, iso-pentila substituída ou não substituída,ou aminoácidos não ácidos. Anéis aromáticos de um aminoácido não naturalincluem, por exemplo, anéis aromáticos de tiazolila, tiofenila, pirazolila, ben-zimidazolila, naftila, furanila, pirrolila, e piridila. Miméticos de aminoácidospodem ser gerados pela substituição de, por exemplo, aminoácidos não car-boxilados ao mesmo tempo mantendo a carga negativa; (fosfono)alanina;treonina sulfatada. Grupos laterais de carboxila (por exemplo, aspartil ouglutamil) também podem ser seletivamente modificados pela reação comcarbodiimidas (R'-N-C-N-R') tais como, por exemplo, 1-cicloexil-3(2-morfolinil-(4-etil) carbodiimida ou 1-etil-3(4-azonia- 4,4- dimetolpentil) carbo-diimida. Aspartila ou glutamila também podem ser convertidos para resíduosde asparaginila e glutaminila pela reação com íons de amônia. Miméticos deaminoácidos básicos podem ser gerados por substituição, por exemplo, (a-lém de Iisina e arginina) com os aminoácidos ornitina, citrulina, ou ácido(guanidino)-acético ou ácido (guanidino)alquil-acético onde alquila é comodefinido acima. Derivado de nitrila (por exemplo, contendo a porção CN nolugar de GOOH) pode ser substituído por asparagina ou glutamina. Resíduosde asparaginila ou glutaminila podem ser desaminados para os resíduos as-partila ou glutamila correspondentes. Miméticos de resíduo de arginina po-dem ser gerados pela reação de arginila com, por exemplo, um ou mais rea-gentes convencionais, incluindo, por exemplo, fenilglioxal, 2,3-butanodiona,1,2-ciclo-hexanodiona ou ninhidrina, preferivelmente sob condições alcali-nas. Miméticos de resíduos de tirosina podem ser gerados pela reação detirosila com, por exemplo, compostos de diazônio aromáticos ou tetranitro-metano. N-acetilimidizol e tetranitrometano podem ser usados para formarespécies de O-acetil tirosil e derivados 3-nitro, respectivamente. Miméticosde resíduos de cisteína podem ser gerados pela reação de resíduos de cis-teinila com, por exemplo, alfa-haloacetatos tais como ácido 2-cloroacético oucloroacetamida e aminas correspondentes; para dar derivados carboximetilaou carboxiamidometila. Miméticos de resíduos de cisteína podem ser gera-dos pela reação de resíduos de cisteinila com, por exemplo bromo-trifluoroacetona, ácido alfa-bromo-beta-(5-imidozoila) propiônico; fosfato decloroacetila, N-alquilmaleimidas, dissulfeto de 3-nitro-2-piridila; dissulfeto demetil 2-piridila; p-cloromercuribenzoato; 2-cloromercuri-4 nitrofenol; ou, cloro-7-nitrobenzo-oxa-1,3-diazol. Miméticos de resíduos de cisteína podem sergerados pela reação de resíduos de cisteinila com, por exemplo bromo-trifluoroacetona, ácido alfa-bromo-beta-(5-imidozoila) propiônico; fosfato decloroacetila, N-alquilmaleimidas, dissulfeto de 3-nitro-2-piridila; dissulfeto demetil 2-piridila; p-cloromercuribenzoato; 2-cloromercuri-4 nitrofenol; ou, cloro-7-nitrobenzo-oxa-1,3-diazol. Miméticos de Iisina podem ser gerados (e osresíduos de amina terminais podem ser alterados) pela reação de Iisinilacom, por exemplo, anidrido de ácido succínico ou outros anidridos de ácidocarboxílico. Lisina e outros miméticos de resíduo que contém alfa-aminotambém podem ser gerados pela reação com imidoésteres, tais como picoli-nimidato de metila, fosfato de piridoxal, piridoxal, cloroboroidreto, ácido trini-tro-benzenessulfônico, O-metilisouréia, 2,4, pentanodiona, e reações comglioxilato catalisadas com transamidase. Miméticos de metionina podem sergerados pela reação com, por exemplo, sulfóxido de metionina. Miméticosde prolina incluem, por exemplo, ácido pipecólico, ácido tiazolidino carboxíli-co, 3- ou 4- hidróxi prolina, deidroprolina, 3- ou 4-metilprolina, ou 3,3,-dimetilprolina. Miméticos de resíduo de histidina podem ser gerados pelareação de histidila com, por exemplo, dietilprocarbonato ou brometo de para-bromofenacila. Outros miméticos incluem, por exemplo, aqueles gerados porhidroxilação de prolina e lisina; fosforilação dos grupos de hidroxila de resí-duos de serila ou treonila; metilação de grupos alfa-amino de lisina, argininae histidina; acetilação de amina N terminal; metilação de resíduos de amidada cadeia principal ou substituição com N metil aminoácidos; ou amidaçãode grupos carboxila C-terminais.

Um resíduo, por exemplo, um aminoácido, de um polipeptídeoda invenção também pode ser substituído por um aminoácido (ou resíduopeptidomimético) da quiralidade oposta. Assim, qualquer aminoácido queocorre naturalmente na configuração L (que também pode ser referida comoR ou S, dependendo da estrutura da entidade química) pode ser substituídopelo aminoácido do mesmo tipo de estrutura química ou um peptidomiméti-co, mas de quiralidade oposta, referido como o D aminoácido, mas tambémpode ser referido como forma R ou S.

A invenção também fornece métodos para modificar os polipep-tídeos da invenção por processos naturais, tais como processamento pós-traducional (por exemplo, fosforilação, acilação, etc.) ou por técnicas de mo-dificação química e os polipeptídeos resultantes modificados. Modificaçõespodem ocorrer em qualquer lugar no polipeptídeo, incluindo na cadeia prin-cipal do peptídeo, cadeias laterais de aminoácidos e as terminações aminaou carboxila. Será apreciado que o mesmo tipo de modificação pode estarpresente no mesmo ou em vários graus em diversos sítios em um dado poli-peptídeo. Um dado polipeptídeo também pode ter vários tipos de modifica-ções. Modificações incluem acetilação, acilação, ADP-ribosilação, amidação,ligação covalente de flavina, ligação covalente de uma porção heme, ligaçãocovalente de um nucleotídeo ou derivado de nucleotídeo, ligação covalentede um lipídeo ou derivado de lipídeo, ligação covalente de um fosfitidilinosi-tol, ciclização por reticulação, formação de ligação de dissulfeto, desmetila-ção, formação de ligações cruzadas covalentes, formação de cisteína, for-mação de piroglutamato, formilação, gama-carboxilação, glicosilação, forma-ção de âncora de GPI1 hidroxilação, iodinação, metilação, miristoliação, oxi-dação, peguilação, processamento de xilano hidrolase, fosforilação, prenila-ção, racemização, selenoilação, sulfatação e adição de aminoácios à proteí-na mediada por RNA de transferência tal como arginilação. (Veja Creighton1T.E., Proteins - Structure and Molecular Properties 2nd Ed., W.H. Freemanand Company, New York (1993); Posttranslational Covalent Modification ofProtgnsx B.C. Johnson, Ed., Academic Press, Nova Iorque, pp. 1-12 (1983)).

Métodos de síntese química de peptídeo em fase sólida tambémpodem ser usados para sintetizar o polipeptídeo ou fragmentos da invenção.Tais métodos são conhecidos na técnica desde os primeiros anos de 1960(Merrifield, R. B., J. Am. Chem. Soc., 85:2149-2154, 1963) (veja também Ste-wart, J. M. & Young, J. D., Solid Phase Peptide Svnthesis. 2.- Ed.. Pierce Che-mical Co., Rockford, Ill., pp. 11-12)) e tem sido recentemente empregados emkits laboratoriais de desenho e síntese de peptídeo comercialmente disponí-veis (Cambridge Research Biochemicals). Tais kits de laboratório comercial-mente disponíveis têm utilizado comumente os ensinamentos de Η. M. Geysenet al, Proc. NatL Acad. Sci., USA, 81:3998 (1984) e possibilitam síntese depeptídeos nas extremidades de uma variedade de "hastes" ou "pinos" todos osquais conectados a uma única placa. Quando tal sistema é utilizado, uma pla-ca de hastes ou pinos é invertida e inserida em uma segunda placa de reser-vatórios ou cavidades correspondentes, que contêm soluções para a ligaçãoou ancoragem de um aminoácido apropriado nas extremidades do pino ouhaste. Pela repetição de tal etapa do processo, isto é, invertendo e inserindoas extremidades do pino ou haste em soluções apropriadas, os aminoácidossão montados nos peptídeos desejados. Além disso, vários sistemas de sínte-se de peptídeo FMOC estão disponíveis. Por exemplo, a montagem de umpolipeptídeo ou fragmento pode ser executada sobre um suporte sólido usandoum sintetizador automatizado de peptídeo Applied Biosystems, Inc. Modelo431 A. Tal equipamento fornece rápido acesso aos peptídeos da invenção, tan-to por síntese direta quanto por síntese de uma série de fragmentos que po-dem ser acoplados usando outras técnicas conhecidas.

A invenção inclui xilanases da invenção com e sem sinal. O po-lipeptídeo que compreende uma seqüência de sinal da invenção pode seruma xilanase da invenção ou outra xilanase ou outra enzima ou outro poli-peptídeo.

A invenção inclui xilanases imobilizadas, anticorpos antixilanasee fragmentos desses. A invenção fornece métodos para inibir a atividade daxilanase, por exemplo, usando mutantes dominantes negativos ou anticorposantixilanase da invenção. A invenção inclui heterocomplexos, por exemplo,proteínas de fusão, heterodímeros, etc., que compreendem as xilanases dainvenção.

Polipeptídeos da invenção podem ter uma atividade de xilanasesob várias condições, por exemplo, extremas em pH e/ou temperatura, a-gentes oxidantes e semelhantes. A invenção fornece métodos que levam apreparações alternativas de xilanase com eficiências catalíticas e estabilida-des diferentes, por exemplo face a condições de temperatura, agentes oxi-dantes e lavagem alterada. Em um aspecto, variantes de xilanase podem serproduzidas usando técnicas de mutagênese sítio direcionada e/ou mutagê-nese aleatória. Em um aspecto, a evolução dirigida pode ser usada paraproduzir uma grande variedade de variantes de xilanase com especificidadese estabilidade alternativas.

As proteínas da invenção também são úteis como reagentes depesquisa para identificar moduladores de xilanase, por exemplo, ativadoresou inibidores de atividade de xilanase. Resumidamente, amostras de teste(compostos, caldos, extratos e semelhantes) são adicionados a ensaios paraxilanase para determinar sua habilidade em inibir a clivagem do substrato.Inibidores identificados dessa maneira podem ser usados na indústria e pes-quisa para reduzir ou prevenir proteólise indesejada. Do mesmo modo queas xilanases, inibidores podem ser combinados para aumentar o espectro deatividade.

As enzimas da invenção também são úteis como reagentes depesquisa para digerir proteínas ou no seqüenciamento de proteína. Por e-xemplo, xilanases podem ser usadas para decompor polipeptídeos em frag-mentos menores para uso em seqüenciamento, por exemplo em um se-qüenciador automatizado.

A invenção também fornece métodos de descoberta de novasxilanases usando os ácidos nucléicos, polipeptídeos e anticorpos da inven-ção, Em um aspecto, bibliotecas de fagomídeos são rastreadas para desco-berta de xilanases baseada em expressão. Em outro aspecto, bibliotecas defagos Iambda são rastreadas para descoberta de xilanases baseada em ex-pressão. O rastreamento de bibliotecas de fago ou fagomídeo pode permitira detecção de clones tóxicos; melhorar o acesso ao substrato; reduzir a ne-cessidade de manipular um hospedeiro, contornando o potencial para qual-quer influência que resulte da excisão maciça da biblioteca; e, crescimentomais rápido com baixas densidades de clones. O rastreamento de bibliote-cas de fago ou fagomídeo pode ser em fase líquida ou em fase sólida. Emum aspecto, a invenção fornece o rastreamento em fase líquida. Isso dámaior flexibilidade em condições de ensaio; flexibilidade adicional do subs-trato; maior sensibilidade para clones fracos; e facilidade de automatizaçãosobre o rastreamento em fase sólida.

A invenção fornece métodos de rastreamento usando as proteí-nas e ácidos nucléicos da invenção e automação robotizada para permitir aexecução de várias centenas de reações biocatálíticas e ensaios de rastre-amento em um curto período de tempo, por exemplo, por dia, assim comoassegurar um nível elevado dé precisão e reprodutibilidade (veja discussãode arranjos, abaixo). Como resultado, uma biblioteca de compostos deriva-dos pode ser produzida em uma questão de semanas. Para mais ensina-mentos sobre modificações de moléculas, incluindo moléculas pequenas,veja PCT/US94/09174.Outro aspecto da invenção é um polipeptídeo isolado ou purifi-cado que compreende uma seqüência da invenção e seqüências substanci-almente idênticas a esta ou fragmentos que compreendem pelo menos cercade 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivosdesta. Como discutido acima, tais polipeptídeos podem ser obtidos pela inser-ção de um ácido nucléico que codifica o polipeptídeo em um vetor tal que aseqüência codificante é operativamente ligada a uma seqüência capaz de di-recionar a expressão do polipeptídeo codificado em uma célula hospedeiraadequada. Por exemplo, o vetor de expressão pode compreender um promo-tor, um sítio de ligação a ribossomo para iniciação da tradução e um termina-dor da transcrição. O vetor pode também incluir seqüências apropriadas paraamplificar a expressão.

Outro aspecto da invenção é polipeptídeos ou fragmentos dessesque tem pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menoscerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelomenos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%,pelo menos cerca de 90%, pelo menos cerca de 95%, ou mais do que cercade 95% de homologia com um dos polipeptídeos da invenção e seqüênciassubstancialmente idênticas a estas ou um fragmento que compreende pelomenos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecu-tivos dessa. A homologia pode ser determinada usando qualquer um dos pro-gramas descritos acima que alinha os polipeptídeos ou fragmentos a ser com-parados e determina a extensão da identidade de aminoácidos ou a similarida-de entre eles. Será apreciado que "homologia" de aminoácidos inclui substitui-ções conservativas de aminoácidos tais como aquelas descritas acima.

Os polipeptídeos ou fragmentos que tem homologia com um dospolipeptídeos da invenção ou um fragmento que compreende pelo menos cer-ca de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecuti-vos deste podem ser obtidos pelo isolamento do ácido nucléico que os codificausando as técnicas descritas acima.Alternativamente, polipeptídeos ou fragmentos homólogos podemser obtidos através de enriquecimento bioquímico ou procedimentos de purifi-cação. A seqüência de polipeptídeos ou fragmentos potencialmente homólo-gos pode ser determinada pela digestão com xilano hidrolase, eletroforese emgel e/ou microseqüenciamento. A seqüência do polipeptídeo ou fragmentohomólogo prospectivo pode ser comparada com uma dos polipeptídeos dainvenção ou um fragmento que compreende pelo menos cerca de 5, 10, 15,20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos desses u-sando qualquer um dos programas descritos acima.

Outro aspecto da invenção é um ensaio para identificação defragmentos ou variantes da invenção, que retêm a função enzimática dospolipeptídeos da invenção. Por exemplo, os fragmentos ou variantes dosditos polipeptídeos podem ser usados para catalisar reações bioquímicas,que indicam que o fragmento ou variante retém a atividade enzimática dospolipeptídeos da invenção.

O ensaio para determinar se fragmentos de variantes retêm aatividade enzimática dos polipeptídeos da invenção inclui as etapas de: co-locar o fragmento ou variante de polipeptídeo em conato com uma moléculade substrato sob condições que permitem ao fragmento ou variante de poli-peptídeo funcionar e detectar tanto uma diminuição no nível de substratoquanto um aumento no nível do produto de reação específico da reação en-tre o polipeptídeo e o substrato.

Os polipeptídeos da invenção ou fragmentos que compreendempelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos con-secutivos destes podem ser usados em uma variedade de aplicações. Por e-xemplo, os polipeptídeos ou fragmentos desses podem ser usados para cata-lisar reações bioquímicas. De acordo com um aspecto da invenção, é forneci-do um processo para utilizar os polipeptídeos da invenção ou polinucleotídeosque codificam tais polipeptídeos para hidrolisar ligações glicosídicas. Em taisprocedimentos, uma substância que contém uma ligação glicosídica (por e-xemplo, um amido) é Colocada em contato com um dos polipeptídeos da in-venção ou seqüências substancialmente idênticas a estes sob condições quefacilitam a hidrólise da ligação glicosídica.

A presente invenção explora as propriedades cataiíticas únicas deenzimas. Enquanto o uso de biocatalisadores (isto é, enzimas purificadas oubrutas, células vivas ou não-vivas) em transformações químicas normalmenterequer a identificação de um biocatalisador particular que reaja com um com-posto inicial específico, a presente invenção usa biocatalisadores selecionadose condições de reação que são específicas para grupos funcionais que estãopresentes em vários compostos iniciais, tais como moléculas pequenas. Cadabiocatalisador é específico para um grupo funcional ou vários grupos funcio-nais relacionados e pode reagir com vários compostos iniciais que contém es-se grupo funcional.

As reações biocatalíticas produzem uma população de derivadosa partir de um único composto inicial. Esses derivados podem ser submetidosà outra rodada de reações biocatal íticas para produzir uma segunda populaçãode compostos derivados. Milhares de variações da molécula pequena ou com-posto original podem ser produzidas com cada iteração de derivatização bioca-talítica.

Enzimas reagem em sítios específicos de um composto inicialsem afetar o resto da molécula, um processo que é muito difícil de se obterusando métodos químicos tradicionais. Esse alto grau de especificidade bioca-talítica fornece o meio para identificar um composto ativo único dentro da bibli-oteca. A biblioteca é caracterizada por uma série de reações biocatal íticas u-sadas para produzi-la, a assim chamada "história biossintética". O rastreamen-to da biblioteca quanto a atividades biológicas e a investigação da história bi-ossintética identifica a seqüência de reação específica que produz o compostoativo. A seqüência de reação é repetida e a estrutura do composto sintetizadodeterminada. Esse modo de identificação, diferente de outras abordagens desíntese e rastreamento, não requer tecnologias de imobilização e os compos-tos podem ser sintetizados e testados livres em solução usando virtualmentequalquer tipo de ensaio de rastreamento. É importante observar que o altograu de especificidade de reações enzimáticas de grupos funcionais permite o"rastreamento" de reações enzimáticas específicas que constroem a bibliotecaproduzida biocataliticamente.

Várias das etapas processuais são realizadas usando automatiza-ção robótica que possibilita a execução de vários milhares de reações biocata-líticas e ensaios de rastreamento por dia assim como possibilita um alto graude precisão e reprodutibilidade. Como resultado, uma biblioteca de compostosderivados pode ser produzida em uma questão de semanas o que poderia le-var anos para produzir usando métodos químicos atuais.

Em um aspecto particular, a invenção fornece um método paramodificar moléculas pequenas, que compreende colocar um polipeptídeo codi-ficado por um polinucleotídeo descrito aqui, ou fragmentos enzimaticamenteativos deste, em contato com uma molécula pequena para produzir uma molé-cula pequena modificada. Uma biblioteca de moléculas pequenas modificadasé testada para determinar se uma molécula pequena modificada que está pre-sente dentro da biblioteca exibe uma atividade desejada. Uma reação biocata-lítica específica que produz a molécula pequena modificada com a atividadedesejada é identificada por eliminar sistematicamente cada uma das reaçõesbiocatalíticas usadas para produzir uma porção da biblioteca e então testar asmoléculas pequenas produzidas na porção da biblioteca quanto à presença ouausência da molécula pequena modificada com a atividade desejada. As rea-ções biocatalíticas específicas que produzem a molécula pequena modificadade atividade desejada são, em um aspecto (opcionalmente), repetidas. As rea-ções biocatalíticas são conduzidas com um grupo de biocatalisadores que rea-gem com porções estruturais distintas encontradas dentro da estrutura da mo-lécula pequena, cada biocatalisador é específico para uma porção estruturalou um grupo de porções estruturais relacionadas; e cada biocatalisador reagecom várias moléculas pequenas diferentes que contém a porção estrutural dis-tinta.

Seqüências de sinal, orepro e domínios catalíticos de xilanaseA invenção fornece seqüências de sinal (por exemplo, peptídeosde sinal (SPs)), domínios prepro e domínios catalíticos (CDs) de xilanase.Os SPs, domínios prepro e/ou CDs da invenção podem ser peptídeosisolados, sintéticos ou recombinantes ou podem ser parte de uma proteínade fusão, por exemplo, um domínio heterólogo em uma proteína quimérica.

A invenção fornece ácidos nucléicos que codificam esses domínioscatalíticos (CDs), domínios prepro e seqüências de sinal (SPs, por exemplo,um peptídeo que tem uma seqüência que compreende/consiste em resíduosamino terminais de um polipeptídeo da invenção). Em um aspecto, ainvenção fornece uma seqüência de sinal que compreende um peptídeo quecompreende/consiste em uma seqüência como descrita nos resíduos 1 a 12,1 a 13, 1 a 14, 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a 22, 1a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a 32, 1 a33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a 39, 1 a 40, 1 a 41, 1 a 42, 1 a43, 1 a 44, 1 a 45, 1 a 46, 1 a 47, 1a 48, 1 a 49 ou 1 a 50 de umpolipeptídeo da invenção.

Em um aspecto, a invenção fornece uma seqüência de sinal quecompreende um peptídeo que compreende/consiste em uma seqüênciacomo descrita na Tabela 4 abaixo. Por exemplo, ao ler a Tabela 4, ainvenção fornece uma seqüência de sinal que compreende/consiste nosresíduos de 1 a 23 de SEQ ID NO: 102 (codificada, por exemplo, por SEQ IDNO: 101), uma seqüência de sinal que compreende/consiste nos resíduos de1 a 41 de SEQ ID N0:104 (codificada, por exemplo, por SEQ ID N0:103),etc.

Tabela 4: seqüências de sinal exemplares da invenção

<table>table see original document page 242</column></row><table><table>table see original document page 243</column></row><table><table>table see original document page 244</column></row><table><table>table see original document page 245</column></row><table><table>table see original document page 246</column></row><table><table>table see original document page 247</column></row><table><table>table see original document page 248</column></row><table><table>table see original document page 249</column></row><table>

As seqüências de sinal (SPs) e/ou seqüência prepro de xilanaseda invenção podem ser peptídeos isolados ou seqüências ligadas a outraxilanase ou a um polipeptídeo não-xilanase, por exemplo, como uma proteí-na de fusão (quimérica). Em um aspecto, a invenção fornece polipeptídeosque compreendem seqüências de sinal de xilanase da invenção. Em um as-pecto, polipeptídeos que compreendem seqüências de sinal SPs e/ou preprode xilanase da invenção compreendem seqüências heterólogas a uma xila-nase da invenção (por exemplo, uma proteína de fusão que compreendeuma SP e/ou prepro da invenção e seqüências de outra xilanase ou de umaproteína não-xilanase). Em um aspecto, a invenção fornece xilanases dainvenção com SPs e/ou seqüências prepro heterólogas, por exemplo, se-qüências com uma seqüência de sinal de levedura. Uma xilanase da inven-ção pode compreender uma SP e/ou prepro heterólogas em um vetor, porexemplo, um vetor da série pPIC (Invitrogen, Carlsbad, CA).

Em um aspecto, SPs e/ou seqüências prepro da invenção sãoidentificados após a identificação de novos polipeptídeos de xilanase. Asvias pelas as proteínas são classificadas e transportadas para as suas loca-lizações celulares apropriadas são geralmente referidas como vias de dire-cionamento de proteína. Um dos mais importantes elementos em todos es-ses sistemas de direcionamento é uma seqüência de aminoácido curta naterminação amina de um polipeptídeo recentemente sintetizado chamada deseqüência de sinal. Essa seqüência de sinal direciona a proteína para sualocalização apropriada na célula e é removida durante o transporte ou quan-do a proteína alcança seu destino final. A maioria das proteínas lisossomais,de membrana ou secretadas tem uma seqüência de sinal amino-terminalque marca as mesmas para translocação para dentro da luz do retículo en-doplasmático. Mais de 100 seqüências de sinal para proteínas desse grupoforam determinadas. As seqüências de sinal podem variar em extensão en-tre cerca de 11 a 41 ou entre cerca de 13 a 36 resíduos de aminoácidos.Vários métodos de reconhecimento de seqüências de sinal são conhecidospor aqueles versados na técnica. Por exemplo, em um aspecto, novos peptí-deos de sinal de xilanase são identificados por um método referido comoSignalP. SignaIP usa uma rede neural combinada que reconhece os peptí-deos de sinal e seus sítios de clivagem, veja, por exemplo, Nielsen (1997)"Identification of prokaryotic and eukaryotic signal peptides and prediction oftheir cleavage sites." Protein Engineering 10:1-6.

Deve ficar entendido que, em alguns aspectos, as xilanases dainvenção podem não ter SPs e/ou seqüências prepro ou "domínios". Em umaspecto, a invenção fornece xilanases que não têm todo ou de parte de umaSP e/ou domínio prepro. Em um aspecto, a invenção fornece uma seqüênciade ácido nucléico que codifica uma seqüência de sinal (SP) e/ou prepro deuma xilanase operativamente ligada a uma seqüência de ácido nucléico deuma xilanase diferente ou, em um aspecto (opcionalmente), uma seqüênciade sinal (SPs) e/ou domínio prepro de uma proteína não-xilanase pode serdesejado.

A invenção também fornece polipeptídeos isolados, sintéticos ourecombinantes que compreendem seqüências de sinal (SPs), domínio pre-pro e/ou domínios catalíticos (CDs) da invenção e seqüências heterólogas.As seqüências heterólogas são seqüências não naturalmente associadas(por exemplo, a uma xilanase) com uma SP, domínio prepro e/ou CD. A se-qüência a qual SP, domínio prepro e/ou CD não estão naturalmente associ-ados pode estar na terminação amina, terminação carboxila de SP, domínioprepro e/ou CD e/ou em ambas as terminações de SP e/ou CD. Em um as-pecto, a invenção fornece um polipeptídeo isolado, sintético ou recombinanteque compreende (ou consiste em) um polipeptídeo que compreende umaseqüência de sinal (SP), domínio prepro e/ou domínio catalítico (CD) da in-venção com a condição de que não esteja associada com nenhuma seqüên-cia a qual ela está naturalmente associada (por exemplo, uma seqüência dexilanase). Similarmente, em um aspecto, a invenção fornece ácidos nucléi-cos isolados, sintéticos ou recombinantes que codificam esses polipeptí-deos. Assim, em um aspecto, o ácido nucléico isolado, sintético ou recombi-nante da invenção compreende uma seqüência codificante para uma se-qüência de sinal (SP), domínio prepro e/ou domínio catalítico (CD) da inven-ção e uma seqüência heteróloga (isto é, uma seqüência não naturalmenteassociada com uma seqüência de sinal (SP), domínio prepro e/ou domíniocatalítico (CD) da invenção). A seqüência heteróloga pode ser sobre a ex-tremidade 3' terminal, 5' terminal e/ou sobre ambas as extremidades da se-qüência codificante de SP, domínio prepro e/ou CD.

Xilanases híbridas (quiméricas) e bibliotecas de peptídeo

Em um aspecto, a invenção fornece xilanases híbridas eproteínas de fusão, incluindo bibliotecas de peptídeo, compreendendo asseqüências da invenção. As bibliotecas de peptídeo da invenção podem serusadas para isolar moduladores de peptídeo (por exemplo, ativadores ouinibidores) de alvos, tais como substratos de xilanase, receptores, enzimas.As bibliotecas de peptídeo da invenção podem ser usadas para identificarparceiros de ligação formais de alvos, tais como ligantes, por exemplo,citocinas, hormônios e semelhantes. Em um aspecto, a invenção forneceproteínas quiméricas que compreendem uma seqüência de sinal (SP),domínio prepro e/ou domínio catalítico (CD) da invenção ou umacombinação desses e uma seqüência heteróloga (veja acima).

Em um aspecto, as proteínas de fusão da invenção (porexemplo, a porção peptídica) são conformacionalmente estabilizadas (emrelação a peptídeos lineares) para permitir uma maior afinidade de ligaçãoaos alvos. A invenção fornece fusões de xilanases da invenção e outrospeptídeos, incluindo peptídeos conhecidos e aleatórios. Eles podem serfundidos de tal maneira que a estrutura das xilanases não ésignificativamente perturbada e o peptídeo é estabilizadoconformacionalmente, metabolicamente ou estruturalmente. Isso permite acriação de uma biblioteca de peptídeo que é facilmente monitorada por suapresença dentro da célula e por sua quantidade.

Variantes de seqüência de aminoácidos da invenção podem sercaracterizadas por uma natureza predeterminada da variação, um aspectoque as coloca em separado de uma forma que ocorre naturalmente, por e-xemplo, uma variação alélica ou inter-espécie de uma seqüência de xilana-se. Em um aspecto, as variantes da invenção exibem a mesma atividadebiológica qualitativa que o análogo que ocorre naturalmente. Alternativamen-te, as variantes podem ser selecionadas por terem características modifica-das. Em um aspecto, enquanto o sítio ou da região para introdução de umavariação de seqüência de aminoácido é predeterminado, a mutação em sinão precisa ser predeterminada. Por exemplo, a fim de otimizar o desempe-nho de uma mutação em um dado sítio, a mutagênese aleatória pode serconduzida para o códon alvo ou região e as variantes de xilanase expressasrastreadas quanto à combinação ótima de atividade desejada. Técnicas parafazer mutações por substituição em sítios predeterminados no DNA que temuma seqüência conhecida são bem-conhecidas, como discutido aqui, porexemplo, mutagênese por iniciador M13 e mutagênese por PCR. O rastrea-mento dos mutantes pode ser feito usando, por exemplo, ensaios de hidróli-se de xilano. Em aspectos alternativos, substituições de aminoácidos podemser resíduos únicos; inserções podem ser da ordem de cerca de 1 a 20 ami-noácidos, embora inserções consideravelmente maiores possam ser feitas.Deleções podem variar entre cerca de 1 a cerca de 20, 30, 40, 50, 60, 70 oumais resíduos. Para se obter um derivado final com propriedades ótimas,substituições, deleções, inserções ou qualquer combinação desses podemser usadas. Geralmente, essas alterações são feitas sobre alguns aminoáci-dos para minimizar a alteração da molécula. Entretanto, alterações maiorespodem ser toleradas em certas circunstancias.

A invenção fornece xilanases onde a estrutura da cadeia princi-pal do polipeptídeo, a estrutura secundária ou terciária, por exemplo, umaestrutura em alfa hélice ou folha beta, foi modificada. Em um aspecto, a car-ga ou hidrofobicidade foi modificada. Em um aspecto, o volume de uma ca-deia lateral foi modificado. Alterações substanciais na função ou identidadeimunológica são feitas pela seleção de substituições que são menos conser-vativas. Por exemplo, podem ser feitas substituições que afetam mais signi-ficativamente: a estrutura da cadeia principal do polipeptídeo na área da alte-ração, por exemplo, uma estrutura em alfa-hélice ou folha-beta; uma cargaou um sítio hidrofóbico da molécula, que pode ser um sítio ativo; ou uma ca-deia lateral. A invenção fornece substituições em polipeptídeos da invençãoonde (a) um resíduo hidrofílico, por exemplo, serila ou treonila, é substituídopor um resíduo hidrofóbico, por exemplo, leucila, isoleucila, fenilalanila, valilaou alanil;a (b) uma cisteína ou prolina é substituída por outro resíduo; (c) umresíduo que tem uma cadeia lateral eletropositiva, por exemplo, lisila, arginilaou histidila é substituído por um resíduo eletronegativo, por exemplo, gluta-mila ou aspartila; ou (d) um resíduo que tem uma cadeia lateral grande, porexemplo, fenilalanina, é substituído por um que não tem uma cadeia lateral,por exemplo, glicina. As variantes podem exibir a mesma atividade biológicaqualitativa (isto é, atividade de xilanase) embora variantes possam ser sele-cionadas para modificar as características das xilanases como necessário.

Em um aspecto, xilanases da invenção compreendem epitoposou sinalizadores de purificação, seqüências de sinal ou outras seqüências defusão, etc. Em um aspecto, as xilanases da invenção podem ser fundidas aum peptídeo aleatório para formar um polipeptídeo de fusão. Por "fundido"ou "operativamente ligado" entende-se que o peptídeo aleatório e a xilanaseestão ligados juntos, de maneira a minimizar a ruptura da estabilidade daestrutura da xilanase, por exemplo, retém a atividade de xilanase. O polipep-tídeo de fusão (ou polinucleotídeo de fusão que codifica o polipeptídeo defusão) pode compreender ainda outros componentes, incluindo múltiplospeptídeos em múltiplas alças.

Em um aspecto, os peptídeos e ácidos nucléicos que os codifi-cam são randomizados, ou completamente randomizados ou eles induzidosem sua randomização, por exemplo, geralmente na freqüência de nucleotí-deo/peptídeo ou por posição. "Randomizado" significa que cada ácido nu-cléico e peptídeo consiste em nucleotídeos e aminoácidos essencialmentealeatórios, respectivamente. Em um aspecto, os ácidos nucléicos que dãoorigem aos peptídeos podem ser sintetizados quimicamente e assim podemincorporar qualquer nucleotídeo em qualquer posição. Assim, quando os á-cidos nucléicos são expressos para formar peptídeos, qualquer resíduo deaminoácido pode ser incorporado em qualquer posição. O processo sintéticopode ser designado para gerar ácidos nucléicos randomizados, para permitira formação de todas ou da maioria das combinações possíveis sobre a ex-tensão do ácido nucléico, formando assim uma biblioteca de ácidos nucléi-cos aleatórios. A biblioteca pode fornecer uma população suficientementediversa estruturalmente de produtos de expressão para afetar uma faixaprobabilisticamente suficiente de respostas celulares para fornecer uma oumais células que exibem a resposta desejada. Assim, a invenção forneceuma biblioteca de interação grande o suficiente tal que pelo menos um deseus membros terá uma estrutura que dá a ele afinidade por algumas molé-culas, proteína ou outro fator.

Xilanases são enzimas de multidomínios que consistem, em umaspecto (opcionalmente), em um peptídeo de sinal, um módulo de ligação acarboidrato, um domínio catalítico de xilanase, um Iigante e/ou outro domíniocatai ítico.A invenção fornece um meio de gerar polipeptídeos quiméricosque podem codificar polipeptídeos híbridos biologicamente ativos (por e-xemplo, xilanases híbridas). Em um aspecto, os polinucleotídeos originaiscodificam polipeptídeos biologicamente ativos. O método da invenção pro-duz novos polipeptídeos híbridos pela utilização de processos celulares queintegram a seqüência do polinucleotídeo original tal que o polinucleotídeohíbrido resultante codifique um polipeptídeo que demonstra atividades deri-vadas dos polipeptídeos ativos biologicamente originais. Por exemplo, poli-nucleotídeos originais podem codificar uma enzima particular de microrga-nismos diferentes. Qualquer enzima codificada por um primeiro polinucleotí-deo de um organismo ou uma variante desse, por exemplo, funciona efeti-vamente sob uma condição ambiental particular, por exemplo, alta salinida-de. Uma enzima codificada por um segundo polinucleotídeo de um organis-mo diferente ou variante pode funcionar efetivamente sob uma condiçãoambiental diferente, tal como temperaturas extremamente elevadas. Um po-linucleotídeo híbrido que contenha seqüências do primeiro e segundo poli-nucleotídeos originais pode codificar uma enzima que exibe característicasde ambas as enzimas codificadas pelos polinucleotídeos originais. Assim, aenzima codificada pelo polinucleotídeo híbrido pode funcionar efetivamentesob condições ambientais partilhadas por cada uma das enzimas codificadaspelo primeiro e segundo polinucleotídeos, por exemplo, alta salinidade etemperaturas extremas.

Enzimas codificadas pelos polinucleotídeos da invenção inclu-em, mas não são limitadas a hidrolases, tais como xilanases. Hidrolases deglicosidase foram inicialmente classificadas em famílias em 1991, veja, porexemplo, Henrissat (1991) Biochem. J. 280:309-316. Desde então, as classi-ficações tem sido continuamente atualizadas, veja, por exemplo, Henrissat(1993) Biochem. J. 293:781-788; Henrissat (1996) Biochem. J. 316:695-696;Henrissat (2000) Plant Physiology 124:1515-1519. Existem 87 famílias iden-tificadas de hidrolases de glicosidase. Em um aspecto, as xilanases da in-venção podem ser classificadas em famílias 8, 10, 11, 26 e 30. Em um as-pecto, a invenção também fornece ácidos nucléicos que codificam xilanasecom uma novidade em comum pelo fato de que eles são derivados de umafamília comum, por exemplo, família 5, 6, 8, 10, 11, 26 ou 30, como descritona Tabela 5, abaixo.

Tabela 5

<table>table see original document page 256</column></row><table><table>table see original document page 257</column></row><table><table>table see original document page 258</column></row><table><table>table see original document page 259</column></row><table><table>table see original document page 260</column></row><table>

Um polipeptídeo híbrido que resulta de um método da invençãopode exibir atividade de enzima especializada não apresentada nas enzimasoriginais. Por exemplo, depois de recombinação e/ou reclassificação redutivade polinucleotídeos que codificam atividades de hidrolase, o polipeptídeohíbrido resultante codificado por um polinucleotídeo híbrido pode ser rastre-ado para atividades de hidrolase especializadas obtidas a partir de cada umadas enzimas originais, isto é, o tipo de ligação na qual a hidrolase age e atemperatura na qual a hidrolase funciona. Assim, por exemplo, a hidrolasepode ser rastreada para verificar aquelas funcionalidades químicas que dis-tinguem a hidrolase híbrida das hidrolases originais, tais como: (a) amida(ligações peptídicas), isto é, xilanases; (b) ligações de éster, isto é, esteara-ses e lipases; (c) acetais, isto é, glicosidases e, por exemplo, a temperatura,pH ou concentração de sal nas quais o polipeptídeo híbrido funciona.

Fontes dos polinucleotídeos originais podem ser isoladas deorganismos individuais ("isolados"), coleções de organismos que tenhamcrescido em meios definidos ("culturas de enriquecimento") ou organismosnão cultivados ("amostras ambientais"). O uso de uma abordagem indepen-dente de cultura para derivar polinucleotídeos que codificam novas bioativi-dades a partir de amostras ambientais é mais preferível desde que ela per-mita avaliar recursos de biodiversidade não explorados.

"Bibliotecas ambientais" são geradas a partir de amostras ambi-entais e representam os genomas coletivos de organismos que ocorrem na-turalmente arquivados em vetores de clonagem que podem ser propagadosem hospedeiros procarióticos adequados. Como o DNA clonado é inicial-mente extraído diretamente de amostras ambientais, as bibliotecas não sãolimitadas à pequena fração de procariotos que podem ser cultivados em cul-tura pura. Além disso, uma normalização do DNA ambiental presente nessasamostras pode permitir uma representação mais idêntica do DNA de todasas espécies presentes na amostra original. Isso pode aumentar dramatica-mente a eficiência de descoberta de genes interessantes a partir dos consti-tuintes secundários da amostra que podem estar sub-representados em vá-rias ordens de magnitude comparados com as espécies dominantes.

Por exemplo, bibliotecas de genes geradas a partir de um oumais microrganismos não cultivados são rastreadas para uma atividade deinteresse. Vias potenciais que codificam moléculas bioativas de interessesão capturadas primeiro em células procarióticas na forma de bibliotecas deexpressão de gene. Polinucleotídeos que codificam atividades de interessesão isolados de tais bibliotecas e introduzidos em uma célula hospedeira. Acélula hospedeira é cultivada sob condições que promovem a recombinaçãoe/ou a reclassificação redutiva criando biomoléculas potencialmente ativascom atividades novas ou intensificadas.

Além disso, a subclonagem pode ser realizada para isolar se-qüências de interesse. Na subclonagem, uma porção de DNA é amplificada,digerida, geralmente por enzimas de restrição, para cortar a seqüência dese-jada, a seqüência desejada é ligada a um vetor receptor e é amplificada. Emcada etapa de subclonagem, a porção é examinada para a atividade de inte-resse, a fim de assegurar que o DNA que codifica a proteína estrutural nãotenha sido excluído. O inserto pode ser purificado em qualquer etapa dasubclonagem, por exemplo, por eletroforese em gel antes da ligação em umvetor ou onde células que contêm o vetor receptor e células que não contêmo vetor receptor são colocadas em meios seletivos contendo, por exemplo,um antibiótico que matará as células que não contêm o vetor receptor. Mé-todos específicos de subclonar insertos de DNA em vetores são bem-conhecidos na técnica (Sambrook et al., Molecular Clonina: A LaboratorvManual. 2g Ed.. Cold Spring Harbor Laboratory Press (1989)). Em outro as-pecto, as enzimas da invenção são subclones. Tais subclones podem diferirdo clone precursor, por exemplo, pela extensão, uma mutação, um sinaliza-dor ou um marcador.

Deve ser compreendido que algumas das xilanases da invençãopodem ou não conter seqüências de sinal. Pode ser desejável incluir umaseqüência de ácido nucléico que codifica uma seqüência de sinal de umaxilanase operativamente ligada a uma seqüência de ácido nucléico de umaxilanase diferente ou, em um aspecto (opcionalmente), uma seqüência desinal de uma proteína não-xilanase pode ser desejada.Os microrganismos a partir dos quais o polinucleotídeo pode serpreparado incluem microrganismos procarióticos, tais como Eubacteria eArchaebacteria e microrganismos eucarióticos inferiores tais como fungos,algumas algas e protozoários. Polinucleotídeos podem ser isolados de a-mostras ambientais em cujo caso o ácido nucléico pode ser recuperado semo cultivo de um organismo ou recuperado a partir de um ou mais organismoscultivados. Em um aspecto, tais microrganismos podem ser extremófilos, taiscomo hipertermófilos, psicrófilos, psicotróficos, halófilos, barófilos e acidófi-los. Polinucleotídeos que codificam enzimas isoladas de microrganismosextremofílicos podem ser usados. Tais enzimas podem funcionar em tempe-raturas acima de 100-C em fontes quentes terrestres e ventos hidrotermaisprofundos, em temperaturas abaixo de 0-C em águas árticas, no ambientesaturado de sal do Mar Morto, em valores de pH em torno de 0 em depósitosde carvão e fontes geotérmicas ricas em enxofre ou em valores de pH maio-res do que 11 em lama de água de esgoto. Por exemplo, várias estearases elipases clonadas e expressas a partir de organismos extremofílicos mostramalta atividade em de uma ampla faixa de temperaturas e pHs.

Polinucleotídeos selecionados e isolados como descrito acimasão introduzidos em uma célula hospedeira adequada. Uma célula hospedei-ra adequada é qualquer célula que é capaz de promover recombinação e/oureagrupamento redutor. Os polinucleotídeos selecionados já estão preferi-velmente em um vetor que inclui seqüências de controle apropriadas. A célu-la hospedeira pode ser uma célula eucariótica superior, tal como uma célulade mamífero, ou uma célula eucariótica inferior, tal como uma célula de Ie-vedura, ou preferivelmente, a célula hospedeira pode ser uma célula proca-riótica, tal como uma célula bacteriana. A introdução do construto na célulahospedeira pode ser efetuada por transfecção com fosfato de cálcio, trans-fecção mediada por DEAE-dextran ou eletroporação (Davis et ai., 1986).

Como exemplos representativos de hospedeiros apropriados,podem ser mencionados: células bacterianas, tais como E. coli, Streptomy-ces, Salmonella typhimurium-, células fúngicas, tais como levedura; célulasde inseto, tais como Drosophila S2 e Spodoptera Sf9; células de animais,tais como CHO, COS ou de melanoma de Bowes; adenovírus; e células deplantas. A seleção de um hospedeiro apropriado é considerada estar dentrodo escopo daqueles versados na técnica a partir dos ensinamentos aquicontidos.

Com referência particular aos vários sistemas de cultura de célu-la de mamífero que podem ser empregados para expressar proteína recom-binante, exemplos de sistema de expressão de mamífero incluem as linha-gens COS-7 de fibroblasto de rim de macaco, descritas em "SV40-transformed simian cells support the replication of early SV40 mutants"(Gluzman, 1981) e outras linhagens celulares capazes de expressar um ve-tor compatível, por exemplo, as linhagens celulares C127, 3T3, CHO, HeLae BHK. Vetores de expressão em mamífero compreenderão uma origem dereplicação, um promotor e intensificador adequados e também quaisquersítios de ligação a ribossomo necessários, sítio de poliadenilação, sítios do-ador e aceptor de splice, seqüências de terminação traducional e seqüências5' flanqueadoras não traduzidas. As seqüências de DNA derivadas de sítiosde Splice e poliadenilação de SV40 podem ser usadas para fornecer os ele-mentos genéticos não transcritos necessários.

Em outro aspecto, pretende-se que o método da presente in-venção possa ser usado para gerar novos polinucleotídeos que codificamvias bioquímicas de um ou mais óperons ou clusters de genes ou porçõesdesses. Por exemplo, bactérias e vários eucariotos têm um mecanismo co-ordenado para regulação de genes cujos produtos estão envolvidos em pro-cessos relacionados. Os genes são agrupados em estruturas referidas como"clusters de gene" sobre um único cromossomo e são transcritos juntos sobo controle de uma única seqüência regulatória, incluindo um único promotorque inicia a transcrição do cluster inteiro. Assim um cluster de gene é umgrupo de genes adjacentes que são idênticos ou relacionados, geralmentedevido às suas funções. Um exemplo de uma via bioquímica codificada porclusters de gene são policetídeos.O DNA do cluster de gene pode ser isolado de diferentes orga-nismos e ligado em vetores, particularmente vetores que contêm seqüênciasregulatórias de expressão que podem controlar e regular a produção de umaproteína detectável ou a atividade de um arranjo relacionado a proteína dosclusters de gene ligados. O uso de vetores que tem uma capacidade excep-cionalmente grande para introdução de DNA exógeno é particularmente a-propriado para uso com tais clusters de gene e está descrito por meio deexemplo aqui para incluir o fator f (ou fator de fertilidade) de E. coli. Essefator f de E. colié um plasmídeo que afeta a sua própria transferência de altafreqüência durante a conjugação e é ideal para se obter e propagar estavel-mente grandes fragmentos de DNA1 tais como clusters de gene de amostrasmicrobianas mistas. Um aspecto da invenção é usar vetores de clonagem,referidos como "fosmídeos" ou vetores de cromossomo bacteriano artificial(BAC). Esses são derivados do fator f de E coli que é capaz de integrar es-tavelmente grandes segmentos de DNA genômico. Quando integrados comDNA de uma amostra ambiental não cultivada mista, isso torna possível seobter grandes fragmentos genômicos na forma de uma "biblioteca de DNAambiental" estável. Outro tipo de vetor para uso no presente invenção é umvetor de cosmídeo. Vetores de cosmídeos foram originalmente designadospara clonar e propagar grandes segmentos de DNA genômico. A clonagemem vetores de cosmídeos está descrita em detalhes em Sambrook et ai,Molecular Cloninq: A Laboratorv Manual. 2- Ed., Cold Spring Harbor Labora-tory Press (1989). Uma vez ligados em um vetor apropriado, dois ou maisvetores contendo diferentes clusters de gene de policetídeo sintase podemser introduzidos em uma célula hospedeira adequada. Regiões de homolo-gia parcial de seqüência partilhadas pelos clusters de gene promoverão pro-cessos que resultam em reorganização de seqüência resultando em um hí-brido do cluster de gene. O novo cluster de gene híbrido pode então ser ras-treado quanto as atividades intensificadas não encontradas nos clusters degene originais.Portanto, em um aspecto, a invenção refere-se a um métodopara produzir um poiipeptídeo híbrido biologicamente ativo e rastrear tal po-iipeptídeo quanto a atividade intensificada por:

1) introduzir pelo menos um primeiro polinucleotídeo em ligaçãooperativa e um segundo polinucleotídeo em ligação operativa, o pelo menosprimeiro polinucleotídeo e segundo polinucleotídeo partilhando pelo menosuma região de homologia parcial de seqüência, em uma célula hospedeiraadequada;

2) cultivar a célula hospedeira sob condições que promovam areorganização da seqüência resultando em um polinucleotídeo híbrido emligação operativa;

3) expressar o poiipeptídeo híbrido codificado pelo polinucleotí-deo híbrido;

4) rastrear o poiipeptídeo híbrido sob condições que promovamidentificação de atividade biológica aumentada; e

5) isolar o polinucleotídeo que codifica o poiipeptídeo híbrido.

Métodos para rastrear várias atividades enzimáticas são conhe-cidos daqueles versados na técnica e são discutidos ao longo do presentepedido. Tais métodos podem ser empregados quando isolar os polipeptídeose polinucleotídeos da presente invenção.

Metodologias de Rastreamento e Equipamentos de Monitoramento "On-line"

Na prática dos métodos da invenção, uma variedade de apare-lhos e metodologias podem ser usados para, em conjunto com os polipeptí-deos e ácidos nucléicos da invenção, por exemplo, rastrear polipeptídeosquanto a atividade de xilanase (por exemplo, ensaios tais como hidrólise decaseína em zimogramas, a liberação de fluorescência da gelatina, ou a libe-ração de p-nitroanilida de vários substratos de peptídeos pequenos), rastrearcompostos como moduladores em potencial, por exemplo, ativadores ou ini-bidores, de uma atividade de xilanase, para anticorpos que se ligam a umpoiipeptídeo da invenção, para ácidos nucléicos que hibridizam a um ácidonucléico da invenção, para rastrear células que expressam um poiipeptídeoda invenção e semelhantes. Além da estrutura de arranjo descrita com deta-lhes abaixo para o rastreamento de amostras, estruturas alternativas podemser usadas para praticar os métodos da invenção. Tais estruturas incluem,por exemplo, espectrômetros de massa, cromatógrafos, por exemplo, HPLCde alto rendimento e outras formas de cromatografia líquida e estruturasmenores, tais como placas de 1536 cavidades, placas de 384 cavidades eassim por diante. Aparelhos de rastreamento de alto rendimento podem seradaptados e usados para praticar os métodos da invenção, veja por exem-plo, Pedido de Patente U.S. N0. 20020001809.

Arranjos Capilares

Ácidos nucléicos ou polipeptídeos da invenção podem ser imobi-lizados ou aplicados a um arranjo. Arranjos podem ser usados para rastrearou monitorar bibliotecas de composições (por exemplo, moléculas pequenas,anticorpos, ácidos nucléicos, etc.) quanto a sua habilidade de se ligar oumodular a atividade de um ácido nucléico ou polipeptídeo da invenção. Ar-ranjos capilares, tais como GIGAMATRIX™, Diversa Corporation, San Die-go, CA; e arranjos descritos, por exemplo, no Pedido de Patente U.S. N°.20020080350 A1; WO 0231203 A; WO 0244336 A, fornecem um equipa-mento alternativo para conter e rastrear amostras. Em um aspecto, o arranjocapilar inclui uma pluralidade de capilares formados em um arranjo de capi-lares adjacentes, em que cada capilar compreende pelo menos uma paredeque define uma cavidade para reter a amostra. A cavidade pode ser cilíndri-ca, quadrada, hexagonal ou de qualquer outra forma geométrica desde queas paredes formem uma cavidade para retenção de um líquido ou amostra.

Os capilares do arranjo capilar podem ser mantidos juntos em estreita pro-ximidade para formar uma estrutura plana. Os capilares podem estar ligadosjuntos, por estarem fundidos (por exemplo, onde os capilares são feitos devidro), colados, ligados ou grampeados lado a lado. Além disso, o arranjocapilar pode incluir material intersticial disposto entre capilares adjacentes noarranjo, formando dessa maneira um dispositivo sólido plano que contémuma pluralidade de orifícios.Um arranjo capilar pode ser formado por qualquer número decapilares individuais, por exemplo, uma faixa de 100 a 4.000.000 de capila-res. Além disso, um arranjo capilar que tem cerca de 100.000 ou mais capi-lares individuais pode ser formado no tamanho padronizado e na forma deuma placa de Microtiter® para equipar um equipamento de laboratório pa-dronizado. As cavidades são preenchidas manualmente ou automaticamenteusando a ação capilar ou microinjeção usando uma agulha fina. As amostrasde interesse podem ser subseqüentemente removidas dos capilares indivi-duais para análise e caracterização posteriores. Por exemplo, uma sondafina semelhante a uma agulha é posicionada no fluido de comunicação comum capilar selecionado para adicionar ou retirar material da cavidade.

Em um ensaio de rastreamento com recipiente único, os com-ponentes do ensaio são misturados rendendo uma solução de interesse,antes da inserção no arranjo capilar. A cavidade é preenchida por ação capi-lar quando pelo menos uma porção do arranjo é imersa em uma solução deinteresse. Reações e/ou atividades químicas ou biológicas são monitoradasquanto a eventos detectáveis. Um evento detectável é geralmente referidocomo um "hit", que pode ser geralmente distinguido de capilares que nãoproduzem "hit" por detecção óptica. Assim, arranjos capilares permitemgrande detecção paralela de "hits".

Em um ensaio de rastreamento de múltiplos recipientes, um po-lipeptídeo ou ácido nucléico, por exemplo, um ligante, pode ser introduzidoem um primeiro componente, que é introduzido em pelo menos uma porçãode um capilar de um arranjo capilar. Uma bolha de ar pode então ser intro-duzida no capilar atrás do primeiro componente. Um segundo componentepode então ser introduzido no capilar, onde o segundo componente é sepa-rado do primeiro componente pela bolha de ar. O primeiro e segundo com-ponentes podem então ser misturados pela aplicação de pressão hidrostáti-ca em ambos os lados do arranjo capilar para desintegrar a bolha. O arranjocapilar é então monitorizado quanto a um evento detectável que resulta dereação ou não reação dos dois componentes.Em um ensaio de rastreamento de ligação, uma amostra de inte-resse pode ser introduzida como um primeiro líquido marcado com uma par-tícula detectável em um capilar de um arranjo capilar, no qual a cavidade docapilar é revestida com um material Iigante para a ligação da partícula detec-tável com a cavidade. O primeiro líquido pode então ser removido do tubocapilar, no qual a partícula detectável ligada é mantida dentro do capilar, eum segundo líquido é introduzido no tubo capilar. O capilar é então monito-rado quanto a um evento detectável que resulta de reação ou não reação dapartícula com o segundo líquido.

Arranjos ou "Biochips"

Ácidos nucléicos e/ou polipeptídeos da invenção podem ser i-mobilizados ou aplicados a um arranjo, por exemplo, um "biochip". Arranjospodem ser usados para rastrear ou monitorar bibliotecas de composições(por exemplo, moléculas pequenas, anticorpos, ácidos nucléicos, etc.) quan-to as suas habilidades de se ligar ou modular a atividade de um ácido nu-cléico ou um polipeptídeo da invenção. Por exemplo, em um aspecto da in-venção, um parâmetro monitorizado é a expressão transcrita de um gene dexilanase. Um ou mais, ou todos os transcritos de uma célula podem ser me-didos pela hibridização de uma amostra que compreende transcritos da célu-la ou ácidos nucléicos representativos ou complementares a transcritos deuma célula, pela hibridização com ácidos nucléicos imobilizados sobre umarranjo ou "biochip". Pelo uso de um "arranjo" de ácidos nucléicos sobre ummicrochip, alguns ou todos os transcritos de uma célula podem ser simulta-neamente quantificados. Alternativamente, arranjos que compreendem ácidonucléico genômico também podem ser usados para determinar o genótipode uma cepa recentemente manipulada feita pelos métodos da invenção."Arranjos" de polipeptídeo também podem ser usados para quantificar simul-taneamente uma pluralidade de proteínas. A presente invenção pode serpraticada com qualquer "arranjo" conhecido, também referido como um "mi-croarranjo" ou "arranjo de ácido nucléico" ou "arranjo de polipeptídeo" ou"arranjo de anticorpo" ou "biochip" ou variação desses. Arranjos são generi-camente uma pluralidade de "pontos" ou "elementos alvos", cada elementoalvo compreendendo uma quantidade definida de uma ou mais moléculasbiológicas, por exemplo, oligonucleotídeos, imobilizadas sobre uma área de-finida de uma superfície de substrato para ligação específica com uma molé-cuia da amostra, por exemplo, transcritos de mRNA.

Os termos "arranjo" ou "microarranjo" ou "biochip" ou "chip" co-mo usados aqui são uma pluralidade de elementos alvos, cada elementoalvo compreendendo uma quantidade definida de um ou mais polipeptídeos(incluindo anticorpos) ou ácidos nucléicos imobilizados sobre uma área defi-nida de uma superfície de substrato, como discutido em maiores detalhesabaixo.

Na prática dos métodos da invenção, qualquer arranjo conheci-do e/ou método de fazer ou usar arranjos pode ser incorporado no todo ouem parte, ou variações desses, como descrito, por exemplo, nas PatentesU.S. Nos. 6.277.628; 6.277.489; 6.261.776; 6.258.606; 6.054.270;6.048.695; 6.045.996; 6.022.963; 6,013.440; 5.965.452; 5.959.098;5.856.174; 5.830.645; 5.770.456; 5.632.957; 5.556.752; 5.143.854;5.807.522; 5.800.992; 5.744.305; 5.700.637; 5.556.752; 5.434.049; vejatambém, por exemplo, WO 99/51773; WO 99/09217; WO 97/46313; WO96/17958; veja também, por exemplo, Johnston (1998) Curr. Biol. 8:R171-R174; Schummer (1997) Biotechniques 23:1087-1092; Kern (1997) Biotech-niques 23:120-124; Solinas-Toldo (1997) Genes, Chromosomes & Câncer20:399-407; Bowtell (1999) Nature Genetics Supp. 21:25-32. Veja tambémpedidos de patente U.S. Nos. 20010018642; 20010019827; 20010016322;20010014449; 20010014448; 20010012537;20010008765.

Anticorpos e métodos de rastreamento baseados em anticorpos

A invenção fornece anticorpos isolados, sintéticos ourecombinantes que se ligam especificamente a uma xilanase da invenção.Esses anticorpos podem ser usados para isolar, identificar ou quantificar asxilanases da invenção ou polipeptídeos relacionados. Esses anticorpospodem ser usados para isolar outros peptídeos dentro do escopo dainvenção ou outras xilanases relacionadas. Os anticorpos podem serdesignados para se ligar a um sítio ativo de uma xilanase. Assim, a invençãofornece métodos para inibir xilanases usando os anticorpos da invenção(veja discussão acima com relação a aplicações para as composiçõesantixilanase da invenção).

A invenção fornece fragmentos de enzimas da invenção,incluindo fragmentos imunogênicos de um polipeptídeo da invenção. Ainvenção fornece composições que compreendem um polipeptídeo oupeptídeo da invenção e adjuvantes ou veículos e semelhantes.

Os anticorpos podem ser usados em imunoprecipitação,coloração, colunas de imunoafinidade e semelhantes. Se desejado,seqüências de ácido nucléico que codificam antígenos específicos podemser geradas pela imunização seguida de isolamento de polipeptídeo ou ácidonucléico, amplificação ou clonagem e imobilização de polipeptídeo em umarranjo da invenção. Alternativamente, os métodos da invenção podem serusados para modificar a estrutura de um anticorpo produzido por uma célulamodificada, por exemplo, a afinidade de um anticorpo pode ser aumentadaou diminuída. Além disso, a habilidade para fazer ou modificar anticorpospode ser uma manipulação de fenótipo em uma célula pelos métodos dainvenção.

O termo "anticorpo" inclui um peptídeo ou polipeptídeo derivadodele, modelado por, ou substancialmente codificado por um gene deimunoglobulina ou genes de imunoglobulina ou fragmentos desses, capaz dese ligar especificamente a um antígeno ou epitopo, veja, por exemplo,Fundamental lmmunology, Third Edition, W.E. Paul, ed., Raven Press, N.Y.(1993); Wilson (1994) J. Immunol. Methods 175:267-273; Yarmush (1992) J.Biochem. Biophys. Methods 25:85-97. O termo anticorpo inclui porções quese ligam ao antígeno, isto é, "sítios de ligação ao antígeno" (por exemplo,fragmentos, subseqüências e regiões determinantes de complementaridade(CDRs)) que retêm a capacidade de ligação ao antígeno, incluindo (i) umfragmento Fab1 um fragmento monovalente que consiste nos domínios deVL, VH, CH e CH1; (ii) um fragmento F(ab')2, um fragmento bivalente quecompreende dois fragmentos Fab ligados por uma ponte de dissulfeto naregião de dobradiça; (iii) um fragmento Fd que consiste nos domínios de VHe CH1; (iv) um fragmento Fv que consiste nos domínios de VL e VH de umbraço único de um anticorpo; (v) um fragmento dAb (Ward et al., (1989)Nature 341:544-546), que consiste em um domínio de VH e (vi) uma regiãodeterminante de complementaridade isolada (CDR). Anticorpos de cadeiassimples também estão incluídos pela referência no termo "anticorpo".

Métodos de imunização, produção e isolamento de anticorpos(policlonal e monoclonal) são conhecidos daqueles versados na técnica edescritos na literatura científica e de patente, veja, por exemplo, Coligan,CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY (1991); Sti-tes (eds.) BASIC AND CLINICAL IMMUNOLOGY (7th ed.) Lange MedicaiPublications, Los Altos, CA ("Stites"); Goding, MONOCLONAL ANTIBODIES:PRINCIPLES AND PRACTICE (2d ed.) Academic Press, Nova Iorque, NY(1986); Kohler (1975) Nature 256:495; Harlow (1988) ANTIBODIES, A LA-BORATORY MANUAL, Cold Spring Harbor Publications, Nova Iorque. Anti-corpos também podem ser gerados in vitro, por exemplo, usando bibliotecasde apresentação em fago que expressam sítio de ligação de anticorpo re-combinante, além dos métodos tradicionais in vivo usando animais. Veja, porexemplo, Hoogenboom (1997) Trends Biotechnol. 15:62-70; Katz (1997) An-nu. Rev. Biophys. Biomol. Struct. 26:27-45.

Os polipeptídeos da invenção ou fragmentos que compreendempelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidosconsecutivos desses, também podem ser usados para gerar anticorpos que seligam especificamente aos polipeptídeos ou fragmentos. Os anticorpos resul-tantes podem ser usados em procedimentos de cromatografia por afinidadepara isolar ou purificar o polipeptídeo ou para determinar se o polipeptídeo estápresente em uma amostra biológica. Em tais procedimentos, uma preparaçãode proteína, tal como um extrato ou uma amostra biológica, é contatada comum anticorpo capaz de se ligar especificamente a um dos polipeptídeos da in-venção ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30,35, 40, 50, 75,100, ou 150 aminoácidos consecutivos desses.

Em procedimentos de imunoafinidade, o anticorpo é acoplado aum suporte sólido, tal como uma esfera ou outra matriz de coluna. A prepara-ção de proteína é colocada em contato com o anticorpo sob condições nasquais o anticorpo se liga especificamente a um dos polipeptídeos da invençãoou fragmento desse. Após uma lavagem para remover proteínas não especi-ficamente ligadas, os polipeptídeos especificamente ligados são eluídos.

A habilidade de proteínas em uma amostra biológica se ligarema um anticorpo pode ser determinada usando qualquer um de uma varieda-de de procedimentos familiares àqueles versados na técnica. Por exemplo, aligação pode ser determinada pela marcação do anticorpo com um marcadordetectável, tal como um agente fluorescente, um marcador enzimático ou umradioisótopo. Alternativamente, a ligação do anticorpo com a amostra podeser detectada usando um anticorpo secundário que tem tal marcador detec-tável sobre ele. Ensaios particulares incluem ensaios ELISA, ensaios sandu-íche, radioimunoensaios e Western Blots.

Anticorpos policlonais gerados contra os polipeptídeos da inven-ção ou fragmentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35,40, 50, 75, 100, ou 150 ou mais aminoácidos consecutivos desses podem serobtidos pela injeção direta dos polipeptídeos em um animal ou pela adminis-tração do polipeptídeos a um animal, por exemplo, um não humano. O anticor-po assim obtido então se ligará ao próprio polipeptídeo. Dessa maneira, atéuma seqüência que codifica apenas um fragmento do polipeptídeo pode serusada para gerar anticorpos que se ligam ao polipeptídeo nativo completo.Tais anticorpos podem então ser usados para isolar o polipeptídeo das célulasque expressam aquele polipeptídeo.

Para a preparação de anticorpos monoclonais, qualquer técnicaque forneça anticorpos produzidos por culturas de linhagens celulares contí-nuas pode ser usada. Exemplos incluem a técnica do hibridoma Kohler &Milstein, Nature, 256:495-497, 1975), a técnica do trioma, a técnica do hibri-doma de célula B humana (Kozbor et ai, Immunology Today 4:72, 1983) e atécnica de EBV-hibridoma (Cole, et ai, 1985, in Monoclonal Antibodies andCâncer Therapy, Alan R. Liss, Inc., pp. 77-96).

As técnicas descritas para a produção de anticorpos de cadeiaúnica (Patente U.S. N0. 4.946.778) podem ser adaptadas para produzir anti-corpos de cadeia única para os polipeptídeos da invenção ou fragmentosque compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou150 aminoácidos consecutivos desses. Alternativamente, camundongos trans-gênicos podem ser usados para expressar anticorpos humanizados para es-ses polipeptídeos ou fragmentos desses.

Anticorpos gerados contra os polipeptídeos da invenção ou frag-mentos que compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75,100, ou 150 aminoácidos consecutivos desses podem ser usados para rastre-ar polipeptídeos similares de outros organismos e amostras. Em tais técnicas,polipeptídeos do organismo são contatados com o anticorpo e aqueles polipep-tídeos que se ligam especificamente com o anticorpo são detectados. Qual-quer um dos procedimentos descritos acima pode ser utilizado para detectarligação ao anticorpo. Um de tais ensaios de rastreamento está descrito em"Methods for Measuring Cellulase Activities", Methods in Enzymology, Vol160, pp. 87-116.

Kits

A invenção fornece kits que compreendem as composições, porexemplo, ácidos nucléicos, cassetes de expressão, vetores, células, plantasou sementes transgênicas ou partes de planta, polipeptídeos (por exemplo,xilanases) e/ou anticorpos da invenção. Os kits também podem conter mate-rial instrutivo que ensina as metodologias e aplicações e processos industri-ais, de pesquisa, médicas, farmacêuticas, de alimentação e nutrição e pro-cessamento de suplemento alimentício e nutricional e outras aplicações eprocessos da invenção como descritos nesses.

Manipulação de célula íntegra e medida de parâmetros metabólicosOs métodos da invenção fornecem ao desenvolvimento de célu-la íntegra, ou manipulação da célula íntegra, de uma célula para desenvolveruma nova linhagem celular que tem um novo fenótipo, por exemplo, umaatividade de xilanase nova ou modificada, pela modificação da composiçãogenética da célula. A composição genética pode ser modificada pela adiçãoà célula de um ácido nucléico da invenção, por exemplo, uma seqüência co-dificante de uma enzima da invenção. Veja, por exemplo, W00229032;W00196551.

Para detectar o novo fenótipo, pelo menos um parâmetro meta-bólico de uma célula modificada é monitorado na célula em um período em"tempo real" ou "on line". Em um aspecto, uma pluralidade de células, taiscomo uma cultura de células, é monitorizada em "tempo real" ou "on line".Em um aspecto, uma pluralidade de parâmetros metabólicos é monitorizadaem "tempo real" ou "on line". Parâmetros metabólicos podem ser monitoriza-dos usando as xilanases da invenção.

A análise de fluxo metabólico (MFA) é baseada em um sistemabioquímico conhecido. Uma matriz metabólica linearmente independente éconstruída com base na lei da conservação das massas e na hipótese dopseudo-estado estacionário (PSSH) dos metabólitos intracelulares. Na práti-ca dos métodos da invenção, são estabelecidas redes metabólicas incluindoa:

• identidade de todos substratos, produtos e metabólitos inter-mediários das vias

• identidade de todas as reações químicas que interconvertemos metabólitos da via, a estequiometria das reações da vias,

• identidade de todas as enzimas que catalisam as reações, acinética da reação enzimática,

• as interações regulatórias entre os componentes da via, porexemplo, interações alostériças, interações enzima-enzima, etc.,

· compartimentalização intracelular de enzimas ou de qualqueroutra organização supramolecular das enzimas, e,• a presença de qualquer gradiente de concentração de metabó-litos, enzimas ou moléculas efetoras ou barreiras de difusão aos seus movi-mentos.

Uma vez que a rede metabólica para uma dada linhagem é es-tabelecida, a apresentação matemática pela noção de matriz pode ser intro-duzida para estimar os fluxos metabólicos intracelulares se os dados do me-taboloma on-line estiverem disponíveis. Fenótipo metabólico depende dasalterações da rede metabólica completa dentro de uma célula. Fenótipo me-tabólico depende da alteração de utilização da via com relação a condiçõesambientais, regulação genética, estado de desenvolvimento e o genótipo,etc. Em um aspecto dos métodos da invenção, após o cálculo de MFA on-line, o comportamento dinâmico das células, seus fenótipos e outras propri-edades são analisadas pela investigação da utilização da via. Por exemplo,se o suprimento de glicose está aumentado e o oxigênio diminuído durante afermentação de levedura, a utilização de vias respiratórias estará reduzidae/ou paralisada e a utilização de vias fermentativas dominará. O controle doestado físico de culturas celulares se tornará possível após a análise da via.

Os métodos da invenção podem ajudar a determinar como manipular a fer-mentação pela determinação de como alterar o suprimento de substrato,temperatura, uso de indutores, etc, para controlar o estado fisiológico dascélulas que mudam para a direção desejada. Na prática dos métodos da in-venção, os resultados de MFA também podem ser comparados com os da-dos de transcriptoma e proteoma para designar experimentos e protocolospara manipulação genética ou embaralhamento de gene, etc.

Na prática dos métodos da invenção, qualquer fenótipo modifi-cado ou novo pode ser conferido e detectado, incluindo características novasou melhoradas na célula. Qualquer aspecto do metabolismo ou crescimentopode ser monitorizado.

Monitoramento da expressão de um transcrito de mRNA

Em um aspecto da invenção, o fenótipo manipulado compreen-de aumentar ou diminuir a expressão de um transcrito de mRNA (por exem-pio, uma mensagem de xilanase) ou gerar novos transcritos em uma célula(por exemplo, uma xilanase). Essa expressão aumentada ou diminuída podeser rastreada testando a presença de uma xilanase da invenção ou pelosensaios de atividade de xilanase. Transcritos de mRNA ou mensagens tam-bém podem ser detectados e quantificados por qualquer método conhecidona técnica, incluindo, por exemplo, Northern blots, reações de amplificaçãoquantitativa, hibridização a arranjos e semelhantes. Reações de amplificaçãoquantitativa incluem, por exemplo, PCR quantitativo, incluindo, por exemplo,reação em cadeia da polimerase com transcrição reversa quantitativa ou RT-PCR; RT-PCR quantitativo em tempo real ou "RT-PCR cinético em temporeal" (veja, por exemplo, Kreuzer (2001) Br. J. Haematol. 114:313-318; Xia(2001) Transplantation 72:907-914).

Em um aspecto da invenção, o fenótipo manipulado é geradopor nocautear (knocking out) a expressão de um gene homólogo. A seqüên-cia que codifica o gene ou um ou mais elementos de controle transcricionalpode ser nocauteada, por exemplo, promotores ou intensificadores. Assim, aexpressão do transcrito pode ser completamente abolida ou apenas diminuída.

Em um aspecto da invenção, o fenótipo manipulado compreen-de aumentar a expressão de um gene homólogo. Isso pode ser efetuadopelo nocaute de um elemento de controle negativo, incluindo um elementoregulatório transcricional eis- ou trans-atuante ou mutagenizando um ele-mento de controle positivo. Um ou mais ou todos os transcritos de uma célu-la podem ser medidos pela hibridização de uma amostra que compreendetranscritos da célula ou ácidos nucléicos representativos ou complementaresaos transcritos de uma célula, pela hibridização com ácidos nucléicos imobi-lizados sobre um arranjo.

Monitorando a expressão de polipeptídeos. peptídeos e aminoácidos

Em um aspecto da invenção, o fenótipo manipulado compreen-de aumentar ou diminuir a expressão de um polipeptídeo (por exemplo, umaxilanase) ou gerar novos polipeptídeos em uma célula. Essa expressão au-mentada ou diminuída pode ser rastreada pela determinação da quantidadede xilanase presente ou por ensaios de atividade de xilanase. Polipeptídeos,peptídeos e aminoácidos podem ser detectados e quantificados por qualquermétodo conhecido na técnica, incluindo, por exemplo ressonância magnéticanuclear (RMN), espectrofotometria, radiografia (radiomarcação de proteína),eletroforese, eletroforese capilar, cromatografia líquida de alta eficiência (H-PLC), cromatografia em camada delgada (TLC)1 cromatografia de hiperdifu-são, vários métodos imunológicos, por exemplo, imunoprecipitação, imunodi-fusão, imuno-eletroforese, radioimunoensaios (RIAs), ensaios imunoabsor-ventes ligados a enzima (ELISAs), ensaios imuno-fluorescentes, eletroforeseem gel (por exemplo, SDS-PAGE), coloração com anticorpos, citometria defluxo (FACS), pirólise, espectrometria de massa, Espectrometria com Infra-vermelho Transformada de Fourier, Espectroscopia de Raman, GC-MS, LC-Electrospray e espectrometrias de massa cap-LC-tandem-electrospray esemelhantes. Novas bioatividades também podem ser rastreadas usandométodos, ou variações desses, descritos nas Patente U.S. N°. 6.057.103.Além disso, como discutido abaixo em detalhes, um ou mais ou todos ospolipeptídeos de uma célula podem ser medidos usando um arranjo de pro-teína.

Aplicações Industriais. Energia. Farmacêuticas. Médicas. Processamento deAlimentos e outras Aplicações

Polipeptídeos da invenção podem ser usados em qualquer pro-cesso industrial, agrícola, alimentício e nutricional e processamento de su-plemento nutricional, farmacêutico, médico, de pesquisa (laboratório) e ou-tros processos. A invenção fornece processos industriais que usam enzimasda invenção, por exemplo, na indústria farmacêutica ou de suplemento nutri-cional (dietético), na indústria de energia (por exemplo, para fazer biocom-bustíveis "limpos"), nas indústrias alimentícia e nutricional, por exemplo, emmétodos para fazer alimentos e produtos nutricionais e aditivos alimentíciose nutricionais. Em um aspecto, a invenção fornece processos que usam en-zimas da invenção na indústria médica, por exemplo, para fazer farmacêuti-cos e auxiliares ou suplementos dietéticos ou suplementos e aditivos alimen-tícios. Além disso, a invenção fornece métodos para usar as enzimas da in-venção na produção de biocombustível, incluindo, por exemplo, um bioálco-ol, tal como bioetanol, biometanol, biobutanol ou biopropanol, compreenden-do assim uma produção de combustível "limpo".

As enzimas xilanases da invenção podem ser catalisadores al-tamente seletivos. Elas podem catalisar reações com estéreo-, régio e qui-mio-seletividades excelentes que são inigualáveis na química sintética con-vencional. Além disso, as enzimas são acentuadamente versáteis. As enzi-mas xilanases da invenção podem ser adaptadas para funcionar em solven-tes orgânicos, operar em pHs extremos (por exemplo, pHs altos e pHs bai-xos), temperaturas extremas (por exemplo, temperaturas altas e temperatu-ras baixas), níveis extremos de salinidade (por exemplo, salinidade alta esalinidade baixa) e catalisar reações com compostos que não são estrutu-ralmente relacionados com seus substratos naturais, fisiológicos.

Tratamentos de madeira, papel e polpa

As xilanases da invenção podem ser usadas em qualquer trata-mento ou processo industrial de madeira, produto de madeira, resíduo ousubproduto de madeira, papel, produto de papel polpa de papel, ou madeira,polpa Kraft ou reciclagem de madeira ou papel, por exemplo, qualquer ma-deira, polpa de madeira, resíduo de papel, tratamento de papel ou polpa ouprocesso de descolororação de madeira ou papel. Em um aspecto, xilanasesda invenção podem ser usadas para tratar/pré-tratar polpa de papel ou papelreciclado ou polpa de papel e semelhantes. Em um aspecto, enzimas da in-venção são usadas para aumentar a "alvura" do papel através do seu uso notratamento/pré-tratamento de polpa de papel ou papel ou polpa de papel re-ciclados e semelhantes. Quanto maior o grau do papel, maior a alvura; aalvura do papel pode influenciar a capacidade rastreadora do equipamentode rastreamento óptico; assim as enzimas e processos da invenção podemser usadas para fazer papel de alto grau, "alvo" para, por exemplo, uso emequipamento de rastreamento óptico, incluindo papei de qualidade para im-pressão a jato de tinta, laser e fotográfica.

Por exemplo, as enzimas da invenção podem ser usadas emqualquer processo industriai que use as xilanases conhecidas na técnica,por exemplo, tratamento de resíduo de papel, como descrito, por exemploem USPN 6.767.728 ou 6.426.200; secagem de madeira, por exemplo, paraaplicações na indústria alimentícia, como descrito, por exemplo, na USPN6.623.953; para a produção de xilose a partir de polpa de papel de fibrascurtas, como descrito, por exemplo em USPN 6.512.110; tratamento de ma-terial bruto lignocelulósico fibroso com uma xilanase em um meio aquoso,como descrito, por exemplo em USPN 6.287.708; dissolver polpa de fibra decelulose, como descrito, por exemplo em USPN 6.254.722; remover tinta edescobrir um papel impresso ou remover a cor de polpa de madeira, comodescrito, por exemplo em USPN 6.241.849, 5.834.301 ou 5.582.681; alvejan-te de polpa química de papel ou polpa de Iignocelulose usando uma xilana-se, como descrito, por exemplo em USPN 5.645.686 ou 5.618.386; para otratamento de polpa de madeira que inclui polpa marrom incompletamentelavada, como descrito, por exemplo em USPN 5.591.304; purificar e desligni-ficar um material residual lignocelulósico, como descrito, por exemplo emUSPN 5.503.709; produzir papel ou papelão a partir de fibras de celuloserecicladas, como descrito, por exemplo em USPN 5.110.412; retirada de le-nha, como descrito, por exemplo em USPN 5.103.883; produzir polpa maciacom propriedades de trituração melhorada, como descrito, por exemplo emUSPN 5.068.009 e semelhantes. As xilanases da invenção podem ser usa-das para processar ou tratar qualquer material celulósico, por exemplo, fi-bras de madeira, algodão, cânhamo, Iinho ou feito de linho.

Em um aspecto, a invenção fornece processos de tratamento demadeira, polpa de madeira, papel, polpa de papel, resíduo de papel ou ma-deira ou reciclagem de papel usando uma xilanase da invenção. Em um as-pecto, a xilanase da invenção é aplicável para a redução da necessidade deum agente de alvejamento químico, tal como dióxido de cloro (veja, por e-xemplo, Exemplo 6 abaixo), e em ambientes com alcalinidade alta e altatemperatura. A maior parte da Iignina é solubilizada no estágio de cozimentodo processo de formação de polpa. A Iignina residual é removida da polpano processo de alvejante. Em um aspecto, o alvejante da polpa com xilanase(por exemplo, usando uma enzima da invenção) é baseado na hidrólise par-cial do xilano, que é o componente principal da hemicelulose. A ação enzi-mática (por exemplo, de uma enzima da invenção) libera a Iignina ligada àhemicelulose e aumenta a capacidade de extração de Iignina da polpa noprocesso de alvejante subseqüente, por exemplo, usando químicos de cloroe oxigênio. Em um aspecto, as xilanases da invenção podem ser usadaspara aumentar o alvejante final da polpa em um nível determinado de quími-cos branqueadores. Em outro aspecto, as xilanases da invenção podem serusadas para diminuir o número kappa da polpa.

A invenção fornece processos (métodos) de tratamento de ma-deira, polpa de madeira, polpa de papel, resíduo de papel ou madeira oureciclagem de papel usando uma xilanase da invenção, onde o tempo detratamento (a quantidade de tempo em que a xilanase está em contato coma polpa, papel, madeira, etc.) e/ou tempo de retenção pode ser qualquer umentre cerca de 1 minuto a 12 horas ou entre cerca de 5 minutos a 1 hora ouentre cerca de 15 a 30 minutos; ou o tempo de tratamento e/ou de retençãopode ser qualquer período até cerca de 0,1, 0,25, 0,5, 0,75, 1, 1,5, 2, 3, 4, 5,6,7,8,9,10,11,12 ou mais horas.

Em um aspecto, a xilanase da invenção é uma endoxilanasealcalina termoestável que em um aspecto pode efetuar mais do que 25% deredução na necessidade de dióxido de cloro para a polpa Kraft com menosdo que 0,5% de perda de rendimento dâ polpa. Em um aspecto, os parâme-tros limitantes são pH 10, 65-85eC e tempo de tratamento de menos do que60 minutos em uma carga de enzima de menos do que 0,001 p%; em aspec-tos alternativos, o tempo de tratamento e/ou de retenção é menor do quecerca de de 0,1, 0,25, 0,5, 0,75, 1, 1,5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11ou 12.Um grupo de xilanases pode ser testado quanto à habilidade dehidrolisar xilano marcado com corante, por exemplo, em pH 10 e 60-C. Asenzimas que são positivas para o teste sob essas condições podem entãoser avaliadas, por exemplo, em pH 10 e 70-C. Alternativamente, as enzimaspodem ser testadas em pH 8 e pH 10 a 70-C. Na descoberta de xilanasesdesejáveis na indústria de polpa e papel, bibliotecas de alta temperatura ouambientes altamente alcalinos foram visados. Especificamente, essas biblio-tecas foram rastreadas para o funcionamento de enzimas em pH alcalino etemperatura de aproximadamente 45-C. Em outro aspecto, as xilanases dainvenção são úteis na indústria de polpa e papel na degradação de uma li-gação lignina-hemicelulose, a fim de liberar a lignina.

Enzimas da invenção podem ser usadas para remover a tinta deresíduo de papel impresso, tal como jornal, ou para remover a tinta de resí-duo de papel impresso sem contato com a tinta, por exemplo, papel impres-so à laser ou xerográfico e misturas de resíduo de papel impresso com esem contato com tinta, como descrito na USPN 6.767.728 ou 6.426.200; Neo(1986) J. Wood Chem. Tech. 6(2):147. Enzimas da invenção podem ser u-sadas em processos para a produção de xilose a partir de polpa de papel defibra curta pela extração do xilano contido na polpa em uma fase líquida,submetendo o xilano na fase líquida obtida a condições suficientes para hi-drolisar o xilano em xilose e recuperando a xilose, onde a etapa de extraçãoinclui pelo menos um tratamento de uma suspensão aquosa de polpa ou ummaterial solúvel em álcali a uma enzima xilanase, como descrito, por exem-plo, na USPN 6.512.110. Enzimas da invenção podem ser usadas em pro-cessos para dissolver a polpa de fibras celulósicas tais como produtos depapel reciclado feitos de fibras de madeira duras, uma mistura de fibras demadeira dura e fibras de madeira macia, resíduo de papel, por exemplo, deenvelopes não impressos, envelopes com a tinta removida, papel de jornalnão impresso, papel de jornal com a tinta removida e semelhantes, comodescrito, por exemplo, na USPN 6.254.722.Em outro aspecto da invenção, as xilanases da invenção tam-bém podem ser usadas em qualquer tratamento ou processo industrial demadeira, produto de madeira, papel, produto de papel, polpa de papel oumadeira, polpa Kraft, ou reciclagem de madeira ou papel, por exemplo, qual-quer madeira, polpa de madeira, resíduo de papel, tratamento de papel oupolpa ou processo de remoção de tinta de madeira ou papel como um agen-te antimicrobiano ou repelente microbiano. Alternativamente, as xilanases dainvenção podem ser parte de uma composição de madeira, produto de ma-deira, papel, produto de papel, polpa de papel ou madeira, polpa Kraft ou depapel reciclado e/ou uma composição que compreende uma ou mais com-posições de madeira, produto de madeira, papel, produto de papel, polpa depapel ou madeira, polpa Kraft ou de papel reciclado, em que as xilanases dainvenção atuam como um antimicrobiano ou repelente microbiano na com-posição.

Tratamento de fibras e têxteis

A invenção fornece métodos para tratar fibras e tecidos usandouma ou mais xilanases da invenção. As xilanases podem ser usadas emqualquer método de tratamento de fibra ou tecido, que são bem-conhecidosna técnica, veja, por exemplo, Patente U.S. N°. 6.261.828; 6.077.316;6.024.766; 6.021.536; 6.017.751; 5.980.581; Publicação de Patente U.S. N°.20020142438 A1. Por exemplo, as xilanases da invenção podem ser usadasna remoção de goma de fibra e/ou tecido. Em um aspecto, a textura e apa-rência de um tecido são melhoradas por um método que compreende conta-tar o tecido com uma xilanase da invenção em uma solução. Em um aspec-to, o tecido é tratado com a solução sob pressão. Por exemplo, as xilanasesda invenção podem ser usadas na remoção de corantes.

As xilanases da invenção podem ser usadas para tratar qual-quer material celulósico, incluindo fibras (por exemplo, fibras de algodão,cânhamo, linho ou feitas de linho), tecidos costurados e não costurados, porexemplo, roupas tricotadas, bordadas, jeans, e atoalhados feitos de algodão,misturas de algodão ou celulósicos naturais ou feitos pelo homem (por e-xemplo, que se originam de fibras de celulose que contém xilano tais comopolpa de madeira) ou misturas desses. Exemplos de misturas são misturasde algodão ou raiom/viscose com um ou mais materiais concomitantes taiscomo lã, fibras sintéticas (por exemplo, fibras de poliamida, fibras acrílicas,fibras de poliéster, fibras de álcool polivinílico, fibras de cloreto de polivinila,fibras de cloreto de polivinilideno, fibras de poliuretano, fibras de poliuréia,fibras de aramida) e fibras que contém celulose (por exemplo, raiom/viscose,rami, cânhamo, linho, juta, fibras de acetato de celulose, lyocell).

Os processos de tratamento de têxteis da invenção (usando asxilanases da invenção) podem ser usados em conjunto com outros tratamen-tos de têxteis, por exemplo, limpeza e alvejante. Limpeza é a remoção dematerial não-celulósico da fibra de algodão, por exemplo, a cutícula (consti-tuída principalmente por ceras) e parede celular primária (constituída princi-palmente por pectina, proteína e xiloglicano). A remoção apropriada da ceraé necessária para obtenção de alta umidade. Isso é necessário para o fingi-mento. A remoção de paredes celulares primárias pelos processos da inven-ção melhora a remoção da cera e assegura tingimento por igual. Tratamentode têxteis com os processos da invenção pode melhorar a brancura no pro-cesso de alvejante. O principal químico usado na limpeza é o hidróxido desódio em altas concentrações e em altas temperaturas. Alvejante compreen-de oxidação do têxtil. O alvejante envolve tipicamente o uso de peróxido dehidrogênio como agente oxidante a fim de se obter tanto um tecido comple-tamente branqueado (branco) quanto para assegurar uma tonalidade purado corante.

A invenção também fornece xilanases alcalinas (xilanases ativassob condições alcalinas). Elas têm uma ampla faixa de aplicações no pro-cessamento têxtil, degomação de fibras de planta (por exemplo, fibras deplantas liberianas), tratamento de efluentes de pectina, produção de papel efermentações de café e chá. Veja, por exemplo, Hoondal (2002) Applied Mi-crobiology and Biotechnology 59:409-418.Em outro aspecto da invenção, as xilanases da invenção tam-bém podem ser usadas em qualquer processo de tratamento de fibra e/outecido como antimicrobiano ou repelente microbiano. Alternativamente, asxilanases da invenção podem ser parte de uma composição de fibra e/outecido, onde as xilanases da invenção agem como antimicrobiano ou repe-lente microbiano na fibra e/ou tecido.Composições detergentes, desinfetantes e de limpeza

A invenção fornece composições detergentes, desinfetantes oulimpadores (de limpeza ou removedores) que compreendem um ou maispolipeptídeos (por exemplo, xilanases) da invenção e métodos para fazer eusar essas composições. A invenção incorpora todos os métodos de fazer eusar composições detergentes, desinfetantes ou limpadores, veja, por e-xemplo, Patente U.S. N°. 6.413.928; 6.399.561; 6.365.561; 6.380.147. Ascomposições detergentes, desinfetantes ou limpadores podem ser composi-ções com uma ou duas partes aquosas, composição líquida não-aquosa, umsólido moldado, uma forma granular, uma forma particulada, um tabletecomprimido, um gel e/ou uma pasta e uma forma de pasta. As xilanases dainvenção também podem ser usadas como um produto aditivo de detergen-te, desinfetante ou limpador em uma forma sólida ou líquida. Tais produtosaditivos são pretendidos suplementar ou aumentar o desempenho de com-posições de detergentes convencionais e podem ser adicionados em qual-quer estágio do processo de limpeza.

O conteúdo real de enzima ativa depende do método de produ-ção da composição de detergente, desinfetante ou limpador e não é impor-tante, presumindo que a solução de detergente tenha a atividade enzimáticadesejada. Em um aspecto, a quantidade de xilanase presente na soluçãofinal varia entre cerca de 0,001 mg a 0,5 mg por grama de composição dedetergente. A enzima em particular escolhida para uso no processo e produ-tos dessa invenção depende das condições de utilização finais, incluindo aforma física do produto, pH de uso, temperatura de uso e tipos de solos aserem degradados ou alterados. A enzima pode ser escolhida para forneceratividade e estabilidade ótimas para qualquer grupo de condições de utiliza-ção. Em um aspecto, as xilanases da presente invenção são ativas nas fai-xas de pH entre cerca de 4 a cerca de 12 e na faixa de temperatura entrecerca de 20-C a cerca de 95-C. Os detergentes da invenção podem com-preender tensoativos catiônicos, semi-polares aniônicos ou zwitteriônicos emisturas desses.

Xilanases da invenção podem ser formuladas em detergentes,desinfetantes ou limpadores em pó ou líquidos, que tem pH entre 4.0 e 12.0em níveis de cerca de 0,01 a cerca de 5% (preferivelmente 0,1% a 0,5%) dopeso. Essas composições de detergentes, desinfetantes ou limpadores tam-bém podem incluir outras enzimas tais como xilanases, celulases, lipases,esterases, proteases, ou endoglicosidases, endo-beta.-1,4-glicanases, beta-glicanases, endo-beta-1,3(4)-glicanases, cutinases, peroxidases, catalases,lacases, amilases, glicoamilases, pectinases, redutases, oxidases, fenoloxi-dases, ligninases, pululanases, arabinanases, hemicelulases, mananases,xiloglicanases, xilanases, pectina acetil esterases, ramnogalacturonano ace-til esterases, poligalacturonases, ramnogalacturonases, galactanases, pecti-na liases, pectina metilesterases, celobiohidrolases e/ou transglutaminases.Essas composições de detergentes, desinfetantes ou limpadores tambémpodem incluir pigmentos, corantes, flavorizantes, branqueadores, tampões,intensificadores, "agentes que intensificam" enzimas (veja, por exemplo, pe-dido de Patente U.S. N°. 20030096394) e estabilizadores.

A adição de xilanases da invenção à composições Iimpadorasconvencionais não cria qualquer limitação especial de uso. Em outras pala-vras, qualquer temperatura e pH adequados para o detergente também sãoadequados para ás composições da invenção desde que a enzima seja ativaou tolerante ao pH e/ou temperatura do uso pretendido. Além disso, as xila-nases da invenção podem ser usadas em composições de limpeza sem de-tergentes, novamente tanto sozinhas quanto em combinação com intensifi-cadores e estabilizadores.A presente invenção fornece composições de limpeza incluindocomposições de detergentes para limpeza de superfícies sólidas, composi-ções de detergentes para limpeza de tecidos, composições para lavagem delouças, composições para limpeza oral, composições para limpeza de próte-ses dentárias, e soluções para limpeza de lentes de contato.

Em um aspecto, a invenção fornece um método para lavar umobjeto que compreende contatar o objeto com um polipeptídeo da invençãosob condições suficientes para a lavagem. Uma xilanase da invenção podeser incluída como um aditivo para detergente, desinfetante ou limpador. Acomposição de detergente, desinfetante ou limpador da invenção pode, porexemplo, ser formulada como uma composição de detergente, desinfetanteou limpador compreendendo um polipeptídeo da invenção para lavagemmanual ou para máquina de lavar. Um aditivo de lavagem adequado para opré-tratamento de tecidos coloridos pode compreender um polipeptídeo dainvenção. Uma composição amaciante de tecido pode compreender umaxilanase da invenção. Alternativamente, uma xilanase da invenção pode serformulada como uma composição detergente, desinfetante ou Iimpadora pa-ra uso em operações de limpeza de superfícies difíceis domésticas em geral.Em aspectos alternativos, aditivos para detergente, desinfetante ou limpadore composições de detergente, desinfetante ou limpador da invenção podemcompreender uma ou mais outras enzimas tais como uma xilanase, uma Ii-pase, uma protease, uma cutinase, uma esterase, outra xilanase, uma car-boidrase, uma celulase, uma pectinase, uma mananase, uma arabinase,uma galactanase, uma xilanase, um oxidase, por exemplo, uma lactase, e/ouuma peroxidase (veja também acima). As propriedades da(s) enzima(s) dainvenção são escolhidas para serem compatíveis com o detergente selecio-nado (isto é, pH ótimo, compatibilidade com outros ingredientes enzimáticose não enzimáticos, etc.) e as enzimas estão presentes em quantidades efi-cazes. Em um aspecto, as enzimas xilanases da invenção são usadas pararemover materiais malcheirosos de tecidos. Várias composições de deter-gente e métodos para fazê-las que podem ser usados na prática da inven-ção estão descritos, por exemplo em Patentes U.S. Nos. 6.333.301;6.329.333; 6.326.341; 6.297.038; 6.309.871; 6.204.232; 6.197.070;5.856.164.

Quando formuladas como composições adequadas para uso emum método de lavagem em máquina de lavar, as xilanases da invenção po-dem compreender ambos um tensoativo e um composto intensificador. Elaspodem compreender, além disso, um ou mais componentes detergentes, porexemplo, compostos poliméricos orgânicos, agentes branqueadores, enzi-mas adicionais, supressores de espuma, dispersantes, dispersantes de sa-bão cáustico (lime), agentes de suspensão e anti-redeposição de detritos einibidores de corrosão. Composições para lavagem de roupa da invençãotambém podem conter agentes amaciantes, como componentes detergentesadicionais. Tais composições que contém carboidrase podem fornecer a lim-peza do tecido, remoção de pigmento, manutenção da brancura, amacia-mento, aspecto da cor, inibição de transferência de corante e higienizaçãoquando formuladas como composições de detergente para lavanderia.

A densidade das composições de detergente, desinfetante oulimpador de lavanderia da invenção pode variar entre cerca de 200 a 1500h/litro ou cerca de 400 a 1200 g/litro ou cerca de 500 a 950 g/litro ou 600 a800 g/litro de composição; isso pode ser medido em cerca de 209C.

Em um aspecto, a forma "compacta" de composições de deter-gente, desinfetante ou limpador de lavanderia da invenção é melhor refletidapela densidade e, em termos de composição, pela quantidade de sal inorgâ-nico de preenchimento. Sais de preenchimento inorgânicos são ingredientesconvencionais de composições detergentes em forma de pó. Em composi-ções detergentes convencionais, os sais de preenchimento estão presentesem quantidades substanciais, tipicamente de 17 a 35% do peso da composi-ção total. Em um aspecto das composições compactas, o sal de preenchi-mento está presente em quantidades que não excedem 15% do total dacomposição ou não excedem 10% ou não excedem 5% do peso da compo-sição. Os sais de preenchimento inorgânicos podem ser selecionados entresulfatos e cloretos de sais de metal alcalino e alcalino terroso, por exemplo,sulfato de sódio.

Composições líquidas de detergente da invenção também po-dem estar em uma "forma concentrada". Em um aspecto, composições líqui-das de detergente, desinfetante ou limpador podem conter uma quantidademenor de água, comparadas a detergentes, desinfetantes ou limpadoreslíquidos convencionais. Em aspectos alternativos, o conteúdo de água dodetergente líquido concentrado é menor do que 40% ou menor do que 30%ou menor do que 20% do peso da composição de detergente, desinfetanteou limpador. Compostos de detergente, desinfetante ou limpador da inven-ção podem compreender formulações como descrito na WO 97/01629.

Xilanases da invenção podem ser úteis na formulação de váriascomposições de detergente, desinfetante ou limpador. Numerosos compos-tos conhecidos são tensoativos adequados, incluindo detergentes não-iônicos, aniônicos, catiônicos ou zwitteriônicos, que podem ser usados, porexemplo, como descrito nas Patentes U.S. Nos. 4.404.128; 4.261.868;5.204.015. Além disso, xilanases podem ser usadas, por exemplo em aplica-ções de sabão em barra ou líquido, formulações para limpeza de louça, so-luções ou produtos de limpeza de lente de contato, hidrólise de peptídeo,tratamento de resíduo, aplicações têxteis, como enzimas de fusão-clivagemna produção de proteína e semelhantes. Xilanases podem fornecer desem-penho melhorado em uma composição detergente quando comparada comoutra xilanase detergente, ou seja, o grupo de enzimas pode aumentar alimpeza de certas manchas sensíveis à enzima tais como grama ou sangue,como determinado pela avaliação comum após um ciclo de lavagem padro-nizada. Xilanases podem ser formuladas em detergentes em pó e líquidosque tem pH entre 6.5 e 12.0 em níveis de cerca de 0,01 a cerca de 5% (porexemplo, cerca de 0,1% a 0,5%) do peso. Essas composições detergentesde limpeza também podem incluir outras enzimas tais como xilanases co-nhecidas, xilanases, proteases, amilases, celulases, mananases, Iipases ouendoglicosidases, enzimas de redox tais como catalases e Iacases1 assimcomo intensificadores, estabilizadores, fragrâncias e pigmentos.

Em um aspecto, a invenção fornece composições de detergente,desinfetante ou limpador, que tem atividade de xilanase (uma xilanase dainvenção) para uso com fruta, vegetais e/ou compostos de barro ou argila(veja, por exemplo, Patente U.S. N°. 5.786.316).

Em outro aspecto da invenção, as xilanases da invenção tam-bém podem ser usadas em qualquer processo de produção de detergente,desinfetante ou limpador (solução de limpeza), em que a xilanase é usadacomo um antimicrobiano ou repelente microbiano. Alternativamente, as xila-nases da invenção podem ser usadas em qualquer processo de limpeza oulavagem, em que a xilanase é usada como um antimicrobiano ou repelentemicrobiano. Em outro aspecto da invenção, a xilanase da invenção pode serincluída em qualquer composição detergente ou de limpeza, em que as xila-nases da invenção atuam como um antimicrobiano ou repelente microbianona composição.

Tratamento de alimentos e processamento de alimento

As xilanases da invenção têm numerosas aplicações na indús-tria de processamento de alimento. Por exemplo, em um aspecto, as xilana-ses da invenção são usadas para melhorar a extração de óleo de um mate-rial de planta rica em óleo, por exemplo, sementes ricas em óleo, por exem-plo, óleo de soja de feijões de soja, óleo de oliva de azeitonas, óleo de se-mente de colza da colza e/ou óleo de girassol das sementes de girassol.

As xilanases da invenção podem ser usadas para separação decomponentes de materiais de célula de planta. Por exemplo, xilanases dainvenção podem ser usadas na separação de material rico em xilano (porexemplo, células de planta) em componentes. Em um aspecto, xilanases dainvenção podem ser usadas para separar culturas ricas em xilano ou ricasem óleo em frações valiosas de proteína e óleo e cascas. O processo deseparação pode ser realizada pelo uso de métodos conhecidos na técnica.As xilanases da invenção podem ser usadas na preparação desucos de frutas ou vegetais, xaropes, extratos e semelhantes para aumentaro rendimento, As xilanases da invenção podem ser usadas no tratamentoenzimático (por exemplo, hidrólise de materiais de planta que compreendemxilano) de vários materiais derivados de parede de célula de planta ou mate-riais residuais, por exemplo, de cereais, grãos, produção de vinho ou suco,ou resíduos agrícolas tais como cascas de vegetais, cascas de feijão, polpade beterraba, polpa de azeitona, polpa de batata e semelhantes. As xilana-ses podem ser usadas para modificar a consistência e aspecto de vegetaisou frutas processadas. As xilanases da invenção podem ser usadas paratratar material de planta para facilitar o processamento de material de planta,incluindo alimentos, facilitar a purificação ou extração de componentes deplanta. As xilanases da invenção podem ser usadas para melhorar o valornutricional, diminuir a capacidade de ligação com água, melhorar a degrada-bilidade de resíduos de plantas aquáticas e/ou melhorar a conversão de ma-terial de planta em ensilagem e semelhantes.

Em um aspecto, as xilanases da invenção são usadas em apli-cações de cozimento, por exemplo, biscoitos e bolachas, para hidrolisar xila-nos tais como arabinoxilano. Em um aspecto, as xilanases da invenção sãousadas para criar massas de farinha não pegajosas que não são difíceis deprocessar e para reduzir o tamanho do biscoito. Xilanases da invenção po-dem ser usadas para hidrolisar arabinoxilanos para prevenir a rápida reidra-tação do produto assado que resulta em perda da crocância e prazo de vali-dade reduzido. Em um aspecto, as xilanases da invenção são usadas comoaditivos no processamento de massas de farinha. Em um aspecto, as xilana-ses da invenção são usadas no condicionamento de massa de farinha, emque em um aspecto as xilanases possuem alta atividade sobre uma faixa detemperatura de cerca de 25-359C e em pH próximo de neutro (7.0-7.5). Emum aspecto, enzimas que condicionam massa de farinha podem ser inativa-das em temperaturas extremas de cozimento [>260°C (>500°F)]. As enzimasda invenção podem ser usadas em conjunção com qualquer protocolo deprocessamento da massas de farinha, por exemplo, como no Pedido de Pa-tente U.S. N°. 20050281916.

Em um aspecto, xilanases da invenção são usadas como aditi-vos no processamento de massa de farinha agirem otimamente sob as con-dições de pH e temperatura da massa de farinha. Em um aspecto, uma en-zima da invenção é usada para o condicionamento de massa de farinha. Emum aspecto, uma xilanase da invenção possui alta atividade sobre uma faixade temperatura de cerca de 25-359C e em pH próximo de neutro (7.0-7.5).Em um aspecto, enzima que condiciona massa de farinha é inativada emtemperaturas extremas de cozimento, por exemplo >500°F.

Em outro aspecto da invenção, as xilanases da invenção tam-bém podem ser usadas em qualquer tratamento de alimento ou bebida ouprocesso de processamento de alimento ou bebida, no qual a xilanase é u-sada como antimicrobiano ou repelente microbiano. Em outro aspecto dainvenção, a xilanase da invenção pode ser incluída em qualquer composiçãode alimento ou bebida, no qual as xilanases da invenção atuam como anti-microbianos ou repelentes microbianos.

Rações e alimento para animais ou aditivos para ração ou alimento(suplementos)

A invenção fornece métodos para tratar rações e alimentos paraanimais e aditivos para alimento e ração (suplementos) usando xilanases dainvenção, animais que incluam mamíferos ( por exemplo, seres humanos),pássaros, peixe e semelhantes. A invenção fornece rações animais,alimentos e aditivos (suplementos) que compreendem xilanases dainvenção. Em um aspecto, o tratamento de rações animais, alimentos eaditivos usando xilanases da invenção podem ajudar na disponibilização denutrientes, por exemplo, amido, proteína e semelhantes, na ração animal ouaditivo (suplementos). Pela decomposição de proteínas difíceis de digerir oupela exposição indiretamente ou diretamente de amido (ou outrosnutrientes), as xilanases tornam os nutrientes mais acessíveis a outrasenzimas endógenas ou exógenas. A xilanase pode também causarsimplesmente a liberação de nutrientes e açúcares rapidamente digestíveis efacilmente absorvíveis.

Quando adicionadas à ração animal, as xilanases da invençãomelhoram a decomposição in vivo de material de parede celular de planta,parcialmente devido à redução da viscosidade intestinal (veja, por exemplo,Bedford et al., Proceedings of the 1st Symposium on Enzymes in AnimalNutrition, 1993, pp. 73-77), através do que uma melhor utilização dosnutrientes da planta pelo animal é obtida. Assim, pelo uso de xilanases dainvenção em rações, a taxa de crescimento e/ou a taxa de conversão doalimento (isto é, o peso do alimento ingerido em relação ao ganho de peso)do animal é melhorada.

O aditivo para ração animal da invenção pode ser um produtogranulado de enzima que pode ser rapidamente misturado com componen-tes alimentícios. Alternativamente, aditivos para ração da invenção podemformar um componente de uma pré-mistura. O produto granulado de enzimada invenção pode ser revestido ou não revestido. O tamanho da partícula degranulados de enzima pode ser compatível com aquele da ração e compo-nentes pré-mistura. Isso fornece um meio seguro e conveniente de incorpo-rar enzimas em rações. Alternativamente, o aditivo para ração animal da in-venção pode ser uma composição líquida estabilizada. Essa pode ser umapasta aquosa ou baseada em óleo. Veja, por exemplo, Patente U.S. N°.6.245.546.

Xilanases da presente invenção, na modificação de raçãoanimal ou alimento, podem processar o alimento ou ração tanto in vitro (pelamodificação dos componentes da ração ou alimento) quanto in vivo.Xilanases podem ser adicionadas à ração animal ou composiçõesalimentícias que contém altas quantidades de xilanos, por exemplo, ração oualimento que contém material de planta de cereais, grãos e semelhantes.Quando adicionada a ração ou alimento, a xilanase melhorasignificativamente a decomposição de material que contém xilano, porexemplo, paredes de célula de planta, através do que uma melhor utilizaçãodos nutrientes da planta pelo animal (por exemplo, ser humano) é obtida. Emum aspecto, a taxa de crescimento e/ou taxa de conversão do alimento (istoé, o peso do alimento ingerido em relação ao ganho de peso) do animal émelhorada. Por exemplo, uma proteína que compreende xilano parcialmenteou indigerível é totalmente ou parcialmente degradada por uma xilanase dainvenção, por exemplo, em combinação com outra enzima, por exemplo,beta-galactosidase, em peptídeos e galactose e/ou galactoligômeros. Essesprodutos de digestão da enzima são mais digeríveis para o animal. Assim,xilanases da invenção podem contribuir para a energia disponível da raçãoou alimento. Também, pela contribuição à degradação de proteínas quecompreendem xilano, uma xilanase da invenção pode melhorar adigestibilidade e absorção de carboidrato e constituintes não carboidratos deração ou alimento, tais como proteína, gordura e minerais.

Em outro aspecto, a xilanase da invenção pode ser fornecidapara expressar as enzimas diretamente em culturas de alimentostransgênicos (como, por exemplo, plantas, sementes transgênicas esemelhantes), tais como grãos, cereais, milho, soja, colza, Iupino esemelhantes. Como discutido acima, a invenção fornece plantastransgênicas, partes de planta e células de planta que compreendem umaseqüência de ácido nucléico que codifica um polipeptídeo da invenção. Emum aspecto, o ácido nucléico é expresso tal que a xilanase da invenção éproduzida em quantidades recuperáveis. A xilanase pode ser recuperada dequalquer planta ou parte de planta. Alternativamente, a planta ou parte deplanta que contém o polipeptídeo recombinante pode ser usada como talmelhorando a qualidade de um alimento ou ração, por exemplo, melhorandoo valor nutricional, palatabilidade e propriedades reológicas ou para destruirum fator anti-nutritivo.

Em um aspecto, a invenção fornece métodos para removeroligqssacarídeos da ração antes do consumo pelo animal usando umaxilanase da invenção. Nesse processo, uma ração é formada tendo um valorde energia metabolizável aumentada. Além das xilanases da invenção,galactosidases, celulases e combinações dessas podem ser usadas. Em umaspecto, a enzima é adicionada em uma quantidade igual entre cerca de0,1% e 1% do peso do material da ração. Em um aspecto, a ração é ummaterial de cereal, trigo, um grão, soja (por exemplo, soja triturada). Veja,por exemplo, Patente U.S. N°. 6.399.123.

Em outro aspecto, a invenção fornece métodos para utilizarxilanase como um suplemento nutricional nas dietas de animais preparandoum suplemento nutricional que contém uma enzima xilanase recombinanteque compreende pelo menos trinta aminoácidos contíguos de umaseqüência da invenção e administrando o suplemento nutricional a umanimal para aumentar a utilização do xilano contido no alimento ingerido peloanimal.

Em outro aspecto, a invenção fornece uma matriz de liberaçãode enzima peletizada comestível e método de uso para a liberação dexilanase para um animal, por exemplo, como suplemento nutricional. Amatriz de liberação de enzima libera prontamente um enzima xilanase, talcomo aquela que tem uma seqüência de aminoácidos da invenção ou pelomenos 30 aminoácidos contíguos dessa, em meio aquoso, tal como, porexemplo, o fluido digestivo de um animal. A matriz de liberação de enzimada invenção é preparada a partir de um veículo granulado comestívelselecionado a partir de tais componentes como gérmen de grão que é pobreem óleo, feno, alfafa, grama timothy, casca de soja, farinha de semente degirassol, farelo de trigo e semelhantes, que dispersam rapidamente a enzimarecombinante contida neles em meio aquoso. Em uso, a matriz de liberaçãode enzima peletizada comestível é administrada a um animal para liberarxilanase para o animal. Substratos baseados em grão adequados podemcompreender ou ser derivados de qualquer grão comestível adequado, talcomo trigo, milho, soja, sorgo, alfafa, cevada e semelhantes. Um exemplarde substrato baseado èm grão é um substrato baseado em milho. Osubstrato pode ser derivado de qualquer parte adequada do grão, mas épreferivelmente um gérmen de grão aprovado para uso em ração animal, talcomo germe de milho que é obtido em um processo de moagem à úmido oua seco. O grão germinado preferivelmente compreende um germe exaurido,que é um gérmen de grão do qual o óleo tenha sido expelido, tal como porprensagem ou extração com hexano ou outro solvente. Alternativamente, ogérmen de grão é extraído por extrusão, ou seja, o óleo foi removido porprensagem.

A matriz de liberação de enzima da invenção está na forma demuitas partículas, péletes ou grânulos individuais. Por "grânulos" entendem-se partículas que são comprimidas ou compactadas, tais como porpeletização, extrusão ou compactação similar para remover água da matriz.Tal compressão ou compactação das partículas também promove a coesãointra-partícula das partículas. Por exemplo, os grânulos podem serpreparados pela peletização do substrato baseado em grão em um moinhode pélete. Os péletes preparados dessa maneira são triturados ouesfarelados até um tamanho de grânulo desejado para uso como adjuvanteem ração animal. Como a matriz está aprovada por si própria para uso emração animal, ela pode ser usada como um diluente para liberação deenzimas em ração animal.

A matriz de liberação de enzima pode estar na forma degrânulos que tem um tamanho de grânulo que varia entre cerca de 4 a cercade 400 mesh (USS); mais preferivelmente, cerca de 8 a cerca de 80 mesh; emais preferivelmente cerca de 14 a cerca de 20 mesh. Se o gérmen do grãoé tem o óleo retirado através de extração com solvente, o uso de um agentelubrificante tal como óleo de milho pode ser necessário no peletizador, mastal agente lubrificante geralmente não é necessário se o gérmen é expelidopor extração. Em outros aspectos da invenção, a matriz é preparada poroutros processos de compactação ou compressão, tais como, por exemplo,pela extrusão de um substrato baseado em grão através de um molde etriturâção do extrusado até um tamanho de grânulo adequado.

A matriz de liberação de enzima pode ainda incluir umcomponente de polissacarídeo como um agente de coesão para aumentar aaderência dos grânulos da matriz. O agente de coesão é tido comofornecedor de grupos hidroxila adicionais, que aumentam a ligação entregrãos de proteína dentro da matriz granuiar. Acredita-se ainda que os gruposadicionais de hidroxila funcionam assim para intensificar a ligação dohidrogênio de proteínas ao amido e outras proteínas. O agente de coesãopode estar presente em qualquer quantidade adequada para intensificar aadesão dos grânulos da matriz de liberação de enzima/Agentes de coesãoadequados incluem uma ou mais de dextrinas, maltodextrinas, amido, talcomo amido de milho, farinhas, celulósicos, hemicelulósicos e semelhantes.Por exemplo, o percentual de gérmen de grão e agente de coesão na matriz(não incluindo a enzima) é de 78% de farinha de gérmen de milho e 20% dopeso de amido de milho.

Como a matriz que libera enzima da invenção é feita demateriais biodegradáveis e contém mistura, a matriz pode ser submetida adecomposição, tal como por mofo. Para prevenir ou inibir tal mofo, a matrizpode incluir um inibidor de mofo, tal como um sal de propionato, que podeestar presente em qualquer quantidade suficiente para inibir o mofo damatriz que libera enzima, fornecendo assim uma matriz de liberação em umaformulação estável que não requer refrigeração.

A enzima xilanase contida na matriz de liberação de enzima emétodos da invenção é preferivelmente uma xilanase termoestável, comodescrita nesse, a fim de resistir a inativação da xilanase durante a fabricaçãoonde temperaturas elevadas e/ou vapor podem ser empregados parapreparar a matriz de liberação de enzima peletizada. Durante a digestão daração que contém a matriz de liberação de enzima da invenção, fluidosdigestivos aquosos causarão a liberação da enzima ativa. Outros tipos deenzimas termoestáveis e suplementos nutricionais que são termoestáveispodem ser incorporados na matriz de liberação para liberar sob qualquer tipode condição aquosa.

Um revestimento pode ser aplicado a partículas de matriz deenzima da invenção por muitos propósitos diferentes, tais como adicionarsabor ou suplemento nutricional a ração animal, para retardar a liberação desuplementos e enzimas da ração animal em condições gástricas esemelhantes. Ou, a cobertura pode ser aplicada para se obter uma metafuncional, por exemplo, sempre que é desejado retardar a liberação daenzima das partículas de matriz ou controlar as condições sob as quais aenzima será liberada. A composição do material de revestimento pode ser talque ela é seletivamente degradada por um agente ao qual ela é suscetível(tal como calor, ácido ou base, enzimas ou outros químicos).Alternativamente, duas ou mais coberturas suscetíveis para tais agentes dedegradação diferentes podem ser consecutivamente aplicadas às partículasda matriz.

A invenção também é dirigida para um processo de prepararuma matriz que libera enzima. De acordo com a invenção, o processocompreende fornecer várias partículas individuais de um substrato baseadoem grão em um tamanho de partícula particular adequado para uso comouma matriz que libera enzima, em que as partículas compreendem a enzimaxilanase codificada por uma seqüência de aminoácidos da invenção ou pelomenos 30 aminoácidos contíguos dessa. Preferivelmente, o processo incluicompactar ou comprimir as partículas da matriz que libera enzima emgrânulos o que pode ser obtido pela peletização. O inibidor de mofo e agentede coesão, quando usados, podem ser adicionados em qualquer momentoadequado e podem ser misturados com o substrato baseado em grão nasproporções desejadas antes da peletização do substrato baseado em grão.

O conteúdo da mistura da ração no moinho de péletes pode estar nas faixasdescritas acima com relação ao conteúdo da mistura no produto final, e podeser cerca de 14 a 15%. Em um aspecto, a mistura é adicionada à ração naforma de uma preparação aquosa da enzima para introduzir na ração esseconteúdo da mistura. A temperatura desse moinho de péletes pode serlevada para cerca de 82-C com vapor. O moinho de pélete pode ser utilizadosob quaisquer condições que transmitem trabalho suficiente à matéria-primapara fornecer péletes. O processo de peletização por si só é um processoeficiente para remoção de água da composição que contém enzima.

Em um aspecto, o moinho de pélete é operado com um moldede 0,3175 cm (1/8 de polegada) por 5,08 cm (2 polegadas) a 756 g/s (100Ib/min) de pressão a 825C para fornecer péletes, que são então trituradosem um triturador pára fornecer várias partículas individuais que tem umtamanho de partícula capaz de passar através de uma tela de malha 8, masser retidas numa tela de malha 20.

As xilanases termoestáveis da invenção podem ser usadas nospéletes da invenção. Eles podem ter temperaturas ótimas elevadas e altaresistência ào calor tal que uma reação enzimática pode ser conseguida emuma temperatura até então não executada. O gene que codifica a xilanasede acordo com a presente invenção (por exemplo, como descrito emqualquer uma das seqüências da invenção) pode ser usado na preparaçãode xilanases (por exemplo, usando GSSM como descrito nesse) que temcaracterísticas diferentes daquelas das xilanases da invenção (em termos depH ótimo, temperatura ótima, resistência ào calor, estabilidade parasolventes, atividade específica, afinidade com o substrato, habilidade desecreção, taxa de tradução, controle de transcrição e semelhantes). Alémdisso, um polinucleotídeo da invenção pode ser empregado para orastreamento de xilanases variantes preparadas pelos métodos descritosnesse para determinar aquelas que tem a atividade desejada, tais comotermoestabilidade ou termotolerância melhorada ou modificada. Porexemplo, Patente U.S. N°. 5.830.732 descreve um ensaio de rastreamentopara determinar a termotelerância de uma xilanase.

Em outro aspecto da invenção, as xilanases da invenção tam-bém podem ser usadas em qualquer ração animal, alimento para animal ouprocesso de produção de aditivo para ração, em que a xilanase é usada co-mo um antimicrobiano ou repelente microbianoi Em outro aspecto da inven-ção, a xilanase da invenção pode ser incluída em qualquer ração animal,alimento para animal composição de aditivo para ração, no qual as xilanasesda invenção atuam como antimicrobianos ou repelentes microbianos.

Tratamento de resíduo

As xilanases da invenção podem ser usadas em uma variedadede outras aplicações industriais, por exemplo, no tratamento de resíduos.Por exemplo, em um aspecto, a invenção fornece um processo de digestãode resíduo sólido usando as xilanases da invenção. Os métodos podemcompreender reduzir a massa e o volume de resíduo sólido substancialmen-te não tratado. O resíduo sólido pode ser tratado com um processo de diges-tão enzimática na presença de uma solução enzimática (incluindo as xilana-ses da invenção) em uma temperatura controlada. Isso resulta em uma rea-ção sem fermentação bacteriana apreciável dos microrganismos adiciona-dos. O resíduo sólido é convertido em um resíduo liqüefeito e algum resíduosólido remanescente. O resíduo liqüefeito resultante pode ser separado dodito resíduo sólido remanescente. Veja, por exemplo, Patente U.S. N°.5.709.796.

Em outro aspecto da invenção, as xilanases da invençãotambém podem ser usadas em qualquer processo de tratamento de resíduo,no qual a xilanase é usada como um antimicrobiano ou repelentemicrobiano. Em outro aspecto da invenção, a xilanase da invenção pode serincluída em qualquer composição de tratamento de resíduo, no qual asxilanases da invenção atuam como antimicrobianos ou repelentesmicrobianos na composição.

Produtos para higiene oral

A invenção fornece produto para higiene oral que compreendexilanases da invenção, incluindo as misturas de enzimas ou "coquetéis" dainvenção. Produtos para higiene oral exemplares incluem pastas de dente,cremes dentais/ géis ou pós dentais, enxagüantes bucais, formulações paralimpeza pré e pós-escovação, gomas de mascar, comprimidos, ou bala.Veja, por exemplo, Patente U.S. N°. 6.264.925.Em outro aspecto da invenção, xilanases da invenção, incluindoas misturas de enzimas ou "coquetéis" da invenção, também podem serusados em qualquer processo de fabricação de composição para higieneoral, no qual as xilanases da invenção atuam como antimicrobianos ourepelentes microbianos na composição.

Produção de cerveja e fermentação

A invenção fornece métodos para produzir cerveja (por exemplo,fermentação) compreendendo as xilanases da invenção, incluindo asmisturas de enzimas ou "coquetéis" da invenção. Em um processo exemplar,os materiais brutos que contém amido são desintegrados e processados/ para formar o malte. Uma xilanase da invenção é usada em qualquer pontono processo de fermentação. Por exemplo, xilanases da invenção podem serusadas no processamento de malte de cevada. O material bruto principal daprodução de cerveja é o malte de cevada. Isso pode ser em um processo detrês estágios. Primeiro, o grão de cevada pode imerso em água paraaumentar o conteúdo de água, por exemplo, por volta de 40%. Segundo, ogrão pode ser germinado pela incubação a 15 a 259C por 3 a 6 dias quandoa síntese enzimática é estimulada sob controle de giberelinas. Em umaspecto, xilanases de invenção são adicionadas a esse (ou qualquer outro)estágio do processo. Xilanases da invenção podem ser usadas no processode produção de cerveja ou qualquer bebida alcoólica, como descrito, porexemplo, na Patente U.S. N°. 5.762.991; 5.536.650; 5.405.624; 5.021.246;4.788.066.

Em um aspecto, uma enzima da invenção é usada paramelhorar a filtrbilidade e a viscosidade do mosto e para obter uma hidrólisemais completa de componentes do endosperma. O uso de uma enzima dainvenção pode também aumentar o rendimento do extrato. O processo deprodução de cerveja envolve a germinação do grão de cevada (maltagem)seguida da extração e degradação dos carboidratos armazenados para seobter açúcares simples que são usados pela levedura para fermentaçãoalcoólica A degradação eficiente das reservas de carboidrato presentes noendosperma da cevada e suplementos cervejeiros requer a atividade devárias enzimas diferentes.

Em um aspecto, uma enzima da invenção tem atividade emacidificar levemente o pH (por exemplo, 5.5-6.0) em, por exemplo, uma faixade temperatura de 40-C a 70-C; e em um aspecto, com inativação a 95-C. Aatividade sob tais condições pode ser ótima, mas não é um requisitoessencial para eficácia. Em um aspecto, uma enzima da invenção tematividade entre 40-75-C e pH 5.5-6.0; estabilidade a 70-C por pelo menos 50minutos e, em um aspecto, é inativada a 96-100-C. Enzimas da invençãopodem ser usadas com outras enzimas, por exemplo, beta-1,4-endoglicanases e amilases.

Em outro aspecto da invenção, as xilanases da invenção,incluindo a mistura de enzimas ou "coquetéis" da invenção também podemser usadas em qualquer processo cervejeiro ou de fermentação, no qual axilanase é usada como um antimicrobiano ou repelente microbiano. Emoutro aspecto da invenção, a xilanase da invenção pode ser incluída emqualquer composição de para fazer cerveja ou fermentada, na qual asxilanases da invenção atuam como antimicrobianos ou repelentesmicrobianos na composição.

Conversão de biomassa e produção de biocombustível

A invenção fornece métodos e processos para conversão debiomassa, por exemplo, para um biocombustível, tal como bioetanol,biometanol, biopropanol e/ou biobutanol e semelhantes, usando as enzimasda invenção, incluindo a mistura de enzimas ou "coquetéis" da invenção.

Assim, a invenção fornece combustíveis, por exemplo, biocombustíveis, taiscomo bio-etanóis, que compreendem um polipeptídeo da invenção, incluindoa mistura de enzimas ou "coquetéis" da invenção ou um polipeptídeocodificado por um ácido nucléico da invenção. Em aspectos alternativos, ocombustível é derivado de um material de planta, que opcionalmentecompreende batatas, soja (colza), cevada, centeio, milho, aveia, beterrabaou cana-de-açúcar e opcionalmente o combustível compreende um bioetanolou mistura de gasolina-etanol.

A invenção fornece métodos para fazer um combustível quecompreendem contatar uma composição que compreende um xilano,hemicelulose, celulose ou um açúcar fermentável com um polipeptídeo dainvenção ou um polipeptídeo codificado por um ácido nucléico da invençãoou qualquer uma das misturas ou "coquetéis" ou produtos fabricados dainvenção. Em modalidades alternativas, a composição compreende umxilano, hemicelulose, celulose ou um açúcar fermentável que compreendeuma planta, produto de planta ou derivado de planta e a planta ou produto deplanta pode compreender plantas ou produtos de planta de cana-de-açúcar,beterrabas, trigo, milho, soja, batata, arroz ou cevada. Em modalidadesalternativas, ρ polipeptídeo tem atividade que compreende catalisar ahidrólise de ligações internas β-1,4-xilosídicas ou ligações endo- β-1,4-glicanase; e/ou degradar um polissacarídeo linear de beta-1,4-xilano emxilose. Em um aspecto, o combustível compreende um bioetanol ou umamistura de gasolina-etanol, ou biopropanol ou uma mistura de gasolina-propanol, ou um biobutanol ou uma mistura de gasolina-butanol, ou umbiometanol ou uma mistura de gasolina-metanol ou qualquer combinaçãodesses.

A invenção fornece métodos para fazer bioetanol, biobutanol,biometanol, e/ou biopropanol que compreendem contatar uma composiçãoque compreende um xilano, hemicelulose, celulose ou um açúcarfermentável com um polipeptídeo da invenção oü um polipeptídeo codificadopor um ácido nucléico da invenção ou qualquer uma das misturas ou"coquetéis" ou produtos fabricados da invenção. Em modalidadesalternativas, a composição compreende um xilano, hemicelulose, celulose ouum açúcar fermentável que compreende uma planta, produto de planta ouderivado de planta e a planta ou produto de planta pode compreenderplantas ou produtos de planta de cana-de-açúcar, beterrabas, trigo, milho,soja, batata, arroz ou cevada e o polipeptídeo pode ter atividade quecompreende atividade de celulase, glicanase, celobioidrolase, beta-glicosidase, xilanase, mananse, β-xilosidase, e/ou arabinofuranosidase.

A invenção fornece conjuntos de enzimas, ou "coquetel", paradespolimerização de polímeros celulósicos e hemicelulósicos em porções decarbono metabolizáveis que compreendem um polipeptídeo da invenção ouum polipeptídeo codificado por um ácido nucléico da invenção. Emmodalidades alternativas, o polipeptídeo tem atividade que compreendecatalisar a hidrólise de ligações internas p-1,4-xilosídicas ou ligações endo-P-1,4-glicanase; e/ou degradar um polissacarídeo linear de beta-1,4-xilanoem xilose. Os conjuntos de enzimas ou "coquetéis" da invenção podem estarna forma de uma composição (por exemplo, uma formulação, líquida ousólida), por exemplo, como um produto de fabricação.

A invenção fornece composições (incluindo produtos de fabrica-ção, grupos de de enzimas ou "coquetéis") que compreendem uma mistura(ou "coquetel") de enzimas que hidrolisam hemicelulose e celulose, em queas enzimas que hidrolisam o xilano compreendem pelo menos uma de cadaxilanase da invenção e pelo menos uma, várias ou todas celulase, glicanase,celobioidrolase e/ou β -glicosidase. Em modalidades alternativas, as mistu-ras que hidrolisam o xilano e/ou hemicelulose da invenção compreendempelo menos uma de cada xilanase da invenção e pelo menos uma ou ambasβ-xilosidase e/ou uma arabinofuranosidase.

A invenção fornece composições (incluindo produtos de fabrica-ção, grupos de enzimas ou "coquetéis") que compreendem uma mistura (ou"coquetel") de enzimas que hidrolisam o xilano, hemicelulose e/ou celuloseque compreendem pelo menos uma, várias ou todas de celulase, uma glica-nase, uma celobioidrolase e/ou uma arabinofuranosidase, e uma xilanasedessa invenção.

A invenção fornece composições (incluindo produtos de fabrica-ção, grupos de enzimas ou "coquetéis") que compreendem uma mistura (ou"coquetel") de enzimas que hidrolisam o xilano, hemicelulose e/ou celuloseque compreendem pelo menos uma, várias ou todas de celulase, uma glica-nase; uma celobioidrolase; uma arabinofuranosidase; uma xilanase; uma β -glicosidase; uma β -xilosidase; e pelo menos uma enzima da invenção.

A invenção fornece composições (incluindo produtos de fabrica-ção, grupos de enzimas ou "coquetéis") que compreendem uma mistura (ou"coquetel") de enzimas que compreendem, além de pelo menos uma enzimada invenção: (1) uma glicanase que cliva ligações β-1,4 internas que resultaem glico-oligossacarídeos curtos; (2) uma celobioidrolase que atua de umamaneira "exo" liberando progressivamente unidades de celobiose (dissacarí-deo de β-1,4 glicose - glicose) e/ou (3) uma β-glicosidase para liberar mo- nômeros de glicose a partir de celo-oligossacarídeos curtos (por exemplo,celobiose).

Conversão de biomassa e produção de biocombustíveis limpos

À invenção fornece composições e processos que usam enzi-mas dessa invenção, incluindo misturas ou "coquetéis" de enzimas da inven-ção, para a conversão de uma biomassa ou qualquer material orgânico, porexemplo, um material que compreende xilano ou lignocelulósico (por exem-plo, qualquer composição compreendendo um xilano, celulose, hemicelulosee/ou lignina) em um combustível, tal como um biocombustível (por exemplo,bioetanol, biobutanol, biometanol, e/ou biopropanol), incluindo biodieseis,além de rações, alimentos, suplementos alimentícios ou para ração (aditi-vos), fármacos e químicos. Assim as composições e métodos da invençãofornecem alternativas eficazes e sustentáveis ou auxiliares para uso comprodutos baseados em petróleo, por exemplo como uma mistura de um bio-combustível (por exemplo, bioetanol, biobutanol, biometanol, e/ou biopropa-nol) e gasolina e/ou um combustível de diesel.

A invenção fornece células e/ou organismos que expressam en-zimas da invenção (por exemplo, em que as células ou organismos compre-endem como ácidos nucléicos heterólogos uma seqüência dessa invenção)para participação em ciclos químicos que envolvem conversão de biomassanatural (por exemplo, planta). Em um aspecto, enzimas e métodos para aconversão são usados em conjuntos de enzimas (ou "coquetéis") para des-polimerização eficiente de composições que compreendem xilano, ou polí-meros de xilano, celulósicos ou hemicelulósicos em porções de carbono me-tabolizáveis. A invenção fornece métodos para descobrir e implementar amais eficaz das enzimas para possibilitar esses novos processos industriaisimportantes de conversão de biomassa e energia alternativa.

Os métodos da invenção também incluem utilizar o material debiomassa (por exemplo, lignocelulósico) convertida (processada pelas enzi-mas da invenção) e transformá-lo em um combustível (por exemplo, um bio-combustível tal como bioetanol, biobutanol, biometanol, biopropanol ou bio-diesel) pela fermentação e/ou síntese química. Em um aspecto, os açúcaresproduzidos são fermentados e/ou os produtos não fermentáveis são gaseifi-cados.

As enzimas da invenção (incluindo, por exemplo, organismostais como microrganismos, por exemplo, fungos, levedura ou bactérias eplantas e células de plantas e partes de plantas, por exemplo, sementes,que produzem e em alguns aspectos seçretam enzimas recombinantes dainvenção) podem ser usadas ou incluídas/integradas em qualquer estágio dequalquer processo de conversão de matéria orgânica/biomassa, por exem-plo, em uma etapa qualquer, várias etapas ou incluídas em todas as etapasou todos os seguintes métodos do processo de conversão de biomassa ouem todos esses biocombustíveis alternativos:

Combustão direta: a queima do material pelo calor direto e é a tecnologia debiomassa mais simples; pode ser muito econômica se a fonte da biomassa épróxima.

1 Pirólise: é a degradação térmica da biomassa pelo calor na ausência deoxigênio. Em um aspecto, a biomassa é aquecida a uma temperatura entrecerca de 800 a 1400 graus Fahrenheit, mas nenhum oxigênio é introduzidopara suportar a combustão resultante na criação de gás, óleo combustível ecarvão.2 Gaseificação: a biomassa pode ser usada para produzir metano através doaquecimento ou digestão anaeróbica. Gás de síntese, uma mistura demonóxido de carbono e hidrogênio pode ser derivado de biomassa.

Gás Natural: é gerado pela decomposição (digestão anaeróbica) de lixoenterrado em aterros sanitários. Quando o resíduo orgânico se decompõe,ela gera gás que consiste em aproximadamente 50% de metano, o principalcomponente do gás natural.

Digestão anaeróbica: converte a matéria orgânica em uma mistura demetano, o principal componente do gás natural, e dióxido de carbono. Emum aspecto, biomassa tal como água de esgoto (esgoto), adubo ou resíduode processamento de alimento, é misturado com água e alimentado em umtanque digestor sem ar.

Fermentação:

Fermentação alcoólica: álcool combustível é produzido pela conversão deamido em açúcar, fermentação do açúcar em álcool, então separando amistura de álcool água por destilação. Matérias-primas tais como trigo,cevada, batatas e resíduos de papel, serragem e palha que contém açúcar,amido ou celulose podem ser convertidos para álcool pela fermentação comlevedura.

Transesterificacão: um exemplar de reação para converter óleo em biodieselé chamada de transesterificação. O processo de transesterificação reage umálccol (como metanol) com os óleos de triglicerídeo contidos em óleosvegetais, gorduras animais ou graxas recicladas, formando ésteres alquil deácido graxo (biodiesel) e glicerina. A reação requer calor e úma basecatalisadora forte, tal como hidróxido de sódio ou hidróxido de potássio.

Biodiesel: Biodiesel é uma mistura de ésteres alquil de ácido graxo feitos apartir de óleos vegetais, gorduras animais ou graxas recicladas. Biodieselpode ser usado como combustível para veículos na sua forma pura, masgeralmente é usado como um aditivo para o diesel de petróleo pára reduziros níveis de particulados, monóxido de carbono, hidrocarbonetos e gasestóxicos de veículos movidos à diesel.Hidrólise: inclui hidrólise de um composto, por exemplo, uma biomassa, talcomo um material lignocelulósico, catalisado usando uma enzima dapresente invenção.

Coqeracão: é a produção simultânea de mais de uma forma de energiausando um único combustível e equipamento. Em um aspecto, a cogeraçãode biomassa tem maior potencial de desenvolvimento do que a geração debiomassa apenas, por que a cogeração produz ambos calor e eletricidade.

Em um aspecto, os polipeptídeos da invenção tem atividadeenzimática suficiente ou podem ser usados com outras enzimas em umprocesso para gerar um biodiesel ou um combustível, por exemplo, umbiocombustível tal como bioetanol, biobutanol, biometanol, biopropanol, apartir de um material orgânico, por exemplo, uma biomassa, tal como ascomposições derivadas de plantas e animais, incluindo qualquer culturaagrícola ou outras matérias-primas renováveis, um resíduo agrícola ou umresíduo animal ou os componentes orgânicos de resíduos municipais eindustriais ou microrganismos tais como algas ou levedura.

Em um aspecto, os polipeptídeos da invenção são usados emprocessos para conversão de um material orgânico, por exemplo, umabiomassa, tal como uma biomassa lignocelulósica, em um biocombustível,tal como bioetanol, biobutanol, biometanol, biopropanol ou, por outro lado,são usados em processos para hidrolisar ou digerir bio-materiais tal que elespossam ser usados como um biocombustível (incluindo biodiesel oubioetanol, biobutanol, biometanol, biopropanol) ou par tornar mais fácil abiomassa ser processada em um combustível· Em um aspecto alternativo,os polipeptídeos da invenção são usados em processos para um processode transestêrificação que reage um álcool (como metanol, butanol, propanol,etanol) com um óleo de triglicerídeo contido em óleos vegetais, gordurasanimais ou graxas recicladas, formando ésteres alquil de ácido graxo(biodiesel) e glicerina. Em um aspecto, biodiesel é feito de óleo dé soja ouóleos culinários reciclados. Gorduras animais, outros óleos vegetais e outrosóleos reciclados também podem ser usados para produzir biodiesel,dependendo de seus custos e disponibilidade. Em outro aspecto, misturasde todos os tipos de gorduras e óleos são usadas pára produzir um biodieselda invenção.

Enzimas da invenção também podem ser usadas no refino deglicerina. O subproduto de glicerina contém catalisadores e sabões nãoreagidos que são neutralizados com um ácido. Água e álcool são removidospara produzir 50 a 80% de glicerina bruta. Os contaminantes restantesincluem gorduras e óleos não reagidos, que podem ser processados usandoos polipeptídeos da invenção. Na grande escala de plantas de biodiesel dainvenção, a glicerina pode ainda ser purificada, por exemplo, para 99% depureza ou mais, para as indústrias farmacêutica e cosmética.

Ambos, o biodiesel e bioetanol, feitos usando os polipeptídeosda invenção podem ser usados como oxigenatos de combustível paramelhorar as características da combustão. Adicionar oxigênio resulta emcombustão mais completa, o que reduz as emissões de monóxido decarbono. Esse é outro benefício ambiental da substituição de combustíveisde petróleo por biocombustíveis (por exemplo, um combustível da invenção).Um bioetanol feito usando as composições e/ou métodos dessa invençãopode ser misturado com gasolina para formar um combustível E10 (cerca de5% a 10% de etanol e cerca de 90% a 95% de gasolina), mas ele pode serusado em concentrações mais elevadas tal como E85 ou em sua formapura. Um bioetanol feito usando as composições e/ou métodos dessainvenção pode ser misturado com diesel de petróleo para formar umamistura B20 (20% de biodiesel e 80% de diesel de petróleo), embora outrosníveis de misturas possam ser usados até B100 (biodiesel puro).

Em um aspecto, os polipeptídeos dessa invenção são usadosem processos para converter material orgânico, por exemplo, umabiomassa, tal como biomassa lignocelulósica, em metanol, butanol, propanole/ou etanol. A invenção também fornece processos para fazer etanol("bioetanol"), metanol, butanol e/ou propanol a partir de composições quecompreendem material orgânico, por exemplo, uma biomassa, tal comobiomassa lignocelulósica. O material orgânico, por exemplo, uma biomassa,tal como biomassa lignocelulósica pode ser obtido de culturas agrícolas,como um subproduto de produção de alimento ou ração ou como biomassade produtos residuais, tais como resíduos de planta e resíduos de papel.

Exemplos de resíduos de plantas adequados para tratamento compolipeptídeos da invenção incluem grãos, sementes, caules, folhas, cascas,pericarpo, espigas de milho, palhas de milho, talos, gramas (por exemplograma indiana, tal como Sorghastrum nutans; ou switch Grass, por exemploda espécie Panicum, tal como Panicum virgatum) e semelhantes, assimcomo madeira lascas de madeira, polpa de madeira e serragem. Exemplosde resíduos de papel adequados para tratamento com polipeptídeos dainvenção incluem papel de fotocópia descartado, papel de impressora, papelagenda, papel de cáderna, papel para impressão e semelhantes, assimcomo jornais, revistas, papelão e materiais de embalagem baseados empapel.

Em um aspecto, as enzimas e métodos da invenção podem serusados em conjunto com meios mais "tradicionais" de fazer metanol, buta-nol, propanol e/ou etanol de biomassa, por exemplo, como métodos quecompreendem hidrolisar a biomassa (por exemplo, materiais lignocelulósi-cos) pela submissão de material de biomassa seco em um raetor a um cata-lisador compreendido por uma solução diluída de um ácido forte ou sal demetal; isso pode diminuir a energia de ativação ou a temperatura da hidróliseda celulose para se obter maiores rendimentos de açúcar; por exemplo, vejaPatentes U.S. Nos. 6.660.506; 6.423.145.

Outro método exemplar que incorporou o uso de enzimas dainvenção compreende hidrolisar biomassa (por exemplo, materiais Iignocelu-lósicos) que contém xilano, hemicelulose, celulose e/ou Iignina pela submis-são do material a um primeiro estágio da etapa de hidrólise em um meio a-quoso em uma temperatura e pressão escolhidas para efetuar a despolime-rizaçãó primariamente de hemicelulose sem a despolimerização principal decelulose para glicose. Essa etapa resulta em uma pasta em que a fase líqui-da aquosa contém monossacarídeos dissolvidos que resultam da despolime-rização da hemicelulose e uma fase sólida que contém celulose e lignina.Um segundo estágio da etapa de hidrólise pode compreender condições taisque pelo menos uma porção principaç de celulose é despolimerizada, taletapa resultando em uma fase líquida aquosa que contém produtos de des-polimerização de celulose dissolvidos/solúveis. Veja, por exemplo, PatenteU.S. Nos. 5.536.325. Enzimas da invenção podem ser adicionadas em qual-quer estágio desse processo exemplar.

Outro método exemplar que incorporou o uso de enzimas dainvenção compreende processar um material de biomassa por um ou maisestágios de hidrólise com ácido diluído com cerca de 0,4 a 2% de ácido for-te; e tratar o componente lignocelulósico sólido não reagido do material debiomassa hidrolisada com ácido pela deslignificaçãó para produzir precurso-res para termoplásticos biodegradáveis e derivados. Veja, por exemplo, Pa-tente U.S. Nos. 6.409.841. Enzimas da invenção podem ser adicionadas emqualquer estágio desse processo exemplar.

Outro método exemplar que incorporou o uso de enzimas dainvenção compreende pré-hidrolisar biomassa (por exemplo, materiais Iigno-celulósicos) em um reator de pré-hidrólise; adicionar um líquido ácido ao ma-terial lignocelulósico sólido para fazer uma mistura; aquecer a mistura até atemperatura de reação; manter a temperatura de reação por tempo suficien-te para fracionar o material lignocelulósico em uma porção solubilizada quecontém pelo menos cerca de 20% da lignina do material lignocelulósico euma fração sólida que contém celulose; remover a porção solubilizada dafração sólida na ou próximo da temperatura de reação enquanto a celulosena fração sólida está mais sensível à digestão enzimática; e recuperar a por-ção solubilizada. Veja, por exemplo, Patente U.S. Nos. 5.705.369. Enzimasda invenção podem ser adicionadas em qualquer estágio desse processoexemplar.

A invenção fornece métodos para fazer composições combustí-veis pára motor (por exemplo, para motores de combustão interna) basea-dos em misturas de hidrocarbonetos líquidos com um álcool anidro feito como uso de uma enzima ou um método da invenção. Em um aspecto, os com-bustíveis feitos com uma enzima da invenção compreendem, por exemplo,misturas de gás liqüefeito de carvão ou gás natural líquido-etanol. Em umaspecto, um co-solvente é 2-metiltetraidrofurano (MTHF) derivado de bio-massa. Veja, por exemplo, Patente U.S, N°. 6.712.866.

Em um aspecto, métodos da invenção para a degradação enzi-mática de biomassa (por exemplo, materiais lignocelulósicos), por exemplo,para a produção de um biocombustível, por exemplo, um etanol, a partir deuma biomassa ou qualquer material orgânico, também podem compreendero uso de tratamento ultrassônico de um material de biomassa; veja, por e-xemplo, Patente U.S. N°. 6.333.181.

Em outro aspecto, métodos da invenção para a produção de umbiocombustível, por exemplo, um etanol (um bioetanol) a partir de substratode biomassa (por exemplo, um celulósico) compreendem fornecer uma mis-tura de reação na forma de uma pasta que compreende substrato de bio-massa (por exemplo, um celulósico), uma enzima dessa invenção e um a-gente de fermentação (por exemplo, dentro de um vaso de reação, tal comoum bioreator alimentado com sólidos semi-continuamente) e a mistura dereação é reagida sob condições suficientes para iniciar e manter uma reaçãode fermentação (como descrita, por exemplo, no Pedido de Patente U.S. N°.20060014260). Em um aspecto, ou cálculos experimentais ou teóricos po-dem determinar uma freqüência de alimentação ótima. Em um aspecto,quantidades adicionais de substrato de biomassa (por exemplo, um celulósi-co) e enzima são fornecidas ao vaso de reação em intervalo (s) de acordocom a freqüência de alimentação otimizada.

Outro processo exemplar para fazer biocombustíveis e biodiseisda invenção está descrito nos Pedidos de Patente U.S. Publicados Nos.20050069998; 20020164730; e em um aspecto, compreende estágios detriturar a biomassa (por exemplo, material lignocelulósico) (por exemplo, pa-ra um tamanho de 15-30 mm), submeter o produto obtido a um pré-tratamento de explosão a vapor (por exemplo, em uma temperatura de 190-230-C) entre 1 e 10 minutos em um reator; coletar o material pré-tratado emum ciclone ou produto de fabricação relacionado; e separar as frações líqui-das e sólidas por filtração em um filtro de pressão, introduzir a fração sólidaem um depósito de fermentação e adicionar uma ou mais enzimas da inven-ção e, em um aspecto, outra enzima também é adicionada, por exemplo,uma enzima celulase e/ou beta-glicosidase (por exemplo, dissolvida emtampão de citrato pH 4.8).

Outro processo exemplar para fazer biocombustíveis e biodie-seis da invenção, que compreendem metanol, butanol, propanol e/ou etanol,/ usando enzimas da invenção compreende pré-tratar um material inicial quecompreende uma matéria bruta de biomassa (por exemplo, um lignocelulósi-co) que compreende pelo menos um xilano, uma hemicelulose e/ou umacelulose. Em um aspecto, o material inicial compreende batatas, soja (colza),cevada, centeio, milho, aveia, trigo, beterraba ou cana-de-açúcar ou umcomponente ou resíduo ou subproduto de produção de alimento ou ração. Omaterial inicial ("matéria-prima") é reagido em condições que rompem a es-trutura de fibras da plantapara efetuar pelo menos uma hidrólise parcial dabiomassa (por exemplo, hemicelulose e/ou celulose). As condições de ruptu-ra podem compreender, por exemplo, submeter o material inicial a uma tem-peratura média de 180-C a 270-C em pH de 0.5 a 2.5 por um período de 5segundos a 120 segundos ou equivalente. Isso gera uma matéria-prima comacessibilidade aumentada para ser digerida por uma enzima, por exemplo,uma enzima celulase da invenção. Patente U.S. N°. 6.090.595.

Condições exemplares para hidrólise de biomassa (por exemplo,material lignocelulósico) por uma enzima dessa invenção incluem reaçõesenr temperaturas entre 30-C e 48-C e/ou um pH entre cerca de 4.0 e 6.0.Outras condições exemplares incluem temperaturas entre cerca de 309C e60-C e um pH entre cerca de 4.0 a 8.0.

Biocombustíveis e alcoóis produzidos bioloaicamente.A invenção fornece biocombustíveis e combustíveis sintéticos,incluindo líquidos e gases (por exemplo, gás de síntese) e álcoois produzi-dos biologicamente, e métodos para fazê-los, usando as composições (porexemplo, enzima e ácidos nucléicos, plantas transgênicas, animais, semen-tes e microrganismos) e métodos da invenção. A invenção fornece biocom-bustíveis e álcoois produzidos biologicamente que compreendem enzimas,ácidos nucléicos, plantas transgênicas, animais (por exemplo microrganis-mos tais como bactérias e levedura) e/òu sementes da invenção. Em umaspecto, esses biocombustíveis e álcoois produzidos biologicamente sãoproduzidos a partir de biomassa.

A invenção fornece álcoois produzidos biologicamente, tais co-mo etanol, metanol, propanol e butanol, produzidos pelos métodos da inven-ção que incluem a ação de micróbios e enzimas da invenção através de fer-mentação (hidrólise) para resultar em um álcool combustível.Biocombustíveis como um líquido ou uma gasolina

A invenção fornece biocombustíveis e combustíveis sintéticos nafirma de um gás ou gasolina, por exemplo, um gás de síntese. Em um as-pecto, métodos da invenção que compreendem o uso de enzimas da inven-ção para ciclos químicos para conversão de biomassa natural, por exemplo,para a hidrólise da biomassa para fazer um biocombustível, por exemplo, umbioetanol, biopropanol, biobutanol ou um biometanol ou um combustível sin-tético na forma de um líquido ou como um gás, tal como um "gás de sínte-se".

Por exemplo, a invenção fornece métodos para fazer gases debiocombustível e combustíveis de gás de síntese ("syngas"), que compreen-dem um bioetanol, biopropanol, biobutanol e/ou biometanol, feitos usandoum polipeptídeo dâ invenção ou feitos usando um método dâ invenção; e emum aspecto, esse gás de biocombustível da invenção é misturado com umgás natural (pode também ser produzido de biomassa, por exemplo, um gáscombustível baseado em hidrogênio ou um hidrocarboneto.Em um aspecto, a invenção fornece métodos para processarbiomassa em um combustível sintético, por exemplo um gás de síntese, talcomo um gás de síntese produzido a partir de uma biomassa por gaseifica-ção. Em um aspecto, a invenção fornece métodos para fazer um gás de eta-nol, propanol, butanol e/ou metanol a partir de cana-de-açúcar, por exemplo,um bagaço. Em um aspecto, esse combustível ou gás é usado como com-bustível de motor, por exemplo, combustível automotivo, de caminhão, avi-ão, barco, motor pequeno, etc. Em um aspecto, a invenção fornece métodospara fazer um etanol, propanol, butanol e/ou metanol de uma planta, por e-xemplo, milho, ou produto de planta, por exemplo, forragem ou palha (porexemplo, palha de arroz ou palha de trigo ou qualquer caule seco de qual-quer planta de cereal) ou um resíduo de produto agrícola. Etanol, propanol,butanol e/ou metanol celulósicos podem ser produzidos a partir de uma plan-ta, por exemplo, milho, ou produto de planta, por exemplo, forragem ou pa-lha ou um resíduo de produto agrícola (por exemplo, como processado porlogen Corporation de Ontário, Canadá).

Em um aspecto, o etanol, propanol, butanol e/óu metanol feitosusando um método de composição da invenção pode ser usado como umaditivo para combustível (por exemplo, uma gasolina) (por exemplo um oxi-genador) ou em um uso direto como um combustível. Por exemplo, etanol,propanol, butanol e/ou metanol, incluindo um combustível, feitos pelo méto-do da invenção podem ser misturados com um éter butil etil terciário (ETBA)ou uma mistura de ETBE tal como ETBE contendo 47% de etanol como umbiocombustível ou com MTBE (eter butil metil terciário). Em outro aspecto,etanol, propanol, butanol e/ou metanol, incluindo um combustível, feitos pelométodo da invenção podem ser misturados com:

<table>table see original document page 315</column></row><table><table>table see original document page 316</column></row><table>

Um butanol e/ou etanol feitos por um método da invenção (porexemplo, usando uma enzima da invenção) podem ser processados aindausando fermentação "A.B.E." (Acetona, Butanol, Etanol); em um aspecto,butanol sendo o único produto líquido. Em um aspecto, esse butanol e/ouetanol é queimado "diretamente" em motores a gasolina existentes (semmodificação do motor ou do carro), produz mais energia e é menos corrosivoe menos solúvel em água do que o etanol e pode ser distribuído através dasinfra-estruturas existentes.

A invenção também fornece alcoóis misturados nos quais um,vários ou todos os alcoóis são feitos pelos processos que compreendempelo menos um método da invenção (por exemplo, usando uma enzima dainvenção), por exemplo, compreendendo uma mistura de etanol, propanol,butanol, pentanol, hexanol e heptanol, tal como ECALENE™ (Power EnergyFuels, Inc., Lakewood, CO), por exemplo.:

<table>table see original document page 316</column></row><table>

Em um aspecto, um, vários ou todos esses alcoóis são feitospor um processo da invenção usando uma enzima da invenção e o processopode compreender ainda uma tecnologia de biomassa para líquido, porexemplo, um processo de gaseificação para produzir gás de síntese seguidopela síntese catalítica ou pela bioconversão de biomassa em umcombustível de álcool misturado.

A invenção também fornece processos que compreendem o usode uma enzima da invenção que incorpora (ou incorporada em) processosde "gás para líquido" ou GTL; ou "carvão para líquido" ou CTL; ou "biomassapara líquido" ou BTL; ou "areias oleíferas para líquido" ou OTL; e em umaspecto, esses processos da invenção compreendem fazer umbiocombustível (por exemplo, um combustível sintético) de uma biomassausando, por exemplo, o assim chamado processo de "Fischer Tropsch" (umareação química catalisada na qual o monóxido de carbono e hidrogênio sãoconvertidos em hidrocarbonetos líquidos de várias formas; catalisadorestípicos usados são baseados em ferro e cobalto; o propósito principal desseprocesso é produzir um substituto sintético do petróleo para uso como óleolubrificante sintético ou como combustível sintético). Em um aspecto, essebiocombustível sintético da invenção pode conter oxigênio e pode ser usadocomo aditivo em diesel e gasolina de alta qualidade.

Em aspectos alternativos, os processos da invenção usamvários pré-tratamentos, que podem ser agrupados em três categorias: físico,químico e múltiplo (físico + químico). Quaisquer químicos podem ser usadoscomo um agente de pré-tratamento, por exemplo, ácidos, álcalis, gases,celulose, solventes, alcoóis, agentes oxidantes e agentes redutores. Entreesses químicos, álcali é o agente de pré-tratamento mais popular por que eleé relativamente barato e resulta em menos degradação de celulose. Osálcalis comuns, hidróxido de sódio e cal também podem ser usados comoagentes de pré-tratamento. Embora o hidróxido de sódio aumentesignificativamente a digestibilidade da biomassa, ele é difícil de reciclar, érelativamente caro e é perigoso de manusear. Em contraste, cal tem muitasvantagens: é segura e muito barata e pode ser recuperada pelacarbonatação da água de Ivagem com dióxido de carbono.

Em um aspecto, a invenção fornece um sistema de multi-enzima(incluindo pelo menos uma enzima da invenção) que pode hidrolisarpolissacarídeos em biomassa, por exemplo, cana-de-açúcar, por exemplo,bagaço, um componente de cana-de-açúcar processado em moinhos deaçúcar. Em um aspecto, a biomassa é processada por uma enzima dainvenção feita por um organismo (por exemplo, animal transgênico, planta oumicrorganismo transformado) e/ou subproduto (por exemplo, planta colhida,fruto, semente) que expressa uma enzima da invenção. Em um aspecto, aenzima é uma enzima recombinante feita pela planta ou biomassa que épara ser processada em um combustível, por exemplo, a invenção forneceum bagaço de cana-de-açúcar transgênica que compreende uma enzima dainvenção. Em um aspecto, essas composições e produtos usados nosmétodos da invenção compreendem ciclos químicos para conversão debiomassa natural, por exemplo, para a hidrólise de uma biomassa para fazerum biocombustível, por exemplo, bioetanol, biopropanol, biobutanol,biometanol, um combustível sintético na forma de um líquido ou um gás, talcomo um "gás de síntese".

Em um aspecto, a invenção fornece um biocombustível, porexemplo, um biogás, produzido pelo processo de digestão anaeróbica dematerial orgânico por anaeróbios, em que o processo compreende o uso deuma enzima da invenção ou de um método da invenção. Essebiocombustível, por exemplo, um biogás, pode ser produzido tanto a partirde materiais residuais biodegradáveis quanto pelo uso de culturasenergéticas alimentadas em digestores anaeróbícos para suplementar aprodução de gás. O produto sólido, biofertilizante, também pode ser usadocomo um biocombustível.

Em um aspecto, a invenção fornece um biocombustível, porexemplo, um biogás, que compreende metano, em que o processocompreende o uso de uma enzima da invenção ou um método da invenção.Esse biocombustível, por exemplo, um biogás, pode ser recuperado emdigestores anaeróbícos industriais e sistemas de tratamento mecânicobiológico. O gás natural pode ser ainda processado usando uma enzimadessa invenção ou um processo dessa invenção; antes do processamento, ogás natural pode ser uma forma menos limpa de biogás produzido ematerros sanitários através da digestão anaeróbica que ocorre naturalmente.Paradoxalmente, se o gás natural é deixado escapar para a atmosfera, ele éum potente gás para o efeito estufa.A invenção fornece métodos para fazer óleos e gasesbiologicamente produzidos a partir de vários resíduos, nos quais o processocompreende o uso de uma enzima da invenção ou um método da invenção.Em um aspecto, esses métodos compreendem a despolimerização térmicado resíduo para extrair metano e outros óleos similares ao petróleo; ou, porexemplo, um sistema de biorreator que utilize algas fotossintéticas nãotóxicas para captar gases de chaminés e produzir biocombustíveis tais comobiodiesel, biogás e um combustível seco comparável ao carvão, porexemplo, como designado por GreenFueI Technologies Corporation, deCambridge, MA.

A invenção fornece métodos para fazer óleos biologicamenteproduzidos, incluindo óleos brutos e gases que podem ser usados emmotores a diesel, nos quais o processo compreende o uso de uma enzimada invenção ou um método da invenção. Em um aspecto, esses métodospodem refinar petróleo, por exemplo, óleos brutos, em querosene, petróleo,diesel e outras frações.

A invenção fornece métodos (usando uma enzima da invençãoou um método da invenção) para fazer óleos biologicamente produzidos apartir de:

Óleo vegetal puro (SVO).

Resíduo de óleo vegetal (WVO) — resíduos de óleos culinários egorduras produzidas em quantidade principalmente em cozinhas comerciais.Biodiesel obtido da transesterificacão de gorduras de animal e óleovegetal, utilizável diretamente em motores a diesel de petróleo.

Óleo bruto biologicamente derivado, junto com biogás e sólidos décarbono através de despolimerização térmica de materiais orgânicoscomplexos incluindo materiais que não são baseados em óleo; por exemplo,produtos residuais tais como pneus velhos, partes não comestíveis deanimal, madeira e plástico.

Óleo de pirólise; que pode ser produzido de biomassa, resíduo demadeira, etc., usando calor apenas para desencadear o processo de pirólise(o óleo deve ser tratado antes de usar em sistemas de combustívelconvencional ou motores de combustão interna)

• Madeira, carvão e estrume seco.

Aplicações médicas e de pesquisa

Xilanases da invenção, incluindo as misturas de enzima ou"coquetéis" da invenção podem ser usadas como agentes antimicrobianosdevido às suas propriedades bacteriolíticas. Xilanases da invenção podemser usadas para eliminar ou proteger animais de salmonelas, como descrito,por exemplo, no Pedido PCT Nos. W00049890 e W09903497. Em outroaspecto da invenção, as xilanases da invenção também podem ser usadascomo um limpador antimicrobiano de superfície ou repelente microbiano.

Outras aplicações industriais e médicas

Como discutido acima, xilanases da invenção, incluindo asmisturas de enzima ou "coquetéis" da invenção, podem ser usadas, porexemplo, em uma grande variedade de processos industriais, aplicaçõesmédicas e de pesquisa (laboratório) e aplicações em alimentos, ração animale bebida. Novas xilanases são descobertas pelo rastreamento de bibliotecasexistentes e bibliotecas de DNA construídas a partir de localizaçõesmesofílicas e termofílicas diversas assim como fontes intencionais incluindoa flora digestiva, microrganismos em resíduo animal, bactérias do solo ehabitats altamente alcalinos.

A bio-captura e estratégias de enriquecimento primário usandosubstratos de arabinoxilano e/ou frações de polissacarídeos não solúveis dematerial de ração animal também são úteis. :

Duas formas de rastreamento (baseado na atividade e baseadona seqüência)são usadas na descoberta de novas xilanases. A abordagembaseada na atividade é o rastreamento direto para a atividade de xilanaseem placas de ágar que usam um substrato tal como azo-xilano (Megazyme).Alternativamente, a abordagem baseada na seqüência pode ser usada, aqual se apóia na bioinformática e biologia molecular para designar sondaspara hibridização e bio-rastreamento. Veja, por exemplo, Patentes U.S. Nos.6.054.267, 6.030.779, 6.368.798, 6.344.328. Achados do rastreamento sãopurificados, seqüenciados, caracterizados (por exemplo, determinação deespecificidade, temperatura e pH ótimos), analisados usando bioinformática,subclonados e expressos para caracterização bioquímica básica. Essesmétodos podem ser usados no rastreamento de xilanases úteis em umamiríade de aplicações, incluindo condicionamento de massa de trigo e comoenzimas aditivas para ração animal.

Na caracterização de enzimas obtidas pelo rastreamento, autilidade exemplar no processamento de massa e aplicações de cozimentopode ser avaliada. A caracterização pode incluir, por exemplo, medida deespecificidade de substrato (xilano, arabinoxilano, CMC, BBG), estabilidadede temperatura e pH e atividade específica. Uma enzima comercial pode serusada como medida padrão. Em um aspecto, as enzimas da invenção tematividade significativa em pH > 7 e 25-35-C, são inativas em xilano solúvel,são estáveis e ativas em 50-67% de sacarose.

Em outro aspecto, utilidade como aditivos para ração pode seravaliada a partir da caracterização de enzimas candidatas. A caracterizaçãopode incluir, por exemplo, a medida da especificidade do substrato (xilano,arabinoxilano, CMC, ΒβΘ), estabilidade de temperatura e pH, atividadeespecífica e estabilidade gástrica. Em um aspecto, a ração é designada paraum animal monogástrico e em outro aspecto a ração é designada para umanimal ruminante. Em um aspecto, as enzimas da invenção tem atividadesignificativa em pH 2-4 e 35-40-C, uma meia-vida maior do que 30 minutosno fluido gástrico, meia-vida da formulação (em tampão ou células) maior doque 5 minutos a 85-C e são usadas como aditivo para ração de animalmonogástrico. Em outro aspecto, as enzimas da invenção tem uma ou maisdas seguintes características: atividade significativa em pH 6.5 a 7.0 e 35 a40-C, uma meia-vida maior do que 30 minutos no fluido do rúmen,estabilidade da formulação tão estável quanto um pó seco e são usadascomo aditivo para ração de animal ruminante.Enzimas são reativas frente a uma ampla faixa de substratosnaturais e não-naturais, possibilitando assim a modificação de virtualmentequalquer composto de chumbo orgânico. Além disso, diferente dos catalisa-dores químicos tradicionais, as enzimas são altamente enantio e régio-seletivas. O alto grau de especificidade funcional por grupo exibida pelasenzimas possibilita que se observe cada reação de uma seqüência sintéticaque leva a um novo composto ativo. Enzimas também são capazes de cata-lisar várias reações diversas não relacionadas com suas funções fisiológicasna natureza. Por exemplo, peroxidases catalisam a oxidação de fenóis peloperóxido de hidrogênio. Peroxidases também podem catalisar reações dehidroxilação que não estão relacionadas com a função nativa da enzima.Outros exemplos são xilanases que catalisam a decomposição de polipeptí-deos. Em solução orgânica algumas xilanases podem também acilar açúca-res, uma função não relacionada com a função nativa dessas enzimas. Ape-sar do uso de biocatalisadores (isto é, enzimas purificadas ou brutas, célulasvivas ou não-vivas) em transformações químicas normalmente requerer aidentificação de um biocatalisador em particular que reage com um compos-to inicial específico, a presente invenção usa biocatalisadores selecionadose condições de reação que são específicas para grupos funcionais que estãopresentes em vários compostos iniciais. Cada biocatalisador é específicopara um grupo funcional ou vários grupos funcionais relacionados e podereagir com vários compostos iniciais que contém esse grupo funcional. Es-sas reações biocatalíticas produzem uma população de derivados a partir deum único composto inicial. Esses derivados podem ser submetidos à outrarodada de reações biocatalíticas para produzir uma segunda população decompostos derivados. Milhares de variações do composto original podem serproduzidas com cada interação de derivatização biocatalítica.

Enzimas reagem em sítios específicos de um composto inicialsem afetar o resto da molécula, um processo que é muito difícil de se obterusando métodos químicos tradicionais. O alto grau de especificidade bioca-talítica fornece o meio para identificar um único composto ativo dentro dabiblioteca. A biblioteca é caracterizada pela série de reações biocatalíticasusadas para produzi-la, a assim chamada "história biossintética". Rastrear abiblioteca quanto a atividades biológicas e traçar a história biossintética iden-tifica a seqüência de reação específica que produz o composto ativo. A se-qüência de reação é repetida e a estrutura do composto sintetizado é deter-minada, Esse modo de identificação, diferente de outras abordagens de sín-tese e rastreamento, não requer tecnologias de !mobilização e os compostospodem ser sintetizados e testados livres na solução usando virtualmentequalquer tipo de ensaio de rastreamento. É importante observar que o altograu de especificidade de reações enzimáticas sobre grupos funcionais per-mite "seguir a pista" de reações enzimáticas específicas que fazem a biblio-teca biocataliticamente produzida.

Várias etapas processuais são realizadas usando automaçãorobótica que permite a execução de vários milhares de reações biocatalíticase ensaios de rastreamento por dia assim como assegurando um alto nível deprecisão e reprodutibilidade. Como resultado, uma biblioteca de compostosderivados pode ser produzida em uma questão de semanas o que poderialevar anos para produzir usando métodos químicos comuns. (Para outrosensinamentos sobre modificação de moléculas, incluindo moléculas peque-nas, veja PCT/US94/09174).

Em um aspecto, a invenção fornece uma composição que com-preende pelo menos um polímero muco-adesivo que é capaz de formar umhidrogel e pelo menos um polímero solúvel em água e uma ou mais enzimasda invenção. Essa formulação pode ser usada em qualquer processamentoindustrial, alimentício ou para ração ou aplicação médica ou de pesquisa dainvenção, isto é, qualquer aplicação que usa uma enzima ou ácido nucléicoda invenção. Em um aspecto, a formulação forma um hidrogel em soluçãoaquosa que tem propriedades müco-adesivas; isso pode ser capaz de liberarenzimas, microrgánismos capazes de gerar enzimas da invenção ou antiçor-pos da invenção, durante um período de tempo prolongado. Alternativamen- -te, o hidrogel pode aprisionar enzimas, microrgánismos capazes de gerarenzimas da invenção ou anticorpos da invenção e liberá-los durante um pe-ríodo de tempo definido (por exemplo, prolongado).

A invenção será ainda descrita com relação aos seguintes e-xemplos; entretanto, é para ser entendido que a invenção não está limitada atais exemplos.

EXEMPLOS

EXEMPLO 1: DESCOBERTA DE ENZIMA ENDOGLICOSIDASE BASEADAEM PLACA: PESQUISA DE EXPRESSÃO

Determinação do título da Biblioteca Lambda: Adicionar 1,0 uL de estoquede biblioteca Lambda Zap Express amplificada a 600μί de células MRF deE. coli (OD600=I ,0). Diluir o estoque de MRF com 10mM de MgSO4. Incubara mistura a 37°C por 15 minutos, então transferir a suspensão para 5 a 6 mLde NZY top ágar a 50 0C e misture gentilmente. Imediatamente derrame asolução de ágar sobre placas grades (150 mm) de meio NZY e deixe o topágar solidificar completamente (aproximadamente 30 minutos). Inverta a pla-ca. Incube a placa a 39°C por 8 a 12 horas. (O número de placas é aproxi-mado. A titulação dos fagos é determinada para dar 50.000 pfu/placa. Diluauma alíquota de fagos da biblioteca com tampão SM se necessário.)Pesquisa de substrato: Adicionar Lambda Zap Express (50.000 pfu) da bibli-oteca amplificada a 600μί de células MRF de E. coli (OD600=I ,0) e incube a37°C por 15 minutos. Enquanto a suspensão fago/célula esta incubando,adicionar 1,0 mL do substrato desejado de polissacarídeo marcado com co-rante (geralmente 1 a 2% p/v) a 5,- mL de NZY top ágar a 50°C e misturevigorosamente, (solução mantida a 50°C até necessário.) transfira a suspen-são celular para solução de substrato/top ágar e misture gentilmente. Ime-diatamente derrame a solução sobre placas grandes (150 mm) de meioNZY. Deixe o top ágar solidificar completamente (aproximadamente 30 minu-tos), e então inverta a placa. Incube a placa a 39°C por 8 a 12 horas. Obser-ve a placa quanto a áreas claras (halos) ao redor das colônias. Remova ascolônias com halos do ágar e transfira para um microtubo estéril, (uma pon-teira de pipeta com orifício largo de 200 μl funciona para remover (perfurar)o ágar contendo a colônia desejada). Ressuspenda os fagos em 500μL emtampão SM. Adicione 20μL de clorofórmio para inibir qualquer crescimentocelular adicional.

Isolamento de clones puros: Adicione 5μL de suspensão de fagos ressus-pensos a 500μL de células MRP de E. coli (OD6oo=1.0). Incube a 37°C por15 minutos. Enquanto a suspensão de fagos/célula está incubando, adicione600μL do substrato desejado de polissacarídeo marcado com corante (ge-ralmente 1 a 2% p/v) a 3,OmL de NZY top ágar a 50°C e misture vigorosa-mente. (solução mantida a 50°C até necessário.) Transfira a suspensão ce-lular para a solução de substrato/top ágar e misture gentilmente. Imediata-mente derrame a solução sobre placas pequenas (90 mm) de meio NZY edeixe o top ágar solidificar completamente (aproximadamente 30 minutos), eentão inverta a placa. Incube a placa a 39°C por 8 a 12 horas. As placas sãoobservadas quanto a uma zona clara (halo) ao redor de uma colônia única(clone puro). (Se uma única colônia não puder ser isolada, ajuste a titulaçãoe replaqueie e suspensão de fagos). Os fagos são ressupensos em 500μLde tampão SM e 20μL de clorofórmio são adicionados para inibir qualquercrescimento celular adicional.

Remoção de clone puro: Deixe a suspensão de fagos puros incubar emtemperatura ambiente por 2 a 3 horas ou durante a noite a 4°C. Adicione100μL de suspensão de fagos puros a 200μL de células MRP de E. coli(OD6Oo=I ,0). Adicione 1,0μΙ_ de fagos auxiliares ExAssist (>1 χ 106 pfu/mL;Stratagene). Incube a suspensão a 37°C por 15 minutos. Adicione 3,0 mL demeio 2 χ YT à suspensão celular. Incube a 37°C por 2 a 2,5 horas duranteagitação. Transfira o tubo para 70°C por 20 minutos. Transfira 50 a 100 μlde suspensão de fagomídeo a microtubos contendo 200μL de células Exp505 de E coli (OD60o=1 0). Incube a suspensão a 37°C por 45 minutos. Pla-queie 100 μL de suspensão celular sobre meio LBcan 50 (meio LB com cana-micina 50μg/mL). Incube a placa a 37°C por 8 a 12 horas. Observe a placaquanto a colônias. Qualquer colônia que cresça contém o fagomídeo puro.Pegue uma colônia a cultive uma pequena cultura líquida (3 a 10 mL) por 8 a12 horas. O meio de cultura é LB can 5o líquido.

Verificação de atividade: Transfira 1,0 mL de cultura líquida a um microtuboestéril. Centrifugue a 13200 rpm (16000 g's) por 1 minuto. Descarte o sobre-nadante e adicione 200μL de tampão de fosfato pH 6.2. Sonique por 5 a 10segundos sobre gelo usando uma micro ponteira. Adicione 200 μL do subs-trato apropriado, misture gentilmente e incube a 37°C por 1,5 a 2 horas. Umcontrole negativo contendo apenas tampão e substrato deve ser realizadotambém. Adicione 1,0mL de etanol absoluto (200 proof) à suspensão e mis-ture. Centrifugue a 13200 rpm por 10 minutos. Observe a cor do sobrena-dante. A quantidade de coloração pode variar, mas qualquer tubo com maiscoloração do que o controle é considerado positivo quanto a atividade. Umespectrofotômetro pode ser usado para esta etapa se assim desejado ounecessário. (Para azo-xilano, Megazyme, leia a 590nm).

RFLP de clones puros das mesmas Bibliotecas: Transfira 1,0mL de culturalíquida a um microtubo estéril. Centrifugue a 13200 rpm (16000 g*s) por 1minuto. Siga o protocolo do QIAprep spin mini kit (Qiagen) para o isolamentodo plasmídeo e use 40 μl água pura (holy water) como o tampão de eluição.Transfira 10 μL de DNA de plasmídeo a um microtubo estéril. Adicione 1,5μLde Tampão 3 (New England Biolabs), 1,5μL de solução de BSA 100X (NewEngland Biolabs) e 2,0μL de água pura. Adicione a isso 1,0μL de Not 1 e1,0μL de endonucleases de restrição Pst 1 (New England Biolabs). Incubepor 1,5 horas a 37°C. Adicione 3,Ομl. de tampão de corrida 6X (Invitrogen).Corra 15μL da amostra digerida em um gel de agarose a 1,0% por 1 a 1,5horas a 120 volts. Observe o gel com um visualizados de gel. Faça análisede seqüência em todos os clones com um padrão de digestão diferente.

A Tabela 6 descreve várias propriedades de enzimas exempla-res da invenção.

Tabela 6

<table>table see original document page 326</column></row><table><table>table see original document page 327</column></row><table><table>table see original document page 328</column></row><table> VpH ou,temperatura ótima determinada pelas taxas iniciais usando AZO-AZO-xilano como um substrato ** estabilidade térmica, tempo que a enzima manteve atividade significativa (aprox. > 50%) *** condicionamento de massa**** precursor de GSSM para evolução de tolerância térmica para aplicaçõesem ração animal

***** mutação N35D feita para aumentar a atividade em pH baixo - com baseem conhecimento publico - atividade relativa da enzima mutante em pH 4significativamenteaumentada

****** Condicionamento de massa

EXEMPLO 2: PESQUISA DE GSSM PARA MUTANTES TOLERANTES

O seguinte exemplo descreve um método exemplar para pes-quisar enzimas termicamente tolerantes.

Placas Master: Prepare placas para um coletor de colônias por marcar pla-cas de 96 cavidades e aliquote 200 μl de LB Amp100 em cada cavidade(~20ml necessários por placa de 96 cavidades). Após as placas terem retor-nado do coletor, remova o meio da coluna 6 da placa A. Substitua com umainoculação de SEQ ID NO: 189. Coloque em uma incubadora úmida a 37°Cdurante a noite.

Ensaio em Placa: Aplique as culturas .em uma placa de 96 cavidades (200μl /cavidade LB Arnp100). Remova a cobertura plástica e substitua por lacrepermeável ao gás. Coloque em uma incubadora úmida durante a noite. Re-mova o lacre e substitua a tampa de plástico. Centrifugue as culturas emuma centrífuga tabletop a 3000 rpm por 10 min. Remova o sobrenadante porinversão sobre uma toalha de papel. Aliquote 45 μl de tampão Cit-Fos-KCIpH 6 em cada cavidade. Substitua a tampa plástica por um lacre de placa dealumínio. Use um rolo para obter um bom lacre. Ressuspenda as células emum agitador de placa no nível 6 a 7 por-30 segundos.

Coloque a placa de 96 cavidades em uma incubadora a 80°Cpor 20 minutos. Não empilhar. A seguir, remova imediatamente as placaspara água gelada para resfriar por alguns minutos. Remova o lacre de alu-mínio e substitua por uma tampa de plástico. Adicione 30 μl de 2% Azo-xilano. Misture como antes em um agitador de placa. Incube a 37°C em umaincubadora úmida durante a noite.Adicione 200 μL de etanol a cada cavidade e misture por sucçãocom pipeta. Como uma alternativa para a troca de ponteiras a cada vez, en-xágüe em um banho de etanol e seque por expelir o etanol em uma toalhade papel. Centrifugue as placas a 3000 rpm por 10 minutos. Remova 100 μLde sobrenadante para uma nova placa de 96 cavidades. Leia a OD590.

EXEMPLO 3: ENSAIO DE GSSM PARA VERIFICAÇÃO DE SUCESSO DEMUTANTES TOLERANTES À TEMPERATURA

O exemplo a seguir descreve um método exemplar para testeenzimas termícamente tolerantes.

Aplique ou selecione clones em duplicata em placas de 96(200ul /cavidade LB Amp100). Remova a cobertura plástica e substitua porum lacre permeável a gás. Coloque em uma incubadora úmida durante anoite. Remova o lacre e substitua por uma tampa de plástico. Aplique os clo-nes sobre ágar sólido. Centrifugue as culturas em uma centrifuga tabletop a3000 rpm por 10 min.Remova o sobrenadante por inversão sobre uma tolhade papel. Aliquote 25 μΙ de solução de BPER/Lisozima/DNase (veja abaixo)em cada cavidade. Ressuspenda as células em um agitador de placa no ní-vel 6 a 7 por -30 segundos

Incube a placa sobre gelo por 15 minutos. Adicione 20 μl detampão Cit-Fos-KCI pH 6 em cada cavidade. Substitua a tampa de plásticopor um lacre de placa de alumínio. Use um rolo para obter um bom lacre.Misture em um agitador de placa no nível 6 a 7 por ~30segundos.

Coloque uma placa de 96 cavidades em uma incubadora a 80°Cpor 20 minutos e a outra a 37°C. Não empilhar. Remova imediatamente asplacas para água gelada para resfriar por alguns minutos (use uma bandejade plástico grande se necessário). Remova o lacre de alumínio. Adicione 30μl de 2% Azo-xilano. Lacre com um lacre permeável a gás. Misture comoantes no agitador de placas. Incube um grupo de placas de 37°C e 80°C emuma incubadora úmida a 37°C por 2 horas e outro grupo por 4 horas.

Após incubação, deixe a placa repousar por ~5 minutos emtemperatura ambiente. Adicione 200 μΙ de etanol a cada cavidade e misturepor sucção com pipeta. Ao invés de trocar as ponteiras a cada vez, enxágüeem um banho de etanol e seque por expeli-lo em uma toalha de papel. Mas,use um novo conjunto de ponteiras para cada clone. Centrifugue as placas a3000 rpm por 10 minutos. Remova 100 μL de sobrenadante a uma nova pla-ca de 96 cavidades. Leia a OD590.

Solução de BPER/Lisozima /DNase (total de 4,74 mL):4,5 mL de BPR

200 μL de Lisozima a 10 mg/mL (feita recentemente em tampãoCit-fos pH 6)

40 μL de DNase I a 5 mg/mL (feita recentemente em tampão/ Cit-fos pH 6)

EXEMPLO 4: ENSAIO DE XILANASE COM ARABINOXILANO DE TRIGOCOMO SUBSTRATO

O exemplo a seguir descreve como um ensaio de xilanase e-xemplar que pode ser usado, por exemplo, para determinar se uma enzimaestá dentro do escopo da invenção.

SEQ ID NOS: 11, 12, 69, 70, 77, 78, 113, 114, 149, 150, 159,160, Í63, 164, 167, 168, 181, 182, 197, e 198 foram submetidos à um ensaioem pH 8 (tampão de Na-fosfato) e 70°C usando arabinoxilano de trigo comoum substrato. As enzimas foram caracterizadas como descrito na Tabela 7.

Tabela 7

<table>table see original document page 331</column></row><table>

* Baseado na adição de 1 mL de água a cada amostra.Unidades são umoles de xilose liberados por minuto com baseem um ensaio redutorde açúcar.

EXEMPLO 5: GERAÇÃO DE UMA XILANASE EXEMPLAR DA INVENÇÃO

O exemplo a seguir descreve a geração de uma xilanaseexemplar da invenção usando mutagênese por tecnologia de mutagênesepor saturação do sítio do gene (GSSM), designado a variante ou mutante"9x" (o ácido nucléico descrito em SEQ ID NO:377, a seqüência depolipeptídeo descrita em SEQ ID NO:378).

GSSM foi usada para criar uma grande biblioteca de mutaçõespontuais na SEQ ID NO: 190 exemplar, xilanase "tipo selvagem" (codificadapor SEQ ID NO:189). A pesquisa de termotolerância de xilanase descritaacima identificou nove mutantes de um único sítio de aminoácido (Figura 6A)(D8F, Q11H, N12L, G17I, G60H, P64V, S65V, G68A & S79P) que melhoroua tolerância térmica em relação à enzima tipo selvagem (medida após umestímulo com calor a 80DC por 20 minutos). Enzima tipo selvagem e todosos 9 mutantes de um único sítio de aminoácido foram produzidos em E. colie purificados utilizando um sinalizador de hexahistidina N-terminal. Nãohouve diferença notável na atividade devido ào sinalizador.

A Figura 6 ilustra os nove mutantes de um único sítio deaminoácido da "variante 9x", ou, como descrito em SEQ ID NO:378(codificada por SEQ ID NO:377), geradas por Mutagênese por Saturação doSítio do Gene (GSSM) da enzima exemplar SEQ ID N0:190 "tipo selvagem"(codificada por SEQ ID NO: 189). A Figura 6A é um diagrama esquemáticoque ilustra a posição, numeração, e alteração de aminoácido para osmutantes pontuais termotolerantes de gene "tipo selvagem" (SEQ IDNO: 190, codificada por SEQ ID NO:189). Uma biblioteca de todos os 64códons foi gerada para cada posição de aminoácido no gene (-13,000mutantes) e rastreada quanto a mutações que aumentam a tolerânciatérmica. A variante "9X" foi gerada por combinar todos os 9 mutantes de sítioúnico em uma enzima. O ponto médio de transição de temperatura de fusão(Tm) determinado por Calorimetria Exploratória Diferencial (DSC) para cadaenzima mutante e a variante "9X" (SEQ ID NO:378) é mostrado à direita. AFigura 6B ilustra o desenovelamento das enzimas "tipo selvagem" (SEQ IDNO: 190) e "9X" (SEQ ID NO:378). As enzimas "variante/mutante" forammonitoradas por DSC em uma taxa de rastreamento de 1-C/min. Os dadosde DSC subtraídos do basal foram normalizados para concentração deproteína.

Medidas de DSC foram feitas usando um microcalorímetro VP-DSC (Micro-Cal) em duplicata. O volume de amostra necessário foi de 540μL. As concentrações da proteína foram entre 0,1 a 0,5 mg/mL em HEPES50mM, pH 7.2 e o tempão de diálise foi mantido para os controles basais.Cada amostra foi aquecida de 40°C a 110°C. As amostras e/ou tampãoforam aquecidos e resfriados em uma taxa de rastreamento de 90°C/h. Osvalores basais do tampão foram registrado múltiplas vezes até que o sistemaatingiu um estágio estável. O valor de Tm era a temperatura onde o calormáximo foi liberado.

Ensaios de atividade de xilanase

As atividades enzimáticas foram determinadas usando 400 DLde Azo-xilano a 2% como substrato em 550 DL de tampão CP (citrato-fosfato)m pH 6.0 nas temperaturas indicadas. As medidas de atividade comouma função de pH foram determinadas usando soluções de tampão Britton eRobinson 50 mM (pH 3.0, 5.0, 6.0, 7.0, 8.0 e 9.0) preparadas por misturarsoluções de ácido fosfórico 0,1 M, ácido bórico 0,1 M e ácido acético 0,1 Mseguido por ajuste do pH com hidróxido de sódio 1 M. As reações foram ini-ciadas por adicionar 50 DL de 0,1 mg/ml de enzima purificada. Os pontos detempo foram tirados de 0 a 15 minutos onde 50 DL da mistura de reaçãoforam adicionados a 200 DL de solução de precipitação (etanol 100%).Quando todos os pontos de tempo foram tomados, as amostras foram mistu-radas, incubadas por 10 minutos e centrifugadas a 3000 g por 10 minutos a49C. O sobrenadante (150 DL) foi aliquotado em uma nova placa de 96 cavi-dades e a absorbância foi medida a 590 nm. Os valores de A590 foram pio-tados contra o tempo e a taxa inicial foi determinada a partir da inclinação dalinha.

Calorimetria Exploratória Diferencial ÍDSC).

A calorimetria foi realizada usando um equipamento de DSCModelo 6100 Nano Il (Calorimetry Sciences Corporation, American Fork, UT)usando o pacote de programas DSCRun para aquisição dos dados, CpCaIcpara análise, CpConvert para conversão em capacidade calorífica molar demicrowatts e CpDeconvoIute para deconvolução. Análise foi realizada com1 mg/ml de proteína recombinante em fosfato de potássio 20 mM (pH 7.0) eKCl 100 mM em uma taxa de rastreamento de 1sC/min. Uma pressãoconstante de 5 atm foi mantida durante os experimentos de DSC para evitarpossível degaseificação da solução no aquecimento, as linhas basaisinstrumentais foram registrados rotineiramente antes dos experimentos comambas as células cheias com tampão. A reversibilidade das transiçõesinduzidas termicamente foi testada por reaquecer a solução na célula docalorímetro imediatamente após resfriar a primeira corrida.Determinação de tolerância térmica

Todas as enzimas foram analisadas quanto a tolerância térmicaa 80°C em fosfato de potássio 20 mM (pH 7.0) e KCI 100 mM. As enzimasforam aquecidas a 80°C por 0, 5, 10 oü 30 minutos em tubos de parede finae foram resfriadas em gelo. As atividades residuais foram determinadas comAzo-xilano como substrato usando o ensaio descrito acima para medida deatividade.

Análise da impressão digital de polissacarídeo

As impressões digitais dos polissacarídeos foram determinadaspor análise do polissacarídeo usando eletroforese em gel de carboidrato(PACE). Xilano (beechwood) (0,1 mg/ml_, 100 DL, Sigma, Poole, Dorset, UK)ou xilooligosacarídeos (1 mM, 20 DL, Megazyme, Wicklow, Irlanda) foramtratados com enzima (1 a 3 Dg) em um volume total de 250 DL por 16 horas.A reação foi tamponada em acetato de amônio 0,1 M pH 5.5. Os controlessem substratos ou enzimas foram realizados sob as mesmas condições paraidentificar qualquer composto inespecífico nas enzimas,polissacarídeos/oligossacarídeos ou reagentes de marcação. As reaçõesforam paralisadas por aquecer por 20 min. Os ensaios foram realizados deforma independente pelo menos 2 vezes para cada condição. Derivatizaçãousando ANTS (ácido 8-aminonaftaleno-1,3,6-trissulfônico, Molecular Probes,Leiden, Holanda), eletroforese e aquisição de imagem foram feitos comodescrito (Goubet, F., Jackson, P., Deery, M. & Dupree, P. (2002) Anal.Biochem. 300, 53-68).

Cálculo de aptidão

A aptidão (fitness (Fn)), para uma dada variante de enzima, n,I foi calculada por avaliar igualmente um aumento no ponto médio detransição da temperatura (Tm) de desnaturação e aumento (ou diminuição)na atividade enzimática com relação à maior diferença em cada parâmetropara todas as variantes: Fn = FTn + FVn, onde FTn = Tm fator de aptidão davariante e FVn = fator de aptidão de atividade da variante. Os fatores deaptidão para cada (Tm e atividade) são relativas à maior diferença na Tm outaxa entre todas as variantes. FTn = (Tm - TmL) / (TmH - TmL) onde Tmn éTm para a dada variante, n, e TmL é a menor Tm entre todas as variantes eTmH é a maior Tm entre todas as variantes e FVn = (Vn - VL) / (VH - VL)onde Vn é a taxa relativa para a dada variante, n, e VL é a menor taxa entretodas as variantes e VH é a maior taxa entre todas as variantes.Evolução pelo método de GSSM

A tecnologia de GSSM foi usada para criar uma bibliotecaabrangente de mutações pontuais na xilanase exemplar da invenção SEQ IDNO: 190 (codificada por SEQ ID NO:189); incluindo a xilanase exemplar dainvenção SEQ ID NO:378 (codificada por SEQ ID NO:377). O rastreamentode termotolerância de xilanase descrito cima identificou nove mutantes deúnico sítio de aminoácido (Figura 6A), D8F, Q11H, N12L, G17I, G60H,P64V, S65V, G68A & S79P, que tiveram tolerância térmica melhorada emrelação à enzima "tipo selvagem" exemplar SEQ ID NO: 190 (codificada porSEQ ID NÓ: 189), como medido após estímulo com calor a 80DC por 20minutos. A enzima tipo selvagem e todos os nove mutantes de único sítio deaminoácido foram produzidos em E. coli e purificados utilizando umsinalizador de hexahistidina N-terminal. Não houve diferença notável naatividade devido ào sinalizador.

Para determinar o efeito de mutações de um único aminoácidosobre a atividade enzimática, todos os nove mutantes foram purificados esua atividade de xilanase (taxas iniciais na temperatura ótima da tiposelvagem, 70DC) foi comparada com aquela da enzima "tipo selvagem"exemplar SEQ ID NO: 190. As atividades enzimáticas foram comparáveis àtipo selvagem (taxa inicial normalizada para 1,0) para os mutantes D8F,N12L, G171, G60H, P64V, S65V G68A e S79P (taxas iniciais relativas 0,65,0,68, 0,76, 1,1, 1,0, 1,2, 0,98 e 0,84 respectivamente) confirmando queessas mutações não alteram significativamente a atividade enzimática. Astaxas iniciais foram medidas 3 ou mais vezes e a variância foi menor do que10%. Ao contrário desses oito mutantes, uma redução notável na atividadeenzimática foi observada para o melhor tolerante térmico, o mutante de sítioúnico, Q11H (taxa inicial relativa de 0,35).

Temperatura de fusão (Tm) das enzimas "tipo selvagem" e mutantes de sítioúnico de aminoácido termotolerante.

A xilanase "tipo selvagem" SEQ ID NO: 190 purificada e os novemutantes de sítio único de aminoácido tolerantes à temperatura foramanalisados usando calorimetria exploratória diferencial (DSC). Agregação foivisível na enzima tipo selvagem como evidenciado por uma saliência notraço de DSC para sua desnaturação térmica, veja a figura 6B. As enzimasmutantes evoluídas não mostraram indícios de agregação. Para todas asenzimas, a desnaturação induzida termicamente foi irreversível e nenhumatransição discernível foi observada em uma segunda pesquisa da amostra.Devido à irreversibilidade da desnaturação, apenas a Tm aparente(temperatura de fusão) pôde ser calculada (como descrito, por exemplo, porSanchez-Ruiz (1992) Biophys. J. 61:921-935; Beldarrain (2000) Biotechnol.Appl Biochem. 31:77-84). A Tm da enzima tipo selvagem foi de 619Cenquanto que as Tm's de todos os mutantes pontuais foram aumentadas evariaram de 64SC a 709C (Figura 6A). A mutação Q11H introduziu o maioraumento (Tm = 70°C) sobre a tipo selvagem, seguida por P64V (69°C), G171(67°C) and D8F (67°C).

A enzima de GSSM combinada exemplar "9X" SEQID NO:378

A "9X" enzima (SEQ ID NO:378) foi construída por combinar asalterações em único-sítio das nove mutantes tolerantes térmicas pormutagênese sítio direcionada (Figura 6A). A enzima "9X" (SEQ ID NO:378)foi expressa em E. coli e purificada para homogeneidade. DSC foi realizadapara determinar a temperatura de fusão. A Tm da enzima "9X" foi 34 grausmaior do que a de SEQ ID NO: 190, a enzima "tipo selvagem", demonstrandouma dramática alteração na sua estabilidade térmica (Figura 6B).

Para avaliar o efeito das mutações combinadas e elevadatemperatura de fusão sobre as propriedades bioquímicas da enzima, osperfis de pH e temperatura foram construídos e comparados a SEQ IDNO: 190, a enzima "tipo selvagem". A figura 7 ilustra a dependência do pH daatividade das enzimas tipo selvagem e mutante 9X evoluída. A atividade dexilanase foi medida a 37eC em cada pH e a velocidade inicial foi plotadacontra a absorbância a 590 nm para determinar as taxas iniciais. A Figura 7Bilustra a dependência da temperatura da atividade das enzimas tiposelvagem e mutante 9X evoluída. As temperaturas ótimas das enzimas tiposelvagem e mutante 9X foram medidas ao longo de uma faixa detemperatura de 25 a IOO9C e pH 6.0 e são baseadas nas taxas iniciaismedidas por 5 minutos. A figura 7C ilustra a estabilidade térmica dasenzimas tipo selvagem e mutante 9X evoluída. A dependência térmica daatividade das enzimas tipo selvagem e mutante 9X evoluída foi medida porprimeiro aquecer as ènzimas em cada uma das temperaturas indicadas por5 minutos, seguido por resfriar para temperatura ambiente e medir aatividade residual (taxa inicial a 37eC, pH 6.0). para todos os experimentos,as taxas iniciais foram medidas 2 ou mais vezes e a variação foi menor doque 10%.As enzimas SEQ ID N0:190 e SEQ ID NO:378 (o mutante "9X")tiveram perfis de atividade/pH comparáveis com a maior atividade entre pH 5e 6 (Figura 7A). Ambas as enzimas tiveram taxa inicial/temperatura ótimassimilares a 70°C, entretanto, SEQ ID NO: 190, a enzima "tipo selvagem" tevemaior atividade em temperaturas mais baixas (25 a 50°C) enquanto queSEQ ID NO:378 (o mutante "9X") reteve mais do que 60% da sua atividadeaté 100°C (determinado pela taxa inicial) na presença de substrato (Figura7B). A atividade de SEQ ID N0:190, a enzima "tipo selvagem" não foidetectável em temperaturas acima de 70°C.

Para determinar o efeito das 9 mutações combinadas sobre atolerância térmica da enzima, a atividade residual foi medida e comparada aSEQ ID N0:190, a enzima "tipo selvagem". A atividade residual foideterminada por um estímulo com calor por 5 minutos em cada temperatura(37, 50, 60, 70, 80 e 90°C) seguido por medidas de atividade a 37°C. SEQ15 ID NO: 190 foi completamente inativada acima de 70°C, enquanto a mutante9X evoluída apresentou atividade significativa após aquecimento a 70, 80 eaté mesmo 90°C (Figura 7C). Além disso, embora a atividade da enzima tiposelvagem tenha diminuído com a temperatura aumentada, a variante 9X foiatividade em alguma extensão pelo aquecimento em temperaturas de até60°C.

Geração de variantes combinatórias de GSSM usando tecnologiaGeneReassembIv

Para identificar variantes combinatórias dos 9 mutantes de únicosítio de aminoácido com a maior tolerância térmica e atividades emcomparação com SEQ ID NO:378 (a variante "9X") construída por adição,uma biblioteca de GeneReassembIy (Patente U.S. N°. 6.537.776) de todasas combinações mutantes possíveis (29) foi construída e rastreada. Usandoa tolerância térmica como critério de rastreamento, 22 combinações únicasdas nove mutações foram identificadas como foi a variante 9X original. Umrastreamento secundário foi realizado para selecionar variantes com maioratividade/expressão do que 9X evoluída. Esse rastreamento produziu 10variantes com seqüências possuindo entre 6 e 8 das mutações de único sítiooriginais em várias combinações, como ilustrado na Figura 8A. A Figura 8ilustra as variantes combinatórias identificadas usando tecnologiaGeneReassembIy. A Figura 8A ilustra a biblioteca de GeneReassembIy detodas a combinações possíveis das 9 mutações pontuais de GSSM que foiconstruída e rastreada por variantes com tolerância térmica a atividademelhoradas. Onze variantes incluindo a variante 9X foram obtidas. Comomostrado na figura, as variantes possuíam 6, 7, 8, ou 9 das mutaçõespontuais ma várias combinações. O ponto médio transição de temperaturade fusão (Tm) correspondente determinado por DSC de cada variante émostrado à direita. A Figura 8B ilustra a atividade relativa (taxa inicial medidapor período de tempo de 5 minutos) das variantes 6X-2 e 9X emcomparação a tipo selvagem na temperatura ótima (70°C) e pH 6.0. asbarras de erro mostram a variação na taxa inicial para as 3 medições.

A temperatura de fusão (Tm) de cada uma das variantescombinatórias foi pelo menos 28QC maior do que o tipo selvagem (Figura 8A)e todas as variantes de reagrupamento apresentaram atividade relativamaior do que a enzima 9X. A atividade de uma variante em particular, 6X-2,foi maior do que a da enzima tipo selvagem e significativamente melhor(1,7X) do que a da enzima 9X (Figura 8B). Comparação de seqüência dasvariantes de reagrupamento identificou pelo menos 6 mutações que eramnecessárias para a termoestabilidade aumentada (>20 graus). Todas as 33variantes únicas encontradas no rastreamento de termoestabilidade inicialcontinham ambas as mutações Q11H e G17I demonstrando sua importânciapara tolerância térmica.

Análise das impressões digitais do produto polissacarídico tioo selvagem evariante

Os produtos gerados pelas variantes "tipo selvagem", 6X-2 e 9Xforam comparados por análise dè polissacarídeo usando eletroforese em gelde carboidrato (PACE); diferentes substratos (oligossacarídeos epolissácarídeos) foram testados por hidrólise por xilanases. Os produtos dedigestão das 3 xilanases testadas foram muito similares, como ilustrado naFigura 9. Toda as três enzimas hidrolisaram (Xyl)6 e (Xyl)5, principalmenteem (Xyl)3 e (Xyl)2; e (Xyl)4 foi hidrolisada para (Xy!)2 (Figura 9A). Apenasuma pequena quantidade de hidrólise de (Xyl)3 em (Xyl)2 e Xyl foiobservada indicando que (Xyl)3 é um substrato relativamente pobre para aenzima. Nenhuma atividade foi detectada sobre (Xyl)2- Xilano de madeira defaia (beechwood), que contém resíduos de glicuronosila, foi hidrolisada portodas as três enzimas principalmente em (Xyl)2 e (Xyl)3, mas outras bandasque migraram entre as bandas de oligoxilano foram detectadas (Figura 9B).Na análise de PACE, cada oligossacarídeo tece uma migração específicadependendo da composição de açúcar e grau de polimerização (Goubet, F.,Jackson, P., Deery, M. and Dupree, P. (2002) Anal. Biochem. 300, 53-68),dessa forma, essas bandas provavelmente correspondem aoligoglicuronoxilanos. Portanto, as enzimas envolvidas retiveram aespecificidade de substrato da enzima "tipo selvagem".

Como observado acima, a Figura 9 ilustra as impressões digitaisdo produto de SEQ ID N0:190 "tipo selvagem" (codificada por SEQ IDNO:189), enzima variante 6X-2 (SEQ ID N0:380, codificada por SEQ IDNO:379) e SEQ ID NO:378 (o mutante "9X"), como determinado por PACE.A Figura 9A ilustra as impressões digitais obtidas após hidrólise deoligoxilanos (Xyl)3, (Xyl)4, (Xyl)5 e (Xyl)6 por enzimas "selvagens" evariantes. As raias de controle contêm oligossacarídeo incubado sob ascondições de ensaio na ausência de enzima. A figura 9B ilustra asimpressões digitais obtidas após hidrólise de xilano de madeira de faia(beechwood) pelas enzimas selvagens e variantes. Os padrões continham(Xyl)2, (Xyl)3, (Xyl)4. Todos os testes foram realizados a 37DC e pH 5.5.

Uma combinação de estratégias de evolução de genelaboratoriais foi usada para gerar rapidamente uma xilanase altamente ativa,termoestável otimizada para compatibilidade de processo em váriasaplicações do mercado industrial. A metodologia de GSSM foi empregadapara pesquisar a seqüência completa da xilanase exemplar "tipo selvagem"SEQ ID NO: 190 (codificada por SEQ ID NO: 189) e para identificar 9mutações pontuais que melhoram sua tolerância térmica. Embora ela nãotenha efeito discernível sobre o perfil de produtos de hidrólise da enzima,como ilustrado na Figura 9, a adição das 9 mutações à seqüência deproteína resultou em uma redução moderada na atividade enzimáticaespecífica na temperatura ótima da SEQ ID NO: 190 (a "tipo selvagem"),70DC, veja Figura 9B. Usando o método de GeneReassembIy para geraruma biblioteca combinatória de 9 mutantes de único sítio de aminoácido,essa redução na atividade foi superada. As variantes termoestáveis (Tm'sentre 89°C e 94°C) com atividade melhor do que a variante "9X" foramobtidas a partir do rastreamento da biblioteca de GeneReassembIy. Comuma Tm de 90°C, atividade enzimática específica superior à tipo selvagem euma impressão digital de produto inalterada e comparável à SEQ ID N0:190(a "tipo selvagem"), a variante 6X-2 (SEQ ID N0:380, codificada por SEQ IDNO:379) é particularmente notável. Pelo que sabemos, a alteração Tmobtida para essas variantes é o maior aumento relatado da aplicação detecnologias de evolução direcionada.

SEQ ID N0:380 (a 6X-2 variante) inclui as seguintes alterações,quando comparada com SEQ ID N0:190 (a "tipo selvagem"): D8F, Q11H,G17I, G60H, S65V e G68A. SEQ ID NO:379 inclui as seguintes alteraçõesde nucleotídeo, quando comparado com a "tipo selvagem" SEQ ID NO:189:os nucleotídeos nas posições 22 a 24 são TTC, os nucleotídeos nasposições 31 a 33 são CAC, os nucleotídeos nas posições 49 a 51 são ATA,os nucleotídeos nas posições 178 a 180 são CAC, os nucleotídeos nasposições 193 a 195 são GTG, os nucleotídeos nas posições 202 a 204 sãoGCT.

A fim de medir a eficácia de mistura combinatória versus adiçãodas mutações pontuais ao fenótipo desejado, um parâmetro de aptidão quecombina atribuições tanto das alterações na atividade enzimática comotermoestabilidade foi calculado para cada mutante. O termo aptidão, descritoaqui, náo é uma medida objetiva que pode ser empregada a outras enzimas,mas ao invés disso, é um termo que permite a medida do sucesso daevolução dirigida dessa xilanase particular. Já que aptidão de enzimas, F, écalculada por avaliar igualmente alterações na Tm e atividade enzimáticapara esse grupo de variantes, o valor de aptidão máximo possível é 2 (FT £1e FV <1, veja acima). Em outras palavras, se a variante com a melhoratividade também tivesse a maior Tm, seu valor de aptidão seria 2. Com umvalor de aptidão próximo de 2 (veja Fig. 10B), a variante 6X-2 (SEQ IDN0:380, codificada por SEQ ID NO:379) é a mais próxima de possuir amelhor combinação possível de estabilidade térmica e atividade enzimática.A mutação de único sítio que confere maior valor de aptidão é S65V.Embora a Tm do mutante S65V seja menor do que aquela do mutante Q11H(66DC versus 70DC respectivamente), ele tem um valor de aptidão maior jáque sua atividade específica não é reduzida em relação a da tipo selvagem.

Figura 10A é um diagrama esquemático ilustrando o nível demelhora da estabilidade térmica (representado por Tm) sobre "tiposelvagem" obtido por evolução de GSSM. O mutante de único sítio deaminoácido e a variante combinatória com a maior estabilidade térmica(Q11H e "9X" (SEQ ID NO:378), respectivamente) são mostrados emcomparação com a tipo selvagem. Figura 10B ilustra um "diagrama deaptidão" da melhora da enzima obtida por combinar as tecnologias de GSSMe GeneReassembIy. A aptidão foi determinada usando a fórmula F = FT +FV onde aptidão (F) é calculada por avaliar igualmente a aptidão detolerância térmica (FT) e aptidão de tolerância relativa (FV) como descritoacima. A mutação pontual que confere a maior aptidão é mostrada (S65V).Combinar as 9 mutações pontuais também melhorou a aptidão (SEQ IDNO:378, a variante "9X"). Entretanto, a maior melhora na aptidão foi obtidapor combinar os métodos de GSSM e GeneReassembIy para obter â melhorvariante, 6X-2 (SEQ ID N0:380),

O método de GeneReassembIy também permitiu a identificaçãode resíduos importantes que parecem ser absolutamente necessários paraestabilidade térmica melhorada. Dois resíduos chave Q11H E G17I, estavampresentes em cada variante de GeneReassembIy identificada com base natolerância térmica (veja Figura 6A). os determinantes estruturais paraestabilidade térmica de proteína foram estudados e várias teorias foramdocumentadas, por exemplo, por Kinjo (2001) Eur. Biophys. J. 30:378-384;

Britton (1999) J. Mol. Biol. 293:1121-1132; Ladenstein (1998) Adv. Biochem.Eng. Biotechnol. 61:37-85; Britton (1995) Eur. J. Biochem. 229:688-695;Tanner (1996) Biochemistry 35:2597-2609; Vetriani (1998) Proc. Natl. Acad.Sei. USA 95:2300-2305. Padrões de ligação de hidrogênio, interaçõesiônicas, empacotamento hidrofóbico, e comprimento reduzido de alças desuperfície estão entre os fatores chave mesmo que a contribuição de cadaum pra a estabilidade da proteína não seja completamente compreendida.Dado que a maioria das substituições pontuais benéficas identificadas apartir do teste de todas as substituições possíveis de um único aminoácidoenvolveu a substituição de resíduos relativamente polares, carregados oupequenos (glicina) por resíduos hidrofóbicos muito maiores, pode ser inferidoque as interações hidrofóbicas desempenham o papel mais significativo emaumentar a termoestabilidade dessa proteína. Mesmo com um bomconhecimento das interações ótimas para aumentar a tolerância térmica, aprevisão de onde fazer as mutações que introduzem tais interações não éóbvia. Uma abordagem não racional usando o método de GSSM, entretanto,permite rápida amostragem de todas as cadeias laterais em todas asposições dentro da estrutura de uma proteína. Tal abordagem leva àdescoberta de substituições de aminoácido que introduzem interaçõesfuncionais que poderiam não ter sido previstas.

EXEMPLO 6: PRÉ-TRATAMENTO DE POLPA DE PAPEL COMXILANASES DA INVENÇÃO

Em um aspecto, xilanases da invenção são usadas paratratar/pré-tratar polpa de papel ou papel reciclado ou polpa de papel esemelhantes. Em um aspecto, enzima(s) da invenção é(são) usadas paraaumentar a "alvura" do papel através de seu uso no tratamento/pré-tratamento de polpa de papel ou papel reciclado ou polpa de papel esemelhantes.

Em um aspecto, xilanases da invenção são usadas paratratar/pré-tratar polpa de papel ou papel reciclado ou polpa de papel esemelhantes para reduzir o número Kappa. O número Kappa é definidocomo um valor numérico que indica o conteúdo relativo de Iignina do papel -quanto maior o número Kappa, maior o conteúdo de lignina. Foi observadonesses testes de moagem uma redução consistente de 1 a 2 pontos nonúmero Kappa com xilanases dessa invenção, por exemplo, com SEQ IDNO:381/382 (isto é, usando a enzima que tem a SEQ ID NO:382, codificada1 por exemplo, por SEQ ID NO: 381) e tratamento com SEQ ID NO:481/482.Em alguns aspectos, essa redução no número Kappa traz benefícios quandose trata polpa não alvejada (número kappa 70 a 90), quando então é usadapara, por exemplo, processamento, tal como na produção de papelão. Emalguns aspectos, uma redução em Kappa ao longo do estágio X permite ouso menor de alcalinos no cozimento ou cozimento para um número dekappa alvo mais elevado. Em alguns aspectos, isso resulta em maiorresistência da polpa, menor refinamento das máquinas e maior velocidadedas máquinas. Em alguns aspectos, tais resultados são vistos usandoaditivos de digestão (tensoativos) em moinhos de papelão de revestimento;isso pode permitir melhor penetração de líquido e permitir um menorcarregamento de alcalinos eficaz levando a maior resistência da polpa,menor refinamento e um aumento de 200 fpm (pés por minuto) navelocidade da máquina.

Esse exemplo descreve um protocolo rotineiro de rastreamentoexemplar para determinar se uma xilanase é útil para pré-tratar polpa depapel; por exemplo, na redução do uso de químicos branqueadores (porexemplo, dióxido de cloro, CIO2) quando usados para pré-tratar polpa depapel Kraft.

O protocolo de rastreamento tem dois parâmetros de testealternativos: Impacto de tratamento com xilanase após uma etapa dedeslignificação com oxigênio (polpa pós- O2); e impacto de xilanase em umprocesso que não inclui deslignificação com oxigênio (polpa marrom pré-O2).

A invenção fornece condições de tratamento de polpa ou papelque simulam condições de processamento em situações industriais, porexemplo, fábricas: por exemplo, pH de cerca de 8.0; 70SC; 60 minutos deduração. Por exemplo, um processo exemplar da invenção está descritoesquematicamente no fluxograma da Figura 11; veja também a Figura 14.Entretanto, as condições de um processo do método da invenção podem serajustadas para qualquer temperatura, tempo de duração e/ou pH,dependendo da(s) enzima(s) exemplar(es) da invenção usada(s) e doobjetivo do processo; por exemplo, existe uma variedade de meios deajustar o pH em vários processamentos de polpa e papel da invenção:adicionar ácido e/ou base:

Ácido clorídrico (HCI)

Hidróxido de sódio (NaOH)

H2SO4 (ácido sulfúrico)

NaHSO4 (hidrogenossulfato de sódio)

H2SO3 (ácido sulfuroso)

H3P04 (ácido fosfórico)

HF (ácido fluorídrico)

CH3C02H (ácido acéticó)

H2CO3 (ácido carbônico)

H2S (sulfeto de hidrogênio)

NaH2PO4 (diidrogenofosfato de sódio)

NH4CI (cloreto de amônio)

HCN (ácido hidrociânico)

Na2SO4 (sulfato de sódio)

NaCl (cloreto de sódio)

NaCH3CO2 (acetato de sódio)

NaHCO3 (bicarbonato de sódio)Na2HPO4 (hidrogenofosfato de sódio)

Na2SO3 (sulfeto de sódio)

NaCN (cianeto de sódio)

NH3 (amônia aquosa)

Na2CO3 (carbonato de sódio)

Na3P04 (fosfato de sódio)

borbulhamento em gás, por exemplo CO2 (que forma um ácidocom água quando dissolvido)

Vinte xilanases foram identificadas em testes bioquímicos queestavam ativos sob essas condições. Das 20 xilanases, 6 foram capazes dereduzir significativamente a demanda de CIO2 quando elas foram usadaspara preparar polpa Kraft antes dela ser alvejada quimicamente. As seis são:SEQ ID NO: 182 (codificada por SEQ ID NO: 181); SEQ ID NO: 160(codificada por SEQ ID NO: 159); SEQ ID NO: 198 (codificada por SEQ IDNO:197); SEQ ID NO:168 (codificada por SEQ ID NO:167); SEQ ID NO:216(codificada por SEQ ID NO:215); SEQ ID N0:260 (codificada por SEQ IDNO:259). Outras mostraram alguma atividade, mas não foram tão boas. Asxilanases SEQ ID NO: 182 (codificada por SEQ ID NO:181) e SEQ IDNO: 160 (codificada por SEQ ID NO: 159) são modulares e contêm ummódulo de ligação de carboidrato além do domínio catalítico de xilanase. Foidemonstrado que derivados truncados dessas 2 xilanases contendo apenaso domínio catalítico são mais eficazes nessa aplicação. A melhor xilanase,SEQ ID N0:160 (codificada por SEQ ID NO:159) foi estudada maiscompletamente. Os resultados podem ser resumidos como segue:

- pré-tratamento de polpa spruce/pinho/abeto (SPF) pós-02 com2 unidades/g de SEQ ID N0:160 (codificada por SEQ ID NO:159) reduz em22% o uso subseqüente de CIO2 para obter 65% de alvura GE;

- pré-tratamento de polpa marrom SPF pré-02 com 0,5unidades/g de SEQ ID N0:160 (codificada por SEQ ID NO:159) reduz em13% o uso subseqüente de CIO2 para obter 65% de alvura GE;- pré-tratamento de polpa Aspen pré-02 com 0,5 unidades/g deSEQ ID NO: 160 (codificada por SEQ ID NO:159) reduz em pelo menos 22%o uso de CIO2;

- pré-tratamento de polpa de Douglas Fir/Hemlock pré-02 com0,5 unidades/g de SEQ ID N0:160 (codificada por SEQ ID NO:159) reduz ouso de CIO2 em pelo menos 22%;

- sob as condições de tratamento empregadas, a redução norendimento do tratamento de xilanase não excedeu 0,5% quando comparadocom polpa que havia sido alvejada no mesmo fator kappa, mas não tratadacom xilanase;

- as condições ótimas para tratar polpa SPF pós-02 com SEQ IDN0S:159, 160 foram: pH 6-7, dose de enzima 0,3 unidades/g, tempo detratamento 20 a 25 min. Sob essas condições, uma redução no uso de CIO2de 28% foi possível para atingir 69% de alvura GE.

Em experimentos adicionais:SEQ ID N0:160 (XYLA)1 codificada por SEQ ID NO: 159 =xilanase tipo selvagem de extensão completa:

• XYLA (E.c) = variante truncada de SEQ ID NOS: 159, 160 contendoapenas o domínio catalítico da xilanase expressa em E.coli

· XYLA (P.f) = idem, mas expressa em P. fluorescensSEQ ID NO:182 (codificada por SEQ ID NO: 181) = segunda xilanase tiposelvagem de extensão completa:

• XYLB (E.c) = variante truncada etc, etc expressa in E.coli

• XYLB (P.f) = idem, mas expressa em P. fluorescensDados de Resposta de Dose para Utilização de Xilanases em Polpa MarromPré-Og

Condições para o estágio de xilanase (EstáqioOO como seque:

pH: 8

Temperatura: 70°C

Tempo: 60 min

Fator Kappa: 0,24Para controle sem enzima, o fator kappa foi de 0,30

Os resultados mostraram um aumento dependente da dose naalvura para amostras tratadas com xilanase em uma carga de dióxido decloro baixa (CIO2) (Kf 0.24 vs Kf 0.30).

Em cada caso, o derivado truncado pareceu ser mais eficaz doque a xilanase de extensão completa. A dose de xilanase ótima pareceu serem torno de 0,6 a 0,7 U/g de polpa.

Pré-tratamento de Polpa Marrom Intercontinental Pré-O? com as 4 melhoresXilanases

Determinação de resposta com dose de CIO2 em D0

Desenho Experimental

• Polpa marrom pré-02 Brownstock

o Kappa inicial: 31,5

• Condições do estágio X

o Quantidade de xilanase: 0,7 U/gm

o Temperatura: 70°C

o pH: 8

o Tempo de tratamento: 1 hr

o Consistência da polpa: 10%

· Seqüência de alvejante XDEp

o Fator Kappa 0,22; 0,26 e 0,30 (%D na polpa: 2,63; 3,12 e 3,60)

Alvura final após seqüência de alveiante estáaio-3 versus fator kappa(quantidade de CIO?):

• XYLB - Em alvura final de 61,5, estágio-X permite redução no uso deCIO2 de 3,89 kg/ton. de polpa.

• XYLB (E.c) - Em alvura final de 61,5, estágio-X permite redução daquantidade de CIO2 de 4,07 kg/ton de polpa.

• XYLA - Em alvura final de 61,5, estágio-X permite redução no uso deCIO2 de 4,07 kg/ton polpa.

Economia de CIO2

· XYLA (E.c) - Em alvur em D0 (kg/ton OD) *gio-X permite redução nouso de CIO2 de 4,90 kg/ton polpa.<table>table see original document page 349</column></row><table>

Determinação de resposta em dose de CIO? em Dn:

Xilanase 0,7 U/g, pH 8.0, 70 sC, 1 hr

Polpa: Polpa marrom pré -02, kappa inicial 31,5

Percentual de economia de CIO2 tem pouco significado naindustria,. Sua preocupação primária são Ibs de CIO2 economizadas do queuma redução percentual total menor para atingir a alvura alvo.Relação entre alvura, rendimento e fator kappa para polpa de controlealvejada:

Os resultados mostraram que alvejante com doses aumentadasde CIO2 para atingir a maior alvura alvo resulta em perda no rendimento dapolpa. Este é um problema porque a polpa neste estágio do processo temum valor de quase $400 por tonelada e perda de celulose significa gasto dedinheiro.

Um benefício da xilanase (por exemplo, uma xilanase dainvenção) é que o uso de uma dose menor de CIO2 pode reduzir as perdasno rendimento contanto que a ação da xilanase em si não cancele o ganho.Dados de resposta com a dose para o pré-tratamento de polpa marrom pré-0£ com xilanase XYLB (P.f):

Desenho experimental

• Polpa marrom do Norte Pré-02

- Kappa inicial 28,0

- consistência inicial 32,46%

- alvura inicial 28,37

· Condições do estágio X

- quantidade de xilanase 0 a 2,70 U/gm

-Temperatura 580C a 61 oc-pH 8.2 a 8.5

- Tempo de tratamento 1 hr

• seqüência de alvejante XDEp

- fator Kappa 0,24

· Economia de CIO2 calculada para fatores Kappa entre 0,24 e 0,30

O propósito desse experimento foi avaliar a melhor das 4xilanases sobre polpa marrom SPF não lavada. Os resultados mostraramaumentos dose-dependentes na alvura final para polpa tratada com XYLB(E.c), com a alvura obtida na presença de xilanase em um Kf menor de 0,24,aproximando-se da alvura obtida em um Kf maior de 0,30 assintoticamente.

Relação entre dose de xilanase XYLB (E.c) e economia de dióxido de cloro(polpa marrom pré-Og):

A dose ótima de xilanase está entre 0,5 e 0,9 U/gmA dose ótima se encontra na faixa de 0,5 a 0,9 U/g. Acima dessadose há uma diminuição de retorno por adição de unidade de xilanase.Reduções na dose de dióxido de cloro por tonelada de polpa tratada dessamagnitude são comercialmente significativos.

<table>table see original document page 350</column></row><table>

Procedimento de biobranaueameto em três estágios

A invenção fornece um procedimento de bioalvejamento em trêsestágios, e em um aspecto, esse processo compreende pelo menos umaenzima da invenção. Esse procedimento de bioalvejamento em três estágiosexemplar foi desenvolvido para simular rigorosamente as operações dealvejante reais em uma fábrica de alvejante de polpa de celulose (veja(figura 11). Essa seqüência de alvejante é designada por (X)DoEp, na qual Xrepresenta o estágio de tratamento com xilanase, D para estádio dealvejante com dióxido de cloro, e Εβ para estágio de extração de peróxidoalcalino. O material bruto primário usado em nossos testes de aplicação foiPolpa Marrom Kraft de Madeira Mole do Sul (sem deslignificação poroxigênio).

Os candidatos de xilanase mais eficazes (enzimas da invenção)que mostraram alto potencial de redução de químico de alvejante nosensaios de bioalvejamento também foram testados em duas espécies depolpa Kraft de madeira dura (bordo e aspen). Após o término de cada ciclode bioalvejamento, a polpa resultante foi usada para produzir folhas de papelde acordo com as normas técnicas de TAPPI (Technical Association of Pulpand Paper Industries, a associação técnica para a indústria de polpa, papel econversão mundial). 0% de alvura GE de cada folha de papel foi medido, eos valores da alvura foram usados como um indício do quão bem cadaenzima agiu sobre a polpa durante o estágio de pré-tratamento enzimático(X).

Resultados:

Dentre aproximadamente 110 xilanases que foram testadasusando a seqüência de bioalvejamento (X)DoEp, 4 enzimas, isto é, XYLA(P.f); XYLB (P.f); SEQ ID N0216 (codificada por SEQ ID NO:215); SEQ IDNO: 176 (codificada por SEQ ID NO: 175) mostraram o melhor potencial parareduzir o uso de químicos branqueadores. Embora XYLA (P.f) e XYLB (P.f)tenham exibido desempenho igualmente alto (melhores dentre as quatroenzimas com bom desempenho), XYLA (P.f) mostrou uma melhor tolerânciaao pH do que XYLB (P.f). Os resultados podem ser resumidos como segue:

• É possível atingir uma alvura da folha de papel de 60 (GE%)usando uma seqüência de alvejante em três estágios [(X)DoEp] que envolvepré-tratamento de Polpa Marrom de Madeira Mole do Sul com as quatroenzimas a seguir nas seguintes quantidades listadas abaixo (pH=8, 65 0C e30 1 h):

o XYLA (P.f) a 0,55 U/g de polpaο XYLB (P.f) a 0,75 U/g de polpa

o SEQ ID NOS:215, 216 a 1,80 U/g de polpa

o SEQ ID NOS:175, 176 a 1,98 U/g de polpa

• Pré-tratamento de Polpa Marrom Kraft de Madeira Mole do Sulcom 2 U/g de polpa de XYLA (P.f) reduz o uso de CIO2 em 18,7% paraatingir uma% de alvura GE final de 61.

• XYLA (P.f) exibe boa tolerância em pH mais elevado e fornecemais do que 14% de economia de reagentes químicos quando o estágio depré-tratamento enzimático é executado em pH=10.

· Pré-tratamento de Polpa Marrom Kraft de Madeira Mole do Sulcom 2 U/g de pipa de XYLB (P.f) reduz o uso de CIO2 em 16,3% para atingiruma% de alvura GE final de 60,5.

• Pré-tratamento de Polpa Kraft de aspen com 2 U/g de polpa deXYLA (P.f) e XYLB (P.f) reduz o uso de CIO2 em cerca de 35% para atingirum% de alvura GE final de 77.

• Pré-tratamento de Polpa Kraft de bordo com 2 U/g d polpa deXYLA (P.f) e XYLB (P.f) reduz o uso de CIO2 em cerca de 38% para atingirum% de alvura GE final de 79.

• As duas xilanases que agiram melhor, isto é, XYLA (P.f) e XYLB(P.f), são enzimas truncadas, contendo apenas o domínio catalítico, e foramproduzidas em Pseudomonas fluorescens.

EXEMPLO 7: XILANASES EXEMPLARES PARA PROCESSAMENTO DEPOLPA E PAPEL

O alvo técnico para a xilanase evoluída foi aumentar atermotolerância na aplicação (por exemplo, até e incluindo 90°C) assimcomo perfil de pH mais amplo (desempenho em pH 8 a 10). O polipeptídeoque tem uma seqüência descrita em SEQ ID NO:384, codificada porexemplo, por SEQ ID NO:383 ("SEQ ID NO:383/384") foi evoluída para sercompatível como especificações alvo por criar e rastrear bibliotecas deGSSM seguido por reagrupamento de genes de mutantes únicos superioresencontrados. O ponto inicial para a GSSM foi SEQ ID NO:383/384, umtruncamento C-terminal de três aminoácidos (3-aa) de SEQ ID NO:381/382.O rastreamento foi realizado em um hospedeiro de E. coli, as seqüências dogene precursor (SEQ ID NO:383/384) são dadas abaixo.

ATGGCTCAGACCTGCCTCACGTCGAGTCAAACCGGCACTAACAATGGCTTCTATTATTCCTTCTGGAAGGACAGTCCGGGCACGGTGAATTTTTGCCTGCAGTCCGGCGGCCGTTACACATCGAACTGGAGCGGCATCAACAACTGGGTGGGCGGCAAGGGATGGCAGACCGGTTCACGCCGGAACATCACGTACTCGGGCAGCTTCAATTCACCGGGCAACGGCTACCTGGCGCTTTACGGATGGACCACCAATCCACTCGTCGAGTACTACGTCGTCGATAGCTGGGGGAGCTGGCGTCCGCCGGGTTCGGACGGAACGTTCCTGGGGACGGTCAACAGCGATGGCGGAACGTATGACATCTATCGCGCGCAGCGGGTCAACGCGCCGTCCATCATCGGCAACGCCACGTTCTATCAATACTGGAGCGTTCGGCAGTCGAAGCGGGTAGGTGGGACGATCACCACCGGAAACCACTTCGACGCGTGGGCCAGCGTGGGCCTGAACCTGGGCACTCACAACTACCAGATCATGGCGACCGAGGGCTACCAAAGCAGCGGCAGCTCCGACATCACGGTGAGTTAA (SEQ ID NO:383)

MAQTCLTSSQTGTNNGFYYSFWKDSPGTVNFCLQSGGRYTSNWSGINNWVGGKGWQTGSR

RNITYSGSFNSPGNGYLALYGWTTNPLVEYYVVDSWGSWRPPGSDGTFLGTVNSDGGTYD

IYRAQRVNAPSIIGNATFYQYWSVRQSKRVGGTITTGNHFDAWASVGLNLGTHNYQIMAT

EGYQSSGSSDITVS (SEQ ID NO:384)

A biblioteca de GSSM foi submetida a estímulo térmico de 74°C,e então rastreada por clones que exibem a atividade mais alta sobresubstrato solúvel de azo-xilano. Os candidatos superiores foramreconfirmados em azo-xilano durante rastreamento secundário e terciário. 15mutantes únicos superiores foram selecionados para reagrupamento degenes. A lista de mutantes únicos gerados:4 T4L9 S9P10 Q10S13 T13F13 T13Y14 N14H18 Y18F25 S25E30 N30V34 Q34C34 Q34H34 Q34L35 S35E71 S71T194 S194H

As propriedades de termotolerância dos mutantes únicosselecionados são dadas na tabela abaixo:

Temperatura máxima tolerada pelos mutantes únicos de GSSM selecionados

Clone Mantém desempenho até:(baseado em ensaio de atividade de azo-xilano)

wt 72°C

S9P 80°C

T13F 80°C

N14H 82,5 °C

Y18F 80°C

Q34C 80°C

O rastreamento de reagrupamento foi executado em substratode azo-xilano da mesma forma que o rastreamento da biblioteca de GSSM.A estringência do rastreamento foi aumentada para 90°C e 1 para a etapa deestímulo com calor. Os clones recombinados superiores foramcaracterizados por seu desempenho sobre os substratos da aplicação, emprotocolos de bioalvejamento em saco. Abaixo está a lista dos clonesselecionados para o teste da aplicação, com as alterações de aminoácidoem relação à SEQ ID NO:384 precursora.

POSIÇÃO DE AMINOÁCIDO<table>table see original document page 355</column></row><table>

Com base nos resultados dos testes aplicados, dois clonesforam selecionados. Eles são Xyl2 e Xyl4. Suas atividades específicas emU/mg foram determinadas usando o ensaio redutor de açúcar dearabinoxilano (chamado " ensaio de Nelson-Somogyi", discutido acima).Esses dados estão listados abaixo.

<table>table see original document page 355</column></row><table>Xyl2 723,8 5,94 121,9Xyl4 2217,8 17,73 125,1

Os resultados da calorimetria exploratória diferencial para osmutantes pontuais selecionados e achados reagrupados superiores:

Medidas de DSC dos candidatos de xilanase superiores vs. xilanases precursorasTemperatura de transição na qual a enzima é irreversivelmente inativada(desenovelada)

Temperatura de fusão

SEQ ID NO:382 80,9°C

SEQ ID NO:384 86,6 °C

Xyl2 103,5 °C

Xyl4 102,2 °C

Enri um aspecto, as mutações únicas observadas acima foramcombinadas para gerar uma enzima que tem pelo menos duas, várias outodas as mutações observadas acima; veja, por exemplo, a Tabela 10abaixo. Dessa forma, a invenção fornece polipeptídeos que têm atividade dexilanase tendo uma, pelo menos duas, várias ou todas as mutações pontuaisobservadas acima, e ácidos nucléicos que os codificam.

EXEMPLO 8: NOVO ENSAIO DE BIOALVEJAMENTO PARA AVALIAR ODESEMPENHO DA XILANASE EM AUMENTAR A ALVURA DE POLPA

Esse exemplo descreve um protocolo exemplar, um "ensaio debioalvejamento" que pode ser usado para determinar se um polipeptídeo tematividade de xilanase e está dentro do escopo da invenção. Esse ensaiopode ser usado para avaliar o desempenho de uma enzima exemplar dainvenção que tem uma seqüência descrita em SEQ ID NO:384 (codificadapor exemplo, por SEQ ID NO:383) em aumentar a alvura de polpa Kraft.Essa e qualquer outra enzima xilanase da invenção podem ser usadas paraaumentar a alvura de uma polpa, por exemplo, uma polpa Kraft.

A invenção fornece procedimentos de bioalvejamento, porexemplo, um procedimento de bioalvejamento em três estágios que simularigorosamente as condições de uma fábrica de alvejante de polpa decelulose real, como ilustrado na Figura 11; incluindo um processo ilustradona Figura 14. Essa seqüência de alvejante é designada por (X)DoEp, naqual X representa o estágio de tratamento com xilanase (usando, porexemplo, uma enzima da invenção), D para estágio de alvejante com dióxidode cloro e Ee para estágio de extração de peróxido alcalino. O material brutousado nos testes foi Polpa Marrom Kraft de Madeira Mole do Sul (semdeslignificação com oxigênio). Após o término de cada ciclo de5 bioalvejamento, a polpa resultante foi usada para produzir folhas de papel deacordo com as normas de TAPPI (Technical Association of Pulp and PaperIndustries). 0% de alvura GE de cada folha de papel foi medido e os valoresde alvura foram usados como o indício de quão bem a enzima agiu sobre apolpa durante o estágio de pré-tratamento enzimático (X).

Bioalvejamento de polpa: A polpa foi alvejada em bateladas de 10 g emsacos plásticos lacrados usando uma seqüência (X)DoEp de três estágio,como ilustrado na Figura 11. As condições do tratamento nos três estágiospodem ser resumidas como segue:

❖ Estágio X: consistência de 10% (p/v) a 65°C e pH=8 por 60 min

Estágio D0: consistência de 4% (p/v) a 60°C por 30 min; fator Kappa

=0,18 para amostras tratadas com enzima,e 0,18 e 0,21 para controles semenzima.

❖ Estágio Ep: consistência de 10% (p/v) a 75°C por 90 min; quantidadede cáustico: 1,7% (p NaOH/p polpa OD) e quantidade de H2O2: 0,5% (p/p)

Como observado na Figura 11, a polpa bruta foi lavada parareduzir o pH para pH 8.5. A polpa foi filtrada com pressão e dividida emsacos. Em cada estágio, os sacos foram incubados em um banho-maria natemperatura desejada e cada saco foi então retirado e amassado a cada 10min para garantir uma massa uniforme e transferência de calor dentro damassa da polpa. Após cada tratamento, a polpa foi filtrada, lavada com 2Lde água Dl e filtrada novamente antes de receber o próximo tratamento. Oconteúdo de umidade da polpa foi medido usando um analisador de umidadeMettler-Toledo (Fisher Scientific, USA).

Como observado na Figura 11, após a polpa ter sido filtrada compressão e dividida em sacos, no estágio X, a polpa foi ressuspensa, filtradacom pressão, e o pH foi ajustado; e então incubada com enzima a 10% desólidos, 65°C, 1 hora; e então amassada por 10 minutos. No estágio Do apolpa foi ressuspensa, lavada, o pH ajustado para 4.0 e filtrada compressão; e então impregnada com CIO2 a 4% de sólidos (isto é, consistênciade 4% (p/v)) a 60°C por 30 min; e então trabalhada por 10 minutos. Noestágio Do fator Kappa=O, 18 para amostras tratadas com enzima, e 0,18 e0,21 para controles sem enzima. No estágio Ep a polpa foi ressuspensa,lavada, e filtrada com pressão; então incubada com NaOH e H2O2 a 10% desólidos (isto é, consistência de 10% (p/v)) a 75°C por 90 min; e entãoamassada por 10 minutos. A quantidade de cáustico: 1,7% (p NaOH/p polpaOD) e quantidade de H2O2: 0,5% (p/p). Após amassar, as folhas de papelforam formadas.

Folhas de papel: como observado na figura 11, as folhas depapel foram formadas (4 m de polpa, pH de cerca de 6.5); as folhas de papelforam feitas a partir de polpa não alvejada e alvejada usando equipamentode TAPPI (Kalamazoo Paper Chemicals, Richland, Ml) de acordo commétodo de TAPPI T-272 sp-97. 0% de alvura GE de cada folha de papel foimedido usando um a BRIGHTMETER MICRO S-5/BC™ (Technidyne Corp.,New Albany, IN) de acordo com o método de TAPPI T-452 om-98 (referênciaa457nm).

EXEMPLO 9: NOVO PROCESSO DE BIOALVEJAMENTO

Esse exemplo descreve um novo processo de bioalvejamentoda invenção, como ilustrado na Figura 14. Esse processo pode ser praticadousando qualquer enzima xilanase, incluindo um polipeptídeo da invenção,incluindo qualquer enzima exemplar da invenção, por exemplo, qualquerpolipeptídeo que tem a seqüência de SEQ ID NO:2 a SEQ ID NO:636.

Esse processo exemplar da invenção pode ter um materialinicial que compreende "polpa marrom", que pode ser descrita como 1)preparação de matéria bruta - troncos que entram no moinho de papel sãodescascados, picados e examinados para remover lascas muito grandes,resíduos, nós e matéria estranha, 2) polpagem - lascas de madeira sãocozidas a 160°C até 190°C sob pressão por várias horas em um licorconcentrado de hidróxido de sódio e sulfeto de sódio para separar as fibrasde celulose e aumentar o conteúdo de celulose por extrair a maior parte daIignina indesejada. O resultado dessa etapa é referido como "polpa marrom".

Esse processo da invenção compreende uma "Etapa dealvejante" - um processo de múltiplos estágios pelo qual a Iignina residual eoutros cromóforos são removidos para alvejar a polpa até a alvurapretendida na preparação para fazer papel e outros produtos. A polpa étratada com agentes químicos oxidantes, por exemplo, cloro e dióxido decloro, que atacam preferivelmente a lignina. Em um aspecto, o processocompreende uma seqüência de alvejante onde a polpa é reagida comdióxido de cloro, o estágio "D0" (veja também a figura 13, e exemplo 8, oestágio "D0"); extraída com álcalis na presença de peróxido de hidrogênio, oestágio "Ep" (veja também a Figura 13, o estágio "Ep"); reagida com dióxidode cloro uma segunda vez, o "estágio D1"; extraída com álcali e peróxido dehidrogênio, um estágio Ep; e reagida com dióxido de cloro uma terceira vez,um estágio D2. Na prática desse processo, o alvejante pode ser submetido amuitas variações com relação ao tipo e quantidade de agentes químicosoxidantes usados e o número de etapas do processo (entretanto, dióxido decloro é geralmente o agente químico oxidante mais amplamente usado). Emum aspecto, esse processo compreende pré-tratamento da polpa cozidacom oxigênio sob pressão; o reator de oxigênio pode estar em alta pressão -cerca de 200 a 230°F e pH 12 a 14 (essa é uma primeira etapa comum noalvejante, conhecida como "deslignificação por oxigênio").

Em um aspecto esse processo compreende refinação. Porexemplo, antes da formação do papel, a polpa alvejada é picadamecanicamente para causar colapso das fibras de celulose em tirasachatadas, fibrilar suas superfícies e melhoras suas características físicaspara produção de papel. Em qualquer estágio do processo após a polpação,a polpa pode ser desaguada, lavada e ajustada para uma consistênciadesejada pela adição de água limpa ou fluxos reciclados.Xilanase (por exemplo, uma enzima da invenção) pode seradicionada logo após a polpação, no reator de oxigênio ou no recipiente dearmazenamento antes do reator de oxigênio. A xilanase (por exemplo, umaenzima da invenção) pode ser adicionada em vários pontos (ou ou mais outodos os pontos) no processo de alvejante. Em um aspecto, uma Iacase éadicionada para catalisar a quebra da lignina. A Iacase pode ser adicionadaem qualquer estágio do processo, incluindo no reator de oxigênio. A polpapode liberar vários componentes que auto-mediam a Iacase (veja, porexemplo, DE 19723890 que descreve um sistema que oxidação quecompreende um mediador orgânico e uma lacase; mediadores exemplaresalternativos incluem 2,2'-azinobis(3-etilbenzt-iazolina-5-sulfonato) (ABTS)como um mediador orgânico exemplar e octacianomolibdato de potássio[K4Mo(CN) 8] como um mediador inorgânico exemplar). Mediadores descritosno pedido de Patente U.S. N°. 20030096394, também podem ser usados noprocesso da invenção, incluindo qualquer composto capaz de aumentar asatividades da lacase e enzimas relacionadas a lacase.

Em um aspecto, uma esterase, por exemplo, uma lipase, ouoxidorredutase, por exemplo, peroxidase é adicionada. Além disso, o pHe/ou temperatura podem ser modificados no reator. Ao monitorar as reaçõesda invenção, qualquer técnica de medição do conteúdo de lignina pode serusada, por exemplo, veja o Pedido de Patente U.S. N°. 20020144795, quedescreve um método para medir o número kappa ou conteúdo de lignina empolpas Kraft com base na medida volumétrica de reações catalíticas queenvolvem lignina e mediadores redox

Enzimas da invenção também podem ser usadas em alvejantecom processos de oxigênio-alcalino (deslignificação com oxigênio) descritospor exemplo, na Patente U.S. 6.824.646, o processo compreendendo alvejarpolpa de Iignocelulose em uma solução alcalina aquosa com oxigênio etratar a polpa com hemicelulase, enquanto uma fração de líquido liberada daetapa de tratamento com enzima é separada da mistura de reação tratadacom hemicelulase, e submetida a um tratamento de penetração através demembrana de separação, por exemplo, membrana de osmose reversa, paraseparar uma fração permeada de uma fração não permeada; e então afração permeada é alimentada na etapa de alvejante com oxigênio-álcali(deslignificação com oxigênio) compreendendo o uso de uma enzima dainvenção.

Em aspectos alternativos dessa ou qualquer outro processo(método) da invenção, xilanases (por exemplo, enzimas da invenção) sãousadas para reduzir a quantidade de agentes químicos branqueadores, porexemplo, cloro, dióxido de cloro, cáusticos, peróxido ou qualquercombinação destes; e em aspectos alternativos, uma redução de até cercade 1%, 5%, 10%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%,70%, 75%, 80%, 85%, 90%, 95% ou mais, ou 100%, de agentes químicospode ser vista na prática dos métodos e uso das enzimas da invenção. Emum aspecto, uma redução de 100% nos agentes químicos pode ser obtidaquando a xilanase é usada em combinação com uma Iacase ou outraenzima, por exemplo, pelo uso de coquetéis de enzimas; observando que ainvenção fornece misturas de enzimas, ou "coquetéis" que compreendempelo menos uma enzima da invenção e uma ou mais outra(s) enzima(s), quepode(m) ser outra xilanase, ou qualquer outra enzima.

Em um aspecto, as xilanases da invenção são usadas parareduzir o dióxido de cloro para permitir reciclagem de água no processo;desta forma, há menos água usada e menos água despejada no esgoto. Emum aspecto, as xilanases da invenção são usadas para permitir que maispolpa rica em Iignina entre na fábrica de alvejante, permitindo melhorrendimento da polpa e melhor qualidade da polpa (isto é, menos destruiçãodurante o processo de cozimento. Em um aspecto, as xilanases da invençãosão usadas para reduzir o número kappa da polpa.

As xilanases da invenção podem ser usadas, e os processos dainvenção podem ser praticados em todos os tipos de madeira, incluindo, porexemplo, um madeira dura, com por exemplo, deslignificação por oxigênio emadeira dura sem deslignificação por oxigênio, madeira mole comdeslignificação por oxigênio e madeira mole sem deslignificação por oxigênioe semelhantes. As xilanases da invenção podem ser usadas, e os processosda invenção podem ser praticados para processamento de papel e/ou polpareciclada.

A deslignificação por oxigênio tipicamente requer a adição deuma torre de reação entre uma lavadora de polpa marrom e uma fábrica dealvejante. Tipicamente, oxigênio e hidróxido de sódio são adicionados àpolpa marrom. A redução de agentes químicos branqueadores em 50% podeser obtida no processo de alvejante se precedido por deslignificação comoxigênio. Lavagem segue a deslignificação com oxigênio; o efluente podeser recuperado ou descartado. Deslignificação com ozônio pode ser usadano lugar de deslignificação com oxigênio.

EXEMPLO 10: NOVO ENSAIO DE BIOALVEJAMENTO

Os dados desse exemplo demonstram a atividade de xilanaseem polipeptídeos exemplares da invenção. Estes estudos de atividade dexilanase foram baseados naqueles descritos por Nelson (1944) J. Biol.Chem. 153:375-380, "Reducing Sugar Assay for Xylanase"; e, Somogyi(1952) J. Biol. Chem. 195:19-23. Esse ensaio de "Nelson-Somogyi" e usadopara determinar unidades de atividade; os dados dos ensaios de "Nelson-Somogyi" demonstrando a atividade de xilanase em polipeptídeosexemplares da invenção por determinar unidades de atividade, é descritoabaixo.

As determinações de unidade de enzima foram feitas usando oensaio de Nelson-Somogyi. Ensaios de alvejante foram baseados nosmétodos da TAPPI (Technical Association of Pulp and Paper Industries, vejaacima). Abaixo uma descrição junto com diferenças dos protocolos daTAPPI.

Polpa: duas bateladas de polpa marrom Kraft de madeira moledo sul foram obtidos do Department of Wood and Fiber Science na NorthCarolina State University (Raleigh, NC). Os números de kappa da polpaforam determinados como sendo 21,4 ou 29,7 respectivamente, usando ométodo TAPPI T-236 om-99 {TAPPI Test Methods (2000-2001), 2003 173/id}.

Bioalvejamento de polpa: a polpa foi pré-tratada com xilanase ealvejada em lotes 10g em sacos plásticos lacrados usando uma seqüênciade 3 estágios de xilanase/dióxido de cloro/peróxido alcalino:(X)DoEp (vejaexplicação acima). As condições de tratamento nos três estágios foramcomo segue:

Estágio X: consistência de 10% (p/v) a 65°C e pH 8 por 60 min.

Estágio Do: consistência de 4% (p/v) a 60 0C por 30 min; um fator kappa de0,18 foi usado para amostras tratadas com enzima, e 0,18 e 0,21 paracontroles sem enzima. A concentração de dióxido de cloro usada durante oestágio Do foi calculada usando a equação (1):

<formula>formula see original document page 363</formula>

Onde CI02% era igual a g de dióxido de cloro puro por 100 g de polpa secaem forno (OD) KF era o fator kappa e K# era o número kappa da polpa comodeterminado pelo método TAPPI T-236 om-99{TAPPI Test Methods (2000-2001), 2003 173 /id}

Estágio Ep: consistência de 10% (p/v) a 75 0C por 90 min;quantidade de cáusticos foi de 1,7% na polpa (p/p) e a quantidade de H2O2foi de 0,5% na polpa (p/p).

Em cada estágio, sacos em duplicata foram incubados em umbanho-maria na temperatura desejada e amassados vigorosamente a cada10 minutos para garantir massa uniforme e transferência de calor dentro damassa da polpa. Após cada estágio, a polpa foi filtrada através de um funilde Buchner forrado com um filtro de polipropileno rígido (297-micron mesh,Spectrum Labs, Ft. Lauderdale, FL). O filtrado foi reciclado uma vez paracapturar os resíduos, e a torta de polpa foi lavada com 2 L de água Dl. Atorta de polpa foi então ressuspensa em 1,5 L de água Dl e o pH foi ajustadopara pH 8 e pH 4 antes dos estágios X e Do, respectivamente. O conteúdode umidade da polpa foi medido usando um analisador de umidade Mettler-Toledo (Fisher Scientific, USA).

Folhas de papel foram feitas a partir da polpa alvejada usandoequipamento padrão TAPPI (Kalamazoo Paper Chemicals, Richland1 Ml) deacordo com o método TAPPI T-272 sp-97{TAPPI Test Methods (2000-2001),2003 173 /id}. A % de alvura GE da cada folha de papel foi medido usandoTechnidyne Brightimeter™ Micro S-5/BC (Technidyne Corp., New Albany,IN) de acordo com o método TAPPI T-452 om-98.

<table>table see original document page 364</column></row><table>

Procedimento

1. Prepare o reagente A

2. Pipete 5 uL de NaOH 1 M em cada cavidade de uma placa de PCRde 96 cavidades. Mantenha a placa sobre gelo.

3. Prepare a mistura de reação. Alternativamente, você pode fazer umamistura estoque (master mix) para várias amostras. Esta é a mistura 1X.Adicione aos tubos de 1 mL e coloque no bloco de 96 cavidades.

a. 50 uL de tampão Na-fosfato pH8

b. 250 uL de substrato a 1 % (para fazer uma concentração final de0,5%)

c. 150 ULdeH2O4. Pré-aqueça a mistura de reação para a temperatura desejada por 3minutos.

5. Dilua o tampão de fosfato 0,5 M para 5 mM pH 8 e faça diluições deenzima usando esse tampão.

5 6. Pipete 75 uL de enzima diluída em um cavidade de uma placa demicrotitulação de 96 cavidades.

7. Pipete 50 uL de enzima diluída no tubo de 1 mL contendo a misturade reação.

8. No momento desejado, pipete 50 uL de cada mistura de reação emtubos contendo NaOH (o NaOH aumentará o pH para 12, paralisando areação).

9. Adicione cada 50 uL de padrão a tubos separados contendo tambémNaOH. Os padrões são lineares dentro da faixa de 0,25 mM de xilose a 2,0mM. Use pelo menos 4 padrões para gerar a curva padrão.

10. Adicione 50 uL de Reagente A a cada cavidade. Lacre a placa o filmeMicroseal™ Ά'.

11. Aqueça a placa por 20 min. a 10O0C em uma máquina de PCR. Ajustea máquina para resfriar para 4°C após aquecer as amostras.

12. Adicione 50 uL de reagente B a cada tubo, misture.

13. -nota: uma quantidade significativa de CO2 é formada após a adiçãodo reagente B. Deve ser tomado cuidado para que a amostra não contamineos cavidades adjacentes.

14. Pipete 100 uL de cada amostra ou padrão em cavidades separadosde uma placa de microtitulação de 96 cavidades.

15. Leia a placa a 560 nm.

16. Faça um gráfico dos dados da curva padrão e expresso padrõescomo pmoles de xilose isto é, 50 μί de xilose 2,5 mM é 0,125 pmoles dex i l o s e

17. Subtraia o controle do tampão dos dados da amostra para cada pontode tempo e plote os dados.18. Divida o valor da inclinação da curva no ponto de tempo pelo valor dainclinação da curva padrão de xilose

19. Multiplique por 10 (contas para as amostras de 50 μΙ_ (1/10 do volumede ensaio total)

20. Divida pelo volume usado no ensaio (0,05) para ter pmoles de xiloseliberados por minuto por mL de enzima ou U/mL de enzima.21. Divida esse número pela concentração de proteína para ter U/mg.

Os dados dos ensaios de "Nelson- Somogyi" demonstrando aatividade de xilanase em polipeptídeos exemplares da invenção sãodescritos na Tabela 8, abaixo. Como observado acima, as condições deensaio compreenderam pH 8; 65°C U/mL, ou, pH 8; 40°C (U/mL).

Na Tabela 8, para auxiliar a leitura da Tabela 8, "SEQ IDNO: 151, 152" significa "o polipeptídeo que tem uma seqüência descrita emSEQ ID NO:152, codificado, por exemplo, por um ácido nucléico que tem15 uma seqüência descrita em SEQ ID NO:151", etc.:

Tabela 8

<table>table see original document page 366</column></row><table><table>table see original document page 367</column></row><table><table>table see original document page 368</column></row><table><table>table see original document page 369</column></row><table>

Dados de "Unidades de Atividade" dos ensaios de "Nelson-Somogyi" foram usados para determinar a dosagem em ensaios debioalvejamento (com base nos métodos de TAPPI), como resumido naTabela 9, abaixo (para auxiliar na leitura da Tabela 9, "SEQ ID NO:151, 152"significa "o polipeptídeo que tem uma seqüência descrita em SEQ IDNO: 152, codificado, por exemplo, por um ácido nucléico que tem umaseqüência descrita em SEQ ID NO:151", etc.):

Tabela 9

<table>table see original document page 369</column></row><table><table>table see original document page 370</column></row><table><table>table see original document page 371</column></row><table><table>table see original document page 372</column></row><table>

Definições de resultado na Tabela 9:

+ = maior do que o ponto médio dos controles de Fator Kappa até o controlede Fator Kappa alto

++ = maior do que o controle de Fator Kappa alto

- = menor ou igual ao ponto médio dos controles de Fator Kappa, mas nãomenor do que o controle de Fator Kappa baixo

-- = menor do que o controle do Fator Kappa baixo

Termo chave para a Tabela 9: SPB = Spruce Pinho Bétula; SSW = MadeiraMole do Sul

Nos estudos resumidos na Tabela 9, para enzimas que exibiramdesempenho abaixo do controle do fator kappa baixo, infere-se que omaterial na amostra da enzima contribuiu para reduzir a alvura. A remoçãodesse material por enriquecimento ou purificação adicional do candidato dexilanase na amostra de enzima poderia melhorar o desempenho.

Em um aspecto, as mutações de um único resíduo deaminoácido descritas aqui foram combinadas para gerar uma enzimaxilanase que tem pelo menos duas, várias ou todas as mutações pontuais,por exemplo, como descrito na Tabela 10, abaixo. A coluna do "no. daenzima" na Tabela 10 está correlacionada com a coluna "no. da enzima" naFigura 15, discutida abaixo.

Tabela 10A, B, C: mutantes combinados, mutantes pontuais superiores(upmutants). mutantes superiores misturados curtos

<table>table see original document page 372</column></row><table><table>table see original document page 373</column></row><table>

Tabela 10B

Mutantes pontuais superiores

<table>table see original document page 373</column></row><table><table>table see original document page 374</column></row><table>

Tabela 10C

Mutantes Superiores Curtos Misturados_

<table>table see original document page 374</column></row><table>

A Figura 15 é uma tabela que resume dados que demonstram aatividade enzimática de enzimas exemplares da invenção que têmseqüências descritas na Tabela 10 acima, onde está indicado que todasessas enzimas são variações da seqüência de SEQ ID NO:384, comodescrito na Tabela 10. Por exemplo, na "enzima 20": a posição deaminoácido 9 é P, ou uma prolina (onde a "tipo selvagem", ou SEQ IDNO:384, é S, ou uma serina), a posição de aminoácido 13 é "Y", ou umatirosina (onde a "tipo selvagem", ou SEQ ID NO:384, é T, ou uma treonina),etc. A menos que especificado de outra forma, todos os estudos foram feitosem polpa marrom de madeira mole do norte (por exemplo, SSWB é polpamarrom de madeira mole do Sul). Os fatores kappa altos/baixos estãoindicados. A metodologia é discutida acima (por exemplo, para estágio "X","Do" e "E1", ou "Ep", veja explicação nos Exemplos 9 e 10, acima). Alvura e"economia de químicos" estão indicadas; "economia de químicos" indicandomenos uso de branqueador químico tal como cloro (cloro elementar oudióxido de cloro), hidrossulfito de sódio e/ou hipoclorito de sódio em umasegunda etapa de alvejante químico: onde uma enzima hemicelulolítica dainvenção (xilanase) é usada inicialmente para degradar (hidrolisar)hemicelulose, e em uma segunda etapa de alvejante químico é usada paradegradar a Iignina restante).

Como observado acima, as enzimas e processos da invençãotambém podem ser usados em conjunto com uma segunda abordagem paraalvejante químico usando enzimas oxidativas tais como Iacase e/ouperoxidase de manganês (MnP) para deslignificar polpa. Dessas enzimas, alacase é preferida, porque MnP requer peróxido de hidrogênio, íonsmanganês e um quelante. A Iacase pode causar deslignificação de polpasob pequena pressão de oxigênio, mas é consideravelmente mais eficazquando mediadores são adicionados, como discutido acima.

Métodos de deslignificação melhorados por catalisadorestambém podem ser usados em conjunto com os métodos da invenção, porexemplo, polissulfeto ou antraquinona. Antraquinona é um catalisador dereação de polpação que pode aumentar a velocidade de polpação, aumentaro rendimento, e reduzir o uso de químicos de polpação em até 10%. Epossível usar antraquinona e polissufeto juntos.

Em um aspecto, a Iacase é usada em conjunto com os métodosda invenção, como discutido acima. Por exemplo, Iacase é usada em umreator de oxigênio em um processo da invenção, onde a Iacase quebra aIignina no reator de oxigênio. Embora a polpa possa liberar várioscomponentes que auto-mediam a lacase, em um aspecto, mediadoresorgânicos ou inorgânicos são adicionados (veja discussão acima, porexemplo mediadores exemplares alternativos incluem 2,2'-azinobis(3-etiIbenzt- iazolina-5-sulfonato) (ABTS) como um mediador orgânico exemplare octacianomolibdato de potássio [K4Mo(CN) 8] como um mediadorinorgânico exemplar, ou mediadores descritos no pedido de patente U.S.20030096394). Em um aspecto, outra hidrolase, tal como uma esterase (porexemplo, uma lipase) e/ou uma oxidorredutase (por exemplo, umaperoxidase) também são adicionadas. Em aspectos alternativos, o pH e/outemperatura são modificados no reator.

EXEMPLO 11: ESTUDOS DEMONSTRANDO A ATIVIDADE ENZIMÁTICADE SEQ ID NO:382

Este exemplo descreve estudos demonstrando a atividadeenzimática da enzima xilanase exemplar da invenção que tem umaseqüência de aminoácido descrita em SEQ ID NO:382 (codificada, porexemplo, por SEQ ID NO:381).A atividade enzimática de SEQ ID NO:382 foi demonstrada emMadeira Mole do Sul (SSWB), o desempenho da enzima sobre SSWB estáresumido na Figura 16, Figura 17, Figura 18 e Figura 19.

Para polpa marrom: SEQ ID NO:382 agiu muito bem na faixa detemperatura de 40 a 70°C, e na faixa de pH de 5 a 8. Economia de agentesquímicos sob essas condições variou de 18% a 22%. A estabilidade de SEQID NO:382 permitiu que ela agisse sobre SSWB em temperatura de até90°C, pH 8 (economia de agentes químicos depende das condições).

Para pós-02, SSW-O2 precisou de apenas 0,05U de SEQ IDNO:382 por grama de polpa OD. SEQ ID NO:382 exibiu excelenteestabilidade a uma variedade de condições de processamento, incluindotemperatura, pH,% de sólidos, tempo de tratamento, quando usada para pré-tratar SSW-O2. Economia de químicos pode ser superior a 22% (economiasapenas do estágio Do) em SSW-O2.

Figura 16 é uma tabela que ilustra a atividade de SEQ IDNO:382 e resume dados de (X)DoEp (veja acima para explicação detalhada)em SSWB 0803 (número Kappa 22,8); X: 10% de sólidos e 60 minutos;filtrado de polpa ajustado para o pH desejado - sistema não-tamponado. Nafigura 16, SEQ ID NO:382, demonstrou atividade a 0,6 U /g de polpa OD,que forneceu um economia de químicos de 18%.

Figura 17 é uma tabela que ilustra a atividade de SEQ IDNO:382 e resume os dados de (X)DoEp em SSWB 0803 (número Kappa22,8); X: pH=8 e 30 minutos, 10% de sólidos; Filtrado de polpa ajustado parapH 8 - sistema não-tamponado. Na figura 17, SEQ ID NO:382, demonstrou25 atividade fornecendo uma economia de 14% a 0,9 U/g, 40°C e 50°C, pH 8,30 minutos em SSWB-GP Brunswick.

Figura 18 é uma tabela que ilustra a atividade de SEQ IDNO:382 e resume os dados de (X)DoEp em SSWB 0803 (número Kappa22,8); X: 40°C, 30 minutos e 10% de sólidos; o filtrado de polpa foi ajustadopara o pH desejado - sistema não-tamponado. Na Figura 18, SEQ IDNO:382, demonstrou atividade mostrando que o pré-tratamento de SSWB-Brunswick com SEQ ID NO:382 forneceu uma economia de químicos de18% e mostrou um desempenho um pouco melhor em um pH mais baixo pH(pH 6), 40°C, 30 minutos.

Figura 19 é uma tabela que ilustra a atividade de SEQ IDNO:382 e resume os dados de (X)DoEp em SSWB 0803 (número Kappa22,8); (X)DoEp em SSWB (número Kappa 28,6) X: 40°C, pH=7, 30 minutose 4,5% de sólidos; o filtrado de polpa foi ajustado para o pH desejado -sistema não-tamponado. Nà figura 19, SEQ ID NO:382, demonstrouatividade mostrando que o prértratamento de SSWB-Brunswick com SEQ IDNO:382 em 4,5% de sólidos forneceu 18% de economia de químicos.

Figura 20 é uma tabela que ilustra que SEQ ID NO:382 tambémé eficaz sobre Madeira Dura do Norte (NHW) pós-02 na faixa de pH de 6 a8,5, retendo atividade mesmo em pH 10; 60°C e 90°C. Na figura 20,bioalvejamento com (X)DoEp Madeira do Norte NSWB (número Kappa24,8). X: 0,7U/g, pH=10, 60 min, 10% de sólidos.

Em resumo: SEQ ID NO:382 é ativa sobre todos os tipos depolpa, incluindo por exemplo, madeira mole, madeira dura, kappa baixo,kappa alto, etc.; SEQ ID NO:382 tem uma alta tolerância para variação decondições de processamento, incluindo, por exemplo, temperatura, pH,% desólidos, tempo de tratamento; SEQ ID NO:382 age sobre uma ampla gamade temperaturas de operação (de 39°C a 90°C), com o melhor desempenhoaté 70°C; SEQ ID NO:382 é ativa em uma ampla faixa de pH (pelo menos afaixa de pH 5.2 a 10.0 testada) e ótima na faixa de pH 6.0 a 8.0; SEQ IDNO:382 pode obter o efeito de pré-alvejante desejado em aproximadamente20 minutos, permitindo taxas de alimentação aumentadas; e SEQ ID NO:382age bem em várias as consistências de polpa (cerca de 3% a 10%),permitindo uma opção de alimentação aumentada durante o estágio X.

EXEMPLO 12: ESTUDOS DEMONSTRANDO A ATIVIDADE ENZIMÁTICADE ENZIMAS DA INVENÇÃO

Esse exemplo descreve estudos que demonstram a atividadeenzimática das enzimas xilanases exemplares da invenção, incluindo asenzimas xilanases exemplares da invenção que têm as seqüências deaminoácido de SEQ ID NO:482 (codificada por exemplo, por SEQ IDNO:481), SEQ ID N0:490, SEQ ID N0:502, SEQ ID N0:504 e SEQ IDNO:512. As atividades em pH 10 e em temperaturas de 45°C, 50°C, e 55°Cpara a xilanase exemplar da invenção que tem a seqüência SEQ ID NO:512são descritas.

Um ensaio exemplar para avaliar essas xilanases:

1. Rastreamento inicial - usando um substrato de azo-xilano (baseadoem solução)

a. Acertos descobertos foram subclonados em um vetor deexpressão adequado

b. Subclones de xilanase foram expressos em frascos de agitaçãode 1 L sob condições usuais

c. Os níveis de expressão dos subclones foram determinados porSDS-PAG E.

d. O nível de atividade enzimática das enzimas foi determinadopelo ensaio de Azo-xilano usando substrato Azo-xilano de madeira de bétula(Birchwood) de Megazyme® em fosfato de sódio 100 mM, pH 8, de acordocom o protocolo de ensaio recomendado pelo fabricante. As concentraçõesde amostras de enzima foram ajustadas tal que elas tinham quantidadesiguais de atividade de xilanase em pH8.

e. O ensaio de azo-xilano foi então repetido com amostrasnormalizadas em tampão de borato de sódio 100 mM em pH 10,4.Os dados do ensaio de azo-xilano desse protocolo usandoenzimas exemplares da invenção que têm as seqüências de aminoácido deSEQ ID NO:482, SEQ ID N0:490, SEQ ID N0:502, SEQ ID N0:504 e SEQID NO:512, são mostrados na Figura 21.

2. Rastreamento Inicial - ENZ-CHEK ULTRA XYLANASE ASSAY KIT™(Invitrogen)

a. Amostras de xilanase foram preparadas da mesma maneira quepara o ensaio de Azo-xilano (sessão 1, acima).b. O nível de atividade enzimática de enzimas foi medido por

empregar um kit de ensaio comercialmente disponível vendido pelaInvitrogen sob o nome ENZ-CHEK ULTRA XYLANASE ASSAY KIT™(número do produto E33650). O substrato do kit ENZ-CHEK™ produz sinalfluorescente na presença de xilanases, o qual pode ser usado paraquantificar as atividades usando padrões fornecidos pelo kit. O protocolousado para testar as enzimas xilanases foi o protocolo recomendado pelofabricante ligeiramente modificado. As modificações envolveramprimariamente testar as xilanases em pH e temperatura diferente daquelaque é recomendada pelo fabricante.

3. Rastreamento secundário - ensaios de polpa exemplares

a. As enzimas do ensaio de azo-xilano tiveram a atividade testadaem arabinoxilano de trigo usando o ensaio de Nelson-Somogyi como jádescrito aqui. Elas foram então testadas em ensaios de alvejante em escala15 laboratorial para determinar a quantidade de economia de químicos quepode ser obtida para um dado tipo de polpa e quantidade de dióxido decloro. Aquelas que preencheram as características de desempenhodesejadas foram testadas em ensaio de bioalvejamento em saco TAPPI emtriplicata em uma faixa de quantidades e níveis de pH.

b. Os dados típicos para esse ensaio são mostrados na Figura 22e na Figura 23.

4. Rastreamento de caracterização de enzima exemplar - perfil detemperatura

a. A termotolerância de xilanases pode ser testada usando ensaiode azo-xilano em pH 8 e pH 10.4 em temperaturas progressivamente maiselevadas; e enzimas da invenção foram testadas usando esse ensaio. Astaxas iniciais de reação em cada temperatura foram registradas e plotadaspara determinar a temperatura ótima de desempenho de xilanases. Gráficosde perfil térmico exemplares são mostrados na Figura 24 e na Figura 25.

b. Atividade residual - Outro ensaio exemplar que pode serempregado para testar a termoestabilidade de enzimas é o método deatividade residual, pelo qual uma amostra de enzima é tratada em umatemperatura elevada e em um pH particular por um período de tempoespecífico, e então testada sob condições usuais sob temperaturapermissiva (tipicamente 37°C). A meia vida em uma temperatura particular éentão determinada e fornece uma medida da aptidão de uma dada enzimasob essas condições de temperatura. Um gráfico de atividades residuais empH 10 e temperaturas de 45°C, 50°C, e 55°C de uma das xilanasesexemplares da invenção que tem a seqüência de aminoácido SEQ IDNO:512 são mostradas na Figura 26.

EXEMPLO 13: CRISTALIZAÇÃO E COLETA DE DADOS PARA ANÁLISEDE ESTRUTURA

Esse exemplo descreve e demonstra a cristalização e coleta dedados e análise de estrutura, para as xilanases exemplares da invenção quetêm a seqüência de aminoácidos SEQ ID NO: 482 (codificada, por exemplo,por SEQ ID NO:481).

Cristalização e coleta de dados

Cristais de SEQ ID NO:482 (21 g/l em ddH20) cresceram a 209Cem PEG 400 55% (p/v), sulfato de lítio 0,15 M, acetato tri-sódico 0,1 M (pH5.1). Os cristais cresceram durante um período de dois a três dias e foramcrio-protegidos no líquido original. Cristais de SEQ ID NO: 382 (codificada,por exemplo, por SEQ ID NO:381) (21 g/l em ddH20) foram formados a 20eCem PEG 8000 12% (p/v), Tris/HCI 0,1 M (pH 9). Os cristais também foramobservados após dois a três dias e crio-resfriados no líquido originalcontendo 30% (v/v) de glicerol adicional. Dados de difração em umaresolução máxima de 1.8À para SEQ ID NO:382 e 1.9À para SEQ IDNO:482 foram registrados a partir de cristais únicos a 100 K usando umdetector de imagem de placa RAXIS-IV equipado com uma fonte de raio Xde anodo rotatório MicroMax 007 (cobre 1,5418 Á). Os dados de difraçãoforam integrados em MOSFLM e escalonados em SCALA. Todos os outroscálculos foram feitos com programas da suite CCP4. Ambos os conjuntos dedados continham um total de 250 imagens cada e foram coletados com umângulo de oscilação de 1Resolução estrutural

Os dados de difração revelaram que os cristais de SEQ IDNO:482 pertenciam ao grupo espacial C2 com dimensões de cela unitária dea=64,7 A, 0=33,6 A1 c=83,1 Α, α=90,00°, β=101,90°, γ=90,00°, e com umamolécula ocupando a unidade cristalográfica assimétrica. A estrutura deSEQ ID NO:482 foi resolvida por substituição molecular em MOLREPusando uma estrutura previamente determinada da XynA de Bacilluscirculans (número de acesso PDB 1xnb; PDB é a base de dados de proteína(Protein Data Bank) disponibilizado pelo website do Research Collaboratoryfor Structural Bioinformatics (RCSB)), como modelo de pesquisa. Ciclos dereconstrução manual em Coot foram intercaladas com refinamentoposicionai em REFMAC. Moléculas solventes de água foram adicionadasusando Arp_waters e checadas manualmente usando Coot.

Dados de difração que resultaram dos cristais de SEQ IDNO:382 pertenciam ao grupo espacial com dimensões de celas

unitárias de a=36,3 A, b= 63,2 A, c=75,1 Α, α=90,00°, β=90,00°, γ=90,00°também com uma molécula ocupando a unidade cristalográfica assimétrica.

A estrutura de SEQ ID NO:382 foi resolvida por substituiçãomolecular em MOLREP usando a estrutura da SEQ ID NO:482 como modelode pesquisa. O refinamento foi então realizado de maneira similar ao daSEQ ID NO:482.

EXEMPLO 14: ATIVIDADE ENZIMÁTICA E CARACTERIZAÇÃO DEENZIMAS DA INVENÇÃO

Esse exemplo descreve várias características de enzimasxilanase exemplares da invenção e ensaios exemplares para fazer essasdeterminações.

O Mrda enzima madura exemplar da invenção SEQ ID NO:382foi de 23 kDa determinado por SDS-PAGE. O tamanho da enzima nativa,estimado por cromatografia de exclusão de tamanho, foi de 25 kDa,indicando que a enzima é monomérica. SEQ ID NO:382 hidrolisourapidamente xilano de espelta de aveia com um katde 155000±2700 min'1 eKm de 2,6 ± 1,4 mg/ml. A enzima exibiu termoestabilidade significativa e nãosofreu inativação térmica acima de 70eC. A Calorimetria ExploratóriaDiferencial (DSC) (descrita em detalhes acima) mostrou que a xilanase tinhauma temperatura de fusão de 74,2QC. A termodinâmica de desenovelamentonão pôde ser investigada já que o desenovelamento térmico da proteína foiirreversível; não foi possível obter um exame de reenovelamento e houveevidência de precipitação da proteína. Tentativas de obter o DG entre aforma enovelada e não-enovelada da xilanase também foram mal sucedidasjá que o dicroísmo circular e a espectroscopia de fluorescência revelaramque a proteína não pôde ser desnaturada mesmo quando incubada por trêsmeses em cloridrato de guanidina 6M a 37°C.

Os mutantes de aminoácido único S9P, N14H, T13F, Y18F,Q34L, S35E e S71T e a enzima exemplar da invenção de SEQ ID NO:482foram purificados até homogeneidade eletroforética por cromatografia detroca de ânion. A atividade desses mutantes mostrou que todas asatividades específicas que eles tinham não estavam comprometidas emrelação à enzima "tipo selvagem", o que foi satisfatório já que alterações daestrutura da enzima que aumentam a estabilidade resultam freqüentementeem eficiência catalítica diminuída. A retenção da atividade catalítica totalrelatada aqui reflete, provavelmente, a estratégia de rastreamentoempregada.

A Calorimetria Exploratória Diferencial (DSC) dos mutantes dexilanase mostrou que todas as variantes contendo uma única alteração deaminoácido mostraram Tms elevados, variando entre 2-119 (graus) acimadaquele da enzima "tipo selvagem". A xilanase "mutante" combinadaexemplar da invenção SEQ ID NO:482 teve um Tm de 103°C que é 29° maiordo que da xilanase precursora. Para investigar a resistência à inativaçãotérmica, SEQ ID NO:382 e SEQ ID NO:482 foram aquecidas por 15 minutosem várias temperaturas e testadas na temperatura permissiva de 375C; vejaFigura 27, que ilustra a inativação térmica da xilanase "tipo selvagem"exemplar da invenção SEQ ID NO:382 e a xilanase variante ou "mutante"exemplar da invenção SEQ ID NO:482. As duas enzimas foram incubadasnas várias temperaturas mostradas, alíquotas foram removidas em váriosperíodos de tempo e testadas para atividade residual de xilanase a 37eCusando 4-nitrofenil-D-Dxilotriosideo como substrato.

As constantes da taxa de pseudo-primeira ordem parainativação térmica a 79QC foram 0,573±0,054 min"1 e 0,0026 ± 0,00029 min'1para SEQ ID NO:382 e SEQ ID NO:482 exemplares, respectivamente.Coletivamente, os estudos de inativação térmica são consistentes com osΪ dados de Tm na demonstração de que as sete mutações introduzidas naSEQ ID NO:382 para gerar a SEQ ID NO:482 aumentaram muito atermoestabilidade da xilanase.

Para explorar a diferença na energia de inativação de SEQ IDNO:382 e SEQ ID NO:482 exemplares, a inativação térmica foi medida emvárias temperaturas e os dados foram usados para construir gráficosde Arrhenius; veja Figura 28 que ilustra esse gráfico de Arrhenius: o Iog dataxa de inativação de pseudo-primeira ordem foi plotado contra a recíprocada temperatura. A inclinação das linhas dá a energia de inativação. Aenergia de inativação de SEQ ID NO:482 (68,6 kcal mol"1) está aumentadaem comparação com a enzima tipo selvagem (54,5 kcal mol"1) em 14,1 kcalmol"1. Não foi possível explorar o DG de desenovelamento de SEQ IDNO:482 já que o cloridrato de guanidina não desnaturou a proteína mesmodepois de incubação prolongada em temperaturas elevadas.

Para explorar o mecanismo pelo qual as substituições deaminoácidos aumentaram a estabilidade térmica das enzimas exemplares dainvenção SEQ ID NO:482, as estruturas cristalinas da enzima "tiposelvagem" (a enzima exemplar da invenção SEQ ID NO:382) e da enzimaSEQ ID NO:482 foram determinadas, com uma resolução de 1.8Á e 1.9Á,respectivamente, por substituição molecular usando a xilanase XynA deBacillus circulans (número de acesso PDB 1xnb), que exibe 59% deidentidade de seqüência com SEQ ID NO:382) como modelo de pesquisa.Os aminoácidos que se estendem entre Gln-3 e Gly-197 estavamclaramente visíveis na estrutura cristalina indicando que os três resíduos Nterminais da enzima clonada estavam altamente desordenados ou tinhamsido processados proteoliticamente. A enzima "tipo selvagem" (a enzimaexemplar da invenção SEQ ID NO:382) exibe o enovelamento "β-jelly roll"típico das xilanases GH11. De fato, a conformação das enzimas GH11 foicomparada com a forma de uma mão direita com os "dedos" no alto, a"palma" na base e o polegar no lado direito da molécula. O modelo final daenzima contém uma α-hélice e duas folhas-β curvadas anti-paralelas quecompreendem 6 e 8 fitas-β, respectivamente. Uma pesquisa DALI mostrouque a estrutura tridimensional de SEQ ID NO:382 é mais similar a endo-1,4-xilanase Il de Trichoderma reesei com um RMSD de 0,76 Á e exibe de fatoum RMSD de <1,0 Â para 36 proteínas que são todas xilanases GH11.

A maior folha-β côncava da enzima exemplar da invenção SEQID NO:382 compreende a fenda de ligação ao substrato. No centro do sítioativo há dois resíduos catalíticos, Glu-89 (nucleófilo catalítico) e Glu-181(ácido-base catalítico) sobre as fitas-β 9 e 13 respectivamente. Os doisglutamatos, que são invariáveis nas enzimas GH11, são separados por ~6Á, totalmente compatível com o aparato catalítico de glicosídeo hidrolases"de retenção", que hidrolisam ligações glicosídicas por um mecanismo dedeslocamento duplo. Os pH ótimos das xilanases GH11 são influenciadospelo aminoácido adjacente ao catalisador ácido/base. Nas enzimas queapresentam um pH ótimo ácido, esse resíduo é ácido aspártico, enquantoele é asparagina naquelas que funcionam sob condições mais alcalinas. EmSEQ ID NO:382, o resíduo adjacente a Glu-181, o catalisador ácido/base, éAsn-48, compatível com o pH ótimo alcalino exibido pela enzima. A topologiada fenda de ligação ao substrato indica que a enzima contém cinco sub-sítios de ligação de açúcar, três gliconas (-3 a -1) e duas agliconas (+1 e +2)do sítio de clivagem da ligação.A estrutura cristalina da enzima exemplar da invenção SEQ IDNO:482 é extremamente similar a da enzima de "tipo selvagem" - a enzimaexemplar SEQ ID NO:382 da invenção. As diferenças de aminoácidos entrea xilanase SEQ ID NO:382 "tipo selvagem" e a "mutante" SEQ ID NO:482,que estão todas na região N-terminal da proteína, estão localizadas nasfitas-β 2, 3 e 4 e nas alças que conectam as fitas-β 1 e 2 e 5 e 6. Osmecanismos pelos quais essas alterações de aminoácido aumentam atermoestabilidade da enzima são intrigantes. As mutações N14H causam oaumento mais significativo na termoestabilidade da enzima com um Tm 11°maior do que a enzima de tipo selvagem e ainda as interações entre essesaminoácidos e o resíduo equivalente na enzima de tipo selvagem, Asn-14,são muito semelhantes. Assim, a cadeia principal O e N de ambos osresíduos faz pontes de hidrogênio com a carbonila e amina, respectivamentedo resíduo 17. ND2 de Asn-14 na enzima de "tipo selvagem" (SEQ IDNO:382) e ND2 de His-14 em SEQ ID NO:482 fazem, ambas, um ponte dehidrogênio com a cadeia principal de carbonila do aminoácido 34, enquantoas cadeias laterais de histidina e asparagina também podem fazer umainteração fraca adicional com Asn-15, embora a geometria dessasinterações seja sub-ótima para pontes de hidrogênio ideais. A nuvem deelétrons do anel de imidazol de His-14 está colocada entre Asn-15 e Leu-33e assim fará contatos de van der Waals com esses dois resíduos e épossível que essas interações contribuam para a estabilidade global daproteína. O mecanismo preciso pelo qual a mutação N14H causa talaumento substancial na termoestabilidade está atualmente muito vago eaponta para como alterações extremamente sutis na estrutura da proteínapodem ter um impacto substancial sobre a estabilidade térmica. A mutaçãoS9P também resulta em um aumento substancial no Tm (4,6 0C) da enzima,entretanto a base molecular para esse aumento na estabilidade não estáprecisamente esclarecida. A prolina no mutante faz interações hidrofóbicasfracas com a cadeia lateral aromática de Phe-21, entretanto, Ογ de Ser-9 naxilanase tipo selvagem forma pontes de hidrogênio com a cadeia principalcarbonila e NH de Lys-23. Como o resíduo 9 está na região que conecta asfitas β 1 e 2, é possível que o anel de prolina possa contribuir para aestabilidade da proteína pelo fechamento da conformação dessa alça emuma conformação ótima para o enovelamento global da proteína. Afenilalanina introduzida no mutante T13F faz vários contatos de van derWaals com Phe-18, enquanto a hidroxila de Thr-13 na enzima tipo selvagemnão faz pontes de hidrogênio diretas dentro da proteína. Assim, atermoestabilidade aumentada exibida pelo mutante T13F, comparada a daenzima tipo selvagem (SEQ ID NO:382), é o resultado de interaçõeshidrofóbicas entre Phe-13e Phe-18. O aumento da estabilidade fornecidopelas mutações Y18F e Q34L é intrigante. A substituição da glutamina porIeucina resulta na perda de três pontes de hidrogênio diretas entre a cadeialateral de Gln-34 e ND2 de Gln-3 e o Ογ de Thr-40 e a cadeia principalcarbonila de Cys-32 dentro da proteína. A perda dessas ligações dehidrogênio pode ser compensada, em algum grau, pelos contatos de van derWaals entre Leu-34 e a cadeia de hidrocarboneto de Arg-38. Parece,entretanto, que é improvável que Tyr-18 e Leu-34 aumentem atermoestabilidade pelo aumento direto de interações dentro da molécula daproteína. É interessante notar, entretanto, que existem extensas redes depontes de hidrogênio mediadas por solvente entre Οη de Tyr-18 e Gln-56 eAsn-174, enquanto que Οε1 de Gln-34 também faz interações mediadas porágua com Gln-3, Ser-35 e Arg-38. É possível que a perda de duas e cincomoléculas de água através das mutações Q34L e Y18F, respectivamente,possa aumentar a entropia associada com o enovelamento da proteína eportanto a termoestabilidade. O aumento da termoestabilidade fornecidopela mutação S35E é particularmente intrigante. A cadeia lateral doglutamato introduzido não faz nenhuma interação com a proteína e, de fato,ela é altamente desordenada e foi modelada em quatro conformaçõesdiferentes. Embora a estabilização significativa por resíduos carregados nasuperfície seja devida a formação de ponte de sal, foi mostrado que acolocação ótima de resíduos superficiais individuais carregados na redeeletrostática global fornece um modelo geral para a estabilidadehipertermofílica da proteína. Ainda é possível que, já que a dessolvatação decadeias laterais carregadas é desestabilizante, a introdução de carga possalimitar a conformação local, estabilizando a alça que conecta as fitas-β 4 e 5(Glu-35 está bem no final da fita-β 4) e melhorando a cooperatividade. Se ainterrupção dessa alça inicia o processo de desenovelamento, então oargumento para a influência dramática da mutação S35E sobre aestabilidade da proteína é mais evidente.

Esse estudo demonstra a metodologia poderosa da evolução deGene Site Saturation Mutagenesis™ (GSSM™) para desenhar enzimas(incluindo polipeptídeos da invenção) com estabilidade aumentada em umnível estrutural. De forma intrigante, a maioria das mutações não mediainterações tipicamente associadas com estabilidade aumentada, tal como aintrodução de pares de íons, pontes de dissulfeto, preenchimento decavidades com resíduos hidrofóbicos ou redes de pontes de hidrogênioaumentadas dentro da proteína. Excepcionalmente, a mutação maistermoestabilizante, N14H, que causa um aumento no Tm de 8o, parecemediar seu efeito através da introdução de alguns contatos de van derWaals entre o anel de imidazol da histidina e resíduos adjacentes. Não éesperado que essas interações relativamente fracas possam causar talaumento dramático na estabilidade, embora a mutação Y18F não pareça terefeito sobre interações diretas dentro da proteína, mas pode aumentar aestabilidade pela ruptura de uma rede de pontes de hidrogênio mediada porsolvente. A análise estrutural cristalográfica mostra que mesmo emretrospectiva, o mecanismo pelo qual as mutações em SEQ ID NO:482contribuem para a termoestabilidade não está claro. Esse método destaca opoder da abordagem não estocástica do método GSSM feito aqui, utilizandoevolução por GSSM e rastreamento de alta produtividade.

As propriedades bioquímicas e biofísicas das SEQ ID NO:382 eSEQ ID NO:482 exemplares tornam essas enzimas da invenção atraentespara uso industrial e outros usos; elas - e todas as enzimas dessa invenção- têm várias aplicações potenciais em diversas indústrias baseadas embiotecnologia incluindo os setores de ração animal, papel/polpa e bioenergia.

EXEMPLO 15: ATIVIDADE ENZIMÁTIGA E CARACTERIZAÇÃO DEENZIMAS DA INVENÇÃO

Esse exemplo descreve várias características de enzimasxilanases exemplares da invenção, incluindo, por exemplo, atividadeenzimática (incluindo atividade determinada pela identidade de seqüência -ou homologia - com enzimas conhecidas), fonte inicial do polipeptídeo esemelhantes, como explicado em detalhes abaixo.

Por exemplo, para auxiliar na leitura da tabela imediatamenteabaixo, na primeira coluna, com referência ao polipeptídeo que tem aseqüência de SEQ ID NO:484, codificado por exemplo, por SEQ ID NO:483,a fonte inicial dessa seqüência exemplar é desconhecida, tomando comobase a homologia de seqüência a enzimas conhecidas ele pode serclassificado na Família 10 de xilanases, com base na homologia deseqüência a enzimas conhecidas ele tem o número EC "previsto" de 3.2.1.8e tem atividade de xilanase; na última coluna à direita, os resultados deatividade enzimática sobre azo-xilano (o ensaio está descrito acima).

A segunda tabela, abaixo, são diagramas que descrevemcaracterísticas selecionadas de ácidos nucléicos e polipeptídeos exemplaresda invenção, incluindo comparação de identidade de seqüência dasseqüências exemplares com bases de dados públicas. Todas as seqüênciasdescritas nas Tabelas 2 e 3 (todas as seqüências exemplares da invenção)foram submetidas a uma pesquisa com BLAST (como descrito em detalhesabaixo) contra dois grupos de base de dados. O primeiro grupo de base dedados está disponível através do NCBI (National Center for BiotechnologyInformation). Todos os resultados das pesquisas contra essas bases dedados são encontrados nas colunas designadas "Descrição de NR", "Códigode Acesso de NR", "Valor-E de NR" ou Organismo de NR". "NR" refere-se àbase de dados de nucleotídeo não redundante mantida pelo NCBI. Essabase de dados é uma combinação de GenBank1 atualizações do GenBank eatualizações de EMBL. As entradas na coluna "Descrição de NR" se referemà linha de definição em qualquer registro dado de NCBI, que inclui umadescrição da seqüência, tal como o organismo fonte, nome do gene/nome daproteína e alguma descrição da função da seqüência. As entradas na coluna"Código de Acesso na NR" referem-se ao identificador único dado a umregistro de seqüência. As entradas na coluna "Valor-E de NR" referem-se aovalor Esperado (Valor-E), que representa a probabilidade de que um escorede alinhamento tão bom quanto um encontrado entre a seqüênciapesquisada (as seqüências da invenção) e a seqüência da base de dadospossa ser encontrada no mesmo número dé comparações entre seqüênciasaleatórias como foi feito na presente pesquisa BLAST. As entradas nacoluna Organismo de NR" referem-se ao organismo fonte da seqüênciaidentificada como a mais próxima da encontrada no BLAST. O segundogrupo de base de dados é coletivamente conhecido como base de dadosGENESEQ™, que está disponível através de Thomson Derwent (Filadélfia,PA). Todos os resultados das pesquisas contra essa base de dados sãoencontrados nas colunas designadas "Descrição de Proteína deGENESEQ™", "Código de Acesso de Proteína GENESEQ™", "Valor E deProteína GENESEQ™", "Descrição de DNA de GENESEQ™", "Código deAcesso de DNA de GENESEQ™", ou "Valor E de DNA de GENESEQ™". Ainformação encontrada nessas colunas é comparável à informaçãoencontrada nas colunas de NR descritas acima, exceto que ela foi derivadade pesquisas BLAST contra a base de dados GENESEQ™ ao invés da basede dados do NCBI. Além disso, essa tabela inclui a coluna "No. EC Previsto".Um número EC é o número designado para um tipo de enzima de acordocom um esquema de nomenclatura padronizada de enzima desenvolvidopelo Enzyme Commission of the Nomenclature Committee of theInternational Union of Biochemistry and Molecular Biology (IUBMB). Osresultados na coluna "No EC Previsto" são determinados por uma pesquisaBLAST contra a base de dados Kegg (Kyoto Encyclopedia of Genes andGenomes). Se a combinação mais importante de BLAST tem um Valor Eigual ou menor a e"6, o número EC designado para a combinação maisimportante é inserido na tabela. O número EC da combinação maisimportante é usado como um guia para o provável número EC da seqüênciada invenção. As colunas "Extensão do DNA Examinado" e "Extensão daProteína Examinada" referem-se ao número de nucleotídeos ou número deaminoácidos, respectivamente, na seqüência da invenção que foipesquisada ou examinada contra as bases de dados NCBI ou GENESEQ™.As colunas "Extensão do DNA de GENESEQ™ ou NR" e "Extensão daProteína de GENESEQ™ ou NR", referem-se ao número de nucleotídeos ounúmero de aminoácidos, respectivamente, na seqüência da combinaçãomais importante da pesquisa BLAST. Os resultados fornecidos nessascolunas são da pesquisa que retornou o Valor E mais baixo tanto da base dedados NCBI quanto da base de dados Geneseq. As colunas "% de ID deProteína de GENESEQ™ ou NR" e "% de ID de DNA de GENESEQ™ ouNR" referem-se ao percentual de identidade de seqüência entre a seqüênciada invenção e a seqüência da combinação mais importante de BLAST. Osresultados fornecidos por essas colunas são da pesquisa que retornou ovalor-E mais baixo tanto da base de dados NCBI quanto da base de dadosGENESEQ™.

<table>table see original document page 390</column></row><table><table>table see original document page 391</column></row><table><table>table see original document page 392</column></row><table><table>table see original document page 393</column></row><table><table>table see original document page 394</column></row><table><table>table see original document page 395</column></row><table><table>table see original document page 396</column></row><table><table>table see original document page 397</column></row><table>amplificação de DNA do solo.<table>table see original document page 398</column></row><table><table>table see original document page 399</column></row><table><table>table see original document page 400</column></row><table><table>table see original document page 401</column></row><table><table>table see original document page 402</column></row><table><table>table see original document page 403</column></row><table><table>table see original document page 404</column></row><table><table>table see original document page 405</column></row><table><table>table see original document page 406</column></row><table><table>table see original document page 407</column></row><table><table>table see original document page 408</column></row><table><table>table see original document page 409</column></row><table><table>table see original document page 410</column></row><table> 64<table>table see original document page 411</column></row><table><table>table see original document page 412</column></row><table><table>table see original document page 413</column></row><table><table>table see original document page 414</column></row><table><table>table see original document page 415</column></row><table><table>table see original document page 416</column></row><table><table>table see original document page 417</column></row><table><table>table see original document page 418</column></row><table><table>table see original document page 419</column></row><table><table>table see original document page 420</column></row><table><table>table see original document page 421</column></row><table><table>table see original document page 422</column></row><table><table>table see original document page 423</column></row><table>130 135 140

Tyr Ser Arg His Ala Arg Ser Ile Leu His Thr Cys Val His Gln Gly145 150 155 160

Glu Asp Gly Glu Gly Tyr Pro Met Trp Asn Pro Glu Asn His Leu Ile165 170 175

Lys Phe Ile Pro Glu Thr Glu Trp Thr Asp Pro Ser Tyr His Leu Pro

180 185 190

His Phe Tyr Glu Val Phe Ala Glu Arg Ala Asp Glu Ala Asp Arg Pro195 200 205

Phe Trp Ala Gln Ala Ala Lys Ala Ser Arg Glu Tyr Leu Val Thr Ala210 215 220

Cys His Pro Gln Thr Gly Met Asn Pro Glu Tyr Ser Asn Tyr Asp Gly225 230 235 240

Thr Pro His Val Asp Glu Arg Asp His Trp His Phe Tyr Ser Asp Ala245 250 255

Tyr Arg Thr Ala Gly Asn Ile Gly Leu Asp Cys Leu Trp Asn Gly Val

260 265 270

Val Pro Glu Leu Cys Asp Ala Asn Ala Arg Leu Gln Arg Phe Phe Leu275 280 285

Glu His Asp Arg Thr Cys Val Tyr Ala Ile Asp Gly Thr Pro Val Asp290 295 300

Glu Thr Val Leu His Pro Val Gly Phe Ile Ala Ala Thr Ala Glu Gly305 310 315 320

Ser Leu Ala Ala Met His Ser Gln Glu Pro Asp Ala Leu Asp Asn Ala325 330 335

Ile Arg Trp Val Arg Leu Leu Trp Asp Thr Pro Ile Arg Thr Gly Thr

340 345 350

Arg Arg Tyr Tyr Asp Asn Phe Leu Tyr Ala Phe Ala Phe Leu Ala Leu355 360 365

Ala Gly Glu Tyr Arg Thr Trp370 375

<210> 3<211> 2196<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 3

atgttcaaag aatggggaaa gaccgactcg gaaattacca caaaagtaaa caccgcgtggaacaaactgt ttgttaacgg ggtggaatcc ggagataatg ccgaaagaat ctatgtagag 120

actggaagcg acatggcgta catccatacc tttgacagca acgacgtgcg ctccgaagga 180

atgtcctacg gcatgatgat gtgcgtacag atgaacgatc agacaagatt taacaaactc 240

tggaaatggg caagaaccta tatgtacaat gaaacagacg ccggcagtaa ttccaggggc 300

tatttctcat ggcagtgcag tacaagcggc tcaaaaatgg ataagggccc cgctcctgac 360

480

ggcgaggaat actttattac ggcgctgttg ttcgcgcacg cccgctgggg gagcgcgtccggtactacaa acataaacaa ttacgcgcag caagcaaggc agattatcta tgacttaacg

gcggcgacca caagccgttc attctttgca aaaacgacaa acggtacaac cggacttggaccggattatg ccggctttga cggaacgcct aaaaatgaag gggatcacaa gtatttcgagtatgacgcgt ggcgtatcgc gatgaacata ggtatggact acgcgtggtt cgcgaaagattcctggcaga agacatttgc cgacagaatt caggcgttct ttgtcagcaa gggagtcact

60

600660

cgccgcaaac cggggaacgg agatccttac ggcgagcctt caatgtttaa tgtagacaac 540

tatatggtta gattcgccac acttggaaat tccgccacct ttacagaccc ctcataccatttaccggcat tctatgatgt ttgggcgctg gaattacagg cggactatga taatagtaaactctacggta tctgggctga taaggctgac ttgaaaaaag acattgatta ctttaaacaa 720

780840900960

tcttacggaa accgctggac attggacggg actcaaaggg gagcggatca ctcgccgggt 1020

cttgtcggct gtaacgcggt cgcctctctc gcggcgacaa acgcgaacgc gtggaaattt 1080

atcgaagact tctggaacat cagcatgacg aaaggcaaat accgttacta tgacggatgt 1140

ctgtatatga tgagcatgct gcacttaagc ggcaacttta aggcgtatct ttctacaaat 1200

accacgcccg ccaacagttc cagcattacc ccgacaaccg cgtctttcga caagaagaca 1260

agcgcacaag ccgacattgc cgtaacagtg acgcttaacg ggaatacatt ctcaagtatc 1320

acaaacaacg gtacagccct tacaagcggc acagactact cagtgagtgg aacaaagtat 1380

acgataaaga aagaatacct tgcaaaacag cctgtaggaa caacgaagct cgcattcaac 1440

ttcagtgccg gaggaactcc ggaacttaca gttactataa cggacacggg cagctccagc 1500

atcagcccga caaccgcgac attcgacaaa aagaccggag cgcaagccga catcgccgta 1560accatgacgc ttaatgggaa tactttgtcg aacatcaaaa acggttctgc acaacttaca 1620agcggaactg actactcaac gagcggcagt acggtaacga ttaaaaaaga atacctggca 1680

aagcaggcta acggcacagt aacgcttacc ttcacattca gcgcaggcgc ggcccaaact 1740attgacatca cggtaaaaga tacaaccggc ggagcggcgg gaataaaata caacttcgca 1800actgacaacc tgcccaacgg gtacccgaag tacagttcaa gtgatatatc cgcgacaata 1860accggaggag ctttggtaat aaccaaaacc ggaaataatt cgtccccgaa gattacattg 1920ccctttagtg taacaggtaa cctttccggt tatacaggca taaagataaa tgtaaaggga 1980gtatccggag atttcactta taaagtattg aatgccgcaa taggttctac aaatctcggc 2040agcgtaaata acgccccaat accaaacggc tcatttggag acgtaacaat accaataacc 2100ggcggtacaa acaccggaga tttagatata tcgttctggc tcaataacac aaatgcttac 2160gttattgaga ttaagagcat agagctggta aaatga 2196

<210> 4<211> 711<212> PRT<213> Desconhecido<220><223> Obtido para uma amostra ambiental<400> 4

Met Phe Lys Glu Trp Gly Lys Thr Asp Ser Glu Ile Thr Thr Lys Val1 5 10 15

Asn Thr Ala Trp Asn Lys Leu Phe Val Asn Gly Val Glu Ser Gly Asp20 25 30

Asn Ala Glu Arg Ile Tyr Val Glu Thr Gly Ser Asp Met Ala Tyr Ile35 40 45

His Thr Phe Asp Ser Asn Asp Val Arg Ser Glu Gly Met Ser Tyr Gly50 55 60

Met Met Met Cys Val Gln Met Asn Asp Gln Thr Arg Phe Asn Lys Leu65 70 75 80

Trp Lys Trp Ala Arg Thr Tyr Met Tyr Asn Glu Thr Asp Ala Gly Ser85 90 95

Asn Ser Arg Gly Tyr Phe Ser Trp Gln Cys Ser Thr Ser Gly Ser Lys100 105 HO

Met Asp Lys Gly Pro Ala Pro Asp Gly Glu Glu Tyr Phe Ile Thr Ala115 120 125

Leu Leu Phe Ala His Ala Arg Trp Gly Ser Ala Ser Gly Thr Thr Asn130 135 140

Ile Asn Asn Tyr Ala Gln Gln Ala Arg Gln Ile Ile Tyr Asp Leu Thr145 150 155 160

Arg Arg Lys Pro Gly Asn Gly Asp Pro Tyr Gly Glu Pro Ser Met Phe165 170 175

Asn Val Asp Asn Tyr Met Val Arg Phe Ala Thr Leu Gly Asn Ser Ala180 185 190

Thr Phe Thr Asp Pro Ser Tyr His Leu Pro Ala Phe Tyr Asp Val Trp195 200 205

Ala Leu Glu Leu Gln Ala Asp Tyr Asp Asn Ser Lys Leu Tyr Gly Ile210 215 220

Trp Ala Asp Lys Ala Asp Leu Lys Lys Asp Ile Asp Tyr Phe Lys Gln225 230 235 240

Ala Ala Thr Thr Ser Arg Ser Phe Phe Ala Lys Thr Thr Asn Gly Thr245 250 255

Thr Gly Leu Gly Pro Asp Tyr Ala Gly Phe Asp Gly Thr Pro Lys Asn260 265 270

Glu Gly Asp His Lys Tyr Phe Glu Tyr Asp Ala Trp Arg Ile Ala Met275 280 285

Asn Ile Gly Met Asp Tyr Ala Trp Phe Ala Lys Asp Ser Trp Gln Lys290 295 300

Thr Phe Ala Asp Arg Ile Gln Ala Phe Phe Val Ser Lys Gly Val Thr305 310 315 320

Ser Tyr Gly Asn Arg Trp Thr Leu Asp Gly Thr Gln Arg Gly Ala Asp325 330 335

His Ser Pro Gly Leu Val Gly Cys Asn Ala Val Ala Ser Leu Ala Ala340 345 350

Thr Asn Ala Asn Ala Trp Lys Phe Ile Glu Asp Phe Trp Asn Ile Ser355 360 365

Met Thr Lys Gly Lys Tyr Arg Tyr Tyr Asp Gly Cys Leu Tyr Met Met370 375 380

Ser Met Leu His Leu Ser Gly Asn Phe Lys Ala Tyr Leu Ser Thr Asn385 390 395 400

Thr Thr Pro Ala Asn Ser Ser Ser Ile Thr Pro Thr Thr Ala Ser Phe405 410 41510

15

20

25

30

35

40

45

50

55

60

65

425

Asp Lys Lys Thr Ser Ala Gln Ala Asp Ile Ala Val Thr Val Thr Leu 420 425 430 Asn Gly Asn Thr Phe Ser Ser Ile Thr Asn Asn Gly Thr Ala Leu Thr 435 440 445 Ser Gly 450 Thr Asp Tyr Ser Val 455 Ser Gly Thr Lys Tyr 460 Thr Ile Lys LysGlu Tyr Leu Ala Lys Gln Pro Val Gly Thr Thr Lys Leu Ala Phe Asn465 470 475 480Phe Ser Ala Gly Gly Thr Pro Glu Leu Thr Val Thr Ile Thr Asp Thr 485 490 495 Gly Ser Ser Ser Ile Ser Pro Thr Thr Ala Thr Phe Asp Lys Lys Thr 500 505 510 Gly Ala Gln Ala Asp Ile Ala Val Thr Met Thr Leu Asn Gly Asn Thr 515 520 525 Leu Ser 530 Asn Ile Lys Asn Gly 535 Ser Ala Gln Leu Thr 540 Ser Gly Thr AspTyr Ser Thr Ser Gly Ser Thr Val Thr Ile Lys Lys Glu Tyr Leu Ala545 550 555 560Lys Gln Ala Asn Gly Thr Val Thr Leu Thr Phe Thr Phe Ser Ala Gly 565 570 575 Ala Ala Gln Thr 580 Ile Asp Ile Thr Val 585 Lys Asp Thr Thr Gly 590 Gly AlaAla Gly Ile Lys Tyr Asn Phe Ala Thr Asp Asn Leu Pro Asn Gly Tyr 595 600 605 Pro Lys Tyr Ser Ser Ser Asp Ile Ser Ala Thr Ile Thr Gly Gly Ala 610 615 620 Leu Val Ile Thr Lys Thr Gly Asn Asn Ser Ser Pro Lys Ile Thr Leu625 630 635 640Pro Phe Ser Val Thr 645 Gly Asn Leu Ser Gly 650 Tyr Thr Gly Ile Lys 655 IleAsn Val Lys Gly Val Ser Gly Asp Phe Thr Tyr Lys Val Leu Asn Ala 660 665 670 Ala Ile Gly 675 Ser Thr Asn Leu Gly 680 Ser Val Asn Asn Ala 685 Pro Ile ProAsn Gly Ser Phe Gly Asp Val Thr Ile Pro Ile Thr Gly Gly Thr Asn

690 695 700

Thr Gly Asp Leu Asp Ile Ser705 710

<210> 5<211> 2106<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 5

atgcaaaacc tatttaagcg tgtgtttttc catcttctct tgcttgcctt gctggcaggctgtgctggcc cttctcccgt aacaccggag ccgaccgaaa tgccgaccca ggtccctacaccaacgccta gtcttggcgc ctacgagagc ggcgagtatc gcaacctgtt cgccgaggcgcttggcaaat cggatgccga aattcaggcc aaaatcgatg ccgctttcca acaacttttctacggcgacg atgtttctga gcgcgtctat tacccggttg gcagcgacat gggctatatgctcgacaccg gcaacgacga tgtgcgctcc gagggcatgt cctacggcat gatgattgccgtccagatga acaagaagga agaattcgac cgcatctgga agtggaccaa aacctacatgtaccagaccg aaggtggtta caaaggttat tttgcctggc acgctaaaac ggacggcacccaactggccg ccaacccggc ctctgacggt gaagtctggt ttgtgatggc gctcttctttgccgatgcgc gttggggcag cggcgaagga atttataact accgcgccca agcccaggaaattctcgatg tggccttgaa cgccaaagaa ttgggcggca acctggcgac caacctgttcgacccggaga ccaaacaggt cgtttttgtg ccgcagttgg gcaataactc gaaatttaccgacgcttcgt accacatgcc ccatttctac gagttgtggg cgcgttgggc cgataaaaataacgactttt gggccgaagc cgctaccgtt agccgcgagt tcctgcctac tgccgttcaccccgaaaccg gcctggcccc taactattcc tacttcgatg gccgccctta caatgacgagtatcacggcc agttccgcta cgacgctttc cgcgtgggcg cgaacatcgg catggattatgtctggtttc acccctctga atggtatcgg gaacaagcca accgccaatt atctttcttcgcatcccagg gcatcgatga ttatgttgcc gaatattccc tggatggaaa accgctggccgggcatcgcg ctacggggtt gattgccacc aatgctgtcc tggcctacgc cgcagaccccgaaattggtc aacccttcgt ccaggccctg tgggatgcag agcctccgac tggcaggtatcgctactatg acggcctgct ctacatgatg ggcctgctgc aagccagcgg caacttccgtatttacgagc cgggtattac gcctcgcgct gagttgccgc ccccgccgcc tcgcgccatcgagggccgct tcgcgcccat taccgggcgg gccttgcttc tgattggccc gaatgcggat 1380

ggcgtcaacg cttacttcga caaactggtg acagcgccgg gcggcgtgaa tgtcgaacta 1440

tcgctcaaat cgcctgattt ggaagcgctc gacgccctgg cgaggaaata tcccaacagc 1500

acgctttcgg tcgggttgtc gctggatggc ccggtaacag aggcggatgc gcgggtggga 1560

gaattgctcg acgcgttggc tgtttatccg cgcccggtct tcctgcgcat cgggccggaa 1620

tttgatttgg cggcgagcgg ccaggggccg gaggaatatg tcgcggcctg gaaaacgctc 1680

cataacgaga ttcaggcgcg gggtagttcg aatatcgccc tggtgtggca tagcgccgca 1740

gcctgcgagt cgccctttgg cggtcatccg ctcgaagcgt ggtatcccgg tgatgagttt 1800

gtggattggg tggccgtttc gcgcactgcg cagtctgccg attgcgaggg gcagtccgtt 1860

gaggccgtct tgcagtttgc gcgtgagcga tacaaaccgg ttgtgttggt tgcatcgcca 1920

gcagaggaca tcttcgagtt cgtttacgcc aacaacgacg tgattcgcgc cctgctgtat 1980

ctgaacaccg agccgggcct gttcgacacc cccgaatttt tgagcggctg gaaggccgaa 2040

atcggtcagc agttctggct gcgcggcggc ccggcgcttt tttcgacact cggattggat 2100

gagtaa 2106

<210> 6

<211> 701<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) .. . (47)<400> 6

Met Gln Asn Leu Phe Lys Arg Val Phe Phe His Leu Leu Leu Leu Ala1 5 10 15

Leu Leu Ala Gly Cys Ala Gly Pro Ser Pro Val Thr Pro Glu Pro Thr

20 25 30

Glu Met Pro Thr Gln Val Pro Thr Pro Thr Pro Ser Leu Gly Ala Tyr35 40 45

Glu Ser Gly Glu Tyr Arg Asn Leu Phe Ala Glu Ala Leu Gly Lys Ser

50 55 60

Asp Ala Glu Ile Gln Ala Lys Ile Asp Ala Ala Phe Gln Gln Leu Phe65 70 75 80

Tyr Gly Asp Asp Val Ser Glu Arg Val Tyr Tyr Pro Val Gly Ser Asp

85 90 95

Met Gly Tyr Met Leu Asp Thr Gly Asn Asp Asp Val Arg Ser Glu Gly

100 105 HO

Met Ser Tyr Gly Met Met Ile Ala Val Gln Met Asn Lys Lys Glu Glu

115 120 125

Phe Asp Arg Ile Trp Lys Trp Thr Lys Thr Tyr Met Tyr Gln Thr Glu

130 135 140

Gly Gly Tyr Lys Gly Tyr Phe Ala Trp His Ala Lys Thr Asp Gly Thr145 150 155 160

Gln Leu Ala Ala Asn Pro Ala Ser Asp Gly Glu Val Trp Phe Val Met

165 170 175

Ala Leu Phe Phe Ala Asp Ala Arg Trp Gly Ser Gly Glu Gly Ile Tyr

180 185 190

Asn Tyr Arg Ala Gln Ala Gln Glu Ile Leu Asp Val Ala Leu Asn Ala

195 200 205

Lys Glu Leu Gly Gly Asn Leu Ala Thr Asn Leu Phe Asp Pro Glu Thr

210 215 220

Lys Gln Val Val Phe Val Pro Gln Leu Gly Asn Asn Ser Lys Phe Thr225 230 235 240

Asp Ala Ser Tyr His Met Pro His Phe Tyr Glu Leu Trp Ala Arg Trp

245 250 255

Ala Asp Lys Asn Asn Asp Phe Trp Ala Glu Ala Ala Thr Val Ser Arg

260 265 270

Glu Phe Leu Pro Thr Ala Val His Pro Glu Thr Gly Leu Ala Pro Asn

275 280 285

Tyr Ser Tyr Phe Asp Gly Arg Pro Tyr Asn Asp Glu Tyr His Gly Gln

290 295 300

Phe Arg Tyr Asp Ala Phe Arg Val Gly Ala Asn Ile Gly Met Asp Tyr305 310 315 320

Val Trp Phe His Pro Ser Glu Trp Tyr Arg Glu Gln Ala Asn Arg Gln

325 330 335

Leu Ser Phe Phe Ala Ser Gln Gly Ile Asp Asp Tyr Val Ala Glu Tyr340 345 350

Ser Leu Asp Gly Lys Pro Leu Ala Gly His Arg Ala Thr Gly Leu Ile

355 360 365

Ala Thr Asn Ala Val Leu Ala Tyr Ala Ala Asp Pro Glu Ile Gly Gln370 375 380

Pro Phe Val Gln Ala Leu Trp Asp Ala Glu Pro Pro Thr Gly Arg Tyr385 390 395 400

Arg Tyr Tyr Asp Gly Leu Leu Tyr Met Met Gly Leu Leu Gln Ala Ser405 410 415

Gly Asn Phe Arg Ile Tyr Glu Pro Gly Ile Thr Pro Arg Ala Glu Leu420 425 430

Pro Pro Pro Pro Pro Arg Ala Ile Glu Gly Arg Phe Ala Pro Ile Thr

435 440 445

Gly Arg Ala Leu Leu Leu Ile Gly Pro Asn Ala Asp Gly Val Asn Ala450 455 460

Tyr Phe Asp Lys Leu Val Thr Ala Pro Gly Gly Val Asn Val Glu Leu465 470 475 480

Ser Leu Lys Ser Pro Asp Leu Glu Ala Leu Asp Ala Leu Ala Arg Lys485 490 495

Tyr Pro Asn Ser Thr Leu Ser Val Gly Leu Ser Leu Asp Gly Pro Val500 505 510

Thr Glu Ala Asp Ala Arg Val Gly Glu Leu Leu Asp Ala Leu Ala Val

515 520 525

Tyr Pro Arg Pro Val Phe Leu Arg Ile Gly Pro Glu Phe Asp Leu Ala530 535 540

Ala Ser Gly Gln Gly Pro Glu Glu Tyr Val Ala Ala Trp Lys Thr Leu545 550 555 560

His Asn Glu Ile Gln Ala Arg Gly Ser Ser Asn Ile Ala Leu Val Trp565 570 575

His Ser Ala Ala Ala Cys Glu Ser Pro Phe Gly Gly His Pro Leu Glu580 585 590

Ala Trp Tyr Pro Gly Asp Glu Phe Val Asp Trp Val Ala Val Ser Arg595 600 605

Thr Ala Gln Ser Ala Asp Cys Glu Gly Gln Ser Val Glu Ala Val Leu610 615 620

Gln Phe Ala Arg Glu Arg Tyr Lys Pro Val Val Leu Val Ala Ser Pro625 630 635 640

Ala Glu Asp Ile Phe Glu Phe Val Tyr Ala Asn Asn Asp Val Ile Arg645 650 655

Ala Leu Leu Tyr Leu Asn Thr Glu Pro Gly Leu Phe Asp Thr Pro Glu660 665 670

Phe Leu Ser Gly Trp Lys Ala Glu Ile Gly Gln Gln Phe Trp Leu Arg675 680 685

Gly Gly Pro Ala Leu Phe Ser Thr Leu Gly Leu Asp Glu690 695 700

<210> 7<211> 1539<212> DNA<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 7

atggcacgtt taatcaccta ttgcttgatc ggcgtcttac tcgtgatgcc agtccttgccgcttgcagca cagcacctac gccaacgctg atgagccagc caacttccac gccgcaaccggccctgcaac cgacgccacc accgacgagc gtcccccggt cgatcggggc gtttgagtcc 180

240300360420480540600660

ggtcagtatc gtaatctctt cacggaatta ctgggcaaga gcgaggccga gattcagcag

aagatcgatc aggcgtgggc gcagttgttc tacggcgaca acgacacgca gcgcgtttac

tatcccgtgg gtcgcgacag ggcctacatc aaagacatcg gcaacaatga tgtgcgcagt

gagggtatgt cgtacggtat gatgctggcg gtgcagctgg acaagcagga agagttcaac

aaattgtgga agtgggcgca cacctatatg ctgcaaaagg atggcccgta caaaggctat

tttgcgtggc atgccaatga gaacggtgaa cagctggatg cgggtcccgc ctccgatggc

gaagagtggt ttgtcatggc actgctcttc gcggcaaatc gctggggcaa cggtgaaggc

atctttaatt atcaggccga ggcgcagaag atcctggatg tgatgctgca taagagcgaa

60120

gaggacaacg gtctcgccac cagcatgttc gatccggaca cgaagcaggt ggtgtttgtg 720

ccggccgggc gccaggccac attcaccgat ccgtcttatc acttgcccgc gttctatgaactgtgggcgc gctgggctga caaggataac gatttttgga aagaagcggc gcaggccagccgcgaatttt ggaagaaggc ggcgcatccg gaaacgggcc tgatgtctga ctacgccgag

780840900428

tttgacggca gaccccaggc cgattctgaa cacaaggatt ttcgctatga cgcgttccgtgtggcgtcca atgtggcgct cgattgggcc tggttcgccg ccgatccgtg ggaggtggaacagagcaatc ggttgttgga tttcttccgt tcacaaggca tggataagta tccgagtctatacaacatcg atggcacgcc gttatccact aatcgctcgc cgggtttgat cgccatgaacgccacagctg gactcgcggc tgatccggaa aagagcaagg actttgtgca ggcgctatgggatctggaaa ttcccagcgg acaatggcgc tattacgatg gggtgctgta tttcctggcgctgttgcaag ccagcggcaa ctatcgcatc tacacgcccg atatgcccaa ggtggtgcggcccacaccta cgcccgatcc gatcacgcaa gcgaaatttg cacccggcga tgacgcggtgctgttcagtg tggaaacaga tgcactcgac gaatatgtga cggcgacggg ctttgagccgggcggcgtga tgttgaacac tactttggac agcgcctctt ttgacgcacc actgcctgacagcgctctgc tgatcggatt ggacgtcagc gatcaataa<210> 8<211> 512<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(57)<400> 8

Met Ala Arg Leu Ile Thr Tyr Cys Leu Ile Gly Val Leu Leu Val Met1 5 10 15 Pro Val Leu Ala 20 Ala Cys Ser Thr Ala 25 Pro Thr Pro Thr Leu 30 Met SerGln Pro Thr 35 Ser Thr Pro Gln Pro 40 Ala Leu Gln Pro Thr 45 Pro Pro ProThr Ser Val Pro Arg Ser Ile Gly Ala Phe Glu Ser Gly Gln Tyr Arg 50 55 60 Asn Leu Phe Thr Glu Leu Leu Gly Lys Ser Glu Ala Glu Ile Gln Gln65 70 75 80Lys Ile Asp Gln Ala Trp Ala Gln Leu Phe Tyr Gly Asp Asn Asp Thr 85 90 95 Gln Arg Val Tyr Tyr Pro Val Gly Arg Asp Arg Ala Tyr Ile Lys Asp 100 105 110 Ile Gly Asn Asn Asp Val Arg Ser Glu Gly Met Ser Tyr Gly Met Met 115 120 125 Leu Ala 130 Val Gln Leu Asp Lys 135 Gln Glu Glu Phe Asn 140 Lys Leu Trp LysTrp Ala His Thr Tyr Met Leu Gln Lys Asp Gly Pro Tyr Lys Gly Tyr145 150 155 160Phe Ala Trp His Ala Asn Glu Asn Gly Glu Gln Leu Asp Ala Gly Pro 165 170 175 Ala Ser Asp Gly Glu Glu Trp Phe Val Met Ala Leu Leu Phe Ala Ala 180 185 190 Asn Arg Trp 195 Gly Asn Gly Glu Gly 200 Ile Phe Asn Tyr Gln 205 Ala Glu AlaGln Lys 210 Ile Leu Asp Val Met 215 Leu His Lys Ser Glu 220 Glu Asp Asn GlyLeu Ala Thr Ser Met Phe Asp Pro Asp Thr Lys Gln Val Val Phe Val225 230 235 240Pro Ala Gly Arg Gln Ala Thr Phe Thr Asp Pro Ser Tyr His Leu Pro 245 250 255 Ala Phe Tyr Glu 260 Leu Trp Ala Arg Trp 265 Ala Asp Lys Asp Asn 270 Asp PheTrp Lys Glu Ala Ala Gln Ala Ser Arg Glu Phe Trp Lys Lys Ala Ala 275 280 285 His Pro 290 Glu Thr Gly Leu Met 295 Ser Asp Tyr Ala Glu 300 Phe Asp Gly ArgPro Gln Ala Asp Ser Glu His Lys Asp Phe Arg Tyr Asp Ala Phe Arg305 310 315 320Val Ala Ser Asn Val 325 Ala Leu Asp Trp Ala 330 Trp Phe Ala Ala Asp 335 ProTrp Glu Val Glu Gln Ser Asn Arg Leu Leu Asp Phe Phe Arg Ser Gln 340 345 350 Gly Met Asp Lys Tyr Pro Ser Leu Tyr Asn Ile Asp Gly Thr Pro Leu 355 360 365Ser Thr 370 Asn Arg Ser Pro Gly 375 Leu Ile Ala Met Asn 380 Ala Thr Ala Gly Leu Ala Ala Asp Pro Glu Lys Ser Lys Asp Phe Val Gln Ala Leu Trp 385 390 395 400 Asp Leu Glu Ile Pro Ser Gly Gln Trp Arg Tyr Tyr Asp Gly Val Léu 405 410 415 Tyr Phe Leu Ala Leu Leu Gln Ala Ser Gly Asn Tyr Arg Ile Tyr Thr 420 425 430 Pro Asp Met Pro Lys Val Val Arg Pro Thr Pro Thr Pro Asp Pro Ile 435 440 445 Thr Gln 450 Ala Lys Phe Ala Pro 455 Gly Asp Asp Ala Val 460 Leu Phe Ser Val Glu Thr Asp Ala Leu Asp Glu Tyr Val Thr Ala Thr Gly Phe Glu Pro 465 470 475 480 Gly Gly Val Met Leu Asn Thr Thr Leu Asp Ser Ala Ser Phe Asp Ala 485 490 495 Pro Leu Pro Asp 500 Ser Ala Leu Leu Ile 505 Gly Leu Asp Val Ser 510 Asp Gln <210> 9 <211> 1311 <212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental

<400> 9

atgtttccac gtctttcacc aagccgcttc aggcaagttaggccttgtgt cactgaccgg ttgtgcaggt aacagcaagcgctggtgccg ttgctaccgg cgagtaccgc aatctgtttgatagacatcc agcgcaaaat tgacgaggcg tttcagcactgatgcagctg tctactatca agcgggtgga aacgagaatggatgtgaaca gcaatgacgt gcgctcagaa ggcatgagctcaaatggaca aaaaagccga gttcgatgca atctggaactcaagactccc ccacgcatcc agcgtttggt tactttgcctgtcgccaatg acgatatgcc agcgccagat ggcgaggaatttcgccgccg cccgctgggg taatggcgaa ggtattttcaaccattttga gccgcatgcg ccaccgccag gtgatcaccgatgactgcga ccaatctgtt ccacccggaa gaggcgcaagaataatgctg atcatacaga cgcgtcttac catctgccctcgtgtcgcgc cgcaagaaga tcgcgcgttt tgggccaaagtattttgcca aagccgccca ccctgtcact gcgttaacacggcaccccgt gggcggcatc ctggcggccg gagtcggtagcgttccgtca tgaactggtc catggactat gcctggtggggcgcgcagtg ataaattact cgcgttcttc gaaacccaggtatagcctgg atggcaaacc gctgggtggt ggaccgacccgcaacggcag ctatggcagc tactgatccc cgctggcacacaacaacaac cccccacagg gcaataccgg tactacgacgctgctacatt gcgctgggga gtacaaagcg tggatccccg<210> 10<211> 436<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220><221> SIGNAL

<222> (1) ... (36)<400> 10

Met Phe Pro Arg Leu Ser Pro Ser Arg Phe Arg1 5 10

Leu Leu Thr Leu Gly Leu Val Ser Leu Thr Gly20 25

Lys Pro Asp Ala Asp Thr Ser Thr Ala Gly Ala

35 40

Tyr Arg Asn Leu Phe Ala Glu Ile Gly Lys Ser50 55

Arg Lys Ile Asp Glu Ala Phe Gln His Leu Phe65 70 75

ccttaaccttcggatgcagaccgaaatcggtgttttatgggtccactcgcacggcatgatgggcgaaaacggtccatgcgatttcgtgacactaccaacagcccaaccaatgcgcttcaccgttctatgacggccgatgtcggactacggattttcgatagcaaagattcaaggcaaaattcggcctaatattttgtggagtgttctataacggggaata

gctcacgctccaccagtactaaaaagcgaacgacgcgaaaatatgtttacgattactgttctatatgtatccgcgatggtcgctctctatggaagcggactcgcggagtagcccgacatcaatttgggcagagccgcgactaattttgatcgatgcctggaggcgcacctgaaccacctcttccatgaataaagctctggcctgatggcga

Gln Val Thr Leu Thr15

Cys Ala Gly Asn Ser30

Val Ala Thr Gly Glu45

Glu Ile Asp Ile Gln60

Tyr Gly Asp Ala Lys80

60120180240300360420480540600660720780840900960102010801140120012601311430

Asp Ala Ala Val Tyr Tyr Gln Ala Gly Gly Asn Glu Asn Gly Pro Leu 85 90 95 Ala Tyr Val Tyr Asp Val Asn Ser Asn Asp Val Arg Ser Glu Gly Met 100 105 110 Ser Tyr Gly Met Met Ile Thr Val Gln Met Asp Lys Lys Ala Glu Phe 115 120 125 Asp Ala 130 Ile Trp Asn Trp Ala 135 Lys Thr Tyr Met Tyr 140 Gln Asp Ser ProThr His Pro Ala Phe Gly Tyr Phe Ala Trp Ser Met Arg Arg Asp Gly145 150 155 160Val Ala Asn Asp Asp 165 Met Pro Ala Pro Asp 170 Gly Glu Glu Tyr Phe 175 ValThr Ala Leu Tyr Phe Ala Ala Ala Arg Trp Gly Asn Gly Glu Gly Ile 180 185 190 Phe Asn Tyr 195 Gln Gln Glu Ala Asp 200 Thr Ile Leu Ser Arg 205 Met Arg HisArg Gln Val Ile Thr Gly Pro Thr Asn Arg Gly Val Met Thr Ala Thr 210 215 220 Asn Leu Phe His Pro Glu Glu Ala Gln Val Arg Phe Thr Pro Asp Ile225 230 235 240Asn Asn Ala Asp His Thr Asp Ala Ser Tyr His Leu Pro Ser Phe Tyr 245 250 255 Glu Ile Trp Ala Arg Val Ala Pro Gln Glu Asp Arg Ala Phe Trp Ala 260 265 270 Lys Ala Ala Asp Val Ser Arg Asp Tyr Phe Ala Lys Ala Ala His Pro 275 280 285 Val Thr 290 Ala Leu Thr Pro Asp 295 Tyr Gly Asn Phe Asp 300 Gly Thr Pro TrpAla Ala Ser Trp Arg Pro Glu Ser Val Asp Phe Arg Tyr Asp Ala Trp.305 310 315 320Arg Ser Val Met Asn Trp Ser Met Asp Tyr Ala Trp Trp Gly Lys Asp 325 330 335 Ser Gly Ala Pro Ala Arg Ser Asp Lys Leu Leu Ala Phe Phe Glu Thr 340 345 350 Gln Glu Gly 355 Lys Met Asn His Leu 360 Tyr Ser Leu Asp Gly 365 Lys Pro LeuGly Gly 370 Gly Pro Thr Leu Gly 375 Leu Ile Ser Met Asn 380 Ala Thr Ala AlaMet Ala Ala Thr Asp Pro Arg Trp His Asn Phe Val Glu Lys Leu Trp385 390 395 400Gln Gln Gln Pro Pro Thr Gly Gln Tyr Arg Tyr Tyr Asp Gly Val Leu 405 410 415 Tyr Leu Met Ala Leu Leu His Cys Ala Gly Glu Tyr Lys Ala Trp Ile 420 425 430

Pro Asp Gly Glu435

<210> 11<211> 1224<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 11

atgcggaacg tcgtgcgtaa accattgaca atcggactcg ctttaacact attattgcccatgggaatga cggcaacatc agcgaagaat gcagattcct atgcgaaaaa acctcacatcagcgcattga atgccccaca attggatcaa cgctacaaaa acgagttcac gattggtgcggcagtagaac cttatcaact acaaaatgaa aaagacgtac aaatgctaaa gcgccacttcaacagcattg ttgccgagaa cgtaatgaaa ccgatcagca ttcaacctga ggaaggaaaattcaattttg aacaagcgga tcgaattgtg aagttcgcta aggcaaatgg catggatattcgcttccata cactcgtttg gcacagccaa gtacctcaac ggttctttct tgacaaggaaggtaagccaa tggtcaatga aacagatcca gtgaaacgtg aacaaaataa acaactgctgttaaaacgac ttgaaactca tattaaaacg atcgtcgagc ggtacaaaga tgacattaagtactgggacg ttgtaaatga ggttgtgggg gacgacggaa aactgcgcaa ctctccatggtatcaaatcg ccggcatcga ttatattaaa gtggcattcc aagcagctag aaaatatggcggagacaaca ttaagcttta catgaatgat tacaatacag aagtcgaacc gaagcgaaccgctctttaca atttagtcaa acaactgaaa gaagagggtg ttccgatcga cggcatcggccatcaatccc acatccaaat cggctggcct tctgaagcag aaatcgagaa aacgattaacatgttcgccg ctttcggttt agacaaccaa atcactgagc ttgatgtgag catgtacggt 900

tggccgccgc gcgcttaccc gacgtatgac gccattccaa aacaaaagtt tttggatcag 960

gcagcgcgct atgatcgttt gttcaaactg tatgagaagt tgagcgataa aattagcaac 1020

gtcaccttct ggggcatcgc cgacaatcat acgtggctcg acagccgtgc ggatgtgtac 1080

tatgacgcca acgggaatgt tgtggttgac ccgaacgctc cgtacgcaaa agtggaaaaa 1140

gggaaaggaa aagatgcgcc gttcgttttt ggaccggatt acaaagtcaa acccgcatat 1200

tgggctatta ttgaccacaa atag 1224<210> 12<211> 407<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220><221> SIGNAL

<222> (1)...(28)<400> 12

Met Arg Asn Val Val Arg Lys Pro Leu Thr Ile Gly Leu Ala Leu Thr1 5 10 15

Leu Leu Leu Pro Met Gly Met Thr Ala Thr Ser Ala Lys Asn Ala Asp20 25 30

Ser Tyr Ala Lys Lys Pro His Ile Ser Ala Leu Asn Ala Pro Gln Leu

35 40 45

Asp Gln Arg Tyr Lys Asn Glu Phe Thr Ile Gly Ala Ala Val Glu Pro50 55 60

Tyr Gln Leu Gln Asn Glu Lys Asp Val Gln Met Leu Lys Arg His Phe65 70 75 80

Asn Ser Ile Val Ala Glu Asn Val Met Lys Pro Ile Ser Ile Gln Pro85 90 95

Glu Glu Gly Lys Phe Asn Phe Glu Gln Ala Asp Arg Ile Val Lys Phe100 105 HO

Ala Lys Ala Asn Gly Met Asp Ile Arg Phe His Thr Leu Val Trp His

115 120 125

Ser Gln Val Pro Gln Arg Phe. Phe Leu Asp Lys Glu Gly Lys Pro Met130 135 140

Val Asn Glu Thr Asp Pro Val Lys Arg Glu Gln Asn Lys Gln Leu Leu145 150 155 160

Leu Lys Arg Leu Glu Thr His Ile Lys Thr Ile Val Glu Arg Tyr Lys165 170 175

Asp Asp Ile Lys Tyr Trp Asp Val Val Asn Glu Val Val Gly Asp Asp180 185 190

Gly Lys Leu Arg Asn Ser Pro Trp Tyr Gln Ile Ala Gly Ile Asp Tyr

195 200 205

Ile Lys Val Ala Phe Gln Ala Ala Arg Lys Tyr Gly Gly Asp Asn Ile

210 215 220

Lys Leu Tyr Met Asn Asp Tyr Asn Thr Glu Val Glu Pro Lys Arg Thr225 230 235 240

Ala Leu Tyr Asn Leu Val Lys Gln Leu Lys Glu Glu Gly Val Pro Ile245 250 255

Asp Gly Ile Gly His Gln Ser His Ile Gln Ile Gly Trp Pro Ser Glu260 265 270

Ala Glu Ile Glu Lys Thr Ile Asn Met Phe Ala Ala Phe Gly Leu Asp

275 280 285

Asn Gln Ile Thr Glu Leu Asp Val Ser Met Tyr Gly Trp Pro Pro Arg290 295 300

Ala Tyr Pro Thr Tyr Asp Ala Ile Pro Lys Gln Lys Phe Leu Asp Gln305 310 315 320

Ala Ala Arg Tyr Asp Arg Leu Phe Lys Leu Tyr Glu Lys Leu Ser Asp325 330 335

Lys Ile Ser Asn Val Thr Phe Trp Gly Ile Ala Asp Asn His Thr Trp340 345 350

Leu Asp Ser Arg Ala Asp Val Tyr Tyr Asp Ala Asn Gly Asn Val Val

355 360 365

Val Asp Pro Asn Ala Pro Tyr Ala Lys Val Glu Lys Gly Lys Gly Lys370 375 380

Asp Ala Pro Phe Val Phe Gly Pro Asp Tyr Lys Val Lys Pro Ala Tyr385 390 395 400432

Trp Ala Ile Ile Asp His Lys405

<210> 13<211> 1053<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 13

atgaaagacg cgctccagtg ctctcccctt ttcaaagcct atgaaaaata cttccgcatc 60

ggcgcggcgg ttagcagctt catgaccttt gatcccgctt accgcgccct gatccgccgc 120

cattacaatt ccctgacggc ggacaaccag atgaagccgg aaagcgtgtt ggatcgcacc 180

gcgaccctgg cgaagggcga cctgctccac gctgcggtgg atttcacccg tgtggacgcg 240

ctgatgtact ttgcacggga caacgggatc cccatgcggt atcacaccct ggcctggcac 300

aaccagacgc cccgctggtt cttcgcgaag gactggagcg acgcggaaag cgccgaaccc 360

gcctcaaagg aaaccatgct tgcccgtctg gaaaactata tcctggatgt catgaaccat 420

gtgaatacca agtttcccgg tctggtttac acctgggacg tggtaaacga agccattgag 480

ccagagctga aagccccggg attgtaccgg acctggagcc cctggttcaa aacctgcgga 540

gaagatttcc tctttaccgc tttccgggcc gcccgcaagg gacaggcgcc cggtcagacc 600

ctttgctata acgactataa cgccttcgag cccgtcaagc gggacgcgat tatcgatctg 660

ctgaagaagc tgcaggcgga aaacctggtg gataccatgg gtatgcaggg gcattatgtc 720

atggactgga tgaacatctc gctctgcgaa gaggccgccc gcgcctatgc cgccctgggc 780

ctgaaggtcc aggtcaccga gctggatatc cactgcaaca gcgacgatga agcccacagc 840

caaaagctgg cgcagcttta cggcgattat ttcgccatgc tgaagaagct gaaggaggaa 900

ggcgtcgaca tcgaagccgt caccttctgg ggcgtcaccg accaggacag ctggctcaccggtttccgta aagagacaag ctatcccctc ctcttcgacc gcgccaagca ggccaaggatgcctatgacg ccgtcatgaa agccgcggaa taa 1°53

<210> 14<211> 350<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 14

Met Lys Asp Ala Leu Gln Cys Ser Pro Leu Phe Lys Ala Tyr Glu Lys

1 5 10 15

Tyr Phe Arg Ile Gly Ala Ala Val Ser Ser Phe Met Thr Phe Asp Pro

20 25 30

Ala Tyr Arg Ala Leu Ile Arg Arg His Tyr Asn Ser Leu Thr Ala Asp

35 40 45

Asn Gln Met Lys Pro Glu Ser Val Leu Asp Arg Thr Ala Thr Leu Ala

50 55 60

Lys Gly Asp Leu Leu His Ala Ala Val Asp Phe Thr Arg Val Asp Ala65 70 75 80

Leu Met Tyr Phe Ala Arg Asp Asn Gly Ile Pro Met Arg Tyr His Thr 85 90 95 Leu Ala Trp His Asn Gln Thr Pro Arg Trp Phe Phe Ala Lys Asp Trp 100 105 110 Ser Asp Ala 115 Glu Ser Ala Glu Pro 120 Ala Ser Lys Glu Thr 125 Met Leu AlaArg Leu 130 Glu Asn Tyr Ile Leu 135 Asp Val Met Asn His 140 Val Asn Thr LysPhe Pro Gly Leu Val Tyr Thr Trp Asp Val Val Asn Glu Ala Ile Glu145 150 155 160Pro Glu Leu Lys Ala Pro Gly Leu Tyr Arg Thr Trp Ser Pro Trp Phe 165 170 175 Lys Thr Cys Gly Glu Asp Phe Leu Phe Thr Ala Phe Arg Ala Ala Arg 180 185 190 Lys Gly Gln Ala Pro Gly Gln Thr Leu Cys Tyr Asn Asp Tyr Asn Ala 195 200 205 Phe Glu Pro Val Lys Arg Asp Ala Ile Ile Asp Leu Leu Lys Lys Leu 210 215 220 Gln Ala Glu Asn Leu Val Asp Thr Met Gly Met Gln Gly His Tyr Val225 230 235 240Met Asp Trp Met Asn Ile Ser Leu Cys Glu Glu Ala Ala Arg Ala Tyr 245 250 255 Ala Ala Leu Gly Leu Lys Val Gln Val Thr Glu Leu Asp Ile His Cys

9601020260 265

Asn Ser Asp Asp Glu Ala His Ser Gln Lys Leu

275 280

Asp Tyr Phe Ala Met Leu Lys Lys Leu Lys Glu

290 295

Glu Ala Val Thr Phe Trp Gly Val Thr Asp Gln305 310 315

Gly Phe Arg Lys Glu Thr Ser Tyr Pro Leu Leu

325 330

Gln Ala Lys Asp Ala Tyr Asp Ala Val Met Lys340 345

<210> 15

<211> 1110

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 15

atgaaacgtc ctctagtcaa tctcctgaca accgcctgccgcagaaccca ccctccgcga agcctacgaa aagcactttgaccgctcaag tgactggtcg aaacaaagcc gcaggcgaactccatcaccg ctgagaatga catgaagtgg caatcgcttccgctttgaat cggccgatgc ctatatcgac tttgccaaaaggccacactc tcgtctggca cagccagacc cctcagtgggaaacccgcga cacgggaaga acttctcaag cggatgcgcgggccgataca agggtaaggt caagggctgg gacgtcgtcaggtcaggaca ttctacgcga atctccgtgg cggcgaatcacacgctttcc gctacgcccg cgaagccgac ccaaaggcagaacctcgaaa tccctcgcaa acgcgagaac tgcatcaagccgcggcgtcc ccatcgacgg cattggaacg caatcccattctggaagatg tcgagaccac gattgaagag tttggaaaacaccgaactcg atgtggatgt cctccctcgc aataacccagcgcgagcaag gtagcaatcc ctacactgag ggcctgcccgacgaaacgct acgaagacat cttcaagatc tacctaaagcgtgaccttct ggggcctcga tgatggtcaa tcatggttgacgcaccaatc acccgctact tttcgatcgt gaactcaaacttgatagagc tcggcaagaa gaagcgataa<210> 16<211> 369<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL

270

Ala Gln Leu Tyr Gly285

Glu Gly Val Asp Ile300

Asp Ser Trp Leu Thr320

Phe Asp Arg Ala Lys335

Ala Ala Glu350

tcctcgttgcccgtgggtgttcgccgcgaaatccagagctagaatgagattgttccaaggatcacattcaatgaggcgcttcggagacgaaactttactatcgtcaagggttcagcttggtcggccttaagcgtcgccgaaggatgttcaaccagaaaacatggctttcccgaagcccgt

cgcaaatgctcgcactcaatgcagttcaatcgatacctacggaagtcatacgacgatggccaaggtcgccctccgacggatttcatcgatcaacgactaccatgcttgagcttcccatcgggtcatgattcatcagtcagaaagcagcttggtcacccgctgttagaggctcttccagtc

<222> (1)... . (20) <400> 16 Met Lys Arg Pro Leu Val Asn Leu Leu Thr Thr Ala Cys Leu Leu Val 1 5 10 15 Ala Ala Asn Ala 20 Ala Glu Pro Thr Leu 25 Arg Glu Ala Tyr Glu 30 Lys His Phe Ala Val Gly Val Ala Leu Asn Thr Ala Gln Val Thr Gly Arg Asn 35 40 45 Lys Ala Ala Gly Glu Leu Ala Ala Lys Gln Phe Asn Ser Ile Thr Ala 50 55 60 Glu Asn Asp Met Lys Trp Gln Ser Leu His Pro Glu Leu Asp Thr Tyr 65 70 75 80 Arg Phe Glu Ser Ala 85 Asp Ala Tyr Ile Asp 90 Phe Ala Lys Lys Asn 95 Glu Met Glu Val Ile 100 Gly His Thr Leu Val 105 Trp His Ser Gln Thr 110 Pro Gln Trp Val Phe 115 Gln Gly Asp Asp Gly 120 Lys Pro Ala Thr Arg 125 Glu Glu Leu Leu Lys Arg Met Arg Asp His Ile His Lys Val Ala Gly Arg Tyr Lys 130 135 140 Gly Lys Val Lys Gly Trp Asp Val Val Asn Glu Ala Leu Ser Asp Gly 145 150 155 160

60120180240300360420480540600660720780840900960102010801110434

Gly Gln Asp Ile Leu Arg Glu Ser Pro Trp Arg Arg Ile Ile Gly Asp

165 170 175

Asp Phe Ile Asp His Ala Phe Arg Tyr Ala Arg Glu Ala Asp Pro Lys

180 185 190

Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Leu Glu Ile Pro Arg Lys Arg

195 200 205

Glu Asn Cys Ile Lys Leu Val Lys Gly Met Leu Glu Arg Gly Val Pro

210 215 220

Ile Asp Gly Ile Gly Thr Gln Ser His Phe Gln Leu Gly Phe Pro Ser225 230 235 240

Leu Glu Asp Val Glu Thr Thr Ile Glu Glu Phe Gly Lys Leu Gly Leu

245 250 255

Lys Val Met Ile Thr Glu Leu Asp Val Asp Val Leu Pro Arg Asn Asn

260 265 270

Pro Gly Val Ala Asp Ile Ser Gln Arg Glu Gln Gly Ser Asn Pro Tyr

275 280 285

Thr Glu Gly Leu Pro Glu Asp Val Gln Lys Gln Leu Thr Lys Arg Tyr

290 295 300

Glu Asp Ile Phe Lys Ile Tyr Leu Lys His Gln Lys Thr Val Thr Arg305 310 315 320

Val Thr Phe Trp Gly Leu Asp Asp Gly Gln Ser Trp Leu Asn Gly Phe

325 330 335

Pro Val Arg Gly Arg Thr Asn His Pro Leu Leu Phe Asp Arg Glu Leu

340 345 350

Lys Pro Lys Pro Val Leu Pro Val Leu Ile Glu Leu Gly Lys Lys Lys355 360 365

Arg

<210> 17<211> 1035<212> DNA<213> Bactéria<400> 17

atgtcccggc acgtcatcgc cctgtccgcc gccgtctgcc tcgcggccgg cctcgccgccgcgcccgcga gcgccgagcc gcgtccccgg acgctcggcg aactggccaa gaagcaccac 120

..... 180

240300360420480540600660

60

aagtacttcg gctcggccac cgacaacccc gagttcaccg acgccgccta tctgaãgctcctcggcagcg agttcgggca gaccaccccc ggcaacgcca tgaagtggta cgccaccgaacccgcgcccg gcgtcttcga cttcaccgcg ggcgacgagg tcgtggcctt cgccaaggcccatcaccaga aggtccgcgg ccacaccctc gtctggcaca gccagctccc cgcctggctcaccgagcgca gctggaccgc cgcggaactg cgccccgtcc tcaagaatca catccagaaggtggcccggc actacaaggg caaggtcatc cactgggacg tcgtcaacga ggccttcaacgaggacggca cctaccgcga gtcggtcttc tacaagacgc tcggccccgg ctacatcgccgacgccctgc gctgggccca cgaggccgac ccgcacgcca agctgtacct caacgactacaacgtcgacg ggatcggccc caagagcgac gcctactacc gcctgatcaa gcagctgaaggccgacggcg tcccggtgga gggcttcggc atccaggggc acctggcgct ccagtacggc 720

7808409009601020

ttccccgccg acgtcaagca gaacatgcag cgcttcgccg acctcggcgt cgaggtcgcggtcaccgagc tcgacatccg gatgaacctc ccggcgaccc cttcgatgct cgccacccaggccacctggt acgccgacta cgtcaaggcc tgcctggagg tcaggaagtg cgtcggcgtcaccatctggg actacaccga caagtactcg tggatcccct ccgtcttccc cggtgagggcgccgcgctgc cctacgacga gaacctggcg cccaagcccg cctaccacgc gatcaggaaggtgctgggcg gatga 1035

<210> 18<211> 344<212> PRT<213> Bactéria<220>

<221> SIGNAL<222> (1) ... (31)<400> 18

Met Ser Arg His Val Ile Ala Leu Ser Ala Ala Val Cys Leu Ala Ala

1 5 10 15

Gly Leu Ala Ala Ala Pro Ala Ser Ala Glu Pro Arg Pro Arg Thr Leu

20 25 30

Gly Glu Leu Ala Lys Lys His His Lys Tyr Phe Gly Ser Ala Thr Asp

35 40 45

Asn Pro Glu Phe Thr Asp Ala Ala Tyr Leu Lys Leu Leu Gly Ser Glu

50 55 60

Phe Gly Gln Thr Thr Pro Gly Asn Ala Met Lys Trp Tyr Ala Thr Glu65 70

85 90

100

105

115

120

130

135

145

150

165

170

180

185

195

200

210

215

225

230

245

250

260

265

275

280

290

295

305

310

75 80Gly Asp Glu Val Val Ala 95 Gly His Thr Leu Val Trp 110 Arg Ser Trp Thr Ala Ala 125 Gln Lys Val Ala Arg His 140 Val Asn Glu Ala Phe Asn155 160Tyr Lys Thr Leu Gly Pro 175 His Glu Ala Asp Pro His 190 Asp Gly Ile Gly Pro Lys 205 Leu Lys Ala Asp Gly Val 220 Leu Ala Leu Gln Tyr Gly235 240Arg Phe Ala Asp Leu Gly 255 Arg Met Asn Leu Pro Ala 270 Trp Tyr Ala Asp Tyr Val 285 Gly Val Thr Ile Trp Asp 300 Val Phe Pro Gly Glu Gly315 320Pro Lys Pro Ala Tyr His

325

330

335

Ala Ile Arg Lys Val Leu Gly Gly340

<210> 19

<211> 1152

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 19

atgaagatgt taaaaactat tgttgtggct gtagcagcct tactatccagtcagccactt tacagaacct gaagcgggct cctgattcat tgaccttgaagagggtaagt tttatatagg aacagcatta aaccttgatc agatatgggagctgcggtcg cggtggtcaa aacgcagttc aactccatag ttgctgagaaagtatgtttt tgcaaccaag ggaaggtgag tttgatttta gggatgcggagcgtttggag aaaaaaataa aatgcaaatt atcggtcata cgctgatttgacaccagctt ggttttttgt cgataaaaat gggaaagagg tcacccgagagagcgcatgc ggaagcatat acaaaccgtt gtttcccgct ataagggaagtgggatgtgg tgaacgaagc catattggat aatggagaat ggcgtaaaagcagattatcg ggccacaatt tattgaattg gccttcaaat ttgcgcatgaaatgcagaat tatattataa cgattattca actgctatcc ccgaaaaaagatgcgcatgg tgcagcaggt aaaggctgcc ggtgggcagg tcactggaatgaacacaacg cattggacaa tccaccggtc gatgaagtcg aaaaaaccatgcaagccttg gtgcgaaggt aatggttacg gaaatggata tttcggtcctcgtcccaata tgggcgcaga aataggggag cgtcatgcct acagtaaagctacgaaaaag gacttcctgt aacgaaaatg aacgagttgg gagcgagatatttaatttat atctcaaaca tcgggataaa atatcgcgtg tgacattgtggatggagatt catggaagaa tggttggcct attcccggac gtacagactattcgatcgga attaccaacc caaacctttt gtaaaagata ttattgcgttaaaaagaaat aa<210> 20<211> 383<212> PRT<213> Desconhecido<220>

tcctactgctagatgcatttgcgcgatcagttgtatgaaaccgttttgtcgcattcgcagggtacttatcggtgtttggtcaaattctaccgcagatccaaaaggggatttggtatgcagactcggatttgccgcatgtagatgaatccgtgtagcgtttgggtgttggctccattgttagactcaaaaa

601201802403003604204805406006607207808409009601020108011401152436

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(29)<400> 20

Met Lys Met Leu Lys Thr Ile Val Val Ala Val Ala Ala Leu Leu Ser

1 5 10 15

Ser Pro Thr Ala Ser Ala Thr Leu Gln Asn Leu Lys Arg Ala Pro Asp

20 25 30

Ser Leu Thr Leu Lys Asp Ala Phe Glu Gly Lys Phe Tyr Ile Gly Thr

35 40 45

Ala Leu Asn Leu Asp Gln Ile Trp Glu Arg Asp Gln Ala Ala Val Ala

50 55 60

Val Val Lys Thr Gln Phe Asn Ser Ile Val Ala Glu Asn Cys Met Lys65 70 75 80

Ser Met Phe Leu Gln Pro Arg Glu Gly Glu Phe Asp Phe Arg Asp Ala

85 90 95

Asp Arg Phe Val Ala Phe Gly Glu Lys Asn Lys Met Gln Ile Ile Gly

100 105 HO

His Thr Leu Ile Trp His Ser Gln Thr Pro Ala Trp Phe Phe Val Asp

115 120 125

Lys Asn Gly Lys Glu Val Thr Arg Glu Val Leu Ile Glu Arg Met Arg

130 135 140

Lys His Ile Gln Thr Val Val Ser Arg Tyr Lys Gly Arg Val Phe Gly145 150 155 160

Trp Asp Val Val Asn Glu Ala Ile Leu Asp Asn Gly Glu Trp Arg Lys

165 170 175

Ser Lys Phe Tyr Gln Ile Ile Gly Pro Gln Phe Ile Glu Leu Ala Phe

180 185 190

Lys Phe Ala His Asp Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp

195 200 205

Tyr Ser Thr Ala Ile Pro Glu Lys Arg Lys Gly Ile Met Arg Met Val

210 215 220

Gln Gln Val Lys Ala Ala Gly Gly Gln Val Thr Gly Ile Gly Met Gln225 230 235 240

Glu His Asn Ala Leu Asp Asn Pro Pro Val Asp Glu Val Glu Lys Thr

245 250 255

Ile Leu Gly Phe Ala Ser Leu Gly Ala Lys Val Met Val Thr Glu Met

260 265 270

Asp Ile Ser Val Leu Pro His Val Arg Pro Asn Met Gly Ala Glu Ile

275 280 285

Gly Glu Arg His Ala Tyr Ser Lys Ala Met Asn Pro Tyr Glu Lys Gly

290 295 300

Leu Pro Val Thr Lys Met Asn Glu Leu Gly Ala Arg Tyr Val Ala Phe305 310 315 320

Phe Asn Leu Tyr Leu Lys His Arg Asp Lys Ile Ser Arg Val Thr Leu

325 330 335

Trp Gly Val Gly Asp Gly Asp Ser Trp Lys Asn Gly Trp Pro Ile Pro

340 345 350

Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Asn Tyr Gln Pro Lys

355 360 365

Pro Phe Val Lys Asp Ile Ile Ala Leu Thr Gln Lys Lys Lys Lys

370 375 380

<210> 21<211> 1119<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 21

atgcggattc actggctggg gctcagctca cgcgcaagcc tgatgacggc ggcgctcctggctgtcacag gcaccaccaa atccgaggac tcgcccgcaa ctttgaaaga cgccttcaaggattgtttcc ggatcggggt cgcgctcaac cagcggcaat ttaccgagca agataccaacggcgcgacgt tggtgaaacg gcagttcaac gccatctcac ccgaaaacgt gatgaagtgggcgaacattc atccccgacc cgggcccgat gggtataact tcgaggcggc tgaccgttacgtcgagtttg gcgagaagaa cggaatgttc atcgtcggcc atacgctcgt ttggcacttccaaacgccgc gctgggtact ccagggcgat ggcactaacg cggcgacgcg cgagctgctg

60120180240300360420ctgcagcgga tgcgcgatca catccacacg gtcgtaggcc ggtacaaagg gcggatcaaggcttgggacg tggtcaacga agcgctgaac gaagatggca ctctgcggcg gtcgcagtggtaccggatca tcggcgaaga ctacatcgtc aaggctttcg aatatgcgca tgaggccgatccgtccgcgg aattgcgata caacgattac gccatcgaga atgagcggaa gcgcgacggcgtaatcgcgc tcgtgaagaa acttcaggcg cagaaggtcc cacttggggg gctgggctcgcagacgcatg ccaacctgac ctggcctaac gccgaatcgc tggacaccgc cctcacggccttcaccgaac tgggtatccc gatctcaatc acggaactgg atgtgaccgc ctcgcaacgcggtcagctca accagagcgc cgaggtgtcg cagaatggac aggcggggga gggaggcgtggtggacgggg cgaatcagaa gctcgccgag cagtacgcca acttcttccg cgtctttctgaágcatcgca aaaacattga gctcgtgacg ttttggggcg tcacggatcg tgactcctggcggcgcattg gcaaaccgct gctatttaac gcagaatggc aacccaagcc ggcctttcacgccgtcatcg ccgaggcgaa aaagatcagt gggcaatga<210> 22<211> 372<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) . . . (28)

<400> 22 Met Arg Ile His Trp Leu Gly Leu Ser Ser Arg Ala Ser Leu Met Thr1 5 10 15 Ala Ala Leu Leu Ala Val Thr Gly Thr Thr Lys Ser Glu Asp Ser Pro 20 25 30 Ala Thr Leu Lys Asp Ala Phe Lys Asp Cys Phe Arg Ile Gly Val Ala 35 40 45 Leu Asn Gln Arg Gln Phe Thr Glu Gln Asp Thr Asn Gly Ala Thr Leu 50 55 60 Val Lys Arg Gln Phe Asn Ala Ile Ser Pro Glu Asn Val Met Lys Trp65 70 75 80Ala Asn Ile His Pro Arg Pro Gly Pro Asp Gly Tyr Asn Phe Glu Ala 85 90 95 Ala Asp Arg Tyr Val Glu Phe Gly Glu Lys Asn Gly Met Phe Ile Val 100 105 110 Gly His Thr Leu Val Trp His Phe Gln Thr Pro Arg Trp Val Leu Gln 115 120 125 Gly Asp Gly Thr Asn Ala Ala Thr Arg Glu Leu Leu Leu Gln Arg Met 130 135 140 Arg Asp His Ile His Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys145 150 155 160Ala Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly Thr Leu Arg 165 170 175 Arg Ser Gln Trp Tyr Arg Ile Ile Gly Glu Asp Tyr Ile Val Lys Ala 180 185 190 Phe Glu Tyr Ala His Glu Ala Asp Pro Ser Ala Glu Leu Arg Tyr Asn 195 200 205 Asp Tyr Ala Ile Glu Asn Glu Arg Lys Arg Asp Gly Val Ile Ala Leu 210 215 220 Val Lys Lys Leu Gln Ala Gln Lys Val Pro Leu Gly Gly Leu Gly Ser225 230 235 240Gln Thr His Ala Asn Leu Thr Trp Pro Asn Ala Glu Ser Leu Asp Thr 245 250 255 Ala Leu Thr Ala Phe Thr Glu Leu Gly Ile Pro Ile Ser Ile Thr Glu 260 265 270 Leu Asp Val Thr Ala Ser Gln Arg Gly Gln Leu Asn Gln Ser Ala Glu 275 280 285 Val Ser Gln Asn Gly Gln Ala Gly Glu Gly Gly Val Val Asp Gly Ala 290 295 300 Asn Gln Lys Leu Ala Glu Gln Tyr Ala Asn Phe Phe Arg Val Phe Leu305 310 315 320Lys His Arg Lys Asn Ile Glu Leu Val Thr Phe Trp Gly Val Thr Asp 325 330 335 Arg Asp Ser Trp Arg Arg Ile Gly Lys Pro Leu Leu Phe Asn Ala Glu 340 345 350 Trp Gln Pro Lys Pro Ala Phe His Ala Val Ile Ala Glu Ala Lys Lys355 360 365

Ile Ser Gly Gln

370<210> 23<211> 1137<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 23

atgaggacaa aacaagtttt taaattaacc acgctcgctt tattattaac agcagttgttagtagctgtt ctgccccaaa agcggcaaaa gaagatacgc ttaaagatgc cctccagggaaaattcttta ttggtgctgc tgttaatgtt gaccaaatgg caggaaagga ttctcttgcaattgaagttg ttaaaaagaa ctttagctca attgtggccg agaattgcat gaaaatggaaaacatccatc ctgtaaaagg tgaatttttc ttcgatgaag ccgatgcata tgttgaatttggcgaaaaaa acaacatgaa aatcattggt cacacattga tttggcattc acaagccgccaaatgggcat ttgttgatga tgaaggcaaa gatgtatcgc gcgaagaatt aattgaacggatgcgcaacc acatccatac cattgtaggc cgctataaag gtcgtgtaca tggctgggacgttgttaatg aggctattct ggataacggc gaatggcgtc agagcaaatg gtataccatt 540

attggacccg aatttgttca gcttgctttt gagtttgccc acgaagccga ccccaacgctgaattgtatt acaacgacta caacgagtgg attccggcta aaagagacgg catttacaacatggttaagg atttaatcga caaaggcgtt aaagttgatg gaattggcct acagggtcac 720

78084090096010201080

60120180240300360420480

600660

attgctcttg actctcccag catcgaactt tacgaagaag ccattgtaaa atatgcaagtctgggtgtgc aaacaatggt taccgaactc gatatcactg ttttaccatg gccatcgcagcaagttacag ccgatatatc ttttagtgca gagctatcaa ccgaatacaa tccatttgttaatggtttac ccgattcggt tagcgttgaa cttaccaacc gttttgccag tttcttcgagttgtttttga aacatcagga taaaattgac cgcgttactc tatggggtgt acacgatggtcaatcatgga aaaacaactg gcccatcagg ggacgtaaag attatccgtt gttattcgacaggcaatatc agtccaaacc tgccgttcag cgcataatcg aattggctaa acaataa 1137

<210> 24<211> 378<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(29)<400> 24

Met Arg Thr Lys Gln Val Phe Lys Leu Thr Thr Leu Ala Leu Leu Leu

1 5 10 15

Thr Ala Val Val Ser Ser Cys Ser Ala Pro Lys Ala Ala Lys Glu Asp

20 25 30

Thr Leu Lys Asp Ala Leu Gln Gly Lys Phe Phe Ile Gly Ala Ala Val

35 40 45

Asn Val Asp Gln Met Ala Gly Lys Asp Ser Leu Ala Ile Glu Val Val

50 55 60

Lys Lys Asn Phe Ser Ser Ile Val Ala Glu Asn Cys Met Lys Met Glu65 70 75 80

Asn Ile His Pro Val Lys Gly Glu Phe Phe Phe Asp Glu Ala Asp Ala

85 90 95

Tyr Val Glu Phe Gly Glu Lys Asn Asn Met Lys Ile Ile Gly His Thr

100 105 HO

Leu Ile Trp His Ser Gln Ala Ala Lys Trp Ala Phe Val Asp Asp Glu

115 120 125

Gly Lys Asp Val Ser Arg Glu Glu Leu Ile Glu Arg Met Arg Asn His

130 135 140

Ile His Thr Ile Val Gly Arg Tyr Lys Gly Arg Val His Gly Trp Asp145 150 155 160

Val Val Asn Glu Ala Ile Leu Asp Asn Gly Glu Trp Arg Gln Ser Lys

165 170 175

Trp Tyr Thr Ile Ile Gly Pro Glu Phe Val Gln Leu Ala Phe Glu Phe

180 185 190

Ala His Glu Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn

195 200 205

Glu Trp Ile Pro Ala Lys Arg Asp Gly Ile Tyr Asn Met Val Lys Asp210 215 220Leu Ile Asp Lys Gly Val Lys Val Asp Gly Ile Gly Leu Gln Gly His225 230 235 240

Ile Ala Leu Asp Ser Pro Ser Ile Glu Leu Tyr Glu Glu Ala Ile Val245 250 255

Lys Tyr Ala Ser Leu Gly Val Gln Thr Met Val Thr Glu Leu Asp Ile260 265 270

Thr Val Leu Pro Trp Pro Ser Gln Gln Val Thr Ala Asp Ile Ser Phe

275 280 285

Ser Ala Glu Leu Ser Thr Glu Tyr Asn Pro Phe Val Asn Gly Leu Pro290 295 300

Asp Ser Val Ser Val Glu Leu Thr Asn Arg Phe Ala Ser Phe Phe Glu305 310 315 320

Leu Phe Leu Lys His Gln Asp Lys Ile Asp Arg Val Thr Leu Trp Gly325 330 335

Val His Asp Gly Gln Ser Trp Lys Asn Asn Trp Pro Ile Arg Gly Arg340 345 350

Lys Asp Tyr Pro Leu Leu Phe Asp Arg Gln Tyr Gln Ser Lys Pro Ala

355 360 365

Val Gln Arg Ile Ile Glu Leu Ala Lys Gln370 375

<210> 25<211> 978<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 25

gtggatccaa agaattcctt acgcgcctta gctcaaaagc gaggaattgg gtttgggacg 60

gcagtttggg ttgagcctct gtctaacgat tcgagatatc ggacggtgtt ggcgcaggag 120

ttcaatatgg tgacgccaga gaatgagatg aagtttgagc cgacgcatcc agaacgggag 180

cgctacgatt ttacagcagc cgataccctt gttgactttg ccaagaacca taacatgcag 240

gtgcgcggac ataccctggt ttggcatgaa agtctccccg attggctaac gactcaaacg 300

tggacgcgtg aggagttgat gtccatctta gaagaacaca tcaatacagt tgtcgatcgc 360

tatcgggggc aattagttgc ctgggatgtg gtgaatgaag cgatcgccaa cgataaaaac 420

gcactcagag atacgatttg gctgcgaaca atcgggccag agtatataga gaaggcattt 480

cgctgggcgc atgcagccga ccctcaagca cgtttatttt acaacgatta tggcggcgag 540

gaagtggggg gaaagtctga ggccatctat ggcatgctta aagatttgct gcaacagggt 600

gtcccgattc acggggttgg cttgcaaatg cacgttagta taaaaaaccc tcccaatccc 660

gaaaaagtgg cggcaaatat caagcgcctg aacgatctgg gattggaagt gcatataact 720

gagatggatg tgaaaacctg ggatggcatc ggtacgaagc agcaacgact tgcggctcag 780

gcacaagtgt atcggaacat gatgcaggtg tgtttggaag ctgagaactg taaggcgttt 840

tcgttgtggg gggtaagcga tcgctattct tggattcccc ggatttttaa gaagccggat 900

gcaccactga tttttgatga tttagggcgt ccgaaacccg cttacaatgc cctgaaagaa 960

gtcctcaagc ggcgttaa

<210> 26

<211> 325<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 26

Val Asp Pro Lys Asn Ser Leu Arg Ala Leu Ala Gln Lys Arg Gly Ile

1 5 10 15

Gly Phe Gly Thr Ala Val Trp Val Glu Pro Leu Ser Asn Asp Ser Arg

20 25 30

Tyr Arg Thr Val Leu Ala Gln Glu Phe Asn Met Val Thr Pro Glu Asn

35 40 45

Glu Met Lys Phe Glu Pro Thr His Pro Glu Arg Glu Arg Tyr Asp Phe50 55 60

Thr Ala Ala Asp Thr Leu Val Asp Phe Ala Lys Asn His Asn Met Gln65 70 75 80

Val Arg Gly His Thr Leu Val Trp His Glu Ser Leu Pro Asp Trp Leu

85 90 95

Thr Thr Gln Thr Trp Thr Arg Glu Glu Leu Met Ser Ile Leu Glu Glu100 105 110

His Ile Asn Thr Val Val Asp Arg Tyr Arg Gly Gln Leu Val Ala Trp115 120 125Asp Val Val Asn Glu Ala Ile Ala Asn Asp Lys

130 135

Thr Ile Trp Leu Arg Thr Ile Gly Pro Glu Tyr145 150 155

Arg Trp Ala His Ala Ala Asp Pro Gln Ala Arg

165 170

Tyr Gly Gly Glu Glu Val Gly Gly Lys Ser Glu

180 185

Leu Lys Asp Leu Leu Gln Gln Gly Val Pro Ile

195 200

Gln Met His Val Ser Ile Lys Asn Pro Pro Asn

210 215

Ala Asn Ile Lys Arg Leu Asn Asp Leu Gly Leu225 230 235

Glu Met Asp Val Lys Thr Trp Asp Gly Ile Gly

245 250

Leu Ala Ala Gln Ala Gln Val Tyr Arg Asn Met

260 265

Glu Ala Glu Asn Cys Lys Ala Phe Ser Leu Trp

275 280

Tyr Ser Trp Ile Pro Arg Ile Phe Lys Lys Pro

290 295

Phe Asp Asp Leu Gly Arg Pro Lys Pro Ala Tyr305 310 315

Val Leu Lys Arg Arg325

<210> 27<211> 1173<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 27

atgaaatcct taacaaatca atccttcatg aaactcataagcactactca gcatttcatg caaaaaaccc gccgaaccacaaagacagct tcaaagacaa gtttctcatg ggtgtggcgcggaagagata cattggtaca tgcttttaca gtacagcattaacgaaatga agtgggaacg catccacccg cagcctgatggacagcctga ttgcttttgg cgaacgcaac ggcatgtttatggcactccc aggtgcccga ttgggttttc accgatgagagatgctctgc tccaacgcat gaaggatcat atttatgccgaaggtggatg gctgggatgt ggtaaatgaa gcattggatgtccaggtggc atgaaatcat cggtgatgat tacattcagagaggcagatc ccggtgcaga gctttattac aatgattacacgggagggtg ctgtcaggct gctacaggaa ctgcagcaaagtgggcattc agggacattg gcacctgcac tcacctgatccttcaggcat acggacaact tggtctgaag gtcatgatcaattcccgaac cttcaggtat tattggcgcc gatgttgcaccagctgaatc catggcctga aagttttccc gattccatgctatgccgaac tgttcggatt gttcctgaag cacagcgatatggggaattc acgatggcta ttcctggaag aacaactggctatcccctcc tttttgaccg gaattaccag cctaaacctgttgaccaaaa tacagccgga agccagtaac tga<210> 28<211> 390<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<22 0><221><222><400>

Asn Ala Leu140

Ile Glu Lys

Leu Phe Tyr

Ala Ile Tyr190

His Gly Val

205Pro Glu Lys220

Glu Val His

Thr Lys Gln

Met Gln Val270

Gly Val Ser

285Asp Ala Pro300

Asn Ala Leu

Arg Asp

Ala Phe160Asn Asp175

Gly Met

Gly Leu

Val Ala

Ile Thr240Gln Arg255

Cys Leu

Asp Arg

Leu Ile

Lys Glu320

tctgtctggctgaaaccggttgaataaagcttaattccattatatgattttagtcgggcaagggaaagccttgtcggccgaagacggacaaagcctttgaacatagaactaaggcattaatgcaagagatccgaactggaagcgggcggaagcaggttctaggtaagccgcaataccgggcgtatgatgc

attgccagtctgaaggcttáacagattctgtactgcagaacacggttccgtacactcgtatctgacccgcgtataagggcgctgcgcaaagttcacccggcaaaaaaaagaatcgacggatgattcaagttgttaacgtcttatcagagcggccagccggggtgaccttcccgaacaacttgtcattgaa

601201802403003604204805406006607207808409009601020108011401173

SIGNAL(1)...(27)28

Met Lys Ser Leu Thr Asn Gln Ser Phe Met Lys

1 5 10

Ala Leu Pro Val Ala Leu Leu Ser Ile Ser Cys

20 25

Leu Ile Ile Cys Leu15

Lys Lys Pro Ala Glu30Pro Leu Lys Pro Val Glu Gly Leu Lys Asp Ser Phe Lys Asp Lys Phe

35 40 45

Leu Met Gly Val Ala Leu Asn Lys Ala Gln Ile Leu Gly Arg Asp Thr

50 55 60

Leu Val His Ala Phe Thr Val Gln His Phe Asn Ser Ile Thr Ala Glu65 70 75 80

Asn Glu Met Lys Trp Glu Arg Ile His Pro Gln Pro Asp Val Tyr Asp

85 90 95

Phe Thr Val Pro Asp Ser Leu Ile Ala Phe Gly Glu Arg Asn Gly Met

100 105 HO

Phe Ile Val Gly His Thr Leu Val Trp His Ser Gln Val Pro Asp Trp

115 120 125

Val Phe Thr Asp Glu Lys Gly Lys Pro Leu Thr Arg Asp Ala Leu Leu130 135 140

Gln Arg Met Lys Asp His Ile Tyr Ala Val Val Gly Arg Tyr Lys Gly145 150 155 160

Lys Val Asp Gly Trp Asp Val Val Asn Glu Ala Leu Asp Glu Asp Gly

165 170 175

Gln Leu Arg Lys Ser Arg Trp His Glu Ile Ile Gly Asp Asp Tyr Ile180 185 190

Gln Lys Ala Phe Glu Phe Thr Arg Glu Ala Asp Pro Gly Ala Glu Leu

195 200 205

Tyr Tyr Asn Asp Tyr Asn Ile Glu Leu Lys Lys Lys Arg Glu Gly Ala210 215 220

Val Arg Leu Leu Gln Glu Leu Gln Gln Lys Gly Ile Lys Ile Asp Gly225 230 235 240

Val Gly Ile Gln Gly His Trp His Leu His Ser Pro Asp Leu Gln Glu

245 250 255

Ile Asp Ser Ser Leu Gln Ala Tyr Gly Gln Leu Gly Leu Lys Val Met260 265 270

Ile Thr Glu Leu Asp Val Asn Val Ile Pro Glu Pro Ser Gly Ile Ile

275 280 285

Gly Ala Asp Val Ala Gln Arg Ala Asp Tyr Gln Ser Gln Leu Asn Pro290 295 300

Trp Pro Glu Ser Phe Pro Asp Ser Met Gln Gln Val Leu Ala Ser Arg305 310 315 320

Tyr Ala Glu Leu Phe Gly Leu Phe Leu Lys His Ser Asp Lys Val Ser

325 330 335

Arg Val Thr Phe Trp Gly Ile His Asp Gly Tyr Ser Trp Lys Asn Asn340 345 350

Trp Pro Ile Pro Gly Arg Thr Thr Tyr Pro Leu Leu Phe Asp Arg Asn

355 360 365

Tyr Gln Pro Lys Pro Ala Tyr Asp Ala Val Ile Glu Leu Thr Lys Ile370 375 380

Gln Pro Glu Ala Ser Asn385 390

<210> 29<211> 2331<212> DNA<213> Archaea<400> 29

atgacgatgc agagaaagta ctcatccgac gcgaacacac agtatgagtg gataaaatca

60

gctactgtac catctggtca gtgggtacag ctctctggaa cgtacacgat cccggccgga 120

gttaccgtgg aagatctcac gctttacttc gaatctcaaa atccaaccct tgagttctacgtggatgacg tgaagatagt ggatacaact tccgcagaga taaagattga aatggaacctgaaaaagaga tacctgctct gaaagaagta ctgaaagatt acttcaaagt cggagttgcactgccgtcca aggtcttcct caacccgaag gacatagaac tcatcacgaa acacttcaacagcatcaccg cagaaaacga gatgaaaccg gatagtctgc tcgcgggcat cgaaaacggtaagctgaagt tcaggtttga aacagcagac aaatacattc agttcgtcga ggaaaacggcatggttataa gaggtcacac actggtgtgg cacaaccaga cacccgactg gttcttcaaagacgaaaacg gaaacctcct ctccaaagaa gcgatgacgg aaagactcaa agagtacatccacaccgttg tcggacactt caaaggaaaa gtctacgcat gggacgtggt gaacgaagcggtcgatccga accagccgga tggactgaga agatcaacct ggtaccagat catggggcct 720

gactacatag aactcgcctt caagttcgca agagaggcag atccagatgc aaaactcttc 780

tacaacgact acaacacatt cgatcccaga aagagagaca tcatctacaa cctcgtgaag 840

gatctcaaag agaagggact catcgatggc ataggaatgc agtgtcacat cagtcttgca 900

acagacatca aacagatcga agaggccatc aaaaagttca gcaccatacc cggtatagaa 960

180240300360420480540600660442

attcacatca cagaactcga tatgagtgtcgcaccgagga cggcactcat cgaacaggctaagaagcaca gcaacgtgat cacgaacgtctggagagcaa caagaagaaa cgactggccgctcgcttact gggcgatagt ggcacctgagatctccgaag gcgaagcagt ggtagtggggccgatagaga tccttgacga agaagggaacgacagcacga tctacatcta cggagaggtaggagtggcca tattcatcaa cccgaacaacacctacgttg tgctgtggac gaactggaagaagaaattcg ttgggcctgg ctttagaagaggtgtggagt tcaagaaaga cagctacataaagtggtaca gctggagcga cacgacgaacacgctgaagc tcgaaggaat aatggtagcgggagagatcg atgagatctg gaacacgacaggatcgcttg acaagaatgc gacagcgaaatacgtacttg cgatcgtgâa agagcccgttcaggattccg tggagatctt cgtggatgaggacgacgcgc agttcagggt gaactacatgccagcgaggt tcaagacagc ggtgaagctgatcaagtgga agacgatcaa gccaacaccgaacgatgcga acgagaaagg gcagagggtcaacagctggc aagatccttc aaagttcggt<210> 30<211> 776<212> PRT<213> Archaea<400> 30

Met Thr Met Gln Arg Lys Tyr Ser. 1 5

Trp Ile Lys Ser Ala Thr Val Pro20

Gly Thr Tyr Thr Ile Pro Ala Gly

35 40

Tyr Phe Glu Ser Gln Asn Pro Thr

50 55

Lys Ile Val Asp Thr Thr Ser Ala65 70

Glu Lys Glu Ile Pro Ala Leu Lys85

Val Gly Val Ala Leu Pro Ser Lys100

Glu Leu Ile Thr Lys His Phe Asn115 120

Lys Pro Asp Ser Leu Leu Ala Gly

130 135

Arg Phe Glu Thr Ala Asp Lys Tyr145 150

Met Val Ile Arg Gly His Thr Leu165

Trp Phe Phe Lys Asp Glu Asn Gly180

Thr Glu Arg Leu Lys Glu Tyr Ile195 200

Gly Lys Val Tyr Ala Trp Asp Val

210 215

Gln Pro Asp Gly Leu Arg Arg Ser225 230

Asp Tyr Ile Glu Leu Ala Phe Lys245

Ala Lys Leu Phe Tyr Asn Asp Tyr260

Asp Ile Ile Tyr Asn Leu Val Lys275 280

Asp Gly Ile Gly Met Gln Cys His

290 295

Gln Ile Glu Glu Ala Ile Lys Lys

tacagagatt ccagttccaa ctacccagagcacaaaatga tgcagctctt tgagatcttcacattctggg gtctcaagga cgattactccctcatcttcg acaaagatca ccaggcgaaagtccttccac cacttccaaa agaaagcaggatgatggacg actcgtacct gatgtcgaaggtgaaggcaa cgatcagggc agtgtggaaacaggacaaga caaagaaacc agcagaagacgaaagaacac cctatctgca gcctgatgacacggaggtca acagagaaga cgtacaggtgtacagcttcg agatgtcgat cacgataccgggatttgacg ttgcggtgat agacgacgggagccagaaga cgaacacgat gaactacggaacagcaaaat acggaacacc ggtcatcgatgaggagatag agacgaaagc ggtggctatggtgagggtgc tgtgggacga gaactacctgctgaacaaag acaacagcaa cccgtgggagaacaaccaca agacaggata ctacgaagacaacgagcaga cctttggaac gggaggaagtatcgaaggag gatacatagt tgaggcagcgaacacagtga taggattcaa catccaggtgggtatcatct cctggagcga tcccacaaacaacctcagac tcatcaagtg a

Ser Asp Ala Asn Thr Gln Tyr Glu 10 15 Ser Gly Gln Trp Val Gln Leu Ser25 30 Val Thr Val Glu Asp Leu Thr Leu 45 Leu Glu Phe Tyr Val Asp Asp Val 60 Glu Ile Lys Ile Glu Met Glu Pro 75 80Glu Val Leu Lys Asp Tyr Phe Lys 90 95 Val Phe Leu Asn Pro Lys Asp Ile105 110 Ser Ile Thr Ala Glu Asn Glu Met 125 Ile Glu Asn Gly Lys Leu Lys Phe 140 Ile Gln Phe Val Glu Glu Asn Gly 155 160Val Trp His Asn Gln Thr Pro Asp 170 175 Asn Leu Leu Ser Lys Glu Ala Met185 190 His Thr Val Val Gly His Phe Lys 205 Val Asn Glu Ala Val Asp Pro Asn 220 Thr Trp Tyr Gln Ile Met Gly Pro 235 240Phe Ala Arg Glu Ala Asp Pro Asp 250 255 Asn Thr Phe Asp Pro Arg Lys Arg 265 270 Asp Leu Lys Glu Lys Gly Leu Ile 285 Ile Ser Leu Ala Thr Asp Ile Lys 300 Phe Ser Thr Ile Pro Gly Ile Glu305 310 315 320

Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Ser Ser 325 330 335 Asn Tyr Pro Glu Ala Pro Arg Thr Ala Leu Ile Glu Gln Ala His Lys 340 345 350 Met Met Gln Leu Phe Glu Ile Phe Lys Lys His Ser Asn Val Ile Thr 355 360 365 Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala Thr 370 375 380 Arg Arg Asn Asp Trp Pro Leu Ile Phe Asp Lys Asp His Gln Ala Lys 385 390 395 400 Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu Pro 405 410 415 Lys Glu Ser Arg Ile Ser Glu Gly Glu Ala Val Val Val Gly Met Met 420 425 430 Asp Asp Ser Tyr Leu Met Ser Lys Pro Ile Glu Ile Leu Asp Glu Glu 435 440 445 Gly Asn Val Lys Ala Thr Ile Arg Ala Val Trp Lys Asp Ser Thr Ile 450 455 460 Tyr Ile Tyr Gly Glu Val Gln Asp Lys Thr Lys Lys Pro Ala Glu Asp 465 470 475 480 Gly Val Ala Ile Phe Ile Asn Pro Asn Asn Glu Arg Thr Pro Tyr Leu 485 490 495 Gln Pro Asp Asp Thr Tyr Val Val Leu Trp Thr Asn Trp Lys Thr Glu 500 505 510 Val Asn Arg Glu Asp Val Gln Val Lys Lys Phe Val Gly Pro Gly Phe 515 520 525 Arg Arg Tyr Ser Phe Glu Met Ser Ile Thr Ile Pro Gly Val Glu Phe 530 535 540 Lys Lys Asp Ser Tyr Ile Gly Phe Asp Val Ala Val Ile Asp Àsp Gly 545 550 555 560 Lys Trp Tyr Ser Trp Ser Asp Thr Thr Asn Ser Gln Lys Thr Asn Thr 565 570 575 Met Asn Tyr Gly Thr Leu Lys Leu Glu Gly Ile Met Val Ala Thr Ala 580 585 590 Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu Ile Asp Glu Ile Trp Asn 595 600 605 Thr Thr Glu Glu Ile Glu Thr Lys Ala Val Ala Met Gly Ser Leu Asp 610 615 620 Lys Asn Ala Thr Ala Lys Val Arg Val Leu Trp Asp Glu Asn Tyr Leu 625 630 635 640 Tyr Val Leu Ala Ile Val Lys Glu Pro Val Leu Asn Lys Asp Asn Ser 645 650 655 Asn Pro Trp Glu Gln Asp Ser Val Glu Ile Phe Val Asp Glu Asn Asn 660 665 670 His Lys Thr Gly Tyr Tyr Glu Asp Asp Asp Ala Gln Phe Arg Val Asn 675 680 685 Tyr Met Asn Glu Gln Thr Phe Gly Thr Gly Gly Ser Pro Ala Arg Phe 690 695 700 Lys Thr Ala Val Lys Leu Ile Glu Gly Gly Tyr Ile Val Glu Ala Ala 705 710 715 720 Ile Lys Trp Lys Thr Ile Lys Pro Thr Pro Asn Thr Val Ile Gly Phe 725 730 735 Asn Ile Gln Val Asn Asp Ala Asn Glu Lys Gly Gln Arg Val Gly Ile 740 745 750 Ile Ser Trp Ser Asp Pro Thr Asn Asn Ser Trp Gln Asp Pro Ser Lys 755 760 765 Phe Gly Asn Leu Arg Leu Ile Lys 770 775 <210> 31 <211> 1134

<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 31

gtggaaaccg tcggagcacc ggagctgagc tatgaaatcc ggaatttccg ggtggtggca180240300

840900960

ccggacggag tgccggatat acagcccaca gccgcaccgg aagcgcaggc tgttccggaa 120

ggggagatgc cttccctgaa ggatgtatac gcgggcaaat tcgacttcgg tacggcgctgccccggaatg cattcaatga tatccagctg ctgagactgg tgaaggacca gttcaacatcctgacaccgg aaaatgagat gaaaccggat gcaatcctgg atgtgtacgg cagcaaaaaactggcggaaa aggacgagac agcggtggct gtccggtttg aagcatgcaa gacgctgctt 360

cggttcgcac agtccaacgg cctgaaggtg cacggccata cgctgctgtg gcacaaccag 420

accccggaag cccttttcca cgaaggttat gacaccacca agccgatggc cggccgggaa 480

gtgatgttgg gccggatgga gaattacatc cgcgaagtgc tgacctggac cgaagaaaat 540

tatccgggcg tgatcgtttc ctgggacgtg gtgaatgaag caatcgacga cggaacgaac 600

cagctgcgca ccggtgccaa ctggtataag acggtcggac cggactacct ggcacgcgcg 660

tttgaatatg cccggaaata cgcggcggaa ggcgtgctgc tgtactacaa cgattacaat 720

accgcatacg gcggtaagct gtatgggatt gtggatctgc tggagagcct gattgccgag 780

ggcaatattg acggatacgg attccagatg caccacagcc tgggagaacc ttccatggatatgattaccc gggcagtaga gaaaatagcc tcgctgggac tccggctgcg tgtgagcgaactggacatca acgccggcaa ggcgacagag aaaaatttcg aagcccagaa gaacaagtac

aaacaggtga tgaagctgat gctccggttc aaggaccaga ctgaagcggt ccaggtgtgg 1020ggcgtgacgg acatcatgág ctggcgcagg gacggatatc cgctgctgtt tgacaagaac 1080atgaatccga aacccgcgtt cttcggtgtg atcgaagccg gaatggaaga ctga 1134

<210> 32<211> 377<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 32

Val Glu Thr Val Gly Ala Pro Glu Leu Ser Tyr Glu Ile Arg Asn Phe

1 5 10 15

Arg Val Val Ala Pro Asp Gly Val Pro Asp Ile Gln Pro Thr Ala Ala20 25 30

Pro Glu Ala Gln Ala Val Pro Glu Gly Glu Met Pro Ser Leu Lys Asp35 40 45

Val Tyr Ala Gly Lys Phe Asp Phe Gly Thr Ala Leu Pro Arg Asn Ala

50 55 60

Phe Asn Asp Ile Gln Leu Leu Arg Leu Val Lys Asp Gln Phe Asn Ile

65 70 75 80

Leu Thr Pro Glu Asn Glu Met Lys Pro Asp Ala Ile Leu Asp Val Tyr

85 90 95

Gly Ser Lys Lys Leu Ala Glu Lys Asp Glu Thr Ala Val Ala Val Arg100 105 110

Phe Glu Ala Cys Lys Thr Leu Leu Arg Phe Ala Gln Ser Asn Gly Leu115 120 125

Lys Val His Gly His Thr Leu Leu Trp His Asn Gln Thr Pro Glu Ala

130 135 140

Leu Phe His Glu Gly Tyr Asp Thr Thr Lys Pro Met Ala Gly Arg Glu145 150 155 160

Val Met Leu Gly Arg Met Glu Asn Tyr Ile Arg Glu Val Leu Thr Trp

165 170 175

Thr Glu Glu Asn Tyr Pro Gly Val Ile Val Ser Trp Asp Val Val Asn180 185 190

Glu Ala Ile Asp Asp Gly Thr Asn Gln Leu Arg Thr Gly Ala Asn Trp195 200 205

Tyr Lys Thr Val Gly Pro Asp Tyr Leu Ala Arg Ala Phe Glu Tyr Ala

210 215 220

Arg Lys Tyr Ala Ala Glu Gly Val Leu Leu Tyr Tyr Asn Asp Tyr Asn225 230 235 240

Thr Ala Tyr Gly Gly Lys Leu Tyr Gly Ile Val Asp Leu Leu Glu Ser

245 250 255

Leu Ile Ala Glu Gly Asn Ile Asp Gly Tyr Gly Phe Gln Met His His260 265 270

Ser Leu Gly Glu Pro Ser Met Asp Met Ile Thr Arg Ala Val Glu Lys275 280 285

Ile Ala Ser Leu Gly Leu Arg Leu Arg Val Ser Glu Leu Asp Ile Asn

290 295 300

Ala Gly Lys Ala Thr Glu Lys Asn Phe Glu Ala Gln Lys Asn Lys Tyr305 310 315 320

Lys Gln Val Met Lys Leu Met Leu Arg Phe Lys Asp Gln Thr Glu Ala325 330 335Val Gln Val Trp Gly Val Thr Asp Ile Met Ser

340 345

Tyr Pro Leu Leu Phe Asp Lys Asn Met Asn Pro

355 360

Gly Val Ile Glu Ala Gly Met Glu Asp

37Q 375

<210> 33<211> 1815<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 33

atggttcgca aaaaactatt ttatatcgtc gcgttaatgcacttccgctc aggacgcgga attttccctg cgcggtttaggttggagcag ccgtttatac cactcatctg aatgatcctgcgagaattca atatgctcac gcctgaacag caggccaaaccaaggtcaat ttgactttcg gagtttcgat cgtttagtcgatggcgatac acggtcatgc gctggtctgg catagctgcaggcgagtaca cccgtgacga agccattggt ctgctgcgcgggccgttaca aaggccgtat tccgatttgg gacgtcgtcaggcggaacac tgcgcgatac gccatggcgg cagttaattggccttccagt tcgctcatga agccgacccg gatgcgctgcacggaaggca tgaaccctaa atcggacgcc atgtacgagacgtggaattc cgattcacgg ggttgggctg caatcccattccagaccaga ttgctcggaa cgtcgcgcgg cttggcgaacaccgaggtcg atattcgata ttccggcgag gcgacagataggcgattacc atcgcctgat ggacgtttgc ctcggtaacgacctggggcg tgaccgataa atatacctgg ttgcggggcgaacctatcgg ttgaaccgct gctttttgac gatgactatggcggtgctgg actcactagc gcgaagagcg ggcgaaaccccttgcggcga tgatcggcgg cacagtccaa acggtcgaaaaatctcagtc aggaagcgcc ggacgccgtt cctggtgtgaataagcatca cagttgacgg cgaagccaac gattgggaacgacagcggcc ccaccgtacc tcaggataac gacacgacaagacaaaacca atctatactt ccttgcagag gttacggacacacgacccgg ctactgcctg gtatcaggag gactcggttgggcgatctaa ctaacaccgc ctaccaaccc ggcgtcgcccaacatcgaca acgataatcc cggtgcaccg atcatcggggcaggtaaaag cgattgtcgt caaaaccgat accgggtatcctcatgaccg atgtctggac gattgaaccg aaacaaggggcatctcaatg gctcacgcac accggatgcc gaccgagacatagatcagtc ctatagcaat cccagcctgttctaa

Trp Arg Arg Asp Gly350

Lys Pro Ala Phe Phe365

ctggatacgcaacataaatc<210> 34<211><212>

tgatgttcggccgagcgcaatccatgttgaattgtgagttccttcgccgacaccgcaatgàctcgattatatgaaggcatgcgatgattatgttttacaatggtgagcgatcatattaggtcggtttacaatatcctccaacgcctgtaccgaacctgggaacccaagccccgttttgagttcccccgcctctattacgcgcattccgcgtgacatttgcgccaggtgtcagttttacctaaatcggtatgcggcaacagtggtcgaggcctgtactcggccaagttgatttggccgact

cgcaagtttt 60taacttttat 120aacactggca 180ggaggcacag 240agaacacaac 300ggtggctaac 360gaccattgtt 420tgctgacagc 480catcgaactt 540cgactataat 600ttttgtggcg 660cagttttgac 720agttcaattc 780gcgçjcaggcg 840tgcçjtttatc 900cttctacaac 960cgcttatttt 1020cgatgacgag 1080gacgaaaagc 1140cgcctacccc 1200cggtatgatt 1260cgccgctgcc 1320ctacggaacg 1380gaacacgaca 1440catggcagcc 1500cgacatttcg 1560gtctgttcca 1620cttccaagtg 1680ctggtcgcta 1740catcttctgg 1800 1815

604PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (23)<400> 34

Met Val Arg Lys Lys Leu Phe Tyr Ile Val Ala

15 10

Gly Ala Ser Phe Thr Ser Ala Gln Asp Ala Glu

20 25

Leu Ala Glu Arg Asn Asn Phe Tyr Val Gly Ala

35 40

His Leu Asn Asp Pro Val His Val Glu Thr Leu

50 55

Met Leu Thr Pro Glu Gln Gln Ala Lys His Cys65 70 75

Gln Gly Gln Phe Asp Phe Arg Ser Phe Asp Arg

85 90

Glu Glu His Asn Met Ala Ile His Gly His Ala

Leu Met

Phe Ser

Ala Val

45Ala Arg60

Glu LeuLeu ValLeu Val

Leu Met Phe15

Leu Arg Gly30

Tyr Thr Thr

Glu Phe Asn

Glu Ala Gln80

Ala Phe Ala95

Trp His Ser100 105 110 Cys Thr Pro Gln Trp Val Ala Asn Gly Glu Tyr Thr Arg Asp Glu Ala 115 120 125 Ile Gly Leu Leu Arg Asp Ser Ile Met Thr Ile Val Gly Arg Tyr Lys 130 135 140 Gly Arg Ile Pro Ile Trp Asp Val Val Asn Glu Gly Ile Ala Asp Ser145 150 155 160Gly Gly Thr Leu Arg Asp Thr Pro Trp Arg Gln Leu Ile Gly Asp Asp 165 170 175 Tyr Ile Glu Leu Ala Phe Gln Phe Ala His Glu Ala Asp Pro Asp Ala 180 185 190 Leu Leu Phe Tyr Asn Asp Tyr Asn Thr Glu Gly Met Asn Pro Lys Ser 195 200 205 Asp Ala Met Tyr Glu Met Val Ser Asp Phe Val Ala Arg Gly Ile Pro 210 215 220 Ile His Gly Val Gly Leu Gln Ser HiS Phe Ile Leu Gly Ser Phe Asp225 230 235 240Pro Asp Gln Ile Ala Arg Asn Val Ala Arg Leu Gly Glu Leu Gly Leu 245 250 255 Gln Val Gln Phe Thr Glu Val Asp Ile Arg Tyr Ser Gly Glu Ala Thr 260 265 270 Asp Asn Ile Leu Gln Arg Gln Ala Gly Asp Tyr His Arg Leu Met Asp 275 280 285 Val Cys Leu Gly Asn Asp Ala Cys Thr Ala Phe Ile Thr Trp Gly Val 290 295 300 Thr Asp Lys Tyr Thr Trp Leu Arg Gly Ala Asn Leu Gly Phe Tyr Asn305 310 315 320Asn Leu Ser Val Glu Pro Leu Leu Phe Asp Asp Asp Tyr Glu Pro Lys 325 330 335 Pro Ala Tyr Phe Ala Val Leu Asp Ser Leu Ala Arg Arg Ala Gly Glu 340 345 350 Thr Pro Val Leu Ser Asp Asp Glu Leu Ala Ala Met Ile Gly Gly Thr 355 360 365 Val Gln Thr Val Glu Ile Pro Pro Pro Thr Lys Ser Asn Leu Ser Gln 370 375 380 Glu Ala Pro Asp Ala Val Pro Gly Val Ile Tyr Tyr Ala Ala Tyr Pro385 390 395 400Ile Ser Ile Thr Val Asp Gly Glu Ala Asn Asp Trp Glu Arg Ile Pro 405 410 415 Arg Gly Met Ile Asp Ser Gly Pro Thr Val Pro Gln Asp Asn Asp Thr 420 425 430 Thr Met Thr Phe Ala Ala Ala Ala Asp Lys Thr Asn Leu Tyr Phe Leu 435 440 445 Ala Glu Val Thr Asp Ser Gln Val Ser Tyr Gly Thr His Asp Pro Ala 450 455 460 Thr Ala Trp Tyr Gln Glu Asp Ser Val Glu Phe Tyr Leu Asn Thr Thr465 470 475 480Gly Asp Leu Thr Asn Thr Ala Tyr Gln Pro Gly Val Ala Gln Ile Gly 485 490 495 Ile Met Ala Ala Asn Ile Asp Asn Asp Asn Pro Gly Ala Pro Ile Ile 500 505 510 Gly Gly Gly Asn Ser Asp Ile Ser Gln Val Lys Ala Ile Val Val Lys 515 520 525 Thr Asp Thr Gly Tyr Leu Val Glu Ala Ser Val Pro Leu Met Thr Asp 530 535 540 Val Trp Thr Ile Glu Pro Lys Gln Gly Ala Val Leu Gly Phe Gln Val545 550 555 560His Leu Asn Gly Ser Arg Thr Pro Asp Ala Asp Arg Asp Thr Lys Leu 565 570 575 Ile Trp Ser Leu Leu Asp Thr Leu Asp Gln Ser Tyr Ser Asn Pro Ser 580 585 590 Leu Phe Gly Arg Leu Ile Phe Trp Asn Ile Asn Leu 595 600 <210> 35

<211> 2286

<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 35

atgaccttga ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagctcgcgcgcct gcaggtcgac actagtggat ctcacgcttt acttcgaatc tcaaaatccaacccttgagt tctacgtgga tgacgtgaag atagtggata caacttccgc agagataaagattgaaatgg aacctgaaaa agagatacct gctctgaaag aagtactgaa agattacttcaaagtcggag ttgcactgcc gtccaaggtc ttcctcaacc cgaaggacat agaactcatcacgaaacact tcaacagcat caccgcagaa aacgagatga aaccggatag tctgctcgcgggcatcgaaa acggtaagct gaagttcagg tttgaaacag cagacaaata cattcagttcgtcgaggaaa acggcatggt tataagaggt cacacactgg tgtggcacaa ccagacacccgactggttct tcaaagacga aaacggaaac ctcctctcca aagaagcgat gacggaaagactcaaagagt acatccacac cgttgtcgga cacttcaaag gaaaagtcta cgcatgggacgtggtgaacg aagcggtcga tccgaaccag ccggatggac tgagaagatc aacctggtaccagatcatgg ggcctgacta catagaactc gccttcaagt tcgcaagaga ggcagatccagatgcaaaac tcttctacaa cgactacaac acattcgatc ccagaaagag agacatcàtctacaacctcg tgaaggatct caaagagaag ggactcatcg atggcatagg aatgcagtgtcacatcagtc ttgcaacaga catcaaacag atcgaagagg ccatcaaaaa gttcagcaccatacccggta tagaaattca catcacagaa ctcgatatga gtgtctacag agattccagttccaactacc cagaggcacc gaggacggca ctcatcgaac aggctcacaa aatgatgcagctctttgaga tcttcaagaa gcacagcaac gtgatcacga acgtcacatt ctggggtctcaaggacgatt actcctggag agcaacaaga agaaacgact ggccgctcat cttcgacaaagatcaccagg cgaaactcgc ttactgggcg atagtggcac ctgaggtcct tccaccacttccaaaagaaa gcaggatctc cgaaggcgaa gcagtggtag tggggatgat ggacgactcgtacctgatgt cgaagccgat agagatcctt gacgaagaag ggaacgtgaa ggcaacgatcagggcagtgt ggaaagacag cacgatctac atctacggag aggtacagga caagacaaagaaaccagcag aagacggagt ggccatattc atcaacccga acaacgaaag aacaccctatctgcagcctg atgacaccta cgttgtgctg tggacgaact ggaagacgga ggtcaacagagaagacgtac aggtgaagaa attcgttggg cctggcttta gaagatacag cttcgagatgtcgatcacga taccgggtgt ggagttcaag aaagacagct acataggatt tgacgttgcggtgatagacg acgggaagtg gtacagctgg agcgacacga cgaacagcca gaagacgaacacgatgaact acggaacgct gaagctcgaa ggaataatgg tagcgacagc aaaatacggaacaccggtca tcgatggaga gatcgatgag atctggaaca cgacagagga gatagagacgaaagcggtgg ctatgggatc gcttgacaag aatgcgacag cgaaagtgag ggtgctgtgggacgagaact acctgtacgt acttgcgatc gtgaaagatc ccgttctgaa caaagacaacagcaacccgt gggagcagga ttccgtggag atcttcgtgg atgagaacaa ccacaagacaggatactacg aagacgacga cgcgcagttc agggtgaact acatgaacga gcagacctttggaacgggag gaagtccagc gaggttcaag acagcggtga agctgatcga aggaggatacatagttgagg cagcgatcaa gtggaagacg atcaagccaa caccgaacac agtgataggattcaacatcc aggtgaacga tgcgaacgag aaagggcaga gggtcggtat catctcctggagcgatccca caaacaacag ctggcaagat ccttcaaagt tcggtaacct cagactcatcaagtga<210> 36<211> 761<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 36

Met Thr Leu Ile Thr

1 5

Lys Ser Trp Ser Ser20

Leu Tyr Phe Glu Ser35

Val Lys Ile Val Asp50

Pro Glu Lys Glu Ile65

Lys Val Gly Val Ala85

Ile Glu Leu Ile Thr100

Met Lys Pro Asp Ser115

Phe Arg Phe Glu Thr130

Pro Ser Ser Lys Leu Thr Leu Thr Lys Gly Asn

10 15

Arg Ala Cys Arg Ser Thr Leu Val Asp Leu Thr

25 30

Gln Asn Pro Thr Leu Glu Phe Tyr Val Asp Asp

40 45

Thr Thr Ser Ala Glu Ile Lys Ile Glu Met Glu

55 60

Pro Ala Leu Lys Glu Val Leu Lys Asp Tyr Phe70 75 80

Leu Pro Ser Lys Val Phe Leu Asn Pro Lys Asp

90 95

Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu

105 110

Leu Leu Ala Gly Ile Glu Asn Gly Lys Leu Lys

120 125

Ala Asp Lys Tyr Ile Gln Phe Val Glu Glu Asn135 140Gly Met Val Ile Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro145 150 155 160Asp Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser Lys Glu Ala 165 170 175 Met Thr Glu Arg Leu Lys Glu Tyr Ile His Thr Val Val Gly His Phe 180 185 190 Lys Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala Val Asp Pro 195 200 205 Asn Gln Pro Asp Gly Leu Arg Arg Ser Thr Trp Tyr Gln Ile Met Gly 210 215 220 Pro Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro225 230 235 240Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Phe Asp Pro Arg Lys 245 250 255 Arg Asp Ile Ile Tyr Asn Leu Val Lys Asp Leu Lys Glu Lys Gly Leu 260 265 270 Ile Asp Gly Ile Gly Met Gln Cys His Ile Ser Leu Ala Thr Asp Ile 275 280 285 Lys Gln Ile Glu Glu Ala Ile Lys Lys Phe Ser Thr Ile Pro Gly Ile 290 295 300 Glu Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Ser305 310 315 320Ser Asn Tyr Pro Glu Ala Pro Arg Thr Ala Leu Ile Glu Gln Ala His 325 330 335 Lys Met Met Gln Leu Phe Glu Ile Phe Lys Lys His Ser Asn Val Ile 340 345 350 Thr Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala 355 360 365 Thr Arg Arg Asn Asp Trp Pro Leu Ile Phe Asp Lys Asp His Gln Ala 370 375 380 Lys Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu385 390 395 400Pro Lys Glu Ser Arg Ile Ser Glu Gly Glu Ala Val Val Val Gly Met 405 410 415 Met Asp Asp Ser Tyr Leu Met Ser Lys Pro Ile Glu Ile Leu Asp Glu 420 425 430 Glu Gly Asn Val Lys Ala Thr Ile Arg Ala Val Trp Lys Asp Ser Thr 435 440 445 Ile Tyr Ile Tyr Gly Glu Val Gln Asp Lys Thr Lys Lys Pro Ala Glu 450 455 460 Asp Gly Val Ala Ile Phe Ile Asn Pro Asn Asn Glu Arg Thr Pro Tyr465 470 475 480Leu Gln Pro Asp Asp Thr Tyr Val Val Leu Trp Thr Asn Trp Lys Thr 485 490 495 Glu Val Asn Arg Glu Asp Val Gln Val Lys Lys Phe Val Gly Pro Gly 500 505 510 Phe Arg Arg Tyr Ser Phe Glu Met Ser Ile Thr Ile Pro Gly Val Glu 515 520 525 Phe Lys Lys Asp Ser Tyr Ile Gly Phe Asp Val Ala Val Ile Asp Asp 530 535 540 Gly Lys Trp Tyr Ser Trp Ser Asp Thr Thr Asn Ser Gln Lys Thr Asn545 550 555 560Thr Met Asn Tyr Gly Thr Leu Lys Leu Glu Gly Ile Met Val Ala Thr 565 570 575 Ala Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu Ile Asp Glu Ile Trp 580 585 590 Asn Thr Thr Glu Glu Ile Glu Thr Lys Ala Val Ala Met Gly Ser Leu 595 600 605 Asp Lys Asn Ala Thr Ala Lys Val Arg Val Leu Trp Asp Glu Asn Tyr 610 615 620 Leu Tyr Val Leu Ala Ile Val Lys Asp Pro Val Leu Asn Lys Asp Asn625 630 635 640Ser Asn Pro Trp Glu Gln Asp Ser Val Glu Ile Phe Val Asp Glu Asn 645 650 655 Asn His Lys Thr Gly Tyr Tyr Glu Asp Asp Asp Ala Gln Phe Arg Val 660 665 670 Asn Tyr Met Asn Glu Gln Thr Phe Gly Thr Gly Gly Ser Pro Ala Arg685

Tyr Ile Val Glu Ala700

Asn Thr Val Ile Gly720

Gly Gln Arg Val Gly735

Trp Gln Asp Pro Ser750

675 680Phe Lys Thr Ala Val Lys Leu Ile Glu Gly Gly

690 695

Ala Ile Lys Trp Lys Thr Ile Lys Pro Thr Pro705 710 715

Phe Asn Ile Gln Val Asn Asp Ala Asn Glu Lys

725 730

Ile Ile Ser Trp Ser Asp Pro Thr Asn Asn Ser

740 745

Lys Phe Gly Asn Leu Arg Leu Ile Lys755 760

<210> 37

<211> 2769

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 37

atgcacaaga agaacggcac ctattacctg agctactcta caaatccggc caacggcatg 60

cggattgact acatgaccag cacgagcccg accagtggct ttgtccatcg aggcacggtc 120

atggcgcagc cctggcagaa cagcaacaac aacaaccacg caaccagcac cgagtacaac 180

gggcagggct acatcttcta tcacaaccgt gcgttgtcga acgagcgtgc gggtggcaac 240

gtgctgcagc gctcggtgaa cgtggatcgc ctctacttca atgccgatgg cagcatccgt 300

caggtcactt ccagtgcaac cggcgtgccg gccctgaaaa ccctggatgc cttcctggtc 360

aagcctgccg agctgtatca caaggaaagc gggatcaaga ccgagcctgc cagtgaagga 420

acccaggcac tggttatgac ggctggtagc tgggtgcgcc tggccaatgt cgatttcggc 480

aatggcggcg ccactggttt ttccgcgcgt attgcggcaa ccggcagcgg cagcatccag 540

gtgatcctgg gcaatctgaa caacgccccg gtcggcacgc tggcagtgag cagcaccggc 600

aacctccaga cctggcaaga ccgcagcacc gccatcagca aggtgaccgg cgtgcatgac 660

gtgtatttgc gtgccaccgg caatgtgcat gtgcagcgtc actggttcgt ggcgtcggcg 720

ccggccgctg ccgcctcatc cagcagtcag gcaagcgtct ctgccagcag tcaggcaagt 780

gtttcttcca gtagccaggc aagcgttgcc tccagcagca gttccagccg cgcttcttcc 840

gccagcagtt cggtggcggc tggccaggtg gaggtcggtt atcgccttag cagcgaatgg 900

gccgccggct tctgcggcgt ggtcaccatc cgtaatccgg gtagttctcc ggtcaccagc 960

tggagtggca gtttcaacct gcctggcggc aagatcaccc agctgtggaa tgccaactgg 1020

acccagaacg gcagcaccgt gacggtatct tcccaggcct ggagcggtgc cattgctgca 1080

ggcgccacca tcaccacgcc gggcttctgc gccgagcgca cgagcagcaa tgcgtcctcc 1140

agtgtcgcca gcagcagtgt ctcctcatcg agcagcagtg ctgcggctgc cagctccagc 1200

gcggcttcca gcgtcccgtc cactggcagt ggcggggtgg gcagcagcgc atcctcggct 1260

agcagtgccg ctgcacccaa gggcgtgctt gaagtcggcc tgagcggcct ttccagccag 1320

gccatgttcg ccccgttgcg ggtcaggacg gacgctgcgg ccgccaacaa ggcctatgtt 13 80

gaatggccca acaacggcgc caatcagtcg ctggcaacgc ctgccaacga tgccgcaggg 1440

caggtggagg tagccttcgt gctggcccag gcatccgcag tgcagtttga tatcgaagcg 1500

aatttcgcca acgcggaaga cgactccttc tacttccagc tcaacggtgg tgcctggcag 1560

accttcaaca acgccaccac ggtcggctgg cagaccctgc cggtcgcctc tctgggcaat 1620

ctggctgccg ggcgccatgt gctgaccctg ctgcgccgcg aggatggcgc gaagctgggc 1680

aaggtcgtcc tgagtgcggc acagagcagc atcagtcgtg ccacgccggt ggcctacgcg 1740

tcgccgaatg atgttgccaa cctgttcaag ctggccagct tcccgatcgg ggtggcggtc 1800

agtgccggca acgaaggtga cagcctgctg cgtagcggta cccgcgcagc agccgagcgt 1860

gcgctgaccg agaagcactt caacagtctg gtggccggca acatcatgaa gatgagctac 192 0

ctgcatccgg ccgagaacac ctacaccttc acccaggcgg atgcgctggc cgactacgcc 1980

aagtccaagg gcatggtgtt gcatggccat gcgctggtct ggcatgcgga ctatcaggta 2040

cccaactgga tgaagaatta caccggagac tggtcgaaga tgctcgaagc ccacgtcacc 2100

accgtcgcca agcactatgc cggcaaggtg gtgagctggg atgtggtgaa tgaagccctg 2160

gccgatggca atgccaccgc caccaagggt ttccgtgcca ccgattcgat cttctatcag 2220

aagatgggct ccagtttcat cgagaaggcc tttattgctg cacgtgctgc cgacccgaat 2280

gccgacctgt attacaacga ctacggcatg gagggcggaa acagcaagtt caattactgc 2340

atggccatgg tcgatgattt ccagaagcgt ggcattccca tcgacggcat cggtttccag 2400

atgcacatca acatcgactg gccttcgtcg gcccagatcc gcgctgtatt cagtgaagtg 2460

gtcaagcgtg gtctgaaggt gcgtatctcc gagctggata ttccggtgaa taccactgcc 2520

ggtcgttttg ccagcctgaa tgccacggcc aacgagctgc agaagaagaa gtatcgtgag 2580

gttgtggctg cctacctgga tgtggtgccg cccgagctgc gcggtggcat caccgtgtgg 2640

ggcctgagcg acaacggcag ctggctggtg acccccacca agccggactg gccgctgctg 2700

ttcgatgccg acctcaaggc caaggacgcc ctgagcggct ttgccgacgc cctgcgcggc 2760

97 f, Q

gtacgctga<210> 38<211> 922<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 38

Met His Lys Lys Asn Gly Thr Tyr Tyr Leu Ser Tyr Ser Thr Asn Pro1 5 10 15 Ala Asn Gly Met Arg Ile Asp Tyr Met Thr Ser Thr Ser Pro Thr Ser 20 25 30 Gly Phe Val His Arg Gly Thr Val Met Ala Gln Pro Trp Gln Asn Ser 35 40 45 Asn Asn Asn Asn His Ala Thr Ser Thr Glu Tyr Asn Gly Gln Gly Tyr 50 55 60 Ile Phe Tyr His Asn Arg Ala Leu Ser Asn Glu Arg Ala Gly Gly Asn 65 70 75 80Val Leu Gln Arg Ser Val Asn Val Asp Arg Leu Tyr Phe Asn Ala Asp 85 90 95 Gly Ser Ile Arg Gln Val Thr Ser Ser Ala Thr Gly Val Pro Ala Leu 100 105 110 Lys Thr Leu Asp Ala Phe Leu Val Lys Pro Ala Glu Leu Tyr His Lys 115 120 125 Glu Ser Gly Ile Lys Thr Glu Pro Ala Ser Glu Gly Thr Gln Ala Leu 130 135 140 Val Met Thr Ala Gly Ser Trp Val Arg Leu Ala Asn Val Asp Phe Gly145 150 155 160Asn Gly Gly Ala Thr Gly Phe Ser Ala Arg Ile Ala Ala Thr Gly Ser 165 170 175 Gly Ser Ile Gln Val Ile Leu Gly Asn Leu Asn Asn Ala Pro Val Gly 180 185 190 Thr Leu Ala Val Ser Ser Thr Gly Asn Leu Gln Thr Trp Gln Asp Arg 195 200 205 Ser Thr Ala Ile Ser Lys Val Thr Gly Val His Asp Val Tyr Leu Arg 210 215 220 Ala Thr Gly Asn Val His Val Gln Arg His Trp Phe Val Ala Ser Ala225 230 235 240Pro Ala Ala Ala Ala Ser Ser Ser Ser Gln Ala Ser Val Ser Ala Ser 245 250 255 Ser Gln Ala Ser Val Ser Ser Ser Ser Gln Ala Ser Val Ala Ser Ser 260 265 270 Ser Ser Ser Ser Arg Ala Ser Ser Ala Ser Ser Ser Val Ala Ala Gly 275 280 285 Gln Val Glu Val Gly Tyr Arg Leu Ser Ser Glu Trp Ala Ala Gly Phe 290 295 300 Cys Gly Val Val Thr Ile Arg Asn Pro Gly Ser Ser Pro Val Thr Ser305 310 315 320Trp Ser Gly Ser Phe Asn Leu Pro Gly Gly Lys Ile Thr Gln Leu Trp 325 330 335 Asn Ala Asn Trp Thr Gln Asn Gly Ser Thr Val Thr Val Ser Ser Gln 340 345 350 Ala Trp Ser Gly Ala Ile Ala Ala Gly Ala Thr Ile Thr Thr Pro Gly 355 360 365 Phe Cys Ala Glu Arg Thr Ser Ser Asn Ala Ser Ser Ser Val Ala Ser 370 375 380 Ser Ser Val Ser Ser Ser Ser Ser Ser Ala Ala Ala Ala Ser Ser Ser385 390 395 400Ala Ala Ser Ser Val Pro Ser Thr Gly Ser Gly Gly Val Gly Ser Ser 405 410 415 Ala Ser Ser Ala Ser Ser Ala Ala Ala Pro Lys Gly Val Leu Glu Val 420 425 430 Gly Leu Ser Gly Leu Ser Ser Gln Ala Met Phe Ala Pro Leu Arg Val 435 440 445 Arg Thr Asp Ala Ala Ala Ala Asn Lys Ala Tyr Val Glu Trp Pro Asn 450 455 460 Asn Gly Ala Asn Gln Ser Leu Ala Thr Pro Ala Asn Asp Ala Ala Gly465 470 475 480Gln Val Glu Val Ala Phe Val Leu Ala Gln Ala Ser Ala Val Gln Phe

485 490 495Asp Ile Glu Ala 500 Asn Phe Ala Asn Ala 505 Glu Asp Asp Ser Phe 510 Tyr PheGln Leu Asn Gly Gly Ala Trp Gln Thr Phe Asn Asn Ala Thr Thr Val 515 520 525 Gly Trp Gln Thr Leu Pro Val Ala Ser Leu Gly Asn Leu Ala Ala Gly 530 535 540 Arg His Val Leu Thr Leu Leu Arg Arg Glu Asp Gly Ala Lys Leu Gly545 550 555 560Lys Val Val Leu Ser Ala Ala Gln Ser Ser Ile Ser Arg Ala Thr Pro 565 570 575 Val Ala Tyr Ala 580 Ser Pro Asn Asp Val 585 Ala Asn Leu Phe Lys 590 Leu AlaSer Phe Pro Ile Gly Val Ala Val Ser Ala Gly Asn Glu Gly Asp Ser 595 600 605 Leu Leu 610 Arg Ser Gly Thr Arg 615 Ala Ala Ala Glu Arg 620 Ala Leu Thr GluLys His Phe Asn Ser Leu Val Ala Gly Asn Ile Met Lys Met Ser Tyr625 630 635 640Leu His Pro Ala Glu 645 Asn Thr Tyr Thr Phe 650 Thr Gln Ala Asp Ala 655 LeuAla Asp Tyr Ala 660 Lys Ser Lys Gly Met 665 Val Leu His Gly His 670 Ala LeuVal Trp His 675 Ala Asp Tyr Gln Val 680 Pro Asn Trp Met Lys 685 Asn Tyr ThrGly Asp 690 Trp Ser Lys Met Leu 695 Glu Ala His Val Thr 700 Thr Val Ala LysHis Tyr Ala Gly Lys Val Val Ser Trp Asp Val Val Asn Glu Ala Leu705 710 715 720Ala Asp Gly Asn Ala 725 Thr Ala Thr Lys Gly 730 Phe Arg Ala Thr Asp 735 SerIle Phe Tyr Gln 740 Lys Met Gly Ser Ser 745 Phe Ile Glu Lys Ala 750 Phe IleAla Ala Arg 755 Ala Ala Asp Pro Asn 760 Ala Asp Leu Tyr Tyr 765 Asn Asp TyrGly Met Glu Gly Gly Asn Ser Lys Phe Asn Tyr Cys Met Ala Met Val 770 775 780 Asp Asp Phe Gln Lys Arg Gly Ile Pro Ile Asp Gly Ile Gly Phe Gln785 790 795 800Met His Ile Asn Ile 805 Asp Trp Pro Ser Ser 810 Ala Gln Ile Arg Ala 815 ValPhe Ser Glu Val 820 Val Lys Arg Gly Leu 825 Lys Val Arg Ile Ser 830 Glu LeuAsp Ile Pro 835 Val Asn Thr Thr Ala 840 Gly Arg Phe Ala Ser 845 Leu Asn AlaThr Ala 850 Asn Glu Leu Gln Lys 855 Lys Lys Tyr Arg Glu 860 Val Val Ala AlaTyr Leu Asp Val Val Pro Pro Glu Leu Arg Gly Gly Ile Thr Val Trp865 870 875 880Gly Leu Ser Asp Asn 885 Gly Ser Trp Leu Val 890 Thr Pro Thr Lys Pro 895 AspTrp Pro Leu Leu 900 Phe Asp Ala Asp Leu 905 Lys Ala Lys Asp Ala 910 Leu SerGly Phe Ala 915 Asp Ala Leu Arg Gly 920 Val Arg

<210> 39

<211> 1143<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 39

atgaaaaaaa cgattgcaca tttcacctta tggatagtgt tttttctctt cacttcctgtgctgttacgg cgcagaagaa tgcaaagaat acaagagtaa aacccactac cctaaaagaggcttaccaag gtaaattcta tatcggtact gcgatgaact tgagacagat tcacggagatgatccccaat ctgaaaatat tatcaaaaaa cagttcaatt ccatagttgc cgaaaactgcatgaagagta tgtatcttca gccggaggaa ggaaaatttt tcttcgatga tgcggacaagtttgtggatt ttggtcttca gaacaatatg ttcatcattg ggcattgtct gatttggcattcgcaggcgc caaaatggtt tttcaccgat gagaatggaa acacggtttc tccagaagtt 420

cttaaacaaa ggatgaaagc ccatattacc gccgtcgttt cccgttacaa agggaaaatc 480

aaaggttggg atgtggtgaa cgaagccatt atggaagatg gttcttaccg taaaagcaaa 540

ttttacgaga ttttgggaga agaatttatt ccgttggcat ttcagtatgc gcatgaagca 600

gatcctgatg cagaacttta ttacaacgat tataacgaat ggtatcccgg aaaaagagct 660

acggtgacca agataatccg cgatttcaaa actagaggaa tccgcatcga tgccatcgga 720

atgcaggctc atttcgggat ggattcgccc actgtagaag agtatgaaca aactattcag 780

ggctatataa aagaaggcgt gaaagtcaat attacggaac tcgatttgag tccacttcct 840

tctccttggg gaacttccgc caatgttgcc gatacgcagc aatatcagga aaaaatgaat 900

ccatacacca aaggacttcc tgcagatgtt gaaaaagcat gggaaaaccg ttatgtggat 960

tttttcaaac tgttcctaaa atatcatcag catattgagc gtgttacgtt ttggggcgtt 1020agcgatatcg attcctggaa gaacgatttt ccggtaagag gacgtaccga ttatccacta 1080ccgtttaacc gtcaatatca agcaaaacct ttggttcaga aattaataga tttaacaaaa 1140tag 1143

<210> 40

<211> 380<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(24)<400> 40

Met Lys Lys Thr Ile Ala His Phe Thr Leu Trp Ile Val Phe Phe Leu1 5 10 15

Phe Thr Ser Cys Ala Val Thr Ala Gln Lys Asn Ala Lys Asn Thr Arg

20 25 30

Val Lys Pro Thr Thr Leu Lys Glu Ala Tyr Gln Gly Lys Phe Tyr Ile35 40 45

Gly Thr Ala Met Asn Leu Arg Gln Ile His Gly Asp Asp Pro Gln Ser

50 55 60

Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile Val Ala Glu Asn Cys65 70 75 80

Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe Phe Phe Asp

85 90 95

Asp Ala Asp Lys Phe Val Asp Phe Gly Leu Gln Asn Asn Met Phe Ile

100 105 110

Ile Gly His Cys Leu Ile Trp His Ser Gln Ala Pro Lys Trp Phe Phe115 120 125

Thr Asp Glu Asn Gly Asn Thr Val Ser Pro Glu Val Leu Lys Gln Arg

130 135 140

Met Lys Ala His Ile Thr Ala Val Val Ser Arg Tyr Lys Gly Lys Ile145 150 155 160

Lys Gly Trp Asp Val Val Asn Glu. Ala Ile Met Glu Asp Gly Ser Tyr

165 170 175

Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe Ile Pro Leu

180 185 190

Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr195 200 205

Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg Ala Thr Val Thr Lys

210 215 220

Ile Ile Arg Asp Phe Lys Thr Arg Gly Ile Arg Ile Asp Ala Ile Gly225 230 235 240

Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Val Glu Glu Tyr Glu

245 250 255

Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val Lys Val Asn Ile Thr

260 265 270

Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp Gly Thr Ser Ala Asn275 280 285

Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met Asn Pro Tyr Thr Lys

290 295 300

Gly Leu Pro Ala Asp Val Glu Lys Ala Trp Glu Asn Arg Tyr Val Asp305 310 315 320

Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His Ile Glu Arg Val Thr

325 330 335

Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys Asn Asp Phe Pro Val340 345 350

Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asn Arg Gln Tyr Gln Ala

355 360 365

Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr Lys370 375 380

<210> 41<211> 1893<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 41

atgatccatc aàcaaaagcc caaccaagac atcggtaggc tattcaagcg cagctgcagctttgtcggta ttagcgcggc actggctgtt ttctcacaca ccgcaagtgc agcctgtacttacaacattg ataaccaatg gggcagcggt tttgtcgcta gtattactgt aaagaatgacactggtgcaa ccgtcaataa ctggagtgtg aattggcaat atgccaacaa tcgcatcaccaatggttgga gtgcaaattt ctctggcagc aatccttaca ccgccaccaa tatgagctggaacggtagca ttgccgctgg ccagtcggtg acttttggtt tccagggcaa cactaacagcaataccgttg agcgcccggt ggttaacggt tcactgtgcg gtactgcaac aacctcttcagttcgctcca gcgtggctgc gacgtcttcc agtcgctcca gtgttgcgcc cagctcgattcctgcttcca gcactccgcg ttcaagcaca cctgccacct cttcttctgc ttccagcttctcagtaccgg ccaataattt tgcgcagaat ggcggcgtgg aatctggttt gaccaactggggtacgactg cgggcaccgt gactcgctct actgccgata aacacagcgg tacagccagtgccttaatta ccggccgcac tgctgcctgg aatggtttga cgtttaatgt gggcgcattgaccaacggca accagtacca agtcaacgtg tgggtgaaat tggctccagg tacgcccgacagcgtactga ccttaaccgg taagcgtgta gacgatagcg atactactac ctacaacgaatacacacgcg tagcgactgt gactgcctct gccaatgagt ggcgtttgct ggaaggttactacacccaat ctggcagcac tgcattccag catttcatta tcgaagcaac ggatactactgccagttatt acgcggatga tttcgccatc ggcggtcaag tcgtacaagt tccaagcagcagctcacgca gctcaagcag tgctccggcg gctagaaaat tcatcggcaa catcaccacctcgggtgcag tgagatccga ctttactcgt tactggaacc aaattacacc agagaacgaaggtaagtggg gttccgttga aggtactcgc aaccagtaca actgggcacc gctggatcgtatttatgctt acgctcgcca aaataatatt ccggtaaaag ctcacacgtt tgtgtggggtgcgcaatcac ccgcgtggct caataactta agcggaccgg aagtcgctgt tgaaattgaacaatggattc gcgattactg tactcgttac cctgacacgg cgatgattga cgtagtgaacgaagcggttc ctggccatca accggcaggt tatgcacaac gagcatttgg caataactggatccaacgcg tgttccaatt ggctcgccaa tattgcccta actcgatcct gatcctgaatgattacaaca atatccgttg gcagcacaat gagtttattg cccttgcaaa agctcaaggcaattatattg atgcagtcgg cctgcaggcg catgaactga agggtatgac agcggcgcaagtcaaaaccg caatcgacaa tatttggaac caagtgggca agcccatcta catttctgaatacgacattg gcgataacaa tgaccaggtt caattgcaga atttccaggc gcatttccctgtattctggg accatccgca tgttaaaggc atcaccattt ggggttatgt caatggcagaacttggattg aaggctcggg cctgatttct gacaacggaa caccgcgccc cgcaatgacttggttgctga ataactatat caataagcag taa<210> 42<211> 630<212> PRT<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental

<220> <221> SIGNAL <222> (1) . . . (37) <400> 42 Met Ile His Gln Gln Lys Pro Asn Gln Asp Ile Gly Arg Leu Phe Lys1 5 10 15 Arg Ser Cys Ser Phe Val Gly Ile Ser Ala Ala Leu Ala Val Phe Ser 20 25 30 His Thr Ala Ser Ala Ala Gys Thr Tyr Asn Ile Asp Asn Gln Trp Gly35 40 45 Ser Gly Phe Val Ala Ser Ile Thr Val Lys Asn Asp Thr Gly Ala Thr50 55 60 Val Asn Asn Trp Ser Val Asn Trp Gln Tyr Ala Asn Asn Arg Ile Thr65 70 75 80Asn Gly Trp Ser Ala Asn Phe Ser Gly Ser Asn Pro Tyr Thr Ala Thr 85 90 95 Asn Met Ser Trp Asn Gly Ser Ile Ala Ala Gly Gln Ser Val Thr Phe100 105 110

Gly Phe Gln Gly Asn Thr Asn Ser Asn Thr Val Glu Arg Pro Val Val 115 120 125 Asn Gly Ser Leu Cys Gly Thr Ala Thr Thr Ser Ser Val Arg Ser Ser 130 135 140 Val Ala Ala Thr Ser Ser Ser Arg Ser Ser Val Ala Pro Ser Ser Ile145 150 155 160Pro Ala Ser Ser Thr Pro Arg Ser Ser Thr Pro Ala Thr Ser Ser Ser 165 170 175 Ala Ser Ser Phe Ser Val Pro Ala Asn Asn Phe Ala Gln Asn Gly Gly 180 185 190 Val Glu Ser Gly Leu Thr Asn Trp Gly Thr Thr Ala Gly Thr Val Thr 195 200 205 Arg Ser Thr Ala Asp Lys His Ser Gly Thr Ala Ser Ala Leu Ile Thr 210 215 220 Gly Arg Thr Ala Ala Trp Asn Gly Leu Thr Phe Asn Val Gly Ala Leu225 230 235 240Thr Asn Gly Asn Gln Tyr Gln Val Asn Val Trp Val Lys Leu Ala Pro 245 250 255 Gly Thr Pro Asp Ser Val Leu Thr Leu Thr Gly Lys Arg Val Asp Asp 260 265 270 Ser Asp Thr Thr Thr Tyr Asn Glu Tyr Thr Arg Val Ala Thr Val Thr 275 280 285 Ala Ser Ala Asn Glu Trp Arg Leu Leu Glu Gly Tyr Tyr Thr Gln Ser 290 295 300 Gly Ser Thr Ala Phe Gln His Phe Ile Ile Glu Ala Thr Asp Thr Thr305 310 315 320Ala Ser Tyr Tyr Ala Asp Asp Phe Ala Ile Gly Gly Gln Val Val Gln 325 330 335 Val Pro Ser Ser Ser Ser Arg Ser Ser Ser Ser Ala Pro Ala Ala Arg 340 345 350 Lys Phe Ile Gly Asn Ile Thr Thr Ser Gly Ala Val Arg Ser Asp Phe 355 360 365 Thr Arg Tyr Trp Asn Gln Ile Thr Pro Glu Asn Glu Gly Lys Trp Gly 370 375 380 Ser Val Glu Gly Thr Arg Asn Gln Tyr Asn Trp Ala Pro Leu Asp Arg385 390 395 400Ile Tyr Ala Tyr Ala Arg Gln Asn Asn Ile Pro Val Lys Ala His Thr 405 410 415 Phe Val Trp Gly Ala Gln Ser Pro Ala Trp Leu Asn Asn Leu Ser Gly 420 425 430 Pro Glu Val Ala Val Glu Ile Glu Gln Trp Ile Arg Asp Tyr Cys Thr 435 440 445 Arg Tyr Pro Asp Thr Ala Met Ile Asp Val Val Asn Glu Ala Val Pro 450 455 460 Gly His Gln Pro Ala Gly Tyr Ala Gln Arg Ala Phe Gly Asn Asn Trp465 470 475 480Ile Gln Arg Val Phe Gln Leu Ala Arg Gln Tyr Cys Pro Asn Ser Ile 485 490 495 Leu Ile Leu Asn Asp Tyr Asn Asn Ile Arg Trp Gln His Asn Glu Phe 500 505 510 Ile Ala Leu Ala Lys Ala Gln Gly Asn Tyr Ile Asp Ala Val Gly Leu 515 520 525 Gln Ala His Glu Leu Lys Gly Met Thr Ala Ala Gln Val Lys Thr Ala 530 535 540 Ile Asp Asn Ile Trp Asn Gln Val Gly Lys Pro Ile Tyr Ile Ser Glu545 550 555 560Tyr Asp Ile Gly Asp Asn Asn Asp Gln Val Gln Leu Gln Asn Phe Gln 565 570 575 Ala His Phe Pro Val Phe Trp Asp His Pro His Val Lys Gly Ile Thr 580 585 590 Ile Trp Gly Tyr Val Asn Gly Arg Thr Trp Ile Glu Gly Ser Gly Leu 595 600 605 Ile Ser Asp Asn Gly Thr Pro Arg Pro Ala Met Thr Trp Leu Leu Asn

610 615 620

Asn Tyr Ile Asn Lys Gln625 630<210> 43<211> 1011<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 43

atgcaaacaa atattaaagg aaataacatt ccatcattac acgaagttta tcaagatcac 60

tttttgatag gtgcagcagt taatccaaaa acattagact cacagcagga tttattgaga 120

aaacacttta acagtattac agctgaaaat gaaatgaaat ttgaagaatt gcaaccagaa 180

cctggccatt tcacgtttgg tgtagcagat gaaatcgttt catttgcaaa agaaaatgga 240

atgaaagtta gaggacatac attagtttgg cataatcaaa cgcctgattg gatgtttttg 300

aatgaagatg gàtctgtcac agatcgagaa acgcttctag aaagaatgaa attacacatt 360

acaacagtta tgcagcatta caaaggtcaa gcttattgct gggatgttgt aaatgaggtg 420

attgctgacg agggtacaga gttattccgt aaatctaaat ggactgaaat tattggtgat 480

gattttgtag aaaaggcatt tgaatatgca catgaggctg atccagaagc tttactattc 540

tacaatgact ataatgaatc ccatcccaat aagcgtgaga aaattttcac acttgtaaaa 600

ggattagttg ataaggggat acctattcat ggaatcggtt tacaagcaca ttggaattta 660

acaggacctt cttatgaaga tattagagca gcactcgaga aatatgctac attgggattg 720

gaaatacacc ttaccgaatt ggatgtttct gtttttaatt atgaagatcg aagaacagat 780

ttaacagaac caactaaaga tatgcaagcg cttcaagcgg agcgttatac agaattattc 840

aagatattga gagaatatag tcatgtaatc agttcgatta ctttttgggg agctgcagat 900

gattatactt ggttagatga ttttcctgtc aaaggaagaa aaaactggcc atttgttttt 960

gatgaaaacc aagagccaaa agagtcattt tggaatatta ttgactttta a 1011

<210> 44

<211> 336

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 44

Met Gln Thr Asn Ile Lys Gly Asn Asn Ile Pro Ser Leu His Glu Val

1 5 10 15

Tyr Gln Asp His Phe Leu Ile Gly Ala Ala Val Asn Pro Lys Thr Leu20 25 30

Asp Ser Gln Gln Asp Leu Leu Arg Lys His Phe Asn Ser Ile Thr Ala

35 40 45

Glu Asn Glu Met Lys Phe Glu Glu Leu Gln Pro Glu Pro Gly His Phe50 55 60

Thr Phe Gly Val Ala Asp Glu Ile Val Ser Phe Ala Lys Glu Asn Gly65 70 75 80

Met Lys Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp

85 90 95

Trp Met Phe Leu Asn Glu Asp Gly Ser Val Thr Asp Arg Glu Thr Leu

100 105 110

Leu Glu Arg Met Lys Leu His Ile Thr Thr Val Met Gln His Tyr Lys

115 120 125

Gly Gln Ala Tyr Cys Trp Asp Val Val Asn Glu Val Ile Ala Asp Glu130 135 140

Gly Thr Glu Leu Phe Arg Lys Ser Lys Trp Thr Glu Ile Ile Gly Asp145 150 155 160

Asp Phe Val Glu Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Glu

165 170 175

Ala Leu Leu Phe Tyr Asn Asp Tyr Asn Glu Ser His Pro Asn Lys Arg180 185 190

Glu Lys Ile Phe Thr Leu Val Lys Gly Leu Val Asp Lys Gly Ile Pro

195 200 205

Ile His Gly Ile Gly Leu Gln Ala His Trp AsnLeu Thr Gly Pro Ser210 215 220

Tyr Glu Asp Ile Arg Ala Ala Leu Glu Lys Tyr Ala Thr Leu Gly Leu225 230 235 240

Glu Ile His Leu Thr Glu Leu Asp Val Ser Val Phe Asn Tyr Glu Asp

245 250 255

Arg Arg Thr Asp Leu Thr Glu Pro Thr Lys Asp Met Gln Ala Leu Gln260 265 270

Ala Glu Arg Tyr Thr Glu Leu Phe Lys Ile Leu Arg Glu Tyr Ser His275 280 285Val Ile Ser Ser Ile Thr Phe Trp Gly Ala Ala

290 295

Leu Asp Asp Phe Pro Val Lys Gly Arg Lys Asn305 310 315

Asp Glu Asn Gln Glu Pro Lys Glu Ser Phe Trp

325 330

<210> 45<211> 1137<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 45

atgaagatat cacgccgaca attacttgct atgggtggtggccaaattat tcgctgccga aaaagctgct gccgccaccgaacgatttcc tgatcggtgc tgcattaaat acccaaattgcttactgcac tgatcaccaa agaatttaat tcaattaccggaaaggttgc gcaatgaaaa agatggtagc tgggaatggaaatttcgggg ttgcccataa catgcatatt gtcgggcataattcccgaca gcgtctttaa aaacaaagat ggcagttataaaaaaacaac aagagcacat caccacctta gtggatcgtttgggatgtgg ttaacgaagc catgggcgat gacaacaagaaacattatgg gtgatgactt tctcgtcaac gcctttaagcaaagcacatt tgatgtacaa cgattacaac aacgagcgccgttgatatgc tcaagcgcct gttaaaactc ggggcgccgagcacatattg gcctggatgc ggatatgaaa aactttgaaggaattaggct tgcgtattca ccttaccgaa ctggatatagaatttgccag tcgctgaagt atctacccgt tttgaatacaatcaaaggcc tgccaaaaga gatcgacgaa aaactcgcgaaaaattttgc ttaagcataa agacaaagta gatcgtgtgagatgccagct ggctaaatgg cttcccgatc ccgggccgcagaccgtaagc agcaacctaa agcagcgtac ttccgcttac<210> 46<211> 378<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220><221> SIGNAL

<222> (1) . . . (25)<400> 46

Met Lys Ile Ser Arg Arg Gln Leu Leu Ala Met1 5 10

Thr Leu Ala Ser Ala Lys Leu Phe Ala Ala Glu20 25

Thr Gly Leu Lys Asp Ala Tyr Lys Asn Asp Phe

35 40

Leu Asn Thr Gln Ile Val Asp Gly Lys Asp Pro

50 55

Ile Thr Lys Glu Phe Asn Ser Ile Thr Ala Glu65 70 75

Glu Arg Leu Arg Asn Glu Lys Asp Gly Ser Trp85 90

Asp Ala Phe Val Asn Phe Gly Val Ala His Asn100 105

His Thr Leu Gly Trp His Ser Gln Ile Pro Asp

115 120

Lys Asp Gly Ser Tyr Ile Ser Lys Glu Ala Leu130 135

Glu His Ile Thr Thr Leu Val Asp Arg Tyr Lys145 150 155

Trp Asp Val Val Asn Glu Ala Met Gly Asp Asp165 170

Ser His Trp Tyr Asn Ile Met Gly Asp Asp Phe180 185

Lys Leu Ala His Glu Thr Asp Pro Lys Ala His

Asp Asp Tyr Thr Trp300

Trp Pro Phe Val Phe320

Asn Ile Ile Asp Phe335

ccgctgcaac cctggcctct 60gattgaaaga tgcctataaa 120ttgatggcaa agaccccaaa 180cagagaattg ccagaagtgg 240aagatagcga tgcctttgtg 300cgttgggctg gcatagccaa 360tttccaaaga ggcactggca 420acaaaggcaa aattgccgca 480tgcgcgcaag ccattggtac 540tcgcgcatga gactgacccc 600cggaaaagcg cgcagcaacg 660tccacggttt gggaatgcag 720acagtattgt cgcctattca 780atgtgttgcc ctcggtgtgg 840aaccggagcg agatccttac 900aggcttatga atcgctattt 960ccttctgggg tgtgagtgat 1020ccaattatcc actgttattt 1080tggatttaaa gcgttaa 1137

Gly Gly

Lys Ala

Leu Ile

45Lys Leu60

Asn Cys

Glu Trp

Met His

Ser Val125Ala Lys140

Gly LysAsn LysLeu ValLeu Met

Ala Ala Ala15

Ala Ala Ala30

Gly Ala Ala

Thr Ala Leu

Gln Lys Trp80

Lys Asp Ser95

Ile Val Gly110

Phe Lys Asn

Lys Gln Gln

Ile Ala Ala160

Met Arg Ala

175Asn Ala Phe190

Tyr Asn Asp195 200

Tyr Asn Asn Glu Arg Pro Glu Lys Arg Ala Ala

210 215

Lys Arg Leu Leu Lys Leu Gly Ala Pro Ile His225 230 235

Ala His Ile Gly Leu Asp Ala Asp Met Lys Asn

205

220

245

250

Val Ala Tyr Ser Glu Leu Gly Leu Arg Ile His260 265

Ile Asp Val Leu Pro Ser Val Trp Asn Leu Pro275 280

Thr Arg Phe Glu Tyr Lys Pro Glu Arg Asp Pro

290 295

Pro Lys Glu Ile Asp Glu Lys Leu Ala Lys Ala305 310 315

Lys Ile Leu Leu Lys His Lys Asp Lys Val Asp

325 330

Gly Val Ser Asp Asp Ala Ser Trp Leu Asn Gly340 345

Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Lys355 360

Ala Tyr Phe Arg Leu Leu Asp Leu Lys Arg

370 375

<210> 47<211> 1137<212> DNA

<213> Desconhecido<220>

<223> Obtido para Uma amostra ambiental<400> 47

atgaaaagaa taaagattct gaattcgatt gtattagcttccgggatgtt ccaatgcaca gaagagcgag ccggtgctgattttacatcg gggctgctct caataccccc caaattacggaaaatggtca ccagacattt taactccatc gtagctgagaatccagcgga ccgaagggga gtttgatttc agtcttgccggaaaaacaca acatgcacat tgtggggcat accctgatattggtttttca ccggtgcaga cggaaacgaa gtcagccgggaagaaccata tttatacggt cgtggggcgt tacaaaggccgtcaacgaag ccattgaaga caacggctca tggcgcaacaggtgacgagt ttgtggaact ggcctttaaa tttgccgcagctttactata acgactactc catggcatta gaaggcaggagtgaagaacc ttcagtccaa gggactcaaa attgacggtactcatggact cgcccacgct ggaagcttat gaagaaagtaggcgttaagg tgatgatcac ggaactcgat ttgtctgcgccagggagccg atattgccct gagggctgag tatgaggcacggtttaaccg attcagcttc cgtggcatgg aatcagcggattcctgaagc accaggacaa aatcagcagg gttacccttttcctggaaaa ataactttcc gatgagagga aggacagactaattaccaac ccaaaccggt ggtggaaaga atcatcaaag

<210> 48

<211> 378

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL

<222> (1) ... (26)

<400> 48

Met Lys Arg Ile Lys Ile Leu Asn Ser Ile Val1 5 10

Ala Ile Ile Leu Pro Gly Cys Ser Asn Ala Gln

285

300

Asp Met LeuGly Met Gln 240Asp Ser Ile 255 Glu Leu Asp270 Glu Val SerLys Gly LeuSer Leu Phe 320Thr Phe Trp 335 Ile Pro Gly350 Pro Lys Ala

365

taatcctggcaagatgccctgccgggatacactgcatgaaaccagtttgtggcattcacaaggtactgatgtgtccacgggcaagttttaaagccgacccgaaatggcgttcggcatgcatcctggcctatgccatggccggatgaatcctgggcgatttggggggtcacacccgttgctaagcgaaagc

gatcatcctgttcgggaaaacttgtccatgaagcggggagcgcgttcggcggcgccgcgctgagcgcatgctgggatgtgccagatcttaggatgccgaatatcagaatgggggcatctgttccggactgagcccgtcagttacaccgaacttctctcttcgataaccaattttgaccggaaaataa

20

25

Leu Lys Asp Ala Leu Ser Gly Lys Phe Tyr Ile

35

40

Thr Pro Gln Ile Thr Gly Arg Asp Thr Leu Ser

50

55

Leu Ala Leu Ile Leu1 5

Lys Ser Glu Pro Val30

Gly Ala Ala Leu Asn45

Met Lys Met Val Thr60

60120180240300360420480540600660720780840900960102010801137Arg His Phe Asn Ser Ile Val Ala Glu Asn Cys Met Lys Ser Gly Glu65 70 75 80

Ile Gln Arg Thr Glu Gly Glu Phe Asp Phe Ser Leu Ala Asp Gln Phe85 90 95

Val Ala Phe Gly Glu Lys His Asn Met His Ile Val Gly His Thr Leu100 105 110

Ile Trp His Ser Gln Ala Pro Arg Trp Phe Phe Thr Gly Ala Asp Gly

115 120 125

Asn Glu Val Ser Arg Glu Val Leu Ile Glu Arg Met Lys Asn His Ile130 135 140

Tyr Thr Val Val Gly Arg Tyr Lys Gly Arg Val His Gly Trp Asp Val145 150 155 160

Val Asn Glu Ala Ile Glu Asp Asn Gly Ser Trp Arg Asn Ser Lys Phe165 170 175

Tyr Gln Ile Leu Gly Asp Glu Phe Val Glu Leu Ala Phe Lys Phe Ala180 185 190

Ala Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Met

195 200 205

Ala Leu Glu Gly Arg Arg Asn Gly Val Ile Arg Met Val Lys Asn Leu

210 215 220

Gln Ser Lys Gly Leu Lys Ile Asp Gly Ile Gly Met Gln Gly His Leu225 230 235 240

Leu Met Asp Ser Pro Thr Leu Glu Ala Tyr Glu Glu Ser Ile Leu Ala245 250 255

Tyr Ser Gly Leu Gly Val Lys Val Met Ile Thr Glu Leu Asp Leu Ser260 265 270

Ala Leu Pro Trp Pro Ala Arg Gln Gln Gly Ala Asp Ile Ala Leu Arg

275 280 285

Ala Glu Tyr Glu Ala Arg Met Asn Pro Tyr Thr Glu Gly Leu Thr Asp290 295 300

Ser Ala Ser Val Ala Trp Asn Gln Arg Met Gly Asp Phe Phe Ser Leu305 310 315 320

Phe Leu Lys His Gln Asp Lys Ile Ser Arg Val Thr Leu Trp Gly Val325 330 335

Thr Asp Asn Gln Ser Trp Lys Asn Asn Phe Pro Met Arg Gly Arg Thr340 345 350

Asp Tyr Pro Leu Leu Phe Asp Arg Asn Tyr Gln Pro Lys Pro Val Val355 360 365

Glu Arg Ile Ile Lys Glu Ala Lys Ala Lys370 375

<210> 49<211> 996<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 49

atgaacagct ccctcccctc cctccgcgat gtattcgcga atgatttccg catcggggcg 60

gcggtcaatc ctgtgacgat cgagatgcaa aaacagttgt tgatcgatca tgtcaacagt 120

attacggcag agaaccatat gaagtttgag catcttcagc cggaagaagg gaaatttacc 180

tttcaggaag cggatcggat tgtggatttt gcttgttcgc accgaatggc ggttcgaggg 240

cacacacttg tatggcacaa ccagactccg gattgggtgt ttcaagatgg tcaaggccat 300

ttcgtcagtc gggatgtgtt gcttgagcgg atgaaatgtc acatttcaac tgttgtacgg 360

cgatacaagg gaaaaatata ttgttgggat gtcatcaacg aagcggtagc cgacgaagga 420

gacgaattgt tgaggccgtc gaagtggcga caaatcatcg gggacgattt tatggaacaa 480

gcatttctct acgcttatga agctgaccca gatgcactgc ttttttacaa tgactataat 540

gaatgttttc cggaaaagag agaaaaaatt tttgcacttg tcaaatcgct gcgtgataaa 600

ggcattccga ttcatggcat cggcatgcag gcgcactgga gcctgacccg cccgtcgctt 660

gatgaaattc gtgcggcgat tgaacggtat gcgtcccttg gtgttgttct tcatattacg 720

gaactcgatg tatccatgtt tgaatttcac gatcgtcgaa ccgatttggc tgtcccgacg 780

aacgaaatga tcgaacagca agcagaacgg tatgggcaaa tttttgcttt gtttaaggag 840

tatcgcgatg ttattcaaag tgtcacattt tggggaattg ctgatgacca tacatggctc 900

gataactttc cagtgcacgg gagaaaaaac tggccgcttt tgttcgatga acagcataaa 960

ccgaaaccag ctttttggcg ggcagtgagt gtctga 996

<210> 50

<211> 331<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 50

Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn Asp Phe1 5 10 15 Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln Lys Gln 20 25 30 Leu Leu Ile 35 Asp His Val Asn Ser 40 Ile Thr Ala Glu Asn 45 His Met LysPhe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln Glu Ala50 55 60 Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val Arg Gly65 70 75 80His Thr Leu Val Trp 85 His Asn Gln Thr Pro 90 Asp Trp Val Phe Gln 95 AspGly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg Met Lys 100 105 110 Cys His Ile 115 Ser Thr Val Val Arg 120 Arg Tyr Lys Gly Lys 125 Ile Tyr CysTrp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu Leu Leu130 135 140 Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met Glu Gln145 150 155 160Ala Phe Leu Tyr Ala 165 Tyr Glu Ala Asp Pro 170 Asp Ala Leu Leu Phe 175 TyrAsn Asp Tyr Asn 180 Glu Cys Phe Pro Glu 185 Lys Arg Glu Lys Ile 190 Phe AlaLeu Val Lys 195 Ser Leü Arg Asp Lys 200 Gly Ile Pro Ile His 205 Gly Ile GlyMet Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu Ile Arg210 215 220 Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His Ile Thr225 230 235 240Glu Leu Asp Val Ser 245 Met Phe Glu Phe His 250 Asp Arg Arg Thr Asp 255 LeuAla Val Pro Thr 260 Asn Glu Met Ile Glu 265 Gln Gln Ala Glu Arg 270 Tyr GlyGln Ile Phe 275 Ala Leu Phe Lys Glu 280 Tyr Arg Asp Val Ile 285 Gln Ser ValThr Phe Trp Gly Ile Ala Asp Asp His Thr Trp Leu Asp Asn Phe Pro290 295 300 Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln His Lys305 310 315 320Pro Lys Pro Ala Phe 325 Trp Arg Ala Val Ser 330 Val <210> 51 <211> 3162 <212> DNA <213> Desconhecido <220>

<223> Obtido para uma amostra ambiental<400> 51

atgagaggga aaagcaaaaa gggatttctg aacatctcag aagctgtactttagcaggct ttcttggagt tcttctcgca gctacggggg ttttgagtttgcgtcttcgt ctcttgaaac ggtgttcacc ttgagtttcg agggaacaacaatccctttg gaaaagaagt agttctcaca gcttctcaag atgtagcagctattcattga aagtagagaa tagaacttcc ggctgggatg gagttgagatgaaaaagtag aagcgaacaa agattatctg ttgtctttct acgtctatcatcaccccaac tttttgaagt ccttgcaaga acagaagacg ggaaaggtgaacccttaccg acaaggtggt agtatcgaac tactggaaag aaattcttgtccgagtttcg agagtacccc aacaaaatgt tctttgatcg ttgtttcacctcattcactt tctatattga caaggttcaa attctcaaac cgaagaagcagtcatttacg aaacatcctt tgagagtggg acgggaagct ggcaagccaggtgaaaatca aagtgacatc gaaagttgct cattctggaa aaaggtctctaacagacaaa aaggctggca tggtgtacaa cttgacgtga agagactcttaaaacgtatg cttttgaagg atgggtttat caagactctg gacaggatca

tgttggaatt 60

tggtggaaca 120

gcaaggtgtc 180

cgatggcgaa 240

cgatttaacg 300

aacatctgac 360

aaaatacgaa 420

gcccttttcc 480

aaagaaccca 540

aggtccacaa 600

agggtctgat 660

ctatgtctcc 720

gagacccggg 780

aacaattatt 840ctgacgatgc agagaagata ttcttctgat tctagcacac aatatgagtg gatcaaggcggtaactgttc catcaggaca atggacgcag atctctggaa cttacacaat ccaaccaagagtaagcgtgg aggaactcat tgtttacttt gaagccaagg atcccactct tgccttctatgtggacgatt tcaaaataac ggataccaca actactgaca tcaagctcga gctgaagcctgaagaagaaa ttccagctct taaagaagtg cttggagatt acttcaaagt aggtgttgccttacctttca aagtttttgc caaaccagag gatattgctc tcattactaa acatttcaacagcatcactg ccgaaaacga aatgaaacct gagagtctct tggctggcgt agaaaatggaaagttgaagt tcaggtttga gacagcagac aaatacgtag aatttgcaca gcaaaacggtatggttgtga gaggtcacac tctggtgtgg cacaatcaaa caccggactg gttcttcaaggacgagaacg gaaatctgct ctccaaagaa gcaatgactg aaaggcttag ggaatacatccacacagtcg tcggacactt caaaggcaaa gtttacgcgt gggacgtcgt taatgaggcagtagatccat cccaaccaga tggacttaga agatctatat ggtacgaaat catgggacctgactatatag aacttgcatt caagtttgca agagaagcgg accccaatgc aaagctcttctacaacgact acaacaccta ccaggagaag aagagagaca tcatttacaa cctcgtcaaatccctcaaag agaagggact cattgacggt atcggtatgc agtgtcatat cggtgttgggaccagtgtca aagagattga agaggcaatc aaaaaattca gcaccattcc aggtatcgaaattcatatca cggaactaga tataagtgtg tacgaggatg cgacttccaa ttatccaacacctccaaggg aggctctcat taaacaagca cacgtaatga gagaactctt tgccatcttcaaaaagtaca gcaacgtcat aacaaacgtt actttctggg gattgaaaga tgattattcctggaagaatg cccgcagaaa cgactggccg ctactttttg ataaagacta ccaagccaaacttgcctact gggccatagt cagtcctgag gctctaccgg tgcttccaaa gaaatggtctatcgctacag gtagtgcttt ggtagttgga atgatggatg actcctattt ggcttcttcacctatcaaaa ttctcgtcga tggccaagaa aaactcacag ccagagtcat ctgggaagãaaacaaactct tcgtctacgc agaggtctat gacaggacaa gagacaaagg aaaggacggtatcaccatct ttgtggatcc taaaaacttc aaggcacctt acttgcatga agatgctttctacgttacca taaaaaccga ctggagtgtt gagaagagtc gtgatgacat agaagtccagagattcgtag gtccaagtgg agtaaggtac aacgttgaat gtgaaataac acttcctgaaaaactccagg aaggacagca aatcggattt gatatcgccg tccaggatgg cgataaggtctacagctggt ctgatacatc caatcagcag aagctcgcaa ccatgaacta cggaactctcactctgcagg gtgcggtaat ggccacagct aagtatggca cacctgtgat cgatggtgaaatagatgaca tctggtacac cactgaagaa atctcaaccg atgttgttgt catgggttcactcaagaacg caagggcaaa agtgagagtg ctctgggatg aagagcacct ctatgtgcttgccatcgtaa ccgatcctgt gctcaataag gacaacacca atccatggga acaagactctgtagaaatct tcatagacga aaacaacgcc aaaacaccgt actatcagga cgatgatgctcaatatcgtg tcaactacct caacgaacaa tccttcggta caggtgcaag cagcaagaacttcaagacag ccgtgaaact catcgatggt ggttatcttg ttgaggcagc ggttaaatggaagaccatca aaccttcacc aaacacagtg ataggctttg atttccaggt gaacgatgcaaatgctcaag gtaagagagt tggaatactt aagtggtgcg atccaacgga caacagctggcagaatacct ccaagtttgg taatctcagg ttgataaaat ag<210> 52<211> 1053<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(30)<400> 52

Met Arg Gly Lys Ser Lys Lys Gly Phe Leu Asn Ile Ser Glu Ala Val1 5 10 15 Leu Val Gly Ile 20 Leu Ala Gly Phe Leu 25 Gly Val Leu Leu Ala 30 Ala ThrGly Val Leu 35 Ser Phe Gly Gly Thr 40 Ala Ser Ser Ser Leü 45 Glu Thr ValPhe Thr Leu Ser Phe Glu Gly Thr Thr Gln Gly Val Asn Pro Phe Gly 50 55 60 Lys Glu Val Val Leu Thr Ala Ser Gln Asp Val Ala Ala Asp Gly Glu65 70 75 80Tyr Ser Leu Lys Val Glu Asn Arg Thr Ser Gly Trp Asp Gly Val Glu 85 90 95 Ile Asp Leu Thr Glu Lys Val Glu Ala Asn Lys Asp Tyr Leu Leu Ser 100 105 110 Phe Tyr Val 115 Tyr Gln Thr Ser Asp 120 Ser Pro Gln Leu Phe 125 Glu Val LeuAla Arg Thr Glu Asp Gly Lys Gly Glu Lys Tyr Glu Thr Leu Thr Asp 130 135 140Lys Val Val Val Ser Asn Tyr Trp Lys Glu Ile Leu Val Pro Phe Ser 145 150 155 160 Pro Ser Phe Glu Ser Thr Pro Thr Lys Cys Ser Leu Ile Val Val Ser 165 170 175 Pro Lys Asn Pro Ser Phe Thr Phe Tyr Ile Asp Lys Val Gln Ile Léu 180 185 190 Lys Pro Lys Lys Gln Gly Pro Gln Val Ile Tyr Glu Thr Ser Phe Glu 195 200 205 Ser Gly Thr Gly Ser Trp Gln Ala Arg Gly Ser Asp Val Lys Ile Lys 210 215 220 Val Thr Ser Lys Val Ala His Ser Gly Lys Arg Ser Leu Tyr Val Ser 225 230 235 240 Asn Arg Gln Lys Gly Trp His Gly Val Gln Leu Asp Val Lys Arg Leu 245 250 255 Leu Arg Pro Gly Lys Thr Tyr Ala Phe Glu Gly Trp Val Tyr Gln Asp 260 265 270 Ser Gly Gln Asp Gln Thr Ile Ile Leu Thr Met Gln Arg Arg Tyr Ser 275 280 285 Ser Asp Ser Ser Thr Gln Tyr Glu Trp Ile Lys Ala Val Thr Val Pro 290 295 300 Ser Gly Gln Trp Thr Gln Ile Ser Gly Thr Tyr Thr Ile Gln Pro Arg 305 310 315 320 Val Ser Val Glu Glu Leu Ile Val Tyr Phe Glu Ala Lys Asp Pro Thr 325 330 335 Leu Ala Phe Tyr Val Asp Asp Phe Lys Ile Thr Asp Thr Thr Thr Thr 340 345 350 Asp Ile Lys Leu Glu Leu Lys Pro Glu Glu Glu Ile Pro Ala Leu Lys 355 360 365 Glu Val Leu Gly Asp Tyr Phe Lys Val Gly Val Ala Leu Pro Phe Lys 370 375 380 Val Phe Ala Lys Pro Glu Asp Ile Ala Leu Ile Thr Lys His Phe Asn 385 390 395 400 Ser Ile Thr Ala Glu Asn Glu Met Lys Pro Glu Ser Leu Leu Ala Gly 405 410 415 Val Glu Asn Gly Lys Leu Lys Phe Arg Phe Glu Thr Ala Asp Lys Tyr 420 425 430 Val Glu Phe Ala Gln Gln Asn Gly Met Val Val Arg Gly His Thr Leu 435 440 445 Val Trp His Asn Gln Thr Pro Asp Trp Phe Phe Lys Asp Glu Asn Gly 450 455 460 Asn Leu Leu Ser Lys Glu Ala Met Thr Glu Arg Leu Arg Glu Tyr Ile 465 470 475 480 His Thr Val Val Gly His Phe Lys Gly Lys Val Tyr Ala Trp Asp Val 485 490 495 Val Asn Glu Ala Val Asp Pro Ser Gln Pro Asp Gly Leu Arg Arg Ser 500 505 510 Ile Trp Tyr Glu Ile Met Gly Pro Asp Tyr Ile- Glu Leu Ala Phe Lys 515 520 525 Phe Ala Arg Glu Ala Asp Pro Asn Ala Lys Leu Phe Tyr Asn Asp Tyr 530 535 540 Asn Thr Tyr Gln Glu Lys Lys Arg Asp Ile Ile Tyr Asn Leu Val Lys 545 550 555 560 Ser Leu Lys Glu Lys Gly Leu Ile Asp Gly Ile Gly Met Gln Cys His 565 570 575 Ile Gly Val Gly Thr Ser Val Lys Glu Ile Glu Glu Ala Ile Lys Lys 580 585 590 Phe Ser Thr Ile Pro Gly Ile Glu Ile His Ile Thr Glu Leu Asp Ile 595 600 605 Ser Val Tyr Glu Asp Ala Thr Ser Asn Tyr Pro Thr Pro Pro Arg Glu 610 615 620 Ala Leu Ile Lys Gln Ala His Val Met Arg Glu Leu Phe Ala Ile Phe 625 630 635 640 Lys Lys Tyr Ser Asn Val Ile Thr Asn Val Thr Phe Trp Gly Leu Lys 645 650 655 Asp Asp Tyr Ser Trp Lys Asn Ala Arg Arg Asn Asp Trp Pro Leu Leu 660 665 670 Phe Asp Lys Asp Tyr Gln Ala Lys Leu Ala Tyr Trp Ala Ile Val Ser675 680 685 Pro Glu 690 Ala Leu Pro Val Leu 695 Pro Lys Lys Trp Ser 700 Ile Ala Thr GlySer Ala Leu Val Val Gly Met Met Asp Asp Ser Tyr Leu Ala Ser Ser705 710 715 720Pro Ile Lys Ile Leu 725 Val Asp Gly Gln Glu 730 Lys Leu Thr Ala Arg 735 ValIle Trp Glu Glu 740 Asn Lys Leu Phe Val 745 Tyr Ala Glu Val Tyr 750 Asp ArgThr Arg Asp Lys Gly Lys Asp Gly Ile Thr Ile Phe Val Asp Pro Lys 755 760 765 Asn Phe 770 Lys Ala Pro Tyr Leu 775 His Glu Asp Ala Phe 780 Tyr Val Thr IleLys Thr Asp Trp Ser Val Glu Lys Ser Arg Asp Asp Ile Glu Val Gln785 790 795 800Arg Phe Val Gly Pro 805 Ser Gly Val Arg Tyr 810 Asn Val Glu Cys Glu 815 IleThr Leu Pro Glu 820 Lys Leu Gln Glu Gly 825 Gln Gln Ile Gly Phe 830 Asp IleAla Val Gln Asp Gly Asp Lys Val Tyr Ser Trp Ser Asp Thr Ser Asn 835 840 845 Gln Gln 850 Lys Leu Ala Thr Met 855 Asn Tyr Gly Thr Leu 860 Thr Leu Gln GlyAla Val Met Ala Thr Ala Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu865 870 875 880Ile Asp Asp Ile Trp 885 Tyr Thr Thr Glu Glu 890 Ile Ser Thr Asp Val 895 ValVal Met Gly Ser Leu Lys Asn Ala Arg Ala Lys Val Arg Val Leu Trp 900 905 910 Asp Glu Glu 915 His Leu Tyr Val Leu 920 Ala Ile Val Thr Asp 925 Pro Val LeuAsn Lys 930 Asp Asn Thr Asn Pro 935 Trp Glu Gln Asp Ser 940 Val Glu Ile PheIle Asp Glu Asn Asn Ala Lys Thr Pro Tyr Tyr Gln Asp Asp Asp Ala945 950 955 960Gln Tyr Arg Val Asn Tyr Leu Asn Glu Gln Ser Phe Gly Thr Gly Ala 965 970 975 Ser Ser Lys Asn 980 Phe Lys Thr Ala Val 985 Lys Leu Ile Asp Gly 990 Gly TyrLeu Val Glu Ala Ala Val Lys Trp Lys Thr Ile Lys Pro Ser Pro Asn 995 1000 1005 Thr Val Ile Gly Phe Asp Phe Gln Val Asn Asp Ala Asn Ala Gln Gly 1010 1015 1020 Lys Arg Val Gly Ile Leu Lys Trp Cys Asp Pro Thr Asp Asn Ser Trp1025 1030 1035 104CGln Asn Thr Ser Lys Phe Gly Asn Leu Arg Leu Ile Lys 1045 1050

<211> 2370<212> DNA<213> Bactéria<400> 53

atgaagggcc tgcaccggct ccgccgccgt cgccggacct gggtggcagg actgtcggcc

gcggcggtgg tcgccggcgc cctgacgctc ctccccggct ccgccggcgc cgcgggcctg

ggtacgcacg cggccccctc gggccggtac ttcggcacgg ccgtggccgc gggccgcctc

ggcgactcgg cgtacaccgc gatcgccgac cgggagttca acatgatcac cccggagaac

gagatgaagt gggacgccgt cgagccgtcc cgcggccgtt tcgacttcgg tcccgcggac

cggatcgtcg agcgtgccct ggcacgcggc cagcgcgtcc gcggccacac cacggtctgg

cactcgcagc tcccctcctg ggtgggctcc atccgcgaca cgaagacgct gcgcggcgtg

atgaaccacc acatcaccac ccagatgacc cactacaagg gcaagatcta cgcctgggac

gtggtcaacg aggccttcgc cgatggcggc agcggccggc tccgcgactc ggtcttccag

aaggtgctgg gcgacggctt catcgaggag gcgttccgca ccgcccgcgc ggccgacccc

tcggccaagc tctgctacaa cgactacaac atcgagaact ggtcggacgc caagacccag

ggcgtctacc gcctggtgaa ggacttcacg tcccgaggcg ttcccatcga ctgcgtcggc

ttccagagcc acttcggcgc gggcggcccg ccggcgagct tcaagacgac cctggccaac

ttcgccgccc tgggcgtcga cgtccagatc accgagctgg acatcgccca ggcatcacct

gcccactacg cgagtgcggt cagcacctgt ctgtccgtgg cccggtgcac cggcatcacggtgtggggcg tccgtgacag cgactcctgg cggagcgccg aaagcccgct gctgttcgaccggaacggca agcccaagcc cgcgtacgcc gccgtcatga acgccctcgg ctccggctcgggtcccaccc cgagcaagcc ggccgacggt acggggagcg gtacggggga gatcaagggcgtggcctccg gccgctgtct ggacgtcccc gcctccacca ccgccaacgg cacccgggcgcagctgtggg actgtagcgg ccaggccaac cagcgctgga cccacaccgc cggcaagcagctgaagatcc acggcgacaa gtgcctggac gccaagggca agggcaccgc ca:acggcaccgcggtggtcg tctgggactg caacggcggc accaaccagc agtggaacgt ccacaccgacggcacgatca ccggcgtcca gtccggtctg tgcctcgatg ccgtcggcgc ggccaccgccaacggcaccc cgatccagct gcacgcctgt gggggtgtcg gcaaccagaa gtggtccgccccgtccggat cgggcggcgg cacgtgcgtg cttccgtcga cgtacaagtg gagctcgacgggtgccctgg cgcagcccaa ggccgggtgg gcctcgctga aggacttcac ccatgtggtgctgggcggca agcacctggt ctacgggtcg aacttcaacg gatcgacgta cggctcgatgacgttcagcc ccttcaccac ctggtcggac atggcgtccg caggacagaa ggcgatgaagcagcccgcgg tcgcacccac cctgttctac ttcgcaccca agaagatctg ggtgctggcgtaccagtggg gcaggaccgc gttctcctac cggacgtcga ccgaccccac caacccgaacggctggtcgg cggagcagga gctcttctcc ggaagcatca ccggctcggg cacgggccccatcgaccaga cgctcatcgg cgacgggacg aacatgtacc tgttcttcgc cggtgacaacggcaagatct accgggccag catgccgatc gggaacttcc cgggcagctt cggctcctcgtacacgacgg tcatgagcga caccgcgaag aacctgttcg aggcgccgca ggtgtacaaggtcaaggacc agaaccagta cctcatgatc gtcgaggccc ggggcgcggg cgagcgccgctacttccgct cgttcacggc ctccagcctg agcggtgcgt ggaccccgca ggccgcgaccgagagcaacc ccttcgcggg caaggccaac agcggcgcca cctggaccga cgacatcagccacggtgatc tgatccgcac caaccccgat cagaccatga ccatcgaccc ctgcaaccttcagctgctct accagggcaa gtccccgcag gcgggcggac cctacgacca gctgccgtaccggccgggcg tcctcaccct gcagcgctga<210> 54<211> 787<212> PRT<213> Bactéria

<220> <221> SIGNAL <222> (1)... (37) <400> 54 Met Lys Gly Leu His Arg Leu Arg Arg Arg Arg Arg Thr Trp Val Ala1 5 10 15 Gly Leu Ser Ala Ala Ala Val Val Ala Gly Ala Leu Thr Leu Leu Pro 20 25 30 Gly Ser Ala 35 Gly Ala Ala Gly Leu 40 Gly Thr His Ala Ala 45 Pro Ser GlyArg Tyr 50 Phe Gly Thr Ala Val 55 Ala Ala Gly Arg Leu 60 Gly Asp Ser AlaTyr Thr Ala Ile Ala Asp Arg Glu Phe Asn Met Ile Thr Pro Glu Asn65 70 75 80Glu Met Lys Trp Asp 85 Ala Val Glu Pro Ser 90 Arg Gly Arg Phe Asp 95 PheGly Pro Ala Asp 100 Arg Ile Val Glu Arg 105 Ala Leu Ala Arg Gly 110 Gln ArgVal Arg Gly His Thr Thr Val Trp His Ser Gln Leu Pro Ser Trp Val 115 120 125 Gly Ser Ile Arg Asp Thr Lys Thr Leu Arg Gly Val Met Asn His His 130 135 140 Ile Thr Thr Gln Met Thr His Tyr Lys Gly Lys Ile Tyr Ala Trp Asp145 150 155 160Val Val Asn Glu Ala 165 Phe Ala Asp Gly Gly 170 Ser Gly Arg Leu Arg 175 AspSer Val Phe Gln Lys Val Leu Gly Asp Gly Phe Ile Glu Glu Ala Phe 180 185 190 Arg Thr Ala 195 Arg Ala Ala Asp Pro 200 Ser Ala Lys Leu Cys 205 Tyr Asn AspTyr Asn 210 Ile Glu Asn Trp Ser 215 Asp Ala Lys Thr Gln 220 Gly Val Tyr ArgLeu Val Lys Asp Phe Thr Ser Arg Gly Val Pro Ile Asp Cys Val Gly225 230 235 240Phe Gln Ser His Phe 245 Gly Ala Gly Gly Pro 250 Pro Ala Ser Phe Lys 255 ThrThr Leu Ala Asn 260 Phe Ala Ala Leu Gly 265 Val Asp Val Gln Ile 270 Thr GluLeu Asp Ile Ala Gln Ala Ser Pro Ala His Tyr Ala Ser Ala Val Ser 275 280 285 Thr Cys Leu Ser Val Ala Arg Cys Thr Gly Ile Thr Val Trp Gly Val 290 295 300 Arg Asp Ser Asp Ser Trp Arg Ser Ala Glu Ser Pro Leu Leu Phe Asp305 310 315 320Arg Asn Gly Lys Pro Lys Pro Ala Tyr Ala Ala Val Met Asn Ala Leu 325 330 335 Gly Ser Gly Ser Gly Pro Thr Pro Ser Lys Pro Ala Asp Gly Thr Gly 340 345 350 Ser Gly Thr Gly Glu Ile Lys Gly Val Ala Ser Gly Arg Cys Leu Asp 355 360 365 Val Pro Ala Ser Thr Thr Ala Asn Gly Thr Arg Ala Gln Leu Trp Asp 370 375 380 Cys Ser Gly Gln Ala Asn Gln Arg Trp Thr His Thr Ala Gly Lys Gln385 390 395 400Leu Lys Ile His Gly Asp Lys Cys Leu Asp Ala Lys Gly Lys Gly Thr 405 410 415 Ala Asn Gly Thr Ala Val Val Val Trp Asp Cys Asn Gly Gly Thr Asn 420 425 430 Gln Gln Trp Asn Val His Thr Asp Gly Thr Ile Thr Gly Val Gln Ser 435 440 445 Gly Leu Cys Leu Asp Ala Val Gly Ala Ala Thr Ala Asn Gly Thr Pro 450 455 460 Ile Gln Leu His Ala Cys Gly Gly Val Gly Asn Gln Lys Trp Ser Ala465 470 475 480Pro Ser Gly Ser Gly Gly Gly Thr Cys Val Leu Pro Ser Thr Tyr Lys 485 490 495 Trp Ser Ser Thr Gly Ala Leu Ala Gln Pro Lys Ala Gly Trp Ala Ser 500 505 510 Leu Lys Asp Phe Thr His Val Val Leu Gly Gly Lys His Leu Val Tyr 515 520 525 Gly Ser Asn Phe Asn Gly Ser Thr Tyr Gly Ser Met Thr Phe Ser Pro 530 535 540 Phe Thr Thr Trp Ser Asp Met Ala Ser Ala Gly Gln Lys Ala Met Lys545 550 555 560Gln Pro Ala Val Ala Pro Thr Leu Phe Tyr Phe Ala Pro Lys Lys Ile 565 570 575 Trp Val Leu Ala Tyr Gln Trp Gly Arg Thr Ala Phe Ser Tyr Arg Thr 580 585 590 Ser Thr Asp Pro Thr Asn Pro Asn Gly Trp Ser Ala Glu Gln Glu Leu 595 600 605 Phe Ser Gly Ser Ile Thr Gly Ser Gly Thr Gly Pro Ile Asp Gln Thr 610 615 620 Leu Ile Gly Asp Gly Thr Asn Met Tyr Leu Phe Phe Ala Gly Asp Asn625 630 635 640Gly Lys Ile Tyr Arg Ala. Ser Met Pro Ile Gly Asn Phe Pro Gly Ser 645 650 655 Phe Gly Ser Ser Tyr Thr Thr Val Met Ser Asp Thr Ala Lys Asn Leu 660 665 670 Phe Glu Ala Pro Gln Val Tyr Lys Val Lys Asp Gln Asn Gln Tyr Leu 675 680 685 Met Ile Val Glu Ala Arg Gly Ala Gly Glu Arg Arg Tyr Phe Arg Ser 690 695 700 Phe Thr Ala Ser Ser Leu Ser Gly Ala Trp Thr Pro Gln Ala Ala Thr705 710 715 720Glu Ser Asn Pro Phe Ala Gly Lys Ala Asn Ser Gly Ala Thr Trp Thr 725 730 735 Asp Asp Ile Ser His Gly Asp Leu Ile Arg Thr Asn Pro Asp Gln Thr 740 745 750 Met Thr Ile Asp Pro Cys Asn Leu Gln Leu Leu Tyr Gln Gly Lys Ser 755 760 765 Pro Gln Ala Gly Gly Pro Tyr Asp Gln Leu Pro Tyr Arg Pro Gly Val

770 775 780

Leu Thr Leu785

<210> 55<211> 1143

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 55

atgaaaaaaa cgattgcaca tttcacctta tggatagcgtgctgttacgg cgcagaagaa tactaagaat gcaagagtaagcttaccaag gtaaattcta tatcggtaca gcgatgaatcgatccccagt ctgaaaatat tatcaaaaaa cagttcaattatgaagagta tgtatcttca gccggaggaa ggaaaatttttttgtggatt ttggtcttca gaacaatatg tttattatcgtcgcaggcgc càaaatggtt tttcaccgac gagaatgggacttaaacaaa ggatgaaagc tcatatcacc gccgtcgtttaaaggatggg atgtggtgaa cgaagccatt atggaagatgttttacgaga ttttgggaga agaatttatt ccgttggcatgatcctgatg cagaactcta ttacaacgat tataacgaatacggtgacca aaataatccg agatttcaaa tctagaggaaatgcaggctc atttcgggat ggattcaccc actatagaagggctatataa aagaaggcgt gaaagtcaat attacggaactccccttggg gaacttccgc caacgttgcc gatacgcagcccttacacca aaggacttcc cacagaggtg gaaaaagctttttttcaaac tattcctaaa atatcatcag catatcgagcagcgatatcg attcctggaa gaacgatttt ccagtgagagccctttgacc gacagtatca ggcaaaaccttag

<210> 56<211> 380<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220><221><222>

ttggttcaga

tttttctcttagcccactactgagacagatccattgttgctcttcgatgaggcattgtctaaacggtctcctcgctacaagttcttaccgttcagtatgcggtatcccggtccgcattgaagtatgaacatcgatttgagagtatcaggagggaaaaccggtgttacgttgacgtaccgaaattaataga

cacttcctgttctaaaagagtcacggagattgaaaactgctgcggataaggatttggcatcccagaagttagggaaaatccaaaagcaaagcatgaagcaaaaaagagcttgccattggaaactattcagtccacttcctaaaaatgaatttatctcgatttggggcgttttatccgttacttaacgaaa

SIGNAL(1)...(24)

<400> 56

Met Lys Lys Thr Ile Ala His Phe Thr Leu1 5 10Phe Thr Ser Cys 20 Ala Val Thr Ala Gln 25 LysVal Lys Pro 35 Thr Thr Leu Lys Glu 40 Ala TyrGly Thr Ala Met Asn Leu Arg Gln Ile His

50

55

45 Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile

Ile Ala

Thr Lys

Gly Lys

45Asp Asp60

Val Ala

65

70

75

Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe

85 90

Asp Ala Asp Lys Phe Val Asp Phe Gly Leu Gln Asn Asn

100

105

Ile Gly His Cys Leu Ile Trp His Ser Gln Ala

115

120

Thr Asp Glu Asn Gly Lys Thr Val Ser Pro Glu

130

135

55 Met Lys Ala His Ile Thr Ala Val Val Ser Arg

Pro Lys125Val Leu140

Tyr Lys

145

150

155

Lys Gly Trp Asp Val Val Asn Glu Ala Ile Met Glu Asp

165 170

Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe

180

185

Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp

195

200

Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg

210

215

Ala Glu205Ala Thr220

Ile Asp

Ilè Ile Arg Asp Phe Lys Ser Arg Gly Ile Arg225 230 235

Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Ile Glu Glu Tyr Glu

Phe Phe Leu 15 Asn Ala Arg30 Phe Tyr IlePro Gln SerGlu Asn Cys 80Phe Phe Asp 95 Met Phe Ile110 Trp Phe PheLys Gln ArgGly Lys Ile 160Gly Ser Tyr 175 Ile Pro Leu190 Leu Tyr TyrVal Thr LysAla Ile Gly 240

601201802403003604204805406006607207808409009601020108011401143<211><212>

245 250

Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val

260 265

Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp

275 280

Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met

290 295

Gly Leu Pro Thr Glu Val Glu Lys Ala Trp Glu305 310 315

Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His

325 330

Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys

340 345

Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asp

355 360

Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr

370 375

<210> 57

1578DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 57

atgaaaagaa tgatcggttt gctgctggcc atttgcctggtgggctgcct cggatacgct ggtctatgca tccagtttcgtttgcaaggg gcgcttcccg ggtttaccat accacggaggcggagcgaca actggaattc tccgggacgc tattttgaacacgctgagcg tggaggtcta ccaggacgga gcggacagcggaaaaggttg cggatgggat caccggatgg gaaaacctggggtgaatgga cgacgctgtc cggaacctat acttttgcagtatgtggaga cctccgacgc gccgacgctg gactttgagaagccccaatg ggatcccgga gccgaaggct accgaggcgcacggatattc cgagcctgaa ggacgcttac gcggattactccgcagtctg ctttcaccag cagagataat attcagctgattcagcatcc tgacgcctga aaatgagctg aagccggacaagcaagcagc tggccaaaga ggatgaaacc gcggtagtggtcattgctgc ggtttgccca gcaaaacggc atcaaggtgccacagccaga cgccggaagc ctttttccat gaaggatatgagccgggaag tgatgctggg acggctggaa aactatatccgaagaactgt atccgggcgt gatcgtcagc tgggacgtggggaaccaact ggatccggaa gggatcgggc tggtaccggagagaaggctt ttgagtttgc ccggaagtat gccccggaaggattacaaca cggcatacgc cggaaaactg aatgggattaatcgagcagg gaacgatcga cggatacggc ttccagatgcagcaaccaga tgatcaccac ggcggtggag aagatcgcgggtcagcgaga tggacatcgg gattacaaag tatacagagagacaagtaca aggcgatgat ggaactgatg ctgcggttcgcaggtctggg ggattacgga tacgatgagcgaccggagca ggaatccgaa gccggcgttcacagggaaaa gtgaatag<210> 58525PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) . . . (22)<400> 58

Met Lys Arg Met Ile Gly Leu Leu Leu Ala Ile

15 10

Leu Ala Gly Ala Trp Ala Ala Ser Asp Thr Leu

20 25

Phe Ala Ala Gly Asp Asp Asp Trp Phe Ala Arg35 40

Lys Val Asn270

Gly Thr Ser

285Asn Pro Tyr300

Asn Arg Tyr

Ile Glu Arg

Asn Asp Phe350

Arg Gln Tyr365

Lys380

255

Ile Thr

Ala Asn

Thr Lys

Leu Asp320Val Thr335

Pro ValGln Ala

tggcggagcttatggcgtga

tgatgacgctcagcgggcgacgacgctgcgtggtgccggacgaacttcattgcggggaacactatgaaagtccggaatttcggcagtggttcgactttggtggagctgatgtgtattggatgcggtttaaacgggcatgtatcccaagaagggaagtgcttgaacgaagcccatcggggagcgtgctgcttcaaactgataccatacgacccctgggaatcgagcctgcacggaccagacccagctatccttgaagcggt

ggctggggcctgacgactgggacggaaggctaatgaatatgatttccctgcgtgaaaaagctatgtgctgccgggtggaattcggaagcccgcggccgtggaaaaaccagtgtaagcgcccggggcaaaggctggtctggcccgctggtggacccagacggattgacgacagactatgtggtactacaaccaaacccatgcgggcagccccaagctgcggggcacaaaagggaagcagtggctgctgttttgaagactgg

<211><212>

6012018024030036042048054060066072078084090096010201080114012001260132013801440150015601578

Cys Leu Val Met Thr15

Val Tyr Ala Ser Ser30

Gly Ala Ser Arg Val45Tyr His Thr Thr Glu Ala Thr Leu Arg Thr Glu Gly Arg Ser Asp Asn 50 55 60 Trp Asn Ser Pro Gly Arg Tyr Phe Glu Leu Val Pro Asp Asn Glu Tyr 65 70 75 80 Thr Leu Ser Val Glu Val Tyr Gln Asp Gly Ala Asp Ser Ala Asn Phe 85 90 95 Met Ile Ser Leu Glu Lys Val Ala Asp Gly Ile Thr Gly Trp Glu Asn 100 105 110 Leu Val Arg Gly Thr Val Lys Lys Gly Glu Trp Thr Thr Leu Ser Gly 115 120 125 Thr Tyr Thr Phe Ala Asp Tyr Glu Ser Tyr Val Leu Tyr Val Glu Thr 130 135 140 Ser Asp Ala Pro Thr Leu Asp Phe Glu Ile Arg Asn Phe Arg Val Glu 145 150 155 160 Ser Pro Asn Gly Ile Pro Glu Pro Lys Ala Thr Glu Ala Pro Ala Val 165 170 175 Val Ser Glu Ala Thr Asp Ile Pro Ser Leu Lys Asp Ala Tyr Ala Asp 180 185 190 Tyr Phe Asp Phe Gly Ala Ala Val Pro Gln Ser Ala Phe Thr Ser Arg 195 200 205 Asp Asn Ile Gln Leu Met Glu Leu Met Lys Asn Gln Phe Ser Ile Leu 210 215 220 Thr Pro Glu Asn Glu Leu Lys Pro Asp Ser Val Leu Asp Val Ser Ala 225 230 235 240 Ser Lys Gln Leu Ala Lys Glu Asp Glu Thr Ala Val Val Val Arg Phe 245 250 255 Asn Gly Ala Lys Ser Leu Leu Arg Phe Ala Gln Gln Asn Gly Ile Lys 260 265 270 Val His Gly His Val Leu Val Trp His Ser Gln Thr Pro Glu Ala Phe 275 280 285 Phe His Glu Gly Tyr Asp Pro Lys Asn Pro Leu Val Ser Arg Glu Val 290 295 300 Met Leu Gly Arg Leu Glu Asn Tyr Ile Arg Glu Val Leu Thr Gln Thr 305 310 315 320 Glu Glu Leu Tyr Pro Gly Val Ile Val Ser Trp Asp Val Val Asn Glu 325 330 335 Ala Ile Asp Asp Gly Thr Asn Trp Ile Arg Lys Gly Ser Gly Trp Tyr 340 345 350 Arg Thr Ile Gly Glu Asp Tyr Val Glu Lys Ala Phe Glu Phe Ala Arg 355 360 365 Lys Tyr Ala Pro Glu Gly Val Leu Leu Tyr Tyr Asn Asp Tyr Asn Thr 370 375 380 Ala Tyr Ala Gly Lys Leu Asn Gly Ile Ile Lys Leu Ile Lys Pro Met 385 390 395 400 Ile Glu Gln Gly Thr Ile Asp Gly Tyr Gly Phe Gln Met His His Thr 405 410 415 Thr Gly Gln Pro Ser Asn Gln Met Ile Thr Thr Ala Val Glu Lys Ile 420 425 430 Ala Ala Leu Gly Ile Lys Leu Arg Val Ser Glu Met Asp Ile Gly Ile 435 440 445 Thr Lys Tyr Thr Glu Thr Ser Leu Gln Ala Gln Lys Asp Lys Tyr Lys 450 455 460 Ala Met Met Glu Leu Met Leu Arg Phe Ala Asp Gln Thr Glu Ala Val 465 470 475 480 Gln Val Trp Gly Ile Thr Asp Thr Met Ser Trp Arg Ser Ser Ser Tyr 485 490 495 Pro Leu Leu Phe Asp Arg Ser Arg Asn Pro Lys Pro Ala Phe Tyr Gly 500 505 510 Val Ile Glu Ala Val Glu Asp Trp Thr Gly Lys Ser Glu

515 520 525

<210> 59

<211> 1104

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental

<400> 59atgcttgcca gtagtgccgg tttggtagca tcccaactca agctgtccgcgctaaaaatg ctggattaaa agatgtatat aaggatcgct ttctgattggaatacctcga ttgcgagcgg ccagcaacct gatattacag aaattatcaatcgtcgttaa cacctgaaaa tgcaatgaag tgggaatctg tcaggactgctggaaatggg cagatgccga tcaattcgtt acgtttgcaa cagaacacaagttggccaca cccttgcctg gcatagccag attcccgatt ccgtattcaaggcgaataca taaaatccac cgagctatca aaaaaaatgg aagaacatatgtaggtagat ataaaggcaa actcgatgcc tgggatgtag ttaatgaggcgataatcaaa tgcgcaaaag ccattattac aatattctcg gcgaagatttgcatttcacc ttgcgcatga ggtcgatccc aaagcgcatt taatgtataaattgaaaaag atggcaagcg tgaagctacc cttgaaatgt taaagcgtttggtgtaccga ttcatgggct cggcatccag ggacatattg ccgttgatgggcggatattg aaaaaagtat tttggcttat gcggatttgg gtttgcgtgtgagttggata ttgatgtatt gccgcaaatc tggaacttac cggttgcagacgcttcgaat acaaacctga gcgagatcct ttcaaaaatg gtttatcaaagataaactca gtgcacgcta tgaagaatta ttcacattat ttattaaacaattgatcgta ttactttgtg gggtgtcagc gatgatgcaa cctggctaaaatcaaaggca gaaccagtta tccattattg tttgatcgca agcatcaacctattataaca ttctggcgtt gtga<210> 60<211> 367<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(21)<400> 60

Met Leu Ala Ser Ser Ala Gly Leu Val Ala Ser Gln

1 5 10

Ala Leu Ala Ala Ala Lys Asn Ala Gly Leu Lys Asp

20 25

Arg Phe Leu Ile Gly Ala Ala Ile Asn Thr Ser Ile

35 40

Gln Pro Asp Ile Thr Glu Ile Ile Lys Arg Asp Phe

50 55 60

Pro Glu Asn Ala Met Lys Trp Glu Ser Val Arg Thr65 70 75

Trp Lys Trp Ala Asp Ala Asp Gln Phe Val Thr Phe

85 90

Lys Ile His Ala Val Gly His Thr Leu Ala Trp His

100 105

Asp Ser Val Phe Lys Asn Glu Lys Gly Glu Tyr Ile

115 120

Leu Ser Lys Lys Met Glu Glu His Ile Thr Thr Ile130 135 140

Lys Gly Lys Leu Asp Ala Trp Asp Val Val Asn Glu145 150 155

Asp Asn Gln Met Arg Lys Ser His Tyr Tyr Asn Ile

165 170

Phe Ile Asp Lys Ala Phe His Leu Ala His Glu Val

gttagctgca 60tgcagcaatt 120gcgtgatttt 180tgatggcgga 240aatacacgct 300aaatgaaaaa 360cactacgatt 420tgttggtgat 480tattgataag 540cgactacaac 600acaaaaacgc 660ccccagcatt 720acatttcacc 780aatttctaca 840agaaatgaac 900caaagataaa 960tgatttcccc 1020aaaagatgct 1080 1104

180

185

His Leu Met Tyr Asn Asp Tyr Asn Ile Glu Lys

195

200

Ala Thr Leu Glu Met Leu Lys Arg Leu Gln Lys

210 215

His Gly Leu Gly Ile Gln Gly His Ile Ala Val225 230 235

Ala Asp Ile Glu Lys Ser Ile Leu Ala Tyr Ala

245 250

Val His Phe Thr Glu Leu Asp Ile Asp Val Leu

260 265

Leu Pro Val Ala Glu Ile Ser Thr Arg Phe Glu

275 280

Asp Pro Phe Lys Asn Gly Leu Ser Lys Glu Met290 295

220

Leu Lys Leu Ser 15 Val Tyr Lys Asp 30 Ala Ser Gly Gln45 Ser Ser Leu ThrAla Asp Gly Gly 80Ala Thr Glu His 95 Ser Gln Ile Pro 110 Lys Ser Thr Glu125 Val Gly Arg TyrAla Val Gly Asp 160Leu Gly Glu Asp 175 Asp Pro Lys Ala 190 Gly Lys Arg Glu205 Gly Val Pro IleGly Pro Ser Ile 240Leu Gly Leu Arg 255 Gln Ile Trp Asn 270 Lys Pro Glu Arg285 Asp Lys Leu Ser

300300360420480540

Ala Arg Tyr Glu Glu Leu Phe Thr Leu Phe Ile Lys His Lys Asp Lys305 310 315 320

Ile Asp Arg Ile Thr Leu Trp Gly Val Ser Asp Asp Ala Thr Trp Leu325 330 335

Asn Asp Phe Pro Ile Lys Gly Arg Thr Ser Tyr Pro Leu Leu Phe Asp340 345 350

Arg Lys His Gln Pro Lys Asp Ala Tyr Tyr Asn Ile Leu Ala Leu355 360 365

<210> 61<211> 1041

<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental

<400> 61

atgagaagaa gcatggaaag gctgcccaag ctccatgaag cttacggcaa tagtttcaag 60

atcggcgctg ccgtgaatcc aattacgatg gtgacccaaa aggaattgtt gtcacaccac 120

ttcaacagcg ttacggcaga aaatgaaatg aaattcgagc gattgcaccc atcggaagag 180

gtgtatacat tcgagcaagc cgaccagatc gtatcgtttg ccaaatcgaa cggaatgtcg 240

gtgagaggac ataccctcgt atggcataat cagacgccgg aatgggtgtt tcaagacagt

tccggtggga cagccggccg cgagctgctg ctcgctcgga tgaaatcgca catcgatgag

gtcgttggcc gttatcgcgg agatatctat gcttgggatg tcgtaaacga agccattgcc

gacagtggaa gcgatctgct tcgttcctcc ccgtggcttg cgtcgatcgg ggaggatttt

atcgccaagg ctttcgaata tgcgcacgaa gcagacccgc aagcgctgct gttttataac

gattacaacg aatccgtgcc cgagaagcgg gagaagattt acacgctcct taaatcgtta 600

aaggagcagg atgtgccgat tcacggcgtc gggcttcagg cccattggaa tttggagttt 660

ccatcgcttg acgatatccg cagggcaatc gaaaggtatg caagccttgg catgatcttg 720

catatcacgg agcttgacgt atccgtattc gcgcatgagg ataagcggac cgatctggcg 780

gcgccgaccg aagaaatgct tgagcgccag- gcggagcgtt acggtcaatt gttccgtctg 840

cttaaagagt acagcggcag cgtcacttcc gtgaccttct ggggagcggc ggacgattat 900

acctggctgg atcattttcc ggtaaggggc cgcaaaaatt ggccgttcgt cttcgacgag 960

aaccatcttc cgaaggaatc ctattggaac ctgttgaagg aagecaatcc cgaaagaaca 1020ttccaagaga tacgttcgta a 1041<210> 62<211> 346 ... -

<212> PRT

<213> Desconhecido<220>

<223> Obtido para lima amostra ambiental

<400> 62

Met Arg Arg Ser Met Glu Arg Leu Pro Lys Leu His Glu Ala Tyr Gly

1 5 10 15

Asn Ser Phe Lys Ile Gly Ala Ala Val Asn Pro Ile Thr Met Val Thr20 25 30

Gln Lys Glu Leu Leu Ser His His Phe Asn Ser Val Thr Ala Glu Asn35 40 45

Glu Met Lys Phe Glu Arg Leu His Pro Ser Glu Glu Val Tyr Thr Phe

55 60

Glu Gln Ala Asp Gln Ile Val Ser Phe Ala Lys Ser Asn Gly Met Ser

50 65 70 75 80

Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Glu Trp Val

85 90 95

Phe Gln Asp Ser Ser Gly Gly Thr Ala Gly Arg Glu Leu Leu Leu Ala100 105 110

Arg Met Lys Ser His Ile Asp Glu Val Val Gly Arg Tyr Arg Gly Asp115 120 125

Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Ala Asp Ser Gly Ser

130 135 140

Asp Leu Leu Arg Ser Ser Pro Trp Leu Ala Ser Ile Gly Glu Asp Phe 145 150 155 160

Ile Ala Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Gln Ala Leu

165 170 175

Leu Phe Tyr Asn Asp Tyr Asn Glu Ser Val Pro Glu Lys Arg Glu Lys180 185 190

Ile Tyr Thr Leu Leu Lys Ser Leu Lys Glu Gln Asp Val Pro Ile His195 200 205

Gly Val Gly Leu Gln Ala His Trp Asn Leu Glu Phe Pro Ser Leu Asp210 215 220

Asp Ile Arg Arg Ala Ile Glu Arg Tyr Ala Ser225 230 235

His Ile Thr Glu Leu Asp Val Ser Val Phe Ala

245 250

Thr Asp Leu Ala Ala Pro Thr Glu Glu Met Leu

260 265

Arg Tyr Gly Gln Leu Phe Arg Leu Leu Lys Glu

275 280

Thr Ser Val Thr Phe Trp Gly Ala Ala Asp Asp290 295

Phe Pro Val Arg Gly Arg Lys Asn Trp Pro310 315

Asn His Leu Pro Lys Glu Ser Tyr Trp Asn Leu

325 330

Pro Glu Arg Thr Phe Gln Glu Ile Arg Ser340 345

<210> 63<211> 1110<212> DNA<213> Desconhecido<220><223> Obtido para uma amostra ambiental<400> 63

atgaaacgaa ttttaattgg tttggcggct cttaccgctt tccgacggta ctttaaaaaa agcatttcag gataaattctcttcctcaga ttgatgggac agataaaaga gcggtagccatctattgttg ctgaaaactg tatgaaatcg atgtttctgcttctttgatg acgctgataa atttgttgat ttcgggatgaggacatacgc taatctggca ttcccagctt ccaaaatggtaaagatgttt ctccggaagt attgaaacag cgcatgaaaatcccgttaca aaggaaaagt aaaaggatgg gatgtggtgaggaacctata gaaaaagtaa attttacgaa attctgggtgtttcagtatg cacaggaagc cgatcccaat gcagaattattggtatccgg aaaaggtaaa agcagtcatt acaatggttgatccgtattg atggagtagg aatgcaggcc catgtcggaagaatatgaaa aagcaattct ggcgtattcc aatgccggagctggaaatta gtgcgctgcc ttctccgtgg ggaagctctggcctatcaga aagaaatgaa tccttacacc aaagggcttctgggaaaaac gttaccttga tttctttagc ttgtttttaaagggtgacct tatggggagt tactgataâg cagtcctggaggaagaacag attacccgtt gctgtttgac aggaaagatcaaaataataa aattggcaga gaaaaattaa<210> 64<211> 369<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (20)<400> 64

Met Lys Arg Ile Leu Ile Gly Leu Ala Ala Leu

15 10

Ser Ala Gln Lys Ser Asp Gly Thr Leu Lys Lys

20 25

Phe Tyr Ile Gly Thr Ala Met Ser Leu Pro Gln

35 40

Lys Arg Ala Val Ala Ile Ile Arg Asn Gln Phe

50 55

Glu Asn Cys Met Lys Ser Met Phe Leu Gln Pro65 70 75

Phe Phe Asp Asp Ala Asp Lys Phe Val Asp Phe

85 90

Met Phe Val Ile Gly His Thr Leu Ile Trp His100 105

220

Leu Gly

His Glu

Glu Arg

Tyr Ser285Tyr Thr300

Phe ValLeu Lys

Met Ile Leu240

Asp Lys Arg

255Gln Ala Glu270

Gly Ser Val

Trp Leu Asp

Phe Asp Glu320

Glu Ala Asn335

atatcgggacttatcagaaaaacctcaggaaaaacaatattttttacagaaccacattacatgaagccataagattttatattacaacgaaaaagcttaatggatatcccttaaagttaaccaatgtttcccaatgaagtaacataaagaaaaacgatttaggagaaacc

ggcgcagaaa 60tgcgatgagt 120tcagttcagt 180aggaaagttc 240gttcgtcatc 300taaaaatgga 360aaccgtagtt 420tcttgaagac 480tcctttggcg 540ttataatgaa 600atcaagaggá 660ttccatcaat 720tattacggag 780agataccgtt 840agaagcgaaa 900taaaataaga 960tccggtaaaa 1020tgtagtacaa 1080 1110

Thr Ala

Ala Phe

Ile Asp

45Ser Ser60

Gln GluGly MetSer Gln

Ser Gly Leu15

Gln Asp Lys30

Gly Thr Asp

Ile Val Ala

Gly Lys Phe80

Lys Asn Asn95

Leu Pro Lys110Trp Phe Phe Thr Asp Lys Asn Gly Lys Asp Val Ser Pro Glu Val Leu 115 120 125 Lys Gln 130 Arg Met Lys Asn His 135 Ile Thr Thr Val Val 140 Ser Arg Tyr Lys Gly 145 Lys Val Lys Gly Trp 150 Asp Val Val Asn Glu 155 Ala Ile Leu Glu Asp 160 Gly Thr Tyr Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Asp Phe 165 170 175 Ile Pro Leu Ala Phe Gln Tyr Ala Gln Glu Ala Asp Pro Asn Ala Glu 180 185 190 Leu Tyr Tyr 195 Asn Asp Tyr Asn Glu 200 Trp Tyr Pro Glu Lys 205 Val Lys Ala Val Ile 210 Thr Het Val Glu Lys 215 Leu Lys Ser Arg Gly 220 Ile Arg Ile Asp Gly Val Gly Met Gln Ala His Val Gly Met Asp Ile Pro Ser Ile Asn 225 230 235 240 Glu Tyr Glu Lys Ala Ile Leu Ala Tyr Ser Asn Ala Gly Val Lys Val 245 250 255 Asn Ile Thr Glu Leu Glu Ile Ser Ala Leu Pro Ser Pro Trp Gly Ser 260 265 270 Ser Ala Asn 275 Val Ser Asp Thr Val 280 Ala Tyr Gln Lys Glu 285 Met Asn Pro Tyr Thr 290 Lys Gly Leu Pro Asn 295 Glu Val Glu Ala Lys 300 Trp Glu Lys Arg Tyr Leu Asp Phe Phe Ser Leu Phe Leu Lys His Lys Asp Lys Ile Arg 305 310 315 320 Arg Val Thr Leu Trp Gly Val Thr Asp Lys Gln Ser Trp Lys Asn Asp 325 330 335 Phe Pro Val Lys Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Lys 340 345 350 Asp Gln Glu Lys Pro Val Val Gln Lys Ile Ile Lys Leu Ala Glu Lys 355 360 365

Asn

<210> 6535 <211> 1557<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 65

atgaaaagaa tcggactgtt gctgctggct gtgatcatgc ttgtgggctg tgtatattccgcggcggcgg aggatacgct ggtttatgct tccacttttg tggccggaac ggacggatggtacgcccgcg gagcgcagaa agtataccgc acaaccgagg agacactgcg gacggaaggccggaccagcg actggcattc cccgggccgt gattttgacc tggtggaagg cggcgtctatgtcctgagcg tggaagtgtt ccaggacgaa gcggacaacg ccagcttcat gatttccatcgcccacagca aggacggtac ggaaacctat gaaaacctgg ctcgcggaac cgccaaacgcggcgagtggg tcaccctgac cggaacatat accgccggca attttgaccg gaacgtcctgtatgtggaaa cgaccggatc gccggaactg agctatgaaa tccggaattt ccgggttgaagcgccgaacg gagttccgga gccgaaggct acggagcccc cgatggtgat tgaggcggtggagaacctcc cgggcctgaa gaacgcgtat gcgggaaaat ttgatttcgg cgcggcggttccgggatacg ctttcggcga tccgggcctg aaacagctga tgactgagca gttcagcatcctgacgcccg aaaacgaact gaaaccggac gctgtgctgg acgtggcggc gagcaagcggctggcccagg aggatgaaac ggcggtggcg gttcattttg acggcgccat tccgctgctgaactttgccc gggacaacgg catcagggtg cacggacatg tgctgatctg gcacagccagacgccggaag cgttcttcca tgagggctat gacacctcca agcccctggt cagccgggaagtgatgctgg gccggatgga aaactatatc cgcgaggtgc tgacctggac gaacgagaattatccgggcg tgatcgtatc ctgggacgtg gtgaacgaag ccattgatga cggaacgaactggctgcgga attccaactg gtacaagacg gtgggcggcg actttgtgaa ccgggcttttgaatttgccc gcatgtacgc ggcggacggc gtcctcctgt attacaatga ttacaatacc60 gcctatccgg ccaaacggaa gggaatcatc aagctgctgg gccagctgat tgaggaaggcaatattgacg gatacggctt ccagatgcat cacagcaccg gcgagccttc catggagatgatcaccgctt cggtggagga aatcgccgcg ctgggaataa aactgcgggt cagcgagctggatgtgggca tgggcagcag catgacggaa gaagccctga tgaaacagaa ggacaaatacaaggcggtca tggaactgat gc-tgcggttt gccgaccaga cggaagcggt gcaggtatggggactgacgg acaatatgag ctggcggacc ggccagaatc cgctgctgtt tgaccggaaccggaacccga agccggcctt cttcggcgtc ctggaagcgg cggaagaaag caaataa<210> 66

601201802403003604204805406006607207808409009601020108011401200126013201380144015001557<211> 518<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL

<222> (1)... (22) <400> 66 Met Lys Arg Ile Gly Leu Leu Leu Leu Ala Val Ile Met Leu Val Gly1 5 10 15 Cys Val Tyr Ser Ala Ala Ala Glu Asp Thr Leu Val Tyr Ala Ser Thr 20 25 30 Phe Val Ala Gly Thr Asp Gly Trp Tyr Ala Arg Gly Ala Gln Lys Val 35 40 45 Tyr Arg Thr Thr Glu Glu Thr Leu Arg Thr Glu Gly Arg Thr Ser Asp 50 55 60 Trp His Ser Pro Gly Arg Asp Phe Asp Leu Val Glu Gly Gly Val Tyr65 70 75 80Val Leu Ser Val Glu Val Phe Gln Asp Glu Ala Asp Asn Ala Ser Phe 85 90 95 Met Ile Ser Ile Ala His Ser Lys Asp Gly Thr Glu Thr Tyr Glu Asn 100 105 110 Leu Ala Arg Gly Thr Ala Lys Arg Gly Glu Trp Val Thr Leu Thr Gly 115 120 125 Thr Tyr Thr Ala Gly Asn Phe Asp Arg Asn Val Leu Tyr Val Glu Thr 130 135 140 Thr Gly Ser Pro Glu Leu Ser Tyr Glu Ile Arg Asn Phe Arg Val Glu145 150 155 160Ala Pro Asn Gly Val Pro Glu Pro Lys Ala Thr Glu Pro Pro Met Val 165 170 175 Ile Glu Ala Val Glu Asn Leu Pro Gly Leu Lys Asn Ala Tyr Ala Gly 180 185 190 Lys Phe Asp Phe Gly Ala Ala Val Pro Gly Tyr Ala Phe Gly Asp Pro 195 200 205 Gly Leu Lys Gln Leu Met Thr Glu Gln Phe Ser Ile Leu Thr Pro Glu 210 215 220 Asn Glu Leu Lys Pro Asp Ala Val Leu Asp Val Ala Ala Ser Lys Arg225 230 235 240Leu Ala Gln Glu Asp Glu Thr Ala Val Ala Val His Phe Asp Gly Ala 245 250 255 Ile Pro Leu Leu Asn Phe Ala Arg Asp Asn Gly Ile Arg Val His Gly 260 265 270 His Val Leu Ile Trp His Ser Gln Thr Pro Glu Ala Phe Phe His Glu 275 280 285 Gly Tyr Asp Thr Ser Lys Pro Leu Val Ser Arg Glu Val Met Leu Gly 290 295 300 Arg Met Glu Asn Tyr Ile Arg Glu Val Leu Thr Trp Thr Asn Glu Asn305 310 315 320Tyr Pro Gly Val Ile Val Ser Trp Asp Val Val Asn Glu Ala Ile Asp 325 330 335 Asp Gly Thr Asn Trp Leu Arg Asn Ser Asn Trp Tyr Lys Thr Val Gly 340 345 350 Gly Asp Phe Val Asn Arg Ala Phe Glu Phe Ala Arg Met Tyr Ala Ala 355 360 365 Asp Gly Val Leu Leu Tyr Tyr Asn Asp Tyr Asn Thr Ala Tyr Pro Ala 370 375 380 Lys Arg Lys Gly Ile Ile Lys Leu Leu Gly Gln Leu Ile Glu Glu Gly385 390 395 400Asn Ile Asp Gly Tyr Gly Phe Gln Met His His Ser Thr Gly Glu Pro 405 410 415 Ser Met Glu Met Ile Thr Ala Ser Val Glu Glu Ile Ala Ala Leu Gly 420 425 430 Ile Lys Leu Arg Val Ser Glu Leu Asp Val Gly Met Gly Ser Ser Met 435 440 445 Thr Glu Glu Ala Leu Met Lys Gln Lys Asp Lys Tyr Lys Ala Val Met 450 455 460Glu Leu Met Leu Arg Phe Ala Asp Gln Thr Glu Ala Val Gln Val Trp465 470 475 480Gly Leu Thr Asp Asn Met Ser Trp Arg Thr Gly Gln Asn Pro Leu Leu 485 490 495 Phe Asp Arg Asn Arg Asn Pro Lys Pro Ala Phe Phe Gly Val Leu Glu 500 505 510 Ala Ala Glu Glu Ser Lys

515

<210> 67<211> 1224<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 67

atgcggaacg tcgtgcgtaa accattgaca atcggactcg ctttaacact attattgcccatgggaatga cggcaacatc agcgaagaat gcagattcct atgcgaaaaa acctcacatcagcgcattga atgccccaca attggatcaa cgctacaaaa acgagttcac gattggtgcggcagtagaac cttatcaact acaaaatgaa aaagacgtac aaatgctaaa gcgccacttcaacagcattg ttgccgagaa cgtaatgaaa ccgatcagca ttcaacctga ggaaggaaaattcaattttg aacaagcgga tcgaattgtg aagttcgcta aggcaaatgg catggatattcgcttccata cactcgtttg gcacagccaa gtacctcaat ggttctttct tgacaaggaaggcaagccaa tggttaatga aacagatcca gtgaaacgtg aacaaaataa acaactgctgttaaaacgac ttgaaactca tattaaaacg atcgtcgagc ggtacaaaga tgacattaagtactgggacg ttgtaaatga ggttgtgggg gacgacggaa aactgcgcaa ctctccatggtatcaaatcg ccggcatcga ttatattaaa gtggcattcc aaacagcgag aaaatatggcggcaacaaga ttaaacttta tatcaatgat tacaataccg aagtggaacc aaagcgaagcgctctttata acttggtgaa gcaattaaaa gaagagggcg ttcctattga cggcatcggccatcaatccc acattcaaat cggctggcct tctgaagcag aaatcgagaa aacgattaacatgttcgccg ctctcggctt agacaaccaa atcactgagc ttgatgtgag catgtacggttggccgccgc gcgcttaccc gacgtatgac gccattccaa aacaaaagtt tttggatcaggcagcgcgct atgatcgttt gttcaaactg tatgaaaagt tgagcgataa aattagcaacgtcaccttct ggggcatcgc cgacaatcat acgtggctcg acagccgtgc ggatgtgtactatgacgcca acgggaatgt tgtggttgac ccgaacgctc cgtacgcaaa agtggaaaaagggaaaggaa aagatgcgcc gttcgttttt ggaccggatt acaaagtcaa acccgcatattgggctatta tcgaccacaa atag<210> 68<211> 407<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(28)

Met Arg Asn Val Val Arg Lys Pro Leu Thr Ile Gly Leu Ala Leu Thr1 5 10 15 Leu Leu Leu Pro 20 Met Gly Met Thr Ala 25 Thr Ser Ala Lys Asn 30 Ala AspSer Tyr Ala 35 Lys Lys Pro His Ile 40 Ser Ala Leu Asn Ala 45 Pro Gln LeuAsp Gln Arg Tyr Lys Asn Glu Phe Thr Ile Gly Ala Ala Val Glu Pro 50 55 60 Tyr Gln Leu Gln Asn Glu Lys Asp Val Gln Met Leu Lys Arg His Phe65 70 75 80Asn Ser Ile Val Ala 85 Glu Asn Val Met Lys 90 Pro Ile Ser Ile Gln 95 ProGlu Glu Gly Lys Phe Asn Phe Glu Gln Ala Asp Arg Ile Val Lys Phe 100 105 110 Ala Lys Ala Asn Gly Met Asp Ile Arg Phe His Thr Leu Val Trp His 115 120 125 Ser Gln 130 Val Pro Gln Trp Phe 135 Phe Leu Asp Lys Glu 140 Gly Lys Pro MetVal Asn Glu Thr Asp Pro Val Lys Arg Glu Gln Asn Lys Gln Leu Leu145 150 155 160Leu Lys Arg Leu Glu Thr His Ile Lys Thr Ile Val Glu Arg Tyr Lys165 170 175 Asp Asp Ile Lys 180 Tyr Trp Asp Val Val 185 Asn Glu Val Val Gly 190 Asp Asp Gly Lys Leu Arg Asn Ser Pro Trp Tyr Gln Ile Ala Gly Ile Asp Tyr 195 200 205 Ile Lys 210 Val Ala Phe Gln Thr 215 Ala Arg Lys Tyr Gly 220 Gly Asn Lys Ile Lys Leu Tyr Ile Asn Asp Tyr Asn Thr Glu Val Glu Pro Lys Arg Ser 225 230 235 240 Ala Leu Tyr Asn Leu Val Lys Gln Leu Lys Glu Glu Gly Val Pro Ile 245 250 255 Asp Gly Ile Gly His Gln Ser His Ile Gln Ile Gly Trp Pro Ser Glu 260 265 270 Ala Glu Ile Glu Lys Thr Ile Asn Met Phe Ala Ala Leu Gly Leu Asp 275 280 285 Asn Gln 290 Ile Thr Glu Leu Asp 295 Val Ser Met Tyr Gly 300 Trp Pro Pro Arg Ala Tyr Pro Thr Tyr Asp Ala Ile Pro Lys Gln Lys Phe Leu Asp Gln 305 310 315 320 Ala Ala Arg Tyr Asp 325 Arg Leu Phe Lys Leu 330 Tyr Glu Lys Leu Ser 335 Asp Lys Ile Ser Asn Val Thr Phe Trp Gly Ile Ala Asp Asn His Thr Trp 340 345 350 Leu Asp Ser Arg Ala Asp Val Tyr Tyr Asp Ala Asn Gly Asn Val Val 355 360 365 Val Asp 370 Pro Asn Ala Pro Tyr 375 Ala Lys Val Glu Lys 380 Gly Lys Gly Lys Asp Ala Pro Phe Val Phe Gly Pro Asp Tyr Lys Val Lys Pro Ala Tyr 385 390 395 400 Trp Ala Ile Ile Asp His Lys

405

<210><211><212>

69

1596DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 69

atggcgatgc atagatttaa gcaattaggg gccatcctacttgccagtgc aggcgcaggc ttggcgtgcg gccgcagagcaaggggccac tgcgggttca ggtgaaggat cctgaaggacgtgcacgttc gcatgacgcg tcacgctttt ggatttggtagtcgtggggt cgggatacaa ccccacctat cgggccaagcggccgcacat tcaacatggc tacgccagag aatgaattgagaatggccca tttcgaatcg tcgaaagatc gacgtcatcatacagcattc gaggacacaa cctgctatgg cctgactggcgagcaaaacc gcaacaatcc acagtacatc tacgatcgcgttggctgggc atcgggacat tcggggcaaa ctgcgggactgcccacctga ccgcattgcg cgatgtgttt aacggttggg.gacttctatg tggatgtctt taggtgggcc aaggcagcagatcaacgagt acaacattat caacaactac gccaacgagcaagtggatca ttgcacgcct aatctcaaaa ggagcgcctagggcatattt cggcaccact gccaagcatg agtgaggtcagcagtttttg gattgccttt ggccatcaca gaatacgacggtcgaagcca actttatgcg ggactttttg accatggtctagcttcgtca tgtggggttt ctggagcgga gcacactggccgggccgact ggagtctcaa gccttcggga caggtgttcctggtggaccg atactacggg ggtaaccggt ccagatggcattaggggatt acgttgtgga agtgcaggtg ggggaggtttctcgaaagcc cgcaggatac aaccacgcta gaggtggtgggaaaagccta cagaagacgt gttgcgcgtg caagggtttgggaacggcgc tgcgctactg gttagggcgg ccggccgatggtgctgggcc gacaggtcta cgccgtgcaa aagcatcgcgtgggtcgagg cttcccactg gcctgcagga ctttatctgtctgttgcaca cgggtagaat ggtcaagatc caataa<210> 70<211> 531

ttgtcctatgagcgtattgaggcccgtacccggctgtcagtagaagacctagtggcctgcactggctgcgaatggatgccttcgcaatcagggatgttctgctcatatgaactcgaccgcagcctacgcgtcgaagggataggcagccctttaccggcgtttagtcatccgtgacaatgcttgatctggtgctggtctgtcagtgaccaatcagtagcgtgaccagacccttgaactggctagctggttgaccgactcca

gttttgtgcaacagtaccgtgaatgcccaactttggcctggacgggcgacgtgggagtcgcgcaaaaggcccgtgatattcattgcggcgtaacgaaccagcgtggggaaccgtctataccaactattaccggcattcagagacgaaatgttcggaagaacgctgtggaggccgctgtttctttcggcgcacgcggatttgtccctgcgctaaggtgggtctttgtcgaaagtgtatgatgcatactgaaagcaggtgat

6012018024030036042048054060066072078084090096010201080114012001260132013801440150015601596<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental

<220>

<221> SIGNAL<222> (1)...(25)<400> 70

Met Ala Met His Arg Phe Lys Gln Leu Gly Ala Ile Leu Leu Val Leu

1 5 10 15

Trp Phe Cys Ala Leu Pro Val Gln Ala Gln Ala Trp Arg Ala Ala Ala

20 25 30

Glu Gln Arg Ile Glu Gln Tyr Arg Lys Gly Pro Leu Arg Val Gln Val35 40 45

Lys Asp Pro Glu Gly Arg Pro Val Pro Asn Ala Gln Val His Val Arg50 55 60

Met Thr Arg His Ala Phe Gly Phe Gly Thr Ala Val Ser Phe Gly Leu65 70 75 80

Val Val Gly Ser Gly Tyr Asn Pro Thr Tyr Arg Ala Lys Leu Glu Asp

85 90 95

Leu Thr Gly Asp Gly Arg Thr Phe Asn Met Ala Thr Pro Glu Asn Glu

100 105 HO

Leu Lys Trp Pro Ala Trp Glu Ser Glu Trp Pro Ile Ser Asn Arg Arg115 120 125

Lys Ile Asp Val Ile Asn Trp Leu Arg Ala Lys Gly Tyr Ser Ile Arg130 135 140

Gly His Asn Leu Leu Trp Pro Asp Trp Gln Trp Met Pro Arg Asp Ile145 150 155 160

Glu Gln Asn Arg Asn Asn Pro Gln Tyr Ile Tyr Asp Arg Val Arg Asn

165 170 175

His Ile Ala Ala Leu Ala Gly His Arg Asp Ile Arg Gly Lys Leu Arg

180 185 190

Asp Trp Asp Val Leu Asn Glu Pro Ala His Leu Thr Ala Leu Arg Asp195 200 205

Val Phe Asn Gly Trp Gly Ser Tyr Glu Arg Gly Glu Asp Phe Tyr Val210 215 220

Asp Val Phe Arg Trp Ala Lys Ala Ala Asp Ser Thr Ala Arg Leu Tyr225 230 235 240

Ile Asn Glu Tyr Asn Ile Ile Asn Asn Tyr Ala Asn Glu Gln Pro Thr245 250 255

Arg Asn Tyr Tyr Lys Trp Ile Ile Ala Arg Leu Ile Ser Lys Gly Ala

260 265 270

Pro Ile Glu Gly Ile Gly Ile Gln Gly His Ile Ser Ala Pro Leu Pro275 280 285

Ser Met Ser Glu Val Lys Ala Ala Leu Asp Glu Met Ala Val Phe Gly290 295 300

Leu Pro Leu Ala Ile Thr Glu Tyr Asp Val Thr Gly Val Ser Glu Glu305 310 315 320

Val Glu Ala Asn Phe Met Arg Asp Phe Leu Thr Met Val Phe Ser His325 330 335

Pro Ala Val Glu Ser Phe Val Met Trp Gly Phe Trp Ser Gly Ala His

340 345 350

Trp Arg Asp Asn Ala Pro Leu Phe Arg Ala Asp Trp Ser Leu Lys Pro355 360 365

Ser Gly Gln Val Phe Leu Asp Leu Val Phe Arg Arg Trp Trp Thr Asp370 375 380

Thr Thr Gly Val Thr Gly Pro Asp Gly Ser Trp Ser Val Arg Gly Phe385 390 395 400

Leu Gly Asp Tyr Val Val Glu Val Gln Val Gly Glu Val Ser Val Thr405 410 415

Lys Ser Leu Arg Leu Glu Ser Pro Gln Asp Thr Thr Thr Leu Glu Val

420 425 430

Val Val Ser Ser Val Lys Val Gly Glu Lys Pro Thr Glu Asp Val Leu435 440 445

Arg Val Gln Gly Phe Gly Pro Asp Pro Phe Val Glu Gly Thr Ala Leu450 455 460

Arg Tyr Trp Leu Gly Arg Pro Ala Asp Val Glu Leu Ala Val Tyr Asp465 470 475 480

Val Leu Gly Arg Gln Val Tyr Ala Val Gln Lys His Arg Val Ala Gly

485 490 495

Trp His Thr Glu Trp Val Glu Ala Ser His Trp Pro Ala Gly Leu Tyr

500 505 510

Leu Tyr Arg Leu Gln Ala Gly Asp Leu Leu His Thr Gly Arg Met Val

515 520 525

Lys Ile Gln

530<210> 71<211> 1269<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 71

atgatttcca tcgcccattc agtgaacggg gcggagacct atgagaacct ggcgcacggaactgccaaaa aaggcgaatg gactacgctg aaggggacat acaccgccgg cgcctatcagcgcaacgtgc tctatgtgga aacggtttct gaaggcaccc ttgactttga gatccgtaattttgtcctga cggctccgaa cggactaccg gagcccaagc cgaccgagcc tccgatggtcatcgaggaag ccgagaacgt gcccagtctc aaagagattt atgcagacaa attcgatttcggctccgccg cgccccagat ggtattccgt gaccccaaat ggctcaacct gatgaaggaacagttcagca ttctgacgcc ggaaaacgaa atgaaaccgg attccgttct ggatgtgggcgcgagcaaag cgctggtgaa ggaaaccggt gatgagaccg ccgtcgccgt tcatttcgacgctgccaaag cgctgctgaa ttttgccaag agcaacggga tcaaggttca cggccatgtgctgatctggc acagccagac gccggaagct ttcttccatc agggatatga ttccaagaagcctttcgtta cacgggaagt gatgctgggc cgaatggaaa attacattaa gggtgtttttgaatacctgg atgaaaatta tcccggcgtc gttgtctcct gggacgtgct gaatgaggcgattgacgacg gaagcaactg gctgcggaac agcaactgga gaaagattgt cggcgaagactatccgaacc gggcatatga atatgcgcgc aaatatgcgc cggaaggtac gctgctgtattacaacgatt acaatacgtc gattcccggg aaactgaacg gcattgtgaa actgctgaacagtctgattc cggaaggaaa tatcgacggt tacggcttcc agatgcacca tggcgtcggcttcccgtcca ttgatatgat ccagactgca gtggaacgga ttgccgcgct gaatatccgccttcgcgtca gcgaactgga tgtcacggtg gacaacaaca cggaagcgtc cttcaacaaacaggcaaagt attatgccga agtcatgaag attctgattg ctcacagcga ccagtttgaggctgtgcagg tctgggggct gacagacctg atgagctggc gcggcagtca gttcccgctgctgtttgacg gggcaggcaa tccgaaaccg gcgttctggg ccgtcgcgga tccggattccgtgaaataa<210> 72<211> 422<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 72

Met Ile Ser Ile Ala His Ser Val Asn Gly Ala Glu Thr Tyr Glu Asn1 5 10 15 Leu Ala His Gly 20 Thr Ala Lys Lys Gly 25 Glu Trp Thr Thr Leu 30 Lys GlyThr Tyr Thr 35 Ala Gly Ala Tyr Gln 40 Arg Asn Val Leu Tyr 45 Val Glu ThrVal Ser 50 Glu Gly Thr Leu Asp 55 Phe Glu Ile Arg Asn 60 Phe Val Leu ThrAla Pro Asn Gly Leu Pro Glu Pro Lys Pro Thr Glu Pro Pro Met Val65 70 75 80Ile Glu Glu Ala Glu 85 Asn Val Pro Ser Leu 90 Lys Glu Ile Tyr Ala 95 AspLys Phe Asp Phe 100 Gly Ser Ala Ala Pro 105 Gln Met Val Phe Arg 110 Asp ProLys Trp Leu 115 Asn Leu Met Lys Glu 120 Gln Phe Ser Ile Leu 125 Thr Pro GluAsn Glu 130 Met Lys Pro Asp Ser 135 Val Leu Asp Val Gly 140 Ala Ser Lys AlaLeu Val Lys Glu Thr Gly Asp Glu Thr Ala Val Ala Val His Phe Asp145 150 155 160Ala Ala Lys Ala Leu Leu Asn Phe Ala Lys Ser Asn Gly Ile Lys Val 165 170 175His Gly His Val Leu Ile Trp His Ser Gln Thr Pro Glu Ala180 185 190

His Gln Gly Tyr Asp Ser Lys Lys Pro Phe Val Thr Arg Glu

195 200 205

Leu Gly Arg Met Glu Asn Tyr Ile Lys Gly Val Phe Glu Tyr

210 215 220

Glu Asn Tyr Pro Gly Val Val Val Ser Trp Asp Val Leu Asn225 230 235

Ile Asp Asp Gly Ser Asn Trp Leu Arg Asn Ser Asn Trp Arg

245 250

Val Gly Glu Asp Tyr Pro Asn Arg Ala Tyr Glu Tyr Ala Arg260 265 270

Ala Pro Glu Gly Thr Leu Leu Tyr Tyr Asn Asp Tyr Asn Thr

275 280 285

Pro Gly Lys Leu Asn Gly Ile Val Lys Leu Leu Asn Ser Leu

290 295 300

Glu Gly Asn Ile Asp Gly Tyr Gly Phe Gln Met His His Gly305 310 315

Phe Pro Ser Ile Asp Met Ile Gln Thr Ala Val Glu Arg Ile

325 330

Leu Asn Ile Arg Leu Arg Val Ser Glu Leu Asp Val Thr Val340 345 350

Asn Thr Glu Ala Ser Phe Asn Lys Gln Ala Lys Tyr Tyr Ala

355 360 365

Met Lys Ile Leu Ile Ala His Ser Asp Gln Phe Glu Ala Val

370 375 380

Trp Gly Leu Thr Asp Leu Met Ser Trp Arg Gly Ser Gln Phe385 390 395

Leu Phe Asp Gly Ala Gly Asn Pro Lys Pro Ala Phe Trp Ala

405 410

Asp Pro Asp Ser Val Lys420

<210> 73

4455DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 73

atgcagaaaa tgagaagaaa attgaaaaga attatgttat tacttctggcataatcccgt caggctggat tacacaggct tcagcagcgg aaacaaacaagttctactgt accatcgaat tgttgataat cctactaatc aatggacggagaaacgttta aacagactat gcaatatcta aatgatagcg gttacaacacgaacaatatg taaagatcat ggatggaacg gcaacggcgc ctgaaaaaccacgtttgacg atggtactcc agaatttatc accaatgctc ttccagtattaacatgaaag ctgttctgtt tattgtcagt gactggatag gcggcggcttaaagaacagc tgcaaagttt ggctaatgaa ccatctttaa gcctcgaaaaacccatgacg gtactatttg gggaacaaat ggcggtgtac gtagtacgatcaagctgagg accaaattat atcagcgaat acttatctta aaagtattacccagtcctaa tggcataccc ttatggcagc tataatgata ttgcaaaactgaaaatggta ttaagtacgc atttaaagtg ggatacccta atgaagataaggccgtcact atgtaacaaa tcaaagtgtg gctcaaattg cccaaatgatgtgccagaac caactccaga accaggaaac cagacagaaa ccgtctatcagccagtgata ttggtgtagc agttcaagcg ggtaacccac aagtaacccaatggtttttg caggcaatga cgatggaaaa gccatctctg ttagcggcagtgggacggcg tcgatatccc attcaacaat gtcggtatgg aaaacggcaaattacagtta ctggttatgt tgacgaaaat gcaactgttc cttctggcgcctgcagaatg tagacagcta taacggtttg tatgttgccg cagattatgcgcttttactt taacgggtca gtataccgtg gatactagta aagatagagccaatcaaatg atgctgggaa aactgttccg ttttacattg gaaacatcttaaaaaaacga ctgcgcctga aacagataga gtggtatttc acgaaacattgttggtgttg ctacacaagc gggaagtgcg aaattgactc ctgtttctgagaaggcaata gcgatggaaa agcaatttct gttaatggca gatccaataacgttcagcag tgtcagcatg cagaacggca aagcctatactttatagcag tgtgagtgtt cctgaaggtg cacaagctttgtagacagct ataatggctt gtatgcagca gcagatgtta aggcaggtcactaacgggtc aatataccgt tgatacgagc aaagatagag cactacgaat

Phe Phe

Val Met

Leu Asp

Glu Ala240Lys Ile255

Lys Tyr

Ser Ile

Ile Pro

Val Gly320Ala Ala335

Asp Asn

Glu Val

Gln Val

Pro Leu400Val Ala415

<211><212>

gttgatatacaçtggttttg

agctatgttg 60agatatacct 120taccagcgtt 180cttgtcagcc 240gattctatta 300aaagcaatat 360cagcatgtca 420tcatacgaaa 480aacgaaagaa 540aggtaaagac 600agtaaaccaa 660ttatgctatg 720tggcggccct 780agaaaccttt 840cgtttctggt 900gacgaacaac 960aacttatacg 1020acaagcttta 1080agcgggacag 1140cctacgtatc 1200gattacaacg 1260tggaaatggt 1320gcttgttttt 1380ctgggacgga 1440cattacagtc 1500gcttcagaat 1560aacatttact 1620tcaatcaaat 1680gatgcaggga aaaccgttcc cttctatatc ggagatattc tcattaccga gaaggcagcc 1740

tctggtggtg gcggggacga tggaagacta cctgccgaac catttacagc aattaatttt 1800

gaagaccaaa atatgggtgg tttcgaggga agagctggta ccgaaacact aacagtaacc 1860

aatgaagcca atcatactga tggcggttcc tatgctttga aggttgaagg cagatcacaa 1920

gcttggcatg gaccagcatt acacgtagag aaatatgttg acaaggattc ggaatataaa 1980

atttctgcct gggtgaagct gatttcacca gcaacttcac agçttcagct ttctacacag 2040

gtcggcaatg gcggaactgc tagttacaat aatcttcaag gaaaaactat cagcactgaa 2100

gatggctggg ttaaacttga gggaacgtac cgttatagca gtgtaggcga tgagttttta 2160

accatttatg tagagagctc gaataatagc acagcctcct tttatatcga tgatattact 2220

tttgaatcga ctggttcggg tccgattgaa gttgaggatt tgacaccgat aaaagatgtt 2280

tatcaagacg atttcttaat tggaaacgct gtctcagctt ctgatcttga aggcaataga 2340

cttaagcttc tcaacatgca tcacaatgtt gtcacagcag agaatgcaat gaagccagat 2400

caagcgtata atgcggaaaa acaatttgac tttactgatg aaaatgcgct tgtcgacaag 2460

gttttggatc agggattgca gctgcatggt cacgtgcttg tatggcacca gcagacgcca 2520

gaatggttat ttacagctga aaacggtgcc cctttgagcc gtgaggcagc actagcaaat 2580

ttaaggaccc atgttaaaac agtcgtagaa aattacggta acaaggtaat ttcatgggac 2640

gtggtaaacg aagcaatcat cgataacccg ccgaacccaa cggattggaa ggcatcactt 2700

cgtaaatctg gctggtacaa atcgattgga ccagacttcg tagaacaatc cttccttgct 2760

gcaaaagagg tactgaatga aaaaggcttg aatatcaagc tatattacaa tgattacaat 2820

gatgataatc agagcaaagc cgaggccatt tatcagatgg tgaaagatat caatgaaaag 2880

tatgctaaag aacatgatgg ggatcttctc attgacggaa ttggaatgca agcgcactac 2940

aataaaaaca ctaatcctga aaatgttaaa ctctccctag agaagtttat tacattgggt 3000

gtagaagtca gtgtgactga acttgacatt accgctggaa ccaataatgt acttactgag 3060

aaggaagcaa ttgcacaggg ttatttatac gcacaattgt tcaagattta caaagaacac 3120

gcagagcata tctcacgggt aactttctgg ggactaaatg atgcaacgag ctggagagct 3180

gcacagagtc cattgttgtt tgataaagat ttgcaagcaa aaccagctta ctatgctgtt 3240

atcgatccag acacatttac tgtagaaaat caacctgagg taagagaggc taatcaagga 3300

agtgctgttt ccggcacaçc agtgattgat ggaactgtag atggtgtttg gagcaatgca 3360

acggaactgc cgattaatcg cttccaaatg gcttggcagg gagcaaacgg ggtatccaag 3420

gtcctctggg ataatgaaaa cctgtatgtt ttaattcaag taagtgactc acagctcgac 3480

aaatcgagtc caaatccatg ggaacaggat tccattgaag tctttgtaga tgagaataat 3540

gcaaagacat cttccttcga agatggtgat ggacaatatc gagtaaactt tgacaatgaa 3600

acatccttta accctgtcag agttggagaa ggtttcgaat ctgcaaccaa agcatcaggt 3660

aatggctata ccgttgaagt aaagattccg ttcaaaacca ttacaccaga taacaatacg 3720

aaaatcggtt ttgatgttca gattaatgac ggtaaagatg gtgctcgtca aagtgctgca 3780

acatggaacg atttaactgg tctgggatat caggacactt ctgtgttcgg cgtcctgaca 3840

cttatgaaga ctgacaccac cgcgcctgtt acaaccgata acggaccaga agattgggtt 3900

aataaagatg taacgattgc tttcagtgca aatgataatg acactggtgt ggcggcaacc 3960

tattatagta ttgataatgg ggtcgtacaa aacggtaatt cagttactat ttcggaagag 4020

ggtgtccaca ttctaacata ttggagtgta gacaaagctg gtaatgtcga gcaggttcat 4080

acaaaaacaa ttaaactaga taagaccgga ccaatattag atattaaact cgacaaaaca 4140

acattatcac cagttaatca taagatggtc ccaatatcgg cggctattag tgcatctgat 4200

gccgattcag gaattcattc agtagtgtta acatcaatta ctagcaatga atctatccaa 4260

cctgatgata ttcagaatgc caactataat aaacctatta caggtactac ggattccttt 4320

aaacttcgtg cagaaagatt agcaaacggt aatggccgtg tttacaccat tacttatacg 4380

gccacagata aagctggtaa tgtgacaaca aaaagtgttg aagtttccgt tccacgcgac 4440

aattctaaaa aataa 4455

<210> 74

<211> 1484

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental

<220>

<221> SIGNAL

<222> (1) ... (21)

<400> 74

55Met Gln Lys Met Arg Arg Lys Leu Lys Arg Ile Met Leu Leu Leu Leu15 10 15

60 Ala Ala Met Leu Ile Ile Pro Ser Gly Trp Ile Thr Gln Ala Ser Ala

20 25 30

Ala Glu Thr Asn Lys Asp Ile Pro Val Leu Leu Tyr His Arg Ile Val

35 40 45

Asp Asn Pro Thr Asn Gln Trp Thr Asp Thr Ser Val Glu Thr Phe Lys

65 50 55 60

Gln Thr Met Gln Tyr Leu Asn Asp Ser Gly Tyr Asn Thr Leu Ser AlaGlu Gln Tyr Val Lys Ile Met Asp Gly Thr Ala Thr Ala Pro Glu Lys 85 90 95 Pro Ile Leu Leu 100 Thr Phe Asp Asp Gly 105 Thr Pro Glu Phe Ile 110 Thr AsnAla Leu Pro 115 Val Leu Lys Gln Tyr 120 Asn Met Lys Ala Val 125 Leu Phe IleVal Ser Asp Trp Ile Gly Gly Gly Phe Ser Met Ser Lys Glu Gln Leu 130 135 140 Gln Ser Leu Ala Asn Glu Pro Ser Leu Ser Leu Glu Asn His Thr Lys145 150 155 160Thr His Asp Gly Thr Ile Trp Gly Thr Asn Gly Gly Val Arg Ser Thr 165 170 175 Ile Thr Lys Glu Gln Ala Glu Asp Gln Ile Ile Ser Ala Asn Thr Tyr 180 185 190 Leu Lys Ser Ile Thr Gly Lys Asp Pro Val Leu Met Ala Tyr Pro Tyr 195 200 205 Gly Ser 210 Tyr Asn Asp Ile Ala 215 Lys Leu Val Asn Gln 220 Glu Asn Gly IleLys Tyr Ala Phe Lys Val Gly Tyr Pro Asn Glu Asp Asn Tyr Ala Met225 230 235 240Gly Arg His Tyr Val Thr Asn Gln Ser Val Ala Gln Ile Ala Gln Met 245 250 255 Ile Gly Gly Pro Val Pro Glu Pro Thr Pro Glu Pro Gly Asn Gln Thr 260 265 270 Glu Thr Val 275 Tyr Gln Glu Thr Phe 280 Ala Ser Asp Ile Gly 285 Val Ala ValGln Ala Gly Asn Pro Gln Val Thr His Val Ser Gly Met Val Phe Ala 290 295 300 Gly Asn Asp Asp Gly Lys Ala Ile Ser Val Ser Gly Arg Thr Asn Asn305 310 315 320Trp Asp Gly Val Asp Ile Pro Phe Asn Asn Val Gly Met Glu Asn Gly 325 330 335 Lys Thr Tyr Thr Ile Thr Val Thr Gly Tyr Val Asp Glu Asn Ala Thr 340 345 350 Val Pro Ser Gly Ala Gln Ala Leu Leu Gln Asn Val Asp Ser Tyr Asn 355 360 365 Gly Leu Tyr Val Ala Ala Asp Tyr Ala Ala Gly Gln Ala Phe Thr Leu 370 375 380 Thr Gly Gln Tyr Thr Val Asp Thr Ser Lys Asp Arg Ala Leu Arg Ile385 390 395 400Gln Ser Asn Asp Ala Gly Lys Thr Val Pro Phe Tyr Ile Gly Asn Ile 405 410 415 Leu Ile Thr Thr 420 Lys Lys Thr Thr Ala 425 Pro Glu Thr Asp Arg 430 Val ValPhe His Glu Thr Phe Gly Asn Gly Val Gly Val Ala Thr Gln Ala Gly 435 440 445 Ser Ala 450 Lys Leu Thr Pro Val 455 Ser Glu Leu Val Phe 460 Glu Gly Asn SerAsp Gly Lys Ala Ile Ser Val Asn Gly Arg Ser Asn Asn Trp Asp Gly465 470 475 480Val Asp Ile Pro Phe 485 Ser Ser Val Ser Met 490 Gln Asn Gly Lys Ala 495 TyrThr Ile Thr Val 500 Thr Gly Phe Val Tyr 505 Ser Ser Val Ser Val 510 Pro GluGly Ala Gln Ala Leu Leu Gln Asn Val Asp Ser Tyr Asn Gly Leu Tyr 515 520 525 Ala Ala Ala Asp Val Lys Ala Gly Gln Thr Phe Thr Leu Thr Gly Gln 530 535 540 Tyr Thr Val Asp Thr Ser Lys Asp Arg Ala Leu Arg Ile Gln Ser Asn545 550 555 560Asp Ala Gly Lys Thr Val Pro Phe Tyr Ile Gly Asp Ile Leu Ile Thr 565 570 575 Glu Lys Ala Ala Ser Gly Gly Gly Gly Asp Asp Gly Arg Leu Pro Ala 580 585 590 Glu Pro Phe 595 Thr Ala Ile Asn Phe 600 Glu Asp Gln Asn Met 605 Gly Gly PheGlu Gly Arg Ala Gly Thr Glu Thr Leu Thr Vai. . Thr Asn Glu Ala Asn610 615 620 His Thr Asp Gly Gly Ser Tyr Ala Leu Lys Val Glu Gly Arg Ser Gln625 630 635 640Ala Trp His Gly Pro Ala Leu His Val Glu Lys Tyr Val Asp Lys Asp 645 650 655 Ser Glu Tyr Lys Ile Ser Ala Trp Val Lys Leu Ile Ser Pro Ala Thr 660 665 670 Ser Gln Leu Gln Leu Ser Thr Gln Val Gly Asn Gly Gly Thr Ala Ser 675 680 685 Tyr Asn Asn Leu Gln Gly Lys Thr Ile Ser Thr Glu Asp Gly Trp Val 690 695 700 Lys Leu Glu Gly Thr Tyr Arg Tyr Ser Ser Val Gly Asp Glu Phe Leu705 710 715 720Thr Ile Tyr Val Glu Ser Ser Asn Asn Ser Thr Ala Ser Phe Tyr Ilé 725 730 735 Asp Asp Ile Thr Phe Glu Ser Thr Gly Ser Gly Pro Ile Glu Val Glu 740 745 750 Asp Leu Thr Pro Ile Lys Asp Val Tyr Gln Asp Asp Phe Leu Ile Gly 755 760 765 Asn Ala Val Ser Ala Ser Asp Leu Glu Gly Asn Arg Leu Lys Leu Leu 770 775 780 Asn Met His His Asn Val Val Thr Ala Glu Asn Ala Met Lys Pro Asp785 790 795 800Gln Ala Tyr Asn Ala Glu Lys Gln Phe Asp Phe Thr Asp Glu Asn Ala 805 810 815 Leu Val Asp Lys Val Leu Asp Gln Gly Leu Gln Leu His Gly His Val 820 825 830 Leu Val Trp His Gln Gln Thr Pro Glu Trp Leu Phe Thr Ala Glu Asn 835 840 845 Gly Ala Pro Leu Ser Arg Glu Ala Ala Leu Ala Asn Leu Arg Thr His 850 855 860 Val Lys Thr Val Val Glu Asn Tyr Gly Asn Lys Val Ile Ser Trp Asp865 870 875 880Val Val Asn Glu Ala Ile Ile Asp Asn Pro Pro Asn Pro Thr Asp Trp 885 890 895 Lys Ala Ser Leu Arg Lys Ser Gly Trp Tyr Lys Ser Ile Gly Pro Asp 900 905 910 Phe Val Glu Gln Ser Phe Leu Ala Ala Lys Glu Val Leu Asn Glu Lys 915 920 925 Gly Leu Asn Ile Lys Leu Tyr Tyr Asn Asp Tyr Asn Asp Asp Asn Gln 930 935 940 Ser Lys Ala Glu Ala Ile Tyr Gln Met Val Lys Asp Ile Asn Glu Lys945 950 955 960Tyr Ala Lys Glu His Asp Gly Asp Leu Leu Ile Asp Gly Ile Gly Met 965 970 975 Gln Ala His Tyr Asn Lys Asn Thr Asn Pro Glu Asn Val Lys Leu Ser 980 985 990 Leu Glu Lys Phe Ile Thr Leu Gly Val Glu Val Ser Val Thr Glu Leu 995 1000 1005 Asp Ile Thr Ala Gly Thr Asn Asn Val Leu Thr Glu Lys Glu Ala Ile 1010 1015 1020 Ala Gln Gly Tyr Leu Tyr Ala Gln Leu Phe Lys Ile Tyr Lys Glu His1025 1030 1035 104CAla Glu His Ile Ser Arg Val Thr Phe Trp Gly Leu Asn Asp Ala Thr

1045 1050 1055

Ser Trp Arg Ala Ala Gln Ser Pro Leu Leu Phe Asp Lys Asp Leu Gln

1060 1065 1070

Ala Lys Pro Ala Tyr Tyr Ala Val Ile Asp Pro Asp Thr Phe Thr Val

1075 1080 1085

Glu Asn Gln Pro Glu Val Arg Glu Ala Asn Gln Gly Ser Ala Val Ser

1090 1095 1100

Gly Thr Pro Val Ile Asp Gly Thr Val Asp Gly Val Trp Ser Asn Ala1105 1110 1115 1120

Thr Glu Leu Pro Ile Asn Arg Phe Gln Met Ala Trp Gln Gly Ala Asn

1125 1130 1135

Gly Val Ser Lys Val Leu Trp Asp Asn Glu Asn Leu Tyr Val Leu Ile1140 1145 H50Gln Val Ser Asp Ser Gln Leu Asp Lys Ser Ser Pro Asn Pro Trp Glu

1155 1160 1165

Gln Asp Ser Ile Glu Val Phe Val Asp Glu Asn Asn Ala Lys Thr Ser1170 1175 1180

Ser Phe Glu Asp Gly Asp Gly Gln Tyr Arg Val Asn Phe Asp Asn Glu1185 1190 1195 1200

Thr Ser Phe Asn Pro Val Arg Val Gly Glu Gly Phe Glu Ser Ala Thr

1205 1210 1215

Lys Ala Ser Gly Asn Gly Tyr Thr Val Glu Val Lys Ile Pro Phe Lys1220 1225 1230

Thr Ile Thr Pro Asp Asn Asn Thr Lys Ile Gly Phe Asp Val Gln Ile

1235 1240 1245

Asn Asp Gly Lys Asp Gly Ala Arg Gln Ser Ala Ala Thr Trp Asn Asp1250 1255 1260

Leu Thr Gly Leu Gly Tyr Gln Asp Thr Ser Val Phe Gly Val Leu Thr1265 1270 1275 1280

Leu Met Lys Thr Asp Thr Thr Ala Pro Val Thr Thr Asp Asn Gly Pro

1285 1290 1295

Glu Asp Trp Val Asn Lys Asp Val Thr Ile Ala Phe Ser Ala Asn Asp1300 1305 1310

Asn Asp Thr Gly Val Ala Ala Thr Tyr Tyr Ser Ile Asp Asn Gly Val

1315 1320 1325

Val Gln Asn Gly Asn Ser Val Thr Ile Ser Glu Glu Gly Val His Ile1330 1335 1340

Leu Thr Tyr Trp Ser Val Asp Lys Ala Gly Asn Val Glu Gln Val His1345 1350 1355 1360

Thr Lys Thr Ile Lys Leu Asp Lys Thr Gly Pro Ile Leu Asp Ile Lys

1365 1370 1375

Leu Asp Lys Thr Thr Leu Ser Pro Val Asn His Lys Met Val Pro Ile1380 1385 1390

Ser Ala Ala Ile Ser Ala Ser Asp Ala Asp Ser Gly Ile His Ser Val

1395 1400 1405

Val Leu Thr Ser Ile Thr Ser Asn Glu Ser Ile Gln Pro Asp Asp Ile1410 1415 1420

Gln Asn Ala Asn Tyr Asn Lys Pro Ile Thr Gly Thr Thr Asp Ser Phe1425 1430 1435 1440

Lys Leu Arg Ala Glu Arg Leu Ala Asn Gly Asn Gly Arg Val Tyr Thr

1445 1450 1455

Ile Thr Tyr Thr Ala Thr Asp Lys Ala Gly Asn Val Thr Thr Lys Ser1460 1465 1470

Val Glu Val Ser Val Pro Arg Asp Asn Ser Lys Lys1475 1480

<210> 75<211> 1122<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 75

atgaaaaagc atattgtact cttcgcattt ctttccgtga ttttgctggc ggcccgatcg 60

tcggcgtcgg agcgatttct caaggacgtc ttttcggatt ccttcaaggt cggcgtagcc 120

ctcaatgccg atcagattac gggggcggac tcggccagcc tcgacttgtc cttggctcac 180

ttcgattctc ttgtcgctga aaatgcgatg aagtgggggt cgctcaatcc tgagccgggg 240

gtttacgatt tccgggtggc tgacgccctg gtcgatttgg cggagcggga aggtttgttt 300

ttggttggcc acacactgct ctggcatcag cagacgccgg actgggtttt tctggacgag 360aagggcgaga ccgccacgcg ggagctggtg ctcgctcgac tggagacgca catccgcacc 420

gtggtcggcc gctaccaggg ccgggtgcag ggctgggatg tggtcaacga agccttgaac 480

gaagacggtt cgttgcggga gtcgaaatgg ttgcagatca tcggcccgga ctacatcgaa 540

ctggcgttcc gcatggcgaa ggaggccgat cccgacgccg agctttatta caatgactac 600

aatgtgtcca agcccggcaa gcgaggtgga gtggtgcgcc tgcttggaga gctgcaggcg 660

aaaggagtta aggtcgatgc ggtcggcatc cagggccact acagtctcgg gcaccctgag 720

ctcgaccagc tcgaggccag catttctgcg ataacggagg ctggggctcc gatcatgata 780

accgagctcg atgtgtcggt cttgcccttt cccgacgcgg agcaaatggg ggcggacgtg 840

tcgctcagct ttgagatgca ggaccacctc aatccctatg ccgatggctt gcccgaggcg 900

gtttcgcagc agctagctga acgttacgcg gccatttttg aagtgttttt gcgccaccag 960agccacatcg accgcgtgac gttttgggga gtgcacgacg gggtcagctg gtggaactat 1020tggccgatcg cgggcaggac cgactatccc ttgctgtttg atcgggagct caagcggaaa 1080gcggccttcg aggcggtggt cgatttagcg gagggccgct ga 1122

<210> 76

<211> 373

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<22 0>

<221> SIGNAL

<222> (1)____(22)

<400> 76

Met Lys Lys His Ile Val Leu Phe Ala Phe Leu Ser Val Ile Leu Leu

15 10 15

Ala Ala Arg Ser Ser Ala Ser Glu Arg Phe Leu Lys Asp Val Phe Ser

20 25 30

Asp Ser Phe Lys Val Gly Val Ala Leu Asn Ala Asp Gln Ile Thr Gly

35 40 45

Ala Asp Ser Ala Ser Leu Asp Leu Ser Leu Ala His Phe Asp Ser Leu

50 55 60 .

Val Ala Glu Asn Ala Met Lys Trp Gly Ser Leu Asn Pro Glu Pro Gly65 70 75 80

Val Tyr Asp Phe Arg Val Ala Asp Ala Leu Val Asp Leu Ala Glu Arg

85 90 95

Glu Gly Leu Phe Leu Val Gly His Thr Leu Leu Trp His Gln Gln Thr

100 105 HO

Pro Asp Trp Val Phe Leu Asp Glu Lys Gly Glu Thr Ala Thr Arg Glu

115 120 125

Leu Val Leu Ala Arg Leu Glu Thr His Ile Arg Thr Val Val Gly Arg

130 135 140

Tyr Gln Gly Arg Val Gln Gly Trp Asp Val Val Asn Glu Ala Leu Asn145 150 155 160

Glu Asp Gly Ser Leu Arg Glu Ser Lys Trp Leu Gln Ile Ile Gly Pro

165 170 175

Asp Tyr Ile Glu Leu Ala Phe Arg Met Ala Lys Glu Ala Asp Pro Asp

180 185 190

Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Val Ser Lys Pro Gly Lys Arg

195 200 205

Gly Gly Val Val Arg Leu Leu Gly Glu Leu Gln Ala Lys Gly Val Lys

210 215 220

Val Asp Ala Val Gly Ile Gln Gly His Tyr Ser Leu Gly His Pro Glu225 230 235 240

Leu Asp Gln Leu Glu Ala Ser Ile Ser Ala Ile Thr Glu Ala Gly Ala

245 250 255

Pro Ile Met Ile Thr Glu Leu Asp Val Ser Val Leu Pro Phe Pro Asp

260 265 270

Ala Glu Gln Met Gly Ala Asp Val Ser Leu Ser Phe Glu Met Gln Asp

275 280 285

His Leu Asn Pro Tyr Ala Asp Gly Leu Pro Glu Ala Val Ser Gln Gln

290 295 300

Leu Ala Glu Arg Tyr Ala Ala Ile Phe Glu Val Phe Leu Arg His Gln305 310 315 320

Ser His Ile Asp Arg Val Thr Phe Trp Gly Val His Asp Gly Val Ser

325 330 335

Trp Trp Asn Tyr Trp Pro Ile Ala Gly Arg Thr Asp Tyr Pro Leu Leu

340 345 350

Phe Asp Arg Glu Leu Lys Arg Lys Ala Ala Phe Glu Ala Val Val Asp

355 360 365

Leu Ala Glu Gly Arg

370<210> 77<211> 1248<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 77

atgctaaaag ttttacgtaa acctatcgtt tctggattag ctctagcctt attattacct

60aaccaggtatccataggtgcagcgccattttagaagggcagaatggacataagatgcaaacgtcaaatctcagtcgtttcacgaatggggcggactatattttatatcaataaaaagtttaaatcggctgggttagacaaatcctacctagtttatttaattgctgataaacgttgtaaccaccatttgtacaaataa

ataggatcga cagttagtgc cgaaacaaat atttcaaataacagcaccac aattggacca acgatataaa gattctttcaccaaatcaat tattagatgc aaaagactca caaatgttaagtagcagaaa atgtcatgaa gcctagcagt ttacagccaggaaccggcag ataaacttgt taagtttgcg aaagaaaatgacgcttgtct ggcatagcca agtaccagat tggttcttcaatggttgttt ggcagaatgg aaagcaagtg gttgcagatcaaaaagcttt tattaagccg tttagaaaca catgttaataaatgatatta aattttggga cgttgtcaat gaagtaatcggaaggtttac gtcaatctcc atggttccta attaccggaatttgagacag caagacaata tgctgctcca gacgctaagcacagaãgtaã caccaaáaag aacgtactta tacaacctagggtgttccaa ttgatggtgt tgggcatcag tctcacattcaaagaaattg aagacacaat taacatgttt gctgaactgggagcttgatg taagcatgta tggctggcca gtaagggcgtccagcacaga aatttataga tcaagcagac cgatatgatcaaattaggcg ataaaatcag caatgtgaca ttctggggaattaaatgacc gtgcagatgt ttactatgat gcagatggaagcaccatatg ctaaaatgga agctagatca ggtaaagatggaatacaatg taaaaccagc ctattgggcg attatcgacc<210> 78<211> 415<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(27)<400> 78

Met Leu Lys Val Leu Arg Lys Pro Ile Val Ser

1 5 10

Leu Leu Leu Pro Ile Gly Ser Thr Val Ser Ala

20 25

Asn Lys Pro Gly Ile Ser Gly Leu Thr Ala Pro

35 40

Tyr Lys Asp Ser Phe Thr Ile Gly Ala Ala Val

50 55

Leu Asp Ala Lys Asp Ser Gln Met Leu Lys Arg65 70 75

Val Ala Glu Asn Val Met Lys Pro Ser Ser Leu Gln Pro

85 90

Gln Phe Asn Trp Glu Pro Ala Asp Lys Leu Val Lys Phe

tagcgggttaagcggttgagtaatagcattgtttaactgggcgcggccattggaaattcatgaggctaactcgttataaacggacatccttaaagtcgcttgattacaataaaacagcaagccgtctgaaccaaattacttgattctattattatatgagccatacatggattggcaaatatttgatcca

Gly Leu

Glu Thr

Gln Leu

45Glu Pro60

His Phe

100

105

Asn Gly Met Asp Met Arg Gly His Thr Leu Val

115 120

Pro Asp Trp Phe Phe Lys Asp Ala Asn Gly Asn

130 135

Gln Asn Gly Lys Gln Val Val Ala Asp Pro Ser145 150 155

Lys Lys Leu Leu Leu Ser Arg Leu Glu Thr His

165 170

Ser Arg Tyr Lys Asn Asp Ile Lys Phe Trp Asp

180 185

Ile Asp Glu Trp Gly Gly His Pro Glu Gly Leu

195 200

Phe Leu Ile Thr Gly Thr Asp Tyr Ile Lys Val

210 215

Arg Gln Tyr Ala Ala Pro Asp Ala Lys Leu Tyr225 230 235

Thr Glu Val Thr Pro Lys Arg Thr Tyr Leu Tyr

245 250

Leu Lys Gln Gln Gly Val Pro Ile Asp Gly Val

260 265

Ile Gln Ile Gly Trp Pro Ser Glu Lys Glu Ile

275 280

Met Phe Ala Glu Leu Gly Leu Asp Asn Gln Ile

Trp His125Ser Met140

Asn Leu

Val Asn

Val Val

Arg Gln205Ala Phe220

Ile Asn

Asn Leu

Gly His

Glu Asp285Thr Glu

Ala Leu Ala15

Asn Ile Ser30

Asp Gln Arg

Asn Gln Leu

Asn Ser Ile80

Val Glu Gly95

Ala Lys Glu110

Ser Gln Val

Val Val Trp

Glu Ala Asn160

Thr Val Val

175Asn Glu Val190

Ser Pro Trp

Glu Thr Ala

Asp Tyr Asn240

Val Lys Ser

255Gln Ser His270

Thr Ile AsnLeu Asp Val

12018024030036042048054060066072078084090096010201080114012001248290 295 300

Ser Met Tyr Gly Trp Pro Val Arg Ala Tyr Pro Thr Tyr Asp Ser Ile305 310 315 320Pro Ala Gln Lys Phe Ile Asp Gln Ala Asp Arg Tyr Asp Arg Leu Phe 325 330 335 Lys Leu Tyr Glu Lys Leu Gly Asp Lys Ile Ser Asn Val Thr Phe Trp 340 345 350 Gly Ile Ala Asp Asn His Thr Trp Leu Asn Asp Arg Ala Asp Val Tyr 355 360 365 Tyr Asp 370 Ala Asp Gly Asn Val 375 Val Thr Leu Ala Asn 380 Ala Pro Tyr AlaLys Met Glu Ala Arg Ser Gly Lys Asp Ala Pro Phe Val Phe Asp Pro385 390 395 400Glu Tyr Asn Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys 405 410 415 <210> 79 <211> 1293

<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 79

atgattggtc tggatttgat ttctggtggt cgtcgcaagg cctgtctggc tgcctgtctggcgcttgccg cgctgtcatt gccggtatcg gctcaaatgg ctgcggggaa ggaaaagttcgtgggtaacg tgatcgctgg ttatgtgccc ggtgattacg gcaatctctg gaatcaggtgacgccggaga attccaccaa gtggggagcg gttgagtcta cgcgtaatgt catgaactggacgcaggctg atctggccta caactacgcc aagtccaagg gcttcaagtt caagatgcacacgctggtat ggggctcgca agagccggcc tgggtcaaga atctggatgc gacttcccagcgtgtcgagg tcgaacagtg gatgcgtctg agctgcgaac gctaccccga ttcctgggctatcgatgtgg tgaatgaacc cctgcatgcc gtgccctcgt acaagaacgc actgggtggcgatggtgcca ccggctggga ttgggtcatc acctcgttcc gtctggcgcg tcagtactgtccgcgcgcca agctgctgct caatgagtac gccaccgagc tggatgccag caagcgcgccaagatcaaga ccattgcctc gctgctcaag agtcgcggtc tgattgatgg tgttggcctgcaggcccatt tcttcacgct ggattacatg aatgccagcc agatgaaggc ggcactggatgattacgcca cgctgggtgt ggatatctac atttccgagc tggatctgaa gggcagtgccaataccgacg ccagccagaa ggcgaagtac gaagagctgt tcccggtgat gtggaatcacgccagcgtga agggcatcac cctgtggggc tacaãggtgg gtgaaacctg gtcgagcggcaccggcctgc tgaatgcgaa cggtagcgag cgtccggccc tgacctggct gaaaagctatatgagcagcc gtcctgcagc atcgagcagc agttcttcga gtgtttcatc cagcaaatccagttcgtctt cttctagcca gtccagtgcc tccagcagtg caggcagtgc gccggtcttgtccggcacca gtgattaccc gagcggtttc agcaagtgtg ccgatctggg cggcacttgcagcgtgtctt ccggcaccgg ctgggcggcc ttcgggcgca agggtaagtg ggttgccaaatacgtcggtg tgggcaagag cattccctgc acggtggcgg cgtttggtcg tgacccggggggcaatccca acaagtgttc cttccagagg taa<210> 80<211> 430<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(36)<400> 80

Met Ile Gly Leu Asp Leu Ile Ser Gly Gly Arg Arg Lys Ala Cys Leu1 5 10 15 Ala Ala Cys Leu Ala Leu Ala Ala Leu Ser Leu Pro Val Ser Ala Gln 20 25 30 Met Ala Ala 35 Gly Lys Glu Lys Phe 40 Val Gly Asn Val Ile 45 Ala Gly TyrVal Pro Gly Asp Tyr Gly Asn Leu Trp Asn Gln Val Thr Pro Glu Asn 50 55 60 Ser Thr Lys Trp Gly Ala Val Glu Ser Thr Arg Asn Val Met Asn Trp65 70 75 80Thr Gln Ala Asp Leu Ala Tyr Asn Tyr Ala Lys Ser Lys Gly Phe Lys 85 90 95 Phe Lys Met His Thr Leu Val Trp Gly Ser Gln Glu Pro Ala Trp ValLys Asn Leu Asp Ala Thr Ser Gln Arg Val Glu Val Glu Gln Trp Met

115 120 125

Arg Leu Ser Cys Glu Arg Tyr Pro Asp Ser Trp Ala Ile Asp Val Val

130 135 140

Asn Glu Pro Leu His Ala Val Pro Ser Tyr Lys Asn Ala Leu Gly Gly

145 150 155 160

Asp Gly Ala Thr Gly Trp Asp Trp Val Ile Thr Ser Phe Arg Leu Ala

165 170 175

Arg Gln Tyr Cys Pro Arg Ala Lys Leu Leu Leu Asn Glu Tyr Ala Thr

180 185 190

Glu Leu Asp Ala Ser Lys Arg Ala Lys Ile Lys Thr Ile Ala Ser Leu

195 200 205

Leu Lys Ser Arg Gly Leu Ile Asp Gly Val Gly Leu Gln Ala His Phe

210 215 220

Phe Thr Leu Asp Tyr Met Asn Ala Ser Gln Met Lys Ala Ala Leu Asp225 230 235 240

Asp Tyr Ala Thr Leu Gly Val Asp Ile Tyr Ile Ser Glu Leu Asp Leu

Leu Phe Pro Val Met Trp Asn His Ala Ser Val Lys Gly Ile Thr Leu

275 280 285

Trp Gly Tyr Lys Val Gly Glu Thr Trp Ser Ser Gly Thr Gly Leu Leu

290 295 300

Asn Ala Asn Gly Ser Glu Arg Pro Ala Leu Thr Trp Leu Lys Ser Tyr

305 310 315 320

Met Ser Ser Arg Pro Ala Ala Ser Ser Ser Ser Ser Ser Ser Val Ser

325 330 335

Ser Ser Lys Ser Ser Ser Ser Ser Ser Ser Gln Ser Ser Ala Ser Ser

340 345 350

Ser Ala Gly Ser Ala Pro Val Leu Ser Gly Thr Ser Asp Tyr Pro Ser

355 360 365

Gly Phe Ser Lys Cys Ala Asp Leu Gly Gly Thr Cys Ser Val Ser Ser

370 375 380

Gly Thr Gly Trp Ala Ala Phe Gly Arg Lys Gly Lys Trp Val Ala Lys

385 390 395 400

Tyr Val Gly Val Gly Lys Ser Ile Pro Cys Thr Val Ala Ala Phe Gly

<210> 81<211> 1017<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 81

ttgaccacga gagctattcg cacggaggca gcgctgaagg agatgtttgc ggaggacttt 60

cagatcggag ccgctgttaa tccgatgact atacggacac aggaggagct gcttgcttat 120

cacttcaaca gtattacggc agagaatgaa atgaagtttg ccagtctgca gccggaggag 180

ggggcttatg cttttgacga ggcggatcga ttggcggcct tcgcccggaa gcatggcatg 240

gcgatgcggg gacacacttt agtgtggcat aaccagtcca caggctggct gttcgaagac 300

aagcagggaa atcctgtaga taaggcaact ctgctggaga ggctgaaatc gcacatccat 360

acggtagtag gacgttataa aaacgatatt tatgcttggg atgtggtaaa cgaggttata 42 0gaggacgagg gagacggcct gctgcgccgg tcgaaatggc tggatattgc cggaccggaa 480

ttcattgccc gggcgttcga gtatgctcat gaggctgacc ctaatgcgct gctcttctat 540

aatgactaca acgagtccaa tccggcgaag cgagacaaga tccatgctct ggtgaagtcg 600

ctgctggagc aaggcgtgcc tattcatggc attggactgc aggcgcattg gaatttgtat 660

ggtccttctc tcggcgagat ccgagcggca ctggagaagt atgcttctct tggcctgcag 720ctgcagctta cggagctgga tatgtcgctg tttcgttttg acgacaagcg tacggatata 780

accgagcctc cggcggaatt gcttgagctg caggctgagc ggtatgagga aattttcaag 840

ctgctgaggg aataccggga tgtaatcact tccgtgacct tctggggggc tgcggatgat 900

tatacgtggc tgaacgattt tcccgtccgg gggcggaaaa attggccttt cctgttcgat 960

gagcagcatc accccaaact ggcatttcat cgggtcgctg cactttcccg ccagtga 1Ó17

<210> 82<211> 338<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 82

Leu Thr Thr Arg Ala Ile Arg Thr Glu Ala Ala Leu Lys Glu Met Phe1 5 10 15 Ala Glu Asp Phe 20 Gln Ile Gly Ala Ala 25 Val Asn Pro Met Thr 30 Ile ArgThr Gln Glu 35 Glu Leu Leu Ala Tyr 40 His Phe Asn Ser Ile 45 Thr Ala GluAsn Glu 50 Met Lys Phe Ala Ser 55 Leu Gln Pro Glu Glu 60 Gly Ala Tyr AlaPhe Asp Glu Ala Asp Arg Leu Ala Ala Phe Ala Arg Lys His Gly Met65 70 75 80Ala Met Arg Gly His 85 Thr Leu Val Trp His 90 Asn Gln Ser Thr Gly 95 TrpLeu Phe Glu Asp 100 Lys Gln Gly Asn Pro 105 Val Asp Lys Ala Thr 110 Leu LeuGlu Arg Leu Lys Ser His Ile His Thr Val Val Gly Arg Tyr Lys Asn 115 120 125 Asp Ile 130 Tyr Ala Trp Asp Val 135 Val Asn Glu Val Ile 140 Glu Asp Glu GlyAsp Gly Leu Leu Arg Arg Ser Lys Trp Leu Asp Ile Ala Gly Pro Glu145 150 155 160Phe Ile Ala Arg Ala 165 Phe Glu Tyr Ala His 170 Glu Ala Asp Pro Asn 175 AlaLeu Leu Phe Tyr 180 Asn Asp Tyr Asn Glu 185 Ser Asn Pro Ala Lys 190 Arg AspLys Ile His Ala Leu Val Lys Ser Leu Leu Glu Gln Gly Val Pro Ile 195 200 205 His Gly 210 Ile Gly Leu Gln Ala 215 His Trp Asn Leu Tyr 220 Gly Pro Ser LeuGly Glu Ile Arg Ala Ala Leu Glu Lys Tyr Ala Ser Leu Gly Leu Gln225 230 235 240Leu Gln Leu Thr Glu 245 Leu Asp Met Ser Leu 250 Phe Arg Phe ASp Asp 255 LysArg Thr Asp Ile Thr Glu Pro Pro Ala Glu Leu Leu Glu Leu Gln Ala 260 265 270 Glu Arg Tyr 275 Glu Glu Ile Phe Lys 280 Leu Leu Arg Glu Tyr 285 Arg Asp ValIle Thr 290 Ser Val Thr Phe Trp 295 Gly Ala Ala Asp Asp 300 Tyr Thr Trp LeuAsn Asp Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Phe Leu Phe Asp305 310 315 320Glu Gln His His Pro 325 Lys Leu Ala Phe His 330 Arg Val Ala Ala Leu 335 Ser

Arg Gln<210> 83<211> 3024<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 83atgaaaaccattcagcgcaatcgggccggtaccattgccaaccgagccgagtgcagaatgtggatgagcagtgatggcccgaggacggcagccttccggaatcgaagccttcccgcggcg

aaaggtctat attcaggttg tctatcctggtcaccttgac agccagcgcc gccgacacgcacttcggcac ggcgatagct gccggcaagcaccgtgagtt caacatgatc acggctgagaaccagaacca attcaacttc accaacgccgggaagcaggt gcgcgggcac acgctggcatgcatgagcgg caccgcgctg cgcaatgcgaactacaaggg caggatctac gcctgggatggccgccgcaa ctcgaacctg cagcagaccgcagcccgcac cgccgacccg gccgccaagcggagctatgc caagacgcag ggcgtttacctgccgatcga ctgtgtcggg ttccagagcc

ttgtcctggc tgtgctgctg 60tcggcgcggc ggcggcccag 120tcggcgactc gacctacacg 180atgagatgaa gatcgacgcc 240accggatctt caactgggcg 300ggcactcgca gcagccgggg 360tgatcaacca catcaatggg 420tggtgaacga ggctttcaac 480gcaacgactg gatcgaggtg 540tgtgctacaa cgactacaac 600ggatggtcca ggacttcaag 660acttcaacag cggcacttcc 720tacgtcaaca gcaacttccg gacgacgctg caaagcttcg ccgcgctggg cgtggacgtgcagatcaccg agctggatgt cgagaatgcc gactcgcggc tcgattggtg gagaggcatcgtcaatgact gcctggcggt cccgcgctgc aacggcatca cggtgtgggg cgtgcgcgacagcgattcgt ggcgctcttc gcagaacccg ctgctgttca actccagcgg tggtaagaaggcttcgtaca ccgccgtcct cgacgccctc aacgctgccc cgaccgtcac acctccggtaacgacacctc cggtgacgac accgccagtg accacgcctc ctcccggcac tgtgtcgattaacgcgggcg gctcggcgag cggcagcttc acggccgacc agtacttcag cggtggcagcacctacacca acaccgccac catcgacatg agtcagatca ccagcaaccc accgccggcggcggtcttca acagcgagcg ttacggggcg atgacctaca ccatccccaa ccgctcgggtgctcagacgg tgacgctgta ctttgccgag acctacctca ccgcggcagg gcagcggtcgttcaacgtgt cgattaatgg cgcagcggcg ctgtccaact tcgacatcta tgcctcggcaggtggcgcta accgggccat cgcccggacg ttcagcacca cggctaactc aagtggccaggtggtgatcc agttcacggc ggttaccgag aaccccaaga tcaacgctat cacggtaacagcgggtggca cgcctccacc gacaacgcct ccgcccacca cgccgccacc gaccacccctccggtgacga cacccccagt gacgacaccc ccagtgacga caccgccccc cggcagcgtgtcgatcaacg cgggcggctc ggccaccggc agcttcacgg gcgaccagta ctttagcggtggcagcacct acaccaacac cgccaccatc gacatgagcc agatcaccag caacccaccaccggcggcgg tgttcaacag cgagcgctac ggggcgatga cctacaccat ccccggccgctcgggggctc agacggtcac gctttacttt gccgaaacgt atgtcactgc ggcagggcagcgcgtcttta acgtgtctgt aaacggcgcg gcagcgctgt ccaacttcga catctatgccagcgccggcg gccagaaccg ggccatcgct cgctccttca acaccacggc caactcaagcggccaggtgg tgatccagtt cacggcggtc accgagaacc ccaagatcaa cgccatcactgtggcgggcg ggatcgggga cttccaaacc ctgaccgtca cgaagtccgg cacggggacggtcacctcca acccggctgg tatcaactgc ggctcgacct gcaacgccag cttcgctaccggcaccagcg tgaccctgac cgcctccggc gggaccttca ccggctggag cggagcctgctccggcacct ccaccacctg caccgtctcc atgacccagg cccggtcggt caccgctacttttagcggcg gtggtgacac caggccgagc gcggggtgtg gtaagaaccg gacactgcagaatggcacaa tcaccatttc aagtggcggc gtcaaccgca cctacatcct acgcacgcctgacaactaca acaacacgca tgcataccgg ctgatcatgg cttatcactg gcttaacggcagcgcgcaga atgtggcgag cgagaactac taccggctgt tcccactctc caacaacagcaccatcttcg tggcgcctca ggggctggat gccggatggg ctaacaccaa caaccgcgacctgaacctca ccgatgccat actcacccag gtcgagaacg atctgtgcgt cgacttgaaccgggtctggg ccaccgggtt cagctacggc gcaggtatgt catacgccat cgcctgtgccagggccaatg tgttccgggg cgtcgctctc tatgccggcg cgcagctcag cggttgcaccggtggaacca cggccattgc gtacttcgca acgcacggca tcaacgacag tgtcctcaacatctcgcaag ggcggactct acgcgaccgc tttgtctcga acaacagctg cacggcgcagaaccctcccg agccttcctc gggcagcggg acgcacatct gcacgtccta ccagaactgctcggcaggac atcctgtccg gtggtgcgcg ttcgacggcg accacacccc gaatcagaccgaccgcggcc agagcacaag ctaa

<210> 84

<211> 1007<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(30)<400> 84

Met Lys Thr Lys Arg Ser Ile Phe Arg Leu Ser Ile Leu Val Val Leu1 5 10 15

Ala Val Leu Leu Phe Ser Ala Ile Thr Leu Thr Ala Ser Ala Ala Asp

20 25 30

Thr Leu Gly Ala Ala Ala Ala Gln Ser Gly Arg Tyr Phe Gly Thr Ala35 40 45

Ile Ala Ala Gly Lys Leu Gly Asp Ser Thr Tyr Thr Thr Ile Ala Asn

50 55 60

Arg Glu Phe Asn Met Ile Thr Ala Glu Asn Glu Met Lys Ilé Asp Ala65 70 75 80

Thr Glu Pro Asn Gln Asn Gln Phe Asn Phe Thr Asn Ala Asp Arg Ile

85 90 95

Phe Asn Trp Ala Val Gln Asn Gly Lys Gln Val Arg Gly His Thr Leu

100 105 HO

Ala Trp His Ser Gln Gln Pro Gly Trp Met Ser Ser Met Ser Gly Thr115 120 125

Ala Leu Arg Asn Ala Met Ile Asn His Ile Asn Gly Val Met Ala His130 135 140

78084090096010201080114012001260132013801440150015601620168017401800186019201980204021002160222022802340240024602520258026402700276028202880294030003024Tyr Lys Gly Arg Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Phe Asn145 150 155 160Glu Asp Gly Ser Arg Arg Asn Ser Asn Leu Gln Gln Thr Gly Asn Asp 165 170 175 Trp Ile Glu Val Ala Phe Arg Thr Ala Arg Thr Ala Asp Pro Ala Ala 180 185 190 Lys Leu Cys Tyr Asn Asp Tyr Asn Ile Glu Ala Trp Ser Tyr Ala Lys 195 200 205 Thr Gln Gly Val Tyr Arg Met Val Gln Asp Phe Lys Ser Arg Gly Val 210 215 220 Pro Ile Asp Cys Val Gly Phe Gln Ser His Phe Asn Ser Gly Thr Ser225 230 235 240Tyr Val Asn Ser Asn Phe Arg Thr Thr Leu Gln Ser Phe Ala Ala Leu 245 250 255 Gly Val Asp Val Gln Ile Thr Glu Leu Asp Val Glu Asn Ala Asp Ser 260 265 270 Arg Leu Asp Trp Trp Arg Gly Ile Val Asn Asp Cys Leu Ala Val Pro 275 280 285 Arg Cys Asn Gly Ile Thr Val Trp Gly Val Arg Asp Ser Asp Ser Trp 290 295 300 Arg Ser Ser Gln Asn Pro Leu Leu Phe Asn Ser Ser Gly Gly Lys Lys305 310 315 320Ala Ser Tyr Thr Ala Val Leu Asp Ala Leu Asn Ala Ala Pro Thr Val 325 330 335 Thr Pro Pro Val Thr Thr Pro Pro Val Thr Thr Pro Pro Val Thr Thr 340 345 350 Pro Pro Pro Gly Thr Val Ser Ile Asn Ala Gly Gly Ser Ala Ser Gly 355 360 365 Ser Phe Thr Ala Asp Gln Tyr Phe Ser Gly Gly Ser Thr Tyr Thr Asn 370 375 380 Thr Ala Thr Ile Asp Met Ser Gln Ile Thr Ser Asn Pro Pro Pro Ala385 390 395 400Ala Val Phe Asn Ser Glu Arg Tyr Gly Ala Met Thr Tyr Thr Ile Pro 405 410 415 Asn Arg Ser Gly Ala Gln Thr Val Thr Leu Tyr Phe Ala Glu Thr Tyr 420 425 430 Leu Thr Ala Ala Gly Gln Arg Ser Phe Asn Val Ser Ile Asn Gly Ala 435 440 445 Ala Ala Leu Ser Asn Phe Asp Ile Tyr Ala Ser Ala Gly Gly Ala Asn 450 455 460 Arg Ala Ile Ala Arg Thr Phe Ser Thr Thr Ala Asn Ser Ser Gly Gln 465 470 475 480Val Val Ile Gln Phe Thr Ala Val Thr Glu Asn Pro Lys Ile Asn Ala 485 490 495 Ile Thr Val Thr Ala Gly Gly Thr Pro Pro Pro Thr Thr Pro Pro Pro 500 505 510 Thr Thr Pro Pro Pro Thr Thr Pro Pro Val Thr Thr Pro Pro Val Thr 515 520 525 Thr Pro Pro Val Thr Thr Pro Pro Pro Gly Ser Val Ser Ile Asn Ala 530 535 540 Gly Gly Ser Ala Thr Gly Ser Phe Thr Gly Asp Gln Tyr Phe Ser Gly545 550 555 560Gly Ser Thr Tyr Thr Asn Thr Ala Thr Ile Asp Met Ser Gln Ile Thr 565 570 575 Ser Asn Pro Pro Pro Ala Ala Val Phe Asn Ser Glu Arg Tyr Gly Ala 580 585 590 Met Thr Tyr Thr Ile Pro Gly Arg Ser Gly Ala Gln Thr Val Thr Leu 595 600 605 Tyr Phe Ala Glu Thr Tyr Val Thr Ala Ala Gly Gln Arg Val Phe Asn 610 615 620 Val Ser Val Asn Gly Ala Ala Ala Leu Ser Asn Phe Asp Ile Tyr Ala625 630 635 640Ser Ala Gly Gly Gln Asn Arg Ala Ile Ala Arg Ser Phe Asn Thr Thr 645 650 655 Ala Asn Ser Ser Gly Gln Val Val Ile Gln Phe Thr Ala Val Thx Glu 660 665 670 Asn Pro Lys Ile Asn Ala Ile Thr Val Ala Gly Gly Ile Gly Asp Phe675 680 685 Gln Thr Leu Thr Val Thr Lys Ser Gly Thr Gly Thr Val Thr Ser Asn 690 695 700 Pro Ala Gly Ile Asn Cys Gly Ser Thr Cys Asn Ala Ser Phe Ala Thr 705 710 715 720 Gly Thr Ser Val Thr Leu Thr Ala Ser Gly Gly Thr Phe Thr Gly Trp 725 730 735 Ser Gly Ala Cys 740 Ser Gly Thr Ser Thr 745 Thr Cys Thr Val Ser 750 Met Thr Gln Ala Arg Ser Val Thr Ala Thr Phe Ser Gly Gly Gly Asp Thr Arg 755 760 765 Pro Ser Ala Gly Cys Gly Lys Asn Arg Thr Leu Gln Asn Gly Thr Ile 770 775 780 Thr Ile Ser Ser Gly Gly Val Asn Arg Thr Tyr Ile Leu Arg Thr Pro 785 790 795 800 Asp Asn Tyr Asn Asn 805 Thr His Ala Tyr Arg 810 Leu Ile Met Ala Tyr 815 His Trp Leu Asn Gly 820 Ser Ala Gln Asn Val 825 Ala Ser Glu Asn Tyr 830 Tyr Arg Leu Phe Pro 835 Leu Ser Asn Asn Ser 840 Thr Ile Phe Vál Ala 845 Pro Gln Gly Leu Asp 850 Ala Gly Trp Ala Asn 855 Thr Asn Asn Arg Asp 860 Leu Asn Leu Thr Asp Ala Ile Leu Thr Gln Val Glu Asn Asp Leu Cys Val Asp Leu Asn 865 870 875 880 Arg Val Trp Ala Thr Gly Phe Ser Tyr Gly Ala Gly Met Ser Tyr Ala 885 890 895 Ile Ala Cys Ala Arg Ala Asn Val Phe Arg Gly Val Ala Leu Tyr Ala 900 905 910 Gly Ala Gln Leu Ser Gly Cys Thr Gly Gly Thr Thr Ala Ile Ala Tyr 915 920 925 Phe Ala 930 Thr His Gly Ile Asn 935 Asp Ser Val Leu Asn 940 Ile Ser Gln Gly Arg Thr Leu Arg Asp Arg Phe Val Ser Asn Asn Ser Cys Thr Ala Gln 945 950 955 960 Asn Pro Pro Glu Pro 965 Ser Ser Gly Ser Gly 970 Thr His Ile Cys Thr 975 Ser Tyr Gln Asn Cys 980 Ser Ala Gly His Pro 985 Val Arg Trp Cys Ala 990 Phe Asp Gly Asp His Thr Pro Asn Gln Thr Asp Arg Gly Gln Ser Thr Ser 995 1000 1005

<210> 85<211> 1254<212> DNA<213> Bactéria<400> 85

atgaccttga ttacgccaag ctcgaaatta accctcacta aagggaácaa aagctggagc 60

tcgcgcgcct gcaggtcgac actagtggat ctcacacttt acttcgagtc tcagaatccg 120

accctcgagt tctacgtgga cgatgtgaag gtagtggaca ccacctctgc tgagataaaa 180

ctcgagatga atccagaaga ggaaatacca gccctcaggg aagttctgaa agactacttc 240

agagtgggcg ttgctcttcc atccaaggta ttcatcaacc agaaggactt aacgctcatc 300

accaagcact tcaacagcat caccgcagaa aatgagatga aacctgatag tctgcttgca 360

ggcattgaga atggcaaact caagttcaga tttgaaacag cagacaaata catcgaattt 420

gcacagcaaa acggcatggt tgtgaggggc cacacactgg tatggcacaa tcagacgccc 480

gagtggttct tcaaagacga aaatggaaac ctcctctcca aagaagcgat gacagaaaga 540

ctcagagaat acatacacac cgtcgttgga cacttcaaag ggaaggtcta cgcatgggac 600

gttgtgaacg aagcggtcga tccgaaccag ccagatggac tgágaagatc cacctggtat 660

cagatcatgg ggcctgacta catagaactt gccttcaagt ttgcaaggga ggcagatccc 720

gatgcgaaac tcttctacaa cgactacaac accttcgaac ccaaaaagag agacatcatc 780

tacaaccttg tgaagagtct caaggaaaag ggtctcatcg atggaatcgg tatgcagtgt 840

cacatcagtc ttgcaacgga catcaggcag atcgaagagg ccatcaaaaa gttcagctcc 900

atccctggta tagaaatcca cataacagag ctcgatatga gcgtctacag agattctact 960

tccaactacc cagaggcacc gaggaacgca ctcattgaac aggctcacaa gatggctcaa 1020

ctctttgaaa tcttcaagaa atacagtaat gtgatcacaa acgtcacgtt ctggggtctc 1080

aaagacgact actcctggag agcaacaaga agaaatgact ggacattgat ctttgacaaa 1140

gattatcagg caaaactcgc ttactgggcg attgtcgctc ctgaagtgct accacctctt 1200

tcaaaagaaa gcaagatcca aagaattcaa aaagcttctc gagagtactt ctag 1254<210> 86<211> 417<212> PRT<213> Bactéria<400> 86

Met Thr Leu Ile Thr Pro Ser Ser Lys Leu Thr Leu Thr Lys Gly Asn15 10 15

Lys Ser Trp Ser Ser Arg Ala Cys Arg Ser Thr Leu Val Asp Leu Thr 20 25 30 Leu Tyr Phe Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Val Asp Asp 35 40 45 Val Lys Val Val Asp Thr Thr Ser Ala Glu Ile Lys Leu Glu Met Asn 50 55 60 Pro Glu Glu Glu Ile Pro Ala Leu Arg Glu Val Leu Lys Asp Tyr Phe65 70 75 80Arg Val Gly Val Ala Leu Pro Ser Lys Val Phe Ile Asn Gln Lys Asp 85 90 95 Leu Thr Leu Ile Thr Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu 100 105 110 Met Lys Pro Asp Ser Leu Leu Ala Gly Ile Glu Asn Gly Lys Leu Lys 115 120 125 Phe Arg Phe Glu Thr Ala Asp Lys Tyr Ile Glu Phe Ala Gln Gln Asn 130 135 140 Gly Met Val Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro145 150 155 160Glu Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser Lys Glu Ala 165 170 175 Met Thr Glu Arg Leu Arg Glu Tyr Ile His Thr Val Val Gly His Phe 180 185 190 Lys Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala Val Asp Pro 195 200 205 Asn Gln Pro Asp Gly Leu Arg Arg Ser Thr Trp Tyr Gln Ile Met Gly 210 215 220 Pro Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro225 230 235 240Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Phe Glu Pro Lys Lys 245 250 255 Arg Asp Ile Ile Tyr Asn Leu Val Lys Ser Leu Lys Glu Lys Gly Leu 260 265 270 Ile Asp Gly Ile Gly Met Gln Cys His Ile Ser Leu Ala Thr Asp Ile 275 280 285 Arg Gln Ile Glu Glu Ala Ile Lys Lys Phe Ser Ser Ile Pro Gly Ile 290 295 300 Glu Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Thr305 310 315 320Ser Asn Tyr Pro Glu Ala Pro Arg Asn Ala Leu Ile Glu Gln Ala His 325 330 335 Lys Met Ala Gln Leu Phe Glu Ile Phe Lys Lys Tyr Ser Asn Val Ile 340 345 350 Thr Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala 355 360 365 Thr Arg Arg Asn Asp Trp Thr Leu Ile Phe Asp Lys Asp Tyr Gln Ala 370 375 380 Lys Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu385 390 395 400Ser Lys Glu Ser Lys Ile Gln Arg Ile Gln Lys Ala Ser Arg Glu Tyr 405 410 415 Phe <210> 87 <211> 1089

<212> DNA

<213> Desconhecido

<22 0>

<223> Obtido para uma amostra ambiental<400> 87

ttgaagaaca gaattaaaaa ggttgtgggc gggctcgccc tggcgagtgt tctgctcacctcggtaatgg caggcaatgc cagcgcagca attaccaatg gatcgaagtt cctggggaatatcattgccg gcagtgctcc aagtaacttc accacctact ggaatcaggt caccccggagaacggcacca aatggggttc catcgaaggc aaccgcaacc agatgaactg gggaaacgcggacatgatct ataactacgc catcagcaaa aacatcccgt tcaaattcca tactctcgtctggggaagcc aggagcccaa ctgggtggcc ggcttgtcgg cagcggagca gaaggcggaaatcagctcat tcattactca agcaggacag cgttattccg cgaagacagc ttttgtggatgtagtcaatg aaccgctgca tgccaagcct tcgtaccgca atgccatcgg cggcgatggcagcaccggct gggattgggt gatctggtct ttccagcaag cccgggccgc cttcccgaacgccaagctgc acctcaatga ctacggcatt atcggtgacc ccagcgcggc cgataaatatgtgaacatta tcaatatcct gaaatccaga ggactgatcg atggtattgg tattcagtgccactacttca atatggataa cgtaagtgtg agcaccatga atactgtact gggtaagcttgctgcaacag gcctgccaat ctatgtctcc gagctggata ttaccggtga tgacaacacccagcttgcca gataccaaca gaaattccct gtgctctgga accatccttc cgtgaagggcgtcaccctgt ggggctacat ccaaaatcag acctgggcat caggcaccca tctggtgaattccaacggca cagagcgccc tgccctgaag tggctgaagc aatacctggg cggctcgtcagctctgatgg aaaccacaga cgcccaagac ctcactatca ctgacagtct gatccagccggacagtgtgg ttgagccgga ccctcaactg gatctccagc cggtgcttga gcccgttccggctgagtaa<210> 88<211> 362<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(29)

<400> 88 Leu Lys Asn Arg Ile Lys Lys Val Val Gly Gly Leu Ala Leu Ala Ser1 5 10 15 Val Leu Leu Thr Ser Val Met Ala Gly Asn Ala Ser Ala Ala Ile Thr 20 25 30 Asn Gly Ser Lys Phe Leu Gly Asn Ile Ile Ala Gly Ser Ala Pro Ser 35 40 45 Asn Phe Thr Thr Tyr Trp Asn Gln Val Thr Pro Glu Asn Gly Thr Lys 50 55 60 Trp Gly Ser Ile Glu Gly Asn Arg Asn Gln Met Asn Trp Gly Asn Ala65 70 75 80Asp Met Ile Tyr Asn Tyr Ala Ile Ser Lys Asn Ile Pro Phe Lys Phe 85 90 95 His Thr Leu Val Trp Gly Ser Gln Glu Pro Asn Trp Val Ala Gly Leu 100 105 110 Ser Ala Ala Glu Gln Lys Ala Glu Ile Ser Ser Phe Ile Thr Gln Ala 115 120 125 Gly Gln Arg Tyr Ser Ala Lys Thr Ala Phe Val Asp Val Val Asn Glu 130 135 140 Pro Leu His Ala Lys Pro Ser Tyr Arg Asn Ala Ile Gly Gly Asp Gly145 150 155 160Ser Thr Gly Trp Asp Trp Val Ile Trp Ser Phe Gln Gln Ala Arg Ala 165 170 175 Ala Phe Pro Asn Ala Lys Leu His Leu Asn Asp Tyr Gly Ile Ile Gly 180 185 190 Asp Pro Ser Ala Ala Asp Lys Tyr Val Asn Ile Ile Asn Ile Leu Lys 195 200 205 Ser Arg Gly Leu Ile Asp Gly Ile Gly Ile Gln Cys His Tyr Phe Asn 210 215 220 Met Asp Asn Val Ser Val Ser Thr Met Asn Thr Val Leu Gly Lys Leu225 230 235 240Ala Ala Thr Gly Leu Pro Ile Tyr Val Ser Glu Leu Asp Ile Thr Gly 245 250 255 Asp Asp Asn Thr Gln Leu Ala Arg Tyr Gln Gln Lys Phe Pro Val Leu 260 265 270 Trp Asn His Pro Ser Val Lys Gly Val Thr Leu Trp Gly Tyr Ile Gln 275 280 285 Asn Gln Thr Trp Ala Ser Gly Thr His Leu Val Asn Ser Asn Gly Thr 290 295 300 Glu Arg Pro Ala Leu Lys Trp Leu Lys Gln Tyr Leu Gly Gly Ser Ser305 310 315 320Ala Leu Met Glu Thr Thr Asp Ala Gln Asp Leu

325 330

Leu Ile Gln Pro Asp Ser Val Val Glu Pro Asp

340 345

Gln Pro Val Leu Glu Pro Val Pro Ala Glu355 360

<210> 89<211> 2541<212> DNA<213> Bactéria<400> 89

atggatacat tgtteaatac aaccgatgag cgtggggcgtgcggcgcttg cggccgcagc catgctggtg ccgctggcgtgccgaccccg actatccggg cggcatcaag ggcgaatacaggtgtcgcca tcgagacata caccctcaac caggacaaggttcgaccaga tcaccccgga gaactcgctg aagccggaagaatttccgca tgtcggatga cgcgcggaac ctgctgacgtaaggtctacg gccatgttct ggtctggcac tcgcagacgcgacgaatggt gccatgacac caacgacaac cccggcgtcaaaggccacga tgcaggaacg ccagcgcagg cacatcgagagacgaattcg gaaaattcgg cagcccgacc aatcccgtcggagaccgtga acgacagcga cgaccccgcc accaacggcacagacctatg ggggcgagga ctacatctat gacgcgttccaacgacgtct acgccgccga cgacgcggag catccggtgaggcaccgagc aggcgggcaa gcgttcccgc tacaaggcgccagggggttc cctttgacgg catcggtcac cagttccatgtcgaatctcg acgacgcgct gaccgatatg tcctcgctcggaactggacg tcgccaccgg aacgccggtt acggaggcgatactactacg acgtcaacca gatcatccac aggcacgccggtgtgggggc tgagcgacga ccagtcctgg cgcaacaagggacgacaacc tggagaagaa gccggcgtac atcggctacacccgagccgt tgaagagcat gaacgcattc aaggatgacgcttcccggta ccgtggccga gtccggcgcg tcctctccgtgagatgaccc cgtctgcgta tgacgccgtt tccggctcgtggctctctgg tcgtctacgc ggatgtcgcc gatgccagcgaccgtgcgtg tgggtgacgc cgagtatacg atcggccgcaggtgtgcagg ccaacgtcgt ttcgtctgat gccggatacgtacaccggtg cagagaagga catcgtcgag atgaacgtcaacggagacca gcgcgtggag cacgaacgac actggcgccgagctacacgg aagccgtgaa ggttcccgcc gacgcccaggccgtcggatt ccgtctgggc ggaagccaac gaggttcccgacgccttccc ccgaggcgac cgctaccgcc aagaccctgtgtcctcatgg aagtgaccga cgcggacatc gatctgaccagactccgttg aggtgtacat cgaccgtggc aacaccaagaatccagcaga ttcgcgtgtc cgccgatggt gcggagctgagaggatgtcc agaagtccat ggtccagacc gccggcaagcgtcgagatgg ccatcgatct gggaacggct gaggccggcacagatcaacg acgcgaagaa cggtgctcga atcggcatccggtgccggct atcagacggc gtcccattgg ggcgtgctgcgaaaccgaga ccccgggtgg agaagatccc gagacccccggaggataccg agaagcctgg cgacgaggaa acccccggtggacgagaagc cgcggccttc cgacgatgct gacaacgacgtccgcggtca tcggaatcgc cgtggtggcg ctgctgctgggtcatcgctc ggcgtcgatg a<210> 90<211> 846<212> PRT<213> Bactéria<220>

<221> SIGNAL<222> (1)...(40)<400> 90

Met Asp Thr Leu Phe Asn Thr Thr Asp Glu Arg

1 5 10

Arg Gly Ile Val Ala Ala Leu Ala Ala Ala Ala

20 25

Ala Phe Ala Pro Thr Ala Met Ala Ala Asp Pro

Thr Ile Thr Asp Ser335

Pro Gln Leu Asp Leu350

ccaagcgccgtcgccccgacatccgctgggagaaggccctgctggtacgatcgccagcgaccgactggttccagctgcccacgtggcggatcgcgttcgatgcgcaattcggaacgcgaacgttgttcatttctggaacgtgtcgttgacgcaagaagcaagctcatcgaaccagctgttagggçgcgcctcggtgatagccgtgggcatgggaacgtcttcaatgtctacggcggatgaacggtgtgacaagtcgtggctcgcgacggatcacgctggcctccggtcgttgggtaaggtggtcggacggactcgaatccgcggccagtagcttcggctctcgtcgatggccttcgaagggcaactgggcgtctgctggcgtgacgaggaaggataccgaacaagatgccttgccgccgg

tggcatcgtcggccatggcgaatcaacgctggtcgagaaccgaccagcatgaacggcatccttccaggccgcttgccgacggccatctcccgtggtcaacgctgtggtattacgtatctgcaacgattaccatgatccagcacggcctcgggccatcaccgcagggacggctcggtttcggctgctgttccgccaaccttcgactcggcgttcgctggtcttggaaggaccgacaccgtccggcggcgagcgatatcccgttccgccacccgagccgctgtgacgccgacgaccgccgcccaagctgtatgtgggagaagtaccaacgaccggcgcgtcgcggctatgtctgtcgacttccgatccgacccgatccctccgactcctggcgaagcctggcgcagaccggtatgcgggctg

Gly Ala Ser Lys Arg15

Met Leu Val Pro Leu30

Asp Tyr Pro Gly Gly35 40 45 Ile Lys Gly Glu Tyr Asn Pro Leu Gly Ile Asn Ala Gly Val Ala Ile 50 55 60 Glu Thr Tyr Thr Leu Asn Gln Asp Lys Glu Lys Ala Leu Val Glu Asn65 70 75 80Phe Asp Gln Ile Thr Pro Glu Asn Ser Leu Lys Pro Glu Gly Trp Tyr 85 90 95 Asp Asp Gln His Asn Phe Arg Met Ser Asp Asp Ala Arg Asn Leu Leu 100 105 110 Thr Phe Ala Ser Glu Asn Gly Ile Lys Val Tyr Gly His Val Leu Val 115 120 125 Trp His Ser Gln Thr Pro Asp Trp Phe Phe Gln Ala Asp Glu Trp Cys 130 135 140 His Asp Thr Asn Asp Asn Pro Gly Val Thr Ser Cys Pro Leu Ala Asp145 150 155 160Lys Ala Thr Met Gln Glu Arg Gln Arg Arg His Ile Glu Asn Val Ala 165 170 175 Glu Ala Ile Ser Asp Glu Phe Gly Lys Phe Gly Ser Pro Thr Asn Pro 180 185 190 Val Val Ala Phe Asp Val Val Asn Glu Thr Val Asn Asp Ser Asp Asp 195 200 205 Pro Ala Thr Asn Gly Met Arg Asn Ser Leu Trp Tyr Gln Thr Tyr Gly 210 215 220 Gly Glu Asp Tyr Ile Tyr Asp Ala Phe Arg Asn Ala Asn Thr Tyr Leu225 230 235 240Asn Asp Val Tyr Ala Ala Asp Asp Ala Glu His Pro Val Thr Leu Phe 245 250 255 Ile Asn Asp Tyr Gly Thr Glu Gln Ala Gly Lys Arg Ser Arg Tyr Lys 260 265 270 Ala Leu Leu Glu Arg Met Ile Gln Gln Gly Val Pro Phe Asp Gly Ile 275 280 285 Gly His Gln Phe His Val Ser Leu Thr Thr Ala Ser Ser Asn Leu Asp 290 295 300 Asp Ala Leu Thr Asp Met Ser Ser Leu Gly Lys Lys Gln Ala Ile Thr305 310 315 320Glu Leu Asp Val Ala Thr Gly Thr Pro Val Thr Glu Ala Lys Leu Ile 325 330 335 Glu Gln Gly Arg Tyr Tyr Tyr Asp Val Asn Gln Ile Ile His Arg His 340 345 350 Ala Asp Gln Leu Phe Ser Val Ser Val Trp Gly Leu Ser Asp Asp Gln 355 360 365 Ser Trp Arg Asn Lys Glu Gly Ala Pro Leu Leu Phe Asp Asp Asn Leu 370 375 380 Glu Lys Lys Pro Ala Tyr Ile Gly Tyr Ile Gly Asp Ser Ala Asn Leu385 390 395 400Pro Glu Pro Leu Lys Ser Met Asn Ala Phe Lys Asp Asp Ala Val Gly 405 410 415 Ile Asp Ser Ala Leu Pro Gly Thr Val Ala Glu Ser Gly Ala Ser Ser 420 425 430 Pro Trp Glu Arg Leu Ser Leu Val Glu Met Thr Pro Ser Ala Tyr Asp 435 440 445 Ala Val Ser Gly Ser Phe Asn Val Tyr Trp Lys Asp Gly Ser Leu Val 450 455 460 Val Tyr Ala Asp Val Ala Asp Ala Ser Ala Ala Asp Asp Asp Thr Val465 470 475 480Thr Val Arg Val Gly Asp Ala Glu Tyr Thr Ile Gly Arg Asn Gly Val 485 490 495 Thr Gly Gly Glu Gly Val Gln Ala Asn Val Val Ser Ser Asp Ala Gly 500 505 510 Tyr Glu Val Val Ala Asp Ile Pro Tyr Thr Gly Ala Glu Lys Asp Ile 515 520 525 Val Glu Met Asn Val Ile Ala Thr Asp Ser Ala Thr Thr Glu Thr Ser 530 535 540 Ala Trp Ser Thr Asn Asp Thr Gly Ala Val Thr Leu Ala Glu Pro Leu545 550 555 560Ser Tyr Thr Glu Ala Val Lys Val Pro Ala Asp Ala Gln Ala Pro Val

565 570 575Val Asp Ala Asp Pro Ser Asp Ser Val Trp Ala Glu Ala Asn Glu Val

580 585 590

Pro Val Gly Lys Val Thr Ala Ala Thr Pro Ser Pro Glu Ala Thr Ala595 600 605

Thr Ala Lys Thr Leu Trp Ser Asp Gly Lys Leu Tyr Val Leu Met Glu610 615 620

Val Thr Asp Ala Asp Ile Asp Leu Thr Asn Ser Asn Pro Trp Glu Lys625 630 635 640

Asp Ser Val Glu Val Tyr Ile Asp Arg Gly Asn Thr Lys Ser Gly Gln645 650 655

Tyr Thr Asn Asp Ile Gln Gln Ile Arg Val Ser Ala Asp Gly Ala Glu

660 665 670

Leu Ser Phe Gly Ser Gly Ala Ser Glu Asp Val Gln Lys Ser Met Val675 680 685

Gln Thr Ala Gly Lys Leu Val Asp Gly Gly Tyr Val Val Glu Met Ala690 695 700

Ile Asp Leu Gly Thr Ala Glu Ala Gly Thr Phe Glu Gly Val Asp Phe705 710 715 720

Gln Ile Asn Asp Ala Lys Asn Gly Ala Arg Ile Gly Ile Arg Asn Trp725 730 735

Ala Asp Pro Thr Gly Ala Gly Tyr Gln Thr Ala Ser His Trp Gly Val740 745 750

Leu Arg Leu Leu Ala Asp Pro Ser Glu Thr Glu Thr Pro Gly Gly Glu755 760 765

Asp Pro Glu Thr Pro Gly Asp Glu Glu Thr Pro Gly Glu Asp Thr Glu770 775 780

Lys Pro Gly Asp Glu Glu Thr Pro Gly Glu Asp Thr Glu Lys Pro Gly785 790 795 800

Asp Glu Lys Pro Arg Pro Ser Asp Asp Ala Asp Asn Asp Asp Lys Met805 810 815

Pro Gln Thr Gly Ser Ala Val Ile Gly Ile Ala Val Val Ala Leu Leu

820 825 830

Leu Val Ala Ala Gly Cys Gly Leu Val Ile Ala Arg Arg Arg835 840 845

<210> 91

<211> 1023

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 91

atgaatgtat cggtaccggc cgagtccgca cttaaagaca tcttcgcgga agacttccat 60

ataggtgcgg cggtcagtag taatacgatc aagtcgcagg agagtctgct tacgcatcac 12 0

tttaacagca ttacggcgga aaacgaaatg aagttcgcca gcgtccatcc agaggaagag 180

ctttacacct tcgaggaagc ggatcagatc gtggacttcg cgcgcaaaca cgggatggct 240

gtccgcggac atacgctggt atggcataac cagaccaccg attggttgtt ccgcgacaag 300

cagaatcagc tcgtgagcaa agccgtgctt tatgaaagaa tccgttcgca tatccaaacg 360

gtagtaggca gatataaggg cgatatttac gcttgggacg ttgtgaacga ggtcattgcc 420

gatgacggcg atcagttgct gcgtacctcc agctggacgg aaatcgccgg ggacgaattc 480

atcgccaaag cgtttgaata cgcgcatgct gccgacccga atgcgctgtt gttctacaac 540

gactacaatg agtcccatcc aagcaaacgg gataaaattt ataccttggt caagtctctt 600

ctggaccggg gagtacctat tcacggcatt ggcctgcagg cacactggaa tctgttcaac 660

ccgtccttgg atgacatccg ggcagccatc gaaaaatatg cttcgctagg attgcagctc 720

cagctcacgg aactggatgt gtcggtattc cgtttcgaag ataagcgggc cgatctgacc 780

gagcctgaac cgggaatgct ggaacagcag gctgaattct acgaagccgt gttcaagctg 840

cttaaggaat acagcgatgt aattagcgcg gtgacgttct ggggagctgc ggacgaccac 900

acctggctca gcgattttcc ggtacgtggg cgcaaaaact ggccgctgct gttcgatgag 960

cggcacaggc cgaagccggc atattatcgc ttagctgctc ttgccaatca tcttcggcgt 1020

tga - 1023

<210> 92

<211> 340

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 92

Met Asn Val Ser Val Pro Ala Glu Ser Ala Leu Lys Asp Ile Phe AlaGlu Asp Phe His Ile Gly Ala Ala Val Ser Ser Asn Thr Ile Lys Ser

20 25 30

Gln Glu Ser Leu Leu Thr His His Phe Asn Ser Ile Thr Ala Glu Asn35 40 45

Glu Met Lys Phe Ala Ser Val His Pro Glu Glu Glu Leu Tyr Thr Phe

50 55 60

Glu Glu Ala Asp Gln Ile Val Asp Phe Ala Arg Lys His Gly Met Ala65 70 75 80

Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Thr Asp Trp Leu

85 90 95

Phe Arg Asp Lys Gln Asn Gln Leu Val Ser Lys Ala Val Leu Tyr Glu

100 105 110

Arg Ile Arg Ser His Ile Gln Thr Val Val Gly Arg Tyr Lys Gly Asp115 120 125

Ile Tyr Ala Trp Asp Val Val Asn Glu Val Ile Ala Asp Asp Gly Asp

130 135 140

Gln Leu Leu Arg Thr Ser Ser Trp Thr Glu Ile Ala Gly Asp Glu Phe145 150 155 160

Ile Ala Lys Ala Phe Glu Tyr Ala His Ala Ala Asp Pro Asn Ala Leu

165 170 175

Leu Phe Tyr Asn Asp Tyr Asn Glu Ser His Pro Ser Lys Arg Asp Lys

180 185 190

Ile Tyr Thr Leu Val Lys Ser Leu Leu Asp Arg Gly Val Pro Ile His195 200 205

Gly Ile Gly Leu Gln Ala His Trp Asn Leu Phe Asn Pro Ser Leu Asp

210 215 220

Asp Ile Arg Ala Ala Ile Glu Lys Tyr Ala Ser Leu Gly Leu Gln Leu225 230 235 240

Gln Leu Thr Glu Leu Asp Val Ser Val Phe Arg Phe Glu Asp Lys Arg

245 250 255

Ala Asp Leu Thr Glu Pro Glu Pro Gly Met Leu Glu Gln Gln Ala Glu

260 265 270

Phe Tyr Glu Ala Val Phe Lys Leu Leu Lys Glu Tyr Ser Asp Val Ile275 280 285

Ser Ala Val Thr Phe Trp Gly Ala Ala Asp Asp His Thr Trp Leu Ser

290 295 300

Asp Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu

His Leu Arg Arg340

<210> 93

<211> 1011

<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental

<400> 93

atgaatcaat cagtaaatga agcacaggtt cctgcattat cggatgtata tgaagattat 60

ttttcaatag gtgccgctgt taatccactt actttaggta cgcaaaaaaa gctgttaacc 120

aaacatttta atagtataac ggctgagaat gaaatgaaat ttgaagcatt acagcctaaa 180

ccagatcaat ttacatttga tacggcggat aaaatggttg cctttgccca agcacatgat 240

atgaagatgc gtggccatac attaatctgg cacaatcaaa caccagattg gatgtttttg 300

caaaaagacg gtacgacaat tgatcgtgaa acactcttgg agagaatgaa aaaacatatt 3 60

aagacggtgg tggaaagata taaaggcaaa atatattgtt gggacgttgt aaatgaagcg 420

gtagctgatg aaggcgaagc tattttaaga ccatcaaaat ggacggacat tattggcgac 480

tcgtttattg agtatgcttt taaatacgcc cacgaggccg atcccgatgc actgttgttt 540

tacaatgact acaatgcttg ccaccctcat aaaagagata agatttatca acttgtaaag 600

gggttaatag acaagggtgt gcccatacac ggtattggcc tacaagcaca ttggaacatt 660

gttgacccgt cttacgatga tattaaacga gccatcgaaa cttatgcatc attaggatta 720

agcatacact ttactgaaat ggatgtgtct gtttttgaat atcatgatcg aagaacagac 780

ttattggaac ctacaaaaga tatggtttca cgtcaagctg agcgttatca ggcatttttt 840

gaaatattta ggtcgtatgc tgatgtgatt gattccgtta cgttttgggg catggccgat 900gattatacat ggcttgatga ttttccggtg acaggtcgaa aaaattggcc ctttgtattt 960

gatgcgagac atcagcctaa aacagcattc tggaacatcg ttgattttta a 1011<210> 94<211> 336<212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental

<400> 94

Met Asn Gln Ser Val Asn Glu Ala Gln Val Pro Ala Leu Ser Asp Val1 5 10 15

Tyr Glu Asp Tyr Phe Ser Ile Gly Ala Ala Val Asn Pro Leu Thr Leu

20 25 30

Gly Thr Gln Lys Lys Leu Leu Thr Lys His Phe Asn Ser Ile Thr Ala

35 40 45

Glu Asn Glu Met Lys Phe Glu Ala Leu Gln Pro Lys Pro Asp Gln Phe

15 50 55 60

Thr Phe Asp Thr Ala Asp Lys Met Val Ala Phe Ala Gln Ala His Asp

65 70 75 80

Met Lys Met Arg Gly His Thr Leu Ile Trp His Asn Gln Thr Pro Asp

85 90 95

20 Trp Met Phe Leu Gln Lys Asp Gly Thr Thr Ile Asp Arg Glu Thr Leu

100 105 110

Leu Glu Arg Met Lys Lys His Ile Lys Thr Val Val Glu Arg Tyr Lys

115 120 125

Gly Lys Ile Tyr Cys Trp Asp Val Val Asn Glu Ala Val Ala Asp Glu

25 130 135 140

Gly Glu Ala Ile Leu Arg Pro Ser Lys Trp Thr Asp Ile Ile Gly Asp

145 150 155 160

Ser Phe Ile Glu Tyr Ala Phe Lys Tyr Ala His Glu Ala Asp Pro Asp

165 170 175

30 Ala Leu Leu Phe Tyr Asn Asp Tyr Asn Ala Cys His Pro His Lys Arg

180 185 190

Asp Lys Ile Tyr Gln Leu Val Lys Gly Leu Ile Asp Lys Gly Val Pro

195 200 205

Ile His Gly Ile Gly Leu Gln Ala His Trp Asn Ile Val Asp Pro Ser

35 210 215 220

Tyr Asp Asp Ile Lys Arg Ala Ile Glu Thr Tyr Ala Ser Leu Gly Leu

225 230 235 240

Ser Ile His Phe Thr Glu Met Asp Val Ser Val Phe Glu Tyr His Asp

245 250 255

40 Arg Arg Thr Asp Leu Leu Glu Pro Thr Lys Asp Met Val Ser Arg Gln

260 265 270

Ala Glu Arg Tyr Gln Ala Phe Phe Glu Ile Phe Arg Ser Tyr Ala Asp

275 280 285

Val Ile Asp Ser Val Thr Phe Trp Gly Met Ala Asp Asp Tyr Thr Trp

45 290 295 300

Leu Asp Asp Phe Pro Val Thr Gly Arg Lys Asn Trp Pro Phe Val Phe

305 310 315 320

Asp Ala Arg His Gln Pro Lys Thr Ala Phe Trp Asn Ile Val Asp Phe

325 330 335

50 <210> 95

<211> 1143<212> DNA<213> Desconhecido<220>

55 <223> Obtido para uma amostra ambiental<400> 95

atgaaaaaaa cgattgcaca tttcacctta tggatagtgt tttttctctt cacttcctgt 60

gctgttacgg cgcagaagaa tgctaagaat acaagagtaa aactcactac cctaaaagag 120

gcttaccaag gtaaattcta tatcggtact gcgatgaatc tgagacagat tcacggagat 180

60 gatccccagt ctgaaaatat tatcaaaaaa cagttcaatt ccatagttgc cgaaaactgc 240atgaagagta tgtatcttca gccggaggaa ggaaaatttt tcttcgatga tgcggacaag 300

tttgtggatt ttggtcttca gaacaatatg ttcatcatcg ggcattgtct gatttggcat 360

tcgcaggcgc caaaatggtt tttcaccgat gagaatggaa aaacggtttc cccagaagtt 420

cttaaacaaa ggatgaaagc ccatatcacc gctgtcgttt cccgctacaa agggaaaatc 480

65 aaaggttggg atgtggtgaa cgaagccatt atggaagatg gttcttaccg caaaagcaaa 540

ttttatgaga ttttgggaga agaatttatt ccgttggcat ttcagtatgc gcatgaagca 600

gatcctgatg cagaacttta ttacaacgat tataacgaat ggtatcccgg aaaaagagct 660acggtgacca agataatccg cgatttcaaa tctagaggaa tccgcattga tgccatcgga

atgcaggctc atttcgggat ggattcgccc actttagaag agtatgaaca aaccattcag

ggctatataa aagaaggcgt gaaagtcaat attacggaac tcgatttgag tccgcttcct

tctccttggg gaacttccgc caatgttgcc gatacgcagc agtatcagga aaaaatgaat

ccttacacca aaggacttcc cgccgatgtg gaaaaagcat gggaaaaccg ctatctcgat

tttttcaaac tgttcctgaa atatcatcag catatcgagc gtgttacgtt ttggggcgtt

agcgatatcg attcctggaa gaacgatttt ccagtaagag gacgtaccga ttatccacta

ccgtttaacc gacagtatca ggcaaaacct ttggtgcaga aattaataga cttaacgaaatag

<210> 96

<211> 380<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (24)<400> 96

Met Lys Lys Thr Ile Ala His Phe Thr Leu Trp Ile Val Phe Phe Leu1 5 10 15

Phe Thr Ser Cys Ala Val Thr Ala Gln Lys Asn Ala Lys Asn Thr Arg

20 25 30

Val Lys Leu Thr Thr Leu Lys Glu Ala Tyr Gln Gly Lys Phe Tyr Ile35 40 45

Gly Thr Ala Met Asn Leu Arg Gln Ile His Gly Asp Asp Pro Gln Ser

50 55 60

Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile Val Ala Glu Asn Cys65 70 75 80

Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe Phe Phe Asp

85 90 95

Asp Ala Asp Lys Phe Val Asp Phe Gly Leu Gln Asn Asn Met Phe Ile

100 105 110

Ile Gly His Cys Leu Ile Trp His Ser Gln Ala Pro Lys Trp Phe Phe115 120 125

Thr Asp Glu Asn Gly Lys Thr Val Ser Pro Glu Val Leu Lys Gln Arg

130 135 140

Met Lys Ala His Ile Thr Ala Val Val Ser Arg Tyr Lys Gly Lys Ile

145 150 155 160

Lys Gly Trp Asp Val Val Asn Glu Ala Ile Met Glu Asp Gly Ser Tyr

165 170 175

Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe Ile Pro Leu

180 185 190

Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr

195 200 205

Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg Ala Thr Val Thr Lys

210 215 220

Ile Ile Arg Asp Phe Lys Ser Arg Gly Ile Arg Ile Asp Ala Ile Gly225 230 235 240

Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Leu Glu Glu Tyr Glu

245 250 255

Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val Lys Val Asn Ile Thr

260 265 270

Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp Gly Thr Ser Ala Asn275 280 285

Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met Asn Pro Tyr Thr Lys

290 295 300

Gly Leu Pro Ala Asp Val Glu Lys Ala Trp Glu Asn Arg Tyr Leu Asp305 310 315 320

Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His Ile Glu Arg Val Thr

325 330 335

Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys Asn Asp Phe Pro Val

340 345 350

Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asn Arg Gln Tyr Gln Ala355 360 365

Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr Lys370 375 380

7207808409009601020108011401143<210> 97

<211> 1407

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 97

atgaatgaaa cctcgcggaa ttggttggag agaggattgctccaacattc agcccagggt tggcgcttgc gcctaccctgtcaaccctga aagggttgca gcggaggttt gcacaagaccggctttctcc cttttccacc cagggtagcg cctgcggcgcgaacgccgtt ggcgttcccg gaaacctgcg aagaaacaacagtctcctct cgggtctgct gtggggcgcc gaagtgcaaccgccaggact tcctgctggg ggcggcgttg aacgcggagcgtcgagtcgg tattgatcga aaagcatttc aacacgatcatgggaacgag tccatcctca gcccaaccag tattcttttggagttcggcc gcaaacacgg aatggtcatc atcggccacaacgcccggct gggtcttccg ggatgccgac ggaaagacgcgagcggatgc gcgaccacat ccacaccgtg gtcgggcgcttgggatgtgg tgaacgaggc gctgcgcgac gacggcgcgtcggatcatcg gcgacgatta cattttgaaa gccttccagtgatgcggagc tctattacaa cgattattcg ctggagaagcgtggacctgg tgaagcagct ccaggccggc ggggcgaagcgggcactaca acctcgactg gccggagacc gccgagatcggcggagctgg ggctcaaggt gatgatcacg gagctggacgggccagtcgg gcgaagccga tgtagggatg acgttcggcgtggaatcctt tcacgaacgg actgccggcc gcagtggagcgctgaaatct tcaggatctt cacgaagcac agccgtcggaggcgtcaccg accggacctc ctggctcaac aattttcccaçcgttgctct ttgatcgggc tggggagccc aaacccgcgtcgtcagccgc gccagcccgt cgaatga<210> 98<211> 468<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 98

Met Asn Glu Thr Ser Arg Asn Trp Leu Glu Arg

15 10

Arg Gln Arg Arg Ser Asn Ile Gln Pro Arg Val

20 25

Pro Gly Leu Glu Ala Ile Ala Pro Ser Thr Leu

35 40

Arg Phe Ala Gln Asp Arg Tyr Asn Pro Phe Arg

ctttcgaacgggttggaagcgatacaacccaaccctgggctcgccttcctcggcactgaaaggtgctggacgcccgagaaaggacgcggacgctggtctgtgacgcgcgaacaagggcaaggcggaattcatgcccatgacggccaagcgtggccggcgtaaaacaccattcaacgcgctgcaatttcggaacgcctcgctttcgcgcgttccgcggccgtccgatccgt

ccaacggcgtaatcgctccatttcaggatttgatggatcaggccatcaccagacgtattccaccaaccggtgtgctgaagtcgctacgtcgcacagccagagccctgctggatccgcggcccaatggcggggccgatccgcaatggcgcccggcttgcagcgcggcgttcgccgacgccccggcgataaaggaccgctaccaccttctgggaccaattaccgtggcggtc

50

55

Phe Pro Pro Arg Val Ala Pro Ala Ala Gln Pro

Gly Leu Pro

Gly Ala Cys30

Lys Gly Leu45

Ile Gly Phe60

Trp Ala Asp

65

70

75

Glu Arg Arg Trp Arg Ser Arg Lys Pro Ala Lys Lys Gln Leu

85

90

Leu Ala Ile Thr Ser Leu Leu Ser Gly Leu Leu

100

105

Gln Pro Ala Leu Lys Asp Val Phe Arg Gln Asp

115 120

Ala Leu Asn Ala Glu Gln Val Leu Asp Thr Asn

130

135

Leu Ile Glu Lys His Phe Asn Thr Ile Thr Pro

Trp Gly Ala110

Phe Leu Leu125

Arg Val Glu140

Glu Asn Val

145

150

155

Phe Glu15

Ala Tyr

Gln Arg

Leu Pro

Gly Ser80

Ala Phe95

Glu Val

Gly Ala

Ser Val

Leu Lys160

Trp Glu Arg Val His Pro Gln Pro Asn Gln Tyr Ser Phe Glu Asp Ala60 165 170 175 Asp Arg Tyr Val 180 Glu Phe Gly Arg Lys 185 His Gly Met Val Ile 190 Ile Gly His Thr Leu 195 Val Trp His Ser Gln 200 Thr Pro Gly Trp Val 205 Phe Arg Asp65 Ala Asp 210 Gly Lys Thr Leu Thr 215 Arg Glu Ala Leu Leu 220 Glu Arg Met Arg Asp His Ile His Thr Val Val Gly Arg Tyr Lys Gly Lys Ile Arg Gly

6012018024030036042048054060066072078084090096010201080114012001260132013801407225 230 235 240 Trp Asp Val Val Asn 245 Glu Ala Leu Arg Asp 250 Asp Gly Ala Trp Arg 255 Asn Ser Gln Trp Arg Arg Ile Ile Gly Asp Asp Tyr Ile Leu Lys Ala Phe 260 265 270 Gln Tyr Ala 275 His Glu Ala Asp Pro 280 Asp Ala Glu Leu Tyr 285 Tyr Asn Asp Tyr Ser 290 Leu Glu Lys Pro Ala 295 Lys Arg Asn Gly Ala 300 Val Asp Leu Val Lys 305 Gln Leu Gln Ala Gly 310 Gly Ala Lys Leu Ala 315 Gly Val Gly Leu Gln 320 Gly His Tyr Asn Leu 325 Asp Trp Pro Glu Thr 330 Ala Glu Ile Glu Asn 335 Thr Ile Ala Ala Phe Ala Glu Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp Val Asn Ala Leu Pro Thr Pro Gly Gln Ser Gly Glu Ala Asp Val 355 360 365 Gly Met Thr Phe Gly Gly Asn Phe Gly Gly Asp Lys Trp Asn Pro Phe 370 375 380 Thr 385 Asn Gly Leu Pro Ala 390 Ala Val Glu Gln Arg 395 Leu Ala Asp Arg Tyr 400 Ala Glu Ile- Phe Arg 405 Ile Phe Thr Lys His 410 Ser Arg Arg Ile Ser 415 Arg Val Thr Phe Trp Gly Val Thr Asp Arg Thr Ser Trp Leu Asn Asn Phe 420 425 430 Pro Ile Arg 435 Gly Arg Thr Asn Tyr 440 Pro Leu Leu Phe Asp 445 Arg Ala Gly Glu Pro 450 Lys Pro Ala Phe Arg 455 Ser Val Val Ala Val 460 Arg Gln Pro Arg Gln Pro Val Glu

<210> 99<211> 1074<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 99

gtgcgctcaa gagctagcgc gtactggttc ggcgtggggtgctcagaccc cttcccccca gtccctgcgc gcgctggccgggagccgcgg tggacctagc ggccctgtac gaccccctcgctcgcccgcg agttcaacct ggtggtggcc gagaacgccaaacgcgcggg ggcagtacag cttcaccggc gctgacgccccacggccagc gcttgcgcgg ccacaccctc atctggcacgcgcagcggca ccttctcccg cgaggccatg ctggcggtgagtggccgggc acttccgcgg ccaggtggcc tactgggacggaccggggcg gcctgcgcga gacccccttt ctgcgggcggcacgccttcc gcttcgcccg cgccgccgac ccccaggccaggcgccgacg gcatgggcgc taaatcggac gagatctacggccaaggggg tacccgtcga cggggtgggc ttccaggcccgtccagcagg cgcggatgcg ggagaaccta gagacgcttcgcacatcacc gagctggacg tgcagctaaa aggggcgggcggcgcaggcc cggatctacg ccgaggtgct ggcgacctgccgccgtgacg ctgtggggct tcaccgacgc ccactcctgggatcttcgac gcgctctacc ggcccaaacc ggcgtaccagaggcaaccct tgagcctttt cagcccagtt ttgccaacga<210> 100<211> 357<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220><221><222><400>

tggtggtggcagcgccagggagcccgagtatgaagtgggctggtgcgcttagcaactgcctgcaggagcatggtcaacgatgggccccgaagctcttctaccctgctcaaacctcgacaggccgacctggtcgcgggaggcgcgcggtcccgagccgccggctctgctgcggacagcact

gctgagcctggctgctggtgcgcccaactcctccctgagccgcccgccagcgcgtgggtgcattcaggcgggcggtgagtctacctcgagcaacgactacagcgctcaagcaccttctcggcctcgaggtaacggctggagcggctgcagccgaacccctgggctctgggatga

6012018024030036042048054060066072078084090096010201074

SIGNAL(1)...(33)100

Val Arg Ser Arg Ala Ser Ala Tyr Trp Phe Gly Val Gly Leu Val Val1 5 10 15 Ala Leu Ser Leu 20 Ala Gln Thr Pro Ser 25 Pro Gln Ser Leu Arg 30 Ala LeuAla Glu Arg 35 Gln Gly Leu Leu Val 40 Gly Ala Ala Val Asp 45 Leu Ala AlaLeu Tyr 50 Asp Pro Leu Glu Pro 55 Glu Tyr Ala Gln Leu 60 Leu Ala Arg GluPhe Asn Leu Val Val Ala Glu Asn Ala Met Lys Trp Ala Ser Leu Ser65 70 75 80Asn Ala Arg Gly Gln Tyr Ser Phe Thr Gly Ala Asp Ala Leu Val Arg 85 90 95 Phe Ala Arg Gln His Gly Gln Arg Leu Arg Gly His Thr Leu Ile Trp 100 105 110 His Glu Gln Leu Pro Ala Trp Val Arg Ser Gly Thr Phe Ser Arg Glu 115 120 125 Ala Met 130 Leu Ala Val Met Gln 135 Glu His Ile Gln Ala 140 Val Ala Gly HisPhe Arg Gly Gln Val Ala Tyr Trp Asp Val Val Asn Glu Ala Val Ser145 150 155 160Asp Arg Gly Gly Leu Arg Glu Thr Pro Phe Leu Arg Ala Val Gly Pro 165 170 175 Asp Tyr Leu Glu His Ala Phe Arg Phe Ala Arg Ala Ala Asp Pro Gln 180 185 190 Ala Lys Leu Phe Tyr Asn Asp Tyr Gly Ala Asp Gly Met Gly Ala Lys 195 200 205 Ser Asp 210 Glu Ile Tyr Ala Leu 215 Leu Lys t Ala Leu Lys 220 Ala Lys Gly ValPro Val Asp Gly Val Gly Phe Gln Ala His Leu Asp Ser Thr Phe Ser225 230 235 240Val Gln Gln Ala Arg 245 Met Arg Glu Asn Leu 250 Glu Thr Leu Arg Arg 255 ProGly Pro Arg Gly Ala His His Arg Ala Gly Arg Ala Ala Lys Arg Gly 260 265 270 Gly Leu Ala Gly Gly Thr Ala Gly Gly Ala Gly Pro Asp Leu Arg Arg 275 280 285 Gly Ala 290 Gly Asp Leu Pro Arg 295 Gly Pro Arg Leu Gln 300 Arg Arg Asp AlaVal Gly Leu His Arg Arg Pro Leu Leu Ala Ser Arg Arg Arg Thr Pro305 310 315 320Asp Leu Arg Arg Ala Leu Pro Ala Gln Thr Gly Val Pro Gly Ser Ala 325 330 335 Ala Gly Ser Gly Arg Gln Pro Leu Ser Leu Phe Ser Pro Val Leu Pro 340 345 350 Thr Arg Thr Ala Leu

355

<210> 101

<211> 1131

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 101

atgaagtatt ggcttacaac cctggtttta atgatagcgg gaataccctt ggcttttggttcttcagcaa agcaagataa atcaaagagt ttgaaagatg ctttcaaaaa caaattctatatcggtgtgg ctttgaaccg gagtcaatat ctggaacaaa acgaacaggc ggataaagagataaaggcac agttcagctc tattgtagct gagaactgca tgaaaagcga aaatctggaacctaaagagg gaaaattctt ctttgacgat gccgatcgtt ttgtcgcttt tggagaaaaaaatggaatgt acatcattgg acatacctta atttggcatt ctcaagtgcc aaaatggtttttcatagata atgaaggcaa agttgtttcc cgggaagttt tgattgaacg aatgaaaaactacatccata cagttgtcgg tcattataaa ggtcgagtta aaggttggga tgttgtcaatgaggccattc tagatgatgg ctcatttaga caaagtaatt tctttaaaat actaggagccgattttatta aacttgcttt tcaatttgcc catgaagcag atcccaatgc tgagctttattacaacgatt attcgatgtc caatccgacc aaaagagacg gagtggttcg catggtgaagtcattgcagc aacaaggtgt gagaatagac gctatcggaa tgcagggaca cgtagggatggattatccca agttggatga gtttgaaaat agtatcaaag ctttttcgtc tttaggaaccaaagtgatga ttacggaact cgatttaagt gtcctaccaa ctcctaaagg aaaacaaggtgctaatattt cggatgttgc cgcttatgag gaaaagataa atccttacaa aaatggtctgccggctgaag ttgaaaaggc ttgggaagac cggtatttgg attttttcaa attatttttg 960

aaatatcaac accaaatttc aagggttaca ttatgggggc ttagtgatca ggattcgtgg 1020aaaaatgatt tcccagtcag agggagaacg gattatcctt tgcttttcga cagacaatac 1080aaaccaaaac ctgtagttca gaaaattatt aaattagcat tgaaaaaata a 1131

<210> 102 -<211> 376<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL <222> C L) . . . . (23) <400> 102 Met Lys Tyr Trp Leu Thr Thr Leu Val Leu Met Ile Ala Gly Ile Pro1 5 10 15 Leu Ala Phe Gly Ser Ser Ala Lys Gln Asp Lys Ser Lys Ser Leu Lys 20 25 30 Asp Ala Phe Lys Asn Lys Phe Tyr Ile Gly Val Ala Leu Asn Arg Ser 35 40 45 Gln Tyr Leu Glu Gln Asn Glu Gln Ala Asp Lys Glu Ile Lys Ala Gln 50 55 60 Phe Ser Ser Ile Val Ala Glu Asn Cys Met Lys Ser Glu Asn Leu Glu65 70 75 80Pro Lys Glu Gly Lys Phe Phe Phe Asp Asp Ala Asp Arg Phe Val Ala 85 90 95 Phe Gly Glu Lys Asn Gly Met Tyr Ile Ile Gly His Thr Leu Ile Trp 100 105 110 His Ser Gln Val Pro Lys Trp Phe Phe Ile Asp Asn Glu Gly Lys Val 115 120 125 Val Ser Arg Glu Val Leu Ile Glu Arg Met Lys Asn Tyr Ile His Thr 130 135 140 Val Val Gly His Tyr Lys Gly Arg Val Lys Gly Trp Asp Val Val Asn145 150 155 160Glu Ala Ile Leu Asp Asp Gly Ser Phe Arg Gln Ser Asn Phe Phe Lys 165 170 175 Ile Leu Gly Ala Asp Phe Ile Lys Leu Ala Phe Gln Phe Ala His Glu 180 185 190 Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Met Ser Asn 195 200 205 Pro Thr Lys Arg Asp Gly Val Val Arg Met Val Lys Ser Leu Gln Gln 210 215 220 Gln Gly Val Arg Ile Asp Ala Ile Gly Met Gln Gly His Val Gly Met225 230 235 240Asp Tyr Pro Lys Leu Asp Glu Phe Glu Asn Ser Ile Lys Ala Phe Ser 245 250 255 Ser Leu Gly Thr Lys Val Met Ile Thr Glu Leu Asp Leu Ser Val Leu 260 265 270 Pro Thr Pro Lys Gly Lys Gln Gly Ala Asn Ile Ser Asp Val Ala Ala 275 280 285 Tyr Glu Glu Lys Ile Asn Pro Tyr Lys Asn Gly Leu Pro Ala Glu Val 290 295 300 Glu Lys Ala Trp Glu Asp Arg Tyr Leu Asp Phe Phe Lys Leu Phe Leu305 310 315 320Lys Tyr Gln His Gln Ile Ser Arg Val Thr Leu Trp Gly Leu Ser Asp 325 330 335 Gln Asp Ser Trp Lys Asn Asp Phe Pro Val Arg Gly Arg Thr Asp Tyr 340 345 350 Pro Leu Leu Phe Asp Arg Gln Tyr Lys Pro Lys Pro Val Val Gln Lys 355 360 365 Ile Ile Lys Leu Ala Leu Lys Lys

370 375

<210> 103<211> 1449<212> DNA<213> Bactéria<220><223> Obtido para uma amostra ambiental<400> 103

atgcgttcac attcccttcc cccgtccacc gtccgccgga aattgggcgggcgctgctcg tcggcgccgt cggcgccgcc accgtgctcg tggcgcccct

tcggtgaccg ccgagaacga gatgaagatc gacgccaccg aaccccagcagacttcaccg ccggcgaccg cgtctacaac tgggcggtgc agaacggcaaggccacaccc tggcctggca ctcccagcag cccgcctgga tgcagaacct

gactccaacc tccagcggag cggcaacgac tggatcgagg tcgccttccggccgccgacc cggccgccaa gctctgctac aacgactaca acgtcgagaagccaagaccc aggccatgta cgccatggtc aaggacttca agcagcgcgggactgcgtcg gcttccagtc gcacttcaac aacgacagcc cctacaacagaccaccctcc agagtttcgc cgccctcggc gtcgacgtgg ccatcaccgacagggcgcct cgggcacgac ctacgccaac gtgaccaacg actgcctggctgcctcggca tcaccgtctg gggtgtccgc gacaccgact cctggcgagcccgctgctct tcaacggcga cggcagcaag aagcccgcct actcctccgtctcaactccg tctcccccaa ccccaacccc actccgaccc cctcccccggatcaagggag tcgcctcggg ccgctgcgtg gacgtacccg gagccggcacacccaggtcc agctgtggga ctgcaacaac cgcaccaacc agcagtggacgccggtgagc tcagggtcta cggcgacaag tgcctggacg ccgccggcacgccaaggtcc agatctacag ctgctggggc ggcgacaacc agaagtggcggacggttcca tcgtcggtgt ccagtccggc ctctgcctcg acgccgctgcgccaacggca cgctgatcca gctctactcc tgctggaaca gcggcaaccacgcacctga<210> 104<211> 482<212> PRT

<213> Bactéria<220>

<223> Obtido para uma amostra ambiental<220><221> SIGNAL

<222> (1)...(41)<400> 104

Met Arg Ser His Ser Leu Pro Pro Ser Thr Val Arg Arg Lys Leu Gly1 5 10 15

Gly Leu Gly Ala Ala Leu Leu Val Gly Ala Val Gly Ala Ala Thr Val20 25 30

Leu Val Ala Pro Leu Thr Ser His Ala Ala Glu Ser Thr Leu Gly Ala

35 40 45

Ala Ala Lys Gln Ser Gly Arg Tyr Phe Gly Thr Ala Ile Ala Ser Gly50 55 60

Arg Leu Asn Asp Ser Thr Tyr Thr Thr Ile Ala Asn Arg Glu Phe Asn65 70 75 80

Ser Val Thr Ala Glu Asn Glu Met Lys Ile Asp Ala Thr Glu Pro Gln85 90 95

Gln Gly Arg Phe Asp Phe Thr Ala Gly Asp Arg Val Tyr Asn Trp Ala100 105 HO

Val Gln Asn Gly Lys Gln Val Arg Gly His Thr Leu Ala Trp His Ser

115 120 125

Gln Gln Pro Ala Trp Met Gln Asn Leu Ser Gly Ser Ala Leu Arg Thr130 135 140

Ala Met Thr Asn His Ile Asn Gly Val Met Ala His Tyr Lys Gly Lys145 150 155 160

Ile Gly Gln Trp Asp Val Val Asn Glu Ala Phe Ala Asp Gly Ser Ser165 170 175

Gly Ala Arg Arg Asp Ser Asn Leu Gln Arg Ser Gly Asn Asp Trp Ile180 185 190

Glu Val Ala Phe Arg Thr Ala Arg Ala Ala Asp Pro Ala Ala Lys Leu

195 200 205

Cys Tyr Asn Asp Tyr Asn Val Glu Asn Trp Thr Trp Ala Lys Thr Gln

210 215 220

Ala Met Tyr Ala Met Val Lys Asp Phe Lys Gln Arg Gly Val Pro Ile225 230 235 240

cctcggcgcg 60cacctcgcac 120cggcaccgcc 180cgagttcaac 240gggccgcttc 300gcaggtacgg 360cagcggcagc 420caagggcaag 480agcgcgccgg 540caccgcccgc 600ctggacgtgg 660cgtgcccatc 720caacttccgc 780actcgacatc 840cgtcccgcgc 900cgagcacact 960cctcaacgcc 1020cgccgggccg 1080cgccgacggc 1140cctcaccgcc 1200cggcaacggc 1260cctcaactcc 1320cggcggcacc 1380gcgctggacc 1440 1449Asp Cys Val Gly Phe Gln Ser His Phe Asn Asn Asp Ser Pro Tyr Asn

245 250 255

Ser Asn Phe Arg Thr Thr Leu Gln Ser Phe Ala Ala Leu Gly Val Asp260 265 270

Val Ala Ile Thr Glu Leu Asp Ile Gln Gly Ala Ser Gly Thr Thr Tyr275 280 285

Ala Asn Val Thr Asn Asp Cys Leu Ala Val Pro Arg Cys Leu Gly Ile

290 295 300

Thr Val Trp Gly Val Arg Asp Thr Asp Ser Trp Arg Ala Glu His Thr305 310 315 320

Pro Leu Leu Phe Asn Gly Asp Gly Ser Lys Lys Pro Ala Tyr Ser Ser

325 330 335

Val Leu Asn Ala Leu Asn Ser Val Ser Pro Asn Pro Asn Pro Thr Pro340 345 350

Thr Pro Ser Pro Gly Ala Gly Pro Ile Lys Gly Val Ala Ser Gly Arg355 360 365

Cys Val Asp Val Pro Gly Ala Gly Thr Ala Asp Gly Thr Gln Val Gln

370 375 380

Leu Trp Asp Cys Asn Asn Arg Thr Asn Gln Gln Trp Thr Leu Thr Ala385 390 395 400

Ala Gly Glu Leu Arg Val Tyr Gly Asp Lys Cys Leu Asp Ala Ala Gly

405 410 415

Thr Gly Asn Gly Ala Lys Val Gln Ile Tyr Ser Cys Trp Gly Gly Asp

Ser Gly Leu Cys Leu Asp Ala Ala Ala Gly Gly Thr Ala Asn Gly Thr

450 455 460

Leu Ile Gln Leu Tyr Ser Cys Trp Asn Ser Gly Asn Gln Arg Trp Thr465 470 475 480

Arg Thr<210> 105<211> 2793<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 105

atgaagttca ctttgatgcc gctgctgtgc gggttcgcct tgctgttggg ttgcgcggtg 60

caggcaaccc cagccgcttc gttacagcag gcttatcagc cgtatttcca tatcggtact 120

gccgtcagct tggcgcaact gcaagcatcg aaaaaccatg aacgagattt aatcgcccag 180

cactttaaca gtctgaccgc tgaaaacctg atgaaatggg aaaaaatcca accgactgaa 240

ggcaactttg attttacagc ggccgacaag ctcgtcgctt ttgctgaaca acatcggatg 300

tggctggtcg gccatacgat cctgtggcat gaacaaaccc cggactgggt atttcagggg 360

ccagatggca aaccggccag caagcaagtg ttactcggca gattaaaaaa gcatatccaa 420

actgtggtcg gtcgttacca aggtcgggta catggctggg atgtagtgaa tgaagcgctg 480

aatgaagatg gcagtctgcg cgatacgccg tggcgaaaaa ttctgggtga tgattacatt 540

gccaccactt ttgcgctggt gcatcaggtc gaccccaaag ccaaactcta ttacaacgac 600

tacaacctgt ataaaccaaa aaaacgcact ggcgtgctac ggatcatcca gcaactgcag 660

caacaacaag tgcccattca tgccattggc gaacaagcgc attatggtct cgattcgccg 720

aaattgcagg aagttgaaga ctcgatcaac gcctttgcag ccaccggcct cgacgtgatg 780

ctgaccgagt tggaaatttc ggtgctaccg tttccgcctg gcatgacacc aggcgccgat 840

atcagtcagc atcaggaact gcaacaacag ctgaatcctt accgcgaagg cttaccaaaa 900

accgtcgaac aggcctggca acaacgttat ctggatctgt tttcgctgtt attgcgccag 960

catcaaaaat tacaccgggt gacgttttgg ggtttagatg atggccaaag ctggcgcaat 1020

aactttccaa tgcgcggtcg taccgattac ccgctactgt ttgaccgcaa gctgcaagcc 1080

aaaccgctat tgagcgcact gatcaaactg gcagaaactc aagcctcagc caagccgaaa 1140

gtaaatcagc tcggttttgc gccaaatgcg caaaaattgc tggtggtgcc ggggcggcag 1200

gcggtgtcgt ttcagatcat caatcaaagc aacggcaaaa cggtgttgca aggccaaagt 1260

tcggtggctc agttttggcc cgaatcgggc gagtgggtca gtatcgctga cttttcgacc 1320

ttaaccaccc aagggcgtta tcaggttgaa gcggctggat taactccgat caccgtcgag 13 80

attactgctg aaccttatgc cgcgctgcat gatgcgtcca tcaaagccta ttattttaat 1440

cgcgcctcgc tggcgctgga gccaagtttt gccgggcctt gggcgcgcgc tgccggtcat 1500

ccggataaca aagtgttggt gcacacttcc gccgcttccg acaagcgacc agccggtttt 1560

gtgatcagcg ccgctaaagg ctggtatgac gccggtgact ataacaaata cgtggtcaat 1620

tccggtattt ccagttacac cctattgcaa gcctggcagg attttcctga gttttatcgc 1680

gacagaacat ggaatcttcc ggagtccagc aacaacctac cagacattct cgacgagacg 1740ttatggaatt tacagtggct gagcaccatg caggacccaa gcgacggcgg cgtgtatcac

aagctgactg aactgaattt ctctgctacc caaatgccgt cagaagtgac agcgccacgt 1860

tatgtggtgc aaaaaaccac ggcagcggca cttaatttcg cggcggtgct ggccaaagcc 1920

agtcgcattt ttacagaatt tgaaacgcaa ctgcccggcc tgtcacagca atatcgccag 1980

caagcattag cagcctggca atgggcgcaa aaaaatccac aacaaattta tcagcaacca 2040

gccgatgttc acaccggtgc ttatggcgac aaacagctgg ctgatgaatg ggcttgggct 2100

ggggcggagc tatatttatt aaccggtgag cagagttacc tgcagccgtt gttggcactt 2160

gagacgccaa tcaccgcagc ttcctgggcc aatgtggcgg cgttgggtta ttttgcgttg 2220

gcatccgctg aacagtttga gcctgcactt cgaaaaaaag tgcagcaaaa aatccaacaa 2280

gccgcggcgc aaattgtagc cgagcatcaa gcgtccgcct accaggtggc gatgactcaa 2340

aaagattttg tctggggcag taatgcggtg gcgatgaaca aaggcatgtt gttatatcaa 2400

gcgtggaaaa ttgacccaca accagagctg cgacaggcga tgcaagggct gctggattac 2460

gtcctcggtc gcaacccgct gcagctgtct tatgtcacag gttttggtgc gcaaagcccg 2520

caacatatcc atcaccgccc ctcggcggca gatcagatca aagcaccagt gccgggctgg 2 580

ttagtgggtg gtgcacagcc gggtaagcaa gataaatgct cttattccgg tatttttgct 2640

accggcactt tacccgctgc cagcacttta cctgcaacga cttatctcga ccactggtgc 2700

agctacgcca ccaatgaagt ggcgattaac tggaatgcac ctttagtgta cgtgctggcc 2760

tggagccttt caccagactc catgaccaaa tga 2793<210> 106<211> 930

<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental

<220>

<221> SIGNAIi<222> (1) . . . (22)<400> 106

Met Lys Phe Thr Leu Met Pro Leu Leu Cys Gly Phe Ala Leu Leu Leu

1 5 10 15

Gly Cys Ala Val Gln Ala Thr Pro Ala Ala Ser Leu Gln Gln Ala Tyr

20 25 30

Gln Pro Tyr Phe His Ile Gly Thr Ala Val Ser Leu Ala Gln Leu Gln35 40 45

Ala Ser Lys Asn His Glu Arg Asp Leu Ile Ala Gln His Phe Asn Ser50 55 60

Leu Thr Ala Glu Asn Leu Met Lys Trp Glu Lys Ile Gln Pro Thr Glu65 70 75 80

Gly Asn Phe Asp Phe Thr Ala Ala Asp Lys Leu Val Ala Phe Ala Glu85 90 95

Gln His Arg Met Trp Leu Val Gly His Thr Ile Leu Trp His Glu Gln

100 105 HO

Thr Pro Asp Trp Val Phe Gln Gly Pro Asp Gly Lys Pro Ala Ser Lys115 120 125

Gln Val Leu Leu Gly Arg Leu Lys Lys His Ile Gln Thr Val Val Gly130 135 140

Arg Tyr Gln Gly Arg Val His Gly Trp Asp Val Val Asn Glu-Ala Leu145 150 155 160

Asn Glu Asp Gly Ser Leu Arg Asp Thr Pro Trp Arg Lys Ile Leu Gly165 170 175

Asp Asp Tyr Ile Ala Thr Thr Phe Ala Leu Val His Gln Val Asp Pro

180 185 190

Lys Ala Lys Leu Tyr Tyr Asn Asp Tyr Asn Leu Tyr Lys Pro Lys Lys195 200 205

Arg Thr Gly Val Leu Arg Ile Ile Gln Gln Leu Gln Gln Gln Gln Val210 215 220

Pro Ile His Ala Ile Gly Glu Gln Ala His Tyr Gly Leu Asp Ser Pro225 230 235 240

245 250 255

Leu Asp Val Met Leu Thr Glu Leu Glu Ile Ser Val Leu Pro Phe Pro

260 265 270

Pro Gly Met Thr Pro Gly Ala Asp Ile Ser Gln His Gln Glu Leu Gln275 280 285

Gln Gln Leu Asn Pro Tyr Arg Glu Gly Leu Pro Lys Thr Val Glu Gln290 295 300

Ala Trp Gln Gln Arg Tyr Leu Asp Leu Phe Ser Leu Leu Leu Arg Gln305 310 315 320

His Gln Lys Leu His Arg Val Thr Phe Trp Gly Leu Asp Asp Gly Gln

325 330 335

Ser Trp Arg Asn Asn Phe Pro Met Arg Gly Arg Thr Asp Tyr Pro Leu

340 345 350

Leu Phe Asp Arg Lys Leu Gln Ala Lys Pro Leu Leu Ser Ala Leu Ile

355 360 365

Lys Leu Ala Glu Thr Gln Ala Ser Ala Lys Pro Lys Val Asn Gln Leu

370 375 380

Gly Phe Ala Pro Asn Ala Gln Lys Leu Leu Val Val Pro Gly Arg Gln385 390 395 400

Ala Val Ser Phe Gln Ile Ile Asn Gln Ser Asn Gly Lys Thr Val Leu

405 410 415

Gln Gly Gln Ser Ser Val Ala Gln Phe Trp Pro Glu Ser Gly Glu Trp

420 425 430

Val Ser Ile Ala Asp Phe Ser Thr Leu Thr Thr Gln Gly Arg Tyr Gln

435 440 445

Val Glu Ala Ala Gly Leu Thr Pro Ile Thr Val Glu Ile Thr Ala Glu

450 455 460

Pro Tyr Ala Ala Leu His Asp Ala Ser Ile Lys Ala Tyr Tyr Phe Asn465 470 475 480

Arg Ala Ser Leu Ala Leu Glu Pro Ser Phe Ala Gly Pro Trp Ala Arg

485 490 495

Ala Ala Gly His Pro Asp Asn Lys Val Leu Val His Thr Ser Ala Ala

500 505 510

Ser Asp Lys Arg Pro Ala Gly Phe Val Ile Ser Ala Ala Lys Gly Trp

515 520 525

Tyr Asp Ala Gly Asp Tyr Asn Lys Tyr Val Val Asn Ser Gly Ile Ser

530 535 540

Ser Tyr Thr Leu Leu Gln Ala Trp Gln Asp Phe Pro Glu Phe Tyr Arg545 550 555 560

Asp Arg Thr Trp Asn Leu Pro Glu Ser Ser Asn Asn Leu Pro Asp Ile

565 570 575

Leu Asp Glu Thr Leu Trp Asn Leu Gln Trp Leu Ser Thr Met Gln Asp

580 585 590

Pro Ser Asp Gly Gly Val Tyr His Lys Leu Thr Glu Leu Asn Phe Ser

595 600 605

Ala Thr Gln Met Pro Ser Glu Val Thr Ala Pro Arg Tyr Val Val Gln

610 615 620

Lys Thr Thr Ala Ala Ala Leu Asn Phe Ala Ala Val Leu Ala Lys Ala625 630 635 640

Ser Arg Ile Phe Thr Glu Phe Glu Thr Gln Leu Pro Gly Leu Ser Gln

645 650 655

Gln Tyr Arg Gln Gln Ala Leu Ala Ala Trp Gln Trp Ala Gln Lys Asn

660 665 670

Pro Gln Gln Ile Tyr Gln Gln Pro Ala Asp Val His Thr Gly Ala Tyr

675 680 685

Gly Asp Lys Gln Leu Ala Asp Glu Trp Ala Trp Ala Gly Ala Glu Leu

690 695 700

Tyr Leu Leu Thr Gly Glu Gln Ser Tyr Leu Gln Pro Leu Leu Ala Leu705 710 715 720

Glu Thr Pro Ile Thr Ala Ala Ser Trp Ala Asn Val Ala Ala Leu Gly

725 730 735

Tyr Phe Ala Leu Ala Ser Ala Glu Gln Phe Glu Pro Ala Leu Arg Lys

740 745 750

Lys Val Gln Gln Lys Ile Gln Gln Ala Ala Ala Gln Ile Val Ala Glu

755 760 765

His Gln Ala Ser Ala Tyr Gln Val Ala Met Thr Gln Lys Asp Phe Val

770 775 780

Trp Gly Ser Asn Ala Val Ala Met Asn Lys Gly Met Leu Leu Tyr Gln785 790 795 800

Ala Trp Lys Ile Asp Pro Gln Pro Glu Leu Arg Gln Ala Met Gln Gly

805 810 815

Leu Leu Asp Tyr Val Leu Gly Arg Asn Pro Leu Gln Leu Ser Tyr Val

820 825 830

Thr Gly Phe Gly Ala Gln Ser Pro Gln His Ile His His Arg Pro Ser835 840 845Ala Ala Asp Gln Ile Lys Ala Pro Val Pro Gly

850 855

Ala Gln Pro Gly Lys Gln Asp Lys Cys Ser Tyr

865 870 875

Thr Gly Thr Leu Pro Ala Ala Ser Thr Leu Pro

885 890

Asp His Trp Cys Ser Tyr Ala Thr Asn Glu Val

900 905

Ala Pro Leu Val Tyr Val Leu Ala Trp Ser Leu

915 920

Thr Lys

930

<210> 107<211> 1725<212> DNA<213> Bactéria<400> 107

gtgtggaagc ccggattgtg gaatttcctt caaatggcaggatggaaaca ctccggttcc gacacccagt ccaaagccgggaagattatg acggtattaa ttcttcaagt attgagataaggcagaggaa taggttatat taccagtggt gattatctggggaaacggag caacgtcgtt taaggccaag gttgcaaatgcttagattaa acggtccgaa tggtactctc ataggcacacgattggaata catatgagga gcaaacttgc agcattagcattgtacttgg tattcaaagg ccctgtaaac atagactggtagttccacag gtctggggga tttaaatggt gacggaaatagcgttaaaga ggcatttgct cggtatatca ccgcttacgggatgtaaata ggagcggcaa agtggattct actgactattctccgcatta ttacagagtt ccccggacaa ggtgatgtacactccgacac aaactcctat ccccacgatt tcgggaaatggcaaggggaa taaaaatcgg aacatgtgtc aactatccgtacctacaaca gcattttgca aagagaattt tcaatggttgtttgatgctt tgcagccgag acaaaacgtt tttgatttttgcttttgcag aaagaaacgg tatgcagatg aggggacataaacccgtcat ggcttacaaa cggtaactgg aaccgggattaatcacatta ccactgttat gacccattac aaaggtaaaaaacgaatgta tggatgattc cggcaacggc ttaagaagcaggtcaggact accttgacta tgctttcagg tatgcaagagcttttctaca atgattataa tattgaagac ttgggtccaaatgattaaaa gtatgaagga aagaggtgtg ccgattgacgtttatcaatg gaatgagccc cgagtacctt gccagcattggcggaaatag gcgttatagt atcctttacc gaaatagataaacccggcaa ctgcattcca ggtacaggca aacaactatactggcaaacc ccaattgcaa tacctttgta atgtggggatattccgggaa ctttcccagg atatggcaat ccattgatttaaaccggcat acaatgcaat aaaggaagct cttatgggct<210> 108<211> 574<212> PRT<213> Bactéria<400> 108

Trp Leu Val Gly Gly860

Ser Gly Ile Phe Ala880

Ala Thr Thr Tyr Leu895

Ala Ile Asn Trp Asn910

Ser Pro Asp Ser Met925

atgaagccggctaacacacgtaggtgttcctatacaagagcaaatacttctctcggtaaaaagtcaccggtcacttttggttaactcgtcgagaggctctcagtgctgaaagacacccaactcttagggatttacaacaatatgtgaaaacgaaaggagacgttgatttgcgctgcttgcttgttgagtggcatatggagaagcagatccagtccaatgcgagtaggattatcaaaatattacgcataccaggaacttattcacagataaatgacagcaaattga

attçjacgaggtattgaagcgacctgaaggatatagactttcaatattgaaatccacaggaaataaatgatcgttgaaagcggaccttcagtttaagagcgaagatatatatccgtctgttttatgcggagttcagatccatgaaatgaagccagttgcttgcacaatcaaggtaatgaaaggatgtggcaaaatgtaatccgatgcacttggtatttaacccaatgccactaagagatattcagtcggaagaaaatttgtatacacatggttacaatccg

10

20

25

35

40

50

55

65

70

85

90

100

105

Thr Leu Ser Val Lys Ser Thr Gly Asp Trp Asn

115

120

Gln Met Ala Asp Glu 15 AlaPro Thr Pro Ser 30 Pro LysTyr Asp Gly 45 Ile Asn SerGlu Gly 60 Gly Arg Gly IleTyr Lys Ser Ile Asp Phe75 80Val Ala Asn Ala Asn 95 ThrAsn Gly Thr Leu 110 Ile GlyAsn Thr Tyr 125 Glu Glu Gln

601201802403003604204805406006607207808409009601020108011401200126013201380144015001560162016801725Thr Cys Ser Ile Ser Lys Val Thr Gly Ile Asn Asp Leu Tyr Leu Val

130 135 140

Phe Lys Gly Pro Val Asn Ile Asp Trp Phe Thr Phe Gly Val Glu Ser145 150 155 160

Ser Ser Thr Gly Leu Gly Asp Leu Asn Gly Asp Gly Asn Ile Asn Ser

165 170 175

Ser Asp Leu Gln Ala Leu Lys Arg His Leu Leu Gly Ile Ser Pro Leu

180 185 190

Thr Gly Glu Ala Leu Leu Arg Ala Asp Val Asn Arg Ser Gly Lys Val195 200 205

Asp Ser Thr Asp Tyr Ser Val Leu Lys Arg Tyr Ile Leu Arg Ile Ile

210 215 220

Thr Glu Phe Pro Gly Gln Gly Asp Val Gln Thr Pro Asn Pro Ser Val225 230 235 240

Thr Pro Thr Gln Thr Pro Ile Pro Thr Ile Ser Gly Asn Ala Leu Arg

245 250 255

Asp Tyr Ala Glu Ala Arg Gly Ile Lys Ile Gly Thr Cys Val Asn Tyr

260 265 270

Pro Phe Tyr Asn Asn Ser Asp Pro Thr Tyr Asn Ser Ile Leu Gln Arg275 280 285

Glu Phe Ser Met Val Val Cys Glu Asn Glu Met Lys Phe Asp Ala Leu

290 295 300

Gln Pro Arg Gln Asn Val Phe Asp Phe Ser Lys Gly Asp Gln Leu Leu305 310 315 320

Ala Phe Ala Glu Arg Asn Gly Met Gln Met Arg Gly His Thr Leu Ile

325 330 335

Trp His Asn Gln Asn Pro Ser Trp Leu Thr Asn Gly Asn Trp Asn Arg

340 345 350

Asp Ser Leu Leu Ala Val Met Lys Asn His Ile Thr Thr Val Met Thr355 360 365

His Tyr Lys Gly Lys Ile Val Glu Trp Asp Val Ala Asn Glu Cys Met

370 375 380

Asp Asp Ser Gly Asn Gly Leu Arg Ser Ser Ile Trp Arg Asn Val Ile385 390 395 400

Gly Gln Asp Tyr Leu Asp Tyr Ala Phe Arg Tyr Ala Arg Glu Ala Asp

405 410 415

Pro Asp Ala Leu Leu Phe Tyr Asn Asp Tyr Asn Ile Glu Asp Leu Gly

420 425 430

Pro Lys Ser Asn Ala Val Phe Asn Met Ile Lys Ser Met Lys Glu Arg435 440 445

Gly Val Pro Ile Asp Gly Val Gly Phe Gln Cys His Phe Ile Asn Gly

450 455 460

Met Ser Pro Glu Tyr Leu Ala Ser Ile Asp Gln Asn Ile Lys Arg Tyr465 470 475 480

Ala Glu Ile Gly Val Ile Val Ser Phe Thr Glu Ile Asp Ile Arg Ile

485 490 495

Pro Gln Ser Glu Asn Pro Ala Thr Ala Phe Gln Val Gln Ala Asn Asn

500 505 510

Tyr Lys Glu Leu Met Lys Ile Cys Leu Ala Asn Pro Asn Cys Asn Thr515 520 525

Phe Val Met Trp Gly Phe Thr Asp Lys Tyr Thr Trp Ile Pro Gly Thr

530 535 540

Phe Pro Gly Tyr Gly Asn Pro Leu Ile Tyr Asp Ser Asn Tyr Asn Pro545 550 555 560

Lys Pro Ala Tyr Asn Ala Ile Lys Glu Ala Leu Met Gly Tyr

565 570

<210> 109<211> 1242<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 109

atgctaaaag ttttacgtaa acctattatt tctggattag ctttagctct attattgccg 60

gcaggggcag ctggtgccga aactaatatt tcaaagaagc caaatataag tggattaacc 120

gcgccgcaat tagaccaaag atataaagat tctttcacca ttggtgctgc ggttgagccg 180

tatcaattat tagatgcaaa agattcacaa atgctaaagc ggcattttaa tagtatcgta 240gcagagaatg tcatgaagcc tagtagttta cagccagtag aaggacaatt caattgggagccggccgata aacttgttca gtttgcgaag gaaaatggaa tggacatgcg cggacatacgcttgtctggc atagccaggt accggattgg ttctttgaag atgcggcagg aaatccaatggttgtttggg aaaatggcag gcaagtggtt gccgatccag caaatcttca ggaaaacaaagagctcttac ttagccgatt acaaaatcat attcaggcag tcgtaacgcg ttataaagatgatataaaat cttgggatgt tgttaatgaa gtaatcgatg aatggggcgg acattctgaagggctgcgtc aatctccatg gttcctcatc accggaacgg actatattaa agttgcttttgaaactgcaa gagaatatgc agctccagac gctaagctgt atatcaatga ttacaataca 720

84090096010201080

300360420480540600660

gaagtagaac caaaaaggac gcacctttat aacttagtaa aaagtttaaa agaagaacaaaacgttccaa ttgatggtgt tgggcatcag tctcacattc aaattggctg gccttcagaaaaagaaattg aagataccat taatatgttt gcagatcttg gtttagataa ccaaatcaccgagcttgatg ttagtatgta tggctggcca gtaaggtcgt atccaactta tgatgcgatcccagaactta aattcatgga tcaagcagct cgttatgatc gtttatttaa gttatatgagaaattaggag ataaaatcag taatgtgaca ttctggggta ttgcggataa ccatacatggctgaatgacc gtgcagatgt ttactatgat gaaaatggaa atgttgtatt agatagagaa 1140acaccaagag tagaaagagg agcaggaaaa gatgcgccat ttgtatttga tcctgaatac 1200aatgtaaaac cagcttattg ggcaattatc gaccacaaat aa 1242

<210> 110<211> 413<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(26)<400> 110

Met Leu Lys Val Leu Arg Lys Pro Ile Ile Ser Gly Leu Ala Leu Ala

1 5 10 15

Leu Leu Leu Pro Ala Gly Ala Ala Gly Ala Glu Thr Asn Ile Ser Lys

20 25 30

Lys Pro Asn Ile Ser Gly Leu Thr Ala Pro Gln Leu Asp Gln Arg Tyr

35 40 45

Lys Asp Ser Phe Thr Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Leu

50 55 60

Asp Ala Lys Asp Ser Gln Met Leu Lys Arg His Phe Asn Ser Ile Val65 70 75 80

Ala Glu Asn Val Met Lys Pro Ser Ser Leu Gln Pro Val Glu Gly Gln

85 90 95

Phe Asn Trp Glu Pro Ala Asp Lys Leu Val Gln Phe Ala Lys Glu Asn

100' 105 HO

Gly Met Asp Met Arg Gly His Thr Leu Val Trp His Ser Gln Val Pro

115 120 125

Asp Trp Phe Phe Glu Asp Ala Ala Gly Asn Pro Met Val Val Trp Glu

130 135 140

Asn Gly Arg Gln Val Val Ala Asp Pro Ala Asn Leu Gln Glu Asn Lys145 150 155 160

Glu Leu Leu Leu Ser Arg Leu Gln Asn His Ile Gln Ala Val Val Thr

165 170 175

Arg Tyr Lys Asp Asp Ile Lys Ser Trp Asp Val Val Asn Glu Val Ile

180 185 190

Asp Glu Trp Gly Gly His Ser Glu Gly Leu Arg Gln Ser Pro Trp Phe

195 200 205

Leu Ile Thr Gly Thr Asp Tyr Ile Lys Val Ala Phe Glu Thr Ala Arg

210 215 220

Glu Tyr Ala Ala Pro Asp Ala Lys Leu Tyr Ile Asn Asp Tyr Asn Thr225 230 235 240

Glu Val Glu Pro Lys Arg Thr His Leu Tyr Asn Leu Val Lys Ser Leu

245 250 255

Lys Glu Glu Gln Asn Val Pro Ile Asp Gly Val Gly His Gln Ser His

260 - 265 270

Ile Gln Ile Gly Trp Pro Ser Glu Lys Glu Ile Glu Asp Thr Ile Asn

275 280 285

Met Phe Ala Asp Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu Asp Val

290 ' 295 300

Ser Met Tyr Gly Trp Pro Val Arg Ser Tyr Pro Thr Tyr Asp Ala Ile305 310 315 320Pro Glu Leu Lys Phe Met Asp Gln Ala Ala Arg Tyr Asp Arg Leu Phe

325 330 335

Lys Leu Tyr Glu Lys Leu Gly Asp Lys Ile Ser Asn Val Thr Phe Trp340 345 350

Gly Ile Ala Asp Asn His Thr Trp Leu Asn Asp Arg Ala Asp Val Tyr355 360 365

Tyr Asp Glu Asn Gly Asn Val Val Leu Asp Arg Glu Thr Pro Arg Val

370 375 380

Glu Arg Gly Ala Gly Lys Asp Ala Pro Phe Val Phe Asp Pro Glu Tyr385 390 395 400

Asn Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys405 410

<210> 111<211> 1089<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 111

atgttgacga ccccgacaac tcaagatcat gtccccgtgc ttaaggacgc tttcaaaggc 60

aagttcctca ttggagccgt gctgggttat gacgcactcc agggaaagga tccggcgagt 120

gtggaaattg cgaccacgca cttcgatgct ctcactgcgg aaaacagcat gaagcccgct 180

ctggtgcaac ctaaagaggg cgaatttgac ttcgctgatg gagaccggct tcttgacatc 240

acacagcagt gcggtgcgac tgcgattggc cacactttgc tctggcacca acagacaccg 300

aaatggtttt tcgaggggcc agatgaccag cctactaacc gcgagttggc cctggcacgc 360

atgagaaagc acatcgccac tcttgttggc cgttacaaag gtcgcattaa gcaatgggat 420

gtggtgaatg aggcgattag cgatgcagag ggcgagtact tgagaccaaa tagtccatgg 480

ttcaaggctg ttggagaaga tcacattgcg caggctttcc gggcagcgca cgaagccgat 540

cctgacgcca tcctcatcta taacgattac aacatcgagc aggagtacaa gcgtcccaaa 600

gcgatacgac tgctgaggtc attacttgag caggacgttc cccttcatgc cgtgggcatc 660

cagggccact ggcgtatgga cactctgaat gttgccgaaa tcgaagaagc tatcaaagaa 720

tttgctgcgc tgggtctcaa ggtcatgatc accgagcttg acatcagcgt gctaccgaca 780

aagtatcagg gagccgatct ctctacccgc gaagaattga cgcctgaaat caatccctat 840

acggagggac tacccgagaa cgttgcccgg caacatgccg aatgttaccg ccaagtcttc 900

aaaatgttcc tgtgccacaa ggatgccatt ggccgtgtca cgctctgggg cgttcatgat 960

ggcagatcat ggttcaatga ctttcccgtc agagggcgca ccgattatcc tctgcttttc 1020gaccggcagg gcaaacccaa gccagcattt tttgccgtct tgaaggctgc gcaagatcag 1080ccacaatga 1089

<210> 112<211> 362

<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental

<400> 112

Met Leu Thr Thr Pro Thr Thr Gln Asp His Val Pro Val Leu Lys Asp

1 5 10 15

Ala Phe Lys Gly Lys Phe Leu Ile Gly Ala Val Leu Gly Tyr Asp Ala20 25 30

Leu Gln Gly Lys Asp Pro Ala Ser Val Glu Ile Ala Thr Thr His Phe35 40 45

Asp Ala Leu Thr Ala Glu Asn Ser Met Lys Pro Ala Leu Val Gln Pro

50 55 60

Lys Glu Gly Glu Phe Asp Phe Ala Asp Gly Asp Arg Leu Leu Asp Ile65 70 75 80

Thr Gln Gln Cys Gly Ala Thr Ala Ile Gly His Thr Leu Leu Trp His

85 90 95

Gln Gln Thr Pro Lys Trp Phe Phe Glu Gly Pro Asp Asp Gln Pro Thr100 105 110

Asn Arg Glu Leu Ala Leu Ala Arg Met Arg Lys His Ile Ala Thr Leu115 120 125

Val Gly Arg Tyr Lys Gly Arg Ile Lys Gln Trp Asp Val Val Asn Glu

130 135 140

Ala Ile Ser Asp Ala Glu Gly Glu Tyr Leu Arg Pro Asn Ser Pro Trp145 150 155 160

Phe Lys Ala Val Gly Glu Asp His Ile Ala Gln Ala Phe Arg Ala Ala165 170 175His Glu Ala Asp Pro Asp Ala Ile Leu Ile Tyr Asn Asp Tyr Asn Ile

180 185 190

Glu Gln Glu Tyr Lys Arg Pro Lys Ala Ile Arg Leu Leu Arg Ser Leu195 200 205

Leu Glu Gln Asp Val Pro Leu His Ala Val Gly Ile Gln Gly His Trp210 215 220

Arg Met Asp Thr Leu Asn Val Ala Glu Ile Glu Glu Ala Ile Lys Glu225 230 235 240

Phe Ala Ala Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp Ile Ser245 250 255

Val Leu Pro Thr Lys Tyr Gln Gly Ala Asp Leu Ser Thr Arg Glu Glu

260 265 270

Leu Thr Pro Glu Ile Asn Pro Tyr Thr Glu Gly Leu Pro Glu Asn Val275 280 285

Ala Arg Gln His Ala Glu Cys Tyr Arg Gln Val Phe Lys Met Phe Leu290 295 300

Cys His Lys Asp Ala Ile Gly Arg Val Thr Leu Trp Gly Val His Asp305 310 315 320

Gly Arg Ser Trp Phe Asn Asp Phe Pro Val Arg Gly Arg Thr Asp Tyr325 330 335

Pro Leu Leu Phe Asp Arg Gln Gly Lys Pro Lys Pro Ala Phe Phe Ala

340 345 350

Val Leu Lys Ala Ala Gln Asp Gln Pro Gln355 360

<210> 113

<211> 1155<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 113

atgttaaaag tattgcgtaa accacttttt tctggattag ctttagcgat agtattacct 60

accggattat ccagtgctta tgcagctgaa aatcaaccag ttagtgcatt agatgcagcg 120

gttgaacttg atgaaagata tgcagaatca ttcgatattg gtgcagccgt tgagccttct 180

atgcttcaag gaaaagatgc tgaagtatta aagcgtcatt ataacagcat tgtggccgaa 240aatgtaatga aaccgattaa tatacagcct gaagaaggaa agttcacttt taaagaaatg 300

gataaaatcg ttaagtttgc gaaagaaaat aatatgaagc ttcgtggcca tacccttatt 360tggcacagtc aagtaccgga gtggttcttc cttgataaag aaggaaataa gatggtggat 420

gaaacggatc caaagcagcg cgaaaaaaat aaaaggcttt tacttaagcg tttagaaacg 480

catattaaaa cgatcgtcaa gcgctataaa aatgatatta gctcctggga cgtggtcaac 540gaggtagtgg atgataacgg gaaattacgt aattcaccct ggtatcaaat cacaggtact 600

gattatatca aggttgcttt tgaaacagcg gaccgttatg cagggaagaa cgctaagctt 660

tatatcaatg açtacaacac ggaaatagac cctaaaagag aaaccctcta taatcttgtc 720

aaggaattag tgaaggaggg agtcccagtt gatggagtgg gacatcaagc tcatatccaa 780

atcggctggc caactatagc ggaaatcgag aaaaccatta atatgt.ttgc agaccttggc 840ctagacaatc aaattacaga actagatgtt agcctttatg ggtggccgcc aaagcctgct 900

tacccaactt atgacgaaat cccggcaagt gaattcgaac gtcaagctgt tcgttacgat 960

caactatttg atttatacga gagattggga gataaaatta gcagtgtgac attctggggc 1020gttgctgaca accatacatg gttaaatgac cgtgcagaâc aatataatga cggggtaggc 1080gtggacgcac catttgtttt cgataaggat tataatgtaa aaccagctta ttgggctatt 1140atcgatcgcg attaa 1155

<210> 114<211> 384<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220> ,<221> SIGNAL<222> (1)...(28)<400> 114

Met Leu Lys Val Leu Arg Lys Pro Leu Phe Ser Gly Leu Ala Leu Ala1 5 10 15

Ile Val Leu Pro Thr Gly Leu Ser Ser Ala Tyr Ala Ala Glu Asn Gln

20 25 30

Pro Val Ser Ala Leu Asp Ala Ala Val Glu Leu Asp Glu Arg Tyr Ala35 40 45Glu Ser Phe Asp Ile Gly Ala Ala Val Glu Pro Ser Met Leu Gln Gly

50 55 60

Lys Asp Ala Glu Val Leu Lys Arg His Tyr Asn Ser Ile Val Ala Glu

65 70 75 80

Asn Val Met Lys Pro Ile Asn Ile Gln Pro Glu Glu Gly Lys Phe Thr

85 90 95

Phe Lys Glu Met,. Asp Lys Ile Val Lys Phe Ala Lys Glu Asn Asn Met

100 105 110

Lys Leu Arg Gly His Thr Leu Ile Trp His Ser Gln Val Pro Glu Trp

115 120 125

Phe Phe Leu Asp Lys Glu Gly Asn Lys Met Val Asp Glu Thr Asp Pro

130 135 140

Lys Gln Arg Glu Lys Asn Lys Arg Leu Leu Leu Lys Arg Leu Glu Thr

145 150 155 160

His Ile Lys Thr Ile Val Lys Arg Tyr Lys Asn Asp Ile Ser Ser Trp

165 170 175

Asp Val Val Asn Glu Val Val Asp Asp Asn Gly Lys Leu Arg Asn Ser

180 185 190

Pro Trp Tyr Gln Ile Thr Gly Thr Asp Tyr Ile Lys Val Ala Phe Glu

195 200 205

Thr Ala Asp Arg Tyr Ala Gly Lys Asn Ala Lys Leu Tyr Ile Asn Asp

210 215 220

Tyr Asn Thr Glu Ile Asp Pro Lys Arg Glu Thr Leu Tyr Asn Leu Val225 230 235 240

Lys Glu Leu Val Lys Glu Gly Val Pro Val Asp Gly Val Gly His Gln

245 250 255

Ala His Ile Gln Ile Gly Trp Pro Thr Ile Ala Glu Ile Glu Lys Thr

260 265 270

Ile Asn Met Phe Ala Asp Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu275 280 285

Asp Val Ser Leu Tyr Gly Trp Pro Pro Lys Pro Ala Tyr Pro Thr Tyr

290 295 300

Asp Glu Ile Pro Ala Ser Glu Phe Glu Arg Gln Ala Val Arg Tyr Asp305 310 315 320

Gln Leu Phe Asp Leu Tyr Glu Arg Leu Gly Asp Lys Ile Ser Ser Val

325 330 335

Thr Phe Trp Gly Val Ala Asp Asn His Thr Trp Leu Asn Asp Arg Ala

340 345 350

Glu Gln Tyr Asn Asp Gly Val Gly Val Asp Ala Pro Phe Val Phe Asp355 360 365

Lys Asp Tyr Asn Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp Arg Asp

370 375 380

<210> 115<211> 1362<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 115

atgacgaacc gtaaatcgaa cgtgcaccgt tcattgaccg atgatttgct cgatggtgtc 60

ttcgccgagg caaaagcggg caaagttgag aagtaccgtg ccaccgggat ccttggaacg 120

ctattcggat tcactgtggc gtcctccatc atgttggcgg cttgcagcaa cgcacaagagaatgttccac cagttgcttc atccaccgca cagagcaata tcacccagga gaacgttccgccgctcaaag atgcgtttaa gggcaagttc ttgattggca ccgcggtgag caatcgcttgctggagggac aagatccggc cacggaagcc ttggtgcgca ggcacttcga tgctctcacg 360gcggaaaacg ccatgaagcc ggatgcactg caaccgcgcg aaggccagtt caacttcgtcgccgccgacc gtctggtgga aatcgcccag caaagcggcg cgacagtggt cggccacacgctggtctggc-actcccaaac gccaggctgg ttcttccagg gtccgaatgg ccagccagcgagtcgagaac tggccctggc gcggatgcga acacacatca agacggtggt gggacgctacaaagggcgca tcaagcagtg ggatgtggtc aacgaagcga tcaacgacgg ccctggcgtg 660

ctgcggcaaa gtccgtggct gcgtgccatc ggcgaagact acatcgccga agcgttccgc 720

gccgcgcacg aagccgatcc tgacgccatt ctggtctaca acgactacaa catcgaactcaactacaagc gtcccaaggc gctggaactg ctaaagaagc tcatcgacca gaaggttccgattcatggtg tgggcattca ggctcactgg cgcatgaccc cgccgctggc cgagaccgaagaagccatca aacagttcgc cgcgctgggc ctgáaggtga tgttcaccga actggacatc 960

ggtgtgctgc ccactcagta tcagggggct gacatctcgg cgcgtgaaac catgacaccc 1020.gaacagcaag cggtgatgaa cccttacact cagggcttgc cggctgaagt ggcacagcaa 1080

180240300

420480540600

780840900catgccgagccgcgtcacgcggccgcaccggccgtcaggcacagcgaaga<210> 116<211> 453<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 116

Met Thr Asn Arg Lys Ser Asn Val His Arg Ser Leu Thr Asp Asp Leu1 5 10 15 Leu Asp Gly Val Phe Ala Glu Ala Lys Ala Gly Lys Val Glu Lys Tyr 20 25 30 Arg Ala Thr Gly Ile Leu Gly Thr Leu Phe Gly Phe Thr Val Ala Ser 35 40 45 Ser Ile Met Leu Ala Ala Cys Ser Asn Ala Gln Glu Asn Val Pro Pro 50 55 60 Val Ala Ser Ser Thr Ala Gln Ser Asn Ile Thr Gln Glu Asn Val Pro65 70 75 80Pro Leu Lys Asp Ala Phe Lys Gly Lys Phe Leu Ile Gly Thr Ala Val 85 90 95 Ser Asn Arg Leu Leu Glu Gly Gln Asp Pro Ala Thr Glu Ala Leu Val 100 105 110 Arg Arg His Phe Asp Ala Leu Thr Ala Glu Asn Ala Met Lys Pro Asp 115 120 125 Ala Leu Gln Pro Arg Glu Gly Gln Phe Asn Phe Val Ala Ala Asp Arg 130 135 140 Leu Val Glu Ile Ala Gln Gln Ser Gly Ala Thr Val Val Gly His Thr145 150 155 160Leu Val Trp His Ser Gln Thr Pro Gly Trp Phe Phe Gln Gly Pro Asn 165 170 175 Gly Gln Pro Ala Ser Arg Glu Leu Ala Leu Ala Arg Met Arg Thr His 180 185 190 Ile Lys Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys Gln Trp Asp 195 200 205 Val Val Asn Glu Ala Ile Asn Asp Gly Pro Gly Val Leu Arg Gln Ser 210 215 220 Pro Trp Leu Arg Ala Ile Gly Glu Asp Tyr Ile Ala Glu Ala Phe Arg225 230 235 240Ala Ala His Glu Ala Asp Pro Asp Ala Ile Leu Val Tyr Asn Asp Tyr 245 250 255 Asn Ile Glu Leu Asn Tyr Lys Arg Pro Lys Ala Leu Glu Leu Leu Lys 260 265 270 Lys Leu Ile Asp Gln Lys Val Pro Ile HiS Gly Val Gly Ile Gln Ala 275 280 285 His Trp Arg Met Thr Pro Pro Leu Ala Glu Thr Glu Glu Ala Ile Lys 290 295 300 Gln Phe Ala Ala Leu Gly Leu Lys Val Met Phe Thr Glu Leu Asp Ile305 310 315 320Gly Val Leu Pro Thr Gln Tyr Gln Gly Ala Asp Ile Ser Ala Arg Glü 325 330 335 Thr Met Thr Pro Glu Gln Gln Ala Val Met Asn Pro Tyr Thr Gln Gly 340 345 350 Leu Pro Ala Glu Val Ala Gln Gln His Ala Glu Arg Tyr Arg Gln Ala 355 360 365 Phe Glu Leu Phe Leu Axg His Lys Asp Val Ile Gly Arg Val Thr Leu 370 375 380 Trp Gly Thr His Asp Gly Glu Ser Trp Leu Asn Gly Phe Pro Val Arg385 390 395 400Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Arg Tyr Gln Pro Lys 405 410 415 Pro Ala Phe Phe Ala Val Arg Gln Val Ala Gln Ala His Thr Val Gln 420 425 430 Thr Thr Gly Ala Gln Thr Gln Ala Thr Ala Lys Thr Ile Gln Lys Ala

gctaccgaca ggccttcgag ctgttcctgctctggggcac gcatgatggc gaatcctggcactatccctt gctcttcgac cgccggtatcaggttgcaca ggcgcatact gtacaaacgacaattcaaaa agcttctcga gagtacttct

gccacaagga tgtgattggt 1140

tgaacggttt tccggtgcgg 1200

agccaaaacc agccttcttc 1260

ccggtgcgca aacccaagct 1320

ag 1362Ser Arg Glu Tyr Phe

450<210> 117<211> 1437<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 117

atgacgaacc gtaaattgaa cgtgcaccgt tcattgagcgttcgccgagt caaaagcggg caaagttgag aaataccgtgctattcggat tcactgtggc gtcctccatc atgttggcggaatgctccac cagttgcttc atccaccgca caaagcaataccgctcaagg atgcgtttaa gggcaagttc ttgattggcactgcagggac aagatccagc cacagaagcc ctggtgcgcagcggaaaatg ccatgaagcc tgatgccatg caacccagaggccgctgacc gcctggtgga aatcgcccag caaagcggcgttggtctggc atagccaaac gccaagctgg ttcttccaggagtcgggaac tggccttggc acggatgcga acgcacatcaaaaggacgca tcaagcaatg ggatgtggtc aacgaagcgactgcggccat cgccgtggtt gcgcgccatc ggcgaagactgccgcgcacg aagctgatcc cgacgcgatt ctcgtctacaaactacaagc gtcccaaggc gctggaacta ctgaagagacattcatggtg tgggcattca ggctcactgg cgcatgacccgagaccatca agcagttttc ggctttgggc ttgaaggtaaggtgtattgc caacacaata ccagggtgcc gacatctcgggaacagcaag cggtgatgaa cccttacacg cagggcttgccatgccgagc gttatcgtca ggcgtttgag ctgttcatgcçgcgttaccc tgtggggcac gcatgatggc gaatcttggcggccgcacgg attatcctct actgttcgac cgccggtatcgcggtgcaaa aggtcgcgca ggcgcagaac gcacaggcaggcacaaaacc cagttgcgca gaagaaatct gcaccaaggcactcaaaagc cagtggtaca aaagcaaagt gcggcaagtc<210> 118<211> 478<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 118

Met Thr Asn Arg Lys Leu Asn Val His Arg Ser

1 5 10

Leu Asp Gly Ala Phe Ala Glu Ser Lys Ala Gly

445

atgatttgctccacggggatcttgcagcaatcacccaggaccatcgcgagggcacttcgaagggtgagttccacggtggtgtccagatggagactgtggttcaacgacggtcatcgccgaacgactacaatcatcgagcacgccgctggctgatcaccgactcgcgagaccggctgaagtgttacaaggatgaacggtttagcctaagcccaaccgatcaaggcggctcagggccgcaga

cgatggcgcc 60ccttggaacg 120cgcacaagag 180gaacgttccg 240caatcgcttg 300cgccctcacg 360caactttgcc 420cggccacacc 480ccaaccggcg 540gggacgctac 600ccctggagtg 660agcgttccgc 720catcgagctc 780gaaggttccg 840cgagatggaa 900gttggacatt 960catgacaccc 1020ggcgcagcaa 1080tgtgattggt 1140tcccgttcgt 1200cgccttcttc 1260agcaccactt 1320aaatcagacc 1380aaagtaa 1437

20

25

Arg Ala Thr Gly Ile Leu Gly Thr Leu Phe Gly

35

40

Ser Ile Met Leu Ala Ala Cys Ser Asn Ala Gln

50

55

Val Ala Ser Ser Thr Ala Gln Ser Asn Ile Thr65 70 75

Pro Leu Lys Asp Ala Phe Lys Gly Lys Phe Leu

85 90

Ser Asn Arg Leu Leu Gln Gly Gln Asp Pro Ala

100 .105

Arg Arg His Phe Asp Ala Leu Thr Ala Glu Asn

115 120

Ala Met Gln Pro Arg Glu Gly Glu Phe Asn Phe

130- 135

Leu Val Glu Ile Ala Gln Gln Ser Gly Ala Thr145 150 155

Leu Val Trp His Ser Gln Thr Pro Ser Trp Phe

165 . 170

Gly Gln Pro Ala Ser Arg Glu Leu Ala Leu Ala

180 185

Ile Lys Thr Val Val Gly Arg Tyr Lys Gly Arg195 200

Leu Ser Asp

Lys Val Glu30

Phe Thr Val45

Glu Asn Ala60

Gln Glu Asn

Ile Gly Thr

Thr Glu Ala110

Ala Met Lys125

Ala Ala Ala140

Val Val Gly

Phe Gln Gly

Arg Met Arg190

Ile Lys Gln205

Asp Leu15

Lys Tyr

Ala Ser

Pro Pro

Val Pro80Ile Ala95

Leu Val

Pro Asp

Asp Arg

His Thr160Pro Asp17 5 'Thr His

Trp AspVal Val 210 Asn Glu Ala Ile Asn 215 Asp Gly Pro Gly Val 220 Leu Arg Pro SerPro Trp Leu Arg Ala Ile Gly Glu Asp Phe Ile Ala Glu Ala Phe Arg225 230 235 240Ala Ala His Glu Ala 245 Asp Pro Asp Ala Ile 250 Leu Val Tyr Asn Asp 255 TyrAsn Ile Glu Leu 260 Asn Tyr Lys Arg Pro 265 Lys Ala Leu Glu Leu 270 Leu LysArg Leu Ile 275 Glu Gln Lys Val Pro 280 Ile His Gly Val Gly 285 Ile Gln AlaHis Trp 290 Arg Met Thr Pro Pro 295 Leu Ala Glu Met Glu 300 Glu Thr Ile LysGln Phe Ser Ala Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp Ile305 310 315 320Gly Val Leu Pro Thr 325 Gln Tyr Gln Gly Ala 330 Asp Ile Ser Ala Arg 335 GluThr Met Thr Pro 340 Glu Gln Gln Ala Val 345 Met Asn Pro Tyr Thr 350 Gln GlyLeu Pro Ala 355 Glu Val Ala Gln Gln 360 His Ala Glu Arg Tyr 365 Arg Gln AlaPhe Glu 370 Leu Phe Met Arg Tyr 375 Lys Asp Val Ile Gly 380 Arg Val Thr LeuTrp Gly Thr His Asp Gly Glu Ser Trp Leu Asn Gly Phe Pro Val Arg385 390 395 400Gly Arg Thr Asp Tyr 405 Pro Leu Leu Phe Asp 410 Arg Arg Tyr Gln Pro 415 LysPro Ala Phe Phe 420 Ala Val Gln Lys Val 425 Ala Gln Ala Gln Asn 430 Ala GlnAla Ala Thr 435 Asp Gln Ala Pro Leu 440 Ala Gln Asn Pro Val 445 Ala Gln LysLys Ser 450 Ala Pro Arg Gln Ala 455 Ala Gln Asn Gln Thr 460 Thr Gln Lys ProVal Val Gln Lys Gln Ser Ala Ala Ser Arg Ala Ala Glu Lys 465 470 475 <210> 119 <211> 2559

<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 119

atgaaaaaaa gattgttagc gttgatagtg acattagttt ttattatctccccatattca ccacaccttt aacaaatgta gcaaaggctc aaagtaaccaaaatttgact ttgaaaacgg tactcaaggt tggggagcaa gaggtgtttcgcaaccgt.tt acgagcaagc ttatgaagga agttattctt taaaggtttctcaacgtggg atggagcagt tgtggatatc acatcaagta tttcagcaaaacagtttctt tatttgttcg tcacagcgat gtaaaaccac aaagattttctatgtcaaag ataacacagg cgaaaaatac atccaggttg cagacaaagtaacttttgga agcagctctt tgggaagttc acaatcacaa catcaaatccgtagaacttc ttgtatgtgt tccatctaac aaatctttag gattttatctgttattactt cagcacaacc agcttcctcg ggtgttgtta aatcttgcacggtagcactg agggttttgt tcagagaggt tcagcttcat tgacagttgttactatcatt ctccaacaaa agcattatat gtgacaggaa ggacagctacgcacagatag atatgacaag tttgcttgag aagggcaagg attatcagttgtatatcaaa atagtggaag tgatcagaag ataaccctta cgatgcaaaggatggaacta cgagttatga ttctataaag tatcagcaaa cagttccatcacagaagtaa caggttcata cacagtgcct cagacagcaa cacagcttatgaatcaccga atattaattt tgacttctac cttgatgact ttacagcggtccacctgttg taaacccagg gcttgttaaa tcttgcacat ttgaaagcggggttttgttc agagaggttc agcttcattg acagttgtcg acggtgtataccaacaaaag cattgtatgt gacaggaagg acagctacat ggcagggtgcatgacaagtt tgcttgagaa gggcaaggat tatcagttta gcatatgggtagtggaagtg atcagaagat aacccttacg atgcaaagga agaatgaagaagttatgatt ctataaagta tcagcaaaca gttccatctg gtacatggacggttcataca cagtgcctca gacagcaaca cagcttatat tctatgttgaattaattttg acttctacct tgatgacttt acagtaatag ataaaaatccccgattgcag caaaagaacc cgaatgggaa attccgtcac tttgtcagca

attgtttaat .· 60aacaaattta 120aacaactatt 180aggtagaagt 240tgtcacctat 300tgtctatgta 360ggttatgcca 420aattcaaaaa 480tgacaatgta 540atttgaaagc 600cgacggtgta 660atggcagggt 720tagcatatgg 780gaagaatgaa 840tggtacatgg 900attctatgtt 960tgacaaaaac 1020tagcactgag 1080ctatcattct 1140acagatagat 1200atatcaaaat 1260tggaactacg 1320agaagtaaca 1380atcaccgaat 1440agtgacggta 1500atatagtcaa 1560tatttctcaa taggtgttgc aataccgtat aaagtacttc aaaatcctgt tgaaagagca 1620atggtgttaa aacacttcaa cagtataaca gctgaaaatg agatgaaacc tgacgctctg 1680caaagaacag aagggaactt tacattcgat atagcagacc agtatgtaaa cttcgcacag 1740caaaacggta ttggaattag agggcatact ctggtatggc acagccaagt acctaattgg 1800ttcttccagc acagtgatgg aacttcactt gatccaagca atccagatga taagcaactt 1860ttgagagata gattgaaaaa tcatattcaa actgttatgt caagatacaa agggaaagtc 1920tatgcatggg atgttgtaaa cgaggcaata gatgaaagcc agcctgatgg atttagaaga 1980agcgaatggt acagaatact tggtccaaca cctgagacaa atggtattcc agaatacatt 2040gtgcttgctt tcaggtatgc aagagaggcg gatccggatg caaaactttt ctacaatgac 2100tacaacacag agatatctaa aaaaagacag tttatatatg acatggtaaa aaagctacat 2160gatatgggtt taattgatgg tgttggtttg caagggcata taaatgttga ttctccaaca 2220gtaaaagata tagaagatac aatcaatctt ttctcaacaa ttcctggact tgagatacag 2280gtaacagagc ttgacataag cgtttacaca agcagcagtc agcgttatga tacgcttcct 2340caggatataa tgataaaaca agcaatgaag tttaaagaac tatttgaaat gttaaagaga 2400catagtgata gagtcacaaa tgtgacactt tggggactta aggatgatta ttcatggctt 2460tcaaaggata gaaataactg gccattgctt tttgacagca actaccaggc aaaatacagc 2520tactgggcaa ttcaaaaagc ttctcgagag tacttctag 2559

<210> 120<211> 852<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(33)<400> 120

Met Lys Lys Arg Leu Leu Ala Leu Ile Val Thr Leu Val Phe Ile Ile1 5 10 15 Ser Leu Phe Asn 20 Pro Ile Phe Thr Thr 25 Pro Leu Thr Asn Val 30 Ala LysAla Gln Ser Asn Gln Thr Asn Leu Lys Phe Asp Phe Glu Asn Gly Thr 35 40 45 Gln Gly Trp Gly Ala Arg Gly Val Ser Thr Thr Ile Ala Thr Val Tyr 50 55 60 Glu Gln Ala Tyr Glu Gly Ser Tyr Ser Leu Lys Val Ser Gly Arg Ser65 70 75 80Ser Thr Trp Asp Gly 85 Ala Val Val Asp Ile 90 Thr Ser Ser Ile Ser 95 AlaAsn Val Thr Tyr 100 Thr Val Ser Leu Phe 105 Val Arg His Ser Asp 110 Val LysPro Gln Arg Phe Ser Val Tyr Val Tyr Val Lys Asp Asn Thr Gly Glu 115 120 125 Lys Tyr 130 Ile Gln Val Ala Asp 135 Lys Val Val Met Pro 140 Asn Phe Trp LysGln Leu Phe Gly Lys Phe Thr Ile Thr Thr Ser Asn Pro Ile Gln Lys145 150 155 160Val Glu Leu Leu Val 165 Cys Val Pro Ser Asn 170 Lys Ser Leu Gly Phe 175 TyrLeu Asp Asn Val Val Ile Thr Ser Ala Gln Pro Ala Ser Ser Gly Val 180 185 190 Val Lys Ser Cys Thr Phe Glu Ser Gly Ser Thr Glu Gly Phe Val Gln 195 200 .205 Arg Gly Ser Ala Ser Leu Thr Val Val Asp Gly Val Tyr Tyr His Ser 210 215 220 Pro Thr Lys Ala Leu Tyr Val Thr. Gly Arg Thr Ala Thr Trp Gln Gly 225 230 235 240Ala Gln Ile Asp Met Thr Ser Leu Leu Glu Lys Gly Lys Asp Tyr Gln 245 250 255 Phe Ser Ile Trp 260 Val Tyr Gln Asn Ser 265 Gly Ser Asp Gln Lys 270 Ile ThrLeu Thr Met 27.5 Gln Arg Lys Asn Glu 280 Asp Gly Thr Thr Ser 285 Tyr Asp SerIle Lys 290 Tyr Gln Gln Thr Val 295 Pro Ser Gly Thr Trp 300 Thr Glu Val ThrGly Ser Tyr Thr Val Pro Gln Thr Ala Thr Gln Leu Ile Phe Tyr Val305 310 315 320Glu Ser Pro Asn Ile Asn Phe Asp Phe Tyr Leu Asp Asp Phe Thr Ala 325 330 335 Val Asp Lys Asn Pro Pro Val Val Asn Pro Gly Leu Val Lys Ser Cys 340 345 350 Thr Phe Glu Ser Gly Ser Thr Glu Gly Phe Val Gln Arg Gly Ser Ala 355 360 365 Ser Leu Thr Val Val Asp Gly Val Tyr Tyr His Ser Pro Thr Lys Ala 370 375 380 Leu Tyr Val Thr Gly Arg Thr Ala Thr Trp Gln Gly Ala Gln Ile Asp385 390 395 400Met Thr Ser Leu Leu Glu Lys Gly Lys Asp Tyr Gln Phe Ser Ile Trp 405 410 415 Val Tyr Gln Asn Ser Gly Ser Asp Gln Lys Ile Thr Leu Thr Met Gln 420 425 430 Arg Lys Asn Glu Asp Gly Thr Thr Ser Tyr Asp Ser Ile Lys Tyr Gln 435 440 445 Gln Thr Val Pro Ser Gly Thr Trp Thr Glu Val Thr Gly Ser Tyr Thr 450 455 460 Val Pro Gln Thr Ala Thr Gln Leu Ile Phe Tyr Val Glu Ser Pro Asn465 470 475 480Ile Asn Phe Asp Phe Tyr Leu Asp Asp Phe Thr Val Ile Asp Lys Asn 485 490 495 Pro Val Thr Val Pro Ile Ala Ala Lys Glu Pro Glu Trp Glu Ile Pro 500 505 510 Ser Leu Cys Gln Gln Tyr Ser Gln Tyr Phe Ser Ile Gly Val Ala Ile 515 520 525 Pro Tyr Lys Val Leu Gln Asn Pro Val Glu Arg Ala Met Val Leu Lys 530 535 540 His Phe Asn Ser Ile Thr Ala Glu Asn Glu Met Lys Pro Asp Ala Leu545 550 555 560Gln Arg Thr Glu Gly Asn Phe Thr Phe Asp Ile Ala Asp Gln Tyr Val 565 570 575 Asn Phe Ala Gln Gln Asn Gly Ile Gly Ile Arg Gly His Thr Leu Val 580 585 590 Trp His Ser Gln Val Pro Asn Trp Phe Phe Gln His Ser Asp Gly Thr 595 600 605 Ser Leu Asp Pro Ser Asn Pro Asp Asp Lys Gln Leu Leu Arg Asp Arg 610 615 620 Leu Lys Asn His Ile Gln Thr Val Met Ser Arg Tyr Lys Gly Lys Val625 630 635 640Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Asp Glu Ser Gln Pro Asp 645 650 655 Gly Phe Arg Arg Ser Glu Trp Tyr Arg Ile Leu Gly Pro Thr Pro Glu 660 665 670 Thr Asn Gly Ile Pro Glu Tyr Ile Val Leu Ala Phe Arg Tyr Ala Arg 675 680 685 Glu Ala Asp Pro Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Glu 690 695 700 Ile Ser Lys Lys Arg Gln Phe Ile Tyr Asp Met Val Lys Lys Leu His705 710 715 720Asp Met Gly Leu Ile Asp Gly Val Gly Leu Gln Gly His Ile Asn Val 725 730 735 Asp Ser Pró Thr Val Lys Asp Ile Glu Asp Thr Ile Asn Leu Phe Ser 740 745 750 Thr Ile Pro Gly Leu Glu Ile Gln Val Thr Glu Leu Asp Ile Ser Val 755 760 765 Tyr Thr Ser Ser Ser Gln Arg Tyr Asp Thr Leu Pro Gln Asp Ile Met 770 775 780 Ile Lys Gln . Ala Met Lys Phe Lys Glu Leu Phe Glu Met Leu Lys Arg785 790 795 800His Ser Asp Arg Val Thr Asn Val Thr Leu Trp Gly Leu Lys Asp Asp 805 810 815 Tyr Ser Trp Leu Ser Lys Asp Arg Asn Asn Trp Pro Leu Leu Phe Asp 820 825 830 Ser Asn Tyr Gln Ala Lys Tyr Ser Tyr Trp Ala Ile Gln Lys Ala Ser 835 840 845 I Arg Glu Tyr Phe850<210> 121<211> 1905<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 121

atgaagcata tttttattgt attaattgtt tccctgctgt ttagcttcgg gggatatgctcaacaaacca ttagcagagc tccgcagggg tttgaccagc aacgtgccgg cattgcatccggtaaagttg aaatcgtaac ctataaatcg aaaaccgtag gagtgaatcg ctctgcacgtgtttatacac cagccggatt ctcaaaaaag aagaaatatc ctgtgcttta tttattacatggcattggag gcgacgaaga tgagtggtac aaaaacggcg ttcctcatat tattttcgacaacctgattg ccgacggcaa aatggaaccg atgattgtgg tactgcccaa tggtcgcgccatgaaaaacg accgtgccga aggaaatatt ttcgacaaag agaaagttga agcctttgcaacattcgaaa aagacctttt aaacgattta ataccgttta tcgaaaaaaa ataccctgtattaaaaaccc gtgagtttcg cgccattgca ggattatcaa tgggcggcgg acaatcgctcaattttggac tgggaaatct cgacaaattt gcatgggtag gcggcttttc atcggcccccaataccaaaa tgcccgctga gttggttcca aacactcaaa aggcaacaga aatgcttaagttgctttatg tgtcttgtgg cgataaagac aatttaatgc aggttagtca gcgcacccacgattatctga aagccaataa agtacctcat attttcaggg ttattcctga tggttaccacgattttaatg tttggaaaga cgatttgtat cattacgtac aaatgctgtt taagcctgtggtaatgcccg tagcagcagc tactttaaaa gatgcttata aagggaaatt cttcattggaactgccctta atacccctca aattttgggt accgctgttg atgaagtgaa tattgttaaaacccatttca actccattgt tgccgaaaac tgtatgaaga gtggcccgat gcaaccacaagaagggaaat ttgagtttga cctggccgat aagtttgtag agtttggagt taaaaacaatatgcagatta ttggtcatac gcttatctgg cattcgcagg caccccgctg gttttttaccgacagcgaag gcaaggacgt atcgcccgag gtgcttaccg agcgcatgaa aaaccatatctatactgttg ttggccgtta caaaggcaag gtgcacggat gggatgtggt gaatgaagccatagttgacg atggcagcta ccgaaacagt aaattctacc aaatactggg cgaagattttatcaaactgg cattccagtt tgctcatgaa gccgaccccg atgcagaatt gtactacaacgattattccg aatttgttcc tgccaaaaga gaaggcattg cccgcatggt gaagaaactcaaagaccagg gcattagaat cgacggcgtt ggatttcagt gccatattgg cctcgattatccaggcctgg atgaatacga aaaaaccatt caattaattg ccaacgaggg ggtaaaagtaatgataaccg aaatggaaat atcggtatta cccatgcccg actggcgcgt tggtgctgagatttcggcca gtttcgaata tcaacagaaa ttaaatccct acaccgaagg attgcccgattcagtgaatg ctcaattaga acagcgttat gtcgactttt tcacgctctt ccttaaatatcacgaagtga ttccaagagt tacggtttgg ggggttaacg atggcaactc atggaaaaacggattcccgg tgcgtggaag aaccgactac ccattgttat tcgaccggaa aaatcagcctaaatcagctg ttgccaaatt aattgaactg gctaatacaa agtag<210> 122<211> 634<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> {!)...(20)<400> 122

Met Lys His Ile Phe Ile Val Leu Ile Val Ser Leu Leu Phe Ser Phe1 5 10 15 Gly Gly Tyr Ala 20 Gln Gln Thr Ile Ser 25 Arg Ala Pro Gln Gly 30 Phe AspGln Gln Arg Ala Gly Ile Ala Ser Gly Lys Val Glu Ile Val Thr Tyr 35 40 45 Lys Ser Lys Thr Val Gly Val Asn Arg Ser Ala Arg Val Tyr Thr Pro 50 55 60 Ala Gly Phe Ser Lys Lys Lys Lys Tyr Pro Val Leu Tyr Leu Leu His 65 70 75 80Gly Ile Gly Gly Asp Glu Asp Glu Trp Tyr Lys Asn Gly Val Pro His 85 90 95 Ile Ile Phe Asp Asn Leu Ile Ala Asp Gly Lys Met Glu Pro Met Ile 100 105 110 Val Val Leu 115 Pro Asn Gly Arg Ala 120 Met Lys Asn Asp Arg Ala 125 Glu GlyAsn Ile Phe Asp Lys Glu Lys Val Glu Ala Phe Ala Thr Phe Glu Lys130 135 140

Asp Leu Leu Asn Asp Leu Ile Pro Phe Ile Glu Lys Lys Tyr Pro Val145 150 155 160

Leu Lys Thr Arg Glu Phe Arg Ala Ile Ala Gly Leu Ser Met Gly Gly165 170 175

Gly Gln Ser Leu Asn Phe Gly Leu Gly Asn Leu Asp Lys Phe Ala Trp

180 185 190

Val Gly Gly Phe Ser Ser Ala Pro Asn Thr Lys Met Pro Ala Glu Leu195 200 205

Vál Pro Asn Thr Gln Lys Ala Thr Glu Met Leu Lys Leu Leu Tyr Val210 215 220

Ser Cys Gly Asp Lys Asp Asn Leu Met Gln Val Ser Gln Arg Thr His225 230 235 240

Asp Tyr Leu Lys Ala Asn Lys Val Pro His Ile Phe Arg Val Ile Pro245 250 255

Asp Gly Tyr His Asp Phe Asn Val Trp Lys Asp Asp Leu Tyr His Tyr

260 265 270

Val Gln Met Leu Phe Lys Pro Val Val Met Pro Val Ala Ala Ala Thr275 280 285

Leu Lys Asp Ala Tyr Lys Gly Lys Phe Phe Ile Gly Thr Ala Leu Asn290 295 300

Thr Pro Gln Ile Leu Gly Thr Ala Val Asp Glu Val Asn Ile Val Lys305 310 315 320

Thr His Phe Asn Ser Ile Val Ala Glu Asn Cys Met Lys Ser Gly Pro325 330 335

Met Gln Pro Gln Glu Gly Lys Phe Glu Phe Asp Leu Ala Asp Lys Phe

340 345 350

Val Glu Phe Gly Val Lys Asn Asn Met Gln Ile Ile Gly His Thr Leu355 360 365

Ile Trp His Ser Gln Ala Pro Arg Trp Phe Phe Thr Asp Ser Glu Gly370 375 380

Lys Asp Val Ser Pro Glu Val Leu Thr Glu Arg Met Lys Asn His Ile385 390 395 400

Tyr Thr Val Val Gly Arg Tyr Lys Gly Lys Val His Gly Trp Asp Val405 410 415

Val Asn Glu Ala Ile Val Asp Asp Gly Ser Tyr Arg Asn Ser Lys Phe

420 425 430

Tyr Gln Ile Leu Gly Glu Asp Phe Ile Lys Leu Ala Phe Gln Phe Ala435 440 445

His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Glu450 455 460

Phe Val Pro Ala Lys Arg Glu Gly Ile Ala Arg Met Val Lys Lys Leu465 470 475 480

Lys Asp Gln Gly Ile Arg Ile Asp Gly Val Gly Phe Gln Cys His Ile485 490 495

Gly Leu Asp Tyr Pro Gly Leu Asp Glu Tyr Glu Lys Thr Ile Gln Leu

500 505 510

Ile Ala Asn Glu Gly Val Lys Val Met Ile Thr Glu Met Glu Ile Sér515 520 525

Val Leu Pro Met Pro Asp Trp Arg Val Gly Ala Glu Ile Ser Ala Ser530 535 540

Phe Glu Tyr Gln Gln Lys Leu Asn Pro Tyr Thr Glu Gly Leu Pro Asp545 550 555 560

Ser Val Asn Ala Gln Leu Glu Gln Arg Tyr Val Asp Phe Phe Thr Leu565 570 575

Phe Leu Lys Tyr His Glu Val Ile Pro Arg Val Thr Val Trp Gly Val

580 585 590

Asn Asp Gly Asn Ser Trp Lys Asn Gly Phe Pro Val Arg Gly Arg Thr595 600 605

Asp Tyr Pro Leu Leu Phe Asp Arg Lys Asn Gln Pro Lys Ser Ala Val610 615 620

Ala Lys Leu Ile Glu Leu Ala Asn Thr Lys625 630

<210> 123

<211> 1200

<212> DNA

<213> Desconhecido<220><223> Obtido para uma amostra ambiental<400> 123

atgatcgttg gattctcgtt tatgctgctg cttcctttag ggatgacgaa tgcattggcaaaaacggaac cagcgtacgc taaaaagccg cgaatcagcg cattgcacgc ccctcaattggatcagcgct acaaagattc cttcactatt ggggcggccg ttgaacctta tcagttgcaaaacgaaaaag acgtccaaat gctgaaacgc cattttaaca gcattgtcgc tgagaacgttatgaaaccga tcaacatcca acccgaagaa ggaaagttca attttgctga ggcggatcaaatcgtccgat ttgctaaaaa acatcatatg gatattcgtt tccatacact cgtttggcacagccaagtac ctcaatggtt ctttcttgac aaggaaggca agccgatggt caatgaaacggatccggcaa agcgcgaaca aaataaacag ctgttactga aacggctcga aatccatattaaaacgattg tcgaacggta taaagacgac atcaaatatt gggacgtcgt gaacgaggtagtcggggatg atggaaaatt gcgcaattcc ccgtggtatc aaatcgccgg catcgattatatcaaggtag cattccaaac ggcgagaaca tatggcggca acaagattaa actgtacatcaacgattaca ataccgaagt ggaaccgaag cgaagcgctc tttataactt agtgaaacaattaaaagaag aaggcgttcc cattgacggg attggccacc agtcccacat ccaaattggctggccttctg aagaagaaat cgaaaaaacg atcaacatgt ttgccgatct agggttagacaatcaaatta cggagctgga tgtgagcatg tacggctggc cgccgcgcgc ctacccgtcgtatgacgcca ttccggaaca aaagtttttg gaccaagcgg ctcgctatga ccgattgtttaagctgtacg aaaaacttgg cgataaaatc agcaacgtca ccttctgggg catcgccgacaaccatacgt ggctcgacag ccgtgcggat gtgtactatg acgccaacgg gaatgttgtggttgacccga acgctccgta cgcaaaagtg gaaaaaggga aaggaaaaga tgcgccgtttctgttcgacc ccgaatacca cgtaaaacct gcgtattggg ccattatcga tcataagtga<210> 124<211> 399<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (20)

<400> 124 Met Ile Val Gly Phe Ser Phe Met Leu Leu Leu Pro Leu Gly Met Thr1 5 10 15 Asn Ala Leu Ala 20 Lys Thr Glu Pro Ala 25 Tyr Ala Lys Lys Pro 30 Arg IleSer Ala Leu 35 His Ala Pro Gln Leu 40 Asp Gln Arg Tyr Lys 45 Asp Ser PheThr Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Gln Asn Glu Lys Asp 50 55 60 Val Gln Met Leu Lys Arg His Phe Asn Ser Ile Val Ala Glu Asn Val65 70 75 80Met Lys Pro Ile Asn Ile Gln Pro Glu Glu Gly Lys Phe Asn Phe Ala 85 90 95 Glu Ala Asp Gln 100 Ile Val Arg Phe Ala 105 Lys Lys His His Met 110 Asp IleArg Phe His 115 Thr Leu Val Trp His 120 Ser Gln Val Pro Gln 125 Trp Phe PheLeu Asp 130 Lys Glu Gly Lys Pro 135 Met Val Asn Glu Thr 140 Asp Pro Ala LysArg Glu Gln- Asn Lys Gln Leu Leu Leu Lys Arg Leu Glu Ile His Ile145 150 155 160Lys Thr Ile Val Glu Arg Tyr Lys Asp Asp Ile Lys Tyr Trp Asp Val 165 170 17 5 Val Asn Glu Val 180 Val Gly Asp Asp Gly 185 Lys Leu Arg Asn Ser 190 Pro TrpTyr Gln Ile Ala Gly Ile Asp Tyr Ile Lys Val Ala Phe Gln Thr Ala 195 200 205 Arg Thr Tyr Gly Gly Asn Lys Ile Lys Leu Tyr Ile Asn Asp Tyr Asn 210 215 220 Thr Glu Val Glu Pro Lys Arg Ser Ala Leu Tyr Asn Leu Val Lys Gln225 230 235 240Leu Lys Glu Glu Gly Val Pro Ile Asp Gly Ile Gly His Gln Ser His 245 250 255 Ile Gln Ile Gly 260 Trp Pro Ser Glu Glu 265 Glu Ile Glu Lys Thr 270 Ile AsnMet Phe Ala Asp Leu Gly Leu Asp Asn Gln Ile

275

280

Ser Met Tyr Gly Trp Pro Pro Arg Ala Tyr Pro

Pro Glu Gln Lys Phe Leu Asp Gln Ala Ala Arg305 310 315

Lys Leu Tyr Glu Lys Leu Gly Asp Lys Ile Ser

325 330

Gly Ile Ala Asp Asn His Thr Trp Leu Asp Ser

340 345

Tyr Asp Ala Asn Gly Asn Val Val Val Asp Pro

355 360

Lys Val Glu Lys Gly Lys Gly Lys Asp Ala Pro

370 375

Glu Tyr His Val Lys Pro Ala Tyr Trp Ala Ile

Thr Glu285Ser Tyr300

Tyr Asp

Asn Val

Arg Ala

Asn Ala365Phe Leu380

Ile Asp

Leu Asp Val

Asp Ala Ile

Arg Leu Phe320

Thr Phe Trp

335Asp Val Tyr350

Pro Tyr AlaPhe Asp ProHis Lys

385

<210> 125<211><212>

390

395

1089DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 125

atgttgacga ccccgacaac tcaagatcat gtccccgtgcaagctcctca ttggagccgt gctcggttac gatgctctccgagaaaattg cgaccactca cttcgatgct ctcactgctgctcgtgcaac ccaaagaggg cgagtttgat ttcgctgatggcgcagcaat gcggcgctac tgcaatcggc catactctgccgctggtttt ttgaagggcc agatggtcag cctgctgaccatgaggaagc acatttccac tctcgttggt cgctataaaggtggtgaatg aggcgattag cgatgcagag ggcgagtactttcaaagccg ttggagagga tcacatcgcg catgctttcccccgatgcca tccttatcta taacgactac aacatcgagcgcgatacgcc tactgaggtc attacttgag caggacgttccagggccatt ggcgtatgga cactctgaat gttgccgaaatttgctgcgc tgggtctcaa ggtcatgatc accgagcttgaagtatcagg gagccgatct cgctactcgg gaagaattgaacggaggaac tacctgagga cgttgcccgg caacatgccggaaatgttcc tgcgccacaa ggatgccatt agccgtgtcaggcagatcat ggttcaacaa ctttccggtc agggggcgcagaccgggaat gtaaccccaa gccagcgttt ttcgccgtctccaçaatga<210> 126<211> 362<212> PRT

<213> Desconhecido<220>

tcaaggacgcaggggaaggaaaaacagcatgagatcgtcttctggcaccagtgagttggcgtcgcattaataagaccaaaaggcagcacaaggagtacaaccattcatgctcgaagaagcatatcagcgtcgcctgaaatagtgttatcgcgctctggggcagactatcctgaaagctgc

tttcaaaggccccgctgagtgaagccggctccttgaaatcacaaacgccacctggcacgcacaatgggatgagcccctggtgaagctgatgcgcccgaagcgtgggcatttatcgaagaagctaccgacacaatccctatgcaggtcttccattcacgattctgctattcgcaagaccag

60120180240300360420480540600660720780840900960102010801089

<223> Obtido para uma amostra ambiental <400> 126 Met Leu Thr Thr Pro Thr Thr Gln Asp His Val Pro Val Leu Lys Asp1 . 5 10 15 Ala Phe Lys Gly Lys Leu Leu Ile Gly Ala Val Leu Gly Tyr Asp Ala 20 25 30 Leu Gln Gly 35 Lys Asp Pro Leu Ser 40 Glu Lys Ile Ala Thr 45 Thr HiS PheAsp Ala Leu 50 Thr Ala Glu Asn 55 Ser Met Lys Pro Ala 60 Leu Val Gln ProLys Glu Gly Glu Phe Asp Phe Ala Asp Gly Asp Arg Leu Leu Glu Ile65 70 75 80Ala Gln Gln Cys Gly Ala Thr Ala Ile Gly His Thr Leu Leu Trp His 85 90 95 Gln Gln Thr Pro 100 Arg Trp Phe Phe Glu 105 Gly Pro Asp Gly Gln 110 Pro AlaAsp Arg Glu 115 Leu Ala Leu Ala Arg 120 Met Arg Lys His Ile 125 Ser Thr LeuVal Gly Arg 130 Tyr Lys Gly Arg 135 Ile Lys Gln Trp Asp 140 Val Val Asn GluAla Ile Ser Asp Ala Glu Gly Glu Tyr Leu Arg Pro Lys Ser Pro Trp 145 150 155 160 Phe Lys Ala Val Gly Glu Asp His Ile Ala His Ala Phe Gln Ala Ala 165 170 175 His Glu Ala Asp 180 Pro Asp Ala Ile Leu 185 Ile Tyr Asn Asp Tyr 190 Asn Ile Glu Gln Glu 195 Tyr Lys Arg Pro Lys 200 Ala Ile Arg Leu Leu 205 Arg Ser Leu Leu Glu Gln Asp Val Pro Ile His Ala Val Gly Ile Gln Gly His Trp 210 215 220 Arg Met Asp Thr Leu Asn Val Ala Glu Ile Glu Glu Ala Ile Glu Glu 225 230 235 240 Phe Ala Ala Leu Gly 245 Leu Lys Val Met Ile 250 Thr Glu Leu Asp Ile 255 Ser Val Leu Pro Thr 260 Lys Tyr Gln Gly Ala 265 Asp Leu Ala Thr Arg 270 Glu Glu Leu Thr Pro 275 Glu Ile Asn Pro Tyr 280 Thr Glu Glu Leu Pro 285 Glu Asp Val Ala Arg Gln His Ala Glu Cys Tyr Arg Gln Val Phe Glu Met Phe Leu 290 295 300 Arg His Lys Asp Ala Ile Ser Arg Val Thr Leu Trp Gly Ile His Asp 305 310 315 320 Gly Arg Ser Trp Phe Asn Asn Phe Pro Val Arg Gly Arg Thr Asp Tyr 325 330 335 Pro Leu Leu Phe Asp Arg Glu Cys Asn Pro Lys Pro Ala Phe Phe Ala

340 345 350

Val Leu Lys Ala Ala Gln Asp Gln Pro Gln

355 360

<210> 127

<211> 960

<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental

<400> 127

gtggatctcgattatcaggggcattaaaatgcaatagttccaccagcagcattctccgtggatgtggttaaatgtaggtcgctcttctcttataacctggatgcatattactaaatgatcccatcaaatgctttcatcagataccaaattaaactagcat<210> 128<211> 319<212> PRT<213> Desci<220>

<223> Obtido para uma amostra ambiental<400> 128

Val Asp Leu Ala Glu Lys Cys Gly Ile Tyr Ile Gly Ala Ala Val Glu

1 5 .10 15

Pro Gly Tyr.Leu Ile Ile Arg Glu Tyr Ala Glu Ile Leu Ser Arg Glu

20 25 30

Phe Asn Val Val Thr Ala Glu Asn Ala Leu Lys Phe Glu Ala Ile His35 40 45

Pro Gln Arg Gly Val Tyr Ser Phe Glu Gly Ala Asp Ala Ile Val Arg50 55 60

Phe Ala Glu Thr His Gly Met Lys Val Arg Gly His Thr Leu Val Trp

ctgagaaatg cggcatatat attggtgcagaatacgctga gattttatcc cgcgaatttattgaagctat tcatccgcag cgtggagtatgatttgcaga aactcatgga atgaaggttcttcctgcatg gataacttct ggaagttacgagcatgtaat gagcgttgtt ggacgatataacgaagcaat attagataac ggttcattaacagaatatat tgagtcagcc tttagatgggtctataatga ttatgaagct gaggacttgattaagagttt acttgagaaa ggtgtaccgaacgtagaaaa tccgccgaaa ccggaagatgtgggcttgat tgtccacata acggaaatggaagatctcat taaacaagca gaaatttaccaaaaatgcac agcattcatt atgtggggatacttcagcgg ctacggttca gctttaatatattactatat acttcggaca ttcatcgaaa

cggttgaacc cggatattta 60acgtggtaac cgcggaaaat 120attcatttga aggtgcagat 180gtggacatac acttgtttgg 240cttgggaggà gtggaagaat 300agggccaaat atatgcatgg 360gagataatgt ttggtttaga 420ctcatgaagc tgacccaaac 480atgataagtc gcatgctgtt 540tacatggcgt aggattacag 600ttgcagcaaa cattaaacgt 660atgtgcgcat tagaacccca 720gtgatatatt aagagtttgt 780ttactgaccg ctattcatgg 840tcgatgagca atataagccc 900aactaggcat taaaggttaa 96065 70 75 80

His Gln Gln Leu Pro Ala Trp Ile Thr Ser Gly Ser Tyr Ala Trp Glu

85 90 95

Glu Trp Lys Asn Ile Leu Arg Glu His Val Met Ser Val Val Gly Arg

100 105 HO

Tyr Lys Gly Gln Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Leu

115 120 125

Asp Asn Gly Ser Leu Arg Asp Asn Val Trp Phe Arg Asn Val Gly Pro

130 135 140

Glu Tyr Ile Glu Ser Ala Phe Arg Trp Ala His Glu Ala Asp Pro Asn145 150 155 160

Ala Leu Leu Phe Tyr Asn Asp Tyr Glu Ala Glu Asp Leu Asn Asp Lys

165 170 175

Ser His Ala Val Tyr Asn Leu Val Lys Ser Leu Leu Glu Lys Gly Val

180 185 190

Pro Ile His Gly Val Gly Leu Gln Met His Ile Asn Val Glu Asn Pro

195 200 205

Pro Lys Pro Glu Asp Val Ala Ala Asn Ile Lys Arg Leu Asn Asp Leu

210 215 220

Gly Leu Ile Val His Ile Thr Glu Met Asp Val Arg Ile Arg Thr Pro225 230 235 240

Pro Ser Asn Glu Asp Leu Ile Lys Gln Ala Glu Ile Tyr Arg Asp Ile

245 250 255

Leu Arg Val Cys Leu Ser Ser Glu Lys Cys Thr Ala Phe Ile Met Trp

260 265 270

Gly Phe Thr Asp Arg Tyr Ser Trp Ile Pro Asn Tyr Phe Ser Gly Tyr

275 280 285

Gly Ser Ala Leu Ile Phe Asp Glu Gln Tyr Lys Pro Lys Leu Ala Tyr

290 295 300

Tyr Tyr Ile Leu Arg Thr Phe Ile Glu Lys Leu Gly Ile Lys Gly305 310 315

<210> 129<211> 3021<212> DNA<213> Bactéria<400> 129

atggtaataa atcgctccag tgcgagtgac ggtgcgtatt cggaaaaagg tttctatctcgacggtggtg tagaatacaa gtacagtgtt tttgtaaaac acaacgggac cggcaccgaaactttcaaac tttctgtgtc ctatttggat tcggaaacag aagaagaaaa taaggaagtaattgcaacaa aggatgttgt ggccggagaa tggactgaga tttcggcaaa atacaaagcacccaaaactg cagtgaatat tactttgtca attacaaccg acagcactgt agatttcatttttgacgatg taaccataac ccgtaaagga atggctgagg caaacacagt atatgcagcaaacgctgtgc tgaaagatat gtatgcaaac tatttcagag ttggttcggt acttaactccggaacggtaa acaattcatc aataaaggcc ttgattttaa gagagtttaa cagtattacctgtgaaaatg aaatgaagcc tgatgccaca ctggttcaat caggatcaac caatacaaatatcagggttt ctcttaatcg tgcagcaagt attttaaact tctgtgcaca aaataatatagccgtcagag gtcatacact ggtttggcac agccagacac ctcaatggtt tttcaaagacaatttccagg acaacggaaa ctgggtttcc caatcagtta tggaccagcg tttggaaagctacataaaaa atatgtttgc tgaaatccaa agacagtatc cgtctttgaa tctttatgcctatgacgttg taaatgaggc agtaagtgat gatgcaaaca ggaccagata ttatggcggggcgagggaac ctggatacgg aaatggtaga tctccatggg ttcagatcta cggagacaacaaatttattg agaáagcatt tacatatgca agaaaatatg ctccggcaaa ttgtaagctttactacaacg attacaacga atattgggat cataagagag actgtattgc ctcaatttgtgcaaacttgt acaacaaggg cttgcttgac ggtgtgggaa tgcagtccca tattaatgcggatatgaatg gattctcagg tatacaaaat tataaagcag ctttgcagaa atatataaatatcggttgtg atgtccaaat taccgagctt gatattagta cagaaaacgg caaatttagcttacagcagc aggctgataa atataaagct gttttccagg cagctgttga tataaacagaacctccagca aaggaaaggt tacggctgtc tgtgtatggg gacctaatga cgccaatacttggctcggtt cacaaaatgc acctcttttg tttaacgcaa acaatcaacc gaaaccggcatacaatgcgg ttgcatccat tattcctcag tccgaatggg gcgacggtaa caatccggccggcggcggag gaggaggcaa accggaagag ccggatgcaa acggatatta ttatcatgacacttttgaag gaagcgtagg acagtggaca gccagaggac ctgcggaagt tctgcttagcggaagaacgg cttacaaagg ttcagaatca ctcttggtaa ggaaccgtac ggcagcatggaacggagcac aacgggcgct gaatcccaga acgtttgttc ccggaaacac atattgtttcagcgtagtgg catcgtttat tgaaggtgcg tcttccacaa cattctgcat gaagctgcaatacgtagacg gaagcggcac tcaacggtat gataccatag atatgaaaac tgtgggtccaaatcagtggg ttcacctgta caatccgcaa tacagaattc cttccgatgc aacagatatg

60120180240300360420480540600660720780840900960102010801140120012601320138014401500156016201680174018001860tatgtttatg tggaaacagc ggatgacacc attaacttct acatagatga ggcaatcggagcggttgccg gaactgtaat cgaaggacct gctccacagc ctacacagcc tccggtactgcttggcgatg taaacggtga tggaaccatt aactcaactg acttgacaat gttaaagagaagcgtgttga gggcaatcac ccttaccgac gatgcaaagg ctagagcaga cgttgacaagaatggatcga taaacagcac tgatgtttta cttctttcac gctacctttt aagagtaatcgacaaatttc ctgtagcaga aaatccttct tcttctttta aatatgagtc ggccgtgcaatatcggccgg ctcctgattc ttatttaaac ccttgtccgc aggcgggaag aattgtcaaggaaacatata caggaataaa cggaactaag agtcttaatg tatatcttcc atacggttatgatccgaaca aaaaatataa cattttctac cttatgcatg gcggcggtga aaatgagaatacgattttca gcaacgatgt taaattgcaa aatatccttg accacgcgat tatgaacggtgaacttgagc ctttgattgt agtaacaccc actttcaacg gcggaaactg cacggcccaaaacttttatc aggaattcag gcaaaatgtc attccttttg tggaaagcaa gtactctacttatgcagaat caacaacccc acagggaata gccgcttcaa gaatgcacag aggtttcggcggattctcaa tgggaggatt gacaacatgg tatgtaatgg ttaactgcct tgattacgttgcatatttta tgcctttaag cggtgactac tggtatggaa acagtccgca ggataaggctaattcaattg ctgaagcaat taacagatcc ggactttcaa agagggagta tttcgtatttgcggccaccg gttccgagga tattgcatat gctaatatga atcctcaaat tgaagctatgaaggctttgc cgcattttga ttatacttcg gatttttcca aaggtaattt ttactttcttgtagctccgg gcgccactca ctggtgggga tacgtaagac attatattta tgatgcacttccatatttct tccatgaatg a<210> 130<211> 1006<212> PRT

<213> Bactéria<400> 130

Met Val Ile Asn Arg Ser Ser Ala Ser Asp Gly Ala Tyr Ser Glu Lys 1 5 10 15 Gly Phe Tyr Leu Asp Gly Gly Val Glu Tyr Lys Tyr Ser Val Phe Val 20 25 30 Lys His Asn Gly Thr Gly Thr Glu Thr Phe Lys Leu Ser Val Ser Tyr 35 40 45 Leu Asp 50 Ser Glu Thr Glu Glu 55 Glu Asn Lys Glu Val 60 Ile Ala Thr Lys Asp Val Val Ala Gly Glu Trp Thr Glu Ile Ser Ala Lys Tyr Lys Ala 65 70 75 80 Pro Lys Thr Ala Val 85 Asn Ile Thr Leu Ser 90 Ile Thr Thr Asp Ser 95 Thr Val Asp Phe Ile Phe Asp Asp Val Thr Ile Thr Arg Lys Gly Met Ala 100 105 110 Glu Ala Asn 115 Thr Val Tyr Ala Ala 120 Asn Ala Val Leu Lys 125 Asp Met Tyr Ala Asn 130 Tyr Phe Arg Val Gly 135 Ser Val Leu Asn Ser 140 Gly Thr Val Asn Asn Ser Ser Ile Lys Ala Leu Ile Leu Arg Glu Phe Asn Ser Ile Thr 145 150 155 160 Cys Glu Asn Glu Met 165 Lys Pro Asp Ala Thr 170 Leu Val Gln Ser Gly 175 Ser Thr Asn Thr Asn Ile Arg Val Ser Leu Asn Arg Ala Ala Ser Ile Leu 180 185 190 Asn Phe Cys 195 Ala Gln Asn Asn Ile 200 Ala Val Arg Gly His 205 Thr Leu Val Trp His 210 Ser Gln Thr Pro Gln 215 Trp Phe Phe Lys Asp 220 Asn Phe Gln Asp Asn Gly Asn Trp Val Ser Gln Ser Val Met Asp Gln Arg Leu Glu Ser 225 230 235 240 Tyr Ile Lys Asn Met 245 Phe Ala Glu Ile Gln 250 Arg Gln Tyr Pro Ser 255 Leu Asn Leu Tyr Ala Tyr Asp Val Val Asn Glu Ala Val Ser Asp Asp Ala 260 265 270 Asn Arg Thr Arg Tyr Tyr Gly Gly Ala Arg Glu Pro Gly Tyr Gly Asn 275 280 285 Gly Arg Ser Pro Trp Val Gln Ile Tyr Gly Asp Asn Lys Phe Ile Glu 290 295 300 Lys Ala Phe Thr Tyr Ala Arg Lys Tyr Ala Pro Ala Asn Cys Lys Leu 305 310 315 320 Tyr Tyr . Asn Asp Tyr 325 Asn Glu Tyr Trp Asp 330 His Lys Arg Asp Cys 335 Ile

19201980204021002160222022802340240024602520258026402700276028202880294030003021Ala Ser Ile Cys Ala Asn Leu Tyr 340 Gly Met Gln Ser His Ile Asn Ala 355 360Gln Asn Tyr Lys Ala Ala Leu Gln 370 375 Val Gln Ile Thr Glu Leu Asp Ile385 390 Leu Gln Gln Gln Ala Asp Lys Tyr 405 Asp Ile Asn Arg Thr Ser Ser Lys 420 Trp Gly Pro Asn Asp Ala Asn Thr 435 440Leu Leu Phe Asn Ala Asn Asn Gln 450 455 Ala Ser Ile Ile Pro Gln Ser Glu465 470 Gly Gly Gly Gly Gly Gly Lys Pro 485 Tyr Tyr His Asp Thr Phe Glu Gly 500 Gly Pro Ala Glu Val Leu Leu Ser 515 520Glu Ser Leu Leu Val Arg Asn Arg 530 535 Arg Ala Leu Asn Pro Arg Thr Phe545 550 Ser Val Val Ala Ser Phe Ile Glu 565 Met Lys Leu Gln Tyr Val Asp Gly 580 Ile Asp Met Lys Thr Val Gly Pro 595 600Pro Gln Tyr Arg Ile Pro Ser Asp 610 615 Glu Thr Ala Asp Asp Thr Ile Asn625 630 Ala Val Ala Gly Thr Val Ile Glu 645 Pro Pro Val Leu Leu Gly Asp Val 660 Thr Asp Leu Thr Met Leu Lys Arg 675 680Thr Asp Asp Ala Lys Ala Arg Ala 690 695 Asn Ser Thr Asp Val Leu Leü Leu705 710 Asp Lys Phe Pro Val Ala Glu Asn 725 Ser Ala Val Gln Tyr Arg Pro Ala 740 Pro Gln Ala Gly Arg Ile Val Lys 755 760Thr Lys Ser Leu Asn Val Tyr Leu 770 775 Lys Tyr Asn Ile Phe Tyr Leu Met785 790 Thr Ile Phe Ser Asn Asp Val Lys 805 Ile Met Asn Gly Glu Leu Glu Pro 820 Asn Gly Gly Asn Cys Thr Ala Gln 835 840Asn Val Ile Pro Phe Val Glu Sèr 850 855 Thr Thr Pro Gln Gly Ile Ala Ala

Asn Lys Gly Leu Leu Asp Gly Val345 350 Asp Met Asn Gly Phe Ser Gly Ile 365 Lys Tyr Ile Asn Ile Gly Cys Asp 380 Ser Thr Glu Asn Gly Lys Phe Ser 395 400Lys Ala Val Phe Gln Ala Ala Val 410 415 Gly Lys Val Thr Ala Val Cys Val425 430 Trp Leu Gly Ser Gln Asn Ala Pro 445 Pro Lys Pro Ala Tyr Asn Ala Val 460 Trp Gly Asp Gly Asn Asn Pro Ala 475 480Glu Glu Pro Asp Ala Asn Gly Tyr 490 495 Ser Val Gly Gln Trp Thr Ala Arg505 510 Gly Arg Thr Ala Tyr Lys Gly Ser 525 Thr Ala Ala Trp Asn Gly Ala Gln 540 Val Pro Gly Asn Thr Tyr Cys Phe 555 560Gly Ala Ser Ser Thr Thr Phe Cys 570 575 Ser Gly Thr Gln Arg Tyr Asp Thr585 590 Asn Gln Trp Val His Leu Tyr Asn 605 Ala Thr Asp Met Tyr Val Tyr Val 620 Phe Tyr Ile Asp Glu Ala Ile Gly 635 640Gly Pro Ala Pro Gln Pro Thr Gln 650 655 Asn Gly Asp Gly Thr Ile Asn Ser665 670 Ser Val Leu Arg Ala Ile Thr Leu 685 Asp Val Asp Lys Asn Gly Ser Ile 700 Ser Arg Tyr Leu Leu Arg Val Ile 715 720Pro Ser Ser Ser Phe Lys Tyr Glu 730 735 Pro Asp Ser Tyr Leu Asn Pro Cys745 750 Glu Thr Tyr Thr Gly Ile Asn Gly 765 Pro Tyr Gly Tyr Asp Pro Asn Lys 780 His Gly Gly Gly Glu Asn Glu Asn 795 800Leu Gln Asn Ile Leu Asp His Ala 810 815 Leu Ile Val Val Thr Pro. Thr Phe825 830 Asn Phe Tyr Gln Glu Phe Arg Gln 845 Lys Tyr Ser Thr Tyr Ala Glu Ser 860 Ser Arg Met HiS Arg Gly Phe Gly865 870 875

Gly Phe Ser Met Gly Gly Leu Thr Thr Trp Tyr

885 890

Leu Asp Tyr Val Ala Tyr Phe Met Pro Leu Ser900 905

Gly Asn Ser Pro Gln Asp Lys Ala Asn Ser Ile

915 920

Arg Ser Gly Leu Ser Lys Arg Glu Tyr Phe Val930 935

Ser Glu Asp Ile Ala Tyr Ala Asn Met Asn Pro945 950 955

Lys Ala Leu Pro His Phe Asp Tyr Thr Ser Asp

965 970

Phe Tyr Phe Leu Val Ala Pro Gly Ala Thr His980 985

Arg His Tyr Ile Tyr Asp Ala Leu Pro Tyr Phe995 1000<210> 131<211> 1218<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 131

atgccgatca tccgaaccct atcgagttac atgcgaaatcctcctcacgc tggccgccgc cgtcacgctg gcgggcgcggaccctgcgcg gggtttacga aaaggacttc accatcggcggcctccggcc gcaatgccgc cgccggcgag atcatcggcagcggagaacg acatgaagtg gcagatgatc cacccccaggacgtccgacg cctacgtcgc gttcgcggaa aagcacaagactcgtgtggc acagccagac cccgcagtgg gtcttccaggaccaaggaag agctgctcaa gcgcatgcgc gaccacatccaagggcaaga tcaagggctg ggacgtcgtc aacgaagcgcattctccgcc agtccccctg gcgccgcatc atcggcgacgcgctacgcca aggaagccgc cccggatgcc gagctctactatcccccgca agcgcgccaa ttgcatcacg ctggtcaaggccgatcgacg gcatcggcac ccagtcgcac ttccagctcggtggaagcca ccatcaagga attcgccgcc ctgggcatgagacgtggatg tcctgccccg caacaacccc ggggtcgccgggagccaacc cctacaccga aggccttccg gacgacgtgctacgaggaca tcttccgcat ctacctgaag taccgcgacctggggcctgg atgacggcat gacctggctg aacggcttcccaccccctgc tctacgaccg gcagctcaat gccaagcccgctgggtcagg aagagcgtcc ggaagccgcc aaggtcgaggaaagaagagg cgaagtaa<210> 132<211> 405<212> PRT<213> Desconhecido

<22 0>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(26)<400> 132

Met Pro Ile Ile Arg Thr Leu Ser Ser Tyr Met

1 5 10

Ile Tyr Arg Gln Leu Leu Thr Leu Ala Ala Ala20 25

60 Ala Ala Thr Ala Glu Glu Glu Ala Thr Leu Arg35 40

Asp Phe Thr Ile Gly Val Ala Met Asn Gly Gly

50 55

Asn Ala Ala Ala Gly Glu Ile Ile Gly Lys Gln65 70 75

Ala Glu Asn Asp Met Lys Trp Gln Met Ile His85 90

Val Met Val

Gly Asp Tyr910

Ala Glu Ala925

Phe Ala Ala940

Gln Ile Glu

Phe Ser Lys

Trp Trp Gly990

Phe His Glu1005

880Asn Cys895

Trp Tyr

Ile Asn

Thr Gly

Ala Met960Gly Asn975

Tyr Val

atcaagcgatccaccgcggatggccatgaaagcagttctcagggtcaatatggaagtcatgtgaaaacggacgccgtggctctccgacggacttcatcgaacaacgactagcatgctcgagctttccctcaggtgatgatacatcgccaaaggaaaagctacgtcacccgcggtccgcggccttccacgctccagaagat

ctaccgtcag 60ggaagaagcc 120cgggggccag 180ctcgctcacc 240ccgcttcgaa 300cggccacacc 360ccagcccgcc 420cggccgttac 480cggggacgac 540ctacgccttc 600caacctcgag 660gcgcggcgtg 720cttggacgac 780caccgagctc 840ccgcgaacag 900cgcgaagcgc 960cgtcaccttc 1020ccgcaccaac 1080cctcgtcaag 1140cgaagcgaag 1200 1218

Arg Asn His Gln Ala15

Val Thr Leu Ala Gly30

Gly Val Tyr Glu Lys45

Gln Ala Ser Gly Arg60

Phe Ser Ser Leu Thr80

Pro Gln Glu Gly Gln95Tyr Arg Phe Glu Thr Ser Asp Ala Tyr Val Ala Phe Ala Glu Lys His 100 105 110 Lys Met Glu Val Ile Gly His Thr Leu Val Trp His Ser Gln Thr Pro 115 120 125 Gln Trp Val Phe Gln Gly Glu Asn Gly Gln Pro Ala Thr Lys Glu Glu 130 135 140 Leu Leu Lys Arg Met Arg Asp His Ile His Ala Val Ala Gly Arg Tyr145 150 155 160Lys Gly Lys Ile Lys Gly Trp Asp Val Val Asn Glu Ala Leu Ser Asp 165 170 175 Gly Gly Asp Asp Ile Leu Arg Gln Ser Pro Trp Arg Arg Ile Ile Gly 180 185 190 Asp Asp Phe Ile Asp Tyr Ala Phe Arg Tyr Ala Lys Glu Ala Ala Pro 195 200 205 Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Leu Glu Ile Pro Arg Lys 210 215 220 Arg Ala Asn Cys Ile Thr Leu Val Lys Gly Met Leu Glu Arg Gly Val225 230 235 240Pro Ile Asp Gly Ile Gly Thr Gln Ser His Phe Gln Leu Gly Phe Pro 245 250 255 Ser Leu Asp Asp Val Glu Ala Thr Ile Lys Glu Phe Ala Ala Leu Gly 260 265 270 Met Lys Val Met Ile Thr Glu Leu Asp Val Asp Val Leu Pro Arg Asn 275 280 285 Asn Pro Gly Val Ala Asp Ile Ala Asn Arg Glu Gln Gly Ala Asn Pro 290 295 300 Tyr Thr Glu Gly Leu Pro Asp Asp Val Gln Glu Lys Leu Ala Lys Arg305 310 315 320Tyr Glu Asp Ile Phe Arg Ile Tyr Leu Lys Tyr Arg Asp His Val Thr 325 330 335 Arg Val Thr Phe Trp Gly Leu Asp Asp Gly Met Thr Trp Leu Asn Gly 340 345 350 Phe Pro Val Arg Gly Arg Thr Asn His Pro Leu Leu Tyr Asp Arg Gln 355 360 365 Leu Asn Ala Lys Pro Ala Phe His Ala Leu Val Lys Leu Gly Gln Glu 370 375 380 Glu Arg Pro Glu Ala Ala Lys Val Glu Val Gln Lys Ile Glu Ala Lys385 390 395 400Lys Glu Glu Ala Lys

405

<210> 133<211> 1011<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 133

atgaaaaata atcaatttag gaaaatccct tccctacata aggtatataa gagtcattttttaattgggg cagctgtaaa tccacttaca cttcaaacac aacaggaact aatcaaaaagcactttaata gtattacggc agaaaatgaa atgaaatttg aagagttgca acctgagcctggacatttta catttgatgt aggagataaa atggtcgctt tcgcaaaaga aaatggtatgaaagttagag gtcatacatt aatctggcac aatcaaacac ctgattggat gtttaagaatgaagatggtt ctgtcacaga tcgagataca cttcttgaaa gaatgaaatt acatattacaactgttatgg agcattataa ggggcaaatt tattgttggg atgttgtcaa tgaagcgattgctgatgaag gatcagagtt attacgtcac tctaaatgga ctgaaattat tggcgacgattttattgaaa aggcatttga gtatgcacat gaagcagacc cagaagcttt actattctataatgactata atgagtccca ccctcataag cgagataaaa tttacacact aataaaaagattggtagaca aaggcatacc tattcacggg gttggcttgc aagcacattg gaatttaacagacccttctt atgaggagat tagggctgca attgaaaaat atgcctcatt aggcttggaaatacatctta cagaaatgga tgtttcagtg ttcaattttg aagatcgaag aacagacttaacagagccga ctaatgaaat gaagactctt caagtagaac gttatacgga atttttcaaaatacttagag aatatagcca tgtgattagc tctgtcactt tttggggagc tgcagatgattatacttggt tggatgggtt tccagttaga ggaaggaaaa actggccatt tgtttttgacgaaaaccacc aaccgaaaga atctttctgg ggaattgtcg attttgaata a<210> 134<211> 336<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 134

Met Lys Asn Asn Gln Phe Arg Lys Ile Pro Ser Leu His Lys Val Tyr

15 10 15

Lys Ser His Phe Leu Ile Gly Ala Ala Val Asn Pro Leu Thr Leu Gln

20 25 30

Thr Gln Gln Glu Leu Ile Lys Lys His Phe Asn Ser Ile Thr Ala Glu

35 40 45

Asn Glu Met Lys Phe Glu Glu Leu Gln Pro Glu Pro Gly His Phe Thr

50 55 60

Phe Asp Val Gly Asp Lys Met Val Ala Phe Ala Lys Glu Asn Gly Met65 70 75 80

Lys Val Arg Gly His Thr Leu IIe Trp His Asn Gln Thr Pro Asp Trp

85 90 95

Met Phe Lys Asn Glu Asp Gly Ser Val Thr Asp Arg Asp Thr Leu Leu

100 105 110

Glu Arg Met Lys Leu His Ile Thr Thr Val Met Glu His Tyr Lys Gly

115 120 125

Gln Ile Tyr Cys Trp Asp Val Val Asn Glu Ala Ile Ala Asp Glu Gly

130 135 140

Ser Glu Leu Leu Arg His Ser Lys Trp Thr Glu Ile Ile Gly Asp Asp145 150 155 160

Phe Ile Glu Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Glu Ala

165 170 175

Leu Leu Phe Tyr Asn Asp Tyr Asn Glu Ser His Pro His Lys Arg Asp

180 185 190

Lys Ile Tyr Thr Leu Ile Lys Arg Leu Val Asp Lys Gly Ile Pro Ile

195 200 205

His Gly Val Gly Leu Gln Ala His Trp Asn Leu Thr Asp Pro Ser Tyr

210 215 220

Glu Glu Ile Arg Ala Ala Ile Glu Lys Tyr Ala Ser Leu Gly Leu Glu225 230 235 240

Ile His Leu Thr Glu Met Asp Val Ser Val Phe Asn Phe Glu Asp Arg

245 250 255

Arg Thr Asp Leu Thr Glu Pro Thr Asn Glu Met Lys Thr Leu Gln Val

260 265 270

Glu Arg Tyr Thr Glu Phe Phe Lys Ile Leu Arg Glu Tyr Ser His Val

275 280 285

Ile Ser Ser Val Thr Phe Trp Gly Ala Ala Asp Asp Tyr Thr Trp Leu

290 295 300

Asp Gly Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Phe Val Phe Asp305 310 315 320

Glu Asn His Gln Pro Lys Glu Ser Phe Trp Gly Ile Val Asp Phe Glu325 330 335

<210> 135

<211> 1170

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 135

atgcgacgcc tcatcgccct tgtcctatat ataggaaccg ccgcgagcgg gacctccgtggagaccgttg cggccgaatc gaaacagccg aaagctagcc taaagaatgc gttcgcagacgattttcgtg tcggcgctgc aattggcacc aatcaggtca tgggcgagga gccaaaatcgctcgaggttg tcgcccagca gttcaacaca atcacgcctg agaatctcct caaatgggctgaggtccacc cagaagcaga ccgctacaac ttcgaaccgt ccgatcgctt cgtcgaatttggcgaaaaga acaacatgtt catcgtcggc cacacgctcg tgtggcataa ccaaacgccggactgggcct ttgagggcaa ggacggcaag ccgctcgatc gcgaaacagc gctcgcccgaatcaaggaac acattgaaac cgtggtcggc cgatatcgcg.gccgcatcca tgcttgggacgtcgtgaacg aggcaatcga cgacaacggc aaacttcgta gtgggccggt cggagtgcccggtcagcgcg gcgaaccgtg gcacgccgcc atcggagacg actacatcca gaaggcgttcgaattcgcgc acaccgccga ccccgacgct gaactctatt acaacgacta caacgaatggcacccgaaaa agatcgaagc catctcgcag ctggtgcggt cgctcaaaga gaagggcgttcgtatcgatg gcctcggtct ccagggccat tgggggatgg attacccgaa agtcgaagagatcgatcaca tgctaaccga gtatggcaag ctcggcgtga agctcatgat taccgaactcgacatcaaca tgcttccgca gcccgacccg agtcaacgcg gcgccgatat cactcgcaactacgagctca gaaaggagct cgatccgtat tccgacggac tcccgcccga tatgcaaaaggcactcgcgg cgcgttatgc tgaaatcttc gaagtcttcg ctaagcatcg cgataagctcgaccgcgtca cattttgggg cgttcacgac ggccattcat ggctcaacaa ctggcctgttcccggtcgca ctgcctaccc gcttctcttc gacacgaagc ttcagcccaa gccggcatttgatgccgtca tcggagtcgc agagcaatga<210> 136<211> 389<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(25)

<400> 136 Met Arg Arg Leu Ile Ala Leu Val Leu Tyr Ile Gly Thr Ala Ala Ser1 5 10 15 Gly Thr Ser Val 20 Glu Thr Val Ala Ala 25 Glu Ser Lys Gln Pro 30 Lys AlaSer Leu Lys 35 Asn Ala Phe Ala Asp 40 Asp Phe Arg Val Gly 45 Ala Ala IleGly Thr Asn Gln Val Met Gly Glu Glu Pro Lys Ser Leu Glu Val Val50 55 60 Ala Gln Gln Phe Asn Thr Ile Thr Pro Glu Asn Leu Leu Lys Trp Ala65 70 75 80Glu Val His Pro Glu 85 Ala Asp Arg Tyr Asn 90 Phe Glu Pro Ser Asp 95 ArgPhe Val Glu Phe 100 Gly Glu Lys Asn Asn 105 Met Phe Ile Val Gly 110 His ThrLeu Val Trp 115 His Asn Gln Thr Pro 120 Asp Trp Ala Phe Glu 125 Gly Lys AspGly Lys Pro Leu Asp Arg Glu Thr Ala Leu Ala Arg Ile Lys Glu His130 135 140 Ile Glu Thr Val Val Gly Arg Tyr Arg Gly Arg Ile His Ala Trp Asp145 150 155 160Val Val Asn Glu Ala 165 Ile Asp Asp Asn Gly 170 Lys Leu Arg Ser Gly 175 ProVal Gly Val Pro Gly Gln Arg Gly Glu Pro Trp His Ala Ala Ile Gly 180 185 190 Asp Asp Tyr 195 Ile Gln Lys Ala Phe 200 Glu Phe Ala His Thr 205 Ala Asp ProAsp Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Glu Trp His Pro Lys Lys210 215 220 Ile Glu Ala Ile Ser Gln Leu Val Arg Ser Leu Lys Glu Lys Gly Val 225 230 235 240Arg Ile Asp Gly Leu 245 Gly Leu Gln Gly His 250 Trp Gly Met Asp Tyr 255 ProLys Val Glu Glu Ile Asp His Met Leu Thr Glu Tyr Gly Lys Leu Gly 260 265 270 Val Lys Leu 275 Met Ile Thr Glu Leu 280 Asp Ile Asn Met Leu 285 Pro Gln ProAsp Pro Ser Gln Arg Gly Ala Asp Ile Thr Arg Asn Tyr Glu Leu Arg290 295 300 Lys Glu Leu Asp Pro Tyr Ser Asp Gly Leu Pro Pro Asp Met Gln Lys305 310 315 320Ala Leu Ala Ala Arg 32 5 Tyr Ala Glu Ile Phe 330 Glu Val Phe Ala Lys 335 HisArg Asp Lys Leu Asp Arg Val Thr Phe Trp Gly Val His Asp Gly His 340 345 350 Ser Trp Leu Asn Asn Trp Pro Val Pro Gly Arg Thr Ala Tyr Pro Leu 355 360 365 Leu Phe Asp Thr Lys Leu Gln Pro Lys Pro Ala Phe Asp Ala Val Ile370 375 380 Gly Val Ala Glu Gln 385 <210> 137<211> 1044<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 137

gtggatcctt cgctgaagga agcagcttcg ggcaagtttcgtacgtcagg cagcaggtca ggatacttgc gcctcgaaagtccattgtgg ccgagaattg catgaaatgc gaagtgattcgattttacgg aagcggaccg gttggttcgt tttggcgagggggcattgcc ttatctggca ttcacagctg gcaccttggtaaaacagtaa gtgccgacat cttgaaggag cgtataaaaaacgcactata aagggcgtat aaagggctgg gatgtgttgaggctcctggc gtaaatctcc tttttacgag atattaggcgtttcagtatg ctcatgaggc agatccggaa gccgaactttgacgggaagg ctaagcgtga caaagtagtc gaattggtaactgcgcatcg acgcggtagg tatgcaggga cacatgggaagaatttgaag ccagtatact ggcatttgca gctgccggagtgggatatga gtgcattgcc cacgacacgg atgggagccatataaacaat ccctgaatcc ctatcccgac ggtttgcccgaataaccgga tgaaggaatt tttcggtctt ttcctgaaacgtgacggcgt ggggggtgac ggacggtgac tcatggaagacgtgtggatt atcctttatt gttcgaccgt gattgccggcctgattggaa aacagaacat ttaa<210> 138347PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 138

Val Asp Pro Ser Leu Lys Glu Ala Ala Ser Gly

1 5 10

Val Ala Leu Asn Val Arg Gln Ala Ala Gly Gln

tgatgggggttggtaaaacgatccggaggaagaacgatattctgtgtggaaacatatccaatgaagccataagagtacatactataatgaagatgctgaatggattatcctaaaggtgatatatttcggaactctgtgtcattcgaatatataatttccccgaaaccttt

agcgttgaattcattttaatagaccattttggctgttatccaaacaaggagactattgtgtgaatcggaccccgcttattttatggcatgagatcgtggagtcagtgtccggtaaccgaacacggtgtcttgtggcatggcattacccgttgtgcccggatgtggaagaa

<211><212>

Lys Val Val Lys Arg His Phe Asn Ser Ile Val

1 5 10 15

Lys Cys Glu Val Ile His Pro Glu Glu Asp His

50 55

Ala Asp Arg Leu Val Arg Phe Gly Glu Glu Asn

Lys Phe Leu

Asp Thr Cys30

Ala Glu Asn45

Phe Asp Phe60

Asp Met Ala

65

70

75

Gly His Cys Leu Ile Trp His Ser Gln Leu Ala Pro Trp Phe

85

90

Asp Lys Gln Gly Lys Thr Val Ser Ala Asp Ile

100 105

Lys Lys His Ile Gln Thr Ile Val Thr His Tyr

115 120

Gly Trp Asp Val Leu Asn Glu Ala Ile Glu Ser

130 135

Lys Ser Pro Phe Tyr Glu Ile Leu Gly Glu Glu145 150 155

Phe Gln Tyr Ala His Glu Ala Asp Pro Glu Ala

165 170

Asp Tyr Gly Met Asp Gly Lys Ala Lys Arg Asp

180 185

Val Lys Met Leu Lys Asp Arg Gly Leu Arg Ile

195 200

Gln Gly His Met Gly Met Asp Tyr Pro Ser Val

210 215

Ser Ile Leu Ala Phe Ala Ala Ala Gly Val Lys225 230 235

Trp Asp Met Ser Ala Leu Pro Thr Thr Arg Met

245 250

Asp Thr Val Ser Tyr Lys Gln Ser Leu Asn Pro

260 265

Pro Asp Ser Val Ser Val Ala Trp Asn Asn Arg275 280

Leu Lys Glu110

Lys Gly Arg125

Asp Gly Ser140

Tyr Ile Pro

Glu Leu Tyr

Lys Val Val190

Asp Ala Val

205Ser Glu Phe220

Val Met Val

Gly Ala Asn

Tyr Pro Asp270

Met Lys Glu285

Met Gly15

Ala Ser

Cys Met

Thr Glu

Val Ile80

Cys Val95

Arg Ile

Ile Lys

Trp Arg

Leu Ile160Tyr Asn175

Glu Leu

Gly Met

Glu Ala

Thr Glu240.Ile Ser255

Gly LeuPhe Phe

6012018024030036042048054060066072078084090096010201044Gly Leu Phe Leu Lys His Ser Asn Ile Ile Thr

290 295

Gly Val Thr Asp Gly Asp Ser Trp Lys Asn Asn305 310 315

Arg Val Asp Tyr Pro Leu Leu Phe Asp Arg Asp

325 330

Phe Val Glu Glu Leu Ile Gly Lys Gln Asn Ile340 345

<210> 139<211> 1143

<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 139

atgaaaaaaa cgattgcaca tttcacctta tggatagtgt

actgttacgg cgcagaagaa tgctaagaat gcaagagtaa

gcttaccaag gtaaattcta tatcggtact gcgatgaact

gatccccaat ctgaaaatat tatcaaaaaa cagttcaatt

atgaagagta tgtatcttca gccggaggaa ggaaaatttt

tttgtggatt ttggtcttca gaacaatatg ttcattatcg

tcgcaggcgc caaaatggtt tttcaccgac gaaaatggaa

cttaaacaaa ggatgaaagc ccatatcacc gctgtcgttt

aaaggttggg atgtggtgaa cgaagccatt atggaagatg

ttttacgaga ttttgggaga agaatttatt ccgttggcat

gatcctgatg cagaacttta ttacaacgat tataacgaat

atggtgacca aaataatccg cgatttcaaa actagaggaa

atgcaggctc atttcgggat ggattcgccc actgtagaag

ggctatataa aagaaggcgt gaaagtcaat attacggaactctccttggg gaacttccgc caacgttgct gatacgcagc

ccttacacca aaggacttcc tgtcgatgta gaaaaagcattttttcaaac ttttcctaaa atatcatcag catattgagc

agcgacatcg attcctggaa aaacgatttt ccgataagag

ccgtttaacc gtcaatatca ggcaaaacct ttggttcaga

tag

<210> 140<211> 380<212> PRT<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL

Arg Val Thr Ala Trp300

Phe Pro Val Pro Gly320

Cys Arg Pro Lys Pro335

tttttctcttaacccactactgagacagatccatagttgctcttcgatgaggcattgtctacacggtttccccgctacaagttcttaccgttcagtatgcggtatcccggtccgcatcgaagtatgaacatcgatttaagagtatcaggagggaaaaccggtgtaactttgacgtaccgaaattaataga

cacttcctgtcctaaaagagtcacggagatcgaaaactgctgcggacaaggatttggcattccagaagttagggaaaatccaaaagcaaagcatgaagcagaaaagagcttgccatcggaaactattcagtccgcttcctaaaaatgaatttatctcgatttggggagtgttafcccactacttaacgaaa

601201802403003604204805406006607207808409009601020108011401143

<222> (1)... . (24) <400> 140 Met Lys Lys Thr Ile Ala His Phe Thr Leu Trp Ile Val Phe Phe Leu 1 . 5 10 15 ' Phe Thr Ser Cys 20 Thr Val Thr Ala Gln 25 Lys Asn Ala Lys Asn 30 Ala Arg Val Lys Pro Thr Thr Leu Lys Glu Ala Tyr Gln Gly Lys Phe Tyr Ile 35 40 45 Gly Thr Ala Met Asn Leu Arg Gln Ile His Gly Asp Asp Pro Gln Ser 50 55 60 Glu Asn Ile Ile Lys Lys Gln Phe Asn Ser Ile Val Ala Glu Asn Cys 65 70 75 80 Met Lys Ser Met Tyr Leu Gln Pro Glu Glu Gly Lys Phe Phe Phe Asp 85 90 95 Asp Ala Asp Lys 100 Phe Val Asp Phe Gly 105 Leu Gln Asn Asn Met 110 Phe Ile Ile Gly His Cys Leu Ile Trp His Ser Gln Ala Pro Lys Trp Phe Phe 115 120 125 Thr Asp Glu Asn Gly Asn Thr Val Ser Pro Glu Val Leu Lys Gln Arg 130 135 140 Met Lys Ala His Ile Thr Ala Val Val Ser Arg Tyr Lys Gly Lys Ile 145 150 155 160 Lys Gly Trp Asp Val Val Asn Glu Ala Ile Met Glu Asp Gly Ser Tyr 165 170 175Arg Lys Ser Lys Phe Tyr Glu Ile Leu Gly Glu Glu Phe Ile Pro Leu

180 185 190

Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr195 200 205

Asn Asp Tyr Asn Glu Trp Tyr Pro Gly Lys Arg Ala Met Val Thr Lys210 215 220

Ile Ile Arg Asp Phe Lys Thr Arg Gly Ile Arg Ile Asp Ala Ile Gly225 230 235 240

Met Gln Ala His Phe Gly Met Asp Ser Pro Thr Val Glu Glu Tyr Glu 245 250 255

Gln Thr Ile Gln Gly Tyr Ile Lys Glu Gly Val Lys Val Asn Ile Thr

260 265 270

Glu Leu Asp Leu Ser Pro Leu Pro Ser Pro Trp Gly Thr Ser Ala Asn275 280 285

Val Ala Asp Thr Gln Gln Tyr Gln Glu Lys Met Asn Pro Tyr Thr Lys290 295 300

Gly Leu Pro Val Asp Val Glu Lys Ala Trp Glu Asn Arg Tyr Leu Asp305 310 315 320

Phe Phe Lys Leu Phe Leu Lys Tyr His Gln His Ile Glu Arg Val Thr 325 330 335

Phe Trp Gly Val Ser Asp Ile Asp Ser Trp Lys Asn Asp Phe Pro Ile

340 345 350

Arg Gly Arg Thr Asp Tyr Pro Leu Pro Phe Asn Arg Gln Tyr Gln Ala355 360 365

Lys Pro Leu Val Gln Lys Leu Ile Asp Leu Thr Lys370 375 380

<210> 141<211> 1134<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 141

atgaatatct cacgcagaca actactggcg ctcacgggtg ctacggcggc gatcacagcagccaaattac aggcggcaga aaaagccagc gccgcgaccg gcttgcgcga tgcctacaaá

aatgattttt tgattggcgc tgcgctgagt gcatcgatca ttcaacagca agatccacag 180

ctagttgcac tgattaataa agactttaat tccatcaccc cagaaaactg tatgaaatgg 240

ggcgagatgc gcaatgatga cggcagctgg aagtggcagg atgcagacgc atttgtcgag 300

tatggaagca aatacaaact acatatggtc ggccacacat tggggtggca cagccagatt 360

cccgatagcg tgtttaaaaa taaagacggt agctatattt ccaaaaccga actcgcgaaa 420aaacaaaaag .aacacatcac cactattgtt ggccgctaca aaggcaaact tgccgcgtgg 480

gatgtggtga atgaagctgt cggcgatgac aacaaaatgc gcgatagtca ctggtataaa 540

atcatgggcg.atgattttct cgttaatgca tttaaccttg ctcatgaagt agatccgaag 600

gcgcatctga tgtacaacga ctacaacaac gagcgcccgg aaaaacgcca ggcgactatc 660

gatatgatca agcgtctgca acaacgcggt acaccaatcc atggtttggg catgcaagcg 720catatcggat tggaaaccaa tatgcaggat tttgaagata gtattctcgc ctãttcagca 780

ttgggtttaa aaatccatct caccgaacta gatatagatg tgctgccctc tgtatggaat 840

ttaccggtgg ccgaaatttc tacccgcttt gaatacaagc cggaacgcga tccttataca 900

aaaggtttgc cgaaagagaú tgatgaaaaa cttgcaaaag cctatgaatc gctatttaaa 960

atattgctta aacatcgcga caaaatagat agagttacgt tttggggcgt aagcgatgat 1020gccagctggc tcaatgattt cccaatcaat ggcagaacca actatccgtt attgtttaac 1080cgtcaacgcc aacctaaagc tgcttatttc cgtttgctgg atttaaaacg ctag 1134

<210> 142<211> 377<212> PRT

<213> Desconhecido<22 0>

<223> Obtido para uma amostra ambiental<22 0><221> SIGNAL

<222> (1)...(25)<400> 142

Met Asn Ile Ser Arg Arg Gln Leu Leu Ala Leu Thr Gly Ala Thr Ala1 5 10 15

Ala Ile Thr Ala Ala Lys Leu Gln Ala Ala Glu Lys Ala Ser Ala Ala20 25 30

Thr Gly Leu Arg Asp Ala Tyr Lys Asn Asp Phe Leu Ile Gly Ala Ala

6012035 40 45 Leu Ser 50 Ala Ser Ile Ile Gln 55 Gln Gln Asp Pro Gln 60 Leu Val Ala LeuIle Asn Lys Asp Phe Asn Ser Ile Thr Pro Glu Asn Cys Met Lys Trp65 70 75 80Gly Glu Met Arg Asn Asp Asp Gly Ser Trp Lys Trp Gln Asp Ala Asp 85 - 90 95 Ala Phe Val Glu 100 Tyr Gly Ser Lys Tyr 105 Lys Leu His Met Val 110 Gly HisThr Leu Gly Trp His Ser Gln Ile Pro Asp Ser Val Phe Lys Asn Lys 115 120 125 Asp Gly 130 Ser Tyr Ile Ser Lys 135 Thr Glu Leu Ala Lys 140 Lys Gln Lys GluHis Ile Thr Thr Ile Val Gly Arg Tyr Lys Gly Lys Leu Ala Ala Trp145 150 155 160Asp Val Val Asn Glu Ala Val Gly Asp Asp Asn Lys Met Arg Asp Ser 165 170 175 HiS Trp Tyr Lys Ile Met Gly Asp Asp Phe Leu Val Asn Ala Phe Asn 180 185 190

Leu Ala His Glu Val Asp Pro Lys Ala His Leu Met Tyr Asn Asp Tyr

195 200 205

Asn Asn Glu Arg Pro Glu Lys Arg Gln Ala Thr Ile Asp Met Ile Lys

210 215 220

Arg Leu Gln Gln Arg Gly Thr Pro Ile His Gly Leu Gly Met Gln Ala225 230 235 240

His Ile Gly Leu Glu Thr Asn Met Gln Asp Phe Glu Asp Ser Ile Leu245 250 255

Ala Tyr Ser Ala 260 Leu Gly Leu Lys Ile 265 His Leu Thr Glu Leu 270 Asp IleAsp Val Leu 275 Pro Ser Val Trp Asn 280 Leu Pro Val Ala Glu 285 Ile Ser ThrArg Phe 290 Glu Tyr Lys Pro Glu 295 Arg Asp Pro Tyr Thr 300 Lys Gly Leu ProLys Glu Ile Asp Glu Lys Leu Ala Lys Ala Tyr Glu Ser Leu Phe Lys305 310 315 320Ile Leu Leu Lys His 325 Arg Asp Lys Ile Asp 330 Arg Val Thr Phe Trp 335 GlyVal Ser Asp Asp 340 Ala Ser Trp Leu Asn 345 Asp Phe Pro Ile Asn 350 Gly ArgThr Asn Tyr 355 Pro Leu Leu Phe Asn 360 Arg Gln Arg Gln Pro 365 Lys Ala AlaTyr Phe Arg Leu Leu Asp Leu Lys Arg

370 375

<210> 143<211> 3285<212> DNA<213> Bactéria<400> 143

atgagtttaa aaataaataa aatcatatca tttatcatag ttttttcgat ggtttttggg 60

acgttaatgt atgtgccaca tctaaaagca tttgcggata ataccggtat taatttggtt 120

tctaatggtg attttgaatc aggcacaatt gatggctggt ttaaacaagg taatccgaca 180

ttaacagtaa caactgagca ggcaattggg caatacagta tgaaagttac aggtagaaca 240

cagacatatg aaggacccgc atatagcttt ttggggaaaa tgcagaaagg tgaatcatat 300

aacgtatcãc ttaaagttag acttgtttct ggacaaaatt catctaatcc tttgatcact 360

gtaactatgt ttagagaaga tgacaatggc aatcattatg acacaatagt ttggcaaaaa 420

caagtttctg aagáttcatg gactactgta agtgggactt atacattgga ttatactgga 480

acattaaaaa cattatatat gtatgtagaa tcacccgatc caacgcttga atattatatt 540

gatgatgttg tagtcacacc gcaaaatcca acgcaaatag gaaatgtagt tgccaatgga 600

acttttgaaa atgaaaatac ttctggatgg gttggaacag gttcatctgt tgttaaagca 660

gtatatggtg atgctcacag cggagattat agcttattga cgacaggaag gacagctaac 720

tggaatggtc ctagttatga tttgactggc aaaatagttc ccggacaaca atacaatgtg 780

gatttttggg taaaatttat tgatggcaat gatacagagç aaatcaaggc tactgttaaa 840

gcgacttctg acaaagacaa ttatatacaa gttaatgatt ttgcagatgt aagtaaaggt 900

gaatggacag aaataaaagg cagttttact ttacctgttg çagattacag cggcattagc 960

atctatgtgg áatctcaaaa tcctacttta gagttttaca ttgatgattt ttctgtaata 1020

ggtgaaattg caaataatca gattactatt caaaatgaca ttccagattt gtactctgta 1080

tttaaagatt attttcctat aggcgttgcg gttgatccaa gtagattaaa tgatactgat 1140ccgcatgctc aattgacggc taaacatttt aatatgcttg ttgcagaaaa cgccatgaaa 1200cctgaaagtt tacaacccac agaaggaaat tttacttttg ataatgctga taagattgtt 1260gattatgcaa tatcacataa tatgaagatg agggggcata ctttactttg gcataatcaa 1320gttccagatt ggtttttcca agatccgtct gacccatcca agcctgcttc gagagattta 1380ctattacaaa gattaaaaac tcatattaca actgtgttag accattttaa aacaaagtat 1440ggttctcaga atccaataat tggatgggat gtcgtaaatg aagttcttga tgataatggc 1500agtttgagaa attcgaagtg gttgcaaatt attggacccg actatataga aaaagccttt 1560gaatatgcac atgaagcgga tccatcgatg aagttgttta ttaatgatta caatatcgaa 1620aataatggcg ttaaaactca agctatgtat gacttggtaa aaagattaaa gagtgaaggc 1680gttcctatag atggaatagg gatgcaaatg cacataaata taaattccaa tatagataat 1740ataaaagcat caatagaaaa actggcatcg ttaggcgttg aaatacaagt aactgaatta 1800gatatgaaca tgaacggtaa tatatctaac gaagcàttgc tcaagcaagc tagattgtat 1860aaacaattat ttgacttatt taaagcagag aaacaatata taactgctgt agttttttgg 1920ggagtttcag acgatgtaac ttggcttagc aagccaaatg ctccgctact ttttgataca 1980aagttgcaag caaagccagc atactgggca atagtagatc cgaataaagc tacaccagac 2040attcaatctg caaaggcttt ggaaggatca ccgacaatgg gtacaaatgt tgataactct 2100tggaaacttg taaagccgtt atatgcaaat acttttgtag aagggtcggt cggagcaact 2160gctgctgtta agtctatgtg ggatactaaa aacttgtatt tgttagtaca agtttcagac 2220aataccccat ctagtaatga tggtattgag atttttgtag ataagaatga tgacaaatcc 2280acttcttatg aaactgatga tgaacattat acaattaaga gggatggtac agggagttca 2340gatattacca aatatgtgac ttctaatgct gacggatatg tagcacagct agctattcca 2400attgaagata ttaatcctgc acttaatgat aaaattggat ttgacattag aataaatgat 2460gataaaggta ttggtaatat agatgcaata acagtttgga acgattatac aaacagtcaa 2520gatactaata catcgtattt tggcgattta gtattatcaa aacctgcaca aattgcaaca 2580gctatatatg gcactcctgt tattgatggt aaagtagatg atatttggaa taatgttgaa 2640gctatttcaa caaatacatg ggttttgggt tcaaatggtg ctactgcgac agcaaaaatg 2700atgtgggacg ataagtacct ttatgttttg gcggatgtta cagattcaaa tctgaacaaa 2760tctagtgtta atccatatga acaagattct gtagaagttt ttgtagatca aaataatgac 2820aagacgacat attataaaaa tgatgatgga cagtttagag ttaactatga caatgaacaa 2880agctttgggg gaagcactaa ttcaaatgga tttaaatcgg caactagtct tacacaaagt 2940ggatatattg tagaagaagc tattccttgg acgagtatca ctccatcaaa tggcactatc 3000ataggatttg acttgcaagt taatgatgca gatgaaaatg gtaagaggac aggtattgta 3060acatggtgtg atccgagcgg aaattcatgg caagatactt ctgggtttgg gaatttattg 3120cttacaggta aaccatccgg tgttggtaca aaaagaatgg cgtttaacga cataaaagac 3180agttgggcaa aagatgcaat agaagtatta gcatcaaggc acatagtaga aggtatgacà 3240gacactcagt atgaaccaaa caagacagta acgagagcgg aataa 3285

<210> 1441094PRT

<213> Bactéria<220>

SIGNAL(1)...(32)<400> 144

Met Ser Leu Lys Ile Asn Lys Ile Ile Ser Phe Ile Ile Val Phe Ser

1. 5 10 15

Met Val Phe Gly Thr Leu Met Tyr Val Pro His Leu Lys Ala Phe Ala

20 25 30

Asp Asn Thr Gly Ile Asn Leu Val Ser Asn Gly Asp Phe Glu Sèr Gly

35 40 45

Thr Ile Asp Gly Trp Phe Lys Gln Gly Asn Pro Thr Leu Thr Val Thr

50 55 60

Thr Glu Gln Ala Ile Gly Gln-Tyr Ser Met Lys Val Thr Gly ArgThr65 70 75 80

Gln Thr Tyr Glu Gly Pro Ala Tyr Ser Phe Leu Gly Lys Met Gln Lys

85 90 95

Gly Glu Ser Tyr Asn Val Ser Leu Lys Val Arg Leu Val Ser Gly Gln

100 .105 110

Asn Ser Ser Asn Pro Leu Ile Thr Val Thr Met Phe Arg Glu Asp Asp

115 . .120 125

Asn Gly Asn His Tyr Asp Thr Ile Val Trp Gln Lys Gln Val Ser Glu

130 135 140

Asp Ser Trp Thr Thr Val Ser Gly Thr Tyr Thr Leu Asp Tyr Thr Gly145 ' .. 150 155 160

Thr Leu Lys Thr Leu Tyr Met Tyr Val Glu Ser Pro Asp.Pro Thr Leu

165 170 - 175

Glu Tyr Tyr Ile Asp Asp Val Val Val Thr Pro Gln Asn Pro Thr Gln

<211><212>

<221><222>180 185 190

Ile Gly Asn Val Val Ala Asn Gly Thr Phe Glu Asn Glu Asn Thr Ser 195 200 205 Gly Trp Val Gly Thr Gly Ser Ser Val Val Lys Ala Val Tyr 210 215 220 Ala His Ser Gly Asp Tyr Ser Leu Leu Thr Thr Gly Arg Thr Ala Asn 225 230 235 240 Trp Asn Gly Pro Ser Tyr Asp Leu Thr Gly Lys Ile Val Pro Gly Gln 245 250 255 Gln Tyr Asn Val Asp Phe Trp Val Lys Phe Ile Asp Gly Asn Asp Thr 260 265 270 Glu Gln Ile 275 Lys Ala Thr Val Lys 280 Ala Thr Ser Asp Lys 285 Asp Asn Tyr Ile Gln Val Asn Asp Phe Ala Asp Val Ser Lys Gly Glu Trp Thr GlU 290 295 300 Ile Lys Gly Ser Phe Thr Leu Pro Val Ala Asp Tyr Ser Gly Ile Ser 305 310 315 320 Ile Tyr Val Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Ile Asp Asp 325 330 335 Phe Ser Val Ile Gly Glu Ile Ala Asn Asn Gln Ile Thr Ile Gln Asn 340 345 350 Asp Ile Pro 355 Asp Leu Tyr Ser Val 360 Phe Lys Asp Tyr Phe 365 Pro Ile Gly Val Ala Val Asp Pro Ser Arg Leu Asn Asp Thr Asp Pro His Ala Gln 370 375 380 Leu Thr Ala Lys His Phe Asn Met Leu Val Ala Glu Asn Ala Met Lys 385 390 395 400 Pro Glu Ser Leu Gln Pro Thr Glu Gly Asn Phe Thr Phe Asp Asn Ala 405 410 415 Asp Lys Ile Val 420 Asp Tyr Ala Ile Ser 425 His Asn Met Lys Met 430 Arg Gly His Thr Leu 435 Leu Trp His Asn Gln 440 Val Pro Asp Trp Phe 445 Phe Pro Ser Asp Pro Ser Lys Pro Ala Ser Arg Asp Leu Leu Leu Gln Arg 450 455 460 Leu Lys Thr His Ile Thr Thr Val Leu Asp His Phe Lys Thr Lys Tyr 465 470 475 480 Gly Ser Gln Asn Pro Ile Ile Gly Trp Asp Val Val Asn Glu Val Leu 485 490 495 Asp Asp Asn Gly 500 Ser Leu Arg Asn Ser 505 Lys Trp Leu Gln Ile 510 Ile Gly Pro Asp Tyr 515 Ile Glu Lys Ala Phe 520 Glu Tyr Ala His Glu 525 Ala Asp Pro Ser Met Lys Leu Phe Ile Asn Asp Tyr Asn Ile Glu Asn Asn Gly Val 530 535 540 Lys Thr Gln Ala Met Tyr Asp Leu Val Lys Arg· Leu Lys Ser Glu Gly 545 550 555 560 Val Pro Ile Asp Gly Ile Gly Met Gln Met His Ile Asn Ile Asn Ser50 565 570 575 Asn Ile Asp Asn 580 Ile Lys Ala Ser Ile 585 Glu Lys Leu Ala Ser 590 Leu Gly Val Glu Ile 595 Gln Val Thr Glu Leu 600 Asp Met Asn Met Asn 605 Gly Asn Ile Ser Asn Glu Ala Leu Leu Lys Gln Ala; Arg Leu Tyr Lys Gln Leu Phe 610 615 620 Asp Leu Phe Lys Ala Glu Lys Gln Tyr Ile Thr Ala Val Val Phe Trp 625 630 635 640 Gly Val Ser Asp Asp Val Thr Trp Leu Ser Lys Pro Asn Ala Pro Leu 645 650 655 Leu Phe Asp Thr 660 Lys Leu Gln Ala Lys 665 Pro Ala Tyr Trp Ala 670 Ile Val Asp Pro Asn 675 Lys Ala Thr Pro Asp 680 Ile Gln Ser Ala Lys 685 Ala Leu Glu Gly Ser Pro Thr Met Gly Thr Asn Val Asp Asn Ser Trp Lys Leu Val 690 695 700 Lys Pro Leu Tyr Ala Asn Thr Phe Val Glu Gly Ser Val Gly Ala Thr

705 710 715 720Ala Ala Val Lys Ser 725 Met Trp Asp Thr Lys 730 Asn Leu Tyr Leu Leu 735 Val Gln Val Ser Asp 740 Asn Thr Pro Ser Ser 745 Asn Asp Gly Ile Glu 750 Ile Phe Val Asp Lys 755 Asn Asp Asp Lys Ser 760 Thr Ser Tyr Glu Thr 765 Asp Asp Glu His Tyr 770 Thr Ile Lys Arg Asp 775 Gly Thr Gly Ser Ser 780 Asp Ile Thr Lys Tyr Val Thr Ser Asn Ala Asp Gly Tyr Val Ala Gln Leu Ala Ile Pro 785 790 795 800 Ile Glu Asp Ile Asn 805 Pro Ala Leu Asn Asp 810 Lys Ile Gly Phe Asp 815 Ile Arg Ile Asn Asp 820 Asp Lys Gly Ile Gly 825 Asn Ile Asp Ala Ile 830 Thr Val Trp Asn Asp 835 Tyr Thr Asn Ser Gln 840 Asp Thr Asn Thr Ser 845 Tyr Phe Gly Asp Leu 850 Val Leu Ser Lys Pro 855 Ala Gln Ile Ala Thr 860 Ala Ile Tyr Gly Thr Pro Val Ile Asp Gly Lys Val Asp Asp Ile Trp Asn Asn Val Glu 865 870 875 880 Ala Ile Ser Thr Asn 885 Thr Trp Val Leu Gly 890 Ser Asn Gly Ala Thr 895 Ala Thr Ala Lys Met 900 Met Trp Asp Asp Lys 905 Tyr Leu Tyr Val Leu 910 Ala Asp Val Thr Asp 915 Ser Asn Leu Asn Lys 920 Ser Ser Val Asn Pro 925 Tyr Glu Gln Asp Ser 930 Val Glu Val Phe Val 935 Asp Gln Asn Asn Asp 940 Lys Thr Thr Tyr Tyr Lys Asn Asp Asp Gly Gln Phe Arg Val Asn Tyr Asp Asn Glu Gln 945 950 955 960 Ser Phe Gly Gly Ser Thr Asn Ser Asn Gly Phe Lys Ser Ala Thr Ser 965 970 975 Leu Thr Gln Ser 980 Gly Tyr Ile Val Glu 985 Glu Ala Ile Pro Trp 990 Thr Ser Ile Thr Pro Ser Asn Gly Thr Ile Ile Gly Phe Asp Leu Gln Val Asn 995 1000 1005 Asp Ala Asp Glu Asn Gly Lys Arg Thr Gly Ile Val Thr Trp Cys Asp 1010 1015 1020 Pro Ser Gly Asn Ser Trp Gln Asp Thr Ser Gly Phe Gly Asn Leu Leu

1025 1030 1035 1040

Leu Thr Gly Lys Pro Ser Gly Val Gly Thr Lys Arg Met Ala Phe Asn

1045 1050 1055

Asp Ile Lys Asp Ser Trp Ala Lys Asp Ala Ile Glu Val Leu Ala Ser1060 1065 1070

Arg His Ile Val Glu Gly Met Thr Asp Thr Gln Tyr Glu Pro Asn Lys1075 1080 1085

Thr Val Thr Arg Ala Glu

1090 ..<210> 145<211> 1629

<212> DNA<213> Eukaryote<400> 145

atgaagattg tggatacaac- ttccgcagag ataaágattg aaatggàacc tgaaaaagag 60

atacctgctc tgaaagaagt actaaaagac tacttcaaag tcggagttgc actgccgtcc 120

aaggtcttcc tcaacccgaa ggacatagaa ctcatcacga aacacttcaa cagcatcacc 180

gcagaaaacg agatgaaacc ggatagtctg ctcgcgggca tcgaaaacgg taagctgaag 240

ttcaggtttg aaacagcaga caaatacatt cagttcgtcg aggaaaacgg catggttata 300

agaggtcaca cactggtgtg gcacaaccag acacccgact ggttcttcaa agacgaaaac 360

ggaaacctcc tctccaaaga agcgatgacg gaaagactca aagagtacat ccacaccgtt 420

gtcggacact tcaaaggaaa agtctacgca tgggacgtgg tgaacgaagc ggtcgatccg 480

aaccagccgg atggactgag aagatccacc tggtaccaga tcatggggcc tgactacata 540

gaactcgcct tcaagttcgc aagagaagca gatccagatg caaaactctt ctacaacgac 600

tacaacacat tcgagcccag aaagagagat atcatctaca acctcgtgaa ggatctcaag 660

gagaagggac tcatcgatgg gataggcatg cagtgtcáca tcagtcttgc aacagacatc 720

aaacagatcg aagaggccat caaaaagttc agcaccatac ccggtataga aattcacatc 780

acagaactcg atatgagtgt ctacagagat tccagttcca actacccaga ggcaccgagg 8401629

acggcactca tcgaacaggc tcacaaaatg atgcagctct ttgagatttt caagaagtac 900

agcaacgtga tcacgaacgt cacattctgg ggtctcaagg acgattactc ctggagagca 960

acaagaagaa acgactggcc gctcatcttc gacaaagatc accaggcgaa actcgcttac 1020

tgggcgatag tggcacctga ggtccttcca ccacttccaa aagaaagcag gatctccgaa 1080

ggcgaggctg tggtagtggg gatgatggat gactcgtacc tgatgtcgaa gccgatagag 1140

atccttgacg aagaagggaa cgtgaaggca acgatcaggg cggtgtggaa agacagcacg 1200

atctacatct acggagaggt acaggacaag acgaaaaaac cagcagaaga cggagtggcc 1260

atattcatca acccgaacaa cgaaagaaca ccctatctgc agcctgatga cacctacgct 1320

gtgctgtgga caaactggaa gacggaggtc aacagagaag acgtacaggt gaagaaattc 1380

gttgggcctg gctttagaag atacagcttc gagatgtcga tcacgatacc gggtgtggag 1440

ttcaagaaag acagctacat aggattcgac gctgcggtga tagacgacgg gaagtggtac 1500

agctggagcg acacgacgaa cagccagaag acgaacacga tgaactacgg aacgctgaaa 1560

ctcgaaggaa taatggtagc gacagcaaaa tacggaacac cggtcatcga tggagagata 1620gacgagtaa

<210> 146

<211> 542<212> PRT<213> Eukaryote<400> 146

Met Lys Ile Val Asp Thr Thr Ser Ala Glu Ile Lys Ile Glu Met Glu1 5 10 15

Pro Glu Lys Glu Ile Pro Ala Leu Lys Glu Val Leu Lys Asp Tyr Phe

20 25 30

Lys Val Gly Val Ala Leu Pro Ser Lys Val Phe Leu Asn Pro Lys Asp 35 40 45

Ile Glu Leu Ile Thr Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu

50 55 60

Met Lys Pro Asp Ser Leu Leu Ala Gly Ile Glu Asn Gly Lys Leu Lys65 70 75 80

Phe Arg Phe Glu Thr Ala Asp Lys Tyr Ile Gln Phe Val Glu Glu Asn

85 90 95

Gly Met Val Ile Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro

100 105 110

Asp Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser Lys Glu Ala

115 120 125

Met Thr Glu Arg Leu Lys Glu Tyr Ile His Thr Val Val Gly His Phe

130 135 140

Lys Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala Val Asp Pro145 150 155 160

Asn Gln Pro Asp Gly Leu Arg Arg Ser Thr Trp Tyr Gln Ile Met Gly

165 170 175

Pro Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro

180 185 190

Asp Ala Lys Leu Phe Tyr Asn.Asp Tyr Asn Thr Phe Glu Pro Arg Lys 195 200 205

Arg Asp Ile Ile Tyr Asn Leu Val Lys Asp Leu Lys Glu Lys Gly Leu

210 215 220

Ile Asp Gly Ile Gly Met Gln Cys His Ile Ser Leu Ala Thr Asp Ile225 230 235 240

Lys Gln Ile Glu Glu Ala Ile Lys Lys Phe Ser Thr Ile Pro Gly Ile

245 250 255

Glu Ile His Ile Thr Glu Leu Asp Met Ser Val Tyr Arg Asp Ser Ser

260 265 270

Ser Asn Tyr Pro Glu Ala Pro Arg Thr Ala Leu Ile Glu Gln Ala His 275 280 285

Lys Met Met Gln Leu Phe Glu Ile Phe Lys Lys Tyr Ser Asn Val Ile

290 295 300

Thr Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser Trp Arg Ala305 310 315 320

Thr Arg Arg Asn Asp Trp Pro Leu Ile Phe Asp Lys Asp His Gln Ala

325 330 335

Lys . Leu Ala Tyr Trp Ala Ile Val Ala Pro Glu Val Leu Pro Pro Leu

340 345 350

Pro Lys Glu Ser Arg Ile Ser Glu Gly Glu Ala Val Val Val Gly Met 355 360 365

Met Asp Asp Ser Tyr Leu Met Ser Lys Pro Ile Glu Ile Leu Asp Glu370 375 380537

385

390

405

410

420

425

435

440

450

455

465

470

485

490

500

505

515

520

530<210> 147<211><212>

535

Val Trp Lys Asp Ser Thr395 400Thr Lys Lys Pro Ala 415 GluAsn Glu Arg Thr 430 Pro TyrTrp Thr Asn 445 Trp Lys ThrLys Phe 460 Val Gly Pro GlyThr Ile Pro Gly Val Glu475 480Ala Ala Val Ile Asp 495 AspAsn Ser Gln Lys 510 Thr AsnGly Ile Met 525 Val Ala ThrGlu Ile 540 Asp Glu

1146DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 147

atgactttct ctcgacggca atttttgctg caaacctccgactgccaaaa tgcgcgcttt cgcccgcgca gtcgatgaagaaagaccatt ttcatattgg gactgccatc agcggtcgacttttaccgcg acctggttac ccgtgaattc agtgccattatgggagcgtc tgcatcccaa agaaggccaa tgggattgggaattttggcg aagaaaacga catgtacatt gtcgggcatgaccccggatt gggtgttcca ggattccaga ggcaagcccaaaacgcatgc gccaccagat tgaacagatg gcgggccgcttgggatgtgg tcaatgaggc ggtggacgag gaccaaggctaacattattg ggcccgagtt tatggagcac gccttcaattgacgctcacc tgttgtacaa cgactacaat atgcacggtcctggatttca tcaaaagata caagaaaaaa ggcattccgaggccatgtgg gcctgagctt tcccgatatc agcgagtttggccaaacagg gcatgcggat gcacattacc gagctggatatgggatcaca ttggcgccga gatttccacc gagtttgacttggcccaaag ggctgccgga agaagtcgaa caggaatttatttaaactgt ttttgaaata ccgcgatgat attgaaaggggatgcggaat cgtggaaaaa taatttccca gtaagggggctttgatcgcc gataccgcag aaaaccggcc tatgattcgactttaa<210> 148<211> 381<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(28)<400> 148

Met Thr Phe Ser Arg Arg Gln Phe Leu Léu Gln

1 5 10

Ala Leu Leu Ser Thr Ala Lys Met Arg Ala Phe

20 25

Glu Val Gly Leu Lys Asp His Phe Lys Asp His

35 40

Ala Ile Ser Gly Arg Leu Met Thr Glu Met Pro

50 .55

Leu Val Thr Arg Glu Phe Ser Ala Ile Thr Met65' 70 7 5

ccggcctggctgggccttaatgatgacggaccatggaaaaagattgccgattctggtctgtttctcgcgaataagggccgggcgcaaaagacgcccacgagggaaaaacgtccagggcatagaaaagccttggacgtgttacgctgatgaccgatcgctatcaccttctggcaccaactattgtcgaact

acttttgagcagaccattttaatgccggcccgacatgaaacaaattcgtcgcactcacagcgctttgctgggtacacgcgcccgtggtttagtggacccccgaattcgtcaggcatgcaagcaagcctacaccagtggccactggacccccaccgctttcgggaaccggacccgctgctggaccaaaaac

Thr Ser Ala Gly Leu15

Ala Arg Ala Val Asp30

Phe His Ile Gly Thr45

Ala Phe Tyr Arg Asp60

Glu Asn Asp Met Lys80Trp Glu Arg Leu His Pro Lys Glu Gly Gln Trp Asp Trp Glu Ile Ala

85 90 95

Asp Lys Phe Val Asn Phe Gly Glu Glu Asn Asp Met Tyr Ile Val Gly100 105 110

His Val Leu Val Trp His Ser Gln Thr Pro Asp Trp Val Phe Gln Asp115 120 125

Ser Arg Gly Lys Pro Ile Ser Arg Asp Ala Leu Leu Lys Arg Met Arg

130 135 140

His Gln Ile Glu Gln Met Ala Gly Arg Tyr Lys Gly Arg Val His Ala145 150 155 160

Trp Asp Val Val Asn Glu Ala Val Asp Glu Asp Gln Gly Trp Arg Lys

165 170 175

Ser Pro Trp Phe Asn Ile Ile Gly Pro Glu Phe Met Glu His Ala Phe180 185 190Asn Tyr Ala His Glu Val Asp Pro Asp Ala His Leu Leu Tyr Asn Asp195 200 205

Tyr Asn Met His Gly Arg Glu Lys Arg Glu Phe Val Leu Asp Phe Ile

210 215 220

Lys Arg Tyr Lys Lys Lys Gly Ile Pro Ile Gln Gly Ile Gly Met Gln225 230 235 240

Gly His Val Gly Leu Ser Phe Pro Asp Ile Ser Glu Phe Glu Lys Ser

245 250 255

Leu Gln Ala Tyr Ala Lys Gln Gly Met Arg Met His Ile Thr Glu Leu260 265 270

Asp Met Asp Val Leu Pro Val Ala Trp Asp His Ile Gly Ala Glu Ile275 280 285

Ser Thr Glu Phe Asp Tyr Ala Asp Glu Leu Asp Pro Trp Pro Lys Gly

290 295 300

Leu Pro Glu Glu Val Glu Gln Glu Phe Thr Asp Arg Tyr Thr Ala Phe305 310 315 320

Phe Lys Leu Phe Leu Lys Tyr Arg Asp Asp Ile Glu Arg Val Thr Phe

325 330 335

Trp Gly Thr Gly Asp Ala Glu Ser Trp Lys Asn Asn Phe Pro Val Arg340 345 350

Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Arg Tyr Arg Arg Lys355 360 365

Pro Ala Tyr Asp Ser Ile Val Glu Leu Thr Lys Asn Leu

370 375 380

<210> 149<211> 1044<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 149

atgaagaagc tttttgtcgc ggtcgttttg ttgcccttag caactttttt cgcgtcggac 60

ggattggagg gagaaccttt gagatcgtta gccgagaaac ttggcatcta catcggttac 120

gcttcgatca accatttctg gactcttcçg gattcaaaca agtacacaga agtggcaaag 180

agggagttca acatactcac gccagagaac caaatgaagt gggacagcct tcacccagag 240

cctgacaggt acaacttcac ttacgcagag cgtcatgtcg agttcgcttt ggaaaacaac 300atgctcgttc acggccacac actcgtttgg cacaaccaac ttccgttctg gttgaacaga.. 360cagtggacca aagaagaact cctgaaagtc cttgaggacc acatcaaaac agtcgtcggt 420

cacttcaaag gaagggtgaa gatttgggac gtggtgaacg aagcggtcag cgacatgggc 480

agttacagag agaccatttg gtacaagacc atcggacccg agtacatcga aaaggcattc 540

gtgtgggcaa gacaagccga tccggaagcg atcctcatat acaacgacta caatatagaa 600

acgatcaatc ccaaatcgaa tttcacctac cagctcatca aggagctgaa agaaaaaggt 660

gtgccgatag acggcatcgg ttttcaaatg cacatagaca tcaacggaat aaactatgac 720

agtttcagaa acaacctgaa gaggttcgct gatctcggtc tgaagctcta catcacggaa '780atggatgtga gaatacccaa gaacgcaact gaaaaagact tggacagaca ggcagaaatc 840

tacgcgaaga tcttcgaaat ctgcttagag aatcctgcgg tccaagccat acagttctgg 900ggtttcacgg acaagtattc ctgggtgcct ggctttttca gcgggtacga tcatgcgctg 960

atctttgaca gggactacag cçccaagccc gcgtattttg cgataaagag ggtgctcgaa 1020gccaaggtga gcaagggacg ctga 1044

<210> 150

<211> 347

<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL

<222> (1)...(18)

<400> 150

Met Lys Lys Leu Phe Val Ala Val Val Leu Leu Pro Leu Ala Thr Phe

1 5 10 15

Phe Ala Ser Asp Gly Leu Glu Gly Glu Pro Leu Arg Ser Leu Ala Glu

20 25 30

Lys Leu Gly Ile Tyr Ile Gly Tyr Ala Ser Ile Asn His Phe Trp Thr

35 40 45

Leu Pro Asp Ser Asn Lys Tyr Thr Glu Val Ala Lys Arg Glu Phe Asn50 55 60

Ile Leu Thx Piro Glu Asn Gln Met Lys Trp Asp Ser* Leu His Piro Glu65 70 75 80

Pro Asp Arg Tyr Asn Phe Thr Tyr Ala Glu Arg His Val Glu Phe Ala

85 90 95

Leu Glu Asn Asn Met Leu Val His Gly His Thr Leu Val Trp His Asn

100 105 110

Gln Leu Pro Phe Trp Leu Asn Arg Gln Trp Thr Lys Glu Glu Leu Leu115 120 125

Lys Val Leu Glu Asp His Ile Lys Thr Val Val Gly His Phe Lys Gly130 135 140

Arg Val Lys Ile Trp Asp Val Val Asn Glu Ala Val Ser Asp Met Gly145 150 155 160

Ser Tyr Arg Glu Thr Ile Trp Tyr Lys Thr Ile Gly Pro Glu Tyr Ile

165 170 175

Glu Lys Ala Phe Val Trp Ala Arg Gln Ala Asp Pro Glu Ala Ile Leu180 185 190

Ile Tyr Asn Asp Tyr Asn Ile Glu Thr Ile Asn Pro Lys Ser Asn Phe

195 200 205

Thr Tyr Gln Leu Ile Lys Glu Leu Lys Glu Lys Gly Val Pro Ile Asp

210 215 220

Gly Ile Gly Phe Gln Met His Ile Asp Ile Asn Gly Ile Asn Tyr Asp

225 230 235 240

Ser Phe Arg Asn Asn Leu Lys Arg Phe Ala Asp Leu Gly Leu Lys Leu

245 250 255

Tyr Ile Thr Glu Met Asp Val Arg Ile Pro Lys Asn Ala Thr Glu Lys

260 265 270

Asp Leu Asp Arg Gln Ala Glu Ile Tyr Ala Lys Ile Phe Glu Ile Cys

275 280 285

Leu Glu Asn Pro Ala Val Gln Ala Ile Gln Phe Trp Gly Phe Thr Asp290 295 300

Lys Tyr Ser Trp Val Pro Gly Phe Phe Ser Gly Tyr Asp His Ala Leu305 310 315 320

Ile Phe Asp Arg Asp Tyr Ser Pro Lys Pro Ala Tyr Phe Ala Ile Lys

325 330 335

Arg Val Leu Glu Ala Lys Val Ser Lys Gly Arg340 345

<210> 151<211> 1131<212> DNA<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 151

atgcgatcta tgccacttta tgtgttgtta tgcagcgccc ttctgaccgg cagcctatat 60

gcacaagacc aaaatgcttc tttaaaacag gcctttagca aaaactttag tattggcaca 120

gccttaagtg ctacacaaat tcagggcaaa gagccgggca cactggaatt ggtaacacag 180

caatttaacg cggtgacggc agaaaacgtg atgaagtggg aaatcattga acctgtggaa 240

ggccagttca actttgctgc cgccgacgcc atgattgaat tcgccgaagc caatcatatc 300

aaggtgatag gccatgtgct gttatggcac gaacaaacac cagcctgggt atttctggac 360

gccaaaggcc aggccgcctc aaaggaactg gtgttatcac ggctaaaaaa ccatatcaat 420

gccgtaatgg gccgctacaa aggccgtatt catggctggg atgcagtcaa cgaagcctta 480

aatgaagacg gcactctgcg ccaatccaac tggtataaag ctttaggcga cgactatata 540

gccacagtct ttgaactggc gcatcaggcc gacccgaaag ccgaactcta ttacaacgac 600ttcaatttat ttaaaccgga aaaacgcgct ggtgtactca aactggtggc agctttaaaa 660

gcgaaaaatg tgcctatcca cggcataggc gagcaaggcc attacagcct ggattaccct 720

gagctgcagc aagtagaaga ctctattgtg gcttttaaaa acactggcct gaaagtggtg 780

attaccgaac tggatatctc agttttaccc ttccctgagc cagaaaagat tggtgctgat 840

atctcactca atatgcagtt aaaacaagaa cttaatccct acgccgatgg cttacccaaa 900

gaagtcagcg atcaactgac agaaaaatac ctgcaattat ttcagctatt tttacgccac 960

agcgacgcca tcgaacgcgt gaccttatgg ggcgtaaacg acaaccaaac ctggcgcaac 1020aactggccaa tgaaaggcag aacagactac cccttactct tcgaccggaa aaaccagcca 1080aaagaagtgg ttcctgcatt gattaaactg gcggaaaaag ctggtaaata a 1131

<210> 152<211> 376<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(21)<400> 152

Met Arg Ser Met Pro Leu Tyr Val Leu Leu Cys Ser Ala Leu Leu Thr15 10 15

Gly Ser Leu Tyr Ala Gln Asp Gln Asn Ala Ser Leu Lys Gln Ala Phe

20 25 30

Ser Lys Asn Phe Ser Ile Gly Thr Ala Leu Ser Ala Thr Gln Ile Gln 35 40 45

Gly Lys Glu Pro Gly Thr Leu Glu Leu Val Thr Gln Gln Phe Asn Ala

50 55 60

Val Thr Ala Glu Asn Val Met Lys Trp Glu Ile Ile Glu Pro Val Glu65 " 70 75 80

Gly Gln Phe Asn Phe Ala Ala Ala Asp Ala Met Ile Glu Phe Ala Glu

85 90 95

Ala Asn His Ile Lys Val Ile Gly His Val Leu Leu Trp His Glu Gln

100 105 110

Thr Pro Ala Trp Val Phe Leu Asp Ala Lys Gly Gln Ala Ala Ser Lys

115 120 125

Glu Leu Val Leu Ser Arg Leu Lys Asn His Ile Asn Ala Val Met Gly

130 135 140

Arg Tyr Lys Gly Arg Ile His Gly Trp Asp Ala Val Asn Glu Ala Leu145 150 155 160

Asn Glu Asp Gly Thr Leu Arg Gln Ser Asn Trp Tyr Lys Ala Leu Gly

165 170 175

Asp Asp Tyr Ile Ala Thr Val Phe Glu Leu Ala His Gln Ala Asp Pro

180 185 190

Lys Ala Glu Leu Tyr Tyr Asn Asp Phe Asn Leu Phe Lys Pro Glu Lys 195 200 205

Arg Ala Gly Val Leu Lys Leu Val Ala Ala Leu Lys Ala Lys Asn Val

210 ".., 215 220

Pro Ile His Gly Ile Gly Glu Gln Gly His Tyr Ser Leu Asp Tyr Pro225 230 235 240

Glu Leu Gln Gln Val Glu Asp Ser Ile Val Ala Phe Lys Asn Thr Gly

245 250 255

Leu Lys Val Val Ile Thr Glu Leu Asp Ile Ser Val Leu Pro Phe Pro: 260 ·- 265 270

Glu Pro Glu Lys Ile Gly Ala Asp Ile Ser Leu Asn Met Gln Leu Lys 275 280 285

Gln Glu Leu Asn Pro Tyr Ala Asp Gly Leu Pro Lys Glu Val Ser Asp

290 295 300

Gln Leu Thr Glu Lys Tyr Leu Gln Leu Phe Gln Leu Phe Leu Arg His305 . 310 315 320

Ser Asp Ala Ile Glu Arg Val Thr Leu Trp Gly Val Asn Asp Asn Gln

325 330 335

Thr Trp Arg Asn Asn Trp Pro Met Lys Gly Arg Thr Asp Tyr Pro Leu

340 345 350

Leu Phe Asp Arg Lys Asn Gln Pro Lys Glu Val Val Pro Ala Leu Ile 355 ' 360 365

Lys Leu Ala Glu Lys Ala Gly Lys370 375<210> 153

<211> 1020

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 153

atgggtgcta tgggcctggc ggcgctgtat tcgctgccag ccaatgcaca gacctgcatt 60

acgcagagtc agacgggcac caacaacggc cactattttt cgttctggaa ggacaatccg 120

ggaacggtca atttctgtat gtatgccaac ggccgttaca cgtctaactg gaacggcatc 180

aacaattggg tcggcggcaa aggctggcaa accggctcgc gcagaaacgt cacctactct 240

ggctcgttca actctcccgg caatggctat ctggctgctc tactggctgg accaccaatc 300

ctgttggtcg agtactacat catcgagagc tggggaaatt ggcgcccgcc gggttcggat 360

ggaacattgt taggcaccgt cactagcgac ggcggtactt acgatatcta tcgctcgcgc 420

cgcaccaacg cgccttgtat cactggcaac tcctgtaact tcgatcagta ctggagcgta 480

cggcaatcca agcgcgtggg cggcacgatt accacgggca atcacttcga cgcttgggcg 540

gcacgcggct tgaacctcgg cacgcacaac taccaagtga tggcgaccga gggatatcag 600

agcaacggca gctccgacat caccattagc gacaacccgg gaccgacgcc aggacccact 660

ccgaacccga atcccacgcc gggcaccaag aatttcacgg tgcgcgcgcg cggaaccgcg 720

gggggtgagt ccatcacgct gcgtgtgaac aatcagaacg tgcagacctg gacgctgtcg 780

accagctacc agaacttcac ggcgtccacg acgttgagtg gtggcatcac ggtcgcgttc 840

accaatgatg gtggtagtcg agacgttcag gtggattaca tccaggtgaa cggcgcaact 900

cgacaatccg agagccagac gtacaacacc ggcctctatg ccaacggcag ttgcggcggc 960

ggctcgaaca gcgagtggat gcattgcaat ggagcgatcg gctacggcaa cacgccgtag 1020<210> 154<211> 339<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (16)<400> 154

Met Gly Ala Met Gly Leu Ala Ala Leu Tyr Ser Leu Pro Ala Asn Ala

1 5 10 15

Gln Thr Cys Ile Thr Gln Ser Gln Thr Gly Thr Asn Asn Gly His Tyr

20 25 30

Phe Ser Phe Trp Lys Asp Asn Pro Gly Thr Val Asn Phe Cys Met Tyr

35 40 45

Ala Asn Gly Arg Tyr Thr Ser Asn Trp Asn Gly Ile Asn Asn Trp Val

50 55 60

Gly Gly Lys Gly Trp Gln Thr Gly Ser Arg Arg Asn Val Thr Tyr Ser65 70 75 80

Gly Ser Phe Asn Ser Pro Gly Asn Gly Tyr Leu Ala Ala Leu Leu Ala

85 90 95

Gly Pro Pro Ile Leu Leu Val Glu Tyr Tyr Ile Ile Glu Ser Trp Gly

100 105 HO

Asn Trp Arg Pro Pro Gly Ser Asp Gly Thr Leu Leu Gly Thr Val Thr

115 120 125

Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Ser Arg Arg Thr Asn Ala

130 135 140

Pro Cys Ile Thr Gly Asn Ser Cys Asn Phe Asp Gln Tyr Trp Ser Val145 150 155 160

Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr Thr Gly Asn His Phe

165 170 175

Asp. Ala Trp Ala Ala Arg Gly Leu Asn Leu Gly Thr His Asn Tyr Gln

180 185 190

Val Met Ala Thr Glu Gly Tyr Gln Ser Asn Gly Ser Ser Asp Ile Thr

195 200 , 205

Ile Ser Asp Asn Pro Gly Pro Thr Pro Gly Pro Thr Pro Asn Pro Asn

210 215 220

Pro Thr Pro Gly Thr Lys Asn Phe Thr Val Arg Ala Arg Gly Thr Ala225· 230 235 240

Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn Gln Asn Val Gln Thr

245 250 255

Trp Thr Leu Ser Thr Ser Tyr Gln Asn Phe Thr Ala Ser Thr Thr Leu<211><212>

260 265

Ser Gly Gly Ile Thr Val Ala Phe Thr Asn Asp

275 280

Val Gln Val Asp Tyr Ile Gln Val Asn Gly Ala

290 295

Ser Gln Thr Tyr Asn Thr Gly Leu Tyr Ala Asn305 310 315

Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly325 330

Asn Thr Pro<210> 1551836DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 155

atgaaaggat taattgcggc agcgcttgct ggcttggcatggacagtgca caacgtttac caçcagtacc attcagaattctctggagtc agaataacaa gggcaccgta agcatgaagaccgaatggag gaactttcga tgctacctgg aatggcaccgggtaagaaat ggggctcgtc cagcactacc acccccacgtgaattcgcgg cgacatggtc ctcaagcgat aacgtaaaaagcgtactatc caactggaag tatcccgact aaacaggaaaacaaatcaaa ttgagtacta catcatccag gatcgtggtaggaacgaact ccaaaaaata cggcgaaggg acgatcgatgatcgcagaca gaatcaacca gcctgatctg tcaggaaagattcagcgtcc cga.aaagtac gagcagccat aggcaaagtgcatttccagg cctgggaáaa tgccggaatg aaaatgatgtgcaatgaaag tcgagtccta taccggttct gcgaccggtgaagaatatac tcaccattgg tggaatcttg agcagtagcaacagtaagta gcagtagcag caatgcatat acgcttgtcagccggaacag tgaccaggag ccccaatact gcgacctatgcttactgcaa cgccgagtac cggttggaaa tttgtcggttactacgagta ctgctaccgt caccatgacc aaagatattactggtatcgg gagatggcac gaccaacttg atcaaggatggtcatctcca caggtgatgg cacctcctgg aagctcgggctccgcagcaa cgacgagtgt cagcaatgga atcgcgactgtctcaaacct atcaacccca gctaattcag tataacgtggtacaagctca ccttcaaggc aaaagctgct gctgcaaggacagtcggtgg acccatgggc tggatatgct tccaaggaatcagacatatg agttcgtatt taaaatgact agcgctactgttcaatctcg gccaggcaac aggcgccgtc aatattagtgacagctggta caacacccgt attccgtgga tataatgagggtattcatat ccttggatgg taggacgttg aacattgttccaggtcaagt tagtggacat caatggtaag atgagagcctgcttccatcc cgctgtccaa tatccccgct gggcggtattggcgttaagc aggcatcccc gatagttctg gaataa156611PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (21)<400> 156

Met Lys Gly Leu Ile Ala Ala Ala Leu Ala Gly

1 5 10

Ser Leu Ser Trp Gly Gln Cys Thr Thr Phe Thr

270

Gly Gly Ser Arg Asp285

Thr Arg Gln Ser Glu300

Gly Ser Cys Gly Gly320

Ala Ile Gly Tyr Gly335

tcggggcctcgtaatggcatttacgggaggagaatatcctccgcaggcaatgcttggagtatggagcaaggctataatgcgaattctgtagtggaaacttggacgattaccctgtcgcttttggctctgcgtactgcaagcgaatgtttcccccgaatgcgggctggggaccgcaactgcgaaacttcccaaggtacaaatcaatgtgacctctttacaaaaattgaagttcgatcttacacacggcttcatgtaaagctcggcaacacacagtgtatggccttcaatgtatattgacgt

cctatcctggtgattacgaggagcacgaatggctagagcttattactcttctatggctggtacctcattctgcatcgggttgaattctatcaagcaataccgtttccaaagtatgaagtcgaaggttacacagtagcagctcccgctggattcagtacagtcttacgtcaaaaatttgaacagtagcagcctggggtaatcaccattggaggatatgagccgcattccaaaacgacagagacagttcgcgagtatatacgggagaggcctagccaaactgggtcggaattaagtggtgac

<210><211><212>

20

25

Asn Cys Asn Gly Ile Asp Tyr Glu Leu Trp Ser

35

40

65 Thr Val Ser Met Lys Ile Thr Gly Gly Ser Thr

50

55

Thr Phe Asp Ala Thr" Trp Asri Gly Thr Glu Asn

Leu Ala Phe Gly Ala15

Thr Ser Thr Ile Gln30

Gln Asn Asn Lys Gly45

Asn Pro Asn Gly Gly60

Ile Leu Ala Arg Ala

6012018024030036042048054060066072078084090096010201080114012001260132013801440150015601620168017401800183665 70 75 80 Gly Lys Lys Trp Gly Ser Ser Ser Thr Thr Thr Pro Thr Ser Ala Gly 85 90 95 Asn Ile Thr Leu Glu Phe Ala Ala Thr Trp Ser Ser Ser Asp Asn Val 100 105 110 Lys Met Leu Gly Val Tyr Gly Trp Ala Tyr Tyr Pro Thr Gly Ser Ile 115 120 125 Pro Thr Lys Gln Glu Asn Gly Ala Ser Thr Ser Phe Thr Asn Gln Ile 130 135 140 Glu Tyr Tyr Ile Ile Gln Asp Arg Gly Ser Tyr Asn Ala Ala Ser Gly 145 150 155 160 Gly Thr Asn Ser Lys Lys Tyr Gly Glu Gly Thr Ile Asp Gly Ile Leu 165 170 175 Tyr Glu Phe Tyr Ile Ala Asp Arg Ile Asn Gln Pro Asp Leu Ser Gly 180 185 190 Lys Ser Gly Asn Phe Lys Gln Tyr Phe Ser Val Pro Lys Ser Thr Ser 195 200 205 Ser His Arg Gln Ser Gly Thr Ile Thr Val Ser Lys His Phe Gln Ala 210 215 220 Trp Glu Asn Ala Gly Met Lys Met Met Ser Cys Arg Leu Tyr Glu Val 225 230 235 240 Ala Met Lys Val Glu Ser Tyr Thr Gly Ser Ala Thr Gly Val Gly Ser 245 250 255 Ala Lys Val Thr Lys Asn Ile Leu Thr Ile Gly Gly Ile Leu Ser Ser 260 265 270 Ser Ser Thr Ala Ser Ser Ser Ser Thr Val Ser Ser Ser Ser Ser Asn 275 280 285 Ala Tyr Thr Leu Val Thr Asn Val Ser Pro Ala Gly Ala Gly Thr Val 290 295 300 Thr Arg Ser Pro Asn Thr Ala Thr Tyr Ala Pro Asn Ala Ser Val Gln 305 310 315 320 Leu Thr Ala Thr Pro Ser Thr Gly Trp Lys Phe Val Gly Trp Ala Gly 325 330 335 Asp Leu Thr Ser Thr Thr Ser Thr Ala Thr Val Thr Met Thr Lys Asp 340 345 350 Ile Thr Ala Thr Ala Lys Phe Glu Leu Val Ser Gly Asp Gly Thr Thr 355 360 365 Asn Leu Ile Lys Asp Gly Asn Phe Pro Ser Ser Ser Val Ile Ser Thr 370 375 380 Gly Asp Gly Thr Ser Trp Lys Leu Gly Gln Gly Thr Asn Trp Gly Asn 385 390 395 400 Ser Ala Ala Thr Thr Ser Val Ser Asn Gly Ile Ala Thr Val Asn Val 405 410 415 Thr Thr Ile Gly Ser Gln Thr Tyr Gln Pro Gln Leu Ile Gln Tyr Asn 420 425 430 Val Ala Leu Tyr Lys Asp Met Ser Tyr Lys Leu Thr Phe Lys Ala Lys 435 440 445 Ala Ala Ala Ala Arg Lys Ile Glu Val Ala Phe Gln Gln Ser Val Asp 450 455 460 Pro Trp Ala Gly Tyr Ala Ser Lys Glu Phe Asp Leu Thr Thr Thr Glu 465 470 475 480 Gln Thr Tyr Glu Phe Val Phe Lys Met Thr Ser Ala Thr Asp Thr Ala 485 490 495 Ser Gln Phe Ala Phe Asn Leü Gly Gln Ala Thr Gly Ala Val Asn Ilè 500 505 510 Ser Asp Val Lys Leu Val Tyr Thr Thr Ala Gly Thr Thr Pro Val Phe 515 520 525 Arg Gly Tyr Asn Glu Ala Ala Thr Gln Glu Arg Pro Val Phe Ile Ser 530 535 540 Leu Asp Gly Arg Thr Leu Asn Ile Val Pro Val Tyr Gly Ala Lys Leu 545 550 555 560 Gln Val Lys Leu Val Asp Ile Asn Gly Lys Met Arg Ala Ser Phe Asn 565 570 575 Val Val Gly Ile Ala Ser Ile Pro Leu Ser Asn Ile Pro Ala Gly Arg 580 585 590 Tyr Tyr Ile Asp Val Ser Gly Asp Gly Val Lys Gln Ala Ser Pro Ile 595 600 605Val Leu Glu610<210> 157<211> 645<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 157

atgtttaagt taagtaagaa aattttgatg gtgttattaa caatttcaat gagttttatt 60

agcttatttg cagtaaccgc gtatgcagct tcgacagact actggcaaaa ttggactgat 120

ggtggtggga cagtaaatgc taccaatgga tctgatggca attacagtgt ttcatggtca 180

aattgcggga attttgttgt tggtaaaggc tggactaccg gatcagcaac tagggtaata 240aactataatg ccggagcctt ttcgccgtcc ggcaatggat atttagctct ttatgggtgg 300

acgagaaatt cactcataga atattacgtc gttgatagct gggggactta tagacctact 360ggaacttata aaggcactgt gactagtgat ggagggacat atgacatata cacgactaca 420cgaaccaacg caccttccat tgacggcaat aatacaaatt tcacccagtt ctggagtgtt 480

aggcagtcaa agagaccgat tggtaccaac aataccatca cttttagcaa ccacgttaac 540

gcctggaaga gtaaaggaat gaatctgggg agtagttggg cttatcaggt attagcgaca 600

gagggatatc aaagtagtgg gtactctaac gtaacggtct ggtaa 645

<210> 158<211> 214<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) . . . (29)<400> 158

Met Phe Lys Leu Ser Lys Lys Ile Leu Met Val Leu Leu Thr Ile Ser15 10 15

Met Ser Phe Ile 20 Ser Leu Phe Ala Val 25 Thr Ala Tyr Ala Ala 30 Ser ThrAsp Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Thr 35 40 45 Asn Gly 50 Ser Asp Gly Asn Tyr 55 Ser Val Ser Trp Ser 60 Asn Cys Gly AsnPhe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala Thr Arg Val Ile65 70 75 80Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn Gly Tyr Leu Ala 85 90 95 Leu Tyr Gly Trp Thr Arg Asn Ser Leu Ile Glu Tyr Tyr Val Val Asp 100 105 110 Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Thr 115 120 125 Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr Arg Thr Asn Ala 130 135 140 Pro Ser Ile Asp Gly Asn Asn Thr Asn Phe Thr Gln Phe Trp Ser Val

145 150 155 160

Arg Gln Ser Lys Arg Pro Ile Gly Thr Asn Asn Thr Ile Thr Phe Ser

165 .170 175

Asn His Val Asn Ala Trp Lys Ser Lys Gly Met Asn Leu Gly Ser Ser

180 185 190

Trp Ala Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Tyr

195 200 205

Ser Asn Val Thr Val Trp210<210> 159<211> 1041<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 159

atgatcagtc tcaaacgagt ggcggcgctc ctgtgcgtcg caggtctggg catgtctgcg 60

gcaaacgcgc agacctgcct cacgtcgagt caaaccggca ctaacaatgg cttctattat 120tccttctgga aggacagtcc gggcacggtg aatttttgcc tgcagtccgg cggccgttac 180

acatcgaact ggagcggcat caacaactgg gtgggcggca agggatggca gaccggttca 240

cgccggaaca tcacgtactc gggcagcttc aattcaccgg gcaacggcta cctggcgctt 300

tacggatgga ccaccaatcc actcgtcgag tactacgtcg tcgatagctg ggggagctgg 360

cgtccgccgg gttcggacgg aacgttcctg gggacggtca acagcgatgg cggaacgtat 420

gacatctatc gcgcgcagcg ggtcaacgcg ccgtccatca tcggcaacgc cacgttctat 480

caatactgga gcgttcggca gtcgaagcgg gtaggtggga cgatcaccac cggaaaccac 540

ttcgacgcgt gggccagcgt gggcctgaac ctgggcactc acaactacca gatcatggcg 600

accgagggct accaaagcag cggcagctcc gacatcacgg tgagtgaagg cggtagcagc 660

agtggtggcg gaagcagcac gagcagcagc agcggcggtg gtggcaccaa gagcttcacg 720

gttcgtgcgc gcggtaccgc gggcggtgag tccatcacgc tgcgcgtgaa caaccagaac 780

gtgcagacct ggacgctggg caccagcatg acgaactaca cggcgtcgac ttcactgagc 840

ggcggcatca ccgtggtgta cacgaacgac agcggtaacc gcgacgtgca ggtggactac 900

atcgtcgtga acggccagac gcgccagtcc gaagcccaga gctacaacac cggcctttat 960

gcgaacgggc gttgcggcgg tggctccaac agcgaatgga tgcattgcaa cggcgccatc 1020

ggctacggca atacaccgta a 1041

<210> 160<211> 346<212> PRT<213> Desconhecido<220><223> Obtido para uma amostra ambiental<220><221> SIGNAL<222> (1) . . . (23)<400> 160

Met Ile Ser Leu Lys Arg Val Ala Ala Leu Leu Cys Val Ala Gly Leu1 5 10 15

Gly Met Ser Ala Ala Asn Ala Gln Thr Cys Leu Thr Ser Ser Gln Thr 20 25 30

Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Lys Asp Ser Pro Gly35 40 45

Thr Val Asn Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Asn Trp50 55 60

Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ser65 70 75 80

Arg Arg Asn Ile Thr Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly85 90 95

Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr 100 105 110

Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Ser Asp Gly Thr115 120 125

Phe Leu Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg130 135 140

Ala Gln Arg Val Asn Ala Pro Ser Ile Ile Gly Asn Ala Thr Phe Tyr145 150 155 160

Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr165 170 . 175

Thr Gly Asn His Phe Asp Ala Trp Ala Ser Val Gly Leu Asn Leu Gly 180 185 190

Thr His Asn Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly195 200 205

Ser Ser Asp Ile Thr Val Ser Glu Gly Gly Ser Ser Ser Gly Gly Gly210 215 220

Ser Ser Thr Ser Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser Phe Thr225 230 235 "" 240

Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val245 250 255

Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met Thr Asn 260 265 270

Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Val Tyr Thr275 280 285

Asn Asp Ser Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Val Val Asn290 295 300

Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr305 310 315 320

Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys325 330

Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro340 345

<210> 161<211> 1047<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 161

atgttcaaag gtcttttgaa atcggtcctc accggcaagctgtctggccg gactgtggat gacacaggcg caggcgcagaacgggcaaca acggcggctt cttcttttcg ttctggaaagttctgcatgt actccggcgg tcgctatacc tccagctggaggtgggaagg gctggcaaac cggttcatcc cgcacggtgatcgccgggaa acggctacct gactctgtac ggatggaccatacatcgtgg acagctgggg cagctaccgt ccgcctggaggtcaccagcg acggcggaac gtatgacatc taccgggttcatcacaggca acaactgcaa cttcgaccag tactggagcgggcggcacca tcaccaccgc caaccatttc aacgcgtggcgggcagcaca actaccaggt gatggcgacc gaaggattccatcaccgtga gcgaaggatc tggcggtggc ggcggaggtgttcacggtgc gcgcgcgcgg caccgcgggc ggcgagtccacaggtcgtgc agagctggac cttgagcacc agcatgcagaatgagcggcg gcatcacggt gaacttcacc aacgacggcagactacatca tcgtgaatgg ccagacgcgt cagtccgaagctgtacgcca acggccgttg cggtggcggg tcgaacagcggcgatcgggt acggcgacac gccctga<210> 162<211> 348<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(32)<400> 162

335

gagccggtgccgtgcatcggacaatccggggcggcatcaacgtattcgggccaatccgctgccagggcttgccgcaccaatgcgtcagtcgtacgctcggagagcagtgggcggcggtggtcacgctgcgactacacggcccaaccgcgacgcagacgtaagtggatgca

ggtgttcatc 60ttcaccacaa 120gtcggtgaat 180caactgggta 240cacgttcaac 300ggtcgagtac 360catgggcacg 420tgcgccgtgc 480gaggcgggtg 540catgaatctc 600cagctcggac 660caccaagagc 720cgtcaacaac 780ctcgaccacg 840cgtgcaggtg 900caacaccggg 960ttgcaatggc 1020 1047

Met Phe Lys Gly Leu Leu Lys Ser Val Leu Thr Gly Lys Arg Ala Gly 1 5 10 15 Ala Val Phe Ile 20 Cys Leu Ala Gly Leu 25 Trp Met Thr Gln Ala 30 Gln Ala Gln Thr Cys Ile Gly Ser Pro Gln Thr Gly Asn Asn Gly Gly Phe Phe 35 40 45 Phe Ser 50 Phe Trp Lys Asp Asn 55 Pro Gly Ser Val Asn 60 Phe Cys Met Tyr Ser Gly Gly Arg Tyr Thr Ser Ser Trp Ser Gly. Ile Asn Asn Trp Val 65 70 75 80 Gly Gly Lys Gly Trp Gln Thr Gly Ser Ser Arg Thr Val Thr Tyr Ser 85 90 95 Gly Thr Phe Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu Tyr Gly Trp 100 105 110 Thr Thr Asn 115 Pró Leu Val Glu Tyr 120 Tyr Ile Val Asp Ser 125 Trp Gly Ser Tyr Arg Pro Pro Gly Gly Gln Gly Phe Met Gly Thr Val Thr Ser Asp 130 135 140 Gly Gly Thr Tyr Asp Ile Tyr Arg Val Arg Arg Thr Asn Ala Pro Cys 145 150 155 160 Ile Thr Gly Asn Asn Cys Asn Phe Asp Gln Tyr Trp Ser Val Arg Gln 165 170 175 Ser Arg Arg Val Gly Gly Thr Ile Thr Thr Ala Asn His Phe Asn Ala 180 185 190 Trp Arg Thr Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln Val Met 195 20.0 205 Ala Thr 210 Glu Gly Phe Gln Ser 215 Ser Gly Ser Ser Asp 220 Ile Thr Val Ser Glu Gly Ser Gly Gly Gly Gly Gly Gly Gly Gly Gly GlyThr Lys Ser225 230 235

Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly

245 250

Arg Val Asn Asn Gln Val Val Gln Ser Trp Thr

260 265

Gln Asn Tyr Thr Ala Ser Thr Thr Met Ser Gly

275 280

Phe Thr Asn Asp Gly Thr Asn Arg Asp Val Gln

290 295

Val Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln305 310 315

Leu Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser

325 330

His Cys Asn Gly Ala Ile Gly Tyr Gly Asp Thr340 345

<210> 163<211> 1068<212> DNA

<213> Desconhecido<220>

<223> Obtido para lima amostra ambientai<400> 163

atgaaagcaa agagaatgaa gttgtttgcc gcatttttaccctggggcag tgcatgcgca gacgatcacc agcaattcgggactatgaat actggaagga cagcgggaat ggaactatggttcagtgccg agtggagcaa tatcaataat attctgttccgagacgcaga cccatcagca aattggaaac atttccataaccgaatggca attcgtattt aacggtctat ggctggacggtacattgtcg atagctgggg cagctggcgt ccgcctggagaacgttgacg gaggaacgta tgacatttat gagacaactcaaaggcacgg caaccttcaa gcagtattgg agtgtccggaaccatatctg taagcgagca ctttaaggcc tgggagaaatatgtatgaag tcgcgcttac ggttgaaggc tatcaaagcaagccatacac tgacgatcgg cgggggaaca acacctccacgaagccgaga gtatgaccaa aagcggacaa tacactgggaggagtcgctt tgtatgccaa caatgattcc gtgaaattcaacccataact tctcactccg gggggcatca aacaactccaaaaatcggcg ggcagacgaa ggggaccttc tatttcggcgactctgaata atgtcagcca tggaaccgga aatcaagagggataacggaa catgggatgc tttcattgat tatctcgaga<210> 164<211> 355<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220><221><222><400>

Glu Ser

Leu Ser

Gly Ile285Val Asp300

Thr TyrAsn SerPro

240

Ile Thr Leu

255Thr Ser Met270

Thr Val Asn

Tyr Ile Ile

Asn Thr Gly320

Glu Trp Met335

tctgttttactcggtacgcattctcggtaggtaaaggcaacctatggtgcttgaccccctcatcgccaaagtgtcaaccacgtcaaaacgtggggatgacgtggaagcgccaaccacaggatatcagctccgcataatttatatggcccggaagcagcccttgaactcgttccattaa

gcttgcactt 60tgacggttat 120tggcggtacg 180gaagttcaat 240cacctaccaa 300cgtcgaatat 360ggggactgtt 420gccttccatt 480gacgagcgga 540catgggcaag 600taatgtgtat 660cacaaagatc 720gccgttcaac 780cacgaccggc 840ggttgacctg 900tgcggtctat 960tgtaaccgcc 1020 1068

SIGNAL(1)...(26)164

Met Lys Ala Lys Arg Met Lys Leu Phe Ala Ala' Phe Leu

1 5 10

Thr Leu Ala Leu Pro Gly Ala Val His Ala Gln Thr Ile

20

25

Ser Val Gly Thr His Asp Gly Tyr Asp Tyr Glu

35 40

Gly Asn Gly Thr Met Val Leu Gly Ser Gly Gly

50 55

Trp Ser Asn Ile Asn Asn Ile Leu Phe Arg Lys65 70 75

Glu Thr Gln Thr His Gln Gln Ile Gly Asn Ile

85 . 90

Ala Thr Tyr Gln Pro Asn Gly Asn Ser Tyr Leu

100 105

Thr Val Asp Pro Leu Val Glu Tyr Tyr Ile Val

115 : 120

Trp Arg Pro Pro Gly Ala Ser Pro Lys Gly Thr

Tyr Trp

45Thr Phe60

Gly Lys

Ser Ile

Thr Val

Asp Ser125Val Asn

Leu Cys Phe15

Thr Ser Asn30

Lys Asp Ser

Ser Ala Glu

Lys Phe Asn80

Thr Tyr Gly95

Tyr Gly Trp110

Trp Gly SerVal Asp Gly130 135 140 Gly Thr Tyr Asp Ile Tyr Glu Thr Thr Arg Val Asn Gln Pro Ser Ile145 150 155 160Lys Gly Thr Ala Thr 165 Phe Lys Gln Tyr Trp 170 Ser Val Arg Thr Ser 175 LysArg Thr Ser Gly 180 Thr Ile Ser Val Ser 185 Glu His Phe Lys Ala 190 Trp GluLys Leu Gly Met Thr Met Gly Lys Met Tyr Glu Val Ala Leu Thr Val 195 200 205 Glu Gly Tyr Gln Ser Ser Gly Ser Ala Asn Val Tyr Ser His Thr Leu210 215 220 Thr Ile Gly Gly Gly Thr Thr Pro Pro Pro Thr Thr Gly Thr Lys Ile225 230 235 240Glu Ala Glu Ser Met Thr Lys Ser Gly Gln Tyr Thr Gly Asn Ile Ser 245 250 255 Ser Pro Phe Asn 260 Gly Val Ala Leu Tyr 265 Ala Asn Asn Asp Ser 270 Val LysPhe Thr His Asn Phe Thr Thr Gly Thr His Asn Phe Ser Leu Arg Gly 275 280 285 Ala Ser Asn Asn Ser Asn Met Ala Arg Val Asp Leu Lys Ile Gly Gly290 295 300 Gln Thr Lys Gly Thr Phe Tyr Phe Gly Gly Ser Ser Pro Ala Val Tyr305 310 315 320Thr Leu Asn Asn Val Ser His Gly Thr Gly Asn Gln Glu Val Glu Leu 325 330 335 Val Val Thr Ala 340 Asp Asn Gly Thr Trp 345 Asp Ala Phe Ile Asp 350 Tyr LeuGlu Ile His 355 <210> 165 <211> 1047 <212> DNA <213> Desconhecido <220> <223> Obtido para uma amostra ambiental <400> 165

gtggggcgca ggagcgccgc cacggcattc atcggcctgg cagcgctgtg tgcctcggccgccaacgcgc agacctgtct gagctcgagt cagaccggca ccaacaacgg cttctactattcgttctgga ccgacggcgg tggctccgtg cagttctgcc tgcaatccgc cgggcgctacacctccagct ggagcaatgt cggaaactgg gtcggtggca agggctggca gaccggcgcgcgccgcaaca tcaactattc cggcagcttc aatccctcgg gtaacgcgta cctggccgtctatggctgga ccacgaatcc cctggtggag tactacatcg tcgacaactg gggtacctatcgtccaccgg gtgggcaggg attcatgggc acggttgtca gcgatggcgg cacctacgacgtctaccgca cgcaacgggt caacgcgccc tccattcagg gcaacgcgac cttctaccagtactggagcg ttcgccagtc gaagcgcacc ggtggaacca tctccaccgg caaccatttcgacggctggg cgacgttcgg catgaacctg ggaaccttca attaccagat cgtggcgaccgagggctacc agagcagcgg caattccgac atcacggtga gcgatggcgg cagcagctcctcgtcctcca gcagcagcag ttcgtcgtcc tccagcagcg gcggtggcgg caccaagagcttcacggtgc gcgcgcgcgg cacggccgga ggcgagtcga tcagcctgcg ggtcaacaacaccaacgtgc agacctggtc gctgaccacc agctaccaga atctcacggc ctcgaccacgctgaccggcg gcatcaccgt caactacacc aacgacagca gcggtcacga cgtacaggtggactacatca tcgtgaacgg ccagacccgc cagtccgagg cgcagagcta caacaccggactctatgcca acgggcgctg cggtggtggt ggctacagcg agtggatgca ttgcaacggcgccatcggct acggcaatac gccgtaa<210> 166<211> 348<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(23)<400> 166

Val Gly Arg Arg Ser Ala Ala Thr Ala Phe Ile Gly Leu Ala Ala Leu

1.5 10 15

Cys Ala Ser Ala Ala Asn Ala Gln Thr Cys Leu Ser Ser Ser Gln Thr20 25 30

Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Thr Asp Gly Gly Gly

35 40 45

Ser Val Gln Phe Cys Leu Gln Ser Ala Gly Arg Tyr Thr Ser Ser Trp50 55 60

Ser Asn Val Gly Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ala65 70 75 80

Arg Arg Asn Ile Asn Tyr Ser Gly Ser Phe Asn Pro Ser Gly Asn Ala85 90 95

Tyr Leu Ala Val Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr100 105 HO

Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly Phe

115 120 125

Met Gly Thr Val Val Ser Asp Gly Gly Thr Tyr Asp Val Tyr Arg Thr130 135 140

Gln Arg Val Asn Ala Pro Ser Ile Gln Gly Asn Ala Thr Phe Tyr Gln145 150 155 160

Tyr Trp Ser Val Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile Ser Thr165 170 175

Gly Asn His Phe Asp Gly Trp Ala Thr Phe Gly Met Asn Leu Gly Thr180 185 190

Phe Asn Tyr Gln Ile Val Ala Thr Glu Gly Tyr Gln Ser Ser Gly Asn

195 200 205

Ser Asp Ile Thr Val Ser Asp Gly Gly Ser Ser Ser Ser Ser Ser Ser

210 215 220

Ser Ser Ser Ser Ser Ser Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser225 230 235 240

Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Ser Leu245 250 255

Arg Val Asn Asn Thr Asn Val Gln Thr Trp Ser Leu Thr Thr Ser Tyr260 265 270

Gln Asn Leu Thr Ala Ser Thr Thr Leu Thr Gly Gly Ile Thr Val Asn

275 280 285

Tyr Thr Asn Asp Ser Ser Gly His Asp Val Gln Val Asp Tyr Ile Ile290 295 300

Val Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly305 310 315 320

Leu Tyr Ala Asn Gly Arg Cys Gly Gly Gly Gly Tyr Ser Glu Trp Met325 330 335

His Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro340 345

<210> 167<211> 669<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 167

gtgaagctga aaagactgtt caagatcgga ctgctgccgg ccgtattgtt gtttagtgcaacgcagcagt taaccgcgca aaccatctgc agcaaccaga ccggcaccaa caacggctac 120

180240300

60

ttctactcgt tctggaagga caccgggtcg gcgtgcatga cactgggttc cggcggcaactacagcgtca actggaacct gggttccggg aacatggtct gcggcaaagg ctggagtaccggatcttcaa gccgcagaat'cggctacaac gccggcgtct gggcgccgaa cggcaatgcctacctgactc tgtatgggtg gaccaggaac ccgctcatcg agtactacgt ggtcgacagt 360

420480540600660

tggggaagct ggaggccgcc aggcggaacc tccgcgggca ccgtcaatag cgatggcgggacctacaacc tctatcggac gcagcgggtc aacgcgcctt ccatcgacgg cacccggacgttctatçagt actggagtgt ccggacctcg aagaggccca ccgggagcaa ccagaccatcaccttcgcga accacgtgaa tgcgtggagg agcaaagggt ggaatctggg gagtcacgtctaccagataa tggcaacaga gggatatcaa agcagcggga attccaacct gacggtgtgggcgcagtag 669

<210> 168

<211> 222 - .<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220><221> SIGNAL<222> (1)...(36)<400> 168

Val Lys Leu Lys Arg Leu Phe Lys Ile Gly Leu Leu Pro Ala Val Leu

1 5 10 15

Leu Phe Ser Ala Thr Gln Gln Leu Thr Ala Gln Thr Ile Cys Ser Asn

20 25 30

Gln Thr Gly Thr Asn Asn Gly Tyr Phe Tyr Ser Phe Trp Lys Asp Thr

35 40 45

Gly Ser Ala Cys Met Thr Leu Gly Ser Gly Gly Asn Tyr Ser Val Asn

50 55 60

Trp Asn Leu Gly Ser Gly Asn Met Val Cys Gly Lys Gly Trp Ser Thr65 70 75 80

Gly Ser Ser Ser Arg Arg Ile Gly Tyr Asn Ala Gly Val Trp Ala Pro

85 90 95

Asn Gly Asn Ala Tyr Leu Thr Leu Tyr Gly Trp Thr Arg Asn Pro Leu

100 105 HO

Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly

115 120 125

Gly Thr Ser Ala Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asn Leu

130 135 140

Tyr Arg Thr Gln Arg Val Asn Ala Pro Ser Ile Asp Gly Thr Arg Thr145 150 155 160

Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Lys Arg Pro Thr Gly Ser

165 170 175

Asn Gln Thr Ile Thr Phe Ala Asn His Val Asn Ala Trp Arg Ser Lys

180 185 190

Gly Trp Asn Leu Gly Ser His Val Tyr Gln Ile Met Ala Thr Glu Gly

195 200 205

Tyr Gln Ser Ser Gly Asn Ser Asn Leu Thr Val Trp Ala Gln

210 215 220

<210> 169<211> 1041<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 169

atgattgtta gtttcaagag cgtgaaggca ctcgcgtgcc tcgccgtgct cggcattacc 60

gccgcgcagg cgcaaacctg catcacttcc agccagaccg gtaccaacaa cggcaactac 120

180240300360420480540600660

ttttccttct ggaaggacag cccgggtacc gtcaacttct gcatgtatgc caatgggcgctacacctcca actggagcgg catcaacaac tgggtgggcg gcaagggctg gcagacgggctccaaccgca cggtgaccta ctccggttcg ttcaattcgc ccggcaatgg ctatctcaccttgtacggat ggaccacgaa tccattgatc gagtactaca tcgtcgacag ctggggcacctatcgaccgc cgggcggcca gggcttcatg ggcaccgtca acagcgatgg cggcacctatgacatctacc gcacgcagcg cgtgaaccag ccttccatca tcggcaccgc cacgttctaccagtactgga gcgtgcggca gtcgaagcgc gtcggcggca cgatcaccac ggccaaccacttcaacgcct gggccacgct gggcatgaac ctgggccagc acaactacca ggtcatggccaccgagggtt accagagcag tggcagctcc gacatcaccg tgaccgaggg cggcggctcctcgtcgtcca gtggcggcgg cagcaccagc agtggcggtg gcggcagcaa gagcttcacc 720

gtgcgtgcgc gcggcacggt cggcggcgaa aacatccagc tgcaggtcaa caaccagacg 780

gtggcgagct ggaacctgac caccagcatg cagaactaca acgcctcgac cagcctgagt 840

ggcggcatca ccgtcgtgta caccaatgac agcggcagcc gcgacgtgca ggtggactac 900

atcgtcgtca acggccagac ccgccagtcc gaagcccaga gctacaácac cgggctctat 960

gccaacggac gttgtggtgg cggctcgaac agcgagtgga tgcattgcaa cggcgcgatt 1020ggctacggca acacgcccta g 1041

<210> 170<211> 346<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (24)<400> 170

Met Ile Val Ser Phe Lys Ser Val Lys Ala Leu Ala Cys Leu Ala Val1 5 10 15 Leu Gly Ile Thr Ala Ala Gln Ala Gln Thr Cys Iie Thr Ser Ser Gln 20 25 30 Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser Phe Trp Lys Asp Ser Pro 35 40 45 Gly Thr Val Asn Phe Cys Met Tyr Ala Asn Gly Arg Tyr Thr Ser Asn 50 55 60 Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly65 70 75 80Ser Asn Arg Thr Val Thr Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn 85 90 95 Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr 100 105 110 Tyr Ile Val Asp Ser Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly 115 120 125 Phe Met Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg 130 135 140 Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe Tyr145 150 155 160Gln Tyr Trp Ser Val 165 Arg Gln Ser Lys Arg 17Ò Val Gly Gly Thr Ile 175 ThrThr Ala Asn His 180 Phe Asn Ala Trp Ala 185 Thr Leu Gly Met Asn 190 Leu GlyGln His Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly 195 200 205 Ser Ser 210 Asp Ile Thr Val Thr 215 Glu Gly Gly Gly Ser 220 Ser Ser Ser SerGly Gly Gly Ser Thr Ser Ser Gly Gly Gly Gly Ser Lys Ser Phe Thr225 230 235 240Val Arg Ala Arg Gly 245 Thr Val Gly Gly Glu 250 Asn Ile Gln Leu Gln 255 ValAsn Asn Gln Thr 260 Val Ala Ser Trp Asn 265 Leu Thr Thr Ser Met 270 Gln AsnTyr Asn Ala 275 Ser Thr Ser Leu Ser 280 Gly Gly Ile Thr Val 285 Val Tyr ThrAsn Asp 290 Ser Gly Ser Arg Asp 295 Val Gln Val Asp Tyr 300 Ile Val Val AsnGly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr305 310 315 320Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys 325 330 335

Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro340 345

<210> 171

<211> 678

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 171

atggagttga aaaaaatatc cagaaaagga ctgccactag tattcttgtc cttgttgttgttcagtgtaa cgcagcagtc aaacgcccaa accatctgca gcaatcaaac tggcacaaacaacggtttct tctattcgtt ttggaaggac accggatcag catgcatgac tttgggctctggcggcaatt acgacgtaag ttggaatctg ggttctggga atatggttgt cggcaaaggctggagtaccg gatcatcaac caggagagta ggctacaatg ccggcatctg gcagccgaacggcaatgcat atttggctct ctatgggtgg acgagaaacc cacttataga atattacgtcgttgatagct ggggcacttt caggccgcct ggaggaacgt caataggctc cgtcaccactgatggtggta cataccaaat atatcggacc cagcgagtca acgcgccttc cattgacggcgccagaactt tttatcagta ctggagtgtc cggacctcga agagaccgac cgggagcaaccaaaccatca cctttgcgaa tcacgttaac gcgtggagga atctaggttt gaatctggggagtcatgttt accagataat ggccacagag ggatttcata gcagtgggag atctaacctaacggtgtggt cacagtaa<210> 172<211> 225<212> PRT<213> Desconhecido<220><223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(29)<400> 172

Met Glu Leu Lys Lys Ile Ser Arg Lys Gly Leu Pro Leu Val Phe Leu

1 5 10 15

Ser Leu Leu Leu Phe Ser Val Thr Gln Gln Ser Asn Ala Gln Thr Ile

Lys Asp Thr Gly Ser Ala Cys Met Thr Leu Gly Ser Gly Gly Asn Tyr

50 55 60

Asp Val Ser Trp Asn Leu Gly Ser Gly Asn Met Val Val Gly Lys Gly65 70 75 80

Trp Ser Thr Gly Ser Ser Thr Arg Arg Val Gly Tyr Asn Ala Gly Ile

85 90 95

Trp Gln Pro Asn Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg

Pro Pro Gly Gly Thr Ser Ile Gly Ser Val Thr Thr Asp Gly Gly Thr

130 135 140

Tyr Gln Ile Tyr Arg Thr Gln Arg Val Asn Ala Pro Ser Ile Asp Gly145 150 155 160

Ala Arg Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Lys Arg Pro

165 170 175

Thr Gly Ser Asn Gln Thr Ile Thr Phe Ala Asn His Val Asn Ala Trp

Thr Glu Gly Phe His Ser Ser Gly Arg Ser Asn Leu Thr Val Trp Ser210 215 220

Gln

225

<210> 173

<211> 1503

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 173

ttgaaaaaac tcgcagctgc cttatcactt gcaattacct ttgccgtacc gacaatagta 60

caagcacaag gtcccacatg gactaccagc acaatacaga aatacaacaa ctacgactat 120

gaactctgga atgaaaacaa tcagggtacc gtttccatga agctcacagg agataacggt 180

accgctgcca atgcggtagg cggaacgttt gagtctactt ggagtggtac aaagaatgtg 240

cttttccgtt ccggcagaaa gtttaccggt acttcagggc aaagcgttga tggtggcggt 300

gctggcaaaa ccgctagtgc ttacggcaat ataagcâtta acttcgccgc tacgtggtct 360

tccggtgacg atgtgaagat gcttggcgta tatggttggg cgttttacgc actgccaagt 420

gtaccagaca aacaggaaaa cggcacttct actaattttt ccaatcaaat agaatactac 480

atcattcaag accgcggcag ctataactcg gctacaggtg gcaccaactc aaagaaatac 540

ggtgaggcta ccattgacgg cattgcttat gagttccgtg tatgtgatag aatagggcaa 600

cctatgttaa ctggcaacgg gaattttaag cagtatttca gtgttcctaa aagcactata 660

aaccaccgca ccagcggtac aatctctgtt tccaaacact ttgaagaatg ggaaaaagtc 720

ggcatgaaaa tggacggtcc cttatacgaa gtagcgatga aagttgaatc ctattctggc 780

aatgggaata gtaacggcaa tgctaaaatt acaaagaata ttttgaccat tggcggaaca 840

accacaactc aaagcagttc aagcggaggt tcaacggttc cagatgaatg tggcgaatat 900

aaaaagagtt tctgtggtgg cttgggatat ggaagcgtat attccaattt aaccgcaata 960

ccctcaacgg gcgactgctt atacatcgga gattttgaag taatccagcc agctttgaat 1020

tcaaccgttg ccataaacgg tgtggaaaat acctgcggaa gcgagtggtc agattgccct 1080

tacaatgata aacccgattc aaaaaaagat ggcggctatt atgtttatgt gaaaacaggc 1140

tcaattaaca attatgagaa taacggttgg caaaacattg tagctaaagc aaaaccggct 1200

tgcacaccac cttctagcag ttccggtgct gcaccaggtt cttcttcttc agacgaagaa 1260

gacccagagc caattttgaa aaatcgcatt cctataactc atttttccct tcaaacgctt 1320

agcgataaag ccttgcgcat agaagtaaat gctccaacta ttgtggacat ttttgacctg 1380

agagggaata aggttaaaag tttgaatgtt tacggttcgc aaagggttaa attatccctg 1440

ccgagcgggg tgtattttgc caaagtgcgc gggatgaaaa gcgttagatt tgtgttgagg 1500<210> 174<211> 500<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(22)<400> 174

Leu Lys Lys Leu Ala Ala Ala Leu Ser Leu Ala Ile Thr Phe Ala Val 1 5 10 15 Pro Thr Ile Val Gln Ala Gln Gly Pro Thr Trp Thr Thr Ser Thr Ile 20 25 30 Gln Lys Tyr 35 Asn Asn Tyr Asp Tyr 40 Glu Leu Trp Asn Glu 45 Asn Asn Gln Gly Thr Val Ser Met Lys Leu Thr Gly Asp Asn Gly Thr Ala Ala Asn 50 55 60 Ala 65 Val Gly Gly Thr Phe 70 Glu Ser Thr Trp Ser 75 Gly Thr Lys Asn Val 80 Leu Phe Arg Ser Gly 85 Arg Lys Phe Thr Gly 90 Thr Ser Gly Gln Ser 95 Val Asp Gly Gly Gly Ala Gly Lys Thr Ala Ser Ala Tyr Gly Asn Ile Ser 100 105 110 Ile Asn Phe Ala Ala Thr Trp Ser Ser Gly Asp Asp Val Lys Met Leu 115 120 125 Gly Val Tyr Gly Trp Ala Phe Tyr Ala Leu Pro Ser Val Pro Asp Lys 130 135 140 Gln 145 Glu Asn Gly Thr Ser 150 Thr Asn Phe Ser Asn 155 Gln Ile Glu Tyr Tyr 160 Ile Ile Gln Asp Arg 165 Gly Ser Tyr Asn Ser 170 Ala Thr Gly Gly Thr 175 Asn Ser Lys Lys Tyr Gly Glu Ala Thr Ile Asp Gly Ile Ala Tyr Glu Phe 180 185 190 Arg Val Cys 195 Asp Arg Ile Gly Gln 200 Pro Met Leu Thr Gly 205 Asn Gly Asn Phe Lys 210 Gln Tyr Phe Ser Val 215 Pro Lys Ser Thr Ile 220 Asn His Arg Thr Ser Gly Thr Ile Ser Val Ser Lys His Phe Glu Glu Trp Glu Lys Val 225 230 235 240 Gly Met Lys Met Asp Gly Pro Leu Tyr Glu Val Ala Met Lys Val Glu 245 250 255 Ser Tyr Ser Gly Asn Gly Asn Ser Asn Gly Asn Ala Lys Ile Thr Lys 260 265 270 Asn Ile Leu 275 Thr Ile Gly Gly Thr 280 Thr Thr Thr Gln Ser 285 Ser Ser Ser Gly Gly Ser Thr Val Pro Asp Glu Cys Gly Glu Tyr Lys Lys Ser Phe 290 295 300 Cys 305 Gly Gly Leu Gly Tyr 310 Gly Ser Val Tyr Ser 315 Asn Leu Thr Ala Ile 320 Pro Ser Thr Gly Asp Cys Leu Tyr Ile Gly Asp Phe Glu Val Ile Gln 325 330 335 Pro Ala Leu Asn Ser Thr Val Ala Ile Asn Gly Val GlU Asn Thr Cys 340 345 350 Gly Ser Glu 355 Trp Ser Asp Cys Pro 360 Tyr Asn Asp Lys Pro 365 Asp Ser Lys Lys Asp 370 Gly Gly Tyr Tyr Val 375 Tyr Val Lys Thr Gly 380 Ser Ile Asn Asn Tyr 385 Glu Asn Asn Gly Trp 390 Gln Asn Ile Val Ala 395 Lys Ala Lys Pro Ala 400 Cys Thr Pro Pro Ser Ser Ser Ser Gly Ala Ala Pro Gly Ser Ser Ser 405 410 415 Ser Asp Glu Glu Asp Pro Glu Pro Ile Leu Lys Asn Arg Ile Pro Ile 420 425 430 Thr His Phe 435 Ser Leu Gln Thr Leu 440 Ser Asp Lys Ala Leu 445 Arg Ile GluVal Asn Ala Pro Thr Ile Val Asp Ile Phe Asp

450 455

Val Lys Ser Leu Asn Val Tyr Gly Ser Gln Arg465 470 475

Pro Ser Gly Val Tyr Phe Ala Lys Vai. Arg Gly

485 490

Phe Val Leu Arg500

<210> 175<211> 1053

<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 175

atgaagtcca ttcgcagccg cagcctcgcc accgccgtcc

gcagccgcag gcgcgcaggc gcagacgctc aacaacaatt

tactactaca cgttctggaa ggactcgggc agcgcctcga

cgctacagct cccagtggac cagcaacacc aacaactggg

cccggtggcc cgcgcgtggt caactactcg ggctactacg

tcctacctgg cgctgtacgg ctggacccgc aatccgctgg

agctacggct cctacaaccc ggccagttgc gccggcgggg

agcgatggcg ccacctacaa cgtacgtcgc tgcctgcgcc

ggcaacaaca gcaccttcta ccagtacttc agcgtgcgca

aacatctccg gcacgatcac cgtcgccaac cacttcaact

aacctcggca accacgacta catggtgttc gccaccgagg

agcgacatca ccgtgagttc gggtaccggc ggcggcggtg

aagaccatcg tggtgcgcgc gcgcggcacc gccggcggag

aacaacgcca ccatcgccag ctggacgctc accaccagca

acctcggcat cgggcggctc gctggtggag ttcaccaacg

caggtggact acctcagcgt caatggcgcc gtccgccagg

accggcgtgt accagaacgg ccagtgcggc ggcggcaacg

tgcaacggtg ccatcggctt cggaaatctc tga<210> 176<211> 350

<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental

<220>

<221> SIGNAL<222> (1)...(27)<400> 176

Met Lys Ser Ile Arg Ser Arg Ser Leu Ala Thr

1 5 10

Ala Leu Gly Val Ala Ala Ala Gly Ala Gln Ala

20 25

Asn Ser Thr Gly Thr His Asp Gly Tyr Tyr Tyr

35 40

Ser Gly Ser Ala Ser Met Thr Leu His Pro Gly

50 55

Gln Trp Thr Ser Asn Thr Asn Asn Trp Val Gly

65 70 75

Pro Gly Gly Pro Arg Val Val Asn Tyr Ser Gly

85 90

Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly

100 105

Leu Val Glu Tyr Tyr Val Ile Glu Ser Tyr Gly115 120

Ser Cys Ala Gly Gly Val Asp Tyr Gly Ser Phe130 135

Thr Tyr Asn Val Arg Arg Cys Leu Arg Gln Asn145 150 155

Gly Asn Asn Ser Thr Phe Tyr Gln Tyr Phe Ser165 170

Lys Gly Phe Gly Asn Ile Ser Gly Thr Ile Thr180 185

Leu Arg Gly Asn Lys460

Val Lys Leu Ser Leu480

Met Lys Ser Val Arg495

tggctggcgcccaccggcactgaccctccatcggcgggaagggtcaacaatcgagtactatggactacggagaacgcgccatcccaagaaactgggccaggctaccagaggcggcggcaaagaacatctctggccaactaacggcggcaaccgaggaccagccgcagcga

cctcggcgtcgcacgacggctccgggcggaaggctggaatcagccagaaccgtgatcgagcagcttccaggtcgatcgaagggattcggcccgcggcctcccagggcagccacgggcagcgctcaaggtccacggccaccccgcgacgtggacctacaacatggctgcac

Ala Val Leu

Gln Thr Leu30

Thr Phe Trp45

Gly Arg Tyr60

Gly Lys Gly

Tyr Tyr Gly

Trp Thr Arg110

Ser Tyr Asn125

Gln Ser Asp140

Ala Pro Ser

Val Arg Asn

Val Ala Asn190

Ala Gly15

Asn Asn

Lys Asp

Ser Ser

Trp Asn80

Val Asn95

Asn Pro

Pro Ala

Gly Ala

Ile Glu160Pro Lys175

His Phe

6012018024030036042048054060066072078084090096010201053Asn Tyr Trp Ala Ser Arg Gly Leu Asn Leu Gly

195 200

Val Phe Ala Thr Glu Gly Tyr Gln Ser Gln Gly

210 215

Val Ser Ser Gly Thr Gly Gly Gly Gly Gly Gly225 230 235

Lys Thr Ile Val Val Arg Ala Arg Gly Thr Ala

245 250

Ser Leu Lys Val Asn Asn Ala Thr Ile Ala Ser

260 265

Ser Met Ala Asn Tyr Thr Ala Thr Thr Ser Ala

275 280

Val Glu Phe Thr Asn Asp Gly Gly Asn Arg Asp

290 295

Leu Ser Val Asn Gly Ala Val Arg Gln Ala Glu305 310 315

Thr Gly Val Tyr Gln Asn Gly Gln Cys Gly Gly

325 330

Glu Trp Leu His Cys Asn Gly Ala Ile Gly Phe340 345

<210> 177<211> 1299<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 177

atgaaattgt tgaaaacgca caggcgtgcg attgctgccggttccaatcg ctcatgcgca aacgcttagc tcaaatgccatactattcgt tttggaagga ttccggtaac gccaccatgatattcttcat cctggaacag cagcactaac aactgggttgggtactcggc gcacagtcac ctattcgggc agttatagcggcactttacg gctggactcg aaacccgctg atcgaatattaattacaatc ctgcgtccgg cgcaacgaat tatgggactgtaccagctgg gccgcagcca acgggttaat cagccatctataccaatact ggagtgtgcg ccaaaacaag cgcaccagcgcatttcgatg catgggctgc tgtgggcttg aacctggggagcgaccgagg gctaccagag cagcggccag tccaatatcaggcagcacga cttcgagcac atccagctcc agctcaagtaagcagttctt ccggcggcgg cacaggaagt tgtgccggagaccgcacgcg actggtctgg cggcgcatac aatcacgccatatcaaaaca atttgtaccg ggcaaactgg tacaccaacttcctggacca gtctcgggtc ctgtagcggc ggcggtagcatccagttcct cttccacctc ggcgtcgagc agctccaact

Asn His Asp

205Ser Ser Asp220

Gly Asn Thr

Gly Gly Glu

Trp Thr Leu270

Ser Gly Gly

285Val Gln Val300

Asp Gln Thr

Gly Asn Gly

Gly Asn Leu350

Tyr Met

Ile Thr

Gly Ser240Asn Ile255

Thr Thr

Ser Leu

Asp Tyr

Tyr Asn320Arg Ser335

agctccagca gcggtggctgctgtgtcaga acaccagcgg

tcgggaaatg tgtaactggtttggggatgg gaaaataacc

acctgtcaaa gtcagaacgg cggctccggg ggtgtggtga

tcttcgtcca gtagcacctc ctcatcgagc agttcaagtt

tcgtcctccg gaattcctgc agcccggggg atccactag

<210> 178

<211> 432

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (26)<400> 178

Met Lys Leu Leu Lys Thr His Arg Arg Ala Ile

1 5 . 10

Ala Val Ala Thr Val Pro Ile Ala His Ala Gln

20 25

Ala Thr Gly Thr Gln Asn Gly Tyr Tyr Tyr Ser

35 40

Gly Asn Ala Thr Met Thr Leu Gly Ala Gly Gly50 55

cagcactagcctggaacccacactcggtgcgcggtaaaggcgagtggaacacattgtcgatcaatattgattgaaggcacgaacgattaactcacgattacggtgagcgacgagttccagtgaatgtgtaatgccggtgaccacgcctggccagttcaaccatccagcagacggacagggagaactgtatacagctgtggcgtcgagtgg

ggtggcgactgaatggttaccggtggaaacctggatgccgcagctacctcaaactgggtccggcagcaccggccacgttctattggagcgtcagattatgaggcagtagctagttcttccccccaattggccaaatggtcaagcgatgccaacgagctcccagttcaagctatgtatcctcggtcgccaataccagcagccaccacgtca

Ala Ala Ala Ala Leu15

Thr Leu Ser Ser Asn30

Phe Trp Lys Asp Ser45

Asn Tyr Ser Sear Ser60

60120180240300360420480540600660720780840900960102010801140120012601299Trp Asn Ser Ser Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Met Pro65 70 75 80

Gly Thr Arg Arg Thr Val Thr Tyr Ser Gly Ser Tyr Ser Ala Ser Gly85 90 95

Thr Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro Leu Ile Glu100 105 110

Tyr Tyr Ile Val Glu Asn Trp Val Asn Tyr Asn Pro Ala Ser Gly Ala

115 120 125

Thr Asn Tyr Gly Thr Val Asn Ile Asp Gly Ser Thr Tyr Gln Leu Gly 130 135 140

Arg Ser Gln Arg Val Asn Gln Pro Ser Ile Glu Gly Thr Ala Thr Phe145 150 155 160

Tyr Gln Tyr Trp Ser Val Arg Gln Asn Lys Arg Thr Ser Gly Thr Ile165 170 175

Asn Ile Gly Ala His Phe Asp Ala Trp Ala Ala Val Gly Leu Asn Leu180 185 190

Gly Thr His Asp Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser

195 200 205

Gly Gln Ser Asn Ile Thr Val Ser Glu Gly Ser Ser Gly Ser Thr Thr

210 215 220

Ser Ser Thr Ser Ser Ser Ser Ser Ser Thr Ser Ser Ser Ser Ser Ser225 230 235 240

Ser Ser Ser Ser Gly Gly Gly Thr Gly Ser Cys Ala Gly Val Asn Val245 250 255

Tyr Pro Asn Trp Thr Ala Arg Asp Trp Ser Gly Gly Ala Tyr Asn His260 265 270

Ala Asn Ala Gly Asp Gln Met Va. 1 Tyr Gln Asn Asn Leu Tyr Arg Ala

275 280 285

Asn Trp Tyr Thr Asn Ser Thr Pro Gly Ser Asp Ala Ser Trp Thr Ser

290 295 300

Leu Gly Ser Cys Ser Gly Gly Gly Ser Thr Ser Ser Thr Thr Ser Ser305 310 315 320

Ser Ser Ser Ser Ser Thr Ser Ala Ser Ser Ser Ser Asn Ser Ser Ser325 330 335

Ser Ser Ser Ser Ser Ser Ser Ser Gly Gly Cys Arg Glu Met Cys Asn340 345 350

Trp Tyr Gly Gln Gly Met Tyr Pro Leu Cys Gln Asn Thr Ser Gly Trp

355 360 365

Gly Trp Glu Asn Asn Gln Asn Cys Ile Gly Arg Gln Thr Cys Gln Ser40 370 375 380

Gln Asn Gly Gly Ser Gly Gly Val Val Asn Ser Cys Gly Thr Ser Ser385 390 395 400

Ser Ser Ser Ser Ser Thr Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser405 410 415

Gly Thr Thr Ser Ser Ser Ser Gly Ile Pro Ala Ala Arg Gly Ile His420 425 430

<210> 179<211> 852<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 179

atgaagaatt ggccgggaac gggtattata ttattattgg cgggcggcct tttggcggct 60

tgtttgacgg gcaaacggca agaggggcaa aaagtggatc cggatactça aaacgagaaa 120ttgacaggcg ggaccgtgtt tacagctaac agcaggggga acaggcccct ggaaggttcg 180

ccttatggtt acgaaatgtg gacgcagggc gggaataata acaagcttgt ttggttcggg 240

ccggatcagg ggggaggggc ggctttcagg gcagaatggá acgagccgga tgattttttg 300

ggacgactgg gtttctggtg gggaaacggc gggcaattta aagaatataa aaatatgtac 360

gcggatttca attacacaag gtcggggcgc ggcaçcggcg gcagttattc ttatataggc 420atttacggct gggcgagaaa cccgaacgcc gcgaacgagg aagacaggtt aatagaatac 480

tatattgtgg acgactggtt cgggaatcaa tggcagtccg acgacacccc cattaccaca 540

agaacaacag gaggctccgt attgggtacc attatagcgg acggcgcgtt ttacaacgtc 600

gtcaggaatg tgagaaccca aaagccttcg atagacggca tcaaaacatt cgcccaata;c 660

ttcagcatac gccaaacacc gcgccaaagc gggacaatct ccatcaccga acatttcaaa 720caatgggaaa gcatgggcct gaagctcgga aatatgtacg aggcaaaatt cctggtagaa 780

gccggcggcg gcaccggctg gctggagttt acgtatctta aactgacgca ggaagaàaaa 840aaaagaaatt ag<210> 180<211> 283<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)... (19)<400> 180

Met Lys Asn Trp Pro Gly Thr Gly Ile Ile Leu Leu Leu Ala Gly Gly 1 5 10 15 Leu Leu Ala Ala Cys Leu Thr Gly Lys Arg Gln Glu Gly Gln Lys Val 20 25 30 Asp Pro Asp Thr Gln Asn Glu Lys Leu Thr Gly Gly Thr Val Phe Thr 35 40 45 Ala Asn Sèr Arg Gly Asn Arg Pro Leu Glu Gly Ser Pro Tyr Gly Tyr 50 55 60 Glu Met Trp. Thr Gln Gly Gly Asn Asn Asn Lys Leu Val Trp Phe Gly65 70 75 80Pro Asp Gln Gly Gly Gly Ala Ala Phe Arg Ala Glu Trp Asn Glu Pro 85 90 95 Asp Asp Phe Leu Gly Arg Leu Gly Phe Trp Trp Gly Asn Gly Gly Gln 100 105 110 Phe Lys Glu 115 Tyr Lys Asn Met Tyr 120 Ala Asp Phe Asn Tyr 125 Thr Arg SerGly Arg 130 Gly Thr Gly Gly Ser 135 Tyr Ser Tyr Ile Gly 140 Ile Tyr Gly TrpAla Arg Asn Pro Asn Ala Ala Asn Glu Glu Asp Arg Leu Ile Glu Tyr145 150 155 160Tyr Ile Val Asp Asp Trp Phe Gly Asn Gln Trp Gln Ser Asp Asp Thr 165 170 175 Pro Ile Thr Thr Arg Thr Thr Gly Gly Ser Val Leu Gly Thr Ile Ile 180 185 190 Ala Asp Gly 195 Ala Phe Tyr Asn Val 200 Val Arg Asn Val Arg 205 Thr Gln LysPro Ser 210 Ile Asp Gly Ile Lys 215 Thr Phe Ala Gln Tyr 220 Phe Ser Ile ArgGln Thr Pro Arg Gln Ser Gly Thr Ile Ser Ile Thr Glu His Phe Lys225 230 235 240Gln Trp Glu Ser Met Gly Leu Lys Leu Gly Asn Met Tyr Glu Ala Lys 245 250 255 Phe Leu Val Glu Ala Gly Gly Gly Thr Gly Trp Leu Glu Phe Thr Tyr 260 265 270 Leu Lys Leu Thr Gln Glu Glu Lys Lys Arg Asn

275 280

<210> 181<211> 1077<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 181

atgaacttca gtctcaggaa ggctgcagcg gcgctggctt gcgtcgcggg cctgtatgcatcatcggcgg gçgctcagac ctgcctgacc aacaaccaga ccggcaacaa cggcgggtactactactcgt tctggaagga cagcggcaac gtcaccttct gcctgcagtc cggcgggcgatacacgtccc agtggagcaa cgtcaacaac tgggtgggcg gcaagggctg gaacccgggtgggcgacgca ccgtcaccta ttccggcacc tacaacccca atggcaattc gtacctgaccctgtacggct ggaccacgaa tccactggtc gagtactaca tcgtcgacag ctggggttcctggcgcccac cgggctcggg atacatgggc acggtcacca gcgatggcgg cacctacgacatctatcgca cgcagcgtgt gaaccagcct tccatcatcg gcaccgcgac gttctaccaatactggagcg tgcggcaatc gaagcgcgtg ggtggcacca tcacctcggg caatcacttcgatgcctggg cctcgctggg catgaacctc ggcacgcaca actacatggt gatggccaccgagggctacc agagcagcgg cagctcggac atcacggtgg gcagcggcag ttcgtcgtcgagcagcagct cgtccagcag tagcagçtcg tcgtccagta gcagcagcag ttcttcgtccagcagcagcg gtggcggcgg caccaagagc ttcaccgtgc gcgcacgcgg cacggcgggtggcgagtcca tcaccttgcg ggtgaacaac cagaacgtgc agacctggac gctgggcacc 840

agcatgcaga actacacggc gtccacctcg ctgagcggcg gcatcacggt ggccttcacc 900

aacgacggcg gcaaccgcga cgtccaggtg gattacatca tcgtgaatgg ccagacgcgc 960

cagtccgagg cgcagaccta caacaccggc ctgtatgcca atggccgctg cggtggtggc 1020tctaacagcg agtggatgca ctgcaacggc gccatcggct acggcaacac gccctag 1077

<210> 182<211> 358<212> PRT<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (25)<400> 182

Met Asn Phe Ser Leu Arg Lys Ala Ala Ala Ala Leu Ala Cys Val Ala

15 10 15

Gly Leu Tyr Ala Ser Ser Ala Gly Ala Gln Thr Cys Leu Thr Asn Asn20 25 30

Gln Thr Gly Asn Asn Gly Gly Tyr Tyr Tyr Ser Phe Trp Lys Asp Ser35 40 45

Gly Asn Val Thr Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Gln

50 55 60

Trp Ser Asn Val Asn Asn Trp Val Gly Gly Lys Gly Trp Asn Pro Gly65 70 75 80

Gly Arg Arg Thr Val Thr Tyr Ser Gly Thr Tyr Asn Pro Asn Gly Asn

85 90 95

Ser Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr100 105 HO

Tyr Ile Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Ser Gly Tyr115 120 125

Met Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Thr

130 135 140

Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Thr Ala. Thr Phe Tyr Gln145 150 155 160

Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr Ser

165 170 175

Gly Asn His Phe Asp Ala Trp Ala Ser Leu Gly Met Asn Leu Gly Thr180 185 190

His Asn Tyr Met Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser195 200 205

Ser Asp Ile Thr Val Gly Ser Gly Ser Ser Ser Ser Ser Ser Ser Ser

210 215 220

Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser225 230 235 240

Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser Phe Thr Val Arg Ala Arg

245 250 255

Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn Gln Asn260 265 270

Val Gln Thr Trp Thr Leu Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser275 280 285

Thr Ser Leu Ser Gly Gly Ile Thr Val Ala Phe Thr Asn Asp Gly Gly

290 295 300

Asn Arg Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Gln Thr Arg305 310 315 320

Gln Ser Glu Ala Gln Thr Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg

325 330 335

Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile340 345 350

Gly Tyr Gly Asn Thr Pro355<210> 183<211> 1083<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 183

atgatcgaag gtctcaggag acctgccttc agtggcaggatgcgtcgcgg ccctgtatgc atcggcggcg caggcgcagaaccggcacca acaacggctt ctactattcg ttctggaaggttctgcatgt attccggcgg ccgctacaca tccaactggaggcggcaagg ggtggcagac cggcgcctcg cgcgtggtcatcaccgggca acggctacct ggcgctgtac ggctggaccatacatcgtcg acaactgggg cacctatcgc ccgccgggcggtgaccagtg acggcggtac ctacgacatc taccggaccgatcaccggca acaactgcaa cttctcgcag ttctggagcgggcggcacca tcaccaccgg caatcacttc agcgcctgggggccagcaca actaccagat catggccacc gagggttaccatcacggtct cggaaggcag cagttcgtcg agcagcagcaagcagctcgt cgagcggcgg cggcggcagc aagagcttcagcgggtggcg agcagatccg gctgcgcgtg aacaatacgaaacaccacga tgacgaacta caccgcttcg accacgctgatacttcaacg acagcaccaa tcacgacgtg caggtggactacgcgccagt ccgaagcgca gagctacaac accggcctgtggcggttcca acagcgaatg gatgcattgc aatggcgccataa

<210> 184<211> 360I <212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL

<222> (1)...(32)

<400> 184

Met Ile Glu Gly Leu Arg Arg Pro Ala Phe Ser

15 10

Lys Ala Leu Leu Cys Val Ala Ala Leu Tyr Ala20 25

Gln Thr Cys Leu Ser Ser Ser Gln Thr Gly Thr35 40

Tyr Ser Phe Trp Lys Asp Ser Pro Gly Ser Val

50 55

Ser Gly Gly Arg Tyr Thr Ser Asn Trp Ser Gly

65 70 75

Gly Gly Lys Gly Trp Gln Thr Gly Ala Ser Arg

85 90

Gly Thr Phe Asn Ser Pro Gly Asn Gly Tyr Leu100 105

Thr Thr Asn Pro Leu Val Glu Tyr Tyr Ile Val115 120

Tyr Arg Pro Pro Gly Gly Thr Gly Phe Gln Gly

130 135

Gly Gly Thr Tyr Asp Ile Tyr Arg Thr Glu Arg145 150 155

Ile Thr Gly Asn Asn Cys Asn Phe Ser Gln Phe

165 170

Ser Lys Arg Thr Gly Gly Thr Ile Thr Thr Gly180 185

Trp Ala Ser His Gly Met Asn Met Gly Gln His195 200

Ala Thr Glu Gly Tyr Gln Ser Asn Gly Ser Ser

210 215

Glu Gly Ser Ser Ser Ser Ser Ser Ser Ser Ser225 230 235

Ser Ser Ser Ser Ser Gly Gly Gly Gly Ser Lys

245 250

Ala Arg Gly Thr Ala Gly Gly Glu Gln Ile Arg260 265

65 Thr Thr Val Gln Thr Trp Thr Leu Asn Thr Thr275 280

Ala Ser Thr Thr Leu Ser Gly Gly Ile Thr Val

gcatcgtcaacctgtctcagacagcccggggcggcatcaagctactcgggccaatccactgcacgggattagcgcaccaatgcggcagtccgtcgcacggagagcaacgggttcgtcctccggtgcgcgcccgtgcagacgcggcggcatacatcatcgtatgccaacggtcggctacgg

ggcattgctcttcgagccagcagcgtgcagcaactgggtccacgttcaatggtcgagtacccagggcacgcgcgccctgcgaagcgcacccatgaacatgcagctcggacttcgtcgagcccgcggcaccctggacgctgcacggtggaggaacggcgcgccgttgcggtcaacactcca

Gly Arg Ser

Ser Ala Ala30

Asn Asn Gly45

Gln Phe Cys60

Ile Asn Asn

Val Val Ser

Ala Leu Tyr110

Asp Asn Trp125

Thr Val Thr140

Thr Asn Ala

Trp Ser Val

Asn His Phe190

Asn Tyr Gln

205

Asp Ile Thr220

Ser Ser Ser

Ser Phe Thr

Leu Arg Val270

Met Thr Asn

285Glu Tyr Phe

Ile Val15

Gln Ala

Phe Tyr

Met Tyr

Trp Val80Tyr Ser95

Gly Trp

Gly Thr

Ser Asp

Pro Cys160Arg Gln175

Ser Ala

Ile Met

Val Ser

Ser Ser240Val Arg255

Asn AsnTyr ThrAsn Asp

60120180240300360420480540600660720780840900960102010801083684

290 295 300

Ser Thr Asn His Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Ala305 310 315 320

Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn325 330 335

Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly

340 345 350

Ala Ile Gly Tyr Gly Asn Thr Pro355 360

<210> 185<211> 684<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 185

atgaatttga aaagattgag gctgttgttt gtgatgtgta ttggatttgt gctgacactg 60

acggctgtgc cagctcatgc ggaaacgatt tatgataata ggatagggac acacagcgga 120

tacgattttg aattatggaa ggattacgga aatacctcga tgacactcaa taacggcggg 180

gcatttagtg caagctggaa caatattgga aatgccttat ttcgaaaagg aaagaagttt 240

gattccacta aaactcatca tcaacttggc aacatctcca tcaactacaa cgcagccttt 300

aacccgggcg ggaattccta tttatgtgtc tatggctgga cacaatctcc attagctgaa 360

tactacattg ttgagtcatg gggcacatat cgtccaacag gaacgtataa aggatcattt 420

tatgccgatg gaggcacata tgacatatat gaaacgctcc gtgtcaatca gccttctatc 480

attggagacg ctaccttcaa acaatattgg agtgtacgtc aaacaaaacg cacaagcgga 540

actgtttccg tcagtgagca ttttaaaaaa tgggaaagct taggcatgcc aatgggaaaa 600

atgtatgaaa cagcattaac tgtagaaggc taccgaagca acggaagtgc gaatgtcatg 660

acgaatcagc tgatgattcg ataa<210> 186<211> 227

<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental

<220>

<221> SIGNAL<222> (1)... (27)<400> 186

Met Asn Leu Lys Arg Leu Arg Leu Leu Phe Val Met Cys Ile Gly Phe1 5 10 15

Val Leu Thr Leu Thr Ala Val Pro Ala His Ala Glu Thr Ile Tyr Asp

20 25 30

Asn Arg Ile Gly Thr His Ser Gly Tyr Asp Phe Glu Leu Trp Lys Asp35 40 45

Tyr Gly Asn Thr Ser Met Thr Leu Asn Asn Gly Gly Ala Phe Ser Ala50 55 60

Ser Trp Asn Asn Ile Gly Asn Ala Leu Phe Arg Lys Gly Lys Lys Phe65 70 75 80

Asp Ser Thr Lys Thr His His Gln Leu Gly Asn Ile Ser Ile Asn Tyr

85 90 95

Asn Ala Ala Phe Asn Pro Gly Gly Asn Ser Tyr Leu Cys Val Tyr Gly

100 105 HO

Trp Thr Gln Ser Pro Leu Ala Glu Tyr Tyr Ile Val Glu Ser Trp Gly115 120 125

Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Ser Phe Tyr Ala Asp Gly130 135 140

Gly Thr Tyr Asp Ile Tyr Glu Thr Leu Arg Val Asn Gln Pro Ser Ile145 150 155 160

Ile Gly Asp Ala Thr Phe Lys Gln Tyr Trp Ser Val Arg Gln Thr Lys165 170 175

Arg Thr Ser Gly Thr Val Ser Val Ser Glu His Phe Lys Lys Trp Glu

180 185 190

Ser Leu Gly Met Pro Met Gly Lys Met Tyr Glu Thr Ala Leu Thr Val195 200 205

Glu Gly Tyr Arg Ser Asn Gly Ser Ala Asn Val Met Thr Asn Gln Leu210 215 220

Met Ile Arg<210> 187<211> 642<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental

<400> 187

atgtttaagt ttaaaaagaa tttcttagtt ggattatcgg cagctttaat gagtattagc 60

ttgttttcgg caaccgcctc tgcagctagc acagactact ggcaaaattg gactgatggg 120

ggcggtatag taaacgctgt caatgggtct ggcgggaatt acagtgttaa ttggtctaat 180

accggaaatt ttgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaac 240

tataatgccg gagtttgggc gccgaatggc aatggatatt taactttata tggttggacg 300

agatcacctc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactgga 360

acgtataaag gtactgtaaa aagtgatggg ggtacatatg acatatatac aactacacgt 420

tataacgcac cttccattga tggcgatcgc actactttta cgcagtactg gagtgttcgc 480

cagtcgaaga gaccaaccgg aagcaacgct acaatcactt tcagcaatca tgtgaacgca 540

tggaagagcc atggaatgaa tctgggcagt aattgggctt accaagtcat ggcgacagaa 600

ggatatcaaa gtagtggaag ttctaacgta acagtgtggt aa 642

<210> 188<211> 213<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(28)<400> 188

Met Phe Lys Phe Lys Lys Asn Phe Leu Val Gly Leu Ser Ala Ala Leu

15 10 15

Met Ser Ile Ser Leu Phe Ser Ala Thr Ala Ser Ala Ala Ser Thr Asp

20 25 30

Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Ile Val Asn Ala Val Asn

35 40 45

Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe

50 55 60

Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn65 70 75 80

Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Gly Tyr Leu Thr Leu

85 90 95

Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser

100 105 HO

Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Lys Ser

115 120 125

Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr Arg Tyr Asn Ala Pro

130 135 140

Ser Ile Asp Gly Asp Arg Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg145 150 155 160

Gln Ser Lys Arg Pro Thr Gly Ser Asn Ala Thr Ile Thr Phe Ser Asn

165 170 175

His Val Asn Ala Trp Lys Ser His Gly Met Asn Leu Gly Ser Asn Trp

180 185 190

Ala Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser

195 200 205

Asn Val Thr Val Trp210<210> 189<211> 570<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 189

atggccctta tggcttcgac agactactgg caaaattgga ctgatggtgg tgggacagta 60

aatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaatttt 120

gttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgccgga 180aaattcactcttataaaggccaacgcacctgtcgaagagagaagagtaaactatcaaagt

gccttttcgc cgtccggtaa tggatatttg gctctttatg ggtggacgagatagaatatt acgtcgttga tagctggggg acttatagac ctactggaacactgtgacta gtgatggagg gacttatgac atatacacga ctacacgaactccattgacg gcaataatac aactttcacc cagttctgga gtgttaggcaccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctgggaatgaatt tggggagtag ttggtcttat caggtattag caacagagggagtgggtact ctaacgtaac ggtctggtaa<210> 190<211> 189<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 190

Met Ala Leu Met Ala Ser Thr Asp Tyr Trp Gln Asn Trp Thr Asp Gly1 5 10 15

Gly Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val

20 25 30

Ser Trp Ser Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr35 40 45

Gly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala Gly Ala Phe Ser Pro

50 55 60

Ser Gly Asn Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu65 70 75 80

Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly

85 90 95

Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr

100 105 HO

Thr Thr Thr Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr

115 120 125

Phe Thr Gln Phe Trp Ser Val Arg Gln Ser Lys Arg Pro Ile Gly Thr

130 135 140

Asn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys145 150 155 160

Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu

165 170 175

Gly Tyr Gln Ser Ser Gly Tyr Ser Asn Val Thr Val Trp180 185

<210> 191

<211> 1053

<212> DNA

<213> Desconhecido<22 0>

<223> Obtido para uma amostra ambiental<400> 191

atgaagtcca ttcgcagccg cagcctcgcc accgccgtcc tggctggcgc cctcggcgtcgcagccgccg gcgcgcaggc gcagacgctc aacaacaatt ccaccggcac gcacgacggcttctactaca cgttctggaa ggactcgggc agcgcctcga tgaccctcca tccgggcggacgctacagct cccagtggac cagcaacacc aacaactggg tcggcgggaa aggctggaatcccggtggcc cgcgcgtggt caactactcg ggctactacg gggtcaacaa cagccagaactcctacctgg cgctgtacgg ctggacccgc aatccgctgg tcgagtacta cgtgatcgagagctacggct cctacaaccc ggccagttgc gccggcgggg tggactacgg cagcttccagagcgatggcg ccacctacaa cgtacgccgc tgcctgcgcc agaacgcgcc gtcgatcgaaggcaacaaca gcaccttcta ccagtacttc agcgtgcgca atcccaagaa gggattcggcaacatctccg gcacgatcac cgtcgccaac cacttcaact actgggccag ccgcggcctcaacctcggca accacgacta catggtgttc gccaccgagg gctaccagag ccagggcagcagcgacatca ccgtgagttc gggtaccggc ggcggcggtg gcggcggcaa cacgggcagcaagaccatcg tggtgcgcgc gcgcggcacc gccggcggag agaacatctc gctcaaggtcaacaacgcca ccatcgccag ctggacgctc accaccagca tggccaacta cacggccaccacctcggcat cgggcggctc gctggtggag ttcaccaacg acggcggcaa ccgcgacgtgcaggtggact acctcagcgt caatggcgcc gtccgccagg ccgaggacca gacctacaacaccggcgtgt accagaacgg ccagtgcggc ggcggcaacg gccgcagcga atggctgcactgcaacggtg ccatcggctt cggaaatctc tga<210> 192<211> 350

<212> PRT

<213> Desconhecido

240300360420480540570

6012018024030036042048054060066072078084090096010201053563

<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(27)<400> 192

Met Lys Ser Ile Arg Ser Arg Ser Leu Ala Thr Ala Val Leu Ala Gly1 5 10 15

Ala Leu Gly Val Ala Ala Ala Gly Ala Gln Ala Gln Thr Leu Asn Asn20 25 30

Asn Ser Thr Gly Thr His Asp Gly Phe Tyr Tyr Thr Phe Trp Lys Asp35 40 45

Ser Gly Ser Ala Ser Met Thr Leu His Pro Gly Gly Arg Tyr Ser Ser50 55 60

Gln Trp Thr Ser Asn Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Asn65 70 75 80

Pro Gly Gly Pro Arg Val Val Asn Tyr Ser Gly Tyr Tyr Gly Val Asn85 90 95

Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro100 105 HO

Leu Val Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro Ala115 120 125

Ser Cys Ala Gly Gly Val Asp Tyr Gly Ser Phe Gln Ser Asp Gly Ala130 135 140

Thr Tyr Asn Val Arg Arg Cys Leu Arg Gln Asn Ala Pro Ser Ile Glu145 150 155 160

Gly Asn Asn Ser Thr Phe Tyr Gln Tyr Phe Ser Val Arg Asn Pro Lys165 170 175

Lys Gly Phe Gly Asn Ile Ser Gly Thr Ile Thr Val Ala Asn His Phe180 185 190

Asn Tyr Trp Ala Ser Arg Gly Leu Asn Leu Gly Asn His Asp Tyr Met195 200 205

Val Phe Ala Thr Glu Gly Tyr Gln Ser Gln Gly Ser Ser Asp Ile Thr210 215 220

Val Ser Ser Gly Thr Gly Gly Gly Gly Gly Gly Gly Asn Thr Gly Ser225 230 235 240

Lys Thr Ile Val Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Asn Ile245 250 255

Ser Leu Lys Val Asn Asn Ala Thr Ile Ala Ser Trp Thr Leu Thr Thr260 265 270

Ser Met Ala Asn Tyr Thr Ala Thr Thr Ser Ala Ser Gly Gly Ser Leu275 280 285

Val Glu Phe Thr Asn Asp Gly Gly Asn Arg Asp Val Gln Val Asp Tyr290 295 300

Leu Ser Val Asn Gly Ala Val Arg Gln Ala Glu Asp Gln Thr Tyr Asn305 310 315 320

Thr Gly Val Tyr Gln Asn Gly Gln Cys Gly Gly Gly Asn Gly Arg Ser325 330 335

Glu Trp Leu His Cys Asn Gly Ala Ile Gly Phe Gly Asn Leu340 345 350

<210> 193<211> 840<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 193

atgacgaagt atcggttagg aataggtatt ttcattttgt tggtttgttg cttttcggcggcatgtattg tgcctaaaca acaagaggaa caaaaagtgg ctcctacaga attgaccggc 120

gcgataacat tcacagccaa cagcaacgga aacaagcccc tgaacggctc gccctacggttacgaaatat ggacacaggg cgggaccaat aacaaactga tctggttcgg gccggatcagggcggcggcg cggctttcag agccgaatgg aacaacccta acgatttttt aggccgcgtgggtttttact ggggtaatgg cggaaaatat accgagtaca aaaatatgta tgcggattttagctacacta gatctggacg caacaccgcc ggtaattatt catatatagg gatttatggctgggctagaa atccaaatgc cgcaaaagaa gaagacaaat tgatagagta ttatattgtggaagattggt ttggcaatca atggcaagag gatagctcac ccattaccac taatacaacaagtggaaccg tattgggaag ttttactata gatggcgcgg tttataatgt cgttagaaat

180240300360420480540600gtcagagtcc aacaaccttc gatagacgga accaaaacat tcacccaata cttcagcata 660

cgacaaacgc cccgacagag cgggacaatt tccattaccg ggcatttcag gcaatgggag 720

agcatgggtt tacagcttgg caatatgtac gaggcaaagt ttcttgttga agccggcggc 780

ggcacaggat ggctggaatt ttcatacctt aaattaacga tggaagacag cttaaggtaa 840

<210> 194<211> 279<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) . . .'(21)<400> 194

Met Thr Lys Tyr Arg Leu Gly Ile Gly Ile Phe Ile Leu Leu Val Cys1 5 10 15

Cys Phe Ser Ala Ala Cys Ile Val Pro Lys Gln Gln Glu Glu Gln Lys

20 25 30

Val Ala Pro Thr Glu Leu Thr Gly Ala Ile Thr Phe Thr Ala Asn Ser35 40 45

Asn Gly Asn Lys Pro Leu Asn Gly Ser Pro Tyr Gly Tyr Glu Ile Trp

50 55 60

Thr Gln Gly Gly Thr Asn Asn Lys Leu Ile Trp Phe Gly Pro Asp Gln65 70 75 80

Gly Gly Gly Ala Ala Phe Arg Ala Glu Trp Asn Asn Pro Asn Asp Phe

85 90 95

Leu Gly Arg Val Gly Phe Tyr Trp Gly Asn Gly Gly Lys Tyr Thr Glu

100 105 110

Tyr Lys Asn Met Tyr Ala Asp Phe Ser Tyr Thr Arg Ser Gly Arg Asn

115 120 125

Thr Ala Gly Asn Tyr Ser Tyr Ile Gly Ile Tyr Gly Trp Ala Arg Asn

130 135 140

Pro Asn Ala Ala Lys Glu Glu Asp Lys Leu Ile Glu Tyr Tyr Ile Val145 150 155 160

Glu Asp Trp Phe Gly Asn Gln Trp Gln Glu Asp Ser Ser Pro Ile Thr

165 170 175

Thr Asn Thr Thr Ser Gly Thr Val Leu Gly Ser Phe Thr Ile Asp Gly

180 185 190

Ala Val Tyr Asn Val Val Arg Asn Val Arg Val Gln Gln Pro Ser Ile

195 200 205

Asp Gly Thr Lys Thr Phe Thr Gln Tyr Phe Ser Ile Arg Gln Thr Pro

210 215 220

Arg Gln Ser Gly Thr Ile Ser Ile Thr Gly His Phe Arg Gln Trp Glu225 230 235 240

Ser Met Gly Leu Gln Leu Gly Asn Met Tyr Glu Ala Lys Phe Leu Val

245 250 255

Glu Ala Gly Gly Gly Thr Gly Trp Leu Glu Phe Ser Tyr Leu Lys Leu

260 265 270

Thr Met Glu Asp Ser Leu Arg

275

<210> 195

<211> 1044

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 195

atgttcaatc tgaagagagt ggcggcgctc ctgtgcgtcg cagggctggg ggtgtctgcg 60

gcaaatgcgc agacctgtct caattcgagt gggaccggca ccaacaacgg cttctattat 120

tccttctgga aagacagtcc gggttcagtg aatttctgca tgtactccgg cggtcgctac 180

acgtcgagct ggagcggcat caacaactgg gtcggcggca agggctggca aaccggatcg 240

cgccggacca tcaactactc cggcagcttc aactcgccgg gcaatggcta cctcgcgctc 300

tacggatgga ccaccaatcc actcgtcgag tactacatcg tcgacaactg gggcacgtat 3 60

cgtccgcccg gcggccaggg ctacatgggc acggtcacga gcgacggcgc cacgtacgac 420

gtctatcgaa cgcaacgagt cgatgcgccg tcgatcattg gtgatcacca gaccttctat 480

caatactgga gcgtgcgtca gtcgaagagg accggcggaa ccatcaccac cggcaaccac 540

ttcgatggct gggcgagcta cggcatgaac ctgggaactc acaactacca gatcctggcg 600660

840900960

accgagggtt atcaaagcag cggcagctcg gacctcaccg tgagcgaagg cagcagcagtagcagcagcg gtggcgggag cagttcgagc agcagcggcg gcggtggcac caagagcttc 720

acggtccgcg cgcgcggcac ggccggtgga gagtcgatca cgttgcgcgt gaataaccag 780

aacgtgcaga cctggacgct cggcacgagc atgacgaact acacggcgtc gacgtcgctgagcggcggca tcaccgtggc gttcacgaac gacggtggca accgcgatgt tcaggtggactacatcatcg tgaacggcca gacacgccag tcggaagcgc agagctacaa caccgggctctacgcgaatg gacgttgcgg cggtggctcg aacagcgagt ggatgcactg caacggcgcg 1020attggctacg gaaacacgcc gtaa 1044

<210> 196<211> 347<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (23)<400> 196

Met Phe Asn Leu Lys Arg Val Ala Ala Leu Leu Cys Val Ala Gly Leu

15 10 15

Gly Val Ser Ala Ala Asn Ala Gln Thr Cys Leu Asn Ser Ser Gly Thr

20 25 30

Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Lys Asp Ser Pro Gly

35 40 45

Ser Val Asn Phe Cys Met Tyr Ser Gly Gly Arg Tyr Thr Ser Ser Trp

50 55 60

Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ser65 70 75 80

Arg Arg Thr Ile Asn Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly

85 90 95

Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr

100 105 HO

Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly Tyr

115 120 125

Met Gly Thr Val Thr Ser Asp Gly Ala Thr Tyr Asp Val Tyr Arg Thr

130 135 140

Gln Arg Val Asp Ala Pro Ser Ile Ile Gly Asp His Gln Thr Phe Tyr145 150 155 160

Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile Thr

165 170 175

Thr Gly Asn His Phe Asp Gly Trp Ala Ser Tyr Gly Met Asn Leu Gly

180 185 190

Thr His Asn Tyr Gln Ile Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly

195 200 205

Ser Ser Asp Leu Thr Val Ser Glu Gly Ser Ser Ser Ser Ser Ser Gly

210 215 220

Gly Gly Ser Ser Ser Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser Phe225 230 235 240

Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg

245 250 255

Val Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met Thr

260 265 270

Asn Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Ala Phe

275 280 285

Thr Asn Asp Gly Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Ile Val

290 295 300

Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu305 310 315 320

Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His

325 330 335

Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro340 345

<210> 197

<211> 636

<212> DNA

<213> Desconhecido

<22 0>566

<223> Obtido para uma amostra ambiental<400> 197

atgtttaagt tcagtaagaa aatgatgacg gttattcttg cagctaccat gagttttggtttatttgcaa caacctcaag tgcagcaacc gactattggc aaaattggac cgatggcggcggaacggtta atgctgtaaa cggctccggc ggtaattaca gcgtgacatg gcaaaataccggaaattttg tcgtcggcaa aggctggaat accggatcgc ctaaccgaac cattaactacaatgccggcg tctgggcgcc ttccggcaat gggtatttga ctctctacgg atggacgagaaacgcactca ttgaatatta cgtcgtggat agctggggta cttatcggcc tacaggaacatataaaggga cggtgacaag tgatgggggc acatatgata tctatacgac catgcggcacaacgcgcctt ccattgacgg aactcaaacg tttgcccagt actggagtgt tcgacaatcgaaaagagcga ccggggtcaa ctcctccatt acgttcagca accacgtgaa cgcatgggctagcaagggaa tgaatctggg aagcagctgg tcatatcagg tgttagctac agagggttatcaaagtagcg gaagctctaa cgtaacagtg tggtaa<210> 198<211> 211<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL <222> (1)... (28) <400> 198 Met Phe Lys Phe Ser Lys Lys Met Met Thr Val Ile Leu Ala Ala Thr1 5 10 15 Met Ser Phe Gly 20 Leu Phe Ala Thr Thr 25 Ser Ser Ala Ala Thr 30 Asp TyrTrp Gln Asn 35 Trp Thr Asp Gly Gly 40 Gly Thr Val Asn Ala 45 Val Asn GlySer Gly 50 Gly Asn Tyr Ser Val Thr 55 Trp Gln Asn Thr 60 Gly Asn Phe ValVal Gly Lys Gly Trp Asn Thr Gly Ser Pro Asn Arg Thr Ile Asn Tyr65 70 75 80Asn Ala Gly Val Trp Ala Pro Ser Gly Asn Gly Tyr Leu Thr Leu Tyr 85 90 95 Gly Trp Thr Arg Asn Ala Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp 100 105 110 Gly Thr Tyr 115 Arg Pro Thr Gly Thr 120 Tyr Lys Gly Thr Val 125 Thr Ser AspGly Gly 130 Thr Tyr Asp Ile Tyr Thr 135 Thr Met Arg His 140 Asn Ala Pro SerIle Asp Gly Thr Gln Thr Phe Ala Gln Tyr Trp Ser Val Arg Gln Ser145 150 155 160Lys Arg Ala Thr Gly 165 Val Asn Ser Ser Ile 170 Thr Phe Ser Asn His 175 ValAsn Ala Trp Ala 180 Ser Lys Gly Met Asn 185 Leu Gly Ser Ser Trp 190 Ser TyrGln Val Leu 195 Ala Thr Glu Gly Tyr 200 Gln Ser Ser Gly Ser 205 Ser Asn ValThr Val 210 Trp <210> 199

<211> 1074

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 199

atgattttcg gtctaaagtc gatcacgggc aggcgcgccg tcgcggcgct ggcctgccttgccggcctct acatggcgcc ggcgaatgcg caaacctgca tcacgtcgag ccagacgggcaccaacaacg gcaactactt ttcgttctgg aaagacagcc cgggcacggt gaacttctgcatgtactccg gcggccgcta cacgtccaac tggagcggca tcaacaactg ggtgggcggcaagggctggc agacgggctc gtcccgcacc gtctcctact ccggcagctt caattcgccgggtaacggct acctgacgct ctacggctgg accaccaatc cgctcatcga gtactacatcgtcgacaact ggggcagcta tcgtccgccg ggtggccagg gcttcatggg cacggtgaacaccgacggcg gcacgtacga catctatcgc acgcaacggg tcaaccagcc gtcgatcatcggcaccgcga cgttctacca gtactggagc gtgcggcagt cgaagcgcac cggcggcacc600660

8409009601020

atcaccacgg ccaaccactt caatgcctgg gccagcctcg gcatgaacct gggacagcacaactaccagg tgatggccac cgagggctac cagagcagcg gcagctccga catcacggtgtgggaaggca cgagcagcgg cggaagcagc aatggcggca gcagcaacgg cggcagcagc 720

aatggtggca gcggcggcac gaagagcttc acggtgcgcg cgcgcggcac tgcgggcggc 780

gagtccatca cgctgcgggt caacaaccag aacgtgcaga cctggacgct gggtaccagcatgcagaact acacggcctc gacctcgctg agcggcggca tcacggtggc gttcaccaacgacggcggca gccgcgacgt gcaggtggac tacatcatcg tgaatggcca gacccgccagtccgaacagc agagctacaa cactggcctc tacgccaatg gaagctgtgg tggcggttcgaacagcgagt ggatgcattg caacggcgcc atcggctacg gcaatacgcc ctga 1074

<210> 200<211> 354<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) . .. (30 )<400> 200

Met Ile Phe Gly Leu Lys Ser Ile Thr Gly Arg Arg Ala Val Ala Ala

15 10 15

Leu Ala Cys Leu Ala Gly Leu Tyr Met Ala Pro Ala Asn Ala Gln Thr

20 25 30

Cys Ile Thr Ser Ser Gln Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser

35 40 45

Phe Trp Lys Asp Ser Pro Gly Thr Val Asn Phe Cys Met Tyr Ser Gly

50 55 60

Gly Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly65 70 75 80

Lys Gly Trp Gln Thr Gly Ser Ser Arg Thr Val Ser Tyr Ser Gly Ser

85 90 95

Phe Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr

100 105 HO

Asn Pro Leu Ile Glu Tyr Tyr Ile Val Asp Asn Trp Gly Ser Tyr Arg

115 120 125

Pro Pro Gly Gly Gln Gly Phe Met Gly Thr Val Asn Thr Asp Gly Gly

130 135 140

Thr Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Ile145 150 155 160

Gly Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg

165 170 175

Thr Gly Gly Thr Ile Thr Thr Ala Asn His Phe Asn Ala Trp Ala Ser

180 185 190

Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln Val Met Ala Thr Glu

195 200 205

Gly Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Trp Glu Gly Thr

210 215 220

Ser Ser Gly Gly Ser Ser Asn Gly Gly Ser Ser Asn Gly Gly Ser Ser225 230 235 240

Asn Gly Gly Ser Gly Gly Thr Lys Ser Phe Thr Val Arg Ala Arg Gly

245 250 255

Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn Gln Asn Val

260 265 270

Gln Thr Trp Thr Leu Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser Thr

275 280 285

Ser Leu Ser Gly Gly Ile Thr Val Ala Phe Thr Asn Asp Gly Gly Ser

290 295 300

Arg Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Gln Thr Arg Gln305 310 315 320

Ser Glu Gln Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Ser Cys

325 330 335

Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile Gly340 345 350

Tyr Gly<210> 201<211> 1002<212> DNA420480540

9009601002

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 201

atgaagatga acagctccct cccctccctc cgcgatgtat tcgcgaatga tttccgcatc 60

ggggcggcgg tcaatcctgt gacgatcgag atgcaaaaac agttgttgat cgatcatgtc 120

aacagtatta cggcagagaa ccatatgaag tttgagcatc ttcagccgga agaagggaaa 180

tttacctttc aggaagcgga tcggattgtg gattttgctt gttcgcaccg aatggcggtt 240

cgagggcaca cacttgtatg gcacaaccag actccggatt gggtgtttca agatggtcaa 300

ggccatttcg tcagtcggga tgtgttgctt gagcggatga aatgtcacat ttcaactgtt 360

gtacggcgat acaagggaaa aatatattgt tgggatgtca tcaacgaagc ggtagccgac

gaaggagacg aattgttgag gccgtcgaag tggcgacaaa tcatcgggga cgattttatg

gaacaagcat ttctctacgc ttatgaagct gacccagatg cactgctttt ttacaatgac

tataatgaat gttttccgga aaagagagaa aaaatttttg cacttgtcaa atcgctgcgt 600

gataaaggca ttccgattca tggcatcggc atgcaggcgc actggagcct gacccgcccg 660

tcgcttgatg aaattcgtgc ggcgattgaa cggtatgcgt cccttggtgt tgttcttcat 720

attacggaac tcgatgtatc catgtttgaa tttcacgatc gtcgaaccga tttggctgtc 780

ccgacgaacg aaatgatcga acagcaagca gaacggtatg ggcaaatttt tgctttgttt 840

aaggagtatc gcgatgttat tcaaagtgtc acattttggg gaattgctga tgaccataca

tggctcgata actttccagt gcacgggaga aaaaactggc cgcttttgtt cgatgaacag

cataaaccga aaccagcttt ttggcgggca gtgagtgtct ga<210> 202<211> 333<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 202

Met Lys Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn

1 5 10 15

Asp Phe Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln

20 25 30

Lys Gln Leu Leu Ile Asp His Val Asn Ser Ile Thr Ala Glu Asn His35 40 45

Met Lys Phe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln

50 55 60

Glu Ala Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val

65 70 75 80

Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Val Phe

85 90 95

Gln Asp Gly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg

100 105 110

Met Lys Cys His Ile Ser Thr Val Val Arg Arg Tyr Lys Gly Lys Ile115 120 125

Tyr Cys Trp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu130 135 140

Leu Leu Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met145 150 155 160

Glu Gln Ala Phe Leu Tyr Ala Tyr Glu Ala Asp Pro Asp Ala Leu Leu165 170 175

Phe Tyr Asn Asp Tyr Asn Glu Cys Phe Pro Glu Lys Arg Glu Lys Ile

180 185 190

Phe Ala Leu Val Lys Ser Leu Arg Asp Lys Gly Ile Pro Ile His Gly195 200 205

Ile Gly Met Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu210 215 220

Ile Arg Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His225 230 235 240

Ile Thr Glu Leu Asp Val Ser Met Phe Glu Phe His Asp Arg Arg Thr245 250 255

Asp Leu Ala Val Pro Thr Asn Glu Met Ile Glu Gln Gln Ala Glu Arg

260 265 270

Tyr Gly Gln Ile Phe Ala Leu Phe Lys Glu Tyr Arg Asp Val Ile Gln275 280 285

Ser Val Thr Phe Trp Gly Ile Ala Asp Asp His Thr Trp Leu Asp Asn290 295 300

Phe Pro Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln305 310 315 320His Lys Pro Lys Pro Ala Phe Trp Arg Ala Val Ser Val325 330

<210> 203<211> 687<212> DNA<213> Desconhecido<220><223> Obtido para uma amostra ambiental<400> 203

atgaaatctg cacgcgcact tttggtggcg ctatcacgca tacttccgat cgcacttgtg 60

ctgttgctcg cccccgtccc cgcgcaagcc caacaggtct gcaacaacgg aacgggcacg 120

cataacggct tcttctggac gttttggaag gacggcggca cggcctgcat gacgctcggc 180tcgggcggca attatagcac gacgttcaat ctgtccggcg gccgcaacct tgttgcgggc 240aagggctggc agactggctc caccaaccga gtcgtcggtt acaatgcggg cgtctggaac 300ccaggcacca attcttatct gacgctctat ggctggtcga cgaatccgct cgtcgaatat 360tatgtcgtgg accattgggg cagccaattc accccgccag gcaacggcgc gcagagcatg 420gggaccgtga ccaccgacgg cggcacctac aacatctacc gcacccaacg cgtcaacgcg 480ccttcgatca tcggcaacgc cacgttctac caatattgga gcgtgcgcac ttcgcgccgc 540gggcaaggca cgaacaacac gatcaccttc gccaatcacg tcaacgcttg gcgcagccgc 600ggcatgaacc ttgggaccat gaattatcaa gtcatggcca cggaaggttt cggctcgaac 660ggaagctcca acctcacagt atggtag 687

<210> 204<211> 228<212> PRT<213> Desconhecido<220><223> Obtido para uma amostra ambiental<220><221> SIGNAL<222> (1)...(30)<400> 204

Met Lys Ser Ala Arg Ala Leu Leu Val Ala Leu Ser Arg Ile Leu Pro1 5 10 15 Ile Ala Leu Val Leu Leu Leu Ala Pro Val Pro Ala Gln Ala Gln Gln 20 25 30 Val Cys Asn Asn Gly Thr Gly Thr His Asn Gly Phe Phe Trp Thr Phe 35 40 45 Trp Lys Asp Gly Gly Thr Ala Cys Met Thr Leu Gly Ser Gly Gly Asn 50 55 60 Tyr Ser Thr Thr Phe Asn Leu Ser Gly Gly Arg Asn Leu Val Ala Gly65 70 75 80Lys Gly Trp Gln Thr Gly Ser Thr Asn Arg Val Val Gly Tyr Asn Ala 85 90 95 Gly Val Trp Asn Pro Gly Thr Asn Ser Tyr Leu Thr Leu Tyr Gly Trp 100 105 110 Ser Thr Asn Pro Leu Val Glu Tyr Tyr Val Val Asp His Trp Gly Ser 115 120 125 Gln Phe Thr Pro Pro Gly Asn Gly Ala Gln Ser Met Gly Thr Val Thr 130 135 140 Thr Asp Gly Gly Thr Tyr Asn Ile Tyr Arg Thr Gln Arg Val Asn Ala145 150 155 160Pro Ser Ile Ile Gly Asn Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg 165 170 175 Thr Ser Arg Arg Gly Gln Gly Thr Asn Asn Thr Ile Thr Phe Ala Asn 180 185 190 His Val Asn Ala Trp Arg Ser Arg Gly Met Asn Leu Gly Thr Met Asn 195 200 205 Tyr Gln Val Met Ala Thr Glu Gly Phe Gly Ser Asn Gly Ser Ser Asn

210 215 220

Leu Thr Val Trp225

<210> 205<211> 1068<212> DNA<213> Desconhecido<220><223> Obtido para lima amostra ambiental<400> 205

atgcaaattt tcaaatcacc actgtcatgg gccggatcac tattactgat cctgtccaccgccctgtttt caacagcggc cactgcccag gaatactgct ccaaccagac cggtacacacagcggttttt actttaccca ttggtctgac ggcggcggta ctgcctgcat tactctgggagacgacggaa attacagtta cacctggtcc aacacaggca attttgtcgg tggcaagggctggagtaccg gcacctccaa tcgggtgatc ggttacaacg ccggagacta ctcgccctccggcaactcct acctggcgct gtatggctgg agcaccaatc cactgattga gtactacgtggtggatagct ggggtagctg gcgtccgccg ggtggcacct cggtaggtac agtcaccagcgatggcggga cttacgacct gtaccgcacc gagcgcgtgc agcagccctc catcgaaggcacggccacct tctatcaata ttggagcgtg cgcacctcac agcgtcccca ggggcagaacaacaccatca cctttcagaa ccacgtggat gcctgggcca atcagggctg gaacctcggcacccacaact atcaggtaat ggcgaccgaa ggctacgaaa gcagcggcag ctccaacgtcacggtttggg attccggcac cagtagcggt aacggtggca acgctggcgg cggtggtggcgaggcaggta acggctccaa ctcactggtc gtgcgtgcgg tgggcacttc gggcaacgaacagttgcgcg tcaacgtcag cggcaacacg gttgaaaccc tgaacctgtc taccaactggcaggactaca ccatcaacac caacgcttcc ggcgatgtga atgtggagtt gatcaacgatcagggcgagg gctacgaagc ccgggtggaa tacgtcatcg tcaacggcga tacccgctacggcgctgatc agagctacaa caccagcgcc tgggacggcg agtgcggcgg cggttcctttaccatgtgga tgcactgcga aggcatcctc ggttttggcg atatgtaa<210> 206<211> 355<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (29)<400> 206

Met Gln Ile Phe Lys Ser Pro Leu Ser Trp Ala Gly Ser Leu Leu Leu1 5 10 15 Ile Leu Ser Thr 20 Ala Leu Phe Ser Thr 25 Ala Ala Thr Ala Gln 30 Glu TyrCys Ser Asn Gln Thr Gly Thr His Ser Gly Phe Tyr Phe Thr His Trp 35 40 45 Ser Asp Gly Gly Gly Thr Ala Cys Ile Thr Leu Gly Asp Asp Gly Asn 50 55 60 Tyr Ser Tyr Thr Trp Ser Asn Thr Gly Asn Phe Val Gly Gly Lys Gly65 70 75 80Trp Ser Thr Gly Thr Ser Asn Arg Val Ile Gly Tyr Asn Ala Gly Asp 85 90 95 Tyr Ser Pro Ser Gly Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Ser Thr 100 105 110 Asn Pro Leu 115 Ile Glu Tyr Tyr Val 120 Val Asp Ser Trp Gly 125 Ser Trp ArgPro Pro Gly Gly Thr Ser Val Gly Thr Val Thr Ser Asp Gly Gly Thr 130 135 140 Tyr Asp Leu Tyr Arg Thr Glu Arg Val Gln Gln Pro Ser Ile Glu Gly145 150 155 160Thr Ala Thr Phe Tyr 165 Gln Tyr Trp Ser Val 170 Arg Thr Ser Gln Arg 175 ProGln Gly Gln Asn Asn Thr Ile Thr Phe Gln Asn His Val Asp Ala Trp 180 185 190 Ala Asn Gln 195 Gly Trp Asn Leu Gly 200 Thr His Asn Tyr Gln 205 Val Met AlaThr Glu 210 Gly Tyr Glu Ser Ser 215 Gly Ser Ser Asn Val 220 Thr Val Trp AspSer Gly Thr Ser Ser Gly Asn Gly Gly Asn Ala Gly Gly Gly Gly Gly225 230 235 240Glu Ala Gly Asn Gly Ser Asn Ser Leu Val Val Arg Ala Val Gly Thr 245 250 255 Ser Gly Asn Glu Gln Leu Arg Val Asn Val Ser Gly Asn Thr Val Glu 260 265 270 Thr Leu Asn 275 Leu Ser Thr Asn Trp 280 Gln Asp Tyr Thr Ile 285 Asn Thr AsnAla Ser Gly Asp Val Asn Val Glu Leu Ile Asn Asp Gln Gly Glu GlyMet Lys Leu Lys Lys Lys Met Leu Thr Leu Leu Leu Thr Ala Ser Met1 5 10 15 Ser Phe Gly Leu Phe Gly Ala Thr Ser Ser Ala Ala Thr Asp Tyr Trp 20 25 30 Gln Tyr Trp 35 Thr Asp Gly Gly Gly 40 Thr Val Asn Ala Val 45 Asn Gly SerGly Gly 50 Asn Tyr Ser Val Thr 55 Trp Gln Asn Ser Gly 60 Asn Phe Val ValGly Lys Gly Trp Ser Val Gly Ser Pro Asn Arg Thr Ile Asn Tyr Asn65 70 75 80Ala Gly Ile Trp Glu Pro Ser Gly Asn Gly Tyr Leu Thr Leu Tyr Gly 85 90 95 Trp Thr Arg Asn Ser Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly 100 105 110 Thr Tyr Arg 115 Pro Thr Gly Thr His 120 Lys Gly Thr Val Asn 125 Ser Asp GlyGly Thr 130 Tyr Asp Ile Tyr Thr 135 Thr Met Arg Tyr Asn 140 Ala Pro Ser IleAsp Gly Thr Gln Thr Phe Gln Gln Phe Trp Ser Val Arg Gln Ser Lys145 150 155 160Arg Pro Thr Gly Ser Asn Val Ser Ile Thr Phe Ser Asn His Val Asn 165 170 175 Ala Trp Arg Ser 180 Lys Gly Met Asn Leu 185 Gly Ser Ser Trp Ser 190 Tyr GlnVal Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Arg Ser Asn Val Thr 195 200 205

60

290 295 300

Tyr Glu Ala Arg Val Glu Tyr Val Ile Val Asn Gly Asp Thr Arg Tyr305 310 315 320

Gly Ala Asp Gln Ser Tyr Asn Thr Ser Ala Trp Asp Gly Glu Cys Gly

325 330 335

Gly Gly Ser Phe Thr Met Trp Met His Cys Glu Gly Ile Leu Gly Phe340 345 350

Gly Asp Met355<210> 207<211> 633<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 207

atgaaattaa aaaagaagat gctcacttta ctcctgacgg cttcgatgag tttcggtttatttggggcaa cctcgagtgc agcaacggat tattggcaat attggacgga tggcggcgga 120

acggtgaatg cggttaacgg gtccgggggc aattacagcg taacttggca aaatagcggg 180

aacttcgtgg tcggcaaagg ctggagcgta gggtcgccaa atcggacgat caattacaat 240

gccggcatct gggaaccttc ggggaacggg tacttgaccc tttacggatg gactagaaac 300

tcgctgatcg agtattacgt tgtcgacagt tgggggacgt accggccaac aggtactcac 360

aaaggaacgg tgaacagcga cggaggcacc tacgatattt atacgaccat gcgctataat 420

gcgccttcca ttgatggcac gcagacgttc caacagttct ggagcgtgcg gcaatcgaaa 480

cgaccaaccg gcagcaacgt ctccatcacc ttcagcaatc acgtgaatgc ctggagaagc 540

aagggcatga acctgggcag cagctggtcg taccaggtct tggcgacgga aggctatcag 600

agcagcggaa gatccaacgt cacggtgtgg taa 633

<210> 208<211> 210<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(27)<400> 208

Val Trp210<210> 209<211> 1194<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 209

atgaaaacat ttagtgtgac caagtctagc gttgttttcg caatggcttt gggtatggcttcgacagctt ttgctcagga tttctgcagc aatgcgcaac attccggcca aaaggtaacgattacttcga accaaactgg taaaatcggc gatatcggtt acgaactctg ggacgaaaacggtcatggtg gtagtgctac cttctatagc gatggttcca tggactgcaa tatcactggtgctaaggact atctctgccg tgcgggcctt tccctcggca gtaacaagac ctacaaggaacttggtggtg atatgattgc cgagttcaag cttgtgaaga gcggtgccca gaatgtgggttactcttata tcggtatcta tggctggatg gaaggtgttt ctggaacgcc tagccagttggtcgaatact acgtgattga taacaccctc gccaatgaca tgccgggtag ctggattggtaacgaaagaa agggtaccat tacggttgac ggcggtacct atactgttta tcgcaatacccgtacaggtc cggctattaa gaacagcggt aacgtcacgt tctatcagta tttcagcgttcgtacctctc cgcgcgattg cggtaccatc aatatttccg aacacatgag acagtgggaaaagatgggca tgaccatggg taagctctac gaagccaagg tgcttggcga agcgggtaacgtgaatggcg aagtccgcgg tggtcacatg gacttcccgc atgctaaggt ttatgtgaaaaacggctctg atccggcttc ttcctcttct gtgaagtcca gctcttctac agtaacgccaaaatccagct cctcgaaggg taacggcaac gtttctggta aaattgacgc ctgcaaggacgctatgggcc atgaaggcaa agaaacgaga actcagggtc agaacaactc tagcgtgacgggtaacgtcg gcagctctcc gtaccactat gaaatttggt atcagggtgg taacaactccatgacgttct acgacaacgg tacttataag gcaagctgga atggtaccaa cgacttccttgctcgtgtcg gtttcaagta tgatgaaaag cacacttacg aagaacttgg ccctatcgatgcctactaca agtggagcaa gcagggtagt gctggtggct acaactacat cggt<210> 210<211> 398<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(25)<400> 210

Met Lys Thr Phe Ser Val Thr Lys Ser Ser Val Val Phe Ala Met Ala1 5 10 15 Leu Gly Met Ala Ser Thr Ala Phe Ala Gln Asp Phe Cys Ser Asn Ala 20 25 30 Gln His Ser Gly Gln Lys Val Thr Ile Thr Ser Asn Gln Thr Gly Lys 35 40 45 Ile Gly 50 Asp Ile Gly Tyr Glu 55 Leu Trp Asp Glu Asn 60 Gly His Gly GlySer Ala Thr Phe Tyr Ser Asp Gly Ser Met Asp Cys Asn Ile Thr Gly65 70 75 80Ala Lys Asp Tyr Leu 85 Cys Arg Ala Gly Leu 90 Ser Leu Gly Ser Asn 95 LysThr Tyr Lys Glu 100 Leu Gly Gly Asp Met 105 Ile Ala Glu Phe Lys 110 Leu ValLys Ser Gly Ala Gln Asn Val Gly Tyr Ser Tyr Ile Gly Ile Tyr Gly 115 120 125 Trp Met Glu Gly Val Ser Gly Thr Pro Ser Gln Leu Val Glu Tyr Tyr 130 135 140 Val Ile Asp Asn Thr Leu Ala Asn Asp Met Pro Gly Ser Trp Ile Gly145 150 155 160Asn Glu Arg Lys Gly Thr Ile Thr Val Asp Gly Gly Thr Tyr Thr Val 165 170 175 Tyr Arg Asn Thr 180 Arg Thr Gly Pro Ala 185 Ile Lys Asn Ser Gly 190 Asn ValThr Phe Tyr 195 Gln Tyr Phe Ser Val 200 Arg Thr Ser Pro Arg 205 Asp Cys GlyThr Ile 210 Asn Ile Ser Glu His 215 Met Arg Gln Trp Glu 220 Lys Met Gly MetThr Met Gly Lys Leu Tyr Glu Ala Lys Val Leu Gly Glu Ala Gly Asn225 230 235 240Val Asn Gly Glu Val Arg Gly Gly His Met Asp Phe Pro His Ala Lys 245 250 255Val Tyr Val Lys Asn Gly Ser Asp Pro Ala Ser Ser Ser Ser Val Lys 260 265 270 Ser Ser Ser 275 Ser Thr Val Thr Pro 280 Lys Ser Ser Ser Ser 285 Lys Gly AsnGly Asn 290 Val Ser Gly Lys Ile 295 Asp Ala Cys Lys Asp 300 Ala Met Gly HisGlu Gly Lys Glu Thr Arg Thr Gln Gly Gln Asn Asn Ser Ser Val Thr305 310 315 320Gly Asn Val Gly Ser 325 Ser Pro Tyr His Tyr 330 Glu Ile Trp Tyr Gln 335 GlyGly Asn Asn Ser 340 Met Thr Phe Tyr Asp 345 Asn Gly Thr Tyr Lys 350 Ala SerTrp Asn Gly 355 Thr Asn Asp Phe Leu 360 Ala Arg Val Gly Phe 365 Lys Tyr AspGlu Lys 370 His Thr Tyr Glu Glu 375 Leu Gly Pro Ile Asp 380 Ala Tyr Tyr LysTrp Ser Lys Gln Gly Ser Ala Gly Gly Tyr Asn Tyr Ile Gly 385 390 395 <210> 211 <211> 1086

<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 211

atgataagtt ctaaagcatc acagtcatgg ggctggtcac tattggtggc cctgtccgccgttctgcttt cggcgacagc ttccgcccag caacactgct ccaaccaaac cggtacgcacaacggttttt actttaccca ttggtcagac ggtggcggta ccgcctgcat gactctgggggacgacggca actacagcta tacctggtcc aacactggca attttgtcgg tggtaagggctggagcacag gtacatccaa ccgggtgatt ggttacaacg ccggagacta ctcgccctccggcaactcct acctggcact gtatggctgg agcaccaatc cgctgattga atattacgtg 360

gtcgacagtt ggggcagctg gcgtccgccg ggtggcacct ctgtgggcac ggtaaccagc 420

gacggtggca cttacgacct gtaccgaacc cagcgtgtgc agcagccctc cattgagggtacggccacct tctatcaata ctggagcgtg cgcacctcac agcggcctca ggggcaaaacaacaccatca cctttcagaa ccacgtgaat gcctgggcca atcagggctg gaatctgggcacccacaact atcaggtgat ggcgaccgaa ggctacgaaa gcagcggcag ctccaacgtcaccgtttggg attccggcac cagtagcggt ggcggtggcg gtggcaacgc gggcggcggc 720

ggagcccccg gtggtggtga ggctggaggc ggctccaact cactggttgt gcgtgcggtg 780

ggcacttcgg gcaatgaaca gttgcgcgtc aacgtcagtg gcaacacggt ggaaaccctgaacctgtcta ccaactggca ggactacacc atcaacacca acgcctccgg cgatgtcaatgtggaattga tcaacgacca gggcgaaggc tacgaggccc gcgtcgagta cgtcatcatcaacggcgata cccgctacgg cgccgaccag agctacaaca ccagcgcctg ggacggcgag 1020tgcggtagcg gttcctttac catgtggatg cactgcgaag gcatcctcgg ttttggcgat 1080atgtaa<210> 212<211> 361<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (29)<400> 212

Met Ile Ser Ser Lys Ala Ser Gln Ser Trp Gly Trp Ser Leu Leu Val

1 5 10 15

Ala Leu Ser Ala Val Leu Leu Ser Ala Thr Ala Ser Ala Gln Gln His

20 25 30

Cys Ser Asn Gln Thr Gly Thr His Asn Gly Phe Tyr Phe Thr His Trp

35 40 45

Ser Asp Gly Gly Gly Thr Ala Cys Met Thr Leu Gly Asp Asp Gly Asn

50 55 60

Tyr Ser Tyr Thr Trp Ser Asn Thr Gly Asn Phe Val Gly Gly Lys Gly65 70 75 80

Trp Ser Thr Gly Thr Ser Asn Arg Val Ile Gly Tyr Asn Ala Gly Asp

85 90 95

Tyr Ser Pro Ser Gly Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Ser Thr

60120180240300

480540600660

840900960

1086100 105 110 Asn Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Ser Trp Arg 115 120 125 Pro Pro Gly Gly Thr Ser Val Gly Thr Val Thr Ser Asp Gly Gly Thr130 135 140 Tyr Asp Leu Tyr Arg Thr Gln Arg Val Gln Gln Pro Ser Ile Glu Gly145 150 155 160Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Gln Arg Pro 165 170 175 Gln Gly Gln Asn Asn Thr Ile Thr Phe Gln Asn His Val Asn Ala Trp 180 185 190 Ala Asn Gln Gly Trp Asn Leu Gly Thr His Asn Tyr Gln Val Met Ala 195 200 205 Thr Glu Gly Tyr Glu Ser Ser Gly Ser Ser Asn Val Thr Val Trp Asp210 215 220 Ser Gly Thr Ser Ser Gly Gly Gly Gly Gly Gly Asn Ala Gly Gly Gly225 230 235 240Gly Ala Pro Gly Gly Gly Glu Ala Gly Gly Gly Ser Asn Ser Leu Val 245 250 255 Val Arg Ala Val Gly Thr Ser Gly Asn Glu Gln Leu Arg Val Asn Val 260 265 270 Ser Gly Asn Thr Val Glu Thr Leu Asn Leu Ser Thr Asn Trp Gln Asp 275 280 285 Tyr Thr Ile Asn Thr Asn Ala Ser Gly Asp Val Asn Val Glu Leu Ile290 295 300 Asn Asp Gln Gly Glu Gly Tyr Glu Ala Arg Val Glu Tyr Val Ile Ile305 310 315 320Asn Gly Asp Thr Arg Tyr Gly Ala Asp Gln Ser Tyr Asn Thr Ser Ala 325 330 335 Trp Asp Gly Glu Cys Gly Ser Gly Ser Phe Thr Met Trp Met His Cys 340 345 350 Glu Gly Ile Leu Gly Phe Gly Asp Met 355 360 <210> 213 <211> 912 <212> DNA <213> Desconhecido <220>

<223> Obtido para uma amostra ambiental<400> 213

gtgaacgcac aacaaaccct tacgtctaac tccaccggta ctcatggtgg tcactactat 60

tctttctgga aggactccgg caatgcgtcc ttcactctct acgatggcgg acgttacggc 120

tcgcaatgga atagcggcac caacaattgg gtgggcggta aaggctggaa cccgggcggc 180

gcaaaagtcg ttaactacga aggttattac ggcgttaaca attcccagaa ttcttacctg 240

gcactctacg ggtggacccg caatccgctg atcgagtact acataatcga aagttacggt 300

tcgtacaacc catcgagctg tagtggcggt actaactacg gtagcttcca aagcgatggt 360

gcgacctata acgtccgccg ttgccagcgc gtacagcagc catcgattga tggaacgcaa 420

acgttctatc agtatttcag cgttcgctca cccaaaaagg gcttcggcca aatcagcggc 480

actatcaatg taggcaacca ctttaattat tgggccagca aagggctgaa tttgggtagc 540

cacgattaca tggttctggc gactgaaggc tatcagagca gcggcaattc agatatttcc 600

gtgtccgaag gcagcagcgg cggctcttcc tcaggcggtt cgacctccag cggaagctcc 660

tccggtagta cgaccagttc ttcaggaggc ggtggcggcg gcatcacagt acgtgctcgc 720

ggcactaatg gtgatgagcg tatcagcctg cgtgtcggcg gttctgcggt agccagttgg 780

acactcagta ccagcgcaca aagctatagc tacacaggcg gcgcctctgg cgatatccag 840

gtggaattcg atatcaagct tatcgatacc gtcgacctcg agggggggcc cggtacccaa 900ttcgccctat ag 912

<210> 214<211> 303<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 214

Val Asn Ala Gln Gln Thr Leu Thr Ser Asn Ser Thr Gly Thr His Gly1 5 10 15

Gly His Tyr Tyr Ser Phe Trp Lys Asp Ser Gly Asn Ala Ser Phe Thr20 25 30Leu Tyr Asp Gly Gly Arg Tyr Gly Ser Gln Trp Asn Ser Gly Thr Asn 35 40 45 ValAsn Trp Val Gly Gly Lys Gly Trp Asn Pro Gly Gly Ala Lys Val 50 55 60 Asn Tyr Glu Gly Tyr Tyr Gly Val Asn Asn Ser Gln Asn Ser Tyr Leu65 70 75 80Ala Leu Tyr Gly Trp Thr Arg Asn Pro Leu Ile Glu Tyr Tyr Ile Ile 85 90 95 Glu Ser Tyr Gly Ser Tyr Asn Pro Ser Ser Cys Ser Gly Gly Thr Asn 100 105 110 Tyr Gly Ser Phe Gln Ser Asp Gly Ala Thr Tyr Asn Val Arg Arg Cys 115 120 125 Gln Arg Val Gln Gln Pro Ser Ile Asp Gly Thr Gln Thr Phe Tyr Gln 130 135 140 Tyr Phe Ser Val Arg Ser Pro Lys Lys Gly Phe Gly Gln Ile Ser Gly145 150 155 Gly 160Thr Ile Asn Val Gly Asn His Phe Asn Tyr Trp Ala Ser Lys Leu 165 170 175 Asn Leu Gly Ser His Asp Tyr Met Val Leu Ala Thr Glu Gly Tyr Gln 180 185 190 Ser Ser Gly Asn Ser Asp Ile Ser Val Ser Glu Gly Ser Ser Gly Gly 195 200 205 Ser Ser Ser Gly Gly Ser Thr Ser Ser Gly Ser Ser Ser Gly Ser Thr 210 215 220 Thr Ser Ser Ser Gly Gly Gly Gly Gly Gly Ile Thr Val Arg Ala Arg225 230 235 240Gly Thr Asn Gly Asp Glu Arg Ile Ser Leu Arg Val Gly Gly Ser Ala 245 250 255 Val Ala Ser Trp Thr Leu Ser Thr Ser Ala Gln Ser Tyr Ser Tyr Thr 260 265 270 Gly Gly Ala Ser Gly Asp Ile Gln Val Glu Phe Asp Ile Lys Leu Ile 275 280 285 Asp Thr Val Asp Leu Glu Gly Gly Pro Gly Thr Gln Phe Ala Leu 290 295 300

<210> 215<211> 1065<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 215

atgtttgcaa gattcgagaa actggccgcg gcgggtaaag ccgtcgtggc cctggcagggctcgcccttt tgggcacggc gcctgccaat gcacagacct gtctcacgaa caattccaccggcaccaaca acggctacta ctactcgttc tggaaggaca gcggcaacgt gaccttctgcatgtacgggg gcggccgcta tacctcgcag tggagcaaca tcaacaactg ggtgggcggcaagggctgga atccgggcgg tcgtcggacc gtcacctatt cggggacgtt caacccgaacggcaattcct atctcacgct gtacggctgg accaccaatc cactggtcga gtactacatcgtcgacagct ggggcagctg gcgtccgccg ggttccggct acatgggttc cgtcacgagcgacggcggca cctacgacat ctatcgcacg cagcgcgtca accagccctc gatcatcggcaccgcgacgt tctaccagta ctggagcgtg cggcagcaga agcgcgtggg tggcaccatcaccaccggca accacttcga tgcctgggct tcgctgggca tgaacctcgg ccagcacaactacatggtca tggccaccga gggctaccag agcagcggca gctccgacat cacggtgggcggcaccagca gctcctcgtc gtcgagcggg ggcagcagca gcagtagcag cagcagcgggggtggcggct cgaagagctt caccgtgcgc gcgcggggtt cgacgggcgg tgagcagatcagtttgcgcg tgaacaacca gaccgtgcag aactggacgc tgggcaccag catgcagaactacaccgcgt ccaccaacct gagcggcggc atcaccgtgc acttcaccaa tgacagcggcaaccgcgacg tgcaggtgga ctacatccag gtgaacggcc agacgcgtca atccgagcagcagagctaca acaccgggct gtatgccaac ggcagctgtg gcggcggcgg ctacagcgagtggatgcatt gcaatggcgc gatcggttac ggcaacacgc cgtag<210> 216<211> 354<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<22 0>

<221> SIGNAL<222> (1)...(31)<400> 216

Met Phe Ala Arg Phe Glu Lys Leu Ala Ala Ala Gly Lys Ala Val Val1 5 10 15

Ala Leu Ala Gly Leu Ala Leu Leu Gly Thr Ala Pro Ala Asn Ala Gln20 25 30

Thr Cys Leu Thr Asn Asn Ser Thr Gly Thr Asn Asn Gly Tyr Tyr Tyr

35 40 45

Ser Phe Trp Lys Asp Ser Gly Asn Val Thr Phe Cys Met Tyr Gly Gly50 55 60

Gly Arg Tyr Thr Ser Gln Trp Ser Asn Ile Asn Asn Trp Val Gly Gly65 70 75 80

Lys Gly Trp Asn Pro Gly Gly Arg Arg Thr Val Thr Tyr Ser Gly Thr85 90 95

Phe Asn Pro Asn Gly Asn Ser Tyr Leu Thr Leu Tyr Gly Trp Thr Thr100 105 HO

Asn Pro Leu Val Glu Tyr Tyr Ile Val Asp Ser Trp Gly Ser Trp Arg

115 120 125

Pro Pro Gly Ser Gly Tyr Met Gly Ser Val Thr Ser Asp Gly Gly Thr130 135 140

Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly145 150 155 160

Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Gln Gln Lys Arg Val165 170 175

Gly Gly Thr Ile Thr Thr Gly Asn His Phe Asp Ala Trp Ala Ser Leu180 185 190

Gly Met Asn Leu Gly Gln His Asn Tyr Met Val Met Ala Thr Glu Gly

195 200 205

Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Gly Gly Thr Ser Ser

210 215 220

Ser Ser Ser Ser Ser Gly Gly Ser Ser Ser Ser Ser Ser Ser Ser Gly225 230 235 240

Gly Gly Gly Ser Lys Ser Phe Thr Val Arg Ala Arg Gly Ser Thr Gly245 250 255

Gly Glu Gln Ile Ser Leu Arg Val Asn Asn Gln Thr Val Gln Asn Trp260 265 270

Thr Leu Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser Thr Asn Leu Ser

275 280 285

Gly Gly Ile Thr Val His Phe Thr Asn Asp Ser Gly Asn Arg Asp Val290 295 300

Gln Val Asp Tyr Ile Gln Val Asn Gly Gln Thr Arg Gln Ser Glu Gln305 310 315 320

Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Ser Cys Gly Gly Gly325 330 335

Gly Tyr Ser Glu Trp Met His Cys Asn Gly Ala Ile Gly Tyr Gly Asn340 345 350

Thr Pro<210> 217<211> 1083<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 217

atgactttcg tcaagacgat caccggcaga cgcgccatcg cggcgttcct ctgcctcgcc 60

ggcctctaca tggcgccggc aaacgcgcaa acctgcatca cgtccagcca gaccggcaccaacaacggga actacttttc gttctggaaa gacagcccgg gcacggtgaa cttctgcatgtacccgaatg gccgctacac ctcgaactgg agcggcatca acaactgggt cggcggcaagggctggtcga ccggctccag ccgcaccgtc agctattcgg gcagcttcaa ttcgcccggcaacggctacc tgactctcta cgggtggacc accaacccgc tcatcgagta ctacatcgtc 360

gagaactggg gtaactaccg cccgccgggc ggccaggggt acatggggac cgtcaattcc 420

gacggggcga cctatgacat ctaccggacc ttccgggaca accagccctg catcacgggcaactcctgcg acttctacca gtactggagc gtgcgccagt ccaagcgcag cagcggcaccatcaccacgg ccaatcactt cgcggcgtgg aacagcctcg gcatgaacct gggccagcacaactaccagg tcatggccac cgagggttac cagagcagcg gcagctccga catcacggtc

acggaaggcg gcggcggcag cagcaatggt ggcagcagca acggcggcag cagcaatggc 720

ggcagcagca atggcggcgg cggcggcacc aagagcttca cggtccgcgc ccgtggcacc 780gcgggtggcg agtccatcac gctgcgtgtc aacaaccaga acgtgcagac ctggacgctgggcaccggca tgcagaacta cacggcctcg acctcgctga gcggtggcat cacggtgcacttcaccaacg acggcggaag ccgcgacgtg caggtggact acatccaggt gaacggcagcacgcgccagt ccgaggcaca gagctacaac accggcgcct acctgaacgg ccgttgcggcggtggcggca acagcgaatg gatgcattgc aacggcgcca tcggctacgg caatacgccctga<210> 218<211> 360<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL

<222> (1) ... (29)<400> 218

Met Thr Phe Val Lys Thr Ile Thr Gly Arg Arg Ala Ile Ala Ala Phe

1 5 10 15

Leu Cys Leu Ala Gly Leu Tyr Met Ala Pro Ala Asn Ala Gln Thr Cys

20 25 30

Ile Thr Ser Ser Gln Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser Phe

35 40 45

Trp Lys Asp Ser Pro Gly Thr Val Asn Phe Cys Met Tyr Pro Asn Gly

50 55 60

Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys65 70 75 80

Gly Trp Ser Thr Gly Ser Ser Arg Thr Val Ser Tyr Ser Gly Ser Phe

85 90 95

Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn

100 105 HO

Pro Leu Ile Glu Tyr Tyr Ile Val Glu Asn Trp Gly Asn Tyr Arg Pro

115 120 125

Pro Gly Gly Gln Gly Tyr Met Gly Thr Val Asn Ser Asp Gly Ala Thr

130 135 140

Tyr Asp Ile Tyr Arg Thr Phe Arg Asp Asn Gln Pro Cys Ile Thr Gly

145 150 155 160

Asn Ser Cys Asp Phe Tyr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg

165 170 175

Ser Ser Gly Thr Ile Thr Thr Ala Asn His Phe Ala Ala Trp Asn Ser

180 185 190

Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln Val Met Ala Thr Glu

195 200 205

Gly Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Thr Glu Gly Gly210 215 220

45 Gly Gly Ser Ser Asn Gly Gly Ser Ser Asn Gly Gly Ser Ser Asn Gly225 230 235 240

Gly Ser Ser Asn Gly Gly Gly Gly Gly Thr Lys Ser Phe Thr Val Arg

245 250 255

Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val Asn Asn260 265 270

Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Gly Met Gln Asn Tyr Thr

275 280 285

Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val His Phe Thr Asn Asp290 295 300

Gly Gly Ser Arg Asp Val Gln Val Asp Tyr Ile Gln Val Asn Gly Ser305 310 315 320

Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Ala Tyr Leu Asn

325 330 335

Gly Arg Cys Gly Gly Gly Gly Asn Ser Glu Trp Met His Cys Asn Gly340 345 350

Ala Ile Gly Tyr Gly Asn Thr Pro355 360

<210> 219<211> 1029<212> DNA

<213> Desconhecido<220>

840900960102010801083<223> Obtido para uma amostra ambiental<400> 219

atgacatcag gtctcaagaa agtgatggca ttcgtctgtc tcgccaccct tggcgtttcg 60

gcgcatgccc agacatgtat tcagtccagt cagaccggca ccaacaacgg attctatttc 120

tccttctgga aggacaaccc gggcacggtg cagttctgcc tgcagagcgg cggtcgttac 180

acctccaact ggaacggcat caacaactgg gtgggcggca aggggtggca gaccggcgca 240

cgccgcacgg tgaactactc gggctcgttc aactcgccgg gcaacggcta tctggcgctg 300

tacggctgga ccaccaatcc gctggtcgag tactacatcg tcgacagctg gggcagcttc 360

cgtccgccgg gcaacactgc aggcctgtgg gtactggtga acagcgatgg cggcacctac 420

gacatctatc gcgcgcatcg cagtaacgcg ccctgcatca ccggcagcag ctgcgacttc 480

gaccagtact ggagcgtgcg acagtcgaag cgcgtcggcg gcaccatcac caccggcaac 540

cacttcgatg cctgggcgaa ccaccagatg aatctgggcc agttcaacta ccagatcatg 600

gctaccgagg gtttccagag caacggcagc tccgacatca ccgtcagtga atgcaccagc 660

aattgcggcg gtggcggcgg cggcgggggt ggcagcaaca gcatcacggt gcgcgcgcgc 720

ggcacgggcg gcggcgagca gatccggctg cgggtgaaca acaccacggt gcaaacctgg 780

acgctgacca ccagctacca gaacttcacg gcttcgacct cgctgagcgg cggcaccatc 840

gtcgagtact tcaacgacag ttccggccat gacgtgcagg tcgactacat catcgtgaat 900

ggcgtgaccc gccagtccga atcgcagagc tacaacaccg ggctgtatgc caacgggcgt 960

tgcggcggcg gctccaacag cgagtggatg cattgcaacg gtgccattgg atacggaaat 1020

accccgtaa 1°29<210> 220<211> 342<212> PRT<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL <222> (1) . . . (23) <400> 220 Met Thr Ser Gly Leu Lys Lys Val Met Ala Phe Val Cys Leu Ala Thr 1 5 10 15 Leu Gly Val Ser Ala His Ala Gln Thr Cys Ile Gln Ser Ser Gln Thr 20 25 30 Gly Thr Asn Asn Gly Phe Tyr Phe Ser Phe Trp Lys Asp Asn Pro Gly 35 40 45 Thr Val Gln Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Asn Trp 50 55 60 Asn Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ala 65 70 75 80 Arg Arg Thr Val Asn Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly 85 90 95 Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr 100 105 110 Ile Val Asp Ser Trp Gly Ser Phe Arg Pro Pro Gly Asn Thr Ala Gly 115 120 125 Leu Trp Val Leu Val Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg 130 135 140 Ala His Arg Ser Asn Ala Pro Cys Ile Thr Gly Ser Ser Cys Asp Phe 145 150 155 160 Asp Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile 165 170 175 Thr Thr Gly Asn His Phe Asp Ala Trp Ala Asn His Gln Met Asn Leu 180 185 190 Gly Gln Phe Asn Tyr Gln Ile Met Ala Thr Glu Gly Phe Gln Ser Asn 195 200 205 Gly Ser Ser Asp Ile Thr Val Ser Glu Cys Thr Ser Asn Cys Gly Gly 210 215 220 Gly Gly Gly Gly Gly Gly Gly Ser Asn Ser Ile Thr Val Arg Ala Arg 225 230 235 240 Gly Thr Gly Gly Gly Glu Gln Ile Arg Leu Arg Val Asn Asn Thr Thr 245 250 255 Val Gln Thr Trp Thr Leu Thr Thr Ser Tyr Gln Asn Phe Thr Ala Ser 260 265 270 Thr Ser Leu Ser Gly Gly Thr Ile Val Glu Tyr Phe Asn Asp Ser Ser 275 280 285 Gly His Asp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Val Thr Arg290 295 300

Gln Ser Glu Ser Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg305 310 315 320

Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile325 330 335

Gly Tyr Gly Asn Thr Pro340

<210> 221<211> 1044<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 221

atgattgtta gtttcaagag cgtgaaggca ctcgcgtgcc tggccgtgct cggcgtgacc ^60

gccgcgcagg cgcaaacctg catcaattcc agccagaccg gcaccaacaa cggcaattatttttcattct ggaaagacaa cccgggcacg gtgaccttct gcatgtatgc caacggccgctacacctcca actggagcgg catcaacaac tgggtgggtg gcaagggctg gcagaccggctcgaatcgca cggtgaccta ctccggttcg ttcaactcgc ccggcaacgg ctacctcaccctgtacgggt ggaccacgaa tccgctgatc gagtactaca tcgtcgacag ttggggcagttatcgaccgc ccggcggcca gggcttcatg ggcaccgtga cgaccgacgg cggcacctacgacatctatc gcacgcagcg cgtgaaccag ccttccatca tcggcaccgc gacgttctaccagtactgga gcgtgcggca gtcgaagcgc gtggggggca ccatcaccac cgccaaccacttcaatgcct gggcgacgct gggcatgaac ctgggccagc acaactacca ggtcatggccaccgagggtt accagagcag cggcagctcc gacatcaccg tgaccgaagg cggcggcagc 660

tcgtcgtcgt cgagcggcgg cggcagcacc agcagcggcg gtggcggcag caagagcttc 720

acggtgcgcg cccgcggcac ggtcggcggc gaaaacatcc agctgcaggt caacaaccag 780

acggtggcga gctggaacct gaccaccagc atgcagaact acaacgcctc gaccagcctgagtggcggca tcaccgtggt ctacaccaac gacggcggta accgcgacgt ccaggtcgactacatcaccg tgaacggcca gacccgccag tccgaagcgc agagtttcaa caccgggctg

tatgccaacg gacgttgtgg cggcggctcg aacagcgagt ggatgcattg caatggcgcg 1020atcggctacg gcaacacgcc gtaa<210> 222<211> 347

<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL <222> (1) . . . (24) <400> 222 Met Ile Val Ser Phe Lys Ser Val Lys Ala Leu Ala Cys Leu Ala Val 1 5 10 15 Leu Gly Val Thr Ala Ala Gln Ala Gln Thr Cys Ile Asn Ser Ser Gln 20 25 30 Thr Gly Thr 35 Asn Asn Gly Asn Tyr 40 Phe Ser Phe Trp Lys 45 Asp Asn Pro Gly Thr Val Thr Phe Cys Met Tyr Ala Asn Gly Arg Tyr Thr Ser Asn 50 55 60 Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly 65 70 75 80 Ser Asn Arg Thr Val Thr Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn 85 90 95 Gly Tyr Leu Thr 100 Leu Tyr Gly Trp Thr 105 Thr Asn Pro Leu Ile 110 Glu Tyr Tyr Ile Val 115 Asp Ser Trp Gly Ser 120 Tyr Arg Pro Pro Gly 125 Gly Gln Gly Phe Met Gly Thr Val Thr Thr Asp Gly Gly Thr Tyr Asp Ile Tyr Arg 130 135 140 Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe Tyr 145 150 155 160 Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr 165 170 175 Thr Ala Asn His 180 Phe Asn Ala Trp Ala 185 Thr Leu Gly Met Asn 190 Leu Gly Gln His Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly

120180240300360420480540600

840900960

1044195 200 205

Ser Ser Asp Ile Thr Val Thr Glu Gly Gly Gly Ser Ser Ser Ser Ser

210 215 220

Ser Gly Gly Gly Ser Thr Ser Ser Gly Gly Gly Gly Ser Lys Ser Phe225 230 235 240

Thr Val Arg Ala Arg Gly Thr Val Gly Gly Glu Asn Ile Gln Leu Gln

245 250 255

Val Asn Asn Gln Thr Val Ala Ser Trp Asn Leu Thr Thr Ser Met Gln260 265 270

Asn Tyr Asn Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Val Tyr275 280 285

Thr Asn Asp Gly Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Thr Val

290 295 300

Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Phe Asn Thr Gly Leü305 310 315 320

Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His

325 330 335

Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro340 345

20 <210> 223

<211> 642<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 223

atgtttaagt ttaaaaagaa tttcttagtt ggattatcgg cagctttaat gagtattagc 60

ttgttttcgg caaccgcctc tgcagctagc acagactact ggcaaaattg gactgatggg 12 0

ggcggtatag taaacgctgt caatgggtct ggcgggaatt acagtgttaa ttggtctaat 180

accggaaatt tcgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaac 240tataatgccg gagtttgggc accgaatgga aatggatatt taactttata tggttggacg 300

agatcacctc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactgga 360

acgtataaag gtactgtaaa aagtgatggg ggtacatatg acatatatac aactacacgt 420tataacgcac cttccattga tggcgatcgc actactttta cgcagtactg gagtgttcgc 480

caaacgaaga gaccaaccgg aagcaacgct acaatcactt tcagcaatca tgttaacgca 540tggaagagcc atggaatgaa tctgggcagt aattgggctt accaagtcat ggcgacagaa 600ggatatcaaa gtagtggaag ttctaacgta acagtgtggt aa 642

<210> 224<211> 213<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220><221> SIGNAL

<222> (1)...(28)<400> 224

Met Phe Lys Phe Lys Lys Asn Phe Leu Val Gly Leu Ser Ala Ala Leu1 5 10 15

Met Ser Ile Ser Leu Phe Ser Ala Thr Ala Ser Ala Ala Ser Thr Asp20 25 30

Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Ile Val Asn Ala Val Asn

35 40 45

Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe

50 55 60

Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn65 70 75 80

Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Gly Tyr Leu Thr Leu85 90 95

Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser100 105 110

Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Lys Ser

115 120 125

Asp Gly Gly Thr Tyr Asp Ile Tyr Thr Thr Thr Arg Tyr Asn Ala Pro130 135 140

Ser Ile Asp Gly Asp Arg Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg145 150 155 160Gln Thr Lys Arg Pro Thr Gly Ser Asn Ala Thr

165 170

His Val Asn Ala Trp Lys Ser His Gly Met Asn

180 185

Ala Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln

195 200

Asn Val Thr Val Trp210<210> 225<211> 1059<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 225

atgtttgtta gtctcaggaa gacggcttgg gcgtgcctgttcgacttcac aagcccagac ctgcatcacg tccagcgggatactattcct tctggaagga cagtggcggc accgtcaactcgctacacct ccaactggag cggcatcaac aactgggtggggctcacgcc ggacgatcag ctactcgggc tcgttcaactaccctgtacg gttggaccac caatccattg atcgagtactacgtaccggc cgccgggagg ctcgggctac atgggcacggtacgacgtct atcgcaccca gcgcgtaaac cagccttccatatcaatact ggagcgtgcg ccagcagaag cggaccggcgcacttcgacg cctgggccgc atacggaatg aacctcggcagcgaccgagg gttaccagag cagcggcagt tcggacatcaagttcatcga gcagcagctc gtcgagcagc agcagttcgtggcacgaaga gcttcacggt ccgcgcgcgc ggcacggcggcgcgtgaaca accagaacgt gcagacctgg acgctgggcagcatcgacca cgctctccgg tggcatcacc gtcgcgtacagacgtgcagg tggactacat cgtcgtgaac ggcgccaccctacaacaccg gtctctatgc caacggtcgt tgcggcggcgcactgcaacg ggcagatcgg ctacgggaat actccctag<210> 226<211> 352<212> PRT<213> Desconhecido<220>

Obtido para uma amostra ambiental

Ile Thr Phe Ser Asn175

Leu Gly Ser Asn Trp190

Ser Ser Gly Ser Ser205

tgctcgccggcgggcaccaatctgcatgtagcggcaagggcacccggcaaacatcgtcgatgacgagcgatcatcggcacggaccatcaccccacaactacggtgagcgacctcttcgaggcggtgaatccgtcgatgcaccaacgacaggccagtccgagctccaacag

cctcggaatc 60caacggccac 120cgcgaacggc 180ctggcagacc 240tggttatctc 300caactggggc 360cggcggcacc 420cgcgacgttc 480caccggcaat 540ccagatcatg 600gggcggtggc 660cggcggcggc 720catcacgctg 780gaactacacc 840cggcaatcgc 900ggcgcagagc 960cgagtggatg 1020 1059

<223><220><221><222><400>Met1

SIGNAL(1)...(25)226

Phe Val Ser Leu Arg Lys Thr Ala Trp Ala5

Gly Leu Gly Ile Ser Thr Ser Gln Ala Gln Thr

20

25

35

40

50

55

Asn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly

65

70

Gly Ser Arg Arg Thr Ile Ser Tyr Ser Gly Ser85

Asn Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr

100

105

Tyr Tyr Ile Val Asp Asn Trp Gly Thr Tyr Arg

115

120

Gly Tyr Met Gly Thr Val Thr Ser Asp Gly Gly

130

135

145

150

165

Trp Ala Cys Leu Leu Leu Ala10 15 Gln Thr Cys Ile Thr Ser Ser 30 Tyr Ser Phe Trp Lys Asp Ser 45 Ala Asn Gly Arg Tyr Thr Ser 60 Gly Gly Lys Gly Trp Gln Thr 75 80Gly Ser Phe Asn Ser Pro Gly90 95 Thr Thr Asn Pro Leu Ile Glu 110 Tyr Arg Pro Pro Gly Gly Ser 125 Gly Gly Thr Tyr Asp Val Tyr 140 Ile Ile Gly Thr Ala Thr Phe 155 160Lys Arg Thr Gly Gly Thr Ile170 175 Ala Ala Tyr Gly Met Asn Leu

180

185

190Gly Thr His Asn Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser

195 200 205

Gly Ser Ser Asp Ile Thr Val Ser Glu Gly Gly Gly Ser Ser Ser Ser210 215 220

Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Gly Gly Gly225 230 235 240

Gly Thr Lys Ser Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu

245 250 255

Ser Ile Thr Leu Arg Val Asn Asn Gln Asn Val Gln Thr Trp Thr Leu260 265 270

Gly Thr Ser Met Gln Asn Tyr Thr Ala Ser Thr Thr Leu Ser Gly Gly

275 280 285

Ile Thr Val Ala Tyr Thr Asn Asp Ser Gly Asn Arg Asp Val Gln Val290 295 300

Asp Tyr Ile Val Val Asn Gly Ala Thr Arg Gln Ser Glu Ala Gln Ser305 310 315 320

Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn

325 330 335

Ser Glu Trp Met His Cys Asn Gly Gln Ile Gly Tyr Gly Asn Thr Pro340 345 350

<210> 227<211> 747<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 227

atgggcggca cgactggtag tggcggctca gccgccgccg gcgcaggcac gagtggaagc 60

gcgggcggta ccgccggagc gctcggcccc ggcggtaccc agggcagcgg tggcgcagcc 120

ggtggtacga gcggaacggg cggggccatc agcagcagct gcacggaagc tgacaagacg 180

gtctgcaaca acgaaaccgg tcgccactgc aattacacgt acgagtattg gaaggaccag 240

ggaagcggtt gcctcgtgaa caaagccgac ggcttcagcg tcaactggaa caacatcaac 300

aatctgctgg gtcgcaaggg tctgaggccc ggatcgtcga atcágacggt gacctaccag 360

gcaaactacc agccgaacgg caattcatac ctgtgcgtat atggatggac gcaaaacccc 420

ctcgtcgaat actacatcgt cgatagctgg ggcagctggc gcccgccggg gggaacgtcc 480

atgggcaccg tcaacgcgga cggcggcacc tacgacatct accgcaccca gcgcgtcaac 540

cagccttcca tcgaaggcac caagaccttc tatcaatact ggagcgttcg cactcagaag 600

cgcacgagcg gaacgatcac ggttgccgct cacttcgacg cctgggcgac gaaggggatg 660

aacatgggga gtctgtacga ggtgtcgatg accgtcgagg gctatcaaag cagcgggacc 720

gccgacgtga gcttctcgat gaagtga /4/<210> 228<211> 248<212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<22 0>

<221> SIGNAL<222> (X) .. . (39)<400> 228

Met Gly Gly Thr Thr Gly Ser Gly Gly Ser Ala Ala Ala Gly Ala Gly 1 5 10 15 Thr Ser Gly Ser Ala Gly Gly Thr Ala Gly Ala Leu Gly Pro Gly Gly 20 25 30 Thr Gln Gly 35 Ser Gly Gly Ala Ala 40 Gly Gly Thr Ser Gly 45 Thr Gly Gly Ala Ile 50 Ser Ser Ser Cys Thr 55 Glu Ala Asp Lys Thr 60 Val Cys Asn Asn Glu Thr Gly Arg His Cys Asn Tyr Thr Tyr Glu Tyr Trp Lys Asp Gln 65 70 75 80 Gly Ser Gly Cys Leu 85 Val Asn Lys Ala Asp 90 Gly Phe Ser Val Asn 95 Trp Asn Asn Ile Asn 100 Asn Leu Leu Gly Arg 105 Lys Gly Leu Arg Pro 110 Gly Ser Ser Asn Gln 115 Thr Val Thr Tyr Gln 120 Ala Asn Tyr Gln Pro 125 Asn Gly Asn Ser Tyr Leu Cys Val Tyr Gly Trp Thr Gln Asn Pro Leu Val Glu Tyr130 135 140

Tyr Ile Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Gly Thr Ser145 150 155 160

Met Gly Thr Val Asn Ala Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Thr

165 170 175

Gln Arg Val Asn Gln Pro Ser Ile Glu Gly Thr Lys Thr Phe Tyr Gln

180 185 190

Tyr Trp Ser Val Arg Thr Gln Lys Arg Thr Ser Gly Thr Ile Thr Val

195 200 205

Ala Ala His Phe Asp Ala Trp Ala Thr Lys Gly Met Asn Met Gly Ser

210 215 220

Leu Tyr Glu Val Ser Met Thr Val Glu Gly Tyr Gln Ser Ser Gly Thr225 230 235 240

Ala Asp Val Ser Phe Ser Met Lys245

<210> 229<211> 642<212> DNA<213> Desconhecido<220><223> Obtido para uma amostra ambiental<400> 229

atgtttaagt ttacaaagaa attcttagtt gggttaacgg cagctttgat gagtattagcttgttttcgg caaacgcctc tgcagctaac acagactact ggcaaaattg gactgatgggggcggaacag taaacgctgt caatgggtct ggcgggaatt acagtgtgaa ttggtctaataccgggaatt tcgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaactataatgccg gagtttgggc gccgaatggc aatgcatatt tgactttata tggttggacgcgatcacccc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactggaacgtataaag gtacggttta cagtgatggg ggtacatatg acgtgtacac aactacacgttatgatgcac cttccattga tggcgataaa actactttta cgcagtactg gagtgttcgccagtcgaaga gaccaactgg aagcaacgct acaatcactt tcagcaatca cgttaacgcatggaagagat atgggatgaa tctgggtagt aattggtctt accaagtctt agcgacagagggatatcaaa gtagtggaag ttctaacgta acagtgtggt aa

<210> 230<211> 213<212> PRT<213> Desconhecido<220><220> <221> SIGNAL <222> (1) . . . . (28) <400> 230 Met Phe Lys Phe Thr Lys Lys Phe Leu Val Gly Leu Thr Ala Ala Leu1 5 10 15 Met Ser Ile Ser 20 Leu Phe Ser Ala Asn 25 Ala Ser Ala Ala Asn 30 Thr AspTyr Trp Gln 35 Asn Trp Thr Asp Gly 40 Gly Gly Thr Val Asn 45 Ala Val AsnGly Ser 50 Gly Gly Asn Tyr Ser 55 Val Asn Trp Ser Asn 60 Thr Gly Asn PheVal Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn65 70 75 80Tyr Asn Ala Gly Val 85 Trp Ala Pro Asn Gly 90 Asn Ala Tyr Leu Thr 95 LeuTyr Gly Trp Thr 100 Arg Ser Pro Leu Ile 105 Glu Tyr Tyr Val Val 110 Asp SerTrp Gly Thr 115 Tyr Arg Pro Thr Gly 120 Thr Tyr Lys Gly Thr 125 Val Tyr SerAsp Gly 130 Gly Thr Tyr Asp Val 135 Tyr Thr Thr Thr Arg 140 Tyr Asp Ala ProSer Ile Asp Gly Asp Lys Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg145 150 155 160Gln Ser Lys Arg Pro 165 Thr Gly Ser Asn Ala 170 Thr Ile Thr Phe Ser 175 AsnHis Val Asn Ala Trp Lys Arg Tyr Gly Met Asn Leu Gly Ser Asn Trp

180 185 190Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser

195 200 205

Asn Val Thr Val Trp210

<210> 231<211> 1008<212> DNA<213> Bactéria<400> 231

atgaacctgc tcgtccagcc gaggcgtcgc agacgcggtc cggtcacctt gctcgtcagg

agcgcgtggg ccgtcgcgct ggcggcgctc gccgcgctga tgctgccggg caccgcccag 120

gccgacacgg tcgtcacgac caaccaggag ggcaccaaca acggctacta ctactcgttc 180

tggaccgaca gccagggcac cgtctccatg aacatgggct ccggcggtca gtacagcacctcgtggcgca acaccggcaa cttcgtcgcg ggcaagggct gggccaacgg cggccgccggaccgtgcagt actcgggcag cttcaacccc tccggcaacg cgtacctggc gctctacgga 360

tggacgtcga acccgctcgt cgagtactac atcgtcgaca actggggcac ctaccggccc 420

acgggcgagt acaagggcac cgtcaccagc gacggcggca cctacgacat ctacaagacg 480

acccgcgtca acaagccctc cgtcgagggc acccgcacct tcgaccagta ctggagcgtc 540

cggcaggcga agcggaccgg cggcaccatc acgaccggca accacttcga cgcgtgggcc 600

cgggccggga tgccgctcgg caacttcagc tactacatga tcatggccac cgagggctac 660

cagagcagcg gcagctccag catcaacgtc ggcgggaccg gccgcggcga caacggcggc 720

ggcgacaacg ggggcggtgg cggcgggtgc accgccacgg tgtccgccgg gcagaagtgg 780

ggcgaccggt acaacctcga cgtctccgtc agcggcgcca gcgactggac ggtgacgatgaacgtgccgt ccccggcgaa ggtcctgtcg acctggaacg tcaacgccag ctatcccagtgcgcagacgc tgaccgccag gtcgaacggc agcggcaaca actggggcgc caccatccag 960

gccaacggca actggacctg gcccagcgtg tcctgcagcg cgggctga 1008

<210> 232<211> 335<212> PRT

<213> Bactéria <220> <221> SIGNAL <222> (1)... (41) <400> 232 Met Asn Leu Leu Val Gln Pro Arg Arg Arg Arg Arg Gly Pro Val Thr1 5 10 15 Leu Leu Val Arg Ser Ala Trp Ala Val Ala Leu Ala Ala Leu Ala Ala 20 25 30 Leu Met Leu Pro Gly Thr Ala Gln Ala Asp Thr Val Val Thr Thr Asn 35 40 45 Gln Glu. Gly Thr Asn Asn Gly Tyr Tyr Tyr Ser Phe Trp Thr Asp Ser 50 55 60 Gln Gly Thr Val Ser Met Asn Met Gly Ser Gly Gly Gln Tyr Ser Thr65 70 75 80Ser Trp Arg Asn Thr Gly Asn Phe Val Ala Gly Lys Gly Trp Ala Asn 85 90 95 Gly Gly Arg Arg Thr Val Gln Tyr Ser Gly Ser Phe Asn Pro Ser Gly 100 105 110 Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Ser Asn Pro Leu Val Glu 115 120 125 Tyr Tyr Xle Val Asp Asn Trp Gly Thr Tyr Arg Pro Thr Gly Glu Tyr 130 135 140 Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Lys Thr145 150 155 160Thr Arg Val Asn Lys Pro Ser Val Glu Gly Thr Arg Thr Phe Asp Gln 165 170 175 Tyr Trp Ser Val Arg Gln Ala Lys Arg Thr Gly Gly Thr Ile Thr Thr 180 185 190 Gly Asn His Phe Asp Ala Trp Ala Arg Ala Gly Met Pro Leu Gly Asn 195 200 205 Phe Ser Tyr Tyr Met Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly 210 215 220 Ser Ser Ser Ile Asn Val Gly Gly Thr Gly Arg Gly Asp Asn Gly Gly225 230 235 240Gly Asp Asn Gly Gly Gly Gly Gly Gly Cys Thr Ala Thr Val Ser Ala 245 250 255 Gly Gln Lys Trp Gly Asp Arg Tyr Asn Leu Asp Val Ser Val Ser Gly

60

240300

840900260 265 270

Ala Ser Asp Trp Thr Val Thr Met Asn Val Pro Ser Pro Ala Lys Val

275 280 285

Leu Ser Thr Trp Asn Val Asn Ala Ser Tyr Pro Ser Ala Gln Thr Leu290 295 300

Thr Ala Arg Ser Asn Gly Ser Gly Asn Asn Trp Gly Ala Thr Ile Gln305 310 315 320

Ala Asn Gly Asn Trp Thr Trp Pro Ser Val Ser Cys Ser Ala Gly325 330 335

<210> 233<211> 1071<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 233

atgtctatgt ttttgagtct caaaagagtg gcggcgctcg tctgcgtcgc agggtttggc 60

atttcggcgg cgaacgctca gtgcgtcact tcgagccaga caggaaccaa caacgggttc 120

tatttttcgt tctggaaaga tagtccggga accgtgaatt tctgcaacca gagcggtggc 180

cgctacacat ccaattggag cggtatcaac aactgggtcg gtggcaaggg ttggcagacc 240ggctcgcgaa gggtcgtgag ctactccggt tcgttcaatt cgccgggcaa cgggtatctg 300

accctctatg ggtggaccac caatccgctc atcgagtact acatcgtcga caactggggc 360

tcgtatcgcc cgccgggcgg acaggggttc atgggcacgg tgaccagcga cggcggcacg 420

tacgatgtct accgcacaca gcgcgtcaat caaccctgca tcaccggcag cagttgcacc 480

ttctatcaat actggagcgt gcggcagtcg aagagaacgg gcggcacgat cacgacgggc 540

aatcactttg acgcgtgggc gagttacggc atgaacctgg gcgctcacaa ctaccagatc 600

atggcgaccg agggttatca aagcagcggg agctctgaca tcacggtcag tgaaggcagc 660

agcagtagca gcagtagcag cagttcgagc agtagctcga gcagcagctc cagcagcagc 720

agcggcggcg gtggcaccaa gagcttcacg gtccgcgcgc gcggcgtggc cggcggggaa 780

tccatcacgt tgcgcgtgaa caatcagaac gtgcagacct ggactctcgg caccggcatg 840cagaactaca cggcgtcgac gtctttgagt ggcggcatca cggttgcgta taccaacgat 900

ggcggcagtc gcgacgtgca ggttgactac atcatcgtga acggccagac gcgtcagtcg 960

gaagcgcaga gctacaacac cgggctttat gccaacggcc gttgcggtgg cggcggcaac 1020agcgaatgga tgcattgcaa tggcgccatt ggctacggga acacgccgta g 1071

<210> 234

<211> 356<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(2 6)<400> 234

Met Ser Met Phe Leu Ser Leu Lys Arg Val Ala Ala Leu Val Cys Val1 5 10 15 Ala Gly Phe Gly 20 Ile Ser Ala Ala Asn 25 Ala Gln Cys Val Thr 30 Ser SerGln Thr Gly 35 Thr Asn Asn Gly Phe 40 Tyr Phe Ser Phe Trp 45 Lys Asp SerPro Gly 50 Thr Val Asn Phe Cys 55 Asn Gln Ser Gly Gly 60 Arg Tyr Thr SerAsn Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr65 70 75 80Gly Ser Arg Arg Val 85 Val Ser Tyr Ser Gly 90 Ser Phe Asn Ser Pro 95 GlyAsn Gly Tyr Leu 100 Thr Leu Tyr Gly Trp 105 Thr Thr Asn Pro Leu 110 Ile GluTyr Tyr Ile 115 Val Asp Asn Trp Gly 120 Ser Tyr Arg Pro Pro 125 Gly Gly GlnGly Phe 130 Met Gly Thr Val Thr 135 Ser Asp Gly Gly Thr 140 Tyr Asp Val TyrArg Thr Gln Arg Val Asn Gln Pro Cys Ile Thr Gly Ser Ser Cys Thr145 150 155 160Phe Tyr Gln Tyr Trp 165 Ser Val Arg Gln Ser 170 Lys Arg Thr Gly Gly 175 ThrIle Thr Thr Gly Asn His Phe Asp Ala Trp Ala Ser Tyr Gly Met Asn180 185 190 Leu Gly Ala 195 His Asn Tyr Gln Ile 200 Met Ala Thr Glu Gly 205 Tyr Gln SerSer Gly 210 Ser Ser Asp Ile Thr 215 Val Ser Glu Gly Ser 220 Ser Ser Ser SerSer Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser225 230 235 240Ser Gly Gly Gly Gly 245 Thr Lys Ser Phe Thr 250 Val Arg Ala Arg Gly 255 ValAla Gly Gly Glu 260 Ser Ile Thr Leu Arg 265 Val Asn Asn Gln Asn 270 Val GlnThr Trp Thr 275 Leu Gly Thr Gly Met 280 Gln Asn Tyr Thr Ala 285 Ser Thr SerLeu Ser 290 Gly Gly Ile Thr Val 295 Ala Tyr Thr Asn Asp 300 Gly Gly Ser ArgAsp Val Gln Val Asp Tyr Ile Ile Val Asn Gly Gln Thr Arg Gln Ser

305 310 315 320

Glu Ala Gln Ser Tyr Asn Thr Gly Leu Tyr Ala Asn Gly Arg Cys Gly

325 330 335

Gly Gly Gly Asn Ser Glu Trp Met His Cys Asn Gly Ala Ile Gly Tyr

340 345 350

Gly Asn Thr Pro

355<210> 235<211> 1539<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 235

atgtcgaata acagatttgt gctgaatcgt gttgctgcag gtttgctgct gggtttctcgctgctgtcat cagcagccat cgcccagaat gtggtggtaa atccttctac ggtccatcagaccgtgcgcg gctttggcgg catgaacgcg ccgggctgga ttgatgacct taccaccgcccaggtcaata aggcctatgg cagtggcgat ggccaggtcg ggctctccat catgcgcatgcgcattgatc cgaactcggc agcctggaat atccaggtgc cggctgccaa gcgggccaaggagctgggtg cgatcctgtt tgccacgccc tggtcgccgc ccgcctacat gaaatccaacaaaagcctga ataacggcgg caagctgctg cccgagtatt acagcgccta caccacccacctgctggatt ttgcgagttt catgtcgcgc aacggcgcac cgctgtatgc gatttcaatccagaacgaac cggactggct gccggattat gagtcgtgtg cctggactgg tactgatttcgtcaattatc tgaataccca gggctcgcgt tttggtgatc tgaaagtgat tgcgccggaatccctgggtt tcacgacctc gtattccgac cccatcctca acagcgccac ggcagcgccgcatgtcgaca tcatcggcgg ccacctctac ggcgtgctgc ccaaggacta cccgctggcgcgccagaagg gcaaggaaat ctggatgacc gagcattaca ccgagagcaa gaactcgggtgatgcctggc cgctggcgct ggacgtaggc accgagctgc accagagcat ggtggccaactacaacgcct acgtgtggtg gtatgtgcgc cgcagctacg gcctgctgct ggagaacggcaatgtgagca agcgcggcta catcatgtcg cagtacgcac gcttcgtccg ccccggctccaagcgcatcg gcgcgacgga aaagccgcac gccgacgtgg cggtgacggc ctacaagacgccggataacc gcattgtgct ggtggcggtg aataccggtg cggcgcaccg tcagctgaacatcacggtgc cgagcggcag cgtgggttct ttcagcaagt tctccacttc cggcacgctgaatgtgggca gtggtggcag ctacaaggtc aacaacggcg cggtgagcct gtacatcgatccgcagagcg tggccacgct ggtgggtgat ctgcccggca cggcctccag ctcttcggcggcgtcctcgt cctcttccag tgcagccagc tctgcttcga gcagtgctag cggcgcaccggccctgtctg gcagcagcga ttaccccacg ggcttcagca agtgcgctga tctgggtggtacttgtgccg tgccttcggg ctcgggctgg acggctttcg ggcgcaaggg caagtgggttgccaagtacg tcggtgtggg caagagcatt gcctgcacgg tgacggcttt cggcagcgatcccggtggtg cacccaacaa gtgttcttac cagaagtaa<210> 236<211> 512<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (28)<400> 236

Met Ser Asn Asn Arg Phe Val Leu Asn Arg Val Ala Ala Gly Leu Leu1 5 10 15 Leu Gly Phe Ser Leu Leu Ser Ser Ala Ala Ile Ala Gln Asn Val Val 20 25 30 Val Asn Pro Ser Thr Val His Gln Thr Val Arg Gly Phe Gly Gly Met 35 40 45 Asn Ala Pro Gly Trp Ile Asp Asp Leu Thr Thr Ala Gln Val Asn Lys 50 55 60 Ala Tyr Gly Ser Gly Asp Gly Gln Val Gly Leu Ser Ile Met Arg Met65 70 75 80Arg Ile Asp Pro Asn Ser Ala Ala Trp Asn Ile Gln Val Pro Ala Ala 85 90 95 Lys Arg Ala Lys Glu Leu Gly Ala Ile Leu Phe Ala Thr Pro Trp Ser 100 105 110 Pro Pro Ala Tyr Met Lys Ser Asn Lys Ser Leu Asn Asn Gly Gly Lys 115 120 125 Leu Leu Pro Glu Tyr Tyr Ser Ala Tyr Thr Thr His Leu Leu Asp Phe 130 135 140 Ala Ser Phe Met Ser Arg Asn Gly Ala Pro Leu Tyr Ala Ile Ser Ile145 150 155 160Gln Asn Glu Pro Asp Trp Leu Pro Asp Tyr Glu Ser Cys Ala Trp Thr 165 170 175 Gly Thr Asp Phe Val Asn Tyr Leu Asn Thr Gln Gly Ser Arg Phe Gly 180 185 190 Asp Leu Lys Val Ile Ala Pro Glu Ser Leu Gly Phe Thr Thr Ser Tyr 195 200 205 Ser Asp Pro Ile Leu Asn Ser Ala Thr Ala Ala Pro His Val Asp Ile 210 215 220 Ile Gly Gly His Leu Tyr Gly Val Leu Pro Lys Asp Tyr Pro Leu Ala225 230 235 240Arg Gln Lys Gly Lys Glu Ile Trp Met Thr Glu His Tyr Thr Glu Ser 245 250 255 Lys Asn Ser Gly Asp Ala Trp Pro Leu Ala Leu Asp Val Gly Thr Glu 260 265 270 Leu His Gln Ser Met Val Ala Asn Tyr Asn Ala Tyr Val Trp Trp Tyr 275 280 285 Val Arg Arg Ser Tyr Gly Leu Leu Leu Glu Asn Gly Asn Val Ser Lys 290 295 300 Arg Gly Tyr Ile Met Ser Gln Tyr Ala Arg Phe Val Arg Pro Gly Ser305 310 315 320Lys Arg Ile Gly Ala Thr Glu Lys Pro His Ala Asp Val Ala Val Thr 325 330 335 Ala Tyr Lys Thr Pro Asp Asn Arg Ile Val Leu Val Ala Val Asn Thr 340 345 350 Gly Ala Ala His Arg Gln Leu Asn Ile Thr Val Pro Ser Gly Ser Val 355 360 365 Gly Ser Phe Ser Lys Phe Ser Thr Ser Gly Thr Leu Asn Val Gly Ser 370 375 380 Gly Gly Ser Tyr Lys Val Asn Asn Gly Ala Val Ser Leu Tyr Ile Asp385 390 395 400Pro Gln Ser Val Ala Thr Leu Val Gly Asp Leu Pro Gly Thr Ala Ser 405 410 415 Ser Ser Ser Ala Ala Ser Ser Ser Ser Ser Ser Ala Ala Ser Ser Ala 420 425 430 Ser Ser Ser Ala Ser Gly Ala Pro Ala Leu Ser Gly Ser Ser Asp Tyr 435 440 445 Pro Thr Gly Phe Ser Lys Cys Ala Asp Leu Gly Gly Thr Cys Ala Val 450 455 460 Pro Ser Gly Ser Gly Trp Thr Ala Phe Gly Arg Lys Gly Lys Trp Val465 470 475 480Ala Lys Tyr Val Gly Val Gly Lys Ser Ile Ala Cys Thr Val Thr Ala 485 490 495 Phe Gly Ser Asp Pro Gly Gly Ala Pro Asn Lys Cys Ser Tyr Gln Lys 500 505 510

<210> 237<211> 1269<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 237

atgattccac gcataaaaaa aacaatttgt gtactattag tatgtttcac tatgctgtcagtcatgttag ggccaggcgc tactgaagtt ttggcagcaa gtgatgtaac agttaatgtatctgcagaga aacaagtgat tcgcggtttt ggagggatga atcatccggc ttgggctggggatcttacag cagctcaaag agaaactgct tttggcaatg gacagaacca gttaggattttcaatcttaa gaattcatgt agatgaaaat cgaaataatt ggtataaaga ggtggagactgcaaagagtg cggtcaaaca cggagcaatc gtttttgctt ctccttggaa tcctccaagtgatatggttg agacctttaa tcggaatggt gacacatcgg ctaaacggct gaaatacaacaagtacgcag catacgcgca gcatcttaac gattttgtta ccttcatgaa gaataatggtgtgaatcttt acgcgatttc ggtccaaaac gagcctgatt acgctcacga gtggacgtggtggacgccgc aagaaatact tcgctttatg agagaaaacg ccggctcgat caatgcccgcgtcattgcgc ctgagtcatt tcaatacttg aagaatttgt cggacccgat cttgaacgatccgcaggctc ttgccaatat ggatattctc ggaactcacc tgtacggcac ccaggtcagccaattccctt atcctctttt caaacaaaaa ggagcgggga aggacctttg gatgacggaagtatactatc caaacagtga taccaactcg gcggatcgat ggcctgaggc attggatgtttcacagcata ttcacaatgc gatggtagag ggggactttc aagcttatgt atggtggtacatccgaagat catatggacc tatgaaagaa gatggtacga tcagcaaacg cggctacaatatggctcatt tctcaaagtt tgtgcgtccc ggctatgtaa ggattgatgc aacgaaaaaccctaatgcga acgtttacgt gtcagcctat aaaggtgaca acaaggtcgt tattgttgccatcaataaaa gcaacacagg agtcaaccaa aactttgttt tgcagaatgg atctgcttcaaacgtatcta gatggatcac gagcagcagc agcaatctac aacctggaac gaatctcactgtatcaggca atcatttttg ggctcatctt ccagctcaaa gcgtgacaac atttgttgtaaatcgttaa<210> 238<211> 422<212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(32)<400> 238

Met Ile Pro Arg Ile Lys Lys Thr Ile Cys Val Leu Leu Val Cys Phe

15 10 15

Thr Met Leu Ser Val Met Leu Gly Pro Gly Ala Thr Glu Val Leu Ala20 25 30

Ala Ser Asp Val Thr Val Asn Val Ser Ala Glu Lys Gln Val Ile Arg35 40 45

Gly Phe Gly Gly Met Asn His Pro Ala Trp Ala Gly Asp Leu Thr Ala

50 55 60

Ala Gln Arg Glu Thr Ala Phe Gly Asn Gly Gln Asn Gln Leu Gly Phe

65 70 75 80

Ser Ile Leu Arg Ile His Val Asp Glu Asn Arg Asn Asn Trp Tyr Lys

85 90 95

Glu Val Glu Thr Ala Lys Ser Ala Val Lys His Gly Ala Ile Val Phe100 105 HO

Ala Ser Pro Trp Asn Pro Pro Ser Asp Met Val Glu Thr Phe Asn Arg115 120 125

Asn Gly Asp Thr Ser Ala Lys Arg Leu Lys Tyr Asn Lys Tyr Ala Ala

130 135 140

Tyr Ala Gln His Leu Asn Asp Phe Val Thr Phe Met Lys Asn Asn Gly145 150 155 160

Val Asn Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp Tyr Ala His

165 170 175

Glu Trp Thr Trp Trp Thr Pro Gln Glu Ile Leu Arg Phe Met Arg Glu180 185 190

Asn Ala Gly Ser Ile Asn Ala Arg Val Ile Ala Pro Glu Ser Phe Gln195 200 205

Tyr Leu Lys Asn Leu Ser Asp Pro Ile Leu Asn Asp Pro Gln Ala Leu

210 215 220

Ala Asn Met Asp Ile Leu Gly Thr His Leu Tyr Gly Thr Gln Val Ser225 230 235 240

Gln Phe Pro Tyr Pro Leu Phe Lys Gln Lys Gly Ala Gly Lys Asp Leu245 250 255Trp Met Thr Glu Val Tyr Tyr Pro Asn Ser Asp Thr Asn Ser Ala Asp

260 265 270

Arg Trp Pro Glu Ala Leu Asp Val Ser Gln His Ile His Asn Ala Met

275 280 285

Val Glu Gly Asp Phe Gln Ala Tyr Val Trp Trp Tyr Ile Arg Arg Ser

290 295 300

Tyr Gly Pro Met Lys Glu Asp Gly Thr Ile Ser Lys Arg Gly Tyr Asn305 310 315 320Met Ala His Phe Ser 325 Lys Phe Val Arg Pro 330 Gly Tyr Val Arg Ile 335 AspAla Thr Lys Asn 340 Pro Asn Ala Asn Val 345 Tyr Val Ser Ala Tyr 350 Lys GlyAsp Asn Lys 355 Val Val Ile Val Ala 360 Ile Asn Lys Ser Asn 365 Thr Gly ValAsn Gln 370 Asn Phe Val Leu Gln 375 Asn Gly Ser Ala Ser 380 Asn Val Ser ArgTrp Ile Thr Ser Ser Ser Ser Asn Leu Gln Pro Gly Thr Asn Leu Thr385 390 395 400Val Ser Gly Asn His Phe Trp Ala His Leu Pro Ala Gln Ser Val Thr 405 410 415 Thr Phe Val Val 420 Asn Arg <210> 239 <211> 1281

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 239

atgaatcgtt tcttgatttc acgttataag aaagccataa gtgcatgttt ggcccttgtccttgcgttgt ctctcatggc ggcacctggc gatgttgccg cagccagcga cgccgttataaatgtatcgt cggagaaaca agtgatacgc ggtttcggag gcatcaacca cccggcatggatcggagatt tgacggcagc acagagagaa accgcatttg ggaacgggcc aaatcagttaggcttctcga tattaagaat ctacgtgcat gaagaccgaa atcagtggca ccgtgaactggatacggcca aacgagcgat tgcccttgga gctatcgtat tcgcttcgcc atggaatccgcccgccgaca tggtcgagac cttcaaccgc aacggcgata cgtcggcaaa gcgacttcgttacgacaagt ataccgccta tgcccagcat cttaacgatt tcgtaaccta catgagaaacaatggcgtga atctctacgc gatttccgtc cagaacgagc ccgattatgc gcatgactggacgtggtgga ctccgcagga aatgcttcgc tttatgaaag aaaatgccgg atcgatcaacagcagagtga tcgcaccgga atcgttccaa tatctgaaaa atatgtcgga cccgattctaaatgatcccc aggcgcttgc caatatggat attcttggcg ctcatctgta cggtacccaagttagcaatt tcgcgtatcc actattcaaa caaaaaggag cgggaaaaga cctctggatgaccgaggtgt attacccgaa cagcgacaac aactcggcgg atcgctggcc cgaagccctggatgtgtctt accatatcca caatgcgatg gtagagggag attttcaagc ttatgtatggtggtatatcc gcagatccta tggtccaatg aaagaggacg gcacgatcag caaacgcggctacaatatgg ctcatttctc caagtttgtc cgtcccggct atgtcagggt ggatgcttcgaaaaatccag aaacgaacgt ttacgtatcc gcatataaag gcgacaacaa aatcgttatcgttgccataa accggaacaa ctccggggtc aatcagaact ttgtccttca gaatggatccgtttcgcagg tatcaaggtg gatcacgagc agcagcagca atctccagcc aggaacgtctctcaatgtaa cagggagcaa tttctgggct catcttcccg cgcaaagcgt tacgacttttgtgggtgaac tcggaaggta a<210> 240<211> 426<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ...(30)<400> 240

Met Asn Arg Phe Leu Ile Ser Arg Tyr Lys Lys Ala Ile Ser Ala Cys

15 10 15

Leu Ala Leu Val Leu Ala Leu Ser Leu Met Ala Ala Pro Gly Asp Val

20 25 30

Ala Ala Ala Ser Asp Ala Val Ile Asn Val Ser Ser Glu Lys Gln Val35 40 45Ile Arg Gly Phe Gly Gly Ile Asn His Pro Ala Trp Ile Gly Asp Leu 50 55 60 Thr Ala Ala Gln Arg Glu Thr Ala Phe Gly Asn Gly Pro Asn Gln Leu65 70 75 80Gly Phe Ser Ile Leu Arg Ile Tyr Val His Glu Asp Arg Asn Gln Trp 85 90 95 His Arg Glu Leu Asp Thr Ala Lys Arg Ala Ile Ala Leu Gly Ala Ile 100 105 110 Val Phe Ala 115 Ser Pro Trp Asn Pro 120 Pro Ala Asp Met Val 125 Glu Thr PheAsn Arg 130 Asn Gly Asp Thr Ser 135 Ala Lys Arg Leu Arg 140 Tyr Asp Lys TyrThr Ala Tyr Ala Gln His Leu Asn Asp Phe Val Thr Tyr Met Arg Asn145 150 155 160Asn Gly Val Asn Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp Tyr 165 170 175 Ala His Asp Trp 180 Thr Trp Trp Thr Pro 185 Gln Glu Met Leu Arg 190 Phe MetLys Glu Asn Ala Gly Ser Ile Asn Ser Arg Val Ile Ala Pro Glu Ser 195 200 205 Phe Gln Tyr Leu Lys Asn Met Ser Asp Pro Ile Leu Asn Asp Pro Gln 210 215 220 Ala Leu Ala Asn Met Asp Ile Leu Gly Ala His Leu Tyr Gly Thr Gln225 230 235 240Val Ser Asn Phe Ala 245 Tyr Pro Leu Phe Lys 250 Gln Lys Gly Ala Gly 255 LysAsp Leu Trp Met Thr Glu Val Tyr Tyr Pro Asn Ser Asp Asn Asn Ser 260 265 270 Ala Asp Arg 275 Trp Pro Glu Ala Leu 280 Asp Val Ser Tyr His 285 Ile His AsnAla Met Val Glu Gly Asp Phe Gln Ala Tyr Val Trp Trp Tyr Ile Arg 290 295 300 Arg Ser Tyr Gly Pro Met Lys Glu Asp Gly Thr Ile Ser Lys Arg Gly305 310 315 320Tyr Asn Met Ala His Phe Ser Lys Phe Val Arg Pro Gly Tyr Val Arg 325 330 335 Val Asp Ala Ser Lys Asn Pro Glu Thr Asn Val Tyr Val Ser Ala Tyr 340 345 350 Lys Gly Asp Asn Lys Ile Val Ile Val Ala Ile Asn Arg Asn Asn Ser 355 360 365 Gly Val Asn Gln Asn Phe Val Leu Gln Asn Gly Ser Val Ser Gln Val 370 375 380 Ser Arg Trp Ile Thr Ser Ser Ser Ser Asn Leu Gln Pro Gly Thr Ser385 390 395 400Leu Asn Val Thr Gly 405 Ser Asn Phe Trp Ala 410 His Leu Pro Ala Gln 415 SerVal Thr Thr Phe Val Gly Glu Leu Gly Arg

420 425

<210> 241

<211> 1695

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 241

gtgaagatat tgaaatttaa gatgaattta aaaaaatcgg ttcatgttct gttggcctgt

ttaacagccc tgcctctcat gttaacgccg acacacgtat cagcagcaag tgatgccaac

attaatttgt cctccgaaaa acagcttatc aaggggtttg gaggtattaa ccacccagcc

tggattggcg acttgacggc agctcagcgt gaaacagcct ttggcaacgg agcgaaccag

cttggttttt ccatactaag aatctatgtc gatgaaaatc caaacaactg gtacagggag

gtggctactg ccaaaagagc catagagcaa ggtgccatcg tattcgcttc tccctggaat

ccaccaagtg acatggtcga aaccttcaat cggaacgggg atacgaacgc caaacgattg

agatacgaca aatatgctgc gtacgcgcag catctgaacg actttgtcag ttatatgaaa

aataacggtg tggatctgta tgccatttcg gtacaaaatg agccggatta tgcccatgaa

tggacctggt ggactccgca ggagatcctt cgtttcatga aggagaatgc gggatccatt

cagaatacca aagtcatggc acctgaatcg ttccagtatt tgaaaaacat gtctgacccg

attctgaatg atcctcaggc actcgccaat atggacattc tgggagctca tacgtacgggacacagttca aagatttcgc atacccgctc tttaagcaaa agggagccggtggatgacag aagtgtatta cccgaacagc gataacaact cgtcggaccggcattggacg tatcttacca tatgcataat gccatggttg aaggagatttgtatggtggt atattcggag acagtacggt ccgatgaatg agaacgggaccgtggttaca atatggccca tttctccaaa tttgtgcgac caggctattagcaaccaaaa atccggatac caataccttc gtctcagcct ataaaggtgagtcattgtgg cgattaatcg cggcacctcg gctgtaagcc aaaaattcgtggtaacgctt ctactgtatc ctcttgggtt acggatagca gccgaaacctgcgccgatta cgatgtcagg tggagccttt acagcacaac tgccagcccaacgtttgtag ccaacattac tggtggtagt gtcactccag gcagcggaacgcggaaacgg gcactacact taccgatgcc gtgatcgaga ctctctacccgggaccggat acgtgaactt taatgcgtat actggttcgg ccattcaatgaataacacga taacaggtac caaaaatgtg aaatttcgtt acgcccaggacgtaatctcg acattttcgt taacggaact aaagtcatca gcaacgaaccacaggcagct ggtcgacctg gagtgaaaaa actattcagg tccccatgaaaatacgatta aagtggtcac aaccggtaca gaagggccaa atattgataaactgcagtcc aataa<210> 242<211> 564<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220><221> SIGNAL

<222> (1)...(28)<400> 242

Val Lys Ile Leu Lys Phe Lys Met Asn Leu Lys1 5 10

Leu Leu Ala Cys Leu Thr Ala Leu Pro Leu Met20 25

Val Ser Ala Ala Ser Asp Ala Asn Ile Asn Leu

35 40

Leu Ile Lys Gly Phe Gly Gly Ile Asn His Pro50 55

Leu Thr Ala Ala Gln Arg Glu Thr Ala Phe Gly65 70 75

Leu Gly Phe Ser Ile Leu Arg Ile Tyr Val Asp85 90

Trp Tyr Arg Glu Val Ala Thr Ala Lys Arg Ala100 105

Ile Val Phe Ala Ser Pro Trp Asn Pro Pro Ser

115 120

Phe Asn Arg Asn Gly Asp Thr Asn Ala Lys Arg

130 135

Tyr Ala Ala Tyr Ala Gln His Leu Asn Asp Phe145 150 155

Asn Asn Gly Val Asp Leu Tyr Ala Ile Ser Val165 170

Tyr Ala His Glu Trp Thr Trp Trp Thr Pro Gln180 185

Met Lys Glu Asn Ala Gly Ser Ile Gln Asn Thr

195 200

Glu Ser Phe Gln Tyr Leu Lys Asn Met Ser Asp

210 215

Pro Gln Ala Leu Ala Asn Met Asp Ile Leu Gly Ala His

225 230 235

Thr Gln Phe Lys Asp Phe Ala Tyr Pro Leu Phe Lys Gln

245 250

Gly Lys Glu Leu Trp Met Thr Glu Val Tyr Tyr Pro Asn

260 265

Asn Ser Ser Asp Arg Trp Pro Glu Ala Leu Asp Val Ser

275 280 285

His Asn Ala Met Val Glu Gly Asp Phe Gln Ala Tyr Val

290 295 300

Ile Arg Arg Gln Tyr Gly Pro Met Asn Glu Asn Gly Thr

305 310 315

caaagaactgttggcctgagtcaggcttactattagcaaaccgtgtcgattaataaggcatcttcagaatggcaagcggaaagcgtaacacacgtacgaggggatacactgaatgccatcaagcggaacgtttcccggcacgcgggaacccatcaatgtc

Lys Ser Val

Leu Thr Pro30

Ser Ser Glu45

Ala Trp Ile60

Asn Gly Ala

Glu Asn Pro

Ile Glu Gln110

Asp Met Val

125Leu Arg Tyr140

Val Ser Tyr

Gln Asn Glu

Glu Ile Leu190

Lys Val Met

205Pro Ile Leu220

His Val15

Thr His

Lys Gln

Gly Asp

Asn Gln80

Asn Asn95

Gly Ala

Glu Thr

Asp Lys

Met Lys160Pro Asp175

Arg PheAla ProAsn Asp

Thr Tyr Gly 240Lys Gly Ala 255 Ser Asp Asn270 Tyr His MetTrp Trp TyrIle Ser Lys 320

7808409009601020108011401200126013201380144015001560162016801695Arg Gly Tyr Asn Met Ala His Phe Ser Lys Phe Val Arg Pro Gly Tyr

325 330 335

Tyr Arg Val Asp Ala Thr Lys Asn Pro Asp Thr Asn Thr Phe Val Ser

340 345 350

Ala Tyr Lys Gly Asp Asn Lys Ala Val Ile Val Ala Ile Asn Arg Gly

355 360 365

Thr Ser Ala Val Ser Gln Lys Phe Val Leu Gln Asn Gly Asn Ala Ser

370 375 380

Thr Val Ser Ser Trp Val Thr Asp Ser Ser Arg Asn Leu Ala Ser Gly385 390 395 400

Ala Pro Ile Thr Met Ser Gly Gly Ala Phe Thr Ala Gln Leu Pro Ala

405 410 415

Gln Ser Val Thr Thr Phe Val Ala Asn Ile Thr Gly Gly Ser Val Thr

420 425 430

Pro Gly Ser Gly Thr Thr Tyr Glu Ala Glu Thr Gly Thr Thr Leu Thr

435 440 445

Asp Ala Val Ile Glu Thr Leu Tyr Pro Gly Tyr Thr Gly Thr Gly Tyr

450 455 460

Val Asn Phe Asn Ala Tyr Thr Gly Ser Ala Ile Gln Trp Asn Ala Ile465 470 475 480

Asn Asn Thr Ile Thr Gly Thr Lys Asn Vai Lys Phe Arg Tyr Ala Gln

485 490 495

Glu Ser Gly Thr Arg Asn Leu Asp Ile Phe Val Asn Gly Thr Lys Val

500 505 510

Ile Ser Asn Glu Pro Phe Pro Ala Thr Gly Ser Trp Ser Thr Trp Ser

515 520 525

Glu Lys Thr Ile Gln Val Pro Met Asn Ala Gly Thr Asn Thr Ile Lys

530 535 540

Val Val Thr Thr Gly Thr Glu Gly Pro Asn Ile Asp Asn Ile Asn Val545 550 555 560

Thr Ala Val Gln<210> 243<211> 1272<212> DNA<213> Desconhecido<220><223> Obtido para uma amostra ambiental<400> 243

atgatttcaa gcgtaaaaaa accaatttgt gtattattgg tatgtttcac tatgctgtcagtcatgttag ccgggccagg tgctactgaa gttttagcag caagtgatgt aacaattaatttatctgcag aaaaacaagt gatccgcggt tttggaggca tgaaccaccc ggcttggattggagatttga cagcagctca aagagaaacc gcttttggca atggacagaa tcagttaggtttttcaatct taagaattca tgtggatgaa aatagaaata attggtacag agaagtggagactgcaaaga gtgcgatcaa acatggagca atcgtttttg cttctccctg gaatcctccaagcgatatgg ttgagacttt caatcgtaat ggtgacacat cagctaaacg gctaagatacgataagtacg ccgcatacgc gcagcatctt aacgattttg ttacctacat gaagaataatggcgtgaatc tttatgcgat ttctgttcaa aacgagcctg attatgcgca cgaatggacgtggtggactc cgcaagaaat acttcgtttc atgagagaaa atgccggttc cattaatgcacgtgtcattg caccagaatc ttttcagtac tttaaaaata tatcggaccc cattttgaacgatccacagg cgcttaggaa tatggatatt ctcggaactc acctgtacgg tactcaggtcagtcagtttc cttatcctct attcaaacaa aaaggagcag ggaaagagct atggatgacggaagtatact atccaaacag tgacaacaat tcagcggatc gctggcccga ggcattaggcgtttcagagc atattcacca ttcaatggtg gagggagatt ttcaatctta tgtttggtggtacatccgca gatcttacgg tcctatgaaa gaggacggta cgatcagcaa acgcggttacaatatggctc atttctcgaa gtttgtgcgt cccggctatg taagggtaga tgcaacgaaaaatcctaatg cgaacgttta cgtgtcagcc tataaaggtg acaacaaggt cgttattgttgccattaaca aaagcáatac aggggtcaac caaaactttg tgttgcagaa tggatctgcttctcaggtat ctaggtggat aacaagcgga agcagcaatc ttcaacctgg aacgaatctcaatgtaacgg gcaatcattt ttgggcccat cttccagctc aaagcgtgac aacatttgtcgcaaatcgtt aa

<210> 244423PRT

Des conhec ido

60120180240300360420480540600660720780840900960102010801140120012601272

<211><212><213><220><223><220>

Obtido para uma amostra ambiental<221> SIGNAL<222> (1)...(33)<400> 244

Met Ile Ser Ser Val Lys Lys Pro Ile Cys Val Leu Leu Val Cys Phe

15 10 15

Thr Met Leu Ser Val Met Leu Ala Gly Pro Gly Ala Thr Glu Val Leu

20 25 30

Ala Ala Ser Asp Val Thr Ile Asn Leu Ser Ala Glu Lys Gln Val Ile

35 40 45

Arg Gly Phe Gly Gly Met Asn His Pro Ala Trp Ile Gly Asp Leu Thr

50 55 60

Ala Ala Gln Arg Glu Thr Ala Phe Gly Asn Gly Gln Asn Gln Leu Gly65 70 75 80

Phe Ser Ile Leu Arg Ile His Val Asp Glu Asn Arg Asn Asn Trp Tyr

85 90 95

Arg Glu Val Glu Thr Ala Lys Ser Ala Ile Lys His Gly Ala Ile Val

100 105 110

Phe Ala Ser Pro Trp Asn Pro Pro Ser Asp Met Val Glu Thr Phe Asn

115 120 125

Arg Asn Gly Asp Thr Ser Ala Lys Arg Leu Arg Tyr Asp Lys Tyr Ala

130 135 140

Ala Tyr Ala Gln His Leu Asn Asp Phe Val Thr Tyr Met Lys Asn Asn145 150 155 160

Gly Val Asn Leu Tyr Ala Ile Ser Val Gln Asn Glu Pro Asp Tyr Ala

165 170 175

His Glu Trp Thr Trp Trp Thr Pro Gln Glu Ile Leu Arg Phe Met Arg

180 185 190

Glu Asn Ala Gly Ser Ile Asn Ala Arg Val Ile Ala Pro Glu Ser Phe

195 200 205

Gln Tyr Phe Lys Asn Ile Ser Asp Pro Ile Leu Asn Asp Pro Gln Ala

210 215 220

Leu Arg Asn Met Asp Ile Leu Gly Thr His Leu Tyr Gly Thr Gln Val225 230 235 240

Ser Gln Phe Pro Tyr Pro Leu Phe Lys Gln Lys Gly Ala Gly Lys Glu

245 250 255

Leu Trp Met Thr Glu Val Tyr Tyr Pro Asn Ser Asp Asn Asn Ser Ala

260 265 270

Asp Arg Trp Pro Glu Ala Leu Gly Val Ser Glu His Ile His His Ser

275 280 285

Met Val Glu Gly Asp Phe Gln Ser Tyr Val Trp Trp Tyr Ile Arg Arg

290 295 300

Ser Tyr Gly Pro Met Lys Glu Asp Gly Thr Ile Ser Lys Arg Gly Tyr305 310 315 320

Asn Met Ala His Phe Ser Lys Phe Val Arg Pro Gly Tyr Val Arg Val

325 330 335

Asp Ala Thr Lys Asn Pro Asn Ala Asn Val Tyr Val Ser Ala Tyr Lys

340 345 350

Gly Asp Asn Lys Val Val Ile Val Ala Ile Asn Lys Ser Asn Thr Gly

355 360 365

Val Asn Gln Asn Phe Val Leu Gln Asn Gly Ser Ala Ser Gln Val Ser

370 375 380

Arg Trp Ile Thr Ser Gly Ser Ser Asn Leu Gln Pro Gly Thr Asn Leu385 390 395 400

Asn Val Thr Gly Asn His Phe Trp Ala His Leu Pro Alá Gln Ser Val

405 410 415

Thr Thr Phe Val Ala Asn Arg420

<210> 245

<211> 1263

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 245

atgtcaatga tcaaaaaacc aatctgcact ttattgatct gcttcaccat gctgtctgtc 60

atgttcatcg gacctggcgt gactgaggtt tcagcagcag atgccaatat taatatcaat 120

gcggaaagac aagtgattcg cggctttggc ggaatgaacc atccggcttg gattggtgat 180ttgaccgcac ctcaaaggga aaccgccttt ggcaatgggcattctaagaa tttttgtaga tgagaaccga aataattggcaaaagagcaa tagagcatgg agctttggtg atcgcttcacatggtagaga ccttcaaccg gaatggtaca tctgcaaagcgccgcatatg ctcagcatct gaacgatttt gtgacgtatactctatgcta tatctgtaca aaatgagccc gattatgcaccctcaggaaa tcctgcgttt catgagagaa aatgctggctgcaccagaat cctttcaata ccttaaaaat atatcagatcgcgcttggaa acatggacat tctcggagcc catttgtacgccgtatcctc ttttcaaaca aaagggaggg ggaaaggagctacccgaata gcgataacaa ttcagcggac cgctggcctgcatattcacc attcgatggt agaaggggac tttcaggcatagatcctacg gccctatgaa agaagacggt ctaatcagcacatttctcca agtttgtacg cccaggatac atcagaattgccgaatgttt tcgtatcagc ctataaagga aacaatcaagaaaaacaata caggagtcaa tcagcacttt gtgatgcaaatcaagatgga tcacaagtag caacagcaac cttcagcctgggtaatcaat tttgggctca tctcccggct caaagtgtgatag

<210> 246<211> 401<212> PRT

<213> Desconhecido<22 0>

<223> Obtido para uma amostra ambiental<220><221><222>

agaatcaattacagagaggtcatggaatccggctcagatatgaaaaataaacgaatggacccattaatgcctatcctaaagaacccaaattttggatgacaagcattaggatgtttggtgaacgtggttaatgcaacgaatcgtcattgtacggaactgcgtacagacttcaacatttgt

aggattttcccgctactgcctccaagcaatcaaccaatactggcgtcaatatggtggactccgcgtgatccgatccgcagcagccagcttagaggtctacggtttcagaggtacattcgccaacatggcgaagtcctgaacgcgattaacttcacaagcgaaatatatcaggtcaaacgc

SIGNAL(1)...(32)<400> 246

Met Ser Met Ile Lys Lys Pro Ile Cys Thr Leu

1 5

Met Leu Ser Val Met Phe20

10

Ile Gly Pro Gly Val25

Leu IleThr Glu

Ala Asp Ala Asn Ile Asn Ile Asn Ala Glu Arg Gln Val

Cys Phe Thr15

Val Ser Ala30

Ile Arg Gly

35

40

45

Phe Gly Gly Met Asn His Pro Ala Trp Ile Gly Asp Leu Thr Ala Pro

50

55

60

Gln Arg Glu Thr Ala Phe Gly Asn Gly Gln Asn Gln Leu Gly Phe Ser 65 70 75 8040 Ile Leu Arg Ile Phe 85 Val Asp Glu Asn Arg 90 Asn Asn Trp His Arg 95 Glu Val Ala Thr Ala 100 Lys Arg Ala Ile Glu 105 His Gly Ala Leu Val 110 Ile Ala Ser Pro Trp Asn Pro Pro Ser Asn Met Val Glu Thr Phe Asn Arg Asn45 115 120 125 Gly Thr 130 Ser Ala Lys Arg Leu 135 Arg Tyr Asn Gln Tyr 140 Ala Ala Tyr Ala Gln His Leu Asn Asp Phe Val Thr Tyr Met Lys Asn Asn Gly Val Asn50 145 150 155 160 Leu Tyr Ala Ile Ser 165 Val Gln Asn Glu Pro 170 Asp Tyr Ala His Glu 175 Trp Thr Trp Trp Thr 180 Pro Gln Glu Ile Leu 185 Arg Phe Met Arg Glu 190 Asn Ala55 Gly Ser Ile Asn Ala Arg Val Ile Ala Pro Glu Ser Phe Gln Tyr Leu 195 200 205 Lys Asn 210 Ile Ser Asp Pro Ile 215 Leu Asn Asp Pro Gln 220 Ala Leu Gly Asn Met Asp Ile Leu Gly Ala His Leu Tyr Gly Thr Gln Ile Ser Gln Leu60 225 230 235 240 Pro Tyr Pro Leu Phe 245 Lys Gln Lys Gly Gly 250 Gly Lys Glu Leu Trp 255 Met Thr Glu Val Tyr 260 Tyr Pro Asn Ser Asp 265 Asn Asn Ser Ala Asp 270 Arg Trp Pro Glu Ala Leu Gly Val Ser Glu His Ile His His Ser Met Val Glu65 275 280 285 Gly Asp 290 Phe Gln Ala Tyr Val 295 Trp Trp Tyr Ile Arg 300 Arg Ser Tyr Gly

240300360420480.540600660720780840900960102010801140120012601263Pro Met Lys Glu Asp Gly Leu Ile Ser Lys Arg Gly Tyr Asn Met Ala305 310 315 320

His Phe Ser Lys Phe Val Arg Pro Gly Tyr Ile Arg Ile Asp Ala Thr

325 330 335

Lys Ser Pro Glu Pro Asn Val Phe Val Ser Ala Tyr Lys Gly Asn Asn

340 345 350

Gln Val Val Ile Val Ala Ile Asn Lys Asn Asn Thr Gly Val Asn Gln

355 360 365

His Phe Val Met Gln Asn Gly Thr Ala Ser Gln Ala Ser Arg Trp Ile

370 375 380

Thr Ser Ser Asn Ser Asn Leu Gln Pro Gly Thr Asp Leu Asn Ile Ser385 390 395 400

Gly

<210> 247

<211> 1044

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 247

gtgtttgcca acgatttcct gataggcgtg gcgctcaact cacggcaggt cgccggggaatccgaggccg gaaaactagc tggcgcgcaa ttttcgtcgg tgacggcgga gaatgagatgaagtggcagt cgctccatcc ccagcccgac cgctatcagt tcggcgcggc ggactcctácatcgattttg ccaaaaaaca caagatggcg gtgatcggcc acacgctcgt gtggcacagccagacacccg gctgggtgtt cgagggcaag gacggcaagc cggcgacccg cgaggatctgctcaagcgca tgcgcgatca catccacacc gtggccggac gctacaaggg caaggtgcgcggctgggacg tggtcaacga ggccttgtcc gacggcggtc ccgaaatcct gcgggattctccgtggcggc gcatcatcgg cgatgacttc atcgaccacg cgttccgttt cgcccgtgaggccgatccga aagccgaact ctactacaac gactacggtc tcgagaacga aaggaagcggagcaactgca tcaagctcgt caagggcatg aaacaacgcg gcgtgccgat cgacggggtgggcacccagt cgcatttcca cttgaaacat ccctcgctcc aggaaatcga aaagaccatcaaggactttt ccgaactcgg actcaaggtg atgatcaccg agctggatgt cgatgtgctgccgtcgcgtg gcaatttcgg caacgccgac atcagccgcc gcgagcaggg cggtgacgcactcaatcctt acaccggcgg cttgcccgat gaggtccaac aggaacttgc gaaacgctatgcggacattt ttgatatcta tctgcgccac cggaaggcgg tcacccgcgt aaccttctggggactcgatg acgggcatac ctggttgaac ggtttcccga tccgcggacg caccaactatccgctgttgt tcgaccgcgc cctcaagccg aagcccgcgt tcgaggcggt catcaaaaaagggcttgaac ccaggaaacg ttga<210> 248<211> 347<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 248

Val Phe Ala Asn Asp Phe Leu Ile Gly Val Ala Leu Asn Ser Arg Gln15 10 15

Val Ala Gly Glu 20 Ser Glu Ala Gly Lys 25 Leu Ala Gly Ala Gln 30 Phe SerSer Val Thr 35 Ala Glu Asn Glu Met 40 Lys Trp Gln Ser Leu 45 His Pro GlnPro Asp 50 Arg Tyr Gln Phe Gly 55 Ala Ala Asp Ser Tyr 60 Ile Asp Phe AlaLys Lys His Lys Met Ala Val Ile Gly His Thr Leu Val Trp His Ser65 70 75 80Gln Thr Pro Gly Trp 85 Val Phe Glu Gly Lys 90 Asp Gly Lys Pro Ala 95 ThrArg Glu Asp Leu Leu Lys Arg Met Arg Asp His Ile His Thr Val Ala 100 105 110 Gly Arg Tyr 115 Lys Gly Lys Val Arg 120 Gly Trp Asp Val Val 125 Asn Glu AlaLeu Ser 130 Asp Gly Gly Pro Glu 135 Ile Leu Arg Asp Ser 140 Pro Trp Arg ArgIle Ile Gly Asp Asp Phe Ile Asp His Ala Phe Arg Phe Ala Arg Glu145 150 155 160Ala Asp Pro Lys Ala Glu Leu Tyr Tyr Asn Asp Tyr Gly Leu Glu Asn 165 170 175Glu Arg Lys Arg Ser Asn Cys Ile Lys Leu Val

180 185

Arg Gly Val Pro Ile Asp Gly Val Gly Thr Gln

195 200

Lys His Pro Ser Leu Gln Glu Ile Glu Lys Thr

210 215

Glu Leu Gly Leu Lys Val Met Ile Thr Glu Leu225 230 235

Pro Ser Arg Gly Asn Phe Gly Asn Ala Asp Ile

245 250

Gly Gly Asp Ala Leu Asn Pro Tyr Thr Gly Gly

260 265

Gln Gln Glu Leu Ala Lys Arg Tyr Ala Asp Ile

275 280

Arg His Arg Lys Ala Val Thr Arg Val Thr Phe

290 295

Gly His Thr Trp Leu Asn Gly Phe Pro Ile Arg305 310 315

Pro Leu Leu Phe Asp Arg Ala Leu Lys Pro Lys

325 330

Val Ile Lys Lys Gly Leu Glu Pro Arg Lys Arg340 345

<210> 249<211> 1439<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 249

tgatcaatcc agtgaaggat cttcgtgaag atttcatctttctacgagat agagcggctc ggtggtaagt tcttcgatggtccagatact gaaggatcat gagataaact ggatcagattgggatgaaaa cggaaatccg ctcggtgggg gaaactgtgatcgcaaaaag ggccaaaaag tacggaatga aggttcttctggtgggcaga tcccggcaag cagtacaaac caaaagagtgttctggaaag ggcggtgtat tcctacacga aactcgtgctgtgcactgcc ggacatggtc caggtgggaa acgaggtgaaatggaatgat tgccggaaag gatgcaggag gattcgacggcggccatcaa agccgtcagg gaagttgatc ccgatatcaaaaggtggaaa caactcactt ttcaggtggt tcttcgacgaattttgatgt gatcggtgta tcgtactatc cgtactggcaagaacaacct gtacgacata gcgaaaagat acaacaaagacgtatgcctg gacactcgag gacggggacg gttaccccaatggagctcac gggtggttac aaagcaacgg ttcagggacatcatagaagt ggtgaacagt gttcctgacg gtcacggtctgagactggat tcctgtgaaa ggagccggct ggaaaaccggatcaggccat gtttgatttc aatggaaatg ctctcccatctgaggacagt cactcctatg gaaataaaaa tcgaagagatcgaatttggg agagattccg aagtttccgg atgctgtgaaccatcagatc cctgaaagtt acatggaatt ttgatccttctctacagagt ggaaggatac gtggaaagta tagaccagaatgaagggaag tagaaactac ctgaagaacc ctgggtttgaggaaggtgtt cggtaacgga aaacgcagtg aaggtggtaa<210> 250<211> 479<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1) ... (33)<400> 250

Met Ile Asn Pro Val Lys Asp Leu Arg Glu Asp

15 10

Asp Val Ser Met Leu Tyr Glu Ile Glu Arg Leu20 25

Lys Gly Met Lys Gln 190 Ser His Phe His Leu 205 Ile Lys Asp Phe Ser220 Asp Val Asp Val Leu 240Ser Arg Arg Glu Gln 255 Leu Pro Asp Glu Val 270 Phe Asp Ile Tyr Leu 285 Trp Gly Leu Asp Asp300 Gly Arg Thr Asn Tyr 320Pro Ala Phe Glu Ala

335

tggaatggactggtgtggaggagagtgtggttatctgaaatgactttcacggatcaccttgaatcatatgcaacggctttattcacaaaagatagtcattgatcacaagatggtaccctgcgtgctcatccatcttcagtggcaacgttctgggatcttccgaaggaaatcctggatgtttctgcctgtgagtgctgttctcttgttgaagatcttcgcaaacgggtgagaggccgatcc

gtttcaatgcaaagatctttaacgatccaaatgacagagatacagcgactcatggagaacagaagaaacgctctggccggcttttgaaggcatttggcagagagacgtgggatgacctgagttgaaacggggtgaagagattgagggatctattgggaagccatgggagattcaagctcggagatctcgaagcgatgattacacccggtgaccttgactgttttctcccttccgagtaa

6012018024030036042048054060066072078084090096010201080114012001260132013801439

Phe Ile Phe Gly Met15

Gly Gly Lys Phe Phe30Asp Gly Gly Val Glu Lys Asp Leu Phe Gln Ile Leu Lys Asp His Glu

35 40 45

Ile Asn Trp Ile Arg Leu Arg Val Trp Asn Asp Pro Arg Asp Glu Asn

50 55 60

Gly Asn Pro Leu Gly Gly Gly Asn Cys Asp Tyr Leu Lys Met Thr Glu65 70 75 80

Ile Ala Lys Arg Ala Lys Lys Tyr Gly Met Lys Val Leu Leu Asp Phe

85 90 95

His Tyr Ser Asp Trp Trp Ala Asp Pro Gly Lys Gln Tyr Lys Pro Lys

100 105 110

Glu Trp Asp His Leu His Gly Glu Leu Leu Glu Arg Ala Val Tyr Ser

115 120 125

Tyr Thr Lys Leu Val Leu Asn His Met Arg Arg Asn Gly Ala Leu Pro

130 135 140

Asp Met Val Gln Val Gly Asn Glu Val Asn Asn Gly Phe Leu Trp Pro145 150 155 160

Asp Gly Met Ile Ala Gly Lys Asp Ala Gly Gly Phe Asp Gly Phe Thr

165 170 175

Lys Leu Leu Lys Ala Ala Ile Lys Ala Val Arg Glu Val Asp Pro Asp

180 185 190

Ile Lys Ile Val Ile His Leu Ala Glu Gly Gly Asn Asn Ser Leu Phe

195 200 205

Arg Trp Phe Phe Asp Glu Ile Thr Arg Arg Asp Val Asp Phe Asp Val

210 215 220

Ile Gly Val Ser Tyr Tyr Pro Tyr Trp His Gly Thr Leu Asp Asp Leu225 230 235 240

Lys Asn Asn Leu Tyr Asp Ile Ala Lys Arg Tyr Asn Lys Asp Val Leu

245 250 255

Ile Val Glu Thr Ala Tyr Ala Trp Thr Leu Glu Asp Gly Asp Gly Tyr

260 265 270

Pro Asn Ile Phe Ser Gly Glu Glu Met Glu Leu Thr Gly Gly Tyr Lys

275 280 285

Ala Thr Val Gln Gly Gln Ala Thr Phe Leu Arg Asp Leu Ile Glu Val

290 295 300

Val Asn Ser Val Pro Asp Gly His Gly Leu Gly Ile Phe Tyr Trp Glu305 310 315 320

Gly Asp Trp Ile Pro Val Lys Gly Ala Gly Trp Lys Thr Gly Glu Gly

325 330 335

Asn Pro Trp Glu Asn Gln Ala Met Phe Asp Phe Asn Gly Asn Ala Leu

340 345 350

Pro Ser Leu Asp Val Phe Lys Leu Val Arg Thr Val Thr Pro Met Glu

355 360 365

Ile Lys Ile Glu Glu Ile Leu Pro Val Glu Ile Ser Thr Asn Leu Gly

370 375 380

Glu Ile Pro Lys Phe Pro Asp Ala Val Lys Val Leu Phe Ser Asp Asp385 390 395 400

Ser Ile Arg Ser Leu Lys Val Thr Trp Asn Phe Asp Pro Ser Leu Val

405 410 415

Glu Thr Pro Gly Val Tyr Arg Val Glu Gly Tyr Val Glu Ser Ile Asp

420 425 430

Gln Lys Ile Phe Ala Thr Leu Thr Val Lys Gly Ser Arg Asn Tyr Leu

435 440 445

Lys Asn Pro Gly Phe Glu Thr Gly Glu Phe Ser Pro Trp Lys Val Phe

450 455 460

Gly Asn Gly Lys Arg Ser Glu Gly Gly Lys Gly Arg Ser Ser Glu465 470 475

<210> 251<211> 555<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 251

atggctacgg attattggca atattggacg gatggcggcg gaacggtgaa tgcggttaacgggtccgggg gcaattacag cgtaacttgg caaaatagcg gggacttcgt ggtcggcaaaggctggagcg tagggtcgcc aaatcggacg atcaattaca atgccggcat ctgggaaccttcggggaacg ggtacttgac cctttacgga tggactagaa actcgctgat cgagtattacgttgtcgaca gttgggggac gtaccggccagacggaggca cctacgatat ttatacgaccacgcagacgt tccaacagtt ctggagcgtggtctccatca ccttcagcaa tcacgtgaatagcagctggt cgtaccaggt cttggcgacggtcacggtgt ggtaa<210> 252<211> 184<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 252Met Ala Thr Asp1

Asn Ala Val Asn20

Ser Gly Asp Phe35

Arg Thr Ile Asn50

Tyr Leu Thr Leu65

Val Val Asp Ser

Thr Val Asn Ser100

Tyr Asn Ala Pro115

Ser Val Arg Gln130

Phe Ser Asn His145

Ser Ser Trp Ser

Gly Arg Ser Asn180

<210> 253<211> 1047<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 253

atgattgtta gcttcaagag cctgaaggca ctcgcgtgccgccgcgcacg cgcaaacctg catcacgtcg agccagacggttttcgttct ggaaagacag tccgggcacg gtgaacttcttatacctcca actggagcgg catcaacaac tgggtgggcgtccagccaca cgatcagcta ctccggcacg ttcaattcgcctgtatggct ggaccaccaa tccattggtc gagtactacataccgtccgc cgggcggcca gggtttcatg ggcacggtaggacgtgtacc ggacgcaacg cgtgaaccag ccatccatcacagtactgga gcgtgcggca gtcgaagcgc gtgggcggcattcaacgcct gggccacgct gggcatgaac ctgggccagcaccgagggtt accagagcag cggcagctcc gacatcaccgtcctcgtcgt cctcgggcgg cggcagcacc agcagcagtgttcacggtgc gtgcgcgcgg cacggccgga ggcgagaacacagacggtcg cgagctggaa cctcaccacc agcatgcagactgagcggcg gcatcaccgt gctctacacc aacgacggcggactacatca tcgtgaacgg ccagacccgc cagtccgaagttgtatgcga atggacgctg cggcggtggc tcgaacagcggcgatcggct acggcaatac gccctga<210> 254<211> 347<212> PRT

<213> Desconhecido<220>

acaggtactcatgcgctatacggcaatcgagcctggagaagaaggctatc

Tyr Trp Gln Tyr Trp Thr Asp5 10 Gly Ser Gly Gly Asn 25 Tyr SerVal Val Gly Lys 40 Gly Trp SerTyr Asn Ala 55 Gly Ile Trp GluTyr Gly 70 Trp Thr Arg Asn Ser 75Trp Gly Thr Tyr Arg Pro Thr85 90 Asp Gly Gly Thr Tyr 105 Asp IleSer Ile Asp Gly 120 Thr Gln ThrSer Lys Arg 135 Pro Thr Gly SerVal Asn 150 Ala Trp Arg Ser Lys 155Tyr Gln Vai. Leu Ala Thr Glu165 170 Val Thr Val Trp

acaaaggaac ggtgaacagc 300atgcgccttc cattgatggc 360aacgaccaac cggcagcaac 420gcaagggcat gaacctgggc 480agagcagcgg aagatccaac 540 555

Gly Gly Gly Thr Val15

Val Thr Trp Gln Asn30

Val Gly Ser Pro Asn45

Pro Ser Gly Asn Gly60

Leu Ile Glu Tyr Tyr80

Gly Thr His Lys Gly95

Tyr Thr Thr Met Arg110

Phe Gln Gln Phe Trp125

Asn Val Ser Ile Thr140

Gly Met Asn Leu Gly160

Gly Tyr Gln Ser Ser175

tcggcgtgct cggcatcacc 60gcaccaacaa cggcaattac 120gcatgtatgc gaatggccgc 180gcaagggctg ggctaccggc 240cgggcaacgg ttacctggcc 300tcgtcgacag ctggggtacc 360ttagcgacgg gggcacgtac 420tcggcaacgc cacgttctac 480ccatcaccat cgccaaccat 540acaactacca ggtcatggcc 600tgaccgaagg tggcggcagy 660gtggcggcgg caacaagagc 720tccagctgca ggtgaacaac 780actacaccgc ctcgaccagc 840gcagccgcga cgtgcaggtg 900cgcagagcta caacaccggg 960agtggatgca ttgcaacggc 1020 1047<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(24)<400> 254

Met Ile Val Ser Phe Lys Ser Leu Lys Ala Leu Ala Cys Leu Gly Val

1 5 10 15

Leu Gly Ile Thr Ala Ala His Ala Gln Thr Cys Ile Thr Ser Ser Gln20 25 30

Thr Gly Thr Asn Asn Gly Asn Tyr Phe Ser Phe Trp Lys Asp Ser Pro35 40 45

Gly Thr Val Asn Phe Cys Met Tyr Ala Asn Gly Arg Tyr Thr Ser Asn

50 55 60

Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Ala Thr Gly65 70 75 80

Ser Ser His Thr Ile Ser Tyr Ser Gly Thr Phe Asn Ser Pro Gly Asn

85 90 95

Gly Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr100 105 110

Tyr Ile Val Asp Ser Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly115 120 125

Phe Met Gly Thr Val Val Ser Asp Gly Gly Thr Tyr Asp Val Tyr Arg130 135 140

Thr Gln Arg Val Asn Gln Pro Ser Ile Ile Gly Asn Ala Thr Phe Tyr145 150 155 160

Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr

165 170 175

Ile Ala Asn His Phe Asn Ala Trp Ala Thr Leu Gly Met Asn Leu Gly180 185 190

Gln His Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly195 200 205

Ser Ser Asp Ile Thr Val Thr Glu Gly Gly Gly Ser Ser Ser Ser Ser

210 215 220

Gly Gly Gly Ser Thr Ser Ser Ser Gly Gly Gly Gly Asn Lys Ser Phe225 230 235 240

Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Asn Ile Gln Leu Gln

245 250 255

Val Asn Asn Gln Thr Val Ala Ser Trp Asn Leu Thr Thr Ser Met Gln260 265 270

Asn Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Leu Tyr275 280 285

Thr Asn Asp Gly Gly Ser Arg Asp Val Gln Val Asp Tyr Ile Ile Val

290 295 300

Asn Gly Gln Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly Leu305 310 315 320

Tyr Ala Asn Gly Arg Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His

325 330 335

Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro340 345

<210> 255

<211> 1137

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 255

ttgatctttt ccgtcagtgg ttccgcgtct cggcggcgcc ctggcatcca caagggggat 60

tccatgattt tcggtctaaa gtcgatcacg ggcaggcgcg ccgtcgcggc gctggcctgc 120

cttgccggcc tctacatggc gccggcgaat gcgcaaacct gcatcacgtc gagccagacg 180

ggcaccaaca acggcaacta cttttcgttc tggaaagaca gcccgggcac ggtgaacttc 240

tgcatgtact ccggcggccg ctacacgtcc aactggagcg gcatcaacaa ctgggtgggc 300

ggcaagggct ggcagacggg ctcgtcccgc accgtctcct actccggcag cttcaattcg 360

ccgggtaacg gctacctgac gctctacggc tggaccacca atccgctcat cgagtactac 420

atcgtcgaca actggggcag ctatcgtccg ccgggtggcc agggcttcat gggcacggtg 480

aacaccgacg gcggcacgta cgacatctat cgcacgcaac gggtcaacca gccgtcgatc 540

atcggcaccg cgacgttcta ccagtactgg agcgtgcggc agtcgaagcg caccggcggc 600

accatcacca cggccaacca cttcaatgcc tgggccagcc tcggcatgaa cctgggacag 660cacaactacc aggtgatggc caccgagggc taccagagca gcggcagctc cgacatcacg 720

gtgtgggaag gcacgagcag cggcggaagc agcaatggcg gcagcagcaa cggcggcagc 780

agcaatggtg gcagcggcgg cacgaagagc ttcacggtgc gcgcgcgcgg cactgcgggc

ggcgagtcca tcacgctgcg ggtcaacaac cagaacgtgc agacctggac gctgggtacc

agcatgcaga actacacggc ctcgacctcg ctgagcggcg gcatcacggt ggcgttcacc

aacgacggcg gcagccgcga cgtgcaggtg gactacatca tcgtgaatgg ccagacccgc 1020

cagtccgaac agcagagcta caacactggc ctctacgcca atggaagctg tggtggcggt 1080

tcgaacagcg agtggatgca ttgcaacggc gccatcggct acggcaatac gccctga 1137

<210> 256<211> 378

<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental

<220>

<221> SIGNAL<222> (1)...(51)<400> 256

Leu Ile Phe Ser Val Ser Gly Ser Ala Ser Arg Arg Arg Pro Gly Ile

1 5 10 15

His Lys Gly Asp Ser Met Ile Phe Gly Leu Lys Ser Ile Thr Gly Arg

20 25 30

Arg Ala Val Ala Ala Leu Ala Cys Leu Ala Gly Leu Tyr Met Ala Pro35 40 45

Ala Asn Ala Gln Thr Cys Ile Thr Ser Ser Gln Thr Gly Thr Asn Asn50 55 60

Gly Asn Tyr Phe Ser Phe Trp Lys Asp Ser Pro Gly Thr Val Asn Phe65 70 75 80

Cys Met Tyr Ser Gly Gly Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn85 90 95

Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ser Ser Arg Thr Val

100 105 110

Ser Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly Tyr Leu Thr Leu115 120 125

Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr Tyr Ile Val Asp Asn130 135 140

Trp Gly Ser Tyr Arg Pro Pro Gly Gly Gln Gly Phe Met Gly Thr Val145 150 155 160

Asn Thr Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn165 170 175

Gln Pro Ser Ile Ile Gly Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val

180 185 190

Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile Thr Thr Ala Asn His Phe195 200 205

Asn Ala Trp Ala Ser Leu Gly Met Asn Leu Gly Gln His Asn Tyr Gln210 215 220

Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr225 230 235 240

Val Trp Glu Gly Thr Ser Ser Gly Gly Ser Ser Asn Gly Gly Ser Ser245 250 255

Asn Gly Gly Ser Ser Asn Gly Gly Ser Gly Gly Thr Lys Ser Phe Thr

260 265 270

Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu Arg Val275 280 285

Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met Gln Asn290 295 300

Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Ala Phe Thr305 310 315 320

Asn Asp Gly Gly Ser Arg Asp Val Gln Val Asp Tyr Ile Ile Val Asn325 330 335

Gly Gln Thr Arg Gln Ser Glu Gln Gln Ser Tyr Asn Thr Gly Leu Tyr

340 345 350

Ala Asn Gly Ser Cys Gly Gly Gly Ser Asn Ser Glu Trp Met His Cys355 360 365

Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro370 375

<210> 257<211> 2694<212> DNA<213> Desconhecido<220><223> Obtido para uma amostra ambiental<400> 257

atggctgata tatctaccac accagtcaca gcctcgacag atgctgccaa gaacctgtat 60gcctatttcc tggaccagta tggcaagaag acgatttcca gcgtcatggc caatgtcaac 120tggaacaaca cttgtgccga gaaagtctat aaactcacgg gcaagtatcc tgccatgaac 180tgctacgact tcatccacat ctgtttctcg ccagccaact ggattgacta caccgacatc 240actcctgcca aggaatggca cgatgcgggc ggtatcgtac agttgatgtg gcatttcaat 300gtgcctaaga gccãgggggc aacagatgtt acctgcacgc ccagcgagac cacctttaag 360gcttccaatg ctctggttag cggcacgtgg gagaacaaat ggttctacga gcagatggac 420aaggtcattg ccaccatcct caagttacag gacgctggca ttgccgctac ctggcgacct 480ttccatgagg cagcaggcaa tgcttgcgcc aagcagcagg ccgactggac caaagcatgg 540ttctggtggg gctacgacgg tgccgacacc tacaagaaac tgtggattgc catgtacgac 600tatttcaagc tgaaaggcgt gaacaacctc atctggatgt ggaccaccca gaattataat 660ggtgacagca gcaaatacaa ccaggacacc gactggtacc ctggcgacga gtatgttgac 720atcgtggccc gcgacctcta tggctacaat gccgaccaga acctgcagga gttcagcgag 780attcaggctg cctatcccaa caagatggtg gttctgggtg aatgcggaaa aggtgatagc 840ggcgaccccg gcaagatgtc cgatgtatgg gcgaaaggtg ccaagtgggg ccacttcatg 900gtatggtatc aaggcgaaca aggctctacc gacacgatgt gcagcgacga ctggtggaag 960gatgccatga gcagcgccaa cgtcatcacc cgcgacaagg tggttatccc cgatgtcact 1020tcaaccatcg agaatgccac ggatgccgtg aagaacatgg gactggggtg gaacctgggg 1080aacgccctcg acgccaatgc ccagcaatac catgatgcca cccaggacaa ctactgggga 1140cagcaggaca ttacctctga gagctgctgg ggtcagctac ccaccaaggc agagctgatg 1200gccatgatga aagaagccgg tttcggagcc atccgcgttc ccgtgacatg gtataaccac 1260atggacaagg acggcaatgt ggatgcagca tggatgaatc gtgtgcatga ggtggttgac 1320tatgtcatca gccagggaat gtactgcatc ctcaacgtac accacgacac gggtgccgac 1380agctacgaça gccagaagaa cctcaccggc taccattgga tcaaggccga cgaaaccaac 1440tacgccacca acaaggcccg ctatgagaag ctgtggcagc agatagccca ggagttccgc 1500aactacggcc agctgctgct gttcgagggc tataacgaga tgctcgatgc caacaactcc 1560tggaattttg cacagagcag ttcagcctac gatgccatca acaaatacgc ccagagcttt 1620gtcgatgtcg tacgcgccac cggtggcaac aatgcccagc gcaacctcat tgtcagcaca 1680tacggcgcct gctcaggcaa cggcacgtgg gatgcaagag tgcaagaccc cttgaagaaa 1740ctgcagattc ccacgggtga aagcaaccat atcatcttcg aggttcacaa ctatccctcc 1800atcgtcaaca aggacaacgc gggcaactac gtcagcgatc gcaccatcag cgaaatcaag 1860gcagagattg atgcatggct taagaactta aagacccacc tcgtcagcaa gggcgctccc 1920gtcatcatcg gcgaatgggg caccaacaac gtcgatgccg gcggtggcaa gacagactac 1980gacctccata aggacctgat gttcgaattt gtcagctaca tgataaagac catgaagcag 2040aacgacattg ccaccttcta ctggatggga cttaccgacg gcgctccacg cacctacccc 2100gccttcacac agcccgacct ggcgctgaag atgctgcagg cctatcacgg cgactcttgg 2160aatccctacc tgcctgacgc caaggacttt cccgaaggca aaatcacctc ggccacggtg 2220aatttcaaca gccaatgggg cgaactgacc atccacgatg gagctattga caagaccgtc 2280tatagaggta tcaaggtgga gctggaagaa aagcctgcca ctggagccct gtctttcaag 2340gtatatgcca acagtgagaa ggcaacagcc atcaattcca aaaccccaca gttggctttc 2400ttcagttaca caggcatcca gaaaatcaac ctacagtgga acatagccac caaggggagt 2460atcaaaatca agagcgtcaa ccttatcaag cacgacgact ccacagaacc ctgtagtctg 2520aaagtggctt ggggttgtac tctcagcgac cagaactacg ccacgggcat cgaagacatt 2580actatcactc ctgttcgtca tgacgatgga atcatctaca atctgagcgg acagcctgta 2640acctctcctc agcgcggcat ctacatcctc aacggaaaga aaatcatcaa atag 2694

<210> 258<211> 897<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<400> 258

Met Ala Asp Ile Ser Thr Thr Pro Val Thr Ala Ser Thr Asp Ala Ala1 5 10' 15

Lys Asn Leu Tyr Ala Tyr Phe Leu Asp Gln Tyr Gly Lys Lys Thr Ile20 25 30

Ser Ser Val Met Ala Asn Val Asn Trp Asn Asn Thr Cys Ala Glu Lys35 40 45

65 Val Tyr Lys Leu Thr Gly Lys Tyr Pro Ala Met Asn Cys Tyr Asp Phe50 55 60

Ile His Ile Cys Phe Ser Pro Ala Asn Trp Ile Asp Tyr Thr Asp Ile65 70 75 80 Thr Pro Ala Lys Glu Trp His Asp Ala Gly Gly Ile Val Gln Leu Met 85 90 95 Trp His Phe Asn Val Pro Lys Ser Gln Gly Ala Thr Asp Val Thr Cys 100 105 110 Thr Pro Ser 115 Glu Thr Thr Phe Lys 120 Ala Ser Asn Ala Leu 125 Val Ser Gly Thr Trp 130 Glu Asn Lys Trp Phe 135 Tyr Glu Gln Met Asp 140 Lys Val Ile Ala Thr Ile Leu Lys Leu Gln Asp Ala Gly Ile Ala Ala Thr Trp Arg Pro 145 150 155 160 Phe His Glu Ala Ala Gly Asn Ala Cys Ala Lys Gln Gln Ala Asp Trp 165 170 175 Thr Lys Ala Trp Phe Trp Trp Gly Tyr Asp Gly Ala Asp 180 185 190 Lys Leu Trp Ile Ala Met Tyr Asp Tyr Phe Lys Leu Lys Gly Val Asn 195 200 205 Asn Leu Ile Trp Met Trp Thr Thr Gln Asn Tyr Asn Gly Asp Ser Ser 210 215 220 Lys Tyr Asn Gln Asp Thr Asp Trp Tyr Pro Gly Asp Glu Tyr Val Asp 225 230 235 240 Ile Val Ala Arg Asp Leu Tyr Gly Tyr Asn Ala Asp Gln Asn Leu Gln 245 250 255 Glu Phe Ser Glu Ile Gln Ala Ala Tyr Pro Asn Lys Met Val Val Leu 260 265 270 Gly Glu Cys Gly Lys Gly Asp Ser Gly Asp Pro Gly Lys Met Ser Asp 275 280 285 Val Trp Ala Lys Gly Ala Lys Trp Gly His Phe Met Val Trp Tyr Gln 290 295 300 Gly 305 Glu Gln Gly Ser Thr 310 Asp Thr Met Cys Ser 315 Asp Asp Trp Trp Lys 320 Asp Ala Met Ser Ser Ala Asn Val Ile Thr Arg Asp Lys Val Val Ile 325 330 335 Pro Asp Val Thr Ser Thr Ile Glu Asn Ala Thr Asp Ala Val Lys Asn 340 345 350 Met Gly Leu Gly Trp Asn Leu Gly Asn Ala Leu Asp Ala Asn Ala Gln 355 360 365 Gln Tyr His Asp Ala Thr Gln Asp Asn Tyr Trp Gly Gln Gln Asp Ile 370 375 380 Thr Ser Glu Ser Cys Trp Gly Gln Leu Pro Thr Lys Ala Glu Leu Met 385 390 395 400 Ala Met Met Lys Glu Ala Gly Phe Gly Ala Ile Arg Val Pro Val Thr 405 410 415 Trp Tyr Asn His Met Asp Lys Asp Gly Asn Val Asp Ala Ala Trp Met 420 425 430 Asn Arg Val 435 His Glu Val Val Asp 440 Tyr Val Ile Ser Gln 445 Gly Met Tyr Cys Ile Leu Asn Val His His Asp Thr Gly Ala Asp Ser Tyr Asp Ser 450 455 460 Gln 465 Lys Asn Leu Thr Gly 470 Tyr His Trp Ile Lys 475 Ala Asp Glu Thr Asn 480 Tyr Ala Thr Asn Lys 485 Ala Arg Tyr Glu Lys 490 Leu Trp Gln Gln Ile 495 Ala Gln Glu Phe Arg Asn Tyr Gly Gln Leu Leu Leu Phe Glu Gly Tyr Asn 500 505 510 Glu Met Leu 515 Asp Ala Asn Asn Ser 520 Trp Asn Phe Ala Gln 525 Ser Ser Ser Ala Tyr 530 Asp Ala Ile Asn Lys 535 Tyr Ala Gln Ser Phe 540 Val Asp Val Val Arg Ala Thr Gly Gly Asn Asn Ala Gln Arg Asn Leu Ile Val Ser Thr 545 550 555 560 Tyr Gly AÍa Cys Ser Gly Asn Gly Thr Trp Asp Ala Arg Val Gln Asp 565 570 575 Pro Leu Lys Lys Leu Gln Ile Pro Thr Gly Glu Ser Asn His Ile Ile 580 585 590 Phe Glu Val His Asn Tyr Pro Ser Ile Val Asn Lys Asp Asn Ala Gly

595 600 605Asn Tyr Val610Ala Trp Leu625

Val Ile Ile

Lys Thr Asp

Tyr Met Ile675

Met Gly Leu

690Pro Asp Leu705

Asn Pro Tyr

Ser Ala Thr

Asp Gly Ala755

Glu Glu Lys

770Ser Glu Lys785

Phe Ser Tyr

Thr Lys Gly

Asp Ser Thr835

Ser Asp Gln

850Val Arg His865

Thr Ser ProLys

<210> 259<211> 1143<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 259

atgaagaaaa ttcgcttact ccagggtgtt tcgttggccatcatgtcagg cacaaaaacc agttgactct cttaaggaagataggtactg ccatgaacac ccctcagatc accggccaggataaaaaaac acatgaactc catagtggcc gaaaatgtaacccagggaag gagagtttga ttttactctt gccgatcagtaacaatatgc atatagttgg ccataccctt atatggcatttttgtggatg agaacggaaa cgatgtgagc cccgaaattccatatttata ccgtagtagg ccgttataaa ggcaaaattcgagtgtataa atgacgatgg ttcgtggcgc aatagtaagtgattttgtta aatatgcatt ccagtttgca gctgaagccgtacaatgatt attcgatgtt ccttccagga cgtagggaagaatctgcagg aacagggaat taaaattgat ggtattgggagattatccac ccctcgaaga ttttgaaacg agtatactggaatgtcatga taaccgaact cgatatatcc gttttgccatgccgatgttt ctctgaacat tgcatacaat actgaattaacccgaagatg tagcgcagaa attacataat cggtgggtggaaacaccacg ataaaattac ccgtgtaacc acttggggtaaagaataact ggcccattcg tggacgtaca gattatccctcagcccaaac cctttgtcgc tgatataatt aaggaggcattaa<210> 260<211> 380<212> PRT

Ser Asp Arg Thr Ile Ser Glu Ile615

Lys Asn Leu Lys Thr His Leu Val630 635

Gly Glu Trp Gly Thr Asn Asn Val

645 650

Tyr Asp Leu His Lys Asp Leu Met660 665

Lys Thr Met Lys Gln Asn Asp Ile680

Thr Asp Gly Ala Pro Arg Thr Tyr695

Ala Leu Lys Met Leu Gln Ala Tyr710 715

Leu Pro Asp Ala Lys Asp Phe Pro

725 730

Val Asn Phe Asn Ser Gln Trp Gly740 745

Ile Asp Lys Thr Val Tyr Arg Gly760

Pro Ala Thr Gly Ala Leu Ser Phe775

Ala Thr Ala Ile Asn Ser Lys Thr790 795

Thr Gly Ile Gln Lys Ile Asn Leu

805 810

Ser Ile Lys Ile Lys Ser Val Asn820 825

Glu Pro Cys Ser Leu Lys Val Ala840

Asn Tyr Ala Thr Gly Ile Glu Asp855

Asp Asp Gly Ile Ile Tyr Asn Leu870 875

Gln Arg Gly Ile Tyr Ile Leu Asn885 890

Lys Ala Glu Ile Asp620 Ser Lys Gly Ala Pro 640Asp Ala Gly Gly Gly 655 Phe Glu Phe Val Ser 670 Ala Thr Phe Tyx Trp 685 Pro Ala Phe Thr Gln700 His Gly Asp Ser Trp 720Glu Gly Lys Ile Thr 735 Glu Leu Thr Ile His 750 Ile Lys Val Glu Leu 765 Lys Val Tyr Ala Asn780 Pro Gln Leu Ala Phe 800Gln Trp Asn Ile Ala 815 Leu Ile Lys His Asp 830 Trp Gly Cys Thr Leu 845 Ile Thr Ile Thr Pro860 Ser Gly Gln Pro Val 880Gly Lys Lys Ile Ile

895

tgtcaataat gtttcttttg 60catttgatgg tttgtttctt 120atacacaaac acttgagttg 180tgaaaagtga ggtgcttcaa 240ttgttcaatt tggtatcgat 300cccaggcgcc acgatggttt 360tgaaacaaag aatgaaagac 420atggatggga tgtggtgaat 480tttaccaaat tcttggtgaa 540atcccgatgc agagctttat 600gcgtaattaa gatggtgaga 660tgcagggcca cctgatgatt 720cttttgccga tctgggggtg 780ttcctacccg caacgtgggc 840atccctaccc gaatggctta 900atctttttcg cctgttcatt 960cagccgatgc catgtcatgg 1020tacttttcga tcgcgatttt 1080tggcagccaa aagaaaatta 1140 1143<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220><221> SIGNAL

<222> (1)...(24)<400> 260

Met Lys Lys Ile Arg Leu Leu Gln Gly Val Ser Leu Ala Met Ser Ile1 5 10 15

Met Phe Leu Leu Ser Cys Gln Ala Gln Lys Pro Val Asp Ser Leu Lys20 25 30

Glu Ala Phe Asp Gly Leu Phe Leu Ile Gly Thr Ala Met Asn Thr Pro

35 40 45

Gln Ile Thr Gly Gln Asp Thr Gln Thr Leu Glu Leu Ile Lys Lys His50 55 60

Met Asn Ser Ile Val Ala Glu Asn Val Met Lys Ser Glu Val Leu Gln65 70 75 80

Pro Arg Glu Gly Glu Phe Asp Phe Thr Leu Ala Asp Gln Phe Val Gln85 90 95

Phe Gly Ile Asp Asn Asn Met His Ile Val Gly His Thr Leu Ile Trp100 105 110

His Ser Gln Ala Pro Arg Trp Phe Phe Val Asp Glu Asn Gly Asn Asp

115 120 125

Val Ser Pro Glu Ile Leu Lys Gln Arg Met Lys Asp His Ile Tyr Thr130 135 140

Val Val Gly Arg Tyr Lys Gly Lys Ile His Gly Trp Asp Val Val Asn145 150 155 160

Glu Cys Ile Asn Asp Asp Gly Ser Trp Arg Asn Ser Lys Phe Tyr Gln165 170 175

Ile Leu Gly Glu Asp Phe Val Lys Tyr Ala Phe Gln Phe Ala Ala Glu180 185 190

Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Met Phe Leu

195 200 205

Pro Gly Arg Arg Glu Gly Val Ile Lys Met Val Arg Asn Leu Gln Glu

210 215 220

Gln Gly Ile Lys Ile Asp Gly Ile Gly Met Gln Gly His Leu Met Ile225 230 235 240

Asp Tyr Pro Pro Leu Glu Asp Phe Glu Thr Ser Ile Leu Ala Phe Ala245 250 255

Asp Leu Gly Val Asn Val Met Ile Thr Glu Leu Asp Ile Ser Val Leu260 265 270

Pro Phe Pro Thr Arg Asn Val Gly Ala Asp Val Ser Leu Asn Ile Ala

275 280 285

Tyr Asn Thr Glu Leu Asn Pro Tyr Pro Asn Gly Leu Pro Glu Asp Val290 295 300

Ala Gln Lys Leu His Asn Arg Trp Val Asp Leu Phe Arg Leu Phe Ile305 310 315 320

Lys His His Asp Lys Ile Thr Arg Val Thr Thr Trp Gly Thr Ala Asp325 330 335

Ala Met Ser Trp Lys Asn Asn Trp Pro Ile Arg Gly Arg Thr Asp Tyr340 345 350

Pro Leu Leu Phe Asp Arg Asp Phe Gln Pro Lys Pro Phe Val Ala Asp

355 360 365

Ile Ile Lys Glu Ala Leu Ala Ala Lys Arg Lys Leu370 375 380

<210> 261<211> 1629<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 261

atgataaaca aaattggcaa aggttttttt tctgcgttca tttgtgctgc tgcgttgagt 60

gtctccacag ttaatgctca gcaaactgtc accaccaaca cgcaaggcac gcacgatggt 120

tttttctatt cgttttggaa agacagtggt gatgcatcat ttggtttgcg tgagggaggg 180

cgttacacct cgcaatggaa tacttctacc aataactggg tgggtggaaa agggtggaat 240

cccggtggta gaagggttgt tcactatcaa ggccaatata atgttgataa ttcacaaaac 300tcttatttgg cattgtatgg ctggacacgc tcaccactga ttgaatatta cgtgattgaa 360

agttacggct cgtataaccc gtcgaattgc acccaaggtc ggcagaccta tggcaccttt 420

cagagtgatg gtgcaaccta tgaaattgtt cgctgtcagc gagttcagca gccctctatc 480

gatggcacac aaactttcta tcaatacttc agtgtgcgtc agccgaagaa aggctttggt 540

agtatcagtg gtacgatcac tgtgggcaac cattttgatg catgggccgc cgccggtttg 600

aacctggggg aacatgatta tatggtgatg gctaccgagg gttatcagag caccggtagt 660

tcggatatta cggtcagtga aattaccggt ggttcaggtg gtggctcttc ctcgggtgct 720

aataccctgg tgattcgtgc tgtgggcacc tctggtaatg aattgctgcg tgtcaatgtg 780

ggtggtagcc ctgtgcagac attgagcctt tcgaccagtt ggcaggattt tactgtcaat 840

acggatgcaa cgggtgacat taacgtagag ttgtttaatg atcagggtca gggttatgag 900

gcgcgtatcg attatgtgct ggttaatggt gagacccgct acgcggccga tcagagttat 960

aacaccagtg cctgggacgg cgaatgtggg ggtggctctt ttacccagtg gatgcattgt 1020

gatggcatga ttggctttgg tgatatgacc ggcggcaatg ccggtggtgg cggttcttcg 1080

ggtggttctg gcgccaatac tctggtggtg cgtgctgtcg gcacttcagg taacgagcag 1140

ttgcgcgtga atgtgggcgg caacacgatt caaacactga acctgtcaag cagttggcaa 1200

gattttactg tcaataccga tgcctcgggc gatattaacg tagagctgtt taatgaccag 1260

ggtcagggct atgaggcgcg tattgattat gtgctggtta atggcgagac ccgctacgcg 1320

gctgaccaga gttataacac cagcgcctgg gatggcgaat gcgggggtgg ctcttttacc 1380

caatggatgc attgtgatgg catgattggt tttggtgata tgtcgggtgg tggttctgct 1440

gtgggtacaa gcagtagcgg taatgccggc agcaatacca gcagtgcctg ttactgtaat 1500

tggtatggca gtgtgatggc ttcttgtgaa aatcaggtga acggctgggg ttgggaaaat 1560

aatcaaagct gtattggtaa taatacctgt aataatcagg gcggtagcgg aggcgtggtg 1620

I tgcaattaa 1629<210> 262<211> 542

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.

<220>

<221> SIGNAL<222> (1) . . . (26)<400> 262

Met Ile Asn Lys Ile Gly Lys Gly Phe Phe Ser Ala Phe Ile Cys Ala 1 5 10 15 Ala Ala Leu Ser 20 Val Ser Thr Val Asn 25 Ala Gln Gln Thr Val 30 Thr Thr Asn Thr Gln Gly Thr His Asp Gly Phe Phe Tyr Ser Phe Trp Lys Asp 35 40 45 Ser Gly 50 Asp Ala Ser Phe Gly 55 Leu Arg Glu Gly Gly 60 Arg Tyr Thr Ser Gln Trp Asn Thr Ser Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Asn 65 70 75 80 Pro Gly Gly Arg Arg Val Val His Tyr Gln Gly Gln Tyr Asn Val Asp 85 90 95 Asn Ser Gln Asn 100 Ser Tyr Leu Ala Leu 105 Tyr Gly Trp Thr Arg 110 Ser Pro Leu Ile Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro Ser 115 120 125 Asn Cys 130 Thr Gln Gly Arg Gln 135 Thr Tyr Gly Thr Phe 140 Gln Ser Asp Gly Ala Thr Tyr Glu Ile Val Arg Cys Gln Arg Val Gln Gln Pro Ser Ile 145 150 155 160 Asp Gly Thr Gln Thr Phe Tyr Gln Tyr Phe Ser Val Arg Gln Pro Lys 165 170 175 Lys Gly Phe Gly 180 Ser Ile Ser Gly Thr 185 Ile Thr Val Gly Asn 190 His Phe Asp Ala Trp Ala Ala Ala Gly Leu Asn Leu Gly Glu His Asp Tyr Met 195 200 205 Val Met 210 Ala Thr Glu Gly Tyr 215 Gln Ser Thr Gly Ser 220 Ser Asp Ile Thr Val Ser Glu Ile Thr Gly Gly Ser Gly Gly Gly Ser Ser Ser Gly Ala 225 230 235 240 Asn Thr Leu Val Ile Arg Ala Val Gly Thr Ser Gly Asn Glu Leu Leu 245 250 255 Arg Val Asn Val 260 Gly Gly Ser Pro Val 265 Gln Thr Leu Ser Leu 270 Ser ThrSer Trp Gln Asp Phe Thr Val Asn Thr Asp Ala Thr Gly Asp Ile Asn

275 280 285

Val Glu Leu Phe Asn Asp Gln Gly Gln Gly Tyr Glu Ala Arg Ile Asp290 295 300

Tyr Val Leu Val Asn Gly Glu Thr Arg Tyr Ala Ala Asp Gln Ser Tyr305 310 315 320

Asn Thr Ser Ala Trp Asp Gly Glu Cys Gly Gly Gly Ser Phe Thr Gln

325 330 335

Trp Met His Cys Asp Gly Met Ile Gly Phe Gly Asp Met Thr Gly Gly340 345 350

Asn Ala Gly Gly Gly Gly Ser Ser Gly Gly Ser Gly Ala Asn Thr Leu

355 360 365

Val Val Arg Ala Val Gly Thr Ser Gly Asn Glu Gln Leu Arg Val Asn370 375 380

Val Gly Gly Asn Thr Ile Gln Thr Leu Asn Leu Ser Ser Ser Trp Gln385 390 395 400

Asp Phe Thr Val Asn Thr Asp Ala Ser Gly Asp Ile Asn Val Glu Leu

405 410 415

Phe Asn Asp Gln Gly Gln Gly Tyr Glu Ala Arg Ile Asp Tyr Val Leu420 425 430

Val Asn Gly Glu Thr Arg Tyr Ala Ala Asp Gln Ser Tyr Asn Thr Ser

435 440 445

Ala Trp Asp Gly Glu Cys Gly Gly Gly Ser Phe Thr Gln Trp Met His450 455 460

Cys Asp Gly Met Ile Gly Phe Gly Asp Met Ser Gly Gly Gly Ser Ala465 470 475 480

Val Gly Thr Ser Ser Ser Gly Asn Ala Gly Ser Asn Thr Ser Ser Ala

485 490 495

Cys Tyr Cys Asn Trp Tyr Gly Ser Val Met Ala Ser Cys Glu Asn Gln500 505 510

Val Asn Gly Trp Gly Trp Glu Asn Asn Gln Ser Cys Ile Gly Asn Asn

515 520 525

Thr Cys Asn Asn Gln Gly Gly Ser Gly Gly Val Val Cys Asn530 535 540

<210> 263

<211> 1092<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 263

atgaaaacta atcacccatt taaattcggg aaaaaaatat gtatggcatt ggctttgctg 60

gtgcttggca tacaggcttc aatcgcacag gaaatttgta ttaccagcgg cactgaccag 120

atcagagaaa ccacatccaa cggctatacc cacgaactat ggaatcagga cacccggggg 180

acggcctgta tgactattaa tgcaggcacc acttacagtg cgcggtggaa cggtgcattt 240aactatttgg cccgccgtgg attggcctac gatggttcgt ccctcaccca tgctgaccgg 3 00

gggaaattca ccataaatta tgcctctaac tacaactgca acaatatgaa tgggctctct 3 60

tatttaagcg tgtacggatg gacgcgggat tttgccaagg aaaatgccaa tccggcagga 420

tcacaggctc atcaggaagc gctggtggaa tattacattg ttgaaaactg gtgcgactgg 480

aatgtttcac aagaccctaa cgcccagagt ctgggcaccc tgaatgttga tgggtcgatc 540

tatgatatgt atcgcacaga acggatcaac caaccttcta tcaggtgcgg tggtacctgc 600

gataattttt accaatactt cagcattcgc cgcaacacac gtaacagtgg caccattgat 660

gtcagcgctc atttcaacca gtgggaagca ttaaccggcg tccctatggg tggcctgcac 720

gaagtgatga tgaaggtcga aggctacaac tcaaacaatc aatccagtgg caatgtaagc 780

tttactcaat tgctcatgcg tgcccgcttc gaggatggcg ccattgtcga gaaccagaat 840gcggtcggcc atgcgcacgg tggagaagcg gtgggagatg atcaccgccg tcttgccctg 900

ggccaggccc ttgaagcggg cgaacacctc ggcctcggcc ttggcgtcga gggcggcggt 960

gggttcgtcg agaatgatca actcggcgtc gcgcatatag gcgcgggcga tggctacctt 1020ctgccactcg ccgcccgaga ggtcgcggcc ctgcttgaaa aggcgcccca attgctccag 1080agaaacgggt ga 1092

<210> 264<211> 363<212> PRT<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<22 0><221> SIGNAL<222> (1)...(29)<400> 264

Met Lys Thr Asn His Pro Phe Lys Phe Gly Lys Lys Ile Cys Met Ala

1 5 10 15

Leu Ala Leu Leu Val Leu Gly Ile Gln Ala Ser Ile Ala Gln Glu Ile

20 25 30

Cys Ile Thr Ser Gly Thr Asp Gln Ile Arg Glu Thr Thr Ser Asn Gly35 40 45

Tyr Thr His Glu Leu Trp Asn Gln Asp Thr Arg Gly Thr Ala Cys Met50 55 60

Thr Ile Asn Ala Gly Thr Thr Tyr Ser Ala Arg Trp Asn Gly Ala Phe65 70 75 80

Asn Tyr Leu Ala Arg Arg Gly Leu Ala Tyr Asp Gly Ser Ser Leu Thr85 90 95

His Ala Asp Arg Gly Lys Phe Thr Ile Asn Tyr Ala Ser Asn Tyr Asn

100 105 110

Cys Asn Asn Met Asn Gly Leu Ser Tyr Leu Ser Val Tyr Gly Trp Thr115 120 125

Arg Asp Phe Ala Lys Glu Asn Ala Asn Pro Ala Gly Ser Gln Ala His130 135 140

Gln Glu Ala Leu Val Glu Tyr Tyr Ile Val Glu Asn Trp Cys Asp Trp145 150 155 160

Asn Val Ser Gln Asp Pro Asn Ala Gln Ser Leu Gly Thr Leu Asn Val165 170 175

Asp Gly Ser Ile Tyr Asp Met Tyr Arg Thr Glu Arg Ile Asn Gln Pro

180 185 190

Ser Ile Arg Cys Gly Gly Thr Cys Asp Asn Phe Tyr Gln Tyr Phe Ser195 200 205

Ile Arg Arg Asn Thr Arg Asn Ser Gly Thr Ile Asp Val Ser Ala His210 215 220

Phe Asn Gln Trp Glu Ala Leu Thr Gly Val Pro Met Gly Gly Leu His225 230 235 240

Glu Val Met Met Lys Val Glu Gly Tyr Asn Ser Asn Asn Gln Ser Ser245 250 255

Gly Asn Val Ser Phe Thr Gln Leu Leu Met Arg Ala Arg Phe Glu Asp

260 265 270

Gly Ala Ile Val Glu Asn Gln Asn Ala Val Gly His Ala His Gly Gly275 280 285

Glu Ala Val Gly Asp Asp His Arg Arg Leu Ala Leu Gly Gln Ala Leu290 295 300

Glu Ala Gly Glu His Leu Gly Leu Gly Leu Gly Val Glu Gly Gly Gly305 310 315 320

Gly Phe Val Glu Asn Asp Gln Leu Gly Val Ala His Ile Gly Ala Gly325 330 335

Asp Gly Tyr Leu Leu Pro Leu Ala Ala Arg Glu Val Ala Ala Leu Leu

340 345 350

Glu Lys Ala Pro Gln Leu Leu Gln Arg Asn Gly355 360

<210> 265<211> 996<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 265

atgaacagct ccctcccctc cctccgcgat gtattcgcga atgatttccg catcggggcggcggtcaatc ctgtgacgat cgagatgcaa aaacagttgt tgatcgatca tgtcaacagtattacggcag agaaccatat gaagtttgag catcttcagc cggaagaagg gaaatttacctttcaggaag cggatcggat tgtggatttt gcttgttcgc accgaatggc ggttcgaggg 240

cacacacttg tatggcacaa ccagactccg gattgggtgt ttcaagatgg tcaaggccatttcgtcagtc gggatgtgtt gcttgagcgg atgaaatgtc acatttcaac tgttgtacggcgatacaagg gaaaaatata ttgttgggat gtcatcaacg aagcggtagc cgacgaaggagacgaattgt tgaggccgtc gaagtggcga caaatcatcg gggacgattt tatggaacaa 480

gcatttctct acgcttatga agctgaccca gatgcactgc ttttttacaa tgactataat 540

gaatgttttc cggaaaagag agaaaaaatt tttgcacttg tcaaatcgct gcgtgataaa 600

ggcattccga ttcatggcat cggcatgcag gcgcactgga gcctgacccg cccgtcgctt 660

60120180

300360420gatgaaattc gtgcggcgat tgaacggtat gcgtcccttg gtgttgttct tcatattacg 720

gaactcgatg tatccatgtt tgaatttcac gatcgtcgaa ccgatttggc tgtcccgacg 780

aacgaaatga tcgaacagca agcagaacgg tatgggcaaa tttttgcttt gtttaaggag 840

tatcgcgatg ttattcaaag tgtcacattt tggggaattg ctgatgacca tacatggctc 900

gataactttc cagtgcacgg gagaaaaaac tggccgcttt tgttcgatga acagcataaa 960

ccgaaaccag ctttttggcg ggcagtgagt gtctga 996

<210> 266<211> 331<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 266

Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn Asp Phe

1 5 10 15

Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln Lys Gln

20 25 30

Leu Leu Ile Asp His Val Asn Ser Ile Thr Ala Glu Asn His Met Lys35 40 45

Phe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln Glu Ala50 55 60

Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val Arg Gly65 70 75 80

His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Val Phe Gln Asp85 90 95

Gly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg Met Lys

100 105 110

Cys His Ile Ser Thr Val Val Arg Arg Tyr Lys Gly Lys Ile Tyr Cys115 120 125

Trp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu Leu Leu130 135 140

Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met Glu Gln145 150 155 160

Ala Phe Leu Tyr Ala Tyr Glu Ala Asp Pro Asp Ala Leu Leu Phe Tyr165 170 175

Asn Asp Tyr Asn Glu Cys Phe Pro Glu Lys Arg Glu Lys Ile Phe Ala

180 185 190

Leu Val Lys Ser Leu Arg Asp Lys Gly Ile Pro Ile His Gly Ile Gly195 200 205

Met Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu Ile Arg210 215 220

Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His Ile Thr225 230 235 240

Glu Leu Asp Val Ser Met Phe Glu Phe His Asp Arg Arg Thr Asp Leu245 250 255

Ala Val Pro Thr Asn Glu Met Ile Glu Gln Gln Ala Glu Arg Tyr Gly

260 265 270

Gln Ile Phe Ala Leu Phe Lys Glu Tyr Arg Asp Val Ile Gln Ser Val275 280 285

Thr Phe Trp Gly Ile Ala Asp Asp His Thr Trp Leu Asp Asn Phe Pro290 295 300

Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln His Lys305 310 315 320

Pro Lys Pro Ala Phe Trp Arg Ala Val Ser Val325 330

<210> 267<211> 1956<212> DNA<213> Bactéria<400> 267

atgaagcgta aggttaagaa gatggcagct atggcaacga gtataattat ggctatcatg 60

atcatcctac atagtatacc agtactcgcc gggcgaataa tttacgacaa tgagacaggc 120

acacatggag gctacgacta tgagctctgg aaagactacg gaaatacgat tatggaactt 180

aacgacggtg gtacttttag ttgtcaatgg agtaatatcg gtaatgcact atttagaaaa 240gggagaaaat ttaattccga caaaacctat caagaattag gagatatagt agttgaatat 300ggctgtgatt acaatccaaa cggaaattcc tatttgtgtg tttacggttg gacaagaaat 360

ccactggttg aatattacat tgtagaaagc tggggcagct ggcgtccacc tggagcaaca 420<222> (1) . . . (30) <400> 268 Met 1 Lys Arg Lys Val 5 Lys Lys Met Ala Ala 10 Met Ala Thr Ser Ile 15 Ile Met Ala Ile Met 20 Ile Ile Leu His Ser 25 Ile Pro Val Leu Ala 30 Gly Arg Ile Ile Tyr Asp Asn Glu Thr Gly Thr His Gly Gly Tyr Asp Tyr Glu 35 40 45 Leu Trp 50 Lys Asp Tyr Gly Asn 55 Thr Ile Met Glu Leu 60 Asn Asp Gly Gly Thr Phe Ser Cys Gln Trp Ser Asn Ile Gly Asn Ala Leu Phe Arg Lys 65 70 75 80 Gly Arg Lys Phe Asn 85 Ser Asp Lys Thr Tyr 90 Gln Glu Leu Gly Asp 95 Ile Val Val Glu Tyr 100 Gly Cys Asp Tyr Asn 105 Pro Asn Gly Asn Ser 110 Tyr Leu Cys Val Tyr Gly Trp Thr Arg Asn Pro Leu Val Glu Tyr Tyr Ile Val 115 120 125 Glu Ser 130 Trp Gly Ser Trp Arg 135 Pro Pro Gly Ala Thr 140 Pro Lys Gly Thr Ile Thr Val Asp Gly Gly Thr Tyr Glu Ile Tyr Glu Thr Thr Arg Val 145 150 155 160 Asn Gln Pro Ser Ile 165 Asp Gly Thr Ala Thr 170 Phe Gln Gln Tyr Trp 17 5 Ser Val Arg Thr Ser 180 Lys Arg Thr Ser Gly 185 Thr Ile Ser Val Thr 190 Glu His Phe Lys Gln Trp Glu Arg Met Gly Met Arg Met Gly Lys Met Tyr Glu 195 200 205 Val Ala 210 Leu Thr Val Glu Gly 215 Tyr Gln Ser Ser Gly 220 Tyr Ala Asn Val Tyr Lys Asn Glu Ile Arg Ile Gly Ala Asn Pro Thr Pro Ala Pro Ser 225 230 235 240 Gln Ser Pro Ile Arg 245 Arg Asp Ala Phe Ser 250 Ile Ile Glu Ala Glu 255 Glu Tyr Asn Ser Thr Asn Ser Ser Thr Leu Gln Val Ile Gly Thr Pro Asn

cccaaaggaa ccatcacagt ggatggcggt acttatgaaa tatatgaaac tacccgggta 480

aatcagcctt ccatcgatgg aactgcgaca ttccaacaat attggagtgt tcgtacatcc 540

aagagaacaa gcggaacaat atctgtcact gaacatttta aacagtggga aagaatgggc 600

atgcgaatgg gtaagatgta tgaagttgct cttaccgttg aaggttatca gagcagtggg 660

tacgctaatg tatataagaa tgaaatcaga ataggtgcaa atccaactcc tgccccatct 720

caaagcccaa ttagaagaga tgcattttca ataatcgaag cggaagaata taacagcaca 780

aattcctcca ctttacaagt gattggaacg ccaaataatg gcagaggaat tggttatatt 840

gaaaatggta ataccgtaac ttacagcaat atagattttg gtagtggtgc aacagggttc 900

tctgcaactg ttgcaacgga ggttaatacc tcaattcaaa tccgttctga cagtcctatc 960

ggaactctac ttggtacctt atatgtaagt tctaccggca gctggaatac atatcaaacc 1020

gtatctacaa acatcagcaa aattaccggc gttcatgata ttgtattggt attctcaggt 1080

ccagtcaatg tggacaactt catatttagc agaagttcac cagtgcctgc acctggtgat 1140

aacacaagag acgcatattc tatcattcag gccgaggatt atgacagcag ttatggcccc 1200

aaccttcaaa tctttagctt accaggcggt ggcagcgcca ttggctatat tgaaaatggt 1260

tattccacta cctataataa cgttaatttc gccaacggct taagttctat aacagcaaga 1320

gttgccactc agatctcaac ttccattcag gtgagagcag gaggagcaac cggtacttta 1380

cttggtacaa tatatgttcc ttcgacaaat agttgggatt cttatcagaa tgtaactgcc 1440

aaccttagca atattacagg tgtgcatgat attacccttg tcttttcagg accagtgaat 1500

gtggactact tcgtatttac accagcaaat gtaaattcag ggcctacctc ccctgtcgga 1560

ggtacaagaa gtgcattttc caatattcaa gccgaagatt atgacagcag ttatggtccc 1620

aaccttcaaa tctttagctt accaggtggt ggcagcgcca ttggctatat tgaaaatggt 1680

tattccacta cctataaaaa tattgatttt ggtgacggcg caacgtccgt aacagcaaga 1740

gtagctaccc agaatgctac taccattcag gtaagattgg gaagtccatc gggtacatta 1800

cttggaacaa tttacgtggg gtccacagga agctttgata cttataggga tgtatccgct 1860

accattagta atactgcggg tgtaaaagat attgttcttg tattttcagg tcctgttaat 1920

gttgactggt ttgtattctc aaaatcagga acttaa 1956<210> 268<211> 651<212> PRT<213> Bactéria<220>

<221> SIGNAL260 265 270

Asn Gly Arg Gly Ile Gly Tyr Ile Glu Asn Gly Asn Thr Val Thr Tyr 275 280 285 Ser Asn Ile Asp Phe Gly Ser Gly Ala Thr Gly Phe Ser Ala Thr Val 290 295 300 Ala Thr Glu Val Asn Thr Ser Ile Gln Ile Arg Ser Asp Ser Pro Ile305 310 315 320Gly Thr Leu Leu Gly Thr Leu Tyr Val Ser Ser Thr Gly Ser Trp Asn 325 330 335 Thr Tyr Gln Thr Val Ser Thr Asn Ile Ser Lys Ile Thr Gly Val His 340 345 350 Asp Ile Val Leu Val Phe Ser Gly Pro Val Asn Val Asp Asn Phe Ile 355 360 365 Phe Ser Arg Ser Ser Pro Val Pro Ala Pro Gly Asp Asn Thr Arg Asp 370 375 380 Ala Tyr Ser Ile Ile Gln Ala Glu Asp Tyr Asp Ser Ser Tyr Gly Pro385 390 395 400Asn Leu Gln Ile Phe Ser Leu Pro Gly Gly Gly Ser Ala Ile Gly Tyr 405 410 415 Ile Glu Asn Gly Tyr Ser Thr Thr Tyr Asn Asn Val Asn Phe Ala Asn 420 425 430 Gly Leu Ser Ser Ile Thr Ala Arg Val Ala Thr Gln Ile Ser Thr Ser 435 440 445 Ile Gln Val Arg Ala Gly Gly Ala Thr Gly Thr Leu Leu Gly Thr Ile 450 455 460 Tyr Val Pro Ser Thr Asn Ser Trp Asp Ser Tyr Gln Asn Val Thr Ala465 470 475 480Asn Leu Ser Asn Ile Thr Gly Val His Asp Ile Thr Leu Val Phe Ser 485 490 495 Gly Pro Val Asn Val Asp Tyr Phe Val Phe Thr Pro Ala Asn Val Asn 500 505 510 Ser Gly Pro Thr Ser Pro Val Gly Gly Thr Arg Ser Ala Phe Ser Asn 515 520 525 Ile Gln Ala Glu Asp Tyr Asp Ser Ser Tyr Gly Pro Asn Leu Gln Ile 530 535 540 Phe Ser Leu Pro Gly Gly Gly Ser Ala Ile Gly Tyr Ile Glu Asn Gly545 550 555 560Tyr Ser Thr Thr Tyr Lys Asn Ile Asp Phe Gly Asp Gly Ala Thr Ser 565 570 575 Val Thr Ala Arg Val Ala Thr Gln Asn Ala Thr Thr Ile Gln Val Arg 580 585 590 Leu Gly Ser Pro Ser Gly Thr Leu Leu Gly Thr Ile Tyr Val Gly Ser 595 600 605 Thr Gly Ser Phe Asp Thr Tyr Arg Asp Val Ser Ala Thr Ile Ser Asn 610 615 620 Thr Ala Gly Val Lys Asp Ile Val Leu Val Phe Ser Gly Pro Val Asn625 630 635 640Val Asp Trp Phe Val Phe Ser Lys Ser Gly Thr 645 650 <210> 269

<211> 1110<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 269

atggggtaca ataggátcat acaagcgatc cgcgtaagca agggagatgt tttgggcgttcataaagttt tttacgctgc acttgcgtgt gtggcgatgg ggtattcgga aacgtgggcacagtgcgcga cctggacccg aagcaccatt cgcaattgcg agggcatcga ctacgagttgtggaaccaga acaaccgcgg cacggtcaac atggaaatca cgggaaacgg aacgttcgcggcgacgtgga gcggaacgga aaacatcctg tttcgcgccg gcaagaaatg ggggttcaacagcaccacga cggcgcggtc ggtcggcgcc atcacgctcg atttcgctgc gacctggacctccagcgaca acgtgaaaat gctcggcatc tacggctggg cgtattaccc gtcgggaagcgagccgacga aaacggaaag cggtcaaaac acgagctttt ccgatcagat cgagtattacatcatccagg accgcggagg cttcaacccg ggttccggcg gcgtcaacgc caaaaagtacggcgaggccg tgatcgacgg aatcgcctat gacttttggg tggccgaccg gatcaaccagcccatgctga caggaagagg caacttcaag caatacttca gcgttccacg gaacacgagcagccaccggc aaagcggcat cgtcagcatt tcgaagcact ttgaggagtg ggacaaggcc 72 0

ggcatgaaga tgctggactg tccgctatac gaagtcgcga tgaaggtgga atcgtatacg 780

ggctcggcga atggcggcgg gtcggcgaac gtgacccgga atattctcac gctcggcggttcttccgcac cgacccctat cgcgcgcggc cccggccggt ccgccgaaag catgcgggtcgccttcgttc aggaaagagt gctcaaggtc gcgcccgtcg acggaacccg cctgcaagtcaaggtgcggg acgtgaaggg cgtgaaccgg gccgagttca atgccgcggg cgcggcaacg 1020ttctcgttgt cccatgtccc cgcgggcccg tatttcctgg atgtgacggg gccggatgta 1080agacagatca cgccgttcgt tttgcgataa 1110

<210> 270<211> 369<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 270

Met Gly Tyr Asn Arg Ile Ile Gln Ala Ile Arg Val Ser Lys Gly Asp

1 5 10 15

Val Leu Gly Val His Lys Val Phe Tyr Ala Ala Leu Ala Cys Val Ala

20 25 30

Met Gly Tyr Ser Glu Thr Trp Ala Gln Cys Ala Thr Trp Thr Arg Ser

35 40 45

Thr Ile Arg Asn Cys Glu Gly Ile Asp Tyr Glu Leu Trp Asn Gln Asn

50 55 60

Asn Arg Gly Thr Val Asn Met Glu Ile Thr Gly Asn Gly Thr Phe Ala65 70 75 80

Ala Thr Trp Ser Gly Thr Glu Asn Ile Leu Phe Arg Ala Gly Lys Lys

85 90 95

Trp Gly Phe Asn Ser Thr Thr Thr Ala Arg Ser Val Gly Ala Ile Thr

100 105 HO

Leu Asp Phe Ala Ala Thr Trp Thr Ser Ser Asp Asn Val Lys Met Leu

115 120 125

Gly Ile Tyr Gly Trp Ala Tyr Tyr Pro Ser Gly Ser Glu Pro Thr Lys

130 135 140

Thr Glu Ser Gly Gln Asn Thr Ser Phe Ser Asp Gln Ile Glu Tyr Tyr145 150 155 160

Ile Ile Gln Asp Arg Gly Gly Phe Asn Pro Gly Ser Gly Gly Val Asn

165 170 175

Ala Lys Lys Tyr Gly Glu Ala Val Ile Asp Gly Ile Ala Tyr Asp Phe

180 185 190

Trp Val Ala Asp Arg Ile Asn Gln Pro Met Leu Thr Gly Arg Gly Asn

195 200 205

Phe Lys Gln Tyr Phe Ser Val Pro Arg Asn Thr Ser Ser His Arg Gln

210 215 220

Ser Gly Ile Val Ser Ile Ser Lys His Phe Glu Glu Trp Asp Lys Ala225 230 235 240

Gly Met Lys Met Leu Asp Cys Pro Leu Tyr Glu Val Ala Met Lys Val

245 250 255

Glu Ser Tyr Thr Gly Ser Ala Asn Gly Gly Gly Ser Ala Asn Val Thr

260 265 270

Arg Asn Ile Leu Thr Leu Gly Gly Ser Ser Ala Pro Thr Pro Ile Ala

275 280 285

Arg Gly Pro Gly Arg Ser Ala Glu Ser Met Arg Val Ala Phe Val Gln

290 295 300

Glu Arg Val Leu Lys Val Ala Pro Val Asp Gly Thr Arg Leu Gln Val305 310 315 320

Lys Val Arg Asp Val Lys Gly Val Asn Arg Ala Glu Phe Asn Ala Ala

325 330 335

Gly Ala Ala Thr Phe Ser Leu Ser His Val Pro Ala Gly Pro Tyr Phe

340 345 350

Leu Asp Val Thr Gly Pro Asp Val Arg Gln Ile Thr Pro Phe Val Leu355 360 365

Arg

<210> 271

<211> 1128

<212> DNA

<213> Desconhecido

<220><223> Obtido para uma amostra ambiental.<400> 271

atgttcattc acaacagcat atgcagcgca ctctgcacaaatgggagaaa acatgacact acaagaagcc tttgccgatcatcagccaac gcctttttca accagatcgc gccgaaacgcttcaacagca tcacagccga aaatgagatg aagtggcagtgaataccgtt tcgaaaacgc cgataaattc gtccgctttgatcgttgggc acgttctctt ctggcacagc cagacacccggacggtaact tcgtctcccg cgaagtctta ctcgaccgcacttgtccagc gctacggcaa ccatgtgcac gcctgggatggataatggtt ccttgcgcga cagcccatgg acgcaaatcccacgccttcc ggattgccgg cgaggaactc cccccccatgtattcgatga ccattcctgc caagcgcgat gctgttgctggccaaaggca tccgcattga cggcgttggc atgcagggacaccatagcgg acatagaaaa aagcattctt gccttcgcagatcactgagc tcgacatcga catgctgcca cgccatccccgacaccatgt tgcgcctaca acaagatccc aaactcgaccgcggaagatc agcaggcatt ggcagaacgc tacgcaagcacacagcgatg ttattcgccg tgtcaccttc tggggggtcaaacaattggc ccatccgtgg ccgcaccagc catcccctgccccaaacccg ccttccacgc cgtcgtcaga ctgaagaccg<210> 272<211> 375<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(22)<400> 272

Met Phe Ile His Asn Ser Ile Cys Ser Ala Leu

15 10

Ala Thr Ala Thr Met Gly Glu Asn Met Thr Leu

20 25

Asp His Phe Tyr Val Gly Ala Ala Ile Ser Gln

tctttttggcacttttatgttgcaactggccgttaaatccgtgtcgaaaaactggctctttgcgcgcccattatcaatgatcggcgaggatcgagctgctaaatggttcgattgggcacggaaccggcgtagatgtttaccctacactgatcttccgtttccgatgcccatcttcgaccgaagactga

aactgcaacagggagccgcccgcgcaccaacactcctggccgatatgtaccaaggatgaccgtgcgcaataaccttcaatattcatcgagctacaatgatcgacctcatagacccacccgacaggtacactggtggtgcagggacttccaattcttgaagcacctggctcccagaacaac

35

40

Asp Arg Ala Glu Thr Leu Gln Leu Ala Ala His

50

55

40 Thr Ala Glu Asn Glu Met Lys Trp Gln Ser Leu

Cys Thr

Gln Glu

Arg Leu

45Gln Phe60

Asn Pro

65

70

75

Ile Phe Leu15

Ala Phe Ala30

Phe Gln Pro

Asn Ser Ile

Thr Pro Gly80

Glu Tyr Arg Phe Glu 85 Asn Ala Asp Lys Phe 90 Val Arg Phe Gly Val 95 Glu Asn Asp Met Tyr Ile Val Gly His Val Leu Phe Trp His Ser Gln Thr45 100 105 110 Pro Asp Trp 115 Leu Phe Lys Asp Asp 120 Asp Gly Asn Phe Val 125 Ser Arg Glu Val Leu 130 Leu Asp Arg Met Arg 135 Ala His Val Arg Asn 140 Leu Val Gln Arg50 Tyr Gly Asn His Val His Ala Trp Asp Val Ile Asn Glu Thr Phe Asn 145 150 155 160 Asp Asn Gly Ser Leu Arg Asp Ser Pro Trp Thr Gln Ile Leu Gly Glu 165 170 175 Glu Phe Ile Glu His Ala Phe Arg Ile Ala Gly Glu Glu Leu Pro Pro55 180 185 190 His Val Glu 195 Leu Leu Tyr Asn Asp 200 Tyr Ser Met Thr Ile 205 Pro Ala Lys Arg Asp 210 Ala Val Ala Glu Met 215 Val Arg Asp Leu Ile 220 Ala Lys Gly Ile60 Arg 225 Ile Asp Gly Val Gly 230 Met Gln Gly His Trp 235 Ala Arg Thr His Pro 240 Thr Ile Ala Asp Ile 245 Glu Lys Ser Ile Leu 250 Ala Phe Ala Gly Thr 255 Gly Val Gln Val His Ile Thr Glu Leu Asp Ile Asp Met Leu Pro Arg His65 260 265 270 Pro Gln Met 275 Phe Thr Gly Gly Ala 280 Asp Thr Met Leu Arg 285 Leu Gln Gln

60120180240300360420480540600660720780840900960102010801128Asp Pro Lys Leu Asp Pro Tyr Thr Glu Gly Leu Pro Ala Glu Asp Gln

290 295 300

Gln Ala Leu Ala Glu. Arg Tyr Ala Ser Ile Phe Arg Leu Phe Leu Lys305 310 315 320

His Ser Asp Val Ile Arg Arg Val Thr Phe Trp Gly Val Thr Asp Ala

325 330 335

His Thr Trp Leu Asn Asn Trp Pro Ile Arg Gly Arg Thr Ser His Pro

340 345 350

Leu Leu Phe Asp Arg Gln Asn Asn Pro Lys Pro Ala Phe His Ala Val

355 360 365

Val Arg Leu Lys Thr Glu Asp370 375

<210> 273<211> 1134<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 273

atggtttcat cgctaatcaa ttcttcatac attcggctca agcactattc gtgctcaagtttattgctcc tgacattggc agcctgtggc ggccagcagc ctcccccgga tacgggatccagcacttcaa gttcaagcag ttcttcgagc tccagttcaa gcagctcttc aagttccagctcaagcagtt cttccagctc cagctcgagc agctcttcga gttcgagctc ttcatcatccagctcttcag gggcaaaccc gccaccgacc gggggcaagt tcgtcggcaa catcacgacccgaggcgccg tccaagcgga cttcattcag tactgggatc aaattacgcc ggagaacgagggcaaatggg gttctgtgga aggaactcgc gaccagtaca actgggcgcc tcttgatcgcatctatgact atgcacgtca gcacaatatc ccagtcaaag cgcatacgct ggtttggggtgcacaggctc caggctggat caacaatctg agtgcggccg agcagcgtga ggaaatcgaggaatggattc gtgattactg cacgcgttac ccagacaccc aaatgatcga cgtagttaacgaggcgcacc caaatcacgc ccccgctcgc tatgcgcaga atgccttcgg caatgactggattaccgaag cgttcaaact ggcgcgccgg cactgcccca acgccatttt gatctacaacgactataatt tcatcacttg ggataccgat gaaatcatgg cgctgattcg cccggctatcgcagcagggg tagtggatgc ggtagggctg caggcgcata gcttgtatcc tgacgaatacgctaacaaga tgtggagtgc cgctgaaata cagcagaagc tcgatctgat ctctacccttggcgtgccga tgtatatttc ggaatatgat gtcgccaagt ccaatgacca agagcãgttggcgattttca gcgagcagtt cccggtcctt tacgaacacc ccaatgtcgt aggtgtaaccctctggggct atattgatgg agcgacgtgg cgcgccggct cgggcttgat tcgaaacggtcagcaccggc ccgccatgca atggctgctc gagtacttgg agaacaatcg atag<210> 274<211> 377<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(74)<400> 274

Met Val Ser Ser Leu Ile Asn Ser Ser Tyr Ile Arg Leu Lys His Tyr

1 5 10 15

Ser Cys Ser Ser Leu Leu Leu Leu Thr Leu Ala Ala Cys Gly Gly Gln

20 25 30

Gln Pro Pro Pro Asp Thr Gly Ser Ser Thr Ser Ser Ser Ser Ser Ser

35 40 45

Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser

50 55 60

Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser65 70 75 80

Ser Ser Ser Gly Ala Asn Pro Pro Pro Thr Gly Gly Lys Phe Val Gly

85 90 95

Asn Ile Thr Thr Arg Gly Ala Val Gln Ala Asp Phe Ile Gln Tyr Trp

100 105 HO

Asp Gln Ile Thr Pro Glu Asn Glu Gly Lys Trp Gly Ser Val Glu Gly

115 120 125

Thr Arg Asp Gln Tyr Asn Trp Ala Pro Leu Asp Arg Ile Tyr Asp Tyr

130 135 140

Ala Arg Gln His Asn Ile Pro Val Lys Ala His Thr Leu Val Trp Gly145 150 155 160 Ala Gln Ala Pro Gly 165 Trp Ile Asn Asn Leu 170 Ser Ala Ala Glu Gln 175 Arg Glu Glu Ile Glu Glu Trp Ile Arg Asp Tyr Cys Thr Arg Tyr Pro Asp 180 185 190 Thr Gln Met 195 Ile Asp Val Val Asn 200 Glu Ala His Pro Asn 205 His Ala Pro Ala Arg 210 Tyr Ala Gln Asn Ala 215 Phe Gly Asn Asp Trp 220 Ile Thr Glu Ala Phe 225 Lys Leu Ala Arg Arg 230 His Cys Pro Asn Ala 235 Ile Leu Ile Tyr Asn 240 Asp Tyr Asn Phe Ile 245 Thr Trp Asp Thr Asp 250 Glu Ile Met Ala Leu 255 Ile Arg Pro Ala Ile Ala Ala Gly Val Val Asp Ala Val Gly Leu Gln Ala 260 265 270 His Ser Leu 275 Tyr Pro Asp Glu Tyr 280 Ala Asn Lys Met Trp 285 Ser Ala Ala Glu Ile 290 Gln Gln Lys Leu Asp 295 Leu Ile Ser Thr Leu 300 Gly Val Pro Met Tyr 305 Xle Ser Glu Tyr Asp 310 Val Ala Lys Ser Asn 315 Asp Gln Glu Gln Leu 320 Ala Ile Phe Ser Glu 325 Gln Phe Pro Val Leu 330 Tyr Glu His Pro Asn 335 Val Val Gly Val Thr Leu Trp Gly Tyr Ile Asp Gly Ala Thr Trp Arg Ala 340 345 350 Gly Ser Gly 355 Leu Ile Arg Asn Gly 360 Gln His Arg Pro Ala 365 Met Gln Trp Leu Leu 370 Glu Tyr Leu Glu Asn 375 Asn Arg

<210> 275

<211> 1401

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 275

ttgggcgctg atccatttgc gctcacctat aacggaagag tgtacattta tatgtcgagt 60

gatgactatg aatatcacag caatggaacg attaaggata attcttttgc caatttgaat 120

agggtctttg tcatctcttc agcagatatg gtgaactgga cagatcatgg cgcgattcca 180

gtagctgggg caaatggcgc aaatggcggc aaaggaattg ccaaatgggc aggtgcttcc 240

tgggctccat cagcagcggt gaaaaaaatc aatgggaagg ataaattttt cctttatttc 300

gcgaacagcg gcggagggat tggcgttctg acagcagact cccccatcgg tccatggaca 3 60

gatcctatcg gaaaagcact cgtcacgcca aatacaccag ggatggctgg agttgtatgg 420

ctttttgatc ctgccgtttt tgtagatgat gacggcactg gttatctata tgccggcgga 480

ggtgttccag gcggttctaa tccaacgcag ggacaatggg cgaatcctaa aacagcaaga 540

gttctaaaac taggacctga tatgacaagt gtggtaggca gcgcatcaac cattgatgct 600

ccttttatgt ttgaagattc ggggatgcat aagtataacg gaacctatta ctattcctat 660

tgcatcaact ttggcggctc ccacccagca gataaaccac ctggtgagat cggttatatg 72 0

acgagctcaa gtccgatggg tccctttacg tatagagggc acttcctgaa aaatccgggt 780

gcatttttcg ggggaggcgg taataaccat catgctgtgt tcaattttaa aaacgagtgg 840

tatgtcgtgt atcataccca aacggtcagc tctgctttat acggatcagg aaaaggctac 900

agatctccgc atattaataa acttgtgcat aatgctgacg gctcccttcg agaagtcgca 960

gccaattttg aaggggttaa acagctttcc aacctgaatc cttatcagcg tgtagaagct 102 0

gaaacattcg catggaatgg acgcattttg acagaggcat cttcagctcc aggcggaccg 1080

gtcaataacc agcatgtcac aaacattcaa aacggagatt gggtggctgc cagtaacgtc 1140

gatttcggat caaacggcgc gaggacattt aaagcgaatg tagcatcaaa tacaggcggg 1200

aaaatagaag tacgcctcgg aagtccagac ggcagactcg tcggaacact gaatgtccct 1260

tccacagggg gaacaaataa ctggcgagaa gtagaaacgg cagtaaatgg agcagcaggc 1320

gtgcacaacg tattttttgt ttttactgga acaggtgcaa atctatttca atttgattcc 1380

tggcagttta ctcaaaggta a ±4Ui<210> 276<211> 466<212> PRT<213> Desconhecido

<220><223> Obtido para uma amostra ambiental.<400> 276Met Gly Ala Asp Pro Phe Ala Leu Thr Tyr Asn Gly Arg Val Tyr Ile1 5 10 15 Tyr Met Ser Ser Asp Asp Tyr Glu Tyr His Ser Asn Gly Thr Ile Lys 20 25 30 Asp Asn Ser Phe Ala Asn Leu Asn Arg Val Phe Val Ile Ser Ser Ala 35 40 45 Asp Met Val Asn Trp Thr Asp His Gly Ala Ile Pro Val Ala Gly Ala 50 55 60 Asn Gly Ala Asn Gly Gly Lys Gly Ile Ala Lys Trp Ala Gly Ala Ser65 70 75 80Trp Ala Pro Ser Ala Ala Val Lys Lys Ile Asn Gly Lys Asp Lys Phe 85 90 95 Phe Leu Tyr Phe Ala Asn Ser Gly Gly Gly Ile Gly Val Leu Thr Ala 100 105 110 Asp Ser Pro Ile Gly Pro Trp Thr Asp Pro Ile Gly Lys Ala Leu Val 115 120 125 Thr Pro Asn Thr Pro Gly Met Ala Gly Val Val Trp Leu Phe Asp Pro 130 135 140 Ala Val Phe Val Asp Asp Asp Gly Thr Gly Tyr Leu Tyr Ala Gly Gly 145 150 155 160Gly Val Pro Gly Gly Ser Asn Pro Thr Gln Gly Gln Trp Ala Asn Pro 165 170 175 Lys Thr Ala Arg Val Leu Lys Leu Gly Pro Asp Met Thr Ser Val Val 180 185 190 Gly Ser Ala Ser Thr Ile Asp Ala Pro Phe Met Phe Glu Asp Ser Gly 195 200 205 Met His Lys Tyr Asn Gly Thr Tyr Tyr Tyr Ser Tyr Cys Ile Asn Phe 210 215 220 Gly Gly Ser His Pro Ala Asp Lys Pro Pro Gly Glu Ile Gly Tyr Met225 230 235 240Thr Ser Ser Ser Pro Met Gly Pro Phe Thr Tyr Arg Gly His Phe Leii 245 250 255 Lys Asn Pro Gly Ala Phe Phe Gly Gly Gly Gly Asn Asn His His Ala 260 265 270 Val Phe Asn Phe Lys Asn Glu Trp Tyr Val Val Tyr His Thr Gln Thr 275 280 285 Val Ser Ser Ala Leu Tyr Gly Ser Gly Lys Gly Tyr Arg Ser Pro His 290 295 300 Ile Asn Lys Leu Val His Asn Ala Asp Gly Ser Leu Arg Glu Val Ala305 310 315 320Ala Asn Phe Glu Gly Val Lys Gln Leu Ser Asn Leu Asn Pro Tyr Gln 325 330 335 Arg Val Glu Ala Glu Thr Phe Ala Trp Asn Gly Arg Ile Leu Thr Glu 340 345 350 Ala Ser Ser Ala Pro Gly Gly Pro Val Asn Asn Gln His Val Thr Asn 355 360 365 Ile Gln Asn Gly Asp Trp Val Ala Ala Ser Asn Val Asp Phe Gly Ser 370 375 380 Asn Gly Ala Arg Thr Phe Lys Ala Asn Val Ala Ser Asn Thr Gly Gly 385 390 395 400Lys Ile Glu Val Arg Leu Gly Ser Pro Asp Gly Arg Leu Val Gly Thr 405 410 415 Leu Asn Val Pro Ser Thr Gly Gly Thr Asn Asn Trp Arg Glu Val Glu 420 425 430 Thr Ala Val Asn Gly Ala Ala Gly Val His Asn Val Phe Phe Val Phe 435 440 445 Thr Gly Thr Gly Ala Asn Leu Phe Gln Phe Asp Ser Trp Gln Phe Thr 450 455 460 Gln Arg 465

<210> 277

<211> 1128

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 277atgcgaaaca cattaatcct tttgattccg gccttgatgaaatcaggata gagtaccatc cctgcacgcc gagttctcgggcgctgaatt ctgagcagat attgggtcgg gatacacgcgcattttaacg ccattacgcc cgaaaacatt accaaatgggggtgtctatg attttaaaga ggctgatgca ttcgtcgattttcatggtgg gtcatacact ggtttggcat agtcagacacgaaaatggcg cgttggtatc gcgcgaggta ctgttagagcaccgttgttg gccgctaccg tggacgtatt cacggctgggaatgaagacg gttcgtacag agaaacactg tggtaccaaacttaaagcat tcgaatttgc ccgggaggcc gatcccgacgtactcgcttg agaacccctc aaagagagcc ggcgcgatgcgaacatggtg ctccgattac tggggttgga acccaggggcgaactttctg aaattgaaca gaccgtcatt gattttgcctattaccgaat tggatatcga tgtactgcct cagccagacgaattttagcg cagagcttta cgacgaactg aacccatggcattgaacagg aattggccaa tcgatatgcc gacatcttcggataaagtta cgcgagtgtc tttttggggt gtcacagatgtggcctgtgc caggtcgtac caactatccg ctcatttttgcccgcttttt tctcgattgt tgatgcagcc agggaggcac<210> 278<211> 375<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(19)<400> 278

Met Arg Asn Thr Leu Ile Leu Leu Ile Pro Ala

15 10

Cys Ser Ala Gly Asn Gln Asp Arg Val Pro Ser

20 25

Ser Asp Ala Phe Leu Ile Gly Thr Ala Leu Asn

35 40

Gly Arg Asp Thr Arg Gly Leu Glu Leu Ile Arg

50 55

Ile Thr Pro Glu Asn Ile Thr Lys Trp Glu Ala65 70 75

Gly Val Tyr Asp Phe Lys Glu Ala Asp Ala Phe

85 90

Lys Tyr Asn Met Phe Met Val Gly His Thr Leu

100 105

Thr Pro Arg Trp Val Phe Lys Asp Glu Asn Gly

115 120

Glu Val Leu Leu Glu Arg Met Arg Asp His Ile

130 135

Arg Tyr Arg Gly Arg Ile His Gly Trp Asp Val

tgctttcttgatgcatttttgactcgaattaggctatccattggccaaaacgcgctgggtggatgcgcgaatgtcgtaaataattggtacctgagctatagaattgttcaatttcaccctcccttggtatattatactggccaacggcctaaatctatttgcgactcgtgatcgaaactgtggattaa

cagtgcgggagattggaacggattagaacttcccgaacccatataatatgcttcaaagacccacatccaccgaagccctcggactatattctataacgatatacctgcagcgactggcccggatgtaatgcgccgatgtgtccaccggaagcgtcatcgtgaaaaataacgaagccaaaa

Leu Met MetLeuSer

Thr60Ile

Val

Ala

His140Val

His Ala

30Glu Gln45

His Phe

145

150

155

165

170

Asn Glu Asp Gly Ser Tyr Arg Glu Thr Leu Trp Tyr

ArgGlu

Thr Asp Tyr Ile Leu Lys Ala Phe Glu Phe Ala

180 185

Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Leu

195 200

Arg Ala Gly Ala Met Arg Ile Val Gln Tyr Leu Gln210 215 220

Pro Ile Thr Gly Val Gly Thr Gln Gly His Phe Thr225 230 235

Glu Leu Ser Glu Ile Glu Gln Thr Val Ile Asp Phe

245 250

Met Asp Val Met Ile Thr Glu Leu Asp Ile Asp Val

260 265

Asp Asp Tyr Thr Gly Ala Asp Val Asn Phe Ser Ala

275 280

Glu Leu Asn Pro Trp Pro Asn Gly Leu Pro Pro Glu290 295 300

His Pro

Asp Phe

Trp His110Leu Val125

Thr Val

Asn Glu

Gln Ile

Glu Ala190Asn Pro205

Glu His

Leu Asp

Ala Ser

Leu Pro270Glu Leu285

Ile Glu

Leu Ser15

Glu Phe

Ile Leu

Asn Ala

Glu Pro80

Gly Gln95

Ser Gln

Ser Arg

Val Gly

Ala Leu160Ile Gly175

Asp Pro

Ser Lys

Gly Ala

Trp Pro240Leu Gly255

Gln ProTyr AspGln Glu

60120180240300360420480540600660720780840900960102010801128Leu Ala Asn Arg Tyr Ala Asp Ile Phe Glu Ile Tyr Leu Arg His Arg305 310 315 320

Asp Lys Val Thr Arg Val Ser Phe Trp Gly Val Thr Asp Gly Asp Ser325 330 335

Trp Lys Asn Asn Trp Pro Val Pro Gly Arg Thr Asn Tyr Pro Leu Ile340 345 350

Phe Asp Arg Asn Trp Lys Pro Lys Pro Ala Phe Phe Ser Ile Val Asp

355 360 365

Ala Ala Arg Glu Ala Leu Asp370 375

<210> 279<211> 786<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 279

atgctttctc cgacaaggaa actcccgccg gccattggac tcaccttcct cttcgccgct 60

tcggcgacgc cggaaaccac gctcaaggac gccttcgcgg accattttct cgtcggggcg 120

gcgctcaatg aatcgcactt tgcggagcac aatccggcgc acgccggtct cgtcgccgca 180

aacttcaatg cgatcaccgc ggagaatgtg atgaaatggg aggccgttca tccccggccg 240

ggagaatata cgttcggcgc cgcggaccgg ttcgttgagt tcggggaaaa gaacggcctg 300

ttcatcgtgg ggcacacgct gatctggcat tctcaaacgc cggcctgggt tttcgaggat 360

gagaatggcg cgccgctcgg ccgcgaggcg ctgctggagc ggatgcgcga tcacattcac 420

accgttgccg gacgttacag gggccgtgtg aaggggtggg acgtggtcaa cgaagccctc 480gccgaggacg gttccctgcg ggattcgccg tggcgccgca tcataggcga cgactatttc 540

gtgaaggcct ttgagtttgc gcgggaagct gatccggatg cggagttgta ttacaacgat 600

tactcgattg aaaacgaacc gaagcgcaag.ggggcggtgg cgttggtgag gacgctccag 660

gcggcgggtg ttcccgttgc cggcgtgggg attcagggac acggcaatct ccattggcct 720

tctccgcggc ttgtcgaaga ggcgatccgg gactttgcca gtttgggcgt caaggtgatg 780atctga 786

<210> 280<211> 261<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<22 0>

<221> SIGNAL

<222> (1)...(22)

<400> 280

Met Leu Ser Pro Thr Arg Lys Leu Pro Pro Ala Ile Gly Leu Thr Phe

1 5 10 15

Leu Phe Ala Ala Ser Ala Thr Pro Glu Thr Thr Leu Lys Asp Ala Phe

20 25 30

Ala Asp His Phe Leu Val Gly Ala Ala Leu Asn Glu Ser His Phe Ala

35 40 45

Glu His Asn Pro Ala His Ala Gly Leu Val Ala Ala Asn Phe Asn Ala50 55 60

Ile Thr Ala Glu Asn Val Met Lys Trp Glu Ala Val His Pro Arg Pro65 70 75 80

Gly Glu Tyr Thr Phe Gly Ala Ala Asp Arg Phe Val Glu Phe Gly Glu

85 90 95

Lys Asn Gly Leu Phe Ile Val Gly His Thr Leu Ile Trp His Ser Gln

100 105 110

Thr Pro Ala Trp Val Phe Glu Asp Glu Asn Gly Ala Pro Leu Gly Arg

115 120 125

Glu Ala Leu Leu Glu Arg Met Arg Asp His Ile His Thr Val Ala Gly130 135 140

Arg Tyr Arg Gly Arg Val Lys Gly Trp Asp Val Val Asn Glu Ala Leu145 150 155 160

Ala Glu Asp Gly Ser Leu Arg Asp Ser Pro Trp Arg Arg Ile Ile Gly

165 170 175

Asp Asp Tyr Phe Val Lys Ala Phe Glu Phe Ala Arg Glu Ala Asp Pro

180 185 190

Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Ile Glu Asn Glu Pro Lys195 200 205Arg Lys Gly Ala Val Ala Leu Val Arg Thr Leu

210 215

Pro Val Ala Gly Val Gly Ile Gln Gly His Gly225 230 235

Ser Pro Arg Leu Val Glu Glu Ala Ile Arg Asp

245 250

Val Lys Val Met Ile260

<210> 281<211> 963<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 281

gtgggcacct gcatgagcgg ggccgattcg cgcaaccctgacgcagtaca gcatcatcac cccggaaaac gagctcaagcgctgccagcc gtgctctggc caaggaggac gataccgccggccgctccca tcctgaactt tgcccgtgac aacggcatcagtctggcaca gccagactcc cgaggagttc ttccacgaggtatgtgagcc gcgaggtgat gctggcccgt ctggacaacttatatggatg aaaactatcc cggcctgatc gtgtcctggggccgacggct ccaccgccct gcgcacctcc aactggacccgtggcccgcg ccttcgagat cgccgataaa tacgcgcccgaacgattatt ccactcccta tgagcccaag ctcaccggcactgacacagg agggtcatat cgacggctac ggcttccagaccctccctgc aggcggtcga gaacgcgttc aaaaagatctcgcgtgagcg agctggacat caaggtagat gccgacagcggccgaccggt atgaggccct gctgcgcatc tatatgaaatgtgtggggcg tatgcgacgg caccagctgg atcggcgcgagccgggctgc gtcccaagcc ctccttcttc ggcatactcctga<210> 282<211> 320<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 282

Gln Ala Ala Gly Val220

Asn Leu His Trp Pro240

Phe Ala Ser Leu Gly255

cccgtctggaccgattccgttggccgtgcaaggtgcacgggctataacgcacatccgtctatgtggccaagcgtggtgggaagatgtgattcgtgaacctgccactacagccgccctgggagcccaaccgacggcgtcaggctatcccctgcgcccttga

gctgatcagatctggatgtgtttcagcgcctcatgtgctgctccgcgccccatctttgaacgaatgcgtggcaggattttgctctgctacgctcaccgagtgtcggcgatgctcaagctgcgcccttcagcgccgtgcagcccctttgaccgaacagaac

Met Gly Thr Cys Met Ser Gly Ala Asp Ser Arg Asn Pro Ala Arg Leu1 5 10 15 Glu Leu Ile Arg Thr Gln Tyr Ser Ile Ile Thr Pro Glu Asn Glu Leu 20 25 30 Lys Pro Asp Ser Val Leu Asp Val Ala Ala Ser Arg Ala Leu Ala Lys 35 40 45 Glu Asp Asp Thr Ala Val Ala Val His Phe Ser Ala Ala Ala Pro Ile 50 55 60 Leu Asn Phe Ala Arg Asp Asn Gly Ile Lys Val His Gly His Val Leu65 70 75 80Val Trp His Ser Gln Thr Pro Glu Glu Phe Phe His Glu Gly Tyr Asn 85 90 95 Ala Ser Ala Pro Tyr Val Ser Arg Glu Val Met Leu Ala Arg Leu Asp 100 105 110 Asn Tyr Ile Arg Leu Ile Phe Glu Tyr Met Asp Glu Asn Tyr Pro Gly 115 120 125 Leu Ile Val Ser Trp Asp Val Ala Asn Glu Cys Val Ala Asp Gly Ser 130 135 140 Thr Ala Leu Arg Thr Ser Asn Trp Thr Arg Val Val Gly Gln Asp Phe145 150 155 160Val Ala Arg Ala Phe Glu Ile Ala Asp Lys Tyr Ala Pro Glu Asp Val 165 170 175 Met Leu Cys Tyr Asn Asp Tyr Ser Thr Pro Tyr Glu Pro Lys Leu Thr 180 185 190 Gly Ile Val Asn Leu Leu Thr Glu Leu Thr Gln Glu Gly His Ile Asp 195 200 205 Gly Tyr Gly Phe Gln Ser His Tyr Ser Val Gly Asp Pro Ser Leu Gln

60120180240300360420480540600660720780840900960963

210

215

220Ala Val Glu Asn Ala Phe Lys Lys Ile Ser Ala Leu Gly Leu Lys Leu225 230 235 240Arg Val Ser Glu Leu 245 Asp Ile Lys Val Asp 250 Ala Asp Ser Glu Pro 255 AsnArg Ala Leu Gln 260 Ala Asp Arg Tyr Glu 265 Ala Leu Leu Arg Ile 270 Tyr MetLys Tyr Gly Val Ser Ala Val Gln Val Trp Gly Val Cys Asp Gly Thr 275 280 285 Ser Trp 290 Ile Gly Ala Ser Tyr 295 Pro Leu Pro Phe Asp 300 Ala Gly Leu ArgPro Lys Pro Ser Phe Phe Gly Ile Leu Arg Ala Leu Asp Glu Gln Asn

305 310 315 320

<210> 283

<211> 4161

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 283

atgtataaaa gtttcgtcaa gaaagtctcc cttgtattat ctactctttt gctcttagtttcggcgtttc ctgtctcata tgcacaaatg aattccatcc ccgtttatga agaaacgtttgaaaaccaag gaaactatgt ccaatctggt ggtgcgaccc tcactctagt aaaaaacaaagtgtttgcag ggaatgaaga tggaactgca ctatatatta gtaatcgatc gaataactgggacggggcag atttccgttt cacggatctt ggattacaag atggaaaaac atatacgatcaatattatag gatatgtcga tgaaaatgaa gttgttcctt caggagccca agtgtatttgcaaactgtag ataaaacata tggatggtta gcaagcgcgg acttaaaaaa cggagagtcgttcactataa atacaacgtt cacccttgac atgagtaaag gggacacccg tcttcgtatacaatccaacg atagtggtaa aaaagtttca ttttacgtcg ggtatttttc aatttcaattagtgatgtag aaggagaaga tggtgggagc tctatttcaa ggccaccggc tttaccttttgaaactattg actttgaaga tcaaagttta agtggatttg agggacgagc aggcacggaaacattgaccg ttacgaatga agcaaataga actcctggag gatcttatgc actaaaagtggaaaatagat ctcaaaattg gcatggacct tccttacgca tcgagaaata tattgatttaggttacgaat atacaatttc tctatgggtt aaacttattt cacccacaag tgcacaaattcagctttcta cccaagtcgg aagtggaagt ggtgcgagtt ataacaatat tttaagtaaagtaattagtg ttgatgatgg atgggtactg tatgaaggaa agtatcgcta caatagttcgggaggggaat atttaacaat ttacgtagaa agcccaaaca atagtactgc atctttttacatcgatgata ttcgtttaat aaagagtgga gacccaatct ctgtacaaaa agatcttctccctatcaaga gtgtttatga aggtgacttc ttagttggta gtgccgtatc agcgactgatttagagggag agagactcga gcttctcaag ttgcattaca atagcataac agcggaaaacgccatgaaac ctagctattt acaacctact aaaggaaact ttaccttcga agcagcagatagtattgtaa ataaagccct agaagaagga atgaaagtac atggacatgt tctcgtatggcatcagcaga cacctgaatg gatgaccact agagaagatg gaagccctct cggcagggaagaagcgttag aaaatctaaa aaatcacatt gaaacagtta tgaaacattt tggtgatagagtaatttcat gggatgttgt caatgaagct atcattgata atccacctaa tcctgataattgggaggaat cattaagaaa atcaccatgg tactattcaa tcggttctga ttatgttgagcaagcattcc gaattgcacg acaagttttg gacgaaaatg ggtgggatat taagctatattacaatgatt acaatgaaga taatcaaaga aaagcacaag ccatttacca tatggtaaaagagcttaatg aaaaatatgc acaagagcat cctggtaaaa gattaatcga tggaattggaatgcaagggc attacagtat acgaacaaat ccagataatg tgaaaatgtc attagaaagatttatttccc ttggtgtgga agttagtatt actgaactcg atattcaagc tggaacggataatcatctta cggaagaaca gtcaaaagca caagcatatt tatacgctaa attattcaaaatattcaaag aaaatgcatc gcatatctcc cgagttacgt tatggggatt aaatgatgcggcaagttggc gtgcgtcaac aagtccattg ttatttgatc gaaatttaca ggccaaaccaagttactatg cggtaattga tcctgataca tttatagaag aaaatcctac tgtgacagaagagtcgcgga aagcaattgc tttgtatggt atccctgtaa ttgatggaag catcgattccatttgggaaa gtgttcctta catccctatt gatcgttacc aaatggcgtg gcaaggagcaagcggaactg ctaaagttct ttgggacgaa gggaatctgt atgtattagt acaagttaacgatgaccagt tagataagtc gagtacaaat ccttgggagc aggattcgat agaggtgtttgtggacgaaa ataatgcaaa aacatcgttt taccaagagg atgatggaca atatagagtaaactttgaca acgaaacatc gtttaatcca ccaagcattg aaaatggatt tatgtccgaaactaatgtat ctgggactaa ttatgtggtg gagatgaaaa tccctttaag aagtatacaactaaaaaatg ggtctgaaat agggtttgat gttcaaatta atgatgggaa aaatggtgctcgtcagagtg tggctgcttg gaatgatacg actggaactg catatatgga tacatctgtattcgggacac ttactctttt aaccacttta gataatgaaa atacaccagg cagcggcacaacaccaggta gtggcacaac accaggcagt ggcacaacac caggcagcag cacaacaccaggcagcggta caacaccagg tagcggcaca acaccaggca gtggcacaac accaggcagcggcacaacac caggcagtgg cacaacacca ggcagtggca caacaccggg cagcggtacaacaccaggca gtggcacaac accaggcagt ggtacaacac cgggcagtgg cacaacacca 2940gtgaagggtg aaaatggtac ggttgtttta cagccgaaag tagagacgaa agaaaaagac 3000ggcaaagtag tagaaaaagt ggcaactatt tcaacaaatg aagttgaagc gattgtcaag 3060gagctgtcga atgaaaataa acaagtcgtc gtctccctcg gctcgcttcc aaaaggtgta 3120gccacaaaag tagatgtgcc agctacatta tttacacaag cggcaaataa acaagcágaa 3180gcaacgattg tgagcgccag tgaacaagcg acgtacaaat tgccagtcaa agaagtgcag 3240gcgtctcttg cgacgattgc ccggtcactc ggtgcaacga tagaacaagt tagcatctcg 3300attgaaatga aagtgaacga tgcgccgtca ctacgtgtga aaccgttgtc tgatgcggta 3360gagtttcatg tcgtggcgaa agcaaatgga aaggaacgcg tcatcgatcg gtttactcaa 3420tatgtcgaac gcgaaatcgc gttaaagcaa tcggtcaacg ctagtcgtgc cattgcagtg 3480cgcgtgaacg atgacggttc acttacccca gtaccgacaa cgtttgttgg caacaaagca 3540gtcattaaat cgttgacgaa ctcgacgtat gttgttgtgg aaggaacaca tacatttagt 3600gacatccaac cacattgggc gaaaggttat attgaaacac tcgcggcaaa acagcttgtc 3660aaagggatga cggacacaac atatcgacca aatgatcgga tgacgcgcgc gcaatttgcg 3720gtgttgctcg tacgggcgct aggattgccg agcgaaacgt atgacggtcg ctttgctgat 3780gtgaagggaa cggagtggtt taacaagaac ggtgaattag cagcggcagt caagttcgga 3840atcattcaag gaaaaacagc ttatatgttt gcgccgaatg agccaatcac tcgcgcacaa 3900gcagctgtca tgatcgaacg ggcattgaaa ctttcgatcg ttggctatga tgaggcaaca 3960agcgacaaaa cgaaaaaagt gacagatttc cgcgatgcaa aacaattgcc aacatgggca 4020aaacaggcga ttgaagcagt ataccaagca ggcatcatgc aaggacgaga tagcggaaac 4080tttgatccga caagccatgt gacgcgtgcc gaaatggcga aggtgttaat ggatatttta 4140gagttgacaa aacttattta a 4161

<210> 284<211> 1386<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220><221> SIGNAL

<222> (1) . . . (28)<400> 284

Met Tyr Lys Ser Phe Val Lys Lys Val Ser Leu Val Leu Ser Thr Leu1 5 10 15

Leu Leu Leu Val Ser Ala Phe Pro Val Ser Tyr Ala Gln Met Asn Ser20 25 30

Ile Pro Val Tyr Glu Glu Thr Phe Glu Asn Gln Gly Asn Tyr Val Gln

35 40 45

Ser Gly Gly Ala Thr Leu Thr Leu Val Lys Asn Lys Val Phe Ala Gly

50 55 60

Asn Glu Asp Gly Thr Ala Leu Tyr Ile Ser Asn Arg Ser Asn Asn Trp65 70 75 80

Asp Gly Ala Asp Phe Arg Phe Thr Asp Leu Gly Leu Gln Asp Gly Lys85 90 95

Thr Tyr Thr Ile Asn Ile Ile Gly Tyr Val Asp Glu Asn Glu Val Val100 105 110

Pro Ser Gly Ala Gln Val Tyr Leu Gln Thr Val Asp Lys Thr Tyr Gly

115 120 125

Trp Leu Ala Ser Ala Asp Leu Lys Asn Gly Glu Ser Phe Thr Ile Asn130 135 140

Thr Thr Phe Thr Leu Asp Met Ser Lys Gly Asp Thr Arg Leu Arg Ile145 150 155 160

Gln Ser Asn Asp Ser Gly Lys Lys Val Ser Phe Tyr Val Gly Tyr Phe165 170 175Ser Ile Ser Ile Ser Asp Val Glu Gly Glu Asp Gly Gly Ser Ser Ile180 185 190

Ser Arg Pro Pro Ala Leu Pro Phe Glu Thr Ile Asp Phe Glu Asp Gln

195 200 205

Ser Leu Ser Gly Phe Glu Gly Arg Ala Gly Thr Glu Thr Leu Thr Val

210 215 220

Thr Asn Glu Ala Asn Arg Thr Pro Gly Gly Ser Tyr Ala Leu Lys Val

225 230 235 240

Glu Asn Arg Ser Gln Asn Trp His Gly Pro Ser Leu Arg Ile Glu Lys

245 250 255

Tyr Ile Asp Leu Gly Tyr Glu Tyr Thr Ile Ser Leu Trp Val Lys Leu

260 265 270

Ile Ser Pro Thr Ser Ala Gln Ile Gln Leu Ser Thr Gln Val Gly Ser275 280 285 Gly Ser Gly Ala Ser Tyr Asn Asn Ile Leu Ser Lys Val Ile Ser Val 290 295 300 Asp Asp Gly Trp Val Leu Tyr Glu Gly Lys Tyr Arg Tyr Asn Ser Ser305 310 315 320Gly Gly Glu Tyr Leu Thr Ile Tyr Val Glu Ser Pro Asn Asn Ser Thr 325 330 335 Ala Ser Phe Tyr Ile Asp Asp Ile Arg Leu Ile Lys Ser Gly Asp Pro 340 345 350 Ile Ser Val Gln Lys Asp Leu Leu Pro Ile Lys Ser Val Tyr Glu Gly 355 360 365 Asp Phe Leu Val Gly Ser Ala Val Ser Ala Thr Asp Leu Glu Gly Glu 370 375 380 Arg Leu Glu Leu Leu Lys Leu His Tyr Asn Ser Ile Thr Ala Glu Asn385 390 395 400Ala Met Lys Pro Ser Tyr Leu Gln Pro Thr Lys Gly Asn Phe Thr Phe 405 410 415 Glu Ala Ala Asp Ser Ile Val Asn Lys Ala Leu Glu Glu Gly Met Lys 420 425 430 Val His Gly His Val Leu Val Trp His Gln Gln Thr Pro Glu Trp Met 435 440 445 Thr Thr Arg Glu Asp Gly Ser Pro Leu Gly Arg Glu Glu Ala Leu Glu 450 455 460 Asn Leu Lys Asn His Ile Glu Thr Val Met Lys His Phe Gly Asp Arg465 470 475 480Val Ile Ser Trp Asp Val Val Asn Glu Ala Ile Ile Asp Asn Pro Pro 485 490 495 Asn Pro Asp Asn Trp Glu Glu Ser Leu Arg Lys Ser Pro Trp Tyr Tyr 500 505 510 Ser Ile Gly Ser Asp Tyr Val Glu Gln Ala Phe Arg Ile Ala Arg Gln 515 520 525 Val Leu Asp Glu Asn Gly Trp Asp Ile Lys Leu Tyr Tyr Asn Asp Tyr 530 535 540 Asn Glu Asp Asn Gln Arg Lys Ala Gln Ala Ile Tyr His Met Val Lys545 550 555 560Glu Leu Asn Glu Lys Tyr Ala Gln Glu His Pro Gly Lys Arg Leu Ile 565 570 575 Asp Gly Ile Gly Met Gln Gly His Tyr Ser Ilé Arg Thr Asn Pro Asp 580 585 590 Asn Val Lys Met Ser Leu Glu Arg Phe Ile Ser Leu Gly Val Glu Val 595 600 605 Ser Ile Thr Glu Leu Asp Ile Gln Ala Gly Thr Asp Asn His Leu Thr 610 615 620 Glu Glu Gln Ser Lys Ala Gln Ala Tyr Leu Tyr Ala Lys Leu Phe Lys625 630 635 640Ile Phe Lys Glu Asn Ala Ser His Ile Ser Arg Val Thr Leu Trp Gly 645 650 655 Leu Asn Asp Ala Ala Ser Trp Arg Ala Ser Thr Ser Pro Leu Leu Phe 660 665 670 Asp Arg Asn Leu Gln Ala Lys Pro Ser Tyr Tyr Ala Val Ile Asp Pro 675 680 685 Asp Thr Phe Ile Glu Glu Asn Pro Thr Val Thr Glu Glu' Ser Arg Lys 690 695 700 Ala Ile Ala Leu Tyr Gly Ile Pro Val Ile Asp Gly Ser Ile Asp Ser705 710 715 720Ile Trp Glu Ser Val Pro Tyr Ile Pro Ile Asp Arg Tyr Gln Met Ala 725 730 735 Trp Gln Gly Ala Ser Gly Thr Ala Lys Val Leu Trp Asp Glu Gly Asn 740 745 750 Leu Tyr Val Leu Val Gln Val Asn Asp Asp Gln Leu Asp Lys Ser Ser 755 760 765 Thr Asn Pro Trp Glu Gln Asp Ser Ile Glu Val Phe Val Asp Glu Asn 770 775 780 Asn Ala Lys Thr Ser Phe Tyr Gln Glu Asp Asp Gly Gln Tyr Arg Val785 790 795 800Asn Phe Asp Asn Glu Thr Ser Phe Asn Pro Pro Ser Ile Glu Asn Gly

805 810 815Phe Met Ser Glu Thr Asn Val Ser Gly Thr Asn Tyr Val Val Glu Met

820 825 830

Lys Ile Pro Leu Arg Ser Ile Gln Leu Lys Asn Gly Ser Glu Ile Gly

835 840 845

Phe Asp Val Gln Ile Asn Asp Gly Lys Asn Gly Ala Arg Gln Ser Val

850 855 860

Ala Ala Trp Asn Asp Thr Thr Gly Thr Ala Tyr Met Asp Thr Ser Val

865 870 875 880

Phe Gly Thr Leu Thr Leu Leu Thr Thr Leu Asp Asn Glu Asn Thr Pro

885 890 895

Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr

900 905 910

Thr Pro Gly Ser Ser Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser

915 920 925

Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro

930 935 940

Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr

945 950 955 960

Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser Gly Thr Thr Pro Gly Ser

965 970 975

Gly Thr Thr Pro Val Lys Gly Glu Asn Gly Thr Val Val Leu Gln Pro

980 985 990

Lys Val Glu Thr Lys Glu Lys Asp Gly Lys Val Val Glu Lys Val Ala

995 1000 1005

Thr Ile Ser Thr Asn Glu Val Glu Ala Ile Val Lys Glu Leu Ser Asn

1010 1015 1020

Glu Asn Lys Gln Val Val Val Ser Leu Gly Ser Leu Pro Lys Gly Val

1025 1030 1035 1040

Ala Thr Lys Val Asp Val Pro Ala Thr Leu Phe Thr Gln Ala Ala Asn

1045 1050 1055

Lys Gln Ala Glu Ala Thr Ile Val Ser Ala Ser Glu Gln Ala Thr Tyr

1060 1065 1070

Lys Leu Pro Val Lys Glu Val Gln Ala Ser Leu Ala Thr Ile Ala Arg

1075 1080 1085

Ser Leu Gly Ala Thr Ile Glu Gln Val Ser Ile Ser Ile Glu Met Lys

1090 1095 1100

Val Asn Asp Ala Pro Ser Leu Arg Val Lys Pro Leu Ser Asp Ala Val1105 1110 1115 1120

Glu Phe His Val Val Ala Lys Ala Asn Gly Lys Glu Arg Val Ile Asp

1125 1130 1135

Arg Phe Thr Gln Tyr Val Glu Arg Glu Ile Ala Leu Lys Gln Ser Val

1140 1145 1150

Asn Ala Ser Arg Ala Ile Ala Val Arg Val Asn Asp Asp Gly Ser Leu

1155 1160 1165

Thr Pro Val Pro Thr Thr Phe Val Gly Asn Lys Ala Val Ile Lys Ser

1170 1175 1180

Leu Thr Asn Ser Thr Tyr Val Val Val Glu Gly Thr His Thr Phe Ser

1185 1190 1195 .1200

Asp Ile Gln Pro His Trp Ala Lys Gly Tyr Ile Glu Thr Leu Ala Ala

1205 1210 1215

Lys Gln Leu Val Lys Gly Met Thr Asp Thr Thr Tyr Arg Pro Asn Asp

1220 1225 1230

Arg Met Thr Arg Ala Gln Phe Ala Val Leu Leu Val Arg Ala Leu Gly

1235 1240 1245

Leu Pro Ser Glu Thr Tyr Asp Gly Arg Phe Ala Asp Val Lys Gly Thr

1250 1255 1260

Glu Trp Phe Asn Lys Asn Gly Glu Leu Ala Ala Ala Val Lys Phe Gly

1265 1270 1275 1280

Ile Ile Gln Gly Lys Thr Ala Tyr Met Phe Ala Pro Asn Glu Pro Ile

1285 1290 1295

Thr Arg Ala Gln Ala Ala Val Met Ile Glu Arg Ala Leu Lys Leu Ser

1300 1305 1310

Ile Val Gly Tyr Asp Glu Ala Thr Ser Asp Lys Thr Lys Lys Val Thr

1315 1320 1325

Asp Phe Arg Asp Ala Lys Gln Leu Pro Thr Trp Ala Lys Gln Ala Ile

1330 1335 1340

Glu Ala Val Tyr Gln Ala Gly Ile Met Gln Gly Arg Asp Ser Gly Asn<210><211>

1345 1350 1355 1360

Phe Asp Pro Thr Ser His Val Thr Arg Ala Glu Met Ala Lys Val Leu

1365 1370 1375

Met Asp Ile Leu Glu Leu Thr Lys Leu Ile1380 1385

2851569<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 285

gtgaaccgaa acacatctcc ggacttcaag cttggagcag gcgttacggt aagtgatttcctgaacaagg gcaggcaata tgaggtcgct gtggcgaatc ttgatgaaat gacggccggaaatgccatga agcagtcttc tgtaatgagg cctgacggat ccatggattt cactcaggtcagaagattca tcgaggaggc cgaacgtgtc ggaatgacag tgtacggcca tacattggcatggcattcac agcagcagaa cgcctatctt aacggtctga tcaagggcaa gaagaccgaggtcgagccag gccaggagtc agaggtcgtt cttctccaga cagatttcaa tgacggaaatgtcacattca acggatgggg aaacaattct tcaaggactg tcgagaatgg tgcattaaagcttacaaacc cttctgtagt aaacagttgg gaggcccagt tcgcatatga tttttcagaggccttcgaga tggacaagac atataagctc aagttcagga tcaagggctc ggctgcaggaaagatcgcgg caggcttcca gatcactgac ggctaccttt cggcaggtga gttcggaaccgtagagttca atacccagtg gaaggatgtc gagctctcat gcgtatgttc cgctgaaggcggtacacgct tgatcttcag tttcggagag tttgccggag atatctatat cgacgatttctgcttcagtg tggaaggagc tggatatatc tacgaagatc ttaccccggc agagaagaaggagcgcctta ccgaggcaat ggaccgttgg atcaagggaa tgatggaggt taccgctaccagggtttctg cgtgggatgc tgtcaatgag gcgatttccg gccgtgatac aaatggcgacggcttctatg aacttgagtc ggcacaatgg ggaagctcga acaacttcta ttggcaggattatctcggct caggagatta tgtgcgtatc gtgatcgcaa aggcccgcaa gtattatgaggaattcggcg gtacggctcc tttgagactc ttcatcaatg actacaacct cgaatctgactgggatgaca acaagaagct caagagcctt atccattgga tcggtgtctg ggagtctgacggagtgacaa agatcgacgg aatcggtacc cagatgcacg tttcgtatta cgagaatcctgatattcagg caagcaagga gaaacattat gtgcagatgc ttcagcttat ggcaaatacaggaaagctcg tgaagatctc cgagcttgat atgggctatg tagaccgcaa cggaaatactgtgggaacag cggacatgac cgaccagcag catagggcca tggcggatta ttatgacttcatcgtgcgca agtactttga gatcgtgcct cctgcacagc agtatggcat cacgcagtggtgcatgacgg atgctcccgg agctatcggc acaggctgga gaggcggtga gcctgtgggcctgtgggacc agaattacaa ccgcaagtat gcgtacgcag gatttgcaaa cggacttagagcgaaataa<210> 286<211> 522<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 286

Met Asn Arg Asn Thr Ser Pro Asp Phe Lys Leu Gly Ala Gly Val Thr

15 10 15

Val Ser Asp Phe Leu Asn Lys Gly Arg Gln Tyr Glu Val Ala Val Ala

20 25 30

Asn Leu Asp Glu Met Thr Ala Gly Asn Ala Met Lys Gln Ser Ser Val

35 40 45

Met Arg Pro Asp Gly Ser Met Asp Phe Thr Gln Val Arg Arg Phe Ile

50 55 60

Glu Glu Ala Glu Arg Val Gly Met Thr Val Tyr Gly His Thr Leu Ala

65

Trp His

70

75

80

Ser Gln Gln Gln Asn Ala Tyr Leu Asn Gly Leu Ile Lys Gly

85

90

95

Lys Lys Thr Glu Val Glu Pro Gly Gln Glu Ser Glu Val Val Leu Leu

100 105

Gln Thr Asp Phe Asn Asp Gly Asn Val Thr115 120

110

Phe Asn Gly Trp Gly Asn125

Asn Ser Ser Arg Thr Val Glu Asn Gly Ala Leu Lys Leu Thr Asn Pro

130

135

140

Ser Val Val Asn Ser Trp Glu Ala Gln Phe Ala Tyr Asp Phe Ser Glu

145

150

155

160

Ala Phe Glu Met Asp Lys Thr Tyr Lys Leu Lys Phe Arg Ile Lys Gly165 170 175

Ser Ala Ala Gly Lys Ile Ala Ala Gly Phe Gln Ile Thr Asp Gly Tyr

180 185 190

Leu Ser Ala Gly Glu Phe Gly Thr Val Glu Phe Asn Thr Gln Trp Lys5 195 200 205

Asp Val Glu Leu Ser Cys Val Cys Ser Ala Glu Gly Gly Thr Arg Leu

210 215 220

Ile Phe Ser Phe Gly Glu Phe Ala Gly Asp Ile Tyr Ile Asp Asp Phe225 230 235 240

10 Cys Phe Ser Val Glu Gly Ala Gly Tyr Ile Tyr Glu Asp Leu Thr Pro

245 250 255

Ala Glu Lys Lys Glu Arg Leu Thr Glu Ala Met Asp Arg Trp Ile Lys

260 265 270

Gly Met Met Glu Val Thr Ala Thr Arg Val Ser Ala Trp Asp Ala Val15 275 280 285

Asn Glu Ala Ile Ser Gly Arg Asp Thr Asn Gly Asp Gly Phe Tyr Glu

290 295 300

Leu Glu Ser Ala Gln Trp Gly Ser Ser Asn Asn Phe Tyr Trp Gln Asp305 310 315 320

20 Tyr Leu Gly Ser Gly Asp Tyr Val Arg Ile Val Ile Ala Lys Ala Arg

325 330 335

Lys Tyr Tyr Glu Glu Phe Gly Gly Thr Ala Pro Leu Arg Leu Phe Ile

340 345 350

Asn Asp Tyr Asn Leu Glu Ser Asp Trp Asp Asp Asn Lys Lys Leu Lys25 355 360 365

Ser Leu Ile His Trp Ile Gly Val Trp Glu Ser Asp Gly Val Thr Lys

370 375 380

Ile Asp Gly Ile Gly Thr Gln Met His Val Ser Tyr Tyr Glu Asn Pro385 390 395 400

30 Asp Ile Gln Ala Ser Lys Glu Lys His Tyr Val Gln Met Leu Gln Leu

405 410 415

Met Ala Asn Thr Gly Lys Leu Val Lys Ile Ser Glu Leu Asp Met Gly

420 425 430

Tyr Val Asp Arg Asn Gly Asn Thr Val Gly Thr Ala Asp Met Thr Asp35 435 440 445

Gln Gln His Arg Ala Met Ala Asp Tyr Tyr Asp Phe Ile Val Arg Lys

450 455 460

Tyr Phe Glu Ile Val Pro Pro Ala Gln Gln Tyr Gly Ile Thr Gln Trp465 470 475 480

40 Cys Met Thr Asp Ala Pro Gly Ala Ile Gly Thr Gly Trp Airg Gly Gly

485 490 495

Glu Pro Val Gly Leu Trp Asp Gln Asn Tyr Asn Arg Lys Tyr Ala Tyr

500 505 510

Ala Gly Phe Ala Asn Gly Leu Arg Ala Lys

45 515 520

<210> 287

<211> 1695

<212> DNA

<213> Desconhecido

50 <22 0>

<223> Obtido para uma amostra ambiental.<400> 287

atgactattc atctacaaaa aaatctgctc tttgcagcag tcttactgac agggcaagca 60

gcgcatgcgc tcacctccgg atctggcgag gccacgctgg atgttaataa cagctggggt 120

55 tcaggttatt gcgctaacgt caccattgcc aacaacggca gccaagccat tacttcctgg 180

acggttggcc tgaaccttaa cggcacgacg atcaataatc tttggaacgg taatttgagt 240

ggggttacgg ttacccccgt ggcctacaat gcgaatgtgg cgccgggtgc taataccagc 300

tttggtttct gtgctaatgg cagcgcaacc cccacgttgg cgacgtttga agttcaaggc 360

ggcggtggcg cagccagtag ttccagcagt tctgctattt caagcagctc cagcagttcg 420

60 gttgccggcg gcagcaacag cgtcaccgta cgcatgagcg gcgtaaccgg agacgaaagc 480

gtgagcctgg aaatcggtgg tcagaccatc gagacctgga ccctgagcgt cggtatgctc 540

gactacaccg tacagaccaa cgctaccggt gagttgcgtg ttgcgtttac caatgatgaa 600

ggtgaccgcg atgtcgaagt ggattacatc atggtcaacg gcgtgaccta tcaggccgaa 660

gatcaggaag ataacaccgg cgcgtgggac ggagagtgtg gtgcgggttc cttctcgcag 720

65 atgctgcact gcaacggttc tatcggcttt ggcaatccat tcgatggcag caactcgtcg 780

tccagctcca gcaacacttc gagctcgagc agcagctcta accctaaccc tggcaatccg 840

aatttccccg atttcttcgt aggtaacatc accaccagcg gctcagttcg ctctgacttc 900atgcagtatt gggatcaaat tacgccggaa aacgaaggta aatggggctc cgtagaggga 960

actcgcgacc agtacaactg gggtccgctg gatgcaattt acaatttcgc ccgtgcgaac 1020

ggtattcctg taaaagcgca cactctggtg tggggcagtc agcaaccggg ttggattggc 1080

ggcttgagtg ccgctgagca gcgcgcggaa attgaagagt ggattdgcga ttactgcgca 1140

cgctacccgg atacggcgat gatcgatgtg gtgaatgaag ctctgccttc gcacgctccg 1200

gcaaactatg cggccaatgc atttggaagc gattggatca ctgaatcctt ccgtttggca 1260

cgtcagtact gtccggatgc cgtgctgatc tacaacgact ataacttcat gacctgggac 1320

accgatgcca tcattcagat gattcgccca gccgtgaact ccggttatgt cgatgcactg 1380

ggtcttcaag cgcacagcct gtattcccca caagtctgga ccgctcagca aatccagagc 1440

aaattggatc agatttccga gttgggcttg ccgctgtaca tctccgagta cgacatcgaa 1500

gcaacgaatg atcagactca gttacagtac atgcagatgc acttcccgat cttctacaac 1560

catcccaacg tggccggtat taccctttgg ggttatgttg tgggtgctac ctggcgtgat 1620

ggcactggcc tgatccaaag caatggtcag cagcgcccgg ccatgcagtg gttgatggag 1680

tatctaaacc gctaa 1695

<210> 288

<211> 564<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<22 0>

<221> SIGNAL<222> (1)...(23)<400> 288

Met Thr Ile His Leu Gln Lys Asn Leu Leu Phe Ala Ala Val Leu Leu1 5 10 15

Thr Gly Gln Ala Ala His Ala Leu Thr Ser Gly Ser Gly Glu Ala Thr

20 25 30

Leu Asp Val Asn Asn Ser Trp Gly Ser Gly Tyr Cys Ala Asn Val Thr35 40 45

Ile Ala Asn Asn Gly Ser Gln Ala Ile Thr Ser Trp Thr Val Gly Leu

50 55 60

Asn Leu Asn Gly Thr Thr Ile Asn Asn Leu Trp Asn Gly Asn Leu Ser65 70 75 80

Gly Val Thr Val Thr Pro Val Ala Tyr Asn Ala Asn Val Ala Pro Gly

85 90 95

Ala Asn Thr Ser Phe Gly Phe Cys Ala Asn Gly Ser Ala Thr Pro Thr

100 105 110

Leu Ala Thr Phe Glu Val Gln Gly Gly Gly Gly Ala Ala Ser Ser Ser

115 120 125

Ser Ser Ser Ala Ile Ser Ser Ser Ser Ser Ser Ser Val Ala Gly Gly

130 135 140

Ser Asn Ser Val Thr Val Arg Met Ser Gly Val Thr Gly Asp Glu Ser145 150 155 160

Val Ser Leu Glu Ile Gly Gly Gln Thr Ile Glu Thr Trp Thr Leu Ser

165 170 175

Val Gly Met Leu Asp Tyr Thr Val Gln Thr Asn Ala Thr Gly Glu Leu

180 185 190

Arg Val Ala Phe Thr Asn Asp Glu Gly Asp Arg Asp Val Glu Val Asp195 200 205

Tyr Ile Met Val Asn Gly Val Thr Tyr Gln Ala Glu Asp Gln Glu Asp

210 215 220

Asn Thr Gly Ala Trp Asp Gly Glu Cys Gly Ala Gly Ser Phe Ser Gln225 230 235 240

Met Leu His Cys Asn Gly Ser Ile Gly Phe Gly Asn Pro Phe Asp Gly

245 250 255

Ser Asn Ser Ser Ser Ser Ser Ser Asn Thr Ser Ser Ser Ser Ser Ser

260 265 270

Ser Asn Pro Asn Pro Gly Asn Pro Asn Phe Pro Asp Phe Phe Val Gly275 280 285

Asn Ile Thr Thr Ser Gly Ser Val Arg Ser Asp Phe Met Gln Tyr Trp

290 295 300

Asp Gln Ile Thr Pro Glu Asn Glu Gly Lys Trp Gly Ser Val Glu Gly305 310 315 320

Thr Arg Asp Gln Tyr Asn Trp Gly Pro Leu Asp Ala Ile Tyr Asn Phe

325 330 335

Ala Arg Ala Asn Gly Ile Pro Val Lys Ala His Thr Leu Val Trp Gly340 345 350 Ser Gln Gln 355 Pro Gly Trp Ile Gly 360 Gly Leu Ser Ala Ala 365 Glu Gln ArgAla Glu 370 Ile Glu Glu Trp Ile 375 Arg Asp Tyr Cys Ala 380 Arg Tyr Pro AspThr Ala Met Ile Asp Val Val Asn Glu Ala Leu Pro Ser His Ala Pro385 390 395 400Ala Asn Tyr Ala Ala 405 Asn Ala Phe Gly Ser 410 Asp Trp Ile Thr Glu 415 SerPhe Arg Leu Ala 420 Arg Gln Tyr Cys Pro 425 Asp Ala Val Leu Ile 430 Tyr AsnAsp Tyr Asn 435 Phe Met- Thr Trp Asp 440 Thr Asp Ala Ile Ile 445 Gln Met IleArg Pro 450 Ala Val Asn Ser Gly 455 Tyr Val Asp Ala Leu 460 Gly Leu Gln AlaHis Ser Leu Tyr Ser Pro Gln Val Trp Thr Ala Gln Gln Ile Gln Ser465 470 475 480Lys Leu Asp Gln Ile 485 Ser Glu Leu Gly Leu 490 Pro Leu Tyr Ile Ser 495 GluTyr Asp Ile Glu 500 Ala Thr Asn Asp Gln 505 Thr Gln Leu Gln Tyr 510 Met GlnMet His Phe 515 Pro Ile Phe Tyr Asn 520 His Pro Asn Val Ala 525 Gly Ile ThrLeu Trp 530 Gly Tyr Val Val Gly 535 Ala Thr Trp Arg Asp 540 Gly Thr Gly LeuIle Gln Ser Asn Gly Gln Gln Arg Pro Ala Met Gln Trp Leu Met Glu545 550 555 560

Tyr Leu Asn Arg<210> 289<211> 2796<212> DNA<213> Desconhecido<22 0>

<223> Obtido para uma amostra ambiental.<400> 289

atgaagttca ctttgacacc gctgctgtgc gggttcgcct tattgttggg ttgcgcggtgcaggcaaccc cagccgcttc gttaaagcag gcctatcagc cgtttttcca tatcggcaccgcagtcagtc tggcgcaatt acaaccatcc aaagaacatg aacgcgcttt aattgcgcagcactttaaca gtctgaccgc cgaaaacctg atgaaatggg aggaaattca acccacggaaggcaactttg attttaaagc ggccgatcag ttggttgcgt ttgccgaacá acatcaaatgtggatgatcg gccataccat tctgtggcat gaacaaaccc cagactgggt gtttcaggggctggatggca aacccgccag caagcagctg ctactggccc gcttgaccaa acatatccaaacggtcgttg gccgttacca gggccgggtc aatggctggg atgtggtgaa tgàagcgctcaatgaagatg gcagcctgcg cgataccccg tggcggcgca ttttgggtga tgattacattgccaccactt ttgcgttggt gcatcaggtc gaccctaaag ccaaactcta ttacaacgattacaacctgt ttaaaccgga aaaacgcgcc ggggtgctgc ggattatcca acaactgcagcaaaaaaatg tgcctattca tgccattggt gaacaagcgc attacggcct tgattcgcctgcattcaaag acgttgaaga ttcgatcaac gcttttgctg ccaccggcct ggacgtgatgctaaccgaac tggagatttc agtattgccg tatccatccg gcatgacgca gggtgccgatatcagtcagc atcaggaatt gcaggaacaa ctaaacccct atcgcgatgg tttgcccaaagccgtcgaac aagcctggca acaacggtat ctcgatttgt tttcgctgtt attacgccagcagcaaaaac tgcatcgcgt gaccttctgg ggcttagatg atggccaaag ctggcgtaataatttcccga tgcgcggtcg caccgattac ccactgctgt ttgatcgcaa gctgcaagccaaaccgctgt taagcgcact gacggcatta gccgcagacc agactaaagc caagcccaaaatgaatcagc tgggctttgc gccgacttcg accaaactgt tgattgtgcc gggtcggcaatcagtgcctt ttcatgtttt ggataccgag accggccaaa cggtgctgca aggccaaagttcggcggcca ggttttggcc tgaatcgggg gaatgggtca gtgctgccga tttttctgcggtgataactc ccggcaccta tcagatcaac atctcaggaa cgccgccaca aactgtcaagatccaggccg aaccctatgc cgcgctgcat gatgcggcaa tcaaagccta ttattttaaccgcgcctcgc tcacactgga gccaaagttt gccggacctt gggcacgcgc agcggggcatccggatacca aagtacgggt gcatgcttct gctgcatcgg ccagcaggcc agaaggttatgagctcagcg ctgccaaagg ctggtatgac gccggtgact acaacaaata cgtggtgaattccggcatta ccagttacac cctgttgcag gcctggcagg attttcctga gttttatcaaagccggacct ggaatattcc ggagtccggc aacgcggtac cggacattct cgacgaaaccttatggaatc tgcagtggtt cagcgccatg caagacccaa acgacggggg cgtctatcacaagctgactg aactgaattt ttcggcaacc caaatgccgg accaagtgac agcagagcgttatgtggtgc aaaaaaccac cgccgcggca ctgaatttcg ctgcggtgtt ggccaaagccagtacggttt ttgccaaatt tgacgcccag ttgcccggcc tgtcgcaaca ataccgtcagcaagcactgc tcgcctggca atgggcgcaa aaaaatccgc agcaaatcta tcaacaacccaaagatgtcc acactggcgc ttatggtgac aaacaactgg ctgatgaatg ggcctgggctggcgccgagc tgtatttatt gaccggcgag caaagttatc tgcagccact gttggcgctggacacgccaa tcagtgcagc atcctgggcc agtgtcagcg ctttggggta tttttctttggcttcggcga aacagcttga gcccgcacta cggcaacagg tacaacagaa aatccaacaagccgccgcgc aaatcctgca ggaacatcaa acatccgcct atcaggtggc gatgaccaaaaacgattttg tctggggcag taatgcggtg gcaatgaata aagcgatgtt gttataccaggcgtggaaaa tagcgccaaa accggagctg ctacaggcga tgcaaggtct ggttgattacgttttggggc gcaacccgtt gcagcagtct tatgtcacag ggtttggcga gcaaagcccgcagcagatcc accaccgacc ttcggccgcc gatgccatca aagcgccggt accaggttggttagtcggtg gtgcacagcc gggtaagcag gataaatgca cttatgccgg cgctttacccgctgtcggcg ctttacccgc tgccagcacc ttaccagcca ccacttatct tgatgactggtgcagttacg ccaccaacga agtggcgatt aactggaatg cacctttggt gtatgtgctggcatggcacc tttcgcaaaa caccaagaca ccataa<210> 290<211> 931<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1) ... (22)<400> 290

Met Lys Phe Thr Leu Thr Pro Leu Leu Cys Gly Phe Ala Leu Leu Leu

15 10 15

Gly Cys Ala Val Gln Ala Thr Pro Ala Ala Ser Leu Lys Gln Ala Tyr

20 25 30

Gln Pro Phe Phe His Ile Gly Thr Ala Val Ser Leu Ala Gln Leu Gln

35 40 45

Pro Ser Lys Glu His Glu Arg Ala Leu Ile Ala Gln His Phe Asn Ser

50 55 60

Leu Thr Ala Glu Asn Leu Met Lys Trp Glu Glu Ile Gln Pro Thr Glu65 70 75 80

Gly Asn Phe Asp Phe Lys Ala Ala Asp Gln Leu Val Ala Phe Ala Glu

85 90 95

Gln His Gln Met Trp Met Ile Gly His Thr Ile Leu Trp His Glu Gln

100 105 110

Thr Pro Asp Trp Val Phe Gln Gly Leu Asp Gly Lys Pro Ala Ser Lys

115 120 125

Gln Leu Leu Leu Ala Arg Leu Thr Lys His Ile Gln Thr Val Val Gly

130 135 140

Arg Tyr Gln Gly Arg Val Asn Gly Trp Asp Val Val Asn Glu Ala Leu145 150 155 160

Asn Glu Asp Gly Ser Leu Arg Asp Thr Pro Trp Arg Arg Ile Leu Gly

165 170 175

Asp Asp Tyr Ile Ala Thr Thr Phe Ala Leu Val His Gln Val Asp Pro

180 185 190

Lys Ala Lys Leu Tyr Tyr Asn Asp Tyr Asn Leu Phe Lys Pro Glu Lys

195 200 205

Arg Ala Gly Val Leu Arg Ile Ile Gln Gln Leu Gln Gln Lys Asn Val

210 215 220

Pro Ile His Ala Ile Gly Glu Gln Ala His Tyr Gly Leu Asp Ser Pro225 230 235 240

Ala Phe Lys Asp Val Glu Asp Ser Ile Asn Ala Phe Ala Ala Thr Gly

245 250 255

Leu Asp Val Met Leu Thr Glu Leu Glu Ile Ser Val Leu Pro Tyr Pro

260 265 270

Ser Gly Met Thr Gln Gly Ala Asp Ile Ser Gln His Gln Glu Leu Gln

275 280 285

Glu Gln Leu Asn Pro Tyr Arg Asp Gly Leu Pro Lys Ala Val Glu Gln

290 295 300

Ala Trp Gln Gln Arg Tyr Leu Asp Leu Phe Ser Leu Leu Leu Arg Gln305 310 315 320

Gln Gln Lys Leu His Arg Val Thr Phe Trp Gly Leu Asp Asp Gly Gln325 330 335Ser Trp Arg Asn Asn Phe Pro Met Arg Gly Arg Thr Asp Tyr Pro Leu

340 345 350

Leu Phe Asp Arg Lys Leu Gln Ala Lys Pro Leu Leu Ser Ala Leu Thr

355 360 365

Ala Leu Ala Ala Asp Gln Thr Lys Ala Lys Pro Lys Met Asn Gln Leu

370 375 380

Gly Phe Ala Pro Thr Ser Thr Lys Leu Leu Ile Val Pro Gly Arg Gln385 390 395 400

Ser Val Pro Phe His Val Leu Asp Thr Glu Thr Gly Gln Thr Val Leu

405 410 415

Gln Gly Gln Ser Ser Ala Ala Arg Phe Trp Pro Glu Ser Gly Glu Trp

420 425 430

Val Ser Ala Ala Asp Phe Ser Ala Val Ile Thr Pro Gly Thr Tyr Gln

435 440 445

Ile Asn Ile Ser Gly Thr Pro Pro Gln Thr Val Lys Ile Gln Ala Glu

450 455 460

Pro Tyr Ala Ala Leu His Asp Ala Ala Ile Lys Ala Tyr Tyr Phe Asn465 470 475 480

Arg Ala Ser Leu Thr Leu Glu Pro Lys Phe Ala Gly Pro Trp Ala Arg

485 490 495

Ala Ala Gly His Pro Asp Thr Lys Val Arg Val His Ala Ser Ala Ala

500 505 510

Ser Ala Ser Arg Pro Glu Gly Tyr Glu Leu Ser Ala Ala Lys Gly Trp

515 520 525

Tyr Asp Ala Gly Asp Tyr Asn Lys Tyr Val Val Asn Ser Gly Ile Thr

530 535 540

Ser Tyr Thr Leu Leu Gln Ala Trp Gln Asp Phe Pro Glu Phe Tyr Gln545 550 555 560

Ser Arg Thr Trp Asn Ile Pro Glu Ser Gly Asn Ala Val Pro Asp Ile

565 570 575

Leu Asp Glu Thr Leu Trp Asn Leu Gln Trp Phe Ser Ala Met Gln Asp

580 585 590

Pro Asn Asp Gly Gly Val Tyr His Lys Leu Thr Glu Leu Asn Phe Ser

595 600 605

Ala Thr Gln Met Pro Asp Gln Val Thr Ala Glu Arg Tyr Val Val Gln

610 615 620

Lys Thr Thr Ala Ala Ala Leu Asn Phe Ala Ala Val Leu Ala Lys Ala625 630 635 640

Ser Thr Val Phe Ala Lys Phe Asp Ala Gln Leu Pro Gly Leu Ser Gln

645 650 655

Gln Tyr Arg Gln Gln Ala Leu Leu Ala Trp Gln Trp Ala Gln Lys Asn

660 665 670

Pro Gln Gln Ile Tyr Gln Gln Pro Lys Asp Val His Thr Gly Ala Tyr

675 680 685

Gly Asp Lys Gln Leu Ala Asp Glu Trp Ala Trp Ala Gly Ala Glu Leu

690 695 ■ 700

Tyr Leu Leu Thr Gly Glu Gln Ser Tyr Leu Gln Pro Leu Leu Ala Leu705 710 715 720

Asp Thr Pro Ile Ser Ala Ala Ser Trp Ala Ser Val Ser Ala Leu Gly

725 730 735

Tyr Phe Ser Leu Ala Ser Ala Lys Gln Leu Glu Pro Ala Leu Arg Gln

740 745 750

Gln Val Gln Gln Lys Ile Gln Gln Ala Ala Ala Gln Ile Leu Gln Glu

755 760 765

His Gln Thr Ser Ala Tyr Gln Val Ala Met Thr Lys Asn Asp Phe Val

770 775 780

Trp Gly Ser Asn Ala Val Ala Met Asn Lys Ala Met Leu Leu Tyr Gln785 790 795 800

Ala Trp Lys Ile Ala Pro Lys Pro Glu Leu Leu Gln Ala Met Gln Gly

805 810 815

Leu Val Asp Tyr Val Leu Gly Arg Asn Pro Leu Gln Gln Ser Tyr Val

820 825 830

Thr Gly Phe Gly Glu Gln Ser Pro Gln Gln Ile His His Arg Pro Ser

835 840 845

Ala Ala Asp Ala Ile Lys Ala Pro Val Pro Gly Trp Leu Val Gly Gly

850 855 860

Ala Gln Pro Gly Lys Gln Asp Lys Cys Thr Tyr Ala Gly Ala Leu Pro865 870 875 880

Ala Val Gly Ala Leu Pro Ala Ala Ser Thr Leu Pro Ala Thr Thr Tyr

885 890 895

Leu Asp Asp Trp Cys Ser Tyr Ala Thr Asn Glu Val Ala Ile Asn Trp900 905 910

Asn Ala Pro Leu Val Tyr Val Leu Ala Trp His Leu Ser Gln Asn Thr

915 920 925

Lys Thr Pro

930

<210> 291

<211> 1230<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 291

atggtcaaag aaagaagttt tcttcatcat tcattcaata ggggcgaaaa tggacaggac 60

agtctgatgt ggaaaaaaga ggcggatgat cgaatctcag agcatagaca aagagatctt 120

gtgatcaacg taacaaacgg tgaaaaaaag ccaatagcag gtatagaggt tgaaataaag 180

caaatcagac atgaattcgc ctttggttca gcgatgaatg atcaagtgtt atttaatcaa 240

caatatgctg attttttcgt gaagtatttt aattgggctg tttttgaaaa tgaggcaaaa 300

tggtatgcga atgagccaca aagagggaga atcacctacg aaaaagcaga tgcgatgctg 360

aattttgcag atcgacatca gcttccagtg agagggcacg ctttgttttg ggaggtagag 420

gatgcgaatc caagctggct aaggtcactg ccaaatcatg aagtatatga agccatgaaa 480

aaccggcttg agcatgcggg caatcacttt aagggaaggt tccgtcattg ggatgtaaac 540aatgaaatga tgcatggttc attttttaaa gatcgctttg ggaaaaatat ttggaagtgg 600

atgtatgaag aaacgaaaaa aattgaccct caagcactat tgtttgtgaa tgattataat 660

gtgatctcat atggtgaaca ccatgcctat aaagcgcata tcaatgaact gcgtcagtta 720

ggcgcaccta ttgaggcgat tggggttcaa ggccattttg aagaacgggt cgatccagtc 780

attgtcaaag agagactcga tgtgcttgct gagctaggtc ttccaatatg ggtcacagag 840

tacgattcgg ttcaccctga ccctaatcga agagcggata acctggaagc tttatatcgc 900

gtcgcattta gtcatccagc cgtaaaagga gtgctgatgt ggggattttg ggcaggtgcc 960

cattggagag gggaaaatgc agccatcgtg aattatgatt ggtctttaaa tgaagcagga 1020

agacgttatg aaaagcttct aaatgagtgg acgacccaaa gaattgaaaa aacagatgct 1080

aatggccatg tgagatgtcc agcatttcac ggaacatatg aggttcgaat cggtaaagaa 1140

agtaaaatgt tgaaacagca gacgattgaa cttgattcaa atgaacaaac accgtttcaa 1200

ctagacgtga tcctgcctca agaaggatag 1230

<210> 292<211> 409<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 292

Met 1 Val Lys Glu Arg 5 Ser Phe Leu His His 10 Ser Phe Asn Arg Gly 15Glu Asn Gly Gln Asp 20 Ser Leu Met Trp Lys 25 Lys Glu Ala Asp Asp 30 Arg IleSer Glu His Arg Gln Arg Asp Leu Val Ile Asn Val Thr Asn Gly Glu 35 40 45 Lys Lys 50 Pro Ile Ala Gly Ile 55 Glu Val Glu Ile Lys 60 Gln Ile Arg His Glu Phe Ala Phe Gly Ser Ala Met Asn Asp Gln Val Leu Phe Asn Gln 70 75 80 Gln Tyr Ala Asp Phe 85 Phe Val Lys Tyr Phe 90 Asn Trp Ala Val Phe 95 Glu Asn Glu Ala Lys 100 Trp Tyr Ala Asn Glu 105 Pro Gln Arg Gly Arg 110 Ile Thr60 Tyr Glu Lys Ala Asp Ala Met Leu Asn Phe Ala Asp Arg His Gln Leu 115 120 125 Pro Val 130 Arg Gly His Ala Leu 135 Phe Trp Glu Val Glu 140 Asp Ala Asn Pro Ser Trp Leu Arg Ser Leu Pro Asn His Glu Val Tyr Glu Ala Met Lys65 145 150 155 160 Asn Arg Leu Glu His 165 Ala Gly Asn His Phe 170 Lys Gly Arg Phe Arg 175 His Trp Asp Val Asn Asn Glu Met Met His Gly Ser Phe Phe Lys Asp Arg180 185 190 Phe Gly Lys 195 Asn Ile Trp Lys Trp 200 Met Tyr Glu Glu Thr 205 Lys Lys IleAsp Pro Gln Ala Leu Leu Phe Val Asn Asp Tyr Asn Val Ile Ser Tyr210 215 220 Gly Glu His His Ala Tyr Lys Ala His Ile Asn Glu Leu Arg Gln Leu225 230 235 240Gly Ala Pro Ile Glu Ala Ile Gly Val Gln Gly His Phe Glu Glu Arg 245 250 255 Val Asp Pro Val 260 Ile Val Lys Glu Arg 265 Leu Asp Val Leu Ala 270 Glu LeuGly Leu Pro 275 Ile Trp Val Thr Glu 280 Tyr Asp Ser Val His 285 Pro Asp ProAsn Arg Arg Ala Asp Asn Leu Glu Ala Leu Tyr Arg Val Ala Phe Ser290 295 300 His Pro Ala Val Lys Gly Val Leu Met Trp Gly Phe Trp Ala Gly Ala305 310 315 320His Trp Arg Gly Glu 325 Asn Ala Ala Ile Val 330 Asn Tyr Asp Trp Ser 335 LeuAsn Glu Ala Gly 340 Arg Arg Tyr Glu Lys 345 Leu Leu Asn Glu Trp 350 Thr ThrGln Arg Ile 355 Glu Lys Thr Asp Ala 360 Asn Gly His Val Arg 365 Cys Pro AlaPhe His Gly Thr Tyr Glu Val Arg Ile Gly Lys Glu Ser Lys Met Leu370 375 380 Lys Gln Gln Thr Ile Glu Leu Asp Ser Asn Glu Gln Thr Pro Phe Gln385 390 395 400Leu Asp Val Ile Leu Pro Gln Glu Gly

405

<210> 293

<211> 1002

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 293

atgaagatga acagctccct cccctccctc cgcgatgtat tcgcgaatga tttccgcatcggggcggcgg tcaatcctgt gacgatcgag atgcaaaaac agttgttgat cgatcatgtcaacagtatta cggcagagaa ccatatgaag tttgagcatc ttcagccgga agaagggaaatttacctttc aggaagcgga tcggattgtg gattttgctt gttcgcaccg aatggcggttcgagggcaca cacttgtatg gcacaaccag actccggatt gggtgtttca agatggtcaaggccatttcg tcagtcggga tgtgttgctt gagcggatga aatgtcacat ttcaactgttgtacggcgat acaagggaaa aatatattgt tgggatgtca tcaacgaagc ggtagccgacgaaggagacg aattgttgag gccgtcgaag tggcgacaaa tcatcgggga cgattttatggaacaagcat ttctctacgc ttatgaagct gacccagatg cactgctttt ttacaatgactataatgaat gttttccgga aaagagagaa aaaatttttg cacttgtcaa atcgctgcgtgataaaggca ttccgattca tggcatcggg atgcaagcgc attggagttt gactcgcccgtcgcttgatg aaattcgtgc ggccattgaa cgatatgcgt cccttggtgt tgttcttcatattacggaac tcgatgtatc catgtttgaa tttcacgatc gtcgaaccga tttggcagctccaacgtcag aaatgatcga acggcaggca gagcggtatg ggcaaatttt tgctttgtttaaggagtatc gcgatgttat tcaaagtgtc acattttggg gaattgctga tgaccatacatggctcgata actttccagt gcacgggaga aaaaactggc cgcttttgtt cgatgaacagcataaaccga aaccagcttt ttggcgggca gtgagtgtct ga<210> 294<211> 333<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 294

Met Lys Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn

15 10 15

Asp Phe Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln

20 25 30

Lys Gln Leu Leu Ile Asp His Val Asn Ser Ile Thr Ala Glu Asn His

35 40 45

Met Lys Phe Glu His Leu Gln Pro Glu Glu Gly Lys Phe Thr Phe Gln50 55 60 Glu Ala Asp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val65 70 75 80Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Val Phe 85 90 95 Gln Asp Gly Gln Gly His Phe Val Ser Arg Asp Val Leu Leu Glu Arg 100 105 110 Met Lys Cys 115 His Ile Ser Thr Val 120 Val Arg Arg Tyr Lys 125 Gly Lys IleTyr Cys 130 Trp Asp Val Ile Asn 135 Glu Ala Val Ala Asp 140 Glu Gly Asp GluLeu Leu Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met145 150 155 160Glu Gln Ala Phe Leu 165 Tyr Ala Tyr Glu Ala 170 Asp Pro Asp Ala Leu 175 LeuPhe Tyr Asn Asp 180 Tyr Asn Glu Cys Phe 185 Pro Glu Lys Arg Glu 190 Lys IlePhe Ala Leu 195 Val Lys Ser Leu Arg 200 Asp Lys Gly Ile Pro 205 Ile His GlyIle Gly Met Gln Ala His Trp Ser Leu Thr Arg Pro Ser Leu Asp Glu 210 215 220 Ile Arg Ala Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His225 230 235 240Ile Thr Glu Leu Asp 245 Val Ser Met Phe Glu 250 Phe His Asp Arg Arg 255 ThrAsp Leu Ala Ala 260 Pro Thr Ser Glu Met 265 Ile Glu Arg Gln Ala 270 Glu ArgTyr Gly Gln Ile Phe Ala Leu Phe Lys Glu Tyr Arg Asp Val Ile Gln 275 280 285 Ser Val 290 Thr Phe Trp Gly Ile 295 Ala Asp Asp His Thr 300 Trp Leu Asp AsnPhe Pro Val His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln305 310 315 320His Lys Pro Lys Pro Ala Phe Trp Arg Ala Val Ser Val

325 330

<210> 295<211> 1134<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 295

atgagatccg tccgcatcgt cacctttgct ctcgccgccg cgctggccgt cccgctggtg 60

acgtcgacgg ccacggccaa gccgtccgcc gaccacgagg ccgcgcccca ctccaacgcc 120

aagttcgacc gcctgcgctg ggccgccccc gaagggttct tcataggctc cgcggcggcc 180

ggcggcggcc accacctcga acaggactac ccggacccct tcaccttcga caagaagtac 240cggaagatcc tgggccagca gttcaactcg gtctccgccg agaaccagat gaagtgggag 300

ttcatccacc ccgagcgcga ccagtaccgc ttcgaggagg ccgacgccat cgtcgagttc 360

gcccagcgga accgccaggc cgtgcgcggg cacaccctcc tgtggcacag ccagaacccc 420

gaatggctgg aggagggcga cttcaccaag gaggaactgc gcgccatcct caaggaccac 480

atcgacacgg tcgtcggccg ctacgccggc aagatccagc agtgggacgt ggccaacgag 540

atcttcaacg accaggccga gctgcgcacc gacgagaaca tctggatacg tgagctcggc 600

ccggagatcg tcgcggacgc cttccgctgg gcccacgagg ccgaccccga ggccaagctg 660

ttcctcaacg actacaacgt cgagggcatc aacgccaaga gcgacgccta ctacgagctc 720

gcccaggaga tgctggagca gggcgtgccg ctccacggat tcggcgccca gggccacctg 780agcacccgct acggcttccc gggcgacctg cagcagaacc tgcagcggtt cgccgacctc 840

ggtctggaga ccgccatcac cgagatcgac gtccgcatgg acctcccggc gagcggcaag 900

cccaccaagg agcagctgcg gcagcaggcc gactactacc agcaggcact gtcggcctgc 960

ctggccgtga acgactgcaa ctccttcacc atctggggct tcaccgacaa gtactcgtgg 1020gtgccggtct tcttcgaggg tgagggcagc gccacggtca tgacggagaa gttcgtccgc 1080aagccggcct tcttcgccct gcagtccacc ctgaaggagg cgcgcaagcg ctga 1134

<210> 296<211> 377<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(26)<400> 296

Met Arg Ser Val Arg Ile Val Thr Phe Ala Leu Ala Ala Ala Leu Ala1 5 10 15

Val Pro Leu Val Thr Ser Thr Ala Thr Ala Lys Pro Ser Ala Asp His

20 25 30

Glu Ala Ala Pro His Ser Asn Ala Lys Phe Asp Arg Leu Arg Trp Ala35 40 45

Ala Pro Glu Gly Phe Phe Ile Gly Ser Ala Ala Ala Gly Gly Gly His

50 55 60

His Leu Glu Gln Asp Tyr Pro Asp Pro Phe Thr Phe Asp Lys Lys Tyr65 70 75 80

Arg Lys Ile Leu Gly Gln Gln Phe Asn Ser Val Ser Ala Glu Asn Gln

85 90 95

Met Lys Trp Glu Phe Ile His Pro Glu Arg Asp Gln Tyr Arg Phe Glu

100 105 110

Glu Ala Asp Ala Ile Val Glu Phe Ala Gln Arg Asn Arg Gln Ala Val

115 120 125

Arg Gly His Thr Leu Leu Trp His Ser Gln Asn Pro Glu Trp Leu Glu

130 135 140

Glu Gly Asp Phe Thr Lys Glu Glu Leu Arg Ala Ile Leu Lys Asp His145 150 155 160

Ile Asp Thr Val Val Gly Arg Tyr Ala Gly Lys Ile Gln Gln Trp Asp

165 170 175

Val Ala Asn Glu Ile Phe Asn Asp Gln Ala Glu Leu Arg Thr Asp Glu

180 185 190

Asn Ile Trp Ile Arg Glu Leu Gly Pro Glu Ile Val Ala Asp Ala Phe195 200 205

Arg Trp Ala His Glu Ala Asp Pro Glu Ala Lys Leu Phe Leu Asn Asp

210 215 220

Tyr Asn Val Glu Gly Ile Asn Ala Lys Ser Asp Ala Tyr Tyr Glu Leu225 230 235 240

Ala Gln Glu Met Leu Glu Gln Gly Val Pro Leu His Gly Phe Gly Ala

245 250 255

Gln Gly His Leu Ser Thr Arg Tyr Gly Phe Pro Gly Asp Leu Gln Gln

260 265 270

Asn Leu Gln Arg Phe Ala Asp Leu Gly Leu Glu Thr Ala Ile Thr Glu

275 280 285

Ile Asp Val Arg Met Asp Leu Pro Ala Ser Gly Lys Pro Thr Lys Glu

290 295 300

Gln Leu Arg Gln Gln Ala Asp Tyr Tyr Gln Gln Ala Leu Ser Ala Cys305 310 315 320

Leu Ala Val Asn Asp Cys Asn Ser Phe Thr Ile Trp Gly Phe Thr Asp

325 330 335

Lys Tyr Ser Trp Val Pro Val Phe Phe Glu Gly Glu Gly Ser Ala Thr

340 345 350

Val Met Thr Glu Lys Phe Val Arg Lys Pro Ala Phe Phe Ala Leu Gln355 360 365

Ser Thr Leu Lys Glu Ala Arg Lys Arg

370 375

<210> 297<211> 1842<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 297

ttgaggtcag gcgcgttctg tttcatcata gtcgttttaa tcctgaacct tatatgcagg 60

gagttgtatg agtgtaaaaa agttgttacc gcagcactgg tatgcttggc tttcgggtca 120

tcgctgactt gggggcaatg caccacattt accaccagta ccattcggaa ttgcgatggt 180

atagattacg agctctggag ccagaataac tctggcacga ccaatatgca aatcacgggagggaactcga atccaaacgg tggaaccttt gaggcgacat ggagtggcac gatcaatgtt

240

300

ctattccgcg cgggtaaaaa atggggcaca tccagcacca gtacccccaa aaccatcggc 360

420

aatatctctc ttgaattcgc agcgacatgg agttcggtcg ataatgtgaa aatgcttggcatctatggct gggcgtatta tccctcggga agcgaaccaa caaaaacgga aagcggtcaa 480agcacgaact tttccaatca gattgagtat tacatcattc aagaccgcgg tagctataacccggcatccg gcggcaccaa cgccaaaaag tacggtgaag ggacgatcga cggaatcgcgtatgattttt atgtcgccga ccgtatcggc caggccatgc tgacaggaac gggaaatttcaaacagtact tcagcgtgcc gaagagcaca agcagtcaca ggcaaagcgg cacggtttccgtctccaaac attttgaggc ctgggaaaaa gcgggcatga agatgatgga ttgtcggttatacgaagtcg cgatgaaagt ggaatcgtat accggttccg cgaatggcaa cggctcggcgaaagtgacca aaaatctcct cacgatcggc ggaagcagca gcaacgagtt tagtctcgtaacgaatgttt ctcctgccag cgcgggaacg gtgtccaaga gcccggacaa cgcatcctatgccccgaacg cctccgttca gctcacggcg accccgaata ccggttggaa gtttzgtgggctgggaagggg acgcctcggg ttccacgagc ccaaccagcg ttaccatgag caaagacctcacggttacag cgaagtttga gctggtatcg gaagaaggca gcacaaacct gatccaggatggcaacttcc cgagcggcag cgtaatctct acagatgacg gggcttcatg gaaactcggacaaggggaaa actggggaaa ttccgcagcc acaacgagcg tcagcaatgg aatcgcgacagtcaatgtga caactgtcgg agcggaagct tatcaaccgc agcttgtaca gtacggtttgggactcgaca tggacatgag ttacaaactt accttcaagg caagagccga tgcggcaaggaagattgaag ttgcgttcca gcaggcggtg gatccttggg ctggttatgc ttcccaggaattcgacctga ccacgaccga tcaggatttc gagttcgtat tcacgatgac caacgccagcgacccggcat cacagttcgc gttcaatctt ggccaggcga caggcgatgt ctatatcagtgatgttaaac tggtatacac gacaggcacc acacccatat cccgcaccat agtccgcggcaatacggcat tcgtctcggt aagtggcaga accctgaata tttcggcagt cgacgcgtccacacttcaga tcaaggtagt agatataaac ggaaaggtaa gagcgaattt caacacggctggtgcagcaa gtgtttcctt gtccaatatt cctgcgggcc agtacttcgt tggtatcacaggcacaggca taaaacaaat ctcaccgatc gttttggaat aa<210> 298<211> 613<212> PRT

<213> Desconhecido<22 0>

<223> Obtido para uma amostra ambiental.<400> 298

Met Arg Ser Gly Ala Phe Cys Phe Ile Ile Val Val Leu Ile Leu Asn1 5 10 15 Leu Ile Cys Arg Glu Leu Tyr Glu Cys Lys Lys Val Val Thr Ala Ala 20 25 30 Leu Val Cys Leu Ala Phe Gly Ser Ser Leu Thr Trp Gly Gln Cys Thr 35 40 45 Thr Phe Thr Thr Ser Thr Ile Arg Asn Cys Asp Gly Ile Asp Tyr Glu 50 55 60 Leu Trp Ser Gln Asn Asn Ser Gly Thr Thr Asn Met Gln Ile Thr Gly65 70 75 80Gly Asn Ser Asn Pro Asn Gly Gly Thr Phe Glu Ala Thr Trp Ser Gly 85 90 95 Thr Ile Asn Val Leu Phe Arg Ala Gly Lys Lys Trp Gly Thr Ser Ser 100 105 110 Thr Ser Thr Pro Lys Thr Ile Gly Asn Ile Ser Leu Glu Phe Ala Ala 115 120 125 Thr Trp Ser Ser Val Asp Asn Val Lys Met Leu Gly Ile Tyr Gly Trp 130 135 140 Ala Tyr Tyr Pro Ser Gly Ser Glu Pro Thr Lys Thr Glu Ser Gly Gln145 150 155 160Ser Thr Asn Phe Ser Asn Gln Ile Glu Tyr Tyr Ile Ile Gln Asp Arg 165 170 175 Gly Ser Tyr Asn Pro Ala Ser Gly Gly Thr Asn Ala Lys Lys Tyr Gly 180 185 190 Glu Gly Thr Ile Asp Gly Ile Ala Tyr Asp Phe Tyr Val Ala Asp Arg 195 200 205 Ile Gly Gln Ala Met Leu Thr Gly Thr Gly Asn Phe Lys Gln Tyr Phe 210 215 220 Ser Val Pro Lys Ser Thr Ser Ser His Arg Gln Ser Gly Thr Val Ser225 230 235 240Val Ser Lys His Phe Glu Ala Trp Glu Lys Ala Gly Met Lys Met Met 245 250 255 Asp Cys Arg Leu Tyr Glu Val Ala Met Lys Val Glu Ser Tyr Thr Gly 260 265 270 Ser Ala Asn Gly Asn Gly Ser Ala Lys Val Thr Lys Asn Leu Leu Thr 275 280 285 Ile Gly Gly Ser Ser Ser Asn Glu Phe Ser Leu Val Thr Asn Val Ser290 295 300 Pro Ala Ser Ala Gly Thr Val Ser Lys Ser Pro Asp Asn Ala Ser Tyr305 310 315 320Ala Pro Asn Ala Ser Val Gln Leu Thr Ala Thr Pro Asn Thr Gly Trp 325 330 335 Lys Phe Val Gly Trp Glu Gly Asp Ala Ser Gly Ser Thr Ser Pro Thr 340 345 350 Ser Val Thr Met Ser Lys Asp Leu Thr Val Thr Ala Lys Phe Glu Leu 355 360 365 Val Ser Glu Glu Gly Ser Thr Asn Leu Ile Gln Asp Gly Asn Phe Pro 370 375 380 Ser Gly Ser Val Ile Ser Thr Asp Asp Gly Ala Ser Trp Lys Leu Gly385 390 395 400Gln Gly Glu Asn Trp Gly Asn Ser Ala Ala Thr Thr Ser Val Ser Asn 405 410 415 Gly Ile Ala Thr Val Asn Val Thr Thr Val Gly Ala Glu Ala Tyr Gln 420 425 430 Pro Gln Leu Val Gln Tyr Gly Leu Gly Leu Asp Met Asp Met Ser Tyr 435 440 445 Lys Leu Thr Phe Lys Ala Arg Ala Asp Ala Ala Arg Lys Ile Glu Val 450 455 460 Ala Phe Gln Gln Ala Val Asp Pro Trp Ala Gly Tyr Ala Ser Gln Glu465 470 475 480Phe Asp Leu Thr Thr Thr Asp Gln Asp Phe Glu Phe Val Phe Thr Met 485 490 495 Thr Asn Ala Ser Asp Pro Ala Ser Gln Phe Ala Phe Asn Leu Gly Gln 500 505 510 Ala Thr Gly Asp Val Tyr Ile Ser Asp Val Lys Leu Val Tyr Thr Thr 515 520 525 Gly Thr Thr Pro Ile Ser Arg Thr Ile Val Arg Gly Asn Thr Ala Phe 530 535 540 Val Ser Val Ser Gly Arg Thr Leu Asn Ile Ser Ala Val Asp Ala Ser545 550 555 560Thr Leu Gln Ile Lys Val Val Asp Ile Asn Gly Lys Val Arg Ala Asn 565 570 575 Phe Asn Thr Ala Gly Ala Ala Ser Val Ser Leu Ser Asn Ile Pro Ala 580 585 590 Gly Gln Tyr Phe Val Gly Ile Thr Gly Thr Gly Ile Lys Gln Ile Ser 595 600 605 Pro Xle Val Leu Glu 610

<210> 299

<211> 1047

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 299

atgtttttga gtctcaaaag agtggcggcg cttgtttgcg tcgccggtct cggcatctctgcggcccaag cacagacctg cctgacctcg agtcaaaccg gcactaacaa cggcttctactattcgttct ggaaagacaa tcccggcacc gtgaatttct gtctgcagtc cggcggccgctacacctcca actggagcgg catcaacaac tgggtcggcg gaaagggatg gcagacgggttcccgcagag tggtgaacta ctcgggcagc ttcaattcgc ctggcaatgg gtacctgactctctatgggt ggaccaccaa tccgctcatc gagtactaca ttgtcgacaa ctggggcacgtatcgtccgc cgggtgggca ggggttcatg ggcacggtga ccagcgatgg cgcgacgtatgacgtctatc gcacgcagcg cgtcaatcag ccctgcatca ccggcagcag ttgcacgttctatcaatact ggagcgtgcg gcagtcgaag cggaccggtg gcacgatcac caccggcaaccacttcgatg cctgggccag ctacggaatg aatctgggcg ctcacaacta ccagatcatggcgaccgagg gctatcaaag cagcggcagc tctgacatca cggtgagtga gggaagcagcagcagtagca gcggtggtgg cagcagcacg agcagcagtg gcggcggcgg caccaagagcttcacggtcc gggcgcgcgg aaccgcgggt ggtgagtcca tcacgctgcg tgtgaacaatcagaacgtgc agacctggac gctgggcacc agcatgacga actacacggc atcgacgtcgttgagcggtg gcatcaccgt ggcttacacg aacgacagtg gcaatcgcga cgtgcaggtggattacatca tcgtgaacgg ctcgacgcgt cagtcagaag cgcagagcta caacaccgggctctatgcca acggtagttg tggtggcggc tccaatagcg aatggatgca ttgcaacggcgccattggct acgggaatac gccgtag<210> 300<211> 348<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(24)<400> 300

Met Phe Leu Ser Leu Lys Arg Val Ala Ala Leu Val Cys Val Ala Gly

15 10 15

Leu Gly Ile Ser Ala Ala Gln Ala Gln Thr Cys Leu Thr Ser Ser Gln

20 25 30

Thr Gly Thr Asn Asn Gly Phe Tyr Tyr Ser Phe Trp Lys Asp Asn Pró

35 40 45

Gly Thr Val Asn Phe Cys Leu Gln Ser Gly Gly Arg Tyr Thr Ser Asn

50 55 60

Trp Ser Gly Ile Asn Asn Trp Val Gly Gly Lys Gly Trp Gln Thr Gly65 70 75 80

Ser Arg Arg Val Val Asn Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn

85 90 95

Gly Tyr Leu Thr Leu Tyr Gly Trp Thr Thr Asn Pro Leu Ile Glu Tyr

100 105 110

Tyr Ile Val Asp Asn Trp Gly Thr Tyr Arg Pro Pro Gly Gly Gln Gly

115 120 125

Phe Met Gly Thr Val Thr Ser Asp Gly Ala Thr Tyr Asp Val Tyr Arg

130 135 140

Thr Gln Arg Val Asn Gln Pro Cys Ile Thr Gly Ser Ser Cys Thr Phe145 150 155 160

Tyr Gln Tyr Trp Ser Val Arg Gln Ser Lys Arg Thr Gly Gly Thr Ile

165 170 175

Thr Thr Gly Asn His Phe Asp Ala Trp Ala Ser Tyr Gly Met Asn Leu

180 185 190

Gly Ala His Asn Tyr Gln Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser

195 200 205

Gly Ser Ser Asp Ile Thr Val Ser Glu Gly Ser Ser Ser Ser Ser Ser

210 215 220

Gly Gly Gly Ser Ser Thr Ser Ser Ser Gly Gly Gly Gly Thr Lys Ser225 230 235 240

Phe Thr Val Arg Ala Arg Gly Thr Ala Gly Gly Glu Ser Ile Thr Leu

245 250 255

Arg Val Asn Asn Gln Asn Val Gln Thr Trp Thr Leu Gly Thr Ser Met

260 265 270

Thr Asn Tyr Thr Ala Ser Thr Ser Leu Ser Gly Gly Ile Thr Val Ala

275 280 285

Tyr Thr Asn Asp Ser Gly Asn Arg Asp Val Gln Val Asp Tyr Ile Ile

290 295 300

Val Asn Gly Ser Thr Arg Gln Ser Glu Ala Gln Ser Tyr Asn Thr Gly305 310 315 320

Leu Tyr Ala Asn Gly Ser Cys Gly Gly Gly Ser Asn Ser Glu Trp Met

325 330 335

His Cys Asn Gly Ala Ile Gly Tyr Gly Asn Thr Pro340 345

<210> 301<211> 642<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 301

atgtttaagt ttacaaagaa attcttagtt gggttaacgg cagctttgat gagtatgagc 60

ttgttttcgg caaacgcctc tgcagctaac acagactact ggcaaaattg gactgatggg 120

ggcggaacag taaacgctgt caatgggtct ggcgggaatt acagtgtgaa ttggtctaat 180

accggaaatt tcgttgttgg taaaggttgg actacaggtt cgccatttag gacgataaac 240tataatgccg gagtttgggc gccgaacggc aatgcatatt tgactttata tggttggacg 300

cgatcccctc tcatagaata ttatgtagtg gattcatggg gtacttatag acctactgga 360

acgtataaag gtacggttta cagtgatggg ggtacatatg acgtgtacac aactacacgt 420tatgatgcac cttccattga tggcgataaa actactttta cgcagtactg gagtgttcgc 480

cagtcgaaga gaccaactgg aagcaacgct acaatcactt tcagcaatca cgttaacgca 540

tggaagagat atgggatgaa tctgggtagt aattggtctt accaagtctt agcgacagag 600

ggatatcgaa gtagtggaag ttctaacgta acagtgtggt aa 642

<210> 302<211> 213<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)... (28)<400> 302

Met Phe Lys Phe Thr Lys Lys Phe Leu Val Gly Leu Thr Ala Ala Leu1 5 10 15

Met Ser Met Ser Leu Phe Ser Ala Asn Ala Ser Ala Ala Asn Thr Asp

20 25 30

Tyr Trp Gln Asn Trp Thr Asp Gly Gly Gly Thr Val Asn Ala Val Asn35 40 45

Gly Ser Gly Gly Asn Tyr Ser Val Asn Trp Ser Asn Thr Gly Asn Phe

50 55 60

Val Val Gly Lys Gly Trp Thr Thr Gly Ser Pro Phe Arg Thr Ile Asn65 70 75 80

Tyr Asn Ala Gly Val Trp Ala Pro Asn Gly Asn Ala Tyr Leu Thr Leu

85 90 95

Tyr Gly Trp Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser

100 105 110

Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Tyr Ser

115 120 125

Asp Gly Gly Thr Tyr Asp Val Tyr Thr Thr Thr Arg Tyr Asp Ala Pro

130 135 140

Ser Ile Asp Gly Asp Lys Thr Thr Phe Thr Gln Tyr Trp Ser Val Arg145 150 155 160

Gln Ser Lys Arg Pro Thr Gly Ser Asn Ala Thr Ile Thr Phe Ser Asn

165 170 175

His Val Asn Ala Trp Lys Arg Tyr Gly Met Asn Leu Gly Ser Asn Trp

180 185 190

Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Arg Ser Ser Gly Ser Ser

195 200 205

Asn Val Thr Val Trp210<210> 303<211> 1404<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 303

ttgactataa aggcctggcc cgggacggct gccagctata ataccaatag aggttttatc 60

atgtcctacg ctcagtttaa gggggccgct accctagcga cgtccttcct gctcgcagtc 120

accttgacag cctgtggagg cagcaaatcc aaacccgttc tgccagaccc atcgaacagc 180

agctcgtcat caagcagcag ctcgtcatca agcagcagct cctcaagttc ctccagtagc 240

agttcgagct cttctagtgc tccctccagc caaacgttct tcattgagcc ggatttccag 300

cttcacaccc tggcggactt cccgattgga gtggcagtct cggcagccaa tgagccatac 360

agcatcttca accaaaccga tggtactgat cggcaggatg tgatcctgga gcatttcaac 420

gaaatgaccg ctggcaacat catgaaaatg agctacgtgt acgcaggtca acgtgcaaat 480

cagcaacccg atcaattcga cttcagcaga gctgatgagc tggttgggtt tgcccacgca 540

aacagtgtga agattcacgg tcacgccctc gtttggcacg ccgactatca agttccgggt 600

ttcatgcaga attatgatgg cgactttgct gagatgttgg ccaatcacgc gcggagtgtt 660

gtggaacatt ttgacgaaga gtttccaggt accgtggtca gctgggatgt ggtcaacgag 720

gcgataaccg acaacttcgg aaccgataca aatggctggc gccggtcgct gttttacaac 780

gcgctgccgc ccgcgacaga agacgatatt cctgagtaca tccgcgttgc cttccaggcc 840

gctcgcgatg ccaacccgga catcgacctc tattacaatg attacgacaa taccgccaac 900

accaaccggc tgaacaaaac cctgcagatc gccgatgccc tggccgagga cgagctgatc 960

gacggtgtgg gattccagat gcacgtctat atgacgtacc cgagccttag tcacttccaa 1020

aacgcgtttc aagaagtggt tgatcgaggc ttgaaggtga agatcaccga gctggacgta 10801404

tcggtggtca acccatacgg tcagagcact ccgccaccgc agcccgtcta cgatgaagcg 1140ttggcaggcg cacagaaaaa gcggttctgc gatatcacca gagtctatct ggaaacggtt 1200ccggctgagc ttcgcggcgg tctcactgtt tgggggcttg ccgacaacga aagctggttg 1260atgcaacagt tcaggaacgc aacgggagcg aactacaccg acgtgtggcc gttgttgttc 1320aacgccgacc tgtcagccaa acctacactc caaggcgtgg ccgatgctct gcagggtctc 1380ccctgcacca ccgacctcga ctaa<210> 304<211> 467<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL

<222> (1) . . . (74)

<400> 304

Met Thr Ile Lys Ala Trp Pro Gly Thr Ala Ala Ser Tyr Asn Thr Asn

1 5 10 15

Arg Gly Phe Ile Met Ser Tyr Ala Gln Phe Lys Gly Ala Ala Thr Leu

20 25 30

Ala Thr Ser Phe Leu Leu Ala Val Thr Leu Thr Ala Cys Gly Gly Ser35 40 45

Lys Ser Lys Pro Val Leu Pro Asp Pro Ser Asn Ser Ser Ser Ser Ser

50 55 60

Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser

65 70 75 80

Ser Ser Ser Ser Ser Ser Ala Pro Ser Ser Gln Thr Phe Phe Ile Glu

85 90 95

Pro Asp Phe Gln Leu His Thr Leu Ala Asp Phe Pro Ile Gly Val Ala

100 105 110

Val Ser Ala Ala Asn Glu Pro Tyr Ser Ile Phe Asn Gln Thr Asp Gly

115 120 125

Thr Asp Arg Gln Asp Val Ile Leu Glu His Phe Asn Glu Met Thr Ala130 135 140

Gly Asn Ile Met Lys Met Ser Tyr Val Tyr Ala Gly Gln Arg Ala Asn145 150 155 160

Gln Gln Pro Asp Gln Phe Asp Phe Ser Arg Ala Asp Glu Leu Val Gly

165 170 175

Phe Ala His Ala Asn Ser Val Lys Ile His Gly His Ala Leu Val Trp180 185 190

His Ala Asp Tyr Gln Val Pro Gly Phe Met Gln Asn Tyr Asp Gly Asp

195 200 205

Phe Ala Glu Met Leu Ala Asn His Ala Arg Ser Val Val Glu His Phe210 215 220

Asp Glu Glu Phe Pro Gly Thr Val Val Ser Trp Asp Val Val Asn Glu225 230 235 240

Ala Ile Thr Asp Asn Phe Gly Thr Asp Thr Asn Gly Trp Arg Arg Ser

245 250 255

Leu Phe Tyr Asn Ala Leu Pro Pro Ala Thr Glu Asp Asp Ile Pro Glu260 265 270

Tyr Ile Arg Val Ala Phe Gln Ala Ala Arg Asp Ala Asn Pro Asp Ile

275 280 285

Asp Leu Tyr Tyr Asn Asp Tyr Asp Asn Thr Ala Asn Thr Asn Arg Leu290 295 300

Asn Lys Thr Leu Gln Ile Ala Asp Ala Leu Ala Glu Asp Glu Leu Ile305 310 315 320

Asp Gly Val Gly Phe Gln Met His Val Tyr Met Thr Tyr Pro Ser Leu

325 330 335

Ser His Phe Gln Asn Ala Phe Gln Glu Val Val Asp Arg Gly Leu Lys340 345 350

Val Lys Ile Thr Glu Leu Asp Val Ser Val Val Asn Pro Tyr Gly Gln

355 360 365

Ser Thr Pro Pro Pro Gln Pro Val Tyr Asp Glu Ala Leu Ala Gly Ala370 375 380

Gln Lys Lys Arg Phe Cys Asp Ile Thr Arg Val Tyr Leu Glu Thr Val385 390 395 400

Pro Ala Glu Leu Arg Gly Gly Leu Thr Val Trp Gly Leu Ala Asp Asn405 410 415

Glu Ser Trp Leu Met Gln Gln Phe Arg Asn Ala Thr Gly Ala Asn Tyr

420 425 430

Thr Asp Val Trp Pro Leu Leu Phe Asn Ala Asp Leu Ser Ala Lys Pro

435 440 445

Thr Leu Gln Gly Val Ala Asp Ala Leu Gln Gly Leu Pro Cys Thr Thr

450 455 460

Asp Leu Asp465

<210> 305<211> 3705<212> DNA<213> Bactéria<400> 305

atgaagagta ttgtaaacag agttgtatct atcgttacag ctttaataat gatttttgggacatcactgc tttcacaaca cataagggca tttgctgatg acactaatac aaatctggtttctaatgggg actttgagac aggcacaatt gatggctgga ttaagcaagg taatcctacattagaagtaa cgactgaaca agcaattggg caatacagta tgaaagttac gggtagaacacagacatatg aaggacctgc atatagcttt ttaggaaaaa tgcagaaagg tgaatcatataatgtatcgc ttaaagttag acttgtttct ggacaaaatt cttctaatcc ttttattaccgtgactatgt ttagagaaga tgacaatggc aagcattatg atacaatagt ttggcaaaaacaagtttctg aagattcatg gactactgta agcgggactt atacattaga ttatactggaacattaaaaa cattatacat gtatgtagaa tcacccgatc caacgctgga atactatattgatgatgttg tagtgacacc acaaaatcca atacaagtag gaaatgtgat taccaatggaacttttgaaa atggaaatac ttcaggatgg gttggaacag gctcatctgt tgttaaggcagtgtatggag tggctcatag cggaggttat agtttattga cgacagggag aacagctaattggaatggtc ctagctatga tttgactggc aaaatagtac caggtcaaca atacaatgttgatttttggg tgaaatttgt taatggcaat gatacagaac aaataaaggc tactgttaaagcgacttcta acaaagacaa ttatatacaa gttaatgatt ttgtaaatgt aaataaaggcgaatggacag aaataaaagg cagttttact ttacctgtga cagattacag cggtgtcagcatctatgtag aatctcaaaa tcctacttta gagttttaca ttgatgattt ttctgtaataggtgaaattt caaataatca gattacaata caaaatgata ttccggattt atattcagtattcaaagatt atttccccat cggtgttgca gttgattcga gtagattaaa tgatgctgatccacatgctc aattgactgc taaacatttt aatatgcttg ttgcagaaaa tgccatgaaaccggaaagct tgcagcctac agagggaaac tttacctttg ataatgctga taagattgttgattatgaaa tagcacataa tatgaagatg agaggtcata cattgctttg gcataatcaggttccggatt ggtttttcca ggacccatct gatccgtcta aaccagcttc aagggatctgctgcttcaaa gattaagaac gcacataaca actgtgttag atcattttaa aacaaaatacggttctcaaa atccaataat cggatgggat gttgtaaatg aggttcttga tgataatggcaatttaagaa attctaagtg gttacaaatt ataggacctg attatataga aaaagcttttgaatatgcgc atgaggcaga tccatctatg aaattgttta ttaatgatta caacatcgaaaataatggcg ttaaaacaca ggcaatgtat gatttagtga aaaagttaaa aagtgaaggtgtgcctataa acggaatagg catgcaaatg cacataagca taaattcaaa tatagacaatataaaagctt ctatagaaaa acttgcatca ttaggtgtgg aaatacaggt aactgaattagatatgaaca tgaatggtaa tgtatctaac gacgcattgc ttaagcaagc gagattgtataaacaattat ttgacttatt taaagcagaa aaacaatata taactgctgt agttttttggggagtttcag atgatgtaag ttggcttagt aagccaaatg ctccactact ttttgattcaaagttacagg caaagccagc atactgggca attgtagatc aaggcaaagc catacctgacattcaatctg caaaagcttt agaaggatca ccgacgattg gtgcaaatgt tgatagttcttggaaacttg taaaaccatt gtatgctaat acttatgtga aaggaactat tggagcaactgctgctgtta aatctatgtg ggatactaaa aacttatatt tgttagtaca agtttcagacaatactccat ctaataatga tggtatcgag atttttgtgg ataagaatga caacaaatctactacctatg aaagtgacga tgaacattat atagttaaga gggatggtac agggagttcaaatattacaa agtatgtaat gtctaatgct gatggatatg tagcacagat agctattccaattgaagaca ttagtcctgt gctgaatgat aaaattggat ttgatatcag aataaatgatgaccaaggca gtggcaatat aaatgcgata acagtttgga atgattatac aaacagtcaagatactaata cagcatattt tggagattta gtattatcaa aacctgcaca gattgcaacagctatatatg gcactcctgt tattgacggt aaagtagatg gtatttggaa taatgctgaagctatttcga caaatacatg ggtcttgggt tcaaatggtg ctactgcaac agcaaaaatgatgtgggacg ataaatatct ttatatattg gcagatgtaa cagataacaa tttaaataaatccagtgtga atccttatga acaggattct gtggaagttt ttgtagatca gaataatgataagacaactt attatgaaaa tgatgatggg cagtttagag ttaactatga taatgaacaaagttttggag gaagcactaa ttcaaatgga tttaagtcgg caacaagtct tacacaaaatggatatattg tagaagaagc tattccttgg acgagtatta ctccgtcaaa tggtactatcatagggtttg acttgcaagt taacgatgca gatgaaaatg gtaagaggac aggtattgtcacatggtgtg atccaagcgg aaattcttgg caagatactt ctggatttgg aaacttgatgcttacaggta agccatctgg tgtccttaaa aaggttgtgg catttaatga cataaaagacaattgggcga aagacgtaat agaagtatta gcgtcaaggc acatagtaga agggatgacagacacccagt atgaaccaaa caagacagtg acgagagcag aatttacagc aatgatactgaggctattaa acataaaaga agaagcatac agcggagaat ttagcgatgt aaaaagtggagactggtatg caaacgcgat agaagcagca tacaaaacag gaataatcga aggtgacggaaagaacgcaa ggccaaatga cagcataaca agagaagaga tgacagcaat agccatgagggcatacgaga tgctgacaca gtacgaagaa gagaatatag gtgcgacaac atttagcgacgacaaatcca taagcgattg ggcaagaaat gtagtggcaa atgcagcgaa attaggaatagtaaatggtg agccaaataa cgtatttgca cctaaaggaa atgccacaag agcagaagcagcagctatca tatacggctt attagaaaaa acaaataagc tttaa<210> 306<211> 1234<212> PRT<213> Bactéria<220>

<221> SIGNAL<222> (1)...(32)<400> 306

Met Lys Ser Ile Val Asn Arg Val Val Ser Ile Val Thr Ala Leu Ile

15 10 15

Met Ile Phe Gly Thr Ser Leu Leu Ser Gln His Ile Arg Ala Phe Ala

20 25 30

Asp Asp Thr Asn Thr Asn Leu Val Ser Asn Gly Asp Phe Glu Thr Gly

35 40 45

Thr Ile Asp Gly Trp Ile Lys Gln Gly Asn Pro Thr Leu Glu Val Thr

50 55 60

Thr Glu Gln Ala Ile Gly Gln Tyr Ser Met Lys Val Thr Gly Arg Thr65 70 75 80

Gln Thr Tyr Glu Gly Pro Ala Tyr Ser Phe Leu Gly Lys Met Gln Lys

85 90 95

Gly Glu Ser Tyr Asn Val Ser Leu Lys Val Arg Leu Val Ser Gly Gln

100 105 110

Asn Ser Ser Asn Pro Phe Ile Thr Val Thr Met Phe Arg Glu Asp Asp

115 120 125

Asn Gly Lys His Tyr Asp Thr Ile Val Trp Gln Lys Gln Val Ser Glu

130 135 140

Asp Ser Trp Thr Thr Val Ser Gly Thr Tyr Thr Leu Asp Tyr Thr Gly145 150 155 160

Thr Leu Lys Thr Leu Tyr Met Tyr Val Glu Ser Pro Asp Pro Thr Leu

165 170 175

Glu Tyr Tyr Ile Asp Asp Val Val Val Thr Pro Gln Asn Pro Ile Gln

180 185 190

Val Gly Asn Val Ile Thr Asn Gly Thr Phe Glu Asn Gly Asn Thr Ser

195 200 205

Gly Trp Val Gly Thr Gly Ser Ser Val Val Lys Ala Val Tyr Gly Val

210 215 220

Ala His Ser Gly Gly Tyr Ser Leu Leu Thr Thr Gly Arg Thr Ala Asn225 230 235 240

Trp Asn Gly Pro Ser Tyr Asp Leu Thr Gly Lys Ile Val Pro Gly Gln

245 250 255

Gln Tyr Asn Val Asp Phe Trp Val Lys Phe Val Asn Gly Asn Asp Thr

260 265 270

Glu Gln Ile Lys Ala Thr Val Lys Ala Thr Ser Asn Lys Asp Asn Tyr

275 280 285

Ile Gln Val Asn Asp Phe Val Asn Val Asn Lys Gly Glu Trp Thr Glu

290 295 300

Ile Lys Gly Ser Phe Thr Leu Pro Val Thr Asp Tyr Ser Gly Val Ser305 310 315 320

Ile Tyr Val Glu Ser Gln Asn Pro Thr Leu Glu Phe Tyr Ile Asp Asp

325 330 335

Phe Ser Val Ile Gly Glu Ile Ser Asn Asn Gln Ile Thr Ile Gln Asn

340 345 350

Asp Ile Pro Asp Leu Tyr Ser Val Phe Lys Asp Tyr Phe Pro Ile Gly

355 360 365

Val Ala Val Asp Ser Ser Arg Leu Asn Asp Ala Asp Pro His Ala Gln

370 375 380

Leu Thr Ala Lys His Phe Asn Met Leu Val Ala Glu Asn Ala Met Lys385 390 395 400Pro Glu Ser Leu Gln Pro Thr Glu Gly Asn Phe Thr Phe Asp Asn Ala

405 410 415

Asp Lys Ile Val Asp Tyr Glu Ile Ala His Asn Met Lys Met Arg Gly420 425 430

His Thr Leu Leu Trp His Asn Gln Val Pro Asp Trp Phe Phe Gln Asp435 440 445

Pro Ser Asp Pro Ser Lys Pro Ala Ser Arg Asp Leu Leu Leu Gln Arg

450 455 460

Leu Arg Thr His Ile Thr Thr Val Leu Asp His Phe Lys Thr Lys Tyr465 470 475 480

Gly Ser Gln Asn Pro Ile Ile Gly Trp Asp Val Val Asn Glu Val Leu

485 490 495

Asp Asp Asn Gly Asn Leu Arg Asn Ser Lys Trp Leu Gln Ile Ile Gly500 505 510

Pro Asp Tyr Ile Glu Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro515 520 525

Ser Met Lys Leu Phe Ile Asn Asp Tyr Asn Ile Glu Asn Asn Gly Val

530 535 540

Lys Thr Gln Ala Met Tyr Asp Leu Val Lys Lys Leu Lys Ser Glu Gly545 550 555 560

Val Pro Ile Asn Gly Ile Gly Met Gln Met His Ile Ser Ile Asn Ser

565 570 575

Asn Ile Asp Asn Ile Lys Ala Ser Ile Glu Lys Leu Ala Ser Leu Gly580 585 590

Val Glu Ile Gln Val Thr Glu Leu Asp Met Asn Met Asn Gly Asn Val595 600 605

Ser Asn Asp Ala Leu Leu Lys Gln Ala Arg Leu Tyr Lys Gln Leu Phe

610 615 620

Asp Leu Phe Lys Ala Glu Lys Gln Tyr Ile Thr Ala Val Val Phe Trp625 630 635 640

Gly Val Ser Asp Asp Val Ser Trp Leu Ser Lys Pro Asn Ala Pro Leu

645 650 655

Leu Phe Asp Ser Lys Leu Gln Ala Lys Pro Ala Tyr Trp Ala Ile Val660 665 670

Asp Gln Gly Lys Ala Ile Pro Asp Ile Gln Ser Ala Lys Ala Leu Glu675 680 685

Gly Ser Pro Thr Ile Gly Ala Asn Val Asp Ser Ser Trp Lys Leu Val

690 695 700

Lys Pro Leu Tyr Ala Asn Thr Tyr Val Lys Gly Thr Ile Gly Ala Thr705 710 715 720

Ala Ala Val Lys Ser Met Trp Asp Thr Lys Asn Leu Tyr Leu Leu Val

725 730 735

Gln Val Ser Asp Asn Thr Pro Ser Asn Asn Asp Gly Ile Glu Ile Phe740 745 750

Val Asp Lys Asn Asp Asn Lys Ser Thr Thr Tyr Glu Ser Asp Asp Glu755 760 765

His Tyr Ile Val Lys Arg Asp Gly Thr Gly Ser Ser Asn Ile Thr Lys

770 775 780

Tyr Val Met Ser Asn Ala Asp Gly Tyr Val Ala Gln Ile Ala Ile Pro785 790 795 800

Ile Glu Asp Ile Ser Pro Val Leu Asn Asp Lys Ile Gly Phe Asp Ile

805 810 815

Arg Ile Asn Asp Asp Gln Gly Ser Gly Asn Ile Asn Ala Ile Thr Val820 825 830

Trp Asn Asp Tyr Thr Asn Ser Gln Asp Thr Asn Thr Ala Tyr Phe Gly835 840 845

Asp Leu Val Leu Ser Lys Pro Ala Gln Ile Ala Thr Ala Ile Tyr Gly

850 855 860

Thr Pro Val Ile Asp Gly Lys Val Asp Gly Ile Trp Asn Asn Ala Glu865 870 875 880

Ala Ile Ser Thr Asn Thr Trp Val Leu Gly Ser Asn Gly Ala Thr Ala

885 890 895

Thr Ala Lys Met Met Trp Asp Asp Lys Tyr Leu Tyr Ile Leu Ala Asp900 905 910

Val Thr Asp Asn Asn Leu Asn Lys Ser Ser Val Asn Pro Tyr Glu Gln915 920 925

Asp Ser Val Glu Val Phe Val Asp Gln Asn Asn Asp Lys Thr Thr Tyr930 935 940

Tyr Glu Asn Asp Asp Gly Gln Phe Arg Val Asn Tyr Asp Asn Glu Gln945 950 955 960Ser Phe Gly Gly Ser 965 Thr Asn Ser Asn Gly 970 Phe Lys Ser Ala Thr 975 SerLeu Thr Gln Asn 980 Gly Tyr Ile Val Glu 985 Glu Ala Ile Pro Trp 990 Thr SerIle Thr Pro Ser Asn Gly Thr Ile Ile Gly Phe Asp Leu Gln Val Asn 995 1000 1005 Asp Ala Asp Glu Asn Gly Lys Arg Thr Gly Ile Val Thr Trp Cys Asp 1010 1015 1020 Pro Ser Gly Asn Ser Trp Gln Asp Thr Ser Gly Phe Gly Asn Leu Met1025 1030 1035 104CLeu Thr Gly Lys Pro Ser Gly Val Leu Lys Lys Val Val Ala Phe Asn

1045 1050 1055

Asp Ile Lys Asp Asn Trp Ala Lys Asp Val Ile Glu Val Leu Ala Ser

1060 1065 1070

Arg His Ile Val Glu Gly Met Thr Asp Thr Gln Tyr Glu Pro Asn Lys

1075 1080 1085

Thr Val Thr Arg Ala Glu Phe Thr Ala Met Ile Leu Arg Leu Leu Asn

1090 1095 1100

Ile Lys Glu Glu Ala Tyr Ser Gly Glu Phe Ser Asp Val Lys Ser Gly1105 1110 1115 1120

Asp Trp Tyr Ala Asn Ala Ile Glu Ala Ala Tyr Lys Thr Gly Ile Ile

1125 1130 1135

Glu Gly Asp Gly Lys Asn Ala Arg Pro Asn Asp Ser Ile Thr Arg Glu

1140 1145 1150

Glu Met Thr Ala Ile Ala Met Arg Ala Tyr Glu Met Leu Thr Gln Tyr

1155 1160 1165

Glu Glu Glu Asn Ile Gly Ala Thr Thr Phe Ser Asp Asp Lys Ser Ile

1170 1175 1180

Ser Asp Trp Ala Arg Asn Val Val Ala Asn Ala Ala Lys Leu Gly Ile1185 1190 1195 1200

Val Asn Gly Glu Pro Asn Asn Val Phe Ala Pro Lys Gly Asn Ala Thr

1205 1210 1215

Arg Ala Glu Ala Ala Ala Ile Ile Tyr Gly Leu Leu Glu Lys Thr Asn1220 1225 1230

Lys Leu<210> 307<211> 3729<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 307

atgaaatccg ccatcggcga cgctgcgttt atggcggcga tggaacgcaagtgacgatgc agtgctacgc acctatcttt gtcaatgtca atcccggcggcgccccaatt tgatgggcta cgatgcgtta agcgctttcg gctcgccctcatcaaaatgt tcagcaacaa tttgggcgat acgattttga agcccagtctcgcctgccag tttccgttac acaagagcag aaaagcggca cgattttcataacccgcaaa cgacgccaca gagcgtaâaa attgatctca aaggcgtgcgttcagcggca ccgccactgt tttagctgcc gactccggcg cgcttaactccctaccaaag tcgttcctgt cacgcgcaga attactggaa tcagcccctcacgctggagc cgtattcgat tactgttttg caaatcaagg ccactgctctacagcaaacg ccgttgcgcc gccaaccttc accacggagc caaaagtgaacccgttacta ttcccgttgc gacttcgcag ccgcagccag tttcgcaaccgcaaacgcta tcgcgccgct gaaaaacgct ttcaaaggca agttcctcatttgagcgggc cagacctgcg cggccagcaa acgcgcagcg tgggtatcgcttcgacgcct ttacggcaga aaacgaaatg aagccggatg cgatgcagcccaattcaact ttgctgccgg cgaccgctta gtggaactgg ccgaaaaaagcccatcggcc acacgctaat ctggcactcg caaacaccac gctggttcttgacggacaac cggcgaatcg tgaattggcc ttggcgcgga tgcgcaagcagtcgtcggcc actacaaagg gcgcgtcaag cagtgggacg tggtgaacgagatggccccg gcgtgctgcg ccaaagcccg tggctgcgcg ctatcggcgagctgaagcgt ttcgagccgc gcacgccgcc gaccctgacg caattctcattacaacatcg aaatgggcta caaacggccc aaagcaatcc aactcttaaagatcagaaag tgccgattca tgcggttggt attcagggcc actggcgtat

ctccgacatcgcggcagtgggtattacgcccagcggtgcgtaaattggtgctccgtcgaacattgatgcggtttgcgcaagccaacggcgcaccaccacggtcgccagattggcaccgtgcaccacgcattcgcgaaggacggcgccacgtgaagggccgtattgcaaccagccataaacagactacatcctataacgatatctctggttggacaccaacctcaccgaag tggaacaagc tattaaagaa ttctcggcgc tgggcctgaa ggtgatgatc - 1380

actgaactcg acatcggtgt tttgccgacg cgttatcagg gcgctgatat ttcgcaggtg 1440

caaaacatga cgcctgaaca gcgcgccgcc gtgaacccat ataccaatgg tttgcccgac 1500

gacgtagcgc aaaaacacgc cgataaatat cgccaggcct tcgatatttt cctgcgctac 1560

aaagatgtca tcgaacgcgt cacgttctgg ggtgtggacg atgctcattc gtggctgaac 1620

ggtttcccga ttcgcgggcg caccgattac ccattgcttt tcgaccggca gggcaaacct 1680

aaacccgcct ttttcgccgt gcaaaacctg gctttaggcg tgaccgccgc gccgcaatcg 1740

aatgcttcgt ctgcacccag agctgtcgct caagctgcgc cggcaaccag caatattcgt 1800

ggccaggaat ttccacgggt cgaaagcgat ttgcgtgtga cgtttcgcat caaagccccc 1860

gaagcgcaaa aagtgcagtt cgatttaggc aagccttacg acgcgacccg cgatgctgaa 1920

ggcaactgga cggcaaccac cgagccgcag gtgcccggct ttcactatta caatttggtg 1980

attgacggcg tgcgcgtgaa cgacccggcc agcgaaacct tttacggcgc gggccgccag 2040

atgagcggca tcgaaatccc cgaccctgac agcgcctttt attcgccgca aaacgtgccg 2100

cacggcgaag tgcgcgagcg ctggtatttt tccaacacca cgcaggcgtg gcgtcgcatt 2160

ttcatttata cgccgccggg ttatgacacg aatcaagtgg agcgttttcc cgttttgtat 2220

ttacagcatg gcggcggcga agatgagcgc ggctggcctc aacagggtcg catgagcttt 2280

atcatggata atctcatcgc cacacgtaaa gccaaaccga tgcttgtggt gatggaacaa 2340

ggctatgcgc gcaagcccaa cgagccgcag gtgccgttgc gcccgcccgg cggtagcgcc 2400

ggagccatgc cccccgattt caatcgcatg ttcggcacac tgggtgaagt gttcaccaaa 2460

gacctgattc cctttattga tgctaattac cgcaccaaaa ccgaccgcga aaaccgcgcc 2520

atggccggac tttcgatggg cgggatgcaa agtttcctta ttggcttgtc gaacaccgat 2580

ttattcgcgc acatcggagg cttcagcggc gcgggcggcg gtttcggtgg cggcaccttc 2640

gacgcaaaaa cggcgcacgg cggtgtaatg gccgacgccg acgcgttcaa caaaaaagtt 2700

cgcacgctgt ttctcagcat cggcacagcg gaaaacgaac gctttcagag cagcgtgcgc 2760

ggttaccgcg atgcgctgac caaagcgggc atcaaaacca cattctacga atcgcccggc 2820

acctcacatg aatggctgac atggcggcgt agcctgaaag aattcgcacc gctcttgttt 2880

caagaagtcg aagtgcaaat tgagcgcggc ccgaatgcgc gcccaattgc gccgcaaccg 2940

attaatctcg gccccgacga taaacccgca tttcccccgg tgcccgccgg tttcgatgtc 3000

cgccgcaacg atattccgca tggcgaaatc aaactcgtgg aatatccatc cgctacagtg 3060

ggcacaaatc gtaagatgca ggtttacacg ccgcccggtt acaatccgca agaaaagtat 3120

gcggtgcttt atctgttgca cggaatcggc ggcgacgagt gggaatggaa aaatggcggc 3180

acgccggaag tgattctcga taatctttac gccgcgaaaa aactccagcc gatgattgtg 3240

gtcatgccca atggccgcgc gcaaaaagat gaccgtccaa tcggcaatgt gttcgcatca 3300

gcgcctgctt ttgaaacctt cgagaaagat ttactcaacg acgtaattcc gtttatcgaa 3360

aagaattatc cagtcaaaac cggcgccgaa aatcgcgcgc ttgcgggcct ttcgatgggc 3420

ggtgggcaat cgctgaactt tggtctgggc aatctcgaca cctttgcgtg ggtcggcggc 3480

ttttcttcgg cgcccaacac gcgcactggc gcaaggctat tagccaatcc cgacgatgcc 3540

aaaaagaagc tgaaattgtt atgggtttcg tgtggcgata aagacggctt gtttttcatc 3 600

agccagcgca cgcatcgcta tctcgccgaa aacaatgtgc cacacgtctg gcatgtgcag 3660

cccggcggcc acgatttccg agtgtggaag caagaccttt ataacttttc gcaactgctg 3720

ttccgctaa 3729<210> 308<211> 1242<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 308

Met Lys Ser Ala Ile Gly Asp Ala Ala Phe Met Ala Ala Met Glu Arg

1 5 10 15

Asn Ser Asp Ile Val Thr Met Gln Cys Tyr Ala Pro Ile Phe Val Asn

Ser Asn Asn Leu Gly Asp Thr Ile Leu Lys Pro Ser Leu Ser Gly Ala65 70 75 80

Arg Leu Pro Val Ser Val Thr Gln Glu Gln Lys Ser Gly Thr Ile Phe

85 90 95

Ile Lys Leu Val Asn Pro Gln Thr Thr Pro Gln Ser Val Lys Ile Asp

100 105 110

Leu Lys Gly Val Arg Ser Val Glu Phe Ser Gly Thr Ala Thr Val Leu

115 120 125

Ala Ala Asp Ser Gly Ala Leu Asn Ser Ile Asp Ala Pro Thr Lys Val

130 135 140

Val Pro Val Thr Arg Arg Ile Thr Gly Ile Ser Pro Ser Phe Ala Gln145 150 155 160Thr Leu Glu Pro Tyr Ser Ile Thr Val Leu Gln Ile Lys Ala Thr Ala 165 170 175 Leu Pro Thr Ala Thr Ala Asn Ala Val Ala Pro Pro Thr Phe Thr Thr 180 185 190 Glu Pro Lys Val Asn Thr Thr Thr Pro Val Thr Ile Pro Val Ala Thr 195 200 205 Ser Gln Pro Gln Pro Val Ser Gln Pro Ser Pro Asp Ala Asn Ala Ile 210 215 220 Ala Pro Leu Lys Asn Ala Phe Lys Gly Lys Phe Leu Ile Gly Thr Val225 230 235 240Leu Ser Gly Pro Asp Leu Arg Gly Gln Gln Thr Arg Ser Val Gly Ile 245 250 255 Ala Thr Thr His Phe Asp Ala Phe Thr Ala Glu Asn Glu Met Lys Pro 260 265 270 Asp Ala Met Gln Pro Arg Glu Gly Gln Phe Asn Phe Ala Ala Gly Asp 275 280 285 Arg Leu Val Glu Leu Ala Glu Lys Ser Gly Ala Thr Pro Ile Gly His 290 295 300 Thr Leu Ile Trp His Ser Gln Thr Pro Arg Trp Phe Phe Glu Gly Pro305 310 315 320Asp Gly Gln Pro Ala Asn Arg Glu Leu Ala Leu Ala Arg Met Arg Lys 325 330 335 His Xle Ala Thr Val Val Gly His Tyr Lys Gly Arg Val Lys Gln Trp 340 345 350 Asp Val Val Asn Glu Ala Ile Asn Asp Gly Pro Gly Val Leu Arg Gln 355 360 365 Ser Pro Trp Leu Arg Ala Ile Gly Glu Asp Tyr Ile Ala Glu Ala Phe 370 375 380 Arg Ala Ala His Ala Ala Asp Pro Asp Ala Ile Leu Ile Tyr Asn Asp385 390 395 400Tyr Asn Ile Glu Met Gly Tyr Lys Arg Pro Lys Ala Ile Gln Leu Leu 405 410 415 Lys Ser Leu Val Asp Gln Lys Val Pro Ile His Ala Val Gly Ile Gln 420 425 430 Gly His Trp Arg Met Asp Thr Asn Leu Thr Glu Val Glu Gln Ala Ile 435 440 445 Lys Glu Phe Ser Ala Leu Gly Leu Lys Val Met Ile Thr Glu Leu Asp 450 455 460 Ile Gly Val Leu Pro Thr Arg Tyr Gln Gly Ala Asp Ile Ser Gln Val465 470 475 480Gln Asn Met Thr Pro Glu Gln Arg Ala Ala Val Asn Pro Tyr Thr Asn 485 490 495 Gly Leu Pro Asp Asp Val Ala Gln Lys His Ala Asp Lys Tyr Arg Gln 500 505 510 Ala Phe Asp Ile Phe Leu Arg Tyr Lys Asp Val Ile Glu Arg Val Thr 515 520 525 Phe Trp Gly Val Asp Asp Ala His Ser Trp Leu Asn Gly Phe Pro Ile 530 535 540 Arg Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Gln Gly Lys Pro545 550 555 560Lys Pro Ala Phe Phe Ala Val Gln Asn Leu Ala Leu Gly Val Thr Ala 565 570 575 Ala Pro Gln Ser Asn Ala Ser Ser Ala Pro Arg Ala Val Ala Gln Ala 580 585 590 Ala Pro Ala Thr Ser Asn Ile Arg Gly Gln Glu Phe Pro Arg Val Glu 595 600 605 Ser Asp Leu Arg Val Thr Phe Arg Ile Lys Ala Pro Glu Ala Gln Lys 610 615 620 Val Gln Phe Asp Leu Gly Lys Pro Tyr Asp Ala Thr Arg Asp Ala Glu625 630 635 640Gly Asn Trp Thr Ala Thr Thr Glu Pro Gln Val Pro Gly Phe His Tyr 645 650 655 Tyr Asn Leu Val Ile Asp Gly Val Arg Val Asn Asp Pro Ala Ser Glu 660 665 670 Thr Phe Tyr Gly Ala Gly Arg Gln Met Ser Gly Ile Glu Ile Pro Asp 675 680 685Pro Asp Ser Ala Phe Tyr Ser Pro Gln Asn Val Pro His Gly Glu Val 690 695 700 Arg Glu Arg Trp Tyr Phe Ser Asn Thr Thr Gln Ala Trp Arg Arg Ile 705 710 715 720 Phe Ile Tyr Thr Pro Pro Gly Tyr Asp Thr Asn Gln Val Glu Arg Phe 725 730 735 Pro Val Leu Tyr Leu Gln His Gly Gly Gly Glu Asp Glu Arg Gly Trp 740 745 750 Pro Gln Gln Gly Arg Met Ser Phe Ile Met Asp Asn Leu Ile Ala Thr 755 760 765 Arg Lys Ala Lys Pro Met Leu Val Val Met Glu Gln Gly Tyr Ala Arg 770 775 780 Lys Pro Asn Glu Pro Gln Val Pro Leu Arg Pro Pro Gly Gly Ser Ala 785 790 795 800 Gly Ala Met Pro Pro Asp Phe Asn Arg Met Phe Gly Thr Leu Gly Glu 805 810 815 Val Phe Thr Lys Asp Leu Ile Pro Phe Ile Asp Ala Asn Tyr Arg Thr 820 825 830 Lys Thr Asp Arg Glu Asn Arg Ala Met Ala Gly Leu Ser Met Gly Gly 835 840 845 Met Gln Ser Phe Leu Ile Gly Leu Ser Asn Thr Asp Leu Phe Ala His 850 855 860 Ile Gly Gly Phe Ser Gly Ala Gly Gly Gly Phe Gly Gly Gly Thr Phe 865 870 875 880 Asp Ala Lys Thr Ala His Gly Gly Val Met Ala Asp Ala Asp Ala Phe 885 890 895 Asn Lys Lys Val Arg Thr Leu Phe Leu Ser Ile Gly Thr Ala Glu Asn 900 905 910 Glu Arg Phe Gln Ser Ser Val Arg Gly Tyr Arg Asp Ala Leu Thr Lys 915 920 925 Ala Gly Ile Lys Thr Thr Phe Tyr Glu Ser Pro Gly Thr Ser His Glu 930 935 940 Trp Leu Thr Trp Arg Arg Ser Leu Lys Glu Phe Ala Pro Leu Leu Phe 960 Gln Glu Val Glu Val Gln Ile Glu Arg Gly Pro Asn Ala Arg Pro Ile 965 970 975 Ala Pro Gln Pro Ile Asn Leu Gly Pro Asp Asp Lys Pro Ala Phe Pro 980 985 990 Pro Val Pro Ala Gly Phe Asp Val Arg Arg Asn Asp Ile Pro His Gly 995 1000 1005 Glu Ile Lys Leu Val Glu Tyr Pro Ser Ala Thr Val Gly Thr Asn Arg 1010 1015 1020 Lys Met Gln Val Tyr Thr Pro Pro Gly Tyr Asn Pro Gln Glu Lys Tyr 1025 1030 1035 1040 Ala Val Leu Tyr Leu Leu His Gly Ile Gly Gly Asp Glu Trp Glu Trp 1045 1050 1055 Lys Asn Gly Gly Thr Pro Glu Val Ile Leu Asp Asn Leu Tyr Ala Ala 1060 1065 1070 Lys Lys Leu Gln Pro Met Ile Val Val Met Pro Asn Gly Arg Ala Gln 1075 1080 1085 Lys Asp Asp Arg Pro Ile Gly Asn Val Phe Ala Ser Ala Pro Ala Phe 1090 1095 1100 Glu Thr Phe Glu Lys Asp Leu Leu Asn Asp Val Ile Pro Phe Ile Glu 1105 1110 1115 1120 Lys Asn Tyr Pro Val Lys Thr Gly Ala Glu Asn Arg Ala Leu Ala Gly 1125 1130 1135 Leu Ser Met Gly Gly Gly Gln Ser Leu Asn Phe Gly Leu Gly Asn Leu 1140 1145 1150 Asp Thr Phe Ala Trp Val Gly Gly Phe Ser Ser Ala Pro Asn Thr Arg 1155 1160 1165 Thr Gly Ala Arg Leu Leu Ala Asn Pro Asp Asp Ala Lys Lys Lys Leu 1170 1175 1180 Lys Leu Leu Trp Val Ser Cys Gly Asp Lys Asp Gly Leu Phe Phe Ile 1185 1190 1195 1200 Ser Gln Arg Thr His Arg Tyr Leu Ala Glu Asn Asn Val Pro His Val 1205 1210 1215 Trp His Val Gln Pro Gly Gly His Asp Phe Arg Val Trp Lys Gln Asp1220 1225 1230

Leu Tyr Asn Phe Ser Gln Leu Leu Phe Arg

1235 1240

<210> 309<211> 1830<212> DNA<213> Desconhecido<22 0>

<223> Obtido para uma amostra ambiental.<400> 309

ttgaaaaaac tcacaatcgc cctatccctt gcaatcactt ttgccgcgcc agtttttgcg 60

acagatgctt gtttgcaaaa tactcaatta aatgctaccg cccaaggagc acaaacctgg 120

actggcaaaa aaggagctac aactttaggc ggttcaggtg acgatgctta tggagttgaa 180

acttggacag aagctggtgg agacgctact aaatttacat ggtttggacc aaatcagggt 240

ggtggtttcg cttatagagc ggaatggaca aattccacag attacttagg tcgctttggt 300

tatttttggg gtattgacgg gaaaaaatgg gacaaattag gagacctttg cgttgattat 3 60

aactataaaa gatctgccaa tggcactgga ggttcatatt cttatatagg cgtttatgga 420

tggacaaacg ctggcggtgg tactgaagct gaatattata tagttgaaga ttggtttgga 480

gaaaatcaac agactgcaaa taatttaggc aatggttgcc aagagcacgg tgaaattaca 540

gtggacgaga aaagctataa agttgtcact tgcataagac cagcaggctc tggctgcgta 600

acttgcaacg gacaacaatt cgggcaagtc tttagcatac gccaaggcat gagaagcgaa 660

caacctaaaa catgcggaac aatctccatc aaaaagcact ttgaagaatg ggtaaaaatg 720

acaaccgaaa aaagcggaca atccccagct aaatatattt acgataaaac ttatgaatcc 780

aaatttttag cggaggcaca aggcggcact ggttggcttg aaaccacttt ccttaaattt 840

tctagaaacg gtgattgcgg cttcgatatt cctgatggtc atttcaccct tcaattagct 900

acctctccgt ctgagggcgg tactgtaagc agaaacccaa aggaatcttc ttatgcctcc 960

ggttcaactg taactctcac agccactccg gcagcaggtt ggaaatttgc cagttggagt 1020ggtgatgcat gtcaaaccac aagcccattg acagtcacta tggacaaaaa caaggtaatc 1080acagcgaaat ttacccccgt tgtagatctc aataaaaacc ttgttacaaa tggtactttc 1140acgaataaag agagttggac ttttaatact ggttccagtt atggcaactc cgaaggaact 1200tttgatgtgt caaacagcga aggcagaata aatgtgacga aaattggctc caacccgtgg 1260gaaccacagc tcgttcaaaa tggcatcacc cttgttgaag gaatgaatta caaaataact 1320tttgaagctt ctgcctctgc tgctcgaaaa ataggcttgg ttatacaaat ggcaggcggc 1380gattatacca cttattttga aaaagatata gacttgactg cctcaaatca acaattttcg 1440tatgaattca aaatgaatgc accaagcgat gaaagcggtc gtattgggtt taatcttggg 1500caaacgactg gaaacgtcac tctaagcaaa atcacccttc attatttaga agaagattca 1560cacgaaccgt ccgacaatcc ctgcgaagac ccaagtccaa ttttgaaaaa acgcatccct 1620gcaactcatt tctcccttca aacgcttagc gacaaagcct tgcgcataga agtgaacgct 1680ccaaccattg tggacatttt tgacctgaga gggaataaag ttaagagttt gaatgtctcc 1740ggctcgcaaa cggttaaatt atccctgcca agcggagtgt attttgccaa agcacgtgga 1800atgaaaagcg tcagatttgt gttgaggtaa 1830

<210> 310<211> 609<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL

<222> (1).. . (20) <400> 310 Met Lys Lys Leu Thr Ile Ala Leu Ser Leu Ala Ile Thr Phe Ala Ala1 5 10 15 Pro Val Phe Ala 20 Thr Asp Ala Cys Leu 25 Gln Asn Thr Gln Leu 30 Asn AlaThr Ala Gln 35 Gly Ala Gln Thr Trp 40 Thr Gly Lys Lys Gly 45 Ala Thr ThrLeu Gly 50 Gly Ser Gly Asp Asp 55 Ala Tyr Gly Val Glu 60 Thr Trp Thr GluAla Gly Gly Asp Ala Thr Lys Phe Thr Trp Phe Gly Pro Asn Gln Gly65 70 75 80Gly Gly Phe Ala Tyr 85 Arg Ala Glu Trp Thr 90 Asn Ser Thr Asp Tyr 95 LeuGly Arg Phe Gly 100 Tyr Phe Trp Gly Ile 105 Asp Gly Lys Lys Trp 110 Asp LysLeu Gly Asp Leu Cys Val Asp Tyr Asn Tyr Lys Arg Ser Ala Asn Gly

115 120 125Thr Gly Gly Ser Tyr Ser Tyr Ile Gly Val Tyr Gly Trp Thr Asn Ala

130 135 140

Gly Gly Gly Thr Glu Ala Glu Tyr Tyr Ile Val Glu Asp Trp Phe Gly145 150 155 160

Glu Asn Gln Gln Thr Ala Asn Asn Leu Gly Asn Gly Cys Gln Glu His

165 170 175

Gly Glu Ile Thr Val Asp Glu Lys Ser Tyr Lys Val Val Thr Cys Ile

180 185 190

Arg Pro Ala Gly Ser Gly Cys Val Thr Cys Asn Gly Gln Gln Phe Gly

195 200 205

Gln Val Phe Ser Ile Arg Gln Gly Met Arg Ser Glu Gln Pro Lys Thr

210 215 220

Cys Gly Thr Ile Ser Ile Lys Lys His Phe Glu Glu Trp Val Lys Met225 230 235 240

Thr Thr Glu Lys Ser Gly Gln Ser Pro Ala Lys Tyr Ile Tyr Asp Lys

245 250 255

Thr Tyr Glu Ser Lys Phe Leu Ala Glu Ala Gln Gly Gly Thr Gly Trp

260 265 270

Leu Glu Thr Thr Phe Leu Lys Phe Ser Arg Asn Gly Asp Cys Gly Phe275 280 285

Asp Ile Pro Asp Gly His Phe Thr Leu Gln Leu Ala Thr Ser Pro Ser

290 295 300

Glu Gly Gly Thr Val Ser Arg Asn Pro Lys Glu Ser Ser Tyr Ala Ser305 310 315 320

Gly Ser Thr Val Thr Leu Thr Ala Thr Pro Ala Ala Gly Trp Lys Phe

325 330 335

Ala Ser Trp Ser Gly Asp Ala Cys Gln Thr Thr Ser Pro Leu Thr Val

340 345 350

Thr Met Asp Lys Asn Lys Val Ile Thr Ala Lys Phe Thr Pro Val Val

355 360 365

Asp Leu Asn Lys Asn Leu Val Thr Asn Gly Thr Phe Thr Asn Lys Glu

370 375 380

Ser Trp Thr Phe Asn Thr Gly Ser Ser Tyr Gly Asn Ser Glu Gly Thr385 390 395 400

Phe Asp Val Ser Asn Ser Glu Gly Arg Ile Asn Val Thr Lys Ile Gly

405 410 415

Ser Asn Pro Trp Glu Pro Gln Leu Val Gln Asn Gly Ile Thr Leu Val

420 425 430

Glu Gly Met Asn Tyr Lys Ile Thr Phe Glu Ala Ser Ala Ser Ala Ala435 440 445

Arg Lys Ile Gly Leu Val Ile Gln Met Ala Gly Gly Asp Tyr Thr Thr

450 455 460

Tyr Phe Glu Lys Asp Ile Asp Leu Thr Ala Ser Asn Gln Gln Phe Ser465 470 475 480

Tyr Glu Phe Lys Met Asn Ala Pro Ser Asp Glu Ser Gly Arg Ile Gly

485 490 495

Phe Asn Leu Gly Gln Thr Thr Gly Asn Val Thr Leu Ser Lys Ile Thr

500 505 510

Leu His Tyr Leu Glu Glu Asp Ser His Glu Pro Ser Asp Asn Pro Cys

515 520 525

Glu Asp Pro Ser Pro Ile Leu Lys Lys Arg Ile Pro Ala Thr His Phe

530 535 540

Ser Leu Gln Thr Leu Ser Asp Lys Ala Leu Arg Ile Glu Val Asn Ala545 550 555 560

Pro Thr Ile Val Asp Ile Phe Asp Leu Arg Gly Asn Lys Val Lys Ser

565 570 575

Leu Asn Val Ser Gly Ser Gln Thr Val Lys Leu Ser Leu Pro Ser Gly

580 585 590

Val Tyr Phe Ala Lys Ala Arg Gly Met Lys Ser Val Arg Phe Val Leu595 600 605

Arg

<210> 311<211> 3972<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 311

atgcggaaaa gagtaatagc tttatttgta actctcatct ttgtcatgtc tattttaagt 60

ccaggatatc ttccatttct gagtactaaa gcaaatgctc aaacacaaaa tacaccaaca 120

attttaaaat ttgattttga aagcggtaat caaggctgga cggggagagg tctttcaaca 180

actgttgcaa ccgtttacaa tgttgcttat gaaggtgatt attcattaaa agtttctggc 240

agaaatgctt catgggatgg agctgttatt gatttaacag acaagctttc ggcaaatgtg 300

agttatacag tttctctgtt tgttcgtcac agtgaccaaa aacctcaaag attttcagta 360

tatgcatatg taaaagattc agcaagtgaa aaatatattc cagttgtaga taaagttgca 420

gttcctaatt attggaagca actggttggt aaattcacaa tcaacacttc aaatccagtc 480

caaaagattc agctgcttgt ctgtgttcct acaaataaat cattggaatt ttttatcgat 540

agcgtattaa ttgcaagtag tgcaggagca acatctggag ttgtaaaatc cacaaatttt 600

gaaagcggta caacagaagg ctggcaagca aggggaacag gttctgttgc tcagattagt 660

gttgtttcta cagtagctca ttcaggtagt aaaagtttgt atgtgacagg gcgagttcaa 720

acgtggcaag gtgcacaaat agatttgaca agtttgttag agaagggtaa agaatatcag 780

ttttctgtgt gggtatatca ggatagtgga agcgaccaaa agctgacact gaccatggaa 840

aggaaaaatg cagatggaag tacaaattat gatacaataa aatggcagca aacagtttca 900

agcaatacat gggtagagct aacaggttca tatacagtac ctgcaacagc aacacaacta 960

atattctaca ttgaatcacc caatgctacc ctaagctttt atattgatga ttttactgct 1020

gttgataaaa atgcaccagt tgtagcgcct ggaattataa aatcagccac atttgaaagc 1080

ggtacaacag aagactggca agcaagaggg acaggagtga ccgtttctgt tgttaacaca 1140

gtggcacata ctgggagcaa gagtttgtat gtgacaggga gaagtcaaaa ttggcatggt 1200

gcagaaattg atctgacaaa tgtgctagag aagggcaagg aatatcaatt ttctgtgtgg 1260

gtatatcagg atagtggaag cgatcagaag ctgacattga ccatgcaaag gaaaaatgca 1320

gataacacaa cagattatga ttctataaaa tatcagcaga cagtagcaac aaatacatgg 1380

gtagagctaa caggttcata tacagtgccg acaacagcca cccagttaat tttatatgtt 1440

gaagctgcag atactaccct aagcttttat attgatgatt ttactgctgt tgataaaaac 1500

ccagaggtaa taccaacagt atcgagagta ccagaatggg aaattccttc actctttgag 1560

cagtatacga attatttcag cattggtgtg gcaataccat ataaagtact tacaaatcca 1620

accgaaaagg caatggtact caaacatttc aacagtataa cagctgagaa tgaaatgaaa 1680

cctgatgcta ttcaaaagac agaagggaat tttacattta atgttgcaga ccaatacgta 1740

gattttgcac agcaaaatag aattggaatc agaggtcaca ctcttgtttg gcatcagcaa 1800

acaccaaatt ggttcttcca gcatagtgat ggtactccgc ttgatccaag caatcctgct 1860

gacaaacaac ttctacgcga tagattaaga acgcatatcc aaacacttgt tggaagatac 1920

gcagggaaaa tttatgcatg ggatgttgta aacgaggcaa ttgacgagaa ccagccagat 1980

ggatacagaa gaagtgaatg gtacagaata ttggggccaa ctgatacaac agatggcatt 2040

ccagaatata ttctgcttgc attccagtat gcaagagagg cagacccaaa tactaagctc 2100

ttttataacg actataatac agaaaatcca aagaaaagac agtttatata caatcttgtt 2160

aagaagctca aagaaagagg cttgattgat ggtgtaggtc tgcagtgcca tattaatgtc 2220

gattcaccta cagttaaaga gatagaggat acaattaaac tgtttagtac aatccctggc 2280

ttagacattc acattacaga gcttgacatt agcgtttata caagcagcag ccagagatat 2340

gatactcttc cacaggatat aatgataaaa caggctttga agttcaaaga gctttttgag 2400

atgctaaaaa gatatagcta tgttgtcaca aacgttactt tctggggact caaagatgac 2460

tattcatggc tttcaacaag cagatctaac tggccactac tgtttgacaa caactaccag 2520

gcaaaatttg catactgggc aattgttgaa ccgtcagtat tgccacttgc tataaacaaa 2580

ggatatgcaa acaatgcatc agcaaggata gatggagttt tagacagaga atacaaaggt 2640

gcgattccaa ttaagattac aaatgaaagt ggacaagaag ttgcaactgt tcgagctcta 2700

tggaattcaa gtgaactcag cctctatata tcggtcaatg atacaacaat agatgctgct 2760

aatgataaag tagttgtatt tgtagaccag gataatggaa aaatgccaga aattaaacct 2820

gatgactatt gggtttcaat tacgagaact ggtacaaaag cacaatcagc tcaaggctat 2880

gtaaaggatt atgctgtcgt gcagcaagca aatggatatg tggttgagtt gaagctttta 2940

attaataaca cgttaactgt taactcttct ataggttttg atatagcaat ctttgacaat 3000

ggagttcaat acagctggaa tgacaagaca aactcacagt ttatagaaac tgataactat 3060

ggtattttaa caatggcaga tagcgtcaag tttgcttctg ctccaaaagg tacagcaata 3120

attgatgcag aattagatga tacatggaaa aacgctcagg aaataacaac tgacacaaag 3180

gtcacggtta caggcacagt atacgactca gcttatgcaa aggctaagat gatgtgggat 3240

gaaaatagta tctatgtcta tgcaattgtt tatgacttgc ttttgaacaa ggctaataca 3300

aatccatggg agcaggattc aattgagata tttgtggatg aaaataatca caaaacgcct 3360

tactatgaaa atgatgatgt tcagtacaga gtgaactatg agaatactca aacatttggc 3420

acgaacggtg ctcctcagaa cttcattaca gcaacaaaga taattccaaa cggatatata 3480

gtggaagctc aagtttacat gaggacgaca aagctttctg aaggaatggt tataggcttt 3540

gacattcaag tgaatgatgc agaccataca ggtaaaagag tcggtgttct aacctggaat 3600

gataaggttg ggaacaatta tagagacaca acaaggttta gatgcttaga gcttgtagca 3660

gcacctgtaa gccagccacc aatacaagct ccatcaccat cacaaccaac aacaataacg 3720

tatatactaa caccgacacc aacacagcca tcaacccaaa cacagcagca acctgctcag 3780

caaccatcac agcagcaaca gcaaccgcaa cagcagcagc ctgcacagac acaacaacct 3840

cagacacagc ctgcacaaaa gcctcagaat gttgtttcga taaagataga ccagacaaaa 3900

gctgagacat ttactgttgg cgctgatacc aaggttgttg tacctcaagg ttctgtaact 3 960ggtgcaaact ga 3972

<210> 312<211> 1323<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL

<222> (1) . . . (33) <400> 312 Met Arg Lys Arg Val Ile Ala Leu Phe Val Thr Leu Ile Phe Val Met 1 5 10 15 Ser Ile Leu Ser Pro Gly Tyr Leu Pro Phe Leu Ser Thr Lys Ala Asn 20 25 30 Ala Gln Thr 35 Gln Asn Thr Pro Thr 40 Ile Leu Lys Phe Asp 45 Phe Glu Ser Gly Asn Gln Gly Trp Thr Gly Arg Gly Leu Ser Thr Thr Val Ala Thr 50 55 60 Val 65 Tyr Asn Val Ala Tyr 70 Glu Gly Asp Tyr Ser 75 Leu Lys Val Ser Gly 80 Arg Asn Ala Ser Trp Asp Gly Ala Val Ile Asp Leu Thr Asp Lys Leu 85 90 95 Ser Ala Asn Val Ser Tyr Thr Val Ser Leu Phe Val Arg His Ser Asp 100 105 110 Gln Lys Pro 115 Gln Arg Phe Ser Val 120 Tyr Ala Tyr Val Lys 125 Asp Ser Ala Ser Glu Lys Tyr Ile Pro Val Val Asp Lys Val Ala Val Pro Asn Tyr 130 135 140 Trp Lys Gln Leu Val Gly Lys Phe Thr Ile Asn Thr Ser Asn Pro Val 145 150 155 160 Gln Lys Ile Gln Leu 165 Leu Val Cys Val Pro 170 Thr Asn Lys Ser Leu 175 Glu Phe Phe Ile Asp Ser Val Leu Ile Ala Ser Ser Ala Gly Ala Thr Ser 180 185 190 Gly Val Val Lys Ser Thr Asn Phe Glu Ser Gly Thr Thr Glu Gly Trp 195 200 205 Gln Ala Arg Gly Thr Gly Ser Val Ala Gln Ile Ser Val Val Ser Thr 210 215 220 Val 225 Ala His Ser Gly Ser 230 Lys Ser Leu Tyr Val 235 Thr Gly Arg Val Gln 240 Thr Trp Gln Gly Ala Gln Ile Asp Leu Thr Ser Leu Leu Glu Lys Gly 245 250 255 Lys Glu Tyr Gln Phe Ser Val Trp Val Tyr Gln Asp Ser Gly Ser Asp 260 265 270 Gln Lys Leu 275 Thr Leu Thr Met Glu 280 Arg Lys Asn Ala Asp 285 Gly Ser Thr Asn Tyr Asp Thr Ile Lys Trp Gln Gln Thr Val Ser Ser Asn Thr Trp 290 295 300 Val 305 Glu Leu Thr Gly Ser 310 Tyr Thr Val Pro Ala 315 Thr Ala Thr Gln Leu 320 Ile Phe Tyr Ile Glu 325 Ser Pro Asn Ala Thr 330 Leu Ser Phe Tyr Ile 335 Asp Asp Phe Thr Ala Val Asp Lys Asn Ala Pro Val Val Ala Pro Gly Ile 340 345 350 Ile Lys Ser 355 Ala Thr Phe Glu Ser 360 Gly Thr Thr Glu Asp 365 Trp Gln Ala Arg Gly Thr Gly Val Thr Val Ser Val Val Asn Thr Val Ala His Thr 370 375 380 Gly 385 Ser Lys Ser Leu Tyr 390 Val Thr Gly Arg Ser 395 Gln Asn Trp His Gly 400 Ala Glu Ile Asp Leu Thr Asn Val Leu Glu Lys Gly Lys Glu Tyr Gln 405 410 415 Phe Ser Val Trp Val Tyr Gln Asp Ser Gly Ser Asp Gln Lys Leu Thr 420 425 430 Leu Thr Met 435 Gln Arg Lys Asn Ala 440 Asp Asn Thr Thr Asp 445 Tyr Asp SerIle Lys Tyr Gln Gln Thr Val Ala Thr Asn Thr Trp Val Glu Leu Thr 450 455 460 Gly Ser Tyr Thr Val Pro Thr Thr Ala Thr Gln Leu Ile Leu Tyr Val465 470 475 480Glu Ala Ala Asp Thr Thr Leu Ser Phe Tyr Ile Asp Asp Phe Thr Ala 485 490 495 Val Asp Lys Asn Pro Glu Val Ile Pro Thr Val Ser Arg Val Pro Glu 500 505 510 Trp Glu Ile Pro Ser Leu Phe Glu Gln Tyr Thr Asn Tyr Phe Ser Ile 515 520 525 Gly Val Ala Ile Pro Tyr Lys Val Leu Thr Asn Pro Thr Glu Lys Ala 530 535 540 Met Val Leu Lys His Phe Asn Ser Ile Thr Ala Glu Asn Glu Met Lys545 550 555 560Pro Asp Ala Ile Gln Lys Thr Glu Gly Asn Phe Thr Phe Asn Val Ala 565 570 575 Asp Gln Tyr Val Asp Phe Ala Gln Gln Asn Arg Ile Gly Ile Arg Gly 580 585 590 His Thr Leu Val Trp His Gln Gln Thr Pro Asn Trp Phe Phe Gln His 595 600 605 Ser Asp Gly Thr Pro Leu Asp Pro Ser Asn Pro Ala Asp Lys Gln Leu 610 615 620 Leu Arg Asp Arg Leu Arg Thr His Ile Gln Thr Leu Val Gly Arg Tyr625 630 635 640Ala Gly Lys Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Asp Glu 645 650 655 Asn Gln Pro Asp Gly Tyr Arg Arg Ser Glu Trp Tyr Arg Ile Leu Gly 660 665 670 Pro Thr Asp Thr Thr Asp Gly Ile Pro Glu Tyr Ile Leu Leu Ala Phe 675 680 685 Gln Tyr Ala Arg Glu Ala Asp Pro Asn Thr Lys Leu Phe Tyr Asn Asp 690 695 700 Tyr Asn Thr Glu Asn Pro Lys Lys Arg Gln Phe Ile Tyr Asn Leu Val705 710 715 720Lys Lys Leu Lys Glu Arg Gly Leu Ile Asp Gly Val Gly Leu Gln Cys 725 730 735 His Ile Asn Val Asp Ser Pro Thr Val Lys Glu Ile Glu Asp Thr Ile 740 745 750 Lys Leu Phe Ser Thr Ile Pro Gly Leu Asp Ile His Ile Thr Glu Leu 755 760 765 Asp Ile Ser Val Tyr Thr Ser Ser Ser Gln Arg Tyr Asp Thr Leu Pro 770 775 780 Gln Asp Ile Met Ile Lys Gln Ala Leu Lys Phe Lys Glu Leu Phe Glu785 790 795 800Met Leu Lys Arg Tyr Ser Tyr Val Val Thr Asn Val Thr Phe Trp Gly 805 810 815 Leu Lys Asp Asp Tyr Ser Trp Leu Ser Thr Ser Arg Ser Asn Trp Pro 820 825 830 Leu Leu Phe Asp Asn Asn Tyr Gln Ala Lys Phe Ala Tyr Trp Ala Ile 835 840 845 Val Glu Pro Ser Val Leu Pro Leu Ala Ile Asn Lys Gly Tyr Ala Asn 850 855 860 Asn Ala Ser Ala Arg Ile Asp Gly Val Leu Asp Arg Glu Tyr Lys Gly865 870 875 880Ala Ile Pro Ile Lys Ile Thr Asn Glu Ser Gly Gln Glu Val Ala Thr 885 890 895 Val Arg Ala Leu Trp Asn Ser Ser Glu Leu Ser Leu Tyr Ile Ser Val 900 905 910 Asn Asp Thr Thr Ile Asp Ala Ala Asn Asp Lys Val Val Val Phe Val 915 920 925 Asp Gln Asp Asn Gly Lys Met Pro Glu Ile Lys Pro Asp Asp Tyr Trp 930 935 940 Val Ser Ile Thr Arg Thr Gly Thr Lys Ala Gln Ser Ala Gln Gly Tyr 945 950 955 960Val Lys Asp Tyr Ala Val Val Gln Gln Ala Asn Gly Tyr Val Val Glu 965 970 975 Leu Lys Leu Leu Ile Asn Asn Thr Leu Thr Val Asn Ser Ser Ile Gly980 985 990

Phe Asp Ile Ala Ile Phe Asp Asn Gly Val Gln Tyr Ser Trp Asn Asp

995 1000 1005

Lys Thr Asn Ser Gln Phe Ile Glu Thr Asp Asn Tyr Gly Ile Leu Thr1010 1015 1020

Met Ala Asp Ser Val Lys Phe Ala Ser Ala Pro Lys Gly Thr Ala Ile1025 1030 1035 1040

Ile Asp Ala Glu Leu Asp Asp Thr Trp Lys Asn Ala Gln Glu Ile Thr1045 1050 1055

Thr Asp Thr Lys Val Thr Val Thr Gly Thr Val Tyr Asp Ser Ala Tyr1060 1065 1070

Ala Lys Ala Lys Met Met Trp Asp Glu Asn Ser Ile Tyr Val Tyr Ala

1075 1080 1085

Ile Val Tyr Asp Leu Leu Leu Asn Lys Ala Asn Thr Asn Pro Trp Glu1090 1095 1100

Gln Asp Ser Ile Glu Ile Phe Val Asp Glu Asn Asn His Lys Thr Pro1105 1110 1115 1120

Tyr Tyr Glu Asn Asp Asp Val Gln Tyr Arg Val Asn Tyr Glu Asn Thr1125 1130 1135

Gln Thr Phe Gly Thr Asn Gly Ala Pro Gln Asn Phe Ile Thr Ala Thr1140 1145 1150

Lys Ile Ile Pro Asn Gly Tyr Ile Val Glu Ala Gln Val Tyr Met Arg

1155 1160 1165

Thr Thr Lys Leu Ser Glu Gly-Met Val Ile Gly Phe Asp Ile Gln Val1170 1175 1180

Asn Asp Ala Asp His Thr Gly Lys Arg Val Gly Val Leu Thr Trp Asn1185 1190 1195 1200

Asp Lys Val Gly Asn Asn Tyr Arg Asp Thr Thr Arg Phe Arg Cys Leu1205 1210 1215

Glu Leu Val Ala Ala Pro Val Ser Gln Pro Pro Ile Gln Ala Pro Ser1220 1225 1230

Pro Ser Gln Pro Thr Thr Ile Thr Tyr Ile Leu Thr Pro Thr Pro Thr

1235 1240 1245

Gln Pro Ser Thr Gln Thr Gln. Gln Gln Pro Ala Gln Gln Pro Ser Gln1250 1255 1260

Gln Gln Gln Gln Pro Gln Gln Gln Gln Pro Ala Gln Thr Gln Gln Pro1265 1270 1275 1280

Gln Thr Gln Pro Ala Gln Lys Pro Gln Asn Val Val Ser Ile Lys Ile1285 1290 1295

Asp Gln Thr Lys Ala Glu Thr Phe Thr Val Gly Ala Asp Thr Lys Val1300 1305 1310

Val Val Pro Gln Gly Ser Val Thr Gly Ala Asn

1315 1320

<210> 313<211> 1392

<212> DNA<213> Bactéria<400> 313

gtgaaacgtc tatccgcgct gaccgccgtc gtattgttag cgctaacaac tcacgtcgcc

gccgctgacc ccgcgccacc cgccaccggc cccgccatcg acttccgggc cgaactccag 120

cccatcgacg gattcggctt ctccatggcc ttccagcggg ccgacctgct gcacggcgcg 180

cgcggcctca gccccgccaa gcggcgcgag gtgctcgacc tgctgctcga caaggagagg 240

ggcgcgggcc tgtcgatcct gcgcctgggc atcgggtcgt cgaccgaccg ggtctacgac 300

cacatgccga cgatcctgcc gaccgatccc ggcgggccgg acgccccgcc gaagtacgtc 360

tgggacggct gggacggcgg ccaggtctgg ctcgccaagg aggccaaggc gtacggcgtc 420

aagcggttct tcgccgacgc ctggagcgcg ccggccttca tgaagaccaa cggcagcgag 480

aacgacggcg gcgagctccg gcccgaatgg cgccaggcct acgcgaacta cctcgtcaag 540

tacgcgaagt tctaccaacg ggaaggcatc ccgatcaccg acctggggtt caccaacgaa 600

cccgactggg cggcgaccta cgcctcgatg cgtttcaccc cgcagcaggc cgtcgacttc 660

ctcaaggtgc tcgggccgac cgtccgcgcg tccggactga agaccggcgt cgtctgctgc 720

gacgcggcgg gctgggaccg gcaggtcgcc tacaccgagg ccatcgaggc ggaccccgag 780

gccgccaagg ccgtgcggac cgtcaccggc caccgctaca gcggtccgac cacggtcccg 840

cagcccaccg acaagcgggt ctggatgtcg gagtggtcac cggacggcac cacctggaac 900

gagaactggg acgacggcag cggctacgac ggcctcaccg tcgccgccga catccagaac 960

accctcaccg tcggcaacgc caacgcctac gtctactgga ccggcgcgtc cctcggcgcc 1020

acccggggac tcatccagct cgccaacccc ggcgactcct accgggtgtc caagcggtac 1080

tgggcgctgg ccgccttcag ccgcttcatc cgccccgacg ccgtccgcgt accggtcacg 1140aacgccgacc cggccctgag cgtcacggcc ttccgcaaca ccgacggcag ccgcgtgatcgagatcctca acacggcgac caccgagaag tccgcccagt tcgccctccg cggcggccacgaccggcacc ccgagggcta cgtcaccgac gagacccgct cgatcacccc ggcccacgtcgcctccgcgc gcggtacgac cctcaaggcc acgctcgccc cgcgcgcgct gaccacgatcgtcctcgact ga<210> 314<211> 463<212> PRT<213> Bactéria<220>

<221> SIGNAL<222> (1)...(22)<400> 314

Met Lys Arg Leu Ser Ala Leu Thr Ala Val Val Leu Leu Ala Leu Thr1 5 10 15 Thr His Val Ala 20 Ala Ala Asp Pro Ala 25 Pro Pro Ala Thr Gly 30 Pro AlaIle Asp Phe 35 Arg Ala Glu Leu Gln 40 Pro Ile Asp Gly Phe 45 Gly Phe SerMet Ala Phe Gln Arg Ala Asp Leu Leu His Gly Ala Arg Gly Leu Ser 50 55 60 Pro Ala Lys Arg Arg Glu Val Leu Asp Leu Leu Leu Asp Lys Glu Arg65 70 75 80Gly Ala Gly Leu Ser Ile Leu Arg Leu Gly Ile Gly Ser Ser Thr Asp 85 90 95 Arg Val Tyr Asp 100 His Met Pro Thr Ile 105 Leu Pro Thr Asp Pro 110 Gly GlyPro Asp Ala Pro Pro Lys Tyr Val Trp Asp Gly Trp Asp Gly Gly Gln 115 120 125 Val Trp Leu Ala Lys Glu Ala Lys Ala Tyr Gly Val Lys Arg Phe Phe 130 135 140 Ala Asp Ala Trp Ser Ala Pro Ala Phe Met Lys Thr Asn Gly Ser Glu145 150 155 160Asn Asp Gly Gly Glu Leu Arg Pro Glu Trp Arg Gln Ala Tyr Ala Asn 165 170 175 Tyr Leu Val Lys 180 Tyr Ala Lys Phe Tyr 185 Gln Arg Glu Gly Ile 190 Pro IleThr Asp Leu 195 Gly Phe Thr Asn Glu 200 Pro Asp Trp Ala Ala 205 Thr Tyr AlaSer Met Arg Phe Thr Pro Gln Gln Ala Val Asp Phe Leu Lys Val Leu 210 215 220 Gly Pro Thr Val Arg Ala Ser Gly Leu Lys Thr Gly Val Val Cys Cys225 230 235 240Asp Ala Ala Gly Trp 245 Asp Arg Gln Val Ala 250 Tyr Thr Glu Ala Ile 255 GluAla Asp Pro Glu Ala Ala Lys Ala Val Arg Thr Val Thr Gly His Arg 260 265 270 Tyr Ser Gly 275 Pro Thr Thr Val Pro 280 Gln Pro Thr Asp Lys 285 Arg Val TrpMet Ser Glu Trp Ser Pro Asp Gly Thr Thr Trp Asn Glu Asn Trp Asp 290 295 300 Asp Gly Ser Gly Tyr Asp Gly Leu Thr Val Ala Ala Asp Ile Gln Asn305 310 315 320Thr Leu Thr Val Gly Asn Ala Asn Ala Tyr Val Tyr Trp Thr Gly Ala 325 330 335 Ser Leu Gly Ala Thr Arg Gly Leu Ile Gln Leu Ala Asn Pro Gly Asp 340 345 350 Ser Tyr Arg 355 Val Ser Lys Arg Tyr 360 Trp Ala Leu Ala Ala 365 Phe Ser ArgPhe Ile 370 Arg Pro Asp Ala Val 375 Arg Val Pro Val Thr 380 Asn Ala Asp ProAla Leu Ser Val Thr Ala Phe Arg Asn Thr Asp Gly Ser Arg Val Ile385 390 395 400Glu Ile Leu Asn Thr 405 Ala Thr Thr Glu Lys 410 Ser Ala Gln Phe Ala 415 LeuArg Gly Gly His Asp Arg His Pro Glu Gly Tyr Val Thr Asp Glu Thr 420 425 430Arg Ser Ile Thr Pro Ala His Val Ala Ser Ala Arg Gly Thr Thr Leu

435 440 445

Lys Ala Thr Leu Ala Pro Arg Ala Leu Thr Thr Ile Val Leu Asp450 455 460

<210> 315<211> 1224<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 315

atgcggaacg tcgtgcgtaa accattgaça atcggactcg ctttaacact attattgcccatgggaatga cggcaacatc agcgaagaat gcagattcct atgcgaaaaa acctcacatcagcgcattga atgccccaca attggatcaa cgctacaaaa acgagttcac gattggtgcggcagtagaac cttatcaact acaaaatgaa aaagacgtac aaatgctaaa gcgccacttcaacagcattg ttgccgagaa cgtaatgaaa ccgatcagca ttcaacctga ggaaggaaaattcaattttg aacaagcgga tcgaattgtg aagttcgcta aggcaaatgg catggatattcgcttccata cactcgtttg gcacagccaa gtacctcaat ggttctttct tgacaaggaaggcaagccaa tggttaatga aacagatcca gtgaaacgtg aacaaaataa acaactgctgttaaaacgac ttgaaactca tattaaaacg atcgtcgagc ggtacaaaga tgacattaagtactgggacg ttgtaaatga ggttgtgggg gacgacggaa aactgcgcaa ctctccatggtatcaaatcg ccggcatcga ttatattaaa gtggcattcc aaacagcgag aaaatatggcggcaacaaga ttaaacttta tatcaatgat tacaataccg aagtggaacc aaagcgaagcgctctttata acttggtgaa gcaattaaaa gaagagggcg ttcctattga cggcatcggccatcaatccc acattcaaat cggctggcct tctgaagcag aaatcgagaa aacgattaacatgttcgccg ctctcggctt agacaaccaa atcactgagc ttgatgtgag catgtacggttggccgccgc gcgcttaccc gacgtatgac gccattccaa aacaaaagtt tttggatcaggcagcgcgct atgatcgttt gttcaaactg tatgaaaagt tgagcgataa aattagcaacgtcaccttct ggggcatcgc cgacaatcat acgtggctcg acagccgtgc ggatgtgtactatgacgcca acgggaatgt tgtggttgac ccgaacgctc cgtacgcaaa agtggaaaaagggaaaggaa aagatgcgcc gttcgttttt ggaccggatt acaaagtcaa acccgcatattgggctatta tcgaccacaa atag<210> 316<211> 407<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220><221> SIGNAL

<222> (1)...(28)<400> 316

Met Arg Asn Val Val Arg Lys Pro Leu Thr Ile Gly Leu Ala Leu Thr1 5 10 15

Leu Leu Leu Pro Met Gly Met Thr Ala Thr Ser Ala Lys Asn Ala Asp20 25 30

Ser Tyr Ala Lys Lys Pro His Ile Ser Ala Leu Asn Ala Pro Gln Leu

35 40 45

Asp Gln Arg Tyr Lys Asn Glu Phe Thr Ile Gly Ala Ala Val Glu Pro

50 50 55 60

Tyr Gln Leu Gln Asn Glu Lys Asp Val Gln Met Leu Lys Arg His Phe65 70 75 80

Asn Ser Ile Val Ala Glu Asn Val Met Lys Pro Ile Ser Ile Gln Pro85 90 95

Glu Glu Gly Lys Phe Asn Phe Glu Gln Ala Asp Arg Ile Val Lys Phe100 105 HO

Ala Lys Ala Asn Gly Met Asp Ile Arg Phe His Thr Leu Val Trp His

115 120 125

Ser Gln Val Pro Gln Trp Phe Phe Leu Asp Lys Glu Gly Lys Pro Met60 130 135 140

Val Asn Glu Thr Asp Pro Val Lys Arg Glu Gln Asn Lys Gln Leu Leu145 150 155 160

Leu Lys Arg Leu Glu Thr His Ile Lys Thr Ile Val Glu Arg Tyr Lys165 170 175

Asp Asp Ile Lys Tyr Trp Asp Val Val Asn Glu Val Val Gly Asp Asp180 185 190

Gly Lys Leu Arg Asn Ser Pro Trp Tyr Gln Ile Ala Gly Ile Asp Tyr

6012018024030036042048054060066072078084090096010201080114012001224210

215

225

230

245

260

265

275

280

290

295

305

310

325

340

345

355

360

370

375

385

390

Lys Tyr Gly 220 Gly Asn Lys IleGlu Val 235 Glu Pro Lys Arg Ser 240Lys Glu Glu Gly Val Pro Ile250 255 Gln Ile Gly Trp Pro 270 Ser GluPhe Ala Ala Leu 285 Gly Leu AspMet Tyr Gly 300 Trp Pro Pro ArgLys Gln 315 Lys Phe Leu Asp Gln 320Leu Tyr Glu Lys Leu Ser Asp330 335 Ile Ala Asp Asn His 350 Thr TrpAsp Ala Asn Gly 365 Asn Val ValVal Glu Lys 380 Gly Lys Gly LysTyr Lys 395 Val Lys Pro Ala Tyr 400

Trp Ala Ile Ile Asp His Lys405

<210> 317

<211> 1695

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 317

gtggctggaa gctcgctcac gagcaacggc ctctcggcca ttctctcgct ccagtcggac 60

tggggcagcg gttactgcgc gacggtagaa cttcagaacg tcggcggaac tccgatcacg 120

gcgtgggagg tccaggtgga gctcgctggg acgaccgtga acagcagcca cagcgcggcg 180

ttctcctcga caggcacccg cctggtcgcc aagcccttgt cctggaacgc gacgctggca 240

cccgccgcca agacgacctt cggcttctgc gcggccgctc cgagcgcagc ggcgcgcccg 300

tccgtggtgc aagtgacagc gaacggctcc gccaccggaa cgggcggaac gagcggcggc 360

ggcacgggcg gctcgaccgc tacgggcggc tcgaccgcta cgggcggctc cggtgggtcg 420

accgcgggag tgtgcgcggc aacctacgag gccgagagca tgctccacag caccggcaac 480

gccatcagcg gcggctggaa catctattcg aacggcaaca tcaccgccac gcactccttc 540

gcagccggct cgaatcgact caccgtgcac gccaagggcg accaggccaa cggggcgccc 600

atcatgcgcg tcagcgtggg caacaccgtc gtcggcgagg tgccagtgcc ggtgaccgtg 660

tggacaccgt actgcttcga ctacgccgcg gcgagcgcag gcgcgcagac cgtcaagatc 720

gagttcacga acgactacaa tggcggcacc ggcgccgacc gcaatctgca cgtggacaag 780

gtcgcggtgc agtgcggcgc gagctgcaac agcgggagcg gagggggcac cggcggctcg 840

agcggaagcg gcggcacctc ggccaccggc ggctccgcca gcggtggcgc ggcagggacg 900

acctgcacga acgttcgtcc cactggaacc gactgggacg cggcgacctg cgacatgtgg 960

gcctcgcaaa ctagcgagtg cagcgcggcc tggatgatcg acaaccatta ctgcgaccag 1020

agctgcgggc gctgctcggg cgggagcggg accggtggca cgaacacggg aggcaccggc 1080

ggtggagtga ccccgagtac ctgcacggag cccaattctc agcagtgctc cacctacaag 1140

gtcgggactc actgcggcct cacctacgag atctggaccg acggctccgc gggctgcatg 1200

acgaacacct cctacgggtt cctcgccaat tggagccagg ggaacgcaaa ctacctggct 1260

cgcaagggcg ttcggcccgg ctcgtcgcga ccggtcgtga cgtacagcgc gaactaccag 1320

ccgaacggga attcctacct ggggatctac ggttggacgc agaacccgct cgtcgagtac 1380

tacatcatcg atagctgggg gagctggcgt ccaccgggga cccaggcgat gggcaccgtc 1440

caggtggacg gcgggaccta cgatatctac cggagcgagc gggtgaacaa gccctcgatc 1500

gagggcaaca agaccttctg gcagtactgg agcgtccgca cccagaagcg caccagtggg 1560

accatcaccg tggctccgca cttcgccgcg tgggcggcat ccggactgca gatgggctcc 1620

ttctacgagg tctccctggt ggtggagggc tacaacagct ccggcagcgc cgacgtaacg 1680

gtgtcgttcc ggtag 1695<210> 318<211> 564<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 318

Met Ala Gly Ser Ser Leu Thr Ser Asn Gly Leu Ser Ala Ile Leu Ser

1 5 10 15

Leu Gln Ser Asp Trp Gly Ser Gly Tyr Cys Ala Thr Val Glu Leu Gln20 25 30

Asn Val Gly Gly Thr Pro Ile Thr Ala Trp Glu Val Gln Val Glu Leu35 40 45

Ala Gly 50 Thr Thr Val Asn Ser 55 Ser His Ser Ala Ala 60 Phe Ser Ser ThrGly Thr Arg Leu Val Ala Lys Pro Leu Ser Trp Asn Ala Thr Leu Ala65 70 75 80Pro Ala Ala Lys Thr Thr Phe Gly Phe Cys Ala Ala Ala Pro Ser Ala 85 90 95 Ala Ala Arg Pro 100 Ser Val Val Gln Val 105 Thr Ala Asn Gly Ser 110 Ala ThrGly Thr Gly Gly Thr Ser Gly Gly Gly Thr Gly Gly Ser Thr Ala Thr 115 120 125 Gly Gly Ser Thr Ala Thr Gly Gly Ser Gly Gly Ser Thr Ala Gly Val 130 135 140 Cys Ala Ala Thr Tyr Glu Ala Glu Ser Met Leu His Ser Thr Gly Asn 145 150 155 160Ala Ile Ser Gly Gly 165 Trp Asn Ile Tyr Ser 170 Asn Gly Asn Ile Thr 175 AlaThr His Ser Phe 180 Ala Ala Gly Ser Asn 185 Arg Leu Thr Val His 190 Ala LysGly Asp Gln Ala Asn Gly Ala Pro Ile Met Arg Val Ser Val Gly Asn 195 200 205 Thr Val 210 Val Gly Glu Val Pro 215 Val Pro Val Thr Val 220 Trp Thr Pro TyrCys Phe Asp Tyr Ala Ala Ala Ser Ala Gly Ala Gln Thr Val Lys Ile225 230 235 240Glu Phe Thr Asn Asp 245 Tyr Asn Gly Gly Thr 250 Gly Ala Asp Arg Asn 255 LeuHis Val Asp Lys 260 Val Ala Val Gln Cys 265 Gly Ala Ser Cys Asn 270 Ser GlySer Gly Gly Gly Thr Gly Gly Ser Ser Gly Ser Gly Gly Thr Ser Ala 275 280 285 Thr Gly 290 Gly Ser Ala Ser Gly 295 Gly Ala Ala Gly Thr 300 Thr Cys Thr AsnVal Arg Pro Thr Gly Thr Asp Trp Asp Ala Ala Thr Cys Asp Met Trp305 310 315 320Ala Ser Gln Thr Ser 325 Glu Cys Ser Ala Ala 330 Trp Met Ile Asp Asn 335 HisTyr Cys Asp Gln Ser Cys Gly Arg Cys Ser Gly Gly Ser Gly Thr Gly 340 345 350 Gly Thr Asn Thr Gly Gly Thr Gly Gly Gly Val Thr Pro Ser Thr Cys 355 360 365 Thr Glu Pro Asn Ser Gln Gln Cys Ser Thr Tyr Lys Val Gly Thr His 370 375 380 Cys Gly Leu Thr Tyr Glu Ile Trp Thr Asp Gly Ser Ala Gly Cys Met385 390 395 400Thr Asn Thr Ser Tyr Gly Phe Leu Ala Asn Trp Ser Gln Gly Asn Ala 405 410 415 Asn Tyr Leu Ala Arg Lys Gly Val Arg Pro Gly Ser Ser Arg Pro Val 420 425 430 Val Thr Tyr 435 Ser Ala Asn Tyr Gln 440 Pro Asn Gly Asn Ser 445 Tyr Leu GlyIle Tyr 450 Gly Trp Thr Gln Asn 455 Pro Leu Val Glu Tyr 460 Tyr Ile Ile AspSer Trp Gly Ser Trp Arg Pro Pro Gly Thr Gln Ala Met Gly Thr Val 465 470 475 480Gln Val Asp Gly Gly 485 Thr Tyr Asp Ile Tyr 490 Arg Ser Glu Arg Val 495 AsnLys Pro Ser Ile 500 Glu Gly Asn Lys Thr 505 Phe Trp Gln Tyr Trp 510 Ser ValArg Thr Gln Lys Arg Thr Ser Gly Thr Ile Thr

515 520

Ala Ala Trp Ala Ala Ser Gly Leu Gln Met Gly

530 535

Ser Leu Val Val Glu Gly Tyr Asn Ser Ser Gly545 550 555

Val Ser Phe Arg<210> 319<211> 1095<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 319

atgaaggtga cccgaacagc tgtcgcgggc attgtcgccgggcacgtcga ccgcgtcggc tgaggatgaa ccaaccagcgccgttgcgcg tcctggcagc caaagccggg atcgcgttcggcgtacaaca acgacgcgac ctaccgtgag ctcgtcggccgccgagaacg tcatgaagtg gcagctcctc gagccgcagcccggccgatc agctcgtgcg cgtagccaac gagaacggccctcatctggc acaaccagct gcccacctgg cttaccagcgacaccggacg agctccggca gctcctgagg aaccacatctaagggcgaga tccaccagtg ggatgtcgcc aacgaggtcacgcaacacga tctggctgca gaacctgggt ccgagctacagctcgcaagg ccgacccgga cgccgccctc tatctgaacgaacgccaagg ccgatgcgta ctacgccctg gtcaagcagcgtggacggct tcggaataca ggggcacctc ggtgtgcagtgcggtggccg acaacatggg gcgcttcgag gcactcggccgcggatgtcc ggatgatcat gccgcccgac gaggacaagctacagcacgt tggtccaggg ctgcctgatg gccaagcgttggcttcaccg acaagtactc ctgggttccg ggcaccttccctcctggccg aggacttcca gcccaagccg gcttactacgcgcgccggac ggtag<210> 320<211> 364<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(27)<400> 320

Met Lys Val Thr Arg Thr Ala Val Ala Gly Ile

15 10

Leu Ile Thr Ile Gly Thr Ser Thr Ala Ser Ala

20 25

Ser Glu Asn Thr Ser Thr Asp Gln Pro Leu Arg

35 40

Ala Gly Ile Ala Phe Gly Thr Ala Val Asp Met

50 55

Asp Ala Thr Tyr Arg Glu Leu Val Gly Gln Glu65 70 75

Ala Glu Asn Val Met Lys Trp Gln Leu Leu Glu

85 90

Tyr Asn Trp Gly Pro Ala Asp Gln Leu Val Arg

Val Ala Pro His Phe525

Ser Phe Tyr Glu Val540

Ser Ala Asp Val Thr560

cagcggtcctagaacacgtcgcacggccgtaggagttctcgaggggtctaagaaggtgcggagtcgcctctcacggtgattcgacgacagtcgcggacgcactacaacgttcctcgccgatcggcttctgtgcagacggctggccgcacagcaggtcgttccggccagggccgtccagga

catcacgatcgacggatcagcgacatgaacgagcgtcacgcaactggggtcgggcacacgcggtgagatcgcgccacttccggcaacctggttccggtggcgagggcccgcgacgtgccggcccgcgagtggtcaccgagggcacgtggccaccgtctggcgcggcgaactgacctcgcg

100

105

Gly Gln Lys Val Arg Gly His Thr Leu Ile Trp

115 120

Thr Trp Leu Thr Ser Gly Val Ala Ser Gly Glu

130 135

Leu Arg Gln Leu Leu Arg Asn His Ile Phe Thr145 150 155

Lys Gly Glu Ile His Gln Trp Asp Val Ala Asn

165 170

Ser Gly Asn Leu Arg Asn Thr Ile Trp Leu Gln180 185

Val Ala

Glu Asp

Val Leu

45Asn Ala60

Phe Ser

Pro Gln

Val Ala

His Asn125Ile Thr140

Val MetGlu ValAsn Leu

Ala Ala Val15

Glu Pro Thr30

Ala Ala Lys

Tyr Asn Asn

Ser Val Thr80

Arg Gly Val95

Asn Glu Asn110

Gln Leu Pro

Pro Asp Glu

Arg His Phe160

Ile Asp Asp175

Gly Pro Ser190

60120180240300360420480540600660720780840900960102010801095Tyr Ile Ala Asp Ala Phe Arg Trp Ala Arg Lys

195 200

Ala Leu Tyr Leu Asn Asp Tyr Asn Val Glu Gly210 215

Asp Ala Tyr Tyr Ala Leu Val Lys Gln Leu Leu225 230 235

Val Asp Gly Phe Gly Ile Gln Gly His Leu Gly

245 250Trp Pro Ala Ser Ala Val Ala Asp Asn Met Gly

260 265

Gly Leu Gln Thr Ala Val Thr Glu Ala Asp Val

275 280

Pro Asp Glu Asp Lys Leu Ala Ala Gln Ala Arg290 295

Val Gln Gly Cys Leu Met Ala Lys Arg Cys Arg305 310 315

Gly Phe Thr Asp Lys Tyr Ser Trp Val Pro Gly

325 330

Gly Ala Ala Asn Leu Leu Ala Glu Asp Phe Gln340 345

Tyr Ala Val Gln Asp Asp Leu Ala Arg Ala Gly

355 360

<210> 321<211> 1608<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 321

gtggactggt gggacgtgga tattttttcc gcgaaggaaaaccttcctgg atgcctcacg agaccatcgc aagccggtcacgccacgtcg gcgtgatcga ggggcagaaa tgctgggatggatctgctca aacgtcgccc cgaaatcaag gccacggcctgagtggtccg accgcctcgg cttccgctgg cacaactgggaacgcccttg ttcgtgatcg ctgggtgcag gaactctcccgcgcgcgacg gatcttgtcc gctgccgcca atcaccgcccctccagaccg tgttccagga ccatttcctg atgggtgctgaccgaaaacg acgcaaccaa gaccgctctc atcaagaagcgagaatgttc tcaagtgggg gccggttcat cctgagcccaaccgatcgtt acgtggactt tggtgtgaag aaccggatgtgtctggcacc accagacacc cgcctgggtg tttcaagattcgggatggac tgctcaatcg cttgagcaac cacatccacaggccgcatcc acgggtggga tatggtgaac gaggccttgacctagccaat ggcttaaaat catcggcccc gactacattgcacgccgccg accctgccgc tgaactgtat tacaacgattaagtgtgctg gtgcgatcgc gctggtgaag cagctccagagggattggca cgcagaccca cgtcggactc aacggacctttcattgacgg cctttggcca gctcggcgtg aaggtcatgggtgctgcccg ccgccagcca aaatcaaaac gcggatctcacccgccctca atcccgccct caatccctat cccgatgggcaaactggccg ctcgctatgc ggaactcttc gccgtgttcgagccgcgtca cgttctggtg cgtcaccgac ggcgactcctcgtggccgcg tcaactatcc gctgctgttc gaccgtgccagatgcggtca ttcgcgtcgc caaggacccg ccgacggtttcacgatgcgg cgcgggtcct ggtcaatccg cacaagggctaatcacatca acaagtatga gatcgcccgc gatgccgacc<210> 322<211> 536<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 322

Met Asp Trp Trp Asp Val Asp Ile Phe Ser Ala

1 5 10

Pro Gln Leu Ala Thr Phe Leu Asp Ala Ser Arg20 25

Ala Asp205Pro Asn220

Ala Asp

Val Gln

Arg Phe

Arg Met285Gly Tyr300

Ser PheThr PhePro LysArg

Pro Asp Ala

Ala Lys Ala

Asp Val Pro240

Phe Gly Phe

255Glu Ala Leu270

Ile Met Pro

Ser Thr Leu

Thr Val Trp320

Pro Gly Gln

335Pro Ala Tyr350

tcacccaccctgatcggcgaaatggtttggatatcaactggcgacgcccgaccccatctatcccatccgcccttgaatgtaattcaacacaccggttcaatcatcgtcggcccaaggccacggtggttggacgatgacggccaaagcgttacagtctcgacgaatggcatccccccagtcttaccgaactaccagcccgctgccgcaagctcaagcacgcggctgaacaagccagcccaacgcacaatctggtaccaccatgacggaa

gcaactggcagatgaccccacccgatgattggaatggcgccatcgagggctctccacgcggaccccgtcggaggcagttccatcacgccccttcgaatccccacaccctcgccgctcgacacgctacaagcaccctccgctgcccttgcctcatcccgccatccattgccggtggatgatcgacgttgatcttgtccaatcgtccaggaccgacaaaatcctggcccgtggcccgccttccaccccgctcctacccggac

6012018024030036042048054060066072078084090096010201080114012001260132013801440150015601608

Lys Glu Ile Thr His15

Asp His Arg Lys Pro30Val Met Ile Gly Glu Met Thr Pro Arg His Val Gly Val Ile Glu Gly

35 40 45

Gln Lys Cys Trp Asp Glu Trp Phe Gly Pro Met Ile Asp Leu Leu Lys

50 55 60

Arg Arg Pro Glu Ile Lys Ala Thr Ala Tyr Ile Asn Trp Glu Trp Arg65 70 75 80

Glu Trp Ser Asp Arg Leu Gly Phe Arg Trp His Asn Trp Gly Asp Ala

85 90 95

Arg Ile Glu Gly Asn Ala Leu Val Arg Asp Arg Trp Val Gln Glu Leu

100 105 HO

Ser His Pro Ile Tyr Leu His Ala Ala Arg Asp Gly Ser Cys Pro Leu

115 120 125

Pro Pro Ile Thr Ala Leu Pro Ser Ala Thr Pro Ser Leu Gln Thr Val

130 135 140

Phe Gln Asp His Phe Leu Met Gly Ala Ala Leu Asn Val Arg Gln Phe145 150 155 160

Thr Glu Asn Asp Ala Thr Lys Thr Ala Leu Ile Lys Lys Gln Phe Asn

165 170 175

Thr Ile Thr Pro Glu Asn Val Leu Lys Trp Gly Pro Val His Pro Glu

180 185 190

Pro Asn Arg Phe Asn Phe Glu Ser Thr Asp Arg Tyr Val Asp Phe Gly

195 200 205

Val Lys Asn Arg Met Phe Ile Val Gly His Thr Leu Val Trp His His

210 215 220

Gln Thr Pro Ala Trp Val Phe Gln Asp Ser Gln Gly Gln Pro Leu Asp225 230 235 240

Arg Asp Gly Leu Leu Asn Arg Leu Ser Asn His Ile His Thr Val Val

245 250 255

Gly Arg Tyr Lys Gly Arg Ile His Gly Trp Asp Met Val Asn Glu Ala

260 265 270

Leu Asn Asp Asp Gly Thr Leu Arg Pro Ser Gln Trp Leu Lys Ile Ile

275 280 285

Gly Pro Asp Tyr Ile Ala Lys Ala Phe Ala Leu Ala His Ala Ala Asp

290 295 300

Pro Ala Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Leu Asp His Pro Ala305 310 315 320

Lys Cys Ala Gly Ala Ile Ala Leu Val Lys Gln Leu Gln Thr Asn Gly

325 330 335

Ile Ser Ile Ala Gly Ile Gly Thr Gln Thr His Val Gly Leu Asn Gly

340 345 350

Pro Ser Pro Gln Ser Val Asp Asp Ser Leu Thr Ala Phe Gly Gln Leu

355 360 365

Gly Val Lys Val Met Val Thr Glu Leu Asp Val Asp Val Leu Pro Ala

370 375 380

Ala Ser Gln Asn Gln Asn Ala Asp Leu Asn Gln Pro Ala Leu Ser Asn385 390 395 400

Pro Ala Leu Asn Pro Ala Leu Asn Pro Tyr Pro Asp Gly Leu Pro Gln

405 410 415

Ala Val Gln Asp Lys Leu Ala Ala Arg Tyr Ala Glu Leu Phe Ala Val

420 425 430

Phe Val Lys His Ala Asp Lys Ile Ser Arg Val Thr Phe Trp Cys Val

435 440 445

Thr Asp Gly Asp Ser Trp Leu Asn Asn Trp Pro Val Arg Gly Arg Val

450 455 460

Asn Tyr Pro Leu Leu Phe Asp Arg Ala Ser Gln Pro Lys Pro Ala Phe465 470 475 480

Asp Ala Val Ile Arg Val Ala Lys Asp Pro Pro Thr Val Ser His Asn

485 490 495

Leu Thr Pro Leu His Asp Ala Ala Arg Val Leu Val Asn Pro His Lys

500 505 510

Gly Trp Tyr His His Tyr Pro Asp Asn His Ile Asn Lys Tyr Glu Ile

515 520 525

Ala Arg Asp Ala Asp Leu Thr Glu

530 535

<210> 323<211> 2355<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 323

atgatgctca atgcccgttg tatccaactt atgaagttgt tgcttcgctccttaccgctg acaaattggc gcaatcattg aatgtatcca agcgaacgatatacaaaaaa cgaatgaatg gttgcatcat gaagggctga agccgattcagggctcggat ttcgcttgga tgatgaagtg aaacaagaaa taacaacaaattacaacctg cccgacatta cacatatcag tcatgggagc gaaaagcttgtggattttga ctcgcgttca tccactgtat ttgtctgatt ttttagagaaagcaggagca cgttgttaaa tgacataaag gaactgaaag aagattggcattgcgattgt cattccatcg caaaaaaggg tatttttcat caggggaagaaggaaattga tgattcgtta tattcatcaa atattagcgg cgatggatgagctgcagaat tgtcagctga gtgtcaatgg ccaatctttg attggatttgtctacttttt ctattcgcta taccggtgag gttattcaaa ctttacctatttgttccaaa gacggtgggc tagaggcaaa tttgtgcaaa tggacgagcagtgctaaggt caatgcggga ataccagatt gctgatcatc tcgttagacggtttccgaaa tatctattcc cgatgacgag gtttgttatt tgacgacccatttcgagttg cagatgacaa gcaaatcgat cataacgatg acatcactacatcattcgac atatggtgga tgattttcaa acttatgcct gtgtacaattgaagagttgg aaaaaaattt attggttcat atgaagcctg cctattatcgggttttcatc tgcaaaacga tctgaccgaa tcggtcaalag cgaactatcaaccttaacga aaaaagtcgt ccatcattta gaaagtgtag ttggccagccgatgaaattg cttatatcgc catgcatttt ggcggatggt tggacagagagttccagtac ggaaaaaggt gttgatcgtc tgcgagagcg ggattggaacttgcaaaaac aattggatca acgctacaaa aacgagttca cgattggtgcccttatcaac tacaaaatga aaaagacgta caaatgctaa agcgccacttgttgccgaga acgtaatgaa accgatcagc attcaacctg aggaaggaaagaacaagcgg atcgaattgt gaagttcgct aaggcaaatg gcatggatatacactcgttt ggcacagcca agtacctcaa tggttctttc ttgacaaggaatggttaatg aaacagatcc agtgaaacgt gaacaaaata aacaactgctcttgaaactc atattaaaac gatcgtcgag cggtacaaag atgacattaagttgtaaatg aggttgtggg ggacgacgga aaactgcgca actctccatggccggcatcg attatattaa agtggcattc caaacagcga gaaaatatggattaaacttt atatcaatga ttacaatacc gaagtggaac caaagcgaagaacttggtga agcaattaaa agaagagggc gttcctattg acggcatcggcacattcaaa tcggctggcc ttctgaagca gaaatcgaga aaacgattaagctctcggct tagacaacca aatcactgag cttgatgtga gcatgtacggcgcgcttacc cgacgtatga cgccattcca aaacaaaagt ttttggatcatatgatcgtt tgttcaaact gtatgaaaag ttgagcgata aaattagcaatggggcatcg ccgacaatca tacgtggctc gacagccgtg cggatgtgtaaacgggaatg ttgtggttga cccgaacgct ccgtacgcaa aagtggaaaaaaagatgcgc cgttcgtttt tggaccggat tacaaagtca aacccgcataatcgaccaca aatag

<210> 324

<211> 784

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 324

Met Met Leu Asn Ala Arg Cys Ile Gln Leu Met Lys

1 5 10

Ser Ser Leu Tyr Leu Thr Ala Asp Lys Leu Ala Glr

20 25

Ser Lys Arg Thr Ile Tyr Tyr Asp Ile Gln Lys Thi

35 40

His His Glu Gly Leu Lys Pro Ile Gln Tyr Ala Arc50 55 60

Arg Leu Asp Asp Glu Val Lys Gln Glu Ile Thr Thi65 70 75Leu Gln Pro Ala Arg His Tyr Thr Tyr Gln Ser Trj

85 90

Trp Ile Gly Leu Trp Ile Leu Thr Arg Val His Prc

100 105

Asp Phe Leu Glu Lys Leu His Val Ser Arg Ser Thi

115 120 125

ttctctttat 60ttattacgat 120atatgcgcgc 180gtggaacaca 240gattggttta 300attacatgta 360gtcatttcag 420aatccaaaaa 480ccagcatttc 540ccaattcgag 600ttacctcgca 660agaaaaagaa 720aattgaaaac 780tttactcagt 840tttgaaacga 900caagcgtcgc 960actgaaatac 1020agatttattt 1080ggtcagcgac 1140gggggtgtcg 1200atcgcgaatg 1260ggcagtagaa 1320caacagcatt 1380attcaatttt 1440tcgcttccat 1500aggcaagcca 1560gttaaaacga 1620gtactgggac 1680gtatcaaatc 1740cggcaacaag 1800cgctctttat 1860ccatcaatcc 1920catgttcgcc 1980ttggccgccg 2040ggcagcgcgc 2100cgtcaccttc 2160ctatgacgcc 2220agggaaagga 2280ttgggctatt 2340 2355

Leu Leu Leu Arg 15 Ser Leu Asn Val 30 Asn Glu Trp Leu45 Gly Leu Gly PheLys Trp Asn Thr 80Glu Arg Lys Ala 95 Leu Tyr Leu Ser 110 Leu Leu Asn AspIle Lys Glu Leu Lys Glu Asp Trp 130 135 Phe His Arg Lys Lys Gly Tyr Phe145 150 Arg Lys Leu Met Ile Arg Tyr Ile 165 Asp Gln His Phe Ala Ala Glu Leu 180 Phe Asp Trp Ile Cys Gln Phe Glu 195 200Gly Glu Val Ile Gln Thr Leu Pro 210 215 Arg Trp Ala Arg Gly Lys Phe Val225 230 Val Leu Arg Ser Met Arg Glu Tyr 245 Arg Ile Glu Asn Val Ser Glu Ile 260 Tyr Leu Thr Thr His Leu Leu Ser 275 280Ile Asp His Asn Asp Asp Ile Thr 290 295 Met Val Asp Asp Phe Gln Thr Tyr305 310 Glu Glu Leu Glu Lys Asn Leu Leu 325 Arg Leu Lys Tyr Gly Phe His Leu 340 Lys Ala Asn Tyr Gln Asp Leu Phe 355 360His Leu Glu Ser Val Val Gly Gln 370 375 Tyr Ile Ala Met His Phe Gly Gly 385 390 Val Pro Val Arg Lys Lys Val Leu 405 Thr Ser Arg Met Leu Gln Lys Gln 420 Phe Thr Ile Gly Ala Ala Val Glu 435 440Asp Val Gln Met Leu Lys Arg His 450 455 Val Met Lys Pro Ile Ser Ile Gln465 470 Glu Gln Ala Asp Arg Ile Val Lys 485 Ile Arg Phe His Thr Leu Val Trp 500 Phe Leu Asp Lys Glu Gly Lys Pro 515 520Lys Arg Glu Gln Asn Lys Gln Leu 530 535 Ile Lys Thr Ile Val Glu Arg Tyr545 550 Val Val Asn Glu Val Val Gly Asp 565 Trp Tyr Gln Ile Ala Gly Ile Asp 580 Ala Arg Lys Tyr Gly Gly Asn Lys 595 600Asn Thr Glu Val Glu Pro Lys Arg 610 615 Gln Leu Lys Glu Glu Gly Val Pro625 630 His Ile Gln Ile Gly Trp Pro Ser 645 Asn Met Phe Ala Ala Leu Gly Leu

Gln Ser Phe Gln Leu Arg Leu Ser 140 Ser Ser Gly Glu Glu Ile Gln Lys 155 160His Gln Ile Leu Ala Ala Met Asp 170 175 Ser Ala Glu Cys Gln Trp Pro Ile185 190 Ser Thr Phe Ser Ile Arg Tyr Thr 205 Ile Tyr Leu Ala Leu Phe Gln Arg 220 Gln Met Asp Glu Gln Glu Lys Glu 235 240Gln Ile Ala Asp His Leu Val Arg 250 255 Ser Ile Pro Asp Asp Glu Val Cys265 270 Phe Arg Val Ala Asp Asp Lys Gln 285 Thr Leu Lys Arg Ile Ile Arg His 300 Ala Cys Val Gln Phe Lys Arg Arg 315 320Val HiS Met Lys Pro Ala Tyr Tyr 330 335 Gln Asn Asp Leu Thr Glu Ser Val345 350 Thr Leu Thr Lys Lys Val Val His 365 Pro Val Ser Asp Asp Glu Ile Ala 380 Trp Leu Asp Arg Glu Gly Val Ser 395 400Ile Val Cys Glu Ser Gly Ile Gly 410 415 Leu Asp Gln Arg Tyr Lys Asn Glu425 430 Pro Tyr Gln Leu Gln Asn Glu Lys 445 Phe Asn Ser Ile Val Ala Glu Asn 460 Pro Glu Glu Gly Lys Phe Asn Phe 475 480Phe Ala Lys Ala Asn Gly Met Asp 490 495 His Ser Gln Val Pro Gln Trp Phe505 510 Met Val Asn Glu Thr Asp Pro Val 525 Leu Leu Lys Arg Leu Glu Thr His 540 Lys Asp Asp Ile Lys Tyr Trp Asp 555 560Asp Gly Lys Leu Arg Asn Ser Pro 570 575 Tyr Ile Lys Val Ala Phe Gln Thr585 590 Ile Lys Leu Tyr Ile Asn Asp Tyr 605 Ser Ala Leu Tyr Asn Leu Val Lys 620 Ile Asp Gly Ile Gly His Gln Ser 635 640Glu Ala Glu Ile Glu Lys Thr Ile 650 655 Asp Asn Gln Ile Thr Glu Leu AspVal Ser Met675

Ile Pro Lys

690Phe Lys Leu705

Trp Gly Ile

Tyr Tyr Asp

Ala Lys Val755

Pro Asp Tyr

770<210> 325<211> 1146<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 325

atgactattt cccgccggaa atttatgtgg ggcacagctg cactcctggc caccacccagctcaaaaccc gcgctctcgc cgctgccatg gccagcacag gcatcaagga cgccttcaagggcgacttcc atatcggcac cgccatcagc aacgctaccc tgcaaaacca ggatgccaccatgctggatt tgatcaagcg cgaatttaat gcaattàccg ctgaaaattg catgaagtgggagcctattc gcccacagct ggatcagtgg aattgggagc tggccgaccg ctttgtggatttcggcgtta aaaacaagat gtatgtggta ggtcacacgc tgatttggca cagccaggcgccagcgcaca tttatctcga cgccgatggt aagcccaaca gtcgcgatgc ccagttgaaagtaatggagg agcacatacg taccctggcg ggccgctaca aaggaaagat agacgcctgggacgtggtta acgaagcagt ggaggatgat ggcagctggc gtcaaaccgg ctggtacaaaaacatgggtg aagaatatat cgcccatgcc ttccgcttgg cagccgaggt agaccccaacgccaagctac tctacaacga ctacaacgag gctgtacccg ccaagcgtga tgcgattattcgggtggtaa aaggcgtgca gaaggctggc gcacccattc acggtgtggg gatgcaagggcacatgagcc tgtcacatcc ggatttcgcg gagttcgaaa aatccataat cgaatacgccaagttggggg tgaaggtgca cgttaccgaa ctggatatcg acgtgttgcc actggcgtggaacctgagtg cggaaatttc caatcgcttt gaataccgcc cagagatgga tccttatcgcgaaggtttgc ccgccaaagt cgaggaggag ctagcggctc gttacgaggc gctgtttaaaatcctgctgc gtcatcgcga caaaattgag cgtgtgacca cttggggcac caacgactcagagacctggt taaatggctt ccccattccg gggcgcatga attacccaat gctgttcgatcgtaataacc agcccaagtt ggcctatcac cggctgctgg cactcaaaca aaagaaaagtcagtaa<210> 326<211> 381<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(27)<400> 326Met Thr Ile Ser1

Ala Thr Thr Gln20

Thr Gly Ile Lys35

Ile Ser Asn Ala50

Ile Lys Arg Glu65

Glu Pro Ile Arg

Arg Phe Val Asp100

Thr Leu Ile Trp

660 665 670 Tyr Gly Trp Pro Pro 680 Arg Ala Tyr Pro Thr 685 Tyr Asp AlaGln Lys Phe Leu 695 Asp Gln Ala Ala Arg 700 Tyr Asp Arg LeuTyr Glu Lys 710 Leu Ser Asp Lys Ile 715 Ser Asn Val Thr Phe 720Ala Asp 725 Asn His Thr Trp Leu 730 Asp Ser Arg Ala Asp 735 ValAla Asn Gly Asn Val Val Val Asp Pro Asn Ala Pro Tyr740 745 750 Glu Lys Gly Lys Gly 760 Lys Asp Ala Pro Phe 765 Val Phe GlyLys Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys

775 780

Arg Arg Lys Phe Met Trp Gly Thr Ala Ala Leu Leu

5 10 15

Leu Lys Thr Arg Ala Leu Ala Ala Ala Met Ala Ser

25 30

Asp Ala Phe Lys Gly Asp Phe His Ile Gly Thr Ala

40 45

Thr Leu Gln Asn Gln Asp Ala Thr Met Leu Asp Leu

55 60

Phe Asn Ala Ile Thr Ala Glu Asn Cys Met Lys Trp

70 75 80

Pro Gln Leu Asp Gln Trp Asn Trp Glu Leu Ala Asp85 90 95

Phe Gly Val Lys Asn Lys Met Tyr Val Val Gly His

105 110

His Ser Gln Ala Pro Ala His Ile Tyr Leu Asp Ala115 120 125

Asp Gly Lys Pro Asn Ser Arg Asp Ala Gln Leu Lys Val Met Glu Glu

130 135 140

His Ile Arg Thr Leu Ala Gly Arg Tyr Lys Gly Lys Ile Asp Ala Trp145 150 155 160

Asp Val Val Asn Glu Ala Val Glu Asp Asp Gly Ser Trp Arg Gln Thr

165 170 175

Gly Trp Tyr Lys Asn Met Gly Glu Glu Tyr Ile Ala His Ala Phe Arg180 185 190

Leu Ala Ala Glu Val Asp Pro Asn Ala Lys Leu Leu Tyr Asn Asp Tyr195 200 205

Asn Glu Ala Val Pro Ala Lys Arg Asp Ala Ile Ile Arg Val Val Lys

210 215 220

Gly Val Gln Lys Ala Gly Ala Pro Ile His Gly Val Gly Met Gln Gly225 230 235 240

His Met Ser Leu Ser His Pro Asp Phe Ala Glu Phe Glu Lys Ser Ile

245 250 255

Ile Glu Tyr Ala Lys Leu Gly Val Lys Val His Val Thr Glu Leu Asp260 265 270

Ile Asp Val Leu Pro Leu Ala Trp Asn Leu Ser Ala Glu Ile Ser Asn275 280 285

Arg Phe Glu Tyr Arg Pro Glu Met Asp Pro Tyr Arg Glu Gly Leu Pro

290 295 300

Ala Lys Val Glu Glu Glu Leu Ala Ala Arg Tyr Glu Ala Leu Phe Lys305 310 315 320

Ile Leu Leu Arg His Arg Asp Lys Ile Glu Arg Val Thr Thr Trp Gly

325 330 335

Thr Asn Asp Ser Glu Thr Trp Leu Asn Gly Phe Pro Ile Pro Gly Arg340 345 350

Met Asn Tyr Pro Met Leu Phe Asp Arg Asn Asn Gln Pro Lys Leu Ala355 360 365

Tyr His Arg Leu Leu Ala Leu Lys Gln Lys Lys Ser Gln

370 375 380

<210> 327

<211> 1500

<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 327

atgaaacgtt cagtctctat ctttatcgca tgtttagtaa tgacagtatt

ggtgtcgcgg caccagaagc atctgcagca ggggcgaaaa cgcctgtagc

cagcttagca ttaaaggtac tcagctagtc aatcaaaacg gaaaatcggt

gggatcagct cacacggttt gcagtggttc ggcgattatg tcaataaaga

tggctaagag acgattgggg aattaccgtc ttccgagcgg caatgtacac

ggttatatag agaatccgtc tgtgaaaaat aaagtcaaag aagctgttga

gagctcggga tatatgtcat cattgactgg catattttaa atgacggcaa

aataaagaga aggcgaagga attctttaag gaaatgtcga gcctttacgg

aacgttattt atgaaattgc taatgaaccg aacggtgatg taaattggaa

aaaccgtatg cggaggaagt gatttccgtt atccgtaaaa atgacccgga

attaccggaa ctggcacttg gagtcaggat gtcaatgatg ctgctgatga

gatgcaaacg tcatgtacgc gcttcatttt tatgcaggta cacacggcca

gataaagccg attatgcgct cagcaaagga gcgccgattt ttgtaacgga

agtgacgctt ccggaaatgg cggggtcttc cttgaccagt cgagggaatg

ctcgacaaca agaaaatcag ctgggtaaac tggaaccttt ctgataagcatcagctttaa agccgggggc atctaaaaca ggcggctggc cgttatcaga

tcagggacat ttgtaaggga aaagatccgt ggctcccaac attcgactgagagacaccaa agcaagataa acccgtacag gaaaacagcc tatctgtgcaggggatggaa gtgtgaacag caaccaaatc cgtcctcaga tccatgtgaaaagaccaccg ttaatttaaa aaatgtaact gtccgctact ggtataacacggccaaaact tcgactgtga ctacgcgaag atcggatgca gcaatgtgacgtgacattac aaaaacctgt aaaaggtgca gatgcctatc tggaacttgg

gggacactgttggggcaattacaaaaaaaa<210> 328<211> 499

aacaattagc 60ccttaatggc 120gcagctgaag 180ctctttaaaa 240ggctgaaggc 300agcggcaaaa 360tccaaatcaa 420aagcacacca 480gcgcgatatc 540taacatcatt 600tcagcttaag 660gtatttaagg 720atgggggacg 780gctgaattat 840ggaatcttcc 900tttatccgct 960agacagatct 1020atacagaaca 1080aaacaacagc 1140gaaaaacaaa 1200gcacaagttt 1260gtttaaaaac 1320caatgaggat 1380gtttaaagat 1440acccaaatag 1500<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(29)<400> 328

Met Lys Arg Ser Val Ser Ile Phe Ile Ala Cys Leu Val Met Thr Val1 5 10 15 Leu Thr Ile Ser Gly Val Ala Ala Pro Glu Ala Ser Ala Ala Gly Ala 20 25 30 Lys Thr Pro Val Ala Leu Asn Gly Gln Leu Ser Ile Lys Gly Thr Gln 35 40 45 Leu Val Asn Gln Asn Gly Lys Ser Val Gln Leu Lys Gly Ile Ser Ser 50 55 60 HiS Gly Leu Gln Trp Phe Gly Asp Tyr Val Asn Lys Asp Ser Leu Lys65 70 75 80Trp Leu Arg Asp Asp Trp Gly Ile Thr Val Phe Arg Ala Ala Met Tyr 85 90 95 Thr Ala Glu Gly Gly Tyr Ile Glu Asn Pro Ser Val Lys Asn Lys Val 100 105 110 Lys Glu Ala Val Glu Ala Ala Lys Glu Leu Gly Ile Tyr Val Ile Ile 115 120 125 Asp Trp His Ile Leu Asn Asp Gly Asn Pro Asn Gln Asn Lys Glu Lys 130 135 140 Ala Lys Glu Phe Phe Lys Glu Met Ser Ser Leu Tyr Gly Ser Thr Pro145 150 155 160Asn Val Ile Tyr Glu Ile Ala Asn Glu Pro Asn Gly Asp Val Asn Trp 165 170 175 Lys Arg Asp Ile Lys Pro Tyr Ala Glu Glu Val Ile Ser Val Ile Arg 180 185 190 Lys Asn Asp Pro Asp Asn Ile Ile Ile Thr Gly Thr Gly Thr Trp Ser 195 200 205 Gln Asp Val Asn Asp Ala Ala Asp Asp Gln Leu Lys Asp Ala Asn Val 210 215 220 Met Tyr Ala Leu His Phe Tyr Ala Gly Thr His Gly Gln Tyr Leu Arg225 230 235 240Asp Lys Ala Asp Tyr Ala Leu Ser Lys Gly Ala Pro Ile Phe Val Thr 245 250 255 Glu Trp Gly Thr Ser Asp Ala Ser Gly Asn Gly Gly Val Phe Leu Asp 260 265 270 Gln Ser Arg Glu Trp Leu Asn Tyr Leu Asp Asn Lys Lys Ile Ser Trp 275 280 285 Val Asn Trp Asn Leu Ser Asp Lys Gln Glu Ser Ser Ser Ala Leu Lys 290 295 300 Pro Gly Ala Ser Lys Thr Gly Gly Trp Pro Leu Ser Asp Leu Ser Ala305 310 315 320Ser Gly Thr Phe Val Arg Glu Lys Ile Arg Gly Ser Gln His Ser Thr 325 330 335 Glu Asp Arg Ser Glu Thr Pro Lys Gln Asp Lys Pro Val Gln Glu Asn 340 345 350 Ser Leu Ser Val Gln Tyr Arg Thr Gly Asp Gly Ser Val Asn Ser Asn 355 360 365 Gln Ile Arg Pro Gln Ile His Val Lys Asn Asn Ser Lys Thr Thr Val 370 375 380 Asn Leu Lys Asn Val Thr Val Arg Tyr Trp Tyr Asn Thr Lys Asn Lys385 390 395 400Gly Gln Asn Phe Asp Cys Asp Tyr Ala Lys Ile Gly Cys Ser Asn Val 405 410 415 Thr His Lys Phe Val Thr Leu Gln Lys Pro Val Lys Gly Ala Asp Ala 420 425 430 Tyr Leu Glu Leu Gly Phe Lys Asn Gly Thr Leu Ser Pro Gly Ala Asn 435 440 445 Thr Gly Glu Ile Gln Ile Arg Leu His Asn Glu Asp Trp Gly Asn Tyr 450 455 460 Ser Gln Ile Gly Asp Tyr Ser Phe Ser Gln Ser Asn Thr Phe Lys Asp<211><212>

465 470 475

Thr Lys Lys Ile Thr Leu Tyr Asn Asn Gly Lys485 490

Glu Pro Lys<210> 3292268DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 329

atgaggaacg ttcaggaaat aggaggcagt atgtacaaaattgtttttgc tgttggcggc ggtggcgctc ccgtctgtggcgcctgcgcg atgtggcggg cgacatttta gtgggttacgaacatgtctg actcagccca atacacagaa gttgcccgcacccgaaaacg ccatgaagtg ggacgccatt catcccgcgccaggccgacc ggcacgtgca gtttgcccag gccaacaacactcgtgtggc acagccaaaa tccaggctgg ctgaccaatgttgatcaaca tcatgaacga ccacattgac acggtcgccgctggtgtggg acgtggtcaa tcaggcgttt aatgaggatgtggtacaacg ggatcggaca ggaatatatc gacctggcctgatcctcatg ccaaactcat ttacaacgat tacaacattgaatggcgtct acaacatggc cgccgatatg gtcaggcgcgggtttccaga tgcacctgga acggggcggc gtcagcggcacagcgtttcg ccgatttggg attggaagtt tacatcaccgcaaaacccaa cccagcagga tttgcaggct caggcggcagcgctgtttgg cgcagcctgc ctgcaaggcg ttgcaggtcttcctgggtac cggacgtatt ccccggcacg ggcgcgcctcgaggccaaac ccgcctatta tgccgtccag gcagagttgaacaaacacac cgggaacgcc cgctcatacc ccttcggccagctacgcccc cggcaacggc cacggcgacc gccaccacccgccgttgatt acgtcattgc caaccagtgg ggcaatggctaccaatcaca gcgccgcgcc ggtgaacggc tataccctggcagattgtca ccagcggctg gaacgtaacc atcgcccaaaagcaacccgg ccggttattg gaacggtgtg atcggagccaggtttccagg gatctctggc gggcggcagc gcggtcgcgcggcgctgcct gtaacggggc cgtccttccg cctactgccagctaccatgt gtccccaggc aacgcctgaa ctgcttgtcgactacccaac tgtctcaaac gctggtggtg cgtttaggcagccggaccgg caggcgttgt caccgtcact gcgccggaccacgataccgc tggcagccaa taccagcaac gccattctggatcacccatt caaatggctg cacctatggc ggttatacctgtgcaagcca gcagcccagt caccttaacg ccgactgccagcaacgccta cggtaaccgc cacgtcgccg tcaggcgcctaccaacgact ggggcagcgg tttcaccgcc aacgttacccgccctcaacg gctggaccct ggcctatgcc tttcccggcatggaacggaa cggccgttca gtccggcagc agcgtcagcgggcagcctgc cgcccaacgt ctccgccagc tttggcttccaacagcgtcc ctgccagctt tacgctgaac ggcgcgcttt<210> 330<211> 755<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(35)<400> 330

Met Arg Asn Val Gln Glu Ile Gly Gly Ser Met

15 10

Leu Val Leu Ala Leu Phe Leu Leu Leu Ala Ala

20 25

Val Gly Ala Ala Pro Gln Gly Pro Arg Leu Arg

35 40

Ile Leu Val Gly Tyr Ala Ser Arg Asn Asp Phe50 55

480

Leu Ile Trp Gly Thr495

aggcttttctgggctgcgcccctccagaaactgagttcaaaaaactcatatggccgtgcagcaactggtcgccgttatgcgàacttatcgttacccgcgcgctggttaaagtgtgcccatgcagtctggcaattggacgttttaccaaacggggcatccctgttgtttaatggccgcgaacgtctacgtccctccggcggttcaggccaacctggacccagcggcagcgcacggcggcaaccacttatttccttcacgcctgcagccggtacggcgaatgcggatggttatagaagggcgtgagcagaaccaccttccccgcaccgtcgctcaccaatacatcaaaccattcaccaacgcaggcgagctagccattga

tgtactggcagcaggggccgcgatttctggcttcatgacgcagttttgcctggacatgccccgcagccaaaggtgaggtgcagcaccatcccgcgccgcccagtaagtcgcgacggcgttgagcaacatggcgcattcccggtgacgaatcgacaaatatcgacaactattccgcagccctgcggccactcggcgtttgccgtcaccatccgcgccggggcgtcagcgccgatttctttttgccttgaacttcaccgacggacttcacccggtgcgcgcttttccgcctgggtgcgggttcgtaacgattcaccgccacgctacgccatctggcggaagccagcaacgcccggttggaatcagcggcaat

Tyr Lys Lys Ala Phe15

Val Ala Leu Pro Ser30

Asp Val Ala Gly Asp45

Trp Asn Met Ser Asp60

601201802403003604204805406006607207808409009601020108011401200126013201380144015001560162016801740180018601920198020402100216022202268Ser Ala Gln Tyr Thr Glu Val Ala Arg Thr Glu Phe Asn Phe Met Thr65 70 75 80

Pro Glu Asn Ala Met Lys Trp Asp Ala Ile His Pro Ala Gln Asn Ser

85 90 95

Tyr Ser Phe Ala Gln Ala Asp Arg His Val Gln Phe Ala Gln Ala Asn

100 105 HO

Asn Met Ala Val His Gly His Ala Leu Val Trp His Ser Gln Asn Pro

115 120 125

Gly Trp Leu Thr Asn Gly Asn Trp Ser Arg Ser Gln Leu Ile Asn Ile

130 135 140

Met Asn Asp His Ile Asp Thr Val Ala Gly Arg Tyr Ala Gly Glu Val145 150 155 160

Leu Val Trp Asp Val Val Asn Gln Ala Phe Asn Glu Asp Gly Thr Tyr

165 170 175

Arg Ser Thr Ile Trp Tyr Asn Gly Ile Gly Gln Glu Tyr Ile Asp Leu

180 185 190

Ala Phe Thr Arg Ala Arg Ala Ala Asp Pro His Ala Lys Leu Ile Tyr

195 200 205

Asn Asp Tyr Asn Ile Gly Trp Leu Asn Ser Lys Ser Asn Gly Val Tyr

210 215 220

Asn Met Ala Ala Asp Met Val Arg Arg Gly Val Pro Ile Asp Gly Val225 230 235 240

Gly Phe Gln Met His Leu Glu Arg Gly Gly Val Ser Gly Ser Ser Leu

245 250 255

Ala Ser Asn Met Gln Arg Phe Ala Asp Leu Gly Leu Glu Val Tyr Ile

260 265 270

Thr Glu Leu Asp Val Arg Ile Pro Gln Asn Pro Thr Gln Gln Asp Leu

275 280 285

Gln Ala Gln Ala Ala Val Tyr Gln Thr Val Thr Asn Arg Cys Leu Ala

290 295 300

Gln Pro Ala Cys Lys Ala Leu Gln Val Trp Gly Ile Pro Asp Lys Tyr305 310 315 320

Ser Trp Val Pro Asp Val Phe Pro Gly Thr Gly Ala Pro Leu Leu Phe

325 330 335

Asn Asp Asn Tyr Glu Ala Lys Pro Ala Tyr Tyr Ala Val Gln Ala Glu

340 345 350

Leu Met Ala Ala Asn Pro Gln Pro Thr Asn Thr Pro Gly Thr Pro Ala

355 360 365

His Thr Pro Ser Ala Thr Ser Thr Ser Ala Ala Thr Ala Thr Pro Pro

370 375 380

Ala Thr Ala Thr Ala Thr Ala Thr Thr Pro Ser Gly Gly Gly Val Cys385 390 395 400

Ala Val Asp Tyr Val Ile Ala Asn Gln Trp Gly Asn Gly Phe Gln Ala

405 410 415

Asn Val Thr Ile Thr Asn His Ser Ala Ala Pro Val Asn Gly Tyr Thr

420 425 430

Leu Ala Trp Thr His Ala Pro Gly Gln Ile Val Thr Ser Gly Trp Asn

435 440 445

Val Thr Ile Ala Gln Ser Gly Ser Ala Val Ser Ala Ser Asn Pró Ala

450 455 460

Gly Tyr Trp Asn Gly Val Ile Gly Ala Asn Gly Gly Lys Ile Ser Phe465 470 475 480

Gly Phe Gln Gly Ser Leu Ala Gly Gly Ser Ala Val Ala Pro Thr Tyr

485 490 495

Phe Ala Leu Asn Gly Ala Ala Cys Asn Gly Ala Val Leu Pro Pro Thr

500 505 510

Ala Thr Phe Thr Pro Ser Pro Thr Ala Thr Met Cys Pro Gln Ala Thr

515 520 525

Pro Glu Leu Leu Val Val Gln Pro Val Thr Ser Pro Thr Thr Gln Leu

530 535 540

Ser Gln Thr Leu Val Val Arg Leu Gly Asn Gly Glu Trp Val Arg Ala545 550 555 560

Ala Gly Pro Ala Gly Val Val Thr Val Thr Ala Pro Asp Pro Asp Gly

565 570 575

Tyr Phe Arg Leu Thr Ile Pro Leu Ala Ala Asn Thr Ser Asn Ala Ile

580 585 590

Leu Val Glu Gly Arg Val Arg Val Ile Thr His Ser Asn Gly Cys Thr595

600

605

610

615

625

630

645

650

660

665

675

680

690

695

705

710

725

730

740

745

Thr Ile 620 Val Gln Ala SerPro Ser Pro Thr Ala Thr635 640Ser Gly Ala Cys Thr Val 655 Gly Phe Thr Ala 670 Asn ValAsn Gly Trp Thr Leu Ala 685 Asn Ala 700 Tirp Asn Gly ThrThr Asn Ala Gly Trp Asn715 720Phe Gly Phe Gln Ala 735 SerPhe Thr Leu Asn 750 Gly Ala

Leu Cys His755<210> 331<211> 1242<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 331

gtgttcaagg gcttgcgcta tttgctgttg ctgtgcctgatgtgcgccac ggtctgtgac cgccccaccc gatgggctaacgccaaggaa ccctcactgt ccttgtccag aatgcccaagaaggtggtag ctgctcagca aacccatgcc ttcccctttgatgtttgagc cttccccgcc acccgcagcc aactggtacctttaatgccg ctgtccatga aaacgccctc aagtggtatgaagctggact ttacgatggc ggatcgcatc ctcgcttggaatgcgggggc acaccctctt ttgggaagtt gagcaatttactgccaccag agcaactgcg ggctgccgtc aagaaccatgtaccgcgggc gaatcaatga atttgatgtc aataatgaaacgcagtcgtt tgggaaacgg catagttaaa gagatgttcgcccgaggccg tcctttatgt gaacgactac ggcattattgtacgtgcagc agattcgcga tttactgggg caaggggttccaagcccatt tggaatatcc cttggatgca gccaagatgagcccaattca acctgcccct aaaaatcact gaagttagtgcagcaggcgg agacactgcg ccaaatctac cgcattggttgagatcctcc tgtggggatt ttgggaaggc aaccactggccgtcgcgact tttccgccaa acctgctgcc gaagcctatctggtggacca ccagcaacgg caaaactaat gccgatgggcgcggggcgct atcgcctcac agtaacggcc aacggccagactaccagact tggagagaac cgtgaccgta caattcccat<210> 332<211> 413<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<22 0>

<221> SIGNAL<222> (1) ... (28)<400> 332

Met Phe Lys Gly Leu Arg Tyr Leu Leu Leu Leu15 10Leu Val Phe Ala Cys Ala Pro Arg Ser Val Thr

20 25

Leu Ser Gly Gln Ile Arg Leu Leu Arg Gln Gly

35 40

Val Gln Asn Ala Gln Gly Gln Pro Ile Ala Asn50 55

gtgcgggactgcgggcaaatggcaacccatgtgttgccttgcaacaccgccccttgaaccgtgaagcccaaccccccatgccatgacggttgctccacggagtggtgccgagggcgatcgccattggtggaacgcgcccttcagccttgcttgcccatccgaccccaagcgacaactcctgctggcagacccattaaccgga

ggtctttgcc 60taggctcctg 120tgccaacgcc 180agatacagca 240tcgccaaaat 300ggagcagggc 360aggctggccg 420gctgaaaacg 480gtgtcgccat 540taactttttc 600cgagggtaac 660cctcgacgac 720cattggcatt 780tgataccctt 840cgacgagcag 900agccgtcaaa 960aggactgtac 1020ctttcaggag 1080ccgcggctat 1140cgacattgac 1200 1242

Cys Leu Ser Ala Gly15

Ala Pro Pro Asp Gly30

Thr Leu Thr Val Leu45

Ala Lys Val Val Ala60Ala Gln Gln Thr His Ala Phe Pro Phe Gly Val Ala Leu Asp Thr Ala65 70 75 80Met Phe Glu Pro Ser 85 Pro Pro Pro Ala Ala 90 Asn Trp Tyr Arg Asn 95 ThrAla Arg Gln Asn Phe Asn Ala Ala Val His Glu Asn Ala Leu Lys Trp 100 105 110 Tyr Ala Leu Glu Pro Glu Gln Gly Lys Leu Asp Phe Thr Met Ala Asp 115 120 125 Arg Ile Leu Ala Trp Ser Glu Ala Gln Gly Trp Pro Met Arg Gly His 130 135 140 Thr Leu Phe Trp Glu Val Glu Gln Phe Asn Pro Pro Trp Leu Lys Thr145 150 155 160Leu Pro Pro Glu Gln 165 Leu Arg Ala Ala Val 170 Lys Asn His Ala Met 175 ThrVal Cys Arg His Tyr Arg Gly Arg Ile Asn Glu Phe Asp Val Asn Asn 180 185 190 Glu Met Leu His Gly Asn Phe Phe Arg Ser Arg Leu Gly Asn Gly Ile 195 200 205 Val Lys Glu Met Phe Glu Trp Cys Arg Glu Gly Asn Pro Glu Ala Val 210 215 220 Leu Tyr Val Asn Asp Tyr Gly Ile Ile Glu Gly Asp Arg Leu Asp Asp225 230 235 240Tyr Val Gln Gln Ile Arg Asp Leu Leu Gly Gln Gly Val Pro Ile Gly 245 250 255 Gly Ile Gly Ile Gln Ala His Leu Glu Tyr Pro Leu Asp Ala Ala Lys 260 265 270 Met Lys Arg Ala Leu Asp Thr Leu Ala Gln Phe Asn Leu Pro Leu Lys 275 280 285 Ile Thr 290 Glu Val Ser Val Ser 295 Leu Ala Asp Glu Gln 300 Gln Gln Ala GluThr Leu Arg Gln Ile Tyr Arg Ile Gly Phe Ala His Pro Ala Val Lys305 310 315 320Glu Ile Leu Leu Trp 325 Gly Phe Trp Glu Gly 330 Asn His Trp Arg Pro 335 GlnAla Gly Leu Tyr 340 Arg Arg Asp Phe Ser 345 Ala Lys Pro Ala Ala 350 Glu AlaTyr Arg Gln Leu Leu Phe Gln Glu Trp Trp Thr Thr Ser Asn Gly Lys 355 360 365 Thr Asn Ala Asp Gly Arg Trp Gln Thr Arg Gly Tyr Ala Gly Arg Tyr 370 375 380 Arg Leu Thr Val Thr Ala Asn Gly Gln Thr Ile Asn Arg Asp Ile Asp385 390 395 400Leu Pro Asp Leu Glu Arg Thr Val Thr Val Gln Phe Pro

405 410

<210> 333

<211> 1152

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 333

atgaaaagac aatttattgg acgattgaga cttgtcacta tcctttcaat catagtgattatgggatgtg cttcaaacaa aagtgatcag aatgttgata acctaaagga cgccttcgacggtttgttcc ttattggaac tgccatgaat accccccaga tcaccggaca ggatacccggacgcttgaat tgatcaaaaa acacatgaac tccattgtgg cagaaaacgt tatgaaaagcggactaatac agcccagcga aggggagttc gacttctcac ttgccgacca gtttgtgcaattcggtgttg acaacaacat gcacatcgta gggcataccc ttatctggca ttcgcaggctccagggtggt tttttgtgga tgaaaacggt aatgatgtta gtcccgaagt tcttaagcaaaggatgaaag accacatcta cacagtagtt ggccgttaca aaggcaaagt gcacggttgggatgtggtga atgaatgtat cgttgacgat gggtcatggc gcaacagcaa gttttaccagatcctgggtg aagactttgt aaagtatgcc ttccagtttg cttcagaagc cgacccgaatgctgaattgt attacaacga ttattccatg gcacttcccg gccgccgcca gggagtcgtaaacatggtaa aaaatctaca ggcacaaggt attaaaattg acggaatagg aatgcagggccacctgatga tcgaccatcc atcccttgaa gatttcgaaa ccagtttgct tgcctttgccgatctgggtg tacatgttat gatcactgag cttgatgtat ctgtacttcc ttttcctacccgcaacctcg gtgctgatgt atctctaaac atagcttaca acactgaact gaacccctatcccgatggat tgcctgatga tgtggcccaa aaacttcatg atcgctggct cgatatatatcgtttattta taaaacatca cgacaagatc acccgtgtta ctacctgggg tacagccgat 1020ggtatgtcat ggaagaacaa ctggcccatt cgtggacgca cagactttcc tttattattc 1080gaccgcgatt ttcaacccaa accggtagta gctgatatta tcaaagaagc attggctgca 1140

aagagaaaat ag 11JÍ

<210> 334<211> 383<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(30)<400> 334

Met Lys Arg Gln Phe Ile Gly Arg Leu Arg Leu Val Thr Ile Leu Ser1 5 10 15

Ile Ile Val Ile Met Gly Cys Ala Ser Asn Lys Ser Asp Gln Asn Val

20 25 30

Asp Asn Leu Lys Asp Ala Phe Asp Gly Leu Phe Leu Ile Gly Thr Ala35 40 45

Met Asn Thr Pro Gln Ile Thr Gly Gln Asp Thr Arg Thr Leu Glu Leu

50 55 60

Ile Lys Lys His Met Asn Ser Ile Val Ala Glu Asn Val Met Lys Ser65 70 75 80

Gly Leu Ile Gln Pro Ser Glu Gly Glu Phe Asp Phe Ser Leu Ala Asp

85 90 95

Gln Phe Val Gln Phe Gly Val Asp Asn Asn Met His Ile Val Gly His

100 105 110

Thr Leu Ile Trp His Ser Gln Ala Pro Gly Trp Phe Phe Val Asp Glu

115 120 125

Asn Gly Asn Asp Val Ser Pro Glu Val Leu Lys Gln Arg Met Lys Asp

130 135 140

His Ile Tyr Thr Val Val Gly Arg Tyr Lys Gly Lys Val His Gly Trp

145 150 155 160

Asp Val Val Asn Glu Cys Ile Val Asp Asp Gly Ser Trp Arg Asn Ser

165 170 175

Lys Phe Tyr Gln Ile Leu Gly Glu Asp Phe Val Lys Tyr Ala Phe Gln

180 185 190

Phe Ala Ser Glu Ala Asp Pro Asn Ala Glu Leu Tyr Tyr Asn Asp Tyr

195 200 205

Ser Met Ala Leu Pro Gly Arg Arg Gln Gly Val Val Asn Met Val Lys

210 215 220

Asn Leu Gln Ala Gln Gly Ile Lys Ile Asp Gly Ile Gly Met Gln Gly225 230 235 240

His Leu Met Ile Asp His Pro Ser Leu Glu Asp Phe Glu Thr Ser Leu

245 250 255

Leu Ala Phe Ala Asp Leu Gly Val His Val Met Ile Thr Glu Leu Asp

260 265 270

Val Ser Val Leu Pro Phe Pro Thr Arg Asn Leu Gly Ala Asp Val Ser

275 280 285

Leu Asn Ile Ala Tyr Asn Thr Glu Leu Asn Pro Tyr Pro Asp Gly Leu

290 295 300

Pro Asp Asp Val Ala Gln Lys Leu His Asp Arg Trp Leu Asp Ile Tyr305 310 315 320

Arg Leu Phe Ile Lys His His Asp Lys Ile Thr Arg Val Thr Thr Trp

325 330 335

Gly Thr Ala Asp Gly Met Ser Trp Lys Asn Asn Trp Pro Ile Arg Gly

340 345 350

Arg Thr Asp Phe Pro Leu Leu Phe Asp Arg Asp Phe Gln Pro Lys Pro355 360 365

Val Val Ala Asp Ile Ile Lys Glu Ala Leu Ala Ala Lys Arg Lys

370 375 380

<210> 335<211> 849<212> DNA

<213> Desconhecido<220>300360420480

780840849

<223> Obtido para uma amostra ambiental.<400> 335

atgattccaa ggatcgtcct ggccgtccgc atatccccta cttttctcag cccacaaaaa 60

ggggtaataa aaatgataaa gcgggctttt atgataaccc tggcggcctt cctcctcctt 120

ttcgccctaa attccctgcc tatccatgcc ggggccgaag gcggggagga aaagtttacc 180

cccaaggtca tcgtggagca cggtttcgag aataacgact tccacggttg ggtcccccgg 240

ggcggggtcg ggaccatttc cattaccaat gaggcggccc atagcgggtc ctcctgcctgaagatcaccg gccggactca agcttggcat atgccgcggg tggagatcac caagtacttagaaaagggag ctaagtataa gatcgaattg tacgtcaagc tccccgcggg cacctcgccgcgcaagttcc agctggcggt tctcacccgt tatctcgaag gcaaccagac cagggacaaagaggactcca tctcggacga ggtggaggtg accgccgata cctggaccaa ggtcgagggc 540

gagtacgtct tcgacccggc ggccatcggc gcctacgtct acccctacct caagggcgac 600

cccgcagggg cctatgcccc ctatctcatc gatgatttca agatcaccac gatcgccccc 660

gcccccaaga agaccgccgc taccgccgcg gcaaaagagg cagaagagcc cttaatcgag 720

accgatatac catccttaaa agacgtctgc gcgtcctact tcgagatcgg cgcggccatcgagccatatg agttattctc caagccccac gatcagctgc tccggaaaca tttcaacaccgttggttga<210> 336<211> 282<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1) ... (50)<400> 336

Met Xle Pro Arg Ile Val Leu Ala Val Arg Ile Ser Pro Thr Phe Leu

1 5 10 15

Ser Pro Gln Lys Gly Val Ile Lys Met Ile Lys Arg Ala Phe Met Ile

20 25 30

Thr Leu Ala Ala Phe Leu Leu Leu Phe Ala Leu Asn Ser Leu Pro Ile

35 40 45

His Ala Gly Ala Glu Gly Gly Glu Glu Lys Phe Thr Pro Lys Val Ile

50 55 60

Val Glu His Gly Phe Glu Asn Asn Asp Phe His Gly Trp Val Pro Arg65 70 75 80

Gly Gly Val Gly Thr Ile Ser Ile Thr Asn Glu Ala Ala His Ser Gly

85 90 95

Ser Ser Cys Leu Lys Ile Thr Gly Arg Thr Gln Ala Trp His Met Pro

100 105 HO

Arg Val Glu Ile Thr Lys Tyr Leu Glu Lys Gly Ala Lys Tyr Lys Ile

115 120 125

Glu Leu Tyr Val Lys Leu Pro Ala Gly Thr Ser Pro Arg Lys Phe Gln

130 135 140

Leu Ala Val Leu Thr Arg Tyr Leu Glu Gly Asn Gln Thr Arg Asp Lys145 150 155 160

Glu Asp Ser Ile Ser Asp Glu Val Glu Val Thr Ala Asp Thr Trp Thr

165 170 175

Lys Val Glu Gly Glu Tyr Val Phe Asp Pro Ala Ala Ile Gly Ala Tyr

180 185 190

Val Tyr Pro Tyr Leu Lys Gly Asp Pro Ala Gly Ala Tyr Ala Pro Tyr

195 200 205

Leu Ile Asp Asp Phe Lys Ile Thr Thr Ile Ala Pro Ala Pro Lys Lys

210 215 220

Thr Ala Ala Thr Ala Ala Ala Lys Glu Ala Glu Glu Pro Leu Ile Glu225 230 235 240

Thr Asp Ile Pro Ser Leu Lys Asp Val Cys Ala Ser Tyr Phe Glu Ile

245 250 255

Gly Ala Ala Ile Glu Pro Tyr Glu Leu Phe Ser Lys Pro His Asp Gln

260 265 270

Leu Leu Arg Lys His Phe Asn Thr Val Gly

275 280

<210> 337<211> 870<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 337

atgaagcccg acagcgtgct ggatgtaaac gccagcaaaa agctctccgc ccaggatgaa 60

accgccgtgg cggtgaaatt cgacgccgcc cgcgccctgc tggattttgt caaggaaaac 120

gggctcaagg tgcacggtca cgtgctggta tggcattccc agacgccgga agccttcttc 180cacgagggct atgatgccgc caggccctac gtggggcggg acgtgatgct ggggcgcatg 240

300360420480540

aaaaactaca tcaaggccgt gtttgaatac actgagacca attaccccgg cgtcatcgtctcctgggacg tagtgaacga agccatcgac gacggcacca acaagctgcg ccagtccaactggttcaaaa ccgttggcga ggatttcgtg ctccgcgcct ttgaatacgc caggaaatacgcccccgaag gcacgctgct ttattacaac gattacaaca ccgccatgcc cggcaagctgaacggcatcg ccaatctgct caaagccctc atcgccgagg gcaacatcga cggctacggc

ttccaaatgc accacagcgt gggcttcccc tccatggaaa tgatttccgc gtctgtggag 600

cgcatcgccg gcatgggcct taagctccgg gtcagcgaat tggacgtggg caccgacggaaacaccgaaa gcagcttcac caagcaggcg gaaaaatacg ccgccatcat gcggctgctgctggattata aggatcaaat ggaagccgtg caggtatggg gcctcaccga cgatatgagctggcgccggg ccaactatcc cctgctcttc gacggcaaat tcaaccccaa gcccgccttctacgccgtgg ctgacccata cgcaaaataa<210> 338

<211> 289

<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 338

Met Lys Pro Asp Ser Val Leu Asp Val Asn Ala Ser Lys Lys Leu Ser

1 5 10 15

Ala Gln Asp Glu Thr Ala Val Ala Val Lys Phe Asp Ala Ala Arg Ala20 25 30

Leu Leu Asp Phe Val Lys Glu Asn Gly Leu Lys Val His Gly His Val35 40 45

Leu Val Trp His Ser Gln Thr Pro Glu Ala Phe Phe His Glu Gly Tyr

50 55 60

Asp Ala Ala Arg Pro Tyr Val Gly Arg Asp Val Met Leu Gly Arg Met65 70 75 80

Lys Asn Tyr Ile Lys Ala Val Phe Glu Tyr Thr Glu Thr Asn Tyr Pro

85 90 95

Gly Val Ile Val Ser Trp Asp Val Val Asn Glu Ala Ile Asp Asp Gly100 105 HO

Thr Asn Lys Leu Arg Gln Ser Asn Trp Phe Lys Thr Val Gly Glu Asp115 120 125

Phe Val Leu Arg Ala Phe Glu Tyr Ala Arg Lys Tyr Ala Pro Glu Gly

135 140

Asp Tyr Asn Thr Ala Met Pro Gly Lys Leu145 150 155 160

Leu Leu Lys Ala Leu Ile Ala Glu Gly Asn Ile

170 175

Gln Met His His Ser Val Gly Phe Pro Ser Met185 190

Glu Met Ile Ser Ala Ser Val Glu Arg Ile Ala Gly Met Gly Leu Lys195 200 205

Leu Arg Val Ser Glu Leu Asp Val Gly Thr Asp Gly Asn Thr Glu Ser

210 215 220

Ser Phe Thr Lys Gln Ala Glu Lys Tyr Ala Ala Ile Met Arg Leu Leu225 230 235 240

Leu Asp Tyr Lys Asp Gln Met Glu Ala Val Gln Val Trp Gly Leu Thr

245 250 255

Asp Asp Met Ser Trp Arg Arg Ala Asn Tyr Pro Leu Leu Phe Asp Gly260 265 270

Lys Phe Asn Pro Lys Pro Ala Phe Tyr Ala Val Ala Asp Pro Tyr Ala275 280 285

Lys

<210> 339<211> 1125<212> DNA

<213> Desconhecido<22 0>

Phe Val Leu Arg Ala 130 Thr Leu Leu Tyr Tyr145 Asn Gly Ile Ala Asn 165Asp Gly Tyr Gly Phe 180 Glu Met Ile Ser Ala

660720780840870<223> Obtido para uma amostra ambiental.<400> 339

atgcctatgg agcgacccac tttcttgcggattttcgccg ccggagggtg ccgaccccttatcccctccc tcaaggaagt cgccgcttcttatcagttat cctctccacc ccacgatgccgcggagaacg tcatgaagcc cgcctccatcgaagcggaca agatcgtgaa ctacgccaaactcgtctggc ataatcaggt cccggattggttgcagcgct tggagaatca tatccggacttattgggacg tggtgaacga agtaatagactaccagatca ccgggaagga ctacatcaagaggaagaatg ggtggaggaa agaaggtcgtaacccaacga agagagaggg gatctggcgccccgtcgacg gagtaggcca ccagacgcatatcgtggaat cgatccgctt cttcggcgaagatgtgagca tctatacgáa tgacaaggatgaagtcttca tcaagcaggg taatcgctacaaaaactacc tcagcaacgt caccttctggcgttggccca tcgaacggcc cgatgctcctccggcgtatt gggggatcgt ggatgctttg<210> 340<211> 374<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL

<222> (1)...(23)

<400> 340

Met Pro Met Glu Arg Pro Thr Phe Leu Arg Phe Leu Ala Phe Phe Leu 1 5 10 15 Leu Phe Thr Met Ile Phe Ala Ala Gly Gly Cys Arg Pro Leu Ala Pro 20 25 30 Ser Arg Met 35 Glu Ile Glu Thr Asp 40 Ile Pro Ser Leu Lys 45 Glu Val Ala Ala Ser 50 Tyr Phe Glu Ile Gly 55 Ala Ala Val Glu Pro 60 Tyr Gln Leu Ser Ser 65 Pro Pro His Asp Ala 70 Leu Leu Arg Lys His 75 Phe Asn Cys Leu Val 80 Ala Glu Asn Val Met 85 Lys Pro Ala Ser Ile 90 Gln Pro Ser Glu Gly 95 Tyr Phe Asn Trp Thr Glu Ala Asp Lys Ile Val Asn Tyr Ala Lys Ala His 100 105 110 Gly Met Lys 115 Leu Arg Phe His Thr 120 Leu Val Trp His Asn 125 Gln Val Pro Asp Trp 130 Phe Phe Ala Gly Asn 135 Asp Lys Thr Arg Leu 140 Leu Gln Arg Leu Glu 145 Asn His Ile Arg Thr 150 Ile Ile Lys Arg Tyr 155 Gly Asp Lys Val Asp 160 Tyr Trp Asp Val Val 165 Asn Glu Val Ile Asp 170 Asp Asn Gly Gly Met 175 Arg Asn Ser Lys Trp Tyr Gln Ile Thr Gly Lys Asp Tyr Ile Lys Thr Ala 180 185 190 Phe Arg Val 195 Ala Asp Asp Glu Leu 200 Arg Lys Asn Gly Trp 205 Arg Lys Glu Gly Arg 210 Gln Leu Tyr Ile Asn 215 Asp Tyr Asn Thr His 220 Asn Pro Thr Lys Arg 225 Glu Gly Ile Trp Arg 230 Leu Ile Gln Glu Leu 235 Arg Ala Glu Gly Ile 240 Pro Val Asp Gly Val Gly His Gln Thr His Ile Asn Ile Glu Trp Pro 245 250 255 Pro Val Ser Gln Ile Val Glu Ser Ile Arg Phe Phe Gly Glu Lys Gly 260 265 270 Leu Asp Asn 275 Gln Val Thr Glu Leu 280 Asp Val Ser Ile Tyr 285 Thr Asn Asp

tttcttgcct tttttcttctgccccttcac ggatggagáttatttcgaga tcggcgcggccttctgcgga aacattttaacagccatcgg aggggtatttgcccacggga tgaagctccgttcttcgcgg gtaacgacaaatcattaaaa gatatggcgagacaacggcg gtatgcgaaaaccgccttcc gggtggcagacagctctata tcaacgactattgatccaag agctccgggcatcaatatcg aatggccgccaaaggcctcg ataaccaggttcacatggta gttatcaggcaaggaactct ttgaagggctggcatggcgg acgatcataccttcctttcg atatctatctaagctttcgc ggtga

ttttaccatg 60

cgagacggat 120

cgtcgagccg 180

ctgcctcgtg 240

caactggacc 300

cttccatacc 360

aacccgcctt 420

taaggtcgac 480

cagcaagtgg 540

cgacgagctc 600

caacacccat 660

ggaagggatt 720

cgtaagccag 780

gaccgagctg 840

catcccgcag 900

aaaaagtgta 960

ctggctgaac 1020

caaggccaag 10801125120180

480540600660

Lys Asp Ser His Gly Ser Tyr Gln Ala Ile Pro Gln Glu Val Phe Ile

290 295 300

Lys Gln Gly Asn Arg Tyr Lys Glu Leu Phe Glu Gly Leu Lys Ser Val305 310 315 320

Lys Asn Tyr Leu Ser Asn Val Thr Phe Trp Gly Met Ala Asp Asp His

325 330 335

Thr Trp Leu Asn Arg Trp Pro Ile Glu Arg Pro Asp Ala Pro Leu Pro

340 345 350

Phe Asp Ile Tyr Leu Lys Ala Lys Pro Ala Tyr TrpGly Ile Val Asp355 360 365

Ala Leu Lys Leu Ser Arg

370<210> 341<211> 1347<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 341

atgacaatta acaacaaaac tacagcgagt cctagtattc ccagcaccca caattccctc 60

ccgtcgcttc gcacactgtt taccaccagc ctgctcacgc tggccctgac cgcctgcggtggttcttcca gcagcgacaa ggacccttca agctccagct ccagtgaatc atcaagttccagcgaatcct cgagctcagc ttccagcgaa tcctcgagca gtgagtccag cagtagctct 240

tccgcgggcc atttctccat cgagccggac ttccagctct acagcctggc caacttcccg 300

gtgggcgtgg cggtctccgc cgccaacgag aacgacagca tcttcaacag tccggatgcc 360

gccgaacgtc aggccgttat tattgagcac ttctctcagc tcaccgccgg caacatcatg 420

aaaatgagct acctgcagcc gagtcaaggc aacttcacct tcgatgacgc cgacgagttggttaacttcg cccaagccaa tggcatgacc gtacacggcc actccaccat ctggcacgcggactaccaag taccgaactt catgagaaac tttgaaggtg accaggagga atgggcagaaattctgaccg atcacgtcac taccatcatc gagcacttcc ccgacgatgt ggtcatcagc

tgggacgtgg tgaacgaggc tgtcgatcaa ggcacggcga acggctggcg ccattcggtg 720

ttctacaatg cattcgacgc cccggaagaa ggcgacattc ccgaatacat caaagtcgct 780

ttccgcgccg cgcgcgaggc tgacgccaac gtagacctct actacaacga ctacgacaat 840

accgccaatg cccagcgcct ggccaaaaca ctgcaaattg ccgaggtact ggacgccgaa 900

ggcaccattg acggcgtcgg tttccagatg cacgcctaca tggattaccc gagcctgacc 960

cattttgaaa acgccttccg gcaagtcgtc gacctggggc tcaaagtgaa agttaccgagctggacgtat ccgtagtcaa cccctacggc ggcgaagcac ctccacaacc ggaatacgacaaagaactgg ccggcgcgca aaaactgcgc ttctgccaaa tcgccgaagt ttacatgaac 1140actgtacccg aggagttacg cggtggcttc accgtctggg gcctgaccga tgatgaaagt 1200tggctgatgc aacagttcag aaacgccacc ggcgccgact acgacgacgt ctggccgtta 1260ctgttcaatg ccgacaaatc cgccaaaccg gcactgcaag gcgtggccga cgcctttacc 1320ggacaaacct gcacctccga gttctaa 1347

<210> 342<211> 448<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220><221> SIGNAL

<222> (1)... (45)<400> 342

Met Thr Ile Asn Asn Lys Thr Thr Ala Ser Pro Ser Ile Pro Ser Thr15 10 15

His Asn Ser Leu Pro Ser Leu Arg Thr Leu Phe Thr Thr Ser Leu Leu20 25 30

Thr Leu Ala Leu Thr Ala Cys Gly Gly Ser Ser Ser Ser Asp Lys Asp

35 40 45

Pro Ser Ser Ser Ser Ser Ser Glu Ser Ser Ser Ser Ser Glu Ser Ser50 55 60

Ser Ser Ala Ser Ser Glu Ser Ser Ser Ser Glu Ser Ser Ser Ser Ser

65 70 75 80

Ser Ala Gly His Phe Ser Ile Glu Pro Asp Phe Gln Leu Tyr Ser Leu

85 90 95

Ala Asn Phe Pro Val Gly Val Ala Val Ser Ala Ala Asn Glu Asn Asp

100 105 110

Ser Ile Phe Asn Ser Pro Asp Ala Ala Glu Arg Gln Ala Val Ile Ile

10201080115 120 125 Glu His Phe Ser Gln Leu Thr Ala Gly Asn Ile Met Lys Met Ser Tyr 130 135 140 Leu Gln Pro Ser Gln Gly Asn Phe Thr Phe Asp Asp Ala Asp Glu Leu145 150 155 160Val Asn Phe Ala Gln 165 Ala Asn Gly Met Thr 170 Val HiS Gly His Ser 175 ThrIle Trp His Ala 180 Asp Tyr Gln Val Pro 185 Asn Phe Met Arg Asn 190 Phe GluGly Asp Gln Glu Glu Trp Ala Glu Ile Leu Thr Asp His Val Thr Thr 195 200 205 Ile Ile 210 Glu His Phe Pro Asp 215 Asp Val Val Ile Ser 220 Trp Asp Val ValAsn Glu Ala Val Asp Gln Gly Thr Ala Asn Gly Trp Arg His Ser Val225 230 235 240Phe Tyr Asn Ala Phe Asp Ala Pro Glu Glu Gly Asp Ile Pro Glu Tyr 245 250 255 Ile Lys Val Ala 260 Phe Arg Ala Ala Arg 265 Glu Ala Asp Ala Asn 270 Val AspLeu Tyr Tyr 275 Asn Asp Tyr Asp Asn 280 Thr Ala Asn Ala Gln 285 Arg Leu AlaLys Thr Leu Gln Ile Ala Glu Val Leu Asp Ala Glu Gly Thr Ile Asp 290 295 300 Gly Val Gly Phe Gln Met His Ala Tyr Met Asp Tyr Pro Ser Leu Thr305 310 315 320His Phe Glu Asn Ala 325 Phe Arg Gln Val Val 330 Asp Leu Gly Leu Lys 335 ValLys Val Thr Glu Leu Asp Val Ser Val Val Asn Pro Tyr Gly Gly Glu 340 345 350 Ala Pro Pro 355 Gln Pro Glu Tyr Asp 360 Lys Glu Leu Ala Gly 365 Ala Gln LysLeu Arg 370 Phe Cys Gln Ile Ala 375 Glu Val Tyr Met Asn 380 Thr Val Pro GluGlu Leu Arg Gly Gly Phe Thr Val Trp Gly Leu Thr Asp Asp Glu Ser385 390 395 400Trp Leu Met Gln Gln Phe Arg Asn Ala Thr Gly Ala Asp Tyr Asp Asp 405 410 415 Val Trp Pro Leu Leu Phe Asn Ala Asp Lys Ser Ala Lys Pro Ala Leu 420 425 430 Gln Gly Val Ala Asp Ala Phe Thr Gly Gln Thr Cys Thr Ser Glu Phe 435 440 445 <210> 343

<211> 2217<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 343

atggtggagc acgaagctga gcttcatgat taccgcgaac gaatatgcga agttgcttggcaattcgctg ggcctggagg gcgagaaggc aaagcggatt ttgcgggaaa tcaacaactggctgttttga agatgaaatt atcgagaggg agggggcatg gcgttttgaa acgagcaggtctgattgggc ttattgcagc gatattgggc tgcgcggcgc tgcttatgca caatgagatctcatccctgg gaattcagct gagatcatgg ctcagaggga gcgacaatgt gaacgctagctgggaaaagg attggaagac ggctgctaac gagcaaatcg agcagctccg caagcgcaatgtggagatcg aggtcgtcga tctgaacgga aacccgctgc ctggggctac cgttcgcgcggttcagcgca cgcatcagtt tggcttcggc accgccatca accgaacggc gttgagcaatccggtgtacg ccgattttgt caaaaaccgt ttcgaatggg tgaccttcga gaacgaggccaagtggctct ggaatgaggc cgtacaaggg cgggtctatt atcgggaggc cgatcagctgctcgaatttg ccaggcaaaa cgggctgaag gtgcgcggac ataatctgtt ctgggaggcggagaaatatc agccgcagtg ggtgaagagt ctgacgggcg ctgcgctgaa ggaagcgatcgataaccggc tgaacagcgc cgtcctgcat tttaagggca attttctgca ctgggacgtcaacaacgaaa tgtttcacgg cagcttcttc aaggatcgcc tgggggaaga aatctggacctatatgtata agcgaacccg ggaactcgat cccggcgtca agctgttcgt caacgattacaattttatcg agtacccgcc ggagcgggat tataaccagg tcattcaagc gctcatcgatcgggggatgc cgattgacgg catcggcgcg caagggcatt ttaacggagt catcgatcccttgttcgtta agggaagact ggataagctg gctgagctga atctgccgat ctggattaccgaattcgatt ccacgcataa ggacgagaga gtccgtgccg ataatctgga gaagatgtatcggctggcgt tcgcccatcc ggcggtcgaa gggattgtca tgtggggctt ctgggcgggctcccattgga agggcactga cggcgcgatc gtgaatcaag actggacgct caatgccgccggacagcgat accagcagct tatggatgaa tggacgacgg tcgtcgaagg cacgaccgatcagcgcggca tgttttcgtt ccgggggttc cacggaacct acgatatgct ggtcgattaccctggagcgg cggctgtgaa gcagtccttt accttggagc ccggctctgg caatgcgaagctgcacattc cgttcgacgt tcaggacaag tccatcccgg aggctcctgc cáagctcagcgccgctgccg cggattccca ggttatgctg agctggagca aggtcaacgg ggcaaccggctatacggtta aaagcgcggt cagcgccgac ggtccctata cgccgattgc ccatcagctgctcaccgaga ccttcacgca catcggtcta gtgaaccgga aagattatta ttacgtggtgagcgccagca accatctagg tgagagcccg gattccgccc cgatccgggc cactccgcgtgccgcgggcg agttacaaac gaatctcgtg cttcagtacc gctccgctga tggagataacaactatcaaa tgaagcctca gttcacgatc aagaacgcag gcaaagtgcc catcccgttaagcgagctga cgatccgcta ctatttcacg ccggagagca cgcagccggt ggataccaggatcgactggg cccaattcgg agcagagcat gtccagacga cggtcgttcc gccatccgatgccgcggcgc acgcctatgt cgagctcagc ttcctggagt cggcaggggc catcccttccgatacgacat taggcaatat tcagctgcgc atctttaaca gcgatggctc ttcgttcgataaaacgaacg attattcctt cgacccgacg aaaaaggctt atacggcgtg ggagaaggtcacgctttatc ggaacgggga actggtttgg gggatagagc cttggggcgc gaagtaa<210> 344<211> 738

<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 344

Met Val Glu His Glu Ala Glu Leu His Asp Tyr Arg Glu Arg Ile Cys

1 5 10 15

Glu Val Ala Trp Gln Phe Ala Gly Pro Gly Gly Arg Glu Gly Lys Ala20 25 30

Asp Phe Ala Gly Asn Gln Gln Leu Ala Val Leu Lys Met Lys Leu Ser35 40 45

Arg Gly Arg Gly His Gly Val Leu Lys Arg Ala Gly Leu Ile Gly Leu

50 55 60

Ile Ala Ala Ile Leu Gly Cys Ala Ala Leu Leu Met His Asn Glu Ile65 70 75 80

Ser Ser Leu Gly Ile Gln Leu Arg Ser Trp Leu Arg Gly Ser Asp Asn

85 90 95

Val Asn Ala Ser Trp Glu Lys Asp Trp Lys Thr Ala Ala Asn Glu Gln100 105 HO

Ile Glu Gln Leu Arg Lys Arg Asn Val Glu Ile Glu Val Val Asp Leu115 120 125

Asn Gly Asn Pro Leu Pro Gly Ala Thr Val Arg Ala Val Gln Arg Thr

130 135 140

His Gln Phe Gly Phe Gly Thr Ala Ile Asn Arg Thr Ala Leu Ser Asn145 150 155 160

Pro Val Tyr Ala Asp Phe Val Lys Asn Arg Phe Glu Trp Val Thr Phe

165 170 175

Glu Asn Glu Ala Lys Trp Leu Trp Asn Glu Ala Val Gln Gly Arg Val180 185 190

Tyr Tyr Arg Glu Ala Asp Gln Leu Leu Glu Phe Ala Arg Gln Asn Gly195 200 205

Leu Lys Val Arg Gly His Asn Leu Phe Trp Glu Ala Glu Lys Tyr Gln

210 215 220

Pro Gln Trp Val Lys Ser Leu Thr Gly Ala Ala Leu Lys Glu Ala Ile225 230 235 240

Asp Asn Arg Leu Asn Ser Ala Val Leu His Phe Lys Gly Asn Phe Leu

245 250 255

His Trp Asp Val Asn Asn Glu Met Phe His Gly Ser Phe Phe Lys Asp260 265 270

Arg Leu Gly Glu Glu Ile Trp Thr Tyr Met Tyr Lys Arg Thr Arg Glu275 280 285

Leu Asp Pro Gly Val Lys Leu Phe Val Asn Asp Tyr Asn Phe Ile Glu

290 295 300

Tyr Pro Pro Glu Arg Asp Tyr Asn Gln Val Ile Gln Ala Leu Ile Asp305 310 315 320

Arg Gly Met Pro Ile Asp Gly Ile Gly Ala Gln Gly His Phe Asn Gly325 330 335

120012601320138014401500156016201680174018001860192019802040210021602217Val Ile Asp Pro Leu Phe Val Lys Gly Arg Leu Asp Lys Leu Ala Glu 340 345 350 Leu Asn Leu Pro Ile Trp Ile Thr Glu Phe Asp Ser Thr His Lys Asp 355 360 365 Glu Arg Val Arg Ala Asp Asn Leu Glu Lys Met Tyr Arg Leu Ala Phe 370 375 380 Ala His Pro Ala Val Glu Gly Ile Val Met Trp Gly Phe Trp Ala Gly385 390 395 400Ser His Trp Lys Gly Thr Asp Gly Ala Ile Val Asn Gln Asp Trp Thr 405 410 415 Leu Asn Ala Ala Gly Gln Arg Tyr Gln Gln Leu Met Asp Glu Trp Thr 420 425 430 Thr Val Val Glu Gly Thr Thr Asp Gln Arg Gly Met Phe Ser Phe Arg 435 440 445 Gly Phe His Gly Thr Tyr Asp Met Leu Val Asp Tyr Pro Gly Ala Ala 450 455 460 Ala Val Lys Gln Ser Phe Thr Leu Glu Pro Gly Ser Gly Asn Ala Lys465 470 475 480Leu His Ile Pro Phe Asp Val Gln Asp Lys Ser Ile Pro Glu Ala Pro 485 490 495 Ala Lys Leu Ser Ala Ala Ala Ala Asp Ser Gln Val Met Leu Ser Trp 500 505 510 Ser Lys Val Asn Gly Ala Thr Gly Tyr Thr Val Lys Ser Ala Val Ser 515 520 525 Ala Asp Gly Pro Tyr Thr Pro Ile Ala His Gln Leu Leu Thr Glu Thr 530 535 540 Phe Thr His Ile Gly Leu Val Asn Arg Lys Asp Tyr Tyr Tyr Val Val545 550 555 560Ser Ala Ser Asn His Leu Gly Glu Ser Pro Asp Ser Ala Pro Ile Arg 565 570 575 Ala Thr Pro Arg Ala Ala Gly Glu Leu Gln Thr Asn Leu Val Leu Glri 580 585 590 Tyr Arg Ser Ala Asp Gly Asp Asn Asn Tyr Gln Met Lys Pro Gln Phe 595 600 605 Thr Ile Lys Asn Ala Gly Lys Val Pro Ile Pro Leu Ser Glu Leu Thr 610 615 620 Ile Arg Tyr Tyr Phe Thr Pro Glu Ser Thr Gln Pro Val Asp Thr Arg625 630 635 640Ile Asp Trp Ala Gln Phe Gly Ala Glu His Val Gln Thr Thr Val Val 645 650 655 Pro Pro Ser Asp Ala Ala Ala His Ala Tyr Val Glu Leu Ser Phe Leu 660 665 670 Glu Ser Ala Gly Ala Ile Pro Ser Asp Thr Thr Leu Gly Asn Ile Gln 675 680 685 Leu Arg Ile Phe Asn Ser Asp Gly Ser Ser Phe Asp Lys Thr Asn Asp 690 695 700 Tyr Ser Phe Asp Pro Thr- Lys Lys Ala Tyr Thr Ala Trp Glu Lys Val705 710 715 720Thr Leu Tyr Arg Asn Gly Glu Leu Val Trp Gly Ile Glu Pro Trp Gly 725 730 735 Ala Lys <210> 345 <211> 849

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 345

atgaagatga cctacatgca tccggctgaa gatacttact cgtttggtca agcggatcagttggtcaact gggcgaaagc gaatggtatt ggcgtgcacg gccacactct ggtttggcactccgaatacc aggtacccaa ttggatgaaa aattactctg gtgatgcaac tgcattccaaaccatgctca acacccatgt gaaaactgtg gctgagcatt ttgctggcga actggacagctgggacgttg tgaatgaagt gctggagccg ggctccaatg gttgctggcg tgaaaactctctgttctacc agaagcttgg caaagacttt gtcgcgaacg cattccgtgc agctcgcgagggcgatccca atgcagactt gtattacaac gattactcga ctgaaaatgg tgtaacttccgatgagaagt tcagttgttt gttggaacta gtcgatgagc ttctggaagc ggacgtgccgattacaggtg ttggtttcca aatgcacgtg caggcgacgt ggcctagcaa tgccaacatcgcgggcgcgg cgagcggctc ggccgaatgg gtggcggtgg agaacatgcc gttcacgcac

840849

ggcaaggcat tcaaagccat cgcggatcgc ggtctgaaag ttaaaatttc tgagctcgat 600

gttcctgtta acaaccctta cggaaccact aatttcccgc aatacagcag ttttaccgcg 660

gaagccgccg agctgcagaa gcagcgctac aagggcatta tgcaagcgta ccttgataac 720

gtaccggcca acctgcgtgg tggtttcacc gtgtggggcg tttgggatgg cgatagctgg 780

atcatgacgt tcagccagta caccaacgct aacgccaacg actggccact gttgttcaccgggccgtag<210> 346<211> 282<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 346

Met Lys Met Thr Tyr Met His Pro Ala Glu Asp Thr Tyr Ser Phe Gly

1 5 10 15

Gln Ala Asp Gln Leu Val Asn Trp Ala Lys Ala Asn Gly Ile Gly Val20 25 30

His Gly His Thr Leu Val Trp His Ser Glu Tyr Gln Val Pro Asn Trp35 40 45

Met Lys Asn Tyr Ser Gly Asp Ala Thr Ala Phe Gln Thr Met Leu Asn50 55 60

Thr His Val Lys Thr Val Ala Glu His Phe Ala Gly Glu Leu Asp Ser65 70 75 80

Trp Asp Val Val Asn Glu Val Leu Glu Pro Gly Ser Asn Gly Cys Trp85 90 95

Arg Glu Asn Ser Leu Phe Tyr Gln Lys Leu Gly Lys Asp Phe Val Ala

100 105 110

Asn Ala Phe Arg Ala Ala Arg Glu Gly Asp Pro Asn Ala Asp Leu Tyr115 120 125

Tyr Asn Asp Tyr Ser Thr Glu Asn Gly Val Thr Ser Asp Glu Lys Phe130 135 140

Ser Cys Leu Leu Glu Leu Val Asp Glu Leu Leu Glu Ala Asp Val Pro145 150 155 160

Ile Thr Gly Val Gly Phe Gln Met His Val Gln Ala Thr Trp Pro Ser165 170 175

Asn Ala Asn Ile Gly Lys Ala Phe Lys Ala Ile Ala Asp Arg Gly Leu

180 185 190

Lys Val Lys Ile Ser Glu Leu Asp Val Pro Val Asn Asn Pro Tyr Gly195 200 205

Thr Thr Asn Phe Pro Gln Tyr Ser Ser Phe Thr Ala Glu Ala Ala Glu210 215 220

Leu Gln Lys Gln Arg Tyr Lys Gly Ile Met Gln Ala Tyr Leu Asp Asn225 230 235 240

Val Pro Ala Asn Leu Arg Gly Gly Phe Thr Val Trp Gly Val Trp Asp245 250 255

Gly Asp Ser Trp Ile Met Thr Phe Ser Gln Tyr Thr Asn Ala Asn Ala

260 265 270

Asn Asp Trp Pro Leu Leu Phe Thr Gly Pro275 280

<210> 347<211> 1794<212> DNA<213> Desconhecido<22 0>

<223> Obtido para uma amostra ambiental.<400> 347

atgcccgttt tgttcgccct gtttcttgtt gcctcgtcct gcgcggcgca gtcgctggccgggccggttt ccctgcttgg cggagatgcg ggcgcggcgt tccgctatac cgggccatcg 12060180

gcctggcggc tgcgcacgaa tccgctgccg gagagcggcg gcaacgaatg ggacctgcgc 240

atccgcgccc gcggagcggc ggctgtttcg gcaggggaca agatcctggc cgagttctgg 300

atgcgctgcg tggagcccga aaacggcgac tgcattctgc gcctgaacgt ggagcgcgac 360

gggtcgccgt ggaccaaatc catcagcaac ccctacccgg tgggccggga gtggcggcgg 420

ttccgcgtgc tgttcgagat gcgggagagc tacgccgccg gcggctacat gatcgatttc 480

tggatgggcc agcaggtgca gacggcggaa gtgggcggga tttccctgct gaattacggt 540

ccgcaggcca cggccgagca gcttggcctg gaccggtttt atgagggcgc ggcggcggac 600

gccgcgtggc ggcaggcggc cgagcagcgg atcgaggaga tccggaaagc gggcatgatc 660atcgtggcgg tgacgccgga cggcgagccg atcgagggcg ctgaaatccg ggcgaagctgaagcggcacg cgttcgggtg gggcacggct gtggcggcat cacggcttct ggggacgggaacggacagcg agcgctaccg caacttcatc cgcgagaact tcaacatggc ggtgctcgagaacgacctga aatggggccc gttcgaagag aaccgcaacc gcgcgatgaa cgcgctgcgctggctgcatg agaacgggat cacgtggatc cgcgggcaca atctcgtctg gccgggctggcggtggatgc cgaacgacgt gcgcaacctg gcgaacaatc ccgaggcgct gcggcagcggattctggacc gcatccggga cacggccacg gccacgcgcg ggctggtggt gcactgggacgtcgtcaacg agccggtggc cgagcgcgac gtgctgaaca ttctgggcga cgaggtgatggcggactggt tccgcgccgc gaaggagtgc gatcccgagg cgaggatgtt catcaatgagtacgacattc tggcggcgaa cggggccaat ctgcggaagc agaacgcgta ttaccgcatgatcgagatgc tgttgaagct cgaggcgccg gtggagggca tcggcttcca gggccacttcgacacggcca cgccgccgga gcggatgctg gagatcatga accggtacgc ccggctcgggctgccgatcg ccatcaccga gtacgatttc gccacggcgg acgaggagct gcaggcgcagttcacgcgcg acctgatgat tctcgccttc agccatccgg cggtttcgga cttcctgatgtggggcttct gggaagggag ccactggaag ccgctgggcg ccatgatccg gcgcgactggagcgagaagc cgatgtaccg cgtctggcgc gagctgatct tcgagcgctg gcagacggatgaaacaggcg tgacgccgga gcacggtgcc atctacgtgc ggggcttcaa gggcgactacgagatcacgg tgaaggcggg cgggcaggaa gtccgggtgc cgtacacgct gaaagaagacggccaggtgc tgtgggtgac ggtgggcggg gcttctgaag agcgcgtgca gtaa<210> 348<211> 597<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(20)<400> 348

Het Pro Val Leu Phe Ala Leu Phe Leu Val Ala Ser Ser Cys Ala Ala1 5 10 15 Gln Ser Leu Ala Gly Pro Val Ser Leu Leu Gly Gly Asp Ala Gly Ala 20 25 30 Ala Phe Arg 35 Tyr Thr Gly Pro Ser 40 Ala Gly Ala Ala Ser 45 Gly Ser AlaGlu Trp 50 Val Ala Val Glu Asn 55 Met Pro Phe Thr His 60 Ala Trp Arg LeuArg Thr Asn Pro Leu Pro Glu Ser Gly Gly Asn Glu Trp Asp Leu Arg65 70 75 80Ile Arg Ala Arg Gly Ala Ala Ala Val Ser Ala Gly Asp Lys Ile Leu 85 90 95 Ala Glu Phe Trp 100 Met Arg Cys Val Glu 105 Pro Glu Asn Gly Asp 110 Cys IleLeu Arg Leu 115 Asn Val Glu Arg Asp 120 Gly Ser Pro Trp Thr 125 Lys Ser IleSer Asn 130 Pro Tyr Pro Val Gly 135 Arg Glu Trp Arg Arg 140 Phe Arg Val LeuPhe Glu Met Arg Glu Ser Tyr Ala Ala Gly Gly Tyr Met Ile Asp Phe145 150 155 160Trp Met Gly Gln Gln Val Gln Thr Ala Glu Val Gly Gly Ile Ser Leu 165 170 175 Leu Asn Tyr Gly 180 Pro Gln Ala Thr Ala 185 Glu Gln Leu Gly Leu 190 Asp ArgPhe Tyr Glu Gly Ala Ala Ala Asp Ala Ala Trp Arg Gln Ala Ala Glu 195 200 205 Gln Arg 210 Ile Glu Glu Ile Arg 215 Lys Ala Gly Met Ile 220 Ile Val Ala ValThr Pro Asp Gly Glu Pro Ile Glu Gly Ala Glu Ile Arg Ala Lys Leu225 230 235 240Lys Arg His Ala Phe 245 Gly Trp Gly Thr Ala 250 Val Ala Ala Ser Arg 255 LeuLeu Gly Thr Gly Thr Asp Ser Glu Arg Tyr Arg Asn Phe Ile Arg Glu 260 265 270 Asn Phe Asn 275 Met Ala Val Leu Glu 280 Asn Asp Leu Lys Trp 285 Gly Pro PheGlu Glu Asn Arg Asn Arg Ala Met Asn Ala Leu Arg Trp Leu His Glu 290 295 300Asn Gly Ile Thr Trp Ile Arg Gly His Asn Leu Val Trp Pro Gly Trp305 310 315 320Arg Trp Met Pro Asn Asp Val Arg Asn Leu Ala Asn Asn Pro Glu Ala 325 330 335 Leu Arg Gln Arg Ile Leu Asp Arg Ile Arg Asp Thr Ala Thr Ala Thr 340 345 350 Arg Gly Leu Val Val His Trp Asp Val Val Asn Glu Pro Val Ala Glu 355 360 365 Arg Asp Val Leu Asn Ile Leu Gly Asp Glu Val Met Ala Asp Trp Phe 370 375 380 Arg Ala Ala Lys Glu Cys Asp Pro Glu Ala Arg Met Phe Ile Asn Glu385 390 395 400Tyr Asp Ile Leu Ala Ala Asn Gly Ala Asn Leu Arg Lys Gln Asn Ala 405 410 415 Tyr Tyr Arg Met Ile Glu Met Leu Leu Lys Leu Glu Ala Pro Val Glu 420 425 430 Gly Ile Gly 435 Phe Gln Gly His Phe 440 Asp Thr Ala Thr Pro 445 Pro Glu ArgMet Leu 450 Glu Ile Met Asn Arg 455 Tyr Ala Arg Leu Gly 460 Leu Pro Ile AlaIle Thr Glu Tyr Asp Phe Ala Thr Ala Asp Glu Glu Leu Gln Ala Gln465 470 475 480Phe Thr Arg Asp Leu Met Ile Leu Ala Phe Ser His Pro Ala Val Ser 485 490 495 Asp Phe Leu Met Trp Gly Phe Trp Glu Gly Ser His Trp Lys Pro Leu 500 505 510 Gly Ala Met Ile Arg Arg Asp Trp Ser Glu Lys Pro Met Tyr Arg Val 515 520 525 Trp Arg 530 Glu Leu Ile Phe Glu 535 Arg Trp Gln Thr Asp 540 Glu Thr Gly ValThr Pro Glu His Gly Ala Ile Tyr Val Arg Gly Phe Lys Gly Asp Tyr545 550 555 560Glu Ilè Thr Val Lys 565 Ala Gly Gly Gln Glu 570 Val Arg Val Pro Tyr 575 ThrLeu Lys Glu Asp Gly Gln Val Leu Trp Val Thr Val Gly Gly Ala Ser

580 585 590

Glu Glu Arg Val Gln

595<210> 349<211> 1794<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 349

atgcccgttt tgttcgccct gtttcttgtt gcctcgtcct gcgcggcgca gtcgctggccgggccggttt ccctgcttgg cggagatgcg ggcgcggcgt tccgctatac cgggccatcggcgggcgcgg cgagcggctc ggccgaatgg gtggcggtgg agaacatgcc gttcacgcacgcctggcggc tgcgcacgaa tccgctgccg gagagcggcg gcaacgaatg ggacctgcgcatccgcgccc gcggagcggc ggctgtttcg gcaggggaca agatcctggc cgagttctggatgcgctgcg tggagcccga aaacggcgac tgcattctgc gcctgaacgt ggagcgcgacgggtcgccgt ggaccaaatc catcagcaac ccctacccgg tgggccggga gtggcggcggttccgcgtgc tgttcgagat gcgggagagc tacgccgccg gcggctacat gatcgatttctggatgggcc agcaggtgca gacggcggaa gtgggcggga tttccctgct gaattacggtccgcaggcca cggccgagca gcttggcctg gaccggttct atgaaggcgc ggcggcggacgccgcgtggc ggcaggcggc cgagcagcgg atcgaggaga tccggaaagc gggcatgatcatcgtggcgg tgacgccgga cggcgagccg atcgaaggcg ccgagatccg ggcgaagctgaagcggcacg cgttcgggtg gggcacggcg gtggcggcat cacggcttct ggggacgggaacggacagcg agcgctaccg caacttcatc cgcgagaact tcaacatggc ggtgctcgagaacgacctga aatggggccc gttcgaggag aaccgcgccc gcgcaatgaa cgcgctgcgctggctgcatg agaacgggat cacgtggatc cgcgggcaca atctcgtctg gccaggctggcggtggatgc cgagcgacgt gcgcaacctg gcgaacaatc ccgaagccct gcggcagcggattctggacc gcatccggga cacggccacc gccacgcgcg ggctggtcgt gcactgggacgtcgtcaacg agccggtggc cgagcgcgac gtgctgaaca ttctgggcga cgaggtgatggcggactggt tccgcgccgc gaaggagtgc gatcccgagg cgaggatgtt catcaacgaatacgacattc tggcggcgaa cggggccaac ctgcggaagc agaacgcgta ctaccgcatgatcgagatgc tgttgaagct cgaggcgccg gtagagggca tcggcttcca gggccatttcgacacggcta cgccgccgga gcggatgctg gagatcatga accggtacgc ccggctcgggctgccgatcg ccatcaccga gtacgatttc gccacggtag acgaagagct gcaggcgcagttcacgcgcg acctgatgat tctcgctttc agccatccgg cggtttcgga cttcttgatgtggggcttct gggaagggag ccactggaag ccgctgggcg ccatgatccg gcgcgactggagcgagaagc cgatgtaccg cgtctggcgc gagctgatct tcgagcgctg gcagacggatgaaacgggag tgacgccgga gcacggggcc atctacgtgc ggggcttcaa gggcgactacgaaatcacgg tgaaggctgg cgggcaggaa gtccgggtgc cgtacacgct gaaagaagacggccaggtgc tgtgggtgac ggtgggcggt acttctgaag agcaggcgcc gtaa<210> 350<211> 597<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(20)<400> 350

Met Pro Val Leu Phe Ala Leu Phe Leu Val Ala Ser Ser Cys Ala Ala

15 10 15

Gln Ser Leu Ala Gly Pro Val Ser Leu Leu Gly Gly Asp Ala Gly Ala

20 25 30

Ala Phe Arg Tyr Thr Gly Pro Ser Ala Gly Ala Ala Ser Gly Ser Ala

35 40 45

Glu Trp Val Ala Val Glu Asn Met Pro Phe Thr His Ala Trp Arg Leu

50 55 60

Arg Thr Asn Pro Leu Pro Glu Ser Gly Gly Asn Glu Trp Asp Leu Arg65 70 75 80

Ile Arg Ala Arg Gly Ala Ala Ala Val Ser Ala Gly Asp Lys Ile Leu

85 90 95

Ala Glu Phe Trp Met Arg Cys Val Glu Pro Glu Asn Gly Asp Cys Ile

100 105 110

Leu Arg Leu Asn Val Glu Arg Asp Gly Ser Pro Trp Thr Lys Ser Ile

115 120 125

Ser Asn Pro Tyr Pro Val Gly Arg Glu Trp Arg Arg Phe Arg Val Leu

130 135 140

Phe Glu Met Arg Glu Ser Tyr Ala Ala Gly Gly Tyr Met Ile Asp Phe145 150 155 160

Trp Met Gly Gln Gln Val Gln Thr Ala Glu Val Gly Gly Ile Ser Leu

165 170 175

Leu Asn Tyr Gly Pro Gln Ala Thr Ala Glu Gln Leu Gly Leu Asp Arg

180 185 190

Phe Tyr Glu Gly Ala Ala Ala Asp Ala Ala Trp Arg Gln Ala Ala Glu

195 200 205

Gln Arg Ile Glu Glu Ile Arg Lys Ala Gly Met Ile Ile Val Ala Val

210 215 220

Thr Pro Asp Gly Glu Pro Ile Glu Gly Ala Glu Ile Arg Ala Lys Leu225 230 235 240

Lys Arg His Ala Phe Gly Trp Gly Thr Ala Val Ala Ala Ser Arg Leu

245 250 255

Leu Gly Thr Gly Thr Asp Ser Glu Arg Tyr Arg Asn Phe Ile Arg Glu

260 265 270

Asn Phe Asn Met Ala Val Leu Glu Asn Asp Leu Lys Trp Gly Pro Phe

275 280 285

Glu Glu Asn Arg Ala Arg Ala Met Asn Ala Leu Arg Trp Leu His Glu

290 295 300

Asn Gly Ile Thr Trp Ile Arg Gly His Asn Leu Val Trp Pro Gly Trp305 310 315 320

Arg Trp Met Pro Ser Asp Val Arg Asn Leu Ala Asn Asn Pro Glu Ala

325 330 335

Leu Arg Gln Arg Ile Leu Asp Arg Ile Arg Asp Thr Ala Thr Ala Thr

340 345 350

Arg Gly Leu Val Val His Trp Asp Val Val Asn Glu Pro Val Ala Glu

355 360 365

Arg Asp Val Leu Asn Ile Leu Gly Asp Glu Val Met Ala Asp Trp Phe

370 375 380

Arg Ala Ala Lys Glu Cys Asp Pro Glu Ala Arg Met Phe Ile Asn Glu385 390 395 400

Tyr Asp Ile Leu Ala Ala Asn Gly Ala Asn Leu Arg Lys Gln Asn Ala

405 410 415

Tyr Tyr Arg Met Ile Glu Met Leu Leu Lys Leu Glu Ala Pro Val Glu420 425 430

Gly Ile Gly Phe Gln Gly His Phe Asp Thr Ala Thr Pro Pro Glu Arg

435 440 445

Met Leu Glu Ile Met Asn Arg Tyr Ala Arg Leu Gly Leu Pro Ile Ala450 455 460

Ile Thr Glu Tyr Asp Phe Ala Thr Val Asp Glu Glu Leu Gln Ala Gln465 470 475 480

Phe Thr Arg Asp Leu Met Ile Leu Ala Phe Ser His Pro Ala Val Ser

485 490 495

Asp Phe Leu Met Trp Gly Phe Trp Glu Gly Ser His Trp Lys Pro Leu500 505 510

Gly Ala Met Ile Arg Arg Asp Trp Ser Glu Lys Pro Met Tyr Arg Val

515 520 525

Trp Arg Glu Leu Ile Phe Glu Arg Trp Gln Thr Asp Glu Thr Gly Val530 535 540

Thr Pro Glu His Gly Ala Ile Tyr Val Arg Gly Phe Lys Gly Asp Tyr545 550 555 560

Glu Ile Thr Val Lys Ala Gly Gly Gln Glu Val Arg Val Pro Tyr Thr

565 570 575

Leu Lys Glu Asp Gly Gln Val Leu Trp Val Thr Val Gly Gly Thr Ser580 585 590

Glu Glu Gln Ala Pro

595<210> 351<211> 1860<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 351

atgcaccttc caaattaccg ctcgctcgca acggcgctca gtcgctacag ttgctcggcgctgctggccg tcagtcttgt ggcctgcggg ggcaataatg accaagatcc gccgaccccggagccaactc cggtcccaac gccgactcca actccaaccc cgaccccgac tccggagccaaccccgactc cgactccgga gcccactccg actccagagc caactccgac gccgaccccggaaccaacac cgacgccgga gccgacgcca acaccggatc ccggggccga ctaccagccgcccagcaatg acattgccgt caatggcgac gtggaaagcg gtactaccaa ctggggtgcacgcggttcgg catccattag ccgagtcact ttagagagct ttgaaggtga tgccagcttgagtgttaccg gccgagaaga cgactggcat ggcgccacct tctctgtagg ccatctgaccccgggtaata gctatgaagt ggctgcgtgg gtcaagttag cctcaggcga gcccaacacagtggtcaaaa tcacgggtaa gcgcgagggc gagagcgcga cttacgaaga gtacacggatgtcggtacgg cattggctac cgacggtagc tggaccgaaa ttaccggcac ttatattcctgatagcgcca gcccatttga atattttatt gtggagaccc aagagggtgg accgaccgttagcttctacg tggacgcgtt ttcagtggcc ggtgaggtgg aagatacgcc agcgccaacgccgcccccaa ccgctccgcc accgagtggc tcaggcctag cggaactagt ggatttcccggtgggcgttg ccgttgcggt agctagtttt gccaataacg atttcctgag taacacgcaacaacaagata tcgtgcttaa caattttagt gaaattgttg cggagaatca gatgaagatggaatatttca acgatgacta ctccaacccc agggcagatc aactggtcag ctgggccaatgagcgaggta ttcgggttca cggccacgct ttggtctggc acgcgcaagc agcgtcatgggtcagtcctc cggtaagcaa ctttcgcgag cgttatgtca accatgttcg tggtgtggcatcccggtatg cggacacggt agtaagctgg gatgtcgtca atgaagcttt gaccgatgatgatgtctccc cgggtggaag ctactaccgg caatctgagt tctaccgaca gttcaatggcccagagttca ttgatatcgc tttccgtgaa gctcgagagg cagcccccaa tgcgctgctttactacaacg actacaatat tgagaacgga ctggacaaaa ccgatggttt gattcagctacttgagaggt tgagggataa tgacgtgccc attgatggcg tgggcttcca aatgcatgttttgttggatt ggcccgatat cagcactatt cgacgttcct gggagcgcgc attagcggttgaccccgatg accgtatgct tttaaaaata acggaactcg atgtgcgtat caacaatccctacgacgata atctcgaaag aggcatcgtt cactccagcc ggggtgactg cgatgacatttccggggtct gcgaaggctt tgagcggcaa gccgctcgtt accgggagat tattgaggcctactttgacg tcgtgccacc gcaccgccga ggtggcatca gtgtttgggg tattgccgaccattatagtt ggtattatac ccatgaaggc tatgtcgatt ggcccctttt gtgggacaggaacctacagc caaagcctgc ttacaacgct gtttatgaag ctctgcagca gggccaataa<210> 352<211> 619

60120180240300360420480540600660720780840900960102010801140120012601320138014401500156016201680174018001860<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1) . . . (73)<400> 352

Met His Leu Pro Asn Tyr Arg Ser Leu Ala Thr Ala Leu Ser Arg Tyr1 5 10 15 Ser Cys Ser Ala Leu Leu Ala Val Ser Leu Val Ala Cys Gly Gly Asn 20 25 30 Asn Asp Gln Asp Pro Pro Thr Pro Glu Pro Thr Pro Val Pro Thr Pro 35 40 45 Thr Pro 50 Thr Pro Thr Pro Thr 55 Pro Thr Pro Glu Pro 60 Thr Pro Thr ProThr Pro Glu Pro Thr Pro Thr Pro Glu Pro Thr Pro Thr Pro Thr Pro65 70 75 80Glu Pro Thr Pro Thr Pro Glu Pro Thr Pro Thr Pro Asp Pro Gly Ala 85 90 95 Asp Tyr Gln Pro Pro Ser Asn Asp Ile Ala Val Asn Gly Asp Val Glu 100 105 110 Ser Gly Thr Thr Asn Trp Gly Ala Arg Gly Ser Ala Ser Ile Ser Arg 115 120 125 Val Thr Leu Glu Ser Phe Glu Gly Asp Ala Ser Leu Ser Val Thr Gly 130 135 140 Arg Glu Asp Asp Trp His Gly Ala Thr Phe Ser Val Gly His Leu Thr145 150 155 160Pro Gly Asn Ser Tyr Glu Val Ala Ala Trp Val Lys Leu Ala Ser Gly 165 170 175 Glu Pro Asn Thr Val Val Lys Ile Thr Gly Lys Arg Glu Gly Glu Ser 180 185 190 Ala Thr Tyr Glu Glu Tyr Thr Asp Val Gly Thr Ala Leu Ala Thr Asp 195 200 205 Gly Ser Trp Thr Glu Ile Thr Gly Thr Tyr Ile Pro Asp Ser Ala Ser 210 215 220 Pro Phe Glu Tyr Phe Ile Val Glu Thr Gln Glu Gly Gly Pro Thr Val225 230 235 240Ser Phe Tyr Val Asp Ala Phe Ser Val Ala Gly Glu Val Glu Asp Thr 245 250 255 Pro Ala Pro Thr' 260 Pro Pro Pro Thr Ala 265 Pro Pro Pro Ser Gly 270 Ser GlyLeu Ala Glu Leu Val Asp Phe Pro Val Gly Val Ala Val Ala Val Ala 275 280 285 Ser Phe 290 Ala Asn Asn Asp Phe 295 Leu Ser Asn Thr Gln 300 Gln Gln Asp IleVal Leu Asn Asn Phe Ser Glu Ile Val Ala Glu Asn Gln Met Lys Met305 310 315 320Glu Tyr Phe Asn Asp 325 Asp Tyr Ser Asn Pro 330 Arg Ala Asp Gln Leu 335 ValSer Trp Ala Asn Glu Arg Gly Ile Arg Val His Gly His Ala Leu Val 340 345 350 Trp His Ala 355 Gln Ala Ala Ser Trp 360 Val Ser Pro Pro Val 365 Ser Asn PheArg Glu Arg Tyr Val Asn His Val Arg Gly Val Ala Ser Arg Tyr Ala 370 375 380 Asp Thr Val Val Ser Trp Asp Val Val Asn Glu Ala Leu Thr Asp Asp385 390 395 400Asp Val Ser Pro Gly Gly Ser Tyr Tyr Arg Gln Ser Glu Phe Tyr Arg 405 410 415 Gln Phe Asn Gly 420 Pro Glu Phe Ile Asp 425 Ile Ala Phe Arg Glu 430 Ala ArgGlu Ala Ala 435 Pro Asn Ala Leu Leu 440 Tyr Tyr Asn Asp Tyr 445 Asn Ile GluAsn Gly 450 Leu Asp Lys Thr Asp 455 Gly Leu Ile Gln Leu 460 Leu Glu Arg LeuArg Asp Asn Asp Val Pro Ile Asp Gly Val Gly Phe Gln Met His Val465 470 475

Leu Leu Asp Trp Pro Asp Ile Ser Thr Ile Arg Arg

485 490

Ala Leu Ala Val Asp Pro Asp Asp Arg Met Leu Leu500 505

Leu Asp Val Arg Ile Asn Asn Pro Tyr Asp Asp Asn

515 520

Ile Val His Ser Ser Arg Gly Asp Cys Asp Asp Ile530 535 540

Glu Gly Phe Glu Arg Gln Ala Ala Arg Tyr Arg Glu545 550 555

Tyr Phe Asp Val Val Pro Pro His Arg Arg Gly Gly

565 570

Gly Ile Ala Asp His Tyr Ser Trp Tyr Tyr Thr His580 585

Asp Trp Pro Leu Leu Trp Asp Arg Asn Leu Gln Pro

595 600

Asn Ala Val Tyr Glu Ala Leu Gln Gln Gly Gln610 615

<210> 353<211> 1983<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 353

atggtttgct cggccgccct cggggcgacc gccgtcagtg cccaaacctttcaaccggta ccaacaacgg tttctactac accttttgga aggactcgggatgaccctcg cagcgggtgg tcgttacacc tcccaatgga ccaacaacacgtgggtggta aaggctggaa cccgggcaat agcacccgcg tgatcagctatatggcgtca gcaatagcca aaattcctac ctggccttgt acggctggacctgattgaat actacgtgat cgaaagctac ggctcctaca acccggcatcggtaccaata tgggtagctt ccagagtgat ggcgcgacct acgatgtgcgcgcgtgcaac agccatccat cgatggcacc caaaccttct accaatatttaatccgaaaa aaggcttcgg ccaaatttcc ggcaccatca cctttgctaattttgggcga gcaagggcat gaacctgggt gcccataact atcaagtaatggttatcaaa gtaccggcag ttccgatatc acagtgagtg aaggccccataccagcagca cgcccccggt aacaaccagc agcagtgcca gctcagtggcggtaacaccg gtagtggcgt agtggtgcgc gcgcgcggcg tcgcgggcggaacctgcgta tcggtggcaa taccgtcgcc agctggaacc tcaccaccagctcagctaca gcggcaccgc gtcgggcgat atccaggtgc aatatgacaaagccgcgatg tcgtagtgga ttacatccgc gttaacggcg aaacccgccaatgagctaca acaccgcctt gtacgcgaat ggttcctgcg gtggcggcggctgatgcact gcaatggcgt gatcggtttt ggctacacct atgattgctttgctccggcg gcagcacggg gggtggcaac actggcacca gcagcagcgcggtggtggca acagcaactg ctccggctat gttggtatta ctttcgacgagctaacactc ccaccctggt taacctgttg aagcaaaaca acctgacgccttcaaccagg gcaacaacgt ggttgccaat gccaattaca tggcccagcaggtgaagtac ataaccacag ctacagccat ccgcaaatgg gcagcatgacgtttatgacg agttgaaccg tgccaaccag gctatccaaa ccgcgggtgcaccctgttcc gcccacctta tggcaccgtt aactccacca tccaacaagcttgggtttgc gggtgatcac ctgggatgtg gattcgcaag actggaatggtcggccatcg ccagcgcagc taaccgcctg acaaacggcc aggtaatcctggcagctaca ccaacaccaa tgccgctatt gcccagatcg cctccagcct55 ggcttgtgcc cgggtcgtat cgatccggca accggccgag ccgttgctccaatactggcg gcggtactgt gtcaagcagc actcgcagca gcactccggtagcagccgta gcagcagtag tgttgccgct ggcggcgcct gccaatgcaaacccgttacc cgatctgtac gtccactgcc agtggttggg gttgggagaatgtatcacca ccagcacctg taacagtcag ggccctggcg gtggtggggt60 taa

<210> 354<211> 660<212> PRT<213> Desconhecido

65 <220>

<223> Obtido para uma amostra ambiental.<220>

480Ser Trp Glu Arg 495 Lys Ile Thr Glu 510 Leu Glu Arg Gly525 Ser Gly Val CysIle Ile Glu Ala 560Ile Ser Val Trp 575 Glu Gly Tyr Val 590 Lys Pro Ala Tyr605

gagcaacaaccagcgcgacccaataactggttccggtaacccgcagcccgctgctctggcccgttgccagcagcgtgcgcccacgcagccggcgaccgagcaacggcggcaacgggcggtcgagcatattcttccaggatcgacggcggcggcggaggatcaattccgaacagcggcaacggcgagcgcctggcccaaccggtaacctggattgagcgttctaccaacagacccaagccaggcccaggcccgccactgccgatgcacgacgcgcgccaagtgcgggtggcagtggtaagcttggtggggccaaccgcagcagtgtgtaac

60120180240300360420480540600660720780840900960102010801140120012601320138014401500156016201680174018001860192019801983<221> SIGNAL<222> (1)...(18)<400> 354

Met Val Cys Ser Ala Ala Leu Gly Ala Thr Ala Val Ser Ala Gln Thr

1 5 10 15

Leu Ser Asn Asn Ser Thr Gly Thr Asn Asn Gly Phe Tyr Tyr Thr Phe

20 25 30

Trp Lys Asp Ser Gly Ser Ala Thr Met Thr Leu Ala Ala Gly Gly Arg

35 40 45

Tyr Thr Ser Gln Trp Thr Asn Asn Thr Asn Asn Trp Val Gly Gly Lys

50 55 60

Gly Trp Asn Pro Gly Asn Ser Thr Arg Val Ile Ser Tyr Ser Gly Asn65 70 75 80

Tyr Gly Val Ser Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly Trp

85 90 95

Thr Arg Ser Pro Leu Ile Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser

100 105 HO

Tyr Asn Pro Ala Ser Cys Ser Gly Gly Thr Asn Met Gly Ser Phe Gln

115 120 125

Ser Asp Gly Ala Thr Tyr Asp Val Arg Arg Cys Gln Arg Val Gln Gln

130 135 140

Pro Ser Ile Asp Gly Thr Gln Thr Phe Tyr Gln Tyr Phe Ser Val Arg145 150 155 160

Asn Pro Lys Lys Gly Phe Gly Gln Ile Ser Gly Thr Ile Thr Phe Ala

165 170 175

Asn His Ala Ala Phe Trp Ala Ser Lys Gly Met Asn Leu Gly Ala His

180 185 190

Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser Thr Gly Ser Ser

195 200 205

Asp Ile Thr Val Ser Glu Gly Pro Ile Asn Gly Gly Thr Ser Ser Thr

210 215 220

Pro Pro Val Thr Thr Ser Ser Ser Ala Ser Ser Val Ala Thr Gly Gly225 230 235 240

Gly Asn Thr Gly Ser Gly Val Val Val Arg Ala Arg Gly Val Ala Gly

245 250 255

Gly Glu His Ile Asn Leu Arg Ile Gly Gly Asn Thr Val Ala Ser Trp

260 265 270

Asn Leu Thr Thr Ser Phe Gln Asp Leu Ser Tyr Ser Gly Thr Ala Ser

275 280 285

Gly Asp Ile Gln Val Gln Tyr Asp Asn Asp Gly Gly Ser Arg Asp Val

290 295 300

Val Val Asp Tyr Ile Arg Val Asn Gly Glu Thr Arg Gln Ala Glu Asp305 310 315 320

Met Ser Tyr Asn Thr Ala Leu Tyr Ala Asn Gly Ser Cys Gly Gly Gly

325 330 335

Gly Asn Ser Glu Leu Met His Cys Asn Gly Val Ile Gly Phe Gly Tyr

340 345 350

Thr Tyr Asp Cys Phe Ser Gly Asn Cys Ser Gly Gly Ser Thr Gly Gly

355 360 365

Gly Asn Thr Gly Thr Ser Ser Ser Ala Ala Ser Ala Gly Gly Gly Asn

370 375 380

Ser Asn Cys Ser Gly Tyr Val Gly Ile Thr Phe Asp Asp Gly Pro Thr385 390 395 400

Ala Asn Thr Pro Thr Leu Val Asn Leu Leu Lys Gln Asn Asn Leu Thr

405 410 415

Pro Val Thr Trp Phe Asn Gln Gly Asn Asn Val Val Ala Asn Ala Asn

420 425 430

Tyr Met Ala Gln Gln Leu Ser Val Gly Glu Val His Asn His Ser Tyr

435 440 445

Ser His Pro Gln Met Gly Ser Met Thr Tyr Gln Gln Val Tyr Asp Glu

450 455 460

Leu Asn Arg Ala Asn Gln Ala Ile Gln Thr Ala Gly Ala Pro Lys Pro465 470 475 480

Thr Leu Phe Arg Pro Pro Tyr Gly Thr Val Asn Ser Thr Ile Gln Gln

485 490 495

Ala Ala Gln Ala Leu Gly Leu Arg Val Ile Thr Trp Asp Val Asp Ser500 505 510Gln Asp Trp Asn Gly Ala Thr Ala Ser Ala Ile

515 520

Arg Leu Thr Asn Gly Gln Val Ile Leu Met His530 535

Asn Thr Asn Ala Ala Ile Ala Gln Ile Ala Ser545 550 555

Gly Leu Cys Pro Gly Arg Ile Asp Pro Ala Thr

565 570

Pro Ala Gly Gly Asn Thr Gly Gly Gly Thr Val580 585

Ser Ser Thr Pro Val Val Val Ser Ser Ser Arg

595 600

Ala Ala Gly Gly Ala Cys Gln Cys Asn Trp Trp610 615

Ile Cys Thr Ser Thr Ala Ser Gly Trp Gly Trp625 630 635

Cys Ile Thr Thr Ser Thr Cys Asn Ser Gln Gly645 650

Val Val Cys Asn660<210> 355<211> 1125<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 355

atgaaacgaa ccatcttctt aagactctta gccggcgcccgcggccgggg ggtgccggcc ctctagtccc ccgaaggtcgtccctcaaag aggtctgcgc ttcttatttc gagatcggcgttatcctctc caccccacga tgcccttctg cggaaacattaacgtcatga agcccgcctc catccagcct tcggaggggtgacaagatcg tgaactacgc caaagcccac gggatgaagctggcataatc aggtcccgga ttggttcttc gcgggtaacgcgcttggaga atcatatccg gactatcatt aaaagatatggacgtggtaa atgaggctat agacccgagc caaccggatgtaccagatca ccgggaagga ctacatcaag accgccttccaggaagaatg ggtggaggaa agaaggtcgt cagctctatagatccgacga agagagagta catctggcgc ttgatcgatgcccgtcgacg gagtaggcca ccagacgcat atcaatatcgatcgtggact cgatccgctt cttcggggaa aaaggcctcggatgtgagca tatatacgga tagatccagt tcctacgggagaagtcttca tcaagcaggg taatcgctac aaggaactctaaaaactacc tcagcaacgt caccttctgg ggcatggcggcattggccca tcgaacggcc cgatgctcct cttcctttcgccggcgtatt gggggatcgt ggatgctttg aagctttcgc<210> 356<211> 374<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL

<222> (1)...(21)

<400> 356

Met Lys Arg Thr Ile Phe Leu Arg Leu Leu Ala

1 5 10

Ala Ala Ala Leu Ala Ala Gly Gly Cys Arg Pro

20 25

Val Glu Ile Glu Ala Asn Ile Pro Ser Leu Lys

35 40

Tyr Phe Glu Ile Gly Ala Ala Val Glu Pro Tyr50 55

Pro His Asp Ala Leu Leu Arg Lys His Phe Asn65 70 "75

Asn Val Met Lys Pro Ala Ser Ile Gln Pro Ser

Ala Ser Ala525

Asp Gly Ser540

Ser Leu Arg

Gly Arg Ala

Ser Ser Ser590

Ser Ser Ser605

Gly Thr Arg620

Glu Asn AsnPro Gly Gly

Ala Asn

Tyr Thr

Ala Lys560Val Ala575

Thr Arg

Ser Val

Tyr Pro

Arg Ser640Gly Gly655

tcctctccgcagatcgaggccggccgtcgattaactgcctatttcaactgtccgcttccaacaaaaccctgcgataaggtgcatgaggaggggtggcagatcaacgactaagcttcaaacaatggccgccataaccaggtgttaccaagcttgaagggctacgatcatacatatctatctggtga

cgcggccctccaatatccccgccgtatcagcgtggcggaggaccgaagcataccctcgtcccttttgcagcgactattgggagcaaatggcgacgagctccaacacccatggaagggattcgtaaaccaggaccgagctggatcccgcagaaaaagtgtactggctgaaccaaggccaag

60120180240300360420480540600660720780840900960102010801125

Gly Ala Leu Leu Ser15

Ser Ser Pro Pro Lys30

Glu Val Cys Ala Ser45

Gln Leu Ser Ser Pro60

Cys Leu Val Ala Glu80

Glu Gly Tyr Phe Asn85 90

Trp Thr Glu Ala Asp Lys Ile Val Asn Tyr Ala

100 105

Lys Leu Arg Phe His Thr Leu Val Trp His Asn115 120Phe Phe Ala Gly Asn Asp Lys Thr Leu Leu Leu

130 135

His Ile Arg Thr Ile Ile Lys Arg Tyr Gly Asp145 150 155

Asp Val Val Asn Glu Ala Ile Asp Pro Ser Gln

165 170

Arg Ser Lys Trp Tyr Gln Ile Thr Gly Lys Asp

180 185

Phe Arg Val Ala Asp Asp Glu Leu Arg Lys Asn195 200Gly Arg Gln Leu Tyr Ile Asn Asp Tyr Asn Thr

210 215

Arg Glu Tyr Ile Trp Arg Leu Ile Asp Glu Leu225 230 235

Pro Val Asp Gly Val Gly His Gln Thr His Ile

245 250

Pro Val Asn Gln Ile Val Asp Ser Ile Arg Phe

260 265

Leu Asp Asn Gln Val Thr Glu Leu Asp Val Ser

275 280

Ser Ser Ser Tyr Gly Ser Tyr Gln Ala Ile Pro

290 295

Lys Gln Gly Asn Arg Tyr Lys Glu Leu Phe Glu305 310 315

Lys Asn Tyr Leu Ser Asn Val Thr Phe Trp Gly

325 330

Thr Trp Leu Asn His Trp Pro Ile Glu Arg Pro

340 345

Phe Asp Ile Tyr Leu Lys Ala Lys Pro Ala Tyr

355 360

Ala Leu Lys Leu Ser Arg

370<210> 357<211> 1155<212> DNA

<213> Desconhecido<220>

<223> Gbtido para uma amostra ambiental.<400> 357

atgaataact tcagaaatac atttctaatc gtcgttgtacctgecggcct gcgaagccgg tccgccggaa aatacaagttgcagatgtgt ttctgatcgg caccgcgctc aatctggcaccaaggcgtac gtctggtgga gcggcatttt aatgcgattatggggaccga tacatccggc gccgggcgaa tataatttcggaattcggtg aagcccacga catgttcatg ataggccataacgcccggat gggtattcga ggatgaagcc ggaaatccgcgaacgcatgc gcgatcatat ccataccgtc gtcggacggttgggacgtcg tcaacgaagc gttgaatgaa gacggaaccccgtatcatcg gcgaggatta cctgttgaaa gcgttcgagtgatgccgagc tgtactataa cgattattct ctcgaaaatcgtacgcctgg tccggtacct gcaggagaac ggggcgccgaggacactact ctcttgactg gccatcgctc gacgagatcggccgcgttgg acgtggacgt catggttacc gaacttgaaattcgagtatc agggggccga tattgcgatg cgggcggaactatcccgacg aactgccggc cgaggtcgat gaagcgcttattcgaggtat ttctgcggca cagcgacgtt cttacgcgcggatggagatt cgtggaagaa taactggccg gtaccgggaattcgaccgcg aatggcagcc aaaaccagca ttttattccgatgctgaatg aataa<210> 358<211> 384<212> PRT

Lys Ala His110

Gln Val Pro

125Gln Arg Leu140 .

Lys Val Asp

Pro Asp Gly

Tyr Ile Lys190

Gly Trp Arg

205His Asp Pro220

Gln Thr Glu

Asn Ile Glu

Phe Gly Glu270

Ile Tyr Thr

285Gln Glu Val300

Gly Leu Lys

Met Ala Asp

Asp Ala Pro350

Trp Gly Ile365

95

Gly Met

Asp Trp

Glu Asn

Tyr Trp160Met Arg175

Thr Ala

Lys Glu

Thr Lys

Gly Ile240Trp Pro255

Lys Gly

Asp Arg

Phe Ile

Ser Val320Asp His335

Leu ProVal Asp

tggcggtcgtcgtccctgcaagatcgacggcaccagagaagaccggccgacgcttgtatgtcggccgcgaaccggggtagtgcgggaatctcgcgcatgaccgccaagcgtacacgggataaagaaccattcgacgtccttcgaagagcgcacagcggtataacgttctgggacgaattatgatcgaagt

cgtcggcgtgggaggcatataagggatgaacattacaaaaccggtttgttgcacagccagcgagctcatcaatacacgcacccctggtacagcggacccgggcgggggcgcggtacccagcaccgatttccccttccgcggttgaatccgtcgggacatcgggggtgacctccgctgctgtgcggatgag

601201802403003604204805406006607207808409009601020108011401155<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220><221> SIGNAL

<222> (1)...(25)<400> 358

Met Asn Asn Phe Arg Asn Thr Phe Leu Ile Val Val Val Leu Ala Val1 5 10 15

Val Val Gly Val Leu Pro Ala Cys Glu Ala Gly Pro Pro Glu Asn Thr20 25 30

Ser Ser Ser Leu Gln Glu Ala Tyr Ala Asp Val Phe Leu Ile Gly Thr

35 40 45

Ala Leu Asn Leu Ala Gln Ile Asp Gly Arg Asp Glu Gln Gly Val Arg

50 55 60

Leu Val Glu Arg His Phe Asn Ala Ile Thr Pro Glu Asn Ile Thr Lys65 70 75 80

Trp Gly Pro Ile His Pro Ala Pro Gly Glu Tyr Asn Phe Gly Pro Ala85 90 95

Asp Arg Phe Val Glu Phe Gly Glu Ala His Asp Met Phe Met Ile Gly100 105 HO

His Thr Leu Val Trp His Ser Gln Thr Pro Gly Trp Val Phe Glu Asp

115 120 125

Glu Ala Gly Asn Pro Leu Gly Arg Asp Glu Leu Ile Glu Arg Met Arg130 135 140

Asp His Ile His Thr Val Val Gly Arg Tyr Arg Gly Arg Ile His Ala145 150 155 160

Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly Thr Leu Arg Glu165 170 175

Ser Pro Trp Tyr Arg Ile Ile Gly Glu Asp Tyr Leu Leu Lys Ala Phe180 185 190

Glu Phe Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp

195 200 205

Tyr Ser Leu Glu Asn Pro Ala Lys Arg Ala Gly Ala Val Arg Leu Val

210 215 220

Arg Tyr Leu Gln Glu Asn Gly Ala Pro Ile His Gly Ile Gly Thr Gln225 230 235 240

Gly His Tyr Ser Leu Asp Trp Pro Ser Leu Asp Glu Ile Glu Arg Thr245 250 255

Ile Thr Asp Phe Ala Ala Leu Asp Val Asp Val Met Val Thr Glu Leu260 265 270

Glu Ile Asp Val Leu Pro Ser Ala Phe Glu Tyr Gln Gly Ala Asp Ile

275 280 285

Ala Met Arg Ala Glu Leu Glu Glu Arg Leu Asn Pro Tyr Pro Asp Glu290 295 300

Leu Pro Ala Glu Val Asp Glu Ala Leu Thr Gln Arg Tyr Arg Asp Ile305 310 315 320

Phe Glu Val Phe Leu Arg His Ser Asp Val Leu Thr Arg Val Thr Phe325 330 335

Trp Gly Val Thr Asp Gly Asp Ser Trp Lys Asn Asn Trp Pro Val Pro340 345 350

Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Glu Trp Gln Pro Lys

355 360 365

Pro Ala Phe Tyr Ser Val Ile Glu Val Ala Asp Glu Met Leu Asn Glu370 375 380

<210> 359<211> 2724<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 359

atgacccggt ctgtacgacc aagagcatgg ggggccggcc tactggccct cgcgatggtggcgacagtcg cccccacggc caccggccac agccacgaca cggcagagcc cgtcgtcgtg

60120

gtctacaccg acttcgagaa cgacagcatc gagccgtggg cgcagtccgg cggcccgacg 180

ctgaacatcg tcgaggtcga cggcgggcac gcgctgcgcg tcggcaacca ccagaacacctgggacggca tccagaccca gcccgccacc acgcggatcg agccgggtgt cgagcacacc

240300ctgtcgatgc gcgtccggct cgtgggcgac ggcacggcga cgacgccggcggccgcgacc ccggagccga gaacggctac cagtggatcg gtaacacgacgagagctgga cgaccatccg gggaacgtgg ctccctcggg cggacgcgaactctatgtct accccgaggt cacaccggtg gccggcttcg actacctcctctcatcgagc gtgctgcccc tgtcgacggc ggcgccccgg gcaccgtcgtggattcgaga cggacctgga cggctgggag gcacgcgccg acggcgtcggctcgaccgga ccgacgcgga gtcggccgag ggcgactggt ccgcgatcgtacctcgcacg gccacggcct gcgcctggac gtcacggaca tcatggacgctacgagatca gcgcccaggt gaagttcgcc gggaccggtg gtccgggcaaagccaggagc tggtcgtgga cgggggtagc acctacggca ccgtcctccagtcacctcga cagcctggac gcagatcacc acgaactacg tcacgccgacctgttcctct acttcgagac gaactggccg gacggcatcg aggacgacttgacgtccgca tccgtgtcgc ccctcgggcg atcatccagg aggacctcacgacacgctgg acgtgcccat gggtgtcgcg atcgaccagc gtgagacctcgcggacctcc tgctgctgca cttcgaccag gtcacggccg agaaccacatgcgtggtacg acgcggcggg caacttccgc atccacccgc aggcccgcgcttcgcggcgg agaacgacct gcgcgtcttc ggtcacgtcc tggtgtggcaccggacttct tcttcacgca cgcggacggc accccgctga cctcgagcgagcgatcctgc gcgaccgcat gcgcacgcac atcttcaacg tcgccgaggctggggcgagt acggcggcga caacccgctc gtggcctggg acgtcgtcaatccgacagcg gcgagcacag cgacggcctg cgccgtagcc gctggtacgagaggagttca tcgacctggc gttcatctac gcgaaccagg cgttcaacgggctgacgacg ccaaccaccc ggtcacgctc ttcatcaacg actacaacacggcaagcaga accggtacgc cgcgctcatc gaccgcctca tcgagcgcgagacgccgtgg ggcaccagtt ccacgtcagc ctggccatgc ccatcgcgaagccctcgagc gcttccagga caccgggctg atccagggcg tcaccgagctgtcggcaaca acccgaccga ggcgctgctc gtcgagcagg gctactactattccggctgt tccgtgagtt cacggaggac ctctactcgg tcaccgtgtggacgaccgca gctggcgcag cgctcaggcg ccgctgctgt tcgacgcgggaagccggcct actacggcgc catcgacgcc gacctggacg cacgcgtgcggtgttcgccg aggacatcgc cctcgacgag gccgcgctga cgagccccacctgccgctgc accagatcga cggggccggc gagttccagc tccgctgggcctcacggtgt tcgtccacgt caccgacggt gacgaggtcg agatcgtgctacctacacgg tctcgtcgga cggcgagggc gacctggacg cggtcaccgcaacggctcct ggaccgctgt ggtccgcgtg ccgctcacgg ccgagcagggcagttcgacc tccggatcat cgacggcgcc accacctccg ggtggaacgtctgggcaccc tgaccctggt cgaggagctg tccttcgtcg aggtcgtcgacggccgacca tcgacggcga gatcgacgcc gtgtgggagg acgccaacgtgacgtccgta tcgagggcgc tgctgacggc gcgaaggccg agatccggacaacaacacgc tgttcgtcct cgcggagatc gccgacccgg tgatcgacgtagcccgtggg agcaggactc gctc<210> 360<211> 908<212> PRT<213> Desconhecido<22 0>

<223> Obtido para uma amostra ambiental.<220>

SIGNAL

ccggtggatcgatctcgacccgcctcggagcgatgacctgctacaccgcttgtcggccaggaccgaccgcgggcgtcacgcatctggctgggtccctggcggccgaccagcctcctcgactccgctgatgcggcagcctcgaagccggagcatcatggaccggccagaccggccgaccagcctctccgagcgaggtcgtccgtgctgggctgagttcgcccgagcagtccggtcccgatccctgcgcggccgacgtcaccccgggacgccgggtctcacccctgcaggcctgcggcctacctgggaccgtggccgaccaccggcgacgagggccggggagcgacaccgcccgaaggtgtcggcggccgaccgtcaccacgcctgtgggacgacggcctcc

<221><222><400>

(1) ·360

. (31)

Met Thr Arg Ser Val Arg Pro Arg Ala Trp Gly Ala Gly Leu Leu Ala1 5 10 15 Leu Ala Met Val 20 Ala Thr Val Ala Pro 25 Thr Ala Thr Gly His 30 Ser HisAsp Thr Ala Glu Pro Val Val Val Val Tyr Thr Asp Phe Glu Asn Asp 35 40 45 Ser Ile 50 Glu Pro Trp Ala Gln 55 Ser Gly Gly Pro Thr 60 Leu Asn Ile ValGlu Val Asp Gly Gly His Ala Leu Arg Val Gly Asn His Gln Asn Thr65 70 75 80Trp Asp Gly Ile Gln Thr Gln Pro Ala Thr Thr Arg Ile Glu Pro Gly 85 90 95 Val Glu His Thr 100 Leu Ser Met Arg Val 105 Arg Leu Val Gly Asp 110 Gly ThrAla Thr Thr 115 Pro Ala Arg Trp Ile 120 Gly Arg Asp Pro Gly 125 Ala Glu Asn

360420480540600660720780840900960102010801140120012601320138014401500156016201680174018001860192019802040210021602220228023402400246025202580264027002724Gly Tyr Gln Trp Ile Gly Asn Thr Thr Ile Ser Thr Glu Ser Trp Thr 130 135 140 Thr Ile Arg Gly Thr Trp Leu Pro Arg Ala Asp Ala Asn Ala Ser Glu 145 150 155 160 Leu Tyr Val Tyr Pro Glu Val Thr Pro Val Ala Gly Phe Asp Tyr Leu 165 170 175 Leu Asp Asp Leu Leu Ile Glu Arg Ala Ala Pro Val Asp Gly Gly Ala 180 185 190 Pro Gly Thr Val Val Tyr Thr Ala Gly Phe Glu Thr Asp Leu Asp Gly 195 200 205 Trp Glu Ala Arg Ala Asp Gly Val Gly Val Gly Gln Leu Asp Arg Thr 210 215 220 Asp Ala Glu Ser Ala Glu Gly Asp Trp Ser Ala Ile Val Thr Asp Arg 225 230 235 240 Thr Ser His Gly His Gly Leu Arg Leu Asp Val Thr Asp Ile Met Asp 245 250 255 Ala Gly Val Thr Tyr Glu Ile Ser Ala Gln Val Lys Phe Ala Gly Thr 260 265 270 Gly Gly Pro Gly Asn Ile Trp Leu Ser Gln Glu Leu Val Val Asp Gly 275 280 285 Gly Ser Thr Tyr Gly Thr Val Leu Gln Val Pro Gly Val Thr Ser Thr 290 295 300 Ala Trp Thr Gln Ile Thr Thr Asn Tyr Val Thr Pro Thr Ala Asp Gln 305 310 315 320 Leu Phe Leu Tyr Phe Glu Thr Asn Trp Piro Asp Gly Ile Glu Asp Asp 325 330 335 Phe Leu Leu Asp 340 Asp Val Arg Ile Arg 345 Val Ala Pro Arg Ala 350 Ile Ile Gln Glu Asp Leu Thr Pro Leu Met Asp Thr Leu Asp Val Pro Met Gly 355 360 365 Val Ala 370 Ile Asp Gln Arg Glu 375 Thr Ser Gly Ser Leu 380 Ala Asp Leu Leu Leu Leu His Phe Asp Gln Val Thr Ala Glu Asn His Met Lys Pro Glu 385 390 395 400 Ala Trp Tyr Asp Ala Ala Gly Asn Phe Arg Ile His Pro Gln Ala Arg 405 410 415 Ala Ile Met Asp Phe Ala Ala Glu Asn Asp Leu Arg Val Phe Gly His 420 425 430 Val Leu Val Trp His Gly Gln Thr Pro Asp Phe Phe Phe Thr His Ala 435 440 445 Asp Gly 450 Thr Pro Leu Thr Ser 455 Ser Glu Ala Asp Gln 460 Ala Ile Leu Arg Asp Arg Met Arg Thr His Ile Phe Asn Val Ala Glu Ala Leu Ser Glu 465 470 475 480 Trp Gly Glu Tyr Gly Gly Asp Asn Pro Leu Val Ala Trp Asp Val Val 485 490 495 Asn Glu Val Val Ser Asp Ser Gly Glu His Ser Asp Gly Leu Arg Arg 500 505 510 Ser Arg Trp Tyr Asp Val Leu Gly Glu Glu Phe Ile Asp Leu Ala Phe 515 520 525 Ile Tyr Ala Asn Gln Ala Phe Asn Gly Glu Phe Ala Ala Asp Asp Ala 530 535 540 Asn His Pro Val Thr Leu Phe Ile Asn Asp Tyr Asn Thr Glu Gln Ser 545 550 555 560 Gly Lys Gln Asn Arg 565 Tyr Ala Ala Leu Ile 570 Asp Arg Leu Ile Glu 575 Arg Glu Val Pro Ile Asp Ala Val Gly His Gln Phe His Val Ser Leu Ala 580 585 590 Met Pro Ile Ala Asn Leu Arg Gly Ala Leu Glu Arg Phe Gln Asp Thr 595 600 605 Gly Leu Ile Gln Gly Val Thr Glu Leu Asp Val Thr Val Gly Asn Asn 610 615 620 Pro Thr Glu Ala Leu Leu Val Glu Gln Gly Tyr Tyr Tyr Arg Asp Ala 625 630 635 640 Phe Arg Leu Phe Arg Glu Phe Thr Glu Asp Leu Tyr Ser Val Thr Val 645 650 655 Trp Gly Leu Thr Asp Asp Arg Ser Trp Arg Ser Ala Gln Ala Pro Leu660 665 670 Leu Phe Asp Ala Gly Leu Gln Ala Lys Pro Ala Tyr Tyr Gly Ala Ile 675 680 685 Asp Ala 690 Asp Leu Asp Ala Arg 695 Val Arg Ala Ala Tyr 700 Val Phe Ala GluAsp Ile Ala Leu Asp Glu Ala Ala Leu Thr Ser Pro Thr Trp Asp Arg705 710 715 720Leu Pro Leu His Gln Ile Asp Gly Ala Gly Glu Phe Gln Leu Arg Trp 725 730 735 Ala Ala Asp His 740 Leu Thr Val Phe Val 745 His Val Thr Asp Gly 750 Asp GluVal Glu Ile 755 Val Leu Gly Asp Glu 760 Thr Tyr Thr Val Ser 765 Ser Asp GlyGlu Gly Asp Leu Asp Ala Val Thr Ala Ala Gly Glu Asn Gly Ser Trp 770 775 780 Thr Ala Val Val Arg Val Pro Leu Thr Ala Glu Gln Gly Asp Thr Ala785 790 795 800Gln Phe Asp Leu Arg Ile Ile Asp Gly Ala Thr Thr Ser Gly Trp Asn 805 810 815 Val Glu Gly Val 820 Leu Gly Thr Leu Thr 825 Leu Val Glu Glu Leu 830 Ser PheVal Glu Val 835 Val Glu Ala Ala Asp 840 Arg Pro Thr Ile Asp 845 Gly Glu IleAsp Ala 850 Val Trp Glu Asp Ala 855 Asn Val Val Thr Thr 860 Asp Val Arg IleGlu Gly Ala Ala Asp Gly Ala Lys Ala Glu Ile Arg Thr Leu Trp Asp865 870 875 880Asn Asn Thr Leu Phe 885 Val Leu Ala Glu Ile 890 Ala Asp Pro Val Ile 895 AspVal Thr Ala Ser 900 Ser Pro Trp Glu Gln 905 Asp Ser Leu <210> 361 <211> 5040

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 361

atggcaagaa gtaagcgagt attagcatgg attatgtcta gtgtgcttct gatatccatggcgatgccat ccttcgcatc aggtgattca agccaagtgc caagggttat atttgaaacaggttttgaaa cgggattaga tggcttcaaa ggacggggta gtgccacctt aactcgaacgactgatgaaa cgcaagcagg cgactattcg gttcttgtga gcaatcggct tgagcactggaatggggcat cattgccact tacaggcttc gttctaccag gtaatacata tgaatttgttggttacataa aagcaaaagc agatgtagca gacaattatg tcatgagtgg tgagtacaatgaggggattt ctggaaatca atatccatgg atatctaatc gtttgttaac ggttcaagatggctttgttg agtttagagg tgaactaacc atactagagg atatgacgtc ctttaatctaaactttgaac atcaaaatgc tgaagtggaa ttttatttag attctgttca ggttattctaatcgaagaag gtcaagtcaa tgacttacca atgaatgtaa gaagagcgcc acttacacttgctgaaactc ccttacatga gatttgggca gatcacttta ctattggcaa tatttatacgccaggttttc gcacagatat acgtggtgag gtattagccc atcattttaa tgtgatcacagctgaaaata ttatgaagcc agatcatttg caaagggaac aaggtatttt tacttttagtgcttccaacg atatgatgga atttgccaga gcaaataatc aagaagtcat tggacatactttggtgtggc attctcaatc cttcccatgg tttgaagctt taaatccaac acgtgatgaagctatagcca ttatgcatgc ccatattgaa actgttatgg gacattttaa tgaaaactacccaggtgtca ttacaggatg ggatgttttg aatgaagcca ttcaaccaag acagggtcaagatcctgaaa attggcgctt gcatttaagg gataccaaat ggttacgtgc cattggtgatgattatattg ccatcgcttt taacaaagcc catgaaatgg atccagatgc tattctttattataatgatt ataatgataa tgactatttt aaagcaacca ttataaaagc catggtgcaggagttgcgta atgaaggcgt gcccattcat cgtattggga tgcaaggtca ttataatttacagacaccat taaactctat tagaaccagc gttgagcgtt ttagtgaaat tactggtcatgaagatctac cacctattgg cattagtttc acagaaattg atgtaacggt accagggtttgaaagtgcag cccgtttacc tgaagaggta gaaattcgcc aagctcagtt ttatgctcaattaatgcaga ttttaagaga caacagcgat gtgattcatc gtgttacttt ctggggtatgtctgatcgtg aatcatggcg tgcagatcgt catcctaaca tgttagatcc tcagtatggtccaaagcatg tctttcatgc tatagccaat ccagaggctt tccttacggc ctacccattaccagagacgc cagatgctca aacagcctat gcatctcaag gtcaaccagt tgtggggcagtttaatttgg atgcgtatca aaattcagaa gtaataccag tggctaatca aatgacagcccataatggcg caacagcggt tgcaagggtg gtttggcacg aagatgctat ttatatttta 1800

gccaatgtca gcgatgccac accgaatgta gcagcttcgg ctgcccatga gcaagactca 1860

cttgaggtat ttatttcaaa tacggattca agaatttcta attatatgcc aggtgactat 1920

caactgagat ttaatcgtgc cggcgtgcat acatatggtt cgactggttc gattgaaggt 1980

atgacctttg cggtacaaga tggtccaata ggttatcaag ttgaagtgcg tattccctta 2040

gaaaatgaag tctatgttgg cagaagactt ggttttgact tacaagtcaa tgatgcatgg 2100

gaagttggcg gtacttctgg ccgacaagca tttgctaaat ggaàtgatca cactgacaat 2160

ggctggcagt ctacagagtt ttggggctgg ttattattac aaggcgatgc ggcacctgtc 2220

ttacccgttg tattagtgga agaaggcttt gaaacggatt taggttcatt ccaaccaagg 2280

ggtagtagta cactgactcg aacccaagag gttagtcatg aaggcgacta ttccgtattg 2340

gttagcaacc gtgtcaacaa ctggaacggt gcgtcattac cgttaacagg cattgttcaa 2400

ccaggcaaca cttatgagtt tgttggttac attagagcaa aagcagatgt aactggatca 2460

tatatcatga gtggtgagtt taataatgga tctggtgtat tagaaaacgg tagtattaat 2520

cgatggccat ggctatcaaa ccgttcatta acgatagcag atggttttgt tgagtttaag 2580

tcagaactaa ccatacctag tgacatgacg acgtttaact tgaactttga acaccaaaat 2640

gctgaagtag aattttactt agatgctgtt caagtcactt tgattgcaga agctgatgta 2700

acaccagtgg acccaccagt agacccacca gtagagccag aaattacagt ggtctattca 2760

atggtagatg atgcagccat tcaagggatt gaagtgggaa caacaggcac tgctgaagat 2820

ttttcggata ttagtgaagc tttattagta tctggttcac cagttgttac tgctgtagca 2880

catccagaag aagcaggaaa gatcggtata gagcttagta atcgagcaga gaattggcat 2940

gcgctagact ttatgttccc agccataggt gtgcagcggg gtgggagcta tcgatttgtg 3000

gccagtggcc gtatggcaga aggaacaggt aattcaaatc gtagaatgca gtggaatcaa 3060

acggatgcgc catggagtga aatatcaggt tctagaacca atgtggcacc tgcagcaacc 3120

acatggacca ttgacgtgac tttaagtcga ttacagatca acacattatt aaacgctggt 3180

caaagaggtc ttcgaattca aacgggtaat gcaccaactg tgaccattac cattgacgat 3240

gtgtttgttt atcagattgg tgacattgac acagcaggtt taccattacc accacaatgg 3300

aattttgatt tgccaagatt atcagaatta ttcgagccat attttggtct tggtaacatt 3360

tattcaaccg aaacattaat gaacgctaat gaaacaaaaa gagcattttt acatcacttt 3420

aacgtgatta cagcagaaaa tggtcataaa ccatccagta ttgcagggcc agaaaatagc 3480

tttacagtac cagaacctga gcaattcaac tttacggatg cagaccgaat tgtaaacttt 3540

gctgttgaaa atgacattga attagtagga catgcacttg tatggcattc acaaagtcca 3600

aactggctgt ttagaagtgc ggctaacaca ccgctaacaa gagcagaagc caaagagcgc 3660

atggcatatt acatgaaaac tgtttcagag catttcgaag cacaaggtac attaggcgca 3720

ttttatggtt gggatgttgt gaatgaagcc atcgccagtg gtggtggtac attcgtagat 3780

caaccaggtc attggcgcac gcaaatgcga acatcatcac catggttcca agcatttaac 3840

aatggattag atgtagaagc cggtgaacat gccagtgatt atattttcta tgcatactat 3900

tatgcaagaa agtatttccc aacatcgatc ctatactaca acgattacaa cgatgaaata 3960

ccaaacaagc gagacaatat cgctcaaatg gtagaagaga taaatgcact ttgggaagca 4020

catgaagaat atgatggtcg cttactgatt gaatccatcg gtatgcaaag tcattatcac 4080

atggaaggtt ggacaaccag cgtagacaat gtaagagctg ctttagatcg atacattgca 4140

acaggtgcaa gagtcagtgt gactgagtta gatatcactt atggtggtca tggtagtaat 4200

gcatatgcat cacttacacc agaacaatta gcggcacaag cggagcgata tgcagagata 4260

tttacattgt atttagagcg tgcagatcag ttaagccgtg tatccatctg gggtatgtct 4320

gatgctaaca gctggagaag ttctggattc ccattactat ttgacagttc acttaatgct 4380

aaaccagcat ttaatgccat tgtagaatta gttaaaaact gggagacacc aacagttgta 4440

gcaccagtga ttcaaacaag aacactagca ccattagaaa gtggtgaaag agtctttacc 4500

atgttagatg tggtaagagg atctaatgca cctgtatggt ttagcataac agacggtgca 4560

ttaccagaag gtataatcct tcattctaga acaggtattt tagaaggaac accagttgaa 4620

gatggtcact atagctttac tgtaactgct agaaattacg gcggttcaac aagtcaagcg 4680

ctgactttaa cagtaggtca tccagtagca ccaccagtaa cgccaccagt aacgccacca 4740

accgtaatca ttgatgaatc ggatatacca caggctggtc caggccttag ggcaccacag 4800

attgttgtaa ccgttcaaga aggcagtgaa gtaacgtttg atcttgaaaa attagaagaa 4860

gttatggcat cactttcaag tcaagtgcca ttggtgttag atgttgaatt ggaagattct 4920

atcatcacct tggatcaaac attacttaaa cgattaacag acaaggcggc tggaatcgaa 4980

atacaagcag atggatttag ttatatgctt ccagcagagg tattagaggc aattctttgg 5040<210> 362<211> 1680<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1) . . . (26)<400> 362

Met Ala Arg Ser Lys Arg Val Leu Ala Trp Ile Met Ser Ser Val LeuLeu Ile Ser Met Ala Met Pro Ser Phe Ala Ser Gly Asp Ser Ser Gln 20 25 30 Val Pro Arg Val Ile Phe Glu Thr Gly Phe Glu Thr Gly Leu Asp Gly 35 40 45 Phe Lys Gly Arg Gly Ser Ala Thr Leu Thr Arg Thr Thr Asp Glu Thr 50 55 60 Gln Ala Gly Asp Tyr Ser Val Leu Val Ser Asn Arg Leu Glu His Trp65 70 75 80Asn Gly Ala Ser Leu Pro Leu Thr Gly Phe Val Leu Pro Gly Asn Thr 85 90 95 Tyr Glu Phe Val Gly Tyr Ile Lys Ala Lys Ala Asp Val Ala Asp Asn 100 105 110 Tyr Val Met Ser Gly Glu Tyr Asn Glu Gly Ile Ser Gly Asn Gln Tyr 115 120 125 Pro Trp Ile Ser Asn Arg Leu Leu Thr Val Gln Asp Gly Phe Val Glu 130 135 140 Phe Arg Gly Glu Leu Thr Ile Leu Glu Asp Met Thr Ser Phe Asn Leu145 150 155 160Asn Phe Glu His Glri Asn Ala Glu Val Glu Phe Tyr Leu Asp Ser Val 165 170 175 Gln Val Ile Leu Ile Glu Glu Gly Gln Val Asn Asp Leu Pro Met Asn 180 185 190 Val Arg Arg Ala Pro Leu Thr Leu Ala Glu Thr Pro Leu His Glu Ile 195 200 205 Trp Ala Asp His Phe Thr Ile Gly Asn Ile Tyr Thr Pro Gly Phe Arg 210 215 220 Thr Asp Ile Arg Gly Glu Val Leu Ala His His Phe Asn Val Ile Thr225 230 235 240Ala Glu Asn Ile Met Lys Pro Asp His Leu Gln Arg Glu Gln Gly Ile 245 250 255 Phe Thr Phe Ser Ala Ser Asn Asp Met Met Glu Phe Ala Arg Ala Asn 260 265 270 Asn Gln Glu Val Ile Gly His Thr Leu Val Trp His Ser Gln Ser Phe 275 280 285 Pro Trp Phe Glu Ala Leu Asn Pro Thr Arg Asp Glu Ala Ile Ala Ile 290 295 300 Met His Ala His Ile Glu Thr Val Met Gly His Phe Asn Glu Asn Tyr305 310 315 320Pro Gly Val Ile Thr Gly Trp Asp Val Leu Asn Glu Ala Ile Gln Pro 325 330 335 Arg Gln Gly Gln Asp Pro Glu Asn Trp Arg Leu His Leu Arg Asp Thr 340 345 350 Lys Trp Leu Arg Ala Ile Gly Asp Asp Tyr Ile Ala Ile Ala Phe Asn 355 360 365 Lys Ala His Glu Met Asp Pro Asp Ala Ile Leu Tyr Tyr Asn Asp Tyr 370 375 380 Asn Asp Asn Asp Tyr Phe Lys Ala Thr Ile Ile Lys Ala Met Val Gln385 390 395 400Glu Leu Arg Asn Glu Gly Val Pro Ile His Arg Ile Gly Met Gln Gly 405 410 415 His Tyr Asn Leu Gln Thr Pro Leu Asn Ser Ile Arg Thr Ser Val Glu 420 425 430 Arg Phe Ser Glu Ile Thr Gly His Glu Asp Leu Pro Pro Ile Gly Ile 435 440 445 Ser Phe Thr Glu Ile Asp Val Thr Val Pro Gly Phe Glu Ser Ala Ala 450 455 460 Arg Leu Pro Glu Glu Val Glu Ile Arg Gln Ala Gln Phe Tyr Ala Gln465 470 475 480Leu Met Gln Ile Leu Arg Asp Asn Ser Asp Val Ile His Arg Val Thr 485 490 495 Phe Trp Gly Met Ser Asp Arg Glu Ser Trp Arg Ala Asp Arg His Pro 500 505 510 Asn Met Leu Asp Pro Gln Tyr Gly Pro Lys His Val Phe His Ala Ile 515 520 525 Ala Asn Pro Glu Ala Phe Leu Thr Ala Tyr Pro Leu Pro Glu Thr Pro 530 535 540 Asp Ala Gln Thr Ala Tyr Ala Ser Gln Gly Gln Pro Val Val Gly Gln545 550 555 560 Phe Asn Leu Asp Ala Tyr Gln Asn Ser Glu Val Ile Pro Val Ala Asn 565 570 575 Gln Met Thr Ala His Asn Gly Ala Thr Ala Val Ala Arg Val Val Trp 580 585 590 His Glu Asp 595 Ala Ile Tyr- Ile Leu 600 Ala Asn Val Ser Asp 605 Ala Thr Pro Asn Val 610 Ala Ala Ser Ala Ala 615 His Glu Gln Asp Ser 620 Leu Glu Val Phe Ile Ser Asn Thr Asp Ser Arg Ile Ser Asn Tyr Met Pro Gly Asp Tyr 625 630 635 640 Gln Leu Arg Phe Asn Arg Ala Gly Val His Thr Tyr Gly Ser Thr Gly 645 650 655 Ser Ile Glu Gly Met Thr Phe Ala Val Gln Asp Gly Pro Ile Gly Tyr 660 665 670 Gln Val Glu 675 Val Arg Ile Pro Leu 680 Glu Asn Glu Val Tyr 685 Val Gly Arg Arg Leu Gly Phe Asp Leu Gln Val Asn Asp Ala Trp Glu Val Gly Gly 690 695 700 Thr Ser Gly Arg Gln Ala Phe Ala Lys Trp Asn Asp His Thr Asp Asn 705 710 715 720 Gly Trp Gln Ser Thr Glu Phe Trp Gly Trp Leu Leu Leu Gln Gly Asp 725 730 735 Ala Ala Pro Val Leu Pro Val Val Leu Val Glu Glu Gly Phe Glu Thr 740 745 750 Asp Leu Gly Ser Phe Gln Pro Arg Gly Ser Ser Thr Leu Thr Arg Thr 755 760 765 Gln Glu Val Ser His Glu Gly Asp Tyr Ser Val Leu Val Ser Asn Arg 770 775 780 Val Asn Asn Trp Asn Gly Ala Ser Leu Pro Leu Thr Gly Ile Val Gln 785 790 795 800 Pro Gly Asn Thr Tyr Glu Phe Val Gly Tyr Ile Arg Ala Lys Ala Asp 805 810 815 Val Thr Gly Ser Tyr Ile Met Ser Gly Glu Phe Asn Asn Gly Ser Gly 820 825 830 Val Leu Glu 835 Asn Gly Ser Ile Asn 840 Arg Trp Pro Trp Leu 845 Ser Asn Arg Ser Leu 850 Thr Ile Ala Asp Gly 855 Phe Val Glu Phe Lys 860 Ser Glu Leu Thr Ile Pro Ser Asp Met Thr Thr Phe Asn Leu Asn Phe Glu His Gln Asn 865 870 875 880 Ala Glu Val Glu Phe 885 Tyr Leu Asp Ala Val 890 Gln Val Thr Leu Ile 895 Ala Glu Ala Asp Val Thr Pro Val Asp Pro Pro Val Asp Pro Pro Val Glu 900 905 910 Pro Glu Ile 915 Thr Val Val Tyr Ser 920 Met Val Asp Asp Ala 925 Ala Ile Gln Gly Ile Glu Val Gly Thr Thr Gly Thr Ala Glu Asp Phe Ser Asp Ile 930 935 940 Ser 945 Glu Ala Leu Leu Val 950 Ser Gly Ser Pro Val 955 Val Thr Ala Val Ala 960 His Pro Glu Glu Ala Gly Lys Ile Gly Ile Glu Leu Ser Asn Arg Ala 965 970 975 Glu Asn Trp His Ala Leu Asp Phe Met Phe Pro Ala Ile Gly Val Gln 980 985 990 Arg Gly Gly Ser Tyr Arg Phe Val Ala Ser Gly Arg Met Ala Glu Gly 995 1000 1005 Thr Gly Asn Ser Asn Arg Arg Met Gln Trp Asn Gln Thr Asp Ala Pro 1010 1015 1020 Trp Ser Glu Ile Ser Gly Ser Arg Thr Asn Val Ala Pro Ala Ala Thr 1025 1030 1035 1040 Thr Trp Thr Ile Asp Val Thr Leu Ser Arg Leu Gln Ile Asn Thr Leu 1045 1050 1055 Leu Asn Ala Gly Gln Arg Gly Leu Arg Ile Gln Thr Gly Asn Ala Pro 1060 1065 1070 Thr Val Thr Ile Thr Ile Asp Asp Val Phe Val Tyr Gln Ile Gly Asp

1075 1080 1085Ile Asp Thr Ala Gly Leu Pro Leu Pro Pro Gln Trp Asn Phe Asp Leu

1090 1095 HOO

Pro Arg Leu Ser Glu Leu Phe Glu Pro Tyr Phe Gly Leu Gly Asn Ile1105 1110 1H5 1120

Tyr Ser Thr Glu Thr Leu Met Asn Ala Asn Glu Thr Lys Arg Ala Phe

1125 1130 1135

Leu His His Phe Asn Val Ile Thr Ala Glu Asn Gly His Lys Pro Ser

1140 1145 1150

Ser Ile Ala Gly Pro Glu Asn Ser Phe Thr Val Pro Glu Pro Glu Gln

1155 1160 1165

Phe Asn Phe Thr Asp Ala Asp Arg Ile Val Asn Phe Ala Val Glu Asn

1170 1175 1180

Asp Ile Glu Leu Val Gly His Ala Leu Val Trp His Ser Gln Ser Pro1185 1190 U95 1200

Asn Trp Leu Phe Arg Ser Ala Ala Asn Thr Pro Leu Thr Arg Ala Glu

1205 1210 1215

Ala Lys Glu Arg Met Ala Tyr Tyr Met Lys Thr Val Ser Glu His Phe

1220 1225 1230

Glu Ala Gln Gly Thr Leu Gly Ala Phe Tyr Gly Trp Asp Val Val Asn

1235 1240 1245

Glu Ala Ile Ala Ser Gly Gly Gly Thr Phe Val Asp Gln Pro Gly His

1250 1255 1260

Trp Arg Thr Gln Met Arg Thr Ser Ser Pro Trp Phe Gln Ala Phe Asn1265 1270 1275 1280

Asn Gly Leu Asp Val Glu Ala Gly Glu His Ala Ser Asp Tyr Ile Phe

1285 1290 1295

Tyr Ala Tyr Tyr Tyr Ala Arg Lys Tyr Phe Pro Thr Ser Ile Leu Tyr

1300 1305 1310

Tyr Asn Asp Tyr Asn Asp Glu Ile Pro Asn Lys Arg Asp Asn Ile Ala

1315 1320 1325

Gln Met Val Glu Glu Ile Asn Ala Leu Trp Glu Ala His Glu Glu Tyr

1330 1335 1340

Asp Gly Arg Leu Leu Ile Glu Ser Ile Gly Met Gln Ser His Tyr His1345 1350 1355 1360

Met Glu Gly Trp Thr Thr Ser Val Asp Asn Val Arg Ala Ala Leu Asp

1365 1370 1375

Arg Tyr Ile Ala Thr Gly Ala Arg Val Ser Val Thr Glu Leu Asp Ile

1380 1385 1390

Thr Tyr Gly Gly His Gly Ser Asn Ala Tyr Ala Ser Leu Thr Pro Glu

1395 1400 1405

Gln Leu Ala Ala Gln Ala Glu Arg Tyr Ala Glu Ile Phe Thr Leu Tyr

1410 1415 1420

Leu Glu Arg Ala Asp Gln Leu Ser Arg Val Ser Ile Trp Gly Met Ser1425 1430 1435 1440

Asp Ala Asn Ser Trp Arg Ser Ser Gly Phe Pro Leu Leu Phe Asp Ser

1445 1450 1455

Ser Leu Asn Ala Lys Pro Ala Phe Asn Ala Ile Val Glu Leu Val Lys

1460 1465 1470

Asn Trp Glu Thr Pro Thr Val Val Ala Pro Val Ile Gln Thr Arg Thr

1475 1480 1485

Leu Ala Pro Leu Glu Ser Gly Glu Arg Val Phe Thr Met Leu Asp Val

1490 1495 1500

Val Arg Gly Ser Asn Ala Pro Val Trp Phe Ser Ile Thr Asp Gly Ala1505 1510 1515 1520

Leu Pro Glu Gly Ile Ile Leu His Ser Arg Thr Gly Ile Leu Glu Gly

1525 1530 1535

Thr Pro Val Glu Asp Gly His Tyr Ser Phe Thr Val Thr Ala Arg Asn

1540 1545 1550

Tyr Gly Gly Ser Thr Ser Gln Ala Leu Thr Leu Thr Val Gly His Pro

1555 1560 1565

Val Ala Pro Pro Val Thr Pro Pro Val Thr Pro Pro Thr Val Ile Ile

1570 1575 1580

Asp Glu Ser Asp Ile Pro Gln Ala Gly Pro Gly Leu Arg Ala Pro Gln1585 1590 1595 1600

Ile Val Val Thr Val Gln Glu Gly Ser Glu Val Thr Phe Asp Leu Glu

1605 1610 1615

Lys Leu Glu Glu Val Met Ala Ser Leu Ser Ser Gln Val Pro Leu Val1620 1625 1630

Leu Asp Val Glu Leu Glu Asp Ser Ile Ile Thr Leu Asp Gln Thr Leu

1635 1640 1645

Leu Lys Arg Leu Thr Asp Lys Ala Ala Gly Ile Glu Ile Gln Ala Asp

1650 1655 1660

Gly Phe Ser Tyr Met Leu Pro Ala Glu Val Leu Glu Ala Ile Leu Trp

1665

<210> 363<211><212>

1670

1675

1680

1317<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 363

gtgaccaccc gcgcacaggt tcttgatcag gcgctggcac tgggccaccg gtgtggctgg

gaaaaactca gcctggacgc catcgccagg gcgctgggcc gttttggcag cctggctctg

tgtgtcgcgc tgttgagcgc ctgcggcagt agtagtagct ccctggatga tccgggtgct

ggcagcagtt cttccagctc tgagagcagc caaagctcca gcgccagttc ccaggctgat

ggcgacggta cccaggacag cctctacgcc caggcggact tccctgtagg ggttgcggtg

caggtggcca attgggagcc tttcagcctg tttaccgcgc ccgatgccgc tgcgcgtcag

aacctggttg cccgacactt ctccgaagtg accgcgacca acgtcatgaa aatgtcctat

atgcgcacca acagtggtgg ttttaccgac gcgccggcgc gtccgctgat tgattttgcc

cgcgccaatg gcatcaaagt gcacggtcac gcactggtct ggcatgcgga ttatcaggtg

ccaaatgtgt ttcgtgacta cgaaggggac aattggcagg ggcttttaac cgagcatgtc

gagggcgtta tggggctgtt tgacgacacc gtggtaagtt gggatgtcgt aaacgaagcg

gttgataccg gctcacctga cggctggcgc cggtcgattt tctataattt tgcgccgccg

gaagcagggc aggtgccgga atatattgaa gtggcttacc aggccgctcg agaggccaat

ccggaagtga ccctctacta caacgatttt gacaacacgg ccaataccgg gcgcctcaacaagaccctgg aaattgccga tcgcctgaaa gagctggacg cgatcgacgg tatcgggttc

cagatgcacg cctatatgaa ctacccgagt attgcgcagt ttcgcaatgc ctttcaggaa

gtggtcgatc gtgacctgaa agtcaaagtc accgagctgg acattgccat cgtcaacccttacggcagct cgacgcctcc gccgctgccg gagtttgatc aggcgctggc cgacgcccaa

ggtgtccgtt actgccagat tgccgaggcc tatctggatg tcgttcctgc cgagctgcggggtggtttca ccgtctgggg cctgaccgat gaçgacagct ggctgatggg agcgttcgcgtccgcaaccg gcgcccaata cgaccaggtc tatccggtgt tgtttgacga taatctgcaagccaagcccg cgttctttgg cgtcaagcgc gccctccgcg gcgaaccctg cgagtaa<210> 364<211> 438<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 364

Met Thr Thr Arg Ala Gln Val Leu Asp Gln Ala Leu Ala Leu Gly His

5 10 15

Arg Cys Gly Trp Glu Lys Leu Ser Leu Asp Ala Ile Ala Arg Ala Leu

20 25 30

Gly Arg Phe Gly Ser Leu Ala Leu Cys Val Ala Leu Leu Ser Ala Cys35 40 45

Gly Ser Ser Ser Ser Ser Leu Asp Asp Pro Gly Ala Gly Ser Ser Ser50 55 60

Ser Ser Ser Glu Ser Ser Gln Ser Ser Ser Ala Ser Ser Gln Ala Asp65 70 75 80

Gly Asp Gly Thr Gln Asp Ser Leu Tyr Ala Gln Ala Asp Phe Pro Val

85 90 95

Gly Val Ala Val Gln Val Ala Asn Trp Glu Pro Phe Ser Leu Phe Thr

100 105 HO

Ala Pro Asp Ala Ala Ala Arg Gln Asn Leu Val Ala Arg His Phe Ser115 120 125

Glu Val Thr Ala Thr Asn Val Met Lys Met Ser Tyr Met Arg Thr Asn130 135 140

Ser Gly Gly Phe Thr Asp Ala Pro Ala Arg Pro Leu Ile Asp Phe Ala145 150 155 160

Arg Ala Asn Gly Ile Lys Val His Gly His Ala Leu Val Trp His Ala165 170 175

Asp Tyr Gln Val Pro Asn Val Phe Arg Asp Tyr Glu Gly Asp Asn Trp180 185 190

60120180240300360420480540600660720780840900960102010801140120012601317Gln Gly Leu Leu Thr Glu His Val Glu Gly Val Met Gly Leu Phe Asp

195 200 205

Asp Thr Val Val Ser Trp Asp Val Val Asn Glu Ala Val Asp Thr Gly

210 215 220

Ser Pro Asp Gly Trp Arg Arg Ser Ile Phe Tyr Asn Phe Ala Pro Pro225 230 235 240

Glu Ala Gly Gln Val Pro Glu Tyr Ile Glu Val Ala Tyr Gln Ala Ala

245 250 255

Arg Glu Ala Asn Pro Glu Val Thr Leu Tyr Tyr Asn Asp Phe Asp Asn

260 265 270

Thr Ala Asn Thr Gly Arg Leu Asn Lys Thr Leu Glu Ile Ala Asp Arg

275 280 285

Leu Lys Glu Leu Asp Ala Ile Asp Gly Ile Gly Phe Gln Met His Ala

290 295 300

Tyr Met Asn Tyr Pro Ser Ile Ala Gln Phe Arg Asn Ala Phe Gln Glu305 310 315 320

Val Val Asp Arg Asp Leu Lys Val Lys Val Thr Glu Leu Asp Ile Ala

325 330 335

Ile Val Asn Pro Tyr Gly Ser Ser Thr Pro Pro Pro Leu Pro Glu Phe

340 345 350

Asp Gln Ala Leu Ala Asp Ala Gln Gly Val Arg Tyr Cys Gln Ile Ala

355 360 365

Glu Ala Tyr Leu Asp Val Val Pro Ala Glu Leu Arg Gly Gly Phe Thr

370 375 380

Val Trp Gly Leu Thr Asp Asp Asp Ser Trp Leu Met Gly Ala Phe Ala385 390 395 400

Ser Ala Thr Gly Ala Gln Tyr Asp Gln Val Tyr Pro Val Leu Phe Asp

405 410 415

Asp Asn Leu Gln Ala Lys Pro Ala Phe Phe Gly Val Lys Arg Ala Leu

420 425 430

Arg Gly Glu Pro Cys Glu

435<210> 365<211> 3246<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 365

atgaaccact tcgcttcaaa atcgctgcgc atggcgtggc aacccggact gcttgcgacaaccgtgctgc cgttggcggc tgccgcccca ataccagcgc cgaatacgga taccaaagtgagcaatactt cgtccatcac cactccggct gcggctccac agtcgcagcc acaaccaacgcaagacgcaa acgctcccgc accgcttaaa gcggctttcc gggataagtt tctcatcggcgcggtgctga gtgacgctgc gctgcgaggc agtgcgcccg acaaggtggc gatagccaccacgcacttta acgcgctcac cgccgaaaac gccatgaagc cagacgcgat gcaaccgcgcgaagggcagt tcaacttcgc tgcaggcgat cggctcgtcg aactcgccga aaaaagcggcggtgtgccca tcggccacac gctggtgtgg cacgcgcaaa caccgaagtg gttttttgaagggccggatg gacagcccgc gacgcgcgaa ctggctttgg agcgcatgcg caaacacatttccactgtgg tggggcgcta caaagggcgc atcaaggagt gggatgtggt gaacgaagccatcaacgacg gacccggtgt gctgcgtccc tctccctggc tcaaagccat cggcgaagattacatcgccg aagccttccg cgccgcgcac gccgccgacc ccgacgcgat tttgatttataacgattaca acatcgaact gggctacaaa cggcccaaag cgctgcaact cctaaaatcgctcattgacc agaaagtgcc gattcacgcc gtgggcattc agggtcactg gcgcatggacaacccgaact tcgccgaagt ggaacaggcc atcaaagagt tttcggcgct ggggttgaaagtcatgatca ccgaactcga catcggcgtg ctgccgacgc gttatcaggg cgcggatatttcagcgaccg aaaccatgac gcccgaacag cgcgccgtga tgaaccccta tacggacggattgccggacg atgtggcgca aaagcacgcc gagcgctatc gccaggcgtt tgagatgttcctgcggcaca aagacaaaat cagtcgtgtg acattttggg gtgtggacga cggcacttcgtggctgaacg gtttcccggt gcgcggccgc accgattatc cgctgctatt tgatcgtcagggcaagccaa aacccgcctt tttcgcggtg caaaacgcgg cgatgggcgc aacagcgcaaccgagcgcca gcgctcccgc aacgcatggc gccgctcctg catccaccaa cattcgcggcgccgagtttc ctcgcgtgga aagcgacggg cgggtgacgt ttcgcatcaa agcgcctgacgcgcaaaaag tgcaatttga tttaggtaag ccttacgacg ccacccgcga cgccgagggcaactggacgg cgaccacaga gccacaagtg cccggcttcc attattattt tttgattgtcgatggagtgc gcgtggccga cccggcgagc gaaacctttt acggtgcggg ccgccagatgagcggcatcg aaattcccga tcccgacagc gcgttttatt cgccgcaaaa cgtgccgcatggcgaagtgc gcgaacgctg gtatttttcc aacaccacgc aggcgtggcg gcgcatcttc

60120180240300360420480540600660720780840900960102010801140120012601320138014401500156016201680atttatacgc cgccgggtta cgacaccgat caggccatgc gttttcctgt gctgtatttgcagcacggcg gtggcgaaga cgaacgcggc tggcccaatc aggggcgcgt gagctttatcatggacaatc tcatcgcgca gggcaaagcc aaaccgatgc tggtggtgat ggagcaaggctatgcgcgca agcccgatga accgcaggtg ccgctgcgcc cgcccggaag caacgccggagcgatgccgc ccgactttaa tcgcatgttc gccacgctgg gcgaagtgtt caccaaagacctgattccgt ttattgacgc aaattaccgc accaaaaccg agcgcgaaaa ccgcgcgatggccggacttt cgatgggtgg aatgcaaagt ttcatcatcg gcctggcgaa caccgatctattcgcgcacc tcggcggttt cagcggcgcg ggtggtggtt ttggcggcgg cgccttcgacgccaaaaccg cgcacggcgg tgtgatggcc gatgccgatg ccttcaacaa aaaagttcgcacgatgtttc tcagcatcgg cactgccgag aacgagcgtt ttcagagcag cgtgcgcggttaccgcgacg cgctgaccaa agcgggcatc aaaaccacgt tctacgaatc gcccggcacttcgcacgagt ggctgacatg gcgccgcagc ctgcgcgaat tcgcgccgct cttgtttcaagaggccaaca cgcagatcga gcgcggcccc aatgcccgcc cgattgcgcc gcagccgattgttcttggcc cgggcgacaa gcccgccttc cctccggcgc cctccggttt cgatgcgcggcgcgatggca ttccgcacgg cgaaattaaa cttgtggaat acccttctgc cacggtcggcaccacgcgca agatgcaggt ctatacgccg ccgggctaca acccgcaaga agaatatcccgtgctctatt tgctgcacgg catcggcggc gacgagtggg aatggaaaaa tggcggcacgcccgaagtga ttctcgacaa cctctacgct gagaagaaac tccagccgat gatcgtggtgatgcccaatg ggcgcgcgca aaaagacgac cgtcctatcg gcaacgtgtt cgcttccgctccggcgtttg cgacgtttga gaaagatttg ctgaacgaca ttatcccctt tgttgagaagaattacccga ccaaaaccgg cccgcaaaat cgcgctttgg ccggtctttc gatgggcggcgggcaatctc tcaactttgg cctcggcaac ctcgacacct tcgcgtgggt tggcggcttttcgtccgcgc ccaacacgcg cagcggcgca agtctactgg ccaatcccga cgacgccaaaaagaagctga agctgctgtg ggtttcgtgc ggcgataaag acaatttgat gtttatcagccagcgcacgc accgttatct tgccgagaat aacgtgccgc acatctggca tgtacagcccggcggacacg acttcaaggt gtggaagcaa gacctgtata acttcgccca actgctattccgttaa<210> 366<211> 1081<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1)...(65)<400> 366

Met Asn His Phe Ala Ser Lys Ser Leu Arg Met Ala Trp Gln Pro Gly1 5 10 15 Leu Leu Ala Thr 20 Thr Val Leu Pro Leu 25 Ala Ala Ala Ala Pro 30 Ile ProAla Pro Asn 35 Thr Asp Thr Lys Val 40 Ser Asn Thr Ser Ser 45 Ile Thr ThrPro Ala 50 Ala Ala Pro Gln Ser 55 Gln Pro Gln Pro Thr 60 Gln Asp Ala AsnAla Pro Ala Pro Leu Lys Ala Ala Phe Arg Asp Lys Phe Leu Ile Gly65 70 75 80Ala Val Leu Ser Asp 85 Ala Ala Leu Arg Gly 90 Ser Ala Pro Asp Lys 95 ValAla Ile Ala Thr 100 Thr His Phe Asn Ala 105 Leu Thr Ala Glu Asn 110 Ala MetLys Pro Asp 115 Ala Met Gln Pro Arg 120 Glu Gly Gln Phe Asn 125 Phe Ala AlaGly Asp 130 Arg Leu Val Glu Leu 135 Ala Glu Lys Ser Gly 140 Gly Val Pro IleGly His Thr Leu Val Trp His Ala Gln Thr Pro Lys Trp Phe Phe Glu145 150 155 160Gly Pro Asp Gly Gln Pro Ala Thr Arg Glu Leu Ala Leu Glu Arg Met 165 170 175 Arg Lys His Ile Ser Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys 180 185 190 Glu Trp Asp Val Val Asn Glu Ala Ile Asn Asp Gly Pro Gly Val Leu 195 200 205 Arg Pro 210 Ser Pro Trp Leu Lys 215 Ala Ile Gly Glu Asp 220 Tyr Ile Ala GluAla Phe Arg Ala Ala His Ala Ala Asp Pro Asp Ala Ile Leu Ile Tyr225 230 235 240Asn Asp Tyr Asn Ile Glu Leu Gly Tyr Lys Arg Pro Lys Ala Leu Gln

245 250 255

Leu Leu Lys Ser Leu Ile Asp Gln Lys Val Pro Ile His Ala Val Gly

260 265 270

Ile Gln Gly His Trp Arg Met Asp Asn Pro Asn Phe Ala Glu Val Glu

275 280 285

Gln Ala Ile Lys Glu Phe Ser Ala Leu Gly Leu Lys Val Met Ile Thr

290 295 300

Glu Leu Asp Ile Gly Val Leu Pro Thr Arg Tyr Gln Gly Ala Asp Ile305 310 315 320

Ser Ala Thr Glu Thr Met Thr Pro Glu Gln Arg Ala Val Met Asn Pro

325 330 335

Tyr Thr Asp Gly Leu Pro Asp Asp Val Ala Gln Lys His Ala Glu Arg

340 345 350

Tyr Arg Gln Ala Phe Glu Met Phe Leu Arg His Lys Asp Lys Ile Ser

355 360 365

Arg Val Thr Phe Trp Gly Val Asp Asp Gly Thr Ser Trp Leu Asn Gly

370 375 380

Phe Pro Val Arg Gly Arg Thr Asp Tyr Pro Leu Leu Phe Asp Arg Gln385 390 395 400

Gly Lys Pro Lys Pro Ala Phe Phe Ala Val Gln Asn Ala Ala Met Gly

405 410 415

Ala Thr Ala Gln Pro Ser Ala Ser Ala Pro Ala Thr His Gly Ala Ala

420 425 430

Pro Ala Ser Thr Asn Ile Arg Gly Ala Glu Phe Pro Arg Val Glu Ser

435 440 445

Asp Gly Arg Val Thr Phe Arg Ile Lys Ala Pro Asp Ala Gln Lys Val

450 455 460

Gln Phe Asp Leu Gly Lys Pro Tyr Asp Ala Thr Arg Asp Ala Glu Gly465 470 475 480

Asn Trp Thr Ala Thr Thr Glu Pro Gln Val Pro Gly Phe His Tyr Tyr

485 490 495

Phe Leu Ile Val Asp Gly Val Arg Val Ala Asp Pro Ala Ser Glu Thr

500 505 510

Phe Tyr Gly Ala Gly Arg Gln Met Ser Gly Ile Glu Ile Pro Asp Pro

515 520 . 525

Asp Ser Ala Phe Tyr Ser Pro Gln Asn Val Pro His Gly Glu Val Arg

530 535 540

Glu Arg Trp Tyr Phe Ser Asn Thr Thr Gln Ala Trp Arg Arg Ile Phe545 550 555 560

Ile Tyr Thr Pro Pro Gly Tyr Asp Thr Asp Gln Ala Met Arg Phe Pro

565 570 575

Val Leu Tyr Leu Gln His Gly Gly Gly Glu Asp Glu Arg Gly Trp Pro

580 585 590

Asn Gln Gly Arg Val Ser Phe Ile Met Asp Asn Leu Ile Ala Gln Gly

595 600 605

Lys Ala Lys Pro Met Leu Val Val Met Glu Gln Gly Tyr Ala Arg Lys

610 615 620

Pro Asp Glu Pro Gln Val Pro Leu Arg Pro Pro Gly Ser Asn Ala Gly625 630 635 640

Ala Met Pro Pro Asp Phe Asn Arg Met Phe Ala Thr Leu Gly Glu Val

645 650 655

Phe Thr Lys Asp Leu Ile Pro Phe Ile Asp Ala Asn Tyr Arg Thr Lys

660 665 670

Thr Glu Arg Glu Asn Arg Ala Met Ala Gly Leu Ser Met Gly Gly Met

675 680 685

Gln Ser Phe Ile Ile Gly Leu Ala Asn Thr Asp Leu Phe Ala His Leu

690 695 700

Gly Gly Phe Ser Gly Ala Gly Gly Gly Phe Gly Gly Gly Ala Phe Asp705 710 715 720

Ala Lys Thr Ala His Gly Gly Val Met Ala Asp Ala Asp Ala Phe Asn

725 730 735

Lys Lys Val Arg Thr Met Phe Leu Ser Ile Gly Thr Ala Glu Asn Glu

740 745 750

Arg Phe Gln Ser Ser Val Arg Gly Tyr Arg Asp Ala Leu Thr Lys Ala

755 760 765

Gly Ile Lys Thr Thr Phe Tyr Glu Ser Pro Gly Thr Ser His Glu Trp770 775 780

Leu Thr Trp Arg Arg Ser Leu Arg Glu Phe Ala Pro Leu Leu Phe Gln785 790 795 800

Glu Ala Asn Thr Gln Ile Glu Arg Gly Pro Asn Ala Arg Pro Ile Ala805 810 815

Pro Gln Pro Ile Val Leu Gly Pro Gly Asp Lys Pro Ala Phe Pro Pro

820 825 830

Ala Pro Ser Gly Phe Asp Ala Arg Arg Asp Gly Ile Pro His Gly Glu835 840 845

Ile Lys Leu Val Glu Tyr Pro Ser Ala Thr Val Gly Thr Thr Arg Lys850 855 860

Met Gln Val Tyr Thr Pro Pro Gly Tyr Asn Pro Gln Glu Glu Tyr Pro865 870 875 880

Val Leu Tyr Leu Leu His Gly Ile Gly Gly Asp Glu Trp Glu Trp Lys885 890 895

Asn Gly Gly Thr Pro Glu Val Ile Leu Asp Asn Leu Tyr Ala Glu Lys

900 905 910

Lys Leu Gln Pro Met Ile Val Val Met Pro Asn Gly Arg Ala Gln Lys915 920 925

Asp Asp Arg Pro Ile Gly Asn Val Phe Ala Ser Ala Pro Ala Phe Ala930 935 940

Thr Phe Glu Lys Asp Leu Leu Asn Asp Ile Ile Pro Phe Val Glu Lys945 950 955 960

Asn Tyr Pro Thr Lys Thr Gly Pro Gln Asn Arg Ala Leu Ala Gly Leu965 970 975

Ser Met Gly Gly Gly Gln Ser Leu Asn Phe Gly Leu Gly Asn Leu Asp

980 985 990

Thr Phe Ala Trp Val Gly Gly Phe Ser Ser Ala Pro Asn Thr Arg Ser995 1000 1005

Gly Ala Ser Leu Leu Ala Asn Pro Asp Asp Ala Lys Lys Lys Leu Lys1010 1015 1020

Leu Leu Trp Val Ser Cys Gly Asp Lys Asp Asn Leu Met Phe Ile Ser1025 1030 1035 1040

Gln Arg Thr His Arg Tyr Leu Ala Glu Asn Asn Val Pro His Ile Trp1045 1050 1055

His Val Gln Pro Gly Gly His Asp Phe Lys Val Trp Lys Gln Asp Leu

1060 1065 1070

Tyr Asn Phe Ala Gln Leu Leu Phe Arg1075 1080

<210> 367<211> 1338<212> DNA

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 367

atgaaaagaa ttggattact atttatggcg ttggcgctaa ccgcatttat ggcgcagcattcgtccgctc aaaggatttg caataaccaa acagggaccc atggtggatt ctactacacatggtggagtg atgggggtgg atctgcatgt ataacaatgg gcgatggcgg taactacagcacccaatgga gcaataccgg taactttgta ggcggtaagg gttggagcac aggaagatccaaccgcgtaa ttagttacaa tgctggtaac tggtcgccat cgggtaatgc ttacctatgtttatatggct ggactaccaa cccgcttgtt gagtactacg tagttgatag ctggggttcttggagacctc ccggagcaac atcgcaggga acagtaaata ctgatggtgg cacctatgagatatacagaa ctcagcgtgt aaaccagcca tctattcagg ggaatactac tttctatcagtattggagcg ttagaacctc taaaagggcc actggaagca atgctaccat caccttccagaaccacgtaa atgcttgggc aagtaggggt tggaacttgg gagctcatag ctatcaggtactggctaccg agggttatca gagcagcgga agttcaaata ttactgtttg ggaaggtggttcaagtggag gttcttcagg tggaagcacc ggaggcagca ctggaggtgg atcacacgagatcattgtaa gagcccgtgg tgtagtaggt tcagagcaaa ttaggcttag ggttggcaatacaaccgttg caacttggac ccttactacc ggttataggg actatagggc tactacctcagctactggtg gtattctggt agagtacttc aatgatagcg gcaaccgtga tgttcagattgattacatta gggtaaacgg ctcaactcgt caatctgaga acatgtcgta caatacaggggtatggcaga atggctcatg cggcggctcc aatagcgagt ggctacactg caacggagctattggctacg gcgatgtggt tactggcaga tcaaccgctg ttgaggaagc atttactgctgccgaggatt gtggctgtga acctaaggca accctattcc ccaaccctgc tggcagtaccctcagtatta tgctagacag gcaaccctat ggcgatgtaa gtattagaat atataatacggtaggtgcag ttgttcgcac catcaacaat ccagacctac tcactgaggt tgatgtcagt

6012018024030036042048054060066072078084090096010201080114012001260gcattaaatt ctggaatcta ctttgtagag cttaggtccg aaggacatgt aagcaactac 1320aaatttatta aaaagtag 1338

<210> 368<211> 445<212> PRT

<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL<222> (1) ... (23)<400> 368

Met Lys Arg Ile Gly Leu Leu Phe Met Ala Leu Ala Leu Thr Ala Phe

15 10 15

Met Ala Gln His Ser Ser Ala Gln Arg Ile Cys Asn Asn Gln Thr Gly

20 25 30

Thr His Gly Gly Phe Tyr Tyr Thr Trp Trp Ser Asp Gly Gly Gly Ser

35 40 45

Ala Cys Ile Thr Met Gly Asp Gly Gly Asn Tyr Ser Thr Gln Trp Ser

50 55 60

Asn Thr Gly Asn Phe Val Gly Gly Lys Gly Trp Ser Thr Gly Arg Ser65 70 75 80

Asn Arg Val Ile Ser Tyr Asn Ala Gly Asn Trp Ser Pro Ser Gly Asn

85 90 95

Ala Tyr Leu Cys Leu Tyr Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr

100 105 HO

Tyr Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro Gly Ala Thr Ser

115 120 125

Gln Gly Thr Val Asn Thr Asp Gly Gly Thr Tyr Glu Ile Tyr Arg Thr

130 135 140

Gln Arg Val Asn Gln Pro Ser Ile Gln Gly Asn Thr Thr Phe Tyr Gln145 150 155 160

Tyr Trp Ser Val Arg Thr Ser Lys Arg Ala Thr Gly Ser Asn Ala Thr

165 170 175

Ile Thr Phe Gln Asn His Val Asn Ala Trp Ala Ser Arg Gly Trp Asn

180 185 190

Leu Gly Ala His Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser

195 200 205

Ser Gly Ser Ser Asn Ile Thr Val Trp Glu Gly Gly Ser Ser Gly Gly

210 215 220

Ser Ser Gly Gly Ser Thr Gly Gly Ser Thr Gly Gly Gly Ser His Glu225 230 235 240

Ile Ile Val Arg Ala Arg Gly Val Val Gly Ser Glu Gln Ile Arg Leu

245 250 255

Arg Val Gly Asn Thr Thr Val Ala Thr Trp Thr Leu Thr Thr Gly Tyr

260 265 270

Arg Asp Tyr Arg Ala Thr Thr Ser Ala Thr Gly Gly Ile Leu Val Glu

275 280 285

Tyr Phe Asn Asp Ser Gly Asn Arg Asp Val Gln Ile Asp Tyr Ile Arg

290 295 300

Val Asn Gly Ser Thr Arg Gln Ser Glu Asn Met Ser Tyr Asn Thr Gly305 310 315 320

Val Trp Gln Asn Gly Ser Cys Gly Gly Ser Asn Ser Glu Trp Leu His

325 330 335

Cys Asn Gly Ala Ile Gly Tyr Gly Asp Val Val Thr Gly Arg Ser Thr

340 345 350

Ala Val Glu Glu Ala Phe Thr Ala Ala Glu Asp Cys Gly Cys Glu Pro

355 360 365

Lys Ala Thr Leu Phe Pro Asn Pro Ala Gly Ser Thr Leu Ser Ile Met

370 375 380

Leu Asp Arg Gln Pro Tyr Gly Asp Val Ser Ile Arg Ile Tyr Asn Thr385 390 395 400

Val Gly Ala Val Val Arg Thr Ile Asn Asn Pro Asp Leu Leu Thr Glu

405 410 415

Val Asp Val Ser Ala Leu Asn Ser Gly Ile Tyr Phe Val Glu Leu Arg

420 425 430

Ser Glu Gly His Val Ser Asn Tyr Lys Phe Ile Lys Lys420480540600660

780840900960

435 440 445

<210> 369<211> 1077<212> DNA<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 369

atgaaatcat ttatcactgg caaaaaaatt gctgctggac taattactgc agctgctttg 60

agcgcatcta tggtgagcgc gcaaaccctg acttcaaatt ctcaaggcac ccacgacgga 120

tttttctact ctttctggaa ggactcaggc aacgcctcaa tgaacttatt ggcgggcggc 180

cgttatcagt ctagctggaa caccggcacc aacaactggg taggcggtaa aggctggaac 240

ccaggcacta acaaccgtgt aattaactac tctggttact acggtgtgga caactcccaa 300

aactcttacg tcgcgcttta cggctggacc agaaacccat tggttgagta ctacgtgatt 360

gagagctacg gctcatacaa ccctgctagc tgctctggcg gcaccgattt cggtagcttccaaagtgacg gcgccaccta caacgtgcgt cgttgccagc gcgtgcaaca gccttcgatcgatggcaccc agactttcta ccaatacttc agcgtgagaa atccgaaaaa agggtttgggaacatttctg gcaccatcac ctttgctaac cacgtaaact actggagaag cagagggatgaatcttggta accacgatta ccaagttctc gctactgaag gctacagaag cacgggttcttctgacctca ccatcagcca aggcgcaagc aacaacggcg gtggcggcag tagctcaagt 720

gctccatctg ctgggggcgg tagcaagaca atcgtcgtgc gggcacgcgg gactaccggacaagagcaaa tccgtttgcg ggtgaacaac actattgttc agacctggac cttgtccaccaccatgcgcg actacaccgt caacactaac ttggcaggcg ggtcattggt tgaatacttcaatgacagcg gcaaccgcga cgtccaagtt gattacatca gcgtaaatgg caatgttcgccaatccgaaa accaaaccta caacaccggt gtctaccaga acggtgcgtg tggcggcggt 1020aacggccgga gcgagtggct ccattgcaac ggtgcaatcg ggtacggcga tatctaa 1077

<210> 370<211> 358<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<220>

<221> SIGNAL

<222> (1) . . . (27)

<400> 370

Met Lys Ser Phe Ile Thr Gly Lys Lys Ile Ala Ala Gly Leu Ile Thr

5 10 15

Ala Ala Ala Leu Ser Ala Ser Met Val Ser Ala Gln Thr Leu Thr Ser20 25 30

Asn Ser Gln Gly Thr His Asp Gly Phe Phe Tyr Ser Phe Trp Lys Asp

35 40 45

Ser Gly Asn Ala Ser Met Asn Leu Leu Ala Gly Gly Arg Tyr Gln Ser50 55 60

Ser Trp Asn Thr Gly Thr Asn Asn Trp Val Gly Gly Lys Gly Trp Asn65 70 75 80

Pro Gly Thr Asn Asn Arg Val Ile Asn Tyr Ser Gly Tyr Tyr Gly Val

85 90 95

Asp Asn Ser Gln Asn Ser Tyr Val Ala Leu Tyr Gly Trp Thr Arg Asn

100 105 HO

Pro Leu Val Glu Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro

115 120 125

Ala Ser Cys Ser Gly Gly Thr Asp Phe Gly Ser Phe Gln Ser Asp Gly130 135 140

Ala Thr Tyr Asn Val Arg Arg Cys Gln Arg Val Gln Gln Pro Ser Ile

145 150 155 160

Asp Gly Thr Gln Thr Phe Tyr Gln Tyr Phe Ser Val Arg Asn Pro Lys

165 170 175

Lys Gly Phe Gly Asn Ile Ser Gly Thr Ile Thr Phe Ala Asn His Val

180 185 190

Asn Tyr Trp Arg Ser Arg Gly Met Asn Leu Gly Asn His Asp Tyr Gln

195 200 205

Val Leu Ala Thr Glu Gly Tyr Arg Ser Thr Gly Ser Ser Asp Leu Thr210 215 220

Ile Ser Gln Gly Ala Ser Asn Asn Gly Gly Gly Gly Ser Ser Ser Ser225 230 235 240

Ala Pro Ser Ala Gly Gly Gly Ser Lys Thr Ile Val Val Arg Ala Arg245 250 255 Gly Thr Thr Gly Gln Glu Gln Ile Arg Leu Arg Val Asn Asn Thr Ile 260 265 270 Val Gln Thr 275 Trp Thr Leu Ser Thr 280 Thr Met Arg Asp Tyr 285 Thr Val AsnThr Asn 290 Leu Ala Gly Gly Ser 295 Leu Val Glu Tyr Phe 300 Asn Asp Ser GlyAsn Arg Asp Val Gln Val Asp Tyr Ile Ser Val Asn Gly Asn Val Arg305 310 315 320Gln Ser Glu Asn Gln Thr Tyr Asn Thr Gly Val Tyr Gln Asn Gly Ala 325 330 335 Cys Gly Gly Gly 340 Asn Gly Arg Ser Glu 345 Trp Leu His Cys Asn 350 Gly AlaIle Gly Tyr 355 Gly Asp Ile

<210> 371

<211> 1245

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 371

gtgaccggga tcgcgagaaa aggcgtatgg tccgtgattt ccggaacttt cactgccggggattacgatt cctacctgct gtatgtcgaa acacaggacc agggcggcgg acacccgacgctgagctttg aaatccggaa cttcagactg acggcaccgg aaggcatcgc tccgccgaaggcgacagaag aaccggctga cgcggcagag gcgacgcctg ttccggcact gagcgagattccgggcctga aggacgtcta cgcggactac tttgacttcg gcgctgcggc gccgcagtatgcattcggcc tcggccagac ccagctgcag gacctgatga tcagccagtt cagcatcctgacccctgaaa acgaactgaa accggacagc gtgcttgatg tccagacgag taaaaaactggcggcagaag acgaaaccgc ggtggcgatc aggctgaacg ccgcaacgcc gctgctgaagttcgcgcaga agaacggcat caaagtgcac ggccatgtgc tggtatggca cagccagacgccggaagctt tcttccatga aggatacgat accaagaaac cctatgtgac gagagaggttatgctcggcc gcctggaaaa ctatatccgt gaagtgctga cgcagacaga ggaacagttcccgggcgtga tcgtcagctg ggacgtcgtg aacgaggcga tcgacgacgg tactcactggctgcggaaga cttccagctg gtacaaagtc gtcggcgagg atttcctgaa cagggcttttgaatacgcca ggaaatacgc cgcggagggc gtgctgctgt actacaacga ttacagcacggcaaattcgg ctaaactgat gggcatcacg aagctgctga agcagctgat tccagacgggaatatcgacg gctacggatt ccagatgcac catgacctcg gctggccgag catcgaccttatggcggcag ctgtgaagca gattgccggc ctggggctga aactgcgcgt cagcgaactggatatcggcg tatccaagaa caatcaggaa aactatgaca aacaggccaa acgctacaaggaaatgctga acctgatgct gcagtacgcg gaccagacgg aagccgtgca ggtctggggcctgacggaca acatgagctg gagaaccggc aaatacccgc tgctgttcga cagcgcggcaaaaccgaaaa aggcgttctt cgcggtgatt gaagccgcag aggaa<210> 372<211> 415<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 372

Met Thr Gly Ile Ala Arg Lys Gly Val Trp Ser Val Ile Ser Gly Thr1 5 10 15 Phe Thr Ala Gly 20 Asp Tyr Asp Ser Tyr 25 Leu Leu Tyr Val Glu 30 Thr GlnAsp Gln Gly 35 Gly Gly His Pro Thr 40 Leu Ser Phe Glu Ile 45 Arg Asn PheArg Leu 50 Thr Ala Pro Glu Gly 55 Ile Ala Pro Pro Lys 60 Ala Thr Glu GluPro Ala Asp Ala Ala Glu Ala Thr Pro Val Pro Ala Leu Ser Glu Ile65 70 75 80Pro Gly Leu Lys Asp Val Tyr Ala Asp Tyr Phe Asp Phe Gly Ala Ala 85 90 95 Ala Pro Gln Tyr 100 Ala Phe Gly Leu Gly 105 Gln Thr Gln Leu Gln 110 Asp LeuMet Ile Ser 115 Gln Phe Ser Ile Leu 120 Thr Pro Glu Asn Glu 125 Leu Lys ProAsp Ser Val Leu Asp Val Gln Thr Ser Lys Lys Leu Ala Ala Glu Asp130 135 140 Glu Thr Ala Val Ala Ile Arg Leu Asn Ala Ala Thr Pro Leu Leu Lys 145 150 155 160 Phe Ala Gln Lys Asn Gly Ile Lys Val His Gly His Val Leu Val Trp 165 170 175 His Ser Gln Thr 180 Pro Glu Ala Phe Phe 185 His Glu Gly Tyr Asp 190 Thr Lys Lys Pro Tyr 195 Val Thr Arg Glu Val 200 Met Leu Gly Arg Leu 205 Glu Asn Tyr Ile Arg 210 Glu Val Leu Thr Gln 215 Thr Glu Glu Gln Phe 220 Pro Gly Val Ile Val Ser Trp Asp Val Val Asn Glu Ala Ile Asp Asp Gly Thr His Trp 225 230 235 240 Leu Arg Lys Thr Ser Ser Trp Tyr Lys Val Val Gly Glu Asp Phe Leu 245 250 255 Asn Arg Ala Phe 260 Glu Tyr Ala Arg Lys 265 Tyr Ala Ala Glu Gly 270 Val Leu Leu Tyr Tyr 275 Asn Asp Tyr Ser Thr 280 Ala Asn Ser Ala Lys 285 Leu Met Gly Ile Thr 290 Lys Leu Leu Lys Gln 295 Leu Ile Pro Asp Gly 300 Asn Ile Asp Gly Tyr Gly Phe Gln Met His His Asp Leu Gly Trp Pro Ser Ile Asp Leu 305 310 315 320 Met Ala Ala Ala Val Lys Gln Ile Ala Gly Leu Gly Leu Lys Leu Arg 325 330 335 Val Ser Glu Leu Asp Ile Gly Val Ser Lys Asn Asn Gln Glu Asn Tyr 340 345 350 Asp Lys Gln 355 Ala Lys Arg Tyr Lys 360 Glu Met Leu Asn Leu 365 Met Leu Gln Tyr Ala 370 Asp Gln Thr Glu Ala 375 Val Gln Val Trp Gly 380 Leu Thr Asp Asn Met Ser Trp Arg Thr Gly Lys Tyr Pro Leu Leu Phe Asp Ser Ala Ala 385 390 395 400 Lys Pro Lys Lys Ala Phe Phe Ala Val Ile Glu Ala Ala Glu Glu

405 410 415<210> 373<211> 1539<212> DNA<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental.<400> 373

ttgattggct gcgtcatgtc gccgccggaa gcgggaagtc cccgttttga tcttttaacc 60

cggcacttta atgtcatcac cgcggaaaac gccatgaagc ccgcgtcgtt gcagcgcgaa 120

aagggggtgt ttacttttga acaggcggac atgatggtgg acgcggtatt ggagcgggga 180

ctgaagatcc acggacatac tctggcctgg caccagcagt ctccggagtg gatgaatcat 240

gaggggattt cccgggacga agccgtggaa aatctcaccg tccacgccaa aaccgcggcc 300

gctcatttta gggggcgggt catatcctgg gatgtactca acgaggcgat cattgacaat 360

ccccccaacc ccggggattg gcgggcatcc ctcaggcaaa gcccctggta caaagccata 420

ggcccggatt acgtggagct tgtgttcaag gcggccaggg aggcggaccc ggaggcaaaa 480

ctttattata acgattacaa ccttgataac cggaacaagg ccctggcggt ttacaacatg 540

gtcagggaac tgaacgaaaa gaatccgaat ccgggcggca ggcccctcat cgacggcgtg 600

ggcatgcagg gccattaccg cctgaatacc aataccgata acgtgaggct gtcgctggaa 660

cggtttattt ccctgggggt cgaggtcagc atcacggagc tcgatataca ggccggttcg 720

gattcaaacc agacagagcg gcagcgggtg gaacagggcc tggtctatgc cgctttgttt 780

accattttcc gggaacacgc ggcaaacata ggccgggtaa ctttttgggg acttgacgac 840

ggggcaagct ggcgttccgc ggcgagtccc tgcctctttg ataaaaacct caacgcaaaa 900

cctgcctttt acgcggtcct ggacccggat tcctttattg cggaaaacag cgccctgctg 960

atcagggaag cgaaagaggg agaggcttat tatggtacgc ctgctttagg cgccgtccct 1020

gatcccctct gggacagggc gccttccctc ccggtggatc agtacctcat ggcctggcag 1080

ggcgcttcgg gaagggcaaa agtcctctgg gacgaaaaaa atctctatgt gctggtccgg 1140

gttgaaaacg cggaaataaa caaggacagt tccaacagct acgaacagga ttcggtcgaa 1200

atttttattg atgaggataa ccggaaaagt tcctttttca gggaggatga cgggcagtac 1260

cgggtcaatt ttgccaacga ggcgggcttt aacccctcgt ccgccggggc ggggtttgtt 1320

tcggccgccg cggtggatgg aaaatcctat accgttacca tgaagattcc ctttaaaaca 13 80

atagtccccg gagcggggac gcgtatcggg tttgatgtcc agatcaacgg cgcgtcggcc 1440

agggggatac gggagagcgt ggcggtatgg aatgatacca cgggcaattc atttcaggat 1500acctcaggtt acggggtact gcggttagta aaaaagtaa<210> 374<211> 512<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental.<400> 374

Met Ile Gly Cys Val Met Ser Pro Pro Glu Ala Gly Ser Pro Arg Phe

1 5 10 15

Asp Leu Leu Thr Arg His Phe Asn Val Ile Thr Ala Glu Asn Ala Met

20 25 30

Lys Pro Ala Ser Leu Gln Arg Glu Lys Gly Val Phe Thr Phe Glu Gln

35 40 45

Ala Asp Met Met Val Asp Ala Val Leu Glu Arg Gly Leu Lys Ile His

50 55 60

Gly His Thr Leu Ala Trp His Gln Gln Ser Pro Glu Trp Met Asn His65 70 75 80

Glu Gly Ile Ser Arg Asp Glu Ala Val Glu Asn Leu Thr Val His Ala

85 90 95

Lys Thr Ala Ala Ala His Phe Arg Gly Arg Val Ile Ser Trp Asp Val

100 105 HO

Leu Asn Glu Ala Ile Ile Asp Asn Pro Pro Asn Pro Gly Asp Trp Arg

115 120 125

Ala Ser Leu Arg Gln Ser Pro Trp Tyr Lys Ala Ile Gly Pro Asp Tyr

130 135 140

Val Glu Leu Val Phe Lys Ala Ala Arg Glu Ala Asp Pro Glu Ala Lys145 150 155 160

Leu Tyr Tyr Asn Asp Tyr Asn Leu Asp Asn Arg Asn Lys Ala Leu Ala

165 170 175

Val Tyr Asn Met Val Arg Glu Leu Asn Glu Lys Asn Pro Asn Pro Gly

180 185 190

Gly Arg Pro Leu Ile Asp Gly Val Gly Met Gln Gly His Tyr Arg Leu

195 200 205

Asn Thr Asn Thr Asp Asn Val Arg Leu Ser Leu Glu Arg Phe Ile Ser

210 215 220

Leu Gly Val Glu Val Ser Ile Thr Glu Leu Asp Ile Gln Ala Gly Ser225 230 235 240

Asp Ser Asn Gln Thr Glu Arg Gln Arg Val Glu Gln Gly Leu Val Tyr

245 250 255

Ala Ala Leu Phe Thr Ile Phe Arg Glu His Ala Ala Asn Ile Gly Arg

260 265 270

Val Thr Phe Trp Gly Leu Asp Asp Gly Ala Ser Trp Arg Ser Ala Ala

275 280 285

Ser Pro Cys Leu Phe Asp Lys Asn Leu Asn Ala Lys Pro Ala Phe Tyr

290 295 300

Ala Val Leu Asp Pro Asp Ser Phe Ile Ala Glu Asn Ser Ala Leu Leu305 310 315 320

Ile Arg Glu Ala Lys Glu Gly Glu Ala Tyr Tyr Gly Thr Pro Ala Leu

325 330 335

Gly Ala Val Pro Asp Pro Leu Trp Asp Arg Ala Pro Ser Leu Pro Val

340 345 350

Asp Gln Tyr Leu Met Ala Trp Gln Gly Ala Ser Gly Arg Ala Lys Val

355 360 365

Leu Trp Asp Glu Lys Asn Leu Tyr Val Leu Val Arg Val Glu Asn Ala

370 375 380

Glu Ile Asn Lys Asp Ser Ser Asn Ser Tyr Glu Gln Asp Ser Val Glu385 390 395 400

Ile Phe Ile Asp Glu Asp Asn Arg Lys Ser Ser Phe Phe Arg Glu Asp

405 410 415

Asp Gly Gln Tyr Arg Val Asn Phe Ala Asn Glu Ala Gly Phe Asn Pro

420 425 430

Ser Ser Ala Gly Ala Gly Phe Val Ser Ala Ala Ala Val Asp Gly Lys

435 440 445

Ser Tyr Thr Val Thr Met Lys Ile Pro Phe Lys Thr Ile Val Pro Gly

450 455 460

Ala Gly Thr Arg Ile Gly Phe Asp Val Gln Ile Asn Gly Ala Ser Ala

1539465 470 475 480

Arg Gly Ile Arg Glu Ser Val Ala Val Trp Asn Asp Thr Thr Gly Asn

485 490 495

Ser Phe Gln Asp Thr Ser Gly Tyr Gly Val Leu Arg Leu Val Lys Lys500 505 510

<210> 375<211> 570<212> DNA

<213> Seqüência Artificial<220>

<223> Geralmente sintético polynucleotide<400> 375

atggccctta tggcttcgac attctactgg cacttgtgga ctgatggtat agggacagtaaatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaattttgttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgcccacgccttttcgg tagtgggtaa tgcttatttg gctctttatg ggtggacgag aaattcactcatagaatatt acgtcgttga tagctggggg acttatagac ctactggaac ttataaaggcactgtgacta gtgatggagg gacttatgac atatacacga ctacacgaac caacgcaccttccattgacg gcaataatac aactttcacc cagttctgga gtgttaggca gtcgaagagaccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctg gaagagtaaaggaatgaatt tggggagtag ttggtcttat caggtattag caacagaggg ctatcaaagtagtgggtact ctaacgtaac ggtctggtaa<210> 376<211> 189<212> PRT

<213> Seqüência Artificial<220>

<223> Polipeptídeo geralmente sintético<400> 376

Met Ala Leu Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly1 5 10 15 Ile Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val 20 25 30 Ser Trp Ser 35 Asn Cys Gly Asn Phe 40 Val Val Gly Lys Gly 45 Trp Thr ThrGly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val 50 55 60 Val Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu65 70 75 80Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly 85 90 95 Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr 100 105 110 Thr Thr Thr 115 Arg Thr Asn Ala Pro 120 Ser Ile Asp Gly Asn 125 Asn Thr ThrPhe Thr 130 Gln Phe Trp Ser Val 135 Arg Gln Ser Lys Arg 140 Pro Ile Gly ThrAsn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys145 150 155 160Gly Met Asn Leu Gly 165 Ser Ser Trp Ser Tyr 170 Gln Val Leu Ala Thr 175 GluGly Tyr Gln Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210> 377<211> 570<212> DNA

<213> Seqüência Artificial<220>

<223> Geralmente sintético polynucleotide<400> 377

atggccctta tggcttcgac attctactgg cacttgtgga ctgatggtat agggacagtaaatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaattttgttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgcccacgccttttcgg tagtgggtaa tgcttatttg gctctttatg ggtggacgag aaatccactcatagaatatt acgtcgttga tagctggggg acttatagac ctactggaac ttataaaggcactgtgacta gtgatggagg gacttatgac atatacacga ctacacgaac caacgcaccttccattgacg gcaataatac aactttcacc cagttctgga gtgttaggca gtcgaagagaccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctg gaagagtaaa

ggaatgaatt tggggagtag ttggtcttat caggtattag caacagaggg ctatcaaagt

agtgggtact ctaacgtaac ggtctggtaa

<210> 378

<211> 189

<212> PRT

<213> Seqüência Artificial<220>

<223> Polipeptídeo geralmente sintético<400> 378

Met Ala Leu Met Ala Ser Thr Phe Tyr Trp His Leu Trp Thr Asp Gly1 5 10 15 Ile Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val 20 25 30 Ser Trp Ser Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr 35 40 45 Gly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Val 50 55 60 Val Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Pro Leu65 70 75 80Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly 85 90 95 Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr 100 105 110 Thr Thr Thr 115 Arg Thr Asn Ala Pro 120 Ser Ile Asp Gly Asn 125 Asn Thr ThrPhe Thr 130 Gln Phe Trp Ser Val 135 Arg Gln Ser Lys Arg 140 Pro Ile Gly ThrAsn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys145 150 155 160Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu 165 170 175 Gly Tyr Gln Ser 180 Ser Gly Tyr Ser Asn 185 Val Thr Val Trp

<210> 379<211> 570<212> DNA

<213> Seqüência Artificial<2 2 0>

<223> Geralmente sintético polynucleotide.<400> 379

atggccctta tggcttcgac attctactgg cacaattgga ctgatggtat agggacagtaaatgctacca atggatctga tggcaattac agcgtttcat ggtcaaattg cgggaattttgttgttggta aaggctggac taccggatca gcaactaggg taataaacta taatgcccacgccttttcgc cggtgggtaa tgcttatttg gctctttatg ggtggacgag aaattcactcatagaatatt acgtcgttga tagctggggg acttatagac ctactggaac ttataaaggcactgtgacta gtgatggagg gacttatgac atatacacga ctacacgaac caacgcaccttccattgacg gcaataatac aactttcacc cagttctgga gtgttaggca gtcgaagagaccgattggta ccaacaatac catcaccttt agcaaccatg ttaacgcctg gaagagtaaaggaatgaatt tggggagtag ttggtcttat caggtattag caacagaggg ctatcaaagtagtgggtact ctaacgtaac ggtctggtaa<210> 380<211> 189<212> PRT

<213> Seqüência Artificial<22 0>

<223> Polipeptídeo geralmente sintético.<400> 380

Met Ala Leu Met Ala Ser Thr Phe Tyr Trp His Asn Trp Thr Asp Gly

1 5 10 15

Ile Gly Thr Val Asn Ala Thr Asn Gly Ser Asp Gly Asn Tyr Ser Val

20 25 30

Ser Trp Ser Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr

35 40 45

Gly Ser Ala Thr Arg Val Ile Asn Tyr Asn Ala His Ala Phe Ser Pro

50 55 60

Val Gly Asn Ala Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Asn Ser Leu65 70 75 80Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly 85 90 95 Thr Tyr Lys Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr Asp Ile Tyr 100 105 110 Thr Thr Thr Arg Thr Asn Ala Pro Ser Ile Asp Gly Asn Asn Thr Thr 115 120 125 Phe Thr 130 Gln Phe Trp Ser Val 135 Arg Gln Ser Lys Arg 140 Pro Ile Gly ThrAsn Asn Thr Ile Thr Phe Ser Asn His Val Asn Ala Trp Lys Ser Lys145 150 155 160Gly Met Asn Leu Gly Ser Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu 165 170 175 Gly Tyr Gln Ser Ser Gly Tyr Ser Asn Val Thr Val Trp

180 185

<210> 381<211> 594<212> DNA

<213> Seqüência Artificial<220>

<223> Geralmente sintético<400> 381

atggcccaga cctgcctcac gtcgagtcaa accggcacta acaatggctt ctattattccttctggaagg acagtccggg cacggtgaat ttttgcctgc agtccggcgg ccgttacacatcgaactgga gcggcatcaa caactgggtg ggcggcaagg gatggcagac cggttcacgccggaacatca cgtactcggg cagcttcaat tcaccgggca acggctacct ggcgctttacggatggacca ccaatccact cgtcgagtac tacgtcgtcg atagctgggg gagctggcgtccgccgggtt cggacggaac gttcctgggg acggtcaaca gcgatggcgg aacgtatgacatctatcgcg cgcagcgggt caacgcgccg tccatcatcg gcaacgccac gttctatcaatactggagcg ttcggcagtc gaagcgggta ggtgggacga tcaccaccgg aaaccacttcgacgcgtggg ccagcgtggg cctgaacctg ggcactcaca actaccagat catggcgaccgagggctacc aaagcagcgg cagctccgac atcacggtga gtgaaggcgg ttga<210> 382<211> 197<212> PRT

<213> Seqüência Artificial<220>

<223> Geralmente sintético<400> 382

Met Ala Gln Thr Cys Leu Thr Ser Ser Gln Thr Gly Thr Asn Asn Gly1 5 10 15 Phe Tyr Tyr Ser Phe Trp Lys Asp Ser Pro Gly Thr Val Asn Phe Cys 20 25 30 Leu Gln Ser 35 Gly Gly Arg Tyr Thr 40 Ser Asn Trp Ser Gly 45 Ile Asn AsnTrp Val 50 Gly Gly Lys Gly Trp 55 Gln Thr Gly Ser Arg 60 Arg Asn Ile ThrTyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly Tyr Leu Ala Leu Tyr65 70 75 80Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr Val Val Asp Ser Trp 85 90 95 Gly Ser Trp Arg Pro Pro Gly Ser Asp Gly Thr Phe Leu Gly Thr Val 100 105 110 Asn Ser Asp 115 Gly Gly Thr Tyr Asp 120 Ile Tyr Arg Ala Gln 125 Arg Val AsnAla Pro 130 Ser Ile Ile Gly Asn 135 Ala Thr Phe Tyr Gln 140 Tyr Trp Ser ValArg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr Thr Gly Asn His Phe145 150 155 160Asp Ala Trp Ala Ser Val Gly Leu Asn Leu Gly Thr His Asn Tyr Gln 165 170 175 Ile Met Ala Thr 180 Glu Gly Tyr Gln Ser 185 Ser Gly Ser Ser Asp 190 Ile ThrVal Ser Glu Gly Gly

195<210> 383<211> 585<212> DNA

<213> Seqüência Artificial<220>

<223> Geralmente sintético<400> 383

atggcccaga cctgcctcac gtcgagtcaa accggcacta acaatggctt ctattattcc 60

ttctggaagg acagtccggg cacggtgaat ttttgcctgc agtccggcgg ccgttacaca 120

tcgaactgga gcggcatcaa caactgggtg ggcggcaagg gatggcagac cggttcacgc 180

cggaacatca cgtactcggg cagcttcaat tcaccgggca acggctacct ggcgctttac 240

ggatggacca ccaatccact cgtcgagtac tacgtcgtcg atagctgggg gagctggcgt 300

ccgccgggtt cggacggaac gttcctgggg acggtcaaca gcgatggcgg aacgtatgac 360

atctatcgcg cgcagcgggt caacgcgccg tccatcatcg gcaacgccac gttctatcaa 420

tactggagcg ttcggcagtc gaagcgggta ggtgggacga tcaccaccgg aaaccacttc 480

gacgcgtggg ccagcgtggg cctgaacctg ggcactcaca actaccagat catggcgacc 540

gagggctacc aaagcagcgg cagctccgac atcacggtga gttga 585

<210> 384<211> 194<212> PRT

<213> Seqüência Artificial<220>

<223> Geralmente sintético<400> 384

Met Ala Gln Thr Cys Leu Thr Ser Ser Gln Thr Gly Thr Asn Asn Gly

1 5 10 15

Phe Tyr Tyr Ser Phe Trp Lys Asp Ser Pro Gly Thr Val Asn Phe Cys

20 25 30

Leu Gln Ser Gly Gly Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn Asn

35 40 45

Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ser Arg Arg Asn Ile Thr

50 55 60

Tyr Ser Gly Ser Phe Asn Ser Pro Gly Asn Gly Tyr Leu Ala Leu Tyr65 70 75 80

Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr Val Val Asp Ser Trp

85 90 95

Gly Ser Trp Arg Pro Pro Gly Ser Asp Gly Thr Phe Leu Gly Thr Val

100 105 110

Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Ala Gln Arg Val Asn

115 120 125

Ala Pro Ser Ile Ile Gly Asn Ala Thr Phe Tyr Gln Tyr Trp Ser Val

130 135 140

Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr Thr Gly Asn His Phe145 150 155 160

Asp Ala Trp Ala Ser Val Gly Leu Asn Leu Gly Thr His Asn Tyr Gln

165 170 175

Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr180 185 190

Val Ser<210> 385<211> 1122<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 385

gctgacctgc ggcgacgtcg cctgctgcag gcggccgcca cgctgccgct gcttggctgg 60

tgcagtgcgc aggccgcgcc cgcaccgcgc tggccggcgt ggcaggtact gctcgacagc 120agcctgagcc gcgacggacg catgatcgat cgcagccagg acgatcagcg cagcacctcc 180gaaggccagt cctatgcgtt gttcttcgcc ctggtcgaca acgaccaggc gctgttcgac 240cgcatcctgg gctggaccca ggacaacctc gccggtggcg acatgcgcca gcacctgccc 300gcctggttgt gggggcggga tgacaaggga agctggcggg tactggacga caacccggcc 3 60tcggactccg atctctggct ggcctatgcg ctgctggaag gcgcgaggct gtggcgccgt 420cccgcgttga aggccatcgc cgagggcctg ctcgcgcagg tgcgggcacg cgagatcgtg 480gacctgcccg ggctcggccc gatgctgttg ccgggcccac agggattcac cgaaggggac 540gcgacgcggg tcaaccccag ctatctgcca ctgccgctgc tgcgccgctt tgcggtggag 600gatcgcagcg ggccgtggca ggcgctggcg cgtaacagcg tgcagctgtt gcagcagacc 660agcccaaagg ggttcgcacc ggactgggcg gcgtggaaag gcgatcgttt cgtcgtcgat 720ccggtgcgcg gcgcggtcgg cagctacgat gcgatccgct gctacacctg ggcaggcatg 780accgcgccgc gcgatgcgtt gttccgcacg cagctggcgg ccctgtccgg gccgctgcag 840cgcctgcgca gtggtgcgcc gatgtgggaa aaaatcgaca cccgcagtgg ccaggggcag 900ggcgaaggca actacggatt ccgcgcggca ctgctgccgt atctgatcgc gcagggcgac 960gcggagcgcg cgcagtcgct gcgggccagc ctgcccagcg ccgaacagca gcgtgctgat 1020gcaccggcct actactcgca gatgctggcc ctgttcggcc tgggctgggc cgaagggcgc 1080tggcgtttcg ccgccgacgg ccgcctgcag ccgcgctggt ag 1122

<210> 386<211> 373<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL

<222> (1) . . . (25)<220>

<221> DOMÍNIO

<222> (5) ... (359)

<223> Família 8 de hidrolase glicosila

<400> 386

Ala Asp Leu Arg Arg Arg Arg Leu Leu Gln Ala Ala Ala Thr Leu Pro1 5 10 15

Leu Leu Gly Trp Cys Ser Ala Gln Ala Ala Pro Ala Pro Arg Trp Pro20 25 30

Ala Trp Gln Val Leu Leu Asp Ser Ser Leu Ser Arg Asp Gly Arg Met35 40 45

Ile Asp Arg Ser Gln Asp Asp Gln Arg Ser Thr Ser Glu Gly Gln Ser

50 55 60

Tyr Ala Leu Phe Phe Ala Leu Val Asp Asn Asp Gln Ala Leu Phe Asp65 70 75 80

Arg Ile Leu Gly Trp Thr Gln Asp Asn Leu Ala Gly Gly Asp Met Arg

85 90 95

Gln His Leu Pro Ala Trp Leu Trp Gly Arg Asp Asp Lys Gly Ser Trp100 105 HO

Arg Val Leu Asp Asp Asn Pro Ala Ser Asp Ser Asp Leu Trp Leu Ala115 120 125

Tyr Ala Leu Leu Glu Gly Ala Arg Leu Trp Arg Arg Pro Ala Leu Lys

130 135 140

Ala Ile Ala Glu Gly Leu Leu Ala Gln Val Arg Ala Arg Glu Ile Val145 150 155 160

Asp Leu Pro Gly Leu Gly Pro Met Leu Leu Pro Gly Pro Gln Gly Phe

165 170 175

Thr Glu Gly Asp Ala Thr Arg Val Asn Pro Ser Tyr Leu Pro Leu Pro180 185 190

Leu Leu Arg Arg Phe Ala Val Glu Asp Arg Ser Gly Pro Trp Gln Ala195 200 205

Leu Ala Arg Asn Ser Val Gln Leu Leu Gln Gln Thr Ser Pro Lys Gly

210 215 220

Phe Ala Pro Asp Trp Ala Ala Trp Lys Gly Asp Arg Phe Val Val Asp225 230 235 240

Pro Val Arg Gly Ala Val Gly Ser Tyr Asp Ala Ile Arg Cys Tyr Thr

245 250 255

Trp Ala Gly Met Thr Ala Pro Arg Asp Ala Leu Phe Arg Thr Gln Leu260 265 270

Ala Ala Leu Ser Gly Pro Leu Gln Arg Leu Arg Ser Gly Ala Pro Met275 280 285

Trp Glu Lys Ile Asp Thr Arg Ser Gly Gln Gly Gln Gly Glu Gly Asn

290 295 300

Tyr Gly Phe Arg Ala Ala Leu Leu Pro Tyr Leu Ile Ala Gln Gly Asp305 310 315 320

Ala Glu Arg Ala Gln Ser Leu Arg Ala Ser Leu Pro Ser Ala Glu Gln

325 330 335

Gln Arg Ala Asp Ala Pro Ala Tyr Tyr Ser Gln Met Leu Ala Leu Phe340 345 350

65 Gly Leu Gly Trp Ala Glu Gly Arg Trp Arg Phe Ala Ala Asp Gly Arg355 360 365

Leu Gln Pro Arg Trp370<210> 387<211> 1221<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 387

atgctaaaag ttttacgcaa accggtttta tcaggtttat ctttagcctt attattacctgttggaataa ctagtgttgg tgcctcagat acagaatcct atgcaaaaaa accaatgattagtgctttaa cagcaccaca gcttgaccaa cgatataaag attccttcac cattggtgcagctgttgaac cttcaatgtt acaaggaaaa gacgcacaaa tgttaaaacg ccattttaacagcatcgtag cagagaatgt tatgaagcct ggaagtttgc agccagtaga agggcaatttaactgggggc cttctgacga aatcattaaa tttgccaaag aaaatggcat ggacgtacgcggccataacc tagtttggca tagtcaggta ccggcatggt tcttcttgga taaaaatggaataaaaatga ccttagagac tgatccagtt aaacgcgagg aaaacaaaca gctcttattacagcgtttgc gtgaccatat taaagcagtc gtaacacgct ataaagatga tattaaatcttgggatgtag taaatgaagt aatctcagat ggtggtggat tacggcaatc cgattggtacagaataacag gtactgacta tattaaagtc gcttttgaga ccgccagaca atatgccgcaccagacacaa aactttatat taatgattac aatacagaag tagaacctaa gagaactagcctttataacc tagttaagag cttgaaggaa gagggagttc caattgatgg tgttggccaccagtctcaca tccaaatcgg ctggccttct gataaagata ttgaagatac tattaacatgtttgccgatc ttggtttaga taaccaaatc acggagcttg atgttagtat gtatggttacccgccaaggg cgtatccaac ttatgctgcc attccggaat ttaaatttat ggatcaagcagaccgttatg accgtttatt taagttgtat gagaaattgg gcgataaaat tagcaatgtgacattctggg gcattgccga taaccatact tggctcaatg accgtgcaga tgtatactatgatgcaaatg gtaacgttgt aactgatcca actgcaccat ttgcaaaaat tgaaagaagagcaggaaaag atgcaccatt cgtgtttgat ccggattaca atttaaagcc agcctactgggccattatcg accataaata a<210> 388<211> 406<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(28)<220>

<221> DOMÍNIO<222> (47)...(406)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (289)...(299)<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591

<220>

<221> SITE

<222> (344)...(347)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (353)...(356)

<223> N-glicosilação site. Prosite id = PS00001 <400> 388 Met Leu Lys Val Leu Arg Lys Pro Val Leu Ser Gly Leu Ser Leu Ala1 '5 10 15 Leu Leu Leu Pro 20 Val Gly Ile Thr Ser 25 Val Gly Ala Ser Asp 30 Thr GluSer Tyr Ala Lys Lys Pro Met Ile Ser Ala Leu Thr Ala Pro Gln Leu 35 40 45 Asp Gln Arg Tyr Lys Asp Ser Phe Thr Ile Gly Ala Ala Val Glu Pro 50 55 60 His Phe Ser Met Leu Gln Gly Lys Asp Ala Gln Met Leu Lys Arg Asn65 70 75 80Ser Ile Val Ala Glu 85 Asn Val Met Lys Pro 90 Gly Ser Leu Gln Pro 95 Val

6012018024030036042048054060066072078084090096010201080114012001221Glu Gly Gln Phe Asn Trp Gly Pro Ser Asp Glu Ile Ile Lys Phe Ala

100 105 HO

Lys Glu Asn Gly Met Asp Val Arg Gly His Asn Leu Val Trp His Ser115 120 125

Gln Val Pro Ala Trp Phe Phe Leu Asp Lys Asn Gly Ile Lys Met Thr130 135 140

Leu Glu Thr Asp Pro Val Lys Arg Glu Glu Asn Lys Gln Leu Leu Leu145 150 155 160

Gln Arg Leu Arg Asp His Ile Lys Ala Val Val Thr Arg Tyr Lys Asp165 170 175

Asp Ile Lys Ser Trp Asp Val Val Asn Glu Val Ile Ser Asp Gly Gly

180 185 190

Gly Leu Arg Gln Ser Asp Trp Tyr Arg Ile Thr Gly Thr Asp Tyr Ile195 200 205

Lys Val Ala Phe Glu Thr Ala Arg Gln Tyr Ala Ala Pro Asp Thr Lys210 215 220

Leu Tyr Ile Asn Asp Tyr Asn Thr Glu Val Glu Pro Lys Arg Thr Ser225 230 235 240

Leu Tyr Asn Leu Val Lys Ser Leu Lys Glu Glu Gly Val Pro Ile Asp245 250 255

Gly Val Gly His Gln Ser His Ile Gln Ile Gly Trp Pro Ser Asp Lys

260 265 270

Asp Ile Glu Asp Thr Ile Asn Met Phe Ala Asp Leu Gly Leu Asp Asn275 280 285

Gln Ile Thr Glu Leu Asp Val Ser Met Tyr Gly Tyr Pro Pro Arg Ala290 295 300

Tyr Pro Thr Tyr Ala Ala Ile Pro Glu Phe Lys Phe Met Asp Gln Ala305 310 315 320

Asp Arg Tyr Asp Arg Leu Phe Lys Leu Tyr Glu Lys Leu Gly Asp Lys325 330 335

Ile Ser Asn Val Thr Phe Trp Gly Ile Ala Asp Asn His Thr Trp Leu

340 345 350

Asn Asp Arg Ala Asp Val Tyr Tyr Asp Ala Asn Gly Asn Val Val Thr355 360 365

Asp Pro Thr Ala Pro Phe Ala Lys Ile Glu Arg Arg Ala Gly Lys Asp370 375 380

Ala Pro Phe Val Phe Asp Pro Asp Tyr Asn Leu Lys Pro Ala Tyr Trp385 390 395 400

Ala Ile Ile Asp His Lys

405

<210> 389

<211> 1008

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 389

atgagtgtta agccgttctg gcgtcaatgg atactctgtt tcatggtgat gttttttagc

cgtatcagcg atacggccaa caacaacgtc agccataccg aaggtcaggg ttacggcatg

ttactggcgg tggcgaatga cgatcgcccc acctttgata agctgtggca atggacgcag

acccatctgc gcaatccgca aaatgatctg ttttactggc gctacactcc cggtgcgacc

gatcccgtcg ccgataaaaa taatgcgtcg gatggtgatg tcctgattgc ctgggcgtta

caacgtgggg cacagaagtg gtccgccagc agctaccaac aggcgtcaga tcgtatccag

cgtgcgattg tgaagcacaa cgtgatcacc tatgccgggc ataccgtgat gctgccgggc

gtgcagggct tcaataaaac cagttttatc gtgctcaatc cgtcctattt tctgttcccc

gcctggcgtg agtttgcgca gcacagccat ttgcgcgtct ggaatcagct gattgatgat

ggcatggacc tgctgggcga tatgcatttc ggcaaaagtg gcttgccgct tgattgggta

gacgcgattc gtattccact gaatatctgg tggtacgacc cgcaaagjcct gcgcctggtg

ccgtaccagc gtgtctggca gggctatgga cgcttaacca ccccggcgtg gtttgatgtg

ctggcgaata cgcctgcacc ttataacctc gacggcgggc tgctggcgat ccgagatttg

acgctgagcg agacggggta tctcagtgac cggttggcac cggatcagaa ctacttctcg

gcgagtttgc agttgctgac ctggatggca tatcaggaaa ggcgctga

<210> 390<211> 335<212> PRT

60

gcccaggcgg ccgcagatgg ctggagtacc tttaaaagtc gctttatgag cagcgatggt 120

180240300360420480540600660

gcgctgaatg ccgacggttc ggtggcacct gcggtcgggt attccaatcg ttttagctat 720

7808409009601008<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(25)<220>

<221> DOMÍNIO<222> (2)...(333)

<223> Família 8 de hidrolase glicosila<220>

<221> SITE<222> (49) . . . (52)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (109)...(112)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (167)...(170)

<223> N-glicosilação site. Prosite id = PS00001<400> 390

Met Ser Val Lys Pro Phe Trp Arg Gln Trp Ile Leu Cys Phe Met Val1 5 10 15 Met Phe Phe Ser 20 Ala Gln Ala Ala Ala 25 Asp Gly Trp Ser Thr 30 Phe LysSer Arg Phe 35 Met Ser Ser Asp Gly 40 Arg Ile Ser Asp Thr 45 Ala Asn AsnAsn Val 50 Ser His Thr Glu Gly 55 Gln Gly Tyr Gly Met 60 Leu Leu Ala ValAla Asn Asp Asp Arg Pro Thr Phe Asp Lys Leu Trp Gln Trp Thr Gln65 70 75 80Thr His Leu Arg Asn Pro Gln Asn Asp Leu Phe Tyr Trp Arg Tyr Thr 85 90 95 Pro Gly Ala Thr Asp Pro Val Ala Asp Lys Asn Asn Ala Ser Asp Gly 100 105 110 Asp Val Leu Ile Ala Trp Ala Leu Gln Arg Gly Ala Gln Lys Trp Ser 115 120 125 Ala Ser 130 Ser Tyr Gln Gln Ala 135 Ser Asp Arg Ile Gln 140 Arg Ala Ile ValLys His Asn Val Ile Thr Tyr Ala Gly His Thr Val Met Leu Pro Gly145 150 155 160Val Gln Gly Phe Asn 165 Lys Thr Ser Phe Ile 170 Val Leu Asn Pro Ser 175 TyrPhe Leu Phe Pro 180 Ala Trp Arg Glu Phe 185 Ala Gln His Ser His 190 Leu ArgVal Trp Asn 195 Gln Leu Ile Asp Asp 200 Gly Met Asp Leu Leu 205 Gly Asp MetHis Phe 210 Gly Lys Ser Gly Leu 215 Pro Leu Asp Trp Val 220 Ala Leu Asn AlaAsp Gly Ser Val Ala Pro Ala Val Gly Tyr Ser Asn Arg Phe Ser Tyr225 230 235 240Asp Ala Ile Arg Ile Pro Leu Asn Ile Trp Trp Tyr Asp Pro Gln Ser 245 250 255 Leu Arg Leu Val Pro Tyr Gln Arg Val Trp Gln Gly Tyr Gly Arg Leu 260 265 270 Thr Thr Pro 275 Ala Trp Phe Asp Val 280 Leu Ala Asn Thr Pro 285 Ala Pro TyrAsn Leu Asp Gly Gly Leu Leu Ala Ile Arg Asp Leu Thr Leu Ser Glu 290 295 300 Thr Gly Tyr Leu Ser Asp Arg Leu Ala Pro Asp Gln Asn Tyr Phe Ser305 310 315 320Ala Ser Leu Gln Leu 325 Leu Thr Trp Met Ala 330 Tyr Gln Glu Arg Arg 335

<210> 391<211> 1116<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 391

gtgatgaaag ggtttcgctg gtgtgtgatg gcgatggtggcgcgccgcct gcacctggcc tgcatgggag cagtttaaaagggcgcgtca ttgatcccag tgacgcgcgc aaaatcagtagcgctgttct ttgccctcgc ggcgaacgat cgccagacctacacgcgaca acctcgcgca gggcgatctg agccagcatcatgaaagaaa aagagaaaga gacctgggcg gtgatcgacagatatctgga ttgcctggtc gctgctggaa gcggggcgttacggccaccg ggaaagcgct gctcaggcgc attgcccgtgggcctggggc tgatgctgct gcccggtaaa gtcggctttgttcaacccga gctatctccc gccgcagctg gcgaactatttggaccacgc ttcgcgaaac caatttgcgg ctgctgctggtcacccgact gggtgcagta tcaaaaaaat aagggctggctttatcggca gctacgacgc gattcgcgtc tatctctggggacccgcaga aagcgcggct gctggcacgt tttaaacccaaaaggcgtac cccctgagaa agtcgatgtc gccagcggtagtcggtttct ccgcctcact gctgccgttt ttacaaaacccgtcagcgtg tcgccgacca ttttcccggt aatgacgcctctgtttggac aaggatggga tcagcatcgt tttcgtttcacctgactggg gccaggaatg cgcaagttct cattaa<210> 392<211> 371<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<22 0>

SIGNAL(1)...(22)

tgatggcggcaggactatatcctcggaaggttgatcggcttccccgcctggcaattccgctgtggaaagcaagaggtggtccgaagagaatcacccgtttaaaccgcgccaactgaagcccgggcatgtttggcgacgctaaaccacggggcgatgcacaattacagctaccgcaaaggg

gacgaacgttcagcgaaggcgcaaagctacgctgggctgggctgtggggactcggatgccgccggagtaccaaggtgccgatcctggcgctggcgcacccaaaaggcttcagaaaaaacggcacgaccggtacaacgaaacaatggcccgagcggtacaacgtactgacctgaattacac

<221><222><220><221><222>

DOMÍNIO(3)... (349)<223> Família 8 de hidrolase glicosila<400> 392

Met Met Lys Gly Phe Arg Trp Cys Val Met Ala15 10

Ala Thr Asn Val Arg Ala Ala Cys Thr Trp Pro

20 25

Lys Lys Asp Tyr Ile Ser Glu Gly Gly Arg Val

35 40

Ala Arg Lys Ile Ser Thr Ser Glu Gly Gln Ser

50 55

Ala Leu Ala Ala Asn Asp Arg Gln Thr Phe Asp65 70 75

Thr Arg Asp Asn Leu Ala Gln Gly Asp Leu Ser

85 90

Trp Leu Trp Gly Met Lys Glu Lys Glu Lys Glu

100 105

Asp Ser Asn Ser Ala Ser Asp Ala Asp Ile Trp

115 120

55 Leu Glu Ala Gly Arg Leu Trp Lys Ala Pro Glu

130 135

Lys Ala Leu Leu Arg Arg Ile Ala Arg Glu Glu145 150 155

Gly Leu Gly Leu Met Leu Leu Pro Gly Lys Val

165 170

Lys Ser Trp Arg Phe Asn Pro Ser Tyr Leu Pro

180 185

Tyr Phe Thr Arg Phe Gly Ala Pro Trp Thr Thr

195 200

Leu Arg Leu Leu Leu Glu Thr Ala Pro Lys Gly

210 215

Val Gln Tyr Gln Lys Asn Lys Gly Trp Gln Leu

Met Val Val

Ala Trp Glu30

Ile Asp Pro45

Tyr Ala Leu60

Arg Leu Leu

Gln His Leu

Thr Trp Ala110

Ile Ala Trp125

Tyr Thr Ala140

Val Val Lys

Gly Phe Ala

Pro Gln Leu190

Leu Arg Glu

205Phe Ser Pro220

Lys Pro Glu

Met Ala15

Gln Phe

Ser Asp

Phe Phe

Gly Trp80Pro Ala95

Val Ile

Ser Leu

Thr Gly

Val Pro160Glu Glu175

Ala AsnThr AsnAsp TrpLys Thr

60120180240300360420480540600660720780840900960102010801116225 230 235 240

Phe Ile Gly Ser Tyr Asp Ala Ile Arg Val Tyr Leu Trp Ala Gly Met

245 250 255

Leu His Asp Arg Asp Pro Gln Lys Ala Arg Leu Leu Ala Arg Phe Lys

260 265 270

Pro Met Ala Thr Leu Thr Thr Lys Lys Gly Val Pro Pro Glu Lys Val

275 280 285

Asp Val Ala Ser Gly Lys Thr Thr Gly Asn Gly Pro Val Gly Phe Ser

290 295 300

Ala Ser Leu Leu Pro Phe Leu Gln Asn Arg Asp Ala Gln Ala Val Gln305 310 315 320

Arg Gln Arg Val Ala Asp His Phe Pro Gly Asn Asp Ala Tyr Tyr Ser

325 330 335

Tyr Val Leu Thr Leu Phe Gly Gln Gly Trp Asp Gln His Arg Phe Arg

340 345 350

Phe Thr Ala Lys Gly Glu Leu His Pro Asp Trp Gly Gln Glu Cys Ala

355 360 365

Ser Ser His

370<210> 393<211> 1677<212> DNA<213> Bactéria<400> 393

ttggtcatgg agggaaaggg acttctcatg cgtcgacgaa gcgtctcgctgccggtctgc tggcggtgcc cttgacggtg ctgccccagg cacaggccgcgtctccaccg ggaaggcggt gacggcatcg tccgtggaga cctcggccttctcgccgtgg acggcaacgc ggccacccgc tgggcgagcc tcgaaggggttggatccgca tcgacctcgg agccgcccac acgatctccc gcgtcaagctgacgcgtacg ggaaggcgta caagatacag acctcggcgg acggttcgacgtctactcca ccaccgccgg tgacggcgcc accgacgacc tgacggtctccgctacgtcc ggatgtacgg caccgggcgc ggcaccgcct acggctactcttcgaggtgt acggcgcgcc caccggcacc ggcgggggcg ggggcggctcttcggcagcc acctcaggcc ctacaccgcc ggcaccctga agccgtccggtcgatcgacc agaaggtcgt cgactactac aacaagtgga aggccgccttaactgcggca acggctggta ccagatcatc tcgcccgacg ccgaccacccgaggcgcagg gctacggcat ggtcatcgcc gccaccatgg ccggcgccgaaagaagatct tcgacggact cgtcaagtgg aagatcgacc acccgtccgcaacctgctcg ccgccgaaca ggacgtcaac tgtcgcagcg tgaacggcggaccgacggcg acatggacgt ggcctacggc ctgctcctcg ccgacaagcaaccggcacct acaactacaa ggacctcgcg ctcaagcaca tcgccgcgatgaggtcaacc cgacgaccaa gctcctgaag ctcggcgact ggagcagctctactactaca tctcccggac ctccgactgg atggccgacc acttccgggcgcgtcgggcg acaccacgtg ggactccgtg cgctccgcgc accagacccactccagtcga cgtacgcctc cggcaccgga ctcctccccg acttcgtcgtacgacgccca agcccgcccc gcgccaggtg ctcgaggacc cgaacgacggtggaacgcct gccgcacccc gtggcgcatc gcggacgacg ccgtgaccagacctcgctcg cggccgcccg caagctgaac agctggatca agacgaagaccccaacaaga tcgccatcgg ctacaagctc aacggcaccc agatctcctcgccgccttct tcgccccgtt cgcggtggcc gcgatgaccg actccggcagctggacgcgc tgtggaacaa gatggtggcg accccggtcg acaccagcaggcgagcatcc agctccaggt catgatcacg gcatccggca accactgggt<210> 394<211> 558<212> PRT<213> Bactéria<220>

SIGNAL(1) ... (36)

tctcgggctc 60cgacggtctg 120cggggccggt 180cgacccgcag 240caactgggag 300ctggaccgac 360cggcaccggt 420cctctgggag 480ggccgtcccc 540ctcccaggcc 600cgtccggcag 660ctacgtcgcc 720ccccgacgcc 780cgtcaacccg 840cgacggcgcc 900gtggggcagc 960caagaaggac 1020cggcgacgag 1080cttccgggcc 1140gatctcccgg 1200cgacaccaac 1260cgcgtactgg 1320cggggacgcc 1380cggcggcgac 1440gggcagcgag 1500ccaggcctgg 1560ctacttctcc 1620gccgtaa 1677

<221><222><22 0><221><222><223><220><221><222><223>

DOMÍNIO

(46)...(161)

F5/8 tipo C domínio

DOMÍNIO(179)...(553)

Família 8 de hidrolase glicosila<220>

<221> SITE

<222> (498)...(501)

<223> N-glicosilação site. Prosite id = PS00001<400> 394

Met Val Met Glu Gly Lys Gly Leu Leu Met Arg Arg Arg Ser Val Ser15 10 15

Leu Leu Gly Leu Ala Gly Leu Leu Ala Val Pro Leu Thr Val Leu Pro20 25 30

10 Gln Ala Gln Ala Ala Asp Gly Leu Val Ser Thr Gly Lys Ala Val Thr35 40 45

Ala Ser Ser Val Glu Thr Ser Ala Phe Gly Ala Gly Leu Ala Val Asp

50 55 60

Gly Asn Ala Ala Thr Arg Trp Ala Ser Leu Glu Gly Val Asp Pro Gln15 65 70 75 80

Trp Ile Arg Ile Asp Leu Gly Ala Ala His Thr Ile Ser Arg Val Lys

85 90 95

Leu Asn Trp Glu Asp Ala Tyr Gly Lys Ala Tyr Lys Ile Gln Thr Ser100 105 HO

20 Ala Asp Gly Ser Thr Trp Thr Asp Val Tyr Ser Thr Thr Ala Gly Asp115 120 125

Gly Ala Thr Asp Asp Leu Thr Val Ser Gly Thr Gly Arg Tyr Val Arg

130 135 140

Met Tyr Gly Thr Gly Arg Gly Thr Ala Tyr Gly Tyr Ser Leu Trp Glu

25 145 150 155 160

Phe Glu Val Tyr Gly Ala Pro Thr Gly Thr Gly Gly Gly Gly Gly Gly

165 170 175

Ser Ala Val Pro Phe Gly Ser His Leu Arg Pro Tyr Thr Ala Gly Thr180 185 190

30 Leu Lys Pro Ser Gly Ser Gln Ala Ser Ile Asp Gln Lys Val Val Asp195 200 205

Tyr Tyr Asn Lys Trp Lys Ala Ala Phe Val Arg Gln Asn Cys Gly Asn

210 215 220

Gly Trp Tyr Gln Ile Ile Ser Pro Asp Ala Asp His Pro Tyr Val Ala35 225 230 235 240

Glu Ala Gln Gly Tyr Gly Met Val Ile Ala Ala Thr Met Ala Gly Ala

245 250 255

Asp Pro Asp Ala Lys Lys Ile Phe Asp Gly Leu Val Lys Trp Lys Ile260 265 270

40 Asp His Pro Ser Ala Val Asn Pro Asn Leu Leu Ala Ala Glu Gln Asp275 280. 285

Val Asn Cys Arg Ser Val Asn Gly Gly Asp Gly Ala Thr Asp Gly Asp

290 295 300

Met Asp Val Ala Tyr Gly Leu Leu Leu Ala Asp Lys Gln Trp Gly Ser45 305 310 315 320

Thr Gly Thr Tyr Asn Tyr Lys Asp Leu Ala Leu Lys His Ile Ala Ala

325 330 335

Ile Lys Lys Asp Glu Val Asn Pro Thr Thr Lys Leu Leu Lys Leu Gly340 345 350

50 Asp Trp Ser Ser Ser Gly Asp Glu Tyr Tyr Tyr Ile Ser Arg Thr Ser355 360 365

Asp Trp Met Ala Asp His Phe Arg Ala Phe Arg Ala Ala Ser Gly Asp

370 375 380

Thr Thr Trp Asp Ser Val Arg Ser Ala His Gln Thr Gln Ile Ser Arg55 385 390 395 400

Leu Gln Ser Thr Tyr Ala Ser Gly Thr Gly Leu Leu Pro Asp Phe Val

405 410 415

Val Asp Thr Asn Thr Thr Pro Lys Pro Ala Pro Arg Gln Val Leu Glu420 425 430

60 Asp Pro Asn Asp Gly Ala Tyr Trp Trp Asn Ala Cys Arg Thr Pro Trp435 440 445

Arg Ile Ala Asp Asp Ala Val Thr Ser Gly Asp Ala Thr Ser Leu Ala

450 455 460

Ala Ala Arg Lys Leu Asn Ser Trp Ile Lys Thr Lys Thr Gly Gly Asp65 465 470 475 480

Pro Asn Lys Ile Ala Ile Gly Tyr Lys Leu Asn Gly Thr Gln Ile Ser485 490 495Ser Gly Ser Glu Ala Ala Phe Phe Ala Pro Phe Ala Val Ala Ala Met

500 505 510

Thr Asp Ser Gly Ser Gln Ala Trp Leu Asp Ala Leu Trp Asn Lys Met

515 520 525

Val Ala Thr Pro Val Asp Thr Ser Ser Tyr Phe Ser Ala Ser Ile Gln

530 535 540

Leu Gln Val Met Ile Thr Ala Ser Gly Asn His Trp Val Pro

545

<210> 395<211><212>

550

555

1224DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 395

atgaaagtat tccgaaattc gatcatccgt aagtcggtgg tattgttctg tgctgttctatggatcttgc cagccggatt gtctctggcg gccaacaagc cgtttcccca gcatacgtcttatacgagcg gttcgattaa accaaacaat gtaacgcagt cagcgatgga caatgcggtcaagagcaaat ggaacagctg gaaagggtct ttcttgaagc cggctgcgac aggacaatattacgtaaaat acaattcggc gggcgagacg gtgtctgagg ctcatggcta cggaatgattttcaccgttc tgatggcggg ttacgacagt aacgcacagt cgtatttcga cggactttatcgctactata aggcgcatcc gagtaataac aatccgtatc tgatggcttg gaaacagaacagcagctttc agaatataga gggagccaat tcggcaacgg atggcgatat ggacattgcttacgcactcc tgcttgcgga caagcagtgg ggaagcagtg gatcgattaa ttatctccaggcagctaagg atatgatcaa tgcgatcatg agtaatgacg ttaatcagtc gcagtggacgctgcgcttag gcgattgggc aaccagtggc atcttcgata ccgccacgcg gccatcggatttcatgctga accatatgaa ggcattccgt acggctaccg gcgatgcccg ttgggataacgtcatcaaca aaacctatac gatcatcaac tccatctata acggttacag ctccaataccggtttgcttc cggatttcgt tgtcatgtcg ggcggcaatt atcagcctgc ggcagcggaattcctggagg gggcgaacga cggaaaatac tattacaact cggccaggac tccttggcggattacgaccg actatctgat gaccggcgat acgcgcgcgc tgaatcaatt gaacaaaatgaacacgttca ttaagtcggc tgcgaacagc aatcctgcca atatcaaggc agggtataatctgaacggaa ctgcgctggt gacttataac agcggagcgt tctatgcacc gttcggcgtaagcgcgatga cgtcgtccag ccaccagagc tggctgaatt cggtatggaa ttatacggcgaacgcatctg cagagggtta ttatgaggag agcatcaagc tgttctcgat gatcgtcatgtcgggaaatt ggtggacata ttaa<210> 396<211> 407<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

SIGNAL(1)...(30)

<221><222><220><221><222>

site. Prosite id = PS00001

6012018024030036042048054060066072078084090096010201080114012001224

DOMÍNIO(33)...(402)<223> Família 8 de hidrolase glicosila<220>

<221> SITE<222> (50)...(53)<223> N-glicosilação<22 0>

<221> SITE<222> (65)... (68)<223> N-glicosilação<220>

<221> SITE

<222> (142)...(145)

<223> N-glicosilação site. Prosite id = PS00001<220>

SITE

(154) . . . (172)

Família 8 de marca hidrolase glicosila. Prosite id = PS00812

<221><222><223><220><221>

SITEI

715

<222> (246)...(249)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (347)...(350)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (382)...(385)<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (386)...(389)

<223> N-glicosilação site. Prosite id = PS00001<400> 396

Met Lys Val Phe Arg Asn Ser Ile Ile Arg Lys Ser Val Val Leu Phe1 5 10 15

Cys Ala Val Leu Trp Ile Leu Pro Ala Gly Leu Ser Leu Ala Ala Asn20 25 30

20 Lys Pro Phe Pro Gln His Thr Ser Tyr Thr Ser Gly Ser Ile Lys Pro35 40 45

Asn Asn Val Thr Gln Ser Ala Met Asp Asn Ala Val Lys Ser Lys Trp

50 55 60

Asn Ser Trp Lys Gly Ser Phe Leu Lys Pro Ala Ala Thr Gly Gln Tyr25 65 70 75 80

Tyr Val Lys Tyr Asn Ser Ala Gly Glu Thr Val Ser Glu Ala His Gly

85 90 95

Tyr Gly Met Ile Phe Thr Val Leu Met Ala Gly Tyr Asp Ser Asn Ala100 105 HO

Gln Ser Tyr Phe Asp Gly Leu Tyr Arg Tyr Tyr Lys Ala His Pro Ser115 120 125

Asn Asn Asn Pro Tyr Leu Met Ala Trp Lys Gln Asn Ser Ser Phe Gln

130 135 140

Asn Ile Glu Gly Ala Asn Ser Ala Thr Asp Gly Asp Met Asp Ile Ala35 145 150 155 160

Tyr Ala Leu Leu Leu Ala Asp Lys Gln Trp Gly Ser Ser Gly Ser Ile

165 170 175

Asn Tyr Leu Gln Ala Ala Lys Asp Met Ile Asn Ala Ile Met Ser Asn180 185 190

Asp Val Asn Gln Ser Gln Trp Thr Leu Arg Leu Gly Asp Trp Ala Thr195 200 205

Ser Gly Ile Phe Asp Thr Ala Thr Arg Pro Ser Asp Phe Met Leu Asn

210 215 220

His Met Lys Ala Phe Arg Thr Ala Thr Gly Asp Ala Arg Trp Asp Asn45 225 230 235 240

Val Ile Asn Lys Thr Tyr Thr Ile Ile Asn Ser Ile Tyr Asn Gly Tyr

245 250 255

Ser Ser Asn Thr Gly Leu Leu Pro Asp Phe Val Val Met Ser Gly Gly260 265 270

Asn Tyr Gln Pro Ala Ala Ala Glu Phe Leu Glu Gly Ala Asn Asp Gly275 280 285

Lys Tyr Tyr Tyr Asn Ser Ala Arg Thr Pro Trp Arg Ile Thr Thr Asp

290 295 300

Tyr Leu Met Thr Gly Asp Thr Arg Ala Leu Asn Gln Leu Asn Lys Met55 305 310 315 320

Asn Thr Phe Ile Lys Ser Ala Ala Asn Ser Asn Pro Ala Asn Ile Lys

325 330 335

Ala Gly Tyr Asn Leu Asn Gly Thr Ala Leu Val Thr Tyr Asn Ser Gly340 345 350

60 Ala Phe Tyr Ala Pro Phe Gly Val Ser Ala Met Thr Ser Ser Ser His355 360 365

Gln Ser Trp Leu Asn Ser Val Trp Asn Tyr Thr Ala Asn Ala Ser Ala

370 375 380

Glu Gly Tyr Tyr Glu Glu Ser Ile Lys Leu Phe Ser Met Ile Val Met65 385 390 395 400

Ser Gly Asn Trp Trp Thr Tyr405<210> 397<211> 738<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 397

gtgcgaggca ggatgaaaaa ttggcacggg gctcagatcg acgtgaagag cgttcttcaa 60cctggtaaat cttacgagct gacggtatgg gtttaccaaa acagtggaga agatcaacgc 120atcacgctca ccatgcagcg aaaatacaac acggatgaga aaaccaacta cgacactatc 180gtgtggcaga gactcgttcc ttctggcaaa tggaccgaga tcaggggttc ttactctgtg 240atgtccaacg tgaacgtcga agaactcttt ttctacgttg aatcacccaa tcccacgttg 300gagtacaaca tcgacgaggt ggtgatcgtg aacaaaagtg tgatgtccat cgaaccagag 360tgggagattc cttctttgaa agaggtgttc aaagatcgtt tcagagtcgg tgtggcttta 420ccgtacaggg tgctgatgaa tccgctcgaa aggaggctcg tcagtaaaca tttcaacagc 480ataactgcgg aaaacgagat gaaaccagag agcttactcg tctctgtggg taaatacagc 540tttctcaggg cggacgaata tgtacgtttc gcccaagagc acggcttggt cgttcgaggg 600cacacgctgg tttggcacag ccagacccca gagtggttct tcagagatga aaccggcaaa 660ctcctctcga aagatgccat gatcgaaggg atgagacagt acatacacga cgtggtggga 720cacttcaaag gtaagatc 738

<210> 398<211> 246<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO

<222> (2)...(112)

<223> Domínio de carbohidrato

<220>

<221> DOMÍNIO<222> (125)...(246)

<223> Família 10 de hidrolase glicosila<22 0>

<221> SITE

<222> (112)...(115)

<223> N-glicosilação site. Prosite id = PS00001<400> 398

Met Arg Gly Arg Met Lys Asn Trp His Gly Ala Gln Ile Asp Val Lys1 5 10 15 Ser Val Leu Gln Pro Gly Lys Ser Tyr Glu Leu Thr Val Trp Val Tyr 20 25 30 Gln Asn Ser Gly Glu Asp Gln Arg Ile Thr Leu Thr Met Gln Arg Lys 35 40 45 Tyr Asn Thr Asp Glu Lys Thr Asn Tyr Asp Thr Ile Val Trp Gln Arg 50 55 60 Leu Val Pro Ser Gly Lys Trp Thr Glu Ile Arg Gly Ser Tyr Ser Val65 70 75 80Met Ser Asn Val Asn 85 Val Glu Glu Leu Phe 90 Phe Tyr Val Glu Ser 95 ProAsn Pro Thr Leu 100 Glu Tyr Asn Ile Asp 105 Glu Val Val Ile Val 110 Asn LysSer Val Met 115 Ser Ile Glu Pro Glu 120 Trp Glu Ile Pro Ser 125 Leu Lys GluVal Phe Lys Asp Arg Phe Arg Val Gly Val Ala Leu Pro Tyr Arg Val 130 135 140 Leu Met Asn Pro Leu Glu Arg Arg Leu Val Ser Lys His Phe Asn Ser145 150 155 160Ile Thr Ala Glu Asn 165 Glu Met Lys Pro Glu 170 Ser Leu Leu Val Ser 175 Val

Gly Lys Tyr Ser Phe Leu Arg Ala Asp Glu Tyr Val Arg Phe Ala Gln

180 185 190

Glu His Gly Leu Val Val Arg Gly His Thr Leu Val Trp His Ser Gln

195 200 205

Thr Pro Glu Trp Phe Phe Arg Asp Glu Thr Gly Lys Leu Leu Ser Lys210 215 220Asp Ala Met Ile Glu Gly Met Arg Gln Tyr Ile225 230 235

His Phe Lys Gly Lys Ile245

<210> 399<211> 2637<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 399

atgactagtg gacgaaacac atgtgtgtgt ctgttgttgactgtcaaagc caccggcgag cgcgcaaaat gaggcgccttcggttggacc aaccgggagc ggtgatcaat cgcaacatctctcggacgtt tgatctacga cgggctctgg gttggtgaagcgcggattgc gtaacgacgt cgttacggcg ttaaaagaattggcccggcg gctgttttgc cgacgagtat cactggcgtgaagcgtccgc ggcggccgaa cgcgagttgg ggcggcgtcgcatgagttca tggagctgtg cgagatgttg ggcgcagacgggcagcggca cgccgcagga gatgatggaa tggatcgagttcggatctcg ccaacctgcg ccgtcgcaat ggccgcgacattcgccgtcg gcaatgagac gtggggctgt ggtggaaatagacgtgtatc gccagtacgc cacgttcatc aagaaccattctcgcgagcg gtggttacga caacaattac aactggaccggcgaagcaga tcgatggcct gtcgttgcac tattacacgcaagaaaggat cggcgacgga attcggcgaa agcgagtggcttgcgcatcg aggagttcat tcagaagcac agcgcgatcaaagcgcgtcg gtttgatggt tgacgagtgg ggcacgtggtgacatgggcg cgctttatca gcagaacacg ttgcgcgatgctcaatatct ttcacaagta tgccgatcgc gtgcgcatggaacgtgttgc aggcgatggt gttgacggac aaagagaaaacacgtttttc ggatgtatcg cgtgcatcag ggagcgacgcgcgccgcagt acacgctggg tggtgcgtct gtgccgtcgtgacggtgaag gacgggtgca tctgtcgatc gtgaatctcgatcgatgcga acggaccgtt cagcagtgtc aagggagaagaatgcgctga atactttcga tcacccggat agtgtcaagcaaattagaag gctctaaatt aatcctgaat attccggcgacttggaccac agaaacaagc aacgctcaaa gatgcattcagcggcgctca accggcgaca gttcttcgaa gaagacgctcatgcatttca actcgatcac gccggagaac gtgttgaagtccgaacaagt acgacttcac cgctcccgat cgcttcgtcgatgttcgtcg tcggacacac gctcgtctgg cataaccaaagacgaaaaga aacagccgct cgatcgcgag acgttgctgattcaccgtcg tcggccgtta caagggacgc attaaaggctctgaatcagg atggcacgat gcggcagtcg ccgtggttcactcgtcaaag cgtttgagtt tgcccacgag gccgatccaggactacgatc tcgagctgcc ggcgaagcgc gcaggcgccgaaagccgcgg gtgtgtcgct tgctggtgtg ggattgcagaccgtcagccg cagatgtgga tgcgacgatc gcggcgttcgcacatcacgg aactcgacgt cgacgtgctg ccgcgcacgagcagtcgacg tgaaggtgac gccgcagttg aacccgtatccgacagtcgg cgttggcgag gcgttatgcg gagctgtttcgacgcgatcg agcgtgtgac gttctgggga gttgcggacgtggcccatcc gcggcaggac aaactatccg ctgctcttcgccggcgttag cgtcggtgat cgaaaccgct aattattcaa<210> 400<211> 878<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

SIGNAL(1)...(28)

His Asp Val Val Gly240

ttgtgctggcataaagccacacggccagttgatcgtcgattgcatgtgccacggcattggattcgaatgccttatatcaaacatgacttcagccgtggaatgcggccggacaggcaatcgaggtgctgattgcccaccggacgcgacgcttggacaagcaacgaccgcgacggttgcggccgaacatcgctggtgctgactgatcccggttgagcgtgtcatccagcgcgtattgactgcccgtgtctttaatccgtggtaaaacgatttgcggcgcagagggggctggtaattcggcgacgccgcgctgaacgaatgcggggacgtagtagatcatcggccgccgagcttcgaactgctaccacagtctcgaatctgggcgaaacccggtcgacggcttacgtgtttaggcgattcgtgatcgttccggcggaacgtcg

gatcggtctt 60gctgacgatc 120tgcggagcat 180cccgaacacg 240tgtgctgcgt 300accacgcgac 360gtttggcacg 420tggcaacgtc 480cgattccgat 540ggtgccgtat 600gttttacgcc 660cattcagaaa 720ggcçjcaggcg 780caactgggac 840cgccaggacg 900cgatccgcag 960cgagggccgc 1020cggtatcaat 1080gcagatggtg 1140gccgacgtat 1200cgaggttagt 1260ggcttcgcgt 1320ggcggcggag 1380gccggcggtg 1440taatggatat 1500ggtgttggaa 1560catgatcggc 1620gatcgtgcgc 1680ccatcccgaa 1740gaagcacggc 1800ggtttttgaa 1860cgatcacatc 1920caacgaggcg 1980cgaggattat 2040ttattacaac 2100gaagaaactg 2160catggagtgg 2220tttgaaggtt 2280tgcggattac 2340accggaggcg 2400aaaacatcgc 2460gttgaacaac 2520ccaaccgaaa 2580acggtga 2637

<221><222><220><221><222>

DOMÍNIO(328)...(515)<223> Alfa-L-arabinofuranosidase C-terminus<220>

<221> DOMÍNIO<222> (528)...(870)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (128)...(131)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (208)...(211)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (235)...(238)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (254) . . . (257)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (745)...(748)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (768) .. . (778)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<220>

<221> SITE

<222> (884)...(887)

<223> N-glicosilação site. Prosite id = PS00001<400> 400

Met Thr Ser Gly Arg Asn Thr Cys Val Cys Leu Leu Leu Ile Val Leu1 5 10 15 Ala Ile Gly Leu Leu Ser Lys Pro Pro Ala Ser Ala Gln Asn Glu Ala 20 25 30 Pro Tyr Lys 35 Ala Thr Leu Thr Ile 40 Arg Leu Asp Gln Pro 45 Gly Ala ValIle Asn 50 Arg Asn Ile Tyr Gly 55 Gln Phe Ala Glu His 60 Leu Gly Arg LeuIle Tyr Asp Gly Leu Trp Val Gly Glu Gly Ser Ser Ile Pro Asn Thr65 70 75 80Arg Gly Leu Arg Asn 85 Asp Val Val Thr Ala 90 Leu Lys Glu Leu His 95 ValPro Val Leu Arg 100 Trp Pro Gly Gly Cys 105 Phe Ala Asp Glu Tyr 110 His TrpArg Asp Gly 115 Ile Gly Pro Arg Asp 120 Lys Arg Pro Arg Arg 125 Pro Asn AlaSer Trp Gly Gly Val Asp Ser Asn Ala Phe Gly Thr His Glu Phe Met 130 135 140 Glu Leu Cys Glu Met Leu Gly Ala Asp Ala Tyr Ile Asn Gly Asn Val145 150 155 160Gly Ser Gly Thr Pro 165 Gln Glu Met Met Glu 170 Trp Ile Glu Tyr Met 175 ThrSer Asp Ser Asp 180 Ser Asp Leu Ala Asn 185 Leu Arg Arg Arg Asn 190 Gly ArgAsp Lys Pro 195 Trp Lys Val Pro Tyr 200 Phe Ala Val Gly Asn 205 Glu Thr TrpGly Cys Gly Gly Asn Met Arg Pro Glu Phe Tyr Ala Asp Val Tyr Arg 210 215 220 Gln Tyr Ala Thr Phe Ile Lys Asn His Ser Gly Asn Arg Ile Gln Lys225 230 235 240Leu Ala Ser Gly Gly Tyr Asp Asn Asn Tyr Asn Trp Thr Glu Val Leu 245 250 255 Met Ala Gln Ala Ala Lys Gln Ile Asp Gly Leu Ser Leu His Tyr Tyr260 265 270

Thr Leu Pro 275 Thr Gly Asn Trp Asp 280 Lys Lys Gly Ser Ala 285 Thr Glu Phe Gly Glu Ser Glu Trp His Ala Thr Leu Ala Arg Thr Leu Arg Ile Glu 290 295 300 Glu Phe Ile Gln Lys His Ser Ala Ile Met Asp Lys His Asp Pro Gln 305 310 315 320 Lys Arg Val Gly Leu Met Val Asp Glu Trp Gly Thr Trp Tyr Asp Arg 325 330 335 Asp Glu Gly Arg Asp Met Gly Ala Leu Tyr Gln Gln Asn Thr Leu Arg 340 345 350 Asp Ala Val Ala Ala Gly Ile Asn Leu Asn Ile Phe His Lys Tyr Ala 355 360 365 Asp Arg Val Arg Met Ala Asn Ile Ala Gln Met Val Asn Val Leu Gln 370 375 380 Ala Met Val Leu Thr Asp Lys Glu Lys Met Val Leu Thr Pro Thr Tyr 385 390 395 400 His Val Phe Arg Met Tyr Arg Val His Gln Gly Ala Thr Leu Ile Pro 405 410 415 Val Glu Val Ser Ala Pro Gln Tyr Thr Leu Gly Gly Ala Ser Val Pro 420 425 430 Ser Leu Ser Val Ser Ala Ser Arg Asp Gly Glu Gly Arg Val His Leu 435 440 445 Ser Ile Val Asn Leu Asp Pro Ala Arg Ala Ala Glu Ile Asp Ala Asn 450 455 460 Gly Pro Phe Ser Ser Val Lys Gly Glu Val Leu Thr Ala Pro Ala Val 465 470 475 480 Asn Ala Leu Asn Thr 485 Phe Asp His Pro Asp 490 Ser Val Lys Pro Val 495 Ser Phe Asn Gly Tyr 500 Lys Leu Glu Gly Ser 505 Lys Leu Ile Leu Asn 510 Ile Pro Ala Lys Ser Val Val Val Leu Glu Leu Gly Pro Gln Lys Gln Ala Thr 515 520 525 Leu Lys Asp Ala Phe Lys Asn Asp Phe Met Ile Gly Ala Ala Leu Asn 530 535 540 Arg Arg Gln Phe Phe Glu Glu Asp Ala Arg Gly Ala Glu Ile Val Arg 545 550 555 560 Met His Phe Asn Ser Ile Thr Pro Glu Asn Val Leu Lys Trp Gly Leu 565 570 575 Val His Pro Glu 580 Pro Asn Lys Tyr Asp 585 Phe Thr Ala Pro Asp 590 Arg Phe Val Glu Phe 595 Gly Glu Lys His Gly 600 Met Phe Val Val Gly 605 His Thr Leu Val Trp His Asn Gln Thr Pro Arg Trp Val Phe Glu Asp Glu Lys Lys 610 615 620 Gln Pro Leu Asp Arg Glu Thr Leu Leu Lys Arg Met Arg Asp His Ile 625 630 635 640 Phe Thr Val Val Gly 645 Arg Tyr Lys Gly Arg 650 Ile Lys Gly Trp Asp 655 Val Val Asn Glu Ala 660 Leu Asn Gln Asp Gly 665 Thr Met Arg Gln Ser 670 Pro Trp Phe Lys Ile 675 Ile Gly Glu Asp Tyr 680 Leu Val Lys Ala Phe 685 Glu Phe Ala His Glu Ala Asp Pro Ala Ala Glu Leu Tyr Tyr Asn Asp Tyr Asp Leu 690 695 700 Glu Leu Pro Ala Lys Arg Ala Gly Ala Val Glu Leu Leu Lys Lys Leu 705 710 715 720 Lys Ala Ala Gly Val Ser Leu Ala Gly Val Gly Leu Gln Asn His Ser 725 730 735 Leu Met Glu Trp 740 Pro Ser Ala Ala Asp 745 Val Asp Ala Thr Ile 750 Ala Ala Phe Ala Asn 755 Leu Gly Leu Lys Val 760 His Ile Thr Glu Leu 765 Asp Val Asp Val Leu Pro Arg Thr Thr Lys Pro Gly Ala Asp Tyr Ala Val Asp Val 770 775 780 Lys Val Thr Pro Gln Leu Asn Pro Tyr Leu Asp Gly Leu Pro Glu Ala 785 790 795 800Arg Gln Ser Ala Leu Ala Arg Arg Tyr Ala Glu Leu Phe His Val Phe

805 810 815

Arg Lys His Arg Asp Ala Ile Glu Arg Val Thr Phe Trp Gly Val Ala

820 825 830

Asp Gly Asp Ser Trp Leu Asn Asn Trp Pro Ile Arg Gly Arg Thr Asn

835 840 845

Tyr Pro Leu Leu Phe Asp Arg Ser Gly Gln Pro Lys Pro Ala Leu Ala

850 855 860

Ser Val Ile Glu Thr Ala Asn Tyr Ser Thr Glu Arg Arg Arg865 870 875

<210> 401<211> 1242<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 401

atgctaaaag ttttacgtaa acctattatt tctggattag ctttagctct attattgccggcaggggcag ctggtgccga aactaatatt tcaaagaagc caaatataag tggattaaccgcgccgcaat tagaccaaag atataaagat tctttcacca ttggtgctgc ggttgagccgtatcaattat tagatgcaaa agattcacaa atgctaaagc ggcattttaa tagtatcgtagcagagaatg tcatgaagcc tagtagttta cagccagtag aaggacaatt caactgggagccggctgata aacttgttca gtttgcgaag gaaaatggaa tggacatgcg aggtcatacgcttgtctggc atagccaggt accggattgg ttctttgaag atgcggcagg aaatccaatggttgtttggg aaaatggcag gcaagtggtt gccgatccat caaagcttca ggaaaacaaagagctcttac ttagccgatt acaaaatcat attcaggcag tcgtaacgcg ttataaagatgatataaaat cttgggatgt tgtcaatgaa gtaatcgatg aatggggcgg acattctgaagggctgcgtc aatctccatg gttcctcatc accggaacgg actatattaa agttgcttttgaaactgcaa gagaatatgc agctccagac gctaagctgt átatcaatga ttacaatacagaagtagaac caaaaaggac gcacctttat aacttagtaa aaagtttaaa agaagaacagaacgttccga ttgatggtgt tgggcatcag tctcacattc aaattggctg gccttcagaaaaagaaattg aagatactat taatatgttt gcagatcttg gtttagataa ccaaatcaccgagcttgatg ttagtatgta tggctggccg gtaaggtcgt atccaaetta tgatgcgatcccagaactta aattcatgga tcaagcagct cgttatgatc gtttatttaa gttatatgagaaattaggag ataaaatcag taatgtgaca ttctggggta ttgcggataa ccatacatggctgaatgacc gcgcagatgt ttactatgat gaaaatggaa atgttgtatt agatagagaaacaccaagag tagaaagagg agcaggaaaa gatgcgccat ttgtatttga tcctgaatacaatgtaaaac cagcttattg ggcaattatc gatcacaaat aa<210> 402<211> 413<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(26)<220><221><222>

DOMÍNIO(43)...(413)<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (29)...(32)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (35)...(38)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (298)..,<223> Família<220>

<221> SITE<222> (353)..

6012018024030036042048054060066072078084090096010201080114012001242

(308)

10 ativa site de hidrolases glicosila. Prosite id = PS00591

(356)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (362) . . . (365)

<223> N-glicosilação site. Prosite id = PS00001<400> 402

Met Leu Lys Val Leu Arg Lys Pro Ile Ile Ser Gly Leu Ala Leu Alal S 10 15

Leu Leu Leu Pro Ala Gly Ala Ala Gly Ala Glu Thr Asn Ile Ser Lys20 25 30

Lys Pro Asn Ile Ser Gly Leu Thr Ala Pro Gln Leu Asp Gln Arg Tyr35 40 45

Lys Asp Ser Phe Thr Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Leu

50 55 60

Asp Ala Lys Asp Ser Gln Met Leu Lys Arg His Phe Asn Ser Ile Val65 70 75 80

Ala Glu Asn Val Met Lys Pro Ser Ser Leu Gln Pro Val Glu Gly Gln

85 90 95

Phe Asn Trp Glu Pro Ala Asp Lys Leu Val Gln Phe Ala Lys Glu Asn100 105 HO

Gly Met Asp Met Arg Gly His Thr Leu Val Trp His Ser Gln Val Pro115 120 125

Asp Trp Phe Phe Glu Asp Ala Ala Gly Asn Pro Met Val Val Trp Glu

130 135 140

Asn Gly Arg Gln Val Val Ala Asp Pro Ser Lys Leu Gln Glu Asn Lys145 150 155 160

Glu Leu Leu Leu Ser Arg Leu Gln Asn His Ile Gln Ala Val Val Thr

165 170 175

Arg Tyr Lys Asp Asp Ile Lys Ser Trp Asp Val Val Asn Glu Val Ile180 185 190

Asp Glu Trp Gly Gly His Ser Glu Gly Leu Arg Gln Ser Pro Trp Phe195 200 205

Leu Ile Thr Gly Thr Asp Tyr Ile Lys Val Ala Phe Glu Thr Ala Arg

210 215 220

Glu Tyr Ala Ala Pro Asp Ala Lys Leu Tyr Ile Asn Asp Tyr Asn Thr225 230 235 240

Glu Val Glu Pro Lys Arg Thr His Leu Tyr Asn Leu Val Lys Ser Leu

245 250 255

Lys Glu Glu Gln Asn Val Pro Ile Asp Gly Val Gly His Gln Ser His260 265 270

Ile Gln Ile Gly Trp Pro Ser Glu Lys Glu Ile Glu Asp Thr Ile Asn275 280 285

Met Phe Ala Asp Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu Asp Val

290 295 300

Ser Met Tyr Gly Trp Pro Val Arg Ser Tyr Pro Thr Tyr Asp Ala Ile305 310 315 320

Pro Glu Leu Lys Phe Met Asp Gln Ala Ala Arg Tyr Asp Arg Leu Phe

325 330 335

Lys Leu Tyr Glu Lys Leu Gly Asp Lys Ile Ser Asn Val Thr Phe Trp340 345 350

Gly Ile Ala Asp Asn His Thr Trp Leu Asn Asp Arg Ala Asp Val Tyr355 360 365

Tyr Asp Glu Asn Gly Asn Val Val Leu Asp Arg Glu Thr Pro Arg Val

370 375 380

Glu Arg Gly Ala Gly Lys Asp Ala Pro Phe Val Phe Asp Pro Glu Tyr.385 390 395 400

Asn Val Lys Pro Ala Tyr Trp Ala Ile Ile Asp His Lys405 410

<210> 403<211> 1158<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 403

atgagtcaac tcgatttgaa tctaaagctg ttcaggcgag tgttttttgc gttggtgcttacgagcatta ttgcgtcagt tctttcagct tcggttgcaa gccaacagca gaacaccacactgaaggacg cctttaaaaa gcacttcttg attggcgctg cgctcaaccg gaaccagttt

60120180tcagaaaaag atatgcgtgg tgtttcgatt atcactacgc agttcaatac gatcactgctgaaaaccaat tgaagtggca gtcgatccac cctcaaccaa ataagtacga cttcgagggaggcgatcaat ttgtcgcgtt tggcgagaaa cacaagatgg tcatcattgg tcacacgcttgtctggcata accagacgcc gaagtgggtg tttcaagatg agaacggcgg tcgcatatcaagagatgcgc tcctcgaacg aatgcgcgat cacattcaaa ctgtcgttgg ccgttacaagggtcggatca aaggttggga tgtagtcaac gaagcaatca acgacgacgg aaccatgcgcgagtcggaat ggcagaagat cattggtaat gactatatcg agcgtgcttt caagtttgcacatgaagcag atccaaacgc cgaactgtac tacaacgact atgatctgga aggtcctccgaaacgcaagg gtgctattga actcatcaag aaactcaaag cggccggtgt tgcgattcacggagttgggc tccaggcaca cagcatgatg gattggcctt ccgtcgctga acaggaacagacgattcttg atttcgccaa tctcggctta cgcgtacaca tcacagaaat ggacctcgagatgttgcctc gtaaacagaa aaaccaggat gcggaaacga gctcgagtgt gacgttggacgagaagtgga atccttatgc gaagggtctt cccgatgacg tttctcaggc ccaggcgaagcgttacgcgg atttgtttgc tgttttcgtc aagcatagcg acaagatcga tcgcgtgacgttctggggag ttaccgatgg cgattcgtgg cttaacaact ggccgatccg cggaagaacaaactatccgt tgctattcga ccgcaccgga aaaccgaagc cggccttttc agccgtaatccagaccgcgg gtccctaa<210> 404<211> 385<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental

<220><221><222>

DOMÍNIO(40) . . . (383)<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (38)...(41)

<223> N-glicosilação site. Prosite id = PS00001<400> 404

Met Ser Gln Leu Asp Leu Asn Leu Lys Leu Phe Arg Arg Val Phe Phe 1 5 10 15 35 Ala Leu Val Leu 20 Thr Ser Ile Ile Ala .25 Ser Val Leu Ser Ala 30 Ser Val Ala Ser Gln 35 Gln Gln Asn Thr Thr 40 Leu Lys Asp Ala Phe 45 Lys Lys His Phe Leu Ile Gly Ala Ala Leu Asn Arg Asn Gln Phe Ser Glu Lys Asp40 50 55 60 Met Arg Gly Val Ser Ile Ile Thr Thr Gln Phe Asn Thr Ile Thr Ala 65 70 75 80 Glu Asn Gln Leu Lys 85 Trp Gln Ser Ile His 90 Pro Gln Pro Asn Lys 95 Tyr45 Asp Phe Glu Gly Gly Asp Gln Phe Val Ala Phe Gly Glu Lys His Lys 100 105 110 Met Val Ile 115 Ile Gly His Thr Leu 120 Val Trp His Asn Gln 125 Thr Pro Lys Trp Val Phe Gln Asp Glu Asn Gly Gly Arg Ile Ser Arg Asp Ala Leu50 130 135 140 Leu Glu Arg Met Arg Asp His Ile Gln Thr Val Val Gly Arg Tyr Lys 145 150 155 160 Gly Arg Ile Lys Gly 165 Trp Asp Val Val Asn 170 Glu Ala Ile Asn Asp 17 5 Asp55 Gly Thr Met Arg Glu Ser Glu Trp Gln Lys Ile Ile Gly Asn Asp Tyr 180 185 190 Ile Glu Arg 195 Ala Phe Lys Phe Ala 200 His Glu Ala Asp Pro 205 Asn Ala Glu60 Leu Tyr Tyr Asn Asp Tyr Asp Leu Glu Gly Pro Pro Lys Arg Lys Gly 210 215 220 Ala Ile Glu Leu Ile Lys Lys Leu Lys Ala Ala Gly Val Ala Ile His 225 230 235 240 Gly Val Gly Leu Gln Ala His Ser Met Met Asp Trp Pro Ser Val Ala 245 250 255 65 Glu Gln Glu Gln 260 Thr Ile Leu Asp Phe 265 Ala Asn Leu Gly Leu 270 Arg Val His Ile Thr Glu Met Asp Leu Glu Met Leu Pro Arg Lys Gln Lys Asn

2403003604204805406006607207808409009601020108011401158275 280 285

Gln Asp Ala Glu Thr Ser Ser Ser Val Thr Leu Asp Glu Lys Trp Asn

290 295 300

Pro Tyr Ala Lys Gly Leu Pro Asp Asp Val Ser Gln Ala Gln Ala Lys305 310 315 320

Arg Tyr Ala Asp Leu Phe Ala Val Phe Val Lys His Ser Asp Lys Ile

325 330 335

Asp Arg Val Thr Phe Trp Gly Val Thr Asp Gly Asp Ser Trp Leu Asn340 345 350

Asn Trp Pro Ile Arg Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg355 360 365

Thr Gly Lys Pro Lys Pro Ala Phe Ser Ala Val Ile Gln Thr Ala Gly370 375 380

Pro

385

<210> 405<211> 1065<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 405

atggcaaccg caacggtttc cgcgcaaaat agcaacgccc ccgcgttgag tctgaaagac 60

gcgtatgccg gcaaattcct gatcggttgt gcgggcgagg tgccggggcg gctttccgcg 120gaggaactgg ccaacatcaa gttccattac aacgtcatta cgcccgagaa ctcgatgaag 180ccgcagccga cgcagcctac cgaagggacg tacaactttg cgacgcccga cgggctggtg 240aaatgggccg gggagaataa tctcaaagtc tgggggcaca cgctggcgtg gcacgcgcaa 300accggccggt ggttcttcga gcccggggcg gacggtcagc ccgtgacgcg cgagctggcg 360atggaacgat tgcgcaaaca catcatgacc gtggccggcc attacaaggg caaggtcctg 420ggctgggatg tcgtgaatga atccatcgcg gacggcggtt cgggtgaaac cgagaatctg 480cgcaattcca gttggtatcg ggtcattggg ccggacgtgc tgaccatggc gttcaagtgg 540gcgcacgagg ccgaccccga cgcgcaactt tactacaacg actacaatat cgagcagggc 600gcggtggcga accggggcaa gcacgccagt tcgctgctgc tgctcaagcg gctcatcgcg 660gagggcgcgc cgatccacgg cgtcggcatc cagggccact ggcatctgga caccaatctc 720gcggatgtcg agaaagccat cgagaactac gccgccctgg ggctgcgcgt cgccatcacg 780gaactggacg tgacggcgat tggccggaac accggggcgt ttcaaaccga tgccggcacc 840aacgctgtga ccgccgaggc ctttcaaaag caggccgagg tttaccggaa attgttcgag 900attttcctga agcacgagaa gtccattgat cgcgtgacgt tctggggcat cagtgaccgg 960cgctcgtggc ggtcccggca atatccgttg ttgttcgacg cgcaaatgca acccaagccg 1020gccctgcaag caattctgga cgtcgcccaa cggagccagc cgtaa 1065

<210> 406<211> 354<212> PRT

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (17)...(349)<223> Família 10 de hidrolase glicosila<220><221> SITE<222> (148)...(151)

<223> N-glicosilação site. Prosite id = PS00001

<22 0>

<221> SITE

<222> (164)...(167)

<223> N-glicosilação site. Prosite id = PS00001<400> 406

Met Ala Thr Ala Thr Val Ser Ala Gln Asn Ser Asn Ala Pro Ala Leu1 5 10 15

Ser Leu Lys Asp Ala Tyr Ala Gly Lys Phe Leu Ile Gly Cys Ala Gly

20 25 30

Glu Val Pro Gly Arg Leu Ser Ala Glu Glu Leu Ala Asn Ile Lys Phe35 40 45

His Tyr Asn Val Ile Thr Pro Glu Asn Ser Met Lys Pro Gln Pro Thr50 55 60Gln Pro Thr Glu Gly Thr Tyr Asn Phe Ala Thr Pro Asp Gly Leu Val65 70 75 80Lys Trp Ala Gly Glu Asn Asn Leu Lys Val Trp Gly His Thr Leu Ala 85 90 95 Trp His Ala Gln Thr Gly Arg Trp Phe Phe Glu Pro Gly Ala Asp Gly 100 105 110 Gln Pro Val Thr Arg Glu Leu Ala Met Glu Arg Leu Arg Lys His Ile 115 120 125 ValMet Thr 130 Val Ala Gly His Tyr Lys 135 Gly Lys Val Leu 140 Gly Trp Asp Val Asn Glu Ser Ile Ala Asp Gly Gly Ser Gly Glu Thr Glu Asn Leu145 150 155 160Arg Asn Ser Ser Trp Tyr Arg Val Ile Gly Pro Asp Val Leu Thr Met 165 170 175 Ala Phe Lys Trp Ala His Glu Ala Asp Pro Asp Ala Gln Leu Tyr Tyr 180 185 190 HisAsn Asp Tyr Asn Ile Glu Gln Gly Ala Val Ala Asn Arg Gly Lys 195 200 205 Ala Ser Ser Leu Leu Leu Leu Lys Arg Leu Ile Ala Glu Gly Ala Pro 210 215 220 Ile His Gly Val Gly Ile Gln Gly His Trp His Leu Asp Thr Asn Leu225 230 235 240Ala Asp Val Glu Lys Ala Ile Glu Asn Tyr Ala Ala Leu Gly Leu Arg 245 250 255 Val Ala Ile Thr Glu Leu Asp Val Thr Ala Ile Gly Arg Asn Thr Gly 260 265 270 Ala Phe Gln 275 Thr Asp Ala Gly Thr 280 Asn Ala Val Thr Ala 285 Glu Ala PheGln Lys 290 Gln Ala Glu Val Tyr Arg 295 Lys Leu Phe Glu 300 Ile Phe Leu LysHis Glu Lys Ser Ile Asp Arg Val Thr Phe Trp Gly Ile Ser Asp Arg305 310 315 320Arg Ser Trp Arg Ser Arg Gln Tyr Pro Leu Leu Phe Asp Ala Gln Met 325 _ 330 335 Gln Pro Lys Pro Ala Leu Gln Ala Ile Leu Asp Val Ala Gln Arg Ser 340 345 350

Gln Pro

<210> 407<211> 1173<212> DNA<213> Desconhecido<22 0>

<223> Obtido para amostra ambiental<400> 407

atggcgtttt ctaaggacaa agcatccttc accaggcgga gcgcgatcgc ggccggactcgctgcgggtg tctccgcgtg cgtgacacca caaccgggcg tcccggcaat gccctcgctcgatcagcttg ccaagcgaag cggccgtcgc ttcggttctg ccgtcggatg gggtcgccccggcgctgacc gcggcagctt cgccaacccg gcctatgcag caatcctcga aaacgagtgctcgctcctcg tgcccgagaa cgagctgaag tggcaatgga cccgcccggg gccggggcagttcgacttcc gccagttcga cgccatcgcc gattacgcct cgcgcaaggg cctattgttgcgtggtcaca cgctcttctg gctgccggag aaatggtatc ccaaatggct ggtcgcccatgactttgggg cgcagcccgc tgcgaaagcg gaagcgatgc ttcgggagca tgtccagacggtgtgccgcc ggtacggcac acgcatctat tcctacgacg tcgtcaàcga ggcggtgcagccggaaacgg gactgatccg cgatacggtc gtgacgaagg cgctcggtca cgaggcgactctggacgtga tgttccagac cgcgcgagcc gaggctccgc acgcgcagct cgtctacaacgactacatga gctgggagcg gaacagcgag gacgagacgc acatgcgcgg cgtgctcaagttgctcgagg gatttcggaa gcgcggtacc ccggtcgacg cactcggaat ccagtcgcacatccggttac taaagccgct gacggtcgcg gaaatcgtac gcgagtccgg gggaccgtggcgccgcttcc tcgatgaggt cgtcgccatg ggctacaagc ttgaaatcac cgaattcgacgtgaacgaca ggctggcgcc gacgaaccca ctggagcgcg atcggatggt cgccgactacgcgaaagcct atctcgacgt gatgctcagc tatccgcagc tgcgcgacat catggcttgggggatggtcg accgatacag ctggctgacc ggtttcgatc cgcggaaaga caagacgctcaagcgcggca cgccttatga caagcacttc cgcccgaagc tcttgcgtga ggcgattgcagcggcattca tgggggctgc cgcgcccgcc tga<210> 408<211> 390<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental

<220>

<221> SIGNAL<222> (1)...(26)<220>

<221> DOMÍNIO <222> (39) . . . (383)

<223> Família 10 de hidrolase glicosila<400> 408

Met Ala Phe Ser Lys Asp Lys Ala Ser Phe Thr Arg Arg Ser Ala Ile! 5 10 15

15 Ala Ala Gly Leu Ala Ala Gly Val Ser Ala Cys Val Thr Pro Gln Pro 25 30

Gly Val Pro Ala Met Pro Ser Leu Asp Gln Leu Ala Lys Arg Ser Gly

35 40 45

Arg Arg Phe Gly Ser Ala Val Gly Trp Gly Arg Pro Gly Ala Asp Arg 50 55 6Ό

Gly Ser Phe Ala Asn Pro Ala Tyr Ala Ala Ile Leu Glu Asn Glu Cys65 70 75 80

Ser Leu Leu Val Pro Glu Asn Glu Leu Lys Trp Gln Trp Thr Arg Pro85 90 95

Gly Pro Gly Gln Phe Asp Phe Arg Gln Phe Asp Ala Ile Ala Asp Tyr100 105 HO

Ala Ser Arg Lys Gly Leu Leu Leu Arg Gly His Thr Leu Phe Trp Leu

115 120 125

Pro Glu Lys Trp Tyr Pro Lys Trp Leu Val Ala His Asp Phe Gly Ala 130 135 140

Gln Pro Ala Ala Lys Ala Glu Ala Met Leu Arg Glu His Val Gln Thr145 150 155 160

Val Cys Arg Arg Tyr Gly Thr Arg Ile Tyr Ser Tyr Asp Val Val Asn165 170 175

Glu Ala Val Gln Pro Glu Thr Gly Leu Ile Arg Asp Thr Val Val Thr180 185 190

Lys Ala Leu Gly His Glu Ala Thr Leu Asp Val Met Phe Gln Thr Ala

195 200 205

Arg Ala Glu Ala Pro His Ala Gln Leu Val Tyr Asn Asp Tyr Met Ser

210 215 220

Trp Glu Arg Asn Ser Glu Asp Glu Thr His Met Arg Gly Val Leu Lys225 230 235 240

Leu Leu Glu Gly Phe Arg Lys Arg Gly Thr Pro Val Asp Ala Leu Gly245 250 255

Ile Gln Ser His Ile Arg Leu Leu Lys Pro Leu Thr Val Ala Glu Ile260 265 270

Val Arg Glu Ser Gly Gly Pro Trp Arg Arg Phe Leu Asp Glu Val Val

275 280 285

Ala Met Gly Tyr Lys Leu Glu Ile Thr Glu Phe Asp Val Asn Asp Arg50 290 295 300

Leu Ala Pro Thr Asn Pro Leu Glu Arg Asp Arg Met Val Ala Asp Tyr305 310 315 320

Ala Lys Ala Tyr Leu Asp Val Met Leu Ser Tyr Pro Gln Leu Arg Asp325 330 335

55 Ile Met Ala Trp Gly Met Val Asp Arg Tyr Ser Trp Leu Thr Gly Phe340 345 350

Asp Pro Arg Lys Asp Lys Thr Leu Lys Arg Gly Thr Pro Tyr Asp Lys

355 360 365

His Phe Arg Pro Lys Leu Leu Arg Glu Ala Ile Ala Ala Ala Phe Met60 370 375 380

Gly Ala Ala Ala Pro Ala385 390

<210> 409<211> 63065 <212> DNA

<213> Desconhecido<220>60120180240300360420480

<223> Obtido para amostra ambiental<400> 409

atgaaggtta cagcagcgtt cgcgggcctc ttggccacag tattggctgc ccctgccgccgactctgctc tggtggaacg ggcgagtggt attaactatg tccagaatta caacggcaaccttggagact tcacgtacaa tgagagtgca ggaacttatt cgatgtactg ggaaaacggagtcaatggag acttcgtcgt tggcttaggc tggagtactg gtgctgcgcg ctccattacctactctgcaa actataatgc tgctagttct ggctcctacc tctcggtcta tggctggataaactctccac aagctgaata ctatatcgtt gagaattatg gcgattacaa cccttgcagcggggctcaga gcctgggtac ccttacctct gatggtggca cctaccaagt ctgcaccgacacacgttaca accagccatc catcacggga acgagcacct tcacgcagtt cttctccgttcgacaaagca agcgctcgtc tggaactgtc acgactggta accatttcaa tttctgggcc 540cagcatggct tcgggaactc gtacaatttc caggtcatgg cagtggaggc attcagtggc 600gcaggaagtg ccactgttac cgtgtcttaa 630

<210> 410<211> 209<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(19)<220>

<221> DOMÍNIO<222> (27)...(208)

<223> Família 11 de glicosila hidrolases<220>

<221> SITE<222> (47)...(50)

<223> N-glicosilação site. Prosite id = PS00001<22 0>

<221> SITE

<222> (104)...(114)

<223> Família 11 de glicosila hidrolases ativa site marca 1. Prosite idPS00776<400> 410

Met Lys Val Thr Ala Ala Phe Ala Gly Leu Leu Ala Thr Val Leu Ala1 5 10 15 Ala Pro Ala Ala 20 Asp Ser Ala Leu Val 25 Glu Arg Ala Ser Gly 30 Ile AsnTyr Val Gln Asn Tyr Asn Gly Asn Leu Gly Asp Phe Thr Tyr Asn Glu 35 40 45 Ser Ala Gly Thr Tyr Ser Met Tyr Trp Glu Asn Gly Val Asn Gly Asp 50 55 60 Phe Val Val Gly Leu Gly Trp Ser Thr Gly Ala Ala Arg Ser Ile Thr65 70 75 80Tyr Ser Ala Asn Tyr Asn Ala Ala Ser Ser Gly Ser Tyr Leu Ser Val 85 90 95 Tyr Gly Trp Ile Asn Ser Pro Gln Ala Glu Tyr Tyr Ile Val Glu Asn 100 105 110 Tyr Gly Asp Tyr Asn Pro Cys Ser Gly Ala Gln Ser Leu Gly Thr Leu 115 120 125 Thr Ser 130 Asp Gly Gly Thr Tyr 135 Gln Val Cys Thr Asp 140 Thr Arg Tyr AsnGln Pro Ser Ile Thr Gly Thr Ser Thr Phe Thr Gln Phe Phe Ser Val145 150 155 160Arg Gln Ser Lys Arg Ser Ser Gly Thr Val Thr Thr Gly Asn HiS Phe 165 170 175 Asn Phe Trp Ala Gln His Gly Phe Gly Asn Ser Tyr Asn Phe Gln Val 180 185 190 Met Ala Val 195 Glu Ala Phe Ser Gly 200 Ala Gly Ser Ala Thr 205 Val Thr Val

Ser

<210> 411<211> 666<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 411

5 atggttgcct ttacttccct tctcgctggc ttcgccgcca ttgccggagt cctgtctgct

cccactgaat cctccgttga ggtggaaaag cgtcagacca ttggacctgg caccggctac 120aacaatggct attactactc ttactggaac gatggccatg ctggcgtgac atacaccaac 180ggtggcggcg gttccttcac cgtcaactgg tccaactctg gcaactttgt cggaggcaag 240ggatggcagc caggcaccaa gaacaaggtc atcaacttct ctggtagcta caaccccaac 30010 ggaaacagct acctctccat ctacggctgg tctcgcaacc ctctcatcga gtactacatc 360gttgagaact ttggaaccta caacccatcc actggtgcca ccaagctggg tgaggttaca 420tctgacggca gtgtctacga catctaccga actcagcgtg tcaaccagcc ctccatcatc 480ggaaccgcca ccttttacca gtactggtcg gtccgccgca accaccgctc cagcggctcg c/mgtcaacacgg ccaaccactt caacgcctgg gcttctcacg gcctcactct cggcacgatg15 gactaccaga ttgttgctgt ggagggatac tttagctctg gctctgcttc catcactgtcagctaa<210> 412<211> 221<212> PRT20 <213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO

25 <222> (39)...(220)

<223> Família 11 de glicosila hidrolases<220>

<221> SITE<222> (70)...(73)30 <223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (93)...(96)

<223> N-glicosilação site. Prosite id = PS00001

35 <220>

<221> SITE

<222> (115)...(125)

<223> Família 11 de glicosila hidrolases ativa site marca 1. Prosite id -PS00776

40 <220>

<221> SITE

<222> (208)...(219) .

<223> Família 11 de glicosila hidrolases ativa site marca 2. Prosite id -

PS00777

45 <400> 412

50

Met Val Ala Phe Thr Ser Leu Leu Ala Gly Phe Ala Ala Ile Ala Gly1 5 10 15 Val Leu Ser Ala 20 Pro Thr Glu Ser Ser 25 Val Glu Val Glu Lys 30 Arg GlnThr Ile Gly 35 Pro Gly Thr Gly Tyr 40 Asn Asn Gly Tyr Tyr 45 Tyr Ser TyrTrp Asn 50 Asp Gly His Ala Gly 55 Val Thr Tyr Thr Asn 60 Gly Gly Gly GlySer Phe Thr Val Asn Trp Ser Asn Ser Gly Asn Phe Val Gly Gly Lys65 70 75 80Gly Trp Gln Pro Gly Thr Lys Asn Lys Val Ile Asn Phe Ser Gly Ser 85 90 95 Tyr Asn Pro Asn Gly Asn Ser Tyr Leu Ser Ile Tyr Gly Trp Ser Arg 100 105 110 Asn Pro Leu 115 Ile Glu Tyr Tyr Ile 120 Val Glu Asn Phe Gly 125 Thr Tyr AsnPro Ser 130 Thr Gly Ala Thr Lys 135 Leu Gly Glu Val Thr 140 Ser Asp Gly SerVal Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Ile145 150 155 His 160Gly Thr Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Arg Asn Arg

165Ser Ser Gly Ser Val Asn Thr Ala Asn His Phe

180 185

His Gly Leu Thr Leu Gly Thr Met Asp Tyr Gln

195 200

Gly Tyr Phe Ser Ser Gly Ser Ala Ser Ile Thr

210 215

<210> 413<211> 2244<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 413

atgaaaaaga gacaaggttt tatcaaaaaa gggctggtttctggcgttga tcatgatgag cgccacatcg caaacatcggttatggcctt ataatcaacc gacccacatc agctttaacgtggacggtct ggcgcgacgc gcagattacg gcgaacaatgcgggtcatgg gcggcgtgga tggcggcagc accgtctccgctcttcgctt ccatctttga cgagcaaacc ctgtttgacggaccactata acgaaaacgg cgtcatggac tggcatatcgggcagcggcg gcgccaccga cgctgaagtg gacatggcgtgtcaaagtgc agaaaaacgc ctggcctgcc agtccggccggccactaacc tgatcaacgc catttatacc tacgaggtagcctggcgggc tgcccaacaa tcagggcaac gaactgctgcagcgaacttt atccacaagg catcatcaac ctctcctactgttttcggca agtttacggg caacgaagcc gcctggaacgcaggtggtgg acatggtgca ggccaaaccg aataactgctaataattaca acggcgacgc ccaactcgtc tcctggcagaagctacgacg cggcccgttt cgcctggcgt attgccgtcgtctgaggccg ccgaaaccat gaatgaaatt ggcggtttctaacatcggcg aacacaacat gaatgggcag cgggtgggcagtggcgaatg cggcggcggc ggtgtgggca gcgcccaatgacagccacag gttcgctgca ggaaagcgcc caatccgcttaaagacacgc ccaacagcta ctacggcaac gcctggcggcacgggcaact tccccaactt ctacgaaatg gccgacggcgctgccgccga cccagacgcc ccacgccacc caaccgcctatccggcggcg gcgtttgtgc cgtggattac gtcattgccacaggccaacg tcaccatcac caatcacagc gccgtgccggtggacccacg cgccggggca ggttgtcacc aacggctggaggcagcgccg tcagcgccag caatccggcc agttattggaggcggcaagg tttcttttgg tttccaggga tctctggcagacttattttg ccttgaacgg cgctgcctgt aacggggccgagtgcgccac ccacacaaac ggccgttccg cccaccgccaacggccgttc cccctaccgc caccacgata ccacccacacgccaccagtc aaccaccgac gcaaacggcc gttccccccatccggggttg gcgcctgcac cgttgtctac gccatcaccaaccgccaacg tcaccctcac caataaaagc agcgccgccctatgccttcc ccggcaatca aaccatcagc aatgcctggaggtaaaaacg tcagcgtcac caatgtaggt tggaacggcagccagctttg gcttccaggc gagctacagc ggtagtaacactgaacgggc agcgatgcga ttga<210> 414<211> 747<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

SIGNAL(1)...(34)

Asn Ala Trp Ala Ser190

Ile Val Ala Val Glu

205Val Ser220

tgggcgtttcccagtccacaaagccgacgtcggggggaaaaagggcaggcgtttgttcctgcagccctggtaggattggtgcgtcaactaaccatgccggccggtgatactcccgcccggccgtcatcaaccggactggtccaacaattaatcaggcctgtcagcagtacgtggtccctgcaacggccgtataaccgggttgttctctatgcgtcacacccggcgactgcaccagtggggtgaacggctaacgtgaccatacggcgtgatgcggcagcgctccttccgccccacgatactaaacggccgtccgccacagcacgattggggttaacggctgacggaacggcgcctgccgccgcgctcctac

attgcttttggaatccgtttgtatcaggcgcggccgttacttacggcattgttcgccaaatgtgcgtattcaacgcctgcctgcgtcgaacagtgcccctctggaacatcctatttcacctcgcaactatgcctaactggcagttggtgggtacggccgtcggcttcaacgcctttcttttaactgcggtgctgaccagcgctgctcatgggttcccacccaccacctcccaatggcttccactctggcccgcccaaagctggagccaacggtcgcgccccaccgccaccgcccacacaatccgcccacctaccccgccacagcggcttcgactctggcccgttcagtcacaacggtgtccagctttacg

<221><222><220><221><222>

601201802403003604204805406006607207808409009601020108011401200126013201380144015001560162016801740180018601920198020402100216022202244

DOMÍNIO(38)...(422)<223> Família 8 de hidrolase glicosila<220>

<221> DOMÍNIO<222> (466)...(570)729

<223> Domínio de celulose obrigatória<220>

<221> DOMÍNIO<222> (646) . . . (746)<223> Domínio de celulose obrigatória<22 0>

<221> SITE

<222> (222)...(225)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (233)...(236)

<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE

<222> (276). . . (279)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (300) . . . (303)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (378) . . . (381)<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (490) . . . (493)

<223> N-glicosilação site. Prosite id = PS00001

<220>

<221> SITE

<222> (495) . . . (498)

<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE

<222> (521) . . . (524)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (673)...(676)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (678)...(681)<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (696) . . . (699)

<223> N-glicosilação site. Prosite id = PS00001

<220>

<221> SITE

<222> (704) . . . (707)

<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE

<222> (713)...(716)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (722)...(725)

<223> N-glicosilação site. Prosite id = PS00001<400> 414

Met Lys Lys Arg Gln Gly Phe Ile Lys Lys Gly Leu Val Leu Gly Val1 5 10 15

Ser Leu Leu Leu Leu Ala Leu Ile Met Met Ser Ala Thr Ser Gln Thr20 25 30

Ser Ala Ser Pro Gln Asn Pro Phe Leu Trp Pro Tyr Asn Gln Pro Thr35 40 45

His Ile 50 Ser Phe Asn Glu Ala 55 Asp Val Tyr Gln Ala 60 Trp Thr Val TrpArg Asp Ala Gln Ile Thr Ala Asn Asn Ala Gly Gly Asn Gly Arg Tyr 65 70 75 80Arg Val Met Gly Gly Val Asp Gly Gly Ser Thr Val Ser Glu Gly Gln 85 90 95 Ala Tyr Gly Ile Leu Phe Ala Ser Ile Phe Asp Glu Gln Thr Leu Phe 100 105 110 Asp Gly Leu Phe Leu Phe Ala Lys Asp His Tyr Asn Glu Asn Gly Val 115 120 125 Met Asp Trp His Ile Gly Ser Pro Gly Val Arg Ile Gly Ser Gly Gly 130 135 140 Ala Thr Asp Ala Glu Val Asp Met Ala Leu Gly Leu Val Asn Ala Cys145 150 155 160Val Lys Val Gln Lys Asn Ala Trp Pro Ala Ser Pro Ala Gly Val Asn 165 170 175 Tyr Cys Val Glu Ala Thr Asn Leu Ile Asn Ala Ile Tyr Thr Tyr Glu 180 185 190 Val Asp His Ala Gly Ser Ala Pro Pro Gly Gly Leu Pro Asn Asn Gln 195 200 205 Gly Asn Glu Leu Leu Pro Gly Asp Thr Trp Asn Ile Ser Glu Leu Tyr 210 215 220 Pro Gln Gly Ile Ile Asn Leu Ser Tyr Phe Pro Pro Gly Tyr Phe Thr225 230 235 240Val Phe Gly Lys Phe Thr Gly Asn Glu Ala Ala Trp Asn Ala Val Ile 245 250 255 Asn Arg Asn Tyr Gln Val Val Asp Met Val Gln Ala Lys Pro Asn Asn 260 265 270 Cys Ser Gly Leu Val Pro Asn Trp Asn Asn Tyr Asn Gly Asp Ala Gln 275 280 285 Leu Val 290 Ser Trp Gln Thr Asn 295 Asn Tyr Ser Trp Trp 300 Ser Tyr Asp AlaAla Arg Phe Ala Trp Arg Ile Ala Val Asp Gln Ala Trp Tyr Gly Arg 305 310 315 320Ser Glu Ala Ala Glu Thr Met Asn Glu Ile Gly Gly Phe Phe Ser Ser 325 330 335 Thr Gly Phe Asn Asn Ile Gly Glu His Asn Met Asn Gly Gln Arg Val 340 345 350 Gly Ser Gly Pro Trp Pro Phe Phe Val Ala Asn Ala Ala Ala Ala Val 355 360 365 Trp Ala Ala Pro Asn Ala Thr Ala Val Asn Cys Gly Thr Ala Thr Gly 370 375 380 Ser Leu Gln Glu Ser Ala Gln Ser Ala Tyr Asn Arg Val Leu Thr Ser385 390 395 400Lys Asp Thr Pro Asn Ser Tyr Tyr Gly Asn Ala Trp Arg Leu Phe Ser 405 410 415 Met Leu Leu Met Thr Gly Asn Phe Pro Asn Phe Tyr Glu Met Ala Asp 420 425 430 Gly Gly Val Thr Pro Val Pro Thr Leu Pro Pro Thr Gln Thr Pro His 435 440 445 Ala Thr Gln Pro Pro Thr Ala Thr Ala Thr Thr Ser Ser Gly Gly Gly 450 455 460 Val Cys Ala Val Asp Tyr Val Ile Ala Asn Gln Trp Gly Asn Gly Phe465 470 475 480Gln Ala Asn Val Thr Ile Thr Asn His Ser Ala Val Pro Val Asn Gly 485 490 495 Tyr Thr Leu Ala Trp Thr His Ala Pro Gly Gln Val Val Thr Asn Gly 500 505 510 Trp Asn Val Thr Ile Ala Gln Ser Gly Ser Ala Val Ser Ala Ser Asn 515 520 525 Pro Ala Ser Tyr Trp Asn Gly Val Ile Gly Ala Asn Gly Gly Lys Val 530 535 540 Ser Phe Gly Phe Gln Gly Ser Leu Ala Gly Gly Ser Ala Val Ala Pro545 550 555 560Thr Tyr Phe Ala Leu Asn Gly Ala Ala Cys Asn Gly Ala Val Leu Pro 565 570 575Pro Thr Ala Thr Ser Ala Pro Pro Thr Gln Thr

580 585

Ala Thr Thr Ile Leu Pro Thr Gln Thr Ala Val

595 600

Thr Ile Pro Pro Thr Gln Thr Ala Val Pro Pro

610 615

Pro Pro Thr Gln Thr Ala Val Pro Pro Thr Ala625 630 635

Ser Gly Val Gly Ala Cys Thr Val Val Tyr Ala

645 650

Gly Ser Gly Phe Thr Ala Asn Val Thr Leu Thr

660 665

Ala Leu Asn Gly Trp Thr Leu Ala Tyr Ala Phe

675 680

Ile Ser Asn Ala Trp Asn Gly Thr Ala Val Gln

690 695

Ser Val Thr Asn Val Gly Trp Asn Gly Ser Leu705 710 715

Ala Ser Phe Gly Phe Gln Ala Ser Tyr Ser Gly

725 730

Thr Ser Phe Thr Leu Asn Gly Gln Arg Cys Asp740 745

<210> 415<211> 1107<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 415

atgaaaggct ttcgctggtg tgtactcgca gtattgatgcgccgcctgta gctggcctgc ctgggaacag tttaaacaggcgcgttatcg atcccagtga cgcgcgaaaa attaccacctctgttctttg ccctggctgc aaacgatcgt aaagcgttcgcgcgataatc tcgccggggg cgatttaacg gccaacctgcaaggacaaag agacctggac ggttatcgat cctaactccgattgcctggt cgctgctgga agcggggcgg ctgtggaaaaggcaaggggc tgcttaaacg catcgtcagc gaggaagtggttcatgctgc tgccgggtaa aaccggattt gccgaagagaagctacctcc cgccacagct agcgaactat ttcacccgatcttcgtgaaa ccaatctgcg tttattgctg gagacggcactgggtgcaat atcagaaaaa cagaggctgg cagctcagtcagttacgacg ccattcgcgt ttatctctgg gtgggcatgaaaggctcggc tgcttgcacg ctttaagcca atggcaacggccgccggaga aagtcgatgt cgcaaccggt aaacggacggtctgcctctc tgctaccttt tttacagaat cgggacgcgcgtcgccgatc attttcctga taataatgcc tattaeagctcaagggtggg atcagcatcg ttttcgcttc accacacaggggccaggaat gcgcaagttc acaataa<210> 416<211> 368<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

SIGNAL(1)...(22)

Ala Val

Pro Pro605Thr Ala620

Thr Ala

Ile Thr

Asn Lys

Pro Gly685Ser Gly700

Pro ProSer Asn

Pro Pro Thr590

Thr Ala Thr

Thr Ser Gln

Thr Pro Pro640

Asn Asp Trp

655Ser Ser Ala670

Asn Gln Thr

Lys Asn Val

Asn Gly Val720

Ser Ala Pro735

tggcggcaacactacatcagctgaagggcaatctgctgctctgcctggctcgtccgatgcatcaggactatgaaagtgccacgcctggcgtgggtacgcccgaaaggtttaggataaatctgaatgataataacggcaaaataaaggtccaggcagtgcaatgtactgacgtgaattaat

gaatctacgccgaaagcgggaagctatgcgggcgtggacggtgggggcaatgatatctggcacccgcacagggtctgggcctttaaccccgtggaccacgctccccaaacgctggtgggcagacccgcaagcagggcgtaggtcggttttacgacagcgccctctttgggaccgaattgg

<221><222><220><221><222><223><400>

DOMÍNIO(2)...(346)

Família 8 de hidrolase glicosila416

Met Lys Gly Phe Arg Trp Cys Val Leu Ala Val1 5 10

Thr Asn Leu Arg Ala Ala Cys Ser Trp Pro Ala

20 25

Gln Asp Tyr Ile Ser Glu Ser Gly Arg Val Ile

60120180240300360420480540600660720780840900960102010801107

Leu Met Leu Ala Ala15

Trp Glu Gln Phe Lys30

Asp Pro Ser Asp Ala35 40 45

Arg Lys Ile Thr Thr Ser Glu Gly Gln Ser Tyr Ala Leu Phe Phe Ala

50 55 60

Leu Ala Ala Asn Asp Arg Lys Ala Phe Asp Leu Leu Leu Ala Trp Thr65 70 75 80

Arg Asp Asn Leu Ala Gly Gly Asp Leu Thr Ala Asn Leu Pro Ala Trp

85 90 95

Leu Trp Gly Gln Lys Asp Lys Glu Thr Trp Thr Val Ile Asp Pro Asn100 105 HO

Ser Ala Ser Asp Ala Asp Ile Trp Ile Ala Trp Ser Leu Leu Glu Ala115 120 125

Gly Arg Leu Trp Lys Asn Gln Asp Tyr Thr Arg Thr Gly Lys Gly Leu

130 135 140

Leu Lys Arg Ile Val Ser Glu Glu Val Val Lys Val Pro Gly Leu Gly145 150 155 160

Phe Met Leu Leu Pro Gly Lys Thr Gly Phe Ala Glu Glu Asn Ala Trp

165 170 175

Arg Phe Asn Pro Ser Tyr Leu Pro Pro Gln Leu Ala Asn Tyr Phe Thr180 185 190

Arg Leu Gly Thr Pro Trp Thr Thr Leu Arg Glu Thr Asn Leu Arg Leu195 200 205

Leu Leu Glu Thr Ala Pro Lys Gly Phe Ser Pro Asn Trp Val Gln Tyr 210 215 220

Gln Lys Asn Arg Gly Trp Gln Leu Ser Gln Asp Lys Ser Leu Val Gly225 230 235 240

Ser Tyr Asp Ala Ile Arg Val Tyr Leu Trp Val Gly Met Met Asn Asp

245 250 255

Lys Asp Pro Gln Lys Ala Arg Leu Leu Ala Arg Phe Lys Pro Met Ala260 265 270

Thr Val Thr Ala Lys Gln Gly Val Pro Pro Glu Lys Val Asp Val Ala275 280 285

Thr Gly Lys Arg Thr Asp Lys Gly Pro Val Gly Phe Ser Ala Ser Leu

290 295 300

Leu Pro Phe Leu Gln Asn Arg Asp Ala Gln Ala Val Gln Arg Gln Arg 305 310 315 320

Val Ala Asp His Phe Pro Asp Asn Asn Ala Tyr Tyr Ser Tyr Val Leu

325 330 335

Thr Leu Phe Gly Gln Gly Trp Asp Gln His Arg Phe Arg Phe Thr Thr340 345 350

Gln Gly Glu Leu Ile Pro Asn Trp Gly Gln Glu Cys Ala Ser Ser Gln355 360 365

<210> 417<211> 1107<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 417

atgaatgtgt tgcgtagtgg actcgtgacg atgctgctgc tggctgcctt tagtgttcaggcagcctgta cctggcctgc ctgggagcag tttaaaaagg attacatcag tcaggaaggg 120

180240300

60

cgcgtcatcg accccagcga cgcgcgcaaa atcaccacct ccgaagggca aagttacggcatgttctttg ccctggcggc taacgaccgt gcagctttcg ataatcttct cgactggacgcagaacaatc tcgctcaggg ttctttaaaa gaacatttgc ccgcctggct gtggggcaagaaagagaaca gtaagtggga agtgctggac agcaattcgg cctccgatgg tgatgtctgg 360atggcctggt cgttgctgga ggcggggcgt ttgtggaaàg agcagcgtta taccgacatc 420ggcagcgcat tgctaaaacg tatcgcgcgg gaggaagtgg tgacggtgcc tgggctgggctccatgttgt taccgggcaa agtgggtttt gctgaggata acagctggcg ttttaaccccagctacctgc cgccgacgct ggcgcagtat ttcacccgct ttggcgcgcc gtggaccacgctgcgcgaaa ccaatcaacg tttattgctg gaaaccgccc cgaaaggctt ttcgccagactgggtgcgct atgagaaaga caaaggctgg cagctaaaag ccgaaaaaac attgatcagc 720agctacgacg ctatccgcgt ttacatgtgg gtaggcatga tgcctgacag cgatccgcaa 780aaagcgcgga tgctcaaccg gtttaaaccg atggcgacat tcactgagaa aaacggttatccgccggaaa aagtggatgt ggctacgggg aaagcgcagg gtaaaggacc ggtcggtttttctgccgcca tgctgccctt tttacaaaac cgcgatgcgc aggccgttca gcgccagcgcgtggccgata actttcccgg cagcgatgcc tattacaact atgtgctgac cctgtttgga

caaggctggg atcaacaccg tttccgcttc tcgacaaaag gtgagttatt acctgactgg 1080ggccaggaat gcgcaaattc acactaa 1107

480540600660

8409009601020<210> 418<211> 368<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(21)<220>

<221> DOMÍNIO<222> (1)...(346)

<223> Família 8 de hidrolase glicosila<400> 418

Met Asn Val Leu Arg Ser Gly Leu Val Thr Met Leu Leu Leu Ala Ala1 5 10 15 Phe Ser Val Gln Ala Ala Cys Thr Trp Pro Ala Trp Glu Gln Phe Lys 20 25 30 Lys Asp Tyr Ile Ser Gln Glu Gly Arg Val Ile Asp Pro Ser Asp Ala 35 40 45 Arg Lys Ile Thr Thr Ser Glu Gly Gln Ser Tyr Gly Met Phe Phe Ala 50 55 60 Leu Ala Ala Asn Asp Arg Ala Ala Phe Asp Asn Leu Leu Asp Trp Thr65 70 75 80Gln Asn Asn Leu Ala 85 Gln Gly Ser Leu Lys 90 Glu His Leu Pro Ala 95 TrpLeu Trp Gly Lys Lys Glu Asn Ser Lys Trp Glu Val Leu Asp Ser Asn 100 105 110 Ser Ala Ser 115 Asp Gly Asp Val Trp 120 Met Ala Trp Ser Leu 125 Leu Glu AlaGly Arg Leu Trp Lys Glu Gln Arg Tyr Thr Asp Ile Gly Ser Ala Leu 130 135 140 Leu Lys Arg Ile Ala Arg Glu Glu Val Val Thr Val Pro Gly Leu Gly145 150 155 160Ser Met Leu Leu Pro 165 Gly Lys Val Gly Phe 170 Ala Glu Asp Asn Ser 175 TrpArg Phe Asn Pro Ser Tyr Leu Pro Pro Thr Leu Ala Gln Tyr Phe Thr 180 185 190 Arg Phe Gly Ala Pro Trp Thr Thr Leu Arg Glu Thr Asn Gln Arg Leu 195 200 205 Leu Leu 210 Glu Thr Ala Pro Lys 215 Gly Phe Ser Pro Asp 220 Trp Val Arg TyrGlu Lys Asp Lys Gly Trp Gln Leu Lys Ala Glu Lys Thr Leu Ile Ser225 230 235 240Ser Tyr Asp Ala Ile Arg Val Tyr Met Trp Val Gly Met Met Pro Asp 245 250 255 Ser Asp Pro Gln Lys Ala Arg Met Leu Asn Arg Phe Lys Pro Met Ala 260 265 270 Thr Phe Thr 275 Glu Lys Asn Gly Tyr 280 Pro Pro Glu Lys Val 285 Asp Val AlaThr Gly Lys Ala Gln Gly Lys Gly Pro Val Gly Phe Ser Ala Ala Met 290 295 300 Leu Pro Phe Leu Gln Asn Arg Asp Ala Gln Ala Val Gln Arg Gln Arg305 310 315 320Val Ala Asp Asn Phe Pro Gly Ser Asp Ala Tyr Tyr Asn Tyr Val Leu 325 330 335 Thr Leu Phe Gly Gln Gly Trp Asp Gln His Arg Phe Arg Phe Ser Thr 340 345 350 Lys Gly Glu Leu Leu Pro Asp Trp Gly Gln Glu Cys Ala Asn Ser His 355 360 3 65

<210> 419<211> 990<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 419atgctggtgc gactgctgat agcgatgacc gtgctgtttt ctgcctttgc ccacgccgatgcgtgggaaa gctataaatc ccggtttgtc atgcccgacg ggcgcgtggt ggataccggcaatggcaacg tttcgcatac cgaaggccag gggtttgcca tgctgatggc ggtcagcctgaatgaccgcc agacgtttga taagctttgg cagtggacca atgcgacgct aaaaaacaaagataacggcc tgttttactg gcgctataac ccgaccgcgg cggaccctat caccgataaaaacgatgcca ccgatggcga tatgatgatc gcctgggcct tgctaaaggc gcagaaacagtggcgcgaga acagctacgg tatcgcctcg gacgagataa cccgcgcgct actgaaacacacggtaataa gctacgcggg ctacagggtg atgctgccgg gcgcgcacgg cttcaatctcaacacccgca tcaacctgaa cccttcctac tttattttcc cggcctggca ggctttcgccgaccgcacgc atctggtggt gtggcgcgat ctgatgcgcg atggcaaaaa gctcatcggcaaaatggggt ggggtaatgc caatcttccg accgactggg ttgcgctgag cgctgacggcaaaatgaagc ccgccgacga gtggaagccg cgtatgagct atgacgccgt gcgcattccgctgtacatcc actggcagga cgcgcaaagc ccactgttag cgccgtggaa agcgttctggcagcgctatc agcgtgaaca aacgcctgcg tgggtcaacg tgatgaccaa cgaaacctctccttacccga tgaacggtgg cctgctggcg attcgcgatt acaccctggg catcaacaccggcgagccgc aaattaccgc gcaggacgac tactattccg cgagcctgaa aatgctgacgtggctggcgg agcagtctgc gggacgctaa<210> 420<211> 329<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(19)<220>

<221> DOMÍNIO<222> (1)...(326)

<223> Família 8 de hidrolase glicosila<220>

<221> SITE<222> (43)...(46)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (75)...(78)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (104)...(122)

<223> Família 8 de marca hidrolase glicosila. Prosite id = PS00812<220>

<221> SITE

<222> (281) . . . (284)

<223> N-glicosilação site. Prosite id = PS00001

Met Leu Val Arg Leu Leu Ile Ala Met Thr Val Leu Phe Ser Ala Phe1 5 10 15 Ala His Ala Asp 20 Ala Trp Glu Ser Tyr 25 Lys Ser Arg Phe Val 30 Met ProAsp Gly Arg Val Val Asp Thr Gly Asn Gly Asn Val Ser His Thr Glu 35 40 45 Gly Gln Gly Phe Ala Met Leu Met Alá Val Ser Leu Asn Asp Arg Gln 50 55 60 Thr Phe Asp Lys Leu Trp Gln Trp Thr Asn Ala Thr Leu Lys Asn Lys65 70 75 80Asp Asn Gly Leu Phe 85 Tyr Trp Arg Tyr Asn 90 Pro Thr Ala Ala Asp 95 ProIle Thr Asp Lys 100 Asn Asp Ala Thr Asp 105 Gly Asp Met Met Ile 110 Ala TrpAla Leu Leu 115 Lys Ala Gln Lys Gln 120 Trp Arg Glu Asn Ser 125 Tyr Gly IleAla Ser Asp Glu Ile Thr Arg Ala Leu Leu Lys His Thr Val Ile Ser 130 135 140 Tyr Ala Gly Tyr Arg Val Met Leu Pro Gly Ala His Gly Phe Asn Leu145 150 155 160Asn Thr Arg Ile Asn Leu Asn Pro Ser Tyr Phe Ile Phe Pro Ala Trp 165 170 175 Gln Ala Phe Ala 180 Asp Arg Thr His Leu 185 Val Val Trp Arg Asp 190 Leu MetArg Asp Gly Lys Lys Leu Ile Gly Lys Met Gly Trp Gly Asn Ala Asn 195 200 205 Leu Pro 210 Thr Asp Trp Val Ala 215 Leu Ser Ala Asp Gly 220 Lys Met Lys ProAla Asp Glu Trp Lys Pro Arg Met Ser Tyr Asp Ala Val Arg Ile Pro225 230 235 240Leu Tyr Ile His Trp Gln Asp Ala Gln Ser Pro Leu Leu Ala Pro Trp 245 250 255 Lys Ala Phe Trp Gln Arg Tyr Gln Arg Glu Gln Thr Pro Ala Trp Val 260 265 270 Asn Val Met Thr Asn Glu Thr Ser Pro Tyr Pro Met Asn Gly Gly Leu 275 280 285 Leu Ala 290 Ile Arg Asp Tyr Thr 295 Leu Gly Ile Asn Thr 300 Gly Glu Pro GlnIle Thr Ala Gln Asp Asp Tyr Tyr Ser Ala Ser Leu Lys Met Leu Thr305 310 315 320Trp Leu Ala Glu Gln 325 Ser Ala Gly Arg

<210> 421

<211> 1044

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 421

atgaaagcaa atatcatatt ttgccttctg gcgcctctgg tagccgctct cccggccgaattcattcaac tggagcctga acttgccgca cgccgcgtca atattactga gagaatggctgatttagagg atcgacaagc ctctgtgagc attgatcagc tcttcaaaag gaaaggcaaagtttattttg gaactgcgac taaccgtggc ttactccaac gagaacgaaa tgcggccattatccaggcta atcttggcca agtgacgcca gagaatagca tgaaatggca gtcccttgagtttaatcaag gccagtataa ttggggagat gcagattacc tcgtcaactt cgctcaacaaaacggcaaga cgatacgtgg acatactctg atttggcact cacagctacc taattgggtcaataacatca ataatgcaga tactttgcgc caagttatcc gtactcatgt tctcactgttgttggaagat ataaaggcaa gattcgcgct tgggatgtag tgaacgagat cttcaacgaggatggaacac tacgctcttc tgtgttttct agactgctgg gcgaagagtt tgtctcgattgctttccgtg ctgctcgaga agctgatccg actgctcgtc tctacatcaa cgattacaatctcgatgttg ccgggtctag taaagtcaac ttgatgagat actatgtgga taaatggatctctcaaggag tccccattga cggaatcgga actcaaactc acatcggtgc tggaggaggtgccgctgtac aaggtgcact tcagcagctg gctacagcac cagtcactga attggccattactgaacttg acatcgtggg cgcaccgtcg aacgattaca acgcagttgt tcgaggatgtttgaatgttc ctaagtgctt ggggatcact gtgtggggta ttagcgacaa agactcgtggcgttcaggct ccagtcccct tctattcgac agcaacttca atcccaaagc agcgtacaacagtattgtaa gcattttaca ataa<210> 422<211> 347<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(16)<220>

<221> DOMÍNIO<222> (50)...(346)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (34)...(37)

<223> N-glicosilação site. Prosite id = PS00001<400> 422

Met Lys Ala Asn Ile Ile Phe Cys Leu Leu Ala Pro Leu Val Ala Ala15 10 15Leu Pro Ala Glu Phe Ile Gln Leu Glu Pro Glu Leu Ala Ala Arg Arg

20 25 30

Val Asn Ile Thr Glu Arg Met Ala Asp Leu Glu Asp Arg Gln Ala Ser35 40 45

Val Ser Ile Asp Gln Leu Phe Lys Arg Lys Gly Lys Val Tyr Phe Gly50 55 60

Thr Ala Thr Asn Arg Gly Leu Leu Gln Arg Glu Arg Asn Ala Ala Ile65 70 75 80

Ile Gln Ala Asn Leu Gly Gln Val Thr Pro Glu Asn Ser Met Lys Trp85 90 95

Gln Ser Leu Glu Phe Asn Gln Gly Gln Tyr Asn Trp Gly Asp Ala Asp

100 105 110

Tyr Leu Val Asn Phe Ala Gln Gln Asn Gly Lys Thr Ile Arg Gly His115 120 125

Thr Leu Ile Trp His Ser Gln Leu Pro Asn Trp Val Asn Asn Ile Asn130 135 140

Asn Ala Asp Thr Leu Arg Gln Val Ile Arg Thr His Val Leu Thr Val145 150 155 160

Val Gly Arg Tyr Lys Gly Lys Ile Arg Ala Trp Asp Val Val Asn Glu165 170 175

Ile Phe Asn Glu Asp Gly Thr Leu Arg Ser Ser Val Phe Ser Arg Leu180 185 190

I Leu Gly Glu Glu Phe Val Ser Ile Ala Phe Arg Ala Ala Arg Glu Ala195 200 205

Asp Pro Thr Ala Arg Leu Tyr Ile Asn Asp Tyr Asn Leu Asp Val Ala210 215 220

Gly Ser Ser Lys Val Asn Leu Met Arg Tyr Tyr Val Asp Lys Trp Ile225 230 235 240

Ser Gln Gly Val Pro Ile Asp Gly Ile Gly Thr Gln Thr His Ile Gly245 250 255

Ala Gly Gly Gly Ala Ala Val Gln Gly Ala Leu Gln Gln Leu Ala Thr

260 265 270

Ala Pro Val Thr Glu Leu Ala Ile Thr Glu Leu Asp Ile Val Gly Ala275 280 285

Pro Ser Asn Asp Tyr Asn Ala Val Val Arg Gly Cys Leu Asn Val Pro290 295 300

Lys Cys Leu Gly Ile Thr Val Trp Gly Ile Ser Asp Lys Asp Ser Trp305 310 315 320

Arg Ser Gly Ser Ser Pro Leu Leu Phe Asp Ser Asn Phe Asn Pro Lys325 330 335

Ala Ala Tyr Asn Ser Ile Val Ser Ile Leu Gln340 345

<210> 423<211> 1335<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400>.423

gtgccgaccg ggttgagggc caagccctgc ctcacgcgct ggctcgcggc cagcgcctgc 60gcgctcgcgc cgctgctgct cggcgcgccc gcgtccgcgc ttgccgcgac ggcgaacgcg 120aacgccaaaa cgcctgctgc gaagacgacg tcggctgccg cgccgcaagc gcctgcctgc 180gcgtggtccg actggaccgc gttcaagggc gcgctgctgt ccgccgacgg acgcgtgatc 240gacgccagtt cgccgcgtca ggtgacggtc tccgaaggcc agtcgtácgc gctcttcttc 300gcgctcgtcg cgaacgaccg cgcggcçttc gacaagatcc tcgcgtggac cgagaacaat 360ctcgcccggg gcgatctcgc ggcgcatttg cccgcgtgga tctgggggcg caccgacatc 420gacgaaaacg gcgcgccggt cgtggcttcg gctgcgtcgg ccgcgtcgtc cagccccgct 480acgcagacgc aaaccggcac gtggggcgtg atcgacacca actccgccag cgacgccgat 540ctctggatcg cctacacgct gctcgaagcg ggccgcctct ggaacgtgcg ccgctacacg 600gcgatcggca cggtgatggc gcgcaacgtc ctgcgccgcg agacggccgc gctgcccggc 660ctcggccgca cggtgctgcc cggcccggtc ggcttcacgc tcgacaagaa cacgtggcgt 720ctgaacccga gctatgtgcc gctgcaggtc atgcgccgct tcacgctcgc gatgcccgag 780aaagaacggc ccgagtggaa gtcgctgctc ggcagttcgt cgaagctcgt caacggcacc 840gcgcccaagg gcttttcgcc cgactgggtc gtctaccgcg cgcggggcaa caagggcgat 900ttcggccctg acgaacccac gcacgccgaa agcgcctata acgcgatccg cgtctatctg 960tgggcgggca tgctcgctta cgacgacccg gcgcgcagcg cgacgctcgc gaccttcgcg 1020ccgctctcgg ccttcgtggc cgcgcacggc tttccgcccg agcgcgtcaa cacgcagacc 1080ggcgaacccg gcccgaacga gggcaacggc ggcttttcgg cggcggtcgc gccgtatctgtcggcactcg gccgcaccga tctgtccgat gcgcaggttc aacgcagccg cacgctcgcgcaaaaatcgc cgcccggcta ttacagcagc gtgctgatgc tgttcggcct cggctatctgcaaggccttt atcgcttcga tgcgcaaggc cgcgtaattc ccgcatggac ggctcaatgcccggcagcac gatga<210> 424<211> 444<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)... (35)<220>

<221> DOMÍNIO<222> (38)...(422)

<223> Família 8 de hidrolase glicosila<220>

<221> SITE

<222> (282)...(285)

<223> N-glicosilação site. Prosite id = PS00001<400> 424

Met Pro Thr Gly Leu Arg Ala Lys Pro Cys Leu Thr Arg Trp Leu Ala1 5 10 15 Ala Ser Ala Cys Ala Leu Ala Pro Leu Leu Leu Gly Ala Pro Ala Ser 20 25 30 Ala Leu Ala Ala Thr Ala Asn Ala Asn Ala Lys Thr Pro Ala Ala Lys 35 40 45 Thr Thr Ser Ala Ala Ala Pro Gln Ala Pro Ala Cys Ala Trp Ser Asp 50 55 60 Trp Thr Ala Phe Lys Gly Ala Leu Leu Ser Ala Asp Gly Arg Val Ile65 70 75 80Asp Ala Ser Ser Pro Arg Gln Val Thr Val Ser Glu Gly Gln Ser Tyr 85 90 95 Ala Leu Phe Phe Ala Leu Val Ala Asn Asp Arg Ala Ala Phe Asp Lys 100 105 110 Ile Leu Ala Trp Thr Glu Asn Asn Leu Ala Arg Gly Asp Leu Ala Ala 115 120 125 His Leu Pro Ala Trp Ile Trp Gly Arg Thr Asp Ile Asp Glu Asn Gly 130 135 140 Ala Pro Val Val Ala Ser Ala Ala Ser Ala Ala Ser Ser Ser Pro Ala145 150 155 160Thr Gln Thr Gln Thr Gly Thr Trp Gly Val Ile Asp Thr Asn Ser Ala 165 170 175 Ser Asp Ala Asp Leu Trp Ile Ala Tyr Thr Leu Leu Glu Ala Gly Arg 180 185 190 Leu Trp Asn Val Arg Arg Tyr Thr Ala Ile Gly Thr Val Met Ala Arg 195 200 205 Asn Val Leu Arg Arg Glu Thr Ala Ala Leu Pro Gly Leu Gly Arg Thr 210 215 220 Val Leu Pro Gly Pro Val Gly Phe Thr Leu Asp Lys Asn Thr Trp Arg225 230 235 240Leu Asn Pro Ser Tyr Val Pro Leu Gln Val Met Arg Arg Phe Thr Leu 245 250 255 Ala Met Pro Glu Lys Glu Arg Pro Glu Trp Lys Ser Leu Leu Gly Ser 260 265 270 Ser Ser Lys Leu Val Asn Gly Thr Ala Pro Lys Gly Phe Ser Pro Asp 275 280 285 Trp Val Val Tyr Arg Ala Arg Gly Asn Lys Gly Asp Phe Gly Pro Asp 290 295 300 Glu Pro Thr His Ala Glu Ser Ala Tyr Asn Ala Ile Arg Val Tyr Leu305 310 315 320Trp Ala Gly Met Leu Ala Tyr Asp Asp Pro Ala Arg Ser Ala Thr Leu 325 330 335 Ala Thr Phe Ala Pro Leu Ser Ala Phe Val Ala Ala His Gly Phe Pro 340 345 350Pro Glu Arg Val Asn Thr Gln Thr Gly Glu Pro

355 360

Asn Gly Gly Phe Ser Ala Ala Val Ala Pro Tyr

370 375

Arg Thr Asp Leu Ser Asp Ala Gln Val Gln Arg385 390 395

Gln Lys Ser Pro Pro Gly Tyr Tyr Ser Ser Val

405 410

Leu Gly Tyr Leu Gln Gly Leu Tyr Arg Phe Asp

420 425

Ile Pro Ala Trp Thr Ala Gln Cys Pro Ala Ala

435 440

<210> 425<211> 1221<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 425

atgttgcaga ctattgcatt aatttttctt gcccttgttaagttttagac gcagccgcac catcggcaaa tacctgggtttttattgcag cggtggttta tggctatttt atgaggcccagtactggaag ctcaagccat cgaacccgag acccgcgcggtatctgggtg caggcaccta tacggttgac gatataaagctttaactcct ataccgcgat caatgcactg aagattggcgcagaaaatct atgacttcac gcaagcggat cgctttattgttacgcatcc gcggccatgc ccttgtgttc ggcaaactgaaatttgcaaa cctggctgga tacatactat cgcgatgacgcaagaattgg tggatcatca tattgatact atggtgacgcçagtgggatg tggtgaacga gccattgggg ttgtttgggcgtgtttttgc gaaatctggg acctgattat attgccaatggctgacaatc aggcaaggtt atttttaaac gaacaatttggccgatgcat ttatcgcatt agtcaaacac ttaaagtcacgtgggtctgg agcatcatat gttgttcacg ctcgcgccgcattcaacggt tgtcagcctt gggcgttgat gttgaaattacgtctgtttg ctgatgcaga aaatccgcat ctggcccaggatgaccgcct gcctcgacat caaagcttgc aaaggcgtcacaggacgcgt ggcacaaaga tttgccgtgg atgtttgcaatttgaccaga ataaaaatcc caagattgcg gcgaaactgatgggatgcaa atgcgcggta g<210> 426<211> 406<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (71)...(398)10

Gly Pro Asn Glu Gly365

Leu Ser Ala Leu Gly380

Ser Arg Thr Leu Ala400

Leu Met Leu Phe Gly415

Ala Gln Gly Arg Val430

Arg

ttctgatcgcatgcaggcggtcactatacccattaacggcaccacgccttctgtgctcacatgaagctttgcgatatttacagacaagcggctaccagggaaggcgagctcgtttaaacgatcgctacacaaggagtgccgtgaagaaacccgaactggacggaatattacgttctggggcgcctaatgatttccgaaac

gctgcttatcggccgcgttagccggcaccgattggattttcacggatttaagagattaatgcatcaaggttgaagaaccgtcaggctttgcaggatcacgggaagataacggcgcacctccgggcccagagatacacggtcaaagcgttttgcgcgccttccgggatatctttgcacgactccctatttgcatagtgcaa

6012018024030036042048054060066072078084090096010201080114012001221

<400> 426 Met Leu Gln Thr Ile Ala Leu Ile Phe Leu Ala Leu Val Ile Leu Ile1 5 10 15 Ala Leu Leu Ile 20 Ser Phe Arg Arg Ser 25 Arg Thr Ile Gly Lys 30 Tyr LeuGly Tyr Ala Gly Gly Ala Ala Leu Phe Ile Ala Ala Val Val Tyr Gly 35 40 45 Tyr Phe Met Arg Pro Ile Thr Ile Pro Pro Ala Pro Val Leu Glu Ala 50 55 60 Gln Ala Ile Glu Pro Glu Thr Arg Ala Ala Leu Thr Ala Leu Asp Phe65 70 75 80Tyr Leu Gly Ala Gly 85 Thr Tyr Thr Val Asp 90 Asp Ile Lys His His 95 AlaPhe Thr Asp Leu 100 Phe Asn Ser Tyr Thr 105 Ala Ile Asn Ala Leu 110 Lys IleGly Ala Val 115 Leu Thr Glu Ile Asn 120 Gln Lys Ile Tyr Asp 125 Phe Thr GlnAla Asp 130 Arg Phe Ile Asp Glu 135 Ala Leu His Gln Gly 140 Leu Arg Ile ArgGly His Ala Leu Val Phe Gly Lys Leu Ser Asp Ile Tyr Glu Glu Pro145 150 155 160Asn Leu Gln Thr Trp 165 Leu Asp Thr Tyr Tyr 170 Arg Asp Asp Ala Asp 175 LysArg Gln Ala Leu 180 Gln Glu Leu Val Asp 185 His His Ile Asp Thr 190 Met ValThr Arg Tyr Gln Gly Arg Ile Thr Gln Trp Asp Val Val Asn Glu Pro 195 200 205 Leu Gly Leu Phe Gly Gln Gly Glu Leu Glu Asp Asn Val Phe Leu Arg 210 215 220 Asn Leu Gly Pro Asp Tyr Ile Ala Asn Ala Phe Lys Arg Ala His Leu225 230 235 240Ala Asp Asn Gln Ala 245 Arg Leu Phe Leu Asn 250 Glu Gln Phe Asp Arg 255 TyrThr Gly Pro Arg 260 Ala Asp Ala Phe Ile 265 Ala Leu Val Lys His 270 Leu LysSer Gln Gly 275 Val Pro Ile His Gly 280 Val Gly Leu Glu His 285 His Met LeuPhe Thr 290 Leu Ala Pro Arg Glu 295 Glu Thr Lys Ala Phe 300 Ile Gln Arg LeuSer Ala Leu Gly Val Asp Val Glu Ile Thr Glu Leu Asp Ala Arg Leu305 310 315 320Arg Leu Phe Ala Asp 325 Ala Glu Asn Pro His 330 Leu Ala Gln Ala Glu 335 TyrTyr Arg Asp Ile 340 Met Thr Ala Cys Leu 345 Asp Ile Lys Ala Cys 350 Lys GlyVal Thr Phe Trp Gly Leu His Asp Gln Asp Ala Trp His Lys Asp Leu 355 360 365 Pro Trp 370 Met Phe Ala Thr Pro 375 Asn Asp Pro Tyr Leu 380 Phe Asp Gln AsnLys Asn Pro Lys Ile Ala Ala Lys Leu Ile Ser Glu Thr Ile Val Gln385 390 395 400Trp Asp Ala Asn Ala 405 Arg

<210> 427

<211> 996

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 427

atgaacagct ccctcccctc cctccgcgat gtattcgcga atgatttccg catcggggcg 60

gcggtcaatc ctgtgacgat cgagatgcaa aaacagttgt tgatcgatca tgtcaacagt 120attacggcag agaaccatat gaagtttgag catcttcagc cggaagaagg gaaatttacc 180tttcaggaag cggatcggat tgtggatttt gcttgttcgc accgaatggc ggttcgaggg 240cacacacttg tatggcacaa ccagactccg gattgggtgt ttcaagatgg tcaaggccat 300ttcgtcagtc gggatgtgtt gcttgagcgg atgaaatgtc acatttcaac tgttgtacgg 360cgatacaagg gaaaaatata ttgttgggat gtcatcaacg aagcggtagc cgacgaagga 420gacgaattgt tgaggccgtc gaagtggcga caaatcatcg gggacgattt tatggaacaa 480gcatttctct acgcttatga agctgaccca gatgcactgc ttttttacaa tgactataat 540gaatgttttc cggaaaagag agaaaaaatt tttgcacttg tcaaatcgct gcgtgataaa 600ggcattccga ttcatggcat cggcatgcag gcgcactgga gcctgacccg cccgtcgctt 660gatgaaattc gtgcggcgat tgaacggtat gcgtcccttg gtgttgttct tcatattacg 720gaactcgatg tatccatgtt tgaatttcac gatcgtcgaa ccgatttggc tgtcccgacg 780aacgaaatga tcgaacagca agcagaacgg tatgggcaaa tttttgcttt gtttaaggag 840tatcgcgatg ttattcaaag tgtcacattt tggggaattg ctgatgacca tacatggctc 900gataactttc cagtgcacgg gagaaaaaac tggccgcttt tgttcgatga acagcataaa 960ccgaaaccag ctttttggcg ggcagtgagt gtctga 996

<210> 428<211> 331<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220><221> DOMÍNIO<222> (7)...(330)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (2)...(5)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (237) . ... (247)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591

<400> 428 Met Asn Ser Ser Leu Pro Ser Leu Arg Asp Val Phe Ala Asn Asp Phe1 5 10 15 Arg Ile Gly Ala Ala Val Asn Pro Val Thr Ile Glu Met Gln Lys Gln 20 25 30 Leu Leu Ile 35 Asp His Val Asn Ser 40 Ile Thr Ala Glu Asn 45 His Met LysPhe Glu 50 His Leu Gln Pro Glu 55 Glu Gly Lys Phe Thr 60 Phe Gln Glu AlaAsp Arg Ile Val Asp Phe Ala Cys Ser His Arg Met Ala Val Arg Gly65 70 75 80His Thr Leu Val Trp 85 His Asn Gln Thr Pro 90 Asp Trp Val Phe Gln 95 AspGly Gln Gly His 100 Phe Val Ser Arg Asp 105 Val Leu Leu Glu Arg 110 Met LysCys His Ile Ser Thr Val Val Arg Arg Tyr Lys Gly Lys Ile Tyr Cys 115 120 125 Trp Asp Val Ile Asn Glu Ala Val Ala Asp Glu Gly Asp Glu Leu Leu 130 135 140 Arg Pro Ser Lys Trp Arg Gln Ile Ile Gly Asp Asp Phe Met Glu Gln145 150 155 160Ala Phe Leu Tyr Ala 165 Tyr Glu Ala Asp Pro 170 Asp Ala Leu Leu Phe 175 TyrAsn Asp Tyr Asn 180 Glu Cys Phe Pro Glu 185 Lys Arg Glu Lys Ile 190 Phe AlaLeu Val Lys 195 Ser Leu Arg Asp Lys 200 Gly Ile Pro Ile His 205 Gly Ile GlyMet Gln 210 Ala His Trp Ser Leu 215 Thr Arg Pro Ser Leu 220 Asp Glu Ile ArgAla Ala Ile Glu Arg Tyr Ala Ser Leu Gly Val Val Leu His Ile Thr225 230 235 240Glu Leu Asp Val Ser Met Phe Glu Phe His Asp Arg Arg Thr Asp Leu 245 250 255 Ala Val Pro Thr 260 Asn Glu Met Ile Glu 265 Gln Gln Ala Glu Arg 270 Tyr GlyGln Ile Phe 275 Ala Leu Phe Lys Glu 280 Tyr Arg Asp Val Ile 285 Gln Ser ValThr Phe 290 Trp Gly Ile Ala Asp 295 Asp His Thr Trp Leu 300 Asp Asn Phe ProVal His Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Glu Gln His Lys305 310 315 320Pro Lys Pro Ala Phe 325 Trp Arg Ala Val Ser 330 Val

<210> 429

<211> 1107

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 429

atgaatgtgt tgcgtagtgg aatcgtgacg atgctgctgt tggctgcctt tagtgttcag 60

gcagcctgta cctggcctgc ctgggagcag tttaaaaagg attacatcag tcaggaaggg 120cgcgtcatcg accccagcga cgcgcgcaaa atcaccacct ccgaagggca aagttacggt 180atgttctttg ccctggcggc taacgaccgt gtagctttcg ataatattct cgactggacg 240cagaacaatc tcgctcaggg ctctttaaaa gaacgtttgc ccgcctggct gtggggcaag 300aaagagaaca gtaagtggga agtgctggac agcaattcgg cctccgatgg tgatgtctgg 360atggcctggt cgttgctgga ggcggggcgt ttgtggaaag agcagcgtta taccgacatc 420ggcagcgcgt tgctaaaacg tatcgcgcgg gaggaagtgg tgacggtgcc tgggctgggt 480tccatgttgt taccgggcaa agtgggtttt gctgaggata acagctggcg ttttaacccc 540agctacctgc cgccgacgct ggcgcagtat ttcacccgct ttggcgcgcc gtggaccacg 600ctgcgcgaaa ccaatcaacg tttattgctg gaaaccgccc cgaaaggttt ttcgccágac 660tgggtgcgct atgagaaaga caaaggctgg cagctaaaag ccgaaaaaac attgatcagc 720agctacgacg ctatccgcgt ttacatgtgg gtaggcatga tgcctgacag cgatccgcaa 780aaagcgcgga tgctcaaccg gtttaaaccg atggcgacat tcactgagaa aaacggttat 840ccgccggaaa aagtggatgt ggctacgggg aaagcgcagg gtaaaggacc ggtcggtttt 900tctgccgcca tgctgccctt tttacaaaac cgcgatgcgc aggccgttca gcgccagcgc 960gtggccgata actttcccgg cagcgatgcc tattacaact atgtgctgac cctgtttgga 1020caaggctggg atcaacaccg tttccgcttc tcgacaaaag gtgagttatt acctgactgg 1080ggccaggaat gcgcaaattc acactaa 1107

<210> 430<211> 368<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<22 0>

<221> SIGNAL<222> (1) . . . (21)<22 0>

<221> DOMÍNIO<222> (1) . . . (346)

<223> Família 8 de hidrolase glicosila

<400> 430 Met Asn Val Leu Arg Ser Gly Ile Val Thr Met Leu Leu Leu Ala Ala1 5 10 15 Phe Ser Val Gln Ala Ala Cys Thr Trp Pro Ala Trp Glu Gln Phe Lys 20 25 30 Lys Asp Tyr Ile Ser Gln Glu Gly Arg Val Ile Asp Pro Ser Asp Ala 35 40 45 Arg Lys Ile Thr Thr Ser Glu Gly Gln Ser Tyr Gly Met Phe Phe Ala 50 55 60 Leu Ala Ala Asn Asp Arg Val Ala Phe Asp Asn Ile Leu Asp Trp Thr65 70 75 80Gln Asn Asn Leu Ala Gln Gly Ser Leu Lys Glu Arg Leu Pro Ala Trp 85 90 95 Leu Trp Gly Lys Lys Glu Asn Ser Lys Trp Glu Val Leu Asp Ser Asn 100 105 110 Ser Ala Ser Asp Gly Asp Val Trp Met Ala Trp Ser Leu Leu Glu Ala 115 120 125 Gly Arg Leu Trp Lys Glu Gln Arg Tyr Thr Asp Ile Gly Ser Ala Leu 130 135 140 Leu Lys Arg Ile Ala Arg Glu Glu Val Val Thr Val Pro Gly Leu Gly145 150 155 160Ser Met Leu Leu Pro Gly Lys Val Gly Phe Ala Glu Asp Asn Ser Trp 165 170 175 Arg Phe Asn Pro Ser Tyr Leu Pro Pro Thr Leu Ala Gln Tyr Phe Thr 180 185 190 Arg Phe Gly Ala Pro Trp Thr Thr Leu Arg Glu Thr Asn Gln Arg Leu 195 200 205 Leu Leu Glu Thr Ala Pro Lys Gly Phe Ser Pro Asp Trp Val Arg Tyr 210 215 220 Glu Lys Asp Lys Gly Trp Gln Leu Lys Ala Glu Lys Thr Leu Ile Ser225 230 235 240Ser Tyr Asp Ala Ile Arg Val Tyr Met Trp Val Gly Met Met Pro Asp 245 250 255 Ser Asp Pro Gln Lys Ala Arg Met Leu Asn Arg Phe Lys Pro Met Ala 260 265 270 Thr Phe Thr Glu Lys Asn Gly Tyr Pro Pro Glu Lys Val Asp Val Ala 275 280 285 Thr Gly Lys Ala Gln Gly Lys Gly Pro Val Gly Phe Ser Ala Ala Met 290 295 300 Leu Pro Phe Leu Gln Asn Arg Asp Ala Gln Ala Val Gln Arg Gln Arg305 310 315 320Val Ala Asp Asn Phe Pro Gly Ser Asp Ala Tyr Tyr Asn Tyr Val Leu

325 330 335

Thr Leu Phe Gly Gln Gly Trp Asp Gln His Arg Phe Arg Phe Ser Thr

340 345 350

Lys Gly Glu Leu Leu Pro Asp Trp Gly Gln Glu Cys Ala Asn Ser His

355 360 365

<210> 431<211> 984<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 431

atggttcaaa tcaaagcagc tgctctggct gttcttttcg ccagcaatgt gctctccaaccccatagagc cccgccaggc ctcggtgagc atcgatgcca aattcaagac gcacggcaagaagtacctgg gcaccatcgg cgaccagtac actctcaaca agaacgcaaa gaccccggcgatcatcaagg ccgactttgg ccagctgact ccggagaaca gcatgaagtg ggatgctactgagcccaacc ggggacagtt ctccttctcg gggtcggatt acctggtcaa cttcgcccagtctaacggaa agctgatccg tggccacact ctcgtctggc actcacagct cccgtcctgggtgcagtcaa tctccgataa gaacaccctg atccaagtca tgcagaacca catcaccaccgtgatgcagc gctacaaggg caaggtctac gcctgggacg ttgtcaatga gatcttcaacgaggatggct ctcttcgcca gagtcacttc tacaacgtca tcggtgagga ctatgtgcgcatcgctttcg agaccgctcg cgcggtggat cccaatgcca agctttacat aaacgactacaacctggatt ccgcctcgta cccgaaattg accggcctgg tcaaccacgt caagaagtgggtcgcagctg gcgtccccat cgacggaatt ggttcccaaa cccacctgag cgcgggtgccggcgctgccg tctcaggagc tcttaatgct ctcgccggtg caggcaccaa ggaggtcgctattaccgagc tcgacatcgc tggcgctagc tccaccgact acgtgaacgt cgtcaaggcgtgtctgaacc agçccaagtg cgtcggtatc accgtctggg gagttgctga ccccgactcgtggcgctcca gctccagccc tctgctcttc gacagcaact acaaccccaa ggctgcttataccgctattg cgaacgctct gtag<210> 432<211> 327<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(19)<220>

<221> DOMÍNIO<222> (30)...(327)

<223> Família 10 de hidrolase glicosila<400> 432

Met Val Gln Ile Lys Ala Ala Ala Leu Ala Val Leu Phe Ala Ser Asn15 10 15

Val Leu Ser Asn 20 Pro Ile Glu Pro Arg 25 Gln Ala Ser Val Ser 30 Ile AspAla Lys Phe 35 Lys Thr His Gly Lys 40 Lys Tyr Leu Gly Thr 45 Ile Gly AspGln Tyr 50 Thr Leu Asn Lys Asn 55 Ala Lys Thr Pro Ala 60 Ile Ile Lys AlaAsp Phe Gly Gln Leu Thr Pro Glu Asn Ser Met Lys Trp Asp Ala Thr65 70 75 80Glu Pro Asn Arg Gly 85 Gln Phe Ser Phe Ser 90 Gly Ser Asp Tyr Leu 95 ValAsn Phe Ala Gln 100 Ser Asn Gly Lys Leu 105 Ile Arg Gly His Thr 110 Leu ValTrp His Ser 115 Gln Leu Pro Ser Trp 120 Val Gln Ser Ile Ser 125 Asp Lys AsnThr Leu 130 Ile Gln Val Met Gln 135 Asn His Ile Thr Thr 140 Val Met Gln ArgTyr Lys Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ile Phe Asn145 150 155 160Glu Asp Gly Ser Leu 165 Arg Gln Ser His Phe 170 Tyr Asn Val Ile Gly 175 GluAsp Tyr Val Arg Ile Ala Phe Glu Thr Ala Arg Ala Val Asp Pro Asn180 185 190 Ala Lys Leu 195 Tyr Ile Asn Asp Tyr 200 Asn Leu Asp Ser Ala 205 Ser Tyr ProLys Leu 210 Thr Gly Leu Val Asn 215 His Val Lys Lys Trp 220 Val Ala Ala GlyVal Pro Ile Asp Gly Ile Gly Ser Gln Thr His Leu Ser Ala Gly Ala225 230 235 240Gly Ala Ala Val Ser 245 Gly Ala Leu Asn Ala 250 Leu Ala Gly Ala Gly 255 ThrLys Glu Val Ala 260 Ile Thr Glu Leu Asp 265 Ile Ala Gly Ala Ser 270 Ser ThrAsp Tyr Val 275 Asn Val Val Lys Ala 280 Cys Leu Asn Gln Pro 285 Lys Cys ValGly Ile 290 Thr Val Trp Gly Val 295 Ala Asp Pro Asp Ser 300 Trp Arg Ser SerSer Ser Pro Leu Leu Phe Asp Ser Asn Tyr Asn Pro Lys Ala Ala Tyr305 310 315 320Thr Ala Ile Ala Asn Ala Leu

325

<210> 433<211> 1131<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 433

atgaacacac tcctaccacg gcggcgactg tggtcctcca cggcgatcct gcgcacgctggcggccgggg cgctggcggc cggtatggtc ctggcacccg tcagtgccgc caacgcggccaccaccctcg gtgcctcggc ggcggagaag ggccggtact tcggtgcggc cgtcgggacgtacaagttca acgacagcac ctacatgtcg gtgctgaacc gcgagttcaa cagcctggtcgccgagaacg agatgaagtg ggacgcgacc gagccccagc gcggcgtgtt caactacagcgccggggacc gcatcgtcaa ccacgcccga tcccagggca tgaaggtacg cggacacgccctgttgtggc acgcccagca gccacgctgg acggagggcc tgtccggcgg cgacctgcgcaacgccgcga tcaaccatgt cacccaggtg gccagccact tccgggggca gatctactcctgggacgtgg tgaacgaggc tttcgccgac ggtggcagcg gtgcccggcg ggactcgaacctccagcgca ccggcaacga ctggatcgag gcggcgttcc gtgccgcccg ggcagccgatcccaacgcca agctctgcta caacgactac aacaccgacg ggatcaacgc gaagtccaccggcgtctaca acatggtgcg tgacttcaag tcccgtgggg tgccgatcga ctgcgtgggcttccagtcac acctgggcac caccctcccc ggtgactacc aggccaacct tcagcgcttcgccgacctgg gcgtcgacgt ggagatcacc gagctggaca tcacccaggg cggaaaccaggccaacatgt acggcgccgt cacccgcgcc tgcctggcga tctcgcgctg caccggcatcaccgtgtggg gggtacggga ctgcgactcc tggcgtggtg gggacaacgc cctgctgttcgactgcgccg gcaacaagaa gcccgcgtac acggccgtcc tcgacgccct caacagcggctcgaacccga accccaaccc caccggcaac cggctgcgca acgaggcctc cggtcgatgcctggacgtca acggcgcaag ctccgccaac gggtcacaaa tgatccaaag a<210> 434<211> 377<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(39)<220>

<221> DOMÍNIO<222> (42)...(337)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (99)...(102)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (268)...(278)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id =<220><221> SITE

<222> (375)...(378)

<223> N-glicosilação site. Prosite id = PS00001<400> 434

Met Asn Thr Leu Leu Pro Arg Arg Arg Leu Trp Ser Ser Thr Ala Ile1 5 10 15

Leu Arg Thr Leu Ala Ala Gly Ala Leu Ala Ala Gly Met Val Leu Ala

20 25 30

Pro Val Ser Ala Ala Asn Ala Ala Thr Thr Leu Gly Ala Ser Ala Ala35 40 45

Glu Lys Gly Arg Tyr Phe Gly Ala Ala Val Gly Thr Tyr Lys Phe Asn

50 55 60

Asp Ser Thr Tyr Met Ser Val Leu Asn Arg Glu Phe Asn Ser Leu Val65 70 75 80

Ala Glu Asn Glu Met Lys Trp Asp Ala Thr Glu Pro Gln Arg Gly Val

85 90 95

Phe Asn Tyr Ser Ala Gly Asp Arg Ile Val Asn His Ala Arg Ser Gln

100 105 110

Gly Met Lys Val Arg Gly His Ala Leu Leu Trp His Ala Gln Gln Pro115 120 125

Arg Trp Thr Glu Gly Leu Ser Gly Gly Asp Leu Arg Asn Ala Ala Ile130 135 140

Asn His Val Thr Gln Val Ala Ser His Phe Arg Gly Gln Ile Tyr Ser145 150 155 160

Trp Asp Val Val Asn Glu Ala Phe Ala Asp Gly Gly Ser Gly Ala Arg

165 170 175

Arg Asp Ser Asn Leu Gln Arg Thr Gly Asn Asp Trp Ile Glu Ala Ala

180 185 190

Phe Arg Ala Ala Arg Ala Ala Asp Pro Asn Ala Lys Leu Cys Tyr Asn195 200 205

Asp Tyr Asn Thr Asp Gly Ile Asn Ala Lys Ser Thr Gly Val Tyr Asn

210 215 220

Met Val Arg Asp Phe Lys Ser Arg Gly Val Pro Ile Asp Cys Val Gly225 230 235 240

Phe Gln Ser His Leu Gly Thr Thr Leu Pro Gly Asp Tyr Gln Ala Asn

245 250 255

Leu Gln Arg Phe Ala Asp Leu Gly Val Asp Val Glu Ile Thr Glu Leu

260 265 270

Asp Ile Thr Gln Gly Gly Asn Gln Ala Asn Met Tyr Gly Ala Val Thr

275 280 285

Arg Ala Cys Leu Ala Ile Ser Arg Cys Thr Gly Ile Thr Val Trp Gly

290 295 300

Val Arg Asp Cys Asp Ser Trp Arg Gly Gly Asp Asn Ala Leu Leu Phe305 310 315 320

Asp Cys Ala Gly Asn Lys Lys Pro Ala Tyr Thr Ala Val Leu Asp Ala

325 330 335

Leu Asn Ser Gly Ser Asn Pro Asn Pro Asn Pro Thr Gly Asn Arg Leu

340 345 350

Arg Asn Glu Ala Ser Gly Arg Cys Leu Asp Val Asn Gly Ala Ser Ser355 360 365

Ala Asn Gly Ser Gln Met Ile Gln Arg

370 375

<210> 435<211> 1116<212> DNA

<213> Cochliobolus heterostrophus ATCC 48333<400> 435

caatctcccc tgtacggcca atgtggtggt actggatgga ccggtcccac aacatgcgtt 60

tccggcgcgg tgtgtaacaa agtcaatgat ttctattccc agtgcgttcc tggtacgggt 120

ggcgggtctc ccgctcccac tactactggc aacagtaacc ctgctcctac tggaggcaat 180

ggtggaggag gctcaggagc tgcaggtgga ttgcacgaaa aattcaaggc caagggaaag 240

atctactatg gcactgaaat cgaccactac catctgaaca acgcccccct catgacgatt 300

gccaagaaca gcttcggaca gatcacgcac gagaacagct tgaagtggga tgctactgaa 360

ccatcacgtg gacaattctc gtttaccaat gccgacaagg tcgtcagctg ggctacccag 420

aacggaaagc tcatgcgtgg tcacacactg ctctggcact cgcagctgcc gtcgtgggtt 480

acgcagatca acgaccgcgc taccctgacc tccgtcatcc agaaccacgt gacacagatc 540

gtcacccact acaagggcaa gatcttgcag tgggacgtcg ttaacgagat ctttgctgag 6006607207808409009601020

aacggccaac ttcgagacag tgtctttagt cgtgtcctcg gcgaagactt tgttggtatcgctttccgcg ccgcacgcgc cgctgatccc aacgctaagc tctacatcaa cgactacaacttggacagtg ccaactacgc caaggtcacc acgggtatgg tcgcacacgt taacaagtggatatcccaag gtatccccat tgatggcatt ggcacacagg cccatcttgc cgcacctggcggctggaacc cagcttccgg cgtccccaac gccctcaagg cactggccgc cgccaatgtcaaggagattg ccattacgga gcttgatatc gccggcgccg cagcaaacga cttcctcaccgtcatgaacg gttgtcttgc cgtctcaaag tgtgttggta tcaccgtctg gggtgtctccgacaaggaca gctggcgcgc caacgaccgc cctctcttgt tcgacaccaa ctaccagcca 1080aagcaggcct acaacaccct tgttggagct ttgtaa 1116

<210> 436

<211> 371

<212> PRT

<213> Cochliobolus heterostrophus ATCC 48333<220>

<221> DOMÍNIO

<222> (4) ... (32)

<223> Fungai domínio de celulose obrigatória<220>

<221> DOMÍNIO

<222> (70)...(371)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (8)...(35)

<223> Cellulose-binding domínio, fungai tipo. Prosite id = PS00562<400> 436

Gln Ser Pro Leu Tyr Gly Gln Cys Gly Gly Thr Gly Trp Thr Gly Pro1 5 10 15

Thr Thr Cys Val Ser Gly Ala Val Cys Asn Lys Val Asn Asp Phe Tyr

20 25 30

Ser Gln Cys Val Pro Gly Thr Gly Gly Gly Ser Pro Ala Pro Thr Thr

35 40 45

Thr Gly Asn Ser Asn Pro Ala Pro Thr Gly Gly Asn Gly Gly Gly Gly

50 55 60

Ser Gly Ala Ala Gly Gly Leu His Glu Lys Phe Lys Ala Lys Gly Lys

65 70 75 80

Ile Tyr Tyr Gly Thr Glu Ile Asp His Tyr His Leu Asn Asn Ala Pro

85 90 95

Leu Met Thr Ile Ala Lys Asn Ser Phe Gly Gln Ile Thr His Glu Asn

100 105 HO

Ser Leu Lys Trp Asp Ala Thr Glu Pro Ser Arg Gly Gln Phe Ser Phe

115 120 125

Thr Asn Ala Asp Lys Val Val Ser Trp Ala Thr Gln Asn Gly Lys Leu130 135 140

Met Arg Gly His Thr Leu Leu Trp His Ser Gln Leu Pro Ser Trp Val145 150 155 160

Thr Gln Ile Asn Asp Arg Ala Thr Leu Thr Ser Val Ile Gln Asn His

165 170 175

Val Thr Gln Ile Val Thr His Tyr Lys Gly Lys Ile Leu Gln Trp Asp180 185 190

Val Val Asn Glu Ile Phe Ala Glu Asn Gly Gln Leu Arg Asp Ser Val

195 200 205

Phe Ser Arg Val Leu Gly Glu Asp Phe Val Gly Ile Ala Phe Arg Ala210 215 220

Ala Arg Ala Ala Asp Pro Asn Ala Lys Leu Tyr Ile Asn Asp Tyr Asn225 230 235 240

Leu Asp Ser Ala Asn Tyr Ala Lys Val Thr Thr Gly Met Val Ala His

245 250 255

Val Asn Lys Trp Ile Ser Gln Gly Ile Pro Ile Asp Gly Ile Gly Thr260 265 270

Gln Ala His Leu Ala Ala Pro Gly Gly Trp Asn Pro Ala Ser Gly Val

275 280 285

Pro Asn Ala Leu Lys Ala Leu Ala Ala Ala Asn Val Lys Glu Ile Ala290 295 300

Ile Thr Glu Leu Asp Ile Ala Gly Ala Ala Ala Asn Asp Phe Leu Thr305 310 315 320

Val Met Asn Gly Cys Leu Ala Val Ser Lys Cys Val Gly Ile Thr Val325

Trp Gly Val Ser Asp Lys Asp Ser340

Leu Phe Asp Thr Asn Tyr Gln Pro355 360

Gly Ala Leu

370<210> 437<211> 993<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 437

atgcgaaaac ccgcatgcgc caccctggct gtcatgatga gtttgctgtt cactcctttctctcaggcag gtcaggcctg ggagagttac aaagcgcgct tctttaagcc ggatgggcgaatcgtcgata ccggcaacgg taacgtttcc cataccgaag gccagggttt tgccatgctgatggcggtgg caaacgatga taaagcgacc tttgataaac tctggcactg gacgagcagtacgctgaaga ataaagagaa cggtcttttt tactggcgtt ataatcccgc tcaggcagacccgattgccg acaaaaacaa tgcctccgat ggcgatgtgc tcattgcctg ggctctgttaaaagcgaacg cgcgctggca tgacaaaggc tacagcacgg catcggatgc cattaccaaagcgctgcttg cccataacgt tatccgctat gcgggttacc gcgtgatggt gcccggctcacacgggttta agcaggacaa taacgttgtg cttaatcctt cctacttcgt atttcctgcctggcaggcat ttgctgagcg cagccatttg caaatatggc gacagctcgc gcaggacggacagcggctgc tgaagaaaat ggggacgggt aaagccaatc tgccaactga ctgggtctctcttgacacga aagggacgct ggcccccgca aacgcctggc cgccccgcat gagttatgacgccatccgca ttccgctgta catcagctgg tccaacgcga aaagcccctt gctgaccccgtggcgcgcct ggttcgctca gtttccgcgt gaacaaacac ccgcatgggt taacgtcacgacgaatgaat acgcccccta catgatggct ggcggtctgc tggcagtgcg tgatttaacgatgggacaga gggtcggcga gcccgacatt actgcaaatg atgattacta ttcggcaagtctgaaaatgc tggtgtggat ctcagaacaa taa<210> 438<211> 330<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1) ... (23)<220>

<221> DOMÍNIO<222> (1) . . . (329)

<223> Família 8 de hidrolase glicosila<220>

<221> SITE<222> (48)...(51)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (108)...(111)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (109) .. . (127)

<223> Família 8 de marca hidrolase glicosila. Prosite id = PS00812<220>

<221> SITE

<222> (282) . . . (285)

<223> N-glicosilação site. Prosite id = PS00001<400> 438

Met Arg Lys Pro Ala Cys Ala Thr Leu Ala Val Met Met Ser Leu Leu15 10 15

Phe Thr Pro Phe Ser Gln Ala Gly Gln Ala Trp Glu Ser Tyr Lys Ala

20 25 30

Arg Phe Phe Lys Pro Asp Gly Arg Ile Val Asp Thr Gly Asn Gly Asn35 40 45

330 335

Trp Arg Ala Asn Asp Arg Pro Leu345 350

Lys Gln Ala Tyr Asn Thr Leu Val365Val Ser His Thr Glu Gly Gln Gly Phe Ala Met Leu Met Ala Val Ala

50 55 60

Asn Asp Asp Lys Ala Thr Phe Asp Lys Leu Trp His Trp Thr Ser Ser65 70 75 80

Thr Leu Lys Asn Lys Glu Asn Gly Leu Phe Tyr Trp Arg Tyr Asn Pro

85 90 95

Ala Gln Ala Asp Pro Ile Ala Asp Lys Asn Asn Ala Ser Asp Gly Asp

100 105 110

Val Leu Ile Ala Trp Ala Leu Leu Lys Ala Asn Ala Arg Trp His Asp 115 120 125

Lys Gly Tyr Ser Thr Ala Ser Asp Ala Ile Thr Lys Ala Leu Leu Ala

130 135 140

His Asn Val Ile Arg Tyr Ala Gly Tyr Arg Val Met Val Pro Gly Ser145 150 155 160

His Gly Phe Lys Gln Asp Asn Asn Val Val Leu Asn Pro Ser Tyr Phe

165 170 175

Val Phe Pro Ala Trp Gln Ala Phe Ala Glu Arg Ser His Leu Gln Ile

180 185 190

Trp Arg Gln Leu Ala Gln Asp Gly Gln Arg Leu Leu Lys Lys Met Gly 195 200 205

Thr Gly Lys Ala Asn Leu Pro Thr Asp Trp Val Ser Leu Asp Thr Lys

210 215 220

Gly Thr Leu Ala Pro Ala Asn Ala Trp Pro Pro Arg Met Ser Tyr Asp225 230 235 240

Ala Ile Arg Ile Pro Leu Tyr Ile Ser Trp Ser Asn Ala Lys Ser Pro

245 250 255

Leu Leu Thr Pro Trp Arg Ala Trp Phe Ala Gln Phe Pro Arg Glu Gln

260 265 270

Thr Pro Ala Trp Val Asn Val Thr Thr Asn Glu Tyr Ala Pro Tyr Met 275 280 285

Met Ala Gly Gly Leu Leu Ala Val Arg Asp Leu Thr Met Gly Gln Arg

290 295 300

Val Gly Glu Pro Asp Ile Thr Ala Asn Asp Asp Tyr Tyr Ser Ala Ser305 310 315 320

Leu Lys Met Leu Val Trp Ile Ser Glu Gln

325 330

<210> 439<211> 1041<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 439

atgagaagaa gcatggaaag gctgcccaag ctccatgaag cttacggcaa tagtttcaagatcggcgctg ccgtgaatcc aattacgatg gtgacccaaa aggaattgtt gtcacaccac 120ttcaacagcg ttacggcaga aaatgaaatg aaattcgagc gattgcaccc atcggaagag 180gtgtatacat tcgagcaagc cgaccagatc gtatcgtttg ccaaatcgaa cggaatgtcg 240gtgagaggac ataccctcgt atggcataat cagacgccgg aatgggtgtt tcaagacagt 300tccggtggga cagccggccg cgagctgctg ctcgctcgga tgaaatcgca catcgatgag 360gtcgttggcc gttatcgcgg agatatctat gcttgggatg tcgtaaacga agccattgcc 420gacagtggaa gcgatctgct tcgttcctcc ccgtggcttg cgtcgatcgg ggaggatttt 480atcgccaagg ctttcgaata tgcgcacgaa gcagacccgc aagcgctgct gttttataac 540gattacaacg aatccgtgcc cgagaagcgg gagaagattt acacgctcct taaatcgtta 600aaggagcagg atgtgccgat tcacggcgtc gggcttcagg cccattggaa tttggagttt 660ccatcgcttg acgatatccg cagggcaatc gaaaggtatg caagccttgg catgatcttg 720catatcacgg agcttgacgt atccgtattc gcgcatgagg ataagcggac cgatctggcg 780gcgccgaccg aagaaatgct tgagcgccag gcggagcgtt acggtcaatt gttccgtctg 840cttaaagagt acagcggcag cgtcacttcc gtgaccttct ggggagcggc ggacgattat 900acctggctgg atcattttcc ggtaaggggc cgcaaaaatt ggccgttcgt cttcgacgag 960aaccatcttc cgaaggaatc ctattggaac ctgttgaagg aagccaatcc cgaaagaaca 1020ttccaagaga tacgttcgta a 1041

<210> 440<211> 346<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental

60<220>

<221> DOMÍNIO<222> (10)...(335)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (185).. . (188)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (240)...(250)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 440

Met Arg Arg Ser Met Glu Arg Leu Pro Lys Leu His Glu Ala Tyr Gly1 5 10 15 Asn Ser Phe Lys Ile Gly Ala Ala Val Asn Pro Ile Thr Met Val Thr 20 25 30 Gln Lys Glu Leu Leu Ser His His Phe Asn Ser Val Thr Ala Glu Asn 35 40 45 Glu Met Lys Phe Glu Arg Leu His Pro Ser Glu Glu Val Tyr Thr Phe 50 55 60 Glu Gln Ala Asp Gln Ile Val Ser Phe Ala Lys Ser Asn Gly Met Ser65 70 75 80Val Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Glu Trp Val 85 90 95 Phe Gln Asp Ser Ser Gly Gly Thr Ala Gly Arg Glu Leu Leu Leu Ala 100 105 110 Arg Met Lys Ser His Ile Asp Glu Val Val Gly Arg Tyr Arg Gly Asp 115 120 125 Ile Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Ala Asp Ser Gly Ser 130 135 140 Asp Leu Leu Arg Ser Ser Pro Trp Leu Ala Ser Ile Gly Glu Asp Phe145 150 155 160Ile Ala Lys Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Gln Ala Leu 165 170 175 Leu Phe Tyr Asn Asp Tyr Asn Glu Ser Val Pro Glu Lys Arg Glu Lys 180 185 190 Ile Tyr Thr Leu Leu Lys Ser Leu Lys Glu Gln Asp Val Pro Ile His 195 200 205 Gly Val Gly Leu Gln Ala His Trp Asn Leu Glu Phe Pro Ser Leu Asp 210 215 220 Asp Ile Arg Arg Ala Ile Glu Arg Tyr Ala Ser Leu Gly Met Ile Leu225 230 235 240His Ile Thr Glu Leu Asp Val Ser Val Phe Ala His Glu Asp Lys Arg 245 250 255 Thr Asp Leu Ala Ala Pro Thr Glu Glu Met Leu Glu Arg Gln Ala Glu 260 265 270 Arg Tyr Gly Gln Leu Phe Arg Leu Leu Lys Glu Tyr Ser Gly Ser Val 275 280 285 Thr Ser Val Thr Phe Trp Gly Ala Ala Asp Asp Tyr Thr Trp Leu Asp 290 295 300 His Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Phe Val Phe Asp Glu305 310 315 320Asn His Leu Pro Lys Glu Ser Tyr Trp Asn Leu Leu Lys Glu Ala Asn 325 330 335 Pro Glu Arg Thr Phe Gln Glu Ile Arg Ser 340 345 <210> 441 <211> 1239 <212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 441

atgctaaccg atagcgaaat tcgtaagcat cgcctgaccc gcgccactct cacgctcatg 60

catcagggcg tgccgctggc gggtcaagat gtcgttgtat ctcaaaaaaa acatgccttt 120ctctttggta gcaattgggg cgaaagcacc atcccgctgg tcaatggcga actgacaggc 180cgtgaaaaag aactggcaga acggcgcaac gagtattttt tgcagttttt taaccaggct 240

actttgccat tttactgggc gcgtttcgag ccgcggcggg gccagcccga tactgttcga 300

attatgaatg cggcccgctg gtatgcccgg cagggctgcg ttctgaaggg acatccgctc 360

tgctggcata ccctcaccgc cgactggctg ctggagatga gcaacgaaca aattctcgaa 420

tcccagttgg cgcgtattcg gcgcgatgtg accgattttt ccggggtcat cgagacctgg 480

gatgtagtga acgaagcggt catcatgcca attttcgaca aatatgataa tggcgtgacg 540

cgcttgtgca aacagatggg gcgcatcggg ctgattcgcg tcatgttcga ggcagctcgc 600

gccgctaacc cgcgcgccat tctgattttg aatgatttcg acatttcgcc tgcttacgat 660

ttgctggttg aagaatgtct ggcggccggc gttccgattg atgtaattgg catccaatcg 720

cácatgcacc agggctactg gggcgtagaa aaaacgcagg aaattctctc tcgtttcgag 780

cgtttcaact tgccaattca attcagcgag accacaattg tctctggtca tctcatgccg 840

cctgaaattg ttgatttgaa tgattaccag gtgagcgagt ggcccagcac ccccgagggc 900

gaggagcgcc aggctcgcga ggtggtcacg cattacaaaa ccctgctctc gcacccgctg 960

gtaaccggaa tcacctggtg ggatatgacg gatggtggct ggctcaatgc accggcagga 1020

ctgttgcgcc aggaccaatc tcccaagccc gcttatgacg agttgctcaa actggtcaag 1080

ggcgagtggt ggctttcccc gacccgcctg accactaatt ctgccggaca actgaccctc 1140

gaaggctttc ctggcgaata cgaatcatcg ttcgacaagc agaaattcgt tttttcgctg 1200

ggttctaaaa ccgaaacgga aatttttgtt catttttga 1239

<210> 442

<211> 412

<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental

<220>

<221> DOMÍNIO<222> (49)...(359)

<223> Família 10 de hidrolase glicosila<400> 442

Met Leu Thr Asp Ser Glu Ile Arg Lys His Arg Leu Thr Arg Ala Thr 1 5 10 15 Leu Thr Leu Met His Gln Gly Val Pro Leu Ala Gly Gln Asp Val Val 20 25 30 Val Ser Gln Lys Lys His Ala Phe Leu Phe Gly Ser Asn Trp Gly Glu 35 40 45 Ser Thr 50 Ile Pro Leu Val Asn 55 Gly Glu Leu Thr Gly 60 Arg Glu Lys Glu Leu Ala Glu Arg Arg Asn Glu Tyr Phe Leu Gln Phe Phe Asn Gln Ala 65 70 75 80 Thr Leu Pro Phe Tyr Trp Ala Arg Phe Glu Pro Arg Arg Gly Gln Pro 85 90 95 Asp Thr Val Arg 100 Ile Met Asn Ala Ala 105 Arg Trp Tyr Ala Arg 110 Gln Gly Cys Val Leu Lys Gly His Pro Leu Cys Trp His Thr Leu Thr Ala Asp 115 120 125 Trp Leu 130 Leu Glu Met Ser Asn 135 Glu Gln Ile Leu Glu 140 Ser Gln Leu Ala Arg Ile Arg Arg Asp Val Thr Asp Phe Ser Gly Val Ile Glu Thr Trp 145 150 155 160 Asp Val Val Asn Glu 165 Ala Val Ile Met Pro 170 Ile Phe Asp Lys Tyr 175 Asp Asn Gly Val Thr Arg Leu Cys Lys Gln Met Gly Arg Ile Gly Leu Ile 180 185 190 Arg Val Met Phe Glu Ala Ala Arg Ala Ala Asn Pro Arg Ala Ile Leu 195 200 205 Ile Leu 210 Asn Asp Phe Asp Ile 215 Ser Pro Ala Tyr Asp 220 Leu Leu Val Glu Glu Cys Leu Ala Ala Gly Val Pro Ile Asp Val Ile Gly Ile Gln Ser 225 230 235 240 His Met His Gln Gly 245 Tyr Trp Gly Val Glu 250 Lys Thr Gln Glu Ile 255 Leu Ser Arg Phe Glu 260 Arg Phe Asn Leu Pro 265 Ile Gln Phe Ser Glu 270 Thr Thr Ile Val Ser Gly His Leu Met Pro Pro Glu Ile Val Asp Leu Asn Asp 275 280 285 Tyr Gln 290 Val Ser Glu Trp Pro 295 Ser Thr ■ Pro Glu Gly 300 Glu Glu Arg GlnAla Arg Glu Val Val Thr His Tyr Lys Thr Leu Leu305 310 315

Val Thr Gly Ile Thr Trp Trp Asp Met Thr Asp Gly

325 330

Ala Pro Ala Gly Leu Leu Arg Gln Asp Gln Ser Pro

340 345

Asp Glu Leu Leu Lys Leu Val Lys Gly Glu Trp Trp

355 360

Arg Leu Thr Thr Asn Ser Ala Gly Gln Leu Thr Leu370 375 380

Gly Glu Tyr Glu Ser Ser Phe Asp Lys Gln Lys Phe385 390 395

Gly Ser Lys Thr Glu Thr Glu Ile Phe Val His Phe405 410

<210> 443<211> 912<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 443

atgaagatga cctacatgca tccggctgaa gatacttact cgtttggtca agcggatcagttggtcaact gggcgaaagc gaatggtatt ggcgtgcacg gccacactct ggtttggcactccgaatacc aggtacccaa ttggatgaaa aattactctg gtgatgcaac tgcattccaaaccatgctca acacccatgt gaaaactgtg gctgagcatt ttgctggcga actggacagctgggacgttg tgaatgaagt gctggagccg ggctccaatg gttgctggcg tgaaaactctctgttctacc agaagcttgg caaagacttt gtcgcgaacg cattccgtgc agctcgcgagggtgatccca atgcagactt gtattacaac gattactcga ctgaaaatgg tgtaacttccgatgcgaagt tcagttgttt gttggaacta gtcgataagc ttctggaagc ggacgtgccgattacaggtg tgggtttcca aatgcacgtg caggcgacgt ggcctagcaa tgccaacatcggcaaggcat tcaaagccat cgcggatcgc ggtctgaaag ttaaaatttc tgagctcgatgttcctgtta acaaccctta cggaaccact aatttcccgc aatacagcag ttttaccgcggaagccgccg agctgcaaaa gcagcgctac aagggcatta tgcaagcgta ccttgataacgtaccggcca acctgcgtgg tggtttcacc gtgtggggcg tttgggatgg cgatagctggatcatgacgt tcagccagta caccaacgct aacgccaacg actggccact gttgttcaccggcccgcaga atggtccata cgaagcgaag cctgcgtact acggcgtatt ggaagccctgatgggtcagt aa<210> 444<211> 303<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (1)...(300)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (51)...(54)

<223> N-glicosilação site. Prosite id = PS00001<400> 444

Met Lys Met Thr Tyr Met His Pro Ala Glu Asp Thr Tyr Ser Phe Gly1 5 10 15 Gln Ala Asp Gln Leu Val Asn Trp Ala Lys Ala Asn Gly Ile Gly Val 20 25 30 His Gly His Thr Leu Val Trp His Ser Glu Tyr Gln Val Pro Asn Trp 35 40 45 Met Lys Asn Tyr Ser Gly Asp Ala Thr Ala Phe Gln Thr Met Leu Âsn 50 55 60 Thr His Val Lys Thr Val Ala Glu His Phe Ala Gly Glu Leu Asp Ser65 70 75 80Trp Asp Val Val Asn Glu Val Leu Glu Pro Gly Ser Asn Gly Cys Trp 85 90 95 Arg Glu Asn Ser Leu Phe Tyr Gln Lys Leu Gly Lys Asp Phe Val Ala 100 105 110 Asn Ala Phe Arg Ala Ala Arg Glu Gly Asp Pro Asn Ala Asp Leu Tyr

Ser His Pro Leu320

Gly Trp Leu Asn335

Lys Pro Ala Tyr350

Leu Ser Pro Thr365

Glu Gly Phe Pro

Val Phe Ser Leu400<211><212>

115 120 125

Tyr Asn Asp Tyr Ser Thr Glu Asn Gly Val Thr Ser Asp Ala Lys Phe

130 135 140

Ser Cys Leu Leu Glu Leu Val Asp Lys Leu Leu Glu Ala Asp Val Pro145 150 155 160

Ile Thr Gly Val Gly Phe Gln Met His Val Gln Ala Thr Trp Pro Ser

165 170 175

Asn Ala Asn Ile Gly Lys Ala Phe Lys Ala Ile Ala Asp Arg Gly Leu

180 185 190

Lys Val Lys Ile Ser Glu Leu Asp Val Pro Val Asn Asn Pro Tyr Gly

195 200 205

Thr Thr Asn Phe Pro Gln Tyr Ser Ser Phe Thr Ala Glu Ala Ala Glu

210 215 220

Leu Gln Lys Gln Arg Tyr Lys Gly Ile Met Gln Ala Tyr Leu Asp Asn225 230 235 240

Val Pro Ala Asn Leu Arg Gly Gly Phe Thr Val Trp Gly Val Trp Asp

245 250 255

Gly Asp Ser Trp Ile Met Thr Phe Ser Gln Tyr Thr Asn Ala Asn Ala

260 265 270

Asn Asp Trp Pro Leu Leu Phe Thr Gly Pro Gln Asn Gly Pro Tyr Glu

275 280 285

Ala Lys Pro Ala Tyr Tyr Gly Val Leu Glu Ala Leu Met Gly Gln

290 295 300

<210> 4451191DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 445

atgaaaaata taatattaaa cttatctccc gtcgtttttg cactgctgat attgactgccgcatgtgaac ctgtgcaaga agagaatacc tcgctgtcgc ttgatccacc attgtatgaggtttatgagg acgcatttct tctgggtacg atccttaaca gggcccagat ctacgccgacggcggtgaag tcccggttga ggtcgtgcgt caggaccggc gcggctattt tgtggagcgtcaggtcatcc cgcagccgga aggcctgaaa ctcggcctgc atcatttcaa tcaggttaccgctgagaatg tcatgaaatg ggaggaaatc cacccggaac ccggagtgta tgacttcgatgcggctgacc ggctggtgga tctcgcggaa gccaacggga tgcacatcac cggacacgccctggtatggc acaaccagac accagactgg gtatttgaag atgacaacgg ccagccaattgatcgcgacg cattgctgga aaggatgcgc gatcatattc atacggttgt tggaagatacgccggacgtg tccactcatg ggatgtggtc aacgaggccg tcagtgaaga tggtggtttccgccagaccc gctggcttga aataattgga gatgatttca ttgtcagggc ttttgaatacgcgcatgaag ccgatccgga agcacgcctg tattacaacg actacaatat ggagactaatccggtcaagc gtcagggtgc gatcgatatt gtgcggaatg tcatggacag cggtgtcccggttcacggta tcggaaccca gagccatctg aacctcctca gctttccgga ccttgccgaagtagaacagg ctattatcga ttttgcggaa cttggaatcg aagtcatggt cacggagcttgatattacgg tccttccttc gccgagaagt gatgacccgg atccgtatgc cgacggactacccattgatg ttgccgaaga gcaggcacag cgctatcggg atttgttcga gatatatctcaaacacagcg atgtggttac ccgtgttact ttttggggcc acatggatga gagtcactggctgaactacc tgccaatcga gcgcgccaac caccctgtgc tttttgaccg ggataaccaggccaagccgg cttttcatgc tgtttacgag ctgggtgccg gaagaaactg a<210> 446396PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (37)... (392)

<223> Família 10 de hidrolase glicosila<220>

SITE

(29)...(32)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (296)...(306)

601201802403003604204805406006607207808409009601020108011401191

<211><212>

<221><222><223> Família 10 ativa site de hidrolases glicosila. Prosite id =<400> 446

Met Lys Asn Ile Ile Leu Asn Leu Ser Pro Val Val Phe Ala Leu Leu1 5 10 15 Ile Leu Thr Ala Ala Cys Glu Pro Val Gln Glu Glu Asn Thr Ser Leu 20 25 30 Ser Leu Asp Pro Pro Leu Tyr Glu Val Tyr Glu Asp Ala Phe Leu Leu 35 40 45 Gly Thr Ile Leu Asn Arg Ala Gln Ile Tyr Ala Asp Gly Gly Glu Val 50 55 60 Pro Val Glu Val Val Arg Gln Asp Arg Arg Gly Tyr Phe Val Glu Arg65 70 75 80Gln Val Ile Pro Gln Pro Glu Gly Leu Lys Leu Gly Leu His His Phe 85 90 95 Asn Gln Val Thr Ala Glu Asn Val Met Lys Trp Glu Glu Ile His Pro 100 105 110 Glu Pro Gly Val Tyr Asp Phe Asp Ala Ala Asp Arg Leu Val Asp Leu 115 120 125 Ala Glu Ala Asn Gly Met His Ile Thr Gly His Ala Leu Val Trp His 130 135 140 Asn Gln Thr Pro Asp Trp Val Phe Glu Asp Asp Asn Gly Gln Pro Ile145 150 155 160Asp Arg Asp Ala Leu Leu Glu Arg Met Arg Asp HiS Ile His Thr Val 165 170 175 Val Gly Arg Tyr Ala Gly Arg Val His Ser Trp Asp Val Val Asn Glu 180 185 190 Ala Val Ser Glu Asp Gly Gly Phe Arg Gln Thr Arg Trp Leu Glu Ile 195 200 205 Ile Gly Asp Asp Phe Ile Val Arg Ala Phe Glu Tyr Ala His Glu Ala 210 215 220 Asp Pro Glu Ala Arg Leu Tyr Tyr Asn Asp Tyr Asn Met Glu Thr Asn225 230 235 240Pro Val Lys Arg Gln Gly Ala Ile Asp Ile Val Arg Asn Val Met Asp 245 250 255 Ser Gly Val Pro Val His Gly Ile Gly Thr Gln Ser His Leu Asn Leu 260 265 270 Leu Ser Phe Pro Asp Leu Ala Glu Val Glu Gln Ala Ile Ile Asp Phe 275 280 285 Ala Glu Leu Gly Ile Glu Val Met Val Thr Glu Leu Asp Ile Thr Val 290 295 300 Leu Pro Ser Pro Arg Ser Asp Asp Pro Asp Pro Tyr Ala Asp Gly Leu305 310 315 320Pro Ile Asp Val Ala Glu Glu Gln Ala Gln Arg Tyr Arg Asp Leu Phe 325 330 335 Glu Ile Tyr Leu Lys His Ser Asp Val Val Thr Arg Val Thr Phe Trp 340 345 350 Gly His Met Asp Glu Ser His Trp Leu Asn Tyr Leu Pro Ile Glu Arg 355 360 365 Ala Asn His Pro Val Leu Phe Asp Arg Asp Asn Gln Ala Lys Pro Ala 370 375 380 Phe His Ala Val Tyr Glu Leu Gly Ala Gly Arg Asn 385 390 395 <210> 447 <211> 1107 <212> DNA <213> Desconhecido <220> <223> Obtido para amostra ambiental <400> 447

atgaatgcgc tacgcacagg ggcgatattg gtattgatgc tggcggcggc gcaggtcagcgccgcctgcc ggtggccggc ctgggatcag ttcaggaaag agtacgtcag cgccgaagggcgcgtcgttg accccagcga tccgcgaaaa atcaccactt cggaagggca gagctacggcctgttctttg ccctggcggc taacgatcgc gatgcgttcg gcaagctgct gcagtggacgcaaaacaacc tcgccgaggg cgacctgcgc gcgcgcctgc ccggctggct gtggggcaaaaagagcgaca gcgagtggac gatgctggac agcaactcgg cctccgattc ggacctgtggatagcctggt cgctgctgga agccgggcgt ctgtggcaga tgccgcagta cgttgagacgggtaaagcgc tgctgtcgcg gattgcgcaa gaagaggtgg cggacgtgcc ggggctggggccgatggtgc tgccggggaa ggtcggcttt gctgacgata aaggctggcg cttcaaccccagctatctcc cgccgcagct ggcgaactat tttgtccgct acggcgcccc gtggccgaagctgcgcgacg gcaatatccg cctgctgctg gagacggcgc ccaagggcct ctcccctgactgggtacgct acgagaaagg taagggctgg gagctgaagg cggataaacc gattatcggcagctacgacg cgatccgcgt ctatttgtgg gtcggcatgc tcaacgacgg cgataagcagaagacacgcc tgctggctca ttttaaaccg atggcgcagc agaccatcag ccagggcctgccgccggaaa aggtgaatat cgccaccgcg aagaccgcag gaaatggccc ggtaggcttctcggccgcgc tgctgccgtt cttgcaaaat gaggatgccc gggccgttca gcgccagcgcgtcagcgaca actatcccgg cgcggacgcg tactatagcg cggtcctgac cctttttggccagggatggg atcaacatcg ttttcgcttt accgccgatg gcgaattaca acctgactggaaccaggaat gcgtaagttc tcactaa<210> 448<211> 368<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (1)...(346)

<223> Família 8 de hidrolase glicosila<400> 448

Met Asn Ala Leu Arg Thr Gly Ala Ile Leu Val Leu Met Leu Ala Ala1 5 10 15 Ala Gln Val Ser Ala Ala Cys Arg Trp Pro Ala Trp Asp Gln Phe Arg 20 25 30 Lys Glu Tyr Val Ser Ala Glu Gly Arg Val Val Asp Pro Ser Asp Pro 35 40 45 Arg Lys Ile Thr Thr Ser Glu Gly Gln Ser Tyr Gly Leu Phe Phe Ala 50 55 60 Leu Ala Ala Asn Asp Arg Asp Ala Phe Gly Lys Leu Leu Gln Trp Thr65 70 75 80Gln Asn Asn Leu Ala Glu Gly Asp Leu Arg Ala Arg Leu Pro Gly Trp 85 90 95 Leu Trp Gly Lys Lys Ser Asp Ser Glu Trp Thr Met Leu Asp Ser Asn 100 105 110 Ser Ala Ser Asp Ser Asp Leu Trp Ile Ala Trp Ser Leu Leu Glu Ala 115 120 125 Gly Arg Leu Trp Gln Met Pro Gln Tyr Val Glu Thr Gly Lys Ala Leu 130 135 140 Leu Ser Arg Ile Ala Gln Glu Glu Val Ala Asp Val Pro Gly Leu Gly145 150 155 160Pro Met Val Leu Pro Gly Lys Val Gly Phe Ala Asp Asp Lys Gly Trp 165 170 17 5 Arg Phe Asn Pro Ser Tyr Leu Pro Pro Gln Leu Ala Asn Tyr Phe Val 180 185 190 Arg Tyr Gly Ala Pro Trp Pro Lys Leu Arg Asp Gly Asn Ile Arg Leu 195 200 205 Leu Leu Glu Thr Ala Pro Lys Gly Leu Ser Pro Asp Trp Val Arg Tyr 210 215 220 Glu Lys Gly Lys Gly Trp Glu Leu Lys Ala Asp Lys Pro Ile Ile Gly225 230 235 240Ser Tyr Asp Ala Ile Arg Val Tyr Leu Trp Val Gly Met Leu Asn Asp 245 250 255 Gly Asp Lys Gln Lys Thr Arg Leu Leu Ala His Phe Lys Pro Met Ala 260 265 270 Gln Gln Thr Ile Ser Gln Gly Leu Pro Pro Glu Lys Val Asn Ile Ala 275 280 285 Thr Ala Lys Thr Ala Gly Asn Gly Pro Val Gly Phe Ser Ala Ala Leu 290 295 300 Leu Pro Phe Leu Gln Asn Glu Asp Ala Arg Ala Val Gln Arg Gln Arg305 310 315 320Val Ser Asp Asn Tyr Pro Gly Ala Asp Ala Tyr Tyr Ser Ala Val Leu 325 330 335 Thr Leu Phe Gly Gln Gly Trp Asp Gln His Arg Phe Arg Phe Thr Ala 340 345 350 Asp Gly Glu Leu Gln Pro Asp Trp Asn Gln Glu Cys Val Ser Ser His355 360

<210> 449<211> 1107<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 449

gtgatgaaag cctttcgctg gtgtgtcatt gcgttgatgcgccgcctgta catggcctgc ctgggagaaa tttaaacaggcgggtcattg atcccagcga cacgcgtaaa atcactacctctgttctttg ccctcgccgc gaatgaccgt aaagcgttcgcgggataacc ttgccggggg gcatctcgac gacacgctccaaagacaaag acacctgggc ggttatcgat accaattccgatcgcctggt ccctgcttga agcggggcgg ttatggaaagggcaagacgc tactcgagcg catcgcccgc gaagaagtggctgatgctgc tgcccggtaa agttggcttt gtcgatgagaagctatcttc ctccacagct cgcaagctac ttcacgcgttctgcgtgaga ccaatctgcg cttgctgctg gagagtgcgctgggtgcaat accagaaaaa caaaggctgg cggttacaacggatatgacg ccatccgcgt ctatctctgg gtggggatgaaaagcccggc tgctggcgcg cttcaggccg atggccgccaccaccggaga aagtgaatgt ggcgagtgga gcacgcacggtctgccgcca tgctgccttt tttacaacag cgtgatgcgcgtggctgacc actttcctga taataatgct tactacagttcaaggatggg atcagcatcg ttttcgtttc accacaaaagggccaggaat gcgcaagttc acagtaa<210> 450<211> 368<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220><221><222><220><221><222>

365

tggcggcggcattacatcagcggaagggcaacaaggtgctccgcctggttcctcggatgcacgctgactatgaaagtaccacgcctggcgttggcgcccccgaaaggtttaggagccgcctgaacgataaccacaacaaagcaatggcccaggccgtccaatgtactgacgtgaattaat

gcctctgcgccgagggcgggaagctacgcgggcatggacgatgggggcaacgatatctggtacccgtacgtggcctcggtttttaatcccgtggaccaccttcgccggacgctggtggggcgatcctcagacagggcgtaggtcggcttcgcgccagcgctctctttggaaccggattgg

SIGNAL(1)...(22)

DOMÍNIO(1)...(346)

<223> Família 8 de hidrolase glicosila<400> 450

Met Met Lys Ala Phe Arg Trp Cys Val Ile Ala15 10

Ala Pro Leu Arg Ala Ala Cys Thr Trp Pro Ala

20 25

Gln Asp Tyr Ile Ser Glu Gly Gly Arg Val Ile

35 40

Arg Lys Ile Thr Thr Ser Glu Gly Gln Ser Tyr

50 55

Leu Ala Ala Asn Asp Arg Lys Ala Phe Asp Lys65 70 75Arg Asp Asn Leu Ala Gly Gly His Leu Asp Asp

85 90

Leu Trp Gly Gln Lys Asp Lys Asp Thr Trp Ala

105

Ile Trp Ile Ala Trp120

Gly Arg Leu Trp Lys Asp Ala Asp Tyr Thr Arg

100

Ser Ala Ser Asp Ala Asp115

130

135

Leu Glu Arg Ile Ala Arg Glu Glu Val Val Lys145 150 155

Leu Met Leu Leu Pro Gly Lys Val Gly Phe Val

165 170

Arg Phe Asn Pro Ser Tyr Leu Pro Pro Gln Leu

180 185

Arg Phe Gly Ala Pro Trp Thr Thr Leu Arg Glu195 200

Leu Met

Trp Glu

Asp Pro

45Ala Leu60

Val Leu

Thr Leu

Val Ile

Ser Leu125Thr Gly140

Val Pro

Asp Glu

Ala Ser

Thr Asn205

Leu Ala Ala15

Lys Phe Lys30

Ser Asp Thr

Phe Phe Ala

Ala Trp Thr80

Pro Ala Trp95

Asp Thr Asn110

Leu Glu Ala

Lys Thr Leu

Gly Leu Gly160

Asn Ala Trp175

Tyr Phe Thr190

Leu Arg Leu

60120180240300360420480540600660720780840900960102010801107Leu Leu Glu Ser Ala Pro Lys Gly Phe Ser Pro Asp Trp Val Gln Tyr

210 215 220

Gln Lys Asn Lys Gly Trp Arg Leu Gln Gln Glu Pro Pro Leu Val Gly225 230 235 240

Gly Tyr Asp Ala Ile Arg Val Tyr Leu Trp Val Gly Met Met Asn Asp

245 250 255

Asn Asp Pro Gln Lys Ala Arg Leu Leu Ala Arg Phe Arg Pro Met Ala

260 265 270

Ala Thr Thr Thr Lys Gln Gly Val Pro Pro Glu Lys Val Asn Val Ala

275 280 285

Ser Gly Ala Arg Thr Gly Asn Gly Pro Val Gly Phe Ser Ala Ala Met

290 295 300

Leu Pro Phe Leu Gln Gln Arg Asp Ala Gln Ala Val Gln Arg Gln Arg305 310 315 320

Val Ala Asp His Phe Pro Asp Asn Asn Ala Tyr Tyr Ser Tyr Val Leu

325 330 335

Thr Leu Phe Gly Gln Gly Trp Asp Gln His Arg Phe Arg Phe Thr Thr

340 345 350

Lys Gly Glu Leu Ile Pro Asp Trp Gly Gln Glu Cys Ala Ser Ser Gln355 360 365

<210> 451<211> 681<212> DNA<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 451

ttgttatttg aacggttgaa agcacatatt tcaactgttg tacagcgata taaggggaaa 60

gtgtactgtt gggatgtcgt taatgaagct gttgcggatg aagataacga tttattgcgt 120

atttctagat ggagtgaagt agctggcatg gaattcatcg agaaggcatt tctttatgcc 180

cgtgaagctg atcctaatgc ccttttattt tacaacgatt ataatgaatc atttccagag 240

aaaagggaga agatttacaa gttagtgaag tcactacttg aaaaacacat accagtcgat 300

ggtataggga tgcaagcaca ttggagtttg actcgtccaa cattagaaga gattcgtata 360

gctattgaac gatatgcctc acttggcgtc caactacata ttacagagtt ggacatatcc 420

atgttcgagt ttgacgacca tcgaaatgat ttaataaagc cgacagatca aatgattgat 480

aagcaagcag agcggtatga acaaattttt tctttattta aggagtatag tgatgtcatt 540

caaaatgtaa cattttgggg cattgcagac gattatacgt ggcttgataa ttttccagtg 600

gagaatagaa aaaattggcc gtttttgttt gatgaaaatc atcagccgaa gccagctttt 660

tggaaagtct gtacatgtta a 681

<210> 452<211> 226<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (1)...(22 5)

<223> Família 10 de hidrolase glicosila

<220>

<221> SITE<222> (76)...(79)

<223> N-glicosilação site. Prosite id = PS00001<220>55 <221> SITE

<222> (184)...(187)

<223> N-glicosilação site. Prosite id = PS00001<400> 452

Met Leu Phe Glu Arg Leu Lys Ala His Ile Ser Thr Val Val Gln Arg

1 5 10 15

Tyr Lys Gly Lys Val Tyr Cys Trp Asp Val Val Asn Glu Ala Val Ala

20 25 30

Asp Glu Asp Asn Asp Leu Leu Arg Ile Ser Arg Trp Ser Glu Val Ala35 40 45

Gly Met Glu Phe Ile Glu Lys Ala Phe Leu Tyr Ala Arg Glu Ala Asp50 55 60

Pro Asn Ala Leu Leu Phe Tyr Asn Asp Tyr Asn Glu Ser Phe Pro Glu65 70 75 80Lys Arg Glu Lys Ile 85 Tyr Lys Leu Val Lys 90 Ser Leu Leu Glu Lys 95 HisIle Pro Val Asp 100 Gly Ile Gly Met Gln 105 Ala His Trp Ser Leu 110 Thr ArgPro Thr Leu 115 Glu Glu Ile Arg Ile 120 Ala Ile Glu Arg Tyr 125 Ala Ser LeuGly Val 130 Gln Leu His Ile Thr 135 Glu Leu Asp Ile Ser 140 Met Phe Glu PheAsp Asp His Arg Asn Asp Leu Ile Lys Pro Thr Asp Gln Met Ile Asp

145 150 155 160

Lys Gln Ala Glu Arg Tyr Glu Gln Ile Phe Ser Leu Phe Lys Glu Tyr

165 170 175

Ser Asp Val Ile Gln Asn Val Thr Phe Trp Gly Ile Ala Asp Asp Tyr

180 185 190

Thr Trp Leu Asp Asn Phe Pro Val Glu Asn Arg Lys Asn Trp Pro Phe

195 200 205

Leu Phe Asp Glu Asn His Gln Pro Lys Pro Ala Phe Trp Lys Val Cys

210 215 220

Thr Cys225

<210> 453<211> 1002<212> DNA

<213> Cochliobolus heterostrophus ATCC 48333<400> 453

ggccctgttc gtcctggccc cagtgatagc ctttacaagg ccatggagaa ggccggaagg 60

gacttcattg gcactgccct gaccctcagg aactctaccc gcgaggacga gattatggat 120gccgacttca actccttcac gcctgagaac agcatgaagt gggagtcgac cgagccatct 180cgtaacaact tcacctttgc ggatgccgac cgctatgccg catacgccaa gaagaacgag 240ttcgaggtcc actgccacac gcttgtctgg cactcccagc tccctgcctg ggtctccaac 300ggcggtttcg acaacaagac gctgattgac atcatggaga accacatcaa gaccgtcatg 360acgcgctaca agagcgtctg cacccgctgg gacgttgtca acgaggccct caacgaagac 420ggcacctacc gcgagtccgt gtggtacaac accatcggcg aggccttcct gcccattgcc 480ttccgcttcg ccaaccagta ccgcggcaag gcceaactct actacaacga ctacaácctc 540gagtacaacg gcaacaagac ccagggtgct gcccgtatcg tcaagctcat caagtcctac 600ggcatccgca ttgatggcgt cggctaccag gcccatctcg ccagcgagcc cacccccacc 660gcccccggcg ctgcccccga ccaggccact ctcgaggctg ccctccgcgc caccgccaac 720ctcggcgtca aggtcgccta caccgagatc gatctccgca tgaacacccc tgccaccccc 780gagaagctcc aggtccaggc cgatgctttc gagcgcgttg ccaggtcctg ccttgctgtc 840aagcagtgca ctggtatgac tgtctggggt atttctgacc tgtactcgtg gatccctggc 900gttttcgctg gtgagggcgc tgccctgctc tgggatgagt cctacaacaa gaagcctgcc 960tatgctggtt tcttgaaggg aatcaaggcc aagaagcact ag 1002

<210> 454<211> 333<212> PRT

<213> Cochliobolus heterostrophus ATCC 48333<220>

<221> DOMÍNIO<222> (10)...(328)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (31)...(34)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (63)... (66)

<223> N-glicosilação site. Prosite id = PS00001<22 0>

<221> SITE

<222> (106)...(109)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (187)...(190)

<223> N-glicosilação site. Prosite id = PS00001<400> 454

Gly Pro Val Arg Pro Gly Pro Ser Asp Ser Leu Tyr Lys Ala Met Glu1 5 10 15

Lys Ala Gly Arg Asp Phe Ile Gly Thr Ala Leu Thr Leu Arg Asn Ser 20 25 30

Thr Arg Glu Asp Glu Ile Met Asp Ala Asp Phe Asn Ser Phe Thr Pro

35 40 45

Glu Asn Ser Met Lys Trp Glu Ser Thr Glu Pro Ser Arg Asn Asn Phe50 55 60

Thr Phe Ala Asp Ala Asp Arg Tyr Ala Ala Tyr Ala Lys Lys Asn Glu65 70 75 80

Phe Glu Val His Cys His Thr Leu Val Trp His Ser Gln Leu Pro Ala

85 90 95

Trp Val Ser Asn Gly Gly Phe Asp Asn Lys Thr Leu Ile Asp Ile Met

100 105 no

Glu Asn His Ile Lys Thr Val Met Thr Arg Tyr Lys Ser Val Cys Thr

115 120 125

Arg Trp Asp Val .Veii Asn Glu Ala Leu Asn Glu Asp Gly Thr Tyr Arg130 135 140

Glu Ser Val Trp Tyr Asn Thr Ile Gly Glu Ala Phe Leu Pro Ile Ala145 150 155 160

Phe Arg Phe Ala Asn Gln Tyr Arg Gly Lys Ala Gln Leu Tyr Tyr Asn

165 170 175

Asp Tyr Asn Leu Glu Tyr Asn Gly Asn Lys Thr Gln Gly Ala Ala Arg 180 185 190

Ile Val Lys Leu Ile Lys Ser Tyr Gly Ile Arg Ile Asp Gly Val Gly

195 200 205

Tyr Gln Ala His Leu Ala Ser Glu Pro Thr Pro Thr Ala Pro Gly Ala210 215 220

Ala Pro Asp Gln Ala Thr Leu Glu Ala Ala Leu Arg Ala Thr Ala Asn225 230 235 240

Leu Gly Val Lys Val Ala Tyr Thr Glu Ile Asp Leu Arg Met Asn Thr

245 250 255

Pro Ala Thr Pro Glu Lys Leu Gln Val Gln Ala Asp Ala Phe Glu Arg

260 265 270

Val Ala Arg Ser Cys Leu Ala Val Lys Gln Cys Thr Gly Met Thr Val

275 280 285

Trp Gly Ile Ser Asp Leu Tyr Ser Trp Ile Pro Gly Val Phe Ala Gly290 295 300

Glu Gly Ala Ala Leu Leu Trp Asp Glu Ser Tyr Asn Lys Lys Pro Ala305 310 315 320

Tyr Ala Gly Phe Leu Lys Gly Ile Lys Ala Lys Lys His325 330

<210> 455

<211> 2823

<212> DNA<213> Bactéria<400> 455

gtggccggag aatggactga gatttcggca aaatacaaag cacccaaaac tgcagtgaatattactttgt caattacaac cgacagcact gtagatttca tttttgacga tgtaaccata 120

180240300360

acccgtaaag gaatggctga ggcaaacaca gtatatgcag caaacgctgt gctgaaagatatgtatgcaa actatttcag agttggttcg gtacttaact ccggaacggt aaacaattcatcaataaagg ccttgatttt aagagagttt aacagtatta cctgtgaaaa tgaaatgaagcctgatgcca cactggttca atcaggatca accaatacaa atatcagggt ttctcttaat

ctggtttggc acagccagac acctcaatgg tttttcaaag acaatttcca ggacaacggaaactgggttt cccaatcagt tatggaccag cgtttggaaa gctacataaa aaatatgtttgctgaaatcc aaagacagta tccgtctttg aatctttatg cctatgacgt tgtaaatgaggcagtaagtg atgatgcaaa caggaccaga tattatggcg gggcgaggga acctggatac

cgtgcagcaa gtattttaaa cttctgtgca caaaataata tagccgtcag aggtcataca 420

480540600660

ggaaatggta gatctccatg ggttcagatc tacggagaca acaaatttat tgagaaagca 720

tttacatatg caagaaaata tgctccggca aattgtaagc tttactacaa cgattacaac

gaatattggg atcataagag agactgtatt gcctcaattt gtgcaaactt gtacaacaag

ggcttgcttg acggtgtggg aatgcagtcc catattaatg cggatatgaa tggattctca

ggtatacaaa attataaagc agctttgcag aaatatataa atatcggttg tgatgtccaa

attaccgagc ttgatattag tacagaaaac ggcaaattta gcttacagca gcaggctgat

aaatataaag ctgttttcca ggcagctgtt gatataaaca gaacctccag caaaggaaag

gttacggctg tctgtgtatg gggacctaat gacgccaata cttggctcgg ttcacaaaat 1140

78084090096010201080gcacctcttt tgtttaacgc aaacaatcaa ccgaaaccgg catacaatgc ggttgcatccattattcctc agtccgaatg gggcgacggt aacaatccgg ccggcggcgg aggaggaggcaaaccggaag agccggatgc aaacggatat tattatcatg acacttttga aggaagcgtaggacagtgga cagccagagg acctgcggaa gttctgctta gcggaagaac ggcttacaaaggttcagaat cactcttggt aaggaaccgt acggcagcat ggaacggagc acaacgggcgctgaatccca gaacgtttgt tcccggaaac acatattgtt tcagcgtagt ggcatcgtttattgaaggtg cgtcttccac aacattctgc atgaagctgc aatacgtaga cggaagcggcactcaacggt atgataccat agatatgaaa actgtgggtc caaatcagtg ggttcacctgtacaatccgc aatacagaat tccttccgat gcaacagata tgtatgttta tgtggaaacagcggatgaca ccattaactt ctacatagat gaggcaatcg gagcggttgc cggaactgtaatcgaaggac ctgctccaca gcctacacag cctccggtac tgcttggcga tgtaaacggtgatggaacca ttaactcaac tgacttgaca atgttaaaga gaagcgtgtt gagggcaatcacccttaccg acgatgcaaa ggctagagca gacgttgaca agaatggatc gataaacagcactgatgttt tacttctttc acgctacctt ttaagagtaa tcgacaaatt tcctgtagcagaaaatcctt cttcttcttt taaatatgag tcggccgtgc aatatcggcc ggctcctgattcttatttaa acccttgtcc gcaggcggga agaattgtca aggaaacata tacaggaataaacggaacta agagtcttaa tgtatatctt ccatacggtt atgatccgaa caaaaaatataacattttct accttatgca tggcggcggt gaaaatgaga atacgatttt cagcaacgatgttaaattgc aaaatatcct tgaccacgcg attatgaacg gtgaacttga gcctttgattgtagtaacac ccactttcaa cggcggaaac tgcacggccc aaaactttta tcaggaattcaggcaaaatg tcattccttt tgtggaaagc aagtactcta cttatgcaga atcaacaaccccacagggaa tagccgcttc aagaatgcac agaggtttcg gcggattctc aatgggaggattgacaacat ggtatgtaat ggttaactgc cttgattacg ttgcatattt tatgcctttaagcggtgact actggtatgg aaacagtccg caggataagg ctaattcaat tgctgaagcaattaacagat ccggactttc aaagagggag tatttcgtat ttgcggccac cggttccgaggatattgcat atgctaatat gaatcctcaa attgaagcta tgaaggcttt gccgcattttgattatactt cggatttttc caaaggtaat ttttactttc ttgtagctcc gggcgccactcactggtggg gatacgtaag acattatatt tatgatgcac ttccatattt cttccatgaatga<210><211><212>

456940PRT

<213> Bactéria<220>

DOMÍNIO(57) . . . (402)

<221><222><223><220>.<221><222>

Família 10 de hidrolase glicosila

DOMÍNIO(428) . . .

(577)

<223> Domínio de carbohidrato<220>

<221> DOMÍNIO

<222> (597). . . (617)

<223> Dockerin tipo I repeat

<220>

<221> DOMÍNIO

<222> (631) . . . (651)

<223> Dockerin tipo I repeat

<220>

<221> SITE<222> (20)...(23)

<223> N-glicosilação site. Prosite id = PS00001<220>

SITE

(79)...(82)

N-glicosilação site. Prosite id = PS00001

<221><222><223><220><221><222>

Prosite id = PS00001

SITE

(210) . . . (213)<223> N-glicosilação site.<220>

<221> SITE

<222> (358) . . . (361)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (476)...(479)

<223> N-glicosiiação site. Prosite id = PS00001<220>

<221> SITE

<222> (606)...(618)

<223> Cálcio-obrigatório domínio EF-mão. Prosite id = PS00018<220>

<221> SITE

<222> (606)...(625)

<223> Enzimas repetidas de domino maraca Clostridium cellulosome. Prosite id

= PS00448

<220>

<221> SITE

<222> (614)...(617)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (640)...(659)

<223> Enzimas repetidas de domino maraca Clostridium cellulosome. Prosite id= PS00448<220>

<221> SITE

<222> (640)...(652)

<223> Cálcio-obrigatório domínio EF-mão. Prosite id = PS00018<220>

<221> SITE

<222> (644)...(647)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (648)...(651)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (711)...(714)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (781)...(784)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (875) ... (878)

<223> N-glicosilação site. Prosite id = PS00001

<400> 456 Met Ala Gly Glu Trp Thr Glu Ile Ser Ala Lys Tyr Lys Ala Pro Lys1 5 10 15 Thr Ala Val Asn 20 Ile Thr Leu Ser Ile 25 Thr Thr Asp Ser Thr 30 Val AspPhe Ile Phe 35 Asp Asp Val Thr Ile 40 Thr Arg Lys Gly Met 45 Ala Glu AlaAsn Thr 50 Val Tyr Ala Ala Asn 55 Ala Val Leu Lys Asp 60 Met Tyr Ala AsnTyr Phe Arg Val Gly Ser Val Leu Asn Ser Gly Thr Val Asn Asn Ser65 70 75 80Ser Ile Lys Ala Leu 85 Ile Leu Arg Glu Phe 90 Asn Ser Ile Thr Cys 95 GluAsn Glu Met Lys 100 Pro Asp Ala Thr Leu 105 Val Gln Ser Gly Ser 110 Thr AsnThr Asn Ile 115 Arg Val Ser Leu Asn 120 Arg Ala Ala Ser Ile 125 Leu Asn PheCys Ala 130 Gln Asn Asn Ile Ala 135 Val Arg Gly His Thr 140 Leu Val Trp HisSer Gln Thr Pro Gln Trp Phe Phe Lys Asp Asn Phe Gln Asp Asn Gly145 150 155 160Asn Trp Val Ser Gln 165 Ser Val Met Asp Gln 170 Arg Leu Glu Ser Tyr 175 IleLys Asn Met Phe Ala Glu Ile Gln 180 Tyr Ala Tyr Asp Val Val Asn Glu 195 200Thr Arg Tyr Tyr Gly Gly Ala Arg 210 215 Ser Pro Trp Val Gln Ile Tyr Gly 225 230 Phe Thr Tyr Ala Arg Lys Tyr Ala 245 Asn Asp Tyr Asn Glu Tyr Trp Asp 260 Ile Cys Ala Asn Leu Tyr Asn Lys 275 280Gln Ser His Ile Asn Ala Asp Met 290 295 Tyr Lys Ala Ala Leu Gln Lys Tyr305 310 Ile Thr Glu Leu Asp Ile Ser Thr 325 Gln Gln Ala Asp Lys Tyr Lys Ala 340 Asn Arg Thr Ser Ser Lys Gly Lys 355 360Pro Asn Asp Ala Asn Thr Trp Leu 370 375 Phe Asn Ala Asn Asn Gln Pro Lys385 390 Ile Ile Pro Gln Ser Glu Trp Gly 405 Gly Gly Gly Gly Lys Pro Glu Glu 420 His Asp Thr Phe Glu Gly Ser Val 435 440Ala Glu Val Leu Leu Ser Gly Arg 450 455 Leu Leu Val Arg Asn Arg Thr Ala465 470 Leu Asn Pro Arg Thr Phe Val Pro 485 Val Ala Ser Phe Ile Glu Gly Ala 500 Leu Gln Tyr Val Asp Gly Ser Gly 515 520Met Lys Thr Val Gly Pro Asn Gln 530 535 Tyr Arg Ile Pro Ser Asp Ala Thr545 550 Ala Asp Asp Thr Ile Asn Phe Tyr 565 Ala Gly Thr Val Ile Glu Gly Pro 580 Val Leu Leu Gly Asp Val Asn Gly 595 600Leu Thr Met Leu Lys Arg Ser Val 610 615 Asp Ala Lys Ala Arg Ala Asp Val625 630 Thr Asp Val Leu Leu Leu Ser Arg 645 Phe Pro Val Ala Glu Asn Pro Ser 660 Val Gln Tyr Arg Pro Ala Pro Asp 675 680Ala Gly Arg Ile Val Lys Glu Thr 690 695 Ser Leu Asn Val Tyr Leu Pro Tyr

Arg Gln Tyr Pro Ser Leu Asn Leu185 190 Ala Val Ser Asp Asp Ala Asn Arg 205 Glu Pro Gly Tyr Gly Asn Gly Arg 220 Asp Asn Lys Phe Ile Glu Lys Ala 235 240Pro Ala Asn Cys Lys Leu Tyr Tyr 250 255 His Lys Arg Asp Cys Ile Ala Ser265 270 Gly Leu Leu Asp Gly Val Gly Met 285 Asn Gly Phe Ser Gly Ile Gln Asn 300 Ile Asn Ile Gly Cys Asp Val Gln 315 320Glu Asn Gly Lys Phe Ser Leu Gln 330 335 Val Phe Gln Ala Ala Val Asp Ile345 350 Val Thr Ala Val Cys Val Trp Gly 365 Gly Ser Gln Asn Ala Pro Leu Leu 380 Pro Ala Tyr Asn Ala Val Ala Ser 395 400Asp Gly Asn Asn Pro Ala Gly Gly 410 415 Pro Asp Ala Asn Gly Tyr Tyr Tyr425 430 Gly Gln Trp Thr Ala Arg Gly Pro 445 Thr Ala Tyr Lys Gly Ser Glu Ser 460 Ala Trp Asn Gly Ala Gln Arg Ala 475 480Gly Asn Thr Tyr Cys Phe Ser Val 490 495 Ser Ser Thr Thr Phe Cys Met Lys505 510 Thr Gln Arg Tyr Asp Thr Ile Asp 525 Trp Val His Leu Tyr Asn Pro Gln 540 Asp Met Tyr Val Tyr Val Glu Thr 555 560Ile Asp Glu Ala Ile Gly Ala Val 570 575 Ala Pro Gln Pro Thr Gln Pro Pro585 590 Asp Gly Thr Ile Asn Ser Thr Asp 605 Leu Arg Ala Ile Thr Leu Thr Asp 620 Asp Lys Asn Gly Ser Ile Asn Ser 635 640Tyr Leu Leu Arg Val Ile Asp Lys 650 655 Ser Ser Phe Lys Tyr Glu Ser Ala665 670 Ser Tyr Leu Asn Pro Cys Pro Gln 685 Tyr Thr Gly Ile Asn Gly Thr Lys 700 Gly Tyr Asp Pro Asn Lys Lys Tyr705 710 715 720

Asn Ile Phe Tyr Leu 725 Met His Gly Gly Gly 730 Glu Asn Glu Asn Thr 735 Ile Phe Ser Asn Asp Val Lys Leu Gln Asn Ile Leu Asp His Ala Ile Met 740 745 750 Asn Gly Glu Leu Glu Pro Leu Ile Val Val Thr Pro Thr Phe Asn Gly 755 760 765 Gly Asn 770 Cys Thr Ala Gln Asn 775 Phe Tyr Gln Glu Phe 780 Arg Gl Asn Val Ile 785 Pro Phe Val Glu Ser 790 Lys Tyr Ser Thr Tyr 795 Ala Glu Ser Thr Thr 800 Pro Gln Gly Ile Ala Ala Ser Arg Met His Arg Gly Phe Gly Gly Phe 805 810 815 Ser Met Gly Gly Leu Thr Thr Trp Tyr Val Met Val Asn Cys Leu Asp 820 825 830 Tyr Val Ala Tyr Phe Met Pro Leu Ser Gly Asp Tyr Trp Tyr Gly Asn 835 840 845 Ser Pro Gln Asp Lys Ala Asn Ser Ile Ala Glu Ala Ile Asn Arg Ser 850 855 860 Gly Leu Ser Lys Arg Glu Tyr Phe Val Phe Ala Ala Thr Gly Ser Glu 865 870 875 880 Asp Ile Ala Tyr Ala 885 Asn Met Asn Pro Gln 890 Ile Glu Ala Met Lys 895 Ala Leu Pro His Phe Asp Tyr Thr Ser Asp Phe Ser Lys Gly Asn Phe Tyr 900 905 910 Phe Leu Val Ala Pro Gly Ala Thr His Trp Trp Gly Tyr Val Arg His 915 920 925 Tyr Ile 930 Tyr Asp Ala Leu Pro 935 Tyr Phe Phe His Glu 940

<210> 457

<211> 984<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 457

gtgattgacc cgagcgacgc gcgcaaaatcttcttcgcgc tggcggcgaa cgatcgtgaaaacaacctgg cggaagggga tttaaaagccgcggacgaca gctggaccgt gctcgacggtgcctggtcgc tgctcgaagc cgggcggctgaaagccctgc tgtctcgcat cgccaaagagatgctgctac cgggtaaagt gggctttgtttatttgcctc cgcagattgc ggcttacttccaggccacca accttcgcct gctgcaggaagtacgttttg acaacaaaaa aggctggcagtacgacgcga tccgcgtgta tctttgggtcccgcggctgc tgaaaaagtt caggccaatgccggagaaaa tcgatattgc caccgggaaggcctcgctgc tgccgttttt acaggaccgggccgaccgtt tccccggcaa tgacgcctatggatgggatc agcatcgttt tcgcttcacccaggaatgcg taagttctca ctaa<210> 458<211> 327

<212> PRT<213> Desconhecido<22 0>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (1) . . . (305)

<223> Família 8 de hidrolase glicosila<220><221> SITE

<222> (74)...(92)

<223> Família 8 de marca hidrolase glicosila. Prosite id = PS00812

accacctccg aagggcaaag ctacgccttg 60gccttcgctt cgctgtttga ctggacgcaa 120catcttcccg cctggctgtg gggtaaaaag 180aactccgcgt cagatgccga tatctggata 240tggaaaatgc cgcagtacag cgaaaccggt 300gaagtggtga aagtgcccgg tctgggctct 360gatgacgccg gctggcgctt taacccaagc 420gcgcgttttg gcgagccgtg gagcgcgatt 480acggcaccta aaggctactc gcctaactgg 540ctaaagcagg ataaatcgct gctcggcagc 600ggcatgctca acgacgccga tccgcagaaa 660gcgatgcaaa ccgccaaagc gggcgcggtg 720gtggagggcg atggcccggt cggtttttct 780gacgctcagg ccgttcagcg ccagcgcgtc 840tacagctatg ttttgaccct gttcggacaa 900gctcgcggtg aacttctacc tgactggggc 960 984<400> 458 Met Ile Asp Pro Ser Asp Ala Arg Lys Ile Thr Thr Ser Glu Gly Gln 1 5 10 15 Ser Tyr Ala Leu 20 Phe Phe Ala Leu Ala 25 Ala Asn Asp Arg Glu 30 Ala PheAla Ser Leu Phe Asp Trp Thr Gln Asn Asn Leu Ala Glu Gly Asp Leu 35 40 45 Lys Ala His Leu Pro Ala Trp Leu Trp Gly Lys Lys Ala Asp Asp Ser 50 55 60 Trp Thr Val Leu Asp Gly Asn Ser Ala Ser Asp Ala Asp Ile Trp Ile65 70 75 80Ala Trp Ser Leu Leu Glu Ala Gly Arg Leu Trp Lys Met Pro Gln Tyr 85 90 95 Ser Glu Thr Gly 100 Lys Ala Leu Leu Ser 105 Arg Ile Ala Lys Glu 110 Glu ValVal Lys Val Pro Gly Leu Gly Ser Met Leu Leu Pro Gly Lys Val Gly 115 120 125 Phe Val 130 Asp Asp Ala Gly Trp 135 Arg Phe Asn Pro Ser 140 Tyr Leu Pro ProGln Ile Ala Ala Tyr Phe Ala Arg Phe Gly Glu Pro Trp Ser Ala Ile145 150 155 160Gln Ala Thr Asn Leu Arg Leu Leu Gln Glu Thr Ala Pro Lys Gly Tyr 165 170 175 Ser Pro Asn Trp Val Arg Phe Asp Asn Lys Lys Gly Trp Gln Leu Lys 180 185 190 Gln Asp Lys 195 Ser Leu LeU Gly Ser 200 Tyr Asp Ala Ile Arg 205 Val Tyr LeuTrp Val Gly Met Leu Asn Asp Ala Asp Pro Gln Lys Pro Arg Leu Leu 210 215 220 Lys Lys Phe Arg Pro Met Ala Met Gln Thr Ala Lys Ala Gly Ala Val225 230 235 240Pro Glu Lys Ile Asp Ile Ala Thr Gly Lys Val Glu Gly Asp Gly Pro 245 250 255 Val Gly Phe Ser 260 Ala Ser Leu Leu Pro 265 Phe Leu Gln Asp Arg 270 Asp AlaGln Ala Val Gln Arg Gln Arg Val Ala Asp Arg Phe Pro Gly Asn Asp 275 280 285 Ala Tyr Tyr Ser Tyr Val Leu Thr Leu Phe Gly Gln Gly Trp Asp Gln 290 295 300 His Arg Phe Arg Phe Thr Ala Arg Gly Glu Leu Leu Pro Asp Trp Gly

305 310 315 320

Gln Glu Cys Val Ser Ser His325

<210> 459<211> 1524<212> DNA

<213> Cochliobolus heterostrophus ATCC 48333<400> 459

ttgccccctt atgcccagtg cggcggcgtc acctacaaag gtgacagtgc ctgcgcttctggctggcact gcgtcaagta caacgactgg tacagccagt gtgtccctgg cggagaagcttctcctccac ctgccaacag tccttctgct gctcccagct tgcccagcaa agccccggctatggagccta acagtaccgt acctgtggct acccctgctt cctcgcctgt cgacgacgagtcctgcgatg ctgatgagga gggtggtgat gctaacacgg atgcaaatga aggggatgacgagtcctgcg acgccgatga ggagggtggc gatgctggca cccagggaag tgagggtgatgatgagtctt gtgaggctga tgacgaaccc gttccatcgc catctccagc tgctagctccggtggcaaca ctggtgttac gcccgctgct tctccttctc cttccccagc tgcctccccttcttcgactg ctacctccgc aagcctgtct agtgttgaac ctactacttc tccttccccctctccagctg ctggctctgg cggaaacagt cccgctccca atgttgccgg cagcggccgcaatggcgcca aatgcgatct tgatgctgcc ttcaaggcca agggcaagaa atacgttggtgttgccactg atcaataccg tctcagcact ggcaagaaca aggagatcat tgtcgacaactttggctgtg ttactcctga gaacagcatg aagtgggatg ccactgagcc cagcgagggccaattcactc tcgatggcgc taatgctctc gtttctttcg ccaccagtaa cggcaaactcatccgcggtc acactaccgt atggcactct cagttggctg catgggtttc tcagatccgtgacaaggcca agctcgaaga ggtcatggtt aaccacataa agaagctcgt tggtacctatgctggcaaga tctacgcctg ggatgttgtg aacgaaatcc ttgacgagca aggtggcttccgatccagtg tcttctacaa cgtccttggt gaaggcttcg tctccaccgc tttccacgctgcccgtcagg ccgatcccct cgctaagctc tacatcaacg actacaacct tgacggcgcaaactacgcca agacaaaggg catgattagc catgtagaga agtggattgc cgacggtgttcccattgacg gaatcggctc ccaatcccac atcagctccc ccggcactct tttccccatctctggtgtcc ctgctgcttt gaaagctctc tgcggtgccg cccccgagtg tgccataactgagttggata tcaactacgg taagcccgcc gattgggtca ccgtcttcga tggttgtctcgatatcaaaa actgtgtcgg tatcactgtt tggggtgttt ctgacaaaga ctcttggatcggtgctgccg gtggacctct cctgttcgac agctccttcc aggctaaacc ctcttacaatgagctttgct ctgctcttgc ttga<210> 460<211> 507<212> PRT

<213> Cochliobolus heterostrophus ATCC 48333<220>

<221> DOMÍNIO<222> (3) . . . (31)<223> Fungai domínio de celulose obrigatória<220>

<221> DOMÍNIO<222> (206) . ..(506)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (7) . . .(34)

<223> Cellulose-binding domínio, fungai tipo. Prosite id = PS00562<400> 460

Met Pro Pro Tyr Ala Gln Cys Gly Gly Val Thr Tyr Lys Gly Asp Ser15 10 15

Ala Cys Ala Ser Gly Trp His Cys Val Lys Tyr Asn Asp Trp Tyr Ser

20 25 30

Gln Cys Val Pro Gly Gly Glu Ala Ser Pro Pro Pro Ala Asn Ser Pro35 40 45

Ser Ala Ala Pro Ser Leu Pro Ser Lys Ala Pro Ala Met Glu Pro Asn

50 55 60

Ser Thr Val Pro Val Ala Thr Pro Ala Ser Ser Pro Val Asp Asp Glu65 70 75 80

Ser Cys Asp Ala Asp Glu Glu Gly Gly Asp Ala Asn Thr Asp Ala Asn

85 90 95

Glu Gly Asp Asp Glu Ser Cys Asp Ala Asp Glu Glu Gly Gly Asp Ala

100 105 110

Gly Thr Gln Gly Ser Glu Gly Asp Asp Glu Ser Cys Glu Ala Asp Asp

115 120 125

Glu Pro Val Pro Ser Pro Ser Pro Ala Ala Ser Ser Gly Gly Asn Thr

130 135 140

Gly Val Thr Pro Ala Ala Ser Pro Ser Pro Ser Pro Ala Ala Ser Pro145 150 155 160

Ser Ser Thr Ala Thr Ser Ala Ser Leu Ser Ser Val Glu Pro Thr Thr

165 170 175

Ser Pro Ser Pro Ser Pro Ala Ala Gly Ser Gly Gly Asn Ser Pro Ala

180 185 190

Pro Asn Val Ala Gly Ser Gly Arg Asn Gly Ala Lys Cys Asp Leu Asp

195 200 205

Ala Ala Phe Lys Ala Lys Gly Lys Lys Tyr Val Gly Val Ala Thr Asp

210 215 220

Gln Tyr Arg Leu Ser Thr Gly Lys Asn Lys Glu Ile Ile Val Asp Asn225 230 235 240

Phe Gly Cys Val Thr Pro Glu Asn Ser Met Lys Trp Asp Ala Thr Glu

245 250 255

Pro Ser Glu Gly Gln Phe Thr Leu Asp Gly Ala Asn Ala Leu Val Ser

260 265 270

Phe Ala Thr Ser Asn Gly Lys Leu Ile Arg Gly His Thr Thr Val Trp

275 280 285

His Ser Gln Leu Ala Ala Trp Val Ser Gln Ile Arg Asp Lys Ala Lys

290 295 300

Leu Glu Glu Val Met Val Asn His Ile Lys Lys Leu Val Gly Thr Tyr

305 310 315 320

Ala Gly Lys Ile Tyr Ala Trp Asp Val Val Asn Glu Ile Leu Asp Glu

325 330 335

Gln Gly Gly Phe Arg Ser Ser Val Phe Tyr Asn Val Leu Gly Glu Gly

1200126013201380144015001524340 345 350

Phe Val Ser Thr Ala Phe His Ala Ala Arg Gln Ala Asp Pro Leu Ala

355 360 365

Lys Leu Tyr Ile Asn Asp Tyr Asn Leu Asp Gly Ala Asn Tyr Ala Lys

370 375 380

Thr Lys Gly Met Ile Ser His Val Glu Lys Trp Ile Ala Asp Gly Val385 390 395 400

Pro Ile Asp Gly Ile Gly Ser Gln Ser His Ile Ser Ser Pro Gly Thr

405 410 415

Leu Phe Pro Ile Ser Gly Val Pro Ala Ala Leu Lys Ala Leu Cys Gly

420 425 430

Ala Ala Pro Glu Cys Ala Ile Thr Glu Leu Asp Ile Asn Tyr Gly Lys

435 440 445

Pro Ala Asp Trp Val Thr Val Phe Asp Gly Cys Leu Asp Ile Lys Asn

450 455 460

Cys Val Gly Ile Thr Val Trp Gly Val Ser Asp Lys Asp Ser Trp Ile465 470 475 480

Gly Ala Ala Gly Gly Pro Leu Leu Phe Asp Ser Ser Phe Gln Ala Lys

485 490 495

Pro Ser Tyr Asn Glu Leu Cys Ser Ala Leu Ala500 505

<210> 461<211> 990<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 461

atgtggcagc gaagtaaaac cctggttctg gtgctgggac tgttgttaag tcatcaggcctttgccggcc ccgcctggga cagctacaaa gcgcgatttt tgatggcgga tggtcgcatcattgataccg gcaacaacag tgtgagccac actgaggggc agggcttcgc catgatgatggcggtgcgta acaacgatcg cgccggtttt gacaaaatct ggaactggac gaaaaagaacctgcagaatc ccgagaccgg actgttctac tggcgttata acccggtggc accggacccgattgccgaca gaaacaatgc caccgacggc gataccttta tcgcctgggc gctgttaaaagcgggtaccc agtggaatga caacagctat ctgaacgcct cggacgccat cactaáatcgctgctggccc gcaacgtaat cagctttgcc ggttaccgcg tgatgctgcc tggcgcgaagggctttaacc tcaacagcta cgtgaacctt aatccgtcct atttcatctt ccctgcgtgggaggatttcg cgaagcgcag tcatctgacg gtgtggcgtg acctgatcaa tgacggacagaagctgctgg tgaagatgcg cttcggcaat acccagcttc ctgcagactg ggtttccctgtacgccgacg gtcgcgtgac cccggccaaa gagtggccgg cgcgctttag ctacgatgcgatccgcgtcc cgctgtatat caagtgggcg aatgcttcca gcccgctgat ggccccttacaccgcgtact ggggacggtt tgcccgtacc cagacgccag cctgggtgaa tgtcaccaccggcgatccgg cgccgtatat gatggegggt gggttgctgg cggtgcgtga tttggcgctggggcaacttc cggcgggcga tccgcagatc acgacgcagg aggattacta ttctgcgagtctgaagatgc tggtgtcgtt agcgaaataa<210> 462<211> 329<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

SIGNAL(1)...(22)

<221><222><220><221><222>

DOMÍNIO(1)...(329)<223> Família 8 de hidrolase glicosila<220>

SITE

(45)...(48)

<223> N-glicosilação site. Prosite id = PS00001<220>

SITE

(76)... (79).

<223> N-glicosilação site. Prosite id = PS00001<220>

<221><222>

60120180240300360420480540600660720780840900960990<221> SITE

<222> (107)...(110)

<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE

<222> (108)...(126)

<223> Família 8 de marca hidrolase glicosila. Prosite id = PS00812<220>

<221> SITE<222> (134)...(137)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (254)...(257)<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (281) . . . (284)

<223> N-glicosilação site. Prosite id = PS00001<400> 462

Met Trp Gln Arg Ser Lys Thr Leu Val Leu Val Leu Gly Leu Leu Leu1 5 10 15

Ser His Gln Ala Phe Ala Gly Pro Ala Trp Asp Ser Tyr Lys Ala Arg20 25 30

Phe Leu Met Ala Asp Gly Arg Ile Ile Asp Thr Gly Asn Asn Ser Val35 40 45

Ser His Thr Glu Gly Gln Gly Phe Ala Met Met Met Ala Val Arg Asn

50 55 60

Asn Asp Arg Ala Gly Phe Asp Lys Ile Trp Asn Trp Thr Lys Lys Asn65 70 75 80

Leu Gln Asn Pro Glu Thr Gly Leu Phe Tyr Trp Arg Tyr Asn Pro Val

85 90 95

Ala Pro Asp Pro Ile Ala Asp Arg Asn Asn Ala Thr Asp Gly Asp Thr100 105 110

Phe Ile Ala Trp Ala Leu Leu Lys Ala Gly Thr Gln Trp Asn Asp Asn115 120 125

Ser Tyr Leu Asn Ala Ser Asp Ala Ile Thr Lys Ser Leu Leu Ala Arg

130 135 140

Asn Val Ile Ser Phe Ala Gly Tyr Arg Val Met Leu Pro Gly Ala Lys145 150 155 160

Gly Phe Asn Leu Asn Ser Tyr Val Asn Leu Asn Pro Ser Tyr Phe Ile

165 170 175

Phe Pro Ala Trp Glu Asp Phe Ala Lys Arg Ser His Leu Thr Val Trp180 185 190

Arg Asp Leu Ile Asn Asp Gly Gln Lys Leu Leu Val Lys Met Arg Phe195 200 205

Gly Asn Thr Gln Leu Pro Ala Asp Trp Val Ser Leu Tyr Ala Asp Gly

210 215 220

Arg Val Thr Pro Ala Lys Glu Trp Pro Ala Arg Phe Ser Tyr Asp Ala225 230 235 240

Ile Arg Val Pro Leu Tyr Ile Lys Trp Ala Asn Ala Ser Ser Pro Leu

245 250 255

Met Ala Pro Tyr Thr Ala Tyr Trp Gly Arg Phe Ala Arg Thr Gln Thr260 265 270

Pro Ala Trp Val Asn Val Thr Thr Gly Asp Pro Ala Pro Tyr Met Met275 280 285

Ala Gly Gly Leu Leu Ala Val Arg Asp Leu Ala Leu Gly Gln Leu Pro

290 295 300

Ala Gly Asp Pro Gln Ile Thr Thr Gln Glu Asp Tyr Tyr Ser Ala Ser305 310 315 320

Leu Lys Met Leu Val Ser Leu Ala Lys325

<210> 463<211> 1023<212> DNA

<213> Desconhecido<220><223> Obtido para amostra ambiental<400> 463

atgaatccaa cattcagttc cgtaccggca ttaaaggagc tgtttgcggc ggacttcaacatcggggcgg cggtgaatcc gacgacgatc cggacgcagg aggcgttgct ggcttatcattttaacagcc tgactgcgga gaacgagatg aagttcgtca gcgtgcatcc ggaggagcagacctatacct tcgaggcggc ggaccggctg gtcgaattcg cccgagagca cggcatggccatgcggggac acacgctcgt atggcataac cagacgtccg attggctgtt ccaggatcgccaaggcggga gggtaagcaa ggaggtgctg ctcggaaggc tccgggagca tattcataccatagtaggcc ggtacaagaa cgagatctac gcctgggacg tcgtcaacga ggtcatcgcggacgaagggg aggcgctgct gcgcacttcc aaatggacgg aaatcgcggg acctgaatttatcgctaaag cgttcgagta tgcacatgag gcggatccac aggcgctgtt gttttataacgactacaacg aatcgaatcc tctgaaacgc gataaaattt acacactcgt tcattcgctgctggagcaag gggtgccgat ccatggcatc ggattacaag cgcactggaa cctgtacgatccatcgttgg atgagattaa ggcagcgatt gagaagtatg cttcgctggg tttgcagctgcagctgacgg agctggatct ctcgatgttc cgcttcgatg accggcgaac cgatttgaccgcgccagagc cggggatgct ggagcaacag gccgagcgtt atgaagccgt gttccggctgttgctggagt atcgtgacgt catcagcggc gttaccttct ggggagcggc ggatgattatacctggctgg acaattttcc ggtgcgcggc cggaagaact ggccgtttct gttcgatgcccagcaccagc cgaaggcagc ttatcaccgt gtggcggcat tggctgcgga gcaacgagcataa

<210> 464

<211> 340

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<220><221><222>

DOMÍNIO(10)...(335)<223> Família 10 de hidrolase glicosila<220>

SITE

(91)...(94)<223> N-glicosilação site.<220>

SITE

(185)...(188)<223> N-glicosilação site. Prosite id =<400> 464

Met Asn Pro Thr Phe Ser Ser Val Pro Ala Leu Lys Glu Leu Phe Ala

<221><222>

Prosite id = PS00001

PS00001

1 5 10 15 Ala Asp Phe Asn 20 Ile Gly Ala Ala Val 25 Asn Pro Thr Thr Ile 30 Arg ThrGln Glu Ala 35 Leu Leu Ala Tyr His 40 Phe Asn Ser Leu Thr 45 Ala Glu AsnGlu Met 50 Lys Phe Val Ser Val 55 His Pro Glu Glu Gln 60 Thr Tyr Thr PheGlu Ala Ala Asp Arg Leu Val Glu Phe Ala Arg Glu His Gly Met Ala65 70 75 80Met Arg Gly His Thr Leu Val Trp His Asn Gln Thr Ser Asp Trp Leu 85 90 95 Phe Gln Asp Arg 100 Gln Gly Gly Arg Val 105 Ser Lys Glu Val Leu 110 Leu GlyArg Leu Arg 115 Glu His Ile His Thr 120 Ile Val Gly Arg Tyr 125 Lys Asn GluIle Tyr 130 Ala Trp Asp Val Val 135 Asn Glu Val Ile Ala 140 Asp Glu Gly GluAla Leu Leu Arg Thr Ser Lys Trp Thr Glu Ile Ala Gly Pro Glu Phe145 150 155 160Ile Ala Lys Ala Phe 165 Glu Tyr Ala His Glu 170 Ala Asp Pro Gln Ala 175 LeuLeu Phe Tyr Asn 180 Asp Tyr Asn Glu Ser 185 Asn Pro Leu Lys Arg 190 Asp LysIle Tyr Thr 195 Leu Val His Ser Leu 200 Leu Glu Gln Gly Val 205 Pro Ile HisGly Ile 210 Gly Leu Gln Ala His 215 Trp Asn Leu Tyr Asp 220 Pro Ser Leu AspGlu Ile Lys Ala Ala Ile Glu Lys Tyr Ala Ser Leu Gly Leu Gln Leu225 230 235 240

Gln Leu Thr Glu Leu Asp Leu Ser Met Phe Arg Phe Asp Asp Arg Arg

245 250 255

Thr Asp Leu Thr Ala Pro Glu Pro Gly Met Leu Glu Gln Gln Ala Glu260 265 270

Arg Tyr Glu 275 Ala Val Phe Arg Leu 280 Leu Leu Glu Tyr Arg 285 Asp Val IleSer Gly 290 Val Thr Phe Trp Gly 295 Ala Ala Asp Asp Tyr 300 Thr Trp Leu AspAsn Phe Pro Val Arg Gly Arg Lys Asn Trp Pro Phe Leu Phe Asp Ala305 310 315 320Gln His Gln Pro Lys Ala Ala Tyr His Arg Val Ala Ala Leu Ala Ala

325 330 335

Glu Gln Arg Ala340

<210> 465

<211> 2142

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 465

gtggacgatt tcaaaataac ggataccaca actactgaca tcaagctcga gctgaagcctgaagaagaaa ttccagctct taaagaagtg cttggagatt acttcaaagt aggtgttgccttacctttca aagtttttgc caaaccagag gatattgctc tcattactaa acatttcaacagcatcactg ccgaaaacga aatgaaacct gagagtctct tggctggcgt agaaaatggaaagttgaagt tcaggtttga gacagcagac aaatacgtag aatttgcaca gcaaaacggtatggttgtga gaggtcacac tctggtgtgg cacaatcaaa caccggactg gttcttcaaggacgagaacg gaaatctgct ctccaaagaa gcaatgactg aaaggcttag ggaatacatccacacagtcg tcggacactt caaaggcaaa gtttacgcgt gggacgtcgt taatgaggcagtagatccat cccaaccaga tggacttaga agatctatat ggtacgaaat catgggacctgactatatag aacttgcatt caagtttgca agagaagcgg accccaatgc aaagctcttctacaacgact acaacaccta ccaggagaag aagagagaca tcatttacaa cctcgtcaaatccctcaaag agaagggact cattgacggt atcggtatgc agtgtcatat cggtgttgggaccagtgtca aagagattga agaggcàatc aaaaaattca gcaccattcc aggtatcgaaattcatatca cggaactaga tataagtgtg tacgaggatg cgacttccaa ttatccaacacctccaaggg aggctctcat taaacaagca cacgtaatga gagaactctt tgccatcttcaaaaagtaca gcaacgtcat aacaaacgtt actttctggg gattgaaaga tgattattcctggaagaatg cccgcagaaa cgactggccg ctactttttg ataaagacta ccaagccaaacttgcctact gggccatagt cagtcctgag gctctaccgg tgcttccaaa gaaatggtctatcgctacag gtagtgcttt ggtagttgga atgatggatg actcctattt ggcttcttcacctatcaaaa ttctcgtcga tggccaagaa aaactcacag ccagagtcat ctgggaagaaaacaaactct tcgtctacgc agaggtctat gacaggacaa gagacaaagg aaaggacggtatcaccatct ttgtggatcc taaaaacttc aaggcacctt acttgcatga agatgctttctacgttacca taaaaaccga ctggagtgtt gagaagagtc gtgatgacat agaagtccagagattcgtag gtccaagtgg agtaaggtac aacgttgaat gtgaaataac acttcctgaaaaactccagg aaggacagca aatcggattt gatatcgccg tccaggatgg cgataaggtctacagctggt ctgatacatc caatcagcag aagctcgcaa ccatgaacta cggaactctcactctgcagg gtgcggtaat ggccacagct aagtatggca cacctgtgat cgatggtgaaatagatgaca tctggtacac cactgaagaa atctcaaccg atgttgttgt catgggttcactcaagaacg caagggcaaa agtgagagtg ctctgggatg aagagcacct ctatgtgcttgccatcgtaa ccgatcctgt gctcaataag gacaacacca atccatggga acaagactctgtagaaatct tcatagacga aaacaacgcc aaaacaccgt actatcagga cgatgatgctcaatatcgtg tcaactacct caacgaacaa tccttcggta caggtgcaag cagcaagaacttcaagacag ccgtgaaact catcgatggt ggttatcttg ttgaggcagc ggttaaatggaagaccatca aaccttcacc aaacacagtg ataggctttg atttccaggt gaacgatgcaaatgctcaag gtaagagagt tggaatactt aagtggtgcg atccaacgga caacagctggcagaatacct ccaagtttgg taatctcagg ttgataaaat ag<210> 466<211> 713<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (26)...(350)

<223> Família 10 de hidrolase glicosila<220>

<221> DOMÍNIO<222> (532)...(713)

<223> Domínio of desconhecido function (DUF1083)<220>

<221> SITE

<222> (313)...(316)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (712)...(715)

<223> N-glicosilação site. Prosite id = PS00001<400> 466

Met Asp Asp Phe Lys Ile Thr Asp Thr Thr Thr Thr Asp Ile Lys Leu1 5 10 15 Glu Leu Lys Pro Glu Glu Glu Ile Pro Ala Leu Lys Glu Val Leu Gly 20 25 30 Asp Tyr Phe Lys Val Gly Val Ala Leu Pro Phe Lys Val Phe Ala Lys 35 40 45 Pro Glu 50 Asp Ile Ala Leu Ile 55 Thr Lys His Phe Asn 60 Ser Ile Thr AlaGlu Asn Glu Met Lys Pro Glu Ser Leu Leu Ala Gly Val Glu Asn Gly 65 70 75 80Lys Leu Lys Phe Arg Phe Glu Thr Ala Asp Lys Tyr Val Glu Phe Ala 85 90 95 Gln Gln Asn Gly Met Val Val Arg Gly His Thr Leu Val Trp His Asn 100 105 110 Gln Thr Pro Asp Trp Phe Phe Lys Asp Glu Asn Gly Asn Leu Leu Ser 115 120 125 Lys Glu 130 Ala Met Thr Glu Arg 135 Leu Arg Glu Tyr Ile 140 His Thr Val ValGly His Phe Lys Gly Lys Val Tyr Ala Trp Asp Val Val Asn Glu Ala145 150 155 160Val Asp Pro Ser Gln Pro Asp Gly Leu Arg Arg Ser Ile Trp Tyr Glu 165 170 175 Ile Met Gly Pro Asp Tyr Ile Glu Leu Ala Phe Lys Phe Ala Arg Glu 180 185 190 Ala Asp Pro Asn Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Tyr Gln 195 200 205 Glu Lys 210 Lys Arg Asp Ile Ile 215 Tyr Asn Leu Val Lys 220 Ser Leu Lys GluLys Gly Leu Ile Asp Gly Ile Gly Met Gln Cys His Ile Gly Val Gly225 230 235 240Thr Ser Val Lys Glu Ile Glu Glu Ala Ile Lys Lys Phe Ser Thr Ile 245 250 255 Pro Gly Ile Glu Ile His Ile Thr Glu Leu Asp Ile Ser Val Tyr Glu 260 265 270 Asp Ala Thr 275 Ser Asn Tyr Pro Thr 280 Pro Pro Arg Glu Ala 285 Leu Ile LysGln Ala 290 His Val Met Arg Glu 295 Leu Phe Ala Ile Phe 300 Lys Lys Tyr SerAsn Val Ile Thr Asn Val Thr Phe Trp Gly Leu Lys Asp Asp Tyr Ser305 310 315 320Trp Lys Asn Ala Arg Arg Asn Asp Trp Pro Leu Leu Phe Asp Lys Asp 325 330 335 Tyr Gln Ala Lys Leu Ala Tyr Trp Ala Ile Val Ser Pro Glu Ala Leu 340 345 350 Pro Val Leu 355 Pro Lys Lys Trp Ser 360 Ile Ala Thr Gly Ser 365 Ala Leu ValVal Gly Met Met Asp Asp Ser Tyr Leu Ala Ser Ser Pro Ile Lys Ile 370 375 380 Leu Val Asp Gly Gln Glu Lys Leu Thr Ala Arg Val Ile Trp Glu Glu385 390 395 400Asn Lys Leu Phe Val Tyr Ala Glu Val Tyr Asp Arg Thr Arg Asp Lys

405 410 415Gly Lys Asp Gly Ile Thr Ile Phe Val Asp Pro Lys Asn Phe Lys Ala 420 425 430 Pro Tyr Leu His Glu Asp Ala Phe Tyr Val Thr Ile Lys Thr Asp Trp 435 440 445 Ser Val 450 Glu Lys Ser Arg Asp 455 Asp Ile Glu Val Gln 460 Arg Phe Val GlyPro Ser Gly Val Arg Tyr Asn Val Glu Cys Glu Ile Thr Leu Pro Glu465 470 475 480Lys Leu Gln Glu Gly Gln Gln Ile Gly Phe Asp Ile Ala Val Gln Asp 485 490 495 Gly Asp Lys Val 500 Tyr Ser Trp Ser Asp 505 Thr Ser Asn Gln Gln 510 Lys LeuAla Thr Met Asn Tyr Gly Thr Leu Thr Leu Gln Gly Ala Val Met Ala 515 520 525 Thr Ala Lys Tyr Gly Thr Pro Val Ile Asp Gly Glu Ile Asp Asp Ile 530 535 540 Trp Tyr Thr Thr Glu Glu Ile Ser Thr Asp Val Val Val Met Gly Ser545 550 555 560Leu Lys Asn Ala Arg Ala Lys Val Arg Val Leu Trp Asp Glu Glu His 565 570 575 Leu Tyr Val Leu Ala Ile Val Thr Asp Pro Val Leu Asn Lys Asp Asn 580 585 590 Thr Asn Pro 595 Trp Glu Gln Asp Ser 600 Val Glu Ile Phe Ile 605 Asp Glu AsnAsn Ala 610 Lys Thr Pro Tyr Tyr 615 Gln Asp Asp Asp Ala 620 Gln Tyr Arg ValAsn Tyr Leu Asn Glu Gln Ser Phe Gly Thr Gly Ala Ser Ser Lys Asn625 630 635 640Phe Lys Thr Ala Val Lys Leu Ile Asp Gly Gly Tyr Leu Val Glu Ala 645 650 655 Ala Val Lys Trp 660 Lys Thr Ile Lys Pro 665 Ser Pro Asn Thr Val 670 Ile GlyPhe Asp Phe 675 Gln Val Asn Asp Ala 680 Asn Ala Gln Gly Lys 685 Arg Val GlyIle Leu 690 Lys Trp Cys Asp Pro 695 Thr Asp Asn Ser Trp 700 Gln Asn Thr SerLys Phe Gly Asn Leu Arg Leu Ile Lys

705 710

<210> 467

<211> 978

<212> DNA

<213> Bactéria

<400> 467

gtgaagttct ttactgttct tttgtttttc ctttcattcg ttttttcggc gagtattgacgtgtggaaat tgtgggaaca ttataaaaag acctttataa gtaaagaggg gtacgtggtagatccttaca acaattacag ggttacttcg gaagctcaag gctatacact tctcatatccgccctcatag gggataagga aaccttctac agggtatgga actggacaaa ggaaaatctcaaaaggaagg ataatttatt ctcctggctc tggataaacg gacacgtagt tgacagaaacaacgcaacgg acgccgacct gttcatagct tacgctctgc taatcgcttc tcaaaagtggaaggattata cgctcctgag cgaggcaaag aggataaagg attccgtcaa ggaactcgttgtgcccgtgt gcaacggaag aagggattac ctttttatac ccgcaaagga aggttacattaaaaacaata tagtgagttt aaacgtagtc tactacgtcc cattcatctt cagaaagttctacgaatctt tcggagagga cgtgtggaaa aacctctata ggtacaccta cgacatttatacgattagga atatatcaac gcaccttaca tacgacctat tcaaaaagga attgagaaaggggaatttta tagacataga cggcatgcgt ttcctgatat acgcttacgt ggacgacaaaaggagtctcc tttacatgag gaacgcagta gagggtattc tgaagtttta cagagaaaagggttacattc ctttgaagta taattacgta accggtggag caagcaagtt aaaagctcccttttgttttt actacgtatt cagtaagctc cttccttccg ataaaaactt agaaaaggagttcagaaatg ggcttgagta cgacaagaag aattactact gttacgctct gcttcttattgctctcctac acgattag<210> 468<211> 325<212> PRT<213> Bactéria<220>

<221> SIGNAL<222> (1).■·(16)<220>

<221> DOMÍNIO<222> (1)...(324)

<223> Família 8 de hidrolase glicosila<220>

<221> SITE<222> (75)...(78)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (102)...(105)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (103)...(121)

<223> Família 8 de marca hidrolase glicosila. Prosite id = PS00812<220>

<221> SITE

<222> (207)...(210)

<223> N-glicosilação site. Prosite id = PS00001<400> 468

Met Lys Phe Phe Thr Val Leu Leu Phe Phe Leu Ser Phe Val Phe Ser1 5 10 15

Ala Ser Ile Asp 20 Val Trp Lys Leu Trp 25 Glu His Tyr Lys Lys 30 Thr PheIle Ser Lys 35 Glu Gly Tyr Val Val 40 Asp Pro Tyr Asn Asn 45 Tyr Arg ValThr Ser 50 Glu Ala Gln Gly Tyr 55 Thr Leu Leu Ile Ser 60 Ala Leu Ile GlyAsp Lys Glu Thr Phe Tyr Arg Val Trp Asn Trp Thr Lys Glu Asn Leu65 70 75 80Lys Arg Lys Asp Asn Leu Phe Ser Trp Leu Trp Ile Asn Gly His Val 85 90 95 Val Asp Arg Asn Asn Ala Thr Asp Ala Asp Leu Phe Ile Ala Tyr Ala 100 105 110 Leu Leu Ile 115 Ala Ser Gln Lys Trp 120 Lys Asp Tyr Thr Leu 125 Leu Ser GluAla Lys 130 Arg Ile Lys Asp Ser 135 Val Lys Glu Leu Val 140 Val Pro Val CysAsn Gly Arg Arg Asp Tyr Leu Phe Ile Pro Ala Lys Glu Gly Tyr Ile145 150 155 160Lys Asn Asn Ile Val Ser Leu Asn Val Val Tyr Tyr Val Pro Phe Ile 165 170 175 Phe Arg Lys Phe Tyr Glu Ser Phe Gly Glu Asp Val Trp Lys Asn Leu 180 185 190 Tyr Arg Tyr Thr Tyr Asp Ile Tyr Thr Ile Arg Asn Ile Ser Thr His 195 200 205 Leu Thr 210 Tyr Asp Leu Phe Lys 215 Lys Glu Leu Arg Lys 220 Gly Asn Phe IleAsp Ile Asp Gly Met Arg Phe Leu Ile Tyr Ala Tyr Val Asp Asp Lys225 230 235 240Arg Ser Leu Leu Tyr Met Arg Asn Ala Val Glu Gly Ile Leu Lys Phe 245 250 255 Tyr Arg Glu Lys Gly Tyr Ile Pro Leu Lys Tyr Asn Tyr Val Thr Gly 260 265 270 Gly Ala Ser Lys Leu Lys Ala Pro Phe Cys Phe Tyr Tyr Val Phe Ser 275 280 285 Lys Leu Leu Pro Ser Asp Lys Asn Leu Glu Lys Glu Phe Arg Asn Gly 290 295 300 Leu Glu Tyr Asp Lys Lys Asn Tyr Tyr Cys Tyr Ala Leu Leu Leu Ile305 310 315 320Ala Leu Leu His Asp

325

<210> 469<211> 1929<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 469

gtgaacgcta gctgggaaaa ggattggaag acggctgcta acgagcaaat cgagcagctccgcaagcgca atgtggagat cgaggtcgtc gatctgaacg gaaacccgct gcctggggctaccgttcgcg cggttcagcg cacgcatcag tttggcttcg gcaccgccat caaccgaacggcgttgagca atccggtgta cgccgatttt gtcaaaaacc gtttcgaatg ggtgaccttcgagaacgagg ccaagtggct ctggaatgag gccgtacaag ggcgggtcta ttatcgggaggccgatcagc tgctcgaatt tgccaggcaa aacgggctga aggtgcgcgg acataatctgttctgggagg cggagaaata tcagccgcag tgggtgaaga gtctgacggg cgctgcgctgaaggaagcga tcgataaccg gctgaacagc gccgtcctgc attttaaggg caattttctgcactgggacg tcaacaacga aatgtttcac ggcagcttct tcaaggatcg cctgggggaagaaatctgga cctatatgta taagcgaacc cgggaactcg atcccggcgt caagctgttcgtcaacgatt acaattttat cgagtacccg ccggagcggg attataacca ggtcattcaagcgctcatcg atcgggggat gccgattgac ggcatcggcg cgcaagggca ttttaacggagtcatcgatc ccttgttcgt taagggaaga ctggataagc tggctgagct gaatctgccgatctggatta ccgaattcga ttccacgcat aaggacgaga gagtccgtgc cgataatctggagaagatgt atcggctggc gttcgcccat ccggcggtcg aagggattgt catgtggggcttctgggcgg gctcccattg gaagggcact gacggcgcga tcgtgaatca agactggacgctcaatgccg ccggacagcg ataccagcag cttatggatg aatggacgac ggtcgtcgaaggcacgaccg atcagcgcgg catgttttcg ttccgggggt tccacggaac ctacgatatgctggtcgatt accctggagc ggcggctgtg aagcagtcct ttaccttgga gcccggctctggcaatgcga agctgcacat tccgttcgac gttcaggaca agtccatccc ggaggctcctgccaagctca gcgccgctgc cgcggattcc caggttatgc tgagctggag caaggtcaacggggcaaccg gctatacggt taaaagcgcg gtcagcgccg acggtcccta tacgccgattgcccatcagc tgctcaccga gaccttcacg cacatcggtc tagtgaaccg gaaagattattattacgtgg tgagcgccag caaccatcta ggtgagagcc cggattccgc cccgatccgggccactccgc gtgccgcggg cgagttacaa acgaatctcg tgcttcagta ccgctccgctgatggagata acaactatca aatgaagcct cagttcacga tcaagaacgc aggcaaagtgcccatcccgt taagcgagct gacgatccgc tactatttca cgccggagag cacgcagccggtggatacca ggatcgactg ggcccaattc ggagcagagc atgtccagac gacggtcgttccgccatccg atgccgcggc gcacgcctat gtcgagctca gcttcctgga gtcggcaggggccatccctt ccgatacgac attaggcaat attcagctgc gcatctttaa cagcgatggctcttcgttcg ataaaacgaa cgattattcc ttcgacccga cgaaaaaggc ttatacggcgtgggagaagg tcacgcttta tcggaacggg gaactggttt gggggataga gccttggggcgcgaagtaa<210> 470<211> 642<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (41) .. . (332)

<223> Família 10 de hidrolase glicosila<220>

<221> DOMÍNIO<222> (495) . .. (574)

<223> Domínio de celulose obrigatória<220>

SITE

(2)...(5)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (58)...(61)

<223> N-glicosilação site. Prosite id = PS00001<400> 470

Met Asn Ala Ser Trp Glu Lys Asp Trp Lys Thr Ala Ala Asn Glu Gln15 10 15

Ile Glu Gln Leu Arg Lys Arg Asn Val Glu Ile Glu Val Val Asp Leu

20 25 30

Asn Gly Asn Pro Leu Pro Gly Ala Thr Val Arg Ala Val Gln Arg Thr

35 40 45

His Gln Phe Gly Phe Gly Thr Ala Ile Asn Arg Thr Ala Leu Ser Asn50 55 60

<221><222>

6012018024030036042048054060066072078084090096010201080114012001260132013801440150015601620168017401800186019201929Pro Val Tyr Ala Asp Phe Val Lys Asn Arg Phe Glu Trp Val Thr Phe65 70 75 80Glu Asn Glu Ala Lys Trp Leu Trp Asn Glu Ala Val Gln Gly Arg Val 85 90 95 Tyr Tyr Arg Glu Ala Asp Gln Leu Leu Glu Phe Ala Arg Gln Asn Gly 100 105 110 Leu Lys Val Arg Gly His Asn Leu Phe Trp Glu Ala Glu Lys Tyr Gln 115 120 125 Pro Gln Trp Val Lys Ser Leu Thr Gly Ala Ala Leu Lys Glu Ala Ile 130 135 140 Asp Asn Arg Leu Asn Ser Ala Val Leu His Phe Lys Gly Asn Phe Leu145 150 155 160His Trp Asp Val Asn Asn Glu Met Phe His Gly Ser Phe Phe Lys Asp 165 170 175 Arg Leu Gly Glu Glu Ile Trp Thr Tyr Met Tyr Lys Arg Thr Arg Glu 180 185 190 Leu Asp Pro Gly Val Lys Leu Phe Val Asn Asp Tyr Asn Phe Ile Glu 195 200 205 Tyr Pro Pro Glu Arg Asp Tyr Asn Gln Val Ile Gln Ala Leu Ile Asp 210 215 220 Arg Gly Met Pro Ile Asp Gly Ile Gly Ala Gln Gly His Phe Asn Gly225 230 235 240Val Ile Asp Pro Leu Phe Val Lys Gly Arg Leu Asp Lys Leu Ala Glu 245 250 255 Leu Asn Leu Pro Ile Trp Ile Thr Glu Phe Asp Ser Thr His Lys Asp 260 265 270 Glu Arg Val Arg Ala Asp Asn Leu Glu Lys Met Tyr Arg Leu Ala Phe 275 280 285 Ala His Pro Ala Val Glu Gly Ile Val Met Trp Gly Phe Trp Ala Gly 290 295 300 Ser His Trp Lys Gly Thr Asp Gly Ala Ile Val Asn Gln Asp Trp Thr305 310 315 320Leu Asn Ala Ala Gly Gln Arg Tyr Gln Gln Leu Met Asp Glu Trp Thr 325 330 335 Thr Val Val Glu Gly Thr Thr Asp Gln Arg Gly Met Phe Ser Phe Arg 340 345 350 Gly Phe His Gly Thr Tyr Asp Met Leu Val Asp Tyr Pro Gly Ala Ala 355 360 365 Ala Val Lys Gln Ser Phe Thr Leu Glu Pro Gly Ser Gly Asn Ala Lys 370 375 380 Leu His Ile Pro Phe Asp Val Gln Asp Lys Ser Ile Pro Glu Ala Pro385 390 395 400Ala Lys Leu Ser Ala Ala Ala Ala Asp Ser Gln Val Met Leu Ser Trp 405 410 415 Ser Lys Val Asn Gly Ala Thr Gly Tyr Thr Val Lys Ser Ala Val Ser 420 425 430 Ala Asp Gly Pro Tyr Thr Pro Ile Ala His Gln Leu Leu Thr Glu Thr 435 440 445 Phe Thr His Ile Gly Leu Val Asn Arg Lys Asp Tyr Tyr Tyr Val Val 450 455 460 Ser Ala Ser Asn His Leu Gly Glu Ser Pro Asp Ser Ala Pro Ile Arg465 470 475 480Ala Thr Pro Arg Ala Ala Gly Glu Leu Gln Thr Asn Leu Val Leu Gln 485 490 495 Tyr Arg Ser Ala Asp Gly Asp Asn Asn Tyr Gln Met Lys Pro Gln Phe 500 505 510 Thr Ile Lys Asn Ala Gly Lys Val Pro Ile Pro Leu Ser Glu Leu Thr 515 520 525 Ile Arg Tyr Tyr Phe Thr Pro Glu Ser Thr Gln Pro Val Asp Thr Arg 530 535 540 Ile Asp Trp Ala Gln Phe Gly Ala Glu His Val Gln Thr Thr Val Val545 550 555 560Pro Pro Ser Asp Ala Ala Ala His Ala Tyr Val Glu Leu Ser Phe Leu 565 570 575 Glu Ser Ala Gly Ala Ile Pro Ser Asp Thr Thr Leu Gly Asn Ile Gln 580 585 590 Leu Arg Ile Phe Asn Ser Asp Gly Ser Ser Phe Asp Lys Thr Asn Asp595 600 605

Tyr Ser Phe Asp Pro Thr Lys Lys Ala Tyr Thr Ala Trp Glu Lys Val

610 615 620

Thr Leu Tyr Arg Asn Gly Glu Leu Val Trp Gly Ile Glu Pro Trp Gly625 630 635 640

Ala Lys

<210> 471<211> 1119<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 471

atgcgaattc actggctggg gctcagctca cgcgcaagcc tgatgacggc ggcgctcctggctgtcacag gcaccaccaa atccgaggac tcgcccgcaa ctttgaaaga cgccttcaaggattgtttcc ggatcggggt cgcgctcaac cagcggcaat ttaccgagca agataccaacggcgcgacgt tggtgaaacg gcagttcaac gccatctcac ccgaaaacgt gatgaagtgggcgaacattc atccccgacc cgggcccgat gggtataact tcgaggcggc tgaccgttacgtcgagtttg gcgagaagaa cggaatgttc atcgtcggcc àtacgctcgt ttggcacttccaaacgccgc gctgggtact ccagggcgat ggcactaacg cggcgacgcg cgagctgctgctgcagcgga tgcgcgatca catccacacg gtcgtaggcc ggtacaaagg gcggatcaaggcttgggacg tggtcaacga agcgctgaac gaagatggca ctctgcggcg gtcgcagtggtaccggatca tcggcgaaga ctacatcgtc aaggctttcg aatatgcgca tgaggccgatccgtccgcgg aattgcgata caacgattac gccatcgaga atgagcggaa gcgcgacggcgtaatcgcgc tcgtgaagaa acttcaggcg cagaaggtcc cacttggggg gctgggctcgcagacgcatg ccaacctgac ctggcctaac gccgaatcgc tggacaccgc cctcacggccttcaccgaac tgggtatccc gatctcaatc acggaactgg atgtgaccgc ctcgcaacgcggtcagctca accagagcgc cgaggtgtcg cagaatggac aggcggggga gggaggcgtggtggacgggg cgaatcagaa gctcgccgag cagtacgcca gcttcttccg cgtctttctgaagcatcgca aaaacattga gctcgtgacg ttttggggcg tcacggatcg tgactcctggcggcgcattg gcaaaccgct gctatttaac gcagaatggc aacccaagcc ggcctttcacgccgtcatcg ccgaggcgaa aaagatcagt gggcaatga<210> 472<211> 372<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(21)<220>

<221> DOMÍNIO<222> (34)...(366)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (248)...(251)

<223> N-glicosilação site. Prosite id = PS00001<220>

SITE

(269)...(279)

Família 10 ativa site de hidrolases glicosila. Prosite id

60120180240300360420480540600660720780840900960102010801119

<221><222><223><220><221><222>

PS00591

SITE

(288)...(291)<223> N-glicosilação site.Prosite id = PS00001<400> 472

Met Arg Ile His Trp Leu Gly Leu Ser Ser Arg Ala Ser Leu Met Thr

Ala Ala Leu Leu Ala Val Thr Gly Thr Thr Lys Ser Glu Asp Ser Pro

20 25 30

Ala Thr Leu Lys Asp Ala Phe Lys Asp Cys Phe Arg Ile Gly Val Ala

35 40 45

Leu Asn Gln Arg Gln Phe Thr Glu Gln Asp Thr Asn Gly Ala Thr Leu50 55 60Val Lys Arg Gln Phe Asn Ala Ile Ser Pro Glu Asn Val Met Lys Trp65 70 75 80Ala Asn Ile His Pro 85 Arg Pro Gly Pro Asp 90 Gly Tyr Asn Phe Glu 95 AlaAla Asp Arg Tyr Val Glu Phe Gly Glu Lys Asn Gly Met Phe Ile Val 100 105 110 Gly His Thr Leu Val Trp His Phe Gln Thr Pro Arg Trp Val Leu Gln 115 120 125 Gly Asp 130 Gly Thr Asn Ala Ala 135 Thr Arg Glu Leu Leu 140 Leu Gln Arg MetArg Asp His Ile His Thr Val Val Gly Arg Tyr Lys Gly Arg Ile Lys145 150 155 160Ala Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly Thr Leu Arg 165 170 175 Arg Ser Gln Trp Tyr Arg Ile Ile Gly Glu Asp Tyr Ile Val Lys Ala 180 185 190 Phe Glu Tyr 195 Ala His Glu Ala Asp 200 Pro Ser Ala Glu Leu 205 Arg Tyr AsnAsp Tyr Ala Ile Glu Asn Glu Arg Lys Arg Asp Gly Val Ile Ala Leu 210 215 220 Val Lys Lys Leu Gln Ala Gln Lys Val Pro Leu Gly Gly Leu Gly Ser225 230 235 240Gln Thr His Ala Asn 245 Leu Thr Trp Pro Asn 250 Ala Glu Ser Leu Asp 255 ThrAla Leu Thr Ala 260 Phe Thr Glu Leu Gly 265 Ile Pro Ile Ser Ile 270 Thr GluLeu Asp Val 275 Thr Ala Ser Gln Arg 280 Gly Gln Leu Asn Gln 285 Ser Ala GluVal Ser Gln Asn Gly Gln Ala Gly Glu Gly Gly Val Val Asp Gly Ala 290 295 300 Asn Gln Lys Leu Ala Glu Gln Tyr Ala Ser Phe Phe Arg Val Phe Leu305 310 315 320Lys His Arg Lys Asn Ile Glu Leu Val Thr Phe Trp Gly Val Thr Asp 325 330 335 Arg Asp Ser Trp Arg Arg Ile Gly Lys Pro Leu Leu Phe Asn Ala Glu 340 345 350 Trp Gln Pro 355 Lys Pro Ala Phe His 360 Ala Val Ile Ala Glu 365 Ala Lys LysIle Ser Gly Gln

370<210> 473<211> 1020<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 473

atgagtgtca tccgcaaggc agcagggatc aaggacgcgt gggcccatgc cttccgcgtcggaacggtca ccagcgccga aattctcgcg aaaaacgtga caagggaact gatacatacccatttctcgt cgctgacggc ggaaaacgcc atgaaaatgg cccatatcca tcccgaagaacgacggtggg atacagccga ggccgacgtc atcgcggatt tcgcgcggga atcctcaatattgttgcgtg gcaacgcctt tgtctgccac cggcaggtac cggaatgggt attcagggacggaaacgggg cggtctcgca ggcgacgctc tttggccggc tggaatgcca tatcgcggccatggccgaac ggtacggcga cattgtctat gcctgggacg tcctcagcga ggtgatggacgccggatcgc ccgacgggat gcgcatgagc gaatggtacc gcaccggcgg cgccggactctgggaattcg ctttcaggac ggcgcatgcc gccgcgccgg aatcacgcct tttctgcactgactatggca tcgagtcggg catgaagatg gacggaacgc tgcgttttct ttccggtctccttgacgccg gggtcccggt gcacggaatc ggcatagagg gacactggaa ctacaaccatcccgacgaaa aaattctccg caccgcgctc gaacgctact cggccctggg actggacatcgagctgaccg aggtcgacgt atccgcttac gggacggacg aggcgggaat acggtaccccgacataccgc aggaccggaa gttcatgcag gcgcagcagt tcaagaacat attccggatcgccgccgact atcccgccgt aaagaacatc accctgaggg gccccgccgg cggccataccccgtttgacg attttcccgt gcgggactgc aggaactggc cgctcctctt tgacaccgaatacaaggcga aaagcttcgt gcccgaactc atcgacaccg gattctccct gacggactga<210> 474<211> 339<212> PRT<213> Desconhecido<220><223> Obtido para amostra ambiental<220><221> DOMÍNIO<222> (9)...(334)<223> Família 10 de hidrolase glicosila<220><221> SITE<222> (32)...(35)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (201)...(211)<223> Serine proteases, subtilase family, aspartic acid active site. Prositeid = PS00136<220><221> SITE<222> (293)...(296)<223> N-glicosilação site. Prosite id = PS00001<400> 474

Met Ser Val Ile Arg Lys Ala Ala Gly Ile Lys Asp Ala Trp Ala His 1 5 10 15 Ala Phe Arg Val Gly Thr Val Thr Ser Ala Glu Ile Leu Ala Lys Asn 20 25 30 Val Thr Arg 35 Glu Leu Ile His Thr 40 His Phe Ser Ser Leu 45 Thr Ala Glu Asn Ala 50 Met Lys Met Ala His 55 Ile His Pro Glu Glu 60 Arg Arg Trp Asp Thr 65 Ala Glu Ala Asp Val 70 Ile Ala Asp Phe Ala 75 Arg Glu Ser Ser Ile 80 Leu Leu Arg Gly Asn Ala Phe Val Cys His Arg Gln Val Pro Glu Trp 85 90 95 Val Phe Arg Asp Gly Asn Gly Ala Val Ser Gln Ala Thr Leu Phe Gly 100 105 110 Arg Leu Glu Cys His Ile Ala Ala Met Ala Glu Arg Tyr Gly Asp Ile 115 120 125 Val Tyr 130 Ala Trp Asp Val Leu 135 Ser Glu Val Met Asp 140 Ala Gly Ser Pro Asp Gly Met Arg Met Ser Glu Trp Tyr Arg Thr Gly Gly Ala Gly Leu 145 150 155 160 Trp Glu Phe Ala Phe Arg Thr Ala His Ala Ala Ala Pro Glu Ser Arg 165 170 175 Leu Phe Cys Thr Asp Tyr Gly Ile Glu Ser Gly Met Lys Met Asp Gly 180 185 190 Thr Leu Arg Phe Leu Ser Gly Leu Leu Asp Ala Gly Val Pro Val His 195 200 205 Gly Ile 210 Gly Ile Glu Gly His 215 Trp Asn Tyr Asn His 220 Pro Asp Glu Lys Ile 225 Leu Arg Thr Ala Leu 230 Glu Arg Tyr Ser Ala 235 Leu Gly Leu Asp Ile 240 Glu Leu Thr Glu Val 245 Asp Val Ser Ala Tyr 250 Gly Thr Asp Glu Ala 255 Gly Ile Arg Tyr Pro Asp Ile Pro Gln Asp Arg Lys Phe Met Gln Ala Gln 260 265 270 Gln Phe Lys Asn Ile Phe Arg Ile Ala Ala Asp Tyr Pro Ala Val Lys 275 280 285 Asn Ile Thr Leu Arg Gly Pro Ala Gly Gly His Thr Pro Phe Asp Asp 290 295 300 Phe 305 Pro Val Arg Asp Cys 310 Arg Asn Trp Pro Leu 315 Leu Phe Asp Thr Glu 320 Tyr Lys Ala Lys Ser Phe Val Pro Glu Leu Ile Asp Thr Gly Phe Ser 325 330 335

Leu Thr Asp

<210> 475<211> 1248<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 475

atgaagacac atagcttcaa cctcagatca cggatcacct tgttgaccgc ggcactgcttttcatcgggg caacggccgg ggccgccacg acacctatca ccctcaaaga cgcctacaaagaccatttcc ttatgggtgt agccatcaac cgcctgattg caatgggcga tacgaatgtccgggccgaca acgccagccg gaccccggaa cagctcaagg gggacattgc cctggtcaaggcgcagttca acctgatcgt caatgagaac gatctgaaac cgattctcat tcacccgaggccaggaccgg acgggtacga cttcgcccca gcggatgcct tcgtgaagtt cggcatggacaacaatatgt atatcgtggg ccacaccctc ctctggcaca gccaggtgcc caactggttcttccaagggt ctgctccggc gactccggaa acgccacctg ctgccacgga cgcggcggtcgcaccccgcg gcggacgagg aggtcgcggc gggattaccg gccccctggc gacccgcgaggagttgatcg aacgcatgcg cgagcacatt cacaccgtcg tcggccgcta taagggaaagatcaaggtct gggacgtcgt caacgaagcc ctcgccgacg gcggcaccga gaccctgcgaagcacgtact ggacccaaat catcgggccg gaattcatcg ccatggcctt tcgattcgcccacgaagccg atccggatgc gatccttcgt tacaacgatt atggcctgga gaaccctgccaagcgtgaga aactcaagaa gctgatcgcg tcgctccagg agcagaacgt tccggttcatgccatcggca cgcaaaccca tatcagcgtc tccacgacgt tcgaaagaat ggatgagaccttgagggacc tggcatccat cgggcttccc gtccacatca ccgaactgga tgtcaacgccgccgcggggg gccagagggg caccaatgcg gacattgccg gcactgccga gcgtacggcgggcggcgtgg tcagtgaagc cgacaagcgg ctggccgacg cctacgcgaa tctcttccgcgcgatcatga agcacaagga ctcggtgaag atggtcacgt tctggggcgt caatgacgcggtttcgtggc tcgcacgcgg caccccgctg ctgttcgacg gcaacaatca gcccaagccggctttcgatg cggtcattcg cgtcgccacg gaggcggcac agaactga<210> 476<211> 415<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1) ...(28)<220>

<221> DOMÍNIO<222> (34)...(409)

<223> Família 10 de hidrolase glicosila<220>

SITE

(312)...(322)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id =<400> 476

Met Lys Thr His Ser Phe Asn Leu Arg Ser Arg Ile Thr Leu Leu Thr15 10 15

Ala Ala Leu Leu Phe Ile Gly Ala Thr Ala Gly Ala Ala Thr Thr Pro

20 25 30

Ile Thr Leu Lys Asp Ala Tyr Lys Asp His Phe Leu Met Gly Val Ala

35 40 45

Ile Asn Arg Leu Ile Ala Met Gly Asp Thr Asn Val Arg Ala Asp Asn

<221><222>

50 55 60 Ala Ser Arg Thr Pro Glu Gln Leu Lys Gly Asp Ile Ala Leu Val Lys65 70 75 80Ala Gln Phe Asn Leu 85 Ile Val Asn Glu Asn 90 Asp Leu Lys Pro Ile 95 LeuIle His Pro Arg 100 Pro Gly Pro Asp Gly 105 Tyr Asp Phe Ala Pro 110 Ala AspAla Phe Val 115 Lys Phe Gly Met Asp 120 Asn Asn Met Tyr Ile 125 Val Gly HisThr Leu 130 Leu Trp His Ser Gln 135 Val Pro Asn Trp Phe 140 Phe Gln Gly SerAla Pro Ala Thr Pro Glu Thr Pro Pro Ala Ala Thr Asp Ala Ala Val145 150 155 160Ala Pro Arg Gly Gly 165 Arg Gly Gly Arg Gly 170 Gly Ile Thr Gly Pro 175 LeuAla Thr Arg Glu Glu Leu Ile Glu Arg Met Arg Glu His Ile His Thr

6012018024030036042048054060066072078084090096010201080114012001248

PS00591Val Val Gly Arg Tyr195

Glu Ala Leu Ala Asp210

Thr Gln Ile Ile Gly225

His Glu Ala Asp Pro245

Glu Asn Pro Ala Lys260

Gln Glu Gln Asn Val275

Ser Val Ser Thr Thr290

Ala Ser Ile Gly Leu305

Ala Ala Gly Gly Gln325

Glu Arg Thr Ala Gly340

Asp Ala Tyr Ala Asn355

Val Lys Met Val Thr370

Ala Arg Gly Thr Pro385

Ala Phe Asp Ala Val405

<210> 477<211> 2199<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 477

atgaaacggt tcctatcctg gtccctgacc ggcattctgg tggcgagcgc gctggtggctttggccttgc ccggcagctc gcaggccgcc gcgccgctgc ggcccttccc gcagcatgtcgcctatgcgc cgggctccat ccggccttcc aacttcacgc aggcccagat ggaccagcacgtacgggcat tttacgatga ttggaaaagt aagtacctgg tctccgccgg cacgaactctgccgggaaac agctctaccg ggtcgccttc gggatcggct cgccggccac ggtctcggaagggcagggct acggcatggt gatcgtggcg ctgatggccg gccacgatcc caacgcccaggccctgttcg acggcttgtg gtacttctcc cgcaagtacc ccagcggcgg cgacagccggctgatgagct ggaagatcga gaacggccag atcgtcgagg gcaacaacaa cgcgttcgacggtgacgccg acatcgccta tgggttgctg ctggcccacg cccagtgggg cagcggcggggatgtgaatt acgccaacga ggccaacacg gtcatcgccg gcatcctggc cgcgacgatcggcccgaaca gccggctgcc gacgctgggc gactgggtca gcccgaacgg gtcgccgcacaaccagtaca ccccacgctc ctcggacttt atgccatccc atttccgatc ctacggccgggcgaccggca acagcgtctg gaacacggtc gtcgcgaact cgcagaccgt gatcaccagcatccagacca atcacagcgc gaccaccggc ctgctgccgg acttcagcac ttgcacgaccagcctggttt gcagcccagc cagcgccggc ttcctggaag gcccgcacga cggccactactactacaacg ccggccgcga cccgtggcgg atcgggcttg acgcgctgct gaataacgacgcgacctcgc gcacccaggt gcagaaactg gtcaactggg tggcgagcag caccggcggctcggccacca atatcaaggc cggctaccag ctcaacggca cgacaatcgg caactacttcaccacatttt ttgtcgcgcc gatcggggtt ggggcgatga ctgattcctc gaaacagcagttcctcaaca acatctacgc ctcggtctac aacacgcacg aggactactt cgaggatacggtcgcgctgc tgtgcctgct ggtgatgacc gggaactact gggacccgac cgtgggaagttccaacacgc ctgtgccgac cacgccggtg ccgaccacgc ccgtgccgac cacaccgaccggcggtggga ccgggctgcg cggcacctat tacaacaaca gcaacttcac cggctccaccgccacgcgca ccgacccgac cgtgaacttc acctggagcg gcgcgccgat cagcggtatcagcggcgaca ccttctcggt acgctgggag ggccaggtgc agccgccggt cagcggcagctacaccttct cgacggtctc ggacgacggc gtgcggctgt gggtcaacgg ccagcagctgatcaacaact ggaccaacca cagcgcgacc accaacaccg ccgcaccagt cacgctgacgggcggacaga agtacgacat ccggctggag ttctacgaca acaccggcgg ggccacgatccaactgcgct gggcctaccc cggccaggcg acccagatca tcccacagag ccggctctacccacccagcg ccaccagcac gcccacaccg accagcacgc ccactcgcac gccgaccaacacgcccctgc cgggcggcaa cctggcgctg aacaagccgg cgtcctcctc ctccaacgag

777

185 190 Lys Gly Lys 200 Ile Lys Val Trp Asp 205 Val Val AsnGly Gly 215 Thr Glu Thr Leu Arg 220 Ser Thr Tyr TrpPro Glu Phe Ile Ala Met Ala Phe Arg Phe Ala230 235 240Asp Ala Ile Leu Arg 250 Tyr Asn Asp Tyr Gly 255 LeuArg Glu Lys Leu 265 Lys Lys Leu Ile Ala 270 Ser LeuPro Val His Ala Ile Gly Thr Gln Thr His Ile 280 285 Phe Glu 295 Arg Met Asp Glu Thr 300 Leu Arg Asp LeuPro Val His Ile Thr Glu Leu Asp Val Asn Ala310 315 320Arg Gly Thr Asn Ala 330 Asp Ile Ala Gly Thr 335 AlaGly Val Val Ser Glu Ala Asp Lys Arg Leu Ala 345 350 Leu Phe Arg 360 Ala Ile Met Lys His 365 Lys Asp SerPhe Trp 375 Gly Val Asn Asp Ala 380 Val Ser Trp LeuLeu Leu Phe Asp Gly Asn Asn Gln Pro Lys Pro390 395 400Ile Arg Val Ala Thr 410 Glu Ala Ala Gln Asn 415gacggcacgc tgataccggc cagagcggtg gacggcaaca ccggcacccg ctgggccagc 1920gccgagggca gcgacccaca gtggatctcg gtggacctgg gcgcgaccta cccgatcgcg 1980cgggtgaagc tgaactggga ggcggcctac gccacggcct accggatcga ggtctcggcc 2040aacggcagct cgtggacaac gatctacagc accagcagcg gcaacggcgg gatcgatgac 2100ctgaccggcc tgtccggcag tgggcgctac gtgcggatgt acggcacggc gcgcggcacg 2160ccctatgggt actcgctgtg ggagtttgag gtgtactga 2199

<210> 478732PRT

Desconhecido

<211><212><213><220><223><220><221><222><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><400>

Obtido para amostra ambiental

SIGNAL(1)...(29)

DOMÍNIO(34)... (411)

Família 8 de hidrolase glicosila

DOMÍNIO(442)...(578)PAl4 domínio

DOMÍNIO

(613)...(729)

F5/8 tipo C domínio

SITE

(51) . . . (54)N-glicosilação

SITE

(268) . . . (271)N-glicosilação

SITE

(357) . . . (360)N-glicosilação

SITE

(458)...(461)N-glicosilação

SITE

(476) . . . (479)N-glicosilação

site. Prosite id = PS00001

SITE

(531) . . . (534)

N-glicosilação site. Prosite id = PS00001SITE

(691). . . (694)

N-glicosilação site. Prosite id = PS00001478

Met Lys1

Ala Leu

Leu Arg

Pro Ser

50Tyr Asp65

Ala Gly

Arg PheVal

Pro

35

Asn

Ala20Phe

Leu5

Leu Ala

Leu Pro

Ser Trp Ser Leu Thr Gly Ile Leu Val Ala Ser10 15

Ser Ser Gln Ala Ala Ala Pro30

Tyr Ala Pro Gly Ser Ile Arg45

Asp Gln His Val Arg Ala Phe60

Asp Trp Lys Ser Lys Tyr Leu Val Ser Ala Gly Thr Asn Ser

70 75 80

Lys Gln Leu Tyr Arg Val Ala Phe Gly Ile Gly Ser Pro Ala

Pro Gln His Val40

Phe Thr Gln Ala Gln55

Gly

25

Ala

Met85 90 95 Thr Val Ser Glu 100 Gly Gln Gly Tyr Gly 105 Met Val Ile Val Ala 110 Leu Met Ala Gly His Asp Pro Asn Ala Gln Ala Leu Phe Asp Gly Leu Trp Tyr 115 120 125 Phe Ser 130 Arg Lys Tyr Pro Ser 135 Gly Gly Asp Ser Arg 140 Leu Met Ser Trp Lys Ile Glu Asn Gly Gln Ile Val Glu Gly Asn Asn Asn Ala Phe Asp 145 150 155 160 Gly Asp Ala Asp Ile Ala Tyr Gly Leu Leu Leu Ala His Ala Gln Trp 165 170 175 Gly Ser Gly Gly Asp Val Asn Tyr Ala Asn Glu Ala Asn Thr Val Ile 180 185 190 Ala Gly Ile Leu Ala Ala Thr Ile Gly Pro Asn Ser Arg Leu Pro Thr 195 200 205 Leu Gly 210 Asp Trp Val Ser Pro 215 Asn Gly Ser Pro His 220 Asn Gln Tyr Thr Pro Arg Ser Ser Asp Phe Met Pro Ser His Phe Arg Ser Tyr Gly Arg 225 230 235 240 Ala Thr Gly Asn Ser Val Trp Asn Thr Val Val Ala Asn Ser Gln Thr 245 25Ò 255 Val Ile Thr Ser 260 Ile Gln Thr Asn His 265 Ser Ala Thr Thr Gly 270 Leu Leu Pro Asp Phe Ser Thr Cys Thr Thr Ser Leu Val Cys Ser Pro Ala Ser 275 280 285 Ala Gly 290 Phe Leu Glu Gly Pro 295 His Asp Gly His Tyr 300 Tyr Tyr Asn Ala Gly Arg Asp Pro Trp Arg Ile Gly Leu Asp Ala Leu Leu Asn Asn Asp 305 310 315 320 Ala Thr Ser Arg Thr 325 Gln Val Gln Lys Leu 330 Val Asn Trp Val Ala 335 Ser Ser Thr Gly Gly 340 Ser Ala Thr Asn Ile 345 Lys Ala Gly Tyr Gln 350 Leu Asn Gly Thr Thr Ile Gly Asn Tyr Phe Thr Thr Phe Phe Val Ala Pro Ile 355 360 365 Gly Val 370 Gly Ala Met Thr Asp 375 Ser Ser Lys Gln Gln 380 Phe Leu Asn Asn Ile Tyr Ala Ser Val Tyr Asn Thr His Glu Asp Tyr Phe Glu Asp Thr 385 390 395 400 Val Ala Leu Leu Cys Leu Leu Val Met Thr Gly Asn Tyr Trp Asp Pro 405 410 415 Thr Val Gly Ser Ser Asn Thr Pro Val Pro Thr Thr Pro Val Pro Thr 420 425 430 Thr Pro Val Pro Thr Thr Pro Thr Gly Gly Gly Thr Gly Leu Arg Gly 435 440 445 Thr Tyr 450 Tyr Asn Asn Ser Asn 455 Phe Thr Gly Ser Thr 460 Ala Thr Arg Thr Asp Pro Thr Val Asn Phe Thr Trp Ser Gly Ala Pro Ile Ser Gly Ile 465 470 475 480 Ser Gly Asp Thr Phe Ser Val Arg Trp Glu Gly Gln Val Gln Pro Pro 485 490 495 Val Ser Gly Ser Tyr Thr Phe Ser Thr Val Ser Asp Asp Gly Val Arg 500 505 510 Leu Trp Val Asn Gly Gln Gln Leu Ile Asn Asn Trp Thr Asn His Ser 515 520 525 Ala Thr Thr Asn Thr Ala Ala Pro Val Thr Leu Thr Gly Gly Gln Lys 530 535 540 Tyr Asp Ile Arg Leu Glu Phe Tyr Asp Asn Thr Gly Gly Ala Thr Ile 545 550 555 560 Gln Leu Arg Trp Ala Tyr Pro Gly Gln Ala Thr Gln Ile Ile Pro Gln 565 570 575 Ser Arg Leu Tyr Pro Pro Ser Ala Thr Ser Thr Pro Thr Pro Thr Ser 580 585 590 Thr Pro Thr Arg Thr Pro Thr Asn Thr Pro Leu Pro Gly Gly Asn Leu 595 600 605 Ala Leu Asn Lys Pro Ala Ser Ser Ser Ser Asn Glu Asp Gly Thr Leu 610 615 620Ile Pro Ala Arg Ala Val Asp Gly Asn Thr Gly Thr Arg Trp Ala Ser625 630 635 640Ala Glu Gly Ser Asp 645 Pro Gln Trp Ile Ser 650 Val Asp Leu Gly Ala 655 ThrTyr Pro Ile Ala 660 Arg Val Lys Leu Asn 665 Trp Glu Ala Ala Tyr Ala 670 ThrAla Tyr Arg 675 Ile Glu Val Ser Ala 680 Asn Gly Ser Ser Trp 685 Thr Thr IleTyr Ser 690 Thr Ser Ser Gly Asn 695 Gly Gly Ile Asp Asp 700 Leu Thr Gly LeuSer Gly Ser Gly Arg Tyr Val Arg Met Tyr Gly Thr Ala Arg Gly Thr705 710 715 720Pro Tyr Gly Tyr Ser 725 Leu Trp Glu Phe Glu 730 Val Tyr

<210> 479

<211> 636

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 479

atgaaggtct tcgcaacctt ggctggcctc ttggccacgg ccctcgcggc cccttccacc 60

gagcacgcgc ttgtggcccg ccgtaacggt atcgactacg tccaaaacta caacggcaac 120ttgggtgcct ttagctacaa ccagggtgct ggccagttct ccatgtactg ggacaacggt 180gtgaacaatg acttcgtcgt tggtctggga tggcgcactg gctcgaagag ccccatcacc 240tactcggcca cctatgacgc cgccagctct ggctcgtacc ttgctgtgta cggctggatc 300aactcgcccc aggccgagta ctacgttgtc gagtcctacg gcacctacaa cccctgcagt 360caggcccaga gcttgggcac gatcacctcg gacggaggta cctaccaggt ctgcaccgac 420acccgctaca accagccctc cataactggt accagcacct tcacccagtt cttctcggtc 480cgccagaaca agcgcacctc cggcacggtc accatcaaca accacttcaa cttctgggcc 540cagcacgggt tcggcaacag caacttcaac taccaggtca tggccgtcga agcattcaac 600ggtcacggtc acgccagcgt ccaggtctct ggttaa 636

<210> 480<211> 211<212> PRT

<213> Desconhecido t

<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(16)<220>

<221> DOMIN<222> (27).<223> Fami 1<220>

<221> SITE<222> (104)<223> FamilPS00776<400> 480Met Lys Val1

Ala Pro Ser

Tyr Val Gln35

Gly Ala Gly50

Phe Val Val65

Tyr Ser Ala

Tyr Gly Trp

Tyr Gly Thr115

..(209)

ia 11 de glicosila hidrolases

...(114)

ia 11 de glicosila hidrolases ativa site marca 1. Prosite id =

Phe Ala Thr Leu Ala Gly Leu Leu Ala Thr Ala Leu Ala

5 10 15

Thr Glu His Ala Leu Val Ala Arg Arg Asn Gly Ile Asp20 25 30

Asn Tyr Asn Gly Asn Leu Gly Ala Phe Ser Tyr Asn Gln

40 45

Gln Phe Ser Met Tyr Trp Asp Asn Gly Val Asn Asn Asp

55 60

Gly Leu Gly Trp Arg Thr Gly Ser Lys Ser Pro Ile Thr

70 75 80

Thr Tyr Asp Ala Ala Ser Ser Gly Ser Tyr Leu Ala Val

85 90 95

Ile Asn Ser Pro Gln Ala Glu Tyr Tyr Val Val Glu Ser100 105 110

Tyr Asn Pro Cys Ser Gln Ala Gln Ser Leu Gly Thr Ile120 125Thr Ser Asp Gly Gly Thr Tyr Gln Val Cys Thr Asp Thr Arg Tyr Asn

130 135 140

Gln Pro Ser Ile Thr Gly Thr Ser Thr Phe Thr Gln Phe Phe Ser Val145 150 155 160

Arg Gln Asn Lys Arg Thr Ser Gly Thr Val Thr Ile Asn Asn His Phe

165 170 175

Asn Phe Trp Ala Gln His Gly Phe Gly Asn Ser Asn Phe Asn Tyr Gln

180 185 190

Val Met Ala Val Glu Ala Phe Asn Gly His Gly His Ala Ser Val Gln

195 200 205

Val Ser Gly210<210> 481<211> 585<212> DNA

<213> Seqüência Artificial<220>

<223> Sinteticamente projetado<400> 481

atggcccaga cctgcctcac gtcgccccaa accggctttc acaatggctt cttctattcc 60ttctggaagg acagtccggg cacggtgaat ttttgcctgt tggagggcgg ccgttacaca 120tcgaactgga gcggcatcaa caactgggtg ggcggcaagg gatggcagac cggttcacgc 180cggaacatca cgtactcggg cagcttcaat acaccgggca acggctacct ggcgctttac 240ggatggacca ccaatccact cgtcgagtac tacgtcgtcg atagctgggg gagctggcgt 300ccgccgggtt cggacggaac gttcctgggg acggtcaaca gcgatggcgg aacgtatgac 360atctatcgcg cgcagcgggt caacgcgccg tccatcatcg gcaacgccac gttctatcaa 420tactggagcg ttcggcagtc gaagcgggta ggtgggacga tcaccaccgg aaaccacttc 480gacgcgtggg ccagcgtggg cctgaacctg ggcactcaca actaccagat catggcgacc 540gagggctacc aaagcagcgg cagctccgac atcacggtga gttga 585

<210> 482<211> 194<212> PRT

<213> Seqüência Artificial<220>

<223> Sinteticamente projetado<400> 482

Met Ala Gln Thr Cys Leu Thr Ser Pro Gln Thr Gly Phe His Asn Gly

1 5 10 15

Phe Phe Tyr Ser Phe Trp Lys Asp Ser Pro Gly Thr Val Asn Phe Cys

20 25 30

Leu Leu Glu Gly Gly Arg Tyr Thr Ser Asn Trp Ser Gly Ile Asn Asn

35 40 45

Trp Val Gly Gly Lys Gly Trp Gln Thr Gly Ser Arg Arg Asn Ile Thr

50 55 60

Tyr Ser Gly Ser Phe Asn Thr Pro Gly Asn Gly Tyr Leu Ala Leu Tyr65 70 75 80

Gly Trp Thr Thr Asn Pro Leu Val Glu Tyr Tyr Val Val Asp Ser Trp

85 90 95

Gly Ser Trp Arg Pro Pro Gly Ser Asp Gly Thr Phe Leu Gly Thr Val

100 105 110

Asn Ser Asp Gly Gly Thr Tyr Asp Ile Tyr Arg Ala Gln Arg Val Asn

115 120 125

Ala Pro Ser Ile Ile Gly Asn Ala Thr Phe Tyr Gln Tyr Trp Ser Val

130 135 140

Arg Gln Ser Lys Arg Val Gly Gly Thr Ile Thr Thr Gly Asn His Phe145 150 155 160

Asp Ala Trp Ala Ser Val Gly Leu Asn Leu Gly Thr His Asn Tyr Gln

165 170 175

Ile Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr180 185 190

Val Ser

<210> 483<211> 2529<212> DNA

<213> Desconhecido<220><223> Obtido para amostra ambiental<400> 483

atgaaaaaaa gattgttagc gttgatagtg acattagttt ttattatctc attgtttaat 60

cccatattca ccacaccttt aacaaatgta gcaaaggctc aaagtaacca aacaaattta 120aaatttgact ttgaaaacgg tactcaaggt tggggagcaa gaggtgtttc aacaactatt 180gcaaccgttt acgagcaagc ttatgaagga agttattctt taaaggtttc aggtagaagt 240tcaacgtggg atggagcagt tgtggatatc acatcaagta tttcagcaaa tgtcacctat 300acagtttctt tatttgttcg tcacagtgat gtaaaaccac aaagattttc tgtctatgta 360tatgtcaaag ataacacagg cgaaaaatac atccaggttg cagacaaagt ggttatgcca 420aacttttgga agcagctctt tgggaagttc acaatcacaa catcaaatcc aattcaaaaa 480gtagaacttc ttgtatgtgt tccatctaac aaatctttag gattttatct tgacaatgta 540gttgttactt cagcacaacc agcttcctcg ggtgttgtta aatcttgcac atttgaaagc 600ggtagcactg agggttttgt tcagagaggt tcagcttcat tgacagttgt cgacggtgta 660tactatcatt ctccaacaaa agcattatat gtgacaggaa ggacagctac atggcagggt 720gcacagatag atatgacaag tttgcttgag aagggcaagg attatcagtt tagcatatgg 780gtatatcaaa atagtggaag tgatcagaag ataaccctta cgatgcaaag gaagaatgaa 840gatggaacta cgagttatga ttctataaag tatcagcaaa cagttccatc tggtacatgg 900acagaagtga caggttcata cacagtgcct cagacagcaa cacagcttat attctatgtt 960gaatcaccga atattaattt tgacttctac cttgatgact ttacagcggt tgacaaaaac 1020ccacctgttg taaacccagg gcttgttaaa tcttgcacat ttgaaagcgg tagcgctgaa 1080ggttttgttc agagaggttc agcttcattg acagttgtcg acggtgtata ctatcattct 1140ccaacaaaag cattgtatgt gacaggaagg acagctacat ggcagggtgc acagatagat 1200atgacaagct tgcttgagaa gggtaaggat tatcagttta gcatatgggt atatcaaaat 1260agtggaagtg atcagaagat aacccttacg atgcaaagga agaatgaaga tggaactacg 1320agttatgatt ctataaagta tcagcaaaca gttccatctg gtacatggac agaagtaaca 1380ggttcataca cagtgcctca gacagcaaca cagcttatat tctatgttga atcaccgaat 1440attaattttg acttctacct tgatgacttt acagtaatag ataaaaatcc agtgacggta 1500ccgattgcag caaaagaacc cgaatgggaa attccgtcac tttgtcagca atatagtcaa 1560tatttctcaa taggtgttgc aataccgtat aaagtacttc aaaatcctgt tgaaagagca 1620atggtgttaa aacacttcaa cagtataaca gctgaaaatg agatgaaacc tgacgctctg 1680caaagaacag aagggaactt tacattcgat atagcagacc agtatgtaaa cttcgcacag 1740caaaacggta ttggaattag agggcatact ctggtatggc acagccaagt acctaattgg 1800ttcttccagc acagtgatgg aacttcactt gatccaagca atccagatga taagcaactt 1860ttgagagata gattgaaaaa tcatattcaa actgttatgt caagatacaa agggaaagtc 1920tatgcatggg atgttgtaaa cgaggcaata gatgaaagcc agcctgatgg atttagaaga 1980agcgaatggt acagaatact tggtccaaca cctgagacaa atggtattcc agaatacatt 2040gtgcttgctt tcaggtatgc aagagaggca gatccagatg caaaactttt ctacaatgac 2100tacaacacag agatatctaa aaaaagacag tttatatatg acatggtaaa aaagctacat 2160gatatgggtt taattgatgg tgttggtttg caagggcata taaatgttga ttctccaaca 2220gtaaaagata tagaagatac aatcaatctt ttctcaacaa ttcctggact tgagatacag 2280ataacagagc ttgacataag cgtttacaca agcagcagtc agcgttatga tacgcttcct 2340caggatataa tgataaaaca agcaatgaag tttaaagaac tatttgaaat gttaaagaga 2400catagtgata gagtcacaaa tgtgacactt tggggactta aggatgatta ttcatggctt 2460tcaaaggata gaaataactg gccattactt tttgacagca actaccaggc aaaatacaac 2520tactgggca 2529

<210> 484<211> 843<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(33)<220>

<221> DOMÍNIO

<222> (36)...(185)

<223> Domínio de carbohidrato

<220>

<221> DOMÍNIO<222> (190)...(339)<223> Domínio de carbohidrato<220>

<221> DOMÍNIO

<222> (346)...(495)

<223> Domínio de carbohidrato

<220><221> DOMÍNIO<222> (513) ...(843)<223> Família 10 de hidrolase glicosila<220><221> SITE<222> (36)...(39)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (46)...(49)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (98)...(101)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (172)...(175)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (574)...(577)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (767) . . . (777)<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<220><221> SITE<222> (819) ... (822)<223> N-glicosilação site. Prosite id = PS00001<400> 484

Met Lys Lys Arg Leu Leu Ala Leu Ile Val Thr Leu Val Phe Ile Ile1 5 10 15 Ser Leu Phe Asn Pro Ile Phe Thr Thr Pro Leu Thr Asn Val Ala Lys 20 25 30 Ala Gln Ser Asn Gln Thr Asn Leu Lys Phe Asp Phe Glu Asn Gly Thr 35 40 45 Gln Gly Trp Gly Ala. Arg Gly Val Ser Thr Thr Ile Ala Thr Val Tyr 50 55 60 Glu Gln Ala Tyr Glu Gly Ser Tyr Ser Leu Lys Val Ser Gly Arg Ser65 70 75 80Ser. Thr Trp Asp Gly Ala Val Val Asp Ile Thr Ser Ser Ile Ser Ala 85 90 95 Asn Val Thr Tyr Thr Val Ser Leu Phe Val Arg His Ser Asp Val Lys 100 105 110 Pro Gln Arg Phe Ser Val Tyr Val Tyr Val Lys Asp Asn Thr Gly Glu 115 120 125 Lys Tyr Ile Gln Val Ala Asp Lys Val Val Met Pro Asn Phe Trp Lys 130 135 140 Gln Leu Phe Gly Lys Phe Thr Ile Thr Thr Ser Asn Pro Ile Gln Lys145 150 155 160Val Glu Leu Leu Val Cys Val Pro Ser Asn Lys Ser Leu Gly Phe Tyr 165 170 175 Leu Asp Asn Val Val Val Thr Ser Ala Gln Pro Ala Ser Ser Gly Val 180 185 190 Val Lys Ser Cys Thr Phe Glu Ser Gly Ser Thr Glu Gly Phe Val Gln 195 200 205 Arg Gly Ser Ala Ser Leu Thr Val Val Asp Gly Val Tyr Tyr His Ser 210 215 220 Pro Thr Lys Ala Leu Tyr Val Thr Gly Arg Thr Ala Thr Trp Gln Gly225 230 235 240Ala Gln Ile Asp Met Thr Ser Leu Leu Glu Lys Gly Lys Asp Tyr Gln 245 250 255 Phe Ser Ile Trp Val Tyr Gln Asn Ser Gly Ser Asp Gln Lys Ile Thr 260 265 270 Leu Thr Met Gln Arg Lys Asn Glu Asp Gly Thr Thr Ser Tyr Asp Ser275 280 285

Ile Lys Tyr Gln Gln Thr Val Pro Ser Gly Thr Trp Thr Glu Val Thr 290 295 300 Gly Ser Tyr Thr Val Pro Gln Thr Ala Thr Gln Leu Ile Phe Tyr Val305 310 315 320Glu Ser Pro Asn Ile Asn Phe Asp Phe Tyr Leu Asp Asp Phe Thr Ala 325 330 335 Val Asp Lys Asn Pro Pro Val Val Asn Pro Gly Leu Val Lys Ser Cys 340 345 350 Thr Phe Glu Ser Gly Ser Ala Glu Gly Phe Val Gln Arg Gly Ser Ala 355 360 365 Ser Leu Thr Val Val Asp Gly Val Tyr Tyr His Ser Pro Thr Lys Ala 370 375 380 Leu Tyr Val Thr Gly Arg Thr Ala Thr Trp Gln Gly Ala Gln Ile Asp385 390 395 400Met Thr Ser Leu Leu Glu Lys Gly Lys Asp Tyr Gln Phe Ser Ile Trp 405 410 415 Val Tyr Gln Asn Ser Gly Ser Asp Gln Lys Ile Thr Leu Thr Met Gln 420 425 430 Arg Lys Asn Glu Asp Gly Thr Thr Ser Tyr Asp Ser Ile Lys Tyr Gln 435 440 445 Gln Thr Val Pro Ser Gly Thr Trp Thr Glu Val Thr Gly Ser Tyr Thr 450 455 460 Val Pro Gln Thr Ala Thr Gln Leu Ile Phe Tyr Val Glu Ser Pro Asn465 470 475 480Ile Asn Phe Asp Phe Tyr Leu Asp Asp Phe Thr Val Ile Asp Lys Asn 485 490 495 Pro Val Thr Val Pro Ile Ala Ala Lys Glu Pro Glu Trp Glu Ile Pro 500 505 510 Ser Leu Cys Gln Gln Tyr Ser Gln Tyr Phe Ser Ile Gly Val Ala Ile 515 520 525 Pro Tyr Lys Val Leu Gln Asn Pro Val Glu Arg Ala Met Val Leu Lys 530 535 540 His Phe Asn Ser Ile Thr Ala Glu Asn Glu Met Lys Pro Asp Ala Leu545 550 555 560Gln Arg Thr Glu Gly Asn Phe Thr Phe Asp Ile Ala Asp Gln Tyr Val 565 570 575 Asn Phe Ala Gln Gln Asn Gly Ile Gly Ile Arg Gly His Thr Leu Val 580 585 590 Trp His Ser Gln Val Pro Asn Trp Phe Phe Gln His Ser Asp Gly Thr 595 600 605 Ser Leu Asp Pro Ser Asn Pro Asp Asp Lys Gln Leu Leu Arg Asp Arg 610 615 620 Leu Lys Asn His Ile Gln Thr Val Met Ser Arg Tyr Lys Gly Lys Val625 630 635 640Tyr Ala Trp Asp Val Val Asn Glu Ala Ile Asp Glu Ser Gln Pro Asp 645 650 655 Gly Phe Arg Arg Ser Glu Trp Tyr Arg Ile Leu Gly Pro Thr Pro Glu 660 665 670 Thr Asn Gly Ile Pro Glu Tyr Ile Val Leu Ala Phe Arg Tyr Ala Arg 675 680 685 Glu Ala Asp Pro Asp Ala Lys Leu Phe Tyr Asn Asp Tyr Asn Thr Glu 690 695 700 Ile Ser Lys Lys Arg Gln Phe Ile Tyr Asp Met Val Lys Lys Leu His705 710 715 720Asp Met Gly Leu Ile Asp Gly Val Gly Leu Gln Gly His Ile Asn Val 725 730 735 Asp Ser Pro Thr Val Lys Asp Ile Glu Asp Thr Ile Asn Leu Phe Ser 740 745 750 Thr Ile Pro Gly Leu Glu Ile Gln Ile Thr Glü Leu Asp Ile Ser Val 755 760 765 Tyr Thr Ser Ser Ser Gln Arg Tyr Asp Thr Leu Pro Gln Asp Ile Met 770 775 780 Ile Lys Gln Ala Met Lys Phe Lys Glu Leu Phe Glu Met Leu Lys Arg785 790 795 800His Ser Asp Arg Val Thr Asn Val Thr Leu Trp Gly Leu Lys Asp Asp

805 810 81560

Tyr Ser Trp Leu Ser Lys Asp Arg Asn Asn Trp Pro Leu Leu Phe Asp

820 825 830

Ser Asn Tyr Gln Ala Lys Tyr Asn Tyr Trp Ala835 840

<210> 485<211> 1239<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 485

atgatcaggg tttattcagc cggattcggg gggactaatg atccggttga aattgttaaagttgagttct ttgcggattc aataaaaatc catgagagct tcgaacatga tcaacatacc 120ttttcgtttt tatgggagga tgtacagtcg ggtacctaca ggataactgc caccgctacc 180gatgagcttg gaacaacctt cacctctgcc ggtgtcattg ttaaggtcgg agaggatcct 240gttatacgga gaggcctgag tgccggcaaa ggaaaatacc ttggcaatat tgtcgggcat 300catggtatcc ggcctgattt caatgaatac tggaacgggg ttactgcaga gaacggagcc 360aagtggggtg ttgtggaagg gacccgtgac gtaatgaact ggacgcaggc tgactacgcc 420tacaaccatg catattatca caatttaatg tacaggtacc atgcaattgc atggggaagt 480cagtatccgc agtggatcac tgatcttgag ccggaggaat tccagcatga actcgaagag 540tatatggctg ccgttgccga aagatatcct ctgatcgatc aggtagatgt cattaatgag 600cagttgcgaa cccatgctgc gggcaccgta tatttcaggg acgcgctcgg cggtaccggg 660gagaccggat atgactggca gatctggata tttgagaagg cgcgtcagta ttttcctgat 720gcaaagcttg tgcttaatga ctacggactg gaaaatgacc cgactgcaat caatgagatg 780ttggggctgg tcagagttct aagggacaga ggactgattg acggatttgg tacgcaggcc 840cattatttta atgttgatca gatggcaacc cagccaaata ctttgagatc gaggattgat 900ctgatggcct cgggtggtat acccgtatat gttacagagc tggatcttcg gggcagctct 960aataatgatg catcccagct tttcagctac gagaggactt tccctgtatt ctgggagcat 1020cccgctgttg ctggcatcac cctgtgggga tatgtgacag ggcagacctg gcgggagggt 1080accggactta tcaacagtga tgggagcaag agaccggcta tgctatggct tgaagaatat 1140atggctgatc agcctgatat tggcttccct cattccggaa ttgagcctga accggatagt 1200aacctccttt ataacggtga gttcaactct cgtgccgaa 1239

<210> 486<211> 413<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220><221> DOMÍNIO

<222> (84)...(381)

<223>' Família 10 de hidrolase glicosila<220>

<221> SITE<222> (135)...(138)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (310)...(320)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591

<400> 486 Met Ile Arg Val Tyr Ser Ala Gly Phe Gly Gly Thr Asn Asp Pro Val 1 5 10 15 Glu Ile Val Lys Val Glu Phe Phe Ala Asp Ser Ile Lys Ile His Glu 20 25 30 Ser Phe Glu 35 His Asp Gln His Thr 40 Phe Ser Phe Leu Trp 45 Glu Asp Val Gln Ser 50 Gly Thr Tyr Arg Ile 55 Thr Ala Thr Ala Thr 60 Asp Glu Leu Gly Thr 65 Thr Phe Thr Ser Ala 70 Gly Val Ile Val Lys 75 Val Gly Glu Asp Pro 80 Val Ile Arg Arg Gly Leu Ser Ala Gly Lys Gly Lys Tyr Leu Gly Asn 85 90 95 Ile Val Gly His His Gly Ile Arg Pro Asp Phe Asn Glu Tyr Trp Asn 100 105 110 Gly Val Thr Ala Glu Asn Gly Ala Lys Trp Gly Val Val Glu Gly Thr 115 120 125Arg Asp Val Met Asn Trp Thr Gln Ala Asp Tyr Ala Tyr Asn His Ala

130 135 140

Tyr Tyr His Asn Leu Met Tyr Arg Tyr His Ala Ile Ala Trp Gly Ser145 150 155 160

Gln Tyr Pro Gln Trp Ile Thr Asp Leu Glu Pro Glu Glu Phe Gln His

165 170 175

Glu Leu Glu Glu Tyr Met Ala Ala Val Ala Glu Arg Tyr Pro Leu Ile

180 185 190

Asp Gln Val Asp Val Ile Asn Glu Gln Leu Arg Thr His Ala Ala Gly195 200 205

Thr Val Tyr Phe Arg Asp Ala Leu Gly Gly Thr Gly Glu Thr Gly Tyr

210 215 220

Asp Trp Gln Ile Trp Ile Phe Glu Lys Ala Arg Gln Tyr Phe Pro Asp225 230 235 240

Ala Lys Leu Val Leu Asn Asp Tyr Gly Leu Glu Asn Asp Pro Thr Ala

245 250 255

Ile Asn Glu Met Leu Gly Leu Val Arg Val Leu Arg Asp Arg Gly Leu

260 265 270

Ile Asp Gly Phe Gly Thr Gln Ala His Tyr Phe Asn Val Asp Gln Met275 280 285

Ala Thr Gln Pro Asn Thr Leu Arg Ser Arg Ile Asp Leu Met Ala Ser290 295 300

I Gly Gly Ile Pro Val Tyr Val Thr Glu Leu Asp Leu Arg Gly Ser Ser305 310 315 320

Asn Asn Asp Ala Ser Gln Leu Phe Ser Tyr Glu Arg Thr Phe Pro Val

325 330 335

Phe Trp Glu His Pro Ala Val Ala Gly Ile Thr Leu Trp Gly Tyr Val

340 345 350

Thr Gly Gln Thr Trp Arg Glu Gly Thr Gly Leu Ile Asn Ser Asp Gly355 360 365

Ser Lys Arg Pro Ala Met Leu Trp Leu Glu Glu Tyr Met Ala Asp Gln

370 375 380

Pro Asp Ile Gly Phe Pro His Ser Gly Ile Glu Pro Glu Pro Asp Ser385 390 395 400

Asn Leu Leu Tyr Asn Gly Glu Phe Asn Ser Arg Ala Glu

405 410

<210> 487<211> 1152<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 487

atgcaaactg tcctcctcac cgtctcgctt gtgtttctgg caagctgcat gatggccacc 60acgaacagtg attcacccgg ttccgctcgg accgccgcca ccctcaggca ggcggccggg 120gaccgcgttc tcatcggcac ggcgatcatg tcgcgtcatc tggacgaccc gcaactcgcc 180gatctcgtcg cacgacagtt caacagcctc accggtgaaa atgaattcaa acccgcctcg 240ctccaaccac gccccggcga gttcaccttc gacgcggccg acagactcgc cgacttcgca 300cggcagcacg acatgaagtt gatcgggcac acgctcgtgt ggcacaacca ggcgccgaat 360tggatgttcg aggatgaatc cggtcagccg ctgccgcgcg agcaggcgct tgagaatctc 420aagcatcaca tcgacacggt cgtcaagcat ttcaagggcc gcgtcgtcgg ctgggatgtg 480gtcaacgaag ccatcagcga ccgggaggat gagtacctcc gtgatacccc cgcccgccgc 540gcgatcgggg atgattacat cgcccgcgcg tttgaattcg cgcacgcggc cgacccggat 600gtcgagctgt attacaacga ctacagcatc gagcacccga cgaagcgcga gaagacgctg 660cggctgatcc gcgagttgca ggccgcaggc gtccgcatcg acgccgtcgg catccagggg 720cactggctca tcgacagccc ggacgtgcag gtcatcgacg acgcgatcgc tgcgtatgcg 780agccggggag tgaaggtgat gatcaccgag ctggatgtcg atcccctgcc gcgccggcgt 840gacggcgggg cggacctcag cgccgtcgag cttgaggggc tcgacccgta catccaaggt 900cttacggacg aagcgcagca gcggctcgcc gatcgatacc gcgaagtcct cgaagtgatg 960atgaagcacg tcaatcgcgg cgacctcacg cgcatcacct tctggggcac gcacgacggc 1020acaagctggc tgaacaactt ccccgtccgc ggccgcacca atcacccgct gctgtgggat 1080cgcgagctgt cgccgaaacc agcttttcac gcggtgattg aggttctcgc gaggcccgcc 1140ggtgcacgct ga 1152

<210> 488<211> 383<212> PRT<213> Desconhecido<220><223> Obtido para amostra ambiental<220><221> DOMÍNIO<222> (34)...(376)<223> Família 10 de hidrolase glicosila<220><221> SITE<222> (267) . .. (277)<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 488

Met Gln Thr Val Leu Leu Thr Val Ser Leu Val Phe Leu Alai Ser Cys 1 5 10 15 Met Met Ala Thr Thr Asn Ser Asp Ser Pro Gly Ser Ala Arg Thr Ala 20 25 30 Ala Thr Leu Arg Gln Ala Ala Gly Asp Arg Val Leu Ile Gly Thr Ala 35 40 45 Ile Met Ser Arg His Leu Asp Asp Pro Gln Leu Ala Asp Leu Val Ala 50 55 60 Arg Gln Phe Asn Ser Leu Thr Gly Glu Asn Glu Phe Lys Pro Ala Ser 65 70 75 80 Leu Gln Pro Arg Pro Gly Glu Phe Thr Phe Asp Ala Ala Asp Arg Leu 85 90 95 Ala Asp Phe Ala Arg Gln His Asp Met Lys Leu Ile Gly His Thr Leu 100 105 110 Val Trp His Asn Gln Ala Pro Asn Trp Met Phe Glu Asp Glu Ser Gly 115 120 125 Gln Pro Leu Pro Arg Glu Gln Ala Leu Glu Asn Leu Lys His His Ile 130 135 140 Asp Thr Val Val Lys His Phe Lys Gly Arg Val Val Gly Trp Asp Val 145 150 155 160 Val Asn Glu Ala Ile Ser Asp Arg Glu Asp Glu Tyr Leu Arg Asp Thr 165 170 175 Pro Ala Arg Arg Ala Ile Gly Asp Asp Tyr Ile Ala Arg Ala Phe Glu 180 185 190 Phe Ala His Ala Ala Asp Pro Asp Val Glu Leu Tyr Tyr Asn Asp Tyr 195 200 205 Ser Ile Glu His Pro Thr Lys Arg Glu Lys Thr Leu Arg Leu Ile Arg 210 215 220 Glu Leu Gln Ala Ala Gly Val Arg Ile Asp Ala Val Gly Ile Gln Gly 225 230 235 240 His Trp Leu Ile Asp Ser Pro Asp Val Gln Val Ile Asp Asp Ala Ile 245 250 255 Ala Ala Tyr Ala Ser Arg Gly Val Lys Val Met Ile Thr Glu Leu Asp 260 265 270 Val Asp Pro Leu Pro Arg Arg Arg Asp Gly Gly Ala Asp Leu Ser Ala 275 280 285 Val Glu Leu Glu Gly Leu Asp Pro Tyr Ile Gln Gly Leu Thr Asp Glu 290 295 300 Ala Gln Gln Arg Leu Ala Asp Arg Tyr Arg Glu Val Leu Glu Val Met 305 310 315 320 Met Lys His Val Asn Arg Gly Asp Leu Thr Arg Ile Thr Phe Trp Gly 325 330 335 Thr His Asp Gly Thr Ser Trp Leu Asn Asn Phe Pro Val Arg Gly Arg 340 345 350 Thr Asn His Pro Leu Leu Trp Asp Arg Glu Leu Ser Pro Lys Pro Ala 355 360 365 Phe His Ala Val Ile Glu Val Leu Ala Arg Pro Ala Gly Ala Arg 370 375 380 <210> 489

<212> DNA<213> Desconhecido<220><223> Obtido para amostra ambiental<400> 489

atgaagccaa ttttgcgttc atccctctcc tgcctcggca tccttgtcct cgcaacttgcccaactggct gcaaagacaa gccgaagccc gatcccgcaa cgagcgcgcc cacgctagccgaagcctacg ccccctactt cactatcggc gcggccctaa acgaaagcca ggtagaggggccgcccgcgg agctggtcac caagcacttc aactccatca ccgccgagaa catcatgaagtggggcctga tccatccgga gcccggccag tacaactggg agccggtcga ccgcttcgtcgatttcggcg aggccaatgg catggagatt atcggccaca ccctggtctg gcacagccaaacgcccgatt gggtcttccg cgacgaagag ggcaacctgc tcacccgcga gcccatgctcgagcgcatgc gcgatcacat ccacgccgtc gtcgggcgct acaagggccg tatccatggctgggatgtcg tcaacgaagc cctcaacgag gacggcagcc tgcgggagtc gctctactaccagatcatcg gtccggacta catcgccaaa gccttcgaat acgcccacga agccgatccggaggccgaac tctactacaa cgactacacc atcgaaaacc cggacaagcg ggctggagccgtacgcatcg tcaaggacct gcaggaacgc ggcgtccgca tcaccggcgt gggcatacaggaacacgtca acatgacctg gcccagccag cagctgctgc gcgagaccat ccgcgacttcgttgccctcg gcgtgaccgt catgatcacc gagctcgacg tcgatgtcct gccctccgccttccagcacc aaggagccga cgtttcgctc aacgcagagc tgcgcgacga gctcaacccctacccgaacg gattgcccga ggccgtgcag cgcgcccaag cccagcgcta cgccgacctcttttccgtgt acctggaatt caaggacagc atcacccgcg ttaccctttg gggactggacgacggcggtt cctggctcaa cgactggccc gtgcgcggac gcacgagcta cccccttctctttgaccgcg agctgcaacc caagcccgcc ttcgacgccg tgctccggct cggactcgaacaccgacgcc aggacagcgg cggctactga490389PRT

<213> Desconhecido<220><223> Obtido para amostra ambiental<220>DOMÍNIO(38)...(378)<223> Família 10 de hidrolase glicosila<220>SITE(54)... (57)<223> N-glicosilação site. Prosite id =<220>

SITE

(247) . . . (250)<223> N-glicosilação<220>

SITE

(268) . . . (278)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id<400> 490

Met Lys Pro Ile Leu Arg Ser Ser Leu Ser Cys Leu Gly Ile Leu Val15 10 15

Leu Ala Thr Cys Pro Thr Gly Cys Lys Asp Lys Pro Lys Pro Asp Pro

20 25 30

Ala Thr Ser Ala Pro Thr Leu Ala Glu Ala Tyr Ala Pro Tyr Phe Thr

35 40 45

Ile Gly Ala Ala Leu Asn Glu Ser Gln Val Glu Gly Pro Pro Ala Glu

<210><211><212>

<221><222>

<221> SITE<222>site. Prosite id = PS00001

Leu Val Thr Lys His Phe Asn Ser Ile Thr Ala Glu Asn Ile Met Lys

65 70 75 80

Trp Gly Leu Ile His Pro Glu Pro Gly Gln Tyr Asn Trp Glu Pro Val

85 90 95

Asp Arg Phe Val Asp Phe Gly Glu Ala Asn Gly Met Glu Ile Ile Gly

100 105 HO

His Thr Leu Val Trp His Ser Gln Thr Pro Asp Trp Val Phe Arg Asp

115 120 125

Glu Glu Gly Asn Leu Leu Thr Arg Glu Pro Met Leu Glu Arg Met Arg

130 135 140

Asp His Ile His Ala Val Val Gly Arg Tyr Lys Gly Arg Ile His Gly

145 150 155 160

Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly Ser Leu Arg Glu

165 170 175

Ser Leu Tyr Tyr Gln Ile Ile Gly Pro Asp Tyr Ile Ala Lys Ala Phe

180 185 190

Glu Tyr Ala His Glu Ala Asp Pro Glu Ala Glu Leu Tyr Tyr Asn Asp

1201802403003604204805406006607207808409009601020108011401170

= PS00591789

195 200 205

Tyr Thr Ile Glu Asn Pro Asp Lys Arg Ala Gly Ala Val Arg Ile Val

210 215 220

Lys Asp Leu Gln Glu Arg Gly Val Arg Ile Thr Gly Val Gly Ile Gln225 230 235 240

Glu His Val Asn Met Thr Trp Pro Ser Gln Gln Leu Leu Arg Glu Thr

245 250 255

Ile Arg Asp Phe Val Ala Leu Gly Val Thr Val Met Ile Thr Glu Leu260 265 270

Asp Val Asp Val Leu Pro Ser Ala Phe Gln His Gln Gly Ala Asp Val275 280 285

Ser Leu Asn Ala Glu Leu Arg Asp Glu Leu Asn Pro Tyr Pro Asn Gly

290 295 300

Leu Pro Glu Ala Val Gln Arg Ala Gln Ala Gln Arg Tyr Ala Asp Leu305 310 315 320

Phe Ser Val Tyr Leu Glu Phe Lys Asp Ser Ile Thr Arg Val Thr Leu

325 330 335

Trp Gly Leu Asp Asp Gly Gly Ser Trp Leu Asn Asp Trp Pro Val Arg340 345 350

Gly Arg Thr Ser Tyr Pro Leu Leu Phe Asp Arg Glu Leu Gln Pro Lys355 360 365

Pro Ala Phe Asp Ala Val Leu Arg Leu Gly Leu Glu His Arg Arg Gln

370 375 380

Asp Ser Gly Gly Tyr

385

<210> 491

<211> 1530

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 491

atgaacaatt atagagcttt tgtgttgggc ttgtgctggc taggtgggct aatgttgacg 60

gggtgtggag ccgaccaagg cagtccagac cccggcacct ccagtgccac cagcagcacc 120

agttcatcca gtgagggctt ttccagtgct gtcagcgaga gttctgccag tgcgatatcc 180

agctctgcgt catccgcgcc gcccaactat caggtgccag agaataattt cgcggtgaac 240

ggcgatctgg agcagggact taccaattgg ggggctattg gcggaacggt cagtcgagcc 300

acctctgaaa gtcgaagcgg cgccgccagc gcgctgatca ccgaccgtac agcgtcgtgg 360

aatggactta ccttcaatgt tggtcaactg acgcaaggca acgaatacgc agtggcggtc 420

tgggtcaagc tggcttcggg ttctccagat gccactgtaa tccttacggc caagcgccaa 480

gacgatgatg atccctccac cttcctagaa tacaccaaca ttgctatggc tactgcttca 540

gcgagtagtt ggactttgtt gcacggatac tacacccagg ccggcacgcc atttcaacac 600

tttattatcg agtctgctga cgaaacggtc agcttctacg ccgatgactt ctctgtggcg 660

ggtgaagtag acccagtcgt cggcgaaggg catgacttct ttgtcggaaa tatcaccacc 720

tcgggcagtg taaggtcgga ttttatcaac tattgggatc agattacgcc agagaatgag 780

ggtaaatggg aatctgtaga gcgcgtaaga ggagtctacg actggagtgg cactgaccgc 840

gtctacgcat acgcccgtga gcataacatc ccggtgaagg ctcatgcttt tgtctgggga 900

agccaatacc ccagttggat cacctctctg agtccgcaag agcaagccga ggccattgag 960

cgctggatac gtgactactg cgctcgatat cccgataccg cgatgatcga tgtggttaat 1020

50 gaagccacgc ctggtcatgc gccggccgag tttgcccgca gcgcttttgg tgaaaactgg 1080

gttattcggt cgttcgagtt ggcccgccag tattgcccaa atgccatttt aatactcaat 1140

gattacaacg tacttagctg gaacacagac ggttttatca atatggcacg tccagttatt 1200

aacgctggag tggtagatgc acttggtttg caagcgcacg gtttagccga ctggtccttg 1260

gcggatatag agcgaaaact taatgaagtg gcggcgttgg ggttgcccat ctatatctct 1320

55 gaatacgata tcgaaaaaac cgatgatcaa gagcaactcg atgtaatgcg cacccagttc 1380

ccgctctttt ataaccatcc ctcggtagtg gggattaccc tttggggtta cgtagaaggg 1440

cgaacttgga ggccgggaac cgggctaatt catgaggacg gaaaccaccg ccccgcgatg 1500

aattggttga tggattattt ggggcgatag 1530<210> 492<211> 509<212> PRT<213> Desconhecido<22 0>

<223> Obtido para amostra ambiental

<220>

<221> SIGNAL<222> (1) ... (65)<220><221> DOMÍNIO<222> (75)...(222)<223> Domínio de carbohidrato<220><221> DOMÍNIO<222> (205)...(507)<223> Família 10 de hidrolase glicosila<220><221> SITE<222> (240). . . (243)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (380)...(394)<223> Trp-Asp (WD) marca repetida. Prosite id = PS00678<220><221> SITE<222> (440)...(450)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 492

Met Asn Asn Tyr Arg Ala Phe Val Leu Gly Leu Cys Trp Leu Gly Gly1 5 10 15 Leu Met Leu Thr Gly Cys Gly Ala Asp Gln Gly Ser Pro Asp Pro Gly 20 25 30 Thr Ser Ser 35 Ala Thr Ser Ser Thr 40 Ser Ser Ser Ser Glu 45 Gly Phe SerSer Ala 50 Val Ser Glu Ser Ser 55 Ala Ser Ala Ile Ser 60 Ser Ser Ala SerSer Ala Pro Pro Asn Tyr Gln Val Pro Glu Asn Asn Phe Ala Val Asn65 70 75 80Gly Asp Leu Glu Gln Gly Leu Thr Asn Trp Gly Ala Ile Gly Gly Thr 85 90 95 Val Ser Arg Ala Thr Ser Glu Ser Arg Ser Gly Ala Ala Ser Ala Leu 100 105 110 Ile Thr Asp Arg Thr Ala Ser Trp Asn Gly Leu Thr Phe Asn Val Gly 115 120 125 Gln Leu 130 Thr Gln Gly Asn Glu 135 Tyr Ala Val Ala Val 140 Trp Val Lys LeuAla Ser Gly Ser Pro Asp Ala Thr Val Ile Leu Thr Ala Lys Arg Gln145 150 155 160Asp Asp Asp Asp Pro Ser Thr Phe Leu Glu Tyr Thr Asn Ile Ala Met 165 170 175 Ala Thr Ala Ser Ala Ser Ser Trp Thr Leu Leu His Gly Tyr Tyr Thr 180 185 190 Gln Ala Gly 195 Thr Pro Phe Gln His 200 Phe Ile Ile Glu Ser 205 Ala Asp GluThr Val Ser Phe Tyr Ala Asp Asp Phe Ser Val Ala Gly Glu Val Asp 210 215 220 Pro Val Val Gly Glu Gly His Asp Phe Phe Val Gly Asn Ile Thr Thr225 230 235 240Ser Gly Ser Val Arg Ser Asp Phe Ile Asn Tyr Trp Asp Gln Ile Thr 245 250 255 Pro Glu Asn Glu 260 Gly Lys Trp Glu Ser 265 Val Glu Arg Val Arg 270 Gly ValTyr Asp Trp Ser Gly Thr Asp Arg Val Tyr Ala Tyr Ala Arg Glu His 275 280 285 Asn Ile 290 Pro Val Lys Ala His 295 Ala Phe Val Trp Gly 300 Ser Gln Tyr ProSer Trp Ile Thr Ser Leu Ser Pro Gln Glu Gln Ala Glu Ala Ile Glu305 310 315 320Arg Trp Ile Arg Asp Tyr Cys Ala Arg Tyr Pro Asp Thr Ala Met Ile 325 330 335 Asp Val Val Asn Glu Ala Thr Pro Gly His Ala Pro Ala Glu Phe Ala 340 345 350 Arg Ser Ala Phe Gly Glu Asn -Trp Val Ile Arg Ser Phe Glu Leu Ala 355 360 365Arg Gln Tyr Cys Pro Asn Ala Ile Leu Ile Leu Asn Asp Tyr Asn Val 370 375 380 Leu Ser Tirp Asn Thr Asp Gly Phe Ile Asn Met Ala Arg Pro Val Ile385 390 395 400Asn Ala Gly Val Val Asp Ala Leu Gly Leu Gln Ala His Gly Leu Ala 405 410 415 Asp Trp Ser Leu Ala Asp Ile Glu Arg Lys Leu Asn Glu Val Ala Ala 420 425 430 Leu Gly Leu 435 Pro Ile Tyr Ile Ser 440 Glu Tyr Asp Ile Glu 445 Lys Thr AspAsp Gln Glu Gln Leu Asp Val Met Arg Thr Gln Phe Pro Leu Phe Tyr 450 455 460 Asn His Pro Ser Val Val Gly Ile Thr Leu Trp Gly Tyr Val Glu Gly465 470 475 480Arg Thr Trp Arg Pro Gly Thr Gly Leu Ile His Glu Asp Gly Asn His 485 490 495 Arg Pro Ala Met Asn Trp Leu Met Asp Tyr Leu Gly Arg 500 505

<210> 493<211> 1959<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 493

atgcatgttc tcgcgaaaat ctgcttggtc gtgctcatcg cgctgtcgac atgcgccagcacgatggcac agaccagcat caacggctcc agtctcgcct tgcagtccac gggatccaacgtgatcccat ccaccggtta cgtgggcacg tatcttgtcg ttcccgattc gggcgacggcggctcgacgg tcaatctgaa tctcagtgcc cagcggggtg ccggcagcgg caatccccacctgaacatcg ttgtcgccga ttcgcagttt ggcttcaatg tcacgacttt cggagcgcagaactacaaca cgggcaattt ctggctgccg gccggcacgc acttcgtccg cgtcgagcgcgattcgccca gcaacacgcc cagcatcacg cgatcgatga caatcaacaa tctgagcgtgactggggcaa cctttagcaa tagcaacaat acgtcgaacg cacggaacgc ggctaattcctacatcgaga attttcgcaa gggcgaccaa aacatcgccc tccacggcgc tacgcccggaacgcccgtgc atgtgaagct ggtgaatcac gcctttaact tcggcacggc cattggcggacacgacctga ccacactcaa caacttcctc aacaactcca actacaccag ccgcctgttggagaatttca acatgatcgt gccgggcaac gttggcaaat ggggccacag ccaactgccaactcagattc aggcgatgga cacctttctc aattttgccg agaacaacaa tctccgcgcccgcatgcata acctgatttg gcagaaccag cagcccacta gcatcaacag tctaatcaaccaggcacttg gcggcagcac gtcggccaag aaccagctcc gccaggaaat ctccaatcgcatcagttact acgtcggcag tcgcggccac cgctacatgg agctggacgt gctcaacgaggcccaccgag ccccggacta ctggaacatt ttctcgccca ctgagcttgc tgatattcatgccgaggtcc gcaacgttgc cgcggccaat ggccacgaca tcggtctcta catcaacgactacaaccttc tgcagcacaa cagcgctccc agcttctatc ccgacaccgg cgcatcgaattacgccaact ggtatcgcaa ttacgccgag gagctgaaca acgccggctt tggggaagtcgtgagcggca tcggcattca gtactacgtc cgccacgacg gaaccgtcag cgtaccgcggattcagcagg tcttccagaa tatgggcgtc accggcctgc ccctcacgct caccgagtttggcgttcaaa cgcacaacaa tcctacactc gcccagagtg ccgactatct tgaggacacgattcgcatgg tctttggaac cccccatgcc acgacgttta tgatgtgggg gttctgggaaaacgatgttt gggtgggcgg gccgttggcc gcgctgtacg acgccaattg gaacctaaccgtccccggcc agcgctatca gcaactcatg tccgactggt ccaccgagga aacgctgatagtcgggccgg acggcaccat cgacctcagc ggtttctatg gcgactatga aatcaccatcggcgatgaaa cgttcgaatt cacccacgcc aagggctcgc ccggccagtc gctcattgtcggaccgttct tgccgggcga ctacaacggc gacggcgtgg tggacgtgct cgattacgtcgtgtggcgga acagccgcgg ggccgactgg ctcccgaacc gcgatctgga agctgacggtccggttgggc aggacgatta cgccgcctgg caggctaact tcggcagcac gctcgacggcggcagcgcca gctccctagc gacgattccc gagccggcca gcggcatgct gctgctcttcggcttggtcg ccgcgatctg cctacggatg cgacgttaa<210> 494<211> 652<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(23)<220>

<221> DOMÍNIO<222> (184) . . . (510)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (28)...(31)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (68) . . .(71)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (94) . . . (97)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (139)...(142)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (151)...(154)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (214) . .. (217)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (505)...(508)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (575) . . . (587)

<223> Cálcio-obrigatório domínio EF-mão. Prosite id = PS00018<400> 494

Met His Val Leu Ala Lys Ile Cys Leu Val Val Leu Ile Ala Leu Ser15 10 15

Thr Cys Ala Ser Thr Met Ala Gln Thr Ser Ile Asn Gly Ser Ser Leu

20 25 30

Ala Leu Gln Ser Thr Gly Ser Asn Val Ile Pro Ser Thr Gly Tyr Val

35 40 45

Gly Thr Tyr Leu Val Val Pro Asp Ser Gly Asp Gly Gly Ser Thr Val

50 55 60

Asn Leu Asn Leu Ser Ala Gln Arg Gly Ala Gly Ser Gly Asn Pro His65 70 75 80

Leu Asn Ile Val Val Ala Asp Ser Gln Phe Gly Phe Asn Val Thr Thr

85 90 95

Phe Gly Ala Gln Asn Tyr Asn Thr Gly Asn Phe Trp Leu Pro Ala Gly

100 105 HO

Thr His Phe Val Arg Val Glu Arg Asp Ser Pro Ser Asn Thr Pro Ser

115 120 125

Ile Thr Arg Ser Met Thr Ile Asn Asn Leu Ser Val Thr Gly Ala Thr

130 135 140

Phe Ser Asn Ser Asn Asn Thr Ser Asn Ala Arg Asn Ala Ala Asn Ser145 150 155 160

Tyr Ile Glu Asn Phe Arg Lys Gly Asp Gln Asn Ile Ala Leu His Gly

165 170 175

Ala Thr Pro Gly Thr Pro Val His Val Lys Leu Val Asn His Ala Phe

180 185 190

Asn Phe Gly Thr Ala Ile Gly Gly His Asp Leu Thr Thr Leu Asn Asn

195 200 205

Phe Leu Asn Asn Ser Asn Tyr Thr Ser Arg Leu Leu Glu Asn Phe Asn

210 215 220

Met Ile Val Pro Gly Asn Val Gly Lys Trp Gly His Ser Gln Leu Pro225 230 235 240793

Thr Gln Ile Gln Ala Met Asp Thr Phe Leu Asn Phe Ala Glu Asn Asn

245 250 255

Asn Leu Arg Ala Arg Met His Asn Leu Ile Trp Gln Asn Gln Gln Pro260 265 270

Thr Ser Ile Asn Ser Leu Ile Asn Gln Ala Leu Gly Gly Ser Thr Ser275 280 285

Ala Lys Asn Gln Leu Arg Gln Glu Ile Ser Asn Arg Ile Ser Tyr Tyr

290 295 300

Val Gly Ser Arg Gly His Arg Tyr Met Glu Leu Asp Val Leu Asn Glu 305 310 315 320

Ala His Arg Ala Pro Asp Tyr Trp Asn Ile Phe Ser Pro Thr Glu Leu

325 330 335

Ala Asp Ile His Ala Glu Val Arg Asn Val Ala Ala Ala Asn Gly His340 345 350 ·

Asp Ile Gly Leu Tyr Ile Asn Asp Tyr Asn Leu Leu Gln His Asn Ser355 360 365

Ala Pro Ser Phe Tyr Pro Asp Thr Gly Ala Ser Asn Tyr Ala Asn Trp

370 375 380

Tyr Arg Asn Tyr Ala Glu Glu Leu Asn Asn Ala Gly Phe Gly Glu Val 385 390 395 400

Val Ser Gly Ile Gly Ile Gln Tyr Tyr Val Arg His Asp Gly Thr Val

405 410 415

Ser Val Pro Arg Ile Gln Gln Val Phe Gln Asn Met Gly Val Thr Gly420 425 430

Leu Pro Leu Thr Leu Thr Glu Phe Gly Val Gln Thr His Asn Asn Pro435 440 445

Thr Leu Ala Gln Ser Ala Asp Tyr Leu Glu Asp Thr Ile Arg Met Val

450 455 460

Phe Gly Thr Pro His Ala Thr Thr Phe Met Met Trp Gly Phe Trp Glu465 470 475 480

Asn Asp Val Trp Val Gly Gly Pro Leu Ala Ala Leu Tyr Asp Ala Asn

485 490 495

Trp Asn Leu Thr Val Pro Gly Gln Arg Tyr Gln Gln Leu Met Ser Asp500 505 510

Trp Ser Thr Glu Glu Thr Leu Ile Val Gly Pro Asp Gly Thr Ile Asp515 520 525

Leu Ser Gly Phe Tyr Gly Asp Tyr Glu Ile Thr Ile Gly Asp Glu Thr

530 535 540

Phe Glu Phe Thr His Ala Lys Gly Ser Pro Gly Gln Ser Leu Ile Val 545 550 555 560

Gly Pro Phe Leu Pro Gly Asp Tyr Asn Gly Asp Gly Val Val Asp Val

565 570 575

Leu Asp Tyr Val Val Trp Arg Asn Ser Arg Gly Ala Asp Trp Leu Pro580 585 590

Asn Arg Asp Leu Glu Ala Asp Gly Pro Val Gly Gln Asp Asp Tyr Ala595 600 * 605

Ala Trp Gln Ala Asn Phe Gly Ser Thr Leu Asp Gly Gly Ser Ala Ser

610 615 620

Ser Leu Ala Thr Ile Pro Glu Pro Ala Ser Gly Met Leu Leu Leu Phe 625 630 635 640

Gly Leu Val Ala Ala Ile Cys Leu Arg Met Arg Arg645 650

<210> 495<211> 1125<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 495

atgagaacgc gagttttgac gctgctaggg ggatttctgg gatcgacgat tgctgcgagc 60gtgacggtcg ctgagcggcc aágcctgaag gatgtgtttg cggacgattt tcgcgtcggg 120gtcgcgctcg gtacgtcgca agtgatgggc aaggagccgg acgcgatgca cctggccgcc 180cggcacttca acacgatcac gaacgagaat ctgctcaaat gggccgaggt gcacccggag 240ccggagcgct accatttcga gtcggccgac cgcttcgtcg aattcggcga gaagcatggg 300atgtggatcg tcggccacac gctggtctgg cacagccaga cgcccgactg ggtgtttgaa 360gatgcggagg gccggccgct cgatcgggag gcgctcatcg agcggatgcg ggcgcatatccacacgatcg tcgggcggta caaggggcga gtccacgcct gggacgtggt caacgaggcc

420480gtgctcgacg acggctcgtg gcgcgaaacg aagtggcgcg agatcatcgg cccggactat 540atcgaattgg cctttcggtt tgcccacgag gtcgatccgg aggcggagct ctactacaac 600gactacaacg agtggcacgc gggcaagcgc gcggcgatcg tccggctcgt gcaagatttg 660caggccaagg gagtgcggat cgacgggatc ggactgcaag gacactgggg aatggactac 720ccggagctcg aagagctgga ccacatgttt acggagtacg gcaagctggg cgtgaagctc 780atgatcacgg aattggacgt gaccgtgatt ccgctgcctg gtcgggacac gggcgccgag 840gtgacgcgaa ggggccaggc tggttccggg atgaatcctt atcctgatgg actgccggcc 900gatcagcaac aagcgttggc cgagcggtac gccgcttttt tcaggctctt tatgaagcac 960cgcgataaga tcgaccgcgt gacgttctgg ggcgtgcata acggccagac gtggcgcaac 1020aactggccca ttccaggccg cagtgactat ccgctactct tcgatcgcca gttgcagccg 1080aagccggcgt ttgacgcggt gattgaagtg gccagcgagc gttaa 1125

<210> 496<211> 374<212> PRT<213> Desconhecido<220><223> Obtido para amostra ambiental<220><221> DOMÍNIO<222> (28)...(371)<223> Família 10 de hidrolase glicosila<400> 496

Met Arg Thr Arg Val Leu Thr Leu Leu Gly Gly Phe Leu Gly Ser Thr. ' 1 · 5 10 15

Ile Ala Ala Ser Val Thr Val Ala Glu Arg Pro Ser Leu Lys Asp Val20 25 30

Phe Ala Asp Asp Phe Arg Val Gly Val Ala Leu Gly Thr Ser Gln Val

35 40 45

Met Gly Lys Glu Prò Asp Ala Met His Leu Ala Ala Arg His Phe Asn

50 55 60

Thr Ile Thr Asn Glu Asn Leu Leu Lys Trp Ala Glu Val His Pro Glu65 70 75 80

Pro Glu Arg Tyr His Phe Glu Ser Ala Asp Arg Phe Val Glu Phe Gly85 90 95

Glu Lys His Gly Met Trp Ile Val Gly His Thr Leu Val Trp His Ser100 105 HO

Gln Thr Pro Asp Trp Val Phe Glu Asp Ala Glu Gly Arg Pro Leu Asp

115 120 125

Arg Glu Ala Leu Ile Glu Arg Met Arg Ala His Ile His Thr Ile Val 130 135 140

Gly Arg Tyr Lys Gly Arg Val His Ala Trp Asp Val Val Asn Glu Ala145 150 155 160

Val Leu Asp Asp Gly Ser Trp Arg Glu Thr Lys Trp Arg Glu Ile Ile165 170 175

Gly Pro Asp Tyr Ile Glu Leu Ala Phe Arg Phe Ala His Glu Val Asp180 185 190

Pro Glu Ala Glu Leu Tyr Tyr Asn Asp Tyr Asn Glu Trp His Ala Gly

195 200 205

Lys Arg Ala Ala Ile Val Arg Leu Val Gln Asp Leu Gln Ala Lys Gly

210 215 220

Val Arg Ile Asp Gly Ile Gly Leu Gln Gly His Trp Gly Met Asp Tyr225 230 235 240

Pro Glu Leu Glu Glu Leu Asp His Met Phe Thr Glu Tyr Gly Lys Leu245 250 255

Gly Val Lys Leu Met Ile Thr Glu Leu Asp Val Thr Val Ile Pro Leu260 265 270

Pro Gly Arg Asp Thr Gly Ala Glu Val Thr Arg Arg Gly Gln Ala Gly

275 280 285

Ser Gly Met Asn Pro Tyr Pro Asp Gly Leu Pro Ala Asp Gln Gln Gln 290 295 300

Ala Leu Ala Glu Arg Tyr Ala Ala Phe Phe Arg Leu Phe Met Lys His305 310 315 320

Arg Asp Lys Ile Asp Arg Val Thr Phe Trp Gly Val His Asn Gly Gln325 330 335

Thr Trp Arg Asn Asn Trp Pro Ile Pro Gly Arg Ser Asp Tyr Pro Leu340 345 350

Leu Phe Asp Arg Gln Leu Gln Pro Lys Pro Ala Phe Asp Ala Val Ile355 360

Glu Val Ala Ser Glu Arg

370<210> 497

<211> 1008

<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 497

atgtggcaga taaataacag tgccgaagac gcgcctaaataataatgccg cagtggggac ttggtactcc ctgagtgggagctagtggcc cãgtcctgta cctaaacaat gacaagaccaattgacaatt tcactgtcac aataactgaa acaagtaccgccgccaacca ttacaaccac cccgttagac aaaaacgccgagcaattcag gcggaaataa gaccctttca ggttcaccctgagggcggaa atgacaacaa acttatatgg tacgggccaattcagggcgg aatggaataa ccccaatgac tttttaggcccagggtaaac ctttcactga ttataaaaat gtttattgcgggcagaaata cagccggaag ttattcctat ataggtatttaatgccgcaa aggaagagga gaagttgata gaatactacaaattcatctc aatcagacac ctctcccatg gggaccggaaggcagttata cgctggacgg cgcgacttac agtgttattaccttcaatag acggcgataa aacatttaca caattcttcaaaaaccggga caatttccgt taccgagcat ttcaaaaaatcttggttcaa atatgtacga atgtaaattc cttgtcgaagctggaattta cctacctgaa attctcgcag gaggacaatc

<210> 498<211> 335<212> PRT<213> Desconhecido<220><223> Obtido para amostra ambiental<220><221> DOMÍNIO<222> (111)...(325)<223> Família 11 de glicosila hidrolases<220><221> SITE<222> (5) . . . (8)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (63)...(66)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (107) . . . (110)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (178) . . . (181)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (224)...(227)<223> N-glicosilação site. Prosite id = PS00001<400> 498

Met Trp Gln Ile Asn Asn Ser Ala Glu Asp Ala Pro Lys Tyr Pro Thr

1 5 10 15

Val Ala Ser Gln Asn Asn Ala Ala Val Gly Thr Trp Tyr Ser- Leu Ser

20 25 30Gly Thr Trp Thr Gly Lys Pro Thr Ala Ser Gly Pro Val Leu Tyr Leu

35 40 45

Asn Asn Asp Lys Thr Ser Gly Thr Thr Phe Tyr Tyr Ile Asp Asn Phe

50 55 60

Thr Val Thr Ile Thr Glu Thr Ser Thr Gly Val Gly Gly Gly Asp Gly

atcctacagt ggcgagccaa 60catggacggg aaagccaacc 120gcggcaccac gttctactat 180gagtcggagg cggtgacgga 240caggcgtgca aacgtttacc 300atggctacga aatgtggaca 360accagggagg cggtgccgcg 420gcgtcggtta tttctggaat 480attttaacta tacaaggtcg 540acggctggtc aagaaaccca 600tcgtggatga ctggttcggt 660caacaggggg cagcgtagtc 720aaaatgtgag ggtgaacaag 780gcatacgcca aacgctgcgc 840gggacgcatt aaatatgaag 900cgggcggcgg caccggctgg 960ccaggtag 100865 70 75 80Pro Pro Thr Ile Thr Thr Thr Pro Leu Asp Lys Asn Ala Ala Gly Val 85 90 95 Gln Thr Phe Thr Ser Asn Ser Gly Gly Asn Lys Thr Leu Ser Gly Ser 100 105 110 Pro Tyr Gly Tyr Glu Met Trp Thr Glu Gly Gly Asn Asp Asn Lys Leu 115 120 125 Ile Trp Tyr Gly Pro Asn Gln Gly Gly Gly Ala Ala Phe Arg Ala Glu 130 135 140 Trp Asn Asn Pro Asn Asp Phe Leu Gly Arg Val Gly Tyr Phe Trp Asn145 150 155 160Gln Gly Lys Pro Phe Thr Asp Tyr Lys Asn Val Tyr Cys Asp Phe Asn 165 170 175 Tyr Thr Arg Ser Gly Arg Asn Thr Ala Gly Ser Tyr Ser Tyr Ile Gly 180 185 190 Ile Tyr Gly Trp Ser Arg Asn Pro Asn Ala Ala Lys Glu Glu Glu Lys 195 200 205 Leu Ile Glu Tyr Tyr Ile Val Asp Asp Trp Phe Gly Asn Ser Ser Gln 210 215 220 Ser Asp Thr Ser Pro Met Gly Thr Gly Thr Thr Gly Gly Ser Val Val225 230 235 240Gly Ser Tyr Thr Leu Asp Gly Ala Thr Tyr Ser Val Ile Lys Asn Val 245 250 255 Arg Val Asn Lys Pro Ser Ile Asp Gly Asp Lys Thr Phe Thr Gln Phe 260 265 270 Phe Ser Ile Arg Gln Thr Leu Arg Lys Thr Gly Thr Ile Ser Val Thr 275 280 285 Glu His Phe Lys Lys Trp Asp Ala Leu Asn Met Lys Leu Gly Ser Asn 290 295 300 Met Tyr Glu Cys Lys Phe Leu Val Glu Ala Gly Gly Gly Thr Gly Trp305 310 315 320Leu Glu Phe Thr Tyr Leu Lys Phe Ser Gln Glu Asp Asn Pro Arg 325 330 335 <210> 499 <211> 1155

<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 499

atgattacat tcagàaatac attgtttacc gtcgttatac tcgccattgt cggcagcgggctgccggcat gcgaagccgc tccgccggaa aatgcggatc cgtccttaca cgaggcgtatgcagatgcgt ttctgatggg caccgcactc aatctggcgc agatcgacgg aagggatgaagagggcatcg gtctggtgcg gcggcatttt aatgcgatta cgccagagaa cgtgacgaagtggggaccga tacacccgac gccgggcgag tataatttcg ggccggccga ccggtttgttgaattcggcg aagcccatga catgttcatg ataggccata cgcttgtatg gcacagccagacgccccgat gggtgttcga ggatgaagcc ggaaatccgc tcggccgcga tgcgctcattgaacgcatgc gcgatcatat ccataccgtc gtcgggcggt accggggaag gattcacgcctgggacgttg tgaacgaagc gctgaatgaa gacggaaccc tgcgggaatc cccatggtatcgcattatag gcgaggatta cctgctgaaa gcctttgaat tcgcgcatga agcggatccggatgccgagc tgtattataâ cgattattcg ctcgaaaatc ccgccaagcg ggcgggggcggttcgcctgg tccggtatct gcaggataac ggtgcgccga tacacgggat cggaacccaagggcacttct ctctcatctg gcccgcgctt gaagagatcg ataaaaccat cgtcgattttgccgcattag gcgtggacgt catggttacc gaactcgagg tcgacgttct tcctcccgcattcgaatatc agggagccga tattgccatg cgggcggaac tcgaagaacg attgaacccgtaccccgacg gactgccggc cgaaatcgaa gatgcgctta cacagcggta tcgggacatcttcgaggttt ttctgcggca cagcgacgtt attacgcgtg taacgttctg gggggtggccgatggagatt catggaagaa taactggccg gtacagggaa ggacgaacta tccgctgttgttcgatcgtg aatggcagcc gaaacctgcg ttttattccg tgatggaagt tgcggaagagatgttgaatg aataa<210> 500<211> 384<212> PRT<213> Desconhecido<220><223> Obtido para amostra ambiental<220><221> SIGNAL<222> (1)...(26)<220><221> DOMÍNIO<222> (35)...(378)<223> Família 10 de hidrolase glicosila<220><221> SITE<222> (78)...(81)<223> N-glicosilação site. Prosite id = PS00001<400> 500

Met Ile Thr Phe Arg Asn Thr Leu Phe Thr Val Val Ile Leu Ala Ile1 5 10 15 Val Gly Ser Gly Leu Pro Ala Cys Glu Ala Ala Pro Pro Glu Asn Ala 20 25 30 Asp Pro Ser Leu His Glu Ala Tyr Ala Asp Ala Phe Leu Met Gly Thr 35 40 45 Ala Leu Asn Leu Ala Gln Ile Asp Gly Arg Asp Glu Glu Gly Ile Gly 50 55 60 Leu Val Arg Arg His Phe Asn Ala Ile Thr Pro Glu Asn Val Thr Lys65 70 75 80Trp Gly Pro Ile His Pro Thr Pro Gly Glu Tyr Asn Phe Gly Pro Ala 85 90 95 Asp Arg Phe Val Glu Phe Gly Glu Ala His Asp Met Phe Met Ile Gly 100 105 110 His Thr Leu Val Trp His Ser Gln Thr Pro Arg Trp Val Phe Glu Asp 115 120 125 Glu Ala Gly Asn Pro Leu Gly Arg Asp Ala Leu Ile Glu Arg Met Arg 130 135 140 Asp His Ile His Thr Val Val Gly Arg Tyr Arg Gly Arg Ile His Ala145 150 155 160Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly Thr Leu Arg Glu 165 170 175 Ser Pro Trp Tyr Arg Ile Ile Gly Glu Asp Tyr Leu Leu Lys Ala Phe 180 185 190 Glu Phe Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp 195 200 205 Tyr Ser Leu Glu Asn Pro Ala Lys Arg Ala Gly Ala Val Arg Leu Val 210 215 220 Arg Tyr Leu Gln Asp Asn Gly Ala Pro Ile His Gly Ile Gly Thr Gln225 230 235 240Gly His Phe Ser Leu Ile Trp Pro Ala Leu Glu Glu Ile Asp Lys Thr 245 250 255 Ile Val Asp Phe Ala Ala Leu Gly Val Asp Val Met Val Thr Glu Leu 260 265 270 Glu Val Asp Val Leu Pro Pro Ala Phe Glu Tyr Gln Gly Ala Asp Ile 275 280 285 Ala Met Arg Ala Glu Leu Glu Glu Arg Leu Asn Pro Tyr Pro Asp Gly 290 295 300 Leu Pro Ala Glu Ile Glu Asp Ala Leu Thr Gln Arg Tyr Arg Asp Ile305 310 315 320Phe Glu Val Phe Leu Arg His Ser Asp Val Ile Thr Arg Val Thr Phe 325 330 335 Trp Gly Val Ala Asp Gly Asp Ser Trp Lys Asn Asn Trp Pro Val Gln 340 345 350 Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Glu Trp Gln Pro Lys 355 360 365 Pro Ala Phe Tyr Ser Val Met Glu Val Ala Glu Glu Met Leu Asn Glu 370 375 380

<210> 501

<211> 741

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 501

atgaaatata gtcatgttgt aacgctatct ctagcgctgg tcctatgtat cgccgggttgggtgtgtcgg cagtgaacgc ccaaacccac tgcgggagtc aaacgggcaa ccatggtggt 120tattacttta cgcactggac cgacggtggt ggttccgcct gtatgaccct gggatccggc 180ggcaactaca gctattcgtg gtccaacacg ggtaactttg tcggcggcaa gggttggagc 240accggcacca acaaccgggt tatcggctat aacgccggcg tctttgcccc ggcgggcaac 300tcctacctgg cactctatgg ctggaccacc aacccgctgg tggaatacta cgtggtggac 360agttggggca gctggcggcc gccgggtgcg cagtctgcgg gtacggtgaa cagcgacggc 420ggcacctatg atctgtacag aacccaaagg gtaaaccagc cttccattca gggtacggca 480accttttatc agtactggag tgtgcgcacg tcaccgcggt cccagggaac caacaacaac 540attaccttcc agaatcacgt caacgcctgg gcggctcgag gttggaatct gggtacgcac 600aactaccagg tgatggccac cgaaggttac cagagcagcg gttcgtccaa cgtgaccgtg 660tgggagtccg gtaccagcgg cggcggtggc ggcggtggcg ccagcggcgg tggcggtcag 720aacaactcgt gccgaattct t 741

<210> 502<211> 247<212> PRT<213> Desconhecido<220><223> Obtido para amostra ambiental<220><221> DOMÍNIO<222> (36)...(220)<223> Família 11 de glicosila hidrolases<220><221> SITE<222> (62)... (65)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (113)...(123)<223> Família 11 de glicosila hidrolases ativa site marca 1. Prosite id PS00776<220><221> SITE<222> (182)...(185)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (208)...(219)<223> Família 11 de glicosila hidrolases ativa site marca 2. Prosite id PS00777<220><221> SITE<222> (220) . .. (223)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (244)...(247)<223> N-glicosilação site. Prosite id = PS00001<400> 502

Met Lys Tyr Ser His Val Val Thr Leu Ser Leu Ala Leu Val Leu Cys1 5 10 15

Ile Ala Gly Leu Gly Val Ser Ala Val Asn Ala Gln Thr His Cys Gly

20 25 30

Ser Gln Thr Gly Asn His Gly Gly Tyr Tyr Phe Thr His Trp Thr Asp

35 40 45

Gly Gly Gly Ser Ala Cys Met Thr Leu Gly Ser Gly Gly Asn Tyr Ser

50 55 60

Tyr Ser Trp Ser Asn Thr Gly Asn Phe Val Gly Gly Lys Gly Trp Ser65 70 75 80

Thr Gly Thr Asn Asn Arg Val Ile Gly Tyr Asn Ala Gly Val Phe Ala

85 90 95

Pro Ala Gly Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro

100 105 110

Leu Val Glu Tyr Tyr Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro

115 120 125

Gly Ala Gln Ser Ala Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asp130 135 140Leu Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Gln Gly

145 150 155

Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Pro Arg Ser

165 170

Thr Asn Asn Asn Ile Thr Phe Gln Asn His Val Asn Ala Trp180 185 190

Arg Gly Trp Asn Leu Gly Thr His Asn Tyr Gln Val Met Ala

195 200 205

Gly Tyr Gln Ser Ser Gly Ser Ser Asn Val Thr Val Trp Glu

210 215 220

Thr Ser Gly Gly Gly Gly Gly Gly Gly Ala Ser Gly Gly Gly225 230 235

Asn Asn Ser Cys Arg Ile Leu245

<210> 503<211> 1545<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 503

atgaatacaa cccaaaccac aagcaaaaaa agcagtagga aacgttttgctttgtggtac tcatcagcgc cctgaccata tttgtatcta cggctcttgcagcaccaatg aaaccggcac ccataatggc ttctactatt cgttctggaaaatgccacct tcgaactatt ggaaggtggc cgttacaagt ctcaatggaaaataactggg taggcggcaa aggttggaat ccgggcggcc cccggatagtggctattacg gtgttgataa ctcgcaaaat tcctatctgg cgctctatggaatccgctga tcgaatacta tgttatcgaa agctatggct cgtacaacccagtggcggcc aggattatgg cagttttcag agcgatggcg ccacttacaatgtcagcgtg tcaatgcgcc ttgtatcgaa gggaataact gcaccttctaagtgtccgat caccaaagaa aggctttggc aacatcagtg gcaccatcaccactttaact tttgggcaag caagggattg aacctgggaa gccatgactagccaccgaag gctatcaaag cagcggtagt tctgacatca cagtcagtgaccccccacca cgattccacc gaccggcgtg ccgçcaactg gcgtgccaccccacctggtg gccggatcga ggccgagaat tatagtagct caggcggcactgcggcggaa tgctgtgcta catcggggcc aatgcctgga cgcaatataattgccagccg ggacgaaccg gatcgatctg agcgttgcca acggtggcagattcaggtat tgatcggcgg tacgaacgtc ggcaccctga ccgtgagcggtggaacacgt tccagacccg atcgctcaca ttccctgcac gcagcggcaccgtctcgtct tcgtcaatgg caatgtgaat gtagattggc tggcgttctcacgaacccca ccaacacacc accgccggtg cccaccaata cacccccagtacaatacctc caacgacagt acctccagcg ggtggatgtt cggtgagttaagttggggca acggggcaac ggtaagtgtg agcatcgcca acaatggttcaatggttgga cgttgggttg gaccttcccc ggtaaccaac agattaccaaggcacttaca cccagtctgg agcttccgtt tcggtatcga atgcaagctgattggcgcta acggcggaac gacaagtttt ggcttcaata tttcctttagcaagcgccca ccaactttac cctgaacgga accccttgta gataa<210> 504<211> 514<212> PRT<213> Desconhecido<22 0>

<223> Obtido para amostra ambiental<220>

SIGNAL(1)...(37)

Thr Ala160Gln Gly175

Ala Ala

Thr Glu

Ser Gly

Gly Gln240

ctacaccgct 60tcgaactttg 120agatagcgga 180caacagtacc 240caattaccag 300ctggacaaga 360agccagttgc 420tgtgcgccgt 480ccaatacttt 540cgttcaaaac 600tatggttttc 660aggggccatc 720aaccagcgta 780ggtggatgtg 840tagcgtgaac 900caacaccagt 960caccggcggc 1020acagaatgtg 1080aggctctggc 1140ccccccaaca 1200cactcagaac 1260atcaaacatt 1320tttatggagc 1380gaacggctcg 1440cggttccaat 1500 1545

<221><222><220>

<221> DOMÍNIO

(46)...(235)

Família 11 de glicosila hidrolases

<222><223><22 0><221><222>

DOMÍNIO(267)...(378)<223> Carbohydrate binding module (family 6<220>

<221> DOMÍNIO<222> (413) . . . (513)<223> Domínio de celulose obrigatória<220><221> SITE<222> (2) ...(5)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (43) . . . (46)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (61) . . . (64)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (78)...(81)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (175) . . . (178)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (193)...(196)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (223)...(234)<223> Família 11 de glicosila hidrolases ativa site marca 2. Prosite PS00777<220><221> SITE<222> (274)...(277)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (322)...(325)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (441) . . . (444)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (481)...(484)<223> N-glicosilação site. Prosite id =PS00001<220><221> SITE<222> (485) . . . (488)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (500) . . . (503)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (512) . . . (515)<223> N-glicosilação site. Prosite id = PS00001<400> 504

Met Asn Thr Thr Gln Thr Thr Ser Lys Lys Ser Ser Arg Lys Arg Phe15 10 15

Ala Tyr Thr Ala Phe Val Val Leu Ile Ser Ala Leu Thr Ile Phe Val

20 25 30

Ser Thr Ala Leu Ala Arg Thr Leu Ser Thr Asn Glu Thr Gly Thr His

35 40 45

Asn Gly Phe Tyr Tyr Ser Phe Trp Lys Asp Ser Gly Asn Ala Thr Phe50 55 60Glu Leu Leu Glu Gly Gly Arg Tyr Lys Ser Gln Trp Asn Asn Ser Thr 65 70 75 80 Asn Asn Trp Val Gly Gly Lys Gly Trp Asn Pro Gly Gly Pro Arg Ile 85 90 95 Val Asn Tyr Gln Gly Tyr Tyr Gly Val Asp Asn Ser Gln Asn Ser Tyr 100 105 110 Leu Ala Leu 115 Tyr Gly Trp Thr Arg 120 Asn Pro Leu Ile Glu 125 Tyr Tyr Val Ile Glu Ser Tyr Gly Ser Tyr Asn Pro Ala Ser Cys Ser Gly Gly Gln 130 135 140 Asp Tyr Gly Ser Phe Gln Ser Asp Gly Ala Thr Tyr Asn Val Arg Arg 145 150 155 160 Cys Gln Arg Val Asn Ala Pro Cys Ile Glu Gly Asn Asn Cys Thr Phe 165 170 175 Tyr Gln Tyr Phe Ser Val Arg Ser Pro Lys Lys Gly Phe Gly Asn Ile 180 185 190 Ser Gly Thr 195 Ile Thr Val Gln Asn 200 His Phe Asn Phe Trp 205 Ala Ser Lys Gly Leu Asn Leu Gly Ser His Asp Tyr Met Val Phe Ala Thr Glu Gly 210 215 220 Tyr Gln Ser Ser Gly Ser Ser Asp Ile Thr Val Ser Glu Gly Ala Ile 225 230 235 240 Pro Pro Thr Thr Ile Pro Pro Thr Gly Val Pro Pro Thr Gly Val Pro 245 250 255 Pro Thr Ser Val Pro Pro Gly Gly Arg Ile Glu Ala Glu Asn Tyr Ser 260 265 270 Ser Ser Gly Gly Thr Val Asp Val Cys Gly Gly Met Leu Cys Tyr Ile 275 280 285 Gly Ala Asn Ala Trp Thr Gln Tyr Asn Ser Val Asn Leu Pro Ala Gly 290 295 300 Thr Asn Arg Ile Asp Leu Ser Val Ala Asn Gly Gly Ser Asn Thr Ser 305 310 315 320 Ile Gln Val Leu Ile Gly Gly Thr Asn Val Gly Thr Leu Thr Val Ser 325 330 335 Gly Thr Gly Gly Trp Asn Thr Phe Gln Thr Arg Ser Leu Thr Phe Pro 340 345 350 Ala Arg Ser 355 Gly Thr Gln Asn Val 360 Arg Leu Val Phe Val 365 Asn Gly Asn Val Asn Val Asp Trp Leu Ala Phe Ser Gly Ser Gly Thr Asn Pro Thr 370 375 380 Asn Thr Pro Pro Pro Val Pro Thr Asn Thr Pro Pro Val Pro Pro Thr 385 390 395 400 Thr Ile Pro Pro Thr 405 Thr Val Pro Pro Ala 410 Gly Gly Cys Ser Val 415 Ser Tyr Thr Gln Asn Ser Trp Gly Asn Gly Ala Thr Val Ser Val Ser Ile 420 425 430 Ala Asn Asn Gly Ser Ser Asn Ile Asn Gly Trp Thr Leu Gly Trp Thr 435 440 445 Phe Pro Gly Asn Gln Gln Ile Thr Asn Leu Trp Ser Gly Thr Tyr Thr 450 455 460 Gln Ser Gly Ala Ser Val Ser Val Ser Asn Ala Ser Trp Asn Gly Ser 465 470 475 480 Ile Gly Ala Asn Gly Gly Thr Thr Ser Phe Gly Phe Asn Ile Ser Phe 485 490 495 Ser Gly Ser Asn Gln Ala Pro Thr Asn Phe Thr Leu Asn Gly Thr Pro 500 505 510 Cys Arg

<210> 505<211> 1059

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 505

atgcgattga aaccaaccct gaagtgggct gtgtcactgc ttgtgaccac tgccgccatg 60

acgtttacat cggcggtcaa tgcccagcaa cactgtgcaa acgagatcgg tacccacgac 120ggctacttct tcacccattg gtctgatggg atggggtcgg cctgcatgac gctcggtagc 180gacggtaact acagctatag ctggtccgac accggcaact ttgttggcgg taaaggctgg 240gcaactggct ccagtgaccg cgttatcagc tacaacgccg gcacctacgc gcccgagggt 300aactcctacc tggcgctcta cggctggtcc agaaaccccc tgatcgaata ctacgtggtc 360gacagctggg gggactggcg tccgccgggt ggcacatcgg tcggcaccgt gaccagtgat 420ggcggcacct acgatctgta catcaccgag cgcgtggagc aaçcctccat cgaaggcacc 480gcgaccttct atcagtactg gagcgtgcgc accagcaagc gtccgcaagg tcagaacaac 540accatcacct tccggaacca tgtcgacgcc tgggccaacc agggctggca cctgggtagc 600cacgactatc aggtcatggc aacagaaggc tggtatagct ccggcagctc caacgtcact 660gtctgggaag gcggcagcgg cggtagcaac ggcggcggta acggcaatgc cggtggcggc 720ggtggcgaca acaccatcgt tgtacgcgcg gtaggcacct caggcaacga gcaactgcgc 780gtcaacgtgg gcggcagcac cgttgaaacc ctgagcctgt ccagcagctg gcaggactac 840accgtcacca ccagcgcctc gggcgacgtt aatgtggagc tgttcaacga ccagggtgca 900ggctatgaag cccaggtcga atacctcatc atcaacggcg acacccgcta cggcgccgac 960cagagctata acaccagcgc ctgggacggt gagtgcggcg gcggtgaatt caccatgtgg 1020atgcactgcg atggcatcat gggatttggt gacatgtaa 1059

<210> 506<211> 352<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(28)<220>

<221> DOMÍNIO<222> (37) . . . (221)

<223> Família 11 de glicosila hidrolases<220>

<221> SITE<222> (63) ... (66)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (114)...(124)

<223> Família 11 de glicosila hidrolases ativa site marca 1. Prosite idPS00776<220>

<221> SITE

<222> (181)...(184)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (221)...(224)

<223> N-glicosilação site. Prosite id = PS00001<400> 506

Met Arg Leu Lys Pro Thr Leu Lys Trp Ala Val Ser Leu Leu Val Thr1 5 10 15 Thr Ala Ala Met Thr Phe Thr Ser Ala Val Asn Ala Gln Gln His Cys 20 25 30 Ala Asn Glu Ile Gly Thr His Asp Gly Tyr Phe Phe Thr His Trp Ser 35 40 45 Asp Gly Met Gly Ser Ala Cys Met Thr Leu Gly Ser Asp Gly Asn Tyr 50 55 60 Ser Tyr Ser Trp Ser Asp Thr Gly Asn Phe Val Gly Gly Lys Gly Trp65 70 75 80Ala Thr Gly Ser Ser Asp Arg Val Ile Ser Tyr Asn Ala Gly Thr Tyr 85 90 95 Ala Pro Glu Gly Asn Ser .Tyr Leu Ala Leu Tyr Gly Trp Ser Arg Asn 100 105 110 Pro Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Asp Trp Arg Pro 115 120 125 Pro Gly Gly Thr Ser Val Gly Thr Val Thr Ser Asp Gly Gly Thr Tyr 130 135 140 Asp Leu Tyr Ile Thr Glu Arg Val Glu Gln Pro Ser Ile Glu Gly Thr

145 150 155 160Ala Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Lys Arg Pro Gln 165 170 175 Gly Gln Asn Asn Thr Ile Thr Phe Arg Asn His Val Asp Ala Trp Ala 180 185 190 Asn Gln Gly 195 Trp His Leu Gly Ser 200 His Asp Tyr Gln Val 205 Met Ala Thr Glu Gly 210 Trp Tyr Ser Ser Gly 215 Ser Ser Asn Val Thr 220 Val Trp Glu Gly Gly Ser Gly Gly Ser Asn Gly Gly Gly Asn Gly Asn Ala Gly Gly Gly 225 230 235 240 Gly Gly Asp Asn Thr Ile Val Val Arg Ala Val Gly Thr Ser Gly Asn 245 250 255 Glu Gln Leu Arg 260 Val Asn Val Gly Gly 265 Ser Thr Val Glu Thr 270 Leu Ser Leu Ser Ser 275 Ser Trp Gln Asp Tyr 280 Thr Val Thr Thr Ser 285 Ala Ser Gly Asp Val 290 Asn Val Glu Leu Phe 295 Asn Asp Gln Gly Ala 300 Gly Tyr Glu Ala Gln Val Glu Tyr Leu Ile Ile Asn Gly Asp Thr Arg Tyr Gly Ala Asp 305 310 315 320 Gln Ser Tyr Asn Thr Ser Ala Trp Asp Gly Glu Cys Gly Gly Gly Glu 325 330 335 Phe Thr Met Trp 340 Met His Cys Asp Gly 345 Ile Met Gly Phe Gly 350 Asp Met

<210> 507

<211> 1062

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 507

atgttaactg caaaacgttc cagaccttgg gtctggtcac ttctcgtgac cgcgtccgccttattgttat cggcggcagc ccattcacag caacactgtt ccaaccagac cggtaaccacggtggttact actttaccca ttggacagac ggcggcggta ctgcctgcat gaccctgggcgacggcggca actacagcta cacctggtcc aacaccggca actttgtcgg cggcaaaggctggagtaccg gcaccaataa ccgggtcatc ggttacaacg ccggcaacta ctcacccgccggcaactcct acctcgccct atacggctgg agcaccaatc cactggtgga gtactacgtggtcgatagct ggggaacctg gcgtccaccg ggtggcactt cggtcggcac ggtaaccagcgatggtggca cttatgacct ctaccgcaca cagcgcgtgc aacagccctc cattgagggaacttccacct tctatcagta ctggagtgtg cgcacctcaa agcgtcctca agggcagaacaacaacatta cctttcagaa ccatgtgaac gcctgggcca atcaaggctg gctcctgggcgcacacaact atcaggtaat ggcggttgag ggctatcaga gcagtggcaa cgccaatgtcaccgtctggg atgccggcag cagtggcggc ggtggagacg gcggcaatgc cgctggcggctcaaccggct ccaacacgat cgtggtgcgt gctgtgggta cttcaggcaa cgagcagctgcgcgtcaatg tcggcggcaa taccgtgcaa accctgaacc tgtcgagtaa ctggcaggattacacggtca acaccagcgc ctcgggtgat gtcaatgtcg agctgatcaa cgatcagggccagggctacg aagcccgggt cgaatacctg atcatcaacg gcgacacccg ctacggcgccgatcagagct ataacaccag cgcctgggac ggcgagtgtg gtggtggctc cttcaccatgtggatgcact gcaacggcat cctgggcttt ggcaatatgt aa<210> 508<211> 353<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220><221><222><220><221><222><223><220><221><222>

SIGNAL(1)-..(29)

DOMÍNIO(38) . . . (222)

Família 11 de glicosila hidrolases

6012018024030036042048054060066072078084090096010201062

SITE

(35)...(38)

<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE

<222> (115)...(125)

<223> Família 11 de glicosila hidrolases ativa site marca 1. Prosite id

PS00776

<220>

<221> SITE

<222> (184)...(187)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (210)...(221)

<223> Família 11 de glicosila hidrolases ativa site marca 2. Prosite idPS00777<220>

<221> SITE

<222> (222)...(225)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (277)...(280)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (288)...(291)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (329)...(332)

<223> N-glicosilação site. Prosite id = PS00001<400> 508

Met Leu Thr Ala Lys Arg Ser Arg Pro Trp Val Trp Ser Leu Leu Val15 10 15

Thr Ala Ser Ala Leu Leu Leu Ser Ala Ala Ala His Ser Gln Gln His

20 25 30

Cys Ser Asn Gln Thr Gly Asn His Gly Gly Tyr Tyr Phe Thr His Trp

35 40 45

Thr Asp Gly Gly Gly Thr Ala Cys Met Thr Leu Gly Asp Gly Gly Asn

50 55 60

Tyr Ser Tyr Thr Trp Ser Asn Thr Gly Asn Phe Val Gly Gly Lys Gly65 70 75 80

Trp Ser Thr Gly Thr Asn Asn Arg Val Ile Gly Tyr Asn Ala Gly Asn

85 90 95

Tyr Ser Pro Ala Gly Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Ser Thr

100 105 110

Asn Pro Leu Val Glu Tyr Tyr Val Val Asp Ser Trp Gly Thr Trp Arg

115 120 125

Pro Pro Gly Gly Thr Ser Val Gly Thr Val Thr Ser Asp Gly Gly Thr

130 135 140

Tyr Asp Leu Tyr Árg Thr Gln Arg Val Gln Gln Pro Ser Ile Glu Gly145 150 155 160

Thr Ser Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Lys Arg Pro

165 170 175

Gln Gly Gln Asn Asn Asn Ile Thr Phe Gln Asn His Val Asn Ala Trp

180 185 190

Ala Asn Gln Gly Trp Leu Leu Gly Ala His Asn Tyr Gln Val Met Ala

195 200 205

Val Glu Gly Tyr Gln Ser Ser Gly Asn Ala Asn Val Thr Val Trp Asp

210 215 220

Ala Gly Ser Ser Gly Gly Gly Gly Asp Gly Gly Asn Ala Ala Gly Gly225 230 235 240

Ser Thr Gly Ser Asn Thr Ile Val Val Arg Ala Val Gly Thr Ser Gly

245 250 255

Asn Glu Gln Leu Arg Val Asn Val Gly Gly Asn Thr Val Gln Thr Leu

260 265 270

Asn Leu Ser Ser Asn Trp Gln Asp Tyr Thr Val Asn Thr Ser Ala Ser

275 280 285

Gly Asp Val Asn Val Glu Leu Ile Asn Asp Gln Gly Gln Gly Tyr GluAla Arg Val Glu Tyr Leu Ile Ile Asn Gly Asp305 310 315

Asp Gln Ser Tyr Asn Thr Ser Ala Trp Asp Gly

325 330

Ser Phe Thr Met Trp Met His Cys Asn Gly Ile340 345

Met

<210> 509

<211> 2325

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 509

atggcgtccg ccgacaatgg tctacaccgc tacagcgcggaattctgcgg tgtccgggac ccagcgcgtg ctggtggccaaccgcgccgg gcggcccgac gacttacgag cacctactcacccgaaaatg ctggcaagtg gggtagcgta gccggacagcgatatcgaca tcgcctacca gtttgctcgg gacaacggcattggtctggg gcgagcaaca acccgcctgg ctagattcgccaagccgtac acgcctggat gcagcaggtg gcgcaacgctgaggtggtca atgaacccct gcacgcaccg cccagttacaggcgaaactg ggtgggactg ggtgatcacc gctttcgagagcggcgcaat taaccctgaa cgactatcaa attctgcatttacctggaaa tcattgagtt gctgcaggcg cgcaacctgcgggcacttcc tggagcgggc ggacctggat ttggtagcgagccaccgggc tgcccattta cgtttccgag tttgatttgacatgccaatg tttttcggga cttctttacg ctgttttggggtaacccact ggggccacct ggaaggcacc gtatggcaacaccgacggct ccccccgccc agcactggaa tgggccgtgtaactgcacgg tgccggacta ccagcccagc ggctggcaagctggaggcag aagaatttga cacgggcgaa ggtgtgctggtacaccgatg acggcgattg gatcggcttt gccgaagtggacctttgcca tcacttacgc caaaggcaac caatccggcggacagccttg acagcagccc ggtgttaacc ttggagctgcaccaacgaaa ccctggaagt cgcctggaac cccattgtcgcgcttcaacg acgcctttgg tgtggccaac gtcgatacaacccacggcac cggcactgaa tttagtacag gatggcagctggctggcaga gttggaacaa ctccagcctg atgctgagcacaccaaagcc tgctggccac caaccggccc gacagcgcccactggcgcag tacaagccgg tgccacctac gcggttagcggatgaaccgg atactgcácg tttggccgcc gtggtcgagtcacaactctt acccctggtt gcagaacctg gaaggcgtagctgtcggcgg acctggtcat tccagagtgc gacttggtcaggcactggtg ccggcgtgga tgtgtatctg gaccaagttcccagacagtc tgattccaga cggcagtttt gccaacagtatggaacggtt caactttgag cttatccggt gcccaagcctctcgccacca accgacccga cacggggcag ttcgccgtgtactccgggca ccagctatca ggtgagcgct caggcactgaacagtacgtt tggccgccaa ggtggagtgt gccaacccgcccgtggctaa ataacatcaa cgcggtgacc ccaggtgtctctggtcatcc ctgactgcga tctggttgat gtggctatttggcaccgatg tatacctgga tgaggtgcgc gtcatcgctc<210> 510<211> 774<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (29)...(317)

<223> Família 10 de hidrolase glicosila<220>

<221> DOMÍNIO<222> (342) . .. (458)

300

Thr Arg Tyr Gly Ala320

Glu Cys Gly Gly Gly335

Leu Gly Phe Gly Asn350

tggcctatgattgacaacaacctatttcaaagggggttattacccttccgtcgaccaagcatccggacttaagaagcccttggcgcgggatgccccaatttggatgccattcaatctggaatctcgccgaagcacccggccgaatgcctagtttcattgagtgatgctttcgctcggcggattttcaaatgcagtatttccaccaacaccgcacccgcgattcgctttggtcaacggtacacgcccagtcaatttgctgtcccgggtattgtgccaaccccgccacgccaacgtcgcgataagtgctcgccactttcaggacagcgggcaacaacctgactcggcggcagccgagggccaggacagccattcttcgaaggaataa

cccgtcggggattctttggcccaactgactgaactggggtctatcacaattgaacaactgggaagtggtgggggggcagcatattttcctcacccaggaacagcattcagtagcttagcctgacgcccgtagtggttggccctgatacgccggcggccaacagtttgacttgtggttgctgggctgggaccgtgcatttacggctggggccctgtacattgacgccggcacaccctgtcgctatgatggcgtacaacttacctggatgccgccggctggggtggaccgaactactttgagaccggccgcactggcagagcgcaaagtttgccaagcggtacgaaccggaccaacagcttctgctggagaacactacagcg

6012018024030036042048054060066072078084090096010201080114012001260132013801440150015601620168017401800186019201980204021002160222022802325<223> Carbohydrate binding module (family 6)<220>

<221> DOMÍNIO

<222> (466) . .. (618)

<223> Domínio de carbohidrato

<220>

<221> DOMÍNIO

<222> (622) ... (774)

<223> Domínio de carbohidrato

<220>

<221> SITE

<222> (325)...(328)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (428)...(431)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (482)...(485)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (493)...(496)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (641) ... (644)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (651)...(654)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (685) . . . (688)

<223> N-glicosilação site. Prosite id = PS00001<400> 510

Met Ala Ser Ala Asp Asn Gly Leu His Arg Tyr Ser Ala Val Ala Tyr1 5 10 15 Asp Pro Ser Gly 20 Asn Ser Ala Val Ser 25 Gly Thr Gln Arg Val 30 Leu ValAla Ile Asp Asn Lys Phe Phe Gly Thr Ala Pro Gly Gly Pro Thr Thr 35 40 45 Tyr Glu 50 His Leu Leu Thr Tyr 55 Phe Asn Gln Leu Thr 60 Pro Glu Asn AlaGly Lys Trp Gly Ser Val Ala Gly Gln Gln Gly Val Met Asn Trp Gly 65 70 75 80Asp Ile Asp Ile Ala 85 Tyr Gln Phe Ala Arg 90 Asp Asn Gly Ile Pro 95 PheArg Tyr His Asn Leu Val Trp Gly Glu Gln Gln Pro Ala Trp Leu Asp 100 105 110 Ser Leu Asp 115 Gln Ala Glu Gln Leu 120 Gln Ala Val His Ala 125 Trp Met GlnGln Val 130 Ala Gln Arg Tyr Pro 135 Asp Leu Glu Val Val 140 Glu Val Val AsnGlu Pro Leu His Ala Pro Pro Ser Tyr Lys Glu Ala Leu Gly Gly Ser145 150 155 160Gly Glu Thr Gly Trp 165 Asp Trp Val Ile Thr 170 Ala Phe Glu Met Ala 175 ArgGlu Tyr Phe Pro Ala Ala Gln Leu Thr Leu Asn Asp Tyr Gln Ile Leu 180 185 190 His Leu Pro 195 Gln Phe Thr Gln Glu 200 Tyr Leu Glu Ile Ile 205 Glu Leu LeuGln Ala Arg Asn Leu Leu Asp Ala Ile Ser Ile Gln Gly His Phe Leu 210 215 220 Glu Arg Ala Asp Leu Asp Leu Val Ala Ile Asn Leu Asp Ser Leu Ala225 230 235 240 Ala Thr Gly Leu Pro Ile Tyr Val Ser Glu Phe Asp Leu Asn Leu Ala 245 250 255 Asp Asp Ala Arg His Ala Asn Val Phe Arg Asp Phe Phe Thr Leu Phe 260 265 270 Trp Glu His Pro Ala Val Val Gly Val Thr His Trp Gly His Leu Glu 275 280 285 Gly Thr Val Trp Gln Pro Asn Ala Tyr Leu Ile Arg Thr Asp Gly Ser 290 295 300 Pro Arg Pro Ala Leu Glu Trp Ala Val Cys Phe Ile Asp Gly Gly Gln 305 310 315 320 Asn Cys Thr Val Pro Asp Tyr Gln Pro Ser Gly Trp Gln Gly Asp Ala 325 330 335 Phe Ser Leu Thr Leu Glu Ala Glu Glu Phe Asp Thr Gly Glu Gly Val 340 345 350 Leu Ala Leu Gly Gly Val Val Ala Tyr Thr Asp Asp Gly Asp Trp Ile 355 360 365 Gly Phe 370 Ala Glu Val Asp Phe 375 Gln Met Gly Trp Asp 380 Thr Phe Ala Ile Thr Tyr Ala Lys Gly Asn Gln Ser Gly Gly Ser Ile Ser Val His Leu 385 390 395 400 Asp Ser Leu Asp Ser 405 Ser Pro Val Leu Thr 410 Leu Glu Leu Pro Pro 415 Thr Pro Gly Trp Gly Thr Asn Glu Thr Leu Glu Val Ala Trp Asn Pro Ile 420 425 430 Val Gly Thr Arg Asp Leu Tyr Ile Arg Phe Asn Asp Ala Phe Gly Val 435 440 445 Ala Asn 450 Val Asp Thr Ile Arg 455 Phe Gly Thr Pro Ala 460 Pro Thr Ala Pro Ala Leu Asn Leu Val Gln Asp Gly Ser Phe Asn Gly Thr Thr Leu Ser 465 470 475 480 Gly Trp Gln Ser Trp 485 Asn Asn Ser Ser Leu 490 Met Leu Ser Asn Ala 495 Gln Ser Tyr Asp Gly His Gln Ser Leu Leu Ala Thr Asn Arg Pro Asp Ser 500 505 510 Ala Gln Phe Ala Val Tyr Asn Leu Thr Gly Ala Val Gln Ala Gly Ala 515 520 525 Thr Tyr 530 Ala Val Ser Ala Arg 535 Val Phe Leu Asp Ala 540 Asp Glu Pro Asp Thr 545 Ala Arg Leu Ala Ala 550 Val Val Glu Cys Ala 555 Asn Pro Pro Ala Gly 560 His Asn Ser Tyr Pro 565 Trp Leu Gln Asn Leu 570 Glu Gly Val Ala Pro 575 Arg Gln Trp Thr Glu Leu Ser Ala Asp Leu Val Ile Pro Glu Cys Asp Leu 580 585 590 Val Asn Val Ala Ile Tyr Phe Glu Gly Thr Gly Ala Gly Val Asp Val 595 600 605 Tyr Leu 610 Asp Gln Val Gln Val 615 Leu Ala Pro Ala Ala 620 Pro Asp Ser Leu Ile 625 Pro Asp Gly Ser Phe 630 Ala Asn Ser Thr Leu 635 Ser Gly Trp Gln Ser 640 Trp Asn Gly Ser Thr Leu Ser Leu Ser Gly Ala Gln Ala Tyr Ser Gly 645 650 655 Gln Gln Ser Leu Leu Ala Thr Asn Arg Pro Asp Thr Gly Gln Phe Ala 660 665 670 Val Tyr Asn Leu Thr Gln Ala Val Thr Pro Gly Thr Ser Tyr Gln Val 675 680 685 Ser Ala Gln Ala Leu Ile Gly Gly Ser Glu Pro Asp Thr Val Arg Leu 690 695 700 Ala 705 Ala Lys Val Glu Cys 710 Ala Asn Pro Pro Glu 715 Gly His Asn Ser Phe 720 Pro Trp Leu Asn Asn Ile Asn Ala Val Thr Pro Gly Val Trp Thr Ala 725 730 735 Ile Ala Gly Glu Leu Val Ile Pro Asp Cys Asp Leu Val Asp Val Ala 740 745 750 Ile Phe Phe Glu Gly Thr Thr Ala Gly Thr Asp Val Tyr Leu Asp Glu 755 760 765Val Arg Val Ile Ala Gln

770<210> 511<211> 1107<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 511

atgaagttca gtcatataag atcgctgtcc ctcgcgctgg ttctgtgttt taccgggtttggcgtgtcga cagttcatgc tcaaacccat tgcgggagcc agacaggcaa ccatggcggtttctacttta cccactggac cgatggtggt ggtagtgcct gcatgaccct gggctccggtggcaactaca gctattcctg gtccaatacc ggcaactttg ttggcggcaa gggctgggcaaccggcacca ataaccgggt tatcggctac aacgccgggg tgtttgcgcc ggcaggtaattcttacctgg cgctctacgg atggaccacc aatcctctgg tggaatacta cgtggtggatagctggggca gctggcggcc gccgggtgcg cagtcggcag gtacagtgaa cagcgatggtggcacctacg acctgtacag aacccagaga gtcaaccagc cctccattca gggaactgccaccttctatc agtactggag tgtgcgcacg tctccgcgtc cccagggaac caacaacaatatcaccttcc agaatcacgt gaacgcctgg gcgtccaggg gctggaacct gggtacccataactatcagg tgatggccac cgaaggctac cagagcagcg gttcttccaa cgtgaccgtgtgggaatccg gaaccagcgg tggtggtggt ggtgccaccg gcggtggcgg tggcggcggtggtgctaccg gcggtggtgg tggcggtggc ggcggtggtg ctaccggcgg tggtggtcagcacaccatcg tggttcgcgc ccgcggcgtt cacggcagcg agcagatccg cctgcggatcaacaacaaca ccgtggcgac ctggactttg tcgaccaaca tgagcaacta cacctggagcggcaacaata ccgggggtat tgtcgtggag tttttcaacg acaacagcgt tcgcgatgtgcaggttgagc acattcaggt caacggtcag acccggcgcg cccaggatca gacctacaacacgggcgtct ggcaaaacaa ctcctgtggg ggttcccaca gtfcagtggct gcactgcaacggtgcgatcg gatttggcaa tatctag<210> 512<211> 368<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<22 0>

SIGNAL(1)...(27)

60120180240300360420480540600660720780840900960102010801107

<221><222><220><221><222>

te id =

DOMÍNIO(36) .. . (220)<223> Família 11 de glicosila hidrolases<220>

<221> SITE<222> (62)...(65)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (113) ... (123)

<223> Família 11 de glicosila hidrolases ativa site marca 1. ProsiPS00776<220>

<221> SITE

<222> (182)...(185)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (208)...(219)

<221> SITE<222> (220) . . . (223)<223> N-glicosilação<220>

<221> SITE<222> (286) . . . (289)<223> N-glicosilação

site. Prosite id = PS00001

site. Prosite id = PS00001<220>

<221> SITE

<222> (297)...(300)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (306)...(309)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (351)...(354)

<223> N-glicosilação site. Prosite id = PS00001<400> 512

Met Lys Phe Ser His Ile Arg Ser Leu Ser Leu Ala Leu Val Leu Cys1 5 10 15 Phe Thr Gly Phe 20 Gly Val Ser Thr Val 25 His Ala Gln Thr His 30 Cys GlySer Gln Thr 35 Gly Asn HiS Gly Gly 40 Phe Tyr Phe Thr His 45 Trp Thr AspGly Gly Gly Ser Ala Cys Met Thr Leu Gly Ser Gly Gly Asn Tyr Ser 50 55 60 Tyr Ser Trp Ser Asn Thr Gly Asn Phe Val Gly Gly Lys Gly Trp Ala65 70 75 80Thr Gly Thr Asn Asn Arg Val Ile Gly Tyr Asn Ala Gly Val Phe Ala 85 90 95 Pro Ala Gly Asn 100 Ser Tyr Leu Ala Leu 105 Tyr Gly Trp Thr Thr 110 Asn ProLeu Val Glu 115 Tyr Tyr Val Val Asp 120 Ser Trp Gly Ser Trp 125 Arg Pro ProGly Ala Gln Ser Ala Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asp 130 135 140 Leu Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Gln Gly Thr Ala145 150 155 160Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Pro Arg Pro Gln Gly 165 170 175 Thr Asn Asn Asn 180 Ile Thr Phe Gln Asn 185 His Val Asn Ala Trp 190 Ala SerArg Gly Trp 195 Asn Leu Gly Thr His 200 Asn Tyr Gln Val Met 205 Ala Thr GluGly Tyr 210 Gln Ser Ser Gly Ser 215 Ser Asn Val Thr Val 220 Trp Glu Ser GlyThr Ser Gly Gly Gly Gly Gly Ala Thr Gly Gly Gly Gly Gly Gly Gly225 230 235 240Gly Ala Thr Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Ala Thr Gly 245 250 255 Gly Gly Gly Gln 260 His Thr Ile Val Val 265 Arg Ala Arg Gly Val 270 His GlySer Glu Gln 275 Ile Arg Leu Arg Ile 280 Asn Asn Asn Thr Val 285 Ala Thr TrpThr Leu 290 Ser Thr Asn Met Ser 295 Asn Tyr Thr Trp Ser 300 Gly Asn Asn ThrGly Gly Ile Val Val Glu Phe Phe Asn Asp Asn Ser Val Arg Asp Val305 310 315 320Gln Val Glu His Ile 325 Gln Val Asn Gly Gln 330 Thr Arg Arg Ala Gln 335 AspGln Thr Tyr Asn Thr Gly Val Trp Gln Asn Asn Ser Cys Gly Gly Ser 340 345 350 His Ser Gln 355 Trp Leu His Cys Asn 360 Gly Ala Ile Gly Phe 365 Gly Asn Ile

<210> 513

<211> 1089

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 513

atgagatcaa aaagaatgat gtttttcttt ataatgctag tttcttttgc ccttgcattgcctgcagtaa acgtatcagc acaaattaca tcaaatgaaa ttggtgtcca cgacggatatgactatgaat tctggaaaga tgaaggtgga tctggaacga tgtatcttgg cagtggtggtacgtttagtg gggaatggaa tgatatacac aatatattat tccgcaaagg tcagaaatttgacgagacac aaacacatca gcaacttgga aacataacta ttgactacgg tgctgactaccagcctaatg gtagttccta tttaggggtc tatggctgga ctagtgaccc actagttgaatattatatta tagatagttg gggaacatgg cgtccacctg gtgcagatcc aaaaggtacgattcatgttg atggaggaac atacgaaata tacgaaacaa cgcgtgtaga gcagccatctattattggta ctgcaacatt ccaacagtat tggagtgtaa gaacatccaa gcgtactagtggaacaattt ctgttagtga gcactttaat gcttgggaaa gcatggggat gccgatggggaatatgtatg aagttgccac tgtagtagaa ggctggcaaa gtagtggata cgctgatgtctatagtaata cacttacgat cgatagttcc ggcggtggtg gaacacctcc tggagatggcggtggtggct ctaccgttgt acaagctgaa gatatgaaca ttagcggccc atgggcacaccaaatcagct ctccgtttga cggtgtcgtt ttgtatggaa acgatgatag ggtaagttacacccagtatt ttgcaaatga tacccatagc ttttcacttc gaggggcttc gaataacaacaacttggcga gagtcgactt aagaatcggt ggacaacaca tggggacatt ttactacggggatcaccacc cagcagtcta taccatagat aacattcagc atggcaccgg ccatcaggaagtggaactca tcttaactgc taatgatggt aactgggatg cttatatcga ttacttagagatacattaa<210> 514<211> 362<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1).. . (27)<220>

<221> DOMÍNIO<222> (35)...(222)

<223> Família 11 de glicosila hidrolases<220>

<221> SITE<222> (24)...(27)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (92)...(95)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (104)...(107)

<223> N-glicosilação site. Prosite id = PS00001<220>

120180240300360420480540600660720780840900960102010801089

<221><222>

SITE(118)

(128)

<223> Família 11 de glicosila hidrolases ativa site marca 1. PrositePS00776<220>

<221> SITE

<222> (256)...(259)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (290)...(293)

<223> N-glicosilação site. Prosite id = PS00001<400> 514

Met Arg Ser Lys Arg Met Met Phe Phe Phe Ile Met Leu Val Ser Phe1 5 10 15

Ala Leu Ala Leu Pro Ala Val Asn Val Ser Ala Gln Ile Thr Ser Asn

20 25 30

Glu Ile Gly Val His Asp Gly Tyr Asp Tyr Glu Phe Trp Lys Asp Glu

35 40 45

Gly Gly Ser Gly Thr Met Tyr Leu Gly Ser Gly Gly Thr Phe Ser Gly

50 55 60

Glu Trp Asn Asp Ile His Asn Ile Leu Phe Arg Lys Gly Gln Lys Phe65 70 75 80

id =Asp Glu Thr Gln Thr 85 His Gln Gln Leu Gly 90 Asn Ile Thr Ile Asp 95 TyrGly Ala Asp Tyr Gln Pro Asn Gly Ser Ser Tyr Leu Gly Val Tyr Gly 100 105 110 Trp Thr Ser 115 Asp Pro Leu Val Glu 120 Tyr Tyr Ile Ile Asp 125 Ser Trp GlyThr Trp Arg Pro Pro Gly Ala Asp Pro Lys Gly Thr Ile His Val Asp 130 135 140 Gly Gly Thr Tyr Glu Ile Tyr Glu Thr Thr Arg Val Glu Gln Pro Ser145 150 155 160Ile Ile Gly Thr Ala 165 Thr Phe Gln Gln Tyr 170 Trp Ser Val Arg Thr 175 SerLys Arg Thr Ser Gly Thr Ile Ser Val Ser Glu His Phe Asn Ala Trp 180 185 190 Glu Ser Met Gly Met Pro Met Gly Asn Met Tyr Glu Val Ala Thr Val 195 200 205 Val Glu Gly Trp Gln Ser Ser Gly Tyr Ala Asp Val Tyr Ser Asn Thr 210 215 220 Leu Thr Ile Asp Ser Ser Gly Gly Gly Gly Thr Pro Pro Gly Asp Gly225 230 235 240Gly Gly Gly Ser Thr 245 Val Val Gln Ala Glu 250 Asp Met Asn Ile Ser 255 GlyPro Trp Ala His 260 Gln Ile Ser Ser Pro 265 Phe Asp Gly Val Val 270 Leu TyrGly Asn Asp 275 Asp Arg Val Ser Tyr 280 Thr Gln Tyr Phe Ala 285 Asn Asp ThrHis Ser 290 Phe Ser Leu Arg Gly 295 Ala Ser Asn Asn Asn 300 Asn Leu Ala ArgVal Asp Leu Arg Ile Gly Gly Gln His Met Gly Thr Phe Tyr Tyr Gly305 310 315 320Asp His His Pro Ala 325 Val Tyr Thr Ile Asp 330 Asn Ile Gln His Gly 335 ThrGly His Gln Glu Val Glu Leu Ile Leu Thr Ala Asn Asp Gly Asn Trp 340 345 350

Asp Ala Tyr Ile Asp Tyr Leu Glu Ile His355 360

<210> 515<211> 1188<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 515

atgctacata ttcttcggaa accgattata gcagggttag ctttatctct cgtattctcaggtggtatgg ggagtgtctc agctcaagaa aatggacata aaggagtatt tggaaaagatcagaaaggca acggtaatgt tcaaccgcat gcatggcaag tgtcttctct tgctgaaagatatgagagcg ctttcgatat tggtgctgct gtagaacctt atcaattaaa cggaagacaaggtaaaattt taaagcatca ttataatagt attgttgctg aaaatgcgat gaagcctatttctcttcagc cccaagaagg acaatgggat tgggaagggg cggacaaaat tgttgagtttgctcgcaaaa atgatatgaa tctacgtttt cacacacttg tctggcataa tcaagtaccggattggtttt tccttgatga gaatggaaat ccgatggtag atgaaacaga tgatgagaaaagggagacaa ataaagccct tttattagag cgcatgaaaa cacatataaa aacggttgtagagcgttata aggatgatgt ggattcttgg gatgtagtaa atgaagtgat cgatgataatggaggcttac gaaattcatc ttggtatcag attactggta ccgattatat taaagtagcatttgagactg ctagaaaata tgctggagaa gatgcaaaac tttacatcaa tgactacâatacggaagtac catcaaaaag ggatgaccta cacaaccttg ttagtcaatt gttagatcaaggagttccga ttgatggagt aggacatcag gcacatattc aaattgactg gccttcaatagaagaaacaa gagagtcttt tgaaatgttt acggaactag gattggacaa tcaagtaacagaactcgatg taagtctata cggctggccg ccagataacg cgtatgaaac gtatgatgatatcccagcag aagattttga gcggcaagct gttcgttacg atcagttgtt tgagttatatgaagagttgg aagcggacat cagcagtgtc acattctggg gcatagctga taatcatacttggttggatg accgagccga gcaatatagt ggagtcggaa ttgatgcacc gtttttattcgacgaaaatt acagagtgaa acctgcgttc tggaaggtaa ttgattaa<210> 516<211> 395<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(28)<220>

<221> DOMÍNIO<222> (56)...(395)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (208)...(211)

<223> N-glicòsilação site. Prosite id = PS00001<220>

<221> SITE

<222> (298) ... (308)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<220>

<221> SITE

<222> (363)...(366)

<223> N-glicosilação site. Prosite id = PS00001<400> 516

Met Leu His Ile Leu Arg Lys Pro Ile Ile Ala Gly Leu Ala Leu Ser

1 5 10 15 Leu Val Phe Ser 20 Gly Gly Met Gly Ser 25 Val Ser Ala Gln Glu 30 Asn GlyHis Lys Gly Val Phe Gly Lys Asp Gln Lys Gly Asn Gly Asn Val Gln 35 40 45 Pro His 50 Ala Trp Gln Val Ser 55 Ser Leu Ala Glu Arg 60 Tyr Glu Ser AlaPhe Asp Ile Gly Ala Ala Val Glu Pro Tyr Gln Leu Asn Gly Arg Gln65 70 75 80Gly Lys Ile Leu Lys His His Tyr Asn Ser Ile Val Ala Glu Asn Ala 85 90 95 Met Lys Pro Ile Ser Leu Gln Pro Gln Glu Gly Gln Trp Asp Trp Glu 100 105 110 Gly Ala Asp Lys Ile Val Glu Phe Ala Arg Lys Asn Asp Met Asn Leu 115 120 125 Arg Phe His Thr Leu Val Trp His Asn Gln Val Pro Asp Trp Phe Phe 130 135 140 Leu Asp Glu Asn Gly Asn Pro Met Val Asp Glu Thr Asp Asp Glu Lys145 150 155 160Arg Glu Thr Asn Lys Ala Leu Leu Leu Glu Arg Met Lys Thr His Ile 165 170 175 Lys Thr Val Val Glu Arg Tyr Lys Asp Asp Val Asp Ser Trp Asp Val 180 185 190 Val Asn Glu Val Ile Asp Asp Asn Gly Gly Leu Arg Asn Ser Ser Trp 195 200 205 Tyr Gln Ile Thr Gly Thr Asp Tyr Ile Lys Val Ala Phe Glu Thr Ala 210 215 220 Arg Lys Tyr Ala Gly Glu Asp Ala Lys Leu Tyr Ile Asn Asp Tyr Asn225 230 235 240Thr Glu Val Pro Ser 245 Lys Arg Asp Asp Leu 250 His Asn Leu Val Ser 255 GlnLeu Leu Asp Gln Gly Val Pro Ile Asp Gly Val Gly His Gln Ala His 260 265 270 Ile Gln Ile 275 Asp Trp Pro Ser Ile 280 Glu Glu Thr Arg Glu 285 Ser Phe GluMet Phe 290 Thr Glu Leu Gly Leu 295 Asp Asn Gln Val Thr 300 Glu Leu Asp ValSer Leu Tyr Gly Trp Pro Pro Asp Asn Ala Tyr Glu Thr Tyr Asp Asp305 310 315 320Ile Pro Ala Glu Asp 325 Phe Glu Arg Gln Ala 330 Val Arg Tyr Asp Gln 335 LeuPhe Glu Leu Tyr 340 Glu Glu Leu Glu Ala 345 Asp Ile Ser Ser Val 350 Thr PheTrp Gly Ile Ala Asp Asn His Thr Trp Leu Asp Asp Arg Ala Glu Gln355

Tyr Ser Gly Val370

Arg Val Lys Pro385

360

Gly Ile Asp Ala Pro Phe Leu Phe

365

Asp Glu Asn Tyr

375

Ala Phe Trp Lys Val Ile Asp

380

390

395

<210> 517<211> 1728<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 517

atgagtttct tcaaaaccat aacgagaaac agtaaaacct gtgccgcgac attggcgttg

gcggcaacgg tgagtgcagt ttcagcaaac gctcagcaaa ccctgaccga aaacacccag

actacccgcg acggcttttt tgtgtccttc tggaaggaca gcggcagcgc ctccatgacg

ctgtacgaca acggtcgcta tacctcccag tggaacaact ccaccaacaa ctgggtcggc

ggtatgggct ggaaccccgg aggtcgccgg gtggtggaat atgaggggga gtacaatgtt

gacaactccc agaactccta cctggcgctg tacggctgga cgcgtgatcc gctgattgaa

tactacgtga tcgaaagcta tggctcctac aacccgtcgc agtgtacaac gggacgccaa

acctacggca ccttccagag tgacggcgcg acttatgaga tcgtccgttg tcagcgtgtg

cagcagccct cgattgatgg cacccagacc ttctatcagt acttcagtgt gcgtcagccc

aaaaaaggtt ttggcagcat cagcggtacc attaccgtgg gcaatcactt tgatgcctgg

gaagccgccg gtttgaacct gggtaaccac gactatatgg tcatggccac cgagggctac

cagagcagcg gtagctcgga tattacggtt cgggaagtca gcggtggcgg cagccccggt

ggtccgggca cgggtggccc cggtggtggc gatagctctc ccggcacggg cgacaacacc

ctggtgattc gagcggtggg cacctcgggc agtgagcagc tgcgtgtcaa tgtgggcggt

agtacggtgc gtacgctgag tttgtccacc agctggcagg actttaccgt caacaccgac

gccacgggcg atatcaatgt ggagctgttc aacgatcagg gcgagggtta cgaagctcag

gtcgagtatg tgcaggtcaa cggcgatacc cgctacgcgg aagaccagag ctacaácacc

agtgcctggg acggcgagtg tggcggtggt agcaatacca tgtggatgca ctgtgatggc

atgatcggct ttggcgatat gaccggtgga ggctctacgg gtggtggcga ctctggtggc

agtgatggcg ggtcttcggg ctcgggcgat aacactctgg tgattcgtgc tgtaggcacc

tccgggagtg agcagctgcg ggtgaatgtg ggtggtacta ccatcgagac cctgagtctg

tcgagcagct ggcagagttt cacgatcaat accgatgcca caggcgatat caacgttgaactgttcaacg atcagggcga aggttacgaa gcceaggttg agtacgtcca ggtcaacggc

gatacccgct atgcagaaga ccagagctac aacaccagtg cctgggatgg agagtgcggc

ggtggtagca acaccatgtg gatgcactgt gacggcatga tcggctttgg tgatatgaca

ggtaacggtg gtggctcaac cggcggtggt aatggcggta acaccggtgg cgattctgcc

ggcaacaaca gcggtagcga tgactgccac tgcaactggt acggcagcac catccccagttgtgccaacc agagtgaagg ttggggctgg gaaaataaca ccagctgtgt gggcaacaat

acctgcaaca gtcagggtag ccagcatggt ggtgtggtct gtaactga<210> 518<211> 575<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL

<222> (1) . . . (31)<220>

<221> DOMÍNIO

<222> (41)...(230)

<223> Família 11 de glicosila hidrolases

<220>

<221> SITE

<222> (73)... (76)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (118)...(128)

<223> Família 11 de glicosila hidrolases ativa site marca 1. ProsiPS00776<220>

<221> SITE

<222> (218)...(229)

601201802403003604204805406006607207808409009601020108011401200126013201380144015001560162016801728<223> Família 11 de glicosila hidrolases ativa site marca 2. Prosite idPS00777<220>

<221> SITE

<222> (344)...(347)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (478)...(481)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (530)...(533)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (551)...(554)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (560) ... (563)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (567)... (570)

<223> N-glicosilação site. Prosite id = PS00001 <400> 518 Met Ser Phe Phe Lys Thr Ile Thr Arg Asn Ser Lys Thr Cys Ala Ala1 5 10 15Thr Leu Ala Leu Ala Ala Thr Val Ser Ala Val Ser Ala Asn Ala Gln 20 25 30 Gln Thr Leu Thr Glu Asn Thr Gln Thr Thr Arg Asp Gly Phe Phe Val 35 40 45 Ser Phe Trp Lys Asp Ser Gly. Ser Ala Ser Met Thr Leu Tyr Asp Asn 50 55 60 Gly Arg Tyr Thr Ser Gln Trp Asn Asn Ser Thr Asn Asn Trp Val Gly65 70 75 80Gly Met Gly Trp Asn Pro Gly Gly Arg Arg Val Val Glu Tyr Glu Gly 85 90 95Glu Tyr Asn Val Asp Asn Ser Gln Asn Ser Tyr Leu Ala Leu Tyr Gly 100 105 110 Trp Thr Arg Asp Pro Leu Ile Glu Tyr Tyr Val Ile Glu Ser Tyr Gly 115 120 125 Ser Tyr Asn Pro Ser Gln Cys Thr Thr Gly Arg Gln Thr Tyr Gly Thr 130 135 140 Phe Gln Ser Asp Gly Ala Thr Tyr Glu Ile Val Arg Cys Gln Arg Val145 150 155 160Gln Gln Pro Ser Ile Asp Gly Thr Gln Thr Phe Tyr Gln Tyr Phe Ser 165 170 175Val Arg Gln Pro Lys Lys Gly Phe Gly Ser Ile Ser Gly Thr Ile Thr 180 185 190 Val Gly Asn His Phe Asp Ala Trp Glu Ala Ala Gly Leu Asn Leu Gly 195 200 205 Asn His Asp Tyr Met Val Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly 210 215 220 Ser Ser Asp Ile Thr Val Arg Glu Val Ser Gly Gly Gly Ser Pro Gly225 230 235 240Gly Pro Gly Thr Gly Gly Pro Gly Gly Gly Asp Ser Ser Pro Gly Thr 245 250 255Gly Asp Asn Thr Leu Val Ile Arg Ala Val Gly Thr Ser Gly Ser Glu 260 265 270 Gln Leu Arg Val Asn Val Gly Gly Ser Thr Val Arg Thr Leu Ser Leu 275 280 285 Ser Thr Ser Trp Gln Asp Phe Thr Val Asn Thr Asp Ala Thr Gly Asp 290 295 300 Ile Asn Val Glu Leu Phe Asn Asp Gln Gly Glu Gly Tyr Glu Ala Gln305 310 315 320Val Glu Tyr Val Gln Val Asn Gly Asp Thr Arg

325 330

Ser Tyr Asn Thr Ser Ala Trp Asp Gly Glu Cys

340 345

Thr Met Trp Met His Cys Asp Gly Met Ile Gly

355 360

Gly Gly Gly Ser Thr Gly Gly Gly Asp Ser Gly

370 375

Ser Ser Gly Ser Gly Asp Asn Thr Leu Val Ile385 390 395

Ser Gly Ser Glu Gln Leu Arg Val Asn Val Gly

405 410

Thr Leu Ser Leu Ser Ser Ser Trp Gln Ser Phe

420 425

Ala Thr Gly Asp Ile Asn Val Glu Leu Phe Asn

435 440

Tyr Glu Ala Gln Val Glu Tyr Val Gln Val Asn

450 455

Ala Glu Asp Gln Ser Tyr Asn Thr Ser Ala Trp465 470 475

Gly Gly Ser Asn Thr Met Trp Met His Cys Asp

485 490

Gly Asp Met Thr Gly Asn Gly Gly Gly Ser Thr

500 505

Gly Asn Thr Gly Gly Asp Ser Ala Gly Asn Asn

515 520

Cys His Cys Asn Trp Tyr Gly Ser Thr Ile Pro

530 535

Ser Glu Gly Trp Gly Trp Glu Asn Asn Thr Ser545 550 555

Thr Cys Asn Ser Gln Gly Ser Gln His Gly Gly565 570

<210> 519<211> 1473<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 519

atgagttttg caagcgtaaa aaatataact atcgcaggcaaccttcgcct tactgtcagg aatttcatcg gtcaatgcccgtccagggct ctgtggacgg ttttttctat tctttctggaatgacggttt accccggtgg tcgttacaca tcgcaatggagtgggtggtc tggggtggaa ccccggtggt cgcagggtggaatgtggata attcacagaa ctcgtatctc gcactgtacggtcgaatact acgtgatcga aagctacggt tcctataacccgccagactt acggcacctt ccagagtgat ggcgccacttcgtgtgcagc agccgtccat cgatggtact caaaccttttcagccaaagc tgggctttgg cagcgtcagc ggcaccatcagcctgggctt cggtggggct gaatctgggc aaccacgactggttatcaaa gcttcggcag ctccgacatt actgtcagcgggtggcggcg gtcctggtgc gggtggtccc ggctctggcagccgtgggca catccggcag tgagcaactg cgcgtcaacgacgttgagtc tgtccaccag ttggcaggac tataccgtcaatcaatgtcg agctgttcaa cgatcagggc cagggctacgattgtcaacg gcgacacccg ctatggtgcg gaccagagctggcgagtgcg gcggtggtag cttcaccatg tggatgcactggtgacatga ccggtggcgg cagtggtggt gggtccaacgggcaacaccc tggtggtgcg tgctgttggc acctccggcagtgggtggca atgctgtcga gaccttgagt ctgtccaccaaataccagcg cctcgggtga tgtcaatgtc cagttgatcagaagcgcgtg tcgagtacgt catcatcaac ggtgataccctataacacca gcgcctggga cggtgagtgt ggcggcggcatgcgaaggca tactcggttt tggtgatatg tag<210> 520<211> 490<212> PRT

Tyr Ala

Gly Gly

Phe Gly365Gly Ser380

Arg Ala

Gly Thr

Thr Ile

Asp Gln445Gly Asp460

Asp Gly

Gly Met

Gly Gly

Ser Gly525Ser Cys540

Cys ValVal Val

Glu Asp Gln

335Gly Ser Asn350

Asp Met Thr

Asp Gly Gly

Val Gly Thr400

Thr Ile Glu

415Asn Thr Asp430

Gly Glu Gly

Thr Arg Tyr

Glu Cys Gly480

Ile Gly Phe

495Gly Asn Gly510

Ser Asp Asp

Ala Asn Gln

Gly Asn Asn560

Cys Asn575

aagggttggtagacgacgctaggatagtggacaactcgtctgaattattcgttggacccgcgtccaactgacgagatcgtatcagtacttccgtgggcaaatcaggtgataaggagcagggcaatacacttcggcggcagataccaatgcaggcacaggtacaacaccaggtgacggcatgtggcggcggacgagcagttgttggcaggaacgaccaggggctacggcgcgcttcaccat

cgcgcttttcgacgtccaatggacgcgtcccaacaactggcggtcagtacggatccgctgcaccactggttcgctgtcagcagtgtgcgctcactttgatggcgaccgagcggcggccccggtggtgcgtctccgtggcatactggcgactgaatacgtgcgcctgggactcttggtttttgctccgggcgcaggtcaatatacaccatctgaaggctacggatcagagcgtggatgcac

60120180240300360420480540600660720780840900960102010801140120012601320138014401473<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220><221> SIGNAL

<222> (1)...(33)<220>

<221> DOMÍNIO<222> (43) ... (232)<223> Família 11 de glicosila hidrolases<220>

<221> SITE

<222> (8)...(11)

<223> N-glicosilação site. Prosite id = PS00001

<220>

<221> SITE<222> (75)...(78)

<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE

<222> (96) ... (99)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (120)...(130)

<223> Família 11 de glicosila hidrolases ativa site marca 1. Prosite id =PS00776<220>

<221> SITE

<222> (138)...(141)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (300). . . (303)<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (340) ... (343)

<223> N-glicosilação site. Prosite id = PS00001

<220>

<221> SITE

<222> (427)...(430)

<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE

<222> (469) . . . (472)

<223> N-glicosilação site. Prosite id = PS00001<400> 520

Met Ser Phe Ala Ser Val Lys Asn Ile Thr Ile Ala Gly Lys Gly Leu 1 5 10 15 Val Ala Leu Phe 20 Thr Phe Ala Leu Leu 25 Ser Gly Ile Ser Ser 30 Val Asn Ala Gln Thr 35 Thr Leu Thr Ser Asn 40 Val Gln Gly Ser Val 45 Asp Gly Phe Phe Tyr 50 Ser Phe Trp Lys Asp 55 Ser Gly Asp Ala Ser 60 Met Thr Val Tyr Pro Gly Gly Arg Tyr Thr Ser Gln Trp Asn Asn Ser Ser Asn Asn Trp 65 70 75 80 Val Gly Gly Leu Gly Trp Asn Pro Gly Gly Arg Arg Val Val Asn Tyr 85 90 95 Ser Gly Gln Tyr 100 Asn Val Asp Asn Ser 105 Gln Asn Ser Tyr Leu 110 Ala Leu Tyr Gly Trp 115 Thr Arg Asp Pro Leu 120 Val Glu Tyr Tyr Val 125 Ile Glu Ser Tyr Gly 130 Ser Tyr Asn Pro Ser 135 Asn Cys Thr Thr Gly 140 Arg Gln Thr Tyr Gly Thr Phe Gln Ser Asp Gly Ala Thr Tyr Glu Ile Val Arg Cys Gln145 150 155 160

Arg Val Gln Gln Pro Ser Ile Asp Gly Thr Gln Thr Phe Tyr Gln Tyr

165 170 175

Phe Ser Val Arg Gln Pro Lys Leu Gly Phe Gly Ser Val Ser Gly Thr180 185 190

Ile Thr Val Gly Asn His Phe Asp Ala Trp Ala Ser Val Gly Leu Asn

195 200 205

Leu Gly Asn His Asp Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser210 215 220

Phe Gly Ser Ser Asp Ile Thr Val Ser Glu Gly Ala Gly Gly Gly Pro225 230 235 240

Gly Gly Gly Gly Pro Gly Ala Gly Gly Pro Gly Ser Gly Ser Asn Thr

245 250 255

Leu Val Val Arg Ala Val Gly Thr Ser Gly Ser Glu Gln Leu Arg Val260 265 270

Asn Val Gly Gly Ser Ser Val Ala Thr Leu Ser Leu Ser Thr Ser Trp

275 280 285

Gln Asp Tyr Thr Val Asn Thr Asn Ala Thr Gly Asp Ile Asn Val Glu290 295 300

Leu Phe Asn Asp Gln Gly Gln Gly Tyr Glu Ala Gln Val Glu Tyr Val305 310 315 320

Ile Val Asn Gly Asp Thr Arg Tyr Gly Ala Asp Gln Ser Tyr Asn Thr

325 330 335

Ser Ala Trp Asp Gly Glu Cys Gly Gly Gly Ser Phe Thr Met Trp Met340 345 350

His Cys Asp Gly Ile Leu Gly Phe Gly Asp Met Thr Gly Gly Gly Ser

355 360 365

Gly Gly Gly Ser Asn Gly Gly Gly Gly Ala Pro Gly Gly Asn Thr Leu370 375 380

Val Val Arg Ala Val Gly Thr Ser Gly Asn Glu Gln Leu Gln Val Asn385 390 395 400

Val Gly Gly Asn Ala Val Glu Thr Leu Ser Leu Ser Thr Ser Trp Gln

405 410 415

Glu Tyr Thr Ile Asn Thr Ser Ala Ser Gly Asp Val Asn Val Gln Leu420 425 430

Ile Asn Asp Gln Gly Glu Gly Tyr Glu Ala Arg Val Glu Tyr Val Ile

435 440 445

Ile Asn Gly Asp Thr Arg Tyr Gly Ala Asp Gln Ser Tyr Asn Thr Ser450 455 460

Ala Trp Asp Gly Glu Cys Gly Gly Gly Ser Phe Thr Met Trp Met His465 470 475 480

Cys Glu Gly Ile Leu Gly Phe Gly Asp Met485 490

<210> 521

<211> 1155

<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 521

atgagctttt ctcgccgcag gtttatcctg agtgccacgg caatgttagc cgccacccaa 60

ttgaaatccc gagccctggc cgctgcggtt aagacgaccg gtatcaaaga cgtctttgag 120aaagactttt tcatcggtac ggccatcagc aacgaagccc ttcaggagcc caataccgcg 180ctgctggctt tgatcagtcg agaattcaac gccattaccg ctgaaaactg catgaagtgg 240gaagagatcc gccctcaact tgaccagtgg aactgggatt tagcagaccg ttttgttgac 300ttcggtctgc aaaacaagat gtacatcgtc ggccacacac tgatttggca tagccaagca 360cctgatcata tctatcttga tgcagacggc aaacgcaata atcgtctggc tcagctggag 420gtgatggagg agcatatcca gaccctcgcg ggccgctata aaggtaaaat cgatgcctgg 480gacgtggtca atgaggcggt ggaagacgat ggctcctggc gagaaaccgg ctggtaccac 540aatgtcggcc ctgaatacat cgcgcacgcc ttccgtatgg cggcggaggt agaccccaacgccaagctct tgtacaacga ttacaacgcc gctatgccga ccaagcggga agcgattatttctgtggtaa aaggggtaca acgcgaaggc gcgcccattc atggcgtggg catgcagggc 720cacatgagcc tgacgcaccc cgacttcggc gagttcgaaa agtctatcgt ggaatacgcc 780aacctgggcg tcaaagtgca catcacagag ttggacattg acgtgttgcc tttagcctgg 840gagctgagcg cagaaatctc taaccgcttc gagtaccgcc cagaaatgga cccctaccgcgacggtttgc ccgccgaggc agaaaaggcc ttggcggatc gctacgaagc cttatttacaatcctgatga aacaccgcga caagattgag cgcgtcacca cgtggggcac gcacgacggt 1020

600660

900960gagtcctggc tcaacggctt ccctatccct gggcgagtca actacccgct gctattcgac 1080cgagatatgc agcccaaaga ggcctatcac cgattgctgc agctccggca gcacagacgt 1140taccgccgtc tataa 1155

<210> 522<211> 384<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(28)<220>

<221> DOMÍNIO<222> (34)...(376)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (267)...(277)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 522

Met Ser Phe Ser Arg Arg Arg Phe Ile Leu Ser Ala Thr Ala Met Leu1 5 10 15 Ala Ala Thr Gln Leu Lys Ser Arg Ala Leu Ala Ala Ala Val Lys Thr 20 25 30 Thr Gly Ile Lys Asp Val Phe Glu Lys Asp Phe Phe Ile Gly Thr Ala 35 40 45 Ile Ser Asn Glu Ala Leu Gln Glu Pro Asn Thr Ala Leu Leu Ala Leu 50 55 60 Ile Ser Arg Glu Phe Asn Ala Ile Thr Ala Glu Asn Cys Met Lys Trp65 70 75 80Glu Glu Ile Arg Pro Gln Leu Asp Gln Trp Asn Trp Asp Leu Ala Asp 85 90 95 Arg Phe Val Asp Phe Gly Leu Gln Asn Lys Met Tyr Ile Val Gly His 100 105 110 Thr Leu Ile Trp His Ser Gln Ala Pro Asp His Ile Tyr Leu Asp Ala 115 120 125 Asp Gly Lys Arg Asn Asn Arg Leu Ala Gln Leu Glu Val Met Glu Glu 130 135 140 His Ile Gln Thr Leu Ala Gly Arg Tyr Lys Gly Lys Ile Asp Ala Trp145 150 155 160Asp Val Val Asn Glu Ala Val Glu Asp Asp Gly Ser Trp Arg Glu Thr 165 170 175 Gly Trp Tyr His Asn Val Gly Pro Glu Tyr Ile Ala His Ala Phe Arg 180 185 190 Met Ala Ala Glu Val Asp Pro Asn Ala Lys Leu Leu Tyr Asn Asp Tyr 195 200 205 Asn Ala Ala Met Pro Thr Lys Arg Glu Ala Ile Ile Ser Val Val Lys 210 215 220 Gly Val Gln Arg Glu Gly Ala Pro Ile His Gly Val Gly Met Gln Gly225 230 235 240His Met Ser Leu Thr His Pro Asp Phe Gly Glu Phe Glu Lys Ser Ile 245 250 255 Val Glu Tyr Ala Asn Leu Gly Val Lys Val His Ile Thr Glu Leu Asp 260 265 270 Ile Asp Val Leu Pro Leu Ala Trp Glu Leu Ser Ala Glu Ile Ser Asn 275 280 285 Arg Phe Glu Tyr Arg Pro Glu Met Asp Pro Tyr Arg Asp Gly Leu Pro 290 295 300 Ala Glu Ala Glu Lys Ala Leu Ala Asp Arg Tyr Glu Ala Leu Phe Thr305 310 315 320Ile Leu Met Lys His Arg Asp Lys Ile Glu Arg Val Thr Thr Trp Gly 325 330 335 Thr His Asp Gly Glu Ser Trp Leu Asn Gly Phe Pro Ile Pro Gly Arg 340 345 350 Val Asn Tyr Pro Leu Leu Phe Asp Arg Asp Met Gln Pro Lys Glu Ala 355 360 365Tyr His Arg Leu Leu Gln Leu Arg Gln His Arg Arg Tyr Arg Arg Leu

370 375 380

<210> 523<211> 1530<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 523

gtgaatctaa aaaataaact aacgctcaaa agctcaattg ctgcagcagc atgcgttgctgcgatgagct tttcgacggc gaacgcctgt accggcgtcc tcaacaacca aaacaacgctgtcggtactc acaacggtta ttattactcc ttctggaagc aaaccaacaa cagtcgcgtgaacattacct gtggagaacc cggctattat aggactgact ggaatggcgt attcaattgggtcggcggaa tgggctggaa tccaggtggg ccgagaatcg ttaattaccg cggcacattcaacagtggtc gcaatcggaa ctcgtcaaac tcttatctcg cactttacgg gtggactcgcgtcccaacag aagttgagta ttacgtagtc gagagttacg gtacctacaa tcccgcaagctgcggcggta gcggcggtgt tgctggcggt ggcggtagtg gggatggcca taaaggatccgtcacgatcg acggagtacg ttacaacttg acgcagtgca cacgaacgaa ccagccatcgatttctggaa cttccacatt taagcagttt ttcagcgtac gccaagaccc cctgccctggggcgaggttc aaggctccat cgacgtgggt gcccacttcc aagcctgggc tgatgccggcatgcaacttg gcaatgatca tttttacatg gtgctcgcca gtgagggtta tgatggtgggaataattcct ctggtaactc cgagctgtgg ataactgagg gctctggcgg tggtggtggtgggggcggtg gtggaggtgg aggtaaccca cctccaccgc caccgccgag ctgtggctctgtgggaggtg ttcccgtttg ctgtcatatc agtgcggacg ataatggtga cggcatgggtatgcaagacg gcgatgtgtg taccgtcacg caagatactg aaggctggca cccaccaaacccgtctgatg ttctggcagc cattaacgta ggtggtactg gaccagccgt gcagattggcaacatttact acgcgcccaa tacctacgtc accggaggta caccgaactc cacgacgtccactatcagtg gcagtaatag cgacgctcat aggtcagaga tctacggtga tttcaccgtctctgttccca tgagcaaccg acgtgtatcc gttgagctcg actttgttga attgtâctggaccgagccgg gccaacgctc tttcaacgtg tctatcgaag gtcaaaatgt tctttccaacgtggacatat tcgaccaggt tggcgccaac actctgtgga agcagacttt tgatgtgaacgtgaccggtg gtcaactgga catcgatatc actaccaaca gtgacaatgg aaccttgagcgcgatccttg tgcggccatc taccggcagc cccagttctt caagctcttc gagcagttcttcaagctctt ccagcagttc acccaccgcc ccgagcagct caccttcgag ttcatcttccggtggtggta atccgccgcc gcctgcgacc<210> 524<211> 510<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

SIGNAL(1)...(29)

<221><222><220><221><222><223><220><221><222>

DOMÍNIO(42

251)

Família 11 de glicosila hidrolases

Prosite id = PS00001

SITE

(56)...(59)<223> N-glicosilação site.<220>

<221> SITE<222> (61)...(64)

<223> N-glicosilação site. Prosite id = PS00001<220>

SITE(108)...(111)<223> N-glicosilação<220>

SITE

(171)...(174)<223> N-glicosilação<220>

<221> SITE

<222> (244)...(247)

<221><222>

site. Prosite id = PS00001

ão site. Prosite id = PS00001

601201802403003604204805406006607207808409009601020108011401200126013201380144015001530<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (361)...(364)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (415)...(418)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (446)...(449)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (463)...(466)

<223> N-glicosilação site. Prosite id = PS00001<400> 524

Met Asn Leu Lys Asn Lys Leu Thr Leu Lys Ser Ser Ile Ala Ala Ala1 5 10 15 Ala Cys Val Ala Ala Met Ser Phe Ser Thr Ala Asn Ala Cys Thr Gly 20 25 30 Val Leu Asn Asn Gln Asn Asn Ala Val Gly Thr His Asn Gly Tyr Tyr 35 40 45 Tyr Ser Phe Trp Lys Gln Thr Asn Asn Ser Arg Val Asn Ile Thr Cys 50 55 60 Gly Glu Pro Gly Tyr Tyr Arg Thr Asp Trp Asn Gly Val Phe Asn Trp65 70 75 80Val Gly Gly Met Gly Trp Asn Pro Gly Gly Pro Arg Ile Val Asn Tyr 85 90 95 Arg Gly Thr Phe Asn Ser Gly Arg Asn Arg Asn Ser Ser Asn Ser Tyr 100 105 110 Leu Ala Leu Tyr Gly Trp Thr Arg Val Pro Thr Glu Val Glu Tyr Tyr 115 120 125 Val Val Glu Ser Tyr Gly Thr Tyr Asn Pro Ala Ser Cys Gly Gly Ser 130 135 140 Gly Gly Val Ala Gly Gly Gly Gly Ser Gly Asp Gly His Lys Gly Ser145 150 155 160Val Thr Ile Asp Gly 165 Val Arg Tyr Asn Leu 170 Thr Gln Cys Thr Arg 175 ThrAsn Gln Pro Ser Ile Ser Gly Thr Ser Thr Phe Lys Gln Phe Phe Ser 180 185 190 Val Arg Gln 195 Asp Pro Leu Pro Trp 200 Gly Glu Val Gln Gly 205 Ser Ile AspVal Gly 210 Ala His Phe Gln Ala 215 Trp Ala Asp Ala Gly Met 220 Gln Leu GlyAsn Asp His Phe Tyr Met Val Leu Ala Ser Glu Gly Tyr Asp Gly Gly225 230 235 240Asn Asn Ser Ser Gly 245 Asn Ser Glu Leu Trp 250 Ile Thr Glu Gly Ser 255 GlyGly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Asn Pro Pro Pro 260 265 270 Pro Pro Pro 275 Pro Ser Cys Gly Ser 280 Val Gly Gly Val Pro 285 Val Cys CysHis Ile 290 Ser Ala Asp Asp Asn 295 Gly Asp Gly Met Gly Met 300 Gln Asp GlyAsp Val Cys Thr Val Thr Gln Asp Thr Glu Gly Trp His Pro Pro Asn305 310 315 320Pro Ser Asp Val Leu Ala Ala Ile Asn Val Gly Gly Thr Gly Pro Ala 325 330 335 Val Gln Ile Gly Asn Ile Tyr Tyr Ala Pro Asn Thr Tyr Val Thr Gly 340 345 350 Gly Thr Pro Asn Ser Thr Thr Ser Thr Ile Ser Gly Ser Asn Ser Asp 355 360 365 Ala His Arg Ser Glu Ile Tyr Gly Asp Phe Thr Val Ser Val Pro Met 370 375 380 Ser Asn Arg Arg Val Ser Val Glu Leu Asp Phe Val Glu Leu Tyr TrpVal Leu Ser

385

Thr Glu Pro

Asn Val Asp Ile Phe420

390

Gly Gln Arg Ser Phe405

395

Asn Val Ser Ile410

Asp Gln Val Gly425

400

Glu Gly Gln Asn415

Ala Asn Thr Leu430

Trp Lys Gln435

Asp Ile Thr450

Thr Phe Asp Val Asn440

Thr Asn Ser Asp Asn455

Thr Gly Ser Pro Ser470

Ser Ser Ser Ser Pro485

Val Thr Gly Gly

Gln Leu Asp Ile445

Gly Thr Leu Ser Ala460

Ser Ser Ser Ser Ser475

Thr Ala Pro Ser Ser490

Ala Ile Leu Val

Arg Pro Ser465

Ser Ser Ser

Ser Gly Gly Gly Asn500

Pro Pro Pro Pro Ala505

Ser Ser Ser480

Ser Pro Ser495

Thr510

<210> 525<211> 3048<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 525

atgaataaca gcaaggactt cttttacaaa gcccgcggat ttctgtcggc actgttgctt 60

ttagtgccga tagccgcaca cgccaataac aatccgctca tttctcatgt ctacaccgcc 120

gacccggcgg cgcgcgtgat cgacgaccgg gtctacgttc tggtcaccca cgaccaggaa 180

ggccagaccg gttacggtga actgcacgac tactacctgt tttcctccga tgacatggtc 240

aactggcagg atcacggtgt tgtctggaac tccagaaccg ataccacctg ggcaaacctg 300

gcgtttgcgc ccgactttat cgagcgcaac ggacgctact atctgtactt ccccgatggc 360

ggcaactcca ttggggtcgc ggtagccgat cagccggaag ggccttacac cgaccccctc 420

gggcacccgt tggtggaccg caacaccccc aacgccaacg tcgactgggt gtttgatccg 480

ggtgtgttta tcgacgacga cggccgcgcc tacctttact ttggcggcgg cggccccggc 540

actgcccggg tgatcgagct caacaacgac atgatcagca ccaatggcgc ggccattacc 600

ctggacgtgc cggacttttt cgaagcgctg tacatgaaca agcgcaacgg catctattac 660

ctgagctatt ccaccaaccc ggatgcgggc atgcacatcg actacatgac cagcgataac 720

cccaccagcg ggttccagca tcgcggcacc attetgccca acccctggga gaacaàcttc 780

aacaacaatc accagtcgat ggtggagtac gagggccagt ggtacatctt ctaccacaac 840

cgggcggtgt ccaatgagcg cagcggcaat acctacgagc gctcgatcaa tgccgatcgg 900

gtctattttg gcgctgacgg cgcgattctc cccgtcgatg ccggccccgc cggcgtgccc 960

caactgcgct acgtcgatgc ctttgcccag aacccggcag cgtctttttc cggcgagagc 1020

ggcattcaga ccgagccttc cagtgagggc ggtcagaacc tgatgatggg tgccggcaac 1080

tgggtgcgga tttccggtgt cgactttggc gacggtgcca caggcatgaa tgcgcgcctg 1140

gcagcggata tcgattccgg cctcgagatc tatctcaacg acatcgacag tcaacccatc 1200

gcgaccctga atgtcagtaa caccggtggc tggcagacct gggagaccca gtccgtctcc 1260

ttcgaccaag tgagcggcgt gcacgatgtt tacctgcgct cgaccgccgg ccacaacctg 1320

aactggtacc agtttaccgg tgcgggcaac ggcgactcgt ccagcagctc gagcagctca 1380

tccgagccgg accagagcgg caacgtcacc ggcagtatcc atgtcgacaa ccagtggagc 1440

gatggttatt gcgccacgct gacggtcacc aacaacaccg atgcggccct gacctggcag 1500

ctggatatca ccgttgaggg caccgtgacc agcctgtgga acggcgagtg gagtcaatcg 1560

ggctcgaccc tgcaagtctc cggtgtggcc tggaacagca ccctgggcgc cggacagagc 1620

gacgccagta tcggcttctg cgccgagtcc gccaatccgc cgggttcgtc cagctcgtcg 1680

agttcttcca gttcgtccag cagcagctcc agcagtacgc cggacaatgg cgaagagctg 1740

gcccgtaacg gcagccttac cgatggcctc acccactggt ccaccactgc cggggagatt 1800

gccctgagca cccaggtata ccgcagcggt aatgccagcg cccagatcac cggacgcacg 1860

gacacctggc acgggctcac ctttgctccg gcatccctgg ctcaaggggg cgactacgcc 1920

gtctcggtct gggtgcgcct ggctgccggt agcccggaca ccactcttta cctgaccgcc 1980

aagcgcgagg acgacggtga cccggacagc tttgccgagt acagccgggt ggcagaggtc 2040

agcgccaacg ccaacagctg ggtggaactc agcggcagct acacccagag cggcacgccc 2100

ttcgagcact ttattatcga atccgagagc gccacggtga gcttttacgc cgatgacttt 2160

tcggtggtgg gcgccgctgg cggcggcacc gggtgggacg ctatcgatca ccccttcttt 2220

gtgggtaaca tcaccaccct gggcgcggta cgcccggact ttgtggacta ctgggatcag 2280

atcaccccgg agaatgaagg caagtggggc agcgtcgagg gcacccgcgg cgtctacaac 2340

tgggccggac tggatgcggc ctaccagtac gcgcaggaac agggtattcc gttcaagcag 2400

cacaccctga tctggggcag tcagtacccc gcctggattg attcactcag cccggcggaa 2460

caggccgagg ccattgaagg ctggattcag gcctactgcg agcgctaccc gaataccgac 2520

atcatcgatg tggtcaacga gtcgacgccg ggacatgccc ccgccggcta tgcggaaagt 2580

gccttcggca gcgactggat cattcgcatg tttgagctga cccgccagta ttgccccgac 2640

tcaatcctgg tgctgaacga ctacaacgtg ctcagctggg ataacgaggc ctttatcgaa 2700atggcgcgcc cggcggtgga agccggcgtg gtggacgccc tgggcctgca ggcgcacgga 2760ctggaaaact ggtcgctgag cgagatcagc gccaacctgg accgggtggc ggccctgggc 2820ctgccgattt acatctcgga gtatgacatt gccgagacca acgatcaggc ccagctgcag 2880atcatgcaga cccagttccc gctgttctac gaacacccct cggtggtggg catcaccctg 2940tggggctatg tggtggatca gacctggctg gaaggcagtg gcctgatgta cccggacggc 3000accccccgcc cggccatgac ctggctgatg aactacctgg gccgctaa 3048

<210> 526<211> 1015<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL

<222> (1) . . . (28)<220>

<221> DOMÍNIO

<222> (29)...(309)

<223> Glycosyl hydrolases family 43<220>

<221> DOMÍNIO

<222> (332) ... (447)

<223> Carbohydrate binding module (family 6)<220>

<221> DOMÍNIO

<222> (469) . .. (566)

<223> Domínio de celulose obrigatória<220>

<221> DOMÍNIO

<222> (578)...(725)

<223> Domínio de carbohidrato<220>

<221> DOMÍNIO<222> (711) . ..(1013)<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (2)...(5)

<223> N-glicosilação site. Prosite id = PS00001

<220>

<221> SITE

<222> (410) . . . (413)

<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE

<222> (475) ... (478)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (498)...(501)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (540)...(543)<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (591)...(594)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (620) . . . (623)

<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE

<222> (754) . . . (757)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (859)...(862)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (894)...(908)

<223> Trp-Asp (WD) marca repetida. Prosite id = PS00678<220>

<221> SITE

<222> (937)...(940)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (954)...(964)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 526

Met Asn Asn Ser Lys Asp Phe Phe Tyr Lys Ala Arg Gly Phe Leu Ser1 5 10 15 Ala Leu Leu Leu 20 Leu Val Pro Ile Ala 25 Ala His Ala Asn Asn 30 Asn ProLeu Ile Ser 35 His Val Tyr Thr Ala 40 Asp Pro Ala Ala Arg 45 Val Ile AspAsp Arg 50 Val Tyr Val Leu Val 55 Thr His Asp Gln Glu 60 Gly Gln Thr GlyTyr Gly Glu Leu His Asp Tyr Tyr Leu Phe Ser Ser Asp Asp Met Val65 70 75 80Asn Trp Gln Asp His Gly Val Val Trp Asn Ser Arg Thr Asp Thr Thr 85 90 95 Trp Ala Asn Leu Ala Phe Ala Pro Asp Phe Ile Glu Arg Asn Gly Arg 100 105 110 Tyr Tyr Leu 115 Tyr Phe Pro Asp Gly 120 Gly Asn Ser Ile Gly 125 Val Ala ValAla Asp 130 Gln Pro Glu Gly Pro 135 Tyr Thr Asp Pro Leu 140 Gly His Pro LeuVal Asp Arg Asn Thr Pro Asn Ala Asn Val Asp Trp Val Phe Asp Pro145 150 155 160Gly Val Phe Ile Asp Asp Asp Gly Arg Ala Tyr Leu Tyr Phe Gly Gly 165 170 175 Gly Gly Pro Gly 180 Thr Ala Arg Val Ile 185 Glu Leu Asn Asn Asp 190 Met IleSer Thr Asn Gly Ala Ala Ile Thr Leu Asp Val Pro Asp Phe Phe Glu 195 200 205 Ala Leu 210 Tyr Met Asn Lys Arg 215 Asn Gly Ile Tyr Tyr 220 Leu Ser Tyr SerThr Asn Pro Asp Ala Gly Met His Ile Asp Tyr Met Thr Ser Asp Asn225 230 235 240Pro Thr Ser Gly Phe 245 Gln His Arg Gly Thr 250 Ile Leu Pro Asn Pro 255 TrpGlu Asn Asn Phe 260 Asn Asn Asn His Gln 265 Ser Met Val Glu Tyr 270 Glu GlyGln Trp Tyr 275 Ile Phe Tyr His Asn 280 Arg Ala Val Ser Asn 285 Glu Arg SerGly Asn Thr Tyr Glu Arg Ser Ile Asn Ala Asp Arg Val Tyr Phe Gly 290 295 300 Ala Asp Gly Ala Ile Leu Pro Val Asp Ala Gly Pro Ala Gly Val Pro305 310 315 320Gln Leu Arg Tyr Val Asp Ala Phe Ala Gln Asn Pro Ala Ala Ser Phe 325 330 335 Ser Gly Glu Ser Gly Ile Gln Thr Glu Pro Ser Ser Glu Gly Gly Gln 340 345 350 Asn Leu Met Met Gly Ala Gly Asn Trp Val Arg Ile Ser Gly Val Asp 355 360 365 Phe Gly Asp Gly Ala Thr Gly Met Asn Ala Arg Leu Ala Ala Asp Ile 370 375 380 Asp Ser Gly Leu Glu Ile Tyr Leu Asn Asp Ile Asp Ser Gln Pro Ile385 390 395 400Ala Thr Leu Asn Val Ser Asn Thr Gly Gly Trp Gln Thr Trp Glu Thr 405 410 415 Gln Ser Val Ser Phe Asp Gln Val Ser Gly Val His Asp Val Tyr Leu 420 425 430 Arg Ser Thr Ala Gly His Asn Leu Asn Trp Tyr Gln Phe Thr Gly Ala 435 440 445 Gly Asn Gly Asp Ser Ser Ser Ser Ser Ser Ser Ser Ser Glu Pro Asp 450 455 460 Gln Ser Gly Asn Val Thr Gly Ser Ile His Val Asp Asn Gln Trp Ser 465 470 475 480 Asp Gly Tyr Cys Ala Thr Leu Thr Val Thr Asn Asn Thr Asp Ala Ala 485 490 495 Leu Thr Trp Gln Leu Asp Ile Thr Val Glu Gly Thr Val Thr Ser Leu 500 505 510 Trp Asn Gly Glu Trp Ser Gln Ser Gly Ser Thr Leu Gln Val Ser Gly 515 520 525 Val Ala Trp Asn Ser Thr Leu Gly Ala Gly Gln Ser Asp Ala Ser Ile 530 535 540 Gly Phe Cys Ala Glu Ser Ala Asn Pro Pro Gly Ser Ser Ser Ser Ser 545 550 555 560 Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Thr Pro Asp Asn 565 570 575 Gly Glu Glu Leu Ala Arg Asn Gly Ser Leu Thr Asp Gly Leu Thr His 580 585 590 Trp Ser Thr Thr Ala Gly Glu Ile Ala Leu Ser Thr Gln Val Tyr Arg 595 600 605 Ser Gly Asn Ala Ser Ala Gln Ile Thr Gly Arg Thr Asp Thr Trp His 610 615 620 Gly Leu Thr Phe Ala Pro Ala Ser Leu Ala Gln Gly Gly Asp Tyr Ala 625 630 635 640 Val Ser Val Trp Val Arg Leu Ala Ala Gly Ser Pro Asp Thr Thr Leu 645 650 655 Tyr Leu Thr Ala Lys Arg Glu Asp Asp Gly Asp Pro Asp Ser Phe Ala 660 665 670 Glu Tyr Ser Arg Val Ala Glu Val Ser Ala Asn Ala Asn Ser Trp Val 675 680 685 Glu Leu Ser Gly Ser Tyr Thr Gln Ser Gly Thr Pro Phe Glu His Phe 690 695 700 Ile Ile Glu Ser Glu Ser Ala Thr Val Ser Phe Tyr Ala Asp Asp Phe 705 710 715 720 Ser Val Val Gly Ala Ala Gly Gly Gly Thr Gly Trp Asp Ala Ile Asp 725 730 735 His Pro Phe Phe Val Gly Asn Ile Thr Thr Leu Gly Ala Val Arg Pro 740 745 750 Asp Phe Val Asp Tyr Trp Asp Gln Ile Thr Pro Glu Asn Glu Gly Lys 755 760 765 Trp Gly Ser Val Glu Gly Thr Arg Gly Val Tyr Asn Trp Ala Gly Leu 770 775 780 Asp Ala Ala Tyr Gln Tyr Ala Gln Glu Gln Gly Ile Pro Phe Lys Gln 785 790 795 800 His Thr Leu Ile Trp Gly Ser Gln Tyr Pro Ala Trp Ile Asp Ser Leu 805 810 815 Ser Pro Ala Glu Gln Ala Glu Ala Ile Glu Gly Trp Ile Gln Ala Tyr 820 825 830 Cys Glu Arg Tyr Pro Asn Thr Asp Ile Ile Asp Val Val Asn Glu Ser 835 840 845 Thr Pro Gly His Ala Pro Ala Gly Tyr Ala Glu Ser Ala Phe Gly Ser 850 855 860 Asp Trp Ile Ile Arg Met Phe Glu Leu Thr Arg Gln Tyr Cys Pro Asp 865 870 875 880 Ser Ile Leu Val Leu Asn Asp Tyr Asn Val Leu Ser Trp Asp Asn Glu 885 890 895 Ala Phe Ile Glu Met Ala Arg Pro Ala Val Glu Ala Gly Val Val Asp 900 905 910 Ala Leu Gly Leu Gln Ala His Gly Leu Glu Asn Trp Ser Leu Ser Glu 915 920 925 Ile Ser Ala Asn Leu Asp Arg Val Ala Ala Leu Gly Leu Pro Ile Tyr930

935

940

Ile Ser Glu Tyr Asp Ile Ala Glu Thr Asn Asp Gln Ala Gln Leu Gln945 950 955 960Ile Met Gln Thr Gln Phe Pro Leu Phe Tyr Glu His Pro Ser Val Val 965 970 975Gly Ile Thr Leu Trp Gly Tyr Val Val Asp Gln Thr Trp Leu Glu Gly 980 985 990Ser Gly Leu Met Tyr Pro Asp Gly Thr Pro Arg Pro Ala Met Thr Trp

995 1000 1005

Leu Met Asn Tyr Leu Gly Arg

1010 1015

<210> 527<211> 1140<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 527

atgactgcta tttcccgccg caaattcctg ctcagttccg ctggcgccct ggcgctggcccagatgaagg tttccgccat tgccaaggcc ctggacgaca ccgggctcaa ggacgcctacaagaacgact ttctgatcgg caccgccatc agcaacggca ctctggcgaa caatgacacggcgctactga gtctgatcag ccgggagttc aatgccatca ctgcagaaaa ctgcatgaaatccggcctga ttcaaccctc ccaggggcag tgggagtggc agctggccga ccgctttatcgactttggca ccgagaacaa catgaccatt gtcggccacg ctctggtctg gcactcacaggcgccggggg atttcttctc caaccccgac ggcagccgta tctcccggga tgaactggtcaagcggatgg atactcatat ctccacgtta atggagcgct acaaggggcg tgttcacatttgggatgtgg tcaacgaggc cattgatgag gaccggggct ggcgccggag ccccttcttcgaaatcatgg ggccggagta catggagtac gccttccatc tggctcacga gctggaccccaccgcgcacc tgatttacaa cgactacaac atgcacgacc cggccaagcg ggagtttctcçagaacatca tcaaggatta ccgcaaccgc ggagtaccca tccacggggt tggcctgcaaggccacgtgg ggctggactg gccggatctg gaagaattcg aaaagagtat cgtcactcacgccgcagaag gtatgcggat ccatgtgaca gagatggacg tggacgtgct gccggtggcctgggagtaca tgggcgcgga gatctccacc gagttcgagt actcggacca gctcaacccatggagcgaaa aactgcccgc agaaatcgag gagaaactca ccgcccgcta cgtggagctgttccgtctct tcctgaaaca ccgggacaag atcgaccgca tcaccacctg gggtacgcacgatggcgaat cctggaaaaa cgatttcccg gtacgcggcc gcaccaacta cccgctgctgttcgatcgcg acctgcagcc caagcccgcc cacagggccc tgctgggcct gcccggctga<210> 528<211> 379<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1) ... (30)<220>

<221> DOMÍNIO<222> (35)...(378)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (52)...(55)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (58)...(61)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (108)...(111)<223> N-glicosilação<400> 528

Met Thr Ala Ile Ser Arg Arg Lys Phe Leu Leu Ser Ser Ala Gly Ala15 10 15

Leu Ala Leu Ala Gln Met Lys Val Ser Ala Ile Ala Lys Ala Leu Asp20 25 30

site. Prosite id = PS00001Asp Thr Gly Leu Lys Asp Ala Tyr Lys Asn Asp Phe Leu Ile Gly Thr

35 40 45

Ala Ile Ser Asn Gly Thr Leu Ala Asn Asn Asp Thr Ala Leu Leu Ser50 55 60

Leu Ile Ser Arg Glu Phe Asn Ala Ile Thr Ala Glu Asn Cys Met Lys65 70 75 80

Ser Gly Leu Ile Gln Pro Ser Gln Gly Gln Trp Glu Trp Gln Leu Ala

85 90 95

Asp Arg Phe Ile Asp Phe Gly Thr Glu Asn Asn Met Thr Ile Val Gly100 105 110

His Ala Leu Val Trp His Ser Gln Ala Pro Gly Asp Phe Phe Ser Asn

115 120 125

Pro Asp Gly Ser Arg Ile Ser Arg Asp Glu Leu Val Lys Arg Met Asp130 135 140

Thr His Ile Ser Thr Leu Met Glu Arg Tyr Lys Gly Arg Val His Ile145 150 155 160

Trp Asp Val Val Asn Glu Ala Ile Asp Glu Asp Arg Gly Trp Arg Arg

165 170 175

Ser Pro Phe Phe Glu Ile Met Gly Pro Glu Tyr Met Glu Tyr Ala Phe

180 185 190

His Leu Ala His Glu Leu Asp Pro Thr Ala His Leu Ile Tyr Asn Asp

195 200 205

Tyr Asn Met His Asp Pro Ala Lys Arg Glu Phe Leu Gln Asn Ile Ile210 215 220

Lys Asp Tyr Arg Asn Arg Gly Val Pro Ile His Gly Val Gly Leu Gln225 230 235 240

Gly His Val Gly Leu Asp Trp Pro Asp Leu Glu Glu Phe Glu Lys Ser

245 250 255

Ile Val Thr His Alá Ala Glu Gly Met Arg Ile His Val Thr Glu Met260 265 270

Asp Val Asp Val Leu Pro Val Ala Trp Glu Tyr Met Gly Ala Glu Ile

275 280 285

Ser Thr Glu Phe Glu Tyr Ser Asp Gln Leu Asn Pro Trp Ser Glu Lys290 295 300

Leu Pro Ala Glu Ile Glu Glu Lys Leu Thr Ala Arg Tyr Val Glu Leu305 310 315 320

Phe Arg Leu Phe Leu Lys His Arg Asp Lys Ile Asp Arg Ile Thr Thr

325 330 335

Trp Gly Thr His Asp Gly Glu Ser Trp Lys Asn Asp Phe Pro Val Arg340 345 350

Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Asp Leu Gln Pro Lys

355 360 365

Pro Ala His Arg Ala Leu Leu Gly Leu Pro Gly370 375

<210> 529<211> 696<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 529

atgaaacaca acgtgttctc tacccgcgcg cttcggcgcg ttctccctgg tggtctgctcatcgcaggcc tgatcggcgc cacggccact ggcctccagg cgcaaagcat cacttccaat 120caacaaggta cccacagtgg gtatttctat acctattgga aggattccgg aaacgtgacg 180atgaatctcg gttccggcgg aaactactcc gttaactgga gcttgccttc caatggcaac 240ttcgttggcg gtaaaggctg ggcgaccggc acttccaatc gtcgtatcgg ctacaatgcc 300ggggtctgga acccgaatgg caacggctat ctcaccctct acggatggac caccagcccg 3 60ctggtggaat actacgtggt ggacagttgg ggcagctggc gcccgcccgg tggctcctcc 42 0cagggcacgg tcaacagtga cggtggtacc tacgacctgt atcggaccca gcgggtcaac 480cagccttcga ttcagggaac ggcgaccttc taccaatact ggagcgtgcg cactgccaag 540cgcccgactg gaagcaatca ggtcatcacc ttcagcaatc acgtcaatgc ttggcgtaat 600cgcggctgga acctcggcaa tcataactat caggttatgg cgaccgaagg gtatggcagcagcggttcct ccaacttgac ggtgtggcaa cagtaa<210> 530<211> 231

<212> PRT<213> Desconhecido

660696<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1) . . .(34)<220>

<221> DOMÍNIO<222> (43) . . . (228)

<223> Família 11 de glicosila hidrolases<220>

<221> SITE<222> (58) . . . (61)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (69) ... (72)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (73)...(76)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (121). . . (131)

<221> SITE

<222> (216) . . . (227)

<223> Família 11 de glicosila hidrolases ativa site marca 2. Prosite id

PS00777

<220>

<221> SITE

<222> (228)...(231)

<223> N-glicosilação site. Prosite id = PS00001<400> 530

Met Lys His Asn Val Phe Ser Thr Arg Ala Leu Arg Arg Val Leu Pro1 5 10 15 Gly Gly Leu Leu Ile Ala Gly Leu Ile Gly Ala Thr Ala Thr Gly Leu 20 25 30 Gln Ala Gln 35 Ser Ile Thr Ser Asn 40 Gln Gln Gly Thr His 45 Ser Gly TyrPhe Tyr 50 Thr Tyr Trp Lys Asp 55 Ser Gly Asn Val Thr 60 Met Asn Leu GlySer Gly Gly Asn Tyr Ser Val Asn Trp Ser Leu Pro Ser Asn Gly Asn65 70 75 80Phe Val Gly Gly Lys 85 Gly Trp Ala Thr Gly 90 Thr Ser Asn Arg Arg 95 IleGly Tyr Asn Ala Gly Val Trp Asn Pro Asn Gly Asn Gly Tyr Leu Thr 100 105 110 Leu Tyr Gly 115 Trp Thr Thr Ser Pro 120 Leu Val Glu Tyr Tyr 125 Val Val AspSer Trp Gly Ser Trp Arg Pro Pro Gly Gly Ser Ser Gln Gly Thr Val 130 135 140 Asn Ser Asp Gly Gly Thr Tyr Asp Leu Tyr Arg Thr Gln Arg Val Asn145 150 155 160Gln Pro Ser Ile Gln 165 Gly Thr Ala Thr Phe 170 Tyr Gln Tyr Trp Ser 175 ValArg Thr Ala Lys Arg Pro Thr Gly Ser Asn Gln Val Ile Thr Phe Ser 180 185 190 Asn His Val Asn Ala Trp Arg Asn Arg Gly Trp Asn Leu Gly Asn His 195 200 205 Asn Tyr Gln Val Met Ala Thr Glu Gly Tyr Gly Ser Ser Gly Ser Ser 210 215 220 Asn Leu Thr Val Trp Gln Gln 225 230

<210> 531<211> 1548<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 531

gtgaaattaa caaataaaat aacgcttaaa ggctcgcttg cagcagctgc gtgtgttgctgccatgggct tttccacagc gaacgcgtgt accggcgcgc tcaacaatca gaacaacgcaataggcacgc acaacggctt ctattattcg ttttggaagc agttcgatgg caatagagtgaatattacct gcggagaacc cggctattat aggaccgaat ggagcaacgt ctttaactgggttggtggat tgggctggaa tccaggtggg ccgagaatcg ttaattacca aggcacattcaacagtggcc gcgcccggaa ctcatcaaac tcttatcttg cgctttacgg ttggactcgagttccgaatg aàgttgagta ttacgtcgtc gagagttacg gctcctacaa tcccgcaagctgcggcggta gcggcggtgt tgctggcggt ggcggtagtg gagatggcca taagggctccgtcacaatcg gcggagtggt ttacgacttg acgcaatgca cacgaacgaa ccagccatctatttctggaa cgtccacatt taggcagttt tttagtgtac gccgagaccc cctgccctggggtcagatcc aaggttccat cgacgtgggg gctcatttcc aagcctgggc tgacgctggcatgcagcttg gcactgatca tttctacatg gtgctcgcca ctgagggtta cgatggcaatagcaactcct ctggtaactc agagctgtgg ataagtgagg gcgccggcgg tggcggcactccgccgccac caagctgcgg ctctgtgggt ggtgttccgg tttgctgtca catcagcgccgacgagaatg gcgacggtat gggcatgcag aacggcgatg tatgtaccgt tacgcaagacaccgaaggct ggcatccacc aaacccgtct gacatcctgg cggcgattaa cgtaggcggtaccggtcctg cggtgcagtt caacaacgtt tactacgcac ctaataccta tgtcagcgatggcttgccac actccacaac cgcctccatc agcggcggta atagtgagat ttatcaaacggaaatgtacg gcgatatcag catctcgatt cccatggcca atcagcgcgt aaccgttgaactgggctttg tagaaatgta ttgggaagag ccgggccagc gttccttcaa cgtggcgctccagggccaaa acgttctgtc caacgttgac atatactctg aggtaggcgc caacactctgtacgcgccga cttttgacgt ggacgtaact ggcggtcgac tgaacattga catcaccactattagcgaca atggcacctt gagcgcagtt ctcgtgcgcc cgtatacgcc ttcaccagagccttcaccag agccacagcc atctccggaa ccacaaccat ctccggagcc gcaaccatctccggaaccgc aaccgtcaca agaaccgcaa cctcagccat caccggagca accacctgtgagcgccggcg gtggcatggg gcattggttc ctgatgttcc ctcgtgcc<210> 532<211> 516<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

SIGNAL(1) . . . (29)·

<221><222><220><221><222>

DOMÍNIO(42)...(247)<223> Família 11 de glicosila hidrolases<220>

<221> SITE<222> (61)...(64)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (108) . . . (Hl)

<223> N-glicosilação site. Prosite id = PS00001<220>

SITE

(245)...(248)<223> N-glicosilação site. Prosite id = PS00001<220>

SITE

(450)...(453)<223> N-glicosilação site. Prosite id = PS00001<400> 532

Met Lys Leu Thr Asn Lys Ile Thr Leu Lys Gly Ser Leu Ala1 5 10

Ala Cys Val Ala Ala Met Gly Phe Ser Thr Ala Asn Ala Cys

20 25 30

Ala Leu Asn Asn Gln Asn Asn Ala Ile Gly Thr His Asn Gly Phe Tyr

<221><222>

601201802403003604204805406006607207808409009601020108011401200126013201380144015001548

Ala Ala15

Thr GlyTyr Ser Phe Trp Lys Gln Phe Asp Gly Asn Arg Val Asn Ile Thr Cys 50 55 60 Gly Glu Pro Gly Tyr Tyr Arg Thr Glu Trp Ser Asn Val Phe Asn Trp65 70 75 80Val Gly Gly Leu Gly Trp Asn Pro Gly Gly Pro Arg Ile Val Asn Tyr 85 90 95 Gln Gly Thr Phe Asn Ser Gly Arg Ala Arg Asn Ser Ser Asn Ser Tyr 100 105 110 Leu Ala Leu 115 Tyr Gly Trp Thr Arg 120 Val Pro Asn Glu Val 125 Glu Tyr TyrVal Val 130 Glu Ser Tyr Gly Ser 135 Tyr Asn Pro Ala Ser 140 Cys Gly Gly SerGly Gly Val Ala Gly Gly Gly Gly Ser Gly Asp Gly His Lys Gly Ser145 150 155 160Val Thr Ile Gly Gly Val Val Tyr Asp Leu Thr Gln Cys Thr Arg Thr 165 170 175 Asn Gln Pro Ser 180 Ile Ser Gly Thr Ser 185 Thr Phe Arg Gln Phe 190 Phe SerVal Arg Arg 195 Asp Pro Leu Pro Trp 200 Gly Gln Ile Gln Gly 205 Ser Ile AspVal Gly Ala His Phe Gln Ala Trp Ala Asp Ala Gly Met Gln Leu Gly 210 215 220 Thr Asp His Phe Tyr Met Val Leu Ala Thr Glu Gly Tyr Asp Gly Asn 225 230 235 240Ser Asn Ser Ser Gly Asn Ser Glu Leu Trp Ile Ser Glu Gly Ala Gly 245 250 255 Gly Gly Gly Thr Pro Pro Pro Pro Ser Cys Gly Ser Val Gly Gly Val 260 265 270 Pro Val Cys 275 Cys His Ile Ser Ala 280 Asp Glu Asn Gly Asp 285 Gly Met GlyMet Gln Asn Gly Asp Val Cys Thr Val Thr Gln Asp Thr Glu Gly Trp 290 295 300 His Pro Pro Asn Pro Ser Asp Ile Leu Ala Ala Ile Asn Val Gly Gly 305 310 315 320Thr Gly Pro Ala Val Gln Phe Asn Asn Val Tyr Tyr Ala Pro Asn Thr 325 330 335 Tyr Val Ser Asp Gly Leu Pro His Ser Thr Thr Ala Ser Ile Ser Gly 340 345 350 Gly Asn Ser Glu Ile Tyr Gln Thr Glu Met Tyr Gly Asp Ile Ser Ile 355 360 365 Ser Ile 370 Pro Met Ala Asn Gln 375 Arg Val Thr Val Glu 380 Leu Gly Phe ValGlu Met Tyr Trp Glu Glu Pro Gly Gln Arg Ser Phe Asn Val Ala Leu385 390 395 400Gln Gly Gln Asn Val Leu Ser Asn Val Asp Ile Tyr Ser Glu Val Gly 405 410 415 Ala Asn Thr Leu Tyr Ala Pro Thr Phe Asp Val Asp Val Thr Gly Gly 420 425 430 Arg Leu Asn Ile Asp Ile Thr Thr Ile Ser Asp Asn Gly Thr Leu Ser 435 440 445 Ala Val 450 Leu Val Arg Pro Tyr 455 Thr Pro Ser Pro Glu 460 Pro Ser Pro GluPro Gln Pro Ser Pro Glu Pro Gln Pro Ser Pro Glu Pro Gln Pro Ser465 470 475 480Pro Glu Pro Gln Pro 485 Ser Gln Glu Pro Gln 490 Pro Gln Pro Ser Pro 495 GluGln Pro Pro Val Ser Ala Gly Gly Gly Met Gly His Trp Phe Leu Met 500 505 510

Phe Pro Arg Ala515

<210> 533<211> 1359<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 533agctcgtcgaggcagcctcaacccaggtaccatgggctcatgggtacgccgacgacggtggccaacagtttttattatcgggcgccgctgatcaccactcgagaatgaagctggatgctgatctggggcagccattgaaggtggtcaacgagcgactggagtgctgaacgccggcggtggtggtcgctgatacatctcggacccagttccgtggtggatcccggccatga

<210> 534<211> 452<212> PRT<213> Desconhecido<220><223> Obtido para amostra ambiental<220><221> DOMÍNIO<222> (15)...(162)<223> Domínio de carbohidrato<220><221> DOMÍNIO<222> (148)...(450)<223> Família 10 de hidrolase glicosila<220><221> SITE<222> (20)... (23)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (48)...(51)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (182) .. . (185) <223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (287)...(290)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (365) ... (368)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (382) . . . (392)<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 534

Ser Ser Ser Ser Ser Ser Ser Ser Ser Ala Pro Asp Asn Gly Glu Glu65 1 5 10 15

Leu Ala Arg Asn Gly Ser Leu Thr Asp Gly Leu Thr His Trp Ser Ile20 25 30

gcagcagctc cagcagtgcg ccggacaatgccgatggcct cacccactgg tcgatcactggtcgcagcgg taatgccagc gcccagatcacttttgcccc cgcgtccctg gcccaaggggtggctgccgg cagtccggcg accaccctttacccggacag ctttgccgag tacagccggggggtagcact cagcggcagc tacacccagaaatccgagag cgccacggtg agcttttacggcggcggcac çgggtgggac gctatcgatctgggcgcggt acgcccagac tttgtgacctgcaagtgggg cagcgtcgag ggcacccgcgcctaccagta cgcccaggaa cagggtattcgccagtaccc cgcctggatt gattcactcagctggattca ggcctactgc gagcgctaccagtcgacgcc gggacacgcc cccgccggcttcattcgcat gtttgagctg acccgccagtactacaatgt gctcagctgg gataaccaggaagccggcgt ggtggacgcc ctgggcctgcgcgagatcag cgccaacctg gaccgggtcgagtatgacat tgccgagacc aacgatcaggcgctgttcta tgaacaccct tcggtggtggagacctggct ggaaggcagt ggcctgatgtcctggctgat gaactacctg ggccgctaa

gcgaggagct ggcgcgcaat 60ccggggagat tgccctgagc 120ccggacgcac gagcacctgg 180gcgaatacgc ggtctcggtc 240acctgaccgc caagcgcgag 300tggcagaggt cagcgccaac 360gcggcacgcc cttcgagcac 420ccgatgactt ttcggtggtg 480atcccttctt tgtcggcaac 540actgggacca gatcaccccg 600gcgtctacaa ctgggccgga 660cgttcaaaca gcacaccctg 720gcccggcgga acaggccgag 780cgaataccga catcatcgat 840atgcggaaag tgccttcggc 900attgccccga ctcaatcctg 960cctttatcga catggcgcgc 1020aggcgcacgg actggaaaac 1080cggccctggg cctgccgatt 1140cccagctgca gatcatgcag 1200gcatcaccct gtggggctat 1260acccggacgg caccccccgc 1320 1359Thr Ala Gly Glu Ile Ala Leu Ser Thr Gln Val Arg Arg Ser Gly Asn

35 40 45

Ala Ser Ala Gln Ile Thr Gly Arg Thr Ser Thr Trp His Gly Leu Thr50 55 60

Phe Ala Pro Ala Ser Leu Ala Gln Gly Gly Glu Tyr Ala Val Ser Val65 70 75 80

Trp Val Arg Leu Ala Ala Gly Ser Pro Ala Thr Thr Leu Tyr Leu Thr

85 90 95

Ala Lys Arg Glu Asp Asp Gly Asp Pro Asp Ser Phe Ala Glu Tyr Ser

100 105 110

Arg Val Ala Glu Val Ser Ala Asn Ala Asn Ser Trp Val Ala Leu Ser

115 120 125

Gly Ser Tyr Thr Gln Ser Gly Thr Pro Phe Glu His Phe Ile Ile Glu130 135 140

Ser Glu Ser Ala Thr Val Ser Phe Tyr Ala Asp Asp Phe Ser Val Val145 150 155 160

Gly Ala Ala Gly Gly Gly Thr Gly Trp Asp Ala Ile Asp His Pro Phe

165 170 175

Phe Val Gly Asn Ile Thr Thr Leu Gly Ala Val Arg Pro Asp Phe Val 180 185 190

Thr Tyr Trp Asp Gln Ile Thr Pro Glu Asn Glu Gly Lys Trp Gly Ser195 200 205

Val Glu Gly Thr Arg Gly Val Tyr Asn Trp Ala Gly Leu Asp Ala Ala 210 215 220

Tyr Gln Tyr Ala Gln Glu Gln Gly Ile Pro Phe Lys Gln His Thr Leu225 230 235 240

Ile Trp Gly Ser Gln Tyr Pro Ala Trp Ile Asp Ser Leu Ser Pro Ala

245 250 255

Glu Gln Ala Glu Ala Ile Glu Gly Trp Ile Gln Ala Tyr Cys Glu Arg

260 265 270

Tyr Pro Asn Thr Asp Ile Ile Asp Val Val Asn Glu Ser Thr Pro Gly

275 280 285

His Ala Pro Ala Gly Tyr Ala Glu Ser Ala Phe Gly Ser Asp Trp Ile290 295 300

Ile Arg Met Phe Glu Leu Thr Arg Gln Tyr Cys Pro Asp Ser Ile Leu305 310 315 320

Val Leu Asn Asp Tyr Asn Val Leu Ser Trp Asp Asn Gln Ala Phe Ile

325 330 335

Asp Met Ala Arg Pro Ala Val Glu Ala Gly Val Val Asp Ala Leu Gly 340 345 350

Leu Gln Ala His Gly Leu Glu Asn Trp Ser Leu Ser Glu Ile Ser Ala

355 360 365

Asn Leu Asp Arg Val Ala Ala Leu Gly Leu Pro Ile Tyr Ile Ser Glu370 375 380

Tyr Asp Ile Ala Glu Thr Asn Asp Gln Ala Gln Leu Gln Ile Met Gln385 390 395 400

Thr Gln Phe Pro Leu Phe Tyr Glu His Pro Ser Val Val Gly Ile Thr

405 410 415

Leu Trp Gly Tyr Val Val Asp Gln Thr Trp Leu Glu Gly Ser Gly Leu 420 425 430

Met Tyr Pro Asp Gly Thr Pro Arg Pro Ala Met Thr Trp Leu Met Asn

435 440 445

Tyr Leu Gly Arg450

<210> 535<211> 1002<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 535

atggataata atacaaacac cccatcattg tttgaggtat atgaaaaata ttttccaattggggctgcag tgaatccaac aacacttaat tctgatcaag agttgctaaa gaaacacttt 120aaaagtatta cagctgaaaa tgaaatgaag tttgaaagat tacagcctaa agaaaatgaa 18065 tttacttttg agaaggcaga tgaaatgttt gcattcgcag aagctaatga aaaaattgta 240cgtggacata cacttgtttg gcacaaccaa acacctgact gggtttttga aaatgaagac 300ggctctcagg ttagtgagga aaaactacta gaaagaatgg aaaaccacat tacaactgtt 360atgagtcgat ataaagggcg aatttacagc tgggatgtgg ttaatgaagt tatatcagatcatgaaggtg aatttttaag acaatctaaa tggttggata ttctaggaga agattttattgcaaaggcat ttgaaatcgc tcacaaagta gatccagaag ctaaattatt ctataacgactataatgagt cgaatccgga aaaaagagaa aagatttata aattagttaa atctcttgttgataaaggcg ttccaattca tggtgtaggg ttacaagctc actggaattt atatcaacctagtattgaag atgtaagagt ggcaattgaa cgttacgcat ctctagggtt agaactgcaagttacagaat tagatgtatc tgtttttgac tgggaagaca aaaggacaga tttgacggaaccgacacaag aaatgttgga gcttcaagca caacgttatg atgaattttt taagttgcttagagaatatc atgaagtcat tacaagtgta acgttctggg gtgtgagtga caaatacacttggttaagta attttccagt tcagggaaga aaaaattggc cttttgtttt tgatgagaatcagaagccaa aagattcttt ttggaagctt gtaaacttat ag<210> 536<211> 333<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (9) ... (333)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (3)...(6)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (184) ... (187)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (239) . . . (249)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id -

<400> 536 Met Asp Asn Asn Thr Asn Thr Pro Ser Leu Phe Glu Val Tyr Glu Lys1 5 10 15 Tyr Phe Pro Ile Gly Ala Ala Val Asn Pro Thr Thr Leu Asn Ser Asp 20 25 30 Gln Glu Leu 35 Leu Lys Lys His Phe 40 Lys Ser Ile Thr Ala 45 Glu Asn GluMet Lys Phe Glu Arg Leu Gln Pro Lys Glu Asn Glu Phe Thr Phe Glu 50 55 60 ValLys Ala Asp Glu Met Phe Ala Phe Ala Glu Ala Asn Glu Lys Ile 65 70 75 Val 80Arg Gly His Thr Leu Val Trp His Asn Gln Thr Pro Asp Trp Phe 85 90 95 Glu Asn Glu Asp 100 Gly Ser Gln Val Ser 105 Glu Glu Lys Leu Leu 110 Glu ArgMet Glu Asn His Ile Thr Thr Val Met Ser Arg Tyr Lys Gly Arg Ile 115 120 125 Tyr Ser Trp Asp Val Val Asn Glu Val Ile Ser Asp His Glu Gly Glu 130 135 140 Phe Leu Arg Gln Ser Lys Trp Leu Asp Ile Leu Gly Glu Asp Phe Ile145 150 155 160Ala Lys Ala Phe Glu Ile Ala His Lys Val Asp Pro Glu Ala Lys Leu 165 170 175 Phe Tyr Asn Asp Tyr Asn Glu Ser Asn Pro Glu Lys Arg Glu Lys Ile 180 185 190 Tyr Lys Leu Val Lys Ser Leu Val Asp Lys Gly Val Pro Ile His Gly 195 200 205 Val Gly 210 Leu Gln Ala His Trp 215 Asn Leu Tyr Gln Pro 220 Ser Ile Glu AspVal Arg Val Ala Ile Glu Arg Tyr Ala Ser Leu Gly Leu Glu Leu Gln225 230 235 240Val Thr Glu Leu Asp 245 Val Ser Val Phe Asp 250 Trp Glu Asp Lys Arg 255 ThrAsp Leu Thr Glu Pro Thr Gln Glu Met Leu Glu Leu Gln Ala Gln Arg260 265 270

Tyr Asp Glu Phe Phe Lys Leu Leu Arg Glu Tyr His Glu Val Ile Thr

275 280 285

Ser Val Thr Phe Trp Gly Val Ser Asp Lys Tyr Thr Trp Leu Ser Asn

290 295 300

Phe Pro Val Gln Gly Arg Lys Asn Trp Pro Phe Val Phe Asp Glu Asn305 310 315 320

Gln Lys Pro Lys Asp Ser Phe Trp Lys Leu Val Asn Leu325 330

<210> 537

<211> 1137

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 537

atgccatccc gtcgtcagtt tttactcggt tcagcgcagg tcacaggcct gatgatgctcgccaagcatc aagctatcgc gagcgccgct caaaaaaccg gtcttgccga agtttacaaagacaacttct atataggcac ggccatatca accggcactt tgctcaataa caatgaggccatgcttaatt tgatcgcccg cgaatttaat gccattacgg ctgagaattg catgaaatggggggtgctca atcccgagcc gggtgtttgg ttgtgggatg cggcggatcg tatgatgagctatggtgaac agcacgacat gtgtatcgtg ggccattgtc tggtgtggca ttcacaggttccgggttggt tgttcaggga tgataagggg gggcaggtca gtgcagacga gctcaagcgtcgcatggaga gccatattca aaccctggcg ggccgctaca aaggcaaaat tcatatttgggatgtggtca atgaagcgat tgatgaggac aagggatggc gtaagagtcc ttggttcaatattctcggcc ccgaatttat ggagcgggcc ttccatctgg cccatgaagt ggatccagacagccatctga tttacaacga ttacaatatg cacaaccccg gcaagcgtaa gtttctgttcaacgtgcttg aggattacgt taagcgtggt gtgcctattc atggtgtggg aatgcagggccatgtggggt tggactatcc ggacatgacc gagtttgaaa ataccatgaa ggcttgtgctgatctgggtc ttgccttgca catcaccgaa ttggatgtgg atgtactgcc ggtggcctgggagcatatgg gggcggaaat ctccacgaac tttgcctaca gtgacgagct taacccctatgtggatggtt tgcccgacaa agtgcagcaa cagttgaccg accgctatgt gcagcttttcgagctgttcc tcaagtatga aaaacacatc gcccgtgtat ctacctgggg aactaccgacggtgagagct ggaaaaataa cttcccggta cgcggacgca ccaactatcc gctgttatttgatcgcgagg gtaaagccaa gccggcctat cacgccatca aggcactcaa gtcctga<210> 538<211> 378<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

SIGNAL(1) . .. (29)

<221><222><220><221><222>

60120180240300360420480540600660720780840900960102010801137

DOMÍNIO(34)...(377)<223> Família 10 de hidrolase glicosila<220>.<221> SITE<222> (267)...(277)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 538

Met Pro Ser Arg Arg Gln Phe Leu Leu Gly Ser Ala Gln Val Thr Gly1 5 10 15

Leu Met Met Leu Ala Lys His Gln Ala Ile Ala Ser Ala Ala Gln Lys

20 25 30

Thr Gly Leu Ala Glu Val Tyr Lys Asp Asn Phe Tyr Ile Gly Thr Ala

35 40 45

Ile Ser Thr Gly Thr Leu Leu Asn Asn Asn Glu Ala Met Leu Asn Leu

50 55 60

Ile Ala Arg Glu Phe Asn Ala Ile Thr Ala Glu Asn Cys Met Lys Trp65 70 75 80

Gly Val Leu Asn Pro Glu Pro Gly Val Trp Leu Trp Asp Ala Ala Asp

85 90 95

Arg Met Met Ser Tyr Gly Glu Gln His Asp Met Cys Ile Val Gly His100 105 110Cys Leu Val Trp His Ser Gln Val Pro Gly Trp Leu Phe Arg Asp Asp

115 120 125

Lys Gly Gly Gln Val Ser Ala Asp Glu Leu Lys Arg Arg Met Glu Ser130 135 140

His Ile Gln Thr Leu Ala Gly Arg Tyr Lys Gly Lys Ile His Ile Trp145 150 155 160

Asp Val Val Asn Glu Ala Ile Asp Glu Asp Lys Gly Trp Arg Lys Ser

165 170 175

Pro Trp Phe Asn Ile Leu Gly Pro Glu Phe Met Glu Arg Ala Phe His180 185 190

Leu Ala His Glu Val Asp Pro Asp Ser His Leu Ile Tyr Asn Asp Tyr

195 200 205

Asn Met His Asn Pro Gly Lys Arg Lys Phe Leu Phe Asn Val Leu Glu210 215 220

Asp Tyr Val Lys Arg Gly Val Pro Ile His Gly Val Gly Met Gln Gly225 230 235 240

His Val Gly Leu Asp Tyr Pro Asp Met Thr Glu Phe Glu Asn Thr Met

245 250 255

Lys Ala Cys Ala Asp Leu Gly Leu Ala Leu His Ile Thr Glu Leu Asp260 265 270

Val Asp Val Leu Pro Val Ala Trp Glu His Met Gly Ala Glu Ile Ser

275 280 285

Thr Asn Phe Ala Tyr Ser Asp Glu Leu Asn Pro Tyr Val Asp Gly Leu290 295 300

Pro Asp Lys Val Gln Gln Gln Leu Thr Asp Arg Tyr Val Gln Leu Phe305 310 315 320

Glu Leu Phe Leu Lys Tyr Glu Lys His Ile Ala Arg Val Ser Thr Trp

325 330 335

Gly Thr Thr Asp Gly Glu Ser Trp Lys Asn Asn Phe Pro Val Arg Gly340 345 350

Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Glu Gly Lys Ala Lys Pro

355 360 365

Ala Tyr His Ala Ile Lys Ala Leu Lys Ser370 375

<210> 539<211> 1092<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 539

atgaaaacat tacttaaaat aacattaagt acactgtttg cttttatcgt tttaatgggctgtgatatgg gactcagaga tgcagatgct gcatccgatg gagccgctgc ccgacaggtgaccgagaatc agcaaggaaa ccacgacgga tatttctttt cgttctggac cgacgcccccgggacggttt cgatgcagca ggggcctggt ggaaactaca gcaccagctg gacagacaccggcaactttg ttataggcaa aggatggagc acgggtagtc gacgcagtgt tgactacacagcaaccttta atccttcggg gaatgcctat ctgaccctgt atggctggac taccgatccgctggtcgagt actacataat cgagaactgg ggaacctatc gacccgatgg tgattataagggaacagtgt attctgacgg tgcaacatat gacatctatg aaacgacacg ctatcaacaaccctcgatcc agggcactca aacattccag caatactgga gcgttcgcca gtcgcgtcgatcaagtggta ctatcactgc cggcaaccac tttgatgcct gggaaagcca cggcatgcctttgggaaatc atgactacat gatcatggct accgaggggt accagagcag tgggaattccaatgtgacca tcggtactac cggcgacggt ggtggtggaa acggcggcag tggtggcaatggaggcagca gtggcgccat agacctgaat tcctggcagg cagatggaca gcatgaaaacctgaatgtct ggggcggcgc tgtcggcggt tggtcaaacg gtgactggat tcgttttgacaacgttgatg tgtccggcaa aaccaacctc aacttcaacc tggccaccac tatcaacggtactttccggg ttgtaatggg taactatcat ggtaccgaaa ttggccgact cgactactccccgaccggcg gctggaacaa ctataacaac cagtcagtaa acctgaatct gaatggtgccaccggcaatc agagcatcta tatcattgct tctggaggtg ccgccaatct cggtacactgacaatgcagt aa<210> 540<211> 363<212> PRT<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<220>

60120180240300360420480540600660720780840900960102010801092<221> SIGNAL<222> (1)...(28)<220>

<221> DOMÍNIO<222> (46)...(224)

<223> Família 11 de glicosila hidrolases<220>

<221> DOMÍNIO<222> (215)...(362)

<223> Carbohydrate binding module (family 6)<220>

<221> SITE<222> (73)...(76)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (121).. . (131)

<221> SITE

<222> (212)... (223)

<221> SITE

<222> (224)...(227)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (303)...(306)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (335)...(338)

<223> N-glicosilação site. Prosite id - PS00001<220>

<221> SITE

<222> (348)...(351)

<223> N-glicosilação site. Prosite id = PS00001<400> 540

Met Lys Thr Leu Leu Lys Ile Thr Leu Ser Thr Leu Phe Ala Phe Ile1 5 10 15 Val Leu Met Gly 20 Cys Asp Met Gly Leu 25 Arg Asp Ala Asp Ala 30 Ala SerAsp Gly Ala Ala Ala Arg Gln Val Thr Glu Asn Gln Gln Gly Asn His 35 40 45 Asp Gly Tyr Phe Phe Ser Phe Trp Thr Asp Ala Pro Gly Thr Val Ser 50 55 60 Met Gln Gln Gly Pro Gly Gly Asn Tyr Ser Thr Ser Trp Thr Asp Thr65 70 75 80Gly Asn Phe Val Ile Gly Lys Gly Trp Ser Thr Gly Ser Arg Arg Ser 85 90 95 Val Asp Tyr Thr Ala Thr Phe Asn Pro Ser Gly Asn Ala Tyr Leu Thr 100 105 110 Leu Tyr Gly Trp Thr Thr Asp Pro Leu Val Glu Tyr Tyr Ile Ile Glu 115 120 125 Asn Trp Gly Thr Tyr Arg Pro Asp Gly Asp Tyr Lys Gly Thr Val Tyr 130 135 140 Ser Asp Gly Ala Thr Tyr Asp Ile Tyr Glu Thr Thr Arg Tyr Gln Gln145 150 155 160Pro Ser Ile Gln Gly 165 Thr Gln Thr Phe Gln 170 Gln Tyr Trp Ser Val 175 ArgGln Ser Arg Arg 180 Ser Ser Gly Thr Ile 185 Thr Ala Gly Asn His 190 Phe AspAla Trp Glu Ser His Gly Met Pro Leu Gly Asn His Asp Tyr Met Ile 195 200 205Met Ala Thr Glu Gly Tyr Gln Ser Ser Gly Asn

210 215

Gly Thr Thr Gly Asp Gly Gly Gly Gly Asn Gly225 230 235

Gly Gly Ser Ser Gly Ala Ile Asp Leu Asn Ser

245 250

Gln His Glu Asn Leu Asn Val Trp Gly Gly Ala

260 265

Asn Gly Asp Trp Ile Arg Phe Asp Asn Val Asp

275 280

Asn Leu Asn Phe Asn Leu Ala Thr Thr Ile Asn

290 295

Val Met Gly Asn Tyr His Gly Thr Glu Ile Gly305 310 315

Pro Thr Gly Gly Trp Asn Asn Tyr Asn Asn Gln

325 330

Leu Asn Gly Ala Thr Gly Asn Gln Ser Ile Tyr

340 345

Gly Ala Ala Asn Leu Gly Thr Leu Thr Met Gln

355 360

<210> 541<211> 1155<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 541

ttgaaaagaa aaagtgttaa gttgtttttg gcgattctatccagcaggaa tggttagtgc acaaactgtt actagcaatttatgactatg aattttggaa ggacgctggc ggatctggaaggtacattta gcgcacagtg gagcggcatc aacaatatttttcgaccaaa cacaaacaca tcagcagctc ggtaacataatataatccga atggaaattc atacttatgt gtatacggttgagttttaca tcgtggatag ttggggcaac tggcgcccacacagttaccg ttgatggtgg cacgtacgat atttatgagatcgattattg gagataccac tttccaacaa tattggagtgagtggagtaa tctctgtaag cgaacacttt agagcgtgggggtagaatgt acgaagtggc acttacagta gaaggctggcgtaacgagaa atatccttac ggttggcggc ggctcgcaacgcagagttta atcctaacac tcagtaccga attatctcaagatgttgcgg gtaattcaac gacaaatggg gcaaacattcggaaataacc aacgatggtt tattcgacca gaggctaacggtaagcagcg ggaaggtact tgatgttgca gggagctcaccaacaatggg attggaataa caccggaaac caatggtggaggaagttatc gtatcacaaa cttccatagc ggaaaagctcaatggtgcaa acgttgagca aagagattgg aatagcagcagaacctgcaa actaa<210> 542<211> 384<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(27)<220>

<221> DOMÍNIO<222> (36)...(223)

<223> Família 11 de glicosila hidrolases<220>

DOMÍNIO(245)...(378)

Ricin-tipo beta-trefoil lectin domínio

Ser Asn220

Gly Ser

Trp Gln

Val Gly

Val Ser285Gly Thr300

Arg LeuSer ValIle Ile

Val Thr Ile

Gly Gly Asn240

Ala Asp Gly

255Gly Trp Ser270

Gly Lys Thr

Phe Arg Val

Asp Tyr Ser320

Asn Leu Asn

335Ala Ser Gly350

tttgcatctt gctgatatta 60caatcggtac acacggcggt 120ctatgacgct taatagtggt 180tattccgtaa aggtagaaag 240cgattgacta tgctgcaact 300ggacagttga tccacttgta 360caggagcaac agcaaaaggt 420caactcgagt gaaccaacct 480taagaagaac gaaacgtaca 540aacgtttagg aatgccaatg 600aaagtagcgg aagcgctaat 660ctgcacctac ccctccacct 720ggctaagcaa ccggtctctt 780aacaatgggc atatggagga 840gcacatatcg aatccaatct 900aagctagtgg tgcaaacgtt 960cgatcgcact acaaggtgat 1020ttcatacaac tggttccgat 1080ataaccagcg gtggacaatt 1140 1155

<221><222><223><220><221><222>

SITE(93) .

.·(96)<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (211)...(222)

<223> Família 11 de glicosila hidrolases ativa site marca 2. Prosite id

PS00777

<220>

<221> SITE

<222> (223)...(226)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (260)...(263)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (269)...(272)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (297)...(300)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (331)...(334)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (376)...(379)

<223> N-glicosilação site. Prosite id = PS00001<400> 542

Met Lys Arg Lys Ser Val Lys Leu Phe Leu Ala Ile Leu Phe Cys Ile1 5 10 15 Leu Leu Ile Leu 20 Pro Ala Gly Met Val 25 Ser Ala Gln Thr Val 30 Thr SerAsn Ser Ile 35 Gly Thr His Gly Gly 40 Tyr Asp Tyr Glu Phe 45 Trp Lys AspAla Gly 50 Gly Ser Gly Thr Met 55 Thr Leu Asn Ser Gly 60 Gly Thr Phe SerAla Gln Trp Ser Gly Ile Asn Asn Ile Leu Phe Arg Lys Gly Arg Lys65 70 75 80Phe Asp Gln Thr Gln Thr His Gln Gln Leu Gly Asn Ile Thr Ile Asp 85 90 95 Tyr Ala Ala Thr Tyr Asn Pro Asn Gly Asn Ser Tyr Leu Cys Val Tyr 100 105 110 Gly Trp Thr 115 Val Asp Pro Leu Val 120 Glu Phe Tyr Ile Val 125 Asp Ser TrpGly Asn 130 Trp Arg Pro Pro Gly 135 Ala Thr Ala Lys Gly 140 Thr Val Thr ValAsp Gly Gly Thr Tyr Asp Ile Tyr Glu Thr Thr Arg Val Asn Gln Pro145 150 155 160Ser Ile Ile Gly Asp Thr Thr Phe Gln Gln Tyr Trp Ser Val Arg Arg 165 170 175 Thr Lys Arg Thr Ser Gly Val Ile Ser Val Ser Glu His Phe Arg Ala 180 185 190 Trp Glu Arg Leu Gly Met Pro Met Gly Arg Met Tyr Glu Val Ala Leu 195 200 205 Thr Val Glu Gly Trp Gln Ser Ser Gly Ser Ala Asn Val Thr Arg Asn 210 215 220 Ile Leu Thr Val Gly Gly Gly Ser Gln Pro Ala Pro Thr Pro Pro Pro225 230 235 240Ala Glu Phe Asn Pro 245 Asn Thr Gln Tyr Arg 250 Ile Ile Ser Arg Leu 255 SerAsn Arg Ser Leu Asp Val Ala Gly Asn Ser Thr Thr Asn Gly Ala Asn 260 265 270 Ile Gln Gln 275 Trp Ala Tyr Gly Gly 280 Gly Asn Asn Gln Arg 285 Trp Phe IleArg Pro Glu Ala Asn Gly Thr Tyr Arg Ile Gln Ser Val Ser Ser Gly

290 295 300

Lys Val Leu Asp Val Ala Gly Ser Ser Gln Ala Ser Gly Ala Asn Val305 310 315 320

Gln Gln Trp Asp Trp Asn Asn Thr Gly Asn Gln Trp Trp Thr Ile Ala

325 330 335

Leu Gln Gly Asp Gly Ser Tyr Arg Ile Thr Asn Phe His Ser Gly Lys

340 345 350

Ala Leu His Thr Thr Gly Ser Asp Asn Gly Ala Asn Val Glu Gln Arg355 360 365

Asp Trp Asn Ser Ser Asn Asn Gln Arg Trp Thr Ile Glu Pro Ala Asn

370 375 380

<210> 543<211> 1014<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 543

atgggaaaca tttcgagttt cacaaaattg catgaagcat ttaaagatca ttttttaattggagctgcgg tgaatccgta tacattaact aagcaaagtg agttacttaa gcatcattttaatagtttaa cagctgaaaa tgaaatgaaa tttattagtt tacatcctac tgaagatcaatacacatttg aacatgccga.ccgcttattt gactttgcag aacaaaatgg aatggaagttagaggtcata cacttgtgtg gcataaccaa acatcaccat ggatgtttga aaatgctgacggaactacag tcgataaaga aacgctattg gctcgtatga aatcccatat tgaaacggtaatgagccgct ataaaggaag aatttatgcg tgggatgtag tgaatgaagc agtttctgataaaggagatg agtttcttcg tccttcaaaa tggcttgata tcgctggtga ggactttattagtaaagcat ttgaatatgc tcatgctgtt gacccagacg ctctactatt ttataacgactataatgagt cagttccaga aaaaagggaa aaaatttata agcttgttaa atcattgaaggaaaaaggag tgccaatcca cggtgttggt ttacaggcac attggaacct agagtctccgtctctggatt taattcggga ggcaattgaa agatatgcta gtcttggtat gaagctacatattacagaga tggatgtttc agtatttaac catgatgacc gtagaacgga tttaaaagaaccaactgcag agatgcttga gcttcaggca aaacgttatg gagagatgtt tggtctatttaaggaataca gtgagcatat cacttcagtt accctgtggg gagcagcaga tgactatacatggttaaaca attttccagt aagaggacga aaaaattggc catttccttt tgatgcagaacataatccga aaaaatctta ttttgaatta ataaacgttg caaactcaaa ataa<210> 544<211> 337<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO

<222> (9)...(334)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (3)...(6)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (90)... (93)

<223> N-glicosilação site. Prosite id = PS00001

<220>

<221> SITE

<222> (184) ... (187)

<223> N-glicosilação site. Prosite id = PS00001<400> 544

Met Gly Asn Ile Ser Ser Phe Thr Lys Leu His Glu Ala Phe Lys Asp1 5 10 15

His Phe Leu Ile Gly Ala Ala Val Asn Pro Tyr Thr Leu Thr Lys Gln

Ser Glu Leu Leu Lys His His Phe Asn Ser Leu Thr Ala Glu Asn Glu

35 40 45

Met Lys Phe Ile Ser Leu His Pro Thr Glu Asp Gln Tyr Thr Phe Glu50 55 60HiS Ala Asp Arg Leu Phe Asp Phe Ala Glu Gln Asn Gly Met Glu Val65 70 75 80Arg Gly His Thr Leu Val Trp His Asn Gln Thr Ser Pro Trp Met Phe 85 90 95 Glu Asn Ala Asp 100 Gly Thr Thr Val Asp 105 Lys Glu Thr Leu Leu 110 Ala ArgMet Lys Ser His Ile Glu Thr Val Met Ser Arg Tyr Lys Gly Arg Ile 115 120 125 Tyr Ala Trp Asp Val Val Asn Glu Ala Val Ser Asp Lys Gly Asp Glu 130 135 140 Phe Leu Arg Pro Ser Lys Trp Leu Asp Ile Ala Gly Glu Asp Phe Ile145 150 155 160Ser Lys Ala Phe Glu Tyr Ala His Ala Val Asp Pro Asp Ala Leu Leu 165 170 175 Phe Tyr Asn Asp Tyr Asn Glu Ser Val Pro Glu Lys Arg Glu Lys Ile 180 185 190 Tyr Lys Leu Val Lys Ser Leu Lys Glu Lys Gly Val Pro Ile His Gly 195 200 205 Val Gly 210 Leu Gln Alá His Trp 215 Asn Leu Glu Ser Pro 220 Ser Leu Asp LeuIle Arg Glu Ala Ile Glu Arg Tyr Ala Ser Leu Gly Met Lys Leu His225 230 235 240Ile Thr Glu Met Asp 245 Val Ser Val Phe Asn 250 His Asp Asp Arg Arg 255 ThrAsp Leu Lys Glu Pro Thr Ala Glu Met Leu Glu Leu Gln Ala Lys Arg 260 265 270 Tyr Gly Glu Met Phe Gly Leu Phe Lys Glu Tyr Ser Glu His Ile Thr 275 280 285 Ser Val 290 Thr Leu Trp Gly Ala 295 Ala Asp Asp Tyr Thr 300 Trp Leu Asn AsnPhe Pro Val Arg Gly Arg Lys Asn Trp Pro Phe Pro Phe Asp Ala Glu305 310 315 320His Asn Pro Lys Lys 325 Ser Tyr Phe Glu Leu 330 Ile Asn Val Ala Asn 335 Ser

Lys

<210> 545<211> 1143<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 545

atgaataaaa catttagatt accaatcatt ttaatgggca tcctgctcac gttttcgtcagcacgctgct caactcctga acctacggat tctcttagtg aggccttcga tggaatattttacataggca ctgcaatgaa cgagcggcag ataaggggaa cagataccag gggtgtcgaagtgatcctta agcattttaa ctccatagtt gctgaaaacc atatgaaaag cggattgttacaaccagaag aaggtgtatt tgattttgaa cttgccgaca aatttgttga gtttggtgaaaagcataaca agcagattat aggccacacc cttatttggc actcacaggc acccaggtggttctttgtag atgacgatgg aaacgatgta tcacgcgagg tattgattga aaggatgcgcacccatatcc atgccgttgc aggccgctac aaaggccgga tacatggatg ggatgtggtaaacgaagcca ttgttgatga tggttcatgg cgcaacagta aattctatca gatactgggagaagagtttg tcgaactggc attccgtttt gcccatgaag ctgatcccca cgctgagttgtattacaacg actatagcat ggcgcttcca ggccgccgcc agggagttat tgatatggtaaagaacctgc aggccaaagg tgtaaagatt gatggtattg gtatgcàggg tcatgtaaacgtcgatccta attctccttc tattgaagat tttgagaaaa gcattgttgc atttgctgaccttggggtta cagtgatgat caccgaaatg gatgtaactg tgattccatg gcccggacaaagggtaactg cagaagtatc tctcaacatt gagtacaacc gtgatctcaa tccttatcccgatggtattt cagaggaaac tgatcagaaa cttcatgacc gttatcttga tttcttcaaactattcctca agcaccagga caagatatca cgtgttaccg tttggggtgt aagcgatggagactcatggc gaaataactg gcccgttcgc ggacgtaccg attatcctct tctgtttgatcgtgaccacc aacccaaacc ggtggtgcaa tcacttataa atgaagcatt acgtaacagataa

<210> 546<211> 380<212> PRT

<213> Desconhecido<220>

601201802403003604204805406006607207808409009601020108011401143<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (31)...(376)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (2) . . . (5)

<223> N-glicosilação site. Prosite id = PS00001<400> 546

Met Asn Lys Thr Phe Arg Leu Pro Ile Ile Leu Met Gly Ile Leu Leu1 5 10 15 Thr Phe Ser Ser 20 Ala Arg Cys Ser Thr 25 Pro Glu Pro Thr Asp 30 Ser LeuSer Glu Ala 35 Phe Asp Gly Ile Phe 40 Tyr Ile Gly Thr Ala 45 Met Asn GluArg Gln Ile Arg Gly Thr Asp Thr Arg Gly Val Glu Val Ile Leu Lys 50 55 60 His Phe Asn Ser Ile Val Ala Glu Asn His Met Lys Ser Gly Leu Leu65 70 75 80Gln Pro Glu Glu Gly Val Phe Asp Phe Glu Leu Ala Asp Lys Phe Val 85 90 95 Glu Phe Gly Glu Lys His Asn Lys Gln Ile Ile Gly His Thr Leu Ile 100 105 110 Trp His Ser Gln Ala Pro Arg Trp Phe Phe Val Asp Asp Asp Gly Asn 115 120 125 HisAsp Val Ser Arg Glu Val Leu Ile Glu Arg Met Arg Thr His Ile 130 135 140 ValAla Val Ala Gly Arg Tyr Lys Gly Arg Ile His Gly Trp Asp Val 145 150 155 Phe 175 160Asn Glu Ala Ile Val 165 Asp Asp Gly Ser Trp 170 Arg Asn Ser Lys TyrGln Ile Leu Gly Glu Glu Phe Val Glu Leu Ala Phe Arg Phe Ala His 180 185 190 Glu Ala Asp 195 Pro His Ala Glu Leu 200 Tyr Tyr Asn Asp Tyr 205 Ser Met AlaLeu Pro Gly Arg Arg Gln Gly Val Ile Asp Met Val Lys Asn Leu Gln 210 215 220 Ala Lys Gly Val Lys Ile Asp Gly Ile Gly Met Gln Gly His Val Asn225 230 235 240Val Asp Pro Asn Ser Pro Ser Ile Glu Asp Phe Glu Lys Ser Ile Val 245 250 255 ValAla Phe Ala Asp Leu Gly Val Thr Val Met Ile Thr Glu Met Asp 260 265 270 Thr Val Ile 275 Pro Trp Pro Gly Gln 280 Arg Val Thr Ala Glu 285 Val Ser LeuAsn Ile Glu Tyr Asn Arg Asp Leu Asn Pro Tyr Pro Asp Gly Ile Ser 290 295 300 Glu Glu Thr Asp Gln Lys Leu His Asp Arg Tyr Leu Asp Phe Phe Lys305 310 315 320Leu Phe Leu Lys His Gln Asp Lys Ile Ser Arg Val Thr Val Trp Gly 325 330 335 Val Ser Asp Gly Asp Ser Trp Arg Asn Asn Trp Pro Val Arg Gly Arg 340 345 350 ValThr Asp Tyr Pro Leu Leu Phe Asp Arg Asp His Gln Pro Lys Pro 355 360 365 Val Gln Ser Leu Ile Asn Glu Ala Leu Arg Asn Arg

370 375 380

<210> 547<211> 1149<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 547

atgactcgcc tctctcgccg caactttctg gtcggcagtg ctgctgtcgc cgccatggccaatatcaagg cgtgcgccat caaccgcgct gccgagaata ccggcttaaa agacgtctacaaggacgact tcctgatcgg cactgccatc agcaacggca ccctggagca cggtaacccgcaacttgaaa gcatcatcaa gcaggagttc aactcgattg tagcggaaaa ctgcatgaaatccggcctga tccagccgcg tcagggcgag tgggactgga ccctggcaga ccgctttatcgactttggtg tcgagaacga catgaccatc gtcgggcatg cactggtctg gcactcgcaagcgccggcag acttttttat ccacgaagat gggcgccgga tttcccgcga agagctgatccgacgcatgg atacccatat caccaccctg atggagcgct acaagggcaa agtccatatctgggatgtgg tcaacgaatc cattgacgag gaccagggct ggcgccagag cctctggtatcaggtgatgg gctctgctta tttccaggag cgcgccttca atctcgccca tgagatcgaccccaatgcac acctgattta caacgactac aatatgcaca accccggcaa gcgggagttcctggttgacg ttatccgcga ctacaagcgc cgcggcgtcc cgattcacgg cgtaggcatgcagagtcatg ttgggctgga ttggcctgat atggacgaat acgaggccag cattgaggcatacgccgcag agggcatgcg cctgcacatg actgagctgg aagtggatgt tttacccgtggcttgggagc acagtggtgc agaaatttcg acggagtttg agtactcgga tgagattaacccctacactg acggcttgcc gcaagctatc gaagatcagt tgacacgccg ctacgaagagctgttcacct tgtacgtcaa acatcgcgac aagatcgacc gtgtgacgac ctggggcacttatgacggtg agtcctggaa aaatgacttc ccggtgcgtg gacgcactaa ctacccgctgctgttcgatc gcgatatggc acccaaggat gcttattttg cgctgaagag tttgcgcgctcgtttgtaa<210> 548<211> 382<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1) .. . (20)<220>

<221> DOMÍNIO<222> (35)... (379)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (52)...(55)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (167) ... (170)

<223> N-glicosilação site. Prosite id = PS00001<400> 548

Met Thr Arg Leu Ser Arg Arg Asn Phe Leu Val Gly Ser Ala Ala Val1 5 10 15 Ala Ala Met Ala 20 Asn Ile Lys Ala Cys 25 Ala Ile Asn Arg Ala 30 Ala GluAsn Thr Gly Leu Lys Asp Val Tyr Lys Asp Asp Phe Leu Ile Gly Thr 35 40 45 Ala Ile 50 Ser Asn Gly Thr Leu 55 Glu His Gly Asn Pro 60 Gln Leu Glu SerIle Ile Lys Gln Glu Phe Asn Ser Ile Val Ala Glu Asn Cys Met Lys65 70 75 80Ser Gly Leu Ile Gln 85 Pro Arg Gln Gly Glu 90 Trp Asp Trp Thr Leu 95 AlaAsp Arg Phe Ile 100 Asp Phe Gly Val Glu 105 Asn Asp Met Thr Ile 110 Val GlyHis Ala Leu 115 Val Trp His Ser Gln 120 Ala Pro Ala Asp Phe 125 Phe Ile HisGlu Asp 130 Gly Arg Arg Ile Ser 135 Arg Glu Glu Leu Ile 140 Arg Arg Met AspThr His Ile Thr Thr Leu Met Glu Arg Tyr Lys Gly Lys Val His Ile145 150 155 160Trp Asp Val Val Asn Glu Ser Ile Asp Glu Asp Gln Gly Trp Arg Gln 165 170 175 Ser Leu Trp Tyr 180 Gln Val Met Gly Ser 185 Ala Tyr Phe Gln Glu 190 Arg AlaPhe Asn Leu 195 Ala His Glu Ile Asp 200 Pro Asn Ala His Leu 205 Ile Tyr AsnAsp Tyr Asn Met His Asn Pro Gly Lys Arg Glu Phe Leu Val Asp Val210 215 220

Ile Arg Asp Tyr Lys Arg Arg Gly Val Pro Ile His Gly Val Gly Met225 230 235 240

Gln Ser His Val Gly Leu Asp Trp Pro Asp Met Asp Glu Tyr Glu Ala245 250 255

Ser Ile Glu Ala Tyr Ala Ala Glu Gly Met Arg Leu His Met Thr Glu

260 265 270

Leu Glu Val Asp Val Leu Pro Val Ala Trp Glu His Ser Gly Ala Glu275 280 285

Ile Ser Thr Glu Phe Glu Tyr Ser Asp Glu Ile Asn Pro Tyr Thr Asp290 295 300

Gly Leu Pro Gln Ala Ile Glu Asp Gln Leu Thr Arg Arg Tyr Glu Glu305 310 315 320

Leu Phe Thr Leu Tyr Val Lys His Arg Asp Lys Ile Asp Arg Val Thr325 330 335

Thr Trp Gly Thr Tyr Asp Gly Glu Ser Trp Lys Asn Asp Phe Pro Val

340 345 350

Arg Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Asp Met Ala Pro355 360 365

Lys Asp Ala Tyr Phe Ala Leu Lys Ser Leu Arg Ala Arg Leu370 375 380

<210> 549<211> 981<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 549

atgactactt taaaatcgta ttataaagat caattcaaaa ttggtgcagc aattaatatg 60

cgttcgatca aagaagatgc agatttatta aaagaacagt ttaattcaat cacagctgag 120aatgagatga aatttgaagg gcttcagcca gaaaaaggcc aatttaattt tgaaattagt 180gatcagtttt tagcatttgc tgaggaaaat gatatgggtt tacgtggtca cacacttgtc 240tggcataacc aaacaccaga ttggttcttc caagatgatg acggcaatga cgtgtcgaga 300gacgtgttac tcgaacgtat gaaagagcat atcgaaacgg ttgttggacg ctataaaggg 360cgtatttacg catgggacgt cgtaaacgaa gcgatttctg atgaagaagg tgtcttccta 420agaccgtcta aatggctgga tattattggt gaagatttcc tagatcatgc cttcaaattt 480gcgcatgcgg ttgatcccga agctaaactc ttctataacg actacaacga atcaaatccg 540gaaaaacgcg agaagattta cacgctaatt agtggcatga tctcacgtgg tgttcccatt 600catggtatgg gcatgcaagc ccactggaat cttcatgagc cagctttaac ggatattgaa 660gatgcgattg tgagatacgg tgaattaggg gtagaaattc acgtgactga gatggatgta 720tctgtcttca agtttgatga taagcggaca gatttaatag agccaacgga agaaatggaa 780aaattgcagg ttgaacgtta tgaagcattc tttgatctct ttaagaaaca tgcttcaaaa 840attacatctg ttaccttctg gggtgtatct gaccgttaca catggttaaa tgatttccct 900gtccgtggca gaaaaaactg gccatttgta tttgatggca ataaccagcc gaaagcatca 960tttaaagcga tcactaaata a yBi

<210> 550<211> 326<212> PRT<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (3) . . .(326)<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (178)...(181)

<223> N-glicosilação site. Prosite id = PS00001<400> 550

Met Thr Thr Leu Lys Ser Tyr Tyr Lys Asp Gln Phe Lys Ile Gly Ala1 5 10 15

Ala Ile Asn Met Arg Ser Ile Lys Glu Asp Ala Asp Leu Leu Lys Glu20 25 30

Gln Phe Asn Ser Ile Thr Ala Glu Asn Glu Met Lys Phe Glu Gly Leu35 40 45

Gln Pro Glu Lys Gly Gln Phe Asn Phe Glu Ile Ser Asp Gln Phe Leu50 55 60 Ala Phe Ala Glu Glu Asn Asp Met Gly Leu Arg Gly His Thr Leu Val65 70 75 80Trp His Asn Gln Thr Pro Asp Trp Phe Phe Gln Asp Asp Asp Gly Asn 85 90 95 Asp Val Ser Arg 100 Asp Val Leu Leu Glu 105 Arg Met Lys Glu His 110 Ile GluThr Val Val Gly Arg Tyr Lys Gly Arg Ile Tyr Ala Trp Asp Val Val 115 120 125 Asn Glu 130 Ala Ile Ser Asp Glu 135 Glu Gly Val Phe Leu 140 Arg Pro Ser LysTrp Leu Asp Ile Ile Gly Glu Asp Phe Leu Asp His Ala Phe Lys Phe145 150 155 160Ala His Ala Val Asp 165 Pro Glu Ala Lys Leu 170 Phe Tyr Asn Asp Tyr 175 AsnGlu Ser Asn Pro 180 Glu Lys Arg Glu Lys 185 Ile Tyr Thr Leu Ile 190 Ser GlyMet Ile Ser 195 Arg Gly Val Pro Ile 200 His Gly Met Gly Met 205 Gln Ala HisTrp Asn Leu His Glu Pro Ala Leu Thr Asp Ile Glu Asp Ala Ile Val 210 215 220 Arg Tyr Gly Glu Leu Gly Val Glu Ile His Val Thr Glu Met Asp Val225 230 235 240Ser Val Phe Lys Phe 245 Asp Asp Lys Arg Thr 250 Asp Leu Ile Glu Pro 255 ThrGlu Glu Met Glu 260 Lys LeU Gln Val Glu 265 Arg Tyr Glu Ala Phe 270 Phe AspLeu Phe Lys Lys His Ala Ser Lys Ile Thr Ser Val Thr Phe Trp Gly 275 280 285 Val Ser Asp Arg Tyr Thr Trp Leu Asn Asp Phe Pro Val Arg Gly Arg

290 295 300

Lys Asn Trp Pro Phe Val Phe Asp Gly Asn Asn Gln Pro Lys Ala Ser305 310 315 320

Phe Lys Ala Ile Thr Lys325

<210> 551<211> 1470<212> DNA<213> Desconhecido<220><223> Obtido paira amostra ambiental<400> 551

gtgcgtggcg acgcctctat cagtcgtgta acgtcagagc gttttgaggg taacgctagtttaagtgtga ccggtcgcac tgattattgg cacggcgcca ctttttctgt gggtcatttaacaccgggca atagctatga agtagctgtt tgggtgaagt tggcggcggg cgagccgaatgctgtggtca aggtcaccgg caagcgtgaa ggcaacagct ccacctatgt tgaatacatggaggtcggct cagctctggc taccgccggt agctggaccg agattacggg cacctatgtcccggagagtg acagcccctt tgagttcttt attatagaaa ctcaggaagg cgaggctgataccagcttct atgtggacgc gttttccgta gccggtgagg tggcgcccac cccaacgccagtgatgccgc caccgggtgg cggttcaggg ctggctgggc tggtggactt ccctgtagggactgctgttg cggttgccag tttcgcaaac aacgattttt taagtgacgc gcagcagcaggccattgtgc gtgaaaactt caatgaaatc gtcgcagaaa accagatgaa gatggaatacttcggcagcg actattcgaa ccccagggcg gatcaactgg ttagttgggc taatcagaatggtattcggg ttcatggtca cgctctggtt tggcatgcgc agccggccgc gtgggtaagcacggctacgg gcagtgattt ccgccagcgc tatgttaacc atgttcgagg ggtggccgctcgctacgctg attcggtcgt gagttgggac gtggtcaatg aggccttgac tgacagtaatgtttcaccgg gtggaaacta ttaccggcag tcggcatttt atcagcaatt tggtggtccggagttcattg atatcgcatt ccgggaagcg cgtcaagccg ccccgaatgc gctgttgtactacaacgatt acaacattga gaacgggggg gataaaaccg acgggctgat tcagttgctcgagcggctgg tggccaatgg tgtacccatc gacggtgtag gcttccaaat gcacgtcttacgagattggc cagatatctc aaccattcgc cgctcttggg agcgggcgtt ggccgttcatccagacctgt tgctgaaaat taccgaattg gatgtgcgta tcaacaatcc ctacggtgatagtattattc acaccaatcg aaacgactgt aataatggtt gccgagggtt cgacctacaggccgagcgct atcgagaaat tatagaagct tatttcgagg tggtgcctcc gcatcgtcgtggtggtataa gcgtctgggg tattgcggac cactacagct ggtattatac ccacgaaggcttggtagatt ggcctctgct atgggatcgc aacttgcaac cgaaacctgc ctatcatgctgtctatgagg cacttcgtca ggggcagtag<210> 552<211> 489<212> PRT

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (2) ... (133)<223> Domínio de carbohidrato<220>

<221> DOMÍNIO<222> (150)...(485)

<223> Família 10 de hidrolase glicosila

<220>

<221> SITE

<222> (18)...(21)

<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE

<222> (73)...(76)

<223> N-glicosilação site. Prosite id = PS00001<400> 552

Met Arg Gly Asp Ala Ser Ile Ser Arg Val Thr Ser Glu Arg Phe Glu

1 5 10 15

Gly Asn Ala Ser Leu Ser Val Thr Gly Arg Thr Asp Tyr Trp His Gly

20 25 30

Ala Thr Phe Ser Val Gly His Leu Thr Pro Gly Asn Ser Tyr Glu Val35 40 45

Ala Val Trp Val Lys Leu Ala Ala Gly Glu Pro Asn Ala Val Val Lys50 55 60

Val,Thr Gly Lys Arg Glu Gly Asn Ser Ser Thr Tyr Val Glu Tyr Met65 70 75 80

Glu Val Gly Ser Ala Leu Ala Thr Ala Gly Ser Trp Thr Glu Ile Thr

85 90 95

Gly Thr Tyr Val Pro Glu Ser Asp Ser Pro Phe Glu Phe Phe Ile Ile

100 105 110

Glu Thr Gln Glu Gly Glu Ala Asp Thr Ser Phe Tyr Val Asp Ala Phe115 120 125

Ser Val Ala Gly Glu Val Ala Pro Thr Pro Thr Pro Val Met Pro Pro130 135 140

Pro Gly Gly Gly Ser Gly Leu Ala Gly Leu Val Asp Phe Pro Val Gly145 150 155 160

Thr Ala Val Ala Val Ala Ser Phe Ala Asn Asn Asp Phe Leu Ser Asp 165 170 175

Ala Gln Gln Gln Ala Ile Val Arg Glu Asn Phe Asn Glu Ile Val Ala

180 185 190

Glu Asn Gln Met Lys Met Glu Tyr Phe Gly Ser Asp Tyr Ser Asn Pro195 200 205

Arg Ala Asp Gln Leu Val Ser Trp Ala Asn Gln Asn Gly Ile Arg Val210 215 220

His Gly His Ala Leu Val Trp His Ala Gln Pro Ala Ala Trp Val Ser225 230 235 240

Thr Ala Thr Gly Ser Asp Phe Arg Gln Arg Tyr Val Asn His Val Arg 245 250 255

Gly Val Ala Ala Arg Tyr Ala Asp Ser Val Val Ser Trp Asp Val Val

260 265 270

Asn Glu Ala Leu Thr Asp Ser Asn Val Ser Pro Gly Gly Asn Tyr Tyr275 280 285

Arg Gln Ser Ala Phe Tyr Gln Gln Phe Gly Gly Pro Glu Phe Ile Asp290 295 300

Ile Ala Phe Arg Glu Ala Arg Gln Ala Ala Pro Asn Ala Leu Leu Tyr305 310 315 320

Tyr Asn Asp Tyr Asn Ile Glu Asn Gly Gly Asp Lys Thr Asp Gly Leu 325 330 335

Ile Gln Leu Leu Glu Arg Leu Val Ala Asn Gly Val Pro Ile Asp Gly340 345 350Val Gly Phe Gln Met His Val Leu Arg Asp Trp Pro Asp Ile Ser Thr 355 360 365 Ile Arg 370 Arg Ser Trp Glu Arg 375 Ala Leu Ala Val His 380 Pro Asp Leu LeuLeu Lys Ile Thr Glu Leu Asp Val Arg Ile Asn Asn Pro Tyr Gly Asp385 390 395 400Ser Ile Ile His Thr 405 Asn Arg Asn Asp Cys 410 Asn Asn Gly Cys Arg 415 GlyPhe Asp Leu Gln 420 Ala Glu Arg Tyr Arg 425 Glu Ile Ile Glu Ala 430 Tyr PheGlu Val Val Pro Pro His Arg Arg Gly Gly Ile Ser Val Trp Gly Ile 435 440 445 Ala Asp HiS Tyr Ser Trp Tyr Tyr Thr His Glu Gly Leu Val Asp Trp 450 455 460 Pro Leu Leu Trp Asp Arg Asn Leu Gln Pro Lys Pro Ala Tyr His Ala465 470 475 480Val Tyr Glu Ala Leu 485 Arg Gln Gly Gln

<210> 553

<211> 1116

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 553

atgacgggaa tcagcacagg ccggggaaag aacccgggcc ggatctacac gacgttgagcacggcactgg tgttcgtggt gatgggggcg ttggagtcct gggcgcagtg cagcacctggaccagaagca ccatccgcaa ttgcaacggc atcgattacg agctgtggaa ccagggcaaccgcggcacgg tgaacatgca aatcacgggc gggagcgccg atacgaacgg cggtacgttctcggcgacct ggaccgggac ggagaacatc ctgttccgcg cgggcaagaa gtggggtttcaataccacca cgacgcctga ggaccttggc acgaccacgc ttgatttcga agcgacctggacatcgagcg acaacgtgag gatgctgggc gtgtatggct ggtcgtattt tcagcccgaggacgtgccga ccgagaggga aaacggtcag gccactgagt tttccaatca gatcgagtattacatcatcc aggatcgcgg aagcttcaat ccgggtgcca gcggtgtgaa cgccaagaagtatggcgaag ccaccatcga cggaatcgcc tacgattttt gggttgccga ccgcatcaatcagcccatgc tgaccgggag aggaaacttc aagcagtact tcagcgttcc acagaatacgggaacccacc ggcaaagcgg taccgtcacc atctccgagc attttgagga gtgggagaaggccggcatga agatgatgaa tacccggttg tacgagatcg cgatgaaggt ggagtcgtattccggtgctg cgactggttc cgggtcagcg catgtgaccc gcaacctcct gacgttcgagaatgtggccg cctcgatcac gcacgccgga gggactgctg ccatgtccgc cggaaacgcgccggttgtgt tggtgcaggg cagaaccctg aacgtgaatc ccgtcgatgg ttcccggttgcagattcagg tgcgggatgc gaagggcacg aaccacggcc gcttcaacgc caccggcgccgcggcgtttt cgttgtccga aatccccgcg ggcctgtact tcgttgatgt cacggggaccgggacacgac acgtcacgcc gatcatcttg cgctga<210> 554<211> 371<212> PRT<213> Desconhecido<22 0>

<223> Obtido para amostra ambiental<22 0>

<221> DOMÍNIO<222> (46)... (274)

<223> Família 11 de glicosila hidrolases<220>

<221> SITE

<222> (102)...(105)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (341)...(344)

<223> N-glicosilação site. Prosite id = PS00001<400> 554

Met Thr Gly Ile Ser Thr Gly Arg Gly Lys Asn Pro Gly Arg Ile Tyr1 5 10 15

Thr Thr Leu Ser Thr Ala Leu Val Phe Val Val Met Gly Ala Leu Glu20 25 30Ser Trp Ala Gln Cys Ser Thr Trp Thr Arg Ser Thr Ile Arg Asn Cys 35 40 45 Asn Gly Ile Asp Tyr Glu Leu Trp Asn Gln Gly Asn Arg Gly Thr Val 50 55 60 Asn Met Gln Ile Thr Gly Gly Ser Ala Asp Thr Asn Gly Gly Thr Phe65 70 75 80Ser Ala Thr Trp Thr Gly Thr Glu Asn Ile Leu Phe Arg Ala Gly Lys 85 90 95 Lys Trp Gly Phe Asn Thr Thr Thr Thr Pro Glu Asp Leu Gly Thr Thr 100 105 110 Thr Leu Asp 115 Phe Glu Ala Thr Trp 120 Thr Ser Ser Asp Asn 125 Val Arg MetLeu Gly Val Tyr Gly Trp Ser Tyr Phe Gln Pro Glu Asp Val Pro Thr 130 135 140 Glu Arg Glu Asn Gly Gln Ala Thr Glu Phe Ser Asn Gln Ile Glu Tyr145 150 155 160Tyr Ile Ile Gln Asp Arg Gly Ser Phe Asn Pro Gly Ala Ser Gly Val 165 170 175 Asn Ala Lys Lys Tyr Gly Glu Ala Thr Ile Asp Gly Ile Ala Tyr Asp 180 185 190 Phe Trp Val Ala Asp Arg Ile Asn Gln Pro Met Leu Thr Gly Arg Gly 195 200 205 Asn Phe Lys Gln Tyr Phe Ser Val Pro Gln Asn Thr Gly Thr His Arg 210 215 220 Gln Ser Gly Thr Val Thr Ile Ser Glu His Phe Glu Glu Trp Glu Lys225 230 235 240Ala Gly Met Lys Met Met Asn Thr Arg Leu Tyr Glu Ile Ala Met Lys 245 250 255 Val Glu Ser Tyr Ser Gly Ala Ala Thr Gly Ser Gly Ser Ala His Val 260 265 270 Thr Arg Asn Leu Leu Thr Phe Glu Asn Val Ala Ala Ser Ile Thr His 275 280 285 Ala Gly Gly Thr Ala Ala Met Ser Ala Gly Asn Ala Pro Val Val Leu 290 295 300 Val Gln Gly Arg Thr Leu Asn Val Asn Pro Val Asp Gly Ser Arg Leu305 310 315 Phe 320Gln Ile Gln Val Arg Asp Ala Lys Gly Thr Asn His Gly Arg Asn 325 330 335 Ala Thr Gly Ala Ala Ala Phe Ser Leu Ser Glu Ile Pro Ala Gly Leu 340 345 350 Tyr Phe Val Asp Val Thr Gly Thr Gly Thr Arg His Val Thr Pro Ile 355 360 365 Ile Leu 370 Arg

<210> 555<211> 1071<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 555

atgaagttca gtcatataag atcgctgtcc ctcgcgctgg ttctgtgttt taccgggtttggcgtgtcga cagttcatgc tcaaacccat tgcgggagcc agacaggcaa ccatggcggtttctacttta cccactggac cgatggtggt ggtagtgcct gcatgaccct gggctccggtggcaactaca gctattcctg gtccaacacc ggcaactttg ttggcggcaa gggctgggcaaccggcacca ataaccgggt tatcggctac aacgccgggg tgtttgcgcc ggcaggtaattcgtacctgg cgctctacgg atggaccacc aaccctctgg tggaatacta cgtggtggatagctggggca gctggcggcc gccgggtgcg cagtcggcag gtacagtgaa cagcgatggtggcacctacg acctgtacag aacccagaga gtcaaccagc cctccattca gggaactgccaccttctatc agtactggag tgtgcgcacg tctccgcgtc cccagggaac caacaacaatatcaccttcc agaatcacgt gaacgcctgg gcgtccaggg gctggaacct cggtgcccataactatcagg tgatggccac cgaaggctac cagagcagcg gttcttccaa cgtgaccgtgtgggaatccg gaaccagcgg tggtggtggc ggtggtgcca ccggcggtgg cggcggtggtggtgctaccg gcggtggtgg tcagcacacc atcgtggttc gcgcccgcgg cgttcacggcagcgagcaga tccgcctgcg gatcaacaac aacactgtgg cgacctggaa cctgtcgaccaacatgagca actacacctg gagcggcaac aataccgggg gtattgtcgt ggagtttttcaacgacaaca gcgttcgcga tgtgcaggtt gagcacattc aggtcaacgg tcagacccggcgcgcccagg atcagaccta caacacgggt gtctggcaaa acaactcctg tgggggttcc 102(cacagccagt ggctgcactg caacggtgcg ataggatttg gcaatatcta g 107]

<210> 556<211> 356<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(27)<220>

<221> DOMÍNIO<222> (36)...(220)

<223> Família 11 de glicosila hidrolases<220>

<221> SITE<222> (62)...(65)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (113)...(123)

<221> SITE

<222> (182)...(185)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (208)...(219)

<223> Família 11 de glicosila hidrolases ativa site marca 2. Prosite id

PS00777

<220>

<221> SITE

<222> (220)...(223)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (274)...(277)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (281)...(284)

<223> N-glicosilação site. Prosite id = PS00001<22 0>

<221> SITE

<222> (285)...(288)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (294)...(297)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (339)...(342)

<223> N-glicosilação site. Prosite id = PS00001<400> 556

Met Lys Phe Ser His Ile Arg Ser Leu Ser Leu Ala Leu Val Leu Cys!5 10 15

Phe Thr Gly Phe Gly Val Ser Thr Val His Ala Gln Thr His Cys Gly

20 25 30

Ser Gln Thr Gly Asn His Gly Gly Phe Tyr Phe Thr His Trp Thr Asp

35 40 45

Gly Gly Gly Ser Ala Cys Met Thr Leu Gly Ser Gly Gly Asn Tyr Ser

50 55 60

Tyr Ser Trp Ser Asn Thr Gly Asn Phe Val Gly Gly Lys Gly Trp Ala65 70 75 80

Thr Gly Thr Asn Asn Arg Val Ile Gly Tyr Asn Ala Gly Val Phe Ala

85 90 95

Pro Ala Gly Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Thr Thr Asn Pro100 105 HO

Leu Val Glu Tyr Tyr Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro

115 120 125

Gly Ala Gln Ser Ala Gly Thr Val Asn Ser Asp Gly Gly Thr Tyr Asp130 135 140

Leu Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Gln Gly Thr Ala145 150 155 160

Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Ser Pro Arg Pro Gln Gly

165 170 175

Thr Asn Asn Asn Ile Thr Phe Gln Asn His Val Asn Ala Trp Ala Ser180 185 190

Arg Gly Trp Asn Leu Gly Ala His Asn Tyr Gln Val Met Ala Thr Glu

195 200 205

Gly Tyr Gln Ser Ser Gly Ser Ser Asn Val Thr Val Trp Glu Ser Gly210 215 220

Thr Ser Gly Gly Gly Gly Gly Gly Ala Thr Gly Gly Gly Gly Gly Gly225 230 235 240

Gly Ala Thr Gly Gly Gly Gly Gln His Thr Ile Val Val Arg Ala Arg

245 250 255

Gly Val His Gly Ser Glu Gln Ile Arg Leu Arg Ile Asn Asn Asn Thr260 265 270

Val Ala Thr Trp Asn Leu Ser Thr Asn Met Ser Asn Tyr Thr Trp Ser

275 280 285

Gly Asn Asn Thr Gly Gly Ile Val Val Glu Phe Phe Asn Asp Asn Ser290 295 300

Val Arg Asp Val Gln Val Glu His Ile Gln Val Asn Gly Gln Thr Arg305 310 315 320

Arg Ala Gln Asp Gln Thr Tyr Asn Thr Gly Val Trp Gln Asn Asn Ser

325 330 335

Cys Gly Gly Ser His Ser Gln Trp Leu His Cys Asn Gly Ala Ile Gly340 345 350

Phe Gly Asn Ile

355<210> 557<211> 1371<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 557

atgtcttcat taatagcagg caccattgcc tgttgcatga tgatgatgcc cctaatactg 60

gctcccagcc aggtgcacgc gcaacaacat tgctcaaatc aaaccggcta ccacggtggc 120tactatttca cacactggac tgatggtggc ggaacagcat gtatgacact tggtgccgatggtaactaca gttacagctg gtctaatacc ggaaattttg taggtggtaa gggctggagtaccggtactt caaaccgaat catcggatac aatgccggtg tctataaccc aagtggtaat 300agctatctgg ctctgtatgg ttggtcaacc aatccactta tcgagtacta tgttgtagat 360agctggggaa gctggagacc accaggaggt acttctgtag gtactgtaca atcagatggc 420ggaacctacg acctgtaccg aacacagcgt gttaatcagc cttccattga aggaacagct 480acgttttatc agtattggag tgtacgtaca actccgagac cacaaggcca aaacaatacc 540attacctttc aaaatcacgt aaatgcctgg gctaatcagg gctggcatct gggtgctcat 600aactatcagg tgatggctac tgaaggatac cagagtagtg gtagctcaaa cgtttctgtg 660tgggaagctg gaagcggttc cggaggtggt tctggcggcg gtggcggatc aaactccgtt 720accatcagag ctattggaac ttcaggtaac gaacaactcc ggttgaacat caacaacaatgaaatcatta cctggaacat caccagcagc tggcagaatt actccgttaa caccaatgccagcggacatg tgaatataga gctgatcaac gatcagggtc ctggctacga agcccgtgtggaatacatgg aactgaacgg tcagcggcgt tatgcggcag atcaaagcta caacaccagc 960gcctgggatg gtgagtgcgg tggtggctcg ttcaccatgt ggatgcattg taacgggatg 1020ataggttttg gcgatatgcc acagagcaga gccgaacgca atgaaggaat aagcaatact 1080ctggatttgc caactgactt caagctctcg ggtgcctatc cgaatccgtt taatccaaca 1140actaacatcc gctttgattt accggtttcc tctcaggtta cgctaaccgt atatgacgcg 1200cttgggcgcc aggtaagcca gcttattaat ggaaaccgtg gagcaggcag ccatctggta 1260acttttgatg ccggcaacaa tcccagtggt atatacctct acaggattga tgcttatggc 1320gaagacggca gatcattctc cgataccggt attatgacac tggttaagta a 1371<210> 558<211> 456<212> PRT<213> Desconhecido<220><223> Obtido para amostra ambiental<220><221> SIGNAL<222> (1)...(27)<220><221> DOMÍNIO<222> (36)...(220)<223> Família 11 de glicosila hidrolases<220><221> SITE<222> (33)...(36)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (62)... (65)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (113)...(123)<223> Família 11 de glicosila hidrolases ativa site marca 1. Prosite id PS00776<220><221> SITE<222> (180) ... (183)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (208)...(219)<223> Família 11 de glicosila hidrolases ativa site marca 2. Prosite id PS00777<220><221> SITE<222> (220)...(223)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (270)...(273)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (277)...(280)<223> N-glicosilação site. Prosite id = PS00001<220><221>.SITE<222> (283) . .. (286)<223> N-glicosilação site. Prosite id = PS00001<22 0><221> SITE<222> (322) . . . (325)<223> N-glicosilação site. Prosite id = PS00001<400> 558

Met Ser Ser Leu Ile Ala Gly Thr Ile Ala Cys Cys Met Met Met Met1 5 10 15

Pro Leu Ile Leu Ala Pro Ser Gln Val His Ala Gln Gln His Cys Ser

20 25 30

Asn Gln Thr Gly Tyr His Gly Gly Tyr Tyr Phe Thr His Trp Thr Asp

35 40 45

Gly Gly Gly Thr Ala Cys Met Thr Leu Gly Ala Asp Gly Asn Tyr Ser

50 55 60

Tyr Ser Trp Ser Asn Thr Gly Asn Phe Val Gly Gly Lys Gly Trp Ser65 70 75 80

Thr Gly Thr Ser Asn Arg Ile Ile Gly Tyr Asn Ala Gly Val Tyr Asn85 90 95

Pro Ser Gly Asn Ser Tyr Leu Ala Leu Tyr Gly Trp Ser Thr Asn Pro

100 105 110

Leu Ile Glu Tyr Tyr Val Val Asp Ser Trp Gly Ser Trp Arg Pro Pro115 120 125

Gly Gly Thr Ser Val Gly Thr Val Gln Ser Asp Gly Gly Thr Tyr Asp

130 135 140

Leu Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser Ile Glu Gly Thr Ala145 150 155 160

Thr Phe Tyr Gln Tyr Trp Ser Val Arg Thr Thr Pro Arg Pro Gln Gly

165 170 175

Gln Asn Asn Thr Ile Thr Phe Gln Asn His Val Asn Ala Trp Ala Asn

180 185 190

Gln Gly Trp His Leu Gly Ala His Asn Tyr Gln Val Met Ala Thr Glu

195 200 205

Gly Tyr Gln Ser Ser Gly Ser Ser Asn Val Ser Val Trp Glu Ala Gly

210 215 220

Ser Gly Ser Gly Gly Gly Ser Gly Gly Gly Gly Gly Ser Asn Ser Val225 230 235 240

Thr Ile Arg Ala IleGly Thr Ser Gly Asn Glu Gln Leu Arg Leu Asn

245 25Ò 255

Ile Asn Asn Asn Glu Ile Ile Thr Trp Asn Ile Thr Ser Ser Trp Gln

260 265 270

Asn Tyr Ser Val Asn Thr Asn Ala Ser Gly His Val Asn Ile Glu Leu275 280 285

Ile Asn Asp Gln Gly Pro Gly Tyr Glu Ala Arg Val Glu Tyr Met Glu

290 295 300

Leu Asn Gly Gln Arg Arg Tyr Ala Ala Asp Gln Ser Tyr Asn Thr Ser305 310 315 320

Ala Trp Asp Gly Glu Cys Gly Gly Gly Ser Phe Thr Met Trp Met His

325 330 335

Cys Asn Gly Met Ile Gly Phe Gly Asp Met Pro Gln Ser Arg Ala Glu

340 345 350

Arg Asn Glu Gly Ile Ser Asn Thr Leu Asp Leu Pro Thr Asp Phe Lys355 360 365

Leu Ser Gly Ala Tyr Pro Asn Pro Phe Asn Pro Thr Thr Asn Ile Arg

370 375 380

Phe Asp Leu Pro Val Ser Ser Gln Val Thr Leu Thr Val Tyr Asp Ala385 390 395 400

Leu Gly Arg Gln Val Ser Gln Leu Ile Asn Gly Asn Arg Gly Ala Gly

405 410 415

Ser His Leu Val Thr Phe Asp Ala Gly Asn Asn Pro Ser Gly Ile Tyr

420 425 430

Leu Tyr Arg Ile Asp Ala Tyr Gly Glu Asp Gly Arg Ser Phe Ser Asp435 440 445

Thr Gly Ile Met Thr Leu Val Lys

450 455

<210> 559<211> 996<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 559

atgacaaatc aaatggaatc tttgtatcaa aagtatcaac cttactttcc aattggaaca 60tgcgtcagtc cacgtacact agaaacacat aaggagctac ttatcaagca ttataatagc 120ttgacatcag aaaacaatat gaagtttgga ccgattcatc ctggtattga tgaatatgac 180tttgttgaag cagataaaat ggttgagttt gctagaaacc acaataagct agtgcgaggg 240cacactttag tatggcatgg tcaaaaccct aagtggttgt tccataatca agatggtagt 300cttgtcgata gagctaccct cttaaaacgt atgaaagaac acatcaatac cgtggttagc 360cggtatcgtg atgatgttta ttgctgggat gtagttaatg aagctgtaga tgacaagggc 420tcgaacatct taaggcaatc tttatgggta gacattgttg gtgaagactt catccagaag 480gcattcgaat atgcccacga agttgatcca aaagcactgc tgttttataa cgattataac 540gaaagccaac cagttaaacg agataaaatc tatcaattgg ttaagggctt aaaggacaag 600gatgtaccaa ttcatggtgt tggtttgcag gctcactgga acattcacgg tccagccatg 660gatgacattc gtcaagcaat tgaaaaatat gctacgctag gtttacagct acatattact 720gagcttgacg tatctgtatt cgaacacgat gataagcgta ccgatttaac tgagccagcc 780gatggaatgc tagataaact agctgagcga tatgataatt tcttcagctt gtttagggag 840tactctgaag tgattgcaaa tgtaactttt tggggtccag ctgatgatgc tacctggttg 900gatggtttcc cagcgccggg acggaaaaac tggccgctgc tatttgacgt acatcataaa 960ggtaaaaaag cattagaaaa agtgatgaac ttctaa 996

<210> 560<211> 331<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (7)...(331)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (182)...(185)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (237)...(247)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<220>

<221> SITE

<222> (291) . ... (294)

<223> N-glicosilação site. Prosite id = PS00001<400> 560

Met Thr Asn Gln Met Glu Ser Leu Tyr Gln Lys Tyr Gln Pro Tyr Phe1 5 10 15

Pro Ile Gly Thr Cys Val Ser Pro Arg Thr Leu Glu Thr His Lys Glu

20 25 30

Leu Leu Ile Lys His Tyr Asn Ser Leu Thr Ser Glu Asn Asn Met Lys

35 40 45

Phe Gly Pro Ile His Pro Gly Ile Asp Glu Tyr Asp Phe Val Glu Ala

50 55 60

Asp Lys Met Val Glu Phe Ala Arg Asn His Asn Lys Leu Val Arg Gly65 70 75 80

His Thr Leu Val Trp His Gly Gln Asn Pro Lys Trp Leu Phe His Asn

85 90 95

Gln Asp Gly Ser Leu Val Asp Arg Ala Thr Leu Leu Lys Arg Met Lys

100 105 110

Glu His Ile Asn Thr Val Val Ser Arg Tyr Arg Asp Asp Val Tyr Cys

115 120 125

Trp Asp Val Val Asn Glu Ala Val Asp Asp Lys Gly Ser Asn Ile Leu

130 135 140

Arg Gln Ser Leu Trp Val Asp Ile Val Gly Glu Asp Phe Ile Gln Lys145 150 155 160

Ala Phe Glu Tyr Ala His Glu Val Asp Pro Lys Ala Leu Leu Phe Tyr

165 170 175

Asn Asp Tyr Asn Glu Ser Gln Pro Val Lys Arg Asp Lys Ile Tyr Gln

180 185 190

Leu Val Lys Gly Leu Lys Asp Lys Asp Val Pro Ile His Gly Val Gly

195 200 205

Leu Gln Ala His Trp Asn Ile His Gly Pro Ala Met Asp Asp Ile Arg

210 215 220

Gln Ala Ile Glu Lys Tyr Ala Thr Leu Gly Leu Gln Leu His Ile Thr225 230 235 240

Glu Leu Asp Val Ser Val Phe Glu His Asp Asp Lys Arg Thr Asp Leu

245 250 255

Thr Glu Pro Ala Asp Gly Met Leu Asp Lys Leu Ala Glu Arg Tyr Asp

260 265 270

Asn Phe Phe Ser Leu Phe Arg Glu Tyr Ser Glu Val Ile Ala Asn Val

275 280 285

Thr Phe Trp Gly Pro Ala Asp Asp Ala Thr Trp Leu Asp Gly Phe Pro

290 295 300

Ala Pro Gly Arg Lys Asn Trp Pro Leu Leu Phe Asp Val His His Lys305 310 315 320Gly Lys Lys Ala Leu Glu Lys Val Met Asn Phe325 330

<210> 561<211> 1809<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 561

atgtctttga gtaaacataa atcactgctt cttgccgtga gccgctacacctgttggcgg gtagcttagt cgcctgcggt ggcaacacca ccacagagccacgccaaccc caacgccggt gccaaccccc gccccgacgc cagttccaacacaccagcac ctacgccagc acccacaccg gcgcctacgc ccgctcccacgatcccggag ctaactatca gccaccggcc aacaacatag ccgtcaatggaatggcacga ccaattgggc cgctcgcggc gacgcgtcaa tagcgcgagtcgttttgagg gcaacgccgc cttgagcgta accgggcgca cagatttctgaccttttcgg taggccacct gacaccaggt aatagttacg aagtggccgcttggctgccg gcgagcccaa cgccgtgatt aaaatcactg gtaagcgcgaaccacctacg aggaatacac agaagtcggc acagccttgg tcacggctaagaaattacgg gtacttatat tccagagagc accagcccgt ttgaatacttacgcaagaag gtgaagctaa cgtcagcttc tatgttgacg ccttctcggtgttagcgcca ccccaacgcc tacccccact ccaactccgc cccccagtgggcggcattgg tggacttccc tgtaggggtt gccgtaccag tgaacaacttactcagcgcc aaagcattgt ggccgacaac ttcaatcagc tggtagcagaaagatgaact actacgatga aaacaacttc tctaacccac tggctgaccatgggcgcgga ctagagggat gacggtacac ggtcatgcct tggtatggcacagttgccaa gctgggccga aaacccaggt tcaaacttcc gccagcggtagttcgtggag ttgcacgcaa gcaccgaggg caaattgcaa gctgggacgtgctctatctg acgcaaacgg caataataat gttagcaatc ccgctgactatcggtatttt ataatcagta caacggtatt gattatatag ccaatgctttcgcgaggagg atccaaacgc agagctgtat tacaacgact acaatactgagctaaaaccc gtggtcaagt gcatttaatc agcgagctat tgcgtcgtgggacggtgtcg gtttccagat gcacgtgttg ctggactatc cgagcttggcgcatcctggc gtacgatttt agatttggac ccgaatctaa aactcaaaatgacgtgcgta tcaataaccc ctggggcact attctccacc ccaaccgaaacagggctgtc aaggctggaa tacccaagct aatcgctatc gcgagatcatcttgaggacg tgccacctca tcgccgcggc ggcatcagcg tctggggcatgatagctggt actacaccca tgatgacggc gacggttcca ataatattgtctgctgtggg actccaactt tcaacctaaa ccggcttatc aggccgtataagccgataa<210> 562602PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

DOMÍNIO(91). . . (240)<223> Domínio de carbohidrato<220>

DOMÍNIO(257)...(600)<223> Família 10 de hidrolase glicosila<220>

SITE

(32)...(35)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (102)...(105)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (230) . . .(233)

<223> N-glicosilação site. Prosite id = PS00001<220>

ttgcgcagctcccaacaccatccggcaccccccaactccgcgatgtagagcacttctgaggcaaggcgccatgggtcaaaaggcgaaagccacctggacccattgtggagggctggtgaattccggactgcctcaatagcaaaccagatgaatgatcgaccccgacttaccgaagctcacggtcaacgaactatcgtcgtcatttgggcgcgaaaacctgcgtgccaattaaacattcgtcaccgagctgcgactgcaatcgaggcctacttcggataatagactggccccgacgctcta

<211><212>

<221><222>

60120180240300360420480540600660720780840900960102010801140120012601320138014401500156016201680174018001809<221> SITE

<222> (283).. . (286)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (313) . . . (316)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (568) .. . (571)

<223> N-glicosilação site. Prosite id = PS00001

<400> 562 Met Ser Leu Ser Lys His Lys Ser Leu Leu Leu Ala Val Ser Arg Tyr1 5 10 15 Thr Cys Ala Ala Leu Leu Ala Gly Ser Leu Val Ala Cys Gly Gly Asn 20 25 30 Thr Thr Thr 35 Glu Pro Pro Thr Pro 40 Thr Pro Thr Pro Thr 45 Pro Val ProThr Pro 50 Ala Pro Thr Pro Val 55 Pro Thr Pro Ala Pro 60 Thr Pro Ala ProThr Pro Ala Pro Thr Pro Ala Pro Thr Pro Ala Pro Thr Pro Thr Pro65 70 75 80Asp Pro Gly Ala Asn Tyr Gln Pro Pro Ala Asn Asn Ile Ala Val Asn 85 90 95 Gly Asp Val Glu Asn Gly Thr Thr Asn Trp Ala Ala Arg Gly Asp Ala 100 105 110 Ser Ile Ala Arg Val Thr Ser Glu Arg Phe Glu Gly Asn Ala Ala Leu 115 120 125 Ser Val Thr Gly Arg Thr Asp Phe Trp Gln Gly Ala Thr Phe Ser Val 130 135 140 Gly His Leu Thr Pro Gly Asn Ser Tyr Glu Val Ala Ala Trp Val Lys145 150 155 160Leu Ala Ala Gly Glu Pro Asn Ala Val Ile Lys Ile Thr Gly Lys Arg 165 170 17 5 Glu Gly Glu Ser Thr Thr Tyr Glu Glu Tyr Thr Glu Val Gly Thr Ala 180 185 190 Leu Val Thr 195 Ala Asn Thr Trp Thr 200 Glu Ile Thr Gly Thr 205 Tyr Ile ProGlu Ser 210 Thr Ser Pro Phe Glu 215 Tyr Phe Ile Val Glu 220 Thr Gln Glu GlyGlu Ala Asn Val Ser Phe Tyr Val Asp Ala Phe Ser Val Ala Gly Glu 225 230 235 240Val Ser Ala Thr Pro 245 Thr Pro Thr Pro Thr 250 Pro Thr Pro Pro Pro 255 SerGly Ser Gly Leu Ala Ala Leu Val Asp Phe Pro Val Gly Val Ala Val 260 265 270 Pro Val Asn 275 Asn Phe Leu Asn Ser 280 Thr Gln Arg Gln Ser 285 Ile Val AlaAsp Asn Phe Asn Gln Leu Val Ala Glu Asn Gln Met Lys Met Asn Tyr 290 295 300 Tyr Asp Glu Asn Asn Phe Ser Asn Pro Leu Ala Asp Gln Met Ile Asp305 310 315 320Trp Ala Arg Thr Arg 325 Gly Met Thr Val His 330 Gly HiS Ala Leu Val 335 TrpHis Pro Thr Tyr 340 Gln Leu Pro Ser Trp 345 Ala Glu Asn Pro Gly 350 Ser AsnPhe Arg Gln Arg Tyr Glu Ala His Val Arg Gly Val Ala Arg Lys His 355 360 365 Arg Gly Gln Ile Ala Ser Trp Asp Val Val Asn Glu Ala Leu Ser Asp 370 375 380 Ala Asn Gly Asn Asn Asn Val Ser Asn Pro Ala Asp Tyr Tyr Arg Arg385 390 395 400Ser Val Phe Tyr Asn Gln Tyr Asn Gly Ile Asp Tyr Ile Ala Asn Ala 405 410 415 Phe Ile Trp Ala Arg Glu Glu Asp Pro Asn Ala Glu Leu Tyr Tyr Asn 420 425 430 Asp Tyr Asn Thr Asp Glu Asn Leu Ala Lys Thr Arg Gly Gln Val His435 440 445

Leu Ile Ser Glu Leu Leu Arg Arg Gly Val Pro Ile Asp Gly Val Gly

450 455 460

Phe Gln Met His Val Leu Leu Asp Tyr Pro Ser Leu Ala Asn Ile Arg465 470 475 480

Ala Ser Trp Arg Thr Ile Leu Asp Leu Asp Pro Asn Leu Lys Leu Lys

485 490 495

Ile Thr Glu Leu Asp Val Arg Ile Asn Asn Pro Trp Gly Thr Ile Leu500 505 510

His Pro Asn Arg Asn Asp Cys Asn Gln Gly Cys Gln Gly Trp Asn Thr515 520 525

Gln Ala Asn Arg Tyr Arg Glu Ile Ile Glu Ala Tyr Leu Glu Asp Val

530 535 540

Pro Pro His Arg Arg Gly Gly Ile Ser Val Trp Gly Ile Ser Asp Asn545 550 555 560

Asp Ser Trp Tyr Tyr Thr His Asp Asp Gly Asp Gly Ser Asn Asn Ile

565 570 575

Val Asp Trp Pro Leu Leu Trp Asp Ser Asn Phe Gln Pro Lys Pro Ala580 585 590

Tyr Gln Ala Val Tyr Asp Ala Leu Ser Arg

595 600

<210> 563<211> 2067<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 563

atgcagtcac tctttctttt tcttgttgtt ttctttttta cgcagactca ggtgtttggt 60caggcggcga atcacccttt cccacagaat ctgcagtatc cccatggtta catacccact 120aatttgagtc acaccgatgt gcagacctgg tgggacacct ggaaaaccac atttctgcgtccttgtgggg atgggcttat gcccactgca gatgatcgtg atcatgttaa ggtggaaggacagggctggg cgatgattgc cgctgcttac atgggtgata aggaaacctt tgatggcctcttgcgttttt ataatatgaa aaccacagac agagccggtg gtatgatggg ctggcatgtgacctgcgatg gctttgttga tgagggtagt gcaactgatg gtgatctgga tgtggcttttggcctgattg tggctcactg gcagtggggt ggagaatacc tagatgccgc tcgccaggta 480atcaccaacc tcaggagtct gatcgtggat tgtgatggtg tttcggtgct ggctgctggt 540tttgccggcg gaccttgggg tggttgcagt gaaacggata tttcctatta cacgccagct 600cattttcgca tctttgcgga agtaagcaat gacccgatct ggactaagct agccgaagat 660acgtacattc tgctggaacg ggcagcgcat cctactaccg gattggtgcc agattggcag 720catgccgacg gtaccgcagg tgctggcagt cgtcgcggcg attactctca tgatgcctgtcgtactcctt ggcgtattgc gctggattat ctgtggaatg gtgatgagcg ggcaaaaagctggctgacca aggtgactga ttgggcgcat ggtgtgggcc ctgccaacat tgtggacggttatgacctgg atggtactcc taccgggcag cacaatgata tgccttttgt gggtggctttgcagtgggcg ccatggcaaa tagtcaaact gtagtcaatg attttgcagc gcgggtggcg 1020

cagttcagtc aaggctactg gtatggggcg catttgggga atatgtatct gctggctctg 1080

actggcaata tgtggagcga agatcttttg gtaagcactg agggtactta tgtcttgagt 1140

gtgacagtgg atggtcgggg aaccgtcaat cgcagtcctt cggccattcg ctatgccgcc 1200

ggtacttctg taactttgac tgcggaaccg gctgttggtt ggtcctttga tggctggagt 12 60

ggtgccgggc tctctggagc agagccttct gttaccgtta ccgttgatga ggcaatccat 1320

gtgacggcac attttgtgtt ggatatcggt cccaatacca atctgttgca aaacggtgat 13 80

ttcagcggag atctggctcc ctgggcgttg aatacatgga ccggcgcagc atccggtgct 1440

atcagtgatg gggaatacac gctgaatatc acagagttgc ctgaaaatgt gtgggatgtc 1500

caattggttc agcagcaagt gcctttacag gaaggtcaga catacgtact gagttttgaa 1560

gcttttgcgg atgcaccccg ggatatcagt atcatagccc agttacctgc cgagccttat 1620

accacatacc attcggaaga tgtaagcatt actgctacca aacaaatgta tgaggtggag 1680

tttactatgg aagacgaaag caatctggat tcccgtattg gtttcaatct tgggcaggct 1740

accggtaatg tcaccatcag taatgttcga ctggcaccta ccggaacagt cagtacagtt

cttcccttgc agcgcgcccg gactggtctg agtgtgcagc ctcttgccaa tgctgcagtc

60 aatctgcaat ttcaggccat tgcaggtgga aatgccatac tgcgcattta tgatgtgaga 1920

ggcaatgtgg tggaaggcat tctgctgcag ccttcggcgg atggtgtgta tttgcacacc 1980

accgccagta tgcccaatgg cttttacata gctcgtgtat atcaaaatgg tgttacacag 2040

caagcgtctt ttgcggtaag tcgctga 2067<210> 564

65 <211> 688

<212> PRT

<213> Desconhecido

18001860<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(20)<220>

<221> DOMÍNIO<222> (25)...(362)

<223> Família 8 de hidrolase glicosila<220>

<221> DOMÍNIO

<222> (453)...(594)

<223> Domínio de carbohidrato

<220>

<221> SITE<222> (41)...(44)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (496)...(499)

<223> N-glicosilação site. Prosite id = PS00001<22 0>

<221> SITE

<222> (591)...(594)

<223> N-glicosilação site. Prosite id = PS00001<400> 564

Met Gln Ser Leu Phe Leu Phe Leu Val Val Phe Phe Phe Thr Gln Thr1 5 10 15 Gln Val Phe Gly 20 Gln Ala Ala Asn His 25 Pro Phe Pro Gln Asn 30 Leu GlnTyr Pro His Gly Tyr Ile Pro Thr Asn Leu Ser His Thr Asp Val Gln 35 40 45 Thr Trp Trp Asp Thr Trp Lys Thr Thr Phe Leu Arg Pro Cys Gly Asp 50 55 60 Gly Leu Met Pro Thr Ala Asp Asp Arg Asp His Val Lys Val Glu Gly65 70 75 80Gln Gly Trp Ala Met Ile Ala Ala Ala Tyr Met Gly Asp Lys Glu Thr 85 90 95 Phe Asp Gly Leu Leu Arg Phe Tyr Asn Met Lys Thr Thr Asp Arg Ala 100 105 110 Gly Gly Met Met Gly Trp His Val Thr Cys Asp Gly Phe Val Asp Glu 115 120 125 Gly Ser 130 Ala Thr Asp Gly Asp 135 Leu Asp Val Ala Phe 140 Gly Leu Ile ValAla His Trp Gln Trp Gly Gly Glu Tyr Leu Asp Ala Ala Arg Gln Val145 150 155 160Ile Thr Asn Leu Arg Ser Leu Ile Val Asp Cys Asp Gly Val Ser Val 165 170 175 Leu Ala Ala Gly Phe Ala Gly Gly Pro Trp Gly Gly Cys Ser Glu Thr 180 185 190 Asp Ile Ser 195 Tyr Tyr Thr Pro Ala 200 His Phe Arg Ile Phe 205 Ala Glu ValSer Asn 210 Asp Pro Ile Trp Thr 215 Lys Leu Ala Glu Asp 220 Thr Tyr Ile LeuLeu Glu Arg Ala Ala His Pro Thr Thr Gly Leu Val Pro Asp Trp Gln225 230 235 240His Ala Asp Gly Thr Ala Gly Ala Gly Ser Arg Arg Gly Asp Tyr Ser 245 250 255 His Asp Ala Cys Arg Thr Pro Trp Arg Ile Ala Leu Asp Tyr Leu Trp 260 265 270 Asn Gly Asp Glu Arg Ala Lys Ser Trp Leu Thr Lys Val Thr Asp Trp 275 280 285 Ala His Gly Val Gly Pro Ala Asn Ile Val Asp Gly Tyr Asp Leu Asp 290 295 300 Gly Thr Pro Thr Gly Gln His Asn Asp Met Pro Phe Val Gly Gly Phe305 310 315 320Ala .Val Gly Ala Met Ala Asn Ser Gln Thr Val Val Asn Asp Phe Ala325 330 335 Ala Arg Val Ala Gln Phe Ser Gln Gly Tyr Trp Tyr Gly Ala His Leu 340 345 350 Gly Asn Met Tyr Leu Leu Ala Leu Thr Gly Asn Met Trp Ser Glu Asp 355 360 365 Leu Leu Val Ser Thr Glu Gly Thr Tyr Val Leu Ser Val Thr Val Asp 370 375 380 Gly Arg Gly Thr Val Asn Arg Ser Pro Ser Ala Ile Arg Tyr Ala Ala385 390 395 400Gly Thr Ser Val Thr Leu Thr Ala Glu Pro Ala Val Gly Trp Ser Phe 405 410 415 Asp Gly Trp Ser Gly Ala Gly Leu Ser Gly Ala Glu Pro Ser Val Thr 420 425 430 Val Thr Val 435 Asp Glu Ala Ile His 440 Val Thr Ala His Phe 445 Val Leu AspIle Gly Pro Asn Thr Asn Leu Leu Gln Asn Gly Asp Phe Ser Gly Asp 450 455 460 Leu Ala Pro Trp Ala Leu Asn Thr Trp Thr Gly Ala Ala Ser Gly Ala465 470 475 480Ile Ser Asp Gly Glu Tyr Thr Leu Asn Ile Thr Glu Leu Pro Glu Asn 485 490 495 Val Tirp Asp Val Gln Leu Val Gln Gln Gln Val Pro Leu Gln Glu Gly 500 505 510 Gln Thr Tyr 515 Val Leu Ser Phe Glu 520 Ala Phe Ala Asp Ala 525 Pro Arg AspIle Ser 530 Ile Ile Ala Gln Leu 535 Pro Ala Glu Pro Tyr 540 Thr Thr Tyr HisSer Glu Asp Val Ser Ile Thr Ala Thr Lys Gln Met Tyr Glu Val Glu545 550 555 560Phe Thr Met Glu Asp 565 Glu Ser Asn Leu Asp 570 Ser Arg Ile Gly Phe 575 AsnLeu Gly Gln Ala Thr Gly Asn Val Thr Ile Ser Asn Val Arg Leu Ala 580 585 590 Pro Thr Gly 595 Thr Val Ser Thr Val 600 Leu Pro Leu Gln Arg 605 Ala Arg ThrGly Leu Ser Val Gln Pro Leu Ala Asn Ala Ala Val Asn Leu Gln Phe 610 615 620 Gln Ala Ile Ala Gly Gly Asn Ala Ile Leu Arg Ile Tyr Asp Val Arg625 630 635 640Gly Asn Val Val Glu Gly Ile Leu Leu Gln Pro Ser Ala Asp Gly Val 645 650 655 Tyr Leu His Thr Thr Ala Ser Met Pro Asn Gly Phe Tyr Ile Ala Arg 660 665 670 Val Tyr Gln 675 Asn Gly Val Thr Gln 680 Gln Ala Ser Phe Ala 685 Val Ser Arg

<210> 565

<211> 1515

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 565

atgaacagtt atagagcttt aatgttgggc ttattaggcg gcctgatatt gacgggatgtggagctggtc aggatagccc aacccccggc agctccagtg ccataagttc atccagtgagagcttttcca gcgtgaccag tgagagttct tccagcgcca tatcgagtac tgcctcatctgcgccgccaa actatgaggt gccagagaat aatttcgctg tgaacggcga tgtggagcaggggttggaca actggggggc gataggcgga acggtaagcc gatccacctc tgaaagccgaagcggtgccg ccagcgcatt gattacaggt cgtacagcct cttggaacgg gcttactttttatgtcggtc atctgactca aggcaacgaa tacgaagtgg ccgtctgggt caagctggcttcgggatccc cagataccac attgatcctc accgccaagc gccacgatga tgatgatccgtctaccttct tagagtacac caacattgct atggctaccg cctcagcgag taattggactttgttgcacg gatattacac ccaggcgggc acgccttttc aacactttat tatcgagtcctccgacgata ccgtcagcta ctacgccgat gatttttccg tagcgggtga agtagagccaatcgccggcc aagggcatga gttctttgtc ggtaatatca ctacttcggg taatgtaaggtcggatttta tccagtattg ggatcagatt acgccagaga atgagggtaa atgggagtccgttgagaggg tgcggggtgt gtatgactgg agcggtaccg atcgcgtcta cgcttacgcgcgtgaacata acattcccgt gaaggctcat gcttttgtct ggggcagcca atacccgagttggatcacct ctctcagccc ccaagaacaa gcagaagcca ttgaacgctg gatacgtgac 960tactgtgcgc gataccccga taccgccatg atcgatgtgg ttaacgaagc cacaccagat 1020catgcaccgg ctgagtttgc ccgcagcgcc tttggtgaaa actggattat tcgttcgttc 1080gagttggccc gccagtattg cccaaatgcc attctaatac tcaatgatta caacgtgctt 1140agttggaaca cggaaggatt tatcaatatg gcacgtccgg ttattaacgc cggagtggta 1200gatgcaçttg gcctgcaggc gcacggtttg gccgactggt ctttggcgga tatagagcga 1260aaactcaatg aagtggcggc gttagggttg cccatctata tctctgaata tgatattgaa 1320aagaccaacg atcaagagca gctcgatgtg atgcgcacgc agttcccgct tttttataac 1380catccctcag tagttggcat taccctgtgg ggctacgttg aggggcgaac ctggcggcct 1440ggaaccgggc taattcatga ggacggacgt caccgccccg cgatgacttg gttaatggac 1500tatctgggtc gttag 1515

<210> 566<211> 504<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(60)<220>

<221> DOMÍNIO<222> (70)...(217)<223> Domínio de carbohidrato<220>

<221> DOMÍNIO<222> (203)...(502)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (180) ... (183)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (235)...(238)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (375) . . . (389)

<223> Trp-Asp (WD) marca repetida. Prosite id = PS00678<220>

<221> SITE

<222> (435)...(445)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 566

Met Asn Ser Tyr Arg Ala Leu Met Leu Gly Leu Leu Gly Gly Leu Ile1 5 10 15

Leu Thr Gly Cys Gly Ala Gly Gln Asp Ser Pro Thr Pro Gly Ser Ser

20 25 30

Ser Ala Ile Ser Ser Ser Ser Glu Ser Phe Ser Ser Val Thr Ser Glu

35 40 45

Ser Ser Ser Ser Ala Ile Ser Ser Thr Ala Ser Ser Ala Pro Pro Asn

50 55 60

Tyr Glu Val Pro Glu Asn Asn Phe Ala Val Asn Gly Asp Val Glu Gln65 70 75 80

Gly Leu Asp Asn Trp Gly Ala Ile Gly Gly Thr Val Ser Arg Ser Thr

85 90 95

Ser Glu Ser Arg Ser Gly Ala Ala Ser Ala Leu Ile Thr Gly Arg Thr

100 105 110

Ala Ser Trp Asn Gly Leu Thr Phe Tyr Val Gly His Leu Thr Gln Gly

115 120 125

Asn Glu Tyr Glu Val Ala Val Trp Val Lys Leu Ala Ser Gly Ser Pro

130 135 140

Asp Thr Thr Leu Ile Leu Thr Ala Lys Arg His Asp Asp Asp Asp Pro145 150 155 160

Ser Thr Phe Leu Glu Tyr Thr Asn Ile Ala Met Ala Thr Ala Ser Ala165 170 175Ser Asn Trp Thr Leu Leu His Gly Tyr Tyr Thr Gln Ala Gly Thr Pro 180 185 190 Phe Gln His 195 Phe Ile Ile Glu Ser 200 Ser Asp Asp Thr Val 205 Ser Tyr TyrAla Asp Asp Phe Ser Val Ala Gly Glu Val Glu Pro Ile Ala Gly Gln 210 215 220 Gly His Glu Phe Phe Val Gly Asn Ile Thr Thr Ser Gly Asn Val Arg225 230 235 240Ser Asp Phe Ile Gln Tyr Trp Asp Gln Ile Thr Pro Glu Asn Glu Gly 245 250 255 Lys Trp Glu Ser Val Glu Arg Val Arg Gly Val Tyr Asp Trp Ser Gly 260 265 270 Thr Asp Arg 275 Val Tyr Ala Tyr Ala 280 Arg Glu His Asn Ile 285 Pro Val LysAla His 290 Ala Phe Val Trp Gly 295 Ser Gln Tyr Pro Ser 300 Trp Ile Thr SerLeu Ser Pro Gln Glu Gln Ala Glu Ala Ile Glu Arg Trp Ile Arg Asp305 310 315 320Tyr Cys Ala Arg Tyr Pro Asp Thr Ala Met Ile Asp Val Val Asn Glu 325 330 335 Ala Thr Pro Asp 340 His Ala Pro Ala Glu 345 Phe Ala Arg Ser Ala 350 Phe GlyGlu Asn Trp 355 Ile Ile Arg Ser Phe 360 Glu Leu Ala Arg Gln 365 Tyr Cys ProAsn Ala 370 Ile Leu Ile Leu Asn 375 Asp Tyr Asn Val Leu 380 Ser Trp Asn ThrGlu Gly Phe Ile Asn Met Ala Arg Pro Val Ile Asn Ala Gly Val Val385 390 395 400Asp Ala Leu Gly Leu Gln Ala His Gly Leu Ala Asp Trp Ser Leu Ala 405 410 415 Asp Ile Glu Arg Lys Leu Asn Glu Val Ala Ala Leu Gly Leu Pro Ile 420 425 430 Tyr Ile Ser Glu Tyr Asp Ile Glu Lys Thr Asn Asp Gln Glu Gln Leu 435 440 445 Asp Val 450 Met Arg Thr Gln Phe 455 Pro Leu Phe Tyr Asn 460 His Pro Ser ValVal Gly Ile Thr Leu Trp Gly Tyr Val Glu Gly Arg Thr Trp Arg Pro465 470 475 480Gly Thr Gly Leu Ile His Glu Asp Gly Arg His Arg Pro Ala Met Thr

485 490 495

Trp Leu Met Asp Tyr Leu Gly Arg500

<210> 567

<211> 1158

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 567

atgacttttt cgcgccggaa ttttatctgg ggtactgcgg ctgttttggc cgctacgcaactcaaagcac gcgccttggc cgctgcggtg gccaacacgg gtataaaaga tgtgttcaaaggtgactttt ttatcggcac cgccatcagc aatgaagcgc tggagaagcc cgacaccgaacttcttgcgc tgatcagtcg agaattcaat gccataaccg ctgaaaactg tatgaagtgggagcccattc ggccccagtt agaccaatgg aactgggagt tggccgaccg atttgtcgattttggcctaa aaaacaacat gtacgtcgtg ggccacacac tgatctggca cagccaggcaccggatcaca tatatctgga cgccgacggc aaacccaaca accgcttggc gcaactggcggtcatggaag agcacattcg caccctggcg ggccgctaca aaggcaaaat cgacgcctgggacgtggtga acgaggccgt agaggacgac ggcagttggc ggcaaaccgg ctggtatcgcaatgtggggc cggaatacgt tgcccacgca ttccgcctgg cggccgaggt agaccccaatgccaagctgc tctacaacga ctacaacgcc gccgtgccga caaaacgcga ggcgattatttccgttgtca aaggtataca gcgcgaaaag gcgccgattc acggtgtggg catgcagggccatatcagcc tgagccaccc ggattttggc gaatttgaaa agtcgattgt cgaatacgccaaactcggcg taaaagtgca tatcaccgaa ttggatatcg acgtgctgcc gctggcgtggaatttgagcg cagaaatttc caaccgcttt gagtaccgac cggaaatgga cccctaccgcgacggcctac cagcagaggt ggaaaaagcc ctggccgacc gctacgaagc gctgtttaaaatcctgctga aacaccgcga caaagttgaa cgcgttacca cctggggcac acacgacggcgaaacctggc tgaacggctt ccctattccc ggccgagtca actacccgct gctgttcgaccgcaaccagc aaccgaaaga agcctaccac cgcttgattc agctcagacg gcaccgccgc 1140taccgaaacc ccgcttag 1158

<210> 568<211> 385<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(28)<220>

<221> DOMÍNIO<222> (34)...(376)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (267)...(277)

<223> Família 10 ativa site de hidrolases glicosila. Prosite íd = PS00591<220>

<221> SITE

<222> (285)...(288)

<223> N-glicosilação site. Prosite id = PS00001<400> 568

Met Thr Phe Ser Arg Arg Asn Phe Ile Trp Gly Thr Ala Ala Val Leu1 5 10 15 Ala Ala Thr Gln 20 Leu Lys Ala Arg Ala 25 Leu Ala Ala Ala Val 30 Ala AsnThr Gly Ile Lys Asp Val Phe Lys Gly Asp Phe Phe Ile Gly Thr Ala 35 40 45 Ile Ser 50 Asn Glu Ala Leu Glu 55 Lys Pro Asp Thr Glu 60 Leu Leu Ala LeuIle Ser Arg Glu Phe Asn Ala Ile Thr Ala Glu Asn Cys Met Lys Trp65 70 75 80Glu Pro Ile Arg Pro Gln Leu Asp Gln Trp Asn Trp Glu Leu Ala Asp 85 90 95 Arg Phe Val Asp Phe Gly Leu Lys Asn Asn Met Tyr Val Val Gly His 100 105 110 Thr Leu Ile Trp His Ser Gln Ala Pro Asp His Ile Tyr Leu Asp Ala 115 120 125 Asp Gly Lys Pro Asn Asn Arg Leu Ala Gln Leu Ala Val Met Glu Glu 130 135 140 His Ile Arg Thr Leu Ala Gly Arg Tyr Lys Gly Lys Ile Asp Ala Trp145 150 155 160Asp Val Val Asn Glu Ala Val Glu Asp Asp Gly Ser Trp Arg Gln Thr 165 170 175 Gly Trp Tyr Arg 180 Asn Val Gly Pro Glu 185 Tyr Val Ala His Ala 190 Phe ArgLeu Ala Ala 195 Glu Val Asp Pro Asn 200 Ala Lys Leu Leu Tyr 205 Asn Asp TyrAsn Ala 210 Ala Val Pro Thr Lys 215 Arg Glu Ala Ile Ile 220 Ser Val Val LysGly Ile Gln Arg Glu Lys Ala Pro Ile His Gly Val Gly Met Gln Gly225 230 235 240His Ile Ser Leu Ser 245 His Pro Asp Phe Gly 250 Glu Phe Glu Lys Ser 255 IleVal Glu Tyr Ala Lys Leu Gly Val Lys Val His Ile Thr Glu Leu Asp 260 265 270 Ile Asp Val Leu Pro Leu Ala Trp Asn Leu Ser Ala Glu Ile Ser Asn 275 280 285 Arg Phe Glu Tyr Arg Pro Glu Met Asp Pro Tyr Arg Asp Gly Leu Pro 290 295 300 Ala Glu Val Glu Lys Ala Leu Ala Asp Arg Tyr Glu Ala Leu Phe Lys305 310 315 320Ile Leu Leu Lys His Arg Asp Lys Val Glu Arg Val Thr Thr Trp Gly 325 330 335 Thr His Asp Gly Glu Thr Trp Leu Asn Gly Phe Pro Ile Pro Gly Arg340 345 350

Val Asn Tyr Pro Leu Leu Phe Asp Arg Asn Gln Gln Pro Lys Glu Ala

355 360 365

Tyr His Arg Leu Ile Gln Leu Arg Arg His Arg Arg Tyr Arg Asn Pro370 375 380

Ala385

<210> 569<211> 1062<212> DNA<213> Desconhecido<220><223> Obtido para amostra ambiental<400> 569

ttgattcggg ctatcgaaag tcttggagaa aacggtcctg agaatctgat catcaaggccactccctgga caccgcccaa caactggaaa acgggatacc ctaatgccgg actaccagcctatggcggac gcctgaaaca tgaacactat gcagattatg ccgatgtcct ggccgatttcagcctgcagt acgaagccaa catgggccgc cctctgaatg tgatttctgt ccaaaacgaaccggactatg ttcctaccag ctatgaatcc tgcggctgga ctgccaatga aatccgcgattttctaaaaa taatgggtcc ggtattcgca gccaaaaatg tcgatccgga cttgcgaatcatggctccgg agtccatgca cctgaaagaa gccatgatcc tgccgacctt gcgcgatccggaagcccggg cagtactgga tattgtcgga ctgcatcagt ataaccacga tgaggagttcaatatgggag ctatcgagct tccaactgtc aaggagcatg gactgccgct gtggcagacagaggtttcga cgggagagcg taacgacccc agcatcaagg atggagttta ctgggccaaattgattcatc tggatatgac tgttcccgag gtcaatgcct tcctgtactg gtggttatggtccaccaaca atgattccaa gggcaacctg ataaacatcc gggatggagt acttgagcttaacaaacgcc tgtttacaat gggccagttc agccggttta tacgtccggg ctgggaacgcgtggaatcgg atcatcgccc gataatggga ctgtatacta ccatgtatcg caaccccgaaagtgatgagt tcgcgttggt tatcgtaaac gaacgcaata atccggtcga cctggccatgaatgtggccg gagtcgaggg ttttcaggat cttgaactct ggcgaaccag tgccacagaaaacctggaat tgcaacgtcg cggtgcgcgg gccgaaggga atgttctaca ggttcaatcaccggcaatgt cggtatcgac tgtatacggg cgggttcagt aa<210> 570<211> 353<212> PRT<213> Desconhecido<220><223> Obtido para amostra ambiental<220><221> SITE<222> (227)...(230)<223> N-glicosilação site. Prosite id = PS00001<400> 570

Met Ile Arg Ala Ile Glu Ser Leu Gly Glu Asn Gly Pro Glu Asn Leu15 10 15

Ile Ile Lys Ala Thr Pro Trp Thr Pro Pro Asn Asn Trp Lys Thr Gly

20 25 30

Tyr Pro Asn Ala Gly Leu Pro Ala Tyr Gly Gly Arg Leu Lys His Glu

35 40 45

His Tyr Ala Asp Tyr Ala Asp Val Leu Ala Asp Phe Ser Leu Gln Tyr

50 55 60

Glu Ala Asn Met Gly Arg Pro Leu Asn Val Ile Ser Val Gln Asn Glu

65

70 75 80

Pro Asp Tyr Val Pro Thr Ser Tyr Glu Ser Cys Gly Trp Thr Ala Asn

85 90 95

Glu Ile Arg Asp Phe Leu Lys Ile Met Gly Pro Val Phe Ala Ala Lys

100 105 HO

Asn Val Asp Pro Asp Leu Arg Ile Met Ala Pro Glu Ser Met His Leu

120 125

Ile Leu Pro Thr Leu Arg Asp Pro Glu Ala Arg Ala135 140

Val Leu Asp Ile Val Gly Leu His Gln Tyr Asn His Asp Glu Glu Phe145 150 155 160

Asn Met Gly Ala Ile Glu Leu Pro Thr Val Lys Glu His Gly Leu Pro

165 170 175

Leu Trp Gln Thr Glu Val Ser Thr Gly Glu Arg Asn Asp Pro Ser Ile180 185 190

115

Lys Glu Ala Met130

6012018024030036042048054060066072078084090096010201062Lys Asp

Pro Glu210Asp Ser225

Asn Lys

Gly Trp

Thr Thr

Val Asn290Val Glu305

Asn LeuGln ValGln

Gly Val Tyr195

Val Asn Ala

Lys Gly Asn

Arg Leu Phe245

Glu Arg Val260Met Tyr Arg275

Glu Arg Asn

Gly Phe Gln

Glu Leu Gln325

Gln Ser Pró340

Trp Ala

Phe Leu215Leu Ile230

Thr Met

Glu Ser

Asn Pro

Asn Pro295Asp Leu310

Arg ArgAla Met

Lys Leu200

Tyr Trp

Asn Ile

Gly Gln

Asp His265Glu Ser280

Val Asp

Glu Leu

Gly Ala

Ser Val345

Ile His

Trp Leu

Arg Asp235Phe Ser250

Arg Pro

Asp Glu

Leu Ala

Trp Arg315Arg Ala330

Ser Thr

Leu Asp205Trp Ser220

Gly Val

Arg Phe

Ile Met

Phe Ala285Met Asn300

Thr SerGlu GlyVal Tyr

Met Thr Val

Thr Asn Asn

Leu Glu Leu240

Ile Arg Pro

255Gly Leu Tyr270

Leu Val Ile

Val Ala Gly

Ala Thr Glu320

Asn Val Leu

335Gly Arg Val350

<210> 571<211> 1149<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 571

atgaataatt ccataaaaat tgttctcggt cttatagtgc tggtatttcttgcagtggta attcatccga tgataacctt gcactcaaga ctgtattcgacatattggaa cggcattaag cagtaatcag atatacggat atgaccggcactcacaaaaa aacattttaa cacgataact gctgagaatg atacaaaatgcaccctgagc cgggagtatt tgattttgat gctaccgacc ggtttgtcgaaagcacgata tgtttttggt cggccataca cttgtttggc acagccagacgtttttgaag atgaaaacgg aaatactata agccgcgatg cattgcttgagatcatattc ataccgtcgt cggccggtac aaaggaagaa tgcacggttgaatgaagcgt tgaacgaaga cggcacgctg cgtgaatctc cctggtatcgagggagtacc tggtgaaagc attcgagtat gcacgagaag ccgatcccgatattacaacg attactccct tgaaaatccc gataagcggg aaggtgcgatagatacctgc aggaacaggg tgcacctatt accggaatcg gaacgcagggctcgattggc ccgagctcga agagatagaa aaaactatag tcgatttcgcatcgatgtca tggtgacaga acttgatatc gatgttctgc ctcctgcattggtgccgaca tcgcaatgcg tgcggagctc gaagaacgcc tgaatccgtactgcccgatg aagtcgatga agaacttgcc cggcgctatc gcgatatattgtccgacatc gcgageatat aacaagagtg acattttggg gcgttaccgatggaaaaata actggccggt acagggaaga acaaattacc cgctattattgggcagccga agactgcttt ttattctgtc gttgaaacgg ccaatgagttaattattaa<210> 572<211> 382<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(25)<220>

<221> DOMÍNIO<222> (31)...(374)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (2)...(5)

<223> N-glicosilação site. Prosite id = PS00001<220>

attacccgctagatatttttgggtatcgaaggaaaatatcattcggtgaagccccggtggacgaatgcgcggatgtggttaattatcggatgcagaactatcgattggtgtcactttatgcgcgcttggtcgactatcagtcccgacggtcgaaatttatcggcaattcacgatcgcaacgcttgaggat

601201802403003604204805406006607207808409009601020108011401149<221> SITE<222> (24)...(27)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (74) ... (77)

<223> N-glicosilação site. Prosite id = PS00001<400> 572

Met Asn Asn Ser Ile Lys Ile Val Leu Gly Leu Ile Val Leu Val Phe1 5 10 15 Leu Leu Pro Ala Cys Ser Gly Asn Ser Ser Asp Asp Asn Leu Ala Leu 20 25 30 Lys Thr Val Phe Glu Asp Ile Phe His Ile Gly Thr Ala Leu Ser Ser 35 40 45 Asn Gln Ile Tyr Gly Tyr Asp Arg Gln Gly Ile Glu Leu Thr Lys Lys 50 55 60 His Phe Asn Thr Ile Thr Ala Glu Asn Asp Thr Lys Trp Glu Asn Ile65 70 75 80His Pro Glu Pro Gly Val Phe Asp Phe Asp Ala Thr Asp Arg Phe Val 85 90 95 Glu Phe Gly Glu Lys His Asp Met Phe Leu Val Gly His Thr Leu Val 100 105 110 Trp His Ser Gln Thr Pro Arg Trp Val Phe Glu Asp Glu Asn Gly Asn 115 120 125 Thr Ile Ser Arg Asp Ala Leu Leu Glu Arg Met Arg Asp His Ile His 130 135 140 Thr Val Val Gly Arg Tyr Lys Gly Arg Met His Gly Trp Asp Val Val145 150 155 160Asn Glu Ala Leu Asn Glu Asp Gly Thr Leu Arg Glu Ser Pro Trp Tyr 165 170 175 Arg Ile Ile Gly Arg Glu Tyr Leu Val Lys Ala Phe Glu Tyr Ala Arg 180 185 190 Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr Asn Asp Tyr Ser Leu Glu 195 200 205 Asn Pro Asp Lys Arg Glu Gly Ala Ile Arg Leu Val Arg Tyr Leu Gln 210 215 220 Glu Gln Gly Ala Pro Ile Thr Gly Ile Gly Thr Gln Gly His Phe Met225 230 235 240Leu Asp Trp Pro Glu Leu Glu Glu Ile Glu Lys Thr Ile Val Asp Phe 245 250 255 Ala Ala Leu Gly Ile Asp Val Met Val Thr Glu Leu Asp Ile Asp Val 260 265 270 Leu Pro Pro Ala Phe Asp Tyr Gln Gly Ala Asp Ile Ala Met Arg Ala 275 280 285 Glu Leu Glu Glu Arg Leu Asn Pro Tyr Pro Asp Gly Leu Pro Asp Glu 290 295 300 Val Asp Glu Glu Leu Ala Arg Arg Tyr Arg Asp Ile Phe Glu Ile Tyr305 310 315 320Val Arg His Arg Glu His Ile Thr Arg Val Thr Phe Trp Gly Val Thr 325 330 335 Asp Gly Asn Ser Trp Lys Asn Asn Trp Pro Val Gln Gly Arg Thr Asn 340 345 350 Tyr Pro Leu Leu Phe Asp Arg Asn Gly Gln Pro Lys Thr Ala Phe Tyr 355 360 365 Ser Val Val Glu Thr Ala Asn Glu Leu Leu Glu Asp Asn Tyr 370 375 380 <210> 573

<211> 1326

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 573

gtgaaactgg cggcgggtga gcccaatgcg gtgatcaaag ttacaggtaa gcgggaaggc 60

gagagctcca gttacgaaga gtacgccgag gtggggaccg ccctggcaac tgccgatagc 120tggaccgaaa tcaccggtac ctatattcca gagagtgcca gcccctttga gtactttatt 180atagaaactc aggaaggtga agccgatgtc agcttttatg tggacgcatt ttcggtagcc 240ggtgaggtga ccgcgcccac tccaacacct agtcagccgc cagtgacacctctggcttgg ctagtctggt ggactttccc gtgggggttg ctgtggcggtgcgaataacg atttccttaa tgattcgcag caacaggcca ttgtgcgtgagaaatcgtcg ctgaaaatca gatgaagatg gaatacttcg aaagtgactaagagcagatc aactggtaga ttgggccagt cagaatggta ttcaggttcactggtttggc acgcgcagcc agcagcgtgg gtaagcactg ccacgggtagcagcgctatg tggatcatgt ccgaggagta gcctctcgct acgctggttctgggatgtgg tgaatgaggc cttgactgac aatgatgtgt caccaggtggcgccagtcag cattttatga gcagtttggt ggccctgaat tcattgatatgaagcgcgcg aagcggaccc caatgctctg ttgtactaca acgattacaagggttggata aaaccgacgg gctgatagag ttgcttgagc ggttggttgccccatcgatg gggtagggtt ccaaatgcac gtcttattgg attggccggaatccgagaat cttgggagcg ggcgctggcg gttcatccag acctgttgctgaattggatg tacgtatcaa taatccctac ggtaacacca ttgtccactcgattgcgaca atggctgtca agggttcgaa ttgcaagccg agcgctatcggaagcttatt tcgaggtggt gcctccccat cgtcgtggtg gtataagcgtgcggaccact acagctggta ctacacacac gaaggctacg tagactggccgacagcaaca tgcagcctaa acctgcgtat caagctgttt atgaggcactcagtag<210> 574<211> 441<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (100)...(437)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (128)...(131)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (363)...(366)

<223> N-glicosilação site. Prosite id = PS00001<400> 574

Met Lys Leu Ala Ala Gly Glu Pro Asn Ala Val Ile Lys Val1 5 10

Lys Arg Glu Gly Glu Ser Ser Ser Tyr Glu Glu Tyr Ala Glu

20 25 30

Thr Ala Leu Ala Thr Ala Asp Ser Trp Thr Glu Ile Thr Gly

35 40 45

Ile Pro Glu Ser Ala Ser Pro Phe Glu Tyr Phe Ile Ile Glu

50 55 60

Glu Gly Glu Ala Asp Val Ser Phe Tyr Val Asp Ala Phe Ser65 70 75

Gly Glu Val Thr Ala Pro Thr Pro Thr Pro Ser Gln Pro Pro

85 90

Pro Pro Ser Gly Ser Gly Leu Ala Ser Leu Val Asp Phe Pro100 105 110

Val Ala Val Ala Val Ala Ser Phe Ala Asn Asn Asp Phe Leu

115 120 125

Ser Gln Gln Gln Ala Ile Val Arg Asp Asn Phe Asn Glu Ile

130 135 140

Glu Asn Gln Met Lys Met Glu Tyr Phe Glu Ser Asp Tyr Ser145 150 155

Arg Ala Asp Gln Leu Val Asp Trp Ala Ser Gln Asn Gly Ile

165 170

His Gly His Ala Leu Val Trp His Ala Gln Pro Ala Ala Trp180 185 190

Thr Ala Thr Gly Ser Asp Phe Arg Gln Arg Tyr Val Asp His

195 200 205

Gly Val Ala Ser Arg Tyr Ala Gly Ser Val Val Ser Trp Asp

210 215 220

Asn Glu Ala Leu Thr Asp Asn Asp Val Ser Pro Gly Gly Asn

gccgtcgggttgccagtttttaatttcaatctctaatccctggtcacgcttgacttccgcggttgtgagtaaactattaccgcgttccgccatcgaaaatcaatgatgtatatatcgaccgaaaattaccgaatcgaagtggaaattatactggggtattgcttatgtggcagtcagggg

Thr Gly15

Val Gly

Thr Tyr

Thr Gln

Val Ala80

Val Thr95

Val Gly

Asn Asp

Val Ala

Asn Pro160Gln Val175

Val SerVal ArgVal ValTyr Tyr

3003604204805406006607207808409009601020108011401200126013201326225 230 235 240Arg Gln Ser Ala Phe Tyr Glu Gln Phe Gly Gly Pro Glu Phe Ile Asp 245 250 255 Ile Ala Phe Arg 260 Glu Ala Arg Glu Ala 265 Asp Pro Asn Ala Leu 270 Leu TyrTyr Asn Asp Tyr Asn Ile Glu Asn Gly Leu Asp Lys Thr Asp Gly Leu 275 280 285 Ile Glu 290 Leu Leu Glu Arg Leu 295 Val Ala Asn Asp Val 300 Pro Ile Asp GlyVal Gly Phe Gln Met His Val Leu Leu Asp Trp Pro Asp Ile Ser Thr305 310 315 320Ile Arg Glu Ser Trp Glu Arg Ala Leu Ala Val His Pro Asp Leu Leu 325 330 335 Leu Lys Ile Thr Glu Leu Asp Val Arg Ile Asn Asn Pro Tyr Gly Asn 340 345 350 Thr Ile Val 355 His Ser Asn Arg Ser 360 Asp Cys Asp Asn Gly 365 Cys Gln GlyPhe Glu 370 Leu Gln Ala Glu Arg 375 Tyr Arg Glu Ile Ile 380 Glu Ala Tyr PheGlu Val Val Pro Pro His Arg Arg Gly Gly Ile Ser Val Trp Gly Ile385 390 395 400Ala Asp His Tyr Ser 405 Trp Tyr Tyr Thr His 410 Glu Gly Tyr Val Asp 415 TrpPro Leu Met Trp 420 Asp Ser Asn Met Gln 425 Pro Lys Pro Ala Tyr 430 Gln AlaVal Tyr Glu Ala Leu Ser Gln Gly Gln 435 440

<210> 575<211> 876<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 575

atgagtaaaa gtaagactaa atggattgga aatatatggt ataatgggga tacacctactaactttgctg actattggaa ccaaataact cctgaaaatg ccactaagtg ggcgtcatgtgaaccacagc agagtgtata caatttcaat acagccaaaa caatgtacaa ttactgtaagtccaatgaaa tgcctttcaa gttccataca ttaatctggg gaggacagta tccagattgggtaaacaatc tggatactgc aaatagaaaa atagaagttg aaaattggat taaaaatgctggatcaaact ttcctaatgc agagttggtt gatgttgtaa acgaagctat gccagggcataatccaccta gttggaaaaa tgacatcggt ggtgacaacg gtctttatgg cactggttgggattgggtag tgtggtcatt tgaaaaagcc cgcaaatatt tccccaattc taagttattgatcaatgact ataacgttct ttcagattac agcagttgta ttgatacata tatcactgtaatcaatatat tgaaatctag aggactgatt gatggtatcg gctgtcaatc tcacggtcttgaaaatgtaa atgtcgcaaa tgttaagtca aaactggata gacttgcagc tacaggattatcagtgtata tttcagaatt agatctcaat attgcagatg atactgccca gaaaaataagatgcaggaac tttttcctgt actctatgaa cattctgcag taaaaggcgt taccttatggggttatatac aaggccatac atggatcaca aatagttatc tattgcgtag taacggtacagaaagacctg cgcttacttg gctgaagcag tattag<210> 576<211> 291<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (1) ... (291)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (33)...(36)

<223> N-glicosilação site. Prosite id = PS00001<22 0>

<221> SITE

<222> (222) .. . (232)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id =<220>

<221> SITE<222> (282) . . . (285)

<223> N-glicosilação site. Prosite id = PS00001<400> 576

Met Ser Lys Ser Lys Thr Lys Trp Ile Gly Asn Ile Trp Tyr Asn Gly1 5 10 15

Asp Thr Pro Thr Asn Phe Ala Asp Tyr Trp Asn Gln Ile Thr Pro Glu

20 25 30

Asn Ala Thr Lys Trp Ala Ser Cys Glu Pro Gln Gln Ser Val Tyr Asn

35 40 45

Phe Asn Thr Ala Lys Thr Met Tyr Asn Tyr Cys Lys Ser Asn Glu Met

50 55 60

Pro Phe Lys Phe His Thr Leu Ile Trp Gly Gly Gln Tyr Pro Asp Trp65 70 75 80

Val Asn Asn Leu Asp Thr Ala Asn Arg Lys Ile Glu Val Glu Asn Trp

85 90 95

Ile Lys Asn Ala Gly Ser Asn Phe Pro Asn Ala Glu Leu Val Asp Val

100 105 HO

Val Asn Glu Ala Met Pro Gly His Asn Pro Pro Ser Trp Lys Asn Asp

115 120 125

Ile Gly Gly Asp Asn Gly Leu Tyr Gly Thr Gly Trp Asp Trp Val Val

130 135 140

Trp Ser Phe Glu Lys Ala Arg Lys Tyr Phe Pro Asn Ser Lys Leu Leu145 150 155 160

Ile Asn Asp Tyr Asn Val Leu Ser Asp Tyr Ser Ser Cys Ile Asp Thr

165 170 175

Tyr Ile Thr Val Ile Asn Ile Leu Lys Ser Arg Gly Leu Ile Asp Gly

180 185 190

Ile Gly Cys Gln Ser His Gly Leu Glu Asn Val Asn Val Ala Asn Val

195 200 205

Lys Ser Lys Leu Asp Arg Leu Ala Ala Thr Gly Leu Ser Val Tyr Ile

210 215 220

Ser Glu Leu Asp Leu Asn Ile Ala Asp Asp Thr Ala Gln Lys Asn Lys225 230 235 240

Met Gln Glu Leu Phe Pro Val Leu Tyr Glu His Ser Ala Val Lys Gly

245 250 255

Val Thr Leu Trp Gly Tyr Ile Gln Gly His Thr Trp Ile Thr Asn Ser

260 265 270

Tyr Leu Leu Arg Ser Asn Gly Thr Glu Arg Pro Ala Leu Thr Trp Leu

275 280 285 290

Lys Gln Tyr

<210> 577<211> 642<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 577

atgtttatgt taagtaagaa aattttgatg gtgttattaa caatttcaat gagttttattagcttattta cagtaaccgc gtatgcagct tcgacagact actggcaaaa ttggactgat 120ggtggtggga cagtaaatgc taccaatgga tctgatggca attacagtgt ttcatggaca 180aattgcggga attttgttgt cggtaaaggc tggactaccg gatcagcatc tagggtaata 240aactacaatg ccggcgcctt ttcgccgtcc ggtaatgggt atttggctct ctatgggtgg 300acgagaaact cactcataga atattacgtt gttgatagct ggggtactta tagacctact 360ggaacttata agggcactgt gactagtgat ggggggacat atgacatata tacgactaca 420cgaactaacg caccttccat tgacggaact gcaactttta cccagttctg gagtgtaagg 480cagtcgaaga gaccgaccgg taccaacaac accattactt ttagcaacca cgttaacgca 540tggaagagta aagggatgaa tttggggagt agttggtctt atcaggtatt agcgacagag 600ggatatcaaa gtagtgggta ctctaatgta ácggtctggt aa 642

<210> 578<211> 213<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(29)<220><221> DOMÍNIO

<222> (29)...(212)

<223> Família 11 de glicosila hidrolases<220>

<221> SITE<222> (37)...(40)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (46)...(49)<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (54)... (57)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (105) ... (115)

<223> Família 11 de glicosila hidrolases ativa site marca 1. Prosite idPS00776

<220>

<221> SITE

<222> (171)...(174)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (200)...(211)

<221> SITE

<222> (212)...(215)

<223> N-glicosilação site. Prosite id = PS00001

<400> 578

Met Phe Met Leu Ser Lys Lys Ile Leu Met Val Leu Leu Thr Ile Ser 1 5 10 15 Met Ser Phe Ile 20 Ser Leu Phe Thr Val 25 Thr Ala Tyr Ala Ala 30 Ser Thr Asp Tyr Trp 35 Gln Asn Trp Thr Asp 40 Gly Gly Gly Thr Val 45 Asn Ala Thr Asn Gly 50 Ser Asp Gly Asn Tyr 55 Ser Val Ser Trp Thr 60 Asn Cys Gly Asn Phe Val Val Gly Lys Gly Trp Thr Thr Gly Ser Ala Ser Arg Val Ile 65 70 75 80 Asn Tyr Asn Ala Gly Ala Phe Ser Pro Ser Gly Asn Gly Tyr Leu Ala 85 90 95 Leu Tyr Gly Trp 100 Thr Arg Asn Ser Leu 105 Ile Glu Tyr Tyr Val 110 Val Asp Ser Trp Gly Thr Tyr Arg Pro Thr Gly Thr Tyr Lys Gly Thr Val Thr 115 120 125 Ser Asp 130 Gly Gly Thr Tyr Asp 135 Ile Tyr Thr Thr Thr 140 Arg Thr Asn Ala Pro Ser Ile Asp Gly Thr Ala Thr Phe Thr Gln Phe Trp Ser Val Arg 145 150 155 160 Gln Ser Lys Arg Pro Thr Gly Thr Asn Asn Thr Ile Thr Phe Ser Asn 165 170 175 His Val Asn Ala 180 Trp Lys Ser Lys Gly 185 Met Asn Leu Gly Ser 190 Ser Trp Ser Tyr Gln Val Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Tyr Ser 195 200 205 Asn Val 210 Thr Val Trp

<210> 579<211> 1158<212> DNA<213> Desconhecido<220><223> Obtido para amostra ambiental<400> 579

atgataattt caaagaagaa tttagttaga ggatccatta tcggattaat tccgattgta 60atattcatgt tggcatatga tatggatgga gtaagtaatg actatcccgc tctgagggaa 120gtattcggag atgcaatatt aatcggaaca gcacttaata atgcacagat atataatcag 180gatcgtcgcg gtatcgaact tgtgaaaaaa cattttaatt ccattacccc ggagaatgtt 240acaaagtggg agtttattca tcctcaatca ggtgtctata atttcgatgc agcagatcga 300tttgttgaat tcgggaagaa gaacgacatg tttatggttg gtcacacgct tgtatggcat 360agtcagactc cccgttgggt ttttgaagat gaagatggaa atccacttga tcgcgacgca 420ttattagatc ggatgcgcga gcatattcat actgttgtgg gaagatataa gggaagaatt 480catggctggg acgttgtaaa tgaagcttta aatgatgacg gtacattgag ggagtcacca 540tggtatcgta ttatcggaga agattatctc ctcaaggcat ttgaatatgc acatgaagcg 600gaccctgatg ctgaattata ctataatgat tactcattgg agaatcccga aaaacgtgaa 660ggagctgtac gattagtccg ctatttacag gagcaaggag cgccgattac cggaatcggg 720acgcagggac attacatgct tgattggccc gaccttcatg aaattgaaaa aacgataact 780gattttgccg ctcttggtat agatgtgatg ataacagaac ttgatattga tgttcttcct 840cctgcatttg gatatatggg agccgatatt tcggttcgcg ccgagttgga ggagcagctt 900aatccatatc ccgatggatt acccgatgag gttcaagaag agcttgcaca gcgctatcgt 960gatatttttg aagttttcct caagcatagt gatgtgataa caagagtcac attctggggt 1020gtaaccgacg gggattcatg gaaaaataat tggccagtcc ggggaagagc gaattatcct 1080ctgctgttcg atcgtgaatg gcagccaaag cctgcattct tttcggtaat agaattggtt 1140caggttgatc cggaataa 1158

<210> 580<211> 385<212> PRT<213> Desconhecido<220><223> Obtido para amostra ambiental<220><221> DOMÍNIO<222> (37)...(380)<223> Família 10 de hidrolase glicosila<220><221> SITE<222> (80)...(83)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (270)...(280)<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 580

Met Ile Ile Ser Lys Lys Asn Leu Val Arg Gly Ser Ile Ile Gly Leu1 5 10 15

Ile Pro Ile Val Ile Phe Met Leu Ala Tyr Asp Met Asp Gly Val Ser20 25 30

Asn Asp Tyr Pro Ala Leu Arg Glu Val Phe Gly Asp Ala Ile Leu Ile35 40 45

Gly Thr Ala Leu Asn Asn Ala Gln Ile Tyr Asn Gln Asp Arg Arg Gly50 55 60

Ile Glu Leu Val Lys Lys His Phe Asn Ser Ile Thr Pro Glu Asn Val65 70 75 80

Thr Lys Trp Glu Phe Ile His Pro Gln Ser Gly Val Tyr Asn Phe Asp85 90 95

Ala Ala Asp Arg Phe Val Glu Phe Gly Lys Lys Asn Asp Met Phe Met100 105 110

Val Gly His Thr Leu Val Trp His Ser Gln Thr Pro Arg Trp Val Phe115 120 125

Glu Asp Glu Asp Gly Asn Pro Leu Asp Arg Asp Ala Leu Leu Asp Arg130 135 140

Met Arg Glu His Ile His Thr Val Val Gly Arg Tyr Lys Gly Arg Ile145 150 155 160

His Gly Trp Asp Val Val Asn Glu Ala Leu Asn Asp Asp Gly Thr Leu165 170 175Arg Glu Ser Pro Trp Tyr Arg Ile Ile Gly Glu

180 185

Ala Phe Glu Tyr Ala His Glu Ala Asp Pro Asp195 200

Asn Asp Tyr Ser Leu Glu Asn Pro Glu Lys Arg210 215

Leu Val Arg Tyr Leu Gln Glu Gln Gly Ala Pro225 230 235

Thr Gln Gly His Tyr Met Leu Asp Trp Pro Asp 245 250

Lys Thr Ile Thr Asp Phe Ala Ala Leu Gly Ile

260 265

Glu Leu Asp Ile Asp Val Leu Pro Pro Ala Phe275 280

Asp Ile Ser Val Arg Ala Glu Leu Glu Glu Gln290 295

Asp Gly Leu Pro Asp Glu Val Gln Glu Glu Leu305 310 315

Asp Ile Phe Glu Val Phe Leu Lys His Ser Asp

20 325 330

Thr Phe Trp Gly Val Thr Asp Gly Asp Ser Trp

340 345

Val Arg Gly Arg Ala Asn Tyr Pro Leu Leu Phe355 360

Pro Lys Pro Ala Phe Phe Ser Val Ile Glu Leu370 375

Glu385

<210> 581<211> 1593<212> DNA<213> Desconhecido<220><223> Obtido para amostra ambiental<400> 581

atgagtatca ggaatttttt cacagcaact gttatacttgacctggggtc agacgtggac cagaagtaca attcaaaacgctctggaatc aatacgaacg gggcacggtc aatatgagaagaggcttcgt ggcaaggaac gtttaatgtt cttttccgtt40 tcaagtacca cgactgccgc atccctcaat ggcattacctaattccaccg acaatgtgaa aatgctgggt gtgtatggctgcttcaccgg caaacttctc taaccaaatt gaatactacatggaatccgg cctccggagc caccaacgca agaaagatggattgtgtatg aattttgggt cggcgacaga atcaatcaacaatttcaagc aatacttcag tgtgcccaag aacacccgcgattgacgtgg ccaggcactt tcaggcgtgg cacgataacgccgctttatg aaattgccat gaaggtggaa tcttttaccgggtagtgcta cagtctcacg ggctatactc accctcggtgggcactaccc cggttcagca cacactcaca accaatgtttgtgaccagaa gcccaaacac caatacatac gctccgaatgactcccaact ccggctggag atttgtaggt tggagtggtgcccaccaccg taaccatgag cgaaaatcgc acagttaccgggtgaaagta ccagcaacct gattcaagat ggcgatttcttccgatgaag gcgcttcatg gagactcggg cagggacaatacatcaagtg tgagcaatgg aactgctact atcaatgttatatcagccac aacttgttca atatggagtc cctcttgatgtcttttaccg caagagcggc aacggccagg tctattgaaggaaccatggg ccaattatgc atccactgag tttgacttaagagttcgtat tcaccatgac ccaagcaact gatccagcagggtcaggcaa ccggtaatgt ccatataagc gatgtaaaacacaacatcaa tatcgaacaa catcaacacc gggaacaaagagaatgttaa gtatcgcagc gcctgtcgaa gga<210> 582<211> 531<212> PRT<213> Desconhecido<220>

Asp Tyr

Ala Glu205Glu Gly220

Ile Thr

Leu His

Asp Val

Gly Tyr285Leu Asn300

Ala Gln

Val Ile

Lys Asn

Asp Arg365Val Gln380

Leu Leu Lys190

Leu Tyr Tyr

Ala Val Arg

Gly Ile Gly240

Glu Ile Glu

255Met Ile Thr270

Met Gly Ala

Pro Tyr Pro

Arg Tyr Arg320

Thr Arg Val

335Asn Trp Pro350

Glu Trp GlnVal Asp Pro

ttgctttgggttaatggcattcacgggtgaccggcagaaaatgattatgcgggcttattatcattcaagagcgagggaacccatgctcacatcaccgaacgcatgcgcatgtgatgcggggtggcacgaactcccgccagcatctgttcaatgcctccggcacggttcgaccgcaggcagactggggaaacaaccattggcagacatgattcgcatttcaccacctctgacacagttcgctggtacataccatttgtttc

ggcttctctgtgactacgagcggaagctttatggggctcttgcaacctggccctgcgggaccgtggcagtcattgacgggcggcgatggccagtggagtcgatggattgcaaatagcagccccaggtggtttccggtaccgctcaccgctttctgccagcactcatatcctgtcataagcttctgcagctggcagaagccctacaagcttgcaggcgacatcgggaatacattcaacctgggctgccggtgatgcacgac

6012018024030036042048054060066072078084090096010201080114012001260132013801440150015601593<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1) ... (23)<220>

<221> DOMÍNIO<222> (32)...(247)

<223> Família 11 de glicosila hidrolases<220>

<221> DOMÍNIO

<222> (345)...(497)

<223> Domínio de carbohidrato

<220>

<221> SITE

<222> (102)...(105)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (126)...(129)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (241)...(244)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (297)...(300)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (334)...(337)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (391)...(394)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (398)...(401)

<223> N-glicosilação site. Prosite id = PS00001<400> 582

Met Ser Ile Arg Asn Phe Phe Thr Ala Thr Val Ile Leu Val Ala Leu1 5 10 15 Gly Ala Ser Leu 20 Thr Trp Gly Gln Thr 25 Trp Thr Arg Ser Thr 30 Ile GlnAsn Val Asn 35 Gly Ile Asp Tyr Glu Leu 40 Trp Asn Gln Tyr 45 Glu Arg GlyThr Val 50 Asn Met Arg Ile Thr 55 Gly Asp Gly Ser Phe 60 Glu Ala Ser TrpGln Gly Thr Phe Asn Val Leu Phe Arg Ser Gly Arg Lys Trp Gly Ser65 70 75 80Ser Ser Thr Thr Thr Ala Ala Ser Leu Asn Gly Ile Thr Tyr Asp Tyr 85 90 95 Ala Ala Thr Trp Asn Ser Thr Asp Asn Val Lys Met Leu Gly Val Tyr 100 105 110 Gly Trp Ala 115 Tyr Tyr Pro Ala Gly Ala 120 Ser Pro Ala Asn 125 Phe Ser AsnGln Ile 130 Glu Tyr Tyr Ile Ile 135 Gln Asp Arg Gly Ser 140 Trp Asn Pro AlaSer Gly Ala Thr Asn Ala Arg Lys Met Gly Glu Gly Thr Ile Asp Gly145 150 155 160Ile Val Tyr Glu Phe 165 Trp Val Gly Asp Arg 170 Ile Asn Gln Pro Met 175 LeuThr Gly Asp Gly Asn Phe Lys Gln Tyr Phe Ser Val Pro Lys Asn Thr 180 185 190 Arg Asp His 195 Arg Thr Ser Gly Val Ile 200 Asp Val Ala Arg 205 His Phe GlnAla Trp His Asp Asn Gly Met Arg Met Met Asp Cys Pro Leu Tyr Glu

210 215 220

Ile Ala Met Lys Val Glu Ser Phe Thr Gly Asp Ala Gly Asn Ser Ser225 230 235 240

Gly Ser Ala Thr Val Ser Arg Ala Ile Leu Thr Leu Gly Gly Gly Thr

245 250 255

Asn Pro Gly Gly Gly Thr Thr Pro Val Gln His Thr Leu Thr Thr Asn

260 265 270

Val Ser Pro Ala Ser Ser Gly Thr Val Thr Arg Ser Pro Asn Thr Asn

275 280 285

Thr Tyr Ala Pro Asn Ala Ser Val Gln Leu Thr Ala Thr Pro Asn Ser

290 295 300

Gly Trp Arg Phe Val Gly Trp Ser Gly Asp Ala Ser Gly Ser Ala Ser305 310 315 320

Pro Thr Thr Val Thr Met Ser Glu Asn Arg Thr Val Thr Ala Arg Phe

325 330 335

Glu Leu Ile Ser Gly Glu Ser Thr Ser Asn Leu Ile Gln Asp Gly Asp

340 345 350

Phe Ser Ala Gly Ser Val Ile Ser Ser Asp Glu Gly Ala Ser Trp Arg355 360 365

Leu Gly Gln Gly Gln Tyr Trp Gly Asn Ser Ala Ala Thr Ser Ser Val

370 375 380

Ser Asn Gly Thr Ala Thr Ile Asn Val Thr Thr Ile Gly Ala Glu Ala385 390 395 400

Tyr Gln Pro Gln Leu Val Gln Tyr Gly Val Pro Leu Asp Ala Asp Met

405 410 415

Ile Tyr Lys Leu Ser Phe Thr Ala Arg Ala Ala Thr Ala Arg Ser Ile

420 425 430

Glu Val Ala Phe Gln Gln Ala Thr Glu Pro Trp Ala Asn Tyr Ala Ser435 440 445

Thr Glu Phe Asp Leu Thr Thr Ser Asp Arg Glu Tyr Glu Phe Val Phe

450 455 460

Thr Met Thr Gln Ala Thr Asp Pro Ala Ala Gln Phe Ala Phe Asn Leu465 470 475 480

Gly Gln Ala Thr Gly Asn Val His Ile Ser Asp Val Lys Leu Val His

485 490 495

Thr Ala Ala Gly Thr Thr Ser Ile Ser Asn Asn Ile Asn Thr Gly Asn

500 505 510

Lys Ala Phe Val Ser Met His Asp Arg Met Leu Ser Ile Ala Ala Pro515 520 525

Val Glu Gly

530<210> 583<211> 1362<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 583

atggtaaaat taaaattaaa attaaaaaac ttattacttg ttatttctat cttaacctta 60

ataggtaata atgtttttag tcaaccaccg gccgacggtg cgaacaaatt tgttggtaat 120atcaccacaa attatcagat tcgtcccgat tttaacacgt actggaatca gattaccggtgaaaatgagc ataaatggag ttctgttgag ggaacacgcg gcatgtatga ctggactgcaggtgaccgga ttgctaatta tgcgagggaa catggtattc catggagatt tcacactctgatttggggaa gccagtaccc agggtggatg gacaatctct cccagcagga acaattagca 360tcaatcactg catggatgga cgcagcggca gcgcggtatc ctgatgtaga gatgatcgatgtagtaaacg aagctcttga tggtggaggc gtaagacacg cgcccccgct aacatggaaagacgctctgg gtggtgatgg agcctcaggg tacgactggg taatcactgc gttcagaatggcccgtgagc gttggcccaa tgccatttta aaatataatg attataacat aatagaatggggtaataata ttgcagaagc agaaagattg attggaattt tattggcaaa caatgcacca 660atcgatgcaa tcggagttca ggctcatgat gcctatagaa tagagaccaa tcaattgaga 720agtaatatcg ataggcttgc tgccttcggt ctgccgattt ttgttactga atacgatgtacctgaagcca atgacaacag acaacgggaa atcatacagg aacagtttac catgttctggaaccatccca aaatagtggg gattaccttt tggggatatg tactgggagc tacctgggttgaaaacacag gccttatgca tccggatgga agagaacgtc cggcacttac ctggcttaaa 960aattacatca gagacaaccc aaatccacca aatgatttcc ctcaccttct tggattgggt 1020ggaggagaac cacctccccc tcctccactc gtgccgaatt cggcacgagg cgcagaacac

180240300

420480540600

780840900

1080ccgggcgcgc ctcgaaacggcaccattcca gcgggcctttgctgaaatcc cgacagagacccaacgctag atctagcgggtcttctcagg cggcgaggac<210> 584<211> 453<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL·<222> (1) ... (27)<220>

<221> DOMÍNIO<222> (34)...(323)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (40)...(43)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (113) ...(116)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (253) . . . (263)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<220>

<221> SITE

<222> (371) . . .(374)

<223> N-glicosilação site. Prosite id = PS00001<400> 584

Met Val Lys Leu Lys Leu Lys Leu Lys Asn Leu Leu Leu Val Ile Ser1 5 10 15

Ile Leu Thr Leu Ile Gly Asn Asn Val Phe Ser Gln Pro Pro Ala Asp20 25 30

Gly Ala Asn Lys Phe Val Gly Asn Ile Thr Thr Asn Tyr Gln Ile Arg35 40 45

Pro Asp 50 Phe Asn Thr Tyr Trp 55 Asn Gln Ile Thr Gly 60 Glu Asn Glu HisLys Trp Ser Ser Val Glu Gly Thr Arg Gly Met Tyr Asp Trp Thr Ala65 70 75 80Gly Asp Arg Ile Ala 85 Asn Tyr Ala Arg Glu 90 His Gly Ile Pro Trp 95 ArgPhe His Thr Leu 100 Ile Trp Gly Ser Gln 105 Tyr Pro Gly Trp Met 110 Asp AsnLeu Ser Gln 115 Gln Glu Gln Leu Ala 120 Ser Ile Thr Ala Trp 125 Met Asp AlaAla Ala 130 Ala Arg Tyr Pro Asp 135 Val Glu Met Ile Asp 140 Val Val Asn GluAla Leu Asp Gly Gly Gly Val Arg His Ala Pro Pro Leu Thr Trp Lys145 150 155 160Asp Ala Leu Gly Gly Asp Gly Ala Ser Gly Tyr Asp Trp Val Ile Thr 165 170 175 Ala Phe Arg Met Ala Arg Glu Arg Trp Pro Asn Ala Ile Leu Lys Tyr 180 185 190 Asn Asp Tyr Asn Ile Ile Glu Trp Gly Asn Asn Ile Ala Glu Ala Glu 195 200 205 Arg Leu Ile Gly Ile Leu Leu Ala Asn Asn Ala Pro Ile Asp Ala Ile 210 215 220 Gly Val Gln Ala His Asp Ala Tyr Arg Ile Glu Thr Asn Gln Leu Arg225 230 235 240Ser Asn Ile Asp Arg Leu Ala Ala Phe Gly Leu Pro Ile Phe Val Thr

245 250 255

aacggttcgc cgacaacgca gcatctcggg cagacgaacc 1140

tcgagatatg cagcacaggc cgcgtcgtcg ggaaaaaagc 1200

tgcgggaacg gtagatcttc acgagccaag acatccatac 1260

tatgggagtc aaccggatag gggaggatca tcctccccgc 1320

tcgggtcagt gcattctcgt ag 1362Glu Tyr Asp Val Pro Glu Ala Asn Asp Asn Arg Gln Arg Glu Ile Ile

260 265 270

Gln Glu Gln Phe Thr Met Phe Trp Asn His Pro Lys Ile Val Gly Ile275 280 285

Thr Phe Trp Gly Tyr Val Leu Gly Ala Thr Trp Val Glu Asn Thr Gly290 295 300

Leu Met His Pro Asp Gly Arg Glu Arg Pro Ala Leu Thr Trp Leu Lys305 310 315 320

Asn Tyr Ile Arg Asp Asn Pro Asn Pro Pro Asn Asp Phe Pro His Leu325 330 335

Leu Gly Leu Gly Gly Gly Glu Pro Pro Pro Pro Pro Pro Leu Val Pro

340 345 350

Asn Ser Ala Arg Gly Ala Glu His Pro Gly Ala Pro Arg Asn Gly Thr355 360 365

Val Arg Arg Gln Arg Ser Ile Ser Gly Arg Arg Thr His His Ser Ser370 375 380

Gly Pro Phe Arg Asp Met Gln His Arg Pro Arg Arg Arg Glu Lys Ser385 390 395 400

Ala Glu Ile Pro Thr Glu Thr Ala Gly Thr Val Asp Leu His Glu Pro405 410 415

Arg His Pro Tyr Pro Thr Leu Asp Leu Ala Gly Met Gly Val Asn Arg

420 425 430

Ile Gly Glu Asp His Pro Pro Arg Ser Ser Gln Ala Ala Arg Thr Arg435 440 445

Val Ser Ala Phe Ser450<210> 585<211> 1188<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 585

gcacgagcag aggagcaatg gcgggaagat gcccaagagc ggattgaaca aatacgcaaaggcgatctgg tggtgcgcgt tgtggatggc aacgaggcgc ctgtccccaa tgttcccgtacatatcgcga tggaacgaca tgcttttccg tggggcacat gcgtacaggc agcaagaattagctgcgggc aacctgacaa tgaaacatac cgcgaaaagt tgcttgagtt atttaactgtgccgtccttg agaatgatct gaagtggaat gtgtggtatg gcgcggccgg ccccggcttcaaccgggaac aaacccgcaa agcgctgata tggcttcatg aacgtcaatt ccgcatccgggggcattgcc ttgtatggcc aagctggaaa tactttcgcc ccgagggcga ggaactgcgcacggacttgg cggtctttca aaagcgtgtt ctggagcaca ttgacgaact cgccgagtttacccgtgact atgtgtcgga gtgggatgtc gttaacgaac cggttcatca caacgaggttattcgggcgc tgggagaaga cgccatggtc gaatggtttt cccatgcacg gcaggcgctcccggattcct gcctgttgtt cattaacgaa tataacattg tggagccgga caatcctcttgcacgcgcgc catacaaaaa gattatccgt aatctgctcg aagcgggcgc tcccctggaaggcatcgggt tccaaagcca tttccacgac ccgcctgcga ctccggagga ggcgttgcgggtgttcgacc agtttgcggt ttttgggttg cccatcgtgg tgacggaatt tgacataaacacaaaggacg aatgcagaca ggcggcattt acccgggact ttatgacggc ggcgttcagccatcctgctt gttccgggtt cctgatttgg gggttctggg aaggagcgca ttggcgtcccgatgccgcaa tgtttcgtaa agactggtcg gaaaagccca atctccatgc ctaccgtgacctggtcttca atgaatggtg gaccgatata gaggaaacca cagatgaaaa cggcgtcttgtccgtgagag ggttcaaagg cgactacaca atcgttgttg acggacaaaa gcacgccgccgccattcatg atacgccaac aacaatcgaa atcgtactgt gcgactga<210> 586

<211> 395

<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (40)...(342)

<223> Família 10 de hidrolase glicosila<220><221> SITE

<222> (68)...(71)

<223> N-glicosilação site. Prosite id = PS00001<400> 586 Ala Arg Ala Glu Glu Gln Trp Arg Glu Asp Ala Gln Glu Arg Ile Glu1 5 10 15 Gln Ile Arg Lys Gly Asp Leu Val Val Arg Val Val Asp Gly Asn Glu 20 25 30 Ala Pro Val Pro Asn Val Pro Val His Ile Ala Met Glu Arg His Ala 35 40 45 Phe Pro Trp Gly Thr Cys Val Gln Ala Ala Arg Ile Ser Cys Gly Gln 50 55 60 Pro Asp Asn Glu Thr Tyr Arg Glu Lys Leu Leu Glu Leu Phe Asn Cys65 70 75 80Ala Val Leu Glu Asn Asp Leu Lys Trp Asn Val Trp Tyr Gly Ala Ala 85 90 95 Gly Pro Gly Phe Asn Arg Glu Gln Thr Arg Lys Ala Leu Ile Trp Leu 100 105 110 His Glu Arg Gln Phe Arg Ile Arg Gly His Cys Leu Val Trp Pro Ser 115 120 125 Trp Lys Tyr Phe Arg Pro Glu Gly Glu Glu Leu Arg Thr Asp Leu Ala 130 135 140 Val Phe Gln Lys Arg Val Leu Glu His Ile Asp Glu Leu Ala Glu Phe145 150 155 160Thr Arg Asp Tyr Val Ser Glu Trp Asp Val Val Asn Glu Pro Val His 165 170 175 His Asn Glu Val Ile Arg Ala Leu Gly Glu Asp Ala Met Val Glu Trp 180 185 190 Phe Ser His Ala Arg Gln Ala Leu Pro Asp Ser Cys Leu Leu Phe Ile 195 200 205 Asn Glu Tyr Asn Ile Val Glu Pro Asp Asn Pro Leu Ala Arg Ala Pro 210 215 220 Tyr Lys Lys Ile Ile Arg Asn Leu Leu Glu Ala Gly Ala Pro Leu Glu225 230 235 240Gly Ile Gly Phe Gln Ser His Phe His Asp Pro Pro Ala Thr Pro Glu 245 250 255 Glu Ala Leu Arg Val Phe Asp Gln Phe Ala Val Phe Gly Leu Pro Ile 260 265 270 Val Val Thr Glu Phe Asp Ile Asn Thr Lys Asp Glu Cys Arg Gln Ala 275 280 285 Ala Phe Thr Arg Asp Phe Met Thr Ala Ala Phe Ser His Pro Ala Cys 290 295 300 Ser Gly Phe Leu Ile Trp Gly Phe Trp Glu Gly Ala His Trp Arg Pro305 310 315 320Asp Ala Ala Met Phe Arg Lys Asp Trp Ser Glu Lys Pro Asn Leu His 325 330 335 Ala Tyr Arg Asp Leu Val Phe Asn Glu Trp Trp Thr Asp Ile Glu Glu 340 345 350 Thr Thr Asp Glu Asn Gly Val Leu Ser Val Arg Gly Phe Lys Gly Asp 355 360 365 Tyr Thr Ile Val Val Asp Gly Gln Lys His Ala Ala Ala Ile His Asp 370 375 380 Thr Pro Thr Thr Ile Glu Ile Val Leu Cys Asp 385 390 395

<210> 587<211> 1095<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 587

gcacgagctg cggccgagga gtcgaccggt ctcgcgcatg cctggcgcga cgcctttcacgtcggtgtcg ctgtgagcaa ccagacgctg gatcagcagc tgaccgcgca cctgaatctgatcgcgcgtg aattcagctc gatcacggcc gagaacgcga tgaagtgggg cgtattgcggccggacggcg tgaactggcg ctggcagcgc ccggatgcgt tcatggactt cgcggccacgcacgatctgt acgtggtcgg acatacgctg gtctggcatt cgcagatacc cgccagcgtgttcgcggacg cgaacggcgc cccgctcggt cgcgatgcac tgctggcgcg gatggaggatcacattgaca cgctggccgg tcgttaccgt gggcgcgtgc atgcgtggga cgtcgtcaacgaggccatcg acgagagtaa tggctggcgc cgctcaccgt ggctgcagat catcggtgacgactacatgg aacaggcgtt tcgcatggcg cgcgccgccg atccgcaagc ggtcctgctctacaacgact acaacatgca caacccgcgc aagcgggcgt ttctcgtcga cgtgctgcac 600

gattatctgg accggggcgt gcccatcgat ggcgtcgggc tgcagggtca cctggggctc 660gagtatccgg acatggagga atgggaacgc agcatcgcca cctacgccga gctcgggttg 720

gaagtgcacg tcaccgagct ggaaatcgac ccgctgccga gcccgtacat gatgagcgcg 780gagatttcga accgtttcga ctactcaccc gagaatgatc cgtggccgga cggcctgccc 840

gacgaagtgc agcagcagct ggccgatcgc tatgagcagg tgttcagaat cctgctgcgc 900tatcgcgaca gcgtgcggcg cgtcaccttc tggggtctgc acgacggcat ctcgtggaag 960

aacgacttcc cgatccgcgg tcgcacgaat catccgctgc tgttcgaccg ggatctggcg 1020ccgaagcctg cttatcatcg cctgcgcacg ctacaggccg cggtccaggg cgctcagacg 1080

agttcgaccg agtag 1095<210> 588<211> 364<212> PRT<213> Desconhecido

<220><223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (10)...(352)<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (27)...(30)<223> N-glicosilação site. Prosite id = PS00001<400> 588

Ala Arg Ala Ala Ala Glu Glu Ser Thr Gly Leu Ala His Ala Trp Arg1 5 10 15

Asp Ala Phe His Val Gly Val Ala Val Ser Asn Gln Thr Leu Asp Gln20 25 30

Gln Leu Thr Ala His Leu Asn Leu Ile Ala Arg Glu Phe Ser Ser Ile35 40 45

Thr Ala Glu Asn Ala Met Lys Trp Gly Val Leu Arg Pro Asp Gly Val

50 55 60

Asn Trp Arg Trp Gln Arg Pro Asp Ala Phe Met Asp Phe Ala Ala Thr35 65 70 75 80

His Asp Leu Tyr Val Val Gly His Thr Leu Val Trp His Ser Gln Ile

85 90 95

Pro Ala Ser Val Phe Ala Asp Ala Asn Gly Ala Pro Leu Gly Arg Asp100 105 110

Ala Leu Leu Ala Arg Met Glu Asp His Ile Asp Thr Leu Ala Gly Arg115 120 125

Tyr Arg Gly Arg Val His Ala Trp Asp Val Val Asn Glu Ala Ile Asp

130 135 140

Glu Ser Asn Gly Trp Arg Arg Ser Pro Trp Leu Gln Ile Ile Gly Asp145 150 155 160

Asp Tyr Met Glu Gln Ala Phe Arg Met Ala Arg Ala Ala Asp Pro Gln

165 170 175

Ala Val Leu Leu Tyr Asn Asp Tyr Asn Met His Asn Pro Arg Lys Arg180 185 190

Ala Phe Leu Val Asp Val Leu His Asp Tyr Leu Asp Arg Gly Val Pro195 200 205

Ile Asp Gly Val Gly Leu Gln Gly His Leu Gly Leu Glu Tyr Pro Asp

210 215 220

Met Glu Glu Trp Glu Arg Ser Ile Ala Thr Tyr Ala Glu Leu Gly Leu55 225 230 235 240

Glu Val His Val Thr Glu Leu Glu Ile Asp Pro Leu Pro Ser Pro Tyr

245 250 255

Met Met Ser Ala Glu Ile Ser Asn Arg Phe Asp Tyr Ser Pro Glu Asn260 265 270

Asp Pro Trp Pro Asp Gly Leu Pro Asp Glu Val Gln Gln Gln Leu Ala275 280 285

Asp Arg Tyr Glu Gln Val Phe Arg Ile Leu Leu Arg Tyr Arg Asp Ser

290 295 300

Val Arg Arg Val Thr Phe Trp Gly Leu His Asp Gly Ile Ser Trp Lys305 310 315 320

Asn Asp Phe Pro Ile Arg Gly Arg Thr Asn His Pro Leu Leu Phe Asp325 330 335Arg Asp Leu Ala Pro Lys Pro Ala Tyr His Arg Leu Arg Thr Leu Gln

340 345 350

Ala Ala Val Gln Gly Ala Gln Thr Ser Ser Thr Glu

355 360

<210> 589<211> 1149<212> DNA

<213> Desconhecido.<220>

<223> Obtido para amostra ambiental<400> 589

atgaaaaaaa gaatcaccag tattgcaatt gtatttgcgc ttgtatttgg atttggcgtgttgggatgtt cttcgaataa gcagggagca accgccgata ctttgggaga ggcatttgaaggactttttt acattggcac cgcactgaat acaccgcaga tcaccggcca aaaccaggcggcacaagctg tgataaaaaa acacttcaac tccattgtag cagagaattg catgaagagtgcacttattc aaccacaaga gggccagttt gatttcagcc tgtctgacca gtttattgcttttggccagg aaaatgatat gcacattgtg ggccacaccc tcatctggca ttctcaggccccgaactggt tctttgttga cgaaaacggt gatgacgtat cgcctgaggt gttgaaggagcggatgcgta accatatttt tacacttgct ggcagatata aaggccaggt acatggttgggatgtggtaa atgaggccat tgtggaagat ggttcctggc gcaacagtaa gttttatcaaattcttggcg aggactttgt gcgtctggca ttcaaatatg cgcatgaagc cgatcccgatgccgagttgt attataatga ctatgggatg gcaatccccg gtcgcagaga aggtgtgatcagaatggtaa aagacttgca ggcacaaggc atcaaaattg atggtattgg gatgcaaggccatatgcatt tggattcacc cactatagaa gagttcgaag agagtattct ggcttttgcggagctcggcg tgaaggtaat gatcacagaa ctggatgtca gtgtattgcc atggcccggtacctttgtaa gtgccgatgt ggccatgagt gcagaatacc aggcggaaat gaacccctatgtagatggac tgcctgatga tgtttacgac gttctgcaca acagatatct tgatctcttccaacttttta tcaagcacca cgacaaaatt tcccgcgtta ccacttgggg tgtaaatgacggacagtcat ggaaaaacaa ctggccaatc aggggaaggg ttgactatcc gcttttgtttgatcgcaact atgaacccaa accatttgta tctgaattga tcgatatggc caatgaagccagaagatga<210> 590<211> 382<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(29)<22 0><221><222>

<221><222>

601201802403003604204805406006607207808409009601020108011401149

DOMÍNIO(34) .. . (377)<223> Família 10 de hidrolase glicosila<220>

SITE

(267)...(277)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 590

Met Lys Lys Arg Ile Thr Ser Ile Ala Ile Val Phe Ala Leu Val Phe15 10 15

Gly Phe Gly Val Leu Gly Cys Ser Ser Asn Lys Gln Gly Ala Thr Ala

20 25 30

Asp Thr Leu Gly Glu Ala Phe Glu Gly Leu Phe Tyr Ile Gly Thr Ala

35

40

45

Leu Asn Thr Pro Gln Ile Thr Gly Gln Asn Gln Ala Ala Gln Ala Val

50

55

60

Ile Lys Lys His Phe Asn Ser Ile Val Ala Glu Asn Cys Met Lys Ser

65

70

75

80

Ala Leu Ile Gln Pro Gln Glu Gly Gln Phe Asp Phe Ser Leu Ser Asp

85 90 95

Gln Phe Ile Ala Phe Gly Gln Glu Asn Asp Met His

100 105

Thr Leu Ile Trp His Ser Gln Ala Pro Asn Trp Phe Phe Val Asp Glu

120

Ile Val Gly His110

115

125

Asn Gly Asp Asp Val Ser Pro Glu Val Leu Lys Glu Arg Met Arg Asn

130

135

140His Ile Phe Thr Leu Ala Gly Arg Tyr Lys Gly Gln Val His Gly Trp145 150 155 160Asp Val Val Asn Glu 165 Ala Ile Val Glu Asp 170 Gly Ser Trp Arg Asn 175 SerLys Phe Tyr Gln 180 Ile Leu Gly Glu Asp 185 Phe Val Arg Leu Ala 190 Phe LysTyr Ala His 195 Glu Ala Asp Pro Asp 200 Ala Glu Leu Tyr Tyr 205 Asn Asp TyrGly Met 210 Ala Ile Pro Gly Arg 215 Arg Glu Gly Val Ile 220 Arg Met Val LysAsp Leu Gln Ala Gln Gly Ile Lys Ile Asp Gly Ile Gly Met Gln Gly225 230 235 240His Met His Leu Asp 245 Ser Pro Thr Ile Glu 250 Glu Phe Glu Glu Ser 255 IleLeu Ala Phe Ala 260 Glu Leu Gly Val Lys 265 Val Met Ile Thr Glu 270 Leu AspVal Ser Val 275 Leu Pro Trp Pro Gly 280 Thr Phe Val Ser Ala 285 Asp Val AlaMet Ser 290 Ala Glu Tyr Gln Ala 295 Glu Met Asn Pro Tyr 300 Val Asp Gly LeuPro Asp Asp Val Tyr Asp Val Leu His Asn Arg Tyr Leu Asp Leu Phe305 310 315 320Gln Leu Phe Ile Lys 325 His His Asp Lys Ile 330 Ser Arg Val Thr Thr 335 TrpGly Val Asn Asp 340 Gly Gln Ser Trp Lys 345 Asn Asn Trp Pro Ile 350 Arg GlyArg Val Asp 355 Tyr Pro Leu Leu Phe 360 Asp Arg Asn Tyr Glu 365 Pro Lys ProPhe Val 370 Ser Glu Leu Ile Asp 375 Met Ala Asn Glu Ala 380 Arg Arg <210> 591

<211> 2094<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 591

atgttgaaac aaatcggaga tcaaacagtg aacctaccac taaataaact aacgcttaaa

agctctctta cagcagcagc atgcgttgct gcgatgagct tttcgacggc gaacgcctgt

actggcgcac ttaataacca aaacaacgct gtcggtactc acaacggcca ttattactcc

ttctggaagc aaaccaacaa cagtcgtgta aatgttacct gcggagagcc cggctattat

cgggctgaat ggagcaacgt ctttaactgg gtcggtggaa tcggctggaa tccaggcggg

ccgagaatcg ttaattaccg cggtacattc aacagcggca tcaaccggag ctcgtcaaac

tcttatcttg cgctttacgg gtggactcga gccccaaatg aagttgagta ttacgtagtc

gagagttacg gctcctacaa tcccgcaagc tgcggcggta gcggcggtgt tgctggcggt

ggcggtagtg gggatggcca caaaggatcc gtcacgatcg gcggagtggt ttacgacttg

acgcaatgca cacgaacgaa ccaaccatct atttctggaa cctccacatt taagcagttt

ttcagcgtac gccgaaaccc actgccatgg ggccaggttc aaggcaccat cgatgtaggt

gcccacttcc aagcctgggc taatgccggc atgcaacttg gtactgatca tttttacatg

gtgctcgcca gtgagggtta tgacggtggg agtaattccc gtggtaactc cgagttgtgg

gtaactgagg gcgctggtgg cggcggtgct gtcggcggcg gagctggcgg cggcggcggt

gtaggcggag gtggtactac aggttccggt tctaacaccc tggtagtgcg cgctattggc

acctccggct ccgagcagct acgagtaaac gcaggcggca gcaccatagc cactttgcgt

ctgtctacta gttggcagga tttcactatc aatactaacg ccagcggcga cctgaacgtt

gaactgttca acgaccaagg cgaaggttac gaagcacgtg tggaatacgt catagtcaac

ggcgacacgc gttacgcaga agatcagagc tacaacacca gtgcgtggga tggcgtgtgt

ggtggcggca ctaatactca gtggatgcac tgcaacggaa tgattggctt cggtaatatc

accgggagtg gcggtggtaa caccggtggc ggtgcgagcc cagctccaac cccaacacca

cccgctccag gtgatggagg caatactggc actggcgcca acactatagt ggtacgcgcg

gtaggtacct ctggctccga gcagctacga gtaaacgcag gcggcagcgc catagccact

ttgagcttgt ctaccagttg gcaggacttc actatcaata ctaacgccgg cggcgacctg

aacgttgaac tgttcaacga ccaaggcgaa ggttacgaag cacgtgtgga atacgtcata

gtcaacggcg acacgcgtta cgcagaagat cagagctaca acaccagcgc ttggaatggc

gagtgtggtg gcggcactaa tacccagtgg atgcactgca acggaatgat tggcttcggt

gatatcaccg gaagtggcgg tgcgagccca gctccaacac caacgccaac gccaacacca

actccaacac cccctccagg taatggaggc aatactagca ctggcgccaa cactattgtg

gtacgcgcga taggcacctc gggcagcgaa caactgcgcg ttaatgtggg cggcagcgcggtacagacct tgagtctttc aacaagttgg caagagttca ccgttaatac taacgccgttggcgatctca acgtcgagct attcaacgac cggggtcagg gctacgaagc acgcgtagagtatgtgatcg ttaacggcga caggcgttac tccagggacc aaagctacaa taccagcgcatggagtggtg tgtgtggtgg cggctctcac accgagtgga tgcattgcaa cggtatgatcggtttcggaa acatttctgg caacactggc aacactagca gtacctgcaa ttga<210> 592697PRT

Desconhecido

18601920198020402094

<211><212><213><220><223><220><221><222><220><221><222><223><220><221><222>

Obtido para amostra ambiental

SIGNAL(1)-..(39)

DOMÍNIO(52)...(261)

Família 11 de glicosila hidrolases

SITE

(67)...(70)<223> N-glicosilação<220>

<221> SITE<222> (72)...(75)<223> N-glicosilação<220>

SITE

(116)...(119)N-glicosilação

<221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222><223><220><221><222>

site. Prosite id = PS00001

SITE

(338)...(341)

N-glicosilação site. Prosite id = PS00001

SITE

(377) .. . (380)N-glicosilação

site. Prosite id = PS00001

SITE

(405)...(408)

N-glicosilação site. Prosite id = PS00001

SITE

(521)...(524)N-glicosilação

SITE

(579)...(582)N-glicosilação

site. Prosite id = PS00001

SITE

(667)...(670)<223> N-glicosilação<220>

<221> SITE<222> (694)...(697)<223> N-glicosilação<220>

<221> SITE<222> (701)...(704)<223> N-glicosilação<400> 592

Met Leu Lys Gln Ile Gly Asp Gln Thr Val Asn Leu Pro Leu Asn Lys15 10 15

Leu Thr Leu Lys Ser Ser Leu Thr Ala Ala Ala Cys Val Ala Ala Met20 25 30

site. Prosite id = PS00001

site. Prosite id = PS00001Ser Phe Ser Thr Ala Asn Ala Cys Thr Gly Ala Leu Asn Asn Gln Asn 35 40 45 Asn Ala Val Gly Thr His Asn Gly His Tyr Tyr Ser Phe Trp Lys Gln 50 55 60 Thr Asn Asn Ser Arg Val Asn Val Thr Cys Gly Glu Pro Gly Tyr Tyr 65 70 75 80 Arg Ala Glu Trp Ser Asn Val Phe Asn Trp Val Gly Gly Ile Gly Trp 85 90 95 Asn Pro Gly Gly Pro Arg Ile Val Asn Tyr Arg Gly Thr Phe Asn Ser 100 105 110 Gly Ile Asn Arg Ser Ser Ser Asn Ser Tyr Leu Ala Leu Tyr Gly Trp 115 120 125 Thr Arg 130 Ala Pro Asn Glu Val 135 Glu Tyr Tyr Val Val 140 Glu Ser Tyr Gly Ser Tyr Asn Pro Ala Ser Cys Gly Gly Ser Gly Gly Val Ala Gly Gly 145 150 155 160 Gly Gly Ser Gly Asp Gly His Lys Gly Ser Val Thr Ile Gly Gly Val 165 170 175 Val Tyr Asp Leu Thr Gln Cys Thr Arg Thr Asn Gln Pro Ser Ile Ser 180 185 190 Gly Thr Ser Thr Phe Lys Gln Phe Phe Ser Val Arg Arg Asn Pro Leu 195 200 205 Pro Trp Gly Gln Val Gln Gly Thr Ile Asp Val Gly Ala His Phe Gln 210 215 220 Ala Trp Ala Asn Ala Gly Met Gln Leu Gly Thr Asp His Phe Tyr Met 225 230 235 240 Val Leu Ala Ser Glu Gly Tyr Asp Gly Gly Ser Asn Ser Arg Gly Asn 245 250 255 Ser Glu Leu Trp Val Thr Glu Gly Ala Gly Gly Gly Gly Ala Val Gly 260 265 270 Gly Gly Ala Gly Gly Gly Gly Gly Val Gly Gly Gly Gly Thr Thr Gly 275 280 285 Ser Gly Ser Asn Thr Leu Val Val Arg Ala Ile Gly Thr Ser Gly Ser 290 295 300 Glu 305 Gln Leu Arg Val Asn 310 Ala Gly Gly Ser Thr 315 Ile Ala Thr Leu Arg 320 Leu Ser Thr Ser Trp 325 Gln Asp Phe Thr Ile 330 Asn Thr Asn Ala Ser Gly 335 Asp Leu Asn Val Glu Leu Phe Asn Asp Gln Gly Glu Gly Tyr Glu Ala 340 345 350 Arg Val Glu Tyr Val Ile Val Asn Gly Asp Thr Arg Tyr Ala Glu Asp 355 360 365 Gln Ser Tyr Asn Thr Ser Ala Trp Asp Gly Val Cys Gly Gly Gly Thr 370 375 380 Asn Thr Gln Trp Met His Cys Asn Gly Met Ile Gly Phe Gly Asn Ile 385 390 395 400 Thr Gly Ser Gly Gly Gly Asn Thr Gly Gly Gly Ala Ser Pro Ala Pro 405 410 415 Thr Pro Thr Pro Pro Ala Pro Gly Asp Gly Gly Asn Thr Gly Thr Gly 420 425 430 Ala Asn Thr 435 Ile Val Val Arg Ala 440 Val Gly Thr Ser Gly 445 Ser Glu Gln Leu Arg Val Asn Ala Gly Gly Ser Ala Ile Ala Thr Leu Ser Leu Ser 450 455 460 Thr Ser Trp Gln Asp Phe Thr Ile Asn Thr Asn Ala Gly Gly Asp Leu 465 470 475 480 Asn Val Glu Leu Phe Asn Asp Gln Gly Glu Gly Tyr Glu Ala Arg Val 485 490 495 Glu Tyr Val Ile Val Asn Gly Asp Thr Arg Tyr Ala Glu Asp Gln Ser 500 505 510 Tyr Asn Thr Ser Ala Trp Asn Gly Glu Cys Gly Gly Gly Thr Asn Thr 515 520 525 Gln Trp Met His Cys Asn Gly Met Ile Gly Phe Gly Asp Ile Thr Gly 530 535 540 Ser Gly Gly Ala Ser Pro Ala Pro Thr Pro Thr Pro Thr Pro Thr Pro 545 550 555 560 Thr Pro Thr Pro Pro Pro Gly Asn Gly Gly Asn Thr Ser Thr Gly Ala565 570 575

Asn Thr Ile Val Val Arg Ala Ile Gly Thr Ser Gly Ser Glu Gln Leu

580 585 590

Arg Val Asn Val Gly Gly Ser Ala Val Gln Thr Leu Ser Leu Ser Thr

595 600 605

Ser Trp Gln Glu Phe Thr Val Asn Thr Asn Ala Val Gly Asp Leu Asn

610 615 620

Val Glu Leu Phe Asn Asp Arg Gly Gln Gly Tyr Glu Ala Arg Val Glu625 630 635 640

Tyr Val Ile Val Asn Gly Asp Arg Arg Tyr Ser Arg Asp Gln Ser Tyr

645 650 655

Asn Thr Ser Ala Trp Ser Gly Val Cys Gly Gly Gly Ser His Thr Glu

660 665 670

Trp Met His Cys Asn Gly Met Ile Gly Phe Gly Asn Ile Ser Gly Asn

675 680 685

Thr Gly Asn Thr Ser Ser Thr Cys Asn

690 695

<210> 593<211> 1137<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> misc_feature<222> (1). . . (1137)<223> η = a, g, c or t<400> 593

gtgaacttgt tatcgacatt acccattaaa aggtcactta cagcagcagc gtgcattgcagcgatgggct tttccgcggc aaacgcttgt acgggcgcgc ttaacaatca gaacaacgcagtaggtacgc acaacggctt ctattattcg ttttggaagc agttcaatga caatagagtgaatattacct gcggagaacc cggctattat aggacggaat ggaacaacgt ctttaactgggttggtggaa tgggctggaa cccaggtggg ccgagaatcg ttaattaccg tggcacattcaacagtggcc gcgcccggaa ctcgtcaaac tcttatcttg cgctttacgg gtggactcgagttccaaatg aggttgagta ttacgtcgtc gagagttacg gctcctacaa tcccgcaagctgcggcggta gcggcggtgt tgccggcggt ggcggcagtg gggatggcca taaaggatccgtcacgatcg gcggagtggt ttacgacttg acacaatgca cacgaacgaa ccagccgtctatttctggaa cctccacatt taggcagttt ttcagcgtac gccgagaccc cctaccctggggtcaagtcc aaggctccat cgatgtgggt gcccatttcc aagcctgggc taatgccggcatgcaacttg gcaatgatca tttttatatg gtgcttgcca ctgagggtta cgatggtaatagcaattcct ctggcaactc ggagctgtgg ataactgagg gcgccagcgg cggtggcggtggcggtggtg gtggtggtgg nnnccaccac caagctgtgg ttccgtgggt ggtgttcccgtttgctgcca tatcagcgcc gacgagaatg gcgatggcat gggtatggaa aacggcagtgtgtgtaccgt cacgcaaaat accgaaggct ggcacccacc caacccgtct gatgtgctggcagcgatcaa cgttggcggt actggcccgg cagtgcagat cggcaatgtg tactacgcacccaacaccca cgtcaccggg ggcacaccgc actctacgac ggccactatt caaggcaataacagtgacat ctataagtca gagatctacg gggatttcac tgtctctatt cccatga<210> 594<211> 378<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

SIGNAL(1)...(29)

<221><222><220>

<221> DOMÍNIO

(42) . . . (247)

Família 11 de glicosila hidrolases

60120180240300360420480540600660720780840900960102010801137

<222><223><220><221><222>

SITE

(61)...(64)<223> N-glicosilação site.<220>

<221> SITE

<222> (108)...(111)

Prosite id = PS00001<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (245)...(248)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> VARIANT<222> (1)...(378)

<223> Xaa = Any Amino Acid <400> 594 Met Asn Leu Leu Ser Thr Leu Pro Ile Lys Arg Ser Leu Thr Ala Ala1 5 10 15 Ala Cys Ile Ala Ala Met Gly Phe Ser Ala Ala Asn Ala Cys Thr Gly 20 25 30 Ala Leu Asn Asn Gln Asn Asn Ala Val Gly Thr His Asn Gly Phe Tyr 35 40 45 Tyr Ser Phe Trp Lys Gln Phe Asn Asp Asn Arg Val Asn Ile Thr Cys 50 55 60 Gly Glu Pro Gly Tyr Tyr Arg Thr Glu Trp Asn Asn Val Phe Asn Trp65 70 75 80Val Gly Gly Met Gly Trp Asn Pro Gly Gly Pro Arg Ile Val Asn Tyr 85 90 95 Arg Gly Thr Phe Asn Ser Gly Arg Ala Arg Asn Ser Ser Asn Ser Tyr 100 105 110 Leu Ala Leu Tyr Gly Trp Thr Arg Val Pro Asn Glu Val Glu Tyr Tyr 115 120 125 Val Val Glu Ser Tyr Gly Ser Tyr Asn Pro Ala Ser Cys Gly Gly Ser 130 135 _ 140 Gly Gly Val Ala Gly Gly Gly Gly Ser Gly Asp Gly His Lys Gly Ser145 150 155 160Val Thr Ile Gly Gly Val Val Tyr Asp Leu Thr Gln Cys Thr Arg Thr 165 170 175 Asn Gln Pro Ser Ile Ser Gly Thr Ser Thr Phe Arg Gln Phe Phe Ser 180 185 190 Val Arg Arg Asp Pro Leu Pro Trp Gly Gln Val Gln Gly Ser Ile Asp 195 200 205 Val Gly Ala His Phe Gln Ala Trp Ala Asn Ala Gly Met Gln Leu Gly 210 215 220 Asn Asp His Phe Tyr Met Val Leu Ala Thr Glu Gly Tyr Asp Gly Asn225 230 235 240Ser Asn Ser Ser Gly Asn Ser Glu Leu Trp Ile Thr Glu Gly Ala Ser 245 250 255 Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Xaa His His Gln Ala 260 265 270 Val Val Pro Trp Val Val Phe Pro Phe Ala Ala Ile Ser Ala Pro Thr 275 280 285 Arg Met Ala Met Ala Trp Val Trp Lys Thr Ala Val Cys Val Pro Ser 290 295 300 Arg Lys Ile Pro Lys Ala Gly Thr His Pro Thr Arg Leu Met Cys Trp305 310 315 320Gln Arg Ser Thr Leu Ala Val Leu Ala Arg Gln Cys Arg Ser Ala Met 325 330 335 Cys Thr Thr His Pro Thr Pro Thr Ser Pro Gly Ala His Arg Thr Leu 340 345 350 Arg Arg Pro Leu Phe Lys Ala Ile Thr Val Thr Ser Ile Ser Gln Arg 355 360 365 Ser Thr Gly Ile Ser Leu Ser Leu Phe Pro 370 375 <210> 595 <211> 978 <212> DNA

<213> Desconhecido<22 0>

<223> Obtido para amostra ambiental<400> 595

atggtgcgat cggacacgag acgaacgcgg aggttcgcgc tgctcgccgt gggcgcgatgctcgcagggc tggctgcgct tcccgccgca gcggcgcccg acggcgactt caggccgccggggctcgaca agcaggacac gctccggtgg gttgcgccga agggcttcaa gatcggcacagccgtcgcag gcggtggcca ccacgtcgac cagccggtac ccgacccctt caacatggacccggagtacc gcgccttgat cggcaaggag ttcaattccg tcacgccgga gaaccacctcaagtgggaga tggtgcaccc ggagcagggc cagtacgact tcgccccagc ggacgaggtgatcgcctacg ccctggagca caagcaggac gtgcgcggac acacgctcgt atggcacagccagaacccgg actggctcga ggagggtgac ttcaccgcgg atgagttgcg cgacatcctgcgcgaccaca tccacacggt ggtcggtcgg tacaagggca agatccagca gtgggatgtcgcgaacgaga tcttcctcgg aagcggtgcc tggcgcaaca cgatctggta ccaggcgctaggtccggact acgtcgctga cgccttccgc tgggcccacg aggcggaccc cgacgcgctgttgttcctca acgacttcgg cgtggagggc atcaacgcga agagcaccgc gtactacaacctcatccaac aactgctgga ggacggtgtc ccggttcatg gcttcggcat ccagggccacctgagcatcc agttcgggtt cccaggcaac gtccaggcca acctcgagcg cttcgacgccctcggcatca agaccgcctt caccgaggtc gacgtacgga tgaacctgcc agcgagcgggatccgatcga ggcgttgcgg tacgagtagt ccaatcatgg ccacccctgc accggcagccagcggacgcg tgggctga<210> 596<211> 325<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<22 0>

<221> SIGNAL<222> (1)...(31)<22 0>

<221> DOMÍNIO<222> (47)...(321)

<223> Família 10 de hidrolase glicosila<400> 596

Met Val Arg Ser Asp Thr Arg Arg Thr Arg Arg Phe Ala Leu Leu Ala1 5 10 15 Val Gly Ala Met 20 Leu Ala Gly Leu Ala 25 Ala Leu Pro Ala Ala 30 Ala AlaPro Asp Gly 35 Asp Phe Arg Pro Pro 40 Gly Leu Asp Lys Gln 45 Asp Thr LeuArg Trp 50 Val Ala Pro Lys Gly 55 Phe Lys Ile Gly Thr 60 Ala Val Ala GlyGly Gly His His Val Asp Gln Pro Val Pro Asp Pro Phe Asn Met Asp65 70 75 80Pro Glu Tyr Arg Ala 85 Leu Ile Gly Lys Glu 90 Phe Asn Ser Val Thr 95 ProGlu Asn His Leu 100 Lys Trp Glu Met Val 105 His Pro Glu Gln Gly 110 Gln TyrAsp Phe Ala 115 Pro Ala Asp Glu Val 120 Ile Ala Tyr Ala Leu 125 Glu His LysGln Asp 130 Val Arg Gly His Thr 135 Leu Val Trp His Ser 140 Gln Asn Pro AspTrp Leu Glu Glu Gly Asp Phe Thr Ala Asp Glu Leu Arg Asp Ile Leu145 150 155 160Arg Asp His Ile His 165 Thr Val Val Gly Arg 170 Tyr Lys Gly Lys Ile 175 GlnGln Trp Asp Val 180 Ala Asn Glu Ile Phe 185 Leu Gly Ser Gly Ala 190 Trp ArgAsn Thr Ile 195 Trp Tyr Gln Ala Leu 200 Gly Pro Asp Tyr Val 205 Ala Asp AlaPhe Arg 210 Trp Ala His Glu Ala 215 Asp Pro Asp Ala Leu 220 Leu Phe Leu AsnAsp Phe Gly Val Glu Gly Ile Asn Ala Lys Ser Thr Ala Tyr Tyr Asn225 230 235 240Leu Ile Gln Gln Leu 245 Leu Glu Asp Gly Val 250 Pro Val His Gly Phe 255 GlyIle Gln Gly His 260 Leu Ser Ile Gln Phe 265 Gly Phe Pro Gly Asn 270 Val GlnAla Asn Leu 275 Glu Arg Phe Asp Ala 280 Leu Gly Ile Lys Thr 285 Ala Phe ThrGlu Val 290 Asp Val Arg Met Asn 295 Leu Pro Ala Ser Gly 300 Ile Arg Ser ArgArg Cys Gly Thr Ser Ser Pro Ile Met Ala Thr Pro Ala Pro Ala Ala305 310 315 320

Ser Gly Arg Val Gly325

<210> 597<211> 1842<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 597

atggtgcgat cggacaccac acgaacgcgg aggttcgcgc tgctcgtcgt gagcgcgatggttgccggga tggctgtgct ccccgctgcg gcggccgaca ccgccgcagc cgaaggcgccttcgaggtcg agatccgcat ggccgggagc ggaaccgtct ccggcgcggg cagctacaacgccggcgaca cggtcgagct gacagcgacc ccgaacgagg gacatgtctg gggcggctggacctcggcgg agctggagtg gatcggggct cgggtgagct cgttcacgat gcccgaacacgatgtcgtgc tcgagacgac gttccgaccc cggatggcgt ccctgcgcga ggcctacaccgactacttcc ccgtgggcaa catctggtcg aacgtcggaa cgtacgcagc aggttcgccgaactcagaga cgatcgctcg gcactacaac atcatgactg ccgagaacca catgaagccgaacatgttgc tgcccaacca gaacatcaac ccgacgactc gcgccttcac gttcaactggaccactgcgg acaccttcgt caaccagacg ctcgaccgtg gcatgcaggt gcacgggcacgtcctcgtct ggcacagtca gacgccagcg cggatcttca gcggcgcgac aggtgggacccgtgcgctcg ccaaggacaa catggagcgc tacatcgagg cggtcctcac gcacttccgtgaccgcgtcg tgtcatggga cgtcgtgaac gaggcgttca tcgacgagat ctcggagttcgatccggaga ccgaggactg gcgcgactat ctgcgtggcg gccctcgcgg cggttcgtccggctggtaca cggcctacgg gaacggcgcc gacgtcgagg ccggggaaca cccgagcgacttcctctacg acgccttcgt gctcgcccgg aagcacggcc cggaggtcaa gctcgagtacaacgacttca acttcttcca gtccgagggc aaggccaagg cgatcatcgc catggccctcgaactcaacg agcgctacgc ggccgagtac cccgacgacc agcgcccgct catcgaggggctgggcatgc agtcgcacaa ctacatcaac cagacgccgg ccttcgcctg ctcggacctcacccgactgc ccgagctcgt cgacgacgcg gtcgaggagt ggaagcccgg cgcgtgctcgaacttcgcct cggtcgagcg ctcgatccag ctgatcatcg aggctggctt cagtgtcgccgtcagcgagc tcgacgtgca ggtctgggaa gcgtggaacg ccgagcccga cggcacgagcgcggccgcgt accgcgacct gaccgacccg tcggtcaagg accgcttctc ccgtggtccattcacctact gggtcggcaa gatcaccaac cgggccgagc tggaggcgat ccaggcgcagcggtacgccg agtatttcgc ggtctacagg aagtactcgc aggacatcga tcgggtgaccttctggggcc tgaccgactt cctcaactgg cggaggaacc acaacccgca gctcttcaaccgcgacttct cggagaagct cgcagcagtc gccaccgccg accctgaggg ctggctgggcctccgcaggc cggtgaccga cacctccacg cttcgtcaga ccatcgcaga ggtcgacgcgatgaacctgc gcggccacac ctacaccggg cgcagcatcg gcgcggtgct gggtgcccgaggacaggcca tcgcágtgct ggcccgtggt ggcacccagg ccgaggtgaa cgcggcgaacgccgccctcg tcgacgcgat ggcagcgctc gaacggaggt ag<210> 598<211> 613<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

60120180240300360420480540600660720780840900960102010801140120012601320138014401500156016201680174018001842

<221><222><220><221><222><223><220><221><222>

SIGNAL(1)..'.(31)

DOMÍNIO(114)...(536)

Família 10 de hidrolase glicosilaSITE

(181)...(184)<223> N-glicosilação site. Prosite id =<220>

<221> SITE

<222> (190)...(193)

<223> N-glicosilação site. Prosite id =<22 0>

<221> SITE<222> (422)...(432)

PS00001

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 598

Met Val Arg Ser Asp Thr Thr Arg Thr Arg Arg Phe Ala Leu Leu Val1 5 10 15 Val Ser Ala Met Val Ala Gly Met Ala Val Leu Pro Ala Ala Ala Ala 20 25 30 Asp Thr Ala Ala Ala Glu Gly Ala Phe Glu Val Glu Ile Arg Met Ala 35 40 45 Gly Ser Gly Thr Val Ser Gly Ala Gly Ser Tyr Asn Ala Gly Asp Thr 50 55 60 Val Glu Leu Thr Ala Thr Pro Asn Glu Gly His Val Trp Gly Gly Trp 65 70 75 80Thr Ser Ala Glu Leu Glu Trp Ile Gly Ala Arg Val Ser Ser Phe Thr 85 90 95 Met Pro Glu His Asp Val Val Leu Glu Thr Thr Phe Arg Pro Arg Met 100 105 110 Ala Ser Leu 115 Arg Glu Ala Tyr Thr 120 Asp Tyr Phe Pro Val 125 Gly Asn IleTrp Ser Asn Val Gly Thr Tyr Ala Ala Gly Ser Pro Asn Ser Glu Thr 130 135 140 Ile Ala Arg His Tyr Asn Ile Met Thr Ala Glu Asn His Met Lys Pro145 150 155 160Asn Met Leu Leu Pro 165 Asn Gln Asn Ile Asn 170 Pro Thr Thr Arg Ala 175 PheThr Phe Asn Trp 180 Thr Thr Ala Asp Thr 185 Phe Val Asn Gln Thr 190 Leu AspArg Gly Met Gln Val His Gly His Val Leu Val Trp His Ser Gln Thr 195 200 205 Pro Ala Arg Ile Phe Ser Gly Ala Thr Gly Gly Thr Arg Ala Leu Ala 210 215 220 Lys Asp Asn Met Glu Arg Tyr Ile Glu Ala Val Leu Thr His Phe Arg225 230 235 240Asp Arg Val Val Ser Trp Asp Val Val Asn Glu Ala Phe Ile Asp Glu 245 250 255 Ile Ser Glu Phe 260 Asp Pro Glu Thr Glu 265 Asp Trp Arg Asp Tyr 270 Leu ArgGly Gly Pro Arg Gly Gly Ser Ser Gly Trp Tyr Thr Ala Tyr Gly Asn 275 280 285 Gly Ala Asp Val Glu Ala Gly Glu His Pro Ser Asp Phe Leu Tyr Asp 290 295 300 Ala Phe Val Leu Ala Arg Lys His Gly Pro Glu Val Lys Leu Glu Tyr305 310 315 320Asn Asp Phe Asn Phe Phe Gln Ser Glu Gly Lys Ala Lys Ala Ile Ile 325 330 335 Ala Met Ala Leu 340 Glu Leu Asn Glu Arg 345 Tyr Ala Ala Glu Tyr 350 Pro AspAsp Gln Arg Pro Leu Ile Glu Gly Leu Gly Met Gln Ser His Asn Tyr 355 360 365 Ile Asn 370 Gln Thr Pro Ala Phe 375 Ala Cys Ser Asp Leu 380 Thr Arg Leu ProGlu Leu Val Asp Asp Ala Val Glu Glu Trp Lys Pro Gly Ala Cys Ser385 390 395 400Asn Phe Ala Ser Val Glu Arg Ser Ile Gln Leu Ile Ile Glu Ala Gly 405 410 415 Phe Ser Val Ala 420 Val Ser Glu Leu Asp 425 Val Gln Val Trp Glu 430 Ala TrpAsn Ala Glu 435 Pro Asp Gly Thr Ser 440 Ala Ala Ala Tyr Arg 445 Asp Leu ThrAsp Pro 450 Ser Val Lys Asp Arg 455 Phe Ser Arg Gly Pro 460 Phe Thr Tyr TrpVal Gly Lys Ile Thr Asn Arg Ala Glu Leu Glu Ala Ile Gln Ala Gln465 470 475 480Arg Tyr Ala Glu Tyr Phe Ala Val Tyr Arg Lys Tyr Ser Gln Asp Ile 485 490 495 Asp Arg Val Thr Phe Trp Gly Leu Thr Asp Phe Leu Asn Trp Arg Arg 500 505 510 Asn His Asn Pro Gln Leu Phe Asn Arg Asp Phe Ser Glu Lys Leu Ala

515 520 525Ala Val Ala Thr Ala Asp Pro Glu Gly Trp Leu Gly Leu Arg Arg Pro 530 535 540 AlaVal Thr Asp Thr Ser Thr Leu Arg Gln Thr Ile Ala Glu Val Asp 545 550 555 560Met Asn Leu Arg Gly His Thr Tyr Thr Gly Arg Ser Ile Gly Ala Val 565 570 575 Leu Gly Ala Arg Gly Gln Ala Ile Ala Val Leu Ala Arg Gly Gly Thr 580 585 590 Gln Ala Glu 595 Val Asn Ala Ala Asn 600 Ala Ala Leu Val Asp 605 Ala Met AlaAla Leu Glu Arg Arg

610

<210> 599

<211> 3801

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 599

atgggtagac agctcaaaaa gatcatttct atggtacttg cgtttgcttt gctgatcccgatgatgccga tcacggcagc agcggccgca gagatggaga ccgtgtatca tgagacctttgccagcggca cgagtgcggc tgtgcaatcg ggcggggccg atctgtccta tgtgacagataaagtgtttg caggtaatgc agacggtgca gcgcttcgtg taagcaaccg cacgaatgattgggatgcgg cagatttctc atacgaagct ctaggtttgc aggttgggaa gacatatacgatcagagtaa ccggatatat tgatacggat acagcggtgc cttctggctc ccaagccgttatcaatacgg ttgaaggcca caactgggca gcaaatgtgg atatcgcggc tggtcaagcctttacactga caagagaaga tttcacactc cctgcgggaa gcaatcgtct gcgtcttcaatccaacagta ctggcgcagc agtgccattc tatattggag agatccagat acttgcaaagaaagaaccag taactaatgt taccgtgtac caagagacct tcgcaaccgg aacgagcgcagctgtgcagt ccggcggagc taatctatcc tac-gtgacag ataaagtatt tgcaggcaatgaagacggtg cagcccttcg agtaagcaac cgcacgaatg attgggatgc ggcagatttctcatacgatg cgatgggact acaagctggc aaggcataca cgattaaggt tgtcggctatgttgatgcgg atacagcggt gcctgccggc tctcaagcag ttatcaatac tgtgcctggctatagctggg cagcgaatgt ggacatcgct gcagggcaag tcttcacgct gacgaaggaagactacacgc ttcctgcggg aagtgatcgt ctgcgtcttc aatccaacag tactggcgcggcagtgccat tctatattgg cgaaatcctg attacagaga agtcgagcgc tggcggcggcaatgacggcg gtggcgatca agaggaaccg ccaagacctc cagcgttgcc atttaccactattaccttcg aggatcaaac catgggcggt tttacgggcc gtgcaggtac cgagtccctgacgatcacga acgaagccaa ccgtacagaa ggcggatctt acgctcttaa ggtagagaacagatccaata actggcatgg accttctctt cgcgtggaac aatatgtaga cagaggatacgagtatcatg tgtctgcatg ggtgaagctg atttccccgg agaacgcgca gctgcagctgtctacacaag tgggtgacgg aaatagcgcg agctacaaca acattgagcg taagaccgtcagcacagagg atggctgggt tgagcttaaa ggaacgtacc gctacaacag tgtcggcggtgaatatttga cgatctacat tgagtctccg aacagcgcta cggcatcgtt ctatgttgacgatatcagct ttgtcaaagg ctcaggacct gtggatattc agcgggattt aactccggttaaggatgtat atgctaatga tttcctgatc ggcaacgctg tgtctgccgc tgatctggaaggcataagat tggagctgct gaagcagcat cataacgtcg ttacggcaga gaacgccatgaagccttcct atatgcagcc aaccaagggg aactttacct ttgcgggctc ggatgcgatcgtgaacaagg cgcttgcgga aggtctgcag gtgttcggcc acgtgttggt atggcatcagcagtcgccgg attggatgaa cctggatgca gacggcaatt atctgagcag agaagaagcgctcgataacc tgagaactca catccgtacc gttatggagc attatgggga ccggttgatcggttgggatg tcgtgaacga ggcgatgaga gataacccgc cgaatccgac agattggaaggcatccctgc gtcaatccgc atggtatcat gcgattggtc ctgactacgt ggagcaggcgtatctggctg cgcgcgaggt actggatgaa aatccggatt ggaatgttaa gctgtactataacgactata atgatgataa tcagaataag gcaacagcga tttaccacat ggttaaggatataaatgatc gctatgcggc agctaacaat ggcaagctgc taatcgatgg cataggcatgcagggtcact acaatatggg caccaatccg gaaaatgtaa gactttctct ggaacggttcatcaccctag gtgtagagat cagcgtgacc gagctcgata ttcaggctgg cacgaactctgtgctgacgg agcagcaagc gattgcccaa ggctatctat acgcgcaatt attcaaaatttataaagata acgcagatca tatcgcgcgt gttaccttct gggggcttaa cgatgcaaccagctggagag ctgcaacgag tccgcttatc ttcgacagca atctgcaggc gaagcctgcctactacgctg taatcgatcc ggagaaattc ctggccgact acacaccgga tcaatccgaggcgaatcgcg gcagcgcggt attcggtaca ccggtcattg atggaacgat cgatgcgatctggagcgagg ctcccgtgct cgacatcaat cgttatcagc tcgcatggca aggagctgcaggcgtagcta gagcgctgtg ggatcatgag aacctctatg tgctgattca ggttacggatacggagctga acaaagccaa tgcgaaccca tgggagcagg attccgttga aatcttcgtagacgagaata ataacaaaac gacattctac caaaatgatg acgcgcaata cagagtcaacttcgataatg aagcgacctt taatcctgcg agtatagcgg aaggctttga

aaggtgtccg gcacgaacta tacggttgag gtgaagattc ctttcagaac

gcggtgaata aggaaattgg cttagacctg cagatcaatg atgcaacggc

acgagcgtcg ctacgtggaa tgatacgacg ggcaacgcat atcaagatac

ggtgtgctta cattgactgc tgaaggcaca aatccaggca cagacccagg

ggcaacggcc cgggtaacgg caacggtcat ggtccaatcc ataaccctgg

gttacagaag tgacggcaac aatcaccggc ggtaaagcaa tagctgctgt

agcttcgagt ccgcgcttgc caatgccaaa gcaggacagc tcagcttcat

gcaggacaat ccactaatgt atccttgctg ctctcgggca gtcaagtgaa

gatgcgggga tcaagaccgt ggaggtcaac acaggcttgg caacgctgga

tcgctcattg cgaagggatc ggcagacgta gaggtgaatg tgatccgagt

acgttgccgg ccagcatgcg aagcaaggta ggcagcaatc cagtgtttga

attgtgggcg gcaagaagat cagcagcttc ggcgcaaacc agcaggtgac

gcatacactc tgcagccgag cgagaagcct ggtcaagtag caagctactt

agcggcgagc tggaaattgt gaagaatgct cggtttaacc cggcgttcggtttaaaacga ggaatttcta a<210> 600<211> 1266<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220><221> SIGNAL

<222> (1)...(29)<220>

<221> DOMÍNIO

<222> (355)..,(507)

<223> Domínio de carbohidrato

<220>

<221> DOMÍNIO

<222> (519)·. . . (848)

<223> Família 10 de hidrolase glicosila<220>

<221> DOMÍNIO

<222> (868)...(1048)

<223> Domínio of desconhecido function (DUF1083)<220>

<221> SITE

<222> (77)... (80)

<223> N-glicosilação site. Prosite id<220>

<221> SITE

<222> (164)...(167)

<223> N-glicosilação site. Prosite id<220>

<221> SITE

<222> (188)...(191)

<223> N-glicosilação site. Prosite id = PS00001

<220>

<221> SITE

<222> (211)...(214)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (233)...(236)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (320) . .. (323)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (392)...(395)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

atccgcaacgcattacccctaggctcgcgtttccgtgttcaacaggtccacaaagcgcaaaagtgatgcccgtgaagggtacgtgcggcggctgcctttaggatgtatcccttcaacctgaatcacttaccatagcagaccgtcgttgaa

2940300030603120318032403300336034203480354036003660372037803801

PS00001

= PS00001<222> (406)...(409)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (579)...(582)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (758)...(774)

<223> G-protein coupled receptors family 1 signature. Prosite id = PS00237<220>

<221> SITE

<222> (775)...(785)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591

<220>

<221> SITE

<222> (959)...(962)

<223> N-glicosilação site. Prosite id = PS00001<220>20 <221> SITE

<222> (1001)...(1004)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (1042)...(1045)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (1143)...(1146)<223> N-glicosilação site. Prosite id = PS00001<400> 600

Met Gly Arg Gln Leu Lys Lys Ile Ile Ser Met Val Leu Ala Phe Ala15 10 15

Leu Leu Ile Pro Met Met Pro Ile Thr Ala Ala Ala Ala Ala Glu Met

35 20 25 30

Glu Thr Val Tyr His Glu Thr Phe Ala Ser Gly Thr Ser Ala Ala Val

35 40 45

Gln Ser Gly Gly Ala Asp Leu Ser Tyr Val Thr Asp Lys Val Phe Ala50 55 60

Gly Asn Ala Asp Gly Ala Ala Leu Arg Val Ser Asn Arg Thr Asn Asp65 70 75 80

Trp Asp Ala Ala Asp Phe Ser Tyr Glu Ala Leu Gly Leu Gln Val Gly

85 90 95

Lys Thr Tyr Thr Ile Arg Val Thr Gly Tyr Ile Asp Thr Asp Thr Ala

45 100 105 no

Val Pro Ser Gly Ser Gln Ala Val Ile Asn Thr Val Glu Gly His Asn

115 120 125

Trp Ala Ala Asn Val Asp Ile Ala Ala Gly Gln Ala Phe Thr Leu Thr130 135 140

Arg Glu Asp Phe Thr Leu Pro Ala Gly Ser Asn Arg Leu Arg Leu Gln145 150 155 160

Ser Asn Ser Thr Gly Ala Ala Val Pro Phe Tyr Ile Gly Glu Ile Gln

165 170 175

Ile Leu Ala Lys Lys Glu Pro Val Thr Asn Val Thr Val Tyr Gln Glu180 185 190

Thr Phe Ala Thr Gly Thr Ser Ala Ala Val Gln Ser Gly Gly Ala Asn

195 200 205

Leu Ser Tyr Val Thr Asp Lys Val Phe Ala Gly Asn Glu Asp Gly Ala210 215 220

Ala Leu Arg Val Ser Asn Arg Thr Asn Asp Trp Asp Ala Ala Asp Phe225 230 235 240

Ser Tyr Asp Ala Met Gly Leu Gln Ala Gly Lys Ala Tyr Thr Ile Lys

245 250 255

Val Val Gly Tyr Val Asp Ala Asp Thr Ala Val Pro Ala Gly Ser Gln65 260 265 270

Ala Val Ile Asn Thr Val Pro Gly Tyr Ser Trp Ala Ala Asn Val Asp275 280 285Ile Ala Ala Gly Gln Val Phe Thr Leu Thr Lys Glu Asp Tyr Thr Leu290 295 300

Pro Ala Gly Ser Asp Arg Leu Arg Leu Gln Ser Asn Ser Thr Gly Ala305 310 315 320

Ala Val Pro Phe Tyr Ile Gly Glu Ile Leu Ile Thr Glu Lys Ser Ser325 330 335

Ala Gly Gly Gly Asn Asp Gly Gly Gly Asp Gln Glu Glu Pro Pro Arg340 345 350

Pro Pro Ala Leu Pro Phe Thr Thr Ile Thr Phe Glu Asp Gln Thr Met355 360 365

Gly Gly Phe Thr Gly Arg Ala Gly Thr Glu Ser Leu Thr Ile Thr Asn370 375 380

Glu Ala Asn Arg Thr Glu Gly Gly Ser Tyr Ala Leu Lys Val Glu Asn385 390 395 400

Arg Ser Asn Asn Trp His Gly Pro Ser Leu Arg Val Glu Gln Tyr Val405 410 415

Asp Arg Gly Tyr Glu Tyr His Val Ser Ala Trp Val Lys Leu Ile Ser420 425 430

Pro Glu Asn Ala Gln Leu Gln Leu Ser Thr Gln Val Gly Asp Gly Asn435 440 445

Ser Ala Ser Tyr Asn Asn Ile Glu Arg Lys Thr Val Ser Thr Glu Asp450 455 460

Gly Trp Val Glu Leu Lys Gly Thr Tyr Arg Tyr Asn Ser Val Gly Gly465 470 475 480

Glu Tyr Leu Thr Ile Tyr Ile Glu Ser Pro Asn Ser Ala Thr Ala Ser485 490 495

Phe Tyr Val Asp Asp Ile Ser Phe Val Lys Gly Ser Gly Pro Val Asp500 505 510

Ile Gln Arg Asp Leu Thr Pro Val Lys Asp Val Tyr Ala Asn Asp Phe515 520 525

Leu Ile Gly Asn Ala Val Ser Ala Ala Asp Leu Glu Gly Ile Arg Leu530 535 540

Glu Leu Leu Lys Gln His His Asn Val Val Thr Ala Glu Asn Ala Met545 550 555 560

Lys Pro Ser Tyr Met Gln Pro Thr Lys Gly Asn Phe Thr Phe Ala Gly565 570 575

Ser Asp Ala Ile Val Asn Lys Ala Leu Ala Glu Gly Leu Gln Val Phe580 585 590

Gly His Val Leu Val Trp His Gln Gln Ser Pro Asp Trp Met Asn Leu595 600 605

Asp Ala Asp Gly Asn Tyr Leu Ser Arg Glu Glu Ala Leu Asp Asn Leu610 615 620

Arg Thr His Ile Arg Thr Val Met Glu His Tyr Gly Asp Arg Leu Ile625 630 635 640

Gly Trp Asp Val Val Asn Glu Ala Met Arg Asp Asn Pro Pro Asn Pro645 650 655

Thr Asp Trp Lys Ala Ser Leu Arg Gln Ser Ala Trp Tyr His Ala Ile660 665 670

Gly Pro Asp Tyr Val Glu Gln Ala Tyr Leu Ala Ala Arg Glu Val Leu675 680 685

Asp Glu Asn Pro Asp Trp Asn Val Lys Leu Tyr Tyr Asn Asp Tyr Asn690 695 700

Asp Asp Asn Gln Asn Lys Ala Thr Ala Ile Tyr His Met Val Lys Asp705 710 715 ' 720

Ile Asn Asp Arg Tyr Ala Ala Ala Asn Asn Gly Lys Leu Leu Ile Asp725 730 735

Gly Ile Gly Met Gln Gly His Tyr Asn Met Gly Thr Asn Pro Glu Asn740 745 750

Val Arg Leu Ser Leu Glu Arg Phe Ile Thr Leu Gly Val Glu Ile Ser755 760 765

Val Thr Glu Leu Asp Ile Gln Ala Gly Thr Asn Ser Val Leu Thr Glu770 775 780

Gln Gln Ala Ile Ala Gln Gly Tyr Leu Tyr Ala Gln Leu Phe Lys Ile785 790 795 800

Tyr Lys Asp Asn Ala Asp His Ile Ala Arg Val Thr Phe Trp Gly Leu805 810 815

Asn Asp Ala Thr Ser Trp Arg Ala Ala Thr Ser Pro Leu Ile Phe Asp820 825 830 GluSer Asn Leu Gln Ala Lys Pro Ala Tyr Tyr Ala Val Ile Asp Pro 835 840 845 GlyLys Phe Leu Ala Asp Tyr Thr Pro Asp Gln Ser Glu Ala Asn Arg 850 855 860 IleSer Ala Val Phe Gly Thr Pro Val Ile Asp Gly Thr Ile Asp Ala 865 870 875 Ala 880Trp Ser Glu Ala Pro Val Leu Asp Ile Asn Arg Tyr Gln Leu Trp 885 890 895 Gln Gly Ala Ala Gly Val Ala Arg Ala Leu Trp Asp His Glu Asn Leu 900 905 910 AlaTyr Val Leu Ile Gln Val Thr Asp Thr Glu Leu Asn Lys Ala Asn 915 920 925 Asn Pro Trp Glu Gln Asp Ser Val Glu Ile Phe Val Asp Glu Asn Asn 930 935 940 Asn Lys Thr Thr Phe Tyr Gln Asn Asp Asp Ala Gln Tyr Arg Val Asn945 950 955 960Phe Asp Asn Glu Ala Thr Phe Asn Pro Ala Ser Ile Ala Glu Gly Phe 965 970 975 Glu Ser Ala Thr Lys Val Ser Gly Thr Asn Tyr Thr Val Glu Val Lys 980 985 990 Ile Pro Phe Arg Thr Ile Thr Pro Ala Val Asn Lys Glu Ile Gly Leu 995 1000 1005

Asp Leu Gln Ile Asn Asp Ala Thr Ala Gly Ser Arg Thr Ser Val 1010 1015 1020 Ala Thr Trp Asn Asp Thr Thr Gly Asn Ala Tyr Gln Asp Thr Ser 1025 1030 1035 Pro GlyVal Phe Gly Val Leu Thr Leu Thr Ala Glu Gly Thr Asn 1040 1045 1050 Thr Asp Pro Gly Thr Gly Pro Gly Asn Gly Pro Gly Asn Gly Asn 1055 1060 1065 Gly His Gly Pro Ile His Asn Pro Gly Lys Ala Gln Val Thr Glu 1070 1075 1080 Val Thr Ala Thr Ile Thr Gly Gly Lys Ala Ile Ala Ala Val Ser 1085 1090 1095 Asp Ala Ser Phe Glu Ser Ala Leu Ala Asn Ala Lys Ala Gly Gln 1100 1105 1110 Leu Ser Phe Ile Val Lys Gly Ala Gly Gln Ser Thr Asn Val Ser 1115 1120 1125 Leu Leu Leu Ser Gly Ser Gln Val Lys Arg Ala Ala Asp Ala Gly 1130 1135 1140 Ile Lys Thr Val Glu Val Asn Thr Gly Leu Ala Thr Leu Glu Leu 1145 1150 1155 Pro Leu Ser Leu Ile Ala Lys Gly Ser Ala Asp Val Glu Val Asn 1160 1165 1170 Val Ile Arg Val Asp Val Ser Thr Leu Pro Ala Ser Met Arg Ser 1175 1180 1185 Val GlyLys Val Gly Ser Asn Pro Val Phe Asp Phe Asn Leu Ile 1190 1195 1200 Gly Lys Lys Ile Ser Ser Phe Gly Ala Asn Gln Gln Val Thr Ile 1205 1210 1215 Thr Tyr Ala Tyr Thr Leu Gln Pro Ser Glu Lys Pro Gly Gln Val 1220 1225 1230 Ala Ser Tyr Phe Ile Ala Asp Ser Gly Glu Leu Glu Ile Val Lys 1235 1240 1245 Asn Ala Arg Phe Asn Pro Ala Phe Gly Val Val Glu Phe Lys Thr 1250 1255 1260

Arg Asn Phe

<210> 601<211> 1533<212> DNA<213> Desconhecido<220><223> Obtido para amostra ambiental<400> 601

atggaaaaca agaaatttgt acgtgcgatc tttctgatta cgacggcatg ttgtctatcggccaatgccg taggttccga cctgccggcg ttgcaggacg tgtttaagga ccattttctgattgggggcg cgtataaccg caatttagtg gttgggcggg acccccgagc ggcggagatcgccatcaagc actacaatac cgccacctct gagaatgata tgaagtggtc tctgatccatcctcagccga accaatataa ctgggagccg gcggaccgtt tcatggagtt ctgtgaaaaacacaatatgg cgccgatcgg ccacgccctt gtttggcaca gccaggtgcc gcgatgggtttttacggacg attcgggaaa tactctgacc cgcgaggcgc tgctggcccg tatgaaggaacatatcacag cggttgccgg ccggtataaa ggacgcatga agggctggga cgttgtcaacgaggcgttga acgataacgg caccctacgc aacaccgctt ggctgagaat catcggggagggcaagccgg aacagcaata tgatttcata gcaaaagcgt tccaatatgc ccatgaggccgacccggacg cggagctcta ttacaatgac tataatcttt ccacctcaag ggccaaggcggacggggcgg cggccattgt caagcacctt caatccaaag ggatccgtat cgacggcgtcgggatgcagg tgcacgccgg tctgacatgg cctactatcg aagaccttga atacgcgatcaagacgctgt cggcaacggg cgtcaaagtg atggtgacag agctggatat tcgcacgcggacacacggcc ctcaaggcgc tgcaatcacc cagattaacc gacggaccac ggacgatccggatgcggttt tgccggaagt tcagcagaaa ctcgccgata aatacgccga gatcttctctgtcctggtca agcacaagga cgttatcccg cgtgtcacgt tctggggtgt tcatgatgggatgtcgtgga tcggcggctc acctttgctc tttgacagcg attatcagcc caagcaggcctttcacgcag tgctcaacgt cgttcgcggc gacagttccg gtcaggccca atcggcgcgcaaccccgtca tctgggccga tgttccggat gtcgcggcca ttcgcgtcgg cgacacctactacatggcca gcaccaccat gcacatgagt cccggcttgc ccatcatgaa atcgaagaacctggtcaact gggaattggt cggttatgcc tacgacaccc tggccgacaa ccaggccctccggttggaaa acggccgaaa cgcctacggt cggggctcct gggcgcccag cctgcgctaccacaacggga ccttctatgc atcgaccttt tccgccacga gcggtcgaac acacatctataccactgcgg acattgagaa gggtccgtgg aaagaaatat cattttcccc ttcgatacacgatcattctc tgttcttcga tgctcgtgcc gaa<210> 602<211> 511<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

SIGNAL(1) . . . (23)

<221><222><220>

<221> DOMÍNIO<222> (30)...(368)

<223> Família 10 de hidrolase glicosila<220>

SITE

___ (168)...(171)<223> N-glicosilação site. Prosite id =<220>

<221> SITE<222> (215)...(218)<223> N-glicosilação<220>

<221><222>

PS00001

site. Prosite id = PS00001

1201802403003604204805406006607207808409009601020108011401200126013201380144015001533

<221><222>

SITE(271)

(281)

Prosite id = PS00001

<223> Família 10 ativa site de hidrolases glicosila. Prosite id -<220>

<221> SITE<222> (469)...(472)<223> N-glicosilação site.<400> 602

Met Glu Asn Lys Lys Phe Val Arg Ala Ile Phe Leu Ile Thr Thr Ala15 10 15

Cys Cys Leu Ser Ala Asn Ala Val Gly Ser Asp Leu Pro Ala Leu Gln

20 25 30

Asp Val Phe Lys Asp His Phe Leu Ile Gly Gly Ala Tyr Asn Arg Asn

35 40 45

Leu Val Val Gly Arg Asp Pro Arg Ala Ala Glu Ile Ala Ile Lys His

50 55 60

Tvr Asn Thr Ala Thr Ser Glu Asn Asp Met Lys Trp Ser Leu Ile His65 70 75 80

Pro Gln Pro Asn Gln Tyr Asn Trp Glu Pro Ala Asp Arg Phe Met Glu85 90 95

PS00591Phe Cys Glu Lys His Asn Met Ala Pro Ile Gly His Ala Leu Val Trp

100 105 110

His Ser Gln Val Pro Arg Trp Val Phe Thr Asp Asp Ser Gly Asn Thr115 120 125

Leu Thr Arg Glu Ala Leu Leu Ala Arg Met Lys Glu His Ile Thr Ala130 135 140

Val Ala Gly Arg Tyr Lys Gly Arg Met Lys Gly Trp Asp Val Val Asn145 150 155 160

Glu Ala Leu Asn Asp Asn Gly Thr Leu Arg Asn Thr Ala Trp Leu Arg165 170 175

Ile Ile Gly Glu Gly Lys Pro Glu Gln Gln Tyr Asp Phe Ile Ala Lys

180 185 190

Ala Phe Gln Tyr Ala His Glu Ala Asp Pro Asp Ala Glu Leu Tyr Tyr195 200 205

Asn Asp Tyr Asn Leu Ser Thr Ser Arg Ala Lys Ala Asp Gly Ala Ala210 215 220

Ala Ile Val Lys His Leu Gln Ser Lys Gly Ile Arg Ile Asp Gly Val225 230 235 240

Gly Met Gln Val His Ala Gly Leu Thr Trp Pro Thr Ile Glu Asp Leu245 250 255

Glu Tyr Ala Ile Lys Thr Leu Ser Ala Thr Gly Val Lys Val Met Val

260 265 270

Thr Glu Leu Asp Ile Arg Thr Arg Thr His Gly Pro Gln Gly Ala Ala275 280 285

Ile Thr Gln Ile Asn Arg Arg Thr Thr Asp Asp Pro Asp Ala Val Leu290 295 300

Pro Glu Val Gln Gln Lys Leu Ala Asp Lys Tyr Ala Glu Ile Phe Ser305 310 315 320

Val Leu Val Lys His Lys Asp Val Ile Pro Arg Val Thr Phe Trp Gly325 330 335

Val His Asp Gly Met Ser Trp Ile Gly Gly Ser Pro Leu Leu Phe Asp

340 345 350

Ser Asp Tyr Gln Pro Lys Gln Ala Phe His Ala Val Leu Asn Val Val355 360 365

Arg Gly Asp Ser Ser Gly Gln Ala Gln Ser Ala Arg Asn Pro Val Ile370 375 380

Trp Ala Asp Val Pro Asp Val Ala Ala Ile Arg Val Gly Asp Thr Tyr385 390 395 400

Tyr Met Ala Ser Thr Thr Met His Met Ser Pro Gly Leu Pro Ile Met405 410 415

Lys Ser Lys Asn Leu Val Asn Trp Glu Leu Val Gly Tyr Ala Tyr Asp

420 425 430

Thr Leu Ala Asp Asn Gln Ala Leu Arg Leu Glu Asn Gly Arg Asn Ala435 440 445

Tyr Gly Arg Gly Ser Trp Ala Pro Ser Leu Arg Tyr His Asn Gly Thr450 455 460

Phe Tyr Ala Ser Thr Phe Ser Ala Thr Ser Gly Arg Thr His Ile Tyr465 470 475 480

Thr Thr Ala Asp Ile Glu Lys Gly Pro Trp Lys Glu Ile Ser Phe Ser485 490 495

Pro Ser Ile His Asp His Ser Leu Phe Phe Asp Ala Arg Ala Glu500 505 510

<210> 603<211> 1167<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 603

atgaagaaaa tattaaaaaa attaaaagaa acaagtgtat tacactttgt ggtaattgca 60

tcaatatttt tatcatcctg cggtaatgca gatgtttctg aaaatgatgt tccatcactaaaagatgtat ttgaagatgc atttttaatt ggaacagctc ttaacgaatc acagatctatggtgaggaca aaaagagtgt tgagttgaca aaaactcatt tcaatgctat aactgctgaaaatgttacaa aatgggaggt tatccacccc gaaccgggag tgtataattt tgggccaactgatgaacttg tagcatttgg cgaagaaaat gatatgttta ttatcggtca tacattggta 360

120180240300

tggcatagcc agacgccgcg ttgggttttt gaagatgatg aaggcaatcc tgttgatcgagatgttttga ttgaaaggat gcgcgaccat attcatacgg tagttggcag atataaagga

420480aaaattcacg ggtgggatgt tgtaaatgaa gcattaaatg aagacggtac ttggagagaatcgccatggt acaacattat aggagaagat tatcttgtta aggcttttaa atttgcaagagaagcagacc ctgaagcaga gctatattac aatgattact ctcttgaaaa cccagaaaagcttgcaggtg ctgtaaggtt agtagaattt ctccaggaac acgatgcacc aataactggtataggaactc aggggcattg gagtgtaagg cacccaaccc ttgaagaatt ggaaaacactttaaccgatc ttggtaatct tggtatagat gtaatgatta ccgaaatgga tgtggatgtgcttccggctg cttttcatta tcatggtgct gatatatcca tgcaagctga attaagagaagaattaaatc cctatcctga tggattacct gaagaagccc agcaagaact tgctgcaagatacagagagt tttttgaagt tatactcaga caccgtgata acgtaacacg tgtgactttttggggggtta ctgatggtga ttcatggcta aataactggc ctgtgagagg aaggacaagttatcctttgc tatttgaccg tgaatatgaa cctaaatcag cattttattc agtggtagatttagccaagg aagttttgga agattaa<210> 604<211> 388<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1) . . . (30)<220>

<221> DOMÍNIO<222> (39)... (382)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (55)... (58)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (82)...(85)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (339) . . . (342)

<223> N-glicosilação site. Prosite id = PS00001<400> 604

Met Lys Lys Ile Leu Lys Lys Leu Lys Glu Thr Ser Val Leu His Phe1 5 10 15 Val Val Ile Ala Ser Ile Phe Leu Ser Ser Cys Gly Asn Ala Asp Val 20 25 30 Ser Glu Asn 35 Asp Val Pro Ser Leu 40 Lys Asp Val Phe Glu 45 Asp Ala PheLeu Ile Gly Thr Ala Leu Asn Glu Ser Gln Ile Tyr Gly Glu Asp Lys 50 55 60 Lys Ser Val Glu Leu Thr Lys Thr His Phe Asn Ala Ile Thr Ala Glu65 70 75 80Asn Val Thr Lys Trp 85 Glu Val Ile His Pro 90 Glu Pro Gly Val Tyr 95 AsnPhe Gly Pro Thr Asp Glu Leu Val Ala Phe Gly Glu Glu Asn Asp Met 100 105 110 Phe Ile Ile 115 Gly His Thr Leu Val 120 Trp His Ser Gln Thr 125 Pro Arg TrpVal Phe 130 Glu Asp Asp Glu Gly 135 Asn Pro Val Asp Arg 140 Asp Val Leu IleGlu Arg Met Arg Asp His Ile His Thr Val Val Gly Arg Tyr Lys Gly145 150 155 160Lys Ile His Gly Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly 165 170 17 5 Thr Trp Arg Glu Ser Pro Trp Tyr Asn Ile Ile Gly Glu Asp Tyr Leu 180 185 190 Val Lys Ala Phe Lys Phe Ala Arg Glu Ala Asp Pro Glu Ala Glu Leu 195 200 205 Tyr Tyr Asn Asp Tyr Ser Leu Glu Asn Pro Glu Lys Leu Ala Gly Ala 210 215 220 Val Arg Leu Val Glu Phe Leu Gln Glu His Asp Ala Pro Ile Thr Gly225 230 235 240Ile Gly Thr Gln Gly His Trp Ser Val Arg His Pro Thr Leu Glu Glu 245 250 255 Leu Glu Asn Thr Leu Thr Asp Leu Gly Asn Leu Gly Ile Asp Val Met 260 265 270 Ile Thr Glu 275 Met Asp Val Asp Val 280 Leu Pro Ala Ala Phe 285 His Tyr. HisGly Ala Asp Ile Ser Met Gln Ala Glu Leu Arg Glu Glu Leu Asn Pro 290 295 300 Tyr Pro Asp Gly Leu Pro Glu Glu Ala Gln Gln Glu Leu Ala Ala Arg305 310 315 320Tyr Arg Glu Phe Phe Glu Val Ile Leu Arg His Arg Asp Asn Val Thr 325 330 335 Arg Val Thr Phe Trp Gly Val Thr Asp Gly Asp Ser Trp Leu Asn Asn 340 345 350 Trp Pro Val Arg Gly Arg Thr Ser Tyr Pro Leu Leu Phe Asp Arg Glu 355 360 365 Tyr Glu Pro Lys Ser Ala Phe Tyr Ser Val Val Asp Leu Ala Lys Glu 370 375 380 Val Leu Glu Asp

385

<210> 605

<211> 1146

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 605

atgactttct ctcgacggca atttttgctg caaacctccg ccggcctggc acttttgagcactgctaaaa tgcgcgcttt cgcccgagca gtggatgaag tgggccttaa agaccattttaaagaccatt ttcatattgg aactgccatc agcagtcgac tgatgacgga aatgccggccttttaccgcg acctggttac ccgtgaattc aacgccatca ccatggaaaa cgacatgaaatgggagcgtc tgcatcccaa agaaggccaa tgggattggg agattgccga caaattcgtcaattttggcg aagaaaacga catgtacatt gtcgggcatg ttctggtctg gcattcacagaccccggatt gggtcttcca ggattccaga ggcaagccca tttctcgcga cgctttgctgaaacgcatgc gccaccagat tgaacagatg gcgggccgct ataaaggccg ggtacacgcgtgggatgtgg tcaacgaggc ggtggacgag gaccaaggct ggcgcaaaag cccatggtttaacattattg ggcccgagtt tatggagcac gccttcaatt acgcccacga agtggaccccgacgctcacc tgttgtacaa cgactacaat atgcacggtc gggaaaaacg cgaattcgtcctggatttca tcaaaagata caagaaaaaa ggcatcccga tccagggcat aggcatgcagggccatgtgg gcctaagctt tcccgatatc agagagtttg agaaaagcct gcaagcctacgccaaacagg gcatgcggat gcacattacc gagctggata tggacgtgtt accggtggcctgggatcaca ttggcgcaga gatttccact gagttcgcct acgccgatga actggacccctggcccaaag ggctgccgga agaagtcgaa caggaattta ccgatcgcta cacggctttctttaaactgt ttttaaaata ccgtgacgat attgagcgag tcaccttctg gggaaccggtgatgcggaat cttggaaaaa taatttcccg gtaagggggc gcaccaacta cccactgctgtttgatcgcc gataccgcag aaaaccggcc tatgatgcgg tcgtcgaact gaccaaaaacctttaa<210> 606<211> 381<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(30)<220>

<221> DOMÍNIO<222> (35)...(378)

<223> Família 10 de hidrolase glicosila<400> 606

Met Thr Phe Ser Arg Arg Gln Phe Leu Leu Gln Thr Ser Ala Gly Leux 5 10 15

Ala Leu Leu Ser Thr Ala Lys Met Arg Ala Phe Ala Arg Ala Val Asp

20 25 30

Glu Val Gly Leu Lys Asp His Phe Lys Asp His Phe His Ile Gly Thr35 40 45

Ala Ile Ser Ser Arg Leu Met Thr Glu Met Pro Ala Phe Tyr Arg Asp

50 55 60

Leu Val Thr Arg Glu Phe Asn Ala Ile Thr Met Glu Asn Asp Met Lys65 70 75 80

Trp Glu Arg Leu His Pro Lys Glu Gly Gln Trp Asp Trp Glu Ile Ala

85 90 95

Asp Lys Phe Val Asn Phe Gly Glu Glu Asn Asp Met Tyr Ile Val Gly100 105 HO

His Val Leu Val Trp His Ser Gln Thr Pro Asp Trp Val Phe Gln Asp115 120 125

Ser Arg Gly Lys Pro Ile Ser Arg Asp Ala Leu Leu Lys Arg Met Arg

130 135 140

His Gln Ile Glu Gln Met Ala Gly Arg Tyr Lys Gly Arg Val His Ala145 150 155 160

Trp Asp Val Val Asn Glu Ala Val Asp Glu Asp Gln Gly Trp Arg Lys

165 170 175

Ser Pro Trp Phe Asn Ile Ile Gly Pro Glu Phe Met Glu His Ala Phe180 185 190

Asn Tyr Ala His Glu Val Asp Pro Asp Ala His Leu Leu Tyr Asn Asp195 200 205

Tyr Asn Met His Gly Arg Glu Lys Arg Glu Phe Val Leu Asp Phe Ile210 215 220

Lys Arg Tyr Lys Lys Lys Gly Ile Pro Ile Gln Gly Ile Gly Met Gln225 230 235 240

Gly His Val Gly Leu Ser Phe Pro Asp Ile Arg Glu Phe Glu Lys Ser

245 250 255

Leu Gln Ala Tyr Ala Lys Gln Gly Met Arg Met His Ile Thr Glu Leu260 265 270

Asp Met Asp Val Leu Pro Val Ala Trp Asp His Ile Gly Ala Glu Ile275 280 285

Ser Thr Glu Phe Ala Tyr Ala Asp Glu Leu Asp Pro Trp Pro Lys Gly

290 295 300

Leu Pro Glu Glu Val Glu Gln Glu Phe Thr Asp Arg Tyr Thr Ala Phe305 310 315 320

Phe Lys Leu Phe Leu Lys Tyr Arg Asp Asp Ile Glu Arg Val Thr Phe

325 330 335

Trp Gly Thr Gly Asp Ala Glu Ser Trp Lys Asn Asn Phe Pro Val Arg340 345 350

Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Arg Tyr Arg Arg Lys355 360 365

Pro Ala Tyr Asp Ala Val Val Glu Leu Thr Lys Asn Leu

370 375 380

<210> 607<211> 1515

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 607

atgagttttg caagcgtaaa aaatataact accgcaggca aagggttggt cgcgcttttc 60

accttcgcct tgctgttcgg aacttcatcg gtcaatgccc agacgacgct gacgtccaat 120

gtccagggct ctgtggacgg ttttttctat tctttctgga aggatagcgg ggatgcgtcc 180

atgacggtct accccggtgg tcgttacaca tcacaatgga acaactcgtc caacaactgg 240

gtgggtggtc tggggtggaa ccccggtggc cgcagagttg tgaactattc cggtcagtac 300

aatgtggaca attcacaaaa ctcctatcta gcactgtacg gttggacccg ggatccgctg 360

atcgaatact acgtgatcga aagctacggt tcctataacc cgtccaactg cactatcggt 420

cgtcagactt acggcacctt ccagagtgat ggcgccactt acgagattgt tcgctgtcag 480

cgtgtgcagc agccgtccat cgatggcact cagacgttct atcagtattt cagtgtgcgc 540

cagccaaagc tgggctttgg cagtgtcagc ggcacgatta ccgtgggcaa tcactttgat 600

gcctgggcct cggtggggct gaatctgggc aaccacgact atcaggtgat ggcgaccgag 660

ggttatcaaa gcttcggtag ctccgacatt actgtcagtg aaggagcagg cggtggcccg 720

ggtggcggcg gtcctggtgc gggtggtccc ggtggcggtt ctaccggctc tggcagcaat 780

acactggtgg tacgtgctgt gggcacatct ggcagtgagc aactgcgagt gaacgtcggc 840

ggcagctccg tggcaacgtt gagtctgtcc agtagctggc aggactatac cgtcaacacc 900

aacgccactg gcgacatcaa tgtcgaactg ttcaacgatc agggcccagg ctatgaggcg 960

cgcgttgagt acgtgattgt caacggcgac acccgctatg gtgcggatca gagctataac 1020accagcgcct gggacggcga gtgcggcggt ggcagcttca ccatgtggat gcactgtaac 1080ggtattcttg gtttcggtga catgaccggt ggcggcagtg gtggttcttc cggtggtgga 1140tcgaccggtg gaggctctac tggcggcggt tcttccagtg gtggtaacac gctggtggtg 1200cgtgctgttg gcacctccgg caacgagcag ttgcaggtca atgtgggtgg caacgctgtc 1260gagaccctga gtctgtccac cagttggcag gagtacacca tcaataccag cgcctcggga 1320gacgtcaacg tccagttgat caacgaccag ggtgaaggct acgaagcgcg tgtcgagtac 1380gtcatcatca acggtgatac ccgctacggt gcggatcaga gctacaacac aagcgcctgg 1440gacggtgagt gtggcggtgg cagcttcacc atgtggatgc actgcgaagg catactcggt 1500tttggtgata tgtaa 1515

<210> 608<211> 504<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(33)<220><221> DOMÍNIO

<222> (43) ... (232)

<223> Família 11 de glicosila hidrolases<220>

<221> SITE

<222> (8)...(11)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (75)...(78)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (96) ... (99)

<223> N-glicosilação site. Prosite id = PS00001

<220>

<221> SITE

<222> (120) .. . (130)

<223> Família 11 de glicosila hidrolases ativa site marca 1. Prosite id =PS00776

<220>

<221> SITE

<222> (138) . . . (141)

<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE

<222> (263) . .. (266)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (305) ... (308)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (345) ... (348)<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (441) . . . (444)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (483)...(486)

<223> N-glicosilação site. Prosite id = PS00001<400> 608

Met Ser Phe Ala Ser Val Lys Asn Ile Thr Thr Ala Gly Lys Gly Leu15 10 15

Val Ala Leu Phe Thr Phe Ala Leu Leu Phe Gly Thr Ser Ser Val Asn20 25 30 Ala Gln Thr Thr Leu Thr Ser Asn Val Gln Gly Ser Val Asp Gly Phe 35 40 45 Phe Tyr Ser Phe Trp Lys Asp Ser Gly Asp Ala Ser Met Thr Val Tyr 50 55 60 Pro Gly Gly Arg Tyr Thr Ser Gln Trp Asn Asn Ser Ser Asn Asn Trp 70 75 80Val Gly Gly Leu Gly Trp Asn Pro Gly Gly Arg Arg Val Val Asn Tyr 85 90 95 Ser Gly Gln Tyr Asn Val Asp Asn Ser Gln Asn Ser Tyr Leu Ala Leu 100 105 110 Tyr Gly Trp Thr Arg Asp Pro Leu Ile Glu Tyr Tyr Val Ile Glu Ser 115 120 125 Tyr Gly Ser Tyr Asn Pro Ser Asn Cys Thr Ile Gly Arg Gln Thr Tyr 130 135 140 Gly Thr Phe Gln Ser Asp Gly Ala Thr Tyr Glu Ile Val Arg Cys Gln145 150 155 160Arg Val Gln Gln Pro Ser Ile Asp Gly Thr Gln Thr Phe Tyr Gln Tyr 165 170 175 Phe Ser Val Arg Gln Pro Lys Leu Gly Phe Gly Ser Val Ser Gly Thr 180 185 190 Ile Thr Val Gly Asn His Phe Asp Ala Trp Ala Ser Val Gly Leu Asn 195 200 205 Leu Gly Asn His Asp Tyr Gln Val Met Ala Thr Glu Gly Tyr Gln Ser 210 215 220 Phe Gly Ser Ser Asp Ile Thr Val Ser Glu Gly Ala Gly Gly Gly Pro225 230 235 240Gly Gly Gly Gly Pro Gly Ala Gly Gly Pro Gly Gly Gly Ser Thr Gly 245 250 255 Ser Gly Ser Asn Thr Leu Val Val Arg Ala Val Gly Thr Ser Gly Ser 260 265 270 Glu Gln Leu Arg Val Asn Val Gly Gly Ser Ser Val Ala Thr Leu Ser 275 280 285 Leu Ser Ser Ser Trp Gln Asp Tyr Thr Val Asn Thr Asn Ala Thr Gly 290 295 300 Asp Ile Asn Val Glu Leu Phe Asn Asp Gln Gly Pro Gly Tyr Glu Ala 305 310 315 320Arg Val Glu Tyr Val Ile Val Asn Gly Asp Thr Arg Tyr Gly Ala Asp 325 330 335 Gln Ser Tyr Asn Thr Ser Ala Trp Asp Gly Glu Cys Gly Gly Gly Ser 340 345 350 Phe Thr Met Trp Met HiS Cys Asn Gly Ile Leu Gly Phe Gly Asp Met 355 360 365 Thr Gly Gly Gly Ser Gly Gly Ser Ser Gly Gly Gly Ser Thr Gly Gly 370 375 380 Gly Ser Thr Gly Gly Gly Ser Ser Ser Gly Gly Asn Thr Leu Val Val385 390 395 400Arg Ala Val Gly Thr Ser Gly Asn Glu Gln Leu Gln Val Asn Val Gly 405 410 415 Gly Asn Ala Val Glu Thr Leu Ser Leu Ser Thr Ser Trp Gln Glu Tyr 420 425 430 Thr Ile Asn Thr Ser Ala Ser Gly Asp Val Asn Val Gln Leu Ile Asn 435 440 445 Asp Gln Gly Glu Gly Tyr Glu Ala Arg Val Glu Tyr Val Ile Ile Asn 450 455 460 Gly Asp Thr Arg Tyr Gly Ala Asp Gln Ser Tyr Asn Thr Ser Ala Trp465 470 475 480Asp Gly Glu Cys Gly Gly Gly Ser Phe Thr Met Trp Met His Cys Glu 485 490 495 Gly Ile Leu Gly Phe Gly Asp Met

500

<210> 609

<211> 1146

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 609

atgactattt cccgccggaa atttatgtgg ggcacagctg cactcctggc cgccacccagctcaaaaccc gcgctctcgc cgctgccatg gccagcacag gcatcaagga cgccttcaagggcgacttcc atatcggcac cgccatcagc aacgctaccc tgcaaaacca ggatgccaccatgctggatt tgatcaagcg cgaatttaat gcaattaccg ctgaaaattg catgaagtgggagcctattc gcccacagct ggatcagtgg aattgggagc tggccgaccg ctttgtggatttcggcgtta aaaacaagat gtatgtggta ggtcacacgc tgatttggca cagccaggcgccagcgcaca tttatctcga cgccgatggt aagcccaaca gtcgcgatgc ccagttgaaagtaatggagg agcacatacg taccctggcg ggccgctaca aaggaaagat agacgcctgggacgtggtta acgaagcggt ggaggatgat ggcagctggc gtcaaaccgg ctggtacaaaaacatgggtg aagaatatat cgcccatgcc ttccgcttgg cagccgaggt agaccccaatgccaaactgc tctacaacga ctacaacgag gctgtgcccg ccaagcgtga tgcgattattcgggtggtaa aaggcgtgca aaaggcaggc gcacccattc acggtgtggg gatgcaagggcacatgagtc tgtcacaccc ggattttgcg gagttcgaaa aatccataat cgaatacgccaagttggggg tgaaggtgca cgttaccgaa ctggatatcg acgtgttgcc actggcgtggaacctgagtg cggaaatttc caaccgcttt gaataccgcc cggagatgga cccttatcgtgaaggtttgc ccgccaaagt cgaggaggag ctggcggccc gttacgaggc gctgtttacaatcctgctgc gtcatcgcga caaaattgag cgtgtgacca cctggggcac caacgactcagagacctggc taaatggctt ccccattccg gggcgcatga attacccaat gctgttcgatcgtaacaacc agcccaagtt ggcctatcac cggctgctgg cgctcaaaca aaagaaaaatcagtaa<210> 610<211> 381<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (34)...(376)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (51)...(54)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (267)...(277)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id =<220>

<221> SITE

<222> (285)...(288)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (343)...(346)

<223> N-glicosilação site. Prosite id = PS00001

<400> 610 Met Thr Ile Ser Arg Arg Lys Phe Met Trp Gly Thr Ala Ala Leu Leu1 5 10 15 Ala Ala Thr Gln 20 Leu Lys Thr Arg Ala 25 Leu Ala Ala Ala Met 30 Ala SerThr Gly Ile 35 Lys Asp Ala Phe Lys 40 Gly Asp Phe His Ile 45 Gly Thr AlaIle Ser 50 Asn Ala Thr Leu Gln 55 Asn Gln Asp Ala Thr 60 Met Leu Asp LeuIle Lys Arg Glu Phe Asn Ala Ile Thr Ala Glu Asn Cys Met Lys Trp65 70 75 80Glu Pro Ile Arg Pro 85 Gln Leu Asp Gln Trp 90 Asn Trp Glu Leu Ala 95 AspArg Phe Val Asp 100 Phe Gly Val Lys Asn 105 Lys Met Tyr Val Val 110 Gly HisThr Leu Ile 115 Trp His Ser Gln Ala 120 Pro Ala His Ile Tyr 125 Leu Asp AlaAsp Gly 130 Lys Pro Asn Ser Arg 135 Asp Ala Gln Leu Lys 140 Val Met Glu GluHis Ile Arg Thr Leu Ala Gly Arg Tyr Lys Gly Lys Ile Asp Ala Trp145 150 155 160

Asp Val Val Asn Glu Ala Val Glu Asp Asp Gly Ser Trp Arg Gln Thr

165 170 175

Gly Trp Tyr Lys Asn Met Gly Glu Glu Tyr Ile Ala His Ala Phe Arg 180 185 190

Leu Ala Ala Glu Val Asp Pro Asn Ala Lys Leu Leu Tyr Asn Asp Tyr

195 200 205

Asn Glu Ala Val Pro Ala Lys Arg Asp Ala Ile Ile Arg Val Val Lys210 215 220

Gly Val Gln Lys Ala Gly Ala Pro Ile His Gly Val Gly Met Gln Gly225 230 235 240

His Met Ser Leu Ser His Pro Asp Phe Ala Glu Phe Glu Lys Ser Ile

245 250 255

Ile Glu Tyr Ala Lys Leu Gly Val Lys Val His Val Thr Glu Leu Asp

260 265 270

Ile Asp Val Leu Pro Leu Ala Trp Asn Leu Ser Ala Glu Ile Ser Asn

275 280 285

Arg Phe Glu Tyr Arg Pro Glu Met Asp Pro Tyr Arg Glu Gly Leu Pro290 295 300

Ala Lys Val Glu Glu Glu Leu Ala Ala Arg Tyr Glu Ala Leu Phe Thr305 310 315 320

Ile Leu Leu Arg His Arg Asp Lys Ile Glu Arg Val Thr Thr Trp Gly 325 330 335

Thr Asn Asp Ser Glu Thr Trp Leu Asn Gly Phe Pro Ile Pro Gly Arg 340 345 350

Met Asn Tyr Pro Met Leu Phe Asp Arg Asn Asn Gln Pro Lys Leu Ala

355 360 365

Tyr His Arg Leu Leu Ala Leu Lys Gln Lys Lys Asn Gln370 375 380

<210> 611<211> 993<212> DNA<213> Desconhecido<220><223> Obtido para amostra ambiental<400> 611

gtgaatgatt cacttcgtct gtgcacagtc tatgaccggt ttttccccat tggcaccgct 60gtcgacagcg gtgtgatccg tacccacaga caactgctgc tgcagcactt caacagccta 120acggcggaaa acgacatgaa gttcggcatc atccacccca aggaaaagga gtaccagttt 180gacaaggccg atgctatcgc agcgttcgct caagaaaacg gctttcgcat gcgcggccac 240accttggtgt ggcaccagca gacaccggaa tggctctttc agggcgcggc agggcaaacc 300gtgtcgcagg atcagctgct ggggcggctg cgcgatcaca tcaccaccgt cgttcggcgc 360tatcgcgggc aggtgtactg ctgggatgtg gtcaacgaag cggtctctga cagcgggggc 420gaggacttac gccgttcgcc gtggttggat atctgcgggc ccgactatat cgaacaggcc 48045 tttgcatggg cgcacgcagc cgatccggac gcgcttctgt tctacaacga ctacaatgca 540gcgâtcccca agaaacggga tcggatcggc cggttagtac agcgtctgca gcagaaaggc 600attcccatcc atggggttgg gatacagggc cactggaatc ttgacggtcc atctctggag 660gatatccgga cggcggtgga ggcgtacgcc gcgctgggag tgcaggtaca catcaccgaa 720ctggatatgt ccgtgtttag ctgggatgat cgccgaacag acttagccca gcccacggcg 780gagatgaccg accgccaggc ccagcgctac gcggctttgt ttgcgctctt tcgggagtat 840gcagaggtga tcaccaacgt caccttctgg ggcccggcgg acgatcacac ctggctgcac 900aacttcccgg tgcgggggcg caccaattgg ccgctgttgt ttgatcacca tcatcggccc 960aaaccggcct ttttcgatat cacccgcttc tag 993

<210> 612<211> 330<212> PRT<213> Desconhecido<220><223> Obtido para amostra ambiental<220><221> DOMÍNIO<222> (6) . . . (328)<223> Família 10 de hidrolase glicosila<22 0><221> SITE<222> (2) ... (5)<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (236)...(246)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<220>

<221> SITE

<222> (290)...(293)

<223> N-glicosilação site. Prosite id = PS00001<400> 612

Met Asn Asp Ser Leu Arg Leu Cys Thr Val Tyr Asp Arg Phe Phe Pro 1 5 10 15 Ile Gly Thr Ala Val Asp Ser Gly Val Ile Arg Thr His Arg Gln Leu 20 25 30 Leu Leu Gln His Phe Asn Ser Leu Thr Ala Glu Asn Asp Met Lys Phe 35 40 45 Gly Ile Ile His Pro Lys Glu Lys Glu Tyr Gln Phe Asp Lys Ala Asp 50 55 60 Ala Ile Ala Ala Phe Ala Gln Glu Asn Gly Phe Arg Met Arg Gly His 65 70 75 80 Thr Leu Val Trp His Gln Gln Thr Pro Glu Trp Leu Phe Gln Gly Ala 85 90 95 Ala Gly Gln Thr Val Ser Gln Asp Gln Leu Leu Gly Arg Leu Arg Asp 100 105 110 His Ile Thr Thr Val Val Arg Arg Tyr Arg Gly Gln Val Tyr Cys Trp 115 120 125 Asp Val Val Asn Glu Ala Val Ser Asp Ser Gly Gly Glu Asp Leu Arg 130 135 140 Arg Ser Pro Trp Leu Asp Ile Cys Gly Pro Asp Tyr Ile Glu Gln Ala 145 150 155 160 Phe Ala Trp Ala His Ala Ala Asp Pro Asp Ala Leu Leu Phe Tyr Asn 165 170 175 Asp Tyr Asn Ala Ala Ile Pro Lys Lys Arg Asp Arg Ile Gly Arg Leu 180 185 190 Val Gln Arg Leu Gln Gln Lys Gly Ile Pro Ile His Gly Val Gly Ile 195 200 205 Gln Gly His Trp Asn Leu Asp Gly Pro Ser Leu Glu Asp Ile Arg Thr 210 215 220 Ala Val Glu Ala Tyr Ala Ala Leu Gly Val Gln Val His Ile Thr Glu 225 230 235 240 Leu Asp Met Ser Val Phe Ser Trp Asp Asp Arg Arg Thr Asp Leu Ala 245 250 255 Gln Pro Thr Ala 260 Glu Met Thr Asp Arg 265 Gln Ala Gln Arg Tyr 270 Ala Ala Leu Phe Ala Leu Phe Arg Glu Tyr Ala Glu Val Ile Thr Asn Val Thr 275 280 285 Phe Trp 290 Gly Pro Ala Asp Asp 295 His Thr Trp Leu HiS 300 Asn Phe Pro Val Arg Gly Arg Thr Asn Trp Pro Leu Leu Phe Asp His His His Arg Pro 305 310 315 320 Lys Pro Ala Phe Phe 325 Asp Ile Thr Arg Phe 330

<210> 613<211> 1146<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 613

atgacttttt ctcgacggca atttttgctg caaacctccg ctgggctggc acttttgagcacggccaaaa tgcgcgcttt cgcccgagca gtcgatgaag tgggccttaa agaccattttaaagaccatt ttcatatagg cactgccatc agcggccgac taatgacgga aatgcccgctttttaccgcg acttggtcac tcgtgaattc aacgccatca cgatggaaaa cgacatgaagtgggagcgtc tgcatcccaa agaaggccaa tgggattggg aaattgccga caaattcgtgaagtttggcg aagaacacga catgtatatt gtcgggcatg ttctggtctg gcactcacagaccccggatt gggtcttcca ggattccaga ggcaagccca tttctcgcga cgctttgctgaaacgcatgc gtcatcagat cgagcagatg gcgggccgct ataagggccg ggtacacgcgtgggatgtgg tcaacgaggc ggtggacgag gaccaaggct ggcgcaaaag cccgtggttt 540aacattattg ggccagagttaaggctcacc tgctgtacaactggatttca tcaaaagataggccatgtgg gcctcagcttgccaaacagg gcatgcgtgttgggagcata gtggagcagatggcccaagg gactgccggatttaaactct tcttaaaatagatgcggaat cctggaaaaatttgatcgcc aataccgcaactctga<210> 614<211> 381<212> PRT

<213> Desconhecido<220>

<223> Obtido para amo<220>

<221> SIGNAL<222> (1)...(30)<220>

<221> DOMÍNIO<222> (35)...(378)<223> Família 10 de h<220>

<221> SITE<222> (268)...(278)<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591

<400> 614 Met Thr Phe Ser Arg Arg Gln Phe Leu Leu Gln Thr Ser Ala Gly Leu1 5 10 15 Ala Leu Leu Ser 20 Thr Ala Lys Met Arg 25 Ala Phe Ala Arg Ala 30 Val AspGlu Val Gly 35 Leu Lys Asp His Phe 40 Lys Asp His Phe His 45 Ile Gly ThrAla Ile Ser Gly Arg Leu Met Thr Glu Met Pro Ala Phe Tyr Arg Asp 50 55 60 Leu Val Thr Arg Glu Phe Asn Ala Ile Thr Met Glu Asn Asp Met Lys65 70 75 80Trp Glu Arg Leu His Pro Lys Glu Gly Gln Trp Asp Trp Glu Ile Ala 85 90 95 Asp Lys Phe Val Lys Phe Gly Glu Glu His Asp Met Tyr Ile Val Gly 100 105 110 His Val Leu 115 Val Trp His Ser Gln 120 Thr Pro Asp Trp Val 125 Phe Gln AspSer Arg 130 Gly Lys Pro Ile Ser 135 Arg Asp Ala Leu Leu 140 Lys Arg Met ArgHis Gln Ile Glu Gln Met Ala Gly Arg Tyr Lys Gly Arg Val His Ala145 150 155 160Trp Asp Val Val Asn Glu Ala Val Asp Glu Asp Gln Gly Trp Arg Lys 165 170 175 Ser Pro Trp Phe Asn Ile Ile Gly Pro Glu Phe Met Glu Tyr Ala Phe 180 185 190 Asn Tyr Ala His Glu Val Asp Pro Lys Ala His Leu Leu Tyr Asn Asp 195 200 205 Tyr Asn Met His Gly Arg Glu Lys Arg Glu Phe Val Leu Asp Phe Ile 210 215 220 Lys Arg Tyr Lys Lys Lys Gly Ile Pro Ile Gln Gly Ile Gly Met Gln225 230 235 240Gly His Val Gly Leu Ser Phe Pro Asp Ile Ser Glu Phe Glu Lys Ser 245 250 255 Leu Lys Ala Tyr Ala Lys Gln Gly Met Arg Val His Ile Thr Glu Leu 260 265 270 Asp Met Asp Val Leu Pro Val Ala Trp Glu His Ser Gly Ala Glu Ile 275 280 285 Ser Thr 290 Asn Phe Ala Tyr Ser 295 Asp Glu Leu Asn Pro 300 Trp Pro Lys Gly

tatggagtat gcctttaatt atgcccacga agtggacccc 600

cgactacaat atgcacggtc gggaaaaacg cgagtttgtg 660

caagaaaaaa ggcattccga tccagggcat aggcatgcag 720

tcccgatatc agcgagtttg agaaaagcct gaaagcctac 780

acacattacc gagttggata tggacgtact gccggtggcc 840

gatttccacc aactttgcct attcggatga gttgaacccc 900

agaagtcgag caggaattta ccgatcgcta cacggcattt 960

ccgcgacgat attgaaagag tcaccttctg gggaaccggt 1020

taattttccg gtaagggggc gcaccaacta cccactgctg 1080

aaaaccggcc tatcattcgg tcgtcgaact gaccaaaaac 1140

1146

istra ambiental

tidrolase glicosilaLeu Pro Glu Glu Val Glu Gln Glu Phe Thr Asp305 310 315

Phe Lys Leu Phe Leu Lys Tyr Arg Asp Asp Ile325 330

Trp Gly Thr Gly Asp Ala Glu Ser Trp Lys Asn340 345

Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg

355 360

Pro Ala Tyr His Ser Val Val Glu Leu Thr Lys370 375

<210> 615<211> 1875<212> DNA<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 615

atgattaaaa gggcaatttt tcttatgaca gcggtgctccctcccgccgc ctgccggcgc ggagttgtcc ggtatgaagactcaaggaag tgttcgccga ttgtttcacc atcgggacagaccggggttc gcagcgacct gctgaagaag cattttaatcatgaaaccag tttcgatcca accgctggaa ggcctcttcaattatccaat atgccagaga gaacggaatg actgtgcgttagtcaggttc cggagtggtt ttttattgac aaagatggaagaccctgtta agaaggaggc caataaagaa ctgcttctaaacggcgattg ccgaaagata caaggaccag gtggattactattgaccccg cccggccgga cgggatgcgc aacagtgagtgattatattg aaacggcctt tcgtactgtg cgcagggtagtatattaacg actacaatac tcatgacccg gtaaaaagggaaggaattgc tggccaaggg agtgccggtc gacggtatcgatccagtcac cgcctgtggc ggagattgct gcatcaatagttggataacc aaatcactga gctggatgta agcatctattgacaaagcgc cgccggagct tctcataatt cagggctaccgaattccgcc ggttgaagga ctacattagt aatgtgacttcattcgtggc ttcacgaccg gcctattccc cggcgcgacggactatcaag ccaagccggc ctactgggga atggtcgacccagcggggga tagaaatttt accgcaaacg ccggataccgggtagggttg gcccggcgcc ggctacgggt aatttgattcggtggggatg ggtggatagt gcaaacccat gaactggccaagtgacgccg gcatgtccgg acctagggcg gcaaagatggcttatttggc atgtagagat ctatggggcc tcagtcgttaacaagaaaga acctcgccaa aaagatgggg gctgatgttggatattctct cttcagtgtt gagactgact ggcggagacgatgtcaggaa gtgagtcagc gctgattcaa ggtctttcgtgcttcggtgc ttggggtcta tccttcttcg gtgaccattgttcaaaggca taactgtcta cacaataaca ggacgaaggagcttctgagc ttctgaaaca cgaaaggata gacatcacccccctttgaca ggtgggaaga agccatgcgc acgatgatgtatactggaga tttag

<210> 616

<211> 624

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1) . . . (27)<220><221> DOMÍNIO

<222> (40)...(375)

<223> Família 10 de hidrolase glicosila<220>

Arg Tyr Thr Ala Phe320

Glu Arg Val Thr Phe335

Asn Phe Pro Val Arg350

Gln Tyr Arg Lys Lys

365Asn Leu380

ttttcagtctttcaagaggaccgttgaaccacattgtggcactgggctgattcatactttacgacatggtaacggctggagggacgtggtggtattatatcagggccaaaatttcctttagtcaccagacagctctttgctggaccatcggttaccaggatttggggtaacacccttgcccctccaaactccgatacagaaaaacggtgagcgcccagctcgatcaggagttgtgacggatcctcgatccgagcagacatgcctcaccaaatatcaactctgttcgagaccggttatcacccggtgattc

ggcctttttatattcctgctccaccaattgggagaatgttggcggaccggggtctggcactctggagacaagaccacatctaacgaagtttaccggcaagggccaggttgcgaactcgtcgcatattaatggccttgggtgactgcttatattatttgcttgccgacaacttttgacgagacccgaatcatgagacagtgatttgatcagggaaatagttaggcggtgacattgaatgaaacgcgaagacattgctggaatggtggaatagcttcttactctggcagactacatgtgctagggcaagatc

601201802403003604204805406006607207808409009601020108011401200126013201380144015001560162016801740180018601875

65

<221><222><223><220>

DOMÍNIO(434) ... (586)

Zinc-binding dehydrogenase<221> SITE

<222> (284)...(294)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<220>

<221> SITE

<222> (336)...(339)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (345)....(348)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (486)...(489)

<223> N-glicosilação site. Prosite id = PS00001<400> 616

Met Ile Lys Arg Ala Ile Phe Leu Met Thr Ala Val Leu Leu Phe Ser1 5 10 15

Leu Ala Phe Leu Leu Pro Pro Pro Ala Gly Ala Glu Leu Ser Gly Met

20 25 30

Lys Ile Gln Glu Asp Ile Pro Ala Leu Lys Glu Val Phe Ala Asp Cys

35 40 45

Phe Thr Ile Gly Thr Ala Val Glu Pro His Gln Leu Thr Gly Val Arg

50 55 60

Ser Asp Leu Leu Lys Lys His Phe Asn His Ile Val Ala Glu Asn Val65 70 75 80

Met Lys Pro Val Ser Ile Gln Pro Leu Glu Gly Leu Phe Asn Trp Ala

85 90 95

Glu Ala Asp Arg Ile Ile Gln Tyr Ala Arg Glu Asn Gly Met Thr Val

100 105 HO

Arg Phe His Thr Leu Val Trp His Ser Gln Val Pro Glu Trp Phe Phe

115 120 125

Ile Asp Lys Asp Gly Asn Asp Met Val Leu Glu Thr Asp Pro Val Lys

130 135 140

Lys Glu Ala Asn Lys Glu Leu Leu Leu Lys Arg Leu Glu Asp His Ile145 150 155 160

Thr Ala Ile Ala Glu Arg Tyr Lys Asp Gln Val Asp Tyr Trp Asp Val

165 170 175

Val Asn Glu Val Ile Asp Pro Ala Arg Pro Asp Gly Met Arg Asn Ser

180 185 190

Glu Trp Tyr Tyr Ile Thr Gly Lys Asp Tyr Ile Glu Thr Ala Phe Arg

195 200 205

Thr Val Arg Arg Val Ala Gly Pro Lys Ala Arg Leu Tyr Ile Asn Asp

210 215 220

Tyr Asn Thr His Asp Pro Val Lys Arg Asp Phe Leu Tyr Glu Leu Val225 230 235 240

Lys Glu Leu Leu Ala Lys Gly Val Pro Val Asp Gly Ile Gly His Gln

245 250 255

Thr His Ile Asn Ile Gln Ser Pro Pro Val Ala Glu Ile Ala Ala Ser

260 265 270

Ile Glu Leu Phe Ala Ala Leu Gly Leu Asp Asn Gln Ile Thr Glu Leu

275 280 285

Asp Val Ser Ile Tyr Leu Asp His Arg Thr Ala Tyr Asp Lys Ala Pro

290 295 300

Pro Glu Leu Leu Ile Ile Gln Gly Tyr Arg Tyr Gln Glu Leu Phe Ala305 310 315 320

Glu Phe Arg Arg Leu Lys Asp Tyr Ile Ser Asn Val Thr Phe Trp Gly

325 330 335

Asn Ala Asp Asn His Ser Trp Leu His Asp Arg Pro Ile Pro Arg Arg

340 345 350

Asp Ala Pro Leu Pro Phe Asp Glu Asp Tyr Gln Ala Lys Pro Ala Tyr

355 360 365

Trp Gly Met Val Asp Pro Ser Lys Leu Pro Glu Ser Gln Arg Gly Ile

370 375 380

Glu Ile Leu Pro Gln Thr Pro Asp Thr Ala Asp Thr Asp Glu Thr Val385 390 395 400

Gly Arg Val Gly Pro Ala Pro Ala Thr Gly Asn Leu Ile Gln Asn Gly405 410 415

Glu Phe Asp Gln Gly Gly Asp Gly Trp Ile Val Gln Thr His Glu Leu

420 425 430

Ala Ser Ala Gln Leu Glu Ile Val Ser Asp Ala Gly Met Ser Gly Pro435 440 445

Arg Ala Ala Lys Met Ala Ile Arg Arg Gly Gly Asp Leu Ile Trp His

450 455 460

Val Glu Ile Tyr Gly Ala Ser Val Val Ile Val Thr Glu Leu Asn Glu465 470 475 480

Thr Arg Lys Asn Leu Ala Lys Lys Met Gly Ala Asp Val Val Leu Asp

485 490 495

Pro Arg Glu Asp Asp Ile Leu Ser Ser Val Leu Arg Leu Thr Gly Gly

500 505 510

Asp Gly Ala Asp Ile Leu Leu Glu Met Ser Gly Ser Glu Ser Ala Leu515 520 525

Ile Gln Gly Leu Ser Cys Leu Thr Asn Gly Gly Ile Ala Ser Val Leu

530 535 540

Gly Val Tyr Pro Ser Ser Val Thr Ile Asp Ile Asn Ser Leu Leu Thr545 550 555 560

Phe Lys Gly Ile Thr Val Tyr Thr Ile Thr Gly Arg Arg Met Phe Glu

565 57Ó 575

Thr Trp Gln Thr Ala Ser Glu Leu Leu Lys His Glu Arg Ile Asp Ile

580 585 590

Thr Pro Val Ile Thr His Val Leu Pro Phe Asp Arg Trp Glu Glu Ala595 600 605

Met Arg Thr Met Met Ser Gly Asp Ser Gly Lys Ile Ile Leu Glu Ile

610 615 620

<210> 617<211> 1152<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 617

atgagaacat ttatattaat cccgctgatg ttgttggtgc tcagtgcttg tactaacgga 60

caaaatacag aaccggaaac gttgaaagat gcttttgaag gaaagtttct gataggtgca 120

gcactgaatc acagacttta cactggtaac gacatcaaag gagcgtcggc aattaagcag 180

catttcaatt cgattgtggc agaaaactgc atgaaaagcg aaatgattca accgcgagaa 240

ggagagtttt tctttgacaa cgccgataag tttgttgatt tcggccagcg aaacaatatg 300

ttcattgttg gacataccct catatggcat tcgcaaattc cttattggtt ttttgtggat 360

gagaatggca aagatgtttc tcccgaagtg cttaccgagc gcatgagaaa tcatatccac 420

accgtggtaa cacgctataa aggcaaagta catggttggg atgttgtgaa cgaagcaatt 480

ctcgacgatg gctcattccg taacagcaaa ttttatcaga ttctgggaga agacttcatc 540

aaacttgctt tccagtttgc ccacgaagcc gatcccgatg ctgaactgta ttataatgat 600

tattcgatgg ctctcgaagg aaaaagaaat ggcaccgtta agatggttca aaacctcatt 660

gatcagggag ttaaaatcga cggtattggt atgcagggac atatgagcat ggatttccca 720

agttttgaag ctttcgagaa aagcatcctg gcctttgcca atctcggcgt taaagtgatg 780

attacggagc tggacatttc ggtattgcct ttcccaagtt cgaatgtggg tgccgacatt 840

gccaatactg ctgaatatca acactcactg aatccttata ctgacggatt acccgctgaa 900

gtttacgaac aatggcatca gcgttatgcc gatttcttca gactttttgt gaaacatcag 960

gataaaatca gccgtgtaac cctgtggggc ttgagcgatg ccgattcgtg gaaaaacgac 1020

tggcctgtaa aaggaagaac agattatccc ttgttgttcg atcgtaatac tgaacctaaa 1080

ccgcttgtaa ccacacttat cagggaagtg gccaaaggag ttaaaagtga aatgattgca 1140

gaaattaaat aa 1152

<210> 618

<211> 383<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(20)<220><221> DOMÍNIO

<222> (27)...(370)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (213) . . . (216)

<223> N-glicosilação site. Prosite id = PS00001<400> 618

Met. Arg Thr Phe Ile Leu Ile Pro Leu Met Leu Leu Val Leu Ser Ala1 5 10 15 Cys Thr Asn Gly Gln Asn Thr Glu Pro Glu Thr Leu Lys Asp Ala Phe 20 25 30 Glu Gly Lys Phe Leu Ile Gly Ala Ala Leu Asn His Arg Leu Tyr Thr 35 40 45 Gly Asn 50 Asp Ile Lys Gly Ala 55 Ser Ala Ile Lys Gln 60 His Phe Asn SerIle Val Ala Glu Asn Cys Met Lys Ser Glu Met Ile Gln Pro Arg Glu65 70 75 80Gly Glu Phe Phe Phe Asp Asn Ala Asp Lys Phe Val Asp Phe Gly Gln 85 90 95 Arg Asn Asn Met 100 Phe Ile Val Gly His 105 Thr Leu Ile Trp His 110 Ser GlnIle Pro Tyr Trp Phe Phe Val Asp Glu Asn Gly Lys Asp Val Ser Pro 115 120 125 Glu Val 130 Leu Thr Glu Arg Met 135 Arg Asn His Ile HiS 140 Thr Val Val ThrArg Tyr Lys Gly Lys Val His Gly Trp Asp Val Val Asn Glu Ala Ile145 150 155 160Leu Asp Asp Gly Ser 165 Phe Arg Asn Ser Lys 170 Phe Tyr Gln Ile Leu 175 GlyGlu Asp Phe Ile Lys Leu Ala Phe Gln Phe Ala His Glu Ala Asp Pro 180 185 190 Asp Ala Glu 195 Leu Tyr Tyr Asn Asp 200 Tyr Ser Met Ala Leu 205 Glu Gly LysArg Asn Gly Thr Val Lys Met Val Gln Asn Leu Ile Asp Gln Gly Val 210 215 220 Lys Ile Asp Gly Ile Gly Met Gln Gly His Met Ser Met Asp Phe Pro225 230 235 240Ser Phe Glu Ala Phe 245 Glu Lys Ser Ile Leu 250 Ala Phe Ala Asn Leu 255 GlyVal Lys Val Met Ile Thr Glu Leu Asp Ile Ser Val Leu Pro Phe Pro 260 265 270 Ser Ser Asn Val Gly Ala Asp Ile Ala Asn Thr Ala Glu Tyr Gln His 275 280 285 Ser Leu 290 Asn Pro Tyr Thr Asp 295 Gly Leu Pro Ala Glu 300 Val Tyr Glu GlnTrp His Gln Arg Tyr Ala Asp Phe Phe Arg Leu Phe Val Lys His Gln305 310 315 320Asp Lys Ile Ser Arg Val Thr Leu Trp Gly Leu Ser Asp Ala Asp Ser 325 330 335 Trp Lys Asn Asp Trp Pro Val Lys Gly Arg Thr Asp Tyr Pro Leu Leu 340 345 350 Phe Asp Arg 355 Asn Thr Glu Pro Lys 360 Pro Leu Val Thr Thr 365 Leu Ile ArgGlu Val Ala Lys Gly Val Lys Ser Glu Met Ile Ala Glu Ile Lys

370 375 380

<210> 619<211> 582<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 619

gagcaacagg tttgtggcag ctaccaagtc ggacaacatt gtggactcac ctacgagatc 60

tggaccgata gcagctcggc ctgcatgacc aacaccgcca acgggtttcg ggccatgtgg 120aacgcgggca atcaaaatta cctcgcccgg aagggagtcc ggcctggttc gacctcccct 180gtggtcacct acagtgccga ctacaatccc gacggcaact cctacctggg cgtgtacggc 240tggacgacgg acccactcat cgagttttac atcatcgaca gctgggggag ctggcgtccc 300ccaggcaccg acgaaatcgg caccgtcgac gtgaatggcg gaacctacca gatctatcgc 360agccagcgag tgaaccagcc gtccattcag ggcaccgcga cgttttggca gtactggagc 420gtccgcacag aaaggcgcac cagcggaacc attaccgttg gacctcactt cgaagcatgg

gccaccttcg gcttgaacct aggtgacttt ttcgaggtgt ccatgctggt cgagggctac

catagctcgg ggtcagccga cgtgaccgtc gccttccaat ag

<210> 620

<211> 193

<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<22 0>

<221> DOMÍNIO<222> (11)...(190)

<223> Família 11 de glicosila hidrolases<400> 620

Glu Gln Gln Val Cys Gly Ser Tyr Gln Val Gly Gln His Cys Gly Leu1 5 10 15 Thr Tyr Glu Ile Trp Thr Asp Ser Ser Ser Ala Cys Met Thr Asn Thr 20 25 30 Ala Asn Gly Phe Arg Ala Met Trp Asn Ala Gly Asn Gln Asn Tyr Leu 35 40 45 Ala Arg 50 Lys Gly Val Arg Pro 55 Gly Ser Thr Ser Pro 60 Val Val Thr TyrSer Ala Asp Tyr Asn Pro Asp Gly Asn Ser Tyr Leu Gly Val Tyr Gly65 70 75 80Trp Thr Thr Asp Pro Leu Ile Glu Phe Tyr Ile Ile Asp Ser Trp Gly 85 90 95 Ser Trp Arg Pro Pro Gly Thr Asp Glu Ile Gly Thr Val Asp Val Asn 100 105 110 Gly Gly Thr Tyr Gln Ile Tyr Arg Ser Gln Arg Val Asn Gln Pro Ser 115 120 125 Ile Gln Gly Thr Ala Thr Phe Trp Gln Tyr Trp Ser Val Arg Thr Glu 130 135 140 Arg Arg Thr Ser Gly Thr Ile Thr Val Gly Pro His Phe Glu Ala Trp145 150 155 160Ala Thr Phe Gly Leu Asn Leu Gly Asp Phe Phe Glu Val Ser Met Leu 165 170 175 Val Glu Gly Tyr 180 His Ser Ser Gly Ser 185 Ala Asp Val Thr Val 190 Ala Phe

Gln

<210> 621<211> 1134<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 621

atgcagttga gacgatttac aggaggtgca cttatcatgg tgctttgtgc aagcgcagcaaagggagaaa atatgacgct gagggatgcg tatgccgatc atttctacat cggtgcagcgatcagtcgac accagttccg tcccgatcag tccgccgttt tggagattac ggcgcgtcatttcagtagta ttacggctga aaacgagatg aagtggcgtt cgctgaatcc ggctcccggcgaataccgtt tcgagaatgc cgacgacttc gtgcggcttg gtgttgcgaa taacatgtacatcgtggggc atgttctttt ctggcataat cagacaccag attggttgtt ccaagacgacgatggtaatc ccgtctcacg cgaagtattg atagagcgca tgcgcgcgca tgtgcgcaggctcgtgcagc gctacggcaa ccgcgtgaat gcatgggatg ttgttaacga agcttttaacgacaacggct ccttgcgccg tagtcattgg acgcgtatcc tgggcgacga gtttattgagattgccttcc aaattgccga ggaagaactg cccccggatg tcgagctgct ttataacgattactccatga cgattccagc caaacgcgat gctgttgtgc gcatggtaaa caatttgaaatccaaaggca ttegcatcga tggcgttggc atgcaggggc actgggcacg caccaacccaaccatcgcga atatagagag aagcattctt gcctttgctg gaaccggcgt gcaagtacacatcaccgaac tcgatatcga catgctcccg cgccatcccc agatgtggac aggcggtgcagacaccatgc tccgcctaca acaagaccct gcacttgacc cctataccga gggcctctcagatgaaagcc agagggcatt ggcacaacgc tatgaaggca tcttctcctt gtttttgcagcacagcgatg tgattcgccg tgtaaccttc tggggtgtga ctgatgccca cacctggctcaataactggc cgatacgcgg gcgcaccagt catcccctgc tttttgatcg gcagggaaatcccaagccgg cgtttcatgc catcctcaat cttccgggca agctagcaga ctaa<210> 622<211> 377<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1)...(22)<220>

<221> DOMÍNIO<222> (26)...(372)

<223> Família 10 de hidrolase glicosila

<220>

<221> SITE

<222> (24)...(27)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (164)...(167)

<223> N-glicosilação site. Prosite id = PS00001<400> 622

Met Gln Leu Arg Arg Phe Thr Gly Gly Ala Leu Ile Met Val Leu Cys1 5 10 15

Ala Ser Ala Ala 20 Lys Gly Glu Asn Met 25 Thr Leu Arg Asp Ala 30 Tyr AlaAsp His Phe 35 Tyr Ile Gly Ala Ala 40 Ile Ser Arg His Gln 45 Phe Arg ProAsp Gln 50 Ser Ala Val Leu Glu 55 Ile Thr Ala Arg His 60 Phe Ser Ser IleThr Ala Glu Asn Glu Met Lys Trp Arg Ser Leu Asn Pro Ala Pro Gly65 70 75 80Glu Tyr Arg Phe Glu Asn Ala Asp Asp Phe Val Arg Leu Gly Val Ala 85 90 95 Asn Asn Met Tyr Ile Val Gly His Val Leu Phe Trp His Asn Gln Thr 100 105 110 Pro Asp Trp 115 Leu Phe Gln Asp Asp 120 Asp Gly Asn Pro Val 125 Ser Arg GluVal Leu 130 Ile Glu Arg Met Arg 135 Ala His Val Arg Arg 140 Leu Val Gln ArgTyr Gly Asn Arg Val Asn Ala Trp Asp Val Val Asn Glu Ala Phe Asn145 150 155 160Asp Asn Gly Ser Leu Arg Arg Ser His Trp Thr Arg Ile Leu Gly Asp 165 170 175 Glu Phe Ile Glu 180 Ile Ala Phe Gln Ile 185 Ala Glu Glu Glu Leu 190 Pro ProAsp Val Glu 195 Leu Leu Tyr Asn Asp 200 Tyr Ser Met Thr Ile 205 Pro Ala LysArg Asp 210 Ala Val Val Arg Met 215 Val Asn Asn Leu Lys 220 Ser Lys Gly IleArg Ile Asp Gly Val Gly Met Gln Gly His Trp Ala Arg Thr Asn Pro225 230 235 240Thr Ile Ala Asn Ile Glu Arg Ser Ile Leu Ala Phe Ala Gly Thr Gly 245 250 255 Val Gln Val His 260 Ile Thr Glu Leu Asp 265 Ile Asp Met Leia Pro 270 Arg HisPro Gln Met Trp Thr Gly Gly Ala Asp Thr Met Leu Arg Leu Gln Gln 275 280 285 Asp Pro 290 Ala Leu Asp Pro Tyr 295 Thr Glu Gly Leu Ser 300 Asp Glu Ser GlnArg Ala Leu Ala Gln Arg Tyr Glu Gly Ile Phe Ser Leu Phe Leu Gln305 310 315 320His Ser Asp Val Ile 325 Arg Arg Val Thr Phe 330 Trp Gly Val Thr Asp 335 AlaHis Thr Trp Leu 340 Asn Asn Trp Pro Ile 345 Arg Gly Arg Thr Ser 350 His ProLeu Leu Phe 355 Asp Arg Gln Gly Asn 360 Pro Lys Pro Ala Phe 365 His Ala IleLeu Asn Leu Pro Gly Lys Leu Ala Asp

370 375

<210> 623<211> 1215<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 623

atgcacattg taaagtcgag cgcatatctg cttttggcgt cagtcagcct ggccctgagcgcttgttcca gtagttccag ttcaggttca gagaccagtt cgtccagtgc cagtagttcgtcggcgccaa gtagcactac ggtcgagttg acgtttgaaa atctctatgc cctggccgatttcccgattg ggacagccgt gtctgctgca aatgaacctt acagcatttt tggcgaggagtggggggctg ggcagcgggc ggttattgaa cagcacttta gccagatgac gcctggcaatatcatgaaaa tgagttacct ccaacctcaa cggaatgtgt ttactttcga tgatgctgacgatttcgtca actatgcgga atctcagggt ataggtgttc atgcgcatgc attggtttggcattcggatt atcaggtgcc caattggatg aaaaaccttg gccccgaggt taccaaagaggagtggttgg aattgattcg ggaccatgtg cgctcggtag ccgcgcactt tgctggtaaggtggacagtt gggacgttgt gaatgaagca ttcctcgaca caggttatcg ggaaggcgggggggatgatg gctctttatt ctatgaaaag atgggtgctg attatattga ggcggcgtttgtcgccgccc gtgaaggtga tccaggggcg gatctctact acaacgactt taatatgtcagccaatcaac ccaaattgac gcatgtgttg aatatggttg aagattttca ggagaaaggaattcccatag atggcattgg atttcaaatg catgtgtaca tggattggcc gagtattgcggacattagaa ctagctttca gcgagctgca agcactggct tgaaagtgaa aattacggagctggacattc ccattaacaa tccctacgat ggcagctata agtatcccga taactattatgcggtattga cacctgaact cgctgctcaa cagaagcgcc gttattgcga aattgtagaggtttatctgg aagcggtgcc cgagggtcag cgtggcggcg taagtgtgtg gggggtattcgaccgggata cttggctggt caatgcgata tttgaaggcg agcacgatga gtggccgctcttgttcgacc acaatctaca acccaaacca gcggcccaag gtgtcggtga tgcgctgatgggtgaatcct gctaa<210> 624<211> 404<212> PRT<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (54) . . . (399)<223> Família 10 de hidrolase glicosila<220>

<221> SITE<222> (241) . . . (244)

<223> N-glicosilação site. Prosite id = PS00001

<220>

<221> SITE<222> (297) . . . (307)<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 624

Met His Ile Val Lys Ser Ser Ala Tyr Leu Leu Leu Ala Ser Val Ser1 5 10 15

Leu Ala Leu Ser Ala Cys Ser Ser Ser Ser Ser Ser Gly Ser Glu Thr

20 25 30

Ser Ser Ser Ser Ala Ser Ser Ser Ser Ala Pro Ser Ser Thr Thr Val35 40 45

Glu Leu Thr Phe Glu Asn Leu Tyr Ala Leu Ala Asp Phe Pro Ile Gly

50 55 60

Thr Ala Val Ser Ala Ala Asn Glu Pro Tyr Ser Ile Phe Gly Glu Glu65 70 75 80

Trp Gly Ala Gly Gln Arg Ala Val Ile Glu Gln His Phe Ser Gln Met

85 90 95

Thr Pro Gly Asn Ile Met Lys Met Ser Tyr Leu Gln Pro Gln Arg Asn

100 105 HO

Val Phe Thr Phe Asp Asp Ala Asp Asp Phe Val Asn Tyr Ala Glu Ser

115 120 125

Gln Gly Ile Gly Val His Ala His Ala Leu Val Trp His Ser Asp Tyr130 135 140Gln Val Pro Asn Trp Met Lys Asn Leu Gly Pro Glu Val Thr Lys Glu145 150 155 160Glu Trp Leu Glu Leu Ile Arg Asp His Val Arg Ser Val Ala Ala His 165 170 175 Phe Ala Gly Lys Val Asp Ser Trp Asp Val Val Asn Glu Ala Phe Leu 180 185 190 Asp Thr Gly Tyr Arg Glu Gly Gly Gly Asp Asp Gly Ser Leu Phe Tyr 195 200 205 Glu Lys Met Gly Ala Asp Tyr Ile Glu Ala Ala Phe Val Ala Ala Arg 210 215 220 Glu Gly Asp Pro Gly Ala Asp Leu Tyr Tyr Asn Asp Phe Asn Met Ser225 230 235 240Ala Asn Gln Pro Lys 245 Leu Thr His Val Leu 250 Asn Met Val Glu Asp 255 PheGln Glu Lys Gly Ile Pro Ile Asp Gly Ile Gly Phe Gln Met His Val 260 265 270 Tyr Met Asp Trp Pro Ser Ile Ala Asp Ile Arg Thr Ser Phe Gln Arg 275 280 285 Ala Ala 290 Ser Thr Gly Leu Lys 295 Val Lys Ile Thr Glu 300 Leu Asp Ile ProIle Asn Asn Pro Tyr Asp Gly Ser Tyr Lys Tyr Pro Asp Asn Tyr Tyr305 310 315 320Ala Val Leu Thr Pro 325 Glu Leu Ala Ala Gln 330 Gln Lys Arg Arg Tyr 335 CysGlu Ile Val Glu Val Tyr Leu Glu Ala Val Pro Glu Gly Gln Arg Gly 340 345 350 Gly Val Ser Val Trp Gly Val Phe Asp Arg Asp Thr Trp Leu Val Asn 355 360 365 Ala Ile 370 Phe Glu Gly Glu His 375 Asp Glu Trp Pro Leu 380 Leu Phe Asp HisAsn Leu Gln Pro Lys Pro Ala Ala Gln Gly Val Gly Asp Ala Leu Met

385 390 395 400

Gly Glu Ser Cys

<210> 625<211> 1812<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 625

gtgaacccac taataaatag attagcgctt aaaagctcgc ttgcagcagc aacgtgcgttgctgcgatga gcttttcgac agcgaacgcc tgtaccggag cacttaacag ccaaaacaacgctgttggta ctcacaacgg ctattattac tccttctgga agcagaccga caacggtcgtgtaaatgtca cctgcggaga acccggctat tatagtactg aatggagcaa cgtttttaactgggtcggtg gagtgggctg gaatccaggt gggcctagaa tcgttaatta ccgcggcacattcaacagcg gtatgaacca gagctcttca aactcttatc ttgcgcttta cgggtggactcgagtcccaa atgaagtcga gtattacgta gtcgagagct acggttccta caatcccgcaagctgcggcg gtggcggcgg tgttgctggc ggtggtggta gcggggatgg ccataaaggatccgtcacga tcggcggagt ggtttacgac ttgacgcaat gcacacgaac gaaccagccatctatttctg gaacttccac atttaggcag tttttcagtg tacgccggga ccctctgccttggggccagg tccaaggctc catcgacgtg ggcgcccatt tccaagcctg ggctgatgccggcatgcaac ttggcgatga tcatttttac atggtgctcg ccagtgaggg ttatgatggtgggaataatt cttctggtaa ctccgagctt tggataactg agggttctgg cggcggtgcagcgcctggtg gcggcggcgc aggaaacggc ggcgtagtag gaggtggtac tacaggttccggttctaaca ccctagtagt gcgcgctatt ggcacctctg gctccgagca gctccgagtcaacgcaggcg gcagcgccat aaccactttg agcttgtcta ccagctggca ggatttcacaatcaatactg acgccagcgg cgacctgaac attgaactgt tcaacgatca aggcgaaggttacgaagcac gtgtggaata cgtaatagtc aatggtgaca ctcgatacgc agaagatcaaacctataaca caagtgcctg ggacggcgaa tgtggcggtg catctaacac ccaatggatgcactgtgacg gcatgatcgg tttcggtgac atttctggcg gcggcgccag tagtccagcgcccggcggtg gcggtgccag cccatctcca gctcctggtg acagcacagg tggtggcagttccggcacag gttccaacac actcgtgata cgtgcggttg gcacctctgg caacgagcaactgcgcgtca acgtcggagg tagtgcggtg gacaccctta gcttgtcaac cagctggcaggaatttaccg tgaataccaa cgcctctggc gatatcaatg tcgagctgtt caacgaccaaggtgaaggct acgaagcacg tgtagagtat gtgatggtca acggcgacac gcgttatgccaacgagcaga gctacaatac cagcgcttgg gatggtgaat gtggcggtgg ctccaatacttattggatgc actgcaatgg catgattgga ttcggtgata tgtcaggcaa

agcgctggcg gtgggaatac cggcggcaac gcacctggag ccgggaatgg

accggcggcg gctcaagcgg cacttgcaac tggtatggca gcagctttcc

agcaccagca acggttgggg ttgggagaac aatcaaagct gcatttctcc

agctctcagt ag

<210> 626

<211> 603

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL<222> (1) ... (30)<220>

<221> DOMÍNIO<222> (43)...(252)

<223> Família 11 de glicosila hidrolases<220>

<221> DOMÍNIO<222> (568)...(596)

<223> Cellulose or protein binding domínio<220>

<221> SITE<222> (62) ... (65)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (107) .. . (110)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (245)...(248)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (368)...(371)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (474)...(477)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (513) . . .(516)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (600) . . . (603)

<223> N-glicosilação site. Prosite id = PS00001<400> 626

Met Asn Pro Leu Ile Asn Arg Leu Ala Leu Lys Ser Ser Leu15 10

Ala Thr Cys Val Ala Ala Met Ser Phe Ser Thr Ala Asn Ala

tggcggcggccggcgctaaccatgtgcactcagtacctgc

16201680174018001812

Ala Ala15

Cys Thr

20

25

30

Gly Ala Leu Asn Ser Gln Asn Asn Ala Val Gly Thr His Asn Gly Tyr 35 40 45 Tyr Tyr 50 Ser Phe Trp Lys Gln 55 Thr Asp Asn Gly Arg 60 Val Asn Val Thr60 Cys 65 Gly Glu Pro Gly Tyr 70 Tyr Ser Thr Glu Trp 75 Ser Asn Val Phe Asn 80 Trp Val Gly Gly Val 85 Gly Trp Asn Pro Gly 90 Gly Pro Arg Ile Val 95 Asn Tyr Arg Gly Thr Phe Asn Ser Gly Met Asn Gln Ser Ser Ser Asn Ser65 100 105 110 Tyr Leu Ala 115 Leu Tyr Gly Trp Thr 120 Arg Val Pro Asn Glu 125 Val Glu TyrTyr Val Val Glu Ser Tyr Gly Ser Tyr Asn Pro Ala Ser Cys Gly Gly 130 135 140 Gly Gly Gly Val Ala Gly Gly Gly Gly Ser Gly Asp Gly His Lys Gly 145 150 155 160Ser Val Thr Ile Gly Gly Val Val Tyr Asp Leu Thr Gln Cys Thr Arg 165 170 175Thr Asn Gln Pro Ser Ile Ser Gly Thr Ser Thr Phe Arg Gln Phe Phe 180 185 190Ser Val Arg Arg Asp Pro Leu Pro Trp Gly Gln Val Gln Gly Ser Ile 195 200 205Asp Val Gly Ala His Phe Gln Ala Trp Ala Asp Ala Gly Met Gln Leu 210 215 220 Gly Asp Asp His Phe Tyr Met Val Leu Ala Ser Glu Gly Tyr Asp Gly225 230 235 240Gly Asn Asn Ser Ser Gly Asn Ser Glu Leu Trp Ile Thr Glu Gly Ser 245 250 255Gly Gly Gly Ala Ala Pro Gly Gly Gly Gly Ala Gly Asn Gly Gly Val 260 265 270Val Gly Gly Gly Thr Thr Gly Ser Gly Ser Asn Thr Leu Val Val Arg 275 280 285Ala Ile Gly Thr Ser Gly Ser Glu Gln Leu Arg Val Asn Ala Gly Gly 290 295 300 Ser Ala Ile Thr Thr Leu Ser Leu Ser Thr Ser Trp Gln Asp Phe Thr305 310 315 320Ile Asn Thr Asp Ala Ser Gly Asp Leu Asn Ile Glu Leu Phe Asn Asp 325 330 335Gln Gly Glu Gly Tyr Glu Ala Arg Val Glu Tyr Val Ile Val Asn Gly 340 345 350Asp Thr Arg Tyr Ala Glu Asp Gln Thr Tyr Asn Thr Ser Ala Trp Asp 355 360 365Gly Glu Cys Gly Gly Ala Ser Asn Thr Gln Trp Met His Cys Asp Gly 370 375 380 Met Ile Gly Phe Gly Asp Ile Ser Gly Gly Gly Ala Ser Ser Pro Ala385 390 395 400Pro Gly Gly Gly Gly Ala Ser Pro Ser Pro Ala Pro Gly Asp Ser Thr 405 410 415Gly Gly Gly Ser Ser Gly Thr Gly Ser Asn Thr Leu Val Ile Arg Ala 420 425 430Val Gly Thr Ser Gly Asn Glu Gln Leu Arg Val Asn Val Gly Gly Ser 435 440 445Ala Val Asp Thr Leu Ser Leu Ser Thr Ser Trp Gln Glu Phe Thr Val 450 455 460 Asn Thr Asn Ala Ser Gly Asp Ile Asn Val Glu Leu Phe Asn Asp Gln465 470 475 480Gly Glu Gly Tyr Glu Ala Arg Val Glu Tyr Val Met Val Asn Gly Asp 485 490 495Thr Arg Tyr Ala Asn Glu Gln Ser Tyr Asn Thr Ser Ala Trp Asp Gly 500 505 510Glu Cys Gly 515 Gly Gly Ser Asn Thr 520 Tyr Trp Met His Cys Asn Gly Met 525Ile Gly Phe Gly Asp Met Ser Gly Asn Gly Gly Gly Ser Ala Gly Gly 530 535 540 Gly Asn Thr Gly Gly Asn Ala Pro Gly Ala Gly Asn Gly Gly Ala Asn 545 550 555 560Thr Gly Gly Gly Ser Ser Gly Thr Cys Asn Trp Tyr Gly Ser Ser Phe 565 570 575Pro Met Cys Thr Ser Thr Ser Asn Gly Trp Gly Trp Glu Asn Asn Gln 580 585 590Ser Cys Ile 595 Ser Pro Ser Thr Cys 600 Ser Ser Gln

<210> 627<211> 3351<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 627atgtggaaga agtttaaagt aagtctagcc tatgttttga tttctgtttt attagtttct 60

caaggatggg cgatttctta tgctgaagta gccacaacgt tagagcagac aacagaatca 120

gtcgttttgt atcaggactt tgaagacggc caaactggtg gatgggaaag aaagtcatgg 180

ggaggacaag gagaggtttc agttgatgag gtggatggaa ataaagtttt ggcattcaca 240

aaccgtacat ctaaagacag caacccattg cttaatctaa ccagctatat taagccagac 300

cgcgagtaca gtatatcact gaagttaaga cttggagaag gtactggcaa atatcatttg 360

gcatccaagg ttgaatcacc aatagtggat aataagtacc catggttgac gggagatata 420

gaggttacat ctacagagtg gacaacattt gaaatattag gatacgaaat tgcaagtcaa 480

acaactgagt ttctcatttg gattgaaccg gcaagtgatt cagagactgg tgaagttttt 540

cctgacattt atattgatga agtgttaatc acagaaatac caacaaagtc tgtaccaaaa 600

gaaactgtgg tattgtcaca ggactttgaa gatggtcaaa ctggtggatg ggaaaggaag 660

tcatggggag gccaaggaga ggtttcagtt ggtgaggtag atggaaacaa ggttttagca 720

tttacaaatc gttcatctaa agacagccag ccattactta acctaaccag ctatataaag 780

gcagaaggaa agtacaatat atcatttaag ttaagacttg gagaaggtac tggtaaatat 840

catgtggcat ccaaggttga atcaccaatc gcggataata agtacccatg gttgacaggg 900

gatatagagg ttacatctac agaatggaca acatttgaaa ttttaggata cgaaatagca 960

agtcaaacaa ctgagtttct catttggatt gaatcttcaa gtgattcaga aacagaagaa 1020

gtttttccag acatctacat agatgatgta ttaatcacag aaataccaac aaagtctgta 1080

ccaaaagaaa ctgtggtatt gtcacaggac tttgaagatg gtcaaaatgg tggatgggaa 1140

aggaagtcat ggggaggaca aggagtagtt tcagttgttg aggtagatgg aaacaaggtt 1200

ttagcattta caaatcgttc atctaaagac agccagccat tacttaacct aaccagctat 1260

ataaaggcag aaggaaagta caatatatca tttaagttaa gacttggaga aggtactggt 1320

aaatatcatg tggcatccaa gattgaatca ccaatcgtgg ataataagta cccatggttg 1380

acaggagata tagaggttac atctacagag tggacaacat ttgaaatttt aggatacgaa 1440

atagcaggtc aaacaactga gtttctcatt tggattgaat catcagatga ttctgaaact 1500

ggtgagattt ttcctgatat ctacatagat gatgtattaa tcatagaaat ttctgaagaa 1560

gatggagata atgatgatga tttagatcaa tcaggtatca tatctgactt tgaagatggt 1620

attggtaatt gggtgattag agacagctct ggaggcagta tagaggtaac agacgctgac 1680

aacaataccg cagatggatc taaaagtttg atggcaactg tgtccaccca atataacggt 1740

ccaatcctgg atgttatggg taaaatgcat aagaaccata gataccattt gtctgcatgg 1800

gttaaaatgg ctcccggcca aacatcaact tcattgcgta tcagtgtgca aagtggagat 1860

agcacattca ctaacgtatc tgctaacgta gttgcaacgg atgaacagtg ggtggaattg 1920

tcaggtaatt tcactttggc agttactcca agtatattga acgcttatgt agaaacagta 1980

tcaacacctg ctgaacctgt aacattctat atggatgact ttgtgatatc ttatgttggc 2040

cctgtaggga ttaagccagt tcaaacagat ttgaccccaa ttaaagatgc ttataaagat 2100

tatttcttga ttggtagtgc agttgaagat agagatcttc aaggacctcg tcttgaactt 2160

cttaagcatc atcacaatgt tgttacagca gaaaatgcaa tgaaaccaga ctatagctat 2220

gaccaaaaca gaaatttcaa ctttgatgcg gaaaatgctc ttgtagcaaa agttgaagaa 2280

gctgatctga aattggttgg tcacgtgctg gtatggcatc agcagatgcc tttatggtta 2340

agtacggcgg aagatggtac gccattaagc cgagaggtag ctcttgaaaa tctaaaaact 2400

catattacga cagtaatgga aaactacgga gataaggtga ttgcgtggga tgtggtcaac 2460

gaagcaatca gagatggtct gactacttca gtaactactg ataattggca gttggcactg 2520

cgtcaatctc ctttgtataa tgcaattggt ccggattatg tagaacagtc attcttgatt 2580

gcaaaggaag tactcaagaa caatcctgaa tggtcagata tcaagctgta ttacaatgat 2640

tacaacgaag atatccaact caaatcaaca gctatctaca gcatggttaa ggatattaat 2700

gatcgatatg cagcagaaaa caatggagag aagctcattg atggtattgg tatgcagtct 2760

cactataatg tcaacacaaa ccccgaaaat gttcgacttt ctctggagaa atttatctct 2820

ttaggtgttg agataagcat cactgaactt gacattactg taggaagcga ttctgagctt 2880

tctgaatatg atgctattgc tcagggctac ttatatgcac aattatttaa gctctataag 2940gaatatgctg agaatatcgt acgcgtaacc ttctggggat tggatgacga gacaagctgg 3000

agaagtgaag gaagcccgtt gttattcgat ggatatttgc aggctaaacc agcgtactat 3060

gctataatgg atccagataa attcatagca gagaatcccc ttgaggtaat aggagctaat 3120

caggcgaatg cggtatttgg tacacctgtg attgatggta ctatagattc agtttggagc 3180

caggcccctg agatttctgt taaacagttc ctggatgcat ggcaaggtgc ttctggagtt 3240

gctaaagctc tttgggatga agaaaaccta tatgtactgg ttcaagttaa agatgatcag 3300

cttgacaaaa gtcatgtaga tccatgggaa caggattctg ttgagatcca a 3351<210> 628<211> 1117<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (39) ... (193)

<223> Domínio de carbohidrato<220><221> DOMÍNIO

<222> (201)...(355)

<223> Domínio de carbohidrato

<220>

<221> DOMÍNIO

<222> (363)...(517)

<223> Domínio de carbohidrato

<220>

<221> DOMÍNIO

<222> (529)...(679)

<223> Domínio de carbohidrato

<220>

<221> DOMÍNIO<222> (693)...(1026)

<223> Família 10 de hidrolase glicosila<220>

<221> DOMÍNIO<222> (1046)...(1117)

<223> Domínio of desconhecido function (DUF1083)<220>

<221> SITE<222> (82) ... (85)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (93) . . . (96)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (246)...(249)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (257)...(260)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (270) . . . (273)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (411) . . .(414)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (422)...(425)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (434)...(437)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (569)...(572)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222>(634)...(637)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (652)...(655)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (956) ... (966)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id = PS00591<400> 628 Met Trp Lys Lys Phe Lys Val Ser Leu Ala Tyr Val Leu Ile Ser Val1 5 10 15 Leu Leu Val Ser Gln Gly Trp Ala Ile Ser Tyr Ala Glu Val Ala Thr 20 25 30 Thr Leu Glu Gln Thr Thr Glu Ser Val Val Leu Tyr Gln Asp Phe Glu 35 40 45 Asp Gly Gln Thr Gly Gly Trp Glu Arg Lys Ser Trp Gly Gly Gln Gly 50 55 60 Glu Val Ser Val Asp Glu Val Asp Gly Asn Lys Val Leu Ala Phe Thr65 70 75 80Asn Arg Thr Ser Lys Asp Ser Asn Pro Leu Leu Asn Leu Thr Ser Tyr 85 90 95 Ile Lys Pro Asp Arg Glu Tyr Ser Ile Ser Leu Lys Leu Arg Leu Gly 100 105 110 Glu Gly Thr Gly Lys Tyr His Leu Ala Ser Lys Val Glu Ser Pro Ile 115 120 125 Val Asp Asn Lys Tyr Pro Trp Leu Thr Gly Asp Ile Glu Val Thr Ser 130 135 140 Thr Glu Trp Thr Thr Phe Glu Ile Leu Gly Tyr Glu Ile Ala Ser Gln145 150 155 160Thr Thr Glu Phe Leu Ile Trp Ile Glu Pro Ala Ser Asp Ser Glu Thr 165 170 175 Gly Glu Val Phe Pro Asp Ile Tyr Ile Asp Glu Val Leu Ile Thr Glu 180 185 190 Ile Pro Thr Lys Ser Val Pro Lys Glu Thr Val Val Leu Ser Gln Asp 195 200 205 Phe Glu Asp Gly Gln Thr Gly Gly Trp Glu Arg Lys Ser Trp Gly Gly 210 215 220 Gln Gly Glu Val Ser Val Gly Glu Val Asp Gly Asn Lys Val Leu Ala225 230 235 240Phe Thr Asn Arg Ser Ser Lys Asp Ser Gln Pro Leu Leu Asn Leu Thr 245 250 255 Ser Tyr Ile Lys Ala Glu Gly Lys Tyr Asn Ile Ser Phe Lys Leu Arg 260 265 270 Leu Gly Glu Gly Thr Gly Lys Tyr His Val Ala Ser Lys Val Glu Ser 275 280 285 Pro Ile Ala Asp Asn Lys Tyr Pro Trp Leu Thr Gly Asp Ile Glu Val 290 295 300 Thr Ser Thr Glu Trp Thr Thr Phe Glu Ile Leu Gly Tyr Glu Ile Ala305 310 315 320Ser Gln Thr Thr Glu Phe Leu Ile Trp Ile Glu Ser Ser Ser Asp Ser 325 330 335 Glu Thr Glu Glu Val Phe Pro Asp Ile Tyr Ile Asp Asp Val Leu Ile 340 345 350 Thr Glu Ile Pro Thr Lys Ser Val Pro Lys Glu Thr Val Val Leu Ser 355 360 365 Gln Asp Phe Glu Asp Gly Gln Asn Gly Gly Trp Glu Arg Lys Ser Trp 370 375 380 Gly Gly Gln Gly Val Val Ser Val Val Glu Val Asp Gly Asn Lys Val385 390 395 400Leu Ala Phe Thr Asn Arg Ser Ser Lys Asp Ser Gln Pro Leu Leu Asn 405 410 415 Leu Thr Ser Tyr Ile Lys Ala Glu Gly Lys Tyr Asn Ile Ser Phe Lys 420 425 430 Leu Arg Leu Gly Glu Gly Thr Gly Lys Tyr His Val Ala Ser Lys Ile 435 440 445 Glu Ser Pro Ile Val Asp Asn Lys Tyr Pro Trp Leu Thr Gly Asp Ile 450 455 460 Glu Val Thr Ser Thr. Glu Trp Thr Thr Phe Glu Ile Leu Gly Tyr Glu465 470 475 480Ile Ala Gly Gln Thr Thr Glu Phe Leu Ile Trp Ile Glu Ser Ser Asp 485 490 495 Asp Ser Glu Thr Gly Glu Ile Phe Pro Asp Ile Tyr Ile Asp Asp Val 500 505 510 Leu Ile Ile Glu Ile Ser Glu Glu Asp Gly Asp Asn Asp Asp Asp Leu 515 520 525Asp Gln Ser Gly Ile Ile Ser Asp Phe Glu Asp Gly Ile Gly Asn Trp 530 535 540 Val Ile Arg Asp Ser Ser Gly Gly Ser Ile Glu Val Thr Asp Ala Asp545 550 555 560Asn Asn Thr Ala Asp Gly Ser Lys Ser Leu Met Ala Thr Val Ser Thr 565 570 575 Gln Tyr Asn Gly Pro Ile Leu Asp Val Met Gly Lys Met His Lys Asn 580 585 590 His Arg Tyr His Leu Ser Ala Trp Val Lys Met Ala Pro Gly Gln Thr 595 600 605 Ser Thr Ser Leu Arg Ile Ser Val Gln Ser Gly Asp Ser Thr Phe Thr 610 615 620 Asn Val Ser Ala Asn Val Val Ala Thr Asp Glu Gln Trp Val Glu Leu625 630 635 640Ser Gly Asn Phe Thr Leu Ala Val Thr Pro Ser Ile Leu Asn Ala Tyr 645 650 655 Val Glu Thr Val Ser Thr Pro Ala Glu Pro Val Thr Phe Tyr Met Asp 660 665 670 Asp Phe Val Ile Ser Tyr Val Gly Pro Val Gly Ile Lys Pro Val Gln 675 680 685 Thr Asp Leu Thr Pro Ile Lys Asp Ala Tyr Lys Asp Tyr Phe Leu Ile 690 695 700 Gly Ser Ala Val Glu Asp Arg Asp Leu Gln Gly Pro Arg Leu Glu Leu705 710 715 720Leu Lys His His His Asn Val Val Thr Ala Glu Asn Ala Met Lys Pro 725 730 735 Asp Tyr Ser Tyr Asp Gln Asn Arg Asn Phe Asn Phe Asp Ala Glu Asn 740 745 750 Ala Leu Val Ala Lys Val Glu Glu Ala Asp Leu Lys Leu Val Gly His 755 760 765 Val Leu Val Trp His Gln Gln Met Pro Leu Trp Leu Ser Thr Ala Glu 770 775 780 Asp Gly Thr Pro Leu Ser Arg Glu Val Ala Leu Glu Asn Leu Lys Thr785 790 795 800His Ile Thr Thr Val Met Glu Asn Tyr Gly Asp Lys Val Ile Ala Trp 805 810 815 Asp Val Val Asn Glu Ala Ile Arg Asp Gly Leu Thr Thr Ser Val Thr 820 825 830 Thr Asp Asn Trp Gln Leu Ala Leu Arg Gln Ser Pro Leu Tyr Asn Ala 835 840 845 Ile Gly Pro Asp Tyr Val Glu Gln Ser Phe Leu Ile Ala Lys Glu Val 850 855 860 Leu Lys Asn Asn Pro Glu Trp Ser Asp Ile Lys Leu Tyr Tyr Asn Asp865 870 875 880Tyr Asn Glu Asp Ile Gln Leu Lys Ser Thr Ala Ile Tyr Ser Met Val 885 890 895 Lys Asp Ile Asn Asp Arg Tyr Ala Ala Glu Asn Asn Gly Glu Lys Leu 900 905 910 Ile Asp Gly Ile Gly Met Gln Ser His Tyr Asn Val Asn Thr Asn Pro 915 920 925 Glu Asn Val Arg Leu Ser Leu Glu Lys Phe Ile Ser Leu Gly Val Glu 930 935 940 Ile Ser Ile Thr Glu Leu Asp Ile Thr Val Gly Ser Asp Ser Glu Leu945 950 955 960Ser Glu Tyr Asp Ala Ile Ala Gln Gly Tyr Leu Tyr Ala Gln Leu Phe 965 970 975 Lys Leu Tyr Lys Glu Tyr Ala Glu Asn Ile Val Arg Val Thr Phe Trp

980 985 990

Gly Leu Asp Asp Glu Thr Ser Trp Arg Ser Glu Gly Ser Pro Leu Leu995 . 1000 1005

Phe Asp Gly Tyr Leu Gln Ala Lys Pro Ala Tyr Tyr Ala Ile Met

1010 1015 1020

Asp Pro Asp Lys Phe Ile Ala Glu Asn Pro Leu Glu Val Ile Gly

1025 1030 1035

Ala Asn Gln Ala Asn Ala Val Phe Gly Thr Pro Val Ile Asp Gly

1040 1045 1050

Thr Ile Asp Ser Val Trp Ser Gln Ala Pro Glu Ile Ser Val Lys1055 1060 1065

Gln Phe Leu Asp Ala Trp Gln Gly Ala Ser Gly Val Ala Lys Ala

1070 1075 1080

Leu Trp Asp Glu Glu Asn Leu Tyr Val Leu Val Gln Val Lys Asp

1085 1090 1095

Asp Gln Leu Asp Lys Ser His Val Asp Pro Trp Glu Gln Asp Ser

1100 1105 HlO

Val Glu Ile Gln

1115<210> 629<211> 1143<212> DNA<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 629

atgcactctc gccgtaagtt tttacttcgc tcagctcaag caacaggctt gatgctgtttgccaaacagc aggcttttgc cagcgccgct aaaaaaaccg ggcttgccga ggcctttaaagataacttct ttgtgggtac cgccatctct áccagcacgc tggttaatca ggatgccaccatgctggata ttattgcccg cgagtttaac gccattaccg cggaaaactg tatgaaatggggtgttatta atcccgagcc cggcgtgtgg gactgggagc ctgcggaccg tttcgtggactttggcgaaa agcagggtat gtgcgtggtg ggtcataccc tggtgtggca ctcgcaagcacccgcctggt tgtttaaaga tgacaaaggc gggcaggtga gcgcgacaga gctgaatgcgcggatggagc gccatattga ggttttggcc ggtcgctata aaggcaagat tcacacctgggatgtggtta acgaggccat tgatgaagat aaaggctggc gcaagagccc ctggtttaacatcctcggcc ctgaatttat ggagcgtgcc tttcatttgg cacatcaggt tgatccggacagccacctga tttacaacga ctacaatatg cataaccccg gcaagcgcga gtttttgtttaaggtgttaa aggattatgt aaaacgcggt gtgcccattc atggtgtggg catgcagggccatgtgggac tcgactaccc ggatatgacc gagtttgaaa acaccatgaa agcgtgtgccgatatgggct tagcgttgca tattaccgag ctggatgtgg atgtgttgcc cgttgcctgggagcatatgg gcgcggagat ctctaccaac tttgcctaca gcgacgagct taacccttatgtggatggcc tgcccgacaa ggtgcagcag cagctgactg accgttatgt gcagttgttcgagctgtttt tgaagtacga aaaacacatt gcccgcgtta ccacctgggg cactaatgatgcacagagct ggaagaacgg tttccctgtg cgcggtcgca ctaactaccc gttactgtttgatcgcaaca accagcccaa gcctgcttac catgccatta aggcgttgaa agcgaccccttaa

<210> 630

<211> 380

<212> PRT

<213> Desconhecido

<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (34)...(377)

<223> Família 10 de hidrolase glicosila<220>

<221> SITE

<222> (267) . .. (277)

<223> Família 10 ativa site de hidrolases glicosila. Prosite id =<400> 630

Met His Ser Arg Arg Lys Phe Leu Leu Arg Ser Ala Gln Ala Thr Gly1 5 10 15 Leu Met Leu Phe 20 Ala Lys Gln Gln Ala 25 Phe Ala Ser Ala Ala 30 Lys LysThr Gly Leu 35 Ala Glu Ala Phe Lys 40 Asp Asn Phe Phe Val 45 Gly Thr AlaIle Ser 50 Thr Ser Thr Leu Val 55 Asn Gln Asp Ala Thr 60 Met Leu Asp IleIle Ala Arg Glu Phe Asn Ala Ile Thr Ala Glu Asn Cys Met Lys Trp65 70 75 80Gly Val Ile Asn Pro Glu Pro Gly Val Trp Asp Trp Glu Pro Ala Asp 85 90 95 Arg Phe Val Asp 100 Phe Gly Glu Lys Gln 105 Gly Met Cys Val Val 110 Gly HisThr Leu Val 115 Trp His Ser Gln Ala 120 Pro Ala Trp Leu Phe 125 Lys Asp AspLys Gly 130 Gly Gln Val Ser Ala 135 Thr Glu Leu Asn Ala 140 Arg Met Glu Arg His Ile Glu Val Leu Ala Gly Arg Tyr Lys Gly Lys Ile His Thr Trp 145 150 155 160 Asp Val Val Asn Glu Ala Ile Asp Glu Asp Lys Gly Trp Arg Lys Ser 165 170 175 Pro Trp Phe Asn 180 Ile Leu Gly Pro Glu 185 Phe Met Glu Arg Ala 190 Phe His Leu Ala His Gln Val Asp Pro Asp Ser His Leu Ile Tyr Asn Asp Tyr 195 200 205 Asn Met 210 His Asn Pro Gly Lys 215 Arg Glu Phe Leu Phe 220 Lys Val Leu Lys Asp Tyr Val Lys Arg Gly Val Pro Ile His Gly Val Gly Met Gln Gly 225 230 235 240 His Val Gly Leu Asp 245 Tyr Pro Asp Met Thr 250 Glu Phe Glu Asn Thr 255 Met Lys Ala Cys Ala 260 Asp Met Gly Leu Ala 265 Leu His Ile Thr Glu 270 Leu Asp Val Asp Val Leu Pro Val Ala Trp Glu His Met Gly Ala Glu Ile Ser 275 280 285 Thr Asn 290 Phe Ala Tyr Ser Asp 295 Glu Leu Asn Pro Tyr 300 Val Asp Gly Leu Pro Asp Lys Val Gln Gln Gln Leu Thr Asp Arg Tyr Val Gln Leu Phe 305 310 315 320 Glu Leu Phe Leu Lys 325 Tyr Glu Lys His Ile 330 Ala Arg Val Thr Thr 335 Trp Gly Thr Asn Asp 340 Ala Gln Ser Trp Lys 345 Asn Gly Phe Pro Val 350 Arg Gly Arg Thr Asn Tyr Pro Leu Leu Phe Asp Arg Asn Asn Gln Pro Lys Pro 355 360 365 Ala Tyr 370 His Ala Ile Lys Ala 375 Leu Lys Ala Thr Pro 380 <210> 631 <211> 1143 <212> DNA <213> Desconhecido

<220>

<223> Obtido para amostra ambiental<400> 631

atgaacaatc tatcccgccg taaattcctt ctgggcagcg ccggcctggc cgcactgacc 60

aatctgaaag cctgcgccat caacaacgct gtcgagcaca ccggactgca caaggtgtac 120aaggacgatt tcctgatcgg taccgccatc agcaaccaga ctctggcaac ccgcaaccgc 180ccattgctgg atctgatcgg gcgtgagttc aacgccatta ccgccgagaa ctgcatgaaatccggcctgc tgcaaccctc ccagggccag tgggaatggg agctggcgga tcgttttatcgattacgggg tagagaacga catgcacatt gtcggccacg ctctggtgtg gcactcacag 360gcacccggcg acttttttgt ccacgaagac ggtcggcaga tttcccgcgc cgagctgatc 420cggcgcatgg acacccacat ccagaccgtt atggagcgtt acaagggcaa ggtgcacacc 480tgggatgtgg tcaacgagtc cattgacgaa gatcagggct ggcgcaagag cctgtggtat 540

600660

caggtcatgg gctcggcgga gtaccaggag cgggccttca atctggctca cgagctggaccccaaagcgc acctgattta caacgactac aacatgcaca accccggcaa acgggagttt

tga

<210> 632

<211> 380

<212> PRT

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> SIGNAL

240300

ctggtggatg tgatcaagga ttacaaaaaa cgcggcgtgc ccattcacgg cgtgggtatg 720

cagagccatg tgggcctgga ctacccggat atgcgcgaat acgaaaaaag catcgaagct 780

tacgcggctc tgggcatgcg cctgcacatg accgagctgg aagtggatgt gctgccggta 840

gcctgggaac acatgggggc agaaatttcc accgagtttg agtacgccga tgagctcaat 90055 ccttacactg acggcttgcc ggcggaagtg gagaatgagc tgaccgaacg ttatgtggag 960

ttgttcaaac tctatatcaa gcaccgggac aagatcgacc ggatcaccac ctggggcacc 1020cacgatggcg aatcctggaa aaacgacttc ccggttcgcg gccgcaccaa ctacgccctg 1080

ttgttcgatc gggatctgca gcccaaagac gcttactacg ccctgctcaa cctgcgccgc 1140

1143<222> (1). . . (26)<220><221> DOMÍNIO<222> (35)...(379)<223> Família 10 de hidrolase glicosila<220><221> SITE<222> (3)...(6)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (52). . . (55)<223> N-glicosilação site. Prosite id = PS00001<220><221> SITE<222> (167)...(170)<223> N-glicosilação site. Prosite id = PS00001<400> 632

Met Asn Asn Leu Ser Arg Arg Lys Phe Leu Leu Gly Ser Ala Gly Leu1 5 10 15 Ala Ala Leu Thr Asn Leu Lys Ala Cys Ala Ile Asn Asn Ala Val Glu 20 25 30 His Thr Gly Leu His Lys Val Tyr Lys Asp Asp Phe Leu Ile Gly Thr 35 40 45 Ala Ile Ser Asn Gln Thr Leu Ala Thr Arg Asn Arg Pro Leu Leu Asp 50 55 60 Leu Ile Gly Arg Glu Phe Asn Ala Ile Thr Ala Glu Asn Cys Met Lys65 70 75 80Ser Gly Leu Leu Gln Pro Ser Gln Gly Gln Trp Glu Trp Glu Leu Ala 85 90 95 Asp Arg Phe Ile Asp Tyr Gly Val Glu Asn Asp Met His Ile Val Gly 100 105 110 His Ala Leu Val Trp His Ser Gln Ala Pro Gly Asp Phe Phe Val His 115 120 125 Glu Asp Gly Arg Gln Ile Ser Arg Ala Glu Leu Ile Arg Arg Met Asp 130 135 140 Thr His Ile Gln Thr Val Met Glu Arg Tyr Lys Gly Lys Val His Thr145 150 155 160Trp Asp Val Val Asn Glu Ser Ile Asp Glu Asp Gln Gly Trp Arg Lys 165 170 175 Ser Leu Trp Tyr Gln Val Met Gly Ser Ala Glu Tyr Gln Glu Arg Ala 180 185 190 Phe Asn Leu Ala His Glu Leu Asp Pro Lys Ala His Leu Ile Tyr Asn 195 200 205 Asp Tyr Asn Met His Asn Pro Gly Lys Arg Glu Phe Leu Val Asp Val 210 215 220 Ile Lys Asp Tyr Lys Lys Arg Gly Val Pro Ile His Gly Val Gly Met 225 230 235 240Gln Ser His Val Gly Leu Asp Tyr Pro Asp Met Arg Glu Tyr Glu Lys 245 250 255 Ser Ile Glu Ala Tyr Ala Ala Leu Gly Met Arg Leu His Met Thr Glu 260 265 270 Leu Glu Val Asp Val Leu Pro Val Ala Trp Glu His Met Gly Ala Glu 275 280 285 Ile Ser Thr Glu Phe Glu Tyr Ala Asp Glu Leu Asn Pro Tyr Thr Asp 290 295 300 Gly Leu Pro Ala Glu Val Glu Asn Glu Leu Thr Glu Arg Tyr Val Glu305 310 315 320Leu Phe Lys Leu Tyr Ile Lys His Arg Asp Lys Ile Asp Arg Ile Thr 325 330 335 Thr Trp Gly Thr His Asp Gly Glu Ser Trp Lys Asn Asp Phe Pro Val 340 345 350 Arg Gly Arg Thr Asn Tyr Ala Leu Leu Phe Asp Arg Asp Leu Gln Pro 355 360 365 Lys Asp Ala Tyr Tyr Ala Leu Leu Asn Leu Arg Arg 370 375 380 <210> 633<211> 1398<212> DNA

<213> Desconhecido<220>

<223> Obtido para amostra ambiental<400> 633

atgagaaagc tactaattat ctggattgtg ctgatactgg ccctgttgcctgtgatgtaa ttgcaagggt cgaagacccg accgaagaac tggaaaccgagatgacccgg caaatgactc agggccctcc cctacagaac ctggcagttcctttttatga gcatggccgg taaatcacaa agtcaggtag actccaaactgtcaaccgta tttttggcat agggactggc gaaagctcaa cacccgtccataccgcttgt attacgaact cccccaggâc ccatcgatgg ccttcatctgacaaatgata tccgcaccga aggaatgtcc tacggcatga tgattgcagtatgcaggaag aattcgacaa gctctggaaa tttgctaaaa cccatatgcaaacatcagtg gcgacgacct ggaggcctgg cgttattatt tccgctggtgatcaacacct ccgatccgag caactggagc tggaacagcg ccaacgatacgatggtgagg tatatttcgc aatgtcactg tacctggccg accgccgctgggcacctgga actataaaga agcagccgat caaatcacca acgcgatgctcaatccggca tccgctatcc aattattcat accgatgaaa ataaaatcagtacggaaatt cctacggttt ttcggatccc agctaccatg ttccgcatttttcgcagcct ggggcccatc ggaaaacagt gcccgctgga tggagatagccgggattatc tggttattgc ggctcatgaa caaaccggct tgcatccggatatgacggaa ccccggtatc cgatgtttcc ggaacactca gcgatggcctctgcatgaca acttccgatt cgattcatgg cgtgttccta tgaatatggcatctggtacg gtacggatga gcacatgaaa gagcaagtcg taaaataccaagcgactata aagggacaaa caatgtgacg caatcactgt tcaaaattgaggcagcggaa acggctcaac agctcttact gccactttgg ctgcagccaggaccaccccg atgctgaatt ctgggtcgca gccctctggg attgctggcaacataccgct actatcaaca actggtgtat ctattaggga tgatgaatgttatcagacca actggtaa<210> 634<211> 465<212> PRT<213> Desconhecido<220>

<223> Obtido para amostra ambiental<220>

<221> DOMÍNIO<222> (77)... (459)

<223> Família 8 de hidrolase glicosila<220>

<221> SITE<222> (45)...(48)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (163)...(166)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (184) ... (187)<223> N-glicosilação<220>

<221> SITE<222> (190) .. . (193)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (223)...(226)<223> N-glicosilação site.<220>

<221> SITE<222> (393)...(396)<223> N-glicosilação site.<220>

<221> SITE<222> (410)...(413)

ggttatcagc 60cccggtggat 120aacaagcaac 180acagaccgta 240ggaaactggt 300gacggcagat 360ccagatggac 420gtaccctggc 480gctgacagac 540ccccgctccc 600gggctccaac 660caataaccag 720ctttgtacca 780ttttgaaagc 840ccaaatcagc 900ctatgcagcc 960ttcggatggc 1020catggactat 1080tgagtttttc 1140tgggacaggt 1200catggcttcc 1260gcaaaatggg 1320agcaggaatt 1380 1398

site. Prosite id = PS00001

Prosite id

PS00001

Prosite id = PS00001<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (445)...(448)

<223> N-glicosilação site. Prosite id = PS00001<400> 634

Met Arg Lys Leu Leu Ile Ile Trp Ile Val Leu Ile Leu Ala Leu Leu 1 5 10 15 Pro Val Ile Ser Cys Asp Val Ile Ala Arg Val Glu Asp Pro Thr Glu 20 25 30 Glu Leu Glu 35 Thr Asp Pro Val Asp 40 Asp Asp Pro Ala Asn 45 Asp Ser Gly Pro Ser 50 Pro Thr Glu Pro Gly 55 Ser Ser Thr Ser Asn 60 Leu Phe Met Ser Met Ala Gly Lys Ser Gln Ser Gln Val Asp Ser Lys Leu Gln Thr Val 65 70 75 80 Val Asn Arg Ile Phe Gly Ile Gly Thr Gly Glu Ser Ser Thr Pro Val 85 90 95 Gln Glu Thr Gly Tyr Arg Leu Tyr Tyr Glu Leu Pro Gln Asp Pro Ser 100 105 110 Met Ala Phe 115 Ile Trp Thr Ala Asp 120 Thr Asn Asp Ile Arg 125 Thr Glu Gly Met Ser 130 Tyr Gly Met Met Ile 135 Ala Val Gln Met Asp 140 Met Gln Glu Glu Phe Asp Lys Leu Trp Lys Phe Ala Lys Thr His Met Gln Tyr Pro Gly 145 150 155 160 Asn Ile Ser Gly Asp Asp Leu Glu Ala Trp Arg Tyr Tyr Phe Arg Trp 165 170 175 Trp Leu Thr Asp Ile Asn Thr Ser Asp Pro Ser Asn Trp Ser Trp Asn 180 185 190 Ser Ala Asn Asp Thr Pro Ala Pro Asp Gly Glu Val Tyr Phe Ala Met 195 200 205 Ser Leu Tyr Leu Ala Asp Arg Arg Trp Gly Ser Asn Gly Thr Trp Asn 210 215 220 Tyr Lys Glu Ala Ala Asp Gln Ile Thr Asn Ala Met Leu Asn Asn Gln 225 230 235 240 Gln Ser Gly Ile Arg Tyr Pro Ile Ile His Thr Asp Glu Asn Lys Ile 245 250 255 Ser Phe Val Pro Tyr Gly Asn Ser Tyr Gly Phe Ser Asp Pro Ser Tyr 260 265 270 His Val Pro 275 His Phe Phe Glu Ser 280 Phe Ala Ala Trp Gly 285 Pro Ser Glu Asn Ser 290 Ala Arg Trp Met Glu 295 Ile Ala Gln Ile Ser 300 Arg Asp Tyr Leu Val Ile Ala Ala His Glu Gln Thr Gly Leu His Pro Asp Tyr Ala Ala 305 310 315 320 Tyr Asp Gly Thr Pro Val Ser Asp Val Ser Gly Thr Leu Ser Asp Gly 325 330 335 Leu Ser Asp Gly Leu His Asp Asn Phe Arg Phe Asp Ser Trp Arg Val 340 345 350 Pro Met Asn 355 Met Ala Met Asp Tyr 360 Ile Trp Tyr Gly Thr 365 Asp Glu His Met Lys 370 Glu Gln Val Val Lys 375 Tyr His Glu Phe Phe 380 Ser Asp Tyr Lys Gly Thr Asn Asn Val Thr Gln Ser Leu Phe Lys Ile Asp Gly Thr Gly 385 390 395 400 Gly Ser Gly Asn Gly Ser Thr Ala Leu Thr Ala Thr Leu Ala Ala Ala 405 410 415 Ser Met Ala Ser Asp His Pro Asp Ala Glu Phe Trp Val Ala Ala Leu 420 425 430 Trp Asp Cys Trp Gln Gln Asn Gly Thr Tyr Arg Tyr Tyr Gln Gln Leu 435 440 445 Val Tyr Leu Leu Gly Met Met Asn Val Ala Gly Ile Tyr Gln Thr Asn 450 455 460 Trp 465 <210> 635<211> 831

<212> DNA

<213> Desconhecido

<220>

<223> Obtido para uma amostra ambiental<400> 635

gtgaacccac taataaatag attagcgctt aaaagctcgc ttgcagcagc aacgtgcgttgctgcgatga gcttttcgac agcgaacgcc tgtaccggag cacttaacag ccaaaacaactctgttggta ctcacaacgg ctattattac tccttctgga agcagaccga caacggtcgtgtaaatgtca cctgcggaga acccggctat tatagtactg aatggagcaa cgtttttaactgggtcggtg gagtgggctg gaatccaggt gggcctagaa tcgttaatta ccgcggcacattcaacagcg gtatgaacca gagctcttca aactcttatc ttgcgcttta cgggtggactcgagtcccaa atgaagtcga gtattacgta gtcgagagct acggttccta caatcccgcaagctgcggcg gtggcggcgg tgttgctggc ggtggtggta gcggggatgg ccataaaggatccgtcacga tcggcggagt ggtttacgac ttgacgcaat gcacacgaac gaaccagccatctatttctg gaacttccac atttaggcag tttttcagtg tacgccggga ccctctgccttggggccagg tccaaggctc catcgacgtg ggcgcccatt tccaagcctg ggctgatgccggcatgcaac ttggcgatga tcatttttac atggtgctcg ccagtgaggg ttatgatggtgggaataatt cttctggtaa ctccgagctt tggataactg agggttctgg cggcggtgcagcgcctggtg gcggcggcgc aggaaacggc ggctcgtgcc gaattctttg g<210> 636<2U> 277<212> PRT<213> Desconhecido<220>

<223> Obtido para uma amostra ambiental<220>

<221> SIGNAL<222> (1)...(30)<220>

<221> DOMÍNIO<222> (43) .·. . (252)

<223> Família 11 de glicosila hidrolases<220>

<221> SITE<222> (39)...(42)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE<222> (62)...(65)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (107)...(110)

<223> N-glicosilação site. Prosite id = PS00001<220>

<221> SITE

<222> (245)...(248)

<223> N-glicosilação site. Prosite id = PS00001<400> 636

Met Asn Pro Leu Ile Asn Arg Leu Ala Leu Lys Ser Ser Leu Ala Ala1 5 10 15Ala Thr Cys Val Ala Ala Met Ser Phe Ser Thr Ala Asn Ala Cys Thr 20 25 30 Gly Ala Leu Asn Ser Gln Asn Asn Ser Val Gly Thr His Asn Gly Tyr 35 40 45 Tyr Tyr Ser Phe Trp Lys Gln Thr Asp Asn Gly Arg Val Asn Val Thr 50 55 60 Cys Gly Glu Pro Gly Tyr Tyr Ser Thr Glu Trp Ser Asn Val Phe Asn65 70 75 80Trp Val Gly Gly Val Gly Trp Asn Pro Gly Gly Pro Arg Ile Val Asn 85 90 95Tyr Arg Gly Thr Phe Asn. Ser Gly Met Asn Gln Ser Ser Ser Asn Ser 100 105 110 Tyr Leu Ala Leu Tyr Gly Trp Thr Arg Val Pro Asn Glu Val Glu Tyr 115 120 125 Tyr Val Val Glu Ser Tyr Gly Ser Tyr Asn Pro Ala Ser Cys Gly Gly130 135 140

Gly Gly Gly Val Ala Gly Gly Gly Gly Ser Gly Asp Gly His Lys Gly145 150 155 160Ser Val Thr Ile Gly 165 Gly Val Val Tyr Asp 170 Leu Thr Gln Cys Thr 175 ArgThr Asn Gln Pro 180 Ser Ile Ser Gly Thr 185 Ser Thr Phe Arg Gln Phe 190 PheSer Val Arg 195 Arg Asp Pro Leu Pro 200 Trp Gly Gln Val Gln 205 Gly Ser IleAsp Val 210 Gly Ala His Phe Gln 215 Ala Trp Ala Asp Ala 220 Gly Met Gln LeuGly Asp Asp His Phe Tyr Met Val Leu Ala Ser Glu Gly Tyr Asp Gly225 230 235 240Gly Asn Asn Ser Ser 245 Gly Asn Ser Glu Leu 250 Trp Ile Thr Glu Gly 255 SerGly Gly Gly Ala 260 Ala Pro Gly Gly Gly 265 Gly Ala Gly Asn Gly Gly 270 SerCys Arg Ile 275 Leu Trp

Claims

1. Ácido nucléico isolado, sintético ou recombinante que com-preende(a) um ácido nucléico que codifica pelo menos um polipeptídeo,em que o ácido nucléico compreende uma seqüência que tem pelo menoscerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%,-61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%,-74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%,-87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%,-ou mais ou identidade de seqüência completa (100%) à seqüência de SEQ-I ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO:-19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO:-37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO:-55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ ID NO:-73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81, SEQ- ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ ID NO:-91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99, SEQID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQ IDNO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ ID NO:-117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO: 125,-SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133, SEQID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQ IDNO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO:-151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO: 199,SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ-ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ IDNO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO:-185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193,SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201, SEQID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ IDNO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID NO:-219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO: 227,SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235, SEQID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ IDNO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ ID NO:-253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO: 261,SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269, SEQID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQ IDNO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ ID NO:-287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO: 295,SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303, SEQID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQ IDNO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ ID NO:-321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO: 329,SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 337, SEQID NO: 339, SEQ ID NO: 341, SEQ ID NO: 343, SEQ ID NO: 345, SEQ IDNO: 347, SEQ ID NO: 349, SEQ ID NO: 351, SEQ ID NO: 353, SEQ ID NO:-355, SEQ ID NO: 357, SEQ ID NO: 359, SEQ ID NO: 361, SEQ ID NO: 363,SEQ ID NO: 365, SEQ ID NO: 367, SEQ ID NO: 369, SEQ ID NO: 371, SEQID NO: 373, SEQ ID NO: 375, SEQ ID NO: 377, SEQ ID NO: 379, SEQ IDNO: 381, SEQ ID NO: 383, SEQ ID NO: 385, SEQ ID NO: 387, SEQ ID NO:-389, SEQ ID NO: 391, SEQ ID NO: 393, SEQ ID NO: 395, SEQ ID NO: 397,SEQ ID NO: 399, SEQ ID NO: 401, SEQ ID NO: 403, SEQ ID NO: 405, SEQID NO: 407, SEQ ID NO: 409, SEQ ID NO: 411, SEQ ID NO: 413, SEQ IDNO: 415, SEQ ID NO: 417, SEQ ID NO: 419, SEQ ID NO: 421, SEQ ID NO:-423, SEQ ID NO: 425, SEQ ID NO: 427, SEQ ID NO: 429, SEQ ID NO: 431,SEQ ID NO: 433, SEQ ID NO: 435, SEQ ID NO: 437, SEQ ID NO: 439, SEQID NO: 441, SEQ ID NO: 443, SEQ ID NO: 445, SEQ ID NO: 447, SEQ IDNO: 449, SEQ ID NO: 451, SEO ID NO: 453, SEQ ID NO: 455, SEQ ID NO:-457, SEQ ID NO: 459, SEQ ID NO: 461, SEQ ID NO: 463, SEQ ID NO: 465,SEQ ID NO: 467, SEQ ID NO: 469, SEQ ID NO: 471, SEQ ID NO: 473, SEQID NO: 475, SEQ ID NO: 477, SEQ ID NO: 479, SEQ ID NO: 481, SEQ IDNO: 483, SEQ ID NO: 485, SEQ ID NO: 487, SEQ ID NO: 489, SEQ ID NO:-491, SEQ ID NO: 493, SEQ ID NO: 495, SEQ ID NO: 497, SEQ ID NO: 499,SEQ ID NO: 501, SEQ ID NO: 503, SEQ ID NO: 505, SEQ ID NO: 507, SEQID NO: 509, SEQ ID NO: 511, SEQ ID NO: 513, SEQ ID NO: 515, SEQ IDNO: 517, SEQ ID NO: 519, SEQ ID NO: 521, SEQ ID NO: 523, SEQ ID NO:-525, SEQ ID NO: 527, SEQ ID NO: 529, SEQ ID NO: 531, SEQ ID NO: 533,SEQ ID NO: 535, SEQ ID NO: 537, SEQ ID NO: 539, SEQ ID NO: 541, SEQID NO: 543, SEQ ID NO: 545, SEQ ID NO: 547, SEQ ID NO: 549, SEQ IDNO: 551, SEQ ID NO: 553, SEQ ID NO: 555, SEQ ID NO: 557, SEQ ID NO:-559, SEQ ID NO: 561, SEQ ID NO: 563, SEQ ID NO: 565, SEQ ID NO: 567,SEQ ID NO: 569, SEQ ID NO: 571, SEQ ID NO: 573, SEQ ID NO: 575, SEQID NO: 577, SEQ ID NO: 579, SEQ ID NO: 581, SEQ ID NO: 583, SEQ IDNO: 585, SEQ ID NO: 587, SEQ ID NO: 589, SEQ ID NO: 591, SEQ ID NO:-593, SEQ ID NO: 595, SEQ ID NO: 597, SEQ ID NO: 599, SEQ ID NO: 601,SEQ ID NO: 603, SEQ ID NO: 605, SEQ ID NO: 607, SEQ ID NO: 609, SEQID NO: 611, SEQ ID NO: 613, SEQ ID NO: 615, SEQ ID NO: 617, SEQ IDNO: 619, SEQ ID NO: 621, SEQ ID NO: 623, SEQ ID NO: 625, SEQ ID NO:-627, SEQ ID NO: 629, SEQ ID NO: 631, SEQ ID NO: 633 e/ou SEQ ID NO:-635, ao longo de uma região de pelo menos cerca de 20, 30, 40, 50, 75, 100,-150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850,-900, 950, 1000, 1050, 1100, 1150 ou mais resíduos, ou a extensão completade um cDNA, transcrito (mRNA) ou gene,em que o ácido nucléico codifica pelo menos um polipeptídeoque tem uma atividade de xilanase, a mananase e/ou glicanase ou codificaum polipeptídeo ou peptídeo capaz de gerar um anticorpo específico de xila-nase, mananase e/ou glicanase (um polipeptídeo ou peptídeo que age comoum epitopo ou imunogonênio),e opcionalmente as identidades de seqüência são determinadaspor análise com um algoritmo de comparação de seqüência ou por inspeçãovisual,e opcionalmente o algoritmo de comparação de seqüência é umalgoritmo BLAST versão 2.2.2 onde um ajuste de filtro é ajustado para blas-tall -p blastp -d "nr pataa" -F F, e todas as outras opções são ajustadas parao padrão;(b) um ácido nucléico que codifica pelo menos um polipeptídeo,em que o ácido nucléico compreende uma seqüência que hibridiza sob con-dições estringentes a um ácido nucléico que compreende a seqüência deSEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9,SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ IDNO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27,SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ IDNO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45,SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ IDNO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63,SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71, SEQ IDNO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 81,SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89, SEQ IDNO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 99,SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO: 107, SEQID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115, SEQ IDNO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQ ID NO:-125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ ID NO: 133,SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO: 141, SEQID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ IDNO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQ ID NO:-199, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167,SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ IDNO: 185, SEQ ID NO: 187, SEO ID NO: 189, SEQ ID NO: 191, SEQ ID NO:-193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199, SEQ ID NO: 201,SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO: 209, SEQ-ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217, SEQ ID-NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ ID NO:-227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ ID NO: 235,SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO: 243, SEQ-ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251, SEQ IDNO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQ ID NO:-261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID NO: 269,-SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO: 277, SEQID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285, SEQ IDNO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQ ID NO:-295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ ID NO: 303,-SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO: 311, SEQID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319, SEQ IDNO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQ ID NO:-329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ ID NO: 337,SEQ ID NO: 339, SEQ ID NO: 341, SEQ ID NO: 343, SEQ ID NO: 345, SEQ-ID NO: 347, SEQ ID NO: 349, SEQ ID NO: 351, SEQ ID NO: 353, SEQ IDNO: 355, SEQ ID NO: 357, SEQ ID NO: 359, SEQ ID NO: 361, SEQ ID NO:-363, SEQ ID NO: 365, SEQ ID NO: 367, SEQ ID NO: 369, SEQ ID NO: 371,SEQ ID NO: 373, SEQ ID NO: 375, SEQ ID NO: 377, SEQ ID NO: 379, SEQID NO: 381, SEQ ID NO: 383, SEQ ID NO: 385, SEQ ID NO: 387, SEQ ID-NO: 389, SEQ ID NO: 391, SEQ ID NO: 393, SEQ ID NO: 395, SEQ ID NO:-397, SEQ ID NO: 399, SEQ ID NO: 401, SEQ ID NO: 403, SEQ ID NO: 405,SEQ ID NO: 407, SEQ ID NO: 409, SEQ ID NO: 411, SEQ ID NO: 413, SEQID NO: 415, SEQ ID NO: 417, SEQ ID NO: 419, SEQ ID NO: 421, SEQ IDNO: 423, SEQ ID NO: 425, SEQ ID NO: 427, SEQ ID NO: 429, SEQ ID NO:-431, SEQ ID NO: 433, SEQ ID NO: 435, SEQ ID NO: 437, SEQ ID NO: 439,SEQ ID NO: 441, SEQ ID NO: 443, SEQ ID NO: 445, SEQ ID NO: 447, SEQID NO: 449, SEQ ID NO: 451, SEO ID NO: 453, SEQ ID NO: 455, SEQ IDNO: 457, SEQ ID NO: 459, SEQ ID NO: 461, SEQ ID NO: 463, SEQ ID NO:- 465, SEQ ID NO: 467, SEQ ID NO: 469, SEQ ID NO: 471, SEQ ID NO: 473,SEQ ID NO: 475, SEQ ID NO: 477, SEQ ID NO: 479, SEQ ID NO: 481, SEQID NO: 483, SEQ ID NO: 485, SEQ ID NO: 487, SEQ ID NO: 489, SEQ IDNO: 491, SEQ ID NO: 493, SEQ ID NO: 495, SEQ ID NO: 497, SEQ ID NO:- 499, SEQ ID NO: 501, SEQ ID NO: 503, SEQ ID NO: 505, SEQ ID NO: 507,SEQ ID NO: 509, SEQ ID NO: 511, SEQ ID NO: 513, SEQ ID NO: 515, SEQID NO: 517, SEQ ID NO: 519, SEQ ID NO: 521, SEQ ID NO: 523, SEQ IDNO: 525, SEQ ID NO: 527, SEQ ID NO: 529, SEQ ID NO: 531, SEQ ID NO:- 533, SEQ ID NO: 535, SEQ ID NO: 537, SEQ ID NO: 539, SEQ ID NO: 541,SEQ ID NO: 543, SEQ ID NO: 545, SEQ ID NO: 547, SEQ ID NO: 549, SEQID NO: 551, SEQ ID NO: 553, SEQ ID NO: 555, SEQ ID NO: 557, SEQ IDNO: 559, SEQ ID NO: 561, SEQ ID NO: 563, SEQ ID NO: 565, SEQ ID NO:- 567, SEQ ID NO: 569, SEQ ID NO: 571, SEQ ID NO: 573, SEQ ID NO: 575,SEQ ID NO: 577, SEQ ID NO: 579, SEQ ID NO: 581, SEQ ID NO: 583, SEQID NO: 585, SEQ ID NO: 587, SEQ ID NO: 589, SEQ ID NO: 591, SEQ IDNO: 593, SEQ ID NO: 595, SEQ ID NO: 597, SEQ ID NO: 599, SEQ ID NO:- 601, SEQ ID NO: 603, SEQ ID NO: 605, SEQ ID NO: 607, SEQ ID NO: 609,SEQ ID NO: 611, SEQ ID NO: 613, SEQ ID NO: 615, SEQ ID NO: 617, SEQID NO: 619, SEQ ID NO: 621, SEQ ID NO: 623, SEQ ID NO: 625, SEQ IDNO: 627, SEQ ID NO: 629, SEQ ID NO: 631, SEQ ID NO: 633 e/ou SEQ IDNO: 635,em que o ácido nucléico codifica pelo menos um polipeptídeoque tem uma atividade de xilanase, mananase e/ou glicanase ou codifica umpolipeptídeo ou peptídeo capaz de gerar um anticorpo específico de xilana-se, mananase e/ou glicanase (um polipeptídeo que age como um epitopo ouimunógeno),e opcionalmente as condições estringentes compreendem umaetapa de lavagem que compreende uma lavagem em SSC 0,2X em umatemperatura de cerca de 65°C por cerca de 15 minutos,e opcionalmente o ácido nucléico tem pelo menos cerca de 20,-25, 30, 50, 75, 100, 125, 150, 175, 200, 225, 300, 350, 400, 450, 500, 600,-700, 800, 900, 1000 ou mais resíduos de extensão ou a extensão completado gene ou transcrito;(c) um ácido nucléico que codifica pelo menos um polipeptídeoque tem uma atividade de xilanase, mananase e/ou glicanase, em que o po-lipeptídeo compreende a seqüência de SEQ ID NO: 2, SEQ ID NO: 4, SEQID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14,SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ IDNO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32,SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ IDNO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50,SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ IDNO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68,SEQ ID NO: 70, SEQ ID NO: 72, SEQ ID NO: 74, SEQ ID NO: 76, SEQ IDNO: 78, SEQ ID NO: 80, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86,SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 94, SEQ IDNO: 96, SEQ ID NO: 98, SEQ ID NO: 100, SEQ ID NO: 102, SEQ ID NO:-104, SEQ ID NO: 106, SEQ ID NO: 108, SEQ ID NO: 110, SEQ ID NO: 112,SEQ ID NO: 114, SEQ ID NO: 116, SEQ ID NO: 118, SEQ ID NO: 120, SEQID NO: 122, SEQ ID NO: 124, SEQ ID NO: 126, SEQ ID NO: 128, SEQ IDNO: 130, SEQ ID NO: 132; SEQ ID NO: 134; SEQ ID NO: 136; SEQ ID NO:-138; SEQ ID NO: 140; SEQ ID NO: 142; SEQ ID NO: 144; NO:146, SEQ IDNO: 148, SEQ ID NO: 150, SEQ ID NO: 152, SEQ ID NO: 154, SEQ ID NO:-156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 162, SEQ ID NO: 164,SEQ ID NO: 166, SEQ ID NO: 168, SEQ ID NO: 170, SEQ ID NO: 172, SEQID NO: 174, SEQ ID NO: 176, SEQ ID NO: 178, SEQ ID NO: 180, SEQ IDNO: 182, SEQ ID NO: 184, SEQ ID NO: 186, SEQ ID NO: 188, SEQ ID NO:-190, SEQ ID NO: 192, SEQ ID NO: 194, SEQ ID NO: 196, SEQ ID NO: 198,SEQ ID NO: 200, SEQ ID NO: 202, SEQ ID NO: 204, SEQ ID NO: 206, SEQID NO: 208, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 214, SEQ ID-NO: 216, SEQ ID NO: 218, SEO ID NO: 220, SEQ ID NO: 222, SEQ ID NO:-224, SEQ ID NO: 226, SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 232,SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 238, SEQ ID NO: 240, SEQID NO: 242, SEQ ID NO: 244, SEQ ID NO: 246, SEQ ID NO: 248, SEQ ID-NO: 250, SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 256, SEQ ID NO:-258, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 264, SEQ ID NO: 266,SEQ ID NO: 268, SEQ ID NO: 270, SEQ ID NO: 272, SEQ ID NO: 274, SEQID NO: 276, SEQ ID NO: 278, SEQ ID NO: 280, SEQ ID NO: 282, SEQ IDNO: 284, SEQ ID NO: 286, SEQ ID NO: 288, SEQ ID NO: 290, SEQ ID NO:-292, SEQ ID NO: 294, SEQ ID NO: 296, SEQ ID NO: 298, SEQ ID NO: 300,SEQ ID NO: 302, SEQ ID NO: 304, SEQ ID NO: 306, SEQ ID NO: 308, SEQ-ID NO: 310, SEQ ID NO: 312, SEQ ID NO: 314, SEQ ID NO: 316, SEQ IDNO: 318, SEQ ID NO: 320, SEQ ID NO: 322, SEQ ID NO: 324, SEQ ID NO:-326, SEQ ID NO: 328, SEQ ID NO: 330, SEQ ID NO: 332, SEQ ID NO: 334,-SEQ ID NO: 336, SEQ ID NO: 338, SEQ ID NO: 340, SEQ ID NO: 342, SEQID NO: 344, SEQ ID NO: 346, SEQ ID NO: 348, SEQ ID NO: 350, SEQ ID-NO: 352, SEQ ID NO: 354, SEQ ID NO: 356, SEQ ID NO: 358, SEQ ID NO:-360, SEQ ID NO: 362, SEQ ID NO: 364, SEQ ID NO: 366, SEQ ID NO: 368,SEQ ID NO: 370, SEQ ID NO: 372, SEQ ID NO: 374, SEQ ID NO: 376, SEQ-ID NO: 378, SEQID NO: 380, SEQ ID NO: 382, SEQ ID NO: 384, SEQ IDNO: 386, SEQ ID NO: 388, SEQ ID NO: 390, SEQ ID NO: 392, SEQ ID NO:-394, SEQ ID NO: 396, SEQ ID NO: 398, SEQ ID NO: 400, SEQ ID NO: 402,SEQ ID NO: 404, SEQ ID NO: 406, SEQ ID NO: 408, SEQ ID NO: 410, SEQID NO: 412, SEQ ID NO: 414, SEQ ID NO: 416, SEQ ID NO: 418, SEQ ID-NO: 420, SEQ ID NO: 422, SEQ ID NO: 424, SEQ ID NO: 426, SEQ ID NO:-428, SEQ ID NO: 430, SEQ ID NO: 432, SEQ ID NO: 434, SEQ ID NO: 436,SEQ ID NO: 438, SEQ ID NO: 440, SEQ ID NO: 442, SEQ ID NO: 444, SEQID NO: 446, SEQ ID NO: 448, SEQ ID NO: 450, SEQ ID NO: 452, SEQ IDNO: 454, SEQ ID NO: 456, SEQ ID NO: 458, SEQ ID NO: 460, SEQ ID NO:-462, SEQ ID NO: 464, SEQ ID NO: 466, SEQ ID NO: 468, SEQ ID NO: 470,SEQ ID NO: 472, SEQ ID NO: 474, SEQ ID NO: 476, SEQ ID NO: 478, SEQID NO: 480, SEQ ID NO: 482, SEO ID NO: 484, SEQ ID NO: 486, SEQ IDNO: 488, SEQ ID NO: 490, SEQ ID NO: 492, SEQ ID NO: 494, SEQ ID NO:-496, SEQ ID NO: 498, SEQ ID NO: 500, SEQ ID NO: 502, SEQ ID NO: 504,SEQ ID NO: 506, SEQ ID NO: 508, SEQ ID NO: 510, SEQ ID NO: 512, SEQID NO: 514, SEQ ID NO: 516, SEQ ID NO: 518, SEQ ID NO: 520, SEQ IDNO: 522, SEQ ID NO: 524, SEQ ID NO: 526, SEQ ID NO: 528, SEQ ID NO:-530, SEQ ID NO: 532, SEQ ID NO: 534, SEQ ID NO: 536, SEQ ID NO: 538,SEQ ID NO: 540, SEQ ID NO: 542, SEQ ID NO: 544, SEQ ID NO: 546, SEQID NO: 548, SEQ ID NO: 550, SEQ ID NO: 552, SEQ ID NO: 554, SEQ IDNO: 556, SEQ ID NO: 558, SEQ ID NO: 560, SEQ ID NO: 562, SEQ ID NO:I 564, SEQ ID NO: 566, SEQ ID NO: 568, SEQ ID NO: 570, SEQ ID NO: 572,SEQ ID NO: 574, SEQ ID NO: 576, SEQ ID NO: 578, SEQ ID NO: 580, SEQID NO: 582, SEQ ID NO: 584, SEQ ID NO: 586, SEQ ID NO: 588, SEQ IDNO: 590, SEQ ID NO: 592, SEQ ID NO: 594, SEQ ID NO: 596, SEQ ID NO:-598, SEQ ID NO: 600, SEQ ID NO: 602, SEQ ID NO: 604, SEQ ID NO: 606,SEQ ID NO: 608, SEQ ID NO: 610, SEQ ID NO: 612, SEQ ID NO: 614, SEQID NO: 616, SEQ ID NO: 618, SEQ ID NO: 620, SEQ ID NO: 622, SEQ IDNO: 624, SEQ ID NO: 626, SEQ ID NO: 628, SEQ ID NO: 630, SEQ ID NO:-632, SEQ ID NO: 634 e/ou SEQ ID NO: 636, ou fragmentos enzimaticamen-te ativos desses;(d) (i) o ácido nucléico (polinucleotídeo) de (a), (b) ou (c) e quecodifica um polipeptídeo que tem pelo menos uma substituição de aminoáci-do conservativa e que retém sua atividade de xilanase, mananase e/ou gli-canase; ou, (ii) o ácido nucléico de (d)(i), em que a pelo menos uma substitu-ição de aminoácido conservativa compreende substituir um aminoácido poroutro aminoácido de características semelhantes; ou, uma substituição con-servativa compreende: troca de um aminoácido alifático por outro aminoáci-do alifático; troca de uma Serina por uma Treonina ou vive-versa; troca deum resíduo ácido por outro resíduo ácido; troca de um resíduo que carregaum grupo amida por outro resíduo que carrega um grupo amida; troca de umresíduo básico por outro resíduo básico; ou substituição de um resíduo aro-mático por outro resíduo aromático;(e) o ácido nucléico (polinucleotídeo) de (a), (b), (c) ou (d) quecodifica um polipeptídeo que tem uma atividade de xilanase, mananase e/ouglicanase, mas que não tem uma seqüência de sinal, um domínio prepro, umdomínio doquerina, e/ou um módulo de ligação de carboidrato (CBM)1em que opcionalmente o módulo de ligação a carboidrato (CBM)compreende, ou consiste em, um módulo de ligação ao xilano, um módulode ligação à celulose, um módulo de ligação à lignina, um módulo de ligaçãoà xilose, um módulo de ligação à mananase, um módulo específico para xi-loglicano e/ou a um módulo de ligação à arabinofuranosidase;(f) o ácido nucléico (polinucleotídeo) de (a), (b), (c), (d) ou (e)que codifica um polipeptídeo que tem uma atividade de xilanase, mananasee/ou glicanase ainda compreendendo uma seqüência heteróloga.(g) o ácido nucléico (polinucleotídeo) de (f), em que seqüênciaheteróloga compreende, ou consiste em uma seqüência que codifica: (i) umaseqüência de sinal heteróloga, um módulo de ligação a carboidrato heterólo-go, um domínio de doquerina heterólogo, um domínio cataiítico heterólogo(CD), ou uma combinação desses ou uma combinação desses; (ii) a se-qüência de (ii), em que a seqüência de sinal heteróloga, o módulo de ligaçãoa carboidrato ou domínio catai ítico (CD) é derivado de uma enzima heterólo-ga; ou, (iii) um sinalizador, um epitopo, um peptídeo direcionador, uma se-qüência clivável, uma porção detectável ou uma enzima;(h) o ácido nucléico (polinucleotídeo) de (g), em que o módulode ligação a carboidrato (CBM) heterólogo compreende, ou consiste em ummódulo de ligação ao xilano, um módulo de ligação à celulose, um módulode ligação à lignina, um módulo de ligação à xilose, um módulo de ligação àmananase, um módulo específico de xiloglicano e/ou um módulo de ligaçãoà arabinofuranosidase;(i) o ácido nucléico (polinucleotídeo) de (g), em que a seqüênciade sinal heteróloga direciona a proteína codificada para um vacúolo, para oretículo endoplasmático, para um cloroplasto ou para um grânulo de amido;-ou(j) uma seqüência de ácido nucléico (polinucleotídeo) totalmente(completamente) complementar a (a), (b), (c), (d), (e), (f), (g), (h) ou (i).

2. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 1, em que a identidade de seqüência é de pelo menoscerca de 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%,-62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%,-75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%,-88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, ou- 100% (completa) de identidade de seqüência.

3. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 1, em que a identidade de seqüência é ao longo de umaregião de pelo menos cerca de 150, 175, 200, 225, 250, 275, 300, 350, 400,-450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100,-1150 ou mais resíduos, ou a extensão completa de um gene ou um transcrito.

4. Ácido nucléico isolado, sintético ou recombinante que codificaum polipeptídeo que tem uma atividade de xilanase, mananase e/ou glicana-se, em que o ácido nucléico tem pelo menos uma modificação de seqüênciada seqüência de SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO:-7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ IDNO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25,SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ IDNO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43,-SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ IDNO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61,SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ IDNO: 71, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79,SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID-NO: 89, SEQ ID NO: 91, SEQ ID NO: 93, SEQ ID NO: 95, SEQ ID NO: 97,SEQ ID NO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQID NO: 107, SEQ ID NO: 109, SEO ID NO: 111, SEQ ID NO: 113, SEQ IDNO: 115, SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO:-123, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131,SEQ ID NO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQID NO: 141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ IDNO: 149, SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO:-157, SEQ ID NO: 199, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165,SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ IDNO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO:-191, SEQ ID NO: 193, SEQ ID NO: 195, SEQ ID NO: 197, SEQ ID NO: 199,SEQ ID NO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQID NO: 209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ IDNO: 217, SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO:-225, SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233,SEQ ID NO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQID NO: 243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ IDNO: 251, SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO:-259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267,SEQ ID NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQID NO: 277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ IDNO: 285, SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO:-293, SEQ ID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301,SEQ ID NO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQID NO: 311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ IDNO: 319, SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO:-327, SEQ ID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335,SEQ ID NO: 337, SEQ ID NO: 339, SEQ ID NO: 341, SEQ ID NO: 343, SEQID NO: 345, SEQ ID NO: 347, SEQ ID NO: 349, SEQ ID NO: 351, SEQ IDNO: 353, SEQ ID NO: 355, SEQ ID NO: 357, SEQ ID NO: 359, SEQ ID NO:-361, SEQ ID NO: 363, SEQ ID NO: 365, SEQ ID NO: 367, SEQ ID NO: 369,SEQ ID NO: 371, SEQ ID NO: 373, SEQ ID NO: 375, SEQ ID NO: 377, SEQID NO: 379, SEQ ID NO: 381, SEQ ID NO: 383, SEQ ID NO: 385, SEQ IDNO: 387, SEQ ID NO: 389, SEQ ID NO: 391, SEQ ID NO: 393, SEQ ID NO:-395, SEQ ID NO: 397, SEQ ID NO: 399, SEQ ID NO: 401, SEQ ID NO: 403,SEQ ID NO: 405, SEQ ID NO: 407, SEQ ID NO: 409, SEQ ID NO: 411, SEQID NO: 413, SEQ ID NO: 415, SEQ ID NO: 417, SEQ ID NO: 419, SEQ IDNO: 421, SEQ ID NO: 423, SEQ ID NO: 425, SEQ ID NO: 427, SEQ ID NO:-429, SEQ ID NO: 431, SEQ ID NO: 433, SEQ ID NO: 435, SEQ ID NO: 437,SEQ ID NO: 439, SEQ ID NO: 441, SEQ ID NO: 443, SEQ ID NO: 445, SEQID NO: 447, SEQ ID NO: 449, SEQ ID NO: 451, SEQ ID NO: 453, SEQ IDNO: 455, SEQ ID NO: 457, SEQ ID NO: 459, SEQ ID NO: 461, SEQ ID NO:-463, SEQ ID NO: 465, SEQ ID NO: 467, SEQ ID NO: 469, SEQ ID NO: 471,SEQ ID NO: 473, SEQ ID NO: 475, SEQ ID NO: 477, SEQ ID NO: 479, SEQID NO: 481, SEQ ID NO: 483, SEQ ID NO: 485, SEQ ID NO: 487, SEQ IDNO: 489, SEQ ID NO: 491, SEQ ID NO: 493, SEQ ID NO: 495, SEQ ID NO:-497, SEQ ID NO: 499, SEQ ID NO: 501, SEQ ID NO: 503, SEQ ID NO: 505,SEQ ID NO: 507, SEQ ID NO: 509, SEQ ID NO: 511, SEQ ID NO: 513, SEQID NO: 515, SEQ ID NO: 517, SEQ ID NO: 519, SEQ ID NO: 521, SEQ IDNO: 523, SEQ ID NO: 525, SEQ ID NO: 527, SEQ ID NO: 529, SEQ ID NO:-531, SEQ ID NO: 533, SEQ ID NO: 535, SEQ ID NO: 537, SEQ ID NO: 539,SEQ ID NO: 541, SEQ ID NO: 543, SEQ ID NO: 545, SEQ ID NO: 547, SEQID NO: 549, SEQ ID NO: 551, SEQ ID NO: 553, SEQ ID NO: 555, SEQ IDNO: 557, SEQ ID NO: 559, SEQ ID NO: 561, SEQ ID NO: 563, SEQ ID NO:-565, SEQ ID NO: 567, SEQ ID NO: 569, SEQ ID NO: 571, SEQ ID NO: 573,SEQ ID NO: 575, SEQ ID NO: 577, SEQ ID NO: 579, SEQ ID NO: 581, SEQID NO: 583, SEQ ID NO: 585, SEQ ID NO: 587, SEQ ID NO: 589, SEQ IDNO: 591, SEQ ID NO: 593, SEQ ID NO: 595, SEQ ID NO: 597, SEQ ID NO:-599, SEQ ID NO: 601, SEQ ID NO: 603, SEQ ID NO: 605, SEQ ID NO: 607,SEQ ID NO: 609, SEQ ID NO: 611, SEQ ID NO: 613, SEQ ID NO: 615, SEQID NO: 617, SEQ ID NO: 619, SEQ ID NO: 621, SEQ ID NO: 623, SEQ IDNO: 625, SEQ ID NO: 627, SEQ ID NO: 629, SEQ ID NO: 631, SEQ ID NO:-633 e/ou SEQ ID NO: 635,em que a modificação de seqüência compreende pelo menosuma, duas, três, quatro, cinco, seis, sete, oito, nove, dez, onze, doze, treze,quatorze, quinze, dezesseis, dezessete, dezoito, dezenove ou todas as se-guintes alterações:os nucleotídeos que correspondem aos resíduos 10 a 12 deSEQ ID NO: 383 são alterados para CCT, TTA, TTG, CTC, CTA ou CTG,os nucleotídeos que correspondem aos resíduos 25 a 27 deSEQ ID NO: 383 são alterados para CCC, CCG, CCA ou CCT,os nucleotídeos que correspondem aos resíduos 28 a 30 deSEQ ID NO: 383 são alterados para TCA, TCC, TCT, TCG, AGT ou AGC,os nucleotídeos que correspondem aos resíduos 37 a 39 deSEQ ID NO: 383 são alterados para TTT ou TTC,os nucleotídeos que correspondem aos resíduos 37 a 39 deSEQ ID NO: 383 são alterados para TAC ou TAT,os nucleotídeos que correspondem aos resíduos 37 a 39 deSEQ ID NO: 383 são alterados para ATA, ATT ou ATC,os nucleotídeos que correspondem aos resíduos 37 a 39 deSEQ ID NO: 383 são alterados para TGG,os nucleotídeos que correspondem aos resíduos 40 a 42 deSEQ ID NO: 383 são alterados para CAC ou CAT,os nucleotídeos que correspondem aos resíduos 52 a 54 deSEQ ID NO: 383 são alterados para TTC ou TTT,os nucleotídeos que correspondem aos resíduos 73 a 75 deSEQ ID NO: 383 são alterados para GAG ou GAA,os nucleotídeos que correspondem aos resíduos 73 a 75 deSEQ ID NO: 383 são alterados para CCC, CCG, CCA ou CCT,os nucleotídeos que correspondem aos resíduos 88 a 90 deSEQ ID NO: 383 são alterados para GTG, GTC, GTA ou GTT,os nucleotídeos que correspondem aos resíduos 100 a 102 deSEQ ID NO: 383 são alterados para TGT ou TGC,os nucleotídeos que correspondem aos resíduos 100 a 102 deSEQ ID NO: 383 são alterados para CAT ou CAC,os nucleotídeos que correspondem aos resíduos 100 a 102 deSEQ ID NO: 383 são alterados para TTG1 TTA1 CTT, CTC, CTA ou CTG1os nucleotídeos que correspondem aos resíduos 103 a 105 deSEQ ID NO: 383 são alterados para GAG ou GAA,os nucleotídeos que correspondem aos resíduos 103 a 105 deSEQ ID NO: 383 são alterados para GAT ou GAC1os nucleotídeos que correspondem aos resíduos 211 a 213 deSEQ ID NO: 383 são alterados para ACA, ACT, ACC ou ACG1os nucleotídeos que correspondem aos resíduos 211 a 213 deSEQ ID NO: 383 são alterados para TGT ou TGC, ouos nucleotídeos que correspondem aos resíduos 508 a 582 deSEQ ID NO: 383 são alterados para CAT ou CAC.

5. Ácido nucléico isolado, sintético ou recombinante que codificaum polipeptídeo que tem uma atividade de xilanase, mananase e/ou glicana-se, em que o ácido nucléico tem pelo menos uma modificação de seqüênciade SEQ ID NO: 383, e a pelo menos uma modificação de SEQ ID NO: 383compreende uma alteração em:os nucleotídeos nos resíduos 10 a 12 são CCT, TTA, TTG, CTC,CTA ou CTG,os nucleotídeos nos resíduos 25 a 27 são CCC, CCG, CCA ouCCT,os nucleotídeos nos resíduos 28 a 30 são TCA, TCC, TCT,TCG, AGT ou AGC,os nucleotídeos nos resíduos 37 a 39 são TTT ou TTC,os nucleotídeos nos resíduos 37 a 39 são TAC ou TAT,os nucleotídeos nos resíduos 37 a 39 são ATA, ATT ou ATC,os nucleotídeos nos resíduos 37 a 39 são TGG,os nucleotídeos nos resíduos 40 a 42 são CAC ou CAT,os nucleotídeos nos resíduos 52 a 54 são TTC ou TTT,os nucleotídeos nos resíduos 73 a 75 são GAG ou GAA,os nucleotídeos nos resíduos 73 a 75 são CCC, CCG1 CCA ouCCT,os nucleotídeos nos resíduos 88 a 90 são GTG, GTC, GTA ouGTT1os nucleotídeos nos resíduos 10O a 102 são TGT ou TGC,os nucleotídeos nos resíduos 100 a 102 são CAT ou CAC1os nucleotídeos nos resíduos 100 a 102 são TTG, TTA, CTT,CTC, CTA ou CTG,os nucleotídeos nos resíduos 103 a 105 são GAG ou GAA,os nucleotídeos nos resíduos 103 a 105 são GAT ou GAC,os nucleotídeos nos resíduos 211 a 213 são ACA, ACT, ACC ouACG,os nucleotídeos nos resíduos 211 a 213 são TGT ou TGC, ouos nucleotídeos nos resíduos 508 a 582 são CAT ou CAC.

6. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 5, em que a modificação de seqüência compreende pelomenos duas, três, quatro, cinco, seis, sete, oito, nove, dez, onze, doze, tre-ze, quatorze, quinze, dezesseis, dezessete, dezoito, dezenove ou todas asalterações.

7. Ácido nucléico isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 1 a 6, em que(a) a atividade de xilanase compreende catalisar a hidrólise deligações β-1,4-xilosídicas internas; compreende uma atividade de endo-1,4-beta-xilanase; compreende hidrolisar um xilano ou arabinoxilano para produ-zir uma xilose e xilo-oligômero de peso molecular menor; compreende hidro-lisar um polissacarídeo que compreende uma D-xilopiranose 1,4-p-glicosí-deo-ligada; compreende hidrolisar uma celulose ou hemicelulose; compre-ende hidrolisar uma celulose ou hemicelulose em uma madeira, produto demadeira, polpa de papel, produto de papel, ou resíduo de papel; compreen-de catalisar a hidrólise de um xilano ou um arabinoxilano em uma ração ouproduto alimentício; ou compreende catalisar a hidrólise de um xilano ou a-rabinoxilano em uma célula microbiana ou uma célula de planta;(b) a atividade de glicanase compreende uma atividade de en-doglicanase, por exemplo, atividade de endo-1,4- e/ou 1,3-beta-D-glican 4-glicano hidrolase; catalisar a hidrólise de ligações 1,4-beta-D-glicosídicas;uma atividade de endo-1,4- e/ou 1,3-beta-endoglicanase ou atividade de en-do-β-1,4-glicanase; uma atividade de endo-1,4-beta-D-glican 4-glicano hidro-lase; catalisar a hidrólise de ligações 1,4-beta-D-glicosídicas em celulose,derivados de celulose, carbóxi metil celulose e/ou hidróxi etil celulose, Iiga-ções beta-1,4 de Iiquenina em beta-1,3 glicanos mistos, beta-D-glicanos deI cereais e/ou outro material de planta contendo partes celulósicas; hidrolisarum glicano, um beta-glicano ou um polissacarídeo para produzir um polissa-carídeo ou oligômero de peso molecular menor, ou,(c) a atividade de mananase compreende uma atividade de en-do-1,4-beta-D-mananase, ou catalisar a hidrólise de beta-1,4-manana ouuma beta-1,4-manana linear não substituída.

8. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 7, em que o xilano ou arabinoxilano compreende umarabinoxilano solúvel em água, e opcionalmente o xilano ou arabinoxilanosolúvel em água compreende uma massa de farinha ou um produto de pão.

9. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 7, em que a ração ou produto alimentício compreendeuma ração animal a base de cereal, um mosto ou uma cerveja, um leite ouum produto de leite, uma fruta ou um vegetal.

10. Ácido nucléico isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 1 a 9, em que (a) a atividade de xila-nase, mananase e/ou glicanase é termoestável; ou (b) o polipeptídeo retémuma atividade de xilanase, mananase e/ou glicanase sob condições quecompreendem uma faixa de temperatura entre cerca de 37°C até cerca de-95°C, ou entre cerca de 55°C até cerca de 85°C, ou entre cerca de 70°C atécerca de 75°C, ou entre cerca de 70°C até cerca de 95°C, entre cerca de-90°C até cerca de 95°C, entre cerca de 95°C até cerca de 105°C, ou entrecerca de 95°C até cerca de 1100C1 ou pelo menos cerca de 80°C, 810C,-82°C, 83°C, 84°C, 85°C, 86°C, 87°C, 88°C, 89°C ou 90°C.

11. Ácido nucléico isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 1 a 9, em que (a) a atividade de xila-nase, mananase e/ou glicanase é termotolerante; ou (b) o polipeptídeo retémuma atividade de xilanase, mananase e/ou glicanase após exposição a umatemperatura na faixa de mais do que 37°C até cerca de 95°C, ou entre cercade 55°C até cerca de 85°C, ou entre cerca de 70°C até cerca de 75°C, ouentre cerca de 70°C até cerca de 95°C, entre cerca de 90°C até cerca de-95°C, entre cerca de 95°C até cerca de 105°C, ou entre cerca de 95°C atécerca de 1100C1 ou pelo menos cerca de 80°C, 81 °C, 82°C, 83°C, 84°C,-85°C, 86°C, 87°C, 88°C, 89°C ou 90°C.

12. Ácido nucléico isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 1 a 9, em que a atividade de xilanase,mananase e/ou glicanase retém atividade sob condições ácidas específicasque compreendem cerca de pH 6,5, pH 6, pH 5,5, pH 5, pH 4,5 ou pH 4 oumenos (mais ácido), ou, retém uma atividade de xilanase, mananase e/ouglicanase após exposição a condições acidas que compreendem cerca depH 6,5, pH 6, pH 5,5, pH 5, pH 4,5 ou pH 4 ou menos (mais ácido).

13. Ácido nucléico isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 1 a 9, em que a atividade de xilanase,mananase e/ou glicanase retém atividade sob condições básicas que com-preendem cerca de pH 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH-10,5, pH 11, pH 11,5, pH 12, pH 12,5 ou mais (mais básico) ou, retém ativi-dade de xilanase, mananase e/ou glicanase após exposição a condiçõesbásicas que compreendem cerca de pH 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH-9,5, pH 10, pH 10,5, pH 11, pH 11,5, pH 12, pH 12,5 ou mais (mais básico).

14. Ácido nucléico isolado, sintético ou recombinante de acordocom a reivindicação 13, em que a xilanase, mananase e/ou glicanase retématividade em uma temperatura de pelo menos cerca de 80°C, 81 °C, 82°C,-83°C, 84°C, 85°C, 86°C, 87°C, 88°C, 89°C ou 90°C, e um pH básico de pelomenos cerca de pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11,pH 11,5, pH 12, pH 12,5 ou mais (mais básico).

15. Sonda de ácido nucléico para identificar um ácido nucléicoque codifica um polipeptídeo com uma atividade de xilanase, mananase e/ouglicanase, em que a sonda compreende pelo menos cerca de 10, 15, 20, 25,-30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 100, 125, 150, 175, 200, 225 ou maisbases consecutivas de(a) um ácido nucléico que compreende uma seqüência descritaem SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ IDNO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17,SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ IDNO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35,SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ IDNO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53,SEQ ID NO: 55, SEQ !D NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ IDNO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 71,SEQ ID NO: 73, SEC !D NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ IDNO: 81, SEQ ID NO: 83, SEQ ID NO: 85, SEQ ID NO: 87, SEQ ID NO: 89,SEQ ID NO: 91, SEQ iD NO: 93, SEQ ID NO: 95, SEQ ID NO: 97, SEQ IDNO: 99, SEQ ID NO: 101, SEQ ID NO: 103, SEQ ID NO: 105, SEQ ID NO:-107, SEQ ID NO: 109, SEQ ID NO: 111, SEQ ID NO: 113, SEQ ID NO: 115,SEQ ID NO: 117, SEQ ID NO: 119, SEQ ID NO: 121, SEQ ID NO: 123, SEQID NO: 125, SEQ ID NO: 127, SEQ ID NO: 129, SEQ ID NO: 131, SEQ IDNO: 133, SEQ ID NO: 135, SEQ ID NO: 137, SEQ ID NO: 139, SEQ ID NO:-141, SEQ ID NO: 143, SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149,SEQ ID NO: 151, SEQ ID NO: 153, SEQ ID NO: 155, SEQ ID NO: 157, SEQID NO: 199, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ IDNO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO:-175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183,SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQID NO: 193, SEQ ID NO: 195, SEO ID NO: 197, SEQ ID NO: 199, SEQ IDNO: 201, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 207, SEQ ID NO:-209, SEQ ID NO: 211, SEQ ID NO: 213, SEQ ID NO: 215, SEQ ID NO: 217,SEQ ID NO: 219, SEQ ID NO: 221, SEQ ID NO: 223, SEQ ID NO: 225, SEQ-ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 231, SEQ ID NO: 233, SEQ IDNO: 235, SEQ ID NO: 237, SEQ ID NO: 239, SEQ ID NO: 241, SEQ ID NO:-243, SEQ ID NO: 245, SEQ ID NO: 247, SEQ ID NO: 249, SEQ ID NO: 251,SEQ ID NO: 253, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 259, SEQID NO: 261, SEQ ID NO: 263, SEQ ID NO: 265, SEQ ID NO: 267, SEQ ID-NO: 269, SEQ ID NO: 271, SEQ ID NO: 273, SEQ ID NO: 275, SEQ ID NO:-277, SEQ ID NO: 279, SEQ ID NO: 281, SEQ ID NO: 283, SEQ ID NO: 285,SEQ ID NO: 287, SEQ ID NO: 289, SEQ ID NO: 291, SEQ ID NO: 293, SEQID NO: 295, SEQ ID NO: 297, SEQ ID NO: 299, SEQ ID NO: 301, SEQ IDNO: 303, SEQ ID NO: 305, SEQ ID NO: 307, SEQ ID NO: 309, SEQ ID NO:-311, SEQ ID NO: 313, SEQ ID NO: 315, SEQ ID NO: 317, SEQ ID NO: 319,SEQ ID NO: 321, SEQ ID NO: 323, SEQ ID NO: 325, SEQ ID NO: 327, SEQID NO: 329, SEQ ID NO: 331, SEQ ID NO: 333, SEQ ID NO: 335, SEQ IDNO: 337, SEQ ID NO: 339, SEQ ID NO: 341, SEQ ID NO: 343, SEQ ID NO:-345, SEQ ID NO: 347, SEQ ID NO: 349, SEQ ID NO: 351, SEQ ID NO: 353,-SEQ ID NO: 355, SEQ ID NO: 357, SEQ ID NO: 359, SEQ ID NO: 361, SEQID NO: 363, SEQ ID NO: 365, SEQ ID NO: 367, SEQ ID NO: 369, SEQ IDNO: 371, SEQ ID NO: 373, SEQ ID NO: 375, SEQ ID NO: 377, SEQ ID NO:-379, SEQ ID NO: 381, SEQ ID NO: 383, SEQ ID NO: 385, SEQ ID NO: 387,SEQ ID NO: 389, SEQ ID NO: 391, SEQ ID NO: 393, SEQ ID NO: 395, SEQ-ID NO: 397, SEQ ID NO: 399, SEQ ID NO: 401, SEQ ID NO: 403, SEQ IDNO: 405, SEQ ID NO: 407, SEQ ID NO: 409, SEQ ID NO: 411, SEQ ID NO:-413, SEQ ID NO: 415, SEQ ID NO: 417, SEQ ID NO: 419, SEQ ID NO: 421,SEQ ID NO: 423, SEQ ID NO: 425, SEQ ID NO: 427, SEQ ID NO: 429, SEQID NO: 431, SEQ ID NO: 433, SEQ ID NO: 435, SEQ ID NO: 437, SEQ ID-NO: 439, SEQ ID NO: 441, SEQ ID NO: 443, SEQ ID NO: 445, SEQ ID NO:-447, SEQ ID NO: 449, SEQ ID NO: 451, SEQ ID NO: 453, SEQ ID NO: 455,SEQ ID NO: 457, SEQ ID NO: 459, SEQ ID NO: 461, SEQ ID NO: 463, SEQID NO: 465, SEQ ID NO: 467, SEQ ID NO: 469, SEQ ID NO: 471, SEQ IDNO: 473, SEQ ID NO: 475, SEQ ID NO: 477, SEQ ID NO: 479, SEQ ID NO:-481, SEQ ID NO: 483, SEQ ID NO: 485, SEQ ID NO: 487, SEQ ID NO: 489,-SEQ ID NO: 491, SEQ ID NO: 493, SEQ ID NO: 495, SEQ ID NO: 497, SEQID NO: 499, SEQ ID NO: 501, SEQ ID NO: 503, SEQ ID NO: 505, SEQ IDNO: 507, SEQ ID NO: 509, SEQ ID NO: 511, SEQ ID NO: 513, SEQ ID NO:-515, SEQ ID NO: 517, SEQ ID NO: 519, SEQ ID NO: 521, SEQ ID NO: 523,SEQ ID NO: 525, SEQ ID NO: 527, SEQ ID NO: 529, SEQ ID NO: 531, SEQ-ID NO: 533, SEQ ID NO: 535, SEQ ID NO: 537, SEQ ID NO: 539, SEQ ID-NO: 541, SEQ ID NO: 543, SEQ ID NO: 545, SEQ ID NO: 547, SEQ ID NO:-549, SEQ ID NO: 551, SEQ ID NO: 553, SEQ ID NO: 555, SEQ ID NO: 557,SEQ ID NO: 559, SEQ ID NO: 561, SEQ ID NO: 563, SEQ ID NO: 565, SEQID NO: 567, SEQ ID NO: 569, SEQ ID NO: 571, SEQ ID NO: 573, SEQ ID-NO: 575, SEQ ID NO: 577, SEQ ID NO: 579, SEQ ID NO: 581, SEQ ID NO:-583, SEQ ID NO: 585, SEQ ID NO: 587, SEQ ID NO: 589, SEQ ID NO: 591,SEQ ID NO: 593, SEQ ID NO: 595, SEQ ID NO: 597, SEQ ID NO: 599, SEQID NO: 601, SEQ ID NO: 603, SEQ ID NO: 605, SEQ ID NO: 607, SEQ IDNO: 609, SEQ ID NO: 611, SEQ ID NO: 613, SEQ ID NO: 615, SEQ ID NO:-617, SEQ ID NO: 619, SEQ ID NO: 621, SEQ ID NO: 623, SEQ ID NO: 625,SEQ ID NO: 627, SEQ ID NO: 629, SEQ ID NO: 631, SEQ ID NO: 633 e/ou-SEQ ID NO: 635;(b) um ácido nucléico que compreende uma seqüência descritade acordo com qualquer uma das reivindicações 1 a 14; ou(c) a sonda de (a) ou (b), em que a sonda compreende um oli-gonucleotídeo que compreende pelo menos cerca de 10 a 50, cerca de 20 a-60, cerca de 30 a 70, cerca de 40 a 80, cerca de 60 a 100, ou cerca de 50 a-150 ou mais bases consecutivas.

16. Par de iniciadores de amplificação para amplificar um ácidonucléico que codifica um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase, em que (a) o par de iniciadores é capaz de ampli-ficar um ácido nucléico que compreende uma seqüência descrita de acordocom qualquer uma das reivindicações 1 a 14, ou uma subseqüência dessas;ou (b) o par de iniciadores de (a), em que um membro do par de seqüênciasde iniciadores de amplificação compreendem um oligonucleotídeo que com-preende pelo menos cerca de 10 a 50 bases consecutivas da seqüência, oucerca de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27,-28, 29, 30, 31, 32, 33, 34, 35 ou mais bases consecutivas da seqüência.

17. Par de iniciadores de amplificação, em que o par de iniciado-res compreende um primeiro membro que tem uma seqüência descrita porcerca dos primeiros (a 5') 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22,-23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 ou mais resíduos de umaseqüência descrita de acordo com qualquer uma das reivindicações 1 a 14,e um segundo membro que tem uma seqüência descrita por cerca dos pri-meiros (a 5') 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26,-27, 28, 29, 30, 31, 32, 33, 34, 35 ou mais resíduos da fita complementar doprimeiro membro.

18. Ácido nucléico que codifica uma xilanase e/ou uma glicana-se gerado pela amplificação de um polinucleotídeo usando um par de inicia-dores de amplificação descrito na reivindicação 16 ou na reivindicação 17,em que opcionalmente a amplificação é por reação em cadeia da polimerase(PCR).-

19. Ácido nucléico que codifica uma xilanase e/ou uma glicana-se de acordo com a reivindicação 18, em que o ácido nucléico é gerado poramplificação de uma biblioteca de genes, em que opcionalmente a bibliotecagenômica é uma biblioteca ambiental.

20. Xilanase isolada, sintética ou recombinante codificada porum ácido nucléico que codifica uma xilanase e/ou uma glicanase descrito nareivindicação 18.

21. Método de amplificar um ácido nucléico que codifica um po-lipeptídeo que tem uma atividade de xilanase, mananase e/ou glicanase quecompreende a amplificação de um ácido nucléico molde com um par de se-qüências de iniciadores de amplificação capaz de amplificar uma seqüênciade ácido nucléico descrita de acordo com qualquer uma das reivindicações 1a 14, ou uma subseqüência dessas.

22. Cassete de expressão, um vetor ou um veículo de clonagemque compreende um ácido nucléico que compreende uma seqüência descri-ta de acordo com qualquer uma das reivindicações 1 a 14, em que opcio-nalmente o veículo de clonagem compreende um vetor viral, um plasmídeo,um fago, um fagomídeo, um cosmídeo, um fosmídeo, um bacteriófago, ouum cromossomo artificial.

23. Veículo de clonagem de acordo com a reivindicação 22, emI que o vetor viral compreende um vetor de adenovírus, um vetor retroviral ouum vetor viral adeno-associado, ou, o cromossomo artificial compreende umcromossomo artificial bacteriano (BAC), um vetor derivado de bacteriófagoP1 (PAC), um cromossomo artificial de levedura (YAC), ou um cromossomoartificial de mamífero (MAC).

24. Célula transformada que compreende um ácido nucléico quetem uma seqüência descrita como definido em qualquer uma das reivindica-ções 1 a 14, ou que compreende um cassete de expressão, um vetor ou umveículo de clonagem descrito como definido na reivindicação 22, em queopcionalmente a célula é uma célula bacteriana, uma célula de mamífero,uma célula fúngica, uma célula de levedura, uma célula de inseto ou umacélula de planta.

25. Animal transgênico não-humano que compreende um ácidonucléico que tem uma seqüência descrita como definido em qualquer umadas reivindicações 1 a 14, ou que compreende um cassete de expressão,um vetor, ou um veículo de clonagem descrito como definido na reivindica-ção 22, ou uma célula transformada descrita como definida na reivindicação-24, em que opcionalmente o animal é um camundongo, um rato, um coelho,uma ovelha, um porco, uma galinha, uma cabra, um peixe ou uma vaca.

26. Planta, parte de planta ou semente de planta transgênicaque compreende um ácido nucléico que tem uma seqüência descrita comodefinido em qualquer uma das reivindicações 1 a 14, em que opcionalmentea planta é uma planta de milho, uma planta de sorgo, uma planta de batata,uma planta de tomate, uma planta de trigo, uma planta de semente olagino-sa, uma planta de colza, uma planta de soja, uma planta de arroz, uma plan-ta de cevada, uma grama, uma planta de algodão, uma planta de sementede algodão, uma palmeira, uma planta de gergelim, uma planta de amendo-im, uma planta de girassol, ou uma planta de tabaco.

27. Oligonucleotídeo anti-senso que compreende uma seqüên-cia de ácido nucléico complementar a ou capaz de hibridizar sob condiçõesestringentes a uma seqüência descrita como definido em qualquer uma dasreivindicações 1 a 14, ou uma subseqüência dessas, em que opcionalmenteo oligonucleotídeo anti-senso tem cerca de 10 a 50, cerca de 20 a 60, cercade 30 a 70, cerca de 40 a 80, ou cerca de 60 a 100 bases de extensão,e opcionalmente as condições estringentes compreendem umaetapa de lavagem que compreende uma lavagem em SSC 0,2X em umatemperatura de cerca de 65°C por cerca de 15 minutos.

28. Molécula de RNA inibidor (RNAi) de fita dupla que compre-ende uma subseqüência da seqüência descrita como definido em qualqueruma das reivindicações 1 a 14, em que opcionalmente o RNAi tem cerca de-10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29,ou 30 ou mais nucleotídeos de dúplex de extensão.

29. Método de inibir a tradução de uma mensagem de xilanase,mananase e/ou glicanase em uma célula, ou inibir a expressão de uma xila-nase em uma célula, que compreende administrar à célula ou expressar nacélula um oligonucleotídeo anti-senso descrito como definido na reivindica-ção 27 ou uma molécula de RNA inibidor (RNAi) de fita dupla descrita comodefinida na reivindicação 28.

30. Polipeptídeo ou peptídeo isolado, sintético ou recombinanteque tem uma atividade de xilanase, mananase e/ou glicanase(a) que compreende uma seqüência de aminoácido que tem pe-lo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%,-60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%,-73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%,-86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%,-99%, ou mais, tem 100% (completa) de identidade de seqüência com SEQID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10,SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ IDNO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28,SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ IDNO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46,SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ IDNO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64,SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72, SEQ IDNO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ ID NO: 82,SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ IDNO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ ID NO: 100,SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO: 108, SEQID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116, SEQ IDNO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQ ID NO:-126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132; SEQ ID NO: 134;SEQ ID NO: 136; SEQ ID NO: 138; SEQ ID NO: 140; SEQ ID NO: 142; SEQID NO: 144; NO:146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 152,SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168, SEQ IDNO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO:-178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ ID NO: 186,SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO: 194, SEQID NO: 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202, SEQ IDNO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQ ID NO:-212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ ID NO: 220,SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO: 228, SEQID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236, SEQ IDNO: 238, SEQ ID NO: 240, SEO ID NO: 242, SEQ ID NO: 244, SEQ ID NO:- 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ ID NO: 254,SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO: 262, SEQID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270, SEQ IDNO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQ ID NO:- 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ ID NO: 288,SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO: 296, SEQID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304, SEQ IDNO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQ ID NO:- 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ ID NO: 322,SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO: 330, SEQID NO: 332, SEQ ID NO: 334, SEQ ID NO: 336, SEQ ID NO: 338, SEQ IDNO: 340, SEQ ID NO: 342, SEQ ID NO: 344, SEQ ID NO: 346, SEQ ID NO:- 348, SEQ ID NO: 350, SEQ ID NO: 352, SEQ ID NO: 354, SEQ ID NO: 356,SEQ ID NO: 358, SEQ ID NO: 360, SEQ ID NO: 362, SEQ ID NO: 364, SEQID NO: 366, SEQ ID NO: 368, SEQ ID NO: 370, SEQ ID NO: 372, SEQ IDNO: 374, SEQ ID NO: 376, SEQ ID NO: 378, SEQ ID NO: 380, SEQ ID NO:- 382, SEQ ID NO: 384, SEQ ID NO: 386, SEQ ID NO: 388, SEQ ID NO: 390,SEQ ID NO: 392, SEQ ID NO: 394, SEQ ID NO: 396, SEQ ID NO: 398, SEQID NO: 400, SEQ ID NO: 402, SEQ ID NO: 404, SEQ ID NO: 406, SEQ IDNO: 408, SEQ ID NO: 410, SEQ ID NO: 412, SEQ ID NO: 414, SEQ ID NO:- 416, SEQ ID NO: 418, SEQ ID NO: 420, SEQ ID NO: 422, SEQ ID NO: 424,SEQ ID NO: 426, SEQ ID NO: 428, SEQ ID NO: 430, SEQ ID NO: 432, SEQID NO: 434, SEQ ID NO: 436, SEQ ID NO: 438, SEQ ID NO: 440, SEQ IDNO: 442, SEQ ID NO: 444, SEQ ID NO: 446, SEQ ID NO: 448, SEQ ID NO:- 450, SEQ ID NO: 452, SEQ ID NO: 454, SEQ ID NO: 456, SEQ ID NO: 458,SEQ ID NO: 460, SEQ ID NO: 462, SEQ ID NO: 464, SEQ ID NO: 466, SEQID NO: 468, SEQ ID NO: 470, SEQ ID NO: 472, SEQ ID NO: 474, SEQ IDNO: 476, SEQ ID NO: 478, SEQ ID NO: 480, SEQ ID NO: 482, SEQ ID NO:- 484, SEQ ID NO: 486, SEQ ID NO: 488, SEQ ID NO: 490, SEQ ID NO: 492,SEQ ID NO: 494, SEQ ID NO: 496, SEQ ID NO: 498, SEQ ID NO: 500, SEQID NO: 502, SEQ ID NO: 504, SEQ ID NO: 506, SEQ ID NO: 508, SEQ IDNO: 510, SEQ ID NO: 512, SEQ ID NO: 514, SEQ ID NO; 516, SEQ ID NO:-518, SEQ ID NO: 520, SEQ ID NO: 522, SEQ ID NO: 524, SEQ ID NO: 526,-ID NO: 536, SEQ ID NO: 538, SEQ ID NO: 540, SEQ ID NO: 542, SEQ IDNO: 544, SEQ ID NO: 546, SEQ ID NO: 548, SEQ ID NO: 550, SEQ ID NO:-552, SEQ ID NO: 554, SEQ ID NO: 556, SEQ ID NO: 558, SEQ ID NO: 560,SEQ ID NO: 562, SEQ ID NO: 564, SEQ ID NO: 566, SEQ ID NO: 568, SEQID NO: 570, SEQ ID NO: 572, SEQ ID NO: 574, SEQ ID NO: 576, SEQ ID-NO: 578, SEQ ID NO: 580, SEQ ID NO: 582, SEQ ID NO: 584, SEQ ID NO:-586, SEQ ID NO: 588, SEQ ID NO: 590, SEQ ID NO: 592, SEQ ID NO: 594,SEQ ID NO: 596, SEQ ID NO: 598, SEQ ID NO: 600, SEQ ID NO: 602, SEQID NO: 604, SEQ ID NO: 606, SEQ ID NO: 608, SEQ ID NO: 610, SEQ IDNO: 612, SEQ ID NO: 614, SEQ ID NO: 616, SEQ ID NO: 618, SEQ ID NO:-620, SEQ ID NO: 622, SEQ ID NO: 624, SEQ ID NO: 626, SEQ ID NO: 628,SEQ ID NO: 630, SEQ ID NO: 632, SEQ ID NO: 634 e/ou SEQ ID NO: 636,ao longo de uma região de pelo menos cerca de 20, 25, 30, 35, 40, 45, 50,-55, 60, 75, 100, 150, 200, 250, 300 ou mais resíduos, ou ao longo da exten-são completa do polipeptídeo ou enzima, e/ou subseqüências (fragmentos)-enzimaticamente ativas dessas,em que opcionalmente as identidades de seqüência são deter-minadas por análise com um algoritmo de comparação de seqüência ou porinspeção visual, e opcionalmente o algoritmo de comparação de seqüência éum algoritmo BLAST versão 2.2.2 onde um ajuste de filtro é ajustado para-blastall -p blastp -d "nr pataa" -F F1 e todas as outras opções são ajustadascomo o padrão;(b) uma seqüência de aminoácido codificada pelo ácido nucléicocomo definido na reivindicação 1, em que o polipeptídeo tem (i) uma ativida-de de xilanase, mananase e/ou glicanase, ou, (ii) tem uma atividade imuno--gênica que é capaz de gerar um anticorpo que se liga especificamente a umpolipeptídeo que tem uma seqüência de (a), e/ou subseqüências (fragmen-tos) enzimaticamente ativas disso;(c) a seqüência de aminoácido de (a) ou (b), e que compreendepelo menos uma substituição de resíduo de aminoácido conservativa, e opolipeptídeo retém uma atividade de xilanase, a mananase e/ou a glicanase;(d) a seqüência de aminoácido de (c), em que a substituiçãoconservativa compreende a troca de um aminoácido alifático por outro ami-noácido alifático; troca de uma serina por uma treonina ou vice-versa; trocade um resíduo ácido por outro resíduo ácido, troca de um resíduo que carre-ga um grupo amida por outro resíduo que carrega um grupo amida; troca deum resíduo básico por outro resíduo básico, ou, troca de um resíduo aromá-tico por outro resíduo aromático, ou uma combinação desses,e opcionalmente o resíduo alifático compreende Alanina, Valina,Leucina, Isoleucina ou um equivalente sintético desses; o resíduo ácidocompreende ácido Aspártico, ácido Glutâmico ou um equivalente sintéticodesses; o resíduo que compreende um grupo amida compreende ácido As-pártico, ácido Glutâmico ou um equivalente sintético desses; o resíduo bási-co compreende Lisina, Arginina ou um equivalente sintético desses; ou, oresíduo aromático compreende Fenilalanina, Tirosina ou um equivalente sin-tético desses;(e) o polipeptídeo de (a), (b), (c) ou (d) que tem uma atividadede xilanase, mananase e/ou glicanase, mas que não tem uma seqüência desinal, um domínio prepro, um domínio de doquerina, e/ou um módulo de li-gação a carboidrato (CBM),em que opcionalmente o módulo de ligação a carboidrato (CBM)compreende, ou consiste em, um módulo de ligação ao xilano, um módulode ligação à celulose, um módulo de ligação à lignina, um módulo de ligaçãoà xilose, um módulo de ligação à mananase, um módulo específico de xilo-glicano e/ou a um módulo de ligação à arabinofuranosidase;(f) o polipeptídeo de (a), (b), (c), (d) ou (e) que tem uma ativida-de de xilanase, mananase e/ou glicanase ainda compreendendo uma se-qüência heteróloga;(g) o polipeptídeo de (f), em que a seqüência heteróloga com-preende, ou consiste em: (i) uma seqüência de sinal heteróloga, um módulode ligação a carboidrato heterólogo, um domínio de doquerina heterólogo,um domínio catalítico heterólogo (CD), ou uma combinação desses; (ii) aseqüência de (ii), em que a seqüência de sinal heteróloga, módulo de liga-ção a carboidrato ou domínio catalítico (CD) são derivados de uma enzimalignocelulósica heteróloga; e/ou, (iii) um sinalizador, um epitopo, um peptídeodirecionador, uma seqüência clivável, uma porção detectável, ou uma enzi-ma;(h) o polipeptídeo de (g), em que o módulo de ligação a carboi-drato (CBM) heterólogo compreende ou consiste em, um módulo de ligaçãoao xilano, um módulo de ligação à celulose, um módulo de ligação à lignina,um módulo de ligação à xilose, um módulo de ligação à manana, um móduloespecífico de xiloglicano e/ou um módulo de ligação à arabinofuranosidase;(i) polipeptídeo de (g), em que a seqüência de sinal heterólogadireciona a proteína codificada para um vacúolo, para o retículo endospla-mático, para um cloroplasto, ou um grânulo de amido; ou(j) compreende uma seqüência de aminoácido codificada por umácido nucléico descrito em qualquer uma das reivindicações 1 a 14.

31. Polipeptídeo isolado, sintético ou recombinante que tem umaatividade de xilanase, mananase e/ou glicanase, em que o polipeptídeo temuma seqüência que compreende uma modificação de seqüência da seqüên-cia de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ IDNO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18,SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ IDNO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36,SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ IDNO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54,SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ IDNO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 72,SEQ ID NO: 74, SEQ ID NO: 76, SEQ ID NO: 78, SEQ ID NO: 80, SEQ IDNO: 82, SEQ ID NO: 84, SEO ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90,SEQ ID NO: 92, SEQ ID NO: 94, SEQ ID NO: 96, SEQ ID NO: 98, SEQ IDNO: 100, SEQ ID NO: 102, SEQ ID NO: 104, SEQ ID NO: 106, SEQ ID NO:- 108, SEQ ID NO: 110, SEQ ID NO: 112, SEQ ID NO: 114, SEQ ID NO: 116,SEQ ID NO: 118, SEQ ID NO: 120, SEQ ID NO: 122, SEQ ID NO: 124, SEQID NO: 126, SEQ ID NO: 128, SEQ ID NO: 130, SEQ ID NO: 132; SEQ IDNO: 134; SEQ ID NO: 136; SEQ ID NO: 138; SEQ ID NO: 140; SEQ ID NO:- 142; SEQ ID NO: 144; NO:146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ IDNO: 152, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO:- 160, SEQ ID NO: 162, SEQ ID NO: 164, SEQ ID NO: 166, SEQ ID NO: 168,SEQ ID NO: 170, SEQ ID NO: 172, SEQ ID NO: 174, SEQ ID NO: 176, SEQID NO: 178, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 184, SEQ IDNO: 186, SEQ ID NO: 188, SEQ ID NO: 190, SEQ ID NO: 192, SEQ ID NO:- 194, SEQ ID NO: 196, SEQ ID NO: 198, SEQ ID NO: 200, SEQ ID NO: 202,SEQ ID NO: 204, SEQ ID NO: 206, SEQ ID NO: 208, SEQ ID NO: 210, SEQID NO: 212, SEQ ID NO: 214, SEQ ID NO: 216, SEQ ID NO: 218, SEQ IDNO: 220, SEQ ID NO: 222, SEQ ID NO: 224, SEQ ID NO: 226, SEQ ID NO:- 228, SEQ ID NO: 230, SEQ ID NO: 232, SEQ ID NO: 234, SEQ ID NO: 236,SEQ ID NO: 238, SEQ ID NO: 240, SEQ ID NO: 242, SEQ ID NO: 244, SEQID NO: 246, SEQ ID NO: 248, SEQ ID NO: 250, SEQ ID NO: 252, SEQ IDNO: 254, SEQ ID NO: 256, SEQ ID NO: 258, SEQ ID NO: 260, SEQ ID NO:- 262, SEQ ID NO: 264, SEQ ID NO: 266, SEQ ID NO: 268, SEQ ID NO: 270,SEQ ID NO: 272, SEQ ID NO: 274, SEQ ID NO: 276, SEQ ID NO: 278, SEQID NO: 280, SEQ ID NO: 282, SEQ ID NO: 284, SEQ ID NO: 286, SEQ IDNO: 288, SEQ ID NO: 290, SEQ ID NO: 292, SEQ ID NO: 294, SEQ ID NO:- 296, SEQ ID NO: 298, SEQ ID NO: 300, SEQ ID NO: 302, SEQ ID NO: 304,SEQ ID NO: 306, SEQ ID NO: 308, SEQ ID NO: 310, SEQ ID NO: 312, SEQID NO: 314, SEQ ID NO: 316, SEQ ID NO: 318, SEQ ID NO: 320, SEQ IDNO: 322, SEQ ID NO: 324, SEQ ID NO: 326, SEQ ID NO: 328, SEQ ID NO:- 330, SEQ ID NO: 332, SEQ ID NO: 334, SEQ ID NO: 336, SEQ ID NO: 338,SEQ ID NO: 340, SEQ ID NO: 342, SEQ ID NO: 344, SEQ ID NO: 346, SEQID NO: 348, SEQ ID NO: 350, SEQ ID NO: 352, SEQ ID NO: 354, SEQ IDNO: 356, SEQ ID NO: 358, SEQ ID NO: 360, SEQ ID NO: 362, SEQ ID NO:-364, SEQ ID NO: 366, SEQ ID NO: 368, SEQ ID NO: 370, SEQ ID NO: 372,SEQ ID NO: 374, SEQ ID NO: 376, SEQ ID NO: 378, SEQ ID NO: 380, SEQ-ID NO: 382, SEQ ID NO: 384, SEQ ID NO: 386, SEQ ID NO: 388, SEQ IDNO: 390, SEQ ID NO: 392, SEQ ID NO: 394, SEQ ID NO: 396, SEQ ID NO:-398, SEQ ID NO: 400, SEQ ID NO: 402, SEQ ID NO: 404, SEQ ID NO: 406,SEQ ID NO: 408, SEQ ID NO: 410, SEQ ID NO: 412, SEQ ID NO: 414, SEQID NO: 416, SEQ ID NO: 418, SEQ ID NO: 420, SEQ ID NO: 422, SEQ ID-NO: 424, SEQ ID NO: 426, SEQ ID NO: 428, SEQ ID NO: 430, SEQ ID NO:-432, SEQ ID NO: 434, SEQ ID NO: 436, SEQ ID NO: 438, SEQ ID NO: 440,SEQ ID NO: 442, SEQ ID NO: 444, SEQ ID NO: 446, SEQ ID NO: 448, SEQID NO: 450, SEQ ID NO: 452, SEQ ID NO: 454, SEQ ID NO: 456, SEQ IDNO: 458, SEQ ID NO: 460, SEQ ID NO: 462, SEQ ID NO: 464, SEQ ID NO:-466, SEQ ID NO: 468, SEQ ID NO: 470, SEQ ID NO: 472, SEQ ID NO: 474,SEQ ID NO: 476, SEQ ID NO: 478, SEQ ID NO: 480, SEQ ID NO: 482, SEQID NO: 484, SEQ ID NO: 486, SEQ ID NO: 488, SEQ ID NO: 490, SEQ IDNO: 492, SEQ ID NO: 494, SEQ ID NO: 496, SEQ ID NO: 498, SEQ ID NO:-500, SEQ ID NO: 502, SEQ ID NO: 504, SEQ ID NO: 506, SEQ ID NO: 508,-SEQ ID NO: 510, SEQ ID NO: 512, SEQ ID NO: 514, SEQ ID NO: 516, SEQID NO: 518, SEQ ID NO: 520, SEQ ID NO: 522, SEQ ID NO: 524, SEQ IDNO: 526, SEQ ID NO: 528, SEQ ID NO: 530, SEQ ID NO: 532, SEQ ID NO:-534, SEQ ID NO: 536, SEQ ID NO: 538, SEQ ID NO: 540, SEQ ID NO: 542,SEQ ID NO: 544, SEQ ID NO: 546, SEQ ID NO: 548, SEQ ID NO: 550, SEQ-ID NO: 552, SEQ ID NO: 554, SEQ ID NO: 556, SEQ ID NO: 558, SEQ IDNO: 560, SEQ ID NO: 562, SEQ ID NO: 564, SEQ ID NO: 566, SEQ ID NO:-568, SEQ ID NO: 570, SEQ ID NO: 572, SEQ ID NO: 574, SEQ ID NO: 576,SEQ ID NO: 578, SEQ ID NO: 580, SEQ ID NO: 582, SEQ ID NO: 584, SEQID NO: 586, SEQ ID NO: 588, SEQ ID NO: 590, SEQ ID NO: 592, SEQ ID-NO: 594, SEQ ID NO: 596, SEQ ID NO: 598, SEQ ID NO: 600, SEQ ID NO:-602, SEQ ID NO: 604, SEQ ID NO: 606, SEQ ID NO: 608, SEQ ID NO: 610,SEQ ID NO: 612, SEQ ID NO: 614, SEQ ID NO: 616, SEQ ID NO: 618, SEQID NO: 620, SEQ ID NO: 622, SEQ ID NO: 624, SEQ ID NO: 626, SEQ IDNO: 628, SEQ ID NO: 630, SEQ ID NO: 632, SEQ ID NO: 634 e/ou SEQ IDNO: 636,em que a modificação de seqüência compreende pelo menosuma, duas, três, quatro, cinco, seis, sete, oito, nove, dez, onze, doze, treze,quatorze, quinze, dezesseis, dezessete, dezoito, dezenove ou todas as se-guintes alterações:o aminoácido que corresponde à treonina no resíduo 4 de SEQID NO: 384 é leucina,o aminoácido que corresponde à serina no resíduo 9 de SEQ IDNO: 384 é prolina,o aminoácido que corresponde à glutamina no resíduo 10 deSEQ ID NO: 384 é serina,o aminoácido que corresponde à treonina no resíduo 13 de SEQID NO: 384 é fenilalanina,o aminoácido que corresponde à treonina no resíduo 13 de SEQID NO: 384 é tirosina,o aminoácido que corresponde à treonina no resíduo 13 de SEQID NO: 384 é isoleucina,o aminoácido que corresponde à treonina no resíduo 13 de SEQID NO: 384 é triptofano,o aminoácido que corresponde à asparagina no resíduo 14 deSEQ ID NO: 384 é histidina,o aminoácido que corresponde à tirosina no resíduo 18 de SEQID NO: 384 é fenilalanina,o aminoácido que corresponde à serina no resíduo 25 de SEQID NO: 384 é ácido glutâmico,o aminoácido que corresponde à serina no resíduo 25 de SEQID NO: 384 é prolina,o aminoácido que corresponde à asparagina no resíduo 30 deSEQ ID NO: 384 é valina,o aminoácido que corresponde à glütámina no resíduo 34 deSEQ ID NO: 384 é cisteína,o aminoácido que corresponde à glutamina no resíduo 34 deSEQ ID NO: 384 é histidina,o aminoácido que corresponde à glutamina no resíduo 34 deSEQ ID NO: 384 é leucina,o aminoácido que corresponde à serina no resíduo 35 de SEQID NO: 384 é ácido glutâmico, o aminoácido que corresponde à serina no resíduo 35 de SEQID NO: 384 é ácido aspártico,o aminoácido que corresponde à serina no resíduo 71 de SEQID NO: 384 é treonina,o aminoácido que corresponde à serina no resíduo 71 de SEQID NO: 384 é cisteína, ouo aminoácido que corresponde à serina no resíduo 194 de SEQID NO: 384 é histidina.

32. Polipeptídeo isolado, sintético ou recombinante que tem umaatividade de xilanase, mananase e/ou glicanase, em que o polipeptídeo temuma seqüência que compreende uma ou mais das seguintes alterações àseqüência de aminoácido de SEQ ID NO: 384:a treonina na posição de aminoácido 4 é leucina,a serina na posição de aminoácido 9 é prolina,a glutamina na posição de aminoácido 10 é serina,a treonina na posição de aminoácido 13 é fenilalanina,a treonina na posição de aminoácido 13 é tirosina,a treonina na posição de aminoácido 13 é isoleucina,a treonina na posição de aminoácido 13 é triptofano,a asparagina na posição de aminoácido 14 é histidina,a tirosina na posição de aminoácido 18 é fenilalanina,a serina na posição de aminoácido 25 é ácido glutâmico,a serina na posição de aminoácido 25 é prolina,a asparagina na posição de aminoácido 30 é valina,a glutamina na posição de aminoácido 34 é cisteína,a glutamina na posição de aminoácido 34 é histidina,a glutamina na posição de aminoácido 34 é leucina,a serina na posição de aminoácido 35 é ácido glutâmico,a serina na posição de aminoácido 35 é ácido aspárticoa serina na posição de aminoácido 71 é treonina,a serina na posição de aminoácido 71 é cisteína, oua serina na posição de aminoácido 194 é histidina.

33. Polipeptídeo isolado, sintético ou recombinante de acordocom a reivindicação 32, em que a alteração de seqüência compreende pelomenos duas, três, quatro, cinco, seis, sete, oito, nove, dez, onze, doze, tre-ze, quatorze, quinze, dezesseis, dezessete, dezoito, dezenove ou todas asalterações.

34. Polipeptídeo isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 30 a 33, em que(a) a atividade de xilanase compreende catalisar a hidrólise deligações β-1,4-xilosídicas internas; compreende uma atividade de endo-1,4-beta-xilanase; compreende hidrolisar um xilano ou um arabinoxilano paraproduzir uma xilose e xilo-oligômero de peso molecular menor; compreendehidrolisar um polissacarídeo que compreende uma D-xilopiranose 1,4-β-glicosídeo-ligada; compreende hidrolisar uma celulose ou uma hemicelulose;compreende hidrolisar uma celulose ou uma hemicelulose em uma madeira,produto de madeira, polpa de papel, produto de papel ou resíduo de papel;compreende catalisar a hidrólise de um xilano ou um arabinoxilano em u-ma ração ou um produto alimentício; ou, compreende catalisar a hidrólise deum xilano ou um arabinoxilano em uma célula microbiana ou uma célula deplanta;(b) a atividade de glicanase compreende uma atividade de en-doglicanase, por exemplo, endo-1,4- e/ou 1,3-beta-D-glican 4-glicano hidro-lase; catalisar a hidrólise de ligações 1,4-beta-D-glicosídicas; uma atividadede endo-1,4- e/ou 1,3-beta-endoglicanase ou atividade de endo-p-1,4-glicanase; uma atividade de endo-1,4-beta-D-glican 4-glicano hidrolase; ca-talisar a hidrólise de ligações 1,4-beta-D-glicosídicas em celulose, derivadosde celulose, carbóxi metil celulose e/ou hidróxi etil celulose, liquenina, liga-ções beta-1,4 em beta-1,3 glicanos mistos, beta-D-glicanos de cereais e/ououtro material de planta que contém partes celulósicas; hidrolisar um glicano,beta-glicano ou um polissacarídeo para produzir um polissacarídeo ou oli-gômero de peso molecular menor; ou(c) a atividade de mananase compreende uma atividade de en-do-1,4-beta-D-mananase, ou catalisar a hidrólise de beta-1,4-manana ouuma beta-1,4-manana linear não substituída.

35. Polipeptídeo isolado, sintético ou recombinante de acordocom a reivindicação 34, em que o xilano ou arabinoxilano compreende umarabinoxilano solúvel em água, e opcionalmente o xilano ou arabinoxilanosolúvel em água compreende uma massa de farinha ou um produto de pão.

36. Polipeptídeo isolado, sintético ou recombinante de acordocom a reivindicação 34, em que a ração ou produto alimentício compreendeuma ração animal a base de cereal, um mosto ou uma cerveja, um leite ouum produto de leite, uma fruta ou um vegetal.

37. Polipeptídeo isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 30 a 36, em que a atividade de xilana-se, mananase e/ou glicanase é termoestável, e opcionalmente o polipeptí-deo retém uma atividade de xilanase, mananase e/ou glicanase sob condi-ções que compreendem uma faixa de temperatura entre cerca de 37°C atécerca de 95°C, ou entre cerca de 55°C até cerca de 85°C, ou entre cerca de 70°C até cerca de 75°C, ou entre cerca de 70°C até cerca de 95°C, entrecerca de 90°C até cerca de 95°C, entre cerca de 95°C até cerca de 105°C,ou entre cerca de 95°C até cerca de 110°C, ou pelo menos cerca de 80°C,- 81 °C, 82°C, 83°C, 84°C, 85°C, 86°C, 87°C, 88°C, 89°C ou 90°C.

38. Polipeptídeo isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 30 a 36, em que a atividade de xilana-se, mananase e/ou glicanase é termotolerante, e opcionalmente o polipeptí-deo retém uma atividade de xilanase, mananase e/ou glicanase após expo-sição a uma temperatura na faixa de mais do que 37°C até cerca de 95°C,ou entre cerca de 55°C até cerca de 85°C, ou entre cerca de 70°C até cercade 75°C, ou entre cerca de 70°C até cerca de 95°C, entre cerca de 90°C atécerca de 95°C, entre cerca de 95°C até cerca de 105°C, ou entre cerca de-95°C até cerca de HO0C1 ou pelo menos cerca de 80°C, 81 °C, 82°C, 83°C,-84°C, 85°C, 86°C, 87°C, 88°C, 89°C ou 90°C.em que opcionalmente a termotolerância compreende a reten-ção de pelo menos metade da atividade especifica da xilanase, mananasee/ou glicanase a 37°C após ser aquecida para uma temperatura elevada, ou,opcionalmente a termotolerância compreende retenção da atividade especi-fica a 37°C na faixa de cerca de 500 até cerca de 1200 unidade por miligra-ma de proteína após ser aquecida para uma temperatura elevada, e opcio-nalmente a temperatura elevada é de pelo menos cerca de 80°C, 81 °C,-82°C, 83°C, 84°C, 85°C, 86°C, 87°C, 88°C, 89°C ou 90°C.

39. Polipeptídeo isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 30 a 36, em que a atividade de xilana-se, a mananase e/ou a glicanase retém atividade sob condições ácidas quecompreendem cerca de pH 6,5, pH 6, pH 5,5, pH 5, pH 4,5 ou pH 4 ou me-nos (mais ácido) ou, retém uma atividade de xilanase, mananase e/ou glica-nase após exposição a condições acidas que compreendem cerca de pH-6,5, pH 6, pH 5,5, pH 5, pH 4,5 ou pH 4 ou menos (mais ácido).

40. Polipeptídeo isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 30 a 36, em que a atividade de xilana-se, mananase e/ou glicanase retém atividade sob condições básicas quecompreendem cerca de pH 7, pH 7,5 pH 8,0, pH 8,5, pH 9, pH 9,5, pH 10,pH 10,5, pH 11, pH 11,5, pH 12, pH 12,5 ou mais (mais básico) ou, retémuma atividade de xilanase, mananase e/ou glicanase após exposição a con-dições básicas que compreendem cerca de pH 7, pH 7,5 pH 8,0, pH 8,5, pH-9, pH 9,5, pH 10, pH 10,5, ρΗ 11, ρΗ 11,5, ρΗ 12 ρΗ 12,5 ou mais (mais bá-sico).

41. Polipeptídeo isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 30 a 36, em que a atividade de xilana-se, mananase e/ou glicanase retém atividade em uma temperatura de pelomenos cerca de 80°C, 81 °C, 82°C, 83°C, 84°C, 85°C, 86°C, 87°C, 88°C,-89°C ou 90°C, e um pH básico de pelo menos cerca de pH 7,5 pH 8,0, pH-8,5, pH 9, pH 9,5, pH 10, pH 10,5, pH 11, pH 11,5, pH 12, pH 12,5 ou mais(mais básico).

42. Polipeptídeo isolado, sintético ou recombinante que compre-ende um polipeptídeo de acordo com qualquer uma das reivindicações 30 a-41, e que não tem uma seqüência de sinal ou uma seqüência prepro.

43. Polipeptídeo isolado, sintético ou recombinante que compre-ende um polipeptídeo de acordo com qualquer uma das reivindicações 30 a-41, e que tem uma seqüência de sinal heteróloga ou uma seqüência preproheteróloga.

44. Polipeptídeo isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 30 a 41, em que a atividade de xilana-se, mananase e/ou glicanase compreende uma atividade específica em cer-ca de 37°C na faixa de cerca de 100 até cerca de 1000 unidades por mili-grama de proteína, de cerca de 500 até cerca de 750 unidades por miligra-ma da proteína, de cerca de 500 até cerca de 1200 unidades por miligramade proteína, ou de cerca de 750 até cerca de 1000 unidades por miligramade proteína.

45. Polipeptídeo isolado, sintético ou recombinante de acordocom qualquer uma das reivindicações 30 a 44, em que o polipeptídeo com-preende pelo menos um sítio de glicosilação ou ainda compreende um polis-sacarídeo, em que opcionalmente a glicosilação é uma glicosilação N-ligada,e opcionalmente o polipeptídeo é glicosilado após ser expresso em P. pasto-ris ou S. pombe.

46. Preparação de proteína que compreende um polipeptídeo deacordo com qualquer uma das reivindicações 30 a 45, em que a preparaçãode proteína compreende um líquido, um sólido ou um gel.

47. Heterodímero que compreende um polipeptídeo de acordocom qualquer uma das reivindicações 30 a 45, e um segundo domínio, emque opcionalmente o segundo domínio é um polipeptídeo e o heterodímero éuma proteína de fusão, ou opcionalmente o segundo domínio é um epitopoou um sinalizador.

48. Homodímero que compreende um polipeptídeo de acordocom qualquer uma das reivindicações 30 a 45.

49. Polipeptídeo imobilizado, em que o polipeptídeo compreendeum polipeptídeo de acordo com qualquer uma das reivindicações 30 a 45, ouuma subseqüência desses, em que opcionalmente o polipeptídeo é imobili-zado sobre uma tira de madeira, um papel, uma célula, um metal, uma resi-na, um polímero, uma cerâmica, um vidro, um microeletrodo, uma partículade grafite, uma esfera, um gel, uma placa, uma matriz, ou um tubo capilar.

50. Anticorpo isolado, sintético ou recombinante que se liga es-pecificamente a um polipeptídeo descrito como definido em qualquer umadas reivindicações 30 a 45, em que opcionalmente o anticorpo é um anticor-po monoclonal ou policlonal, ou é um anticorpo de cadeia única.

51. Hibridoma que compreende um anticorpo descrito de acordocom a reivindicação 50.

52. Matriz que compreende: um polipeptídeo imobilizado, emque o polipeptídeo compreende um polipeptídeo como definido em qualqueruma das reivindicações 30 a 45; um ácido nucléico imobilizado, em que oácido nucléico compreende um ácido nucléico como definido em qualqueruma das reivindicações 1 a 14; um anticorpo descrito como definido na rei-vindicação 50; ou, uma combinação desses.

53. Método de isolar ou identificar um polipeptídeo com umaatividade de xilanase, mananase e/ou glicanase que compreende as etapas de:(a) fornecer um anticorpo descrito na reivindicação 50;(b) fornecer uma amostra que compreende polipeptídeos; e(c) colocar a amostra da etapa (b) em contato com o anticorpoda etapa (a) sob condições em que o anticorpo pode ser ligar especificamen-te ao polipeptídeo, dessa forma isolando ou identificando um polipeptídeoque tem uma atividade de xilanase, mananase e/ou glicanase.

54. Método de fazer um anticorpo antixilanase e/ou antiglicana-se que compreende administrar a um animal não-humano um ácido nucléicodescrito como definido em qualquer uma das reivindicações 1 a 14, ou umasubseqüência desses, em uma quantidade suficiente para gerar uma respos-ta imune humoral, fazendo assim um anticorpo antixilanase e/ou antiglicana-se.

55. Método de fazer um anticorpo antixilanase e/ou antiglicana-se que compreende administrar a um animal não-humano um polipeptídeodescrito em qualquer uma das reivindicações 30 a 45, ou uma subseqüênciadesses, em uma quantidade suficiente para gerar uma resposta imune hu-moral, fazendo assim um anticorpo antixilanase e/ou antiglicanase.

56. Método de produzir um polipeptídeo recombinante que com-preende as etapas de: (a) fornecer um ácido nucléico operativamente ligadoa um promotor, em que o ácido nucléico compreende uma seqüência descri-ta como definido em qualquer uma das reivindicações 1 a 14; e (b) expressaro ácido nucléico da etapa (a) sob condições que permitem a expressão dopolipeptídeo, produzindo assim um polipeptídeo recombinante, e opcional-mente o método compreende ainda transformar uma célula hospedeira como ácido nucléico da etapa (a) seguido por expressar o ácido nucléico da eta-pa (a), produzindo assim um polipeptídeo recombinante em uma célulatransformada.

57. Método para identificar um polipeptídeo que tem uma ativi-dade de xilanase, mananase e/ou glicanase que compreende as seguintesetapas:(a) fornecer um polipeptídeo descrito em qualquer uma das rei-vindicações 30 a 45;(b) fornecer um substrato de xilanase, mananase e/ou glicanase;e(c) colocar o polipeptídeo em contato com o substrato da etapa(b) e detectar uma diminuição na quantidade de substrato ou um aumento naquantidade de um produto da reação, em que uma diminuição na quantidadedo substrato ou um aumento na quantidade do produto de reação detectaum polipeptídeo que tem uma atividade de xilanase, mananase e/ou glicana-se.

58. Método para identificar um substrato de xilanase, mananasee/ou glicanase que compreende as seguintes etapas:(a) fornecer um polipeptídeo descrito em qualquer uma das rei-vindicações 30 a 45;(b) fornecer um substrato de teste; e(c) colocar o polipeptídeo da etapa (a) em contato com o subs-trato de teste da etapa (b) e detectar uma diminuição na quantidade de subs-trato ou um aumento na quantidade de produto de reação, em que uma di-minuição na quantidade do substrato ou um aumento na quantidade de umproduto de reação identifica o substrato de teste como um substrato de xila-nase, mananase e/ou glicanase.

59. Método de determinar se um composto de teste se liga es-pecificamente a um polipeptídeo, compreendendo as seguintes etapas:(a) expressar um ácido nucléico ou um vetor que compreende oácido nucléico sob condições permissivas para tradução do ácido nucléicopara um polipeptídeo, em que o ácido nucléico tem uma seqüência descritacomo definida em qualquer uma das reivindicações 1 a 14;(b) fornecer um composto de teste;(c) colocar o polipeptídeo em contato com o composto de teste;e(d) determinar se o composto de teste da etapa (b) se liga espe-cificamente ao polipeptídeo.

60. Método de determinar se um composto de teste se liga es-pecificamente a um polipeptídeo, compreendendo as seguintes etapas:(a) fornecer um polipeptídeo descrito como definido em qualqueruma das reivindicações 30 a 45;(b) fornecer um composto de teste;(c) colocar o polipeptídeo em contato com o composto de teste;e(d) determinar se o composto de teste da etapa (b) se liga espe-cificamente ao polipeptídeo.

61. Método para identificar um modulador de uma atividade dexilanase, mananase e/ou glicanase que compreende as seguintes etapas:(a) fornecer um polipeptídeo descrito em qualquer uma das rei-vindicações 30 a 45;(b) fornecer um composto de teste;(c) colocar o polipeptídeo da etapa (a) em contato com o com-posto de teste da etapa (b) e medir uma atividade de xilanase, mananasee/ou glicanase, em que uma alteração na atividade de xilanase, mananasee/ou glicanase medida na presença do composto de teste comparada com aatividade na ausência do composto de teste fornece uma determinação deque o composto de teste modula a atividade de xilanase, mananase e/ouglicanase.

62. Método de acordo com a reivindicação 61, em que a ativida-de de xilanase, mananase e/ou glicanase é medida por fornecer um subs-trato de xilanase, mananase e/ou glicanase e detectar uma diminuição naquantidade do substrato ou um aumento na quantidade de um produto dereação, ou um aumento na quantidade do substrato, ou uma diminuição naquantidade de um produto de reação, em que opcionalmente uma diminui-ção na quantidade do substrato ou um aumento na quantidade de um pro-duto de reação com o composto de teste quando comparado com a quanti-dade do substrato ou do produto de reação sem o composto de teste identi-fica o composto de teste como um ativador de uma atividade de xilanase,mananase e/ou glicanase.

63. Método de acordo com a reivindicação 62, em que um au-mento na quantidade do substrato ou uma diminuição na quantidade do pro-duto de reação com o composto de teste quando comparado com a quanti-dade do substrato ou do produto de reação sem o composto de teste identi-fica o composto de teste como um inibidor da atividade de xilanase, mana-nase e/ou glicanase.

64. Sistema de computador que compreende um processador eum dispositivo de armazenamento de dados, ou um meio de leitura em com-putador que têm armazenado neles uma seqüência de polipeptídeo ou umaseqüência de ácido nucléico, em que o dispositivo de armazenamento dedados ou meio de leitura em computador têm armazenado neles uma se-qüência de polipeptídeo ou uma seqüência de ácido nucléico, em que a se-qüência de polipeptídeo compreende seqüências descritas em qualquer umadas reivindicações 30 a 45, um polipeptídeo codificado por um ácido nucléi-co descrito como definido em qualquer uma das reivindicações 1 a 14,em que opcionalmente o sistema ainda compreende um algorit-mo de comparação de seqüência e um dispositivo de armazenamento dedados que tem pelo menos uma seqüência de referência armazenada nele,ou, opcionalmente compreende ainda um identificador que identifica uma oumais características na seqüência,e opcionalmente o algoritmo de comparação de seqüência com-preende um programa de computador que indica polimorfismos.

65. Método para identificar uma característica em uma seqüên-cia que compreende as etapas de: (a) ler a seqüência usando um programade computador que identifica uma ou mais características em uma seqüên-cia, em que a seqüência compreende uma seqüência de polipeptídeo ouuma seqüência de ácido nucléico, em que a seqüência de polipeptídeo com-preende seqüências descritas em qualquer uma das reivindicações 30 a 45,um polipeptídeo codificado por um ácido nucléico descrito em qualquer umadas reivindicações 1 a 14; e (b) identificar uma ou mais características naseqüência com o programa de computador.

66. Método para comparar uma primeira seqüência a uma se-gunda seqüência que compreende as etapas de: (a) ler a primeira seqüênciae a segunda seqüência através do uso de um programa de computador quecompara seqüências, em que a primeira seqüência compreende uma se-qüência de polipeptídeo ou uma seqüência de ácido nucléico, em que a se-qüência de polipeptídeo compreende seqüências descritas em qualquer umadas reivindicações 30 a 45, um polipeptídeo codificado por um ácido nucléi-co descrito como definido em qualquer uma das reivindicações 1 a 14; e (b)determinar as diferenças entre a primeira seqüência e a segunda seqüênciacom o programa de computador,em que opcionalmente a etapa de determinar diferenças entre aprimeira seqüência e a segunda seqüência compreende ainda a etapa deidentificar polimorfismos,e opcionalmente o método compreende um identificador queidentifica uma ou mais características em uma seqüência, e opcionalmente ométodo ainda compreende ler a primeira seqüência usando um programa decomputador e identificar uma ou mais características na seqüência.

67. Método para isolar ou recuperar um ácido nucléico que codi-fica um polipeptídeo com uma atividade de xilanase, mananase e/ou glica-nase a partir de uma amostra do ambiente que compreende as etapas de:(a) fornecer uma sonda de polinucleotídeo descrita na reivindi-cação 15;(b) isolar um ácido nucléico da amostra do ambiente ou tratar aamostra do ambiente tal que o ácido nucléico na amostra seja acessível parahibridização a uma sonda de polinucleotídeo da etapa (a);(c) combinar o ácido nucléico isolado ou a amostra do ambientetratada da etapa (b) com a sonda de polinucleotídeo da etapa (a); e(d) isolar um ácido nucléico que hibridiza especificamente com asonda de polinucleotídeo da etapa (a), dessa forma isolando ou recuperandoum ácido nucléico que codifica um polipeptídeo com uma atividade de xila-nase, mananase e/ou glicanase a partir de uma amostra do ambiente,em que opcionalmente a amostra compreende uma amostra deágua, uma amostra de líquido, uma amostra de solo, uma amostra de ar, ouuma amostra biológica;e opcionalmente a amostra biológica é derivada de uma célulabacteriana, uma célula de protozoário, uma célula de inseto, uma célula delevedura, uma célula de planta, uma célula de fungo, ou uma célula de ma-mífero.

68. Método para isolar ou recuperar um ácido nucléico que codi-fica um polipeptídeo com uma atividade de xilanase, mananase e/ou glica-nase a partir de uma amostra do ambiente, que compreende as etapas de:(a) fornecer um par de seqüências de iniciadores de amplifica-ção descrito na reivindicação 16 ou na reivindicação 17;(b) isolar o ácido nucléico da amostra do ambiente ou tratar aamostra do ambiente tal que o ácido nucléico na amostra seja acessível parahibridização ao par de iniciadores de amplificação; e,(c) combinar o ácido nucléico da etapa (b) com o par de iniciado-res de amplificação da etapa (a) e amplificar o ácido nucléico da amostra doambiente, assim isolando ou recuperando um ácido nucléico que codifica umpolipeptídeo com uma atividade de xilanase, mananase e/ou glicanase apartir de uma amostra do ambiente.

69. Método de gerar uma variante de um ácido nucléico que co-difica um polipeptídeo com uma atividade de xilanase, mananase e/ou glica-nase que compreende as etapas de:(a) fornecer um ácido nucléico molde que compreende uma se-qüência descrita como definida em qualquer uma das reivindicações 1 a 14;e(b) modificar, deletar ou adicionar um ou mais nucleotídeos naseqüência molde, ou uma combinação desses, para gerar uma variante doácido nucléico molde.em que opcionalmente o método compreende ainda expressar oácido nucléico variante para gerar um polipeptídeo de xilanase, a mananasee/ou a glicanase variante,e opcionalmente as modificações, adições ou deleções são in-troduzidas por um método que compreende "error-prone" PCR1 embaralha-mento (shuffling), mutagênese sítio-direcionada, "assembly" PCR, mutágê-nese por PCR sexual, mutagênese in vivo, mutagênese de cassete, mutagê-nese de agrupamentos repetitivos, mutagênese de agrupamento exponenci-al, mutagênese sítio-específica, reagrupamento de genes, Mutagênese porSaturação do Sítio do Gene (GSSM), reagrupamento por ligação sintética(SLR) e uma combinação desses, ou as modificações, adições ou deleçõessão introduzidas por um método que compreende recombinação, recombi-nação de seqüência repetitiva, mutagênese de DNA modificado por fosfotio-ato, mutagênese de molde contendo uracila, mutagênese de dúplex inter-rompido, mutagênese de reparo de mal-pareamentos pontuais, mutagênesepor cepas do hospedeiro deficientes em reparo, mutagênese química, muta-gênese radiogênica, mutagênese por deleção, mutagênese por seleção derestrição, mutagênese por purificação de restrição, síntese de gene artificial,mutagênese de agrupamentos (ensemble mutagenesis), criação de multíme-ro de ácido nucléico quimérico e uma combinação desses.

70. Método de acordo com a reivindicação 69, em que o métodoé repetido iterativamente até que uma xilanase, uma mananase e/ou umaglicanase tendo uma atividade alterada ou diferente ou uma estabilidade al-terada ou diferente daquela de um polipeptídeo codificado pelo ácido nucléi-co é produzida em que opcionalmente um polipeptídeo de xilanase, mana-nase e/ou glicanase variante é termotolerante, e retém alguma atividade a-pós ser exposto a uma temperatura elevada ou opcionalmente ao polipeptí-deo de xilanase, mananase e/ou glicanase tem glicosilação aumentadaquando comparado à xilanase, à mananase e/ou à glicanase codificada peloácido nucléico molde, ou opcionalmente o polipeptídeo de xilanase, mana-nase e/ou glicanase variante tem uma atividade de xilanase, mananase e/ouglicanase sob uma alta temperatura, em que a xilanase, mananase e/ou gli-canase codificada pelo ácido nucléico molde não é ativa sob a alta tempera-tura.

71. Método de acordo com a reivindicação 69, em que o métodoé repetido iterativamente até que uma seqüência codificante de xilanase,mananase e/ou glicanase tendo um uso de códon diferente daquele do ácidonucléico molde é produzida,em que opcionalmente o método é repetido iterativamente atéque um gene de xilanase, mananase e/ou glicanase tendo um nível maior oumenor de expressão de mensagem ou estabilidade do que aquele do ácidonucléico molde é produzido.

72. Método para modificar códons em um ácido nucléico quecodifica um polipeptídeo com uma atividade de xilanase, mananase e/ouglicanase para aumentar sua expressão em uma célula hospedeira, o méto-do compreendendo as seguintes etapas:(a) fornecer um ácido nucléico que codifica um polipeptídeo comuma atividade de xilanase, mananase e/ou glicanase que compreende umaseqüência descrita como definida em qualquer uma das reivindicações 1a 14; e,(b) identificar um códon não-preferido ou menos preferido noácido nucléico da etapa (a) e substituí-lo por um códon preferido ou usadode forma neutra que codifica o mesmo aminoácido que o códon substituído,em que um códon preferido é super-representado em seqüências codifican-tes em genes na célula hospedeira e um códon não preferido ou menos pre-ferido é sub-representado em seqüências codificantes em genes na célulahospedeira, modificando assim o ácido nucléico para aumentar sua expres-são em uma célula hospedeira.

73. Método para modificar códons em um ácido nucléico quecodifica um polipeptídeo de xilanase, mananase e/ou glicanase, o métodocompreendendo as seguintes etapas:(a) fornecer um ácido nucléico que codifica um polipeptídeo comuma atividade de xilanase, mananase e/ou glicanase que compreende umaseqüência descrita como definida em qualquer uma das reivindicações 1 a14; e,(b) identificar um códon no ácido nucléico da etapa (a) e substi-tuí-lo por um códon diferente que codifica o mesmo aminoácido que o códonsubstituído, modificando assim códons no ácido nucléico que codifica umaxilanase, mananase e/ou glicanase.

74. Método para modificar códons em um ácido nucléico quecodifica um polipeptídeo de xilanase, mananase e/ou glicanase para aumen-tar sua expressão em uma célula hospedeira, o método compreendendo asseguintes etapas:(a) fornecer um ácido nucléico que codifica um polipeptídeo deI xilanase, mananase e/ou glicanase que compreende uma seqüência descritade acordo com qualquer uma das reivindicações 1 a 14; e,(b) identificar um códon não preferido ou menos preferido noácido nucléico da etapa (a) e substituí-lo por um códon preferido ou usadode forma neutra que codifica o mesmo aminoácido que o códon substituído,em que um códon preferido é um códon super-representado em seqüênciascodificantes em genes na célula hospedeira e um códon não-preferido oumenos preferido é um códon sub-representado em seqüências codificantesem genes na célula hospedeira, modificando assim o ácido nucléico paraaumentar sua expressão em uma célula hospedeira.

75. Método para modificar um códon em um ácido nucléico quecodifica um polipeptídeo que tem uma atividade de xilanase, mananase e/ouglicanase para diminuir sua expressão em uma célula hospedeira, o métodocompreendendo as seguintes etapas:(a) fornecer um ácido nucléico que codifica um polipeptídeo dexilanase, mananase e/ou glicanase que compreende uma seqüência descritacomo definida em qualquer uma das reivindicações 1 a 14; e(b) identificar pelo menos um códon preferido no ácido nucléicoda etapa (a) e substituí-lo por um códon não-preferido ou menos preferidoque codifica o mesmo aminoácido que o códon substituído, em que um có-don preferido é um códon super-representado em seqüências codificantesem genes em uma célula hospedeira, e um códon não-preferido ou menospreferido é um códon sub-representado em seqüências codificantes em ge-nes na célula hospedeira, modificando assim o ácido nucléico para diminuirsua expressão em uma célula hospedeira,em que opcionalmente a célula hospedeira é uma célula bacte-riana, uma célula de fungo, uma célula de inseto, uma célula de levedura,uma célula de planta ou uma célula de mamífero.

76. Método para produzir uma biblioteca de ácidos nucléicosque codificam uma pluralidade de sítios ativos ou sítios de ligação de subs-trato modificados de xilanase, mananase e/ou glicanase, em que os sítiosativos ou sítios de ligação de substrato modificados são derivados de umprimeiro ácido nucléico que compreende uma seqüência que codifica umprimeiro sítio ativo ou um primeiro sítio de ligação de substrato, o métodocompreendendo as seguintes etapas:(a) fornecer um primeiro ácido nucléico que codifica um primeirosítio ativo ou um primeiro sítio de ligação de substrato, em que a primeiraseqüência de ácido nucléico compreende uma seqüência que hibridiza sobcondições estringentes a uma seqüência descrita como definida em qualqueruma das reivindicações 1 a 14, ou uma subseqüência dessas, e o ácido nu-cléico codifica um sítio ativo de xilanase, mananase e/ou glicanase ou umsítio de ligação de substrato de xilanase, mananase e/ou glicanase;(b) fornecer um conjunto de oligonucleotídeos mutagênicos quecodificam variantes de aminoácido de ocorrência natural em uma pluralidadede códons alvo no primeiro ácido nucléico; e(c) usar o conjunto de oligonucleotídeos mutagênicos para gerarum conjunto de ácidos nucléicos variantes codificantes de sítio ativo ou codi-ficantes de sítio de ligação de substrato que codificam uma variedade devariações de aminoácido em cada códon de aminoácido que foi mutageniza-do, produzindo assim uma biblioteca de ácidos nucléicos que codificam umapluralidade de sítios ativos ou sítios de ligação de substrato de xilanase, ma-nanase e/ou glicanase.

77. Método de acordo com a reivindicação 76, que compreendemutagenizar o primeiro ácido nucléico da etapa (a) ou variantes por um mé-todo que compreende um sistema de evolução direcionada otimizado, Muta-gênese por Saturação do Sítio do Gene (GSSM), reagrupamento por ligaçãosintética (SLR), "error-prone" PCR, embaralhamento, mutagênese sítio dire-cionada, "assembly" PCR, mutagênese por PCR sexual, mutagênese in vivo,mutagênese de cassete, mutagênese de agrupamentos repetitivos, mutagê-nese de agrupamentos exponenciais, mutagênese sítio-específica, reagru-pamento de genes, recombinação de seqüência repetitiva, mutagênese deDNA modificado por fosfotioato, mutagênese de molde contendo uracila, mu-tagênese de dúplex interrompido, mutagênese de reparo de mal-pareamentos pontuais, mutagênese por cepas do hospedeiro deficientes emreparo, mutagênese química, mutagênese radiogênica, mutagênese por de-leção, mutagênese por seleção de restrição, mutagênese por purificação derestrição, síntese de gene artificial, mutagênese de agrupamentos, criaçãode multímero de ácido nucléico quimérico ou uma combinação desses.

78. Método para fazer uma pequena molécula que compreendeas seguintes etapas:(a) fornecer uma pluralidade de enzimas biossintéticas capazesde sintetizar ou modificar uma pequena molécula, em que uma das enzimascompreende uma xilanase, mananase e/ou glicanase codificada por um áci-do nucléico que compreende a seqüência como definida em qualquer umadas reivindicações 1 a 14;(b) fornecer um substrato para pelo menos uma das enzimas daetapa (a); e(c) reagir o substrato da etapa (b) com as enzimas sob condi-ções que facilitam uma pluralidade de reações biocatalíticas para gerar umapequena molécula por uma série de reações biocatalíticas.

79. Método para modificar uma pequena molécula que compre-ende as seguintes etapas:(a) fornecer uma enzima xilanase, mananase e/ou glicanase, emque a enzima compreende um polipeptídeo descrito como definido em qual-quer uma das reivindicações 30 a 45, ou um polipeptídeo codificado por umácido nucléico que compreende uma seqüência como definida em qualqueruma das reivindicações 1 a 14;(b) fornecer uma pequena molécula; e(c) reagir a enzima da etapa (a) com a pequena molécula daetapa (b) sob condições que facilitam uma reação enzimática catalisada pelaenzima xilanase, mananase e/ou glicanase, modificando assim uma peque-na molécula por uma reação enzimática de xilanase, mananase e/ou glica-naseem que opcionalmente o método compreende fornecer uma plu-ralidade de substratos de pequenas moléculas para a enzima da etapa (a),gerando assim uma biblioteca de pequenas moléculas modificadas produzi-das por pelo menos uma reação enzimática catalisada pela enzima xilanase,mananase e/ou glicanase.

80. Método de acordo com a reivindicação 79, compreendendoainda uma pluralidade de enzimas adicionais que facilitam uma pluralidadede reações biocatalíticas pelas enzimas para formar uma biblioteca de pe-quenas moléculas modificadas produzidas pela pluralidade de reações en-zimáticas, em que opcionalmente o método ainda compreende a etapa detestar a biblioteca para determinar se uma pequena molécula modificada emparticular que exibe uma atividade desejada está presente dentro da biblio-teca, e opcionalmente a etapa de testar a biblioteca compreendendo atina asetapas de eliminar sistematicamente todas menos uma das reações biocata-líticas usadas para produzir uma porção da pluralidade das pequenas molé-culas modificadas dentro da biblioteca por testar a porção das pequenas mo-léculas modificadas quanto à presença ou ausência da pequena moléculamodificada em particular com uma atividade desejada, e identificar pelo me-nos uma reação biocatalítica que produz a pequena molécula modificadaparticular de atividade desejada.

81. Método para determinar um fragmento funcional de uma en-zima xilanase, mananase e/ou glicanase que compreende as etapas de:(a) fornecer uma enzima xilanase, mananase e/ou glicanase, emque a enzima compreende um polipeptídeo descrito em qualquer uma dasreivindicações 30 a 45, ou um polipeptídeo codificado por um ácido nucléicoque compreende uma seqüência descrita como definida em qualquer umadas reivindicações 1 a 14; e(b) deletar uma pluralidade de resíduos de aminoácido da se-qüência da etapa (a) e testar a subseqüência remanescente quanto a umaatividade de xilanase, mananase e/ou glicanase, determinando assim umfragmento funcional de uma enzima xilanase, mananase e/ou glicanase,em que opcionalmente a atividade de xilanase, mananase e/ouglicanase é medida por fornecer um substrato de xilanase, mananase e/ouglicanase e detectar uma diminuição na quantidade do substrato ou um au-mento na quantidade de um produto de reação.

82. Método para manipulação de células inteiras de fenótiposnovos ou modificados pelo uso de análise de fluxo metabólico em tempo re-al, o método compreendendo as seguintes etapas:(a) fazer uma célula modificada por modificar a composição ge-nética de uma célula, em que a composição genética é modificada pela adi-ção à célula de um ácido nucléico que compreende uma seqüência descritacomo definida em qualquer uma das reivindicações 1 a 14;(b) cultivar a célula modificada para gerar uma pluralidade decélulas modificadas;(c) medir pelo menos um parâmetro metabólico por monitorar acultura celular da etapa (b) em tempo real; e(d) analisar os dados da etapa (c) para determinar se o parâme-tro medido difere de uma medida comparável em uma célula não modificadasob condições similares, identificando assim um fenótipo manipulado na cé-lula usando análise de fluxo em tempo real,em que opcionalmente a composição da célula é modificada porum método que compreende deleção de uma seqüência ou modificação deuma seqüência na célula, ou, nocaute da expressão de um gene,e opcionalmente o método ainda compreende selecionar umacélula que compreende um fenótipo recentemente manipulado, e opcional-mente compreende ainda cultivar a célula selecionada, gerando assim umanova linhagem celular que compreende um fenótipo recentemente manipulado.

83. Seqüência de sinal isolada, sintética ou recombinante quecompreende, ou consiste em: (a) uma seqüência descrita nos resíduos 1 a-12, 1 a 13, 1 a 14, 1 a 15, 1 a 16, 1 a 17, 1 a 18, 1 a 19, 1 a 20, 1 a 21, 1 a-22, 1 a 23, 1 a 24, 1 a 25, 1 a 26, 1 a 27, 1 a 28, 1 a 28, 1 a 30, 1 a 31, 1 a-32, 1 a 33, 1 a 34, 1 a 35, 1 a 36, 1 a 37, 1 a 38, 1 a 39, 1 a 40, 1 a 41, 1 a-42, 1 a 43, 1 a 44, 1 a 45, 1 a 46, 1 a 47, 1 a 48, 1 a 49 ou 1 a 50, de umpolipeptídeo descrito como definido em qualquer uma das reivindicações 30a 45; ou (b) uma seqüência descrita na Tabela 4.

84. Polipeptídeo quimérico que compreende pelo menos umpeptídeo de sinal (SP) e pelo menos um segundo domínio que compreendeum polipeptídeo ou peptídeo heterólogo que compreende uma seqüênciadescrita como definida em qualquer uma das reivindicações 30 a 45, ou umasubseqüência dessas, em que o polipeptídeo ou peptídeo heterólogo nãoestá associado naturalmente com o peptídeo de sinal (SP), em que opcio-nalmente o peptídeo de sinal (SP) não é derivado de uma xilanase, manana-se e/ou glicanase, e opcionalmente o polipeptídeo ou peptídeo heterólogo éamino terminal a, carbóxi terminal a, ou está em ambas as extremidades dopeptídeo de sinal (SP) ou de um domínio catalítico (CD) de uma xilanase,mananase e/ou glicanase.

85. Ácido nucléico isolado, sintético ou recombinante que codifi-ca um polipeptídeo quimérico, em que o polipeptídeo quimérico compreendepelo menos um primeiro domínio que compreende um peptídeo de sinal (SP)e pelo menos um segundo domínio que compreende um polipeptídeo oupeptídeo heterólogo, em que o peptídeo de sinal (SP) compreende uma se-qüência de sinal descrita como definida na reivindicação 83.

86. Método de aumentar a termotolerância ou termoestabilidadede um polipeptídeo de xilanase, mananase e/ou glicanase, o método com-preendendo glicosilar uma xilanase, mananase e/ou glicanase, em que opolipeptídeo compreende pelo menos trinta aminoácidos contíguos de umpolipeptídeo descrito como definido em qualquer uma das reivindicações 30a 45, ou um polipeptídeo codificado por um ácido nucléico que compreendeuma seqüência descrita como definida em qualquer uma das reivindicações- 1 a 14, aumentando assim a termotolerância ou termoestabilidade de umaxilanase, mananase e/ou glicanase.

87. Método para superexpressar uma xilanase, mananase e/ouglicanase em uma célula, compreendendo expressar um vetor que compre-ende uma seqüência de ácido nucléico descrita como definida em qualqueruma das reivindicações 1 a 14, ou um ácido nucléico que codifica pelo me-nos trinta aminoácidos contíguos de um polipeptídeo descrito como definidoem qualquer uma das reivindicações 30 a 45, em que a superexpressão éefetuada pelo uso de um promotor de alta atividade, um vetor bicistrônico oupor amplificação gênica do vetor.

88. Método de fazer uma planta transgênica que compreende asseguintes etapas:(a) introduzir uma seqüência de ácido nucléico heterólogo nacélula, em que a seqüência de ácido nucléico heterólogo compreende umaseqüência descrita como definida em qualquer uma das reivindicações 1 a 14, ou um ácido nucléico que codifica pelo menos trinta aminoácidos contí-guos de um polipeptídeo descrito como definido em qualquer uma das rei-vindicações 30 a 45, produzindo assim uma célula de planta transformada;(b) produzir uma planta transgênica a partir da célula transfor-mada,em que opcionalmente a etapa (a) compreende ainda introduzira seqüência de ácido nucléico heterólogo por eletroporação ou microinjeçãode protoplastos de célula de planta,e opcionalmente a etapa (a) compreende introduzir a seqüênciade ácido nucléico heterólogo diretamente em um tecido de planta por bom-bardeio de partículas de DNA ou pelo uso de um hospedeiro de Agrobacteri-um tumefaciens.

89. Método de expressar uma seqüência de ácido nucléico hete-rólogo em uma célula de planta que compreende as seguintes etapas:(a) transformar a célula de planta com uma seqüência de ácidonucléico heterólogo operativamente ligada a um promotor, em que o ácidonucléico heterólogo compreende uma seqüência descrita como definida emqualquer uma das reivindicações 1 a 14, ou um ácido nucléico que codificapelo menos trinta aminoácidos contíguos de um polipeptídeo descrito comodefinido em qualquer uma das reivindicações 30 a 45;(b) cultivar a planta sob condições em que a seqüência de ácidonucléico heterólogo é expressa na célula de planta.

90. Método para hidrolisar, liqüefazer, quebrar ou romper umacomposição que compreende xilano, compreendendo as seguintes etapas:(a) fornecer um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase, em que o polipeptídeo compreende uma seqüên-cia descrita como definida em qualquer uma das reivindicações 30 a 45, ou opolipeptídeo codificado pelo ácido nucléico que compreende uma seqüênciadescrita como definida em qualquer uma das reivindicações 1 a 14, ou frag-mentos enzimaticamente ativos dessas;(b) fornecer uma composição que compreende um xilano; e(c) colocar o polipeptídeo da etapa (a) em contato com a com-posição da etapa (b) sob condições em que a xilanase, mananase e/ou gli-canase hidrolisa, liqüefaz, quebra ou rompe a composição que compreendexilano,em que opcionalmente a composição compreende uma célulade planta, uma célula bacteriana, uma célula de levedura, uma célula de in-seto, ou uma célula de animal.

91. Massa de farinha ou um produto de pão que compreendeum polipeptídeo que tem uma atividade de xilanase, mananase e/ou glicana-se, em que o polipeptídeo compreende uma seqüência descrita como defini-da em qualquer uma das reivindicações 30 a 45, ou o polipeptídeo é codifi-cado por um ácido nucléico que compreende uma seqüência descrita de a-cordo com qualquer uma das reivindicações 1 a 14, ou um fragmento enzi-maticamente ativo dessas.

92. Método de acondicionar massa de farinha que compreendecolocar uma massa de farinha ou um produto de pão em contato com pelomenos um polipeptídeo que tem uma atividade de xilanase, mananase e/ouglicanase, em que o polipeptídeo compreende uma seqüência descrita co-mo definida em qualquer uma das reivindicações 30 a 45, ou o polipeptídeoé codificado por um ácido nucléico que compreende uma seqüência descri-ta como definida em qualquer uma das reivindicações 1 a 14, ou um frag-mento enzimaticamente ativo dessas, sob condições suficientes para a-condicionar a massa de farinha.

93. Bebida que compreende um polipeptídeo que tem uma ativi-dade de xilanase, mananase e/ou glicanase, em que o polipeptídeo compre-ende uma seqüência descrita como definida em qualquer uma das reivindi-cações 30 a 45, ou o polipeptídeo é codificado por um ácido nucléico quecompreende uma seqüência descrita de acordo com qualquer uma das rei-vindicações 1 a 14.

94. Método de produção de bebida que compreende administra-ção de pelo menos um polipeptídeo que tem uma atividade de xilanase, ma-nanase e/ou glicanase, em que o polipeptídeo compreende uma seqüênciadescrita como definida em qualquer uma das reivindicações 30 a 45, ou opolipeptídeo é codificado por um ácido nucléico que compreende uma se-qüência descrita como definida em qualquer uma das reivindicações 1 a 14,ou um fragmento enzimaticamente ativo dessas, a uma bebida ou precursorde bebida sob condições suficientes para diminuir a viscosidade da bebida,em que opcionalmente a bebida ou o precursor de bebida é ummosto ou uma cerveja.

95. Alimento, uma ração, ou um suplemento nutricional quecompreende um polipeptídeo que tem uma atividade de xilanase, mananasee/ou glicanase, em que o polipeptídeo compreende uma seqüência descritacomo definida em qualquer uma das reivindicações 30 a 45, ou o polipeptí-deo é codificado por um ácido nucléico que compreende uma seqüênciadescrita como definida em qualquer uma das reivindicações 1 a 14.

96. Método para utilizar uma xilanase, mananase e/ou glicanasecomo um suplemento nutricional em uma dieta animal, o método compreen-dendo:preparar um suplemento nutricional que contém uma enzimaxilanase, mananase e/ou glicanase que compreende pelo menos trinta ami-noácidos contíguos de um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase, em que o polipeptídeo compreende uma seqüên-cia descrita como definida em qualquer uma das reivindicações 30 a 45, ou opolipeptídeo é codificado por um ácido nucléico que compreende uma se-qüência descrita qualquer uma das reivindicações 1 a 14, ou fragmentos en-zimaticamente ativos dessas; eadministrar o suplemento nutricional a um animal para aumentara utilização de um xilano contido em uma ração ou alimento ingerido peloanimal,em que opcionalmente o animal é um animal humano ou não-humano, e opcionalmente o animal é um ruminante ou um animal monogás-trico.

97. Método de acordo com a reivindicação 96, em que a enzimaxilanase, mananase e/ou glicanase é preparada pela expressão de um poli-nucleotídeo que codifica a xilanase, mananase e/ou glicanase em um orga-nismo selecionado a partir do grupo que consiste em uma bactéria, uma le-vedura, uma planta, um inseto, um fungo e um animal, em que opcionalmen-te o organismo é selecionado a partir do grupo que consiste em S. pombe,S. cerevisiae, Pichia pastoris, E. coli, B. cereus Streptomyces sp., Bacillussp. e Lactobacillus sp.

98. Matriz de liberação de enzima comestível que compreendeum polipeptídeo que tem uma atividade de xilanase, mananase e/ou glicana-se, em que o polipeptídeo compreende uma seqüência descrita como defini-da em qualquer uma das reivindicações 30 a 45, ou o polipeptídeo é codifi-cado por um ácido nucléico que compreende uma seqüência descrita comodefinida em qualquer uma das reivindicações 1 a 14, ou um fragmento enzi-maticamente ativo dessa,em que opcionalmente a xilanase, mananase e/ou glicanase étermoestável.

99. Método para liberar um suplemento de xilanase, mananasee/ou glicanase a um animal, o método compreendendo:preparar uma matriz de liberação de enzima comestível na for-ma de péletes que compreendem um veículo granulado comestível e umaenzima xilanase, mananase e/ou glicanase recombinante termoestável, emque os péletes dispersam facilmente a enzima xilanase, mananase e/ou gli-canase neles em meio aquoso, eadministrar a matriz de liberação de enzima comestível ao ani-mal;em que a enzima xilanase, mananase e/ou glicanase recombi-nante compreende uma seqüência descrita como definida em qualquer umadas reivindicações 30 a 45, ou o polipeptídeo é codificado por um ácido nu-cléico que compreende uma seqüência descrita como definida em qualqueruma das reivindicações 1 a 14,em que opcionalmente o veículo comestível granulado compre-ende um veículo selecionado a partir do grupo que consiste em um germede grão, um germe de grão que tem o óleo extraído, um feno, uma alfafa,grama (Timothy), uma casca de soja, uma farinha de semente de girassol, eum farelo de trigo,e opcionalmente o veículo comestível compreende germe degrão que tem o óleo extraído, ou opcionalmente a enzima xilanase, a mana-nase e/ou a glicanase é glicosilada para fornecer termoestabilidade em con-dições de peletização, e opcionalmente a matriz de liberação é formada porpeletizar uma mistura que compreende um germe de grão e uma xilanase, amananase e/ou a glicanase, e opcionalmente as condições de peletizaçãocompreendem aplicação vapor, e opcionalmente as condições de peletiza-ção compreendem a aplicação de uma temperatura acima de cerca de 80°Cpor cerca de 5 minutos e a enzima retém uma atividade específica de pelomenos 350 a cerca de 900 unidades por miligrama de enzima.

100. Composição detergente que compreende um polipeptídeoque tem uma atividade de xilanase, mananase e/ou glicanase, em que o po-lipeptídeo compreende uma seqüência descrita como definida em qualqueruma das reivindicações 30 a 45, ou o polipeptídeo é codificado por um ácidonucléico que compreende uma seqüência descrita como definida em qual-quer uma das reivindicações 1 a 14, ou um fragmento enzimaticamente ativodessa.

101. Composição farmacêutica que compreende um polipeptí-deo que tem uma atividade de xilanase, mananase e/ou glicanase, em que opolipeptídeo compreende uma seqüência descrita como definida em qual-quer uma das reivindicações 30 a 45, ou o polipeptídeo é codificado por umácido nucléico que compreende uma seqüência descrita como definida emqualquer uma das reivindicações 1 a 14, ou um fragmento enzimaticamenteativo dessa.

102. Método para eliminar ou proteger animais de um microor-ganismo que compreende um xilano, compreendendo administrar um poli-peptídeo que tem uma atividade de xilanase, mananase e/ou glicanase, emque o polipeptídeo compreende uma seqüência descrita como definida emqualquer uma das reivindicações 30 a 45, ou o polipeptídeo é codificado porum ácido nucléico que compreende uma seqüência descrita como definidaem qualquer uma das reivindicações 1 a 14, ou um fragmento enzimatica-mente ativo dessa,em que opcionalmente o microorganismo é uma bactéria ouuma salmonela.

103. Método para reduzir a quantidade de Iignina (deslignifica-ção), ou solubilizar uma lignina, em um papel ou produto de papel, uma ma-deira, polpa de madeira, ou produto de madeira, ou uma composição de re-ciclagem de madeira ou papel, que compreende colocar o papel ou produtode papel, madeira, polpa de madeira, ou produto de madeira, ou composiçãode reciclagem de papel ou madeira em contato com um polipeptídeo quetem uma atividade de xilanase, mananase e/ou glicanase, em que o polipep-tídeo compreende uma seqüência descrita como definida em qualquer umadas reivindicações 30 a 45, ou o polipeptídeo é codificado por um ácido nu-cléico que compreende uma seqüência descrita como definida em qualqueruma das reivindicações 1 a 14, ou um fragmento enzimaticamente ativo des-sa.

104. Método para hidrolisar hemiceluloses em uma madeira,produto de madeira, polpa de papel, produto de papel ou resíduo de papelque compreende colocar a madeira, produto de madeira, polpa de papel,produto de papel ou resíduo de papel em contato com um polipeptídeo quetem uma atividade de xilanase, mananase e/ou glicanase, em que o polipep-tídeo compreende uma seqüência descrita como definida em qualquer umadas reivindicações 30 a 45, ou o polipeptídeo é codificado por um ácido nu-cléico que compreende uma seqüência descrita como definida em qualqueruma das reivindicações 1 a 14, ou um fragmento enzimaticamente ativo des-sa.

105. Método para alvejante enzimático de polpa de papel, câ-nhamo ou Iinho que compreende colocar a polpa de papel, cânhamo ou Iinhoem contato com uma xilanase, mananase e/ou glicanase e um agente dealvejamento, em que a xilanase, mananase e/ou glicanase tem uma seqüên-cia descrita como definida em qualquer uma das reivindicações 30 a 45, ou axilanase, a mananase e/ou a glicanase é codificada por um ácido nucléicoque compreende uma seqüência descrita como definida em qualquer umadas reivindicações 1 a 14, ou um fragmento enzimaticamente ativo dessa, em que opcionalmente o agente de alvejamento compreendeoxigênio ou peróxido de hidrogênio.

106. Método para o alvejante de uma polpa de Iingocelulose quecompreende colocar a polpa de Iignocelulose em contato com uma xilanase,mananase e/ou glicanase, em que a xilanase, mananase e/ou glicanase temuma seqüência descrita como definida em qualquer uma das reivindicações-30 a 45, ou a xilanase, a mananase e/ou a glicanase é codificada por umácido nucléico que compreende uma seqüência descrita como definida emqualquer uma das reivindicações 1 a 14, ou um fragmento enzimaticamenteativo dessa.

107. Método para remoção enzimática de tintas de papel, resí-duo de papel, produto reciclado de papel, remoção de toner de papéis usa-dos impressos sem contato ou misturas de papéis usados impressos porcontato e sem contato, que compreende colocar em contato o papel, resíduode papel, produto reciclado de papel, papel usado impresso sem contato oupapel usado impresso por contato com uma xilanase, mananase e/ou glica-nase, em que a xilanase, mananase e/ou glicanase tem uma seqüência des-crita como definida em qualquer uma das reivindicações 30 a 45, ou a xila-nase, mananase e/ou glicanase é codificada por um ácido nucléico quecompreende uma seqüência descrita como definida em qualquer uma dasreivindicações 1 a 14, ou um fragmento enzimaticamente ativo dessas.

108. Método para alvejar um tecido, fio, roupa ou têxtil que com-preende colocar o tecido, fio, roupa ou têxtil em contato com uma xilanase,mananase e/ou glicanase sob condições adequadas para produzir um alve-jante do têxtil, em que a xilanase, mananase e/ou glicanase tem uma se-qüência descrita como definida em qualquer uma das reivindicações 30 a 45,ou a xilanase, mananase e/ou glicanase é codificada por um ácido nucléicoque compreende uma seqüência descrita como definida em qualquer umadas reivindicações 1 a 14, ou um fragmento enzimaticamente ativo dessa,em que opcionalmente o tecido, fio, roupa ou têxtil compreendeum tecido, fio, roupa ou têxtil celulósico sem algodão.

109. Método para alvejar ou remover tinta de jornais que com-preende colocar o jornal em contato com uma xilanase, mananase e/ou gli-canase, em que a xilanase, a mananase e/ou a glicanase tem uma seqüên-cia descrita como definida em qualquer uma das reivindicações 30 a 45, ou axilanase, a mananase e/ou a glicanase é codificada por um ácido nucléicoque compreende uma seqüência descrita como definida em qualquer umadas reivindicações 1 a 14, ou um fragmento enzimaticamente ativo dessa.

110. Madeira, polpa de madeira, produto de madeira, polpa depapel, produto de papel, jornal ou resíduo de papel que compreende um po-lipeptídeo que tem uma seqüência descrita como definida em qualquer umadas reivindicações 30 a 45, ou um polipeptídeo codificado por um ácido nu-cléico que compreende uma seqüência descrita como definida em qualqueruma das reivindicações 1 a 14, ou um fragmento enzimaticamente ativo dessa.

111. Tecido, fio, roupa ou têxtil que compreende um polipeptí-deo que tem uma seqüência descrita como definida em qualquer uma dasreivindicações 30 a 45, ou um polipeptídeo codificado por um ácido nucléicoque compreende uma seqüência descrita como definida em qualquer umadas reivindicações 1 a 14, ou um fragmento enzimaticamente ativo dessas,em que opcionalmente o tecido, fio, roupa ou têxtil compreendeum tecido, fio, roupa ou têxtil celulósico sem algodão.

112. Método para reduzir Iignina em uma madeira ou produtode madeira que compreende colocar a madeira ou produto de madeiraem contato com um polipeptídeo que tem uma atividade de xilanase, mana-nase e/ou glicanase, em que o polipeptídeo tem uma seqüência descritacomo definida em qualquer uma das reivindicações 30 a 45, ou o polipeptí-deo é codificado por um ácido nucléico que compreende uma seqüênciadescrita como definida em qualquer uma das reivindicações 1 a 14, ou umfragmento enzimaticamente ativo dessa.

113. Método para reduzir Iignina em uma madeira, uma polpa demadeira, uma polpa Kraft, um papel, um produto de papel ou uma polpa depapel sob condições de alta temperatura e pH básico, o método compreen-dendo as seguintes etapas:(a) fornecer pelo menos um polipeptídeo que tem pelo menosuma atividade de xilanase, mananase e/ou glicanase, em que o polipeptídeoretém uma atividade de xilanase, mananase e/ou glicanase sob condiçõesque compreendem uma temperatura de pelo menos cerca de 85°C e um pHbásico de pelo menos cerca de pH 11,em que o polipeptídeo compreende uma xilanase, mananasee/ou glicanase que tem uma seqüência descrita como definida em qualqueruma das reivindicações 30 a 45, ou a xilanase, mananase e/ou glicanase écodificada por um ácido nucléico que compreende uma seqüência descritacomo definida em qualquer uma das reivindicações 1 a 14, ou um fragmentoenzimaticamente ativo dessa;(b) fornecer uma madeira, polpa de madeira, polpa Kraft, papel,produto de papel ou polpa de papel; que compreende lignina; e(c) colocar a madeira, polpa de madeira, polpa Kraft, papel, pro-duto de papel ou polpa de papel em contato com o polipeptídeo da etapa (a)sob condições que compreendem uma temperatura de pelo menos cerca de85°C e um pH básico de pelo menos cerca de pH 11, em que o polipeptídeoreduz a lignina na madeira, polpa de madeira, polpa Kraft, papel, produto depapel ou polpa de papel.

114. Método para tratar uma madeira, uma polpa de madeira,uma polpa Kraft, um produto de papel, um papel ou uma polpa de papel sobcondições de alta temperatura e pH básico, o método compreendendo asseguintes etapas:(a) fornecer pelo menos um polipeptídeo que tem uma atividadede xilanase, mananase e/ou glicanase, em que o polipeptídeo retém umaatividade de xilanase, mananase e/ou glicanase sob condições que compre-endem uma temperatura de pelo menos cerca de 85°C e um pH básico depelo menos cerca de pH 11,em que o polipeptídeo compreende uma xilanase, mananasee/ou glicanase que tem uma seqüência descrita como definida em qualqueruma das reivindicações 30 a 45, ou a xilanase, mananase e/ou glicanase écodificada por um ácido nucléico que compreende uma seqüência descritacomo definida em qualquer uma das reivindicações 1 a 14, ou um fragmentoenzimaticamente ativo dessa;(b) fornecer uma madeira, uma polpa de madeira, uma polpaKraft, um papel, um produto de papel ou uma polpa de papel; e(c) colocar a madeira, polpa de madeira, polpa Kraft, papel, pro-duto de papel ou polpa de papel em contato com polipeptídeo da etapa (a)sob condições que compreendem uma temperatura de pelo menos cerca de-85°C e um pH básico de pelo menos cerca de pH 11,em que o polipeptídeo catalisa a hidrólise de compostos na ma-deira, polpa de madeira, polpa Kraft, papel, produto de papel ou polpa depapel,e em que opcionalmente a madeira, polpa de madeira, polpaKraft, papel, produto de papel ou polpa de papel compreende uma madeiramole e madeira dura, ou a madeira, polpa de madeira, polpa Kraft, papel oupolpa de papel é derivada de uma madeira mole e madeira dura;e em que opcionalmente após o tratamento a polpa tem umaconsistência de pelo menos cerca de 10%, ou de pelo menos cerca de 32%.

115. Método para descobrir uma madeira, uma polpa de madei-ra, uma polpa Kraft, um papel, um produto de papel ou uma polpa de papelsob condições de alta temperatura e pH básico, o método compreendendoas seguintes etapas:(a) fornecer pelo menos um polipeptídeo que tem uma atividadede xilanase, mananase e/ou glicanase, em que o polipeptídeo retém umaatividade de xilanase, a mananase e/ou a glicanase sob condições quecompreendem uma temperatura de pelo menos cerca de 85°C e um pH bá-sico de pelo menos cerca de pH 11,em que o polipeptídeo compreende uma xilanase, mananasee/ou glicanase que tem uma seqüência descrita como definida em qualqueruma das reivindicações 30 a 45, ou a xilanase, mananase e/ou glicanase écodificada por um ácido nucléico que compreende uma seqüência descritacomo definida em qualquer uma das reivindicações 1 a 14, ou um fragmentoenzimaticamente ativo dessa;(b) fornecer uma madeira, uma polpa de madeira, uma polpaKraft1 um papel, um produto de papel ou uma polpa de papel; e (c) colocar amadeira, polpa de madeira, polpa Kraft, papel, produto de papel ou polpa depapel em contato com o polipeptídeo da etapa (a) sob condições que com-preendem uma temperatura de pelo menos cerca de 85°C e um pH básicode pelo menos cerca de pH 11,em que o polipeptídeo catalisa a hidrólise de compostos na ma-deira, polpa de madeira, polpa Kraft, papel, produto de papel ou polpa depapel, branqueando assim a madeira, polpa de madeira, polpa Kraft, papel,produto de papel ou polpa de papel.

116. Método para reduzir o uso de químicos branqueadores emum processo de alvejante de madeira, polpa de madeira, polpa Kraft, papel,produto de papel ou polpa de papel sob condições de alta temperatura e pHbásico, o método compreendendo as seguintes etapas:(a) fornecer pelo menos um polipeptídeo que tem uma atividadede xilanase, mananase e/ou glicanase, em que o polipeptídeo retém umaatividade de xilanase, a mananase e/ou a glicanase sob condições quecompreendem uma temperatura de pelo menos cerca de 85°C e um pH bá-sico de pelo menos cerca de pH 11,em que o polipeptídeo compreende uma xilanase, mananasee/ou glicanase que tem uma seqüência descrita como definida em qualqueruma das reivindicações 30 a 45, ou a xilanase, mananase e/ou glicanase écodificada por um ácido nucléico que compreende uma seqüência descritacomo definida em qualquer uma das reivindicações 1 a 14, ou um fragmentoenzimaticamente ativo dessa;(b) fornecer uma madeira, uma polpa de madeira, uma polpaKraft, um papel, um produto de papel ou uma polpa de papel; e(c) colocar a madeira, polpa de madeira, polpa Kraft, papel, pro-duto de papel ou polpa de papel em contato com o polipeptídeo da etapa (a)sob condições que compreendem uma temperatura de pelo menos cerca de-85°C e um pH básico de pelo menos cerca de pH 11,em que o polipeptídeo catalisa a hidrólise de compostos na ma-deira, polpa de madeira, polpa Kraft, papel, produto de papel ou polpa depapel, bioalvejando assim a madeira, polpa de madeira, polpa Kraft, papel,produto de papel ou polpa de papel e reduzindo o uso de químicos branque-adores no processo de alvejante;em quê opcionalmente o químico branqueador compreende clo-ro, dióxido de cloro, um cáustico, um peróxido ou qualquer combinação des-ses.

117. Método para remoção de tinta de papel ou polpa sob con-dições de alta temperatura e pH básico, o método compreendendo as se-guintes etapas:(a) fornecer pelo menos um polipeptídeo que tem uma atividadede xilanase, mananase e/ou glicanase, em que o polipeptídeo retém umaatividade de xilanase, a mananase e/ou a glicanase sob condições quecompreendem uma temperatura de pelo menos cerca de 85°C e um pH bá-sico de pelo menos cerca de pH 11,em que o polipeptídeo compreende uma xilanase, mananasee/ou glicanase que tem uma seqüência descrita como definida em qualqueruma das reivindicações 30 a 45, ou a xilanase, mananase e/ou glicanase écodificada por um ácido nucléico que compreende uma seqüência descritacomo definida em qualquer uma das reivindicações 1 a 14, ou um fragmentoenzimaticamente ativo dessa; (b) fornecer uma madeira, polpa de madeira, polpa Kraft, papel,um produto de papel ou polpa de papel com tinta; e(c) colocar a madeira, polpa de madeira, polpa Kraft, papel, pro-duto de papel ou polpa de papel em contato com o polipeptídeo da etapa (a)sob condições que compreendem uma temperatura de pelo menos cerca de-85°C e um pH básico de pelo menos cerca de pH 11,em que o polipeptídeo catalisa a hidrólise de compostos na ma-deira, polpa de madeira, polpa Kraft, papel ou polpa de papel, facilitando as-sim a remoção da tinta da madeira, polpa de madeira, polpa Kraft, papel,produto de papel ou polpa de papel.

118. Método para liberar Iignina de uma madeira, uma polpa demadeira, uma polpa Kraft, um papel, um produto de papel ou uma polpa depapel sob condições de alta temperatura e pH básico, o método compreen-dendo as seguintes etapas:(a) fornecer pelo menos um polipeptídeo que tem uma atividadede xilanase, mananase e/ou glicanase, em que o polipeptídeo retém umaatividade de xilanase, a mananase e/ou a glicanase sob condições quecompreendem uma temperatura de pelo menos cerca de 85°C e um pH bá-sico de pelo menos cerca de pH 11,em que o polipeptídeo compreende uma xilanase, mananasee/ou glicanase que tem uma seqüência descrita como definida em qualqueruma das reivindicações 30 a 45, ou uma xilanase, mananase e/ou glicanaseé codificada por um ácido nucléico que compreende uma seqüência descritacomo definida em qualquer uma das reivindicações 1 a 14, ou um fragmentoenzimaticamente ativo dessa;(b) fornecer uma madeira, polpa de madeira, polpa Kraft, papel,produto de papel ou polpa de papel com lignina; e(c) colocar a madeira, polpa de madeira, polpa Kraft, papel, pro-duto de papel ou a polpa de papel da etapa (b) em contato com o polipeptí-deo da etapa (a) sob condições que compreendem uma temperatura de pelomenos cerca de 85°C e um pH básico de pelo menos cerca de pH 11,em que o polipeptídeo catalisa a hidrólise de compostos na ma-deira, polpa de madeira, polpa Kraft, papel, produto de papel ou polpa depapel, facilitando assim a liberação de lignina da madeira, polpa de madeira,polpa Kraft, papel, produto de papel ou polpa de papel; em que opcional-mente após o tratamento a polpa tem uma consistência de cerca de 10%.

119. Composição que compreende uma madeira, a polpa demadeira, uma polpa Kraft, um papel, um produto de papel ou uma polpa depapel que compreende um polipeptídeo que tem uma atividade de xilanase,mananase e/ou glicanase, em que o polipeptídeo tem uma seqüência descri-ta como definida em qualquer uma das reivindicações 30 a 45, ou o polipep-tídeo é codificado por um ácido nucléico que compreende uma seqüênciadescrita como definida em qualquer uma das reivindicações 1 a 14, ou umfragmento enzimaticamente ativo dessa,em que opcionalmente a madeira, polpa de madeira, polpa Kraft,papel, produto de papel ou polpa de papel compreende uma madeira mole euma madeira dura, ou a madeira, polpa de madeira, polpa Kraft, papel, pro-duto de papel ou polpa de papel é derivado de uma madeira mole e de umaI madeira dura.

120. Método para fazer etanol que compreende colocar umacomposição que compreende amido em conato com um polipeptídeo quetem uma atividade de xilanase, mananase e/ou glicanase, em que o polipep-tídeo tem uma seqüência descrita como definida em qualquer uma das rei-vindicações 30 a 45, ou o polipeptídeo é codificado por um ácido nucléicoque compreende uma seqüência descrita como definida em qualquer umadas reivindicações 1 a 14, ou um fragmento enzimaticamente ativo dessa.

121. Composição que compreende um etanol e um polipeptídeoque tem uma atividade de xilanase, mananase e/ou glicanase, em que o po-lipeptídeo tem uma seqüência descrita como definida em qualquer uma dasreivindicações 30 a 45, ou o polipeptídeo é codificado por um ácido nucléicoque compreende uma seqüência descrita como definida em qualquer umadas reivindicações 1 a 14, ou um fragmento enzimaticamente ativo dessa.

122. Método para fazer etanol sob condições de alta temperatu-ra e pH básico, o método compreendendo as seguintes etapas:(a) fornecer pelo menos um polipeptídeo que tem uma atividadede xilanase, mananase e/ou glicanase, em que o polipeptídeo retém umaatividade de xilanase, mananase e/ou glicanase sob condições que compre-endem uma temperatura de pelo menos cerca de 85°C e um pH básico depelo menos cerca de pH 11,em que o polipeptídeo compreende uma xilanase, uma manana-se e/ou uma glicanase que tem uma seqüência descrita como definida emqualquer uma das reivindicações 30 a 45, ou a xilanase, mananase e/ou gli-canase é codificada por um ácido nucléico que compreende uma seqüênciadescrita como definida em qualquer uma das reivindicações 1 a 14, ou umfragmento enzimaticamente ativo dessa;(b) fornecer uma composição que compreende amido compre-endendo uma madeira, polpa de madeira, polpa Kraft, papel, um produto depapel ou polpa de papel; e(c) colocar a composição da etapa (b) em contato com o poli-peptídeo da etapa (a) sob condições que compreendem uma temperatura depelo menos cerca de 85°C e um pH básico de pelo menos cerca de pH 11,em que o polipeptídeo catalisa a hidrólise de compostos na madeira, polpade madeira, polpa Kraft, papel ou polpa de papel, gerando assim etanol apartir da madeira, polpa de madeira, polpa Kraft, papel, produto de papel oupolpa de papel.

123. Solução de limpeza de lentes de contato que compreendeum polipeptídeo que tem uma atividade de xilanase, mananase e/ou glicana-se, em que o polipeptídeo tem uma seqüência descrita como definida emqualquer uma das reivindicações 30 a 45, ou o polipeptídeo é codificado porum ácido nucléico que compreende uma seqüência descrita como definidaem qualquer uma das reivindicações 1 a 14, ou um fragmento enzimatica-mente ativo dessa.

124. Solução de tratamento de resíduos que compreende umpolipeptídeo que tem uma atividade de xilanase, mananase e/ou glicanase,em que o polipeptídeo tem uma seqüência descrita como definida em qual-quer uma das reivindicações 30 a 45, ou o polipeptídeo é codificado por umácido nucléico que compreende uma seqüência descrita como definida emqualquer uma das reivindicações 1 a 14, ou um fragmento enzimaticamenteativo dessa.

125. Sabão em barra ou líquido que compreende um polipeptí-deo que tem uma atividade de xilanase, mananase e/ou glicanase, em que opolipeptídeo tem uma seqüência descrita como definida em qualquer umadas reivindicações 30 a 45, ou o polipeptídeo é codificado por um ácido nu-cléico que compreende uma seqüência descrita como definida em qualqueruma das reivindicações 1 a 14, ou um fragmento enzimaticamente ativo dessa.

126. Goma de mascar, pastilha ou doce que compreende umpolipeptídeo que tem uma atividade de xilanase, mananase e/ou glicanase,em que o polipeptídeo tem uma seqüência descrita como definida em qual-quer uma das reivindicações 30 a 45, ou o polipeptídeo é codificado por um/ ácido nucléico que compreende uma seqüência descrita como definida emqualquer uma das reivindicações 1 a 14, ou um fragmento enzimaticamenteativo dessa.

127. Goma de mascar que compreende um polipeptídeo quetem uma atividade de xilanase, mananase e/ou glicanase, em que o polipep-tídeo tem uma seqüência descrita como definida em qualquer uma das rei-vindicações 30 a 45, ou o polipeptídeo é codificado por um ácido nucléicoque compreende uma seqüência descrita como definida em qualquer umadas reivindicações 1 a 14, ou um fragmento enzimaticamente ativo dessa.

128. Glicosidase, xilanase e/ou glicanase quimérica que com-preende (a) uma seqüência descrita como definida em qualquer uma dasreivindicações 30 a 45 e pelo menos um módulo de ligação a carboidrato(CBM) heterólogo; ou (b) a glicosidase, xilanase e/ou glicanase quimérica de(a), em que opcionalmente o CBM compreende um CBM3a, CBM3b, CBM4,CBM6, CBM22 ou X14.

129. Glicosidase, xilanase e/ou glicanase quimérica que com-preende pelo menos um módulo de ligação a carboidrato (CBM) heterólogo,em que o CBM compreende uma subseqüência de ligação a carboidrato deuma seqüência descrita como definida em qualquer uma das reivindicações- 30 a 45, ou uma subseqüência de ligação a carboidrato que compreende umX14 como descrito na Tabela 9.

130. Método para desenhar uma glicosidase, xilanase, uma ma-nanase e/ou uma glicanase quimérica que tem uma nova especificidade deligação a carboidrato ou uma especificidade de ligação a carboidrato aumen-tada, que compreende inserir um módulo de ligação a carboidrato (CBM)heterólogo ou endógeno adicional em uma glicosidase, em que o CBM com-preende uma subseqüência de ligação a carboidrato de uma seqüência des-crita como definida em qualquer uma das reivindicações 30 a 45, ou a sub-seqüência de ligação a carboidrato que compreende um X14 descrito na Ta-bela 9.

131. Mistura ou coquetel de enzimas que compreendem (a) pelomenos uma enzima de acordo com qualquer uma das reivindicações 30 a-45, e um ou mais outras enzimas (s); (b) a mistura ou coquetel de (a), emque a uma ou mais outra(s) enzimas é outra xilanase, mananase e/ou glica-nase, celulases, lipases, esterases, proteases, ou endoglicosidases, endo-beta.-1,4-glicanases, beta-glicanases, endo-beta-1,3(4)-glicanases, cutina-ses, peroxidases, catalases, lacases, amilases, glicoamilases, pectinases,redutases, oxidases, fenoloxidases, ligninases, pululanases, arabinanases,hemicelulases, mananases, xiloglicanases, xilanase, mananase e/ou glica-nases, pectina acetil esterases, ramnogalacturonano acetil esterases, poliga-lacturonases, ramnogalacturonases, galactanases, pectina liases, pectinameti leste rases, celobioidrolases e/ou transglutaminases.

132. Processo para hidrolisar hemiceluloses em qualquer com-posto orgânico, planta ou madeira ou produto ou subproduto de madeira,resíduos de madeira, polpa de papel, produto de papel ou resíduo ou sub-produto de papel que compreende o uso de uma mistura ou coquetel de en-zimas de acordo com a reivindicação 131.

133. Método para aumentar o desempenho de uma xilanase emum pH alto (alcalino) que compreende (a) remover resíduos de aminoácido"EGG" (ou o equivalente) próximos ou na extremidade C' terminal de umaseqüência de xilanase; (b) o método de (a), em que o "EGG" (ou o equiva-lente) é removido logo (imediatamente) após o domínio de glicosil hidrolaseda xilanase a ser modificada; ou (c) o método de (a) ou (b), em que a xilana-se compreende um polipeptídeo de acordo com qualquer uma das reivindi-cações 30 a 45.