BRPI0809143B1 - método in vitro para identificar um indivíduo que apresente um risco alterado para desenvolver doença cardíaca coronária (chd) ou aneurisma/dissecção - Google Patents

método in vitro para identificar um indivíduo que apresente um risco alterado para desenvolver doença cardíaca coronária (chd) ou aneurisma/dissecção Download PDF

Info

Publication number
BRPI0809143B1
BRPI0809143B1 BRPI0809143-9A BRPI0809143A BRPI0809143B1 BR PI0809143 B1 BRPI0809143 B1 BR PI0809143B1 BR PI0809143 A BRPI0809143 A BR PI0809143A BR PI0809143 B1 BRPI0809143 B1 BR PI0809143B1
Authority
BR
Brazil
Prior art keywords
snp
nucleic acid
individual
snps
allele
Prior art date
Application number
BRPI0809143-9A
Other languages
English (en)
Inventor
Olga Iakoubova
James Devlin
Carmen Tong
Charles Rowland
Original Assignee
Celera Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Celera Corporation filed Critical Celera Corporation
Publication of BRPI0809143A2 publication Critical patent/BRPI0809143A2/pt
Publication of BRPI0809143B1 publication Critical patent/BRPI0809143B1/pt
Publication of BRPI0809143B8 publication Critical patent/BRPI0809143B8/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/10Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/914Hydrolases (3)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/04Screening involving studying the effect of compounds C directly on molecule A (e.g. C are potential ligands for a receptor A, or potential substrates for an enzyme A)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/32Cardiovascular disorders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/32Cardiovascular disorders
    • G01N2800/324Coronary artery diseases, e.g. angina pectoris, myocardial infarction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/32Cardiovascular disorders
    • G01N2800/329Diseases of the aorta or its branches, e.g. aneurysms, aortic dissection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/14Heterocyclic carbon compound [i.e., O, S, N, Se, Te, as only ring hetero atom]
    • Y10T436/142222Hetero-O [e.g., ascorbic acid, etc.]
    • Y10T436/143333Saccharide [e.g., DNA, etc.]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Pathology (AREA)
  • Urology & Nephrology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Cardiology (AREA)
  • Vascular Medicine (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)

Abstract

POLIMORFISMO GENÉTICOS ASSOCIADOS COM EVENTOS CORONÁRIOS E RESPOSTA A FÁRMACO, MÉTODOS DE DETECÇÃO E USOS DOS MESMOS A presente invenção proporciona composições e métodos com base em polimorfísmos genéticos que são associados com doença cardíaca coronariana (particularmente infarto do miocárdio), aneurisma/dissecção, e/ou tratamento de resposta a fármaco, particularmente tratamento com estatina. Por exemplo, a presente invenção se refere a moléculas de ácido nucléico contendo os polimorfismo, proteínas variantes codificadas pelas referidas moléculas de acido nucléico, reagentes para detectar as moléculas polimórficas de ácido nucléico e proteínas variantes, e métodos de usar as moléculas de ácido nucléico e proteínas assim como método de usar reagentes para a detecção das mesmas.

Description

REFERÊNCIA CRUZADA AOS PEDIDOS RELACIONADOS
[001]Este pedido reivindica o benefício do pedido de patente provisório número de série U.S. 60/919.885, depositado em 22 de março de 2007, os conteúdos dos quais estão aqui incorporados pela referência na sua íntegra dentro deste pedido.
CAMPO DA INVENÇÃO
[002]A presente invenção está no campo de doença cardíaca coronária (CHD), particularmente infarto do miocárdio (MI), bem como aneurisma/dissecção e resposta a medicamento, particularmente resposta ao tratamento com estatina. Em particular, a presente invenção se refere a polimorfismos de um único nucleotídeo específico (SNPs) no genoma humano, e sua associação com CHD, aneuris- ma/dissecção, e/ou variabilidade na correspondência ao tratamento com estatina (incluindo tratamento preventivo) entre indivíduos diferentes. Os SNPs revelados aqui podem ser utilizados como alvo para o projeto de reagentes de diagnóstico e o desenvolvimento de agentes terapêuticos, bem como para associação de doença e análise de ligação. Em particular, os SNPs da presente invenção são úteis para identificar um indivíduo que está em um risco aumentado ou diminuído de desenvolver CHD (particularmente MI) e aneurisma/dissecção, para detecção adiantada da doença, para prover informação clínica importante para a prevenção e/ou tratamento de CHD e aneurisma/detecção, para prever a seriedade ou consequências de CHD e aneurisma/dissecção em um indivíduo, para determinar o prognóstico de uma recuperação de um indivíduo a partir de CHD e aneurisma/dissecção, para classificar e selecionar agentes terapêuticos, e para prever uma resposta do paciente a agentes terapêuticos, tal como avaliar a probabilidade de um indivíduo responder positi- vamente à estatina, particularmente para o tratamento ou prevenção de CHD (tal como MI) e aneurisma/dissecção. Os SNPs revelados aqui também são úteis para aplicações de identificação humana. São providos métodos, testes, kits e reagentes para detectar a presença destes polimorfismos e seus produtos codificados.
ANTECEDENTE DA INVENÇÃO Doença cardíaca coronária (CHD), aneurisma/dissecção e resposta a tratamento com estatina
[003]A presente invenção se refere a SNPs que estão associados à ocorrência de doença cardíaca coronária (CHD), particularmente infarto do miocárdio (MI), bem como aneurisma de aorta e dissecção. A presente invenção também se refere a SNPs que estão associados à variabilidade entre indivíduos diferentes em sua resposta ao tratamento (incluindo tratamentos preventivos) com estatinas (por exemplo, pravastatina, atorvastatina, etc.), particularmente para tratamento ou prevenção de CHD e aneurisma/dissecção.
[004]CHD é definida no Estudo Cardiológico de Framingham como englobando MI, angina pectoris, insuficiência coronariana (que é manifestada como is- quemia, que é fluxo de oxigênio debilitado ao músculo cardíaco), e morte por doença cardíaca coronária. Wilson e outros, Circulation 97:1837-1847 (1998). CHD é algumas vezes registrada através de registros clínicos que indicam as seguintes inter- vençoes: enxerto de desvio de artéria coronária, angioplastia e colocação de stent, adicionalmente aos registros clínicos de MI, angina ou morte coronária.
[005]Conforme utilizado aqui, CHD é definida de acordo com como este termo é definido no Estudo Cardiológico de Framingham (ou seja, como englobando MI, angina pectoris, insuficiência coronariana e morte por doença cardíaca coronária), e pode também incluir revascularização, angioplastia coronária transluminal percutânea (PTCA) e enxerto de desvio de artéria coronária (CABG). Angina pectoris inclui angina instável em particular.
[006]Os SNPs descritos aqui podem adicionalmente ser úteis para tais eventos cardiovasculares como placa vulnerável e derrame.
Infarto do miocárdio (MI)
[007]Infarto do miocárdio (MI), também referido como “ataque cardíaco”, é a causa mais comum de mortalidade nos países desenvolvidos. A incidência de MI é ainda alta apesar das medidas preventivas e intervenções terapêuticas atualmente disponíveis. Mais de 1.500.000 de pessoas nos Estados Unidos sofrem de MI agudo a cada ano, muitas sem procurar socorro devido ao MI irreconhecível, e um terço destas pessoas morrem. O risco de morte de eventos de doença arterial coronariana em idade de 40 anos é de 42,4% para homens, próximo de um em dois, e 24,9% para mulheres, ou uma em quatro. D.M. Lloyd-Jones, lancet 353:89-92 (1999).
[008]MI é uma doença multifatorial que envolve aterogênese, formação de trombos e propagação. A trombose pode resultar em oculsão completa ou parcial de artérias coronárias. O estreitamento ou bloqueio luminal de artérias coronárias reduz oxigênio e fornecimento de nutriente para o músculo cardíaco (isquemia cardíaca), levando à necrose do miocárdio e/ou choque. MI, angina instável e morte súbita por isquemia são manifestações clínicas de dano do músculo cardíaco. Todos os três parâmetros de risco são parte de síndrome coronária aguda uma vez que os mecanismos ocultos de complicações agudas de aterosclerose são considerados os mesmos.
[009]Aterogênese, a primeira etapa de patogênese de MI, é uma interação complexa entre elementos do sangue, forças mecânicas, fluxo de sangue perturbado e anormalidade da parede de vaso que resulta em acumulação de placa. Uma placa instável (vulnerável)foi reconhecida como uma causa oculta de eventos trombóticos arteriais e MI. Uma placa vulnerável é uma placa, que possui uma probabilidade alta de ser interrompida ou desgastada, formando, assim, um foco trombogênico. MI devido a uma placa vulnerável é um fenômeno complexo que inclui: vulnerabilidade de placa, vulnerabilidade de sangue (hipercoagulação, hipotrombólise) e vulnerabilidadecardíaca (sensibilidade do coração à isquemia ou propensão para arritmia). Infar- to do miocárdio recorrente (RMI) pode de modo geral ser visto como uma forma severa de progressão de MI causada por múltiplas placas vulneráveis que são capazes de submeter-se a pré-ruptura ou um estado de pré-erosão, junto com coagulabilida- de de sangue extrema.
[0010]O diagnóstico atual de MI é baseado nos níveis de troponina I ou T que indicam necrose progressiva do músculo cardíaco, eletrocardiograma (ECG) debilitado e detecção de movimento da parede ventricular anormal ou dados angio- gráficos (a presença de trombose aguda). Entretanto, devido à natureza assintomá- tica de 25% de MIs agudos (ausência de dor no peito atípica, sensibilidade de ECG baixa), uma porção significativa de MIs não são diagnosticados e, portanto, não tratados apropriadamente (por exemplo, prevenção de MIs recorrentes).
[0011]A valoração e o prognóstico de risco de MI são atualmente feitos utilizando fatores de risco clássicos ou o Índice de Risco de Framingham introduzido recentemente. Ambas essas valorações colocam um peso significativo nos níveis de LDL para justificar tratamento preventivo. Entretanto, já está bem estabelecido que metade de todos os MIs ocorre em indivíduos sem hiperlipidemia declarada.
[0012]Outros fatores de risco de MI em desenvolvimento são biomarcadores inflamatórios, tais como proteína C reativa (PCR), ICAM-1, SAA, TNF □ , homocisteí- na, glicose rápida debilitada, novos marcadores de lipídeo (ox LDL, Lp-a, MAD-LDL, etc.) e fatores pró-trombóticos (fibrinogênio, PAI-1). Esses marcadores possuem limitações significativas, tais como baixa especificidade e baixo valore de previsão positiva e a necessidade para múltiplos intervalos de referência a serem utilizados para diferentes grupos de pessoas (por exemplo, machos-fêmeas, fumantes-não fumantes, usuários de terapia de reposição hormonal, grupos de idades diferentes). Essas limitações diminuem a utilidade de tais marcadores como marcadores de prognótico independentes para seleção de MI.
[0013]A genética tem um importante papel no risco de MI. Famílias com histórico familiar positivo de MI contam com 14% da população geral, 72% de MIs prematuros e 48% de todos os MIs. R.R. Williams, Am J Cardiology 87:129 (2001). Adicionalmente, estudos de ligações replicadas têm revelado evidência de múltiplas regiões do genoma que estão associadas com MI e relevantes para característica genética de MI, incluindo regiões nos cromossomos 14, 2, 3 e 7, sugerindo que os fatores de risco genéticos influenciam o ataque, manifestação e progressão de MI. U. Broeckel, Nature Genetics 30:210 (2002); S. Harrap, Arterioscler Thromb Vasc Biol 22:874-878 (2002); A. Shearman, HumanMolecular Genetics 9:1315-1320 (2000). Estudos de associação recentes têm identificado variantes alélicas que estão associadas com complucações agudas de CHD, incluindo variantes alélicas dos genes ApoE, ApoAS, Lpa, APOCIII e Klotho.
[0014]Marcadores genéticos, tais como polimorfismos de único nucleotídeo (SNPs) são preferíveis a outros tipos de biomarcadores. Marcadores genéticos que são prognósticos para MI podem ser genotipados cedo na vida e poderiam prever a resposta do indivíduo para vários fatores de risco. A combinação de níveis de proteína do soro e pré-disposição genética revelados por análise genética de genes suscetíveis pode fornecer uma valoração integrada da interação entre genótipos e fatores ambientais, resultando em valor de prognóstico sinergisticamente aumentado de testes de diagnótico.
[0015]Portanto, há uma necessidade urgente para novos marcadores genéticos que podem prever pré-disposição à CHD, tal como MI, particularmente para indivíduos que não são reconhecidos como tendo uma pré-disposição a MI. Tais marcadores genéticos podem permitir prognóticos de MI em populações muito maiores comparado com as populações que podem atualmente serem avaliadas utilizando-se os fatores de risco e biomarcadores existentes. A disponibilidade de um teste genético pode permitir, por exemplo, tratamentos preventivos apropriados para eventos coronários agudos a serem fornecidos para indivíduos suscetíveis (tais tratamentos preventivos podem incluir, por exemplo, tratamentos de estatina e intensificação de dose de estatina, bem como mudanças de fatores de risco modificáveis), diminuindo os limiares para ECG e testes de angiografia, e permitir monitoramento adequado de biomarcadores informativos. Além disso, a revelação de marcadores genéticos associados com MI fornecerá novos alvos para intervenção terapêutica ou tratamentos preventivos de MI, e permite o desenvolvimento de novos agentes terapêuticos para tratamento ou prevenção de MI e outras disfunções cardiovasculares.
[0016]Além disso, marcadores genéticos novos que podem prever pré- disposição a MI podem ser particularmente úteis para identificar indivíduos que estão em risco de um ataque cedo de MI. “Ataque cedo de MI” pode ser definido como MI em homens que têm menos de 55 anos de idade e mulheres que tem menos de 65 anos de idade. K.O Akoash e outros, “Preventing myocardial infartcion in the young adult in the first place: How do the National Cholesterol Education Panel III guidelines perform?” JACC 41(9):1475-1479 (2003). Indivíduos que experimentam ataque cedo de MI podem não ser eficazmente identificados pelas diretrizes de tratamento de colesterol atuais, tais como aquelas sugeridas pelo Programa Nacional de Educação em Colesterol. Em um estudo, por exemplo, um número significativo de indivíduos que sofreram de MI em uma idade cedo (< 50 anos) mostraram ter colesterol LDL abaixo de 100 mg/dl. K.O.Akoash e outros, “Myocardial infarction in young adults with low-density lipoprotein cholesterol levels less than or equal to 100 mg/dl. Clinical profile and 1-year outcomes”. Chest 120:1953-1958 (2001). Por causa do risco para MI poder ser reduzido por mudanças no estilo de vida e pelo tratamento de fatores de risco modificáveis, métodos melhores para identificar indivíduos em risco para ataque cedo de MI poderiam ser úteis para tomar decisões de tratamento preventivo, especialmente considerando que esses pacientes podem não ser identi- ficados por gestão médica por diretrizes de tratamento convencionais. Marcadores genéticos para risco de ataque cedo de MI poderiam ser potencialmente incorporados em protocolos de valoração de risco do indivíduo, à medida que eles têm a vantagem de serem facilmente detectados em qualquer idade.
Aneurisma de aorta e dissecção
[0017]Aneurisma de aorta é a 13acausa de morte mais comum nos Estados Unidos (Majumber e outrso., Am J Hum Genet 48(1):164-170(1991). Aneurisma de aorta é um assassino silencioso uma vez que, na maioria dos casos, a sequela catastrófica é a primeira manifestação da doença. Apenas 10-15% dos indivíduos sobrevivem a um rompimento de aneurisma. Daqueles, apenas cerca de metade sobrevive à reparação cirúrgica de emergência (Powel e outros, N Engl J Med 2003; 348:1895-901).
[0018]Aneurisma de aorta é uma dilatação patológica da aorta, o maior vaso no sistema arterial, que entrega sangue oxigenado do ventrículo esquerdo do coração para os órgãos. Quando da dilatação anormal acontece expansão progressiva, as camadas médias da aorta tornam-se crescentemente enfraquecidas devido a micro apoplexia da parede do vaso, que leva a estresse elevado da parede, pelo que induz progressão adicional de dilatação e formação de aneurisma resultando finalmente em dissecção aórtica, ruptura e, geralmente, morte.
[0019]O fenótipo clínico de aneurisma de aorta pode ser dividido em aneurismas de aorta abdominal (AAA) e aneurismas de aorta torácica (TAA). Ambos TAA e AAA podem ser ainda subdivididos em aneurisma de aorta crônico (CAA) e dissecção de aorta (AD). Ambos AAA e TAA dividem fatores de risco, tais como hipertensão crônica, fumo, idade avançada, doenças inflamatórias vasculares, trauma de deceleração para dissecções de aorta, dislipidemia e características principais de patogênese. Hipertensão crônica, em particular, causa estreitamento íntimo arterial, fibrose e calcificação junto com degradação da matriz extracelular e elsatólise. Isto resulta na ruptura íntima nas extremidades das placas (um processo similar à ruptura de placa coronária) e enfraquecimento do suprimento de oxigênio à parede arterial, seguido de necrose de células de músculo liso e fibrose. Este processo compromete a elasticidade das paredes dos vasos e sua resistência às forças pulsáteis - uma base morfológica para o desenvolvimento de aneurismas e dissecções (Nienaber e outros, Circulation 2003 108:628-635).
[0020]Aneurisma de aorta crônico (que pode também ser referido como aneurisma arterioesclerótico) resulta da dilatação fusiforme. A aorta abdominal distal às artérias renais é a mais comumente afetada. Quando a aorta torácica é envolvida, o aneurisma é usualmente na aorta descendente. Trombos organizados estão habitualmente presentes dentro da dilatação fusiforme. Embora a aorta seja notoriamente anormal na localização do aneurisma, a aorta é habitualmente alongada concen- tricamente, não dissecada longitudinalmente, e as camadas da parede aórtica são normalmente aderentes. Estes aneurismas podem romper, mas eles não dissecam comumente. A cirurgia é realizada eletivamente (se um aneurisma é detectado) quando esses aneurismas alcançam o tamanho no qual a ruptura torna-se um perigo significativo (usualmente 6-8 cm, ou quando o aneurisma começa a se modificar rapidamente).
[0021]Dissecção de aorta se refere a uma condição na qual as camadas da aorta são separadas umas das outras, com sangue sob pressão entrando entre as duas camadas propagando a separação e formando um lúmen falso adicional. Este processo tipicamente começa com um rasgo através do íntimo e meio interno em um local específico na aorta ascendente ou descendente. As dissecções podem prejudicar um indivíduo de várias formas, incluindo ruptura da aorta dentro do pericárdio, peito ou abdomen, tamponamento cardíaco e oclusão da divisão aórtica que pode ser seguida por paraplegia, derrame ou falha renal (Elefteriades e outros, House Officer Guide to ICU Care, Reven Press, NY).
[0022]Aneurisma de aorta tem um componente genético forte. 18% dos pacientes com AAA e 19% dos pacientes com TAA foram confirmados tendo um primeiro grau relativo afetado com aneurisma de aorta (Coady e outros, Cardiol Clin. 1999 Nov; 17(4):615-35; vii). Para pacientes com um histórico familiar de aneurisma de aorta, o fator de risco importante é maior que 4 (Baird e outros, Lancet. 1995 Sep 2; 346(8975):601-4) e é duas vezes maior para pessoas com doença de artéria coronária. Além disso, estudos familiares têm identificado QTL de 5q13-14 no cromossomo 5 (Guo e outros, Circulation. 2001 May 22; 103(20):2461-8) e QTL de 11q23,2- q24 no cromossomo 11 (Vaughan e outros, Circulation. 2001 May 22; 103(20):2469- 75) associado com formação de aneurisma.
[0023]O diagnóstico atual de aneurismas de aorta é baseado em tecnologias de imagem. Entretanto, tecnologias de imagem têm limitações significativas. Por exemplo, o ultrassom é o procedimento de escolha para diagnosticar AAA. Entretanto,seleção periódica para AAA por ultrassom não é parte de diretrizes atuais para diagnóstico e tratamento de AAA porque não é eficaz em tempo e custo para classificarindivíduos que não têm manifestação clínica de doença. Consequentemente, devido à natureza assintomática da doença, uma porção significativa de aneurismas de aorta não são diagnosticados até que a ruptura ou dissecção ocorra, em casos raros, o aneurisma é encontrado acidentalmente durante um ultrassom não relacionado, CT ou MRI. A situação é ainda pior para TAA porque o diagnóstico de TAA utilizando ultrassom relativamente barato não é útil devido a uma falta de sensibilidade do ultrassom, e CT e MRI, embora sensíveis o suficiente, são muito caros para justificar a seleção de indivíduos assintomáticos.
[0024]A falta de confiabilidade, prognóstico e testes de diagnóstico baratos impede os médicos de monitoramento de aneurismas e utilização de tratamentos de escolha apropriados, tais como bloqueadores beta para diminuir a progressão da doença ou intervenção cirúrgica eletiva. A mortalidade entre os pacientes de aneu- risma de aorta com aneurismas de aorta não rompidos tratados por cirúrgia eletiva é de 3-5% comparada com 50-60% de mortalidade durante cirúrgia de emergência de aneurismas rompidos ou dissecções.
[0025]Portanto, existe uma necessidade urgente por marcadores genéticos que podem prever pré-disposição a aneurisma de aorta ou dissecção. Tais marcadoresgenéticos poderiam, por exemplo, permitir prognósticos, diagnósticos e monitoramento de AAA e TAA em populações muito maiores comparado com as populações que podem atualmente ser avaliadas utilizando os fatores de risco existentes. Além disso, a disponibilidade de um test genético poderia também ser capaz de permitir medidas preventivas para serem iniciadas em indivíduos suscetíveis antes do ataque de eventos catastróficos. Tais medidas preventivas podem incluir, por exemplo, tratamento agressivo de hipertensão, uso de bloqueadores beta e/ou terapia com estatina, intervenção cirúrgica eletiva e monitoramento adequado via tecnologias de imagem e/ou biomarcadores informativos.
Tratamento de estatina
[0026]Redução de eventos coronários e cerebrovasculares e mortalidade total por tratamento com inibidores de reductase de HMG-CoA (estatinas) têm sido demonstradas em um número de ensaios esperados de placebo controlado, duplamente cegos, aleatórios. D.D. Waters, Clin Cardiol 24(8 Suppl):III3-7 (2001); B.K. Singh e J.L. Mehta, Curr Opin Cardiol 17(5):503-11 (2002). Estes medicamentos têm seu efeito primário através da inibição de sínstese de colesterol hepático, pelo que regula ascendentemente os receptores LDL no fígado. O aumento resultante no catabolismo de LDL resulta em diminuição da circulação de LDL, um fator de risco importante para a doença cardiovascular.
[0027]Estatinas podem ser divididas em dois tipos de acordo com suas pro-priedadesfisicoquímicas e farmacocinéticas. As estatinas, tais como lovastatina, simvastatina, atorvastatina e cerevastatina são lipofílicas na natureza e, desta forma, difundem através das membranas e, assim, são altamente permeáveis na célula. As estatinas hidrofílicas, tais como pravastatina são mais polares, de modo que elas requerem transportadores de superfície de célula específicos para absorção celular. K. Ziegler e W. Stunkel, Biochem Bipphys Acta 1139(3):203-9 (1992); M. Yamazaki e outros, Am J Physiol 264 (1 Pt 1):G36-44 (1993); T. Komai e outros, Biochem Pharmacol 43(4):667-70 (1992). A última estatina utiliza um transportador, OATP2, cuja distribuição de tecido está confinada no fígado e, portanto, elas são inibidores relativamentehepato-específicas. B. Hsiang e outros, J Biol Chem 274(52):37161-37168 (1999). A estatina anterior, não requerendo mecanismos de transporte específicos, estão disponíveis para todas as células e podem impactar diretamente um espectro bem mais amplo de células e tecidos. Essas diferenças nas propriedades podem influenciar o espectro de atividades que cada estatina possui. Pravastatina, por exemplo, tem um potencial miopático baixo em modelos de animais e culturas de miócitos comparado com estatinas lipofílicas.B.A. Masters e outros, Toxicol Appl Pharmacol 131(1):163-174 (1995); K. Nakahara e outros, Toxicol Appl Pharmacol 152(1):99-106 (1998); J.C. Reijneveld e outros, Pediatr Res 39(6):1028-1035 (1996).
[0028]A evidência de estudos de associação de gene é a acumulação para indicar que as respostas ao medicamento estão, de fato, pelo menos parcialmente sob controle genético. Desta forma, a farmacogenética - o estudo de variabilidade em respostas a medicamento atribuída a fatores hereditários em populações diferentes - pode ajudar significativamente no fornecimento de respostas para resolver este desafio. A.D. Roses, Nature 405(6788):857-865 (2000); V. Mooser e outros, J Thromb Haemost 1(7):1398-1402 (2003); L.M. Humma e S.G. Terra, Am J Health Syst Pharm 59(13):1241-1252 (2002). Várias associações genéticas foram relatadas entre os genótipos selecionados, como definido por SNPs e outras variações de sequência genética, e respostas específicas a medicamentos cardiovasculares. Os polimorfismos em vários genes foram sugeridos para influenciar respostas a estati- nas incluindo CETP (J.A. Kuivenhoven e outros, N Engk J Med 338(2):56-93 (1998)), fibrinogênio beta (M.P. de Maat e outros, Arterioscler Thromb Vasc Biol 18(2):265-71 (1998)), lipase hepática (A. Zambon e outros, Circulation 103(6):792-798 (2001)), lipase de lipoproteína (J.W. Jukema e outros, Circulation 94(8):1913-1918)), glico- proteína IIIa (P.F. Bray e outros, Am J Cardiol 88(4):347-352 (2001)), estromelisina-1 (M.P. de Maat e outros, Am J Cardiol 83(6):852-856 (1999)), e apolipoproteína E (L.U. Gerdes e outros, Circulation 101(12):1366-1371 (2000); J. Pedro-Botet e ou-tros,Atherosclerosis 158 (1):183-193 (2001)). Algumas destas variantes mostraram afetar eventos clínicos enquanto outras foram associadas com mudanças nos pontos de avaliação substitutos.
[0029]Portanto, há uma necessidade por marcadores genéticos que podem ser utilizados para prever a receptividade do indivíduo a estatinas. Por exemplo, há uma necessidade crescente para identificar melhor pessoas que têm chances maiores de se beneficiar das estatinas, e aquelas que têm risco menor de desenvolver efeitos colaterais. Por exemplo, miopatias severas representam um risco significativo para uma pequena porcentagem da população de pacientes, e isto pode ser uma preocupação particular para pacientes que são tratados mais agressivamente com estatinas.
Polimorfismos de um único nucleotídeo (SNPs)
[0030]Os genomas de todos os organismos submetem-se à mutação espontânea no curso de sua evolução contínua, gerando formas de variante de sequências genéticas de progenitor. Gusella, Ann Ver Biochem 55:831-854 (1986). Uma forma de variante pode conferir uma vantagem ou desvantagem evolucionária em relação a uma forma de progenitor ou pode ser neutra. Em alguns casos, uma forma de variante confere uma vantagem evolucionária às espécies e é eventualmente incorporada dentro do DNA de muitos ou da maioria dos membros das espécies e efetivamente se torna uma forma de progenitor.
[0031]Adicionalmente, os efeitos de uma forma de variante podem ser tanto benéficos quanto prejudiciais, dependendo das circunstâncias. Por exemplo, uma mutação de célula falciforme heterozigota confere resitência à malária, mas uma mutação de célula falciforme homozigota é geralmente letal. Em muitos casos, as formas tanto de progenitor quanto de variante sobrevivem e coexistem em uma população de espécies. A coexistência de múltiplas formas de uma sequência genética aumenta os polimorfismos genéticos, incluindo SNPs.
[0032]Aproximadamente 90% de todos os polimorfismos genéticos no ge- noma humano são SNPs. SNPs são posições únicas de base no DNA nas quais ale- los diferentes, ou nucleotídeos alternativos, existem em uma população. A posição de SNP (intecambiavelmente referida aqui como SNP, lugar de SNP, local de SNP, marcador de SNP ou marcador) é usualmente precedida por e seguida por sequências altamente conservadas do alelo (por exemplo, sequências que variam em menos que 1/100 ou 1/1000 membros das populações). Um indivíduo pode ser homozi- goto ou heterozigoto para um alelo em cada posição de SNP. Um SNP pode, em alguns casos, ser referido como um “cSNP” para denotar que a sequência de nucle- otídeo contendo o SNP é uma sequência que codifica aminoácido.
[0033]Um SNP pode formar-se a partir de uma substituição de um nucleotí- deo por outro no local polimórfico. As substituições podem ser transições ou trans- versões. Uma transição é a reposição de um nucleotídeo de purina por outro nucleo- tídeo de purina, ou uma pirimidina por outra pirimidina. Uma transversão é a reposição de uma purina por uma pirimidina, ou vice versa. Um SNP pode também ser uma inserção ou deleção de variante de única base referida como “indel”. Weber e outros, uman diallelic insertion/deletion polymorphisms”, Am J Hum Genet 71(4):854- 62 (Oct. 2202).
[0034]Uma mudança de códon sinônima, ou mutação silenciosa/SNP (termos, tais como “SNP”, “polimorfismo”, “mutação”, “variação” e “variante” são usados aqui intercambiavelmente), é aquela que não resulta em uma mudança de aminoá- cido devido à degeneração do código genético. Uma substituição que modifica uma codificação de códon para um aminoácido por uma codificação de códon para outro aminoácido diferente (ou seja, uma modificação de código não sinônima) é referida como uma mutação missense. Uma mutação nonsense resulta em um tipo de mudança de código não sinônima na qual um códon de terminação é formado, pelo que leva a uma terminação prematura de uma cadeia de polipeptídeo e uma proteína truncada. Uma mutação “read-through” é outro tipo de modificação de códon não sinônimo que causa a destruição de uma códon de terminação, pelo que resulta em um produto de polipeptídeo estendido. Enquando SNPs podem ser bi-, tri- ou tetra- alélicos, a vasta maioria dos SNPs são bialélicos, e, portanto, geralmente referidos como “marcadores bialélicos” ou “marcadores dialélicos”.
[0035]Como usado aqui, as referências a SNPs e genótipos de SNP incluem SNPs individuais e/ou haplotipos, que são grupos de SNPs que são geralmente herdados juntos. Haplotipos podem ter correlações fortes com doenças ou outros efeitosfenotípicos comparado com SNPs individuais, e, portanto, podem prover precisão de diagnóstico aumentada em alguns casos. Stephens e outros, Science 293:489-493 (Jul 2001).
[0036]SNPs causais são aqueles SNPs que produzem alterações na expressão de gene ou na expressão, estrutura e/ou função de um produto de gene, e, portanto,são mais previsíveis de um fenótipo clínico possível. Uma tal classe inclui SNPs caindo dentro de regiões de genes que codificam um produto de polipeptídeo, ou seja, cSNPs. Esses cSNPs podem resultar em uma alteração da sequência de aminoácido do produto de polipeptídeo (ou seja, modificações de códon não sinônimo) e aumentar a expressão de uma proteína defeituosa ou outra variante. Além disso, no caso de mutações nonsense, um SNP pode levar a terminação prematura de um produto de polipeptídeo. Tais produtos de variante podem resultar em uma condição patológica, por exemplo, doença genética. Exemplos de genes nos quais um SNP dentro da sequência genética causa uma doença genética incluem anemina de célula falciforme e fibrose cística.
[0037]SNPs causais não necessariamente devem ocorrer em regiões de codificação; SNPs causais podem ocorrer, por exemplo, em qualquer região genética que pode basicamente afetar a expressão, estrutura e/ou atividade da proteína codificada por um ácido nucléico. Tais regiões genéticas incluem, por exemplo, aquelas envolvidas em trasncrição, tais como SNPs em domínios de ligação de fator de transcrição,SNPs em regiões de promotor, em áreas envolvidas em processamento de transcrição, tais como SNPs em limites intron-exon que podem causar união defeituosa, ou SNPs em sequências de sinal de processamento de mRNA, tais como regiões de sinal de poliadenilação. Alguns SNPs que não são SNPs causais não obstante estão em associação íntima com, e, portanto, sergrega com, uma sequência que causa doença. Nesta situação, a presença de um SNP se correlaciona com a presença de, ou pré-disposição a, ou uma risco aumentado no desenvolvimento da doença. Esses SNPs, embora não causais, são contudo também úteis para diagnósticos,seleção de pré-disposição a doenças e outros usos.
[0038]Um estudo de associação de um SNP e uma disfunção específica envolve a determinação da presença ou frequência do alelo de SNP nas amostras biológicas dos indivíduos com a disfunção de interesse, tal como CHD, e a comparação da informação àquelas dos controles (ou seja, indivíduos que não têm a disfunção; controles podem ser também referidos como indivíduos “saudáveis” ou “normais”) que são preferivelmente da mesma idade e raça. A seleção apropriada de pacientes e controles é importante para o sucesso dos estudos de associação de SNP. Portanto, um grupo de indivíduos com fenótipos bem caracterizados é extremamente desejável.
[0039]Um SNP pode ser classificado em amostras de tecido doente ou qual- quer amostra biológica obtida de um indivíduo doente, e comparada às amostras de controle, e selecionado para sua ocorrência aumentada (ou diminuída) em uma condição patológica específica, tal como patologias relacionadas à CHD e em particular, MI. Uma vez que uma associação estatisticamente significante é estabelecida entre um ou mais SNP(s) e uma condição patológica (ou outro fenótipo) de interesse, então, a região ao redor do SNP pode opcionalmente ser classificada completamente para identificar as sequências/locais genéticos causais (por exemplo, mutação/SNP causal, gene, região regulatória, etc.) que influenciam a condição patológica ou fenó- tipo. Estudos de associação podem ser conduzidos dentro da população geral e não estão limitados aos estudos realizados nos indivíduos relacionados em famílias afetadas (estudos de ligação).
[0040]Ensaios clínicos mostraram que a resposta dos pacientes ao tratamento com medicamentos é geralmente heterogênea. Existe uma necessidade contínua de melhorar o projeto de agente farmacêutico e a terapia. Neste respeito, SNPs podem ser usados para identificar pacientes mais apropriados à terapia com agentes farmacêuticos particulares (isto é geralmente denominado “farmacogenômi- ca”). Similarmente, SNPs podem ser usados para excluir pacientes de certo tratamento devido à probabilidade aumentada do paciente de desenvolver efeitos colateraistóxicos ou sua probabilidade de não responder ao tratamento. A farmacogenô- mica pode também ser usada para pesquisa farmacêutica para ajudar no desenvolvimento do medicamento e no processo de seleção. Linder e outros, Clinical Chemistry 43:254 (1997); Marshall, Nature Biotechnology 15:1249 (1997); Pedido de Patente Internacional WO 97/40462, Spectra Biomedical; e Schafer e outros, Nature Biotechnology 16:3 (1998).
RESUMO DA INVENÇÃO
[0041]A presente invenção se refere à identificação de SNPs, bem como combinações únicas de tais SNPs e haplotipos de SNPs, que estão associados a CHD (particularmente MI), aneurisma/dissecção e/ou resposta a medicamento, particularmente resposta ao tratamento com estatina (incluindo tratamento preventivo), tal como para tratamento ou prevenção de CHD ou aneurisma/dissecção. Os polimorfismos descritos aqui são diretamente úteis como alvos para o projeto de reagentes de diagnóstico e prognóstico e para o desenvolvimento de agentes terapêuti-cos e preventivos para uso em diagnóstico, prognóstico, tratamento e/ou prevenção de CHD (particularmente MI) e aneurisma/dissecção, bem como para previsão de resposta do paciente aos agentes terapêuticos, tais como estatinas, particularmente para o tratamento ou prevenção de CHD e/ou aneurisma/dissecção.
[0042]Além disso, os polimorfismos descritos aqui também são úteis para previsão de uma receptividade do indivíduo às estatinas para o tratamento ou prevenção de disfunções, outras além de CHD e aneurisma/dissecção, tais como câncer, e são também úteis para previsão de uma receptividade do indivíduo ao medicamentos, outros além das estatinas que são usados para tratar ou prevenir CHD ou aneurisma/dissecção.
[0043]Certas modalidades exemplares da invenção se referem em particular a SNP rs20455 e a associação deste SNP com CHD (particularmente MI), aneuris- ma/dissecção, e resposta ao medicamento (particularmente resposta à estatina), bem como SNPs que estão em desequilíbrio de ligação com este SNP e/ou estão localizados na região genômica em volta deste SNP. SNP rs20455 (o número de identificação público deste SNP), que está localizado no gene da proteína similar kinase 6 (KIF6), é intercambiavelmente referido aqui como “hCV3054799” (número de identificação interna para este SNP), “SNP de KIF6”, “SNP de Trp719Arg”, “poli-morfismo de Trp719Arg”, “KIF6 Trp719Arg” ou simplesmente “Trp719Arg”. O alelo de risco para este SNP pode ser intercambiavelmente referido aqui como “alelo de 719Arg”, “alelo de KIF6 719Arg” ou simplesmente “719Arg” (ainda, um “alelo” pode ser intercambiavelmente referido aqui como uma “variante”). Este é o alelo que é associado com risco aumentado para CHD e aneurisma/dissecção, e que é também associado com benefício maior para o tratamento de estatina, como descrito aqui e mostrado nas tabelas. Como usado aqui, o termo “benefício” (com relação a um medicamento)é definido com alcançando um risco reduzido para uma doença que o medicamento pretende tratar ou prevenir (por exemplo, um evento de CHD, tal como MI) por administração do tratamento com o medicamento, comparado com o risco para a doença na ausência do recebimento do tratamento com o medicamento (ou recebimento de um placebo em no lugar do tratamento com o medicamento) para o mesmo genótipo.
[0044]SNP rs20455, e sua associação com CHD (particularmente MI) e respostaà estatina, é também descrito nas seguintes referências, cada uma delas está incorporada aqui pela referência em sua totalidade: Iakoubova e outros, “Association of the Trp719Arg polymorphism in kinesin-like protein 6 with myocardial infarction and coronary heart disease em 2 prospective trials: the CARE and WOSCOPS trials”, J Am Coll Cardiol, 2008 Jan 29; 51(4):435-43, incluindo Online Appendix (que se refere em particular à associação de SNP rs20455 com o risco de CHD, incluindo MI, e benefício do tratamento de estatina; o Online Appendix correspondente se refere a SNPs no desequilíbrio de ligação com rs20455); Shiffman e outros, “A kinesin family member 6 variant is associated with coronary heart disease in the Women’s Health Study”, J Am Coll CardiolI. 2008 Jan 29; 51(4):444-8 (que se refere em particular à associação de SNP rs20455 com risco para CHD, incluindo MI, em mulheres): Iakoubova e outros, “Polymorphism in KIF6 gene and benefit from estatins after acute coronary syndromes: results from the PROVE IT-TIMI 22 study”, J Am Coll Cardiol. 2008 Jan 29;51(4):449-55 (que se refere em particular à associação de SNP rs20455 com benefício de tratamento de estatina, incluindo tanto pravastatina e atorvastatina); e Shiffman e outros, “Association of gene variants with incident myocardial infarction in the Cardiovascular Health Study”, Arterioscler Thromb Vasc Biol. 2008 Jan; 28(1):173-9 (que se refere em particular à associação de SNP rs20455 com risco para CHD, incluindo MI, em indivíduos idosos de idades de 65 e mais velhos).
[0045]Como mostrado e descrito aqui, o SNP de KIF6 (hCV3054799/rs20455) está associado com risco para aneurisma de aorta e dissecçãode aorta, bem como risco para outros eventos coronários, tais como CHD (incluindo MI). Portanto, este SNP tem mostrado estar associado com múltiplos eventos coronários diferentes, e se espera, portanto, que tenha utilidades similares em outros eventos coronários. Consequentemente, o SNP de KIF6 (hCV3054799/rs20455), bem como os outros SNPs descritos aqui, é amplamente útil com relação os espectro completo de eventos coronários. Além disso, o SNP de KIF6 (hCV3054799/rs20455) também tem sido associado com outros eventos cardiovasculares, tais como derrame (ver, por exemplo, pedido provisório de patente dos Estados Unidos 61/066.584, Luke e outros, depositado em 20 de fevereiro de 2008). Portanto, esse SNP tem sido mostrado ser associado com múltiplos eventos cardiovasculares diferentes, e se espera, portanto, que tenha uitlidades similares em outros eventos cardiovasculares. Consequentemente, o SNP de KIF6 (hCV3054799/rs20455), bem como os outros SNPs descritos aqui, é amplamente útil em relação ao espectro completo de eventos cardiovasculares. Ademais, esse SNP tem mostrado especificamente ser associado com benefício ao tratamento de estati- na para redução de MI, angina instável, revascularização e eventos de derrame (ver, por exemplo, Exemplo 2). O SNP de KIF6 (hCV3054799/rs20455), bem como os outros SNPs descritos aqui, é também particularmente útil para determinação do risco de um indivíduo para placa vulnerável.
[0046]Além disso, as utilidades exemplares descritas aqui para SNP de KIF6 (hCV3054799/rs20455), bem como os outros SNPs descritos aqui, aplicam-se a eventos coronários e cardiovasculares tanto primários (ou seja, primeiro), quanto recorrentes. Por exemplo, o SNP de KIF6 (hCV3054799/rs20455) pode ser usado para determinação do risco para um MI primário em um indivíduo que nunca tenha tido MI, e também pode ser usado para determinação do reisco para um MI recorrente em um indivíduo que já teve um MI.
[0047]Ademais, as utilidades exemplares descritas aqui para o SNP de KIF6 (hCV3054799/rs20455), bem como os outros SNPs descritos aqui, aplicam-se a todos os indivíduos, incluindo, porém não limitado a, tanto homens, quanto mulheres (ver Shiffman e outros, “A kinsein family member 6 variant is associated with coronary heart disease in the Women’s Health Study”, J Am Coll Cardiol. 2008 Jan 29; 51(4):444-8 que se refere a mulheres em particular), e todas as idades de indivíduos incluindo indivíduos idosos (ver Shiffman e outros, “Association of gene variants with incident myocardial infarction in the Cardiovascular Health Study”, Arterioscler Thromb Vasc Biol. 2008 Jan; 28(1):173-9, que se refere em particular a indivíduos idosos com idades de 65 ou mais velhos, e o estudo PROSPER descrito no exemplo 3 abaixo, que se refere em particular a indivíduos idosos com idades de 70-82), bem como indivíduos jovens, etc.
[0048]Com base na identificação de SNPs associados com CHD (particularmente MI), aneurisma/dissecção e/ou resposta ao tratamento de estatina, a presente invenção também provê métodos de detecção dessas variantes, bem como os projetos e preparação de reagentes de detecção necessários para alcançar este objetivo. A invenção especificamente provê, por exemplo, SNPs associados com CHD, aneu- risma/dissecção e/ou receptividade ao tratamento de estatina, moléculas de ácido nucléico isoladas (incluindo moléculas de DNA e RNA) contendo esses SNPs, proteínas variantes codificadas pelas moléculas de ácido nucléico contendo tais SNPs, anticorpos para as proteínas de variantes codificadas, sistemas de armazenamento de dados e baseados em computação contendo a nova informação de SNP, métodos de detecção desses SNPs em uma amostra de teste, métodos de identificação de indivíduos que têm um risco alterado (ou seja, aumentado ou diminuído) de desenvolver CHD (particularmente MI) e aneurisma/dissecção, métodos para determinar o risco de um indivíduo para CHD recorrente (por exemplo, MI recorrente) ou aneurisma/dissecção recorrente, métodos para prognóstico da severidade ou consequências de CHD ou aneurisma/dissecção, métodos para tratamento de um indivíduo que tem um risco aumentado para CHD ou aneurisma/dissecção e métodos para identificar indivíduos (por exemplo, determinar uma probabilidade de indivíduo particular) que têm uma probabilidade alterada (ou seja, aumentada ou diminuída) de responder ao tratamento de estatina, particularmente tratamento de estatina de CHD (por exemplo, tratamento ou prevenção de MI usando estatinas) ou aneuris- ma/dissecção, com base na presença ou ausência de um ou mais nucleorídeos particulares (alelos) em um ou mais locais de SNP descritos aqui ou detecção de um ou mais produtos de variante codificados (por exemplo, transcrições de mRNA de variante ou proteínas de variante), métodos de identificação de indivíduos que são mais ou menos passíveis de responder ao tratamento (ou mais ou menos passíveis de experimentar efeitos colaterais indesejáveis com o tratamento), métodos de seleção para compostos úteis no tratamento ou prevenção de uma disfunção associada com uma proteína/gene de variante, compostos identificados por estes métodos, métodos de tratamento ou prevenção de disfunções mediadas por uma proteína/gene de variante,métodos de utilização dos SNPs novos da presente invenção para identificação humana, etc. A presente invenção também provê métodos para identificação de indivíduos que possuem SNPs que estão associados ao risco aumentado de desenvolvimento de CHD (tal como MI)ou aneurisma/dissecção, e ainda pode beneficiar- se de ser tratado com estatina porque o tratamento de estatina pode abaixar seu risco de desenvolver CHD (tal como MI) e estatinas podem também ser utilizadas na prevenção ou tratamento de aneurisma/dissecção.
[0049]A presente invenção provê adicionalmente métodos para selecionar ou formular um regime de tratamento (por exemplo, métodos para determinar se administrar ou não tratamento de estatina a um indivíduo tendo CHD ou aneuris- ma/dissecção, ou que está em risco para desenvolver CHD ou aneurisma/detecção no futuro, ou que teve previamente CHD ou aneurisma/dissecção, métodos para selecionar um regime de tratamento baseado em estatina particular, tal como dosagem e frequência de administração de estatina, ou uma forma/tipo particular de estatina, tal como uma formulação farmacêutica particular ou composto de estatina, métodos de administrar um tratamento alternativo não baseado em estatina a indivíduos que são previsto de serem improváveis a responderem positivamente ao tratamento de estatina, etc.), e métodos para determinar a probabilidade de experimentar toxicidade ou outros efeitos colaterais indesejáveis com o tratamento de estatina, etc. A presente invenção também provê métodos para selecionar indivíduos aos quais um es- tatina ou outro produto terapêutico será administrado com base no genótipo do indivíduo, e métodos para selecionar indivíduos para um ensaio clínico de uma estatina ou outro agente terapêutico com base nos genótipos dos indivíduos (por exemplo, selecionar indivíduos para participarem do ensaio que são mais passíveis de responder positivamente ao tratamento de estatina e/ou excluir indivíduos do ensaio que são improváveis de responder positivamente ao tratamento de estaina). A presente invenção provê adicionalmente métodos para reduzir um risco do indivíduo de desenvolver CHD (tal como MI) ou aneurisma/dissecção utilizando tratamento de estatina, incluindo prevenir CHD recorrente (por exemplo, MI recorrente) ou aneu- risma/dissecção utilizando tratamento de estatina, quando o indivíduo carrega um ou mais SNPs identificados aqui como sendo associados com CHD.
[0050]Nas tabelas 1 e 2, a presente invenção provê informação genética, referências à identificação de sequências de transcrição (SEQ ID NO:1), sequências de aminoácidos codificadas (SEQ ID NO:2), sequências genômicas (SEQ ID NOS: 4-9), sequências de contexto baseadas em transcrição (SEQ ID NO: 3) e sequências de contexto baseadas em genômica (SEQ ID NOS: 10-132) que contêm os SNPs da presente invenção, e informação de SNP abrangente que inclui alelos observados, frequências de alelos, grupos de populações/étnicos nos quais os alelos foram observados,informação sobre o tipo de SNP e efeito funcional correspondente, e, para cSNPs, informação sobre o produto polipeptídeo codificado. As sequências de transcrição atuais (SEQ ID NO: 1), sequências de aminoácido (SEQ ID NO: 2), sequências genômicas (SEQ ID NOS: 4-9), sequências de contexto baseadas em transcrição (SEQ ID NO:3) e sequências de contexto baseadas em genômica (SEQ ID NOS: 10-132), junto com sequências primer (SEQ ID NOS: 133-189) são providas na Listagem de Sequências.
[0051]Em certas modalidades exemplares, a invenção provê um método para identificar um indivíduo que tem um risco alterado para desenvolver uma primeira ou recorrente CHD (por exemplo, MI) ou aneurisma/dissecção, no qual o método compreende detectar um polimorfismo de único nucleotídeo (SNP) em qualquer uma das sequências de nucleotídeo de SEQ ID NO:1, SEQ ID NO:3, SEQ ID NOS:4-9, SEQ ID NOS: 10-132 nestes ácido nucléicos de indivíduos, em que o SNP é especificado na tabela 1 e/ou tabela 2, e a presença do SNP é indicativa de um risco alterado para CHD ou aneurisma/dissecção no indivíduo. Em certas modalidades, a CHD é MI. Em certas modalidades exemplares da invenção, SNPs que ocorrem naturalmente no genoma humano são providas como moléculas de ácido nucléico isoladas. Esses SNPs estão associados a CHD (MI em particular), aneuris- ma/dissecção e ou resposta a medicamento, particularmente resposta ao tratamento de estatina, de forma que eles possam ter uma variedade de usos no diagnóstico, prognótisco, tratamento e/ou prevenção de CHD, aneurisma/dissecção, e patologias relacionadas, e particularmente no tratamento ou prevenção de CHD ou aneuris- ma/dissecção usando estatinas. Em uma modalidade alternativa, um ácido nucléico da invenção é um polinucleotídeo amplificado, que é produzido por amplificação de um molde de ácido nucléico contendo SNP. Em outra modalidade, a invenção provê uma proteína de variante que é codificada por uma molécula de ácido nucléico contendo um SNP descrito aqui.
[0052]Em ainda outra modalidade da invenção, é provido um reagente para detectar um SNP no contexto de suas sequências de nucleotídeo flanqueadas de ocorrência natural (que podem ser, por exemplo, tanto DNA quanto RNA). Em particular, tal reagente pode estar na forma de, por exemplo, uma sonda de hibridização ou um primer de amplificação que é útil na detecção específica de um SNP de interesse. Em uma modalidade alternativa, um reagente de detecção de proteína é utilizado para detectar uma proteína de variante que é codificada por uma molécula de ácido nucléico contendo um SNP descrito aqui. Uma modalidade preferida de um reagente de detecção de proteína é um anticorpo ou um fragmento de anticorpo reativoà antígeno.
[0053]Várias modalidades da invenção também provêem kits compreendendo reagentes de detecção de SNP, e métodos para detectar os SNPs descritos aqui pelo emprego dos reagentes de detecção. Em uma modalidade específica, a presente invenção provê um método de identificação de um indivíduo tendo um risco aumentado ou diminuído de desenvolver CHD (por exemplo, tendo um MI) ou aneuris- ma/dissecção pela detecção da presença ou ausência de um ou mais alelos de SNP descritos aqui. Em outra modalidade, é provida um método para diagnosticar CHD ou aneurisma/dissecção pela detecção da presença ou ausência de um ou mais ale- los de SNP descritos aqui. A presente invenção também provê métodos para avaliar se é provável (ou improvável) um indivíduo responder ao tratamento de estatina, particularmente tratamento de estatina de CHD ou aneurisma/detecção, pela detecção da presença ou ausência de um ou mais alelos de SNP descritos aqui.
[0054]As moléculas de ácido nucléico da invenção podem ser inseridasem um vetor de expressão, tal como para produzir uma proteína de variante em uma célula hospedeira. Portanto, a presente invenção também provê um vetor compreendendo uma molécula de ácido nucléico contendo SNP, células hospedeiras geneticamente engenheiradas contendo o vetor e métodos para expressar uma proteína de variante recombinante utilizando tais células hospedeiras. Em outra modalidade específica, as células hospedeiras, moléculas de ácido nucléico contendo SNP e/ou proteínas de variante podem ser utilizadas como alvos em um método para classificar e identificar agentes terapêuticos ou compostos farmacêuticos úteis no tratamento ou prevenção de CHD (particularmente MI) ou aneurisma/dissecção.
[0055]Um aspecto desta invenção é um método para tratar ou prevenir uma primeira ou recorrente CHD (por exemplo, MI) ou aneurisma/dissecção, em um indivíduo humano em que o indivíduo humano abriga um SNP, gene, transcrição e/ou proteína codificada identificada nas tabelas 1 e 2, cujo método compreende administrar a um indivíduo humano uma quantidade terapeuticamente e profilaticamente eficaz de um ou mais agentes (por exemplo, estatinas, incluindo, mas não limitado a, storvastatina, pravastatina, atorvastatina, etc.) contrapondo-se aos efeitos da doença, tais como pela inibição (ou estimulação) da atividade de um gene, transcrição e/ou proteína codificada identificada nas tabelas 1 e 2.
[0056]Outro aspecto desta invenção é um método para identificar um agente útil no tratamento terapêutico ou profilático de CHD (particularmente MI) ou aneuris- ma/dissecção, em um indivíduo humano em que o indivíduo humano abriga um SNP, gene, transcrição e/ou proteína codificada identificada nas tabelas 1 e 2, cujo método compreende contatar o gene, transcrição ou proteína codificada com um agente candidato (por exemplo, uma estatina, incluindo, mas não limitado a, storvas- tatina, pravastatina, atorvastatina, etc.) sob condições adequadas para permitir a formação de um complexo de ligação entre o gene, transcrição ou proteína codificada e o agente candidato e detectar a formação do complexo de ligação, em que a presença do complexo identifica o agente.
[0057]Outro aspecto desta invenção é um método para tratar ou prevenir CHD (tal como MI) ou aneurisma/dissecção, em um indivíduo humano, em que o método compreende: (i) determinar que o indivíduo humano abriga um SNP, gene, transcrição e/ou proteína codificada identificada nas tabelas 1 e 2, e (ii) administrar ao indivíduo uma quantidade terapeuticamente e profilatica- mente eficaz de um ou mais agentes (tais como uma estatina, incluindo, mas não limitado a, storvastatina, pravastatina, atorvastatina, etc.) contrapondo-se aos efeitos da doença, tal como estatinas.
[0058]Outro aspecto da invenção é um método para identificar um humano que é passível de se beneficiar do tratamento de estatina, em que o método compreende detectar a presença do alelo de risco de SNP rs20455 nos ácidos nucléicos do humano, em que a presença do alelo de risco indica que o humano é passível de se beneficiar do tratamento de estatina.
[0059]Outro aspecto da invenção é um método para identificar um humano que é passível de se beneficiar do tratamento de estatina, em que o método compreende detectar a presença do alelo de risco de um SNP que é um LD com SNP rs20455 nos ácidos nucléicos do humano, em que a presença do alelo de risco do LD SNP indica que o humano é passível de se beneficiar do tratamento de estatina.
[0060]Modalidades exemplares da invenção incluem métodos de utilização de SNP rs20455 realcionado a qualquer estatina. Tem sido especificamente mostrado aqui que os veículos do alelo KIF6 719Arg se beneficiam não apenas de pravas- tatina (Pravachol®), que é uma estatina hidrofílica, mas também atorvastatina (Lipitor®), que é uma estatina lipofílica (como descrito no exemplo 2 abaixo, em particular). Espera-se que este SNP tenha utilidades similares em toda a classe de estati- nas, particularmente uma vez que ele tem mostrado especificamente ser útil para estatinas tanto hidrofílicas quanto lipofílicas. Portanto, este SNP, assim como os ou- tros SNPs associados à resposta de estatina descritos aqui, é amplamente útil na previsão do efeito terapêutico para toda a classe de estatinas, tais como para determinar se um indivíduo se beneficiará de qualquer das estatinas, incluindo, mas não limitado a, fluvastatina (Lescol®), lovastatina (Mevacor®), rosuvastatina (Crestor®) e simvastatina (Zocor®), bem como terapias de combinação que incluem uma estati- na, tal como simvastatina + ezetimiba (Vytorin®), lovastatina + niacin de liberação estendida (Advicor®) e atorvastatina + besilato de amlodipina (Caduet®).
[0061]Em certas modalidades exemplares da invenção, os métodos de diag- nóticos são direcionados para a determinação de quais pacientes teriam proteção maior contra CHD (por exemplo, MI, MI recorrente, etc.) ou aneurisma/dissecção quando a eles é dado tratamento de estatina intensivo quando comparado a um tratamento de estatina padrão. Em certas modalidades, a estatina pode compreender uma estatina selecionado do grupo que consiste de atorvastatina, pravastatina e storvastatina. Em certas modalidades, o tratamento de estatina intensivo compreende a administração de altas doses de uma estatina e/ou aumentando a frequência da administração de estatina quando comparado com o tratamento de estatina padrão. Em certas modalidades adicionais, o tratamento de estatina intensiva pode utilizar um tipo diferente de estatina do que o tratamento de estatina padrão; por exemplo, atorvastatina pode ser usada para tratamento de estatina intensivo e pra- vastatina por ser usada para tratamento de estatina padrão.
[0062]Muitos outros usos e vantagens da presente invenção serão aparentes para aqueles versados na técnica ao rever a descrição detalhada das modalidades preferidas aqui. Somente para clareza de discussão, a invenção é descrita nas seções abaixo por meio dos exemplos não limitadores.
DESCRIÇÃO DOS ARQUIVOS CONTIDOS NO CD-R DENOMINADO CÓPIA 1 DE CDR DUPLICADO E CÓPIA 2 DE CDR DUPLICADO Cada um dos DC-rs contêm o seguinte arquivo de texto:
[0063]Arquivo CD000014PCT_SEQLIST.txt provê a Listagem de Sequências. A listagem de sequências provê as sequências de transcrição (SEQ ID NO: 1) e as sequências de proteína (SEQ ID NO: 2) como referidas na tabela 1, e as sequênciasgenômicas (SEQ ID NOS: 4-9) como referidas na tabela 2, para cada CHD, aneurisma/dissecção e/ou gene associado à resposta a medicamento (or região ge- nômica para SNPs intergênicos) que contêm um ou mais SNPs da presente invenção. Tmabém provido na Listagem de Sequências estão sequências de contexto flanquando cada SNP, incluindo tanto as sequências de contexto baseadas em transcrição como referidas nas tabela 1 (SEQ ID NO: 3) quanto as sequências de contexto baseadas em genômica como referidas na tabela 2 (SEQ ID NOS: 10-132). Adicionalmente, a Listagem de Sequências provê as sequências de primer da tabela 3 (SEQ ID NOS: 133-189) que são oligonucleotídeos que foram sintetizados e utilizados no laboratório para testar certos SNPs descritos aqui por PCR de alelo específico durante o curso dos estudos de associação para verificar a associação destes SNPs com CHD, aneurisma/dissecção e/ou resposta a medicamento. As sequências de contexto geralmente provêem 100 bp ascendente (5’) e 100 bp descendente (3’) de cada SNP, com o SNP no meio da sequência de contexto, para um total de 200 bp da sequência de contexto ao redor de cada SNP.
[0064]Arquivo CD000014PCT_SEQLIST.txt é 614 KB em tamanho, e foi criado em 20 de março de 2008. Um formato legível por computador da listagem de sequência é também submetido aqui em um CDR separado rotulado CRF. De acordo com 37 CFR § 1.821 (f), a informação gravada no CDR CRF é idêntica à listagem de sequência como provida nas Cópias 1 e 2 duplicadas de CDR.
[0065]O material contido no CD-R é aqui incorporado pela referência de acordo com 37 CFR 1.77 (b)(4). DESCRIÇÃO DA TABELA 1 E DA TABELA 2 A tabela 1 e a tabela 2 (ambas providas no CD-R) descrevem o SNP e in- formação de proteína/transcrição/gene associados da presente invenção. Para cada gene, a tabela 1 provê um cabeçalho contendo informação de gene, transcrição e proteína, seguido por um indetificador de sequência de proteína e de transcrição (SEQ IS NO), e, então, informação de SNP sobre cada SNP encontrado naquela transcrição/gene incluindo a sequência de contexto de transcrição. Para cada gene na tabela 2, um cabeçalho é provido que contém informação de gene e genômica, seguido por um identificador de sequência genômica (SEQ ID NO) e, então, informação de SNP sobre cada SNP encontrado naquele gene, incluindo a sequência de contexto genônima.
[0066]Note que marcadores de SNP podem ser incluídos em ambas as tabelas 1 e 2; a tabela 1 apresenta os SNPs relativos a suas sequências de transcrição e sequências de proteína codificada, enquando a tabela 2 apresenta os SNPs relativos a suas sequências genômicas. Em alguns casos a tabela 2 também pode incluir, após a última sequência de gene, sequências genômicas de uma ou mais regiões intergênicas, assim como sequências de contexto de SNP e outras informações de SNP que estão dentro destas regiões intergênicas.
[0067]Adicionalmente, tanto na tabela 1 quanto na 2 um “SNP examinado relacionado” pode ser listado seguindo um SNP que é determinado para ser um LD com aquele SNP examinado de acordo com o valor de potência dado. SNPs podem ser prontamente cruzados entre todas as tabelas com base em seus número de identificação Celera hCV (ou, em alguns casos, hDV) e/ou números de identificação públicos rs, e à Listagem de Sequências baseada em suas correspondentes SEQ ID NOS. A informação de proteína/transcrição/gene inclui: - um número de genes (1 até n, onde n = número total de genes na tabela), - números de identificação interna UID e Celera hCG para o gene, - números de identificação interna UID e Celera hCT para a transcrição (apenas na tabela 1), - número de acesso público ao Genbank (por exemplo, número de RefSeq NM) para a transcrição (apenas na tabela 1), - números de identificação interna UID e Celera hCP para a proteína codificada pela transcrição hCT (apenas na tabela 1), - número de acesso público ao Genbank (por exemplo, número de RefSeq NP) para a proteína (apenas na tabela 1), - um símbolo de gene conhecido na técnica, - um nome de proteína/gene conhecido na técnica, - posição de eixo genômico Celera (indicando a posição do nucleotídeo inici-al-posiçãodo nucleotídeo de terminação), - o número de cromossomo do cromossomo no qual o gene está localizado, - um número de referência público OMIM (Herança Mendeliana Online em Homens; John Hopkins University/NCBI) para obter informação adicional sobre a importância médica de cada gene, e - nomes de proteína/gene alternativos e/ou símbolos na entrada OMIM.
[0068]Note que, devido à presença de formas de ligação alternativas, múltiplas entradas de proteína/transcrição podem ser providas para uma entrada única de gene na tabela 1; ou seja, para um Número de Gene único, múltiplas entradas podem ser providas em séries que diferem em sua informação de proteí- na/transcrição e sequências.
[0069]Seguindo as informações de proteína/transcrição/gene está uma sequência de contexto de transcrição (tabela 1), ou uma sequência de contexto genô- mico (tabela 2), para cada SNP dentro de cada gene.
[0070]Após a última sequência de gene, a tabela 2 pode incluir sequências genômicas adicionais de regiões intergênicas (em tais casos, essas sequências são identificadas com “região intergênica” seguida por um número de identificação nu- mérico), assim como as sequências de contexto de SNP e outras informações de SNP para quaisquer SNPs que estão dentro de cada região intergênica (tais SNPs são identificados como “INTERGÊNICO” para o tipo de SNP).
[0071]Note que a transcrição, proteína e sequências de contexto de SNP baseadas em transcrição são todas providas na Listagem de Sequências. As sequências de contexto de SNP baseadas em transcrição são providas tanto na tabela 1 quanto na Listagem de Sequências. As sequências genômicas e de contexto de SNP baseadas em genômica são providas tanto na tabela 2 quanto na Listagem de Sequências. SEQ ID NOS são indicadas na tabela 1 para sequências de contexto baseadas em transcrição (SEQ ID NO: 3); SEQ ID NOS são indicadas na tabela 2 para sequências de contexto baseadas em genômica (SEQ ID NOS: 10-132). As informações de SNP incluem: - sequência de contexto (tomadas da sequência de transcrição na tabela 1, da sequência genômica na tabela 2) com o SNP representado por seu código IUB, incluindo 100 bp ascendente (5’) da posição do SNP mais 100 bp descendente (3’) da posição do SNP (sequências de contexto de SNP baseadas em transcrição na tabela 1 são providas na Listagem de Sequências como SEQ ID NO: 3; sequências de contexto de SNP baseadas em genômica na tabela 2 são providas na Listagem de Sequências como SEQ ID NOS: 10-132), - número de identificação interna Celera hCV para o SNP (em alguns casos, um número “hDV” é dado ao invés de um número “hCV”), - o número de identificação público correspondente para o SNP, o número rs, - posição de SNP (posição de SNP dentro da sequência de transcrição dada (tabela 1) ou dentro da sequência genômica dada (tabela 2)), - “SNP examinado relacionado” como o SNP examinado com o qual o SNP listado está em LD no valor de potência dado, - fonte de SNP (pode incluir qualquer combinação de um ou mais dos seguintes cinco códigos, dependendo de quais projetos de sequenciamento interno e/ou bases de dados públicas o SNP foi observado: “Applera” = SNP observado durante o resequenciamento de genes e regiões regulatórias de 39 indivíduos, “Celera” = SNP observado durante sequenciamento shotgun e reunião da sequência de ge- noma humano Celera, “Diagnósticos Celera” = SNP observado durante resequenci- amento de amostras de ácido nucléico de indivíduos que têm uma doença, “dbSNP” = SNP observado na base de dados pública dbSNP, “HGBASE” = SNP observado na base de dados pública de HGBASE, “HGMD” = SNP observado na base de dados publica (HGMD-Human Gene Mutation Database), “HapMap” = SNP observado na base de dados pública International HapMap Project, “CSNP” = SNP observado em uma base de dados de codificação de SNPs (cSNPs) interna da Applied Biosystems (Foster City, CA).
[0072]Note que múltiplas entradas de fonte “Applera” para um único SNP indicam que o mesmo SNP foi coberto por múltiplos produtos de amplificação sobrepostos e os resultados de resequenciamento (por exemplo, contagens de alelo observado) a partir de cada um destes produtos de amplificação está sendo provido.
[0073]- Informação de população/alelo/contagem de alelo no formato de [po- pula- ção1(primeiro_alelo,contagem/segundo_alelo,contagem)população2(primeiro_alelo, contagem/segundo_alelo,contagem)total(primeiro_alelo,contagem to- tal/segundo_alelo,contagem total)]. A informação neste campo inclui popula- ção/grupos étnicos nos quais os alelos de SNP particulares foram observados (“cau” = caucasiano, “his” = espânico, “chn” = chinês e “afr” = afro-americano, “jpn” = japonês, “ind” = indiano, “mex” = mexicano, “ain” = índio americano, “cra” = doador Cele- ra, “no_pop” = nenhuma informação de população disponível), alelos de SNP identificados e contagem de alelo obaservada (dentro de cada grupo de população e con- tagens de alelos total), onde disponível [“-“ no campo de alelo representa um alelo de deleção de um polimorfismo de inserção/deleção (“indel”) (em cujo caso o alelo de inserção correspondente, que pode estar compreendido em um ou mais nucleotí- deos, é indicado no campo de alelo no lado oposto da “|”); “-“ no campo de contagem indica que a informação de contagem de alelo não está disponível]. Para certos SNPs da base de dados dsSNP pública, informação de população/etnia é indicada como a seguir (esta informação de população está publicamente disponível em dbSNP): “HISP1” = DNA individual humano (amostras anônimas) de 23 indivíduos de herança HISPANIC descrita em si; “PAC1” = DNA individual humano (amostras anônimas) de 24 indivíduos de herança PACIFIC RIM descrita em si; “CAUC1” = DNA individual humano (amostras anônimas) de 31 indivíduos de herança CAUCASIAN descrita em si; “AFR1” = DNA individual humano (amostras anônimas) de 24 indivíduos de herança AFRICAN/AFRICAN AMERICAN descrita em si; “P1” = DNA individual humano (amostras anônimas) de 102 indivíduos de herança descrita em si; “PA130299515”; “SC_12_A” = SANGER 12 DNAs de origem asiática de depósitos de célula Corielle, 6 das quais são machos e 6 fêmeas; “SC_12_C” = SANGER 12 DNAs de origem caucasiana de depósitos de célula Corielle da biblioteca CEPH/UTAH, seis machos e seis fêmeas; “SC_12_AA” = SANGER 12 DNAs de origem afroamericana de depósitos de célula Corielle 6 das quais são machos e 6 fêmeas; “SC_95_C” = SANGER 95 DNAs de origem caucasiana de depósitos de célula Corielle da biblioteca CEPH/UTAH; e “SC_12_CA” = caucasianos - 12 DNAs de depósitos de célula Corielle que são da biblioteca CEPH/UTAH, seis machos e seis fêmeas.
[0074]Note que para SNPs da fonte de SNP “Applera”, regiões regulató- rias/genes de 39 indivíduos (20 caucasianos e 19 afroamericanos) foram resequen- ciados e, uma vez que cada posição de SNP é representada por dois cromossomos em cada indivíduo (com a exceção de SNPs nos cromossomos X e Y em machos, para qual posição de SNP é representada por um único cromossomo), até 78 cromossomo foram genotipados para cada posição de SNP. Portanto, a soma das contagens de alelo de afroamericano (“afr”) é até 38, a soma das contagens de alelo de caucasiano (“cau”) é até 40, e a soma total de todas as contagens de alelo é até 78.
[0075]Note que semicólons separam informação de popula- ção/alelo/contagem correspondente a cada fonte de SNP indicada; ou seja, se quatro fontes de SNP são indicadas, tais como “Celera”, “dbSNP”, “HGBASE” e “HGMD”, então, a informação de população/alelo/contagem é provida em quatro grupos que são separados por semicólons e listados na mesma ordem da listagem de fontes de SNP, com cada grupo de informação de população/alelo/contagem correspondendoà respectiva fonte de SNP baseada na ordem; portanto, neste exemplo, o primeiro grupo de informação de população/alelo/contagem corresponderia à primeira fonte de SNP listada (Celera) e o terceiro grupo de informação de popula- ção/alelo/contagem separado por semicólons corresponderia à terceira fonte de SNP listada (HGBASE); se a informação de população/alelo/contagem não está disponível para qualquer fonte de SNP particular, então, um par de semicólons está ainda inserido como um suporte de local para manter correspondência entre a lista de fontes de SNP e a listagem correspondente de informação de popula- ção/alelo/contagem.
[0076]- Tipo de SNP (por exemplo, localização dentro do gene/transcrição e/ou efeito funcional previsto) [“MIS-SENSE MUTATION” = SNP causa uma mudança no aminoácido codificado (ou seja, um SNP de condificação não sinônima); “SILENT MUTATION” = SNP não causa uma mudança no aminoácido codificado (ou seja, um SNP de codificação sinônimo); “STOP CODON MUTATION” = SNP está localizado no códon de terminação; “NONSENSE MUTATION” = SNP cria ou destrói um códon de terminação; “UTR 5” = SNP está localizado em um UTR 5’ de uma transcrição; “UTR 3” = SNP está localizado em um UTR 3’ de uma transcrição; “PUTATIVE UTR 5” = SNP está localizado em um suposto UTR 5’; “PUTATIVE UTR 3” = SNP está localizado em um suposto UTR 3’; “DONOR SPLICE SITE” = SNP está localizado em um local de união de doador (limite 5’ intron); “ACCEPTOR SPLICE SITE” = SNP está localizado em um local de união de aceitador (limite 3’ intron); “CODING REGION” = SNP está localizado em uma região de codificação de proteína da transcrição; “EXON” = SNP está localizado em um exon; “INTRON” = SNP está localizado em um intron; “hmCS” = SNP está localizado em um segmento conservado de humano-rato; “TFBS” = SNP está localizado em um local de ligação de fator de transcrição; “UNKNOW” = o tipo de SNP não está definido; “INTERGENIC” = o SNP é intergênico, ou seja, fora de qualquer limite de gene].
[0077]- Informação de codificação de proteína (tabela 1 apenas), onde relevante, no formato de [proteína SEQ ID NO, posição de aminoácido, (aminoácido-1, códon1) (aminoácido-2, códon2)]. A informação neste campo inclui SEQ ID NO da sequência de proteína codificada, posição do resíduo de aminoácido dentro da proteína identificada pela SEQ ID NO que é codificada pelo códon contendo o SNP, aminoácidos (representado pelos códigos de aminoácido de uma letra) que são con- dificados pelos alelos de SNP alternativos (no caso de códons de terminação, “X” é usado para o código de aminoácido de uma letra), e códons alternativos contendo os nucleotídeos de SNP alternativos que codificam os resíduos de aminoácido (portanto, por exemplo, para SNPs de tipo de mutação missense, pelo menos dois aminoá- cido diferentes e pelo menos dois códons diferentes são geralmente indicados; para SNPs de tipo de mutação silenciosa, um aminoácido e pelo menos dois códons diferentessão geralmente indicados, etc.). Em casos onde o SNP é localizado fora da região de codificação de proteína (por exemplo, em uma região UTR), “Nenhum” é indicado seguindo a SEQ ID NO da proteína.
DESCRIÇÃO DA TABELA 3
[0078]A tabela 3 provê sequências (SEQ ID NOS: 133-189) de primers que foram sintetizados e utilizados no laboratório para testas certos SNPs descritos aqui por PCR de alelo específico durante o curso dos estudos de associação para verificar a associação desses SNPs com CHD, aneurisma/dissecção e/ou resposta à es- tatina (ver seção de exemplos).
A tabela 3 provê o seguinte:
[0079]- a coluna rotulada “marcador” provê um número de identificação hCV para cada SNP que pode ser detectado utilizando os primers correspondentes.
[0080]- a coluna rotulada “alelos” designa os dois alelos alternativos (ou seja, nucleotídeos) no local de SNP. Estes alelos são orientados pelos primers de alelo específico (os primers de alelo específico são mostrados com primer 1 e primer 2). Note que alelos podem ser apresentados na tabela 3 baseado na orientação diferente (ou seja, o complemento oposto) relativa a como os mesmos alelos são apresentados nas tabelas 1-2.
[0081]- a coluna rotulada “primer ‘ (alelo-primer específico)” provê um aleloprimer específico que é específico para um alelo designado na coluna “alelo”.
[0082]- a coluna rotulada “primer 2 (alelo-primer específico)” provê um aleloprimer específico que é específico para os outros alelos designados na coluna “ale- lo”.
[0083]- a coluna rotulada “primer comum” provê um primer comum que é utilizado em conjunto com cada um dos alelo-primers específicos (ou seja, primer 1 e primer 2) e que hibridiza em um local fora da posição de SNP.
[0084]Todas as sequências de primer são dadas na direção 5’ para 3’.
[0085]Cada um dos nucleotídeos designados na coluna “alelos” combina ou é o complemento contrário do (dependendo da orientação do primer relativo ao alelo designado) nucleotídeo 3’ do alelo-primer específico (ou seja, tanto primer 1 quanto primer 2) que é específico para aquele alelo.
DESCRIÇÃO DA TABELA 4
[0086]A tabela 4 provê uma lista de LD SNPs que estão relacionados a e derivados de certos SNPs examinados. Os SNPs examinados, que são mostrados na coluna 1 (que indica os números de identificação hCV de cada SNP examinado) e na coluna 2 (que indica os números de identificação pública rs de cada SNP examinado) da tabela 4, são estatisticamente significativamente associados à CHD, aneu- risma/dissecção e/ou resposta à estatina, como descrito e mostrado aqui, particularmente nas tabelas 5-22 e na seção de exemplos abaixo. Os LD SNPs são providos como um exemplo de SNPs que podem também servir como marcadores para associação de doenças baseado em ser LD com um SNP examinado. O critério e processo de seleção de tal LD SNP, incluindo o cálculo do valor de r2e do valor limite de r2, são descritos no exemplo 6, abaixo.
[0087]Na tabela 4, a coluna rotulada “SNP examinado” apresenta cada marcador como identificado por seu único número de identificação hCV. A coluna rotulada “rs examinado” apresenta o número de identificação público conhecido rs para o número hCV correspondente. A coluna rotulada “LDSNP” apresenta os números hCV dos LD SNPs que são derivados de seus SNPs examinados correspondentes. A coluna rotulada “LD SNP rs” apresenta o número de identificação público conhecido rs para o número hCV correspondente. A coluna rotulada “potência” apresenta o nível de potência onde o limite de r2é ajustado. Por exemplo, quando a potência é ajustada em 0,51, o valor do limite de r2calculado do mesmo é o mínimo de r2que um LD SNP deve ter com referência a um SNP examinado, para que o LD SNP seja classificado como um marcador capaz de ser associado a um fenótipo de doença a um probabilidade maior que 51%. A coluna rotulada “limite r2” apresenta o valor mínimo de r2que um LD SNP deve alcançar com referência a um SNP examinado para qualificá-lo como um LD SNP. A coluna rotulada “r2” apresenta o valor de r2real de LD SNP com referência ao SNP examinado ao ele está relacionado.
DESCRIÇÃO DAS TABELAS 5-22
[0088]As tablelas 5-22 provêem os resultados de análises estatísticas para os SNPs descritos nas tabelas 1 e 2 (SNPs podem ser indicados de forma cruzada entre todas as tabelas aqui baseado em seus números de identificação rs e/ou hCV). Os resultados mostrados nas tabelas 5-22 provêem suporte para a associação desses SNPs com CHD, particularmente MI e MI recorrente (RMI), aneurisma/dissecção e/ou a associação destes SNPs à resposta ao medicamento, tais como estatinas administradas como um tratamento preventivo para MI/RMI. Como um exemplo, os resultados estatísticos providos nas tabelas 5-7 mostram que a associação de SNP hCV3054799 no gene de proteína similar kinase 6 (KIF6) (este SNP também é inter- cambiavelmente referido aqui como KIF6 Trp719Arg ou rs20455, seu número de identificação público rs) com risco de MI/RMI, bem como com resposta ao tratamento de estatina na prevenção de MI/RMI, é suportado pelo valores p < 0,05 nos testes de associação genotípica.
[0089]As tabelas 5-7 mostram a associação de SNP hCV3054799 com risco de CHD e resposta ao medicamento (p < 0,05 em ambos os testes dominante ou genotípico) em amostras CARE e WOSCOPS. As tabelas 5-7 provêem especificamenteanálises mostrando a associação de hCV3054799 com riscos de MI/CHD e a associação deste SNP com prevenção de MI/CHD por tratamento de estatina. A tabela 5 mostra a associação de KIF6 Trp719Arg (hCV3054799) com MI e CHD nos braços de placebo dos ensaios CARE e WOSCOPS. A tabela 6 mostra o efeito de pravastatina em MI e CHD nos subgrupos de KIF6 Trp719Arg (hCV3054799) de en-saios CARE e WOSCOPS. A tabela 7 mostra o efeito em CHD de atorvastatina comparado com pravastatina de acordo com o genótipo KIF6 Trp719Arg. Ver exemplo 1 para informações adicionais em relação às tabelas 5-6 e ver exemplo 2 para informações adicionais em relação a tabela 7.
[0090]As tabelas 8-13 mostram a associação de SNP hCV3054799 com o risco de CHD em resposta ao medicamento (p < 0,05 em ambos um teste dominante ou genotípico)em amostras PROSPER. As tabelas 8 e 9 mostram a associação do KIF6 SNP (rs20455) com risco de CHD no braço de placebo do ensaio PROSPER (uma população idosa, idades 70-82). A tabela 8 mostra o número de pacientes dos três genótipos e veículos (homozigoto secundário + heterozigoto) no braço de placebo do ensaio PROSPER. A tabela 9 mostra que, por exemplo, entre aqueles no gru-po de placebo com doença vascular anterior, veículos 719Arg (59,0%) foram de risco nominalmente maior para eventos coronários comparado com não veículos: relação de risco = 1,25 (95% CI 0,95 para 1,64). As tabelas 10-13 mostram o efeito de pravastatina comparado com placebo no risco de CHD em subgrupos de populações de ensaio PROSPER definidos por genótipos de KIF6 SNP (rs20455). A tabela 10 mostra o número de pacientes dos três genótipos e veículos (homozigoto secundário + heterozigoto) no braço de placebo do ensaio PROSPER. A tabela 11 mostra o número de pacientes dos três genótipos e veículos (homozigoto secundário + hete- rozigoto) no braço de pravastatina do ensaio PROSPER. Para avaliar o efeito de pravastatina, estimativas de risco foram utilizadas para comparar o braço de pravas- tatina com o braço de placebo em subgrupos definidos pelos genótipos. A tabela 12 mostra que, por exemplo, entre veículos de 719Arg com doença vascular anterior, um benefício substancial e significativo da terapia de pravastatina foi observado (relação de risco 0,67, 95% CI 0,52 a 0,87), enquanto nenhum benefício significativo foi observado em não veículos (relação de risco 0,92, 95% CI 0,68 a 1,25). A tabela 13 mostra a interação entre o estado de veículo de 719Arg e o tratamento de pravasta- tina (p = 0,12). Ver exemplo 3 para informações adicionais em relação às tabelas 813.
[0091]A tabela 14 mostra SNPs de regiões genômicas ao redor de SNP hCV3054799 que são associados ao risco de CHD (p < 0,15 em ambos os testes recessivo, dominante, aditivo ou genotípico) em amostras CARE e WOSCOPS. Os resultados de meta-análise apresentados na tabela 14 mostram especificamente que seis SNPs (os KIF6 Trp719Arg SNP (rs20455), bem como rs9471077, rs9462535, rs9394584, rs11755763 e rs9471080) foram associados com MI recorrente no braço de placebo de CARE e com CHD no braço de placebo de WOSCOPS (p < 0,05 em meta-análise), com KIF6 Trp719Arg e rs 9471077 sendo particularmente fortemente associado. rs9471077 está em desequilíbrio de ligação forte com Trp719Arg SNP (r2 = 0,79 em paciente tratados com placebo), e as relações de risco para Trp719Arg e rs9471077 foram similares nos braços de placebo de CARE e WOSCOPS. Após ajustar para fatores de risco convencionais, as relações de risco foram 1,57 e 1,54 (p = 0,01 e 0,02) em CARE para Trp719Arg e rs9471077, respectivamente, e as relações de probabilidades ajustadas foram 1,59 e 1,46 (p = 0,003 e 0,01) em WOSCOPS para Trp719Arg e rs9471077, respectivamente. Ver exemplo 4 para informações adicionais em relação à tabela 14.
[0092]A tabela 15 mostra SNPs de uma análise de mapeamento fino da região genômica ao redor de SNP hCV3054799 que estão associados ao risco de CHD (p , 0,1 em ambos os testes recessivo, dominante, aditivo ou genotípico) em amostras CARE. A tabela 15, que provê os resultados de associação para MI recorrente e as contagens para diferentes genótipos no braço de placebo de CARE, mostra que certos genótipos em seis SNPs foram associados ao MI recorrente. Ver a seção “exemplo 4 - Análise suplementar” para informações adicionais em relação à tabela 15.
[0093]A tabela 16 mostra SNPs da região genômica ao redor de SNP hCV3054799 que estão associados à resposta ao medicamento (p < 0,05 em ambos os genótipos) nas amostras CARE. A tabela 16 mostra especificamente SNPs tendo uma associação significativa (valor de p menor que 0,05) com um efeito de tratamento de pravastatina (comparado com placebo) no risco de MI recorrente (RMI) em subgrupos de CARE definidos pelos genótipos. Ver a seção “exemplo 4 - análise suplementar” para informações adicionais em relação à tabela 16.
[0094]As tabelas 17-20 mostram que o KIF6 SNP (hCV3054799) está associado ao risco de aneurisma de aorta e dissecção (p < 0,05 em ambos os testes recessivo, dominante, alélico ou genotípico). Para determinar se o KIF6 SNP (hCV3054799) está associado ao aneurisma de aorta ou dissecção, este SNP foi analisado usando os seguintes parâmetros de risco: (1) utilizando aneurisma de aorta ou dissecção de aorta com um parâmetro de risco, que comparou pacientes com aneurisma e dissecção com paciente sem aneurisma ou dissecção (mostrado na tabela 17), e (2) utilizando dissecção de aorta com um parâmetro de risco, que comparou pacientes com dissecção com pacientes sem dissecção (mostrado na tabela 18). Baseado nesta análise, o KIF6 SNP (hCV3054799) mostrou ser associado (valor de p < 0,05) a aneurisma ou dissecção e a dissecção apenas, e o alelo de risco em ambos os casos foi o mesmo alelo que foi previamente associado ao MI por este SNP (contagens de genótipo para o parâmetro de risco de aneurisma ou dissecção são mostrados na tabela 19, e contagens de genótipo para parâmetro de risco de dissecção são mostrados na tabela 20). Ver exemplo 5 para informações adicionais em relação às tabelas 17-20.
[0095]A tabela 21 mostra que o KIF6 SNP (hCV3054799) está associado ao aneurisma/dissecção entre pacientes se CHD e, portanto, a associação de KIF6 SNP com aneurisma/dissecção é independente de CHD. Ver a seção “exemplo 5 - análise suplementar” para maiores informações em relação à tabela 21.
[0096]A tabela 22 mostra os resultados de uma análise de SNPs da tabela 14 (outra além de KIF6 Trp719Arg SNP, que é mostrada em outro lugar aqui ser associado à resposta ao medicamento, particularmente benéfico ao tratamento de es- tatina) para determinar se indivíduos com risco aumentado de CHD se beneficiarão do tratamento de pravastatina. A tabela 22 mostra que, além de KIF6 Trp719Arg SNP, quatro outros SNPs na tabela 14 (rs9471080/hCV29992177, rs9394584/hCV30225864, rs9471077/hCV3054813 e rs9462535/hCV3054808) es- tão associados ao benefício do tratamento de pravastatina em amostras CARE e WOSCOPS, bem como sendo associado ao risco de CHD (como mostrado na tabela 14).
[0097]Por toda as tabelas 5-22, “OR” se refere à relação de probabilidade, “HR” ou “HRR” se referem às relações de risco e “90% CI” ou “95% CI” se referem ao intervalo de confiança de 90% e 95% (respectivamente) para as relações de probabilidade e de risco (intervalos de confiança, como apresentado nas tabelas, podem especificar os limites inferior e superior como uma faixa, ou podem individualmente especificar o limite inferior e o limite superior). As relações de provbabilidade (OR) ou relações de risco (HR ou HRR) que são maiores do que um indicam que um dado alelo (ou combinação de alelos, tais como um haplotipo, diplotipo ou diplotipo de dois locais) é um alelo de risco (que pode também ser referido como um alelo suscetível), enquanto relações de probabilidade ou relações de risco que são menores do que um indicam que um dado alelo é um alelo de não risco (que pode também ser referido com um alelo protetor). Para um dado alelo de risco, o outro alelo alternativo na posição de SNP (que pode ser derivada da informação provida nas tabelas 1-2, por exemplo) pode ser considerado um alelo de não risco. Para um dado alelo de não risco, o outro alelo alternativo na posição de SNP pode ser considerado com um alelo de risco.
[0098]Portanto, com relação os risco de doença (por exemplo, CHD, tal como MI ou aneurisma/dissecção), se a estimativa de risco (relação de probabilidade ou relação de risco) para um genótipo particular é maior do que um, isso indica que um indivíduo com esse genótipo particular tem um risco maior para a doença do que um indivíduo que tem o genótipo de referência. Ao contrário, se a estimativa de risco (relação de probabilidade ou relação de risco) para um genótipo particular é menor do que um, isso indica que um indivíduo com este genótipo particular tem um risco reduzido para a doença comparado com um indivíduo que tem o genótipo de refe- rência.
[0099]Com relação à resposta ao medicamento (por exemplo, resposta à es- tatina, tal como pravastatina), se a estimativa de risco (relação de probabilidade e relação de risco) de um genótipo particular é maior do que um, isso indica que um indivíduo com este genótipo particular se beneficiaria do medicamento (uma relação de probabilidade ou relação de risco igual a um indicaria que o medicamento não tem efeito). Como usado aqui, o termo “benefício” (com relação ao medicamento) é definido como alcançando um risco reduzido para uma doença que o medicamento pretende tratar ou prevenir (por exemplo, um evento de CHD, tal como MI) por administração do tratamento com o medicamento, comparado com o risco para a doença na ausência de recepção do tratamento com o medicamento (ou recebendo um placebo no lugar do tratamento com o medicamento) para o mesmo genótipo.
[00100]Para as associações de resposta ao medicamento e risco baseado nas amostras de ensaios CARE, WOSCOPS e PROSPER descritas aqui, o risco é avaliado pela comparação do risco de CHD (por exemplo, MI) para um dado genóti- po com o risco de CHD para um genótipo de referência no braço de placebo do ensaio, e resposta ao medicamento é avaliada pela comparação do risco de CHD (por exemplo, MI) no braço de pravastatina do teste com o risco de CHD no braço de placebo do ensaio para o mesmo genótipo.
[00101]Em termos de risco, o alelo KIF6 719Arg foi associado ao risco aumentado de CHD (por exemplo, MI) em amostras de ensaios CARE, WOSCOPS e PROSPER, como mostrado nas tabelas e descrito aqui (particularmente nos exemplos). Em termos de resposta ao medicamento, veículos do alelo KIF6 719 Arg se beneficiaram do tratamento de pravastatina nas amostras dos ensaios CARE, WOSCOPS e PROSPER (enquanto não veículos não se beneficiaram), como mostrado nas tabelas e descrito aqui (particularmente nos exemplos).
[00102]A seguir estão descrições de certos cabeçalhos de coluna que po-  dem ser usados em quaisquer tabelas 5-22 (vários derivados desses cabeçalhos podem ser usados também).
Figure img0001
Figure img0002
Figure img0003
DESCRIÇÃO DETALHADA DA INVENÇÃO
[00103]A presente invenção provê SNPs associados à doença cardíaca coronária (CHD), particularmente infarto do miocárdio (MI), bem como aneuris- ma/dissecção, e SNPs que estão associados à receptividade do indivíduo a agentes terapêuticos, particularmente estatinas, que podem ser utilizadas para o tratamento (incluindo tratamento preventivo) de CHD e aneurisma/dissecção. A presente invenção provê adicionalmente moléculas de ácido nucléico contendo SNPs, processos e reagentes para detecção dos SNPs descritos aqui, usos destes SNPs para o desenvolvimento de reagentes de detecção e testes ou kits que utilizam tais reagentes. Os SNPs descritos aqui são úteis para diagnosticar, prognosticar, classificar e avaliar pré-disposição à CHD, aneurisma/dissecção e patologias relacionadas em humanos. Os SNPs associados à resposta aos medicamentos descritos aqui são particularmente úteis para prever, classificar e avaliar a resposta ao tratamento de estatina, particularmente tratamento ou prevenção de CHD e aneurisma/dissecção utilizando estatinas, em humanos. Além disso, tais SNPs e seus produtos codificados são alvos úteis para o desenvolvimento de agentes terapêuticos e preventivos.
[00104]Além disso, os SNPs associados à resposta aos medicamentos descritos aqui também são úteis para prever a receptividade do indivíduo a outros medicamentos além das estatinas que são utilizadas para tratar ou prevenir CHD ou aneurisma/dissecção, e estes SNPs também são úteis para prever uma receptividade do indivíduo a estatinas para o tratamento ou prevenção de outras disfunções além de CHD ou aneurisma/dissecção, particularmente câncer. Por exemplo, o uso de estatinas no tratamento de câncer é revisto em: Hindler e outros, “The role of statins in cancer therapy”, Oncologist, 2006.Mar; 11(3):306-15; Demierre e outros, “Statins and cancer prevention”, Nat Ver Cancer, 2005 Dec; 5(12):930-42; Stamm e outros, “The role of statins in cancer prevention and treatment”, Oncology, 2005 May; 19(6):739-50; e Sleijfer e outros, “The potential of statins as part of anti-cancer treatment”, Eur J Cancer, 2005 Mar;41(4):516-22, cada um dos quais é incorporado aqui pela referência em sua totalidade.
[00105]Um grande número de SNPs foi identificado a partir de re- sequenciamento de DNA em 39 indivíduos, e eles estão indicados com fonte de SNP “Applera” nas tabelas 1-2. Suas frequências de alelo observadas em cada um dos grupos étnicos caucasiano e afro-americano foram providas. SNPs adicionais incluídos aqui foram previamente identificados durante sequenciamento “forçado” e grupo do genoma humano, e eles estão indicados com fonte de SNP “Celera” nas tabelas 1 e 2. Além disso, a informação provida nas tabelas 1 e 2, particularmente a informação de frequência de alelo obtida dos 39 indivíduos e a identificação da posição precisa de cada SNP dentro de cada gene/transcrição, permite haplotipos (ou seja, grupos de SNPs que são co-herdados) para serem deduzidos prontamente. A presente invenção abrange haplotipos de SNP, bem como SNPs individuais.
[00106]Portanto, a presente invenção provê SNPs individuais associados à CHD (particularmente MI), aneurisma/dissecção e/ou resposta ao medicamento (particularmente resposta à estatina), bem como combinações de SNPs e haplotipos, sequências de transcrição de variante/polimórfica (SEQ ID NO: 1) e sequências ge- nômicas (SEQ ID NOS: 4-9) contendo SNPs, sequências de aminoácido codificado SEQ ID NO: 2), e ambas as sequências de contexto de SNP baseadas em transcrição (SEQ ID NO: 3) e sequências de contexto de SNP basedas em genômica (SEQ ID NOS:10-132) (sequências de transcrição, sequências de proteína e sequências de contexto de SNP baseadas em transcrição são providas na tabela 1 e na Listagem de Sequências; sequências genômicas e sequências de contexto de SNP baseadas em genômica são providas na tabela 2 e na Listagem de Sequências), métodos de detecção desses polimorfismos em uma amostra de teste, métodos de determinação de risco de um indivíduo tendo ou desenvolvendo CHD ou aneuris- ma/dissecção, métodos de determinação se um indivíduo provavelmente responderá a um tratamento particular, tal como estatinas (particularmente para tratar ou prevenir CHD ou aneurisma/dissecção), métodos de seleção para compostos úteis para tratamento de disfunções associadas com uma proteína/gene de variante, tal como CHD ou aneurisma/dissecção, compostos identificados por esses métodos de seleção, métodos de utilização dos SNPs descritos para selecionar uma estratégia de tratamento/prevenção ou agente terapêutico, métodos de tratamento ou prevenção de uma disfunção associada com uma proteína/gene de variante, e métodos de utilização de SNPs da presente invenção para identificação humana.
[00107]A presente invenção provê adicionalmente métodos para selecionar ou formular um regime de tratamento (por exemplo, métodos para determinar se administrar um tratamento de estatina ou não a um indivíduo tendo CHD ou aneu- risma/dissecção, ou que está em risco de desenvolver CHD ou aneurisma/dissecção no futuro, ou que tenha tido previamente CHD ou aneurisma/dissecção, métodos para selecionar um regime de tratamento baseado em estatina particular, tal como dosagem e frequência de administração de estatina, ou uma forma/tipo particular de estatina, tal como uma formulação farmacêutica ou composto de estatina, métodos para administrar um tratamento não baseado em estatina particular a um indivíduo que se prevê ser improvável responder positivamente ao tratamento de estatina, etc.), e métodos para determinar a probabilidade de experimentar toxicidade ou outro efeito colateral indesejado a partir do tratamento de estatina, etc. A presente invenção também provê métodos para selecionar indivíduos aos quais estatina ou ou- tro produto terapêutico será administrado baseado no genótipo do indivíduo, e méto-dos para selecionar indivíduos para um ensaio clínico de uma estatina ou outro agente terapêutico baseado nos genótipos dos indivíduos (por exemplo, selecionar indivíduos para participar do ensaio que são mais prováveis de responder positivamente ao tratamento de estatina e/ou excluir indivíduos do ensaio que são improváveis de responder positivamente ao tratamento de estatina).
[00108]A presente invenção provê novos SNPs associados à CHD, aneuris- ma/dissecção e/ou resposta ao tratamento de estatina, bem como SNPs que eram previamente conhecidos na técnica, mas não eram previamente conhecidos por serem associados com CHD, aneurisma/dissecção ou resposta ao tratamento de esta- tina. Por conseguinte, a presente invenção provê novas composições e métodos baseados nos novos SNPs descritos aqui, e também provê novos métodos de uso dos conhecidos, mas não previamente associados, SNPs em métodos relacionados à avaliação de uma probabilidade do indivíduo de ter ou desenvolver CHO (particularmente MI) ou aneurisma/dissecção, prevendo a probabilidade de um indivíduo experimentar uma recorrência de CHD (por exemplo, experimentar um MI recorrente) ou aneurisma/dissecção, prognosticando a severidade de CHD ou aneurisma/dissecção em um indivíduo, ou prognosticando uma recuperação do indivíduo de CHD ou aneurisma/dissecção, e métodos relacionados à avaliar uma probabilidade do indivíduo de responder ao tratamento de estatina (particularmente tratamento de estatina, incluindo tratamento preventivo, de CHD ou aneurisma/dissecção). Nas tabelas 1 e 2, os SNPs conhecidos são identificados com base na base de dados publica na qual eles foram observados, que é indicada como um ou mais dos seguintes tipos de SNP: “dbSNP” = SNP observado em dbSNP, “HGBASE” = SNP observado em HGBASE e “HGMD” = SNP observado na base de dados de mutação de gene humano (HGMD).
[00109]Os alelos de SNP particulares da presente invenção podem ser as- sociados tanto a risco aumentado de ter ou desenvolver CHD (por exemplo, MI) ou aneurisma/dissecção ou probabilidade aumentada de responder ao tratamento de estatina (particularmente tratamento de estatina, incluindo tratamento preventivo, de CHD ou aneurisma/dissecção), ou um risco diminuído de ter ou desenvolver CHD ou aneurisma/dissecção ou probabilidade diminuída de responder ao tratamento de es- tatina. Portanto, enquanto certos SNPs (ou seus produtos codificados) podem ser testados para determinar se um indivíduo possui um alelo de SNP que é indicativo de um risco aumentado de ter ou desenvolver CHD (por exemplo, MI) ou aneuris- ma/dissecção ou probabilidade aumentada de responder ao tratamento de estatina, outros SNPs (ou seus produtos codificados) podem ser testados para determinar se um indivíduo possui um alelo de SNP que é indicativo de um risco diminuído de ter ou desenvolver CHD ou aneurisma/dissecção ou probabilidade diminuída de responder ao tratamento de estatina. Similarmente, alelos de SNP particulares da presente invenção podem ser associados tanto a probabilidade aumentada quanto diminuída de ter uma recorrência de CHD (por exemplo, MI recorrente) ou aneuris- ma/dissecção, de recuperação completa de CHD ou aneurisma/dissecção, de experimentar efeitos tóxicos de um tratamento particular ou composto terapêutico, etc. O termo “alterado” pode ser usado aqui para incluir tanto essas duas possibilidades (por exemplo, risco/probabilidade aumentada ou diminuída). Os alelos de SNP que são associados a um risco diminuído de ter ou desenvolver CHD (tal como MI) ou aneurisma/dissecção podem ser referidos como alelos “protetores”, e os alelos de SNP que são associados a um risco aumentado de ter ou desenvolver CHD ou aneurisma/dissecção podem ser referidos com alelos de “suscetibilidade”, alelos de “risco” ou “fatores de risco”.
[00110]Aqueles versados na técnica prontamente reconhecerão que moléculas de ácido nucléico podem ser moléculas duplex e aquela referência a um local particular em uma cadeia se refere, também, ao local correspondente em uma ca- deia complementar. Ao definir uma posição de SNP, alelo de SNP ou sequência de nucleotídeo, se faz referência a uma adenina, timina (uridina), citosina ou guanina em um local particular em uma cadeia de uma molécula de ácido nucléico também define a timina (uridina), adenina, guanina ou citosina (respectivamente) no local cor-respondente em uma cadeia complementar da molécula de ácido nucléico. Portanto, a referência pode ser feita tando à cadeia para se referir a uma posição de SNP particular, alelo de SNP ou sequênica de nucleotídeo. Sondas e primers, podem ser projetadas para hibridizar tanto a cadeia quanto métodos para genotipar o SNP descrito aqui podem geralmente orientar qualquer cadeia. Por todo o relatório, ao identificar uma posição de SNP, referência é geralmente feita à cadeia que codifica proteína, apenas com o objetivo de ser conveniente.
[00111]Referências a vários peptídeos, polipeptídeos ou proteínas da presente invenção incluem peptídeos, polipeptídeos, proteínas ou fragmentos dos mesmos, que contêm pelo menos um resíduo de aminoácido que se difere da sequência de aminoácido correspondente do peptídeo/polipeptídeo/proteína conhecida na técnica (a proteína conhecida na técnica pode ser intercambiavelmente referida como a proteína “tipo selvagem”, “referência” ou “normal”). Tais peptí- deos/polipeptídeos/proteínas de variante podem resultar de uma mudança de códon causada por uma substituição de nucleotídeo não sinônima na posição de SNP que codifica proteína (ou seja, uma mutação missense) descrita pela presente invenção. Peptídeos/polipeptídeos/proteínas da presente invenção podem também resultar de uma mutação nonsense (ou seja, um SNP que cria um códon de terminação prematuro, um SNP que gera uma mutação read-through pela eliminação de um códon de terminação), ou devido a qualquer SNP descrito pela presente invenção que de outro modo altera a estrutura, função, atividade ou expressão de uma proteína, tal como um SNP em uma região regulatória (por exemplo, um promotor ou melhorador) ou um SNP que leva a união alternativa ou defeituosa, tal como um SNP em um in- tron ou um SNP em um limite exon/intron. Como usado aqui, os termos “polipeptí- deo”, “peptídeo” e “proteína” são utilizados intercambiavelmente.
[00112]Como usado aqui, um “alelo” pode se referir a um nucleotídeo em uma posição de SNP (em que pelo menos dois nucleotídeos alternativos estão presentes na população na posição de SNP, de acordo com a definição inerente de um SNP) ou pode se referir a um resíduo de aminoácido que é codificado pelo códon que contém a posição de SNP (onde os nucleotídeos alternativos que estão presentes na população da posição de SNP formam códons alternativos que codificam resíduos de aminoácido diferentes). Utilizando o KIF6 SNP (hCV3054799/rs20455) como um exemplo, o termo “alelo” pode se referir a, por exemplo, um nucleotídeo ‘A’ ou ‘G’ (ou os complementos opostos dos mesmos) na posição de SNP, ou um resíduo de triptofano (Trp) ou arginina (Arg) na posição de aminoácido 719 da proteína de KIF6. Um “alelo” pode também ser referido aqui como uma “variante”. Também, um resíduo de aminoácido que é codificado por um códon contendo um SNP particular pode simplesmente ser referido como sendo codificado pelo SNP.
[00113]Os resultatod de um teste (por exemplo, um risco de indivíduo para CHD ou aneurisma/dissecção, ou uma receptividade ao medicamento prevista do indivíduo, baseado na avaliação de um ou mais SNPs descritos aqui, e/ou um genó- tipo do indivíduo para um ou mais SNPs descritos aqui, etc.), e/ou qualquer outra informação pertencente ao teste, pode ser referida aqui como um “relatório”. Um relatório tangível pode opcionalmente ser gerado como parte de um processo de teste (que pode ser intercambiavelmente referido aqui como “”declarando”, ou como “provendo” um relatório, “produzindo” um relatório, ou “gerando” um relatório). Exemplos de relatórios tangíveis podem incluir, mas não está limitado a, relatórios em papel (tais como impressos gerados por computador de resultados de teste) ou formatos equivalentes e relatórios armazenados em meio legível por computador (tal como um CD, disco rígido de computador, ou servidor de rede de computador, etc.). Rela- tórios, particularmente aqueles armazenados em meio legível por computador, podem ser parte de uma base de dados (tal como uma base de dados de registros de paciente, que pode ser uma “base de dados segura” que tem características de segurança que limitam o acesso ao relatório, tal como para permitir apenas ao paciente e ao médico do paciente ver o relatório, por exemplo). Adicionalmente, ou como uma alternativa, a gerar um relatório tangível, os relatórios podem também ser expostos em uma tela de computador (ou o monitor de outro dispositivo ou instrumento eletrônico).
[00114]Um relatório pode adicionalmente ser “transmitido” ou “comunicado” (esses termos podem ser usados aqui intercambiavelmente), tal como ao indivíduo que foi testado, um profissional da área médica (por exemplo, um médico, enfermeiro, profissional de laboratório clínico, orientador de genética, etc.), uma organização de saúde, um laboratório clínico e/ou qualquer outra parte que pretenda ver ou possuir o relatório. O ato de “transmitir” ou “comunicar” um relatório pode ser por qualquer meio conhecido na técnica, baseado na forma do relatório. Além disso, “transmitir” ou “comunicar” um relatório pode incluir entregar um relatório (“prosseguir”) e/ou devolver (“puxar”) um relatório. Por exemplo, relatórios podem ser transmiti- dos/comunicados por tais meios como sendo fisicamente transferidos entre partes (tal como para relatórios no formato em papel), tais como por ser fisicamente entregues de uma parte para outra, ou por ser transmitido eletronicamente ou na forma de sinal (por exemplo, via e-mail ou pela internet, por fax e/ou por qualquer método de comunicação sem fio ou cabeado conhecido na técnica), tal como por ser devolvido a partir da base de dados armazenado em um servidor de rede de computador, etc.
MOLÉCULAS DE ÁCIDO NUCLÉICO ISOLADAS E REAGENTES E KITS DE DETECÇÃO DE SNP
[00115]As tabelas 1 e 2 provêem uma variedade de informações sobre cada SNP da presente invenção que está associado à CHD (particularmente MI), aneu- risma/dissecção e/ou resposta ao medicamento (particularmente resposta ao tratamento de estatina), incluindo as sequências de transcrição (SEQ ID NO: 1), sequênciasgenômicas (SEQ ID NOS: 4-9) e sequências de proteína (SEQ ID NO: 2) dos produtos genéticos codificados (com os SNPs indicados pelos códigos IUB nas sequências de ácido nucléico). Adicionalmente, as tabelas 1 e 2 incluem sequências de contexto de SNP, que geralmente inclui 100 nucleotídeos ascendentes (5’) mais 100 nucleotídeos descendentes (3’) de cada posição de SNP (SEQ ID NO: 3 correspondeàs sequências de contexto de SNP baseada em transcrição descritas na tabela 1, e SEQ ID NOS: 10-132 corresponde às sequências de contexto baseadas em genômica descritas na tabela 2), os nucleotídeos alternativos (alelos) em cada posição de SNP, e informações adicionais sobre a variante onde relevante, tal como tipo de SNP (codificação, missense, local de união, UTE, etc.), população humana na qual o SNP foi observado, frequências de alelo observado, informações sobre proteína codificada, etc.
Moléculas de ácido nucléico isoladas
[00116]A presente invenção provê moléculas de ácido nucléico isoladas que contêm um ou mais SNPs descritos nas tabela 1 e/ou tabela 2. Moléculas de ácido nucléico isoladas contendo um ou mais SNPs descritos em pelo menos uma das tabelas 1 e 2 podem ser intercambiavelmente referidos em todo o presente texto com “moléculas de ácido nucléico contendo SNP”. Moléculas de ácido nucléico isoladas podem opcionalmente codificar uma proteína de variante de comprimento total ou fragmento do mesmo. As moléculas de ácido nucléico isoladas da presente invenção também incluem sondas e primers (que são descritos em maior detalhes abaixo na seção intitulada “Reagentes de detecção de SNP”), que podem ser utilizados para avaliar os SNPs descritos, e genes de comprimento total isolados, transcrições, moléculas de cDNA e fragmentos dos mesmos, que podem ser utilizados para tal propósito como expressando uma proteína codificada.
[00117]Como utilizado aqui, uma “molécula de ácido nucléico isolada” geralmenteé uma que contém um SNP da presente invenção ou uma que hibridiza tal molécula, tal como um ácido nucléico com uma sequência complementar, e é separada da maioria de outros ácidos nucléicos presentes na fonte natural da molécula de ácido nucléico. Além disso, uma molécula de ácido nucléico “isolada”, tal como uma molécula cDNA contendo um SNP da presente invenção, pode ser substancialmente livre de outros materiais celulares, ou meio de cultura quando produzida por técnicas de recombinação, ou precursores químicos ou outros produtos químicos quando sintetizados quimicamente. Uma molécula de ácido nucléico pode ser fundida a outra sequência regulatória ou de codificação e ainda ser considerada “isolada”. Moléculas de ácido nucléico presentes em animais transgênicos não humanos, que não ocorrem naturalmente no animal, também são considerados “isolados”. Por exemplo, moléculas de DNA recombinante contidas em um vetor são consideradas “isoladas”. Exemplos adicionais de moléculas de DNS “isoladas” incluem moléculas de DNS recombinante mantidas em células hospedeiras heterólogas, e moléculas de DNA purificadas (parcialmente ou substancialmente) em solução. Moléculas de RNA isoladas incluem transcrições de RNA in vivo ou in vitro das moléculas de DNA contendo SNP isoladas da presente invenção. Moléculas de ácido nucléico isoladas de acordo com a presente invenção incluem adicionalmente tais moléculas sinteticamente produzidas.
[00118]Geralmente, uma molécula de ácido nucléico contendo SNP isolada compreende uma ou mais posições de SNP descritas na presente invenção com sequências de nucleotídeo flanqueadas em qualquer lado das posições de SNP. Uma sequência flanqueada pode incluir resíduos de nucleotídeo que estão naturalmente associados ao local de SNP e/ou sequências de nucleotídeo heterólogas. Preferivelmente, a sequência flanqueada é de aproximadamente 500, 300, 100, 60, 50, 30, 25, 20, 15, 10, 8 ou 4 nucleotídeos (ou qualquer outro comprimento intermediário) em qualquer lado de uma posição de SNP, ou tão longo quanto o comprimento total do gene ou toda a sequência que codifica proteína (ou qualquer porção do mesmo, tal como um exon), especialmente se a molécula de ácido nucléico contendo SNP for para ser utilizada para produzir uma proteína ou fragmento de proteína.
[00119]Para genes de comprimento total e sequências inteiras de codificação de proteína, uma sequência de flanqueamento de SNP pode ser, por exemplo, até aproximadamente 5 KB, 4 KB, 3 KB, 2 KB, 1 KB em qualquer lado do SNP. Além disso, em tais casos a molécula de ácido nucléico isolada compreende sequências exônica (incluindo codificação de proteína e/ou seuqências exônica de não codificação), mas pode também incluir sequências intrônicas. Portanto, qualquer sequência que codifica proteína pode ser tanto contígua quanto separada por introns. O ponto importante é que o ácido nucléico é isolado de sequências de flanqueamento desprezível ou remoto e é de comprimento apropriado de forma que possa ser submetido a manipulações específicas ou usos descritos aqui, tais como expressão de proteína recombinante, preparação de sondas e primers para avaliar a posição de SNP e outros usos específicos de sequências de ácido nucléico contendo SNP.
[00120]Uma molécula de ácido nucléico contendo SNP isolado pode compreender, por exemplo, um gene ou transcrição de comprimento total, tal como um gene isolado de DNA genômico (por exemplo, por clonagem ou amplificação PCR), uma molécula de cDNA ou uma molécula de transcrição de mRNA. Sequências de transcrição polimórficas estão referidas na tabela 1 e providas na Listagem Sequências (SEQ ID NO: 1), e sequências genômicas polimórficas são referidas na tabela 2 e providas na Listagem de Sequências (SEQ ID NOS: 4-9). Além disso, fragmentos de tais genes e transcrição de comprimento total que contêm um ou mais SNPs descritos aqui também estão incluídos na presente invenção, e tais fragmentos podem ser utilizados, por exemplo, para expressar qualquer parte de uma proteína, tal como um domínio funcional particular ou epítopo antigênico.
[00121]Portanto, a presente invenção também engloba fragmentos das sequências de ácido nucléico como descrito nas tabelas 1 e 2 (sequências de transcri- çãosão referidas na tabela 1 como SEQ ID NO: 1, sequências genômicas são referidas na tabela 2 como SEQ ID NOS: 4-9, sequências de contexto de SNP baseadas em genômica são referidas na tabela 2 como SEQ ID NOS: 10-132) e seus complementos. As sequências reais referidas nas tabelas são providas na Listagem de Se-quências. Um fragmento compreende tipicamente uma sequência de nucleotídeo contígua pelo menos aproximadamente 8 nucleotídeos ou mais, mais preferivelmente pelo menos aproximadamente 12 nucleotídeos ou mais, e ainda mais preferivelmente pelo menos 16 nucleotídeos ou mais. Além disso, um fragmento poderia compreender pelo menos aproximadamente 18, 20, 22, 25, 30, 40, 50, 60, 80, 100, 150, 200, 250 ou 500 nucleotídeos em comprimento (ou qualquer outro número intermediário). O comprimento do fragmento será baseado em sua intenção de uso. Por exemplo, o fragmento pode codificar regiões sustentando epítopo de um peptí- deo de variante ou regiões de um peptídeo de variante que diferem da proteína nor- mal/tipo selvagem, ou pode ser útil como uma sonda ou primer de polinucleotídeo. Tais fragmentos podem ser isolados utilizando sequências de nucleotídeo providas nas tabelas 1 e/ou 2 para a síntese de uma sonda de polinucleotídeo. Uma sonda rotulada pode, então, ser utilizada, por exemplo, para classificar uma biblioteca de cDNA, biblioteca de DNA genômico ou mRNA para ácido nucléico isolado corres-pondenteà região de codificação. Ademais, primers podem ser utilizados em reações de amplificação, tais como para propósitos de avaliação de um ou mais locais de SNPs ou para clonar regiões específicas de um gene.
[00122]Uma molécula de ácido nucléico isolada da presente invenção engloba adicionalmente um polinucleotídeo contendo SNP que é o produto de qualquer uma de uma variedade de métodos de amplificação de ácido nucléico, que são utili- zados para aumentar o número de cópias de um polinucleotídeo de interesse em uma amostra de ácido nucléico. Tais métodos de amplificação são bem conhecidos na técnica, e incluem, mas não estão limitados a, reação de cadeia de polimerase (PCR) (Patente US N° 4.683.195 e 4.683.202; PCR Technology: Principles and Applications for DNA Amplification, Ed. H.A. Erlich, Freeman Press, NY, NY (1992)), reação de cadeia de ligase (LCR) (Wu e Wallace, Genomics 4:560 (1989); Lande- gren e outros, Science 241:1077 (1988)), amplificação de deslocamento de fita (SDA) (Patente US N° 5.270.184 e 5.422.252), amplificação mediada por transcrição (TMA) (Patente US N° 5.399.491), amplificação linear ligada (LLA) (Patente US N° 6.027.923) e semelhantes, e métodos de amplificação isotérmica, tais como sequência de ácido nucléico baseada em amplificação (NASBA) e replicação de sequência autossustentada (Guatelli e outros, Proc Natl Acad Sci USA 87:1874 (1990)). Com base em tais tecnologias, uma pessoa versada na técnica pode prontamente projetar primers em quaisquer regiões adequadas 5’ e 3’ para um SNP descrito aqui. Tais primers podem ser utilizados para amplificar DNA de qualquer comprimento tão longo que possa conter o SNP de interesse nesta sequência.
[00123]Como utilizado aqui, um “polinucleotídeo amplificado” da invenção é uma molécula de ácido nucléico contendo SNP cuja quantidade foi aumentada pelo menos duas vezes por qualquer método de amplificação de ácido nucléico realizado in vitro quando comparado a sua quantidade inicial em uma amostra de teste. Em outras modalidades preferidas, um polinucleotídeo amplificado é o resultado de pelo menos dez vezes, quinze vezes, cem vezes, mil vezes, ou ainda dez mil vezes de aumento quando comparado a sua quantidade inicial em uma amostra de teste. Em uma amplificação típica PCR, um polinucleotídeo de interesse é geralmente amplificado pelo menos quinze mil vezes em quantidade sobre o DNA genômico não amplificado, mas a quantidade precisa de amplificação necessitada para uma avaliação depende da sensibilidade do método de detecção subsequente utilizado.
[00124]Geralmente, um polinucleotídeo amplificado é pelo menos aproximadamente 16 nucleotídeos em comprimento. Mais tipicamente, um polinucleotídeo amplificado é pelo menos aproximadamente 20 nucleotídeos em comprimento. Em uma modalidade preferida da invenção, um polinucleotídeo amplificado é pelo menos aproximadamente 30 nucleotídeos em comprimento. Em uma modalidade mais preferida da invenção, um polinucleotídeo amplificado é pelo menos aproximadamente 32, 40, 45, 50 ou 60 nucleotídeos em comprimento. Em ainda outra modalidade preferida da invenção, um polinucleotídeo amplificado é pelo menos aproximadamente 100, 200, 300, 400 ou 500 nucleotídeos em comprimento. Enquanto o comprimento total de um polinucleotídeo da invenção pode ser tão longo quanto um exon, um intron ou o gene inteiro onde o SNP de interesse reside, um produto amplificadoé tipicamente até aproximadamente 1000 nucleotídeos em comprimento (embora certos métodos de amplificação possam gerar produtos amplificados maiores do que 1000 nucleotídeos em comprimento). Mais preferivelmente, um polinucleotí- deo amplificado não é maior do que aproximadamente 600-700 nucleotídeos em comprimento. Deve ser entendido que independente do comprimento de um polinu- cleotídeo amplificado, um SNP de interesse pode estar localizado em qualquer lugar ao longo de sua sequência.
[00125]Em uma modalidade específica da invenção, o produto amplificado é pelo menos aproximadamente 201 nucleotídeos em comprimento, compreende um das sequências de contexto baseadas em transcrição ou sequências de contexto baseadas em genômica mostradas nas tabelas 1 e 2. Tal produto pode ter adicionalmentesequências em suas extremidades 5’ ou 3’ ou ambas. Em outra modalidade, o produto amplificado é aproximadamente 101 nucleotídeos em comprimento, e contém um SNP descrito aqui. Preferivelmente, o SNP está localizado no meio do produto amplificado (por exemplo, na posição 101 em um produto amplificado que é 201 nucleotídeos em comprimento, ou na posição 51 em um produto amplificado que é 101 nucleotídeos em comprimento), ou dentro de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15 ou 20 nucleotídeos a partir do meio do produto amplificado. Entretanto, como indicado acima, o SNP de interesse pode estar localizado em qualquer lugar ao longo do comprimento do produto amplificado.
[00126]A presente invenção provê moléculas de ácido nucléico isoladas que compreendem, consistem em ou consistem essencialmente em uma ou mais sequências de polinucleotídeos que contêm um ou mais SNPs descritos aqui, complementos dos mesmos, e fragmentos contendo SNP dos mesmos.
[00127]Por conseguinte, a presente invenção provê moléculas de ácido nu- cléico que consistem em qualquer das sequências de nucleotídeo mostradas nas tabelas 1 e/ou 2 (sequências de transcrição são referidas na tabela 1 como SEQ ID NO: 1, sequências genômicas são referidas na tabela 2 como SEQ ID NOS: 4-9, sequências de contexto de SNP baseadas em transcrição são referidas na tabela 1 como SEQ ID NO: 3 e sequências de contexto de SNP baseadas em genômica são referidas na tabela 2 como SEQ ID NOS: 10-132), ou qualquer molécula de ácido nucléico que codifica qualquer uma das proteínas de variante referidas na tabela 1 (SEQ ID NO: 2). As sequências reais referidas nas tabelas são providas na Listagem de Sequências. Uma molécula de ácido nucléico consiste de uma sequência de nu- cleotídeo quando a sequência de nucleotídeo é a sequência de nucleotídeo completa da molécula de ácido nucléico.
[00128]A presente invenção provê adicionalmente moléculas de ácido nu- cléico que consistem essencialmente em quaisquer das sequências de nucleotídeo referidas nas tabelas 1 e/ou 2 (sequências de transcrição são referidas na tabela 1 como SEQ ID NO: 1, sequências genômicas são referidas na tabela 2 como SEQ ID NOS: 4-9, sequências de contexto de SNP baseadas em transcrição são referidas na tabela 1 como SEQ ID NO: 3, e sequências de contexto de SNP baseadas em genômica são referidas na tabela 2 como SEQ ID NOS: 10-132), ou qualquer molé- cula de ácido nucléico que codifica quaisquer proteínas de variante referidas na tabela 1 (SEQ ID NO: 2). As sequências reais referidas nas tabelas estão providas na Listagem de Sequência. Uma molécula de ácido nucléico consiste essencialmente de uma sequência de nucleotídeo quando tal sequência de nucleotídeo está presente com apenas poucos resíduos de nucleotídeos adicionais na molécula final de ácidonucléico.
[00129]A presente invenção provê adicionalmente moléculas de ácido nu- cléico que compreendem quaisquer das sequências de nucleotídeo mostradas nas tabelas 1 e/ou 2 ou um fragmento contendo SNP do mesmo (sequências de transcrição são referidas na tabela 1 como SEQ ID NO: 1, sequências genômicas são referidas na tabela 2 como SEQ ID NOS: 4-9, sequências de contexto de SNP baseadas em transcrição são referidas na tabela 1 como SEQ ID NO: 3, e sequências de contexto de SNP baseadas em genômica são referidas na tabela 2 como SEQ ID NOS: 10-132), ou qualquer molécula de ácido nucléico que codifica quaisquer proteínas de variante providas na tabela 1 (SEQ ID NO: 2). As sequências reais referidas nas tabelassão providas na Listagem de Sequências. Uma molécula de ácido nucléico compreende uma sequência de nucleotídeo quando a sequência de nucleotídeo é pelo menos parte da sequência final de nucleotídeo da molécula de ácido nucléico. Em tal modo, a molécula de ácido nucléico pode ser apenas a sequência de nucleo- tídeo ou ter resíduos de nucleotídeo adicionais, tais como resíduos que estão naturalmente associados a eles ou sequências de nucleotídeo heterólogas. Tal molécula de ácido nucléico pode ter um até poucos nucleotídeos adicionais ou pode compreender muitos mais nucleotídeos adicionais. Uma breve descrição de como vários tipos destas moléculas de ácido nucléico podem ser prontamente feitas e isoladas está provida abaixo, e tais técnicas são bem conhecidas daqueles versados na técnica. Sambrook e Russell, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, NY, (2000).
[00130]As moléculas de ácido nucléico isoladas podem codificar proteínas maduras mais amioácidos de terminal carboxil ou amino adicionais ou ambos, ou aminoácidos interiores ao peptídeo maduro (quando a forma madura tem mais do que uma cadeia de peptídeo, por exemplo). Tais sequências podem desempenhar um papel no processamento de uma proteína a partir do precursor para uma forma madura, facilitar o tráfico de proteína, prolongar ou diminuir a meia vida da proteína, ou facilitar a manipulação de uma proteína para avaliação ou produção. Como ge-ralmenteé o caso in situ, os aminoácidos adicionais podem ser processados fora da proteína madura por enzimas celulares.
[00131]Portanto, as moléculas de ácido nucléico incluem, mas não estão limitadas a, moléculas de ácido nucléico tendo uma sequência que codifica um peptí- deo sozinho, uma sequência que codifica um peptídeo maduro e sequências de codificação adicionais, tais como uma sequência guia ou secretora (por exemplo, uma sequência pré-pro ou pró-proteína), um sequência que codifica um peptídeo maduro com ou sem sequências de codificação adicionais, mais sequências que não codificam adicionais, por exemplo introns e sequências 3’ e 5’ que não codificam, tais como sequências transcritas mas não traduzidas que desempenham um papel em, por exemplo, transcrição, processamento de mRNA (incluindo sinais de união e poliade- nilação), ligação de ribossomo e/ou estabilidade de mRNA. Adicionalmente, as moléculas de ácido nucléico podem ser fundidas a sequências de marcador heterólogas que codificam, por exemplo, um peptídeo que facilita a purificação.
[00132]Moléculas de ácido nucléico isoladas pode estar na forma de RNA, tais como mRNA, ou na forma de DNA, incluindo cDNA e DNA genômico, que pode ser obtido, por exemplo, por clonagem molecular ou produzido por técnicas sintéticasquímicas ou por uma combinação dos mesmos. Sambrook e Russell, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, NY (2000). Ademais, moléculas de ácido nucléico isoladas, particularmente reagentes de detecção de SNP, tais como sondas e primers, podem também estar parcialmente ou completamente na foram de um ou mais tipos de análogos de ácido nucléico, tais como ácido nu- cléico de peptídeo (PNA). Patente US No. 5.539.082; 5.527.675; 5.623.049; e 5.714.331. O ácido nucléico, especialmente DNA, pode ser duplex ou de fita simples. O ácido nucléico de fita simples pode ser a fita de codificação (fita de sentido) ou fitas de não codificação complementares (fita anti-sense). Segmentos de DNA, RNA ou PNA podem ser agrupados, por exemplo, a partir de fragmentos do genoma humano (no caso de DNA ou RNA) ou nucleotídeos simples, ligadores de oligonu- cleotídeos curtos, ou a partir de uma série de oligonucleotídeos, para prover uma molécula de ácido nucléico sintética. Moléculas de ácido nucléico podem ser prontamente sintetizadas utilizando as sequências providas aqui como uma referência; técnicas de síntese de oligômeros de PNA e oligonucleotídeos são bem conhecidas na técnica. Ver, por exemplo, Corey, “Peptide nucleic acids: expanding the scope of nucleic acid recognition”, Trends Biotechnol 15(6):224-9 (Jun, 1997), e Hyrup e outros, “Peptide nucleic acids (PNA): synthesis, properties and potential applications”, Bioorg Med Chem 4(1):5-23) (Jan. 1996). Ademais, síntese de oligonucleotídeo/PNA automatizada em larga escala (incluindo síntese em uma coleção ou superfície de conta ou outro suporte sólido) pode prontamente ser realizado utilizando sintetizado- res de ácido nucléico disponíveis comercialmente, tais como o Sintetizador de DNA de rendimento elevado 3900 da Applied Biosystems (Foster City, CA) ou o Sistema de síntese de ácido nucléico Expedite 8909, e as informações de sequência providas aqui.
[00133]A presente invenção engloba análogos de ácido nucléico que contêm nucleotídeos de ocorrência não natural, sintéticos ou modificados ou elementos estruturais ou outros produtos químicos de ácido nucléico modificados/alternativos conhecidos na técnica. Tais análogos de ácido nucléico são úteis, por exemplo, como reagentes de detecção (por exemplo, primers/sondas) para detectar um ou mais SNPs identificados na tabela 1 e/ou tabela 2. Além disso, kits/sistemas (tais como contas, coleções, etc.) que incluem esses análogos também são englobados pela presente invenção. Por exemplo, oligômeros de PNA que estão baseados nas sequências polimórficas da presente invenção são especificamente contemplados. Os oligômeros de PNA são análogos de DNA nos quais a estrutura de fosfato é substituída por uma estrutura semelhante ao peptídeo. Lagriffoul e outros, Bioorganci & Medicinal Chemistry Letters 4:1081-1082 (1994); Petersen e outros, Bioorganic & Medicinal Chemistry Letters 6:793-796 (1996); Kumar e outros, Organic Letter 3(9):1269-1272 (2001); WO 96/04000. O PNA hibridiza a RNA ou DNA complementares com afinidade e especificidade maiores do que oligonucleotídeos convencionais e análogos de oligonucleotídeo. As propriedades de PNA permitem nova biologia molecular e aplicações bioquímicas não alcançáveis com oligonucleotídeos e peptídeos tradicionais.
[00134]Exemplos adicionais de modificações de ácido nucléico que melhoram as propriedades de ligação e/ou estabilidade de um ácido nucléico incluem o uso de análagos de base, tais como inosina, intercaladores (Patente US N° 4.835.263) e ligantes de ranhura menores (Patente US N° 5.801.115). Portanto, as referências aqui a moléculas de ácido nucléico, moléculas de ácido nucléico contendo SNP, reagentes de detecção de SNP (por exemplo, sondas e primers), oligonu- cleotídeos/polinucleotídeos incluem oligômeros de PNA e outros análogos de ácido nucléico. Outros exemplos de análogos de ácido nucléico e produtos químicos de ácido nucléico modificados/alternativos conhecidos na técnica estão descritos em Current Protocols in Nucleic Acid Chemistry, John Wiley & Sons, NY (2002).
[00135]A presente invenção provê adicionalmente moléculas de ácido nu- cléico que codificam fragmentos de polipeptídeos de variantes descritos aqui, bem como moléculas de ácido nucléico que codificam variantes óbvias de tais polipeptí- deos de variante. Tais moléculas de ácido nucléico podem ser de ocorrência natural, tais como parálogos (locais diferentes) e ortólogos (organismos diferentes), ou podem ser construídos por métodos de DNA recombinante ou síntese química. Variantes de ocorrência não natural podem ser feitos por técnicas de mutagênese, incluindo aquelas aplicadas às moléculas de ácido nucléico, células ou organismos. Por conseguinte, as variantes pode conter substituições, deleções, inversões e inserções de nucleotídeo (em adição aos SNPs descritos nas tabelas 1 e 2). A variação pode ocorrer em qualquer ou ambas as regiões de codificação e não codificação. As variações podem produzir substituições de aminoácido conservadores e/ou não conservadoras.
[00136]Variantes adicionais às moléculas de ácido nucléico descritas nas tabelas 1 e 2, tais como variantes alélicas de ocorrência natural (bem como ortólogos e parálogos) e variantes sintéticas produzidas por técnicas de mutagênese, podem ser identificadas e/ou produzidas utilizando métodos bem conhecidos na técnica. Tais variantes adicionais podem compreender uma sequência de nucleotídeo que compartilha pelo menos 70-80%, 80-85%, 85-90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com uma sequência de ácido nucléico descrita nas tabelas 1 e/ou 2 (ou um fragmento do mesmo) e que inclui um alelo de SNP novo descrito nas tabelas 1 e/ou 2. Ademais, as variantes podem compreender uma sequência de nucleotídeo que codifica um polipeptídeo que compartilha pelo menos 70-80%, 80-85%, 85-90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com uma sequência de polipeptídeo descrita na tabela 1 (ou um fragmento do mesmo) e que inclui um alelo de SNP descrito nas tabelas 1 e/ou 2. Portanto, um aspecto de presente invenção que é especificamente contemplado são moléculas de ácido nucléico isoladas que têm um certo grau de variação de sequência comparado com as sequências mostradas na tabelas 1-2, mas que contêm um alelo de SNP novo descrito aqui. Em outras palavras, enquanto uma molécula de ácido nucléico contém um alelo de SNP novo descrito aqui, outras porções da molécula de ácido nucléico que flanqueiam o alelo de SNP novo podem variar em algum grau das sequências de contexto, genômicas e de transcrição específicas referidas e mostradas nas tabelas 1 e 2, e podem codificar um poli- peptídeo que varia em algum grau de sequências de polipeptídeo específicas referidas na tabela 1.
[00137]Para determinar o percentual de identidade de duas sequências de aminoácido ou duas sequências de nucleotídeo que compartilham homologia de sequências, as sequências são alinhadas para propósitos de comparação ótimos (por exemplo, fendas podem ser introduzidas em uma ou ambas de uma primeira e uma segunda sequência de aminoácido ou ácido nucléico para alinhamento ótimo e sequências não homólogas podem ser desconsideradas para propósitos de comparação). Em uma modalidade preferida, pelo menos 30%, 40%, 50%, 60%, 70%, 80% ou 90% ou mais do comprimento da sequência de referência está alinhado para propósitos de comparação. Os resíduos de aminoácido ou nucleotídeos nas posições de aminoácido ou posições de nucleotídeo correspondentes são, então, comparados. Quando uma posição na primeira sequência é ocupada pelo mesmo resíduo de aminoácido ou nucleotídeo como a posição correspondente na segunda sequência, então, as moléculas são idênticas naquela posição (como usado aqui, “identidade” de ácido nucléico ou aminoácido é equivalente à “homologia” de ácido nucléico ou aminoácido). O percentual de identidade entre as duas sequências é uma função do número de posições idênticas compartilhadas pelas sequências, levando em conta o número de fendas, e o comprimento de cada fenda, que necessita ser introduzida para alinhamento ótimo de duas sequências.
[00138]A comparação de sequências e determinação de percentual de identidade entre duas sequências pode ser realizada utilizando um algorítimo matemático.Computational Molecular Biology, A.M. Lesk, ed. Oxford University Press, NY (1988); Biocomputing: Informatics and Genome Projects, D.W. Smith, ed. Academic Press, NY (1993); Computer Analysis of Sequence Data, Parte 1, A.M. Griffin e H.G. Griffin, eds. Humana Press, NJ (1994); Sequence Analysis in Molecular Biology, G, von Heinje, Ed. Academic Press, NY (1987); e Sequence Analysis Primer, M. Gribskov e J. Devereux, eds. M. Stockton Press, NY (1991). Em uma modalidade preferida, o percentual de identidade entre duas sequências de aminoácido é deter-minado utilizando o algorítimo de Needleman e Wunsch (J Mol Biol (48):444-453 (1970)) que foi incorporado no programa GAP no pacote de software GCG, utilizando tanto uma matriz Blossom 62 quanto uma matriz PAM250, e um peso de fenda de 16, 14, 12, 10, 8, 6 ou 4, e um peso de comprimento de 1, 2, 3, 4, 5 ou 6.
[00139]Em ainda outra modalidade preferida, o percentual de identidade entre duas sequências de nucleotídeo é determinado utilizando um programa GAP em um pacote de software GCG usando uma matriz NWSgapdna.CMP e um peso de fenda de 40, 50, 60, 70 ou 80 e um peso de comprimento de 1, 2, 3, 4, 5 ou 6. J. Devereux e outros, Nucleic Acids Res. 12(1):387 (1984). Em outra modalidade, o percentual de identidade entre duas sequências de aminoácido ou nucleotídeo é determinado utilizando o algorítimo de E. Myers e W. Miller (CABIOS 4:11-17 (1989)) que foi incorporado em um programa ALIGN (versão 2.0), usando uma tabela de resído pesado PAM120, uma penalidade de comprimento de fenda de 12 e uma penalidade de fenda de 4.
[00140]As sequências de nucleotídeo e aminoácido da presente invenção podem ser adicionalmente utilizadas como um “sequência de pesquisa” para realizar uma busca em bases de dados de sequências; por exemplo, para identificar outros membros da família ou sequências relacionadas. Tais buscas podem ser realizadas utilizando os programas NBLAST e XBLAST (versão 2.0). Altschul e outros, J Mo Biol 215:403-10 (1990). Buscas de nucleotídeos BLAST podem ser realizadas com o programa NBLAST, resultado = 100, comprimento de palavra = 12 para obter sequências de nucleotídeos homólogas às moléculas de ácido nucléico da invenção. Buscas de proteína BLAST podem ser realizadas com o programa XBLAST, resultado = 50, comprimento de palavra = 3 para obter sequências de aminoácidos homólogasàs proteínas da invenção. Para obter alinhamentos com fendas para propósitos de comparação, BLAST com fendas pode ser utilizado. Altschul e outros, Nucleic Acids Res 25(17):3389-3402 (1997). Quando se utiliza programas BLAST ou BLAST com fendas, os parâmetros padrão dos respectivos programas (por exemplo, XBLAST e NBLAST) podem ser usados. Além de BLAST, exemplos de outros programas de comparação de sequência e busca utilizados na técnica incluem, mas não estão limitados a, FASTA (Pearson, Methods Mol Biol 25, 365-389 (1994)) e KERR (Dufresne e outros, Nat Biotechnol 20(12):1269-71 (Dec. 2002)). Para informações adicionais sobre técnicas de bioinformática, ver Current Protocols in Bioinformatics, John Wiley & Sons, Inc. NY.
[00141]A presente invenção provê fragmentos não codificados das moléculas de ácido nucléico descritas nas tabelas 1 e/ou 2. Fragmentos não codificados preferidos incluem, mas não estão limitados a, sequências de promotores, sequências de melhoradores, sequências intrônicas, regiões não traduzidas 5’ (UTRs), regiões não traduzidas 3’, sequências de modulação de gene e sequências de terminação de gene. Tais fragmentos são úteis, por exemplo, no controle de expressão de gene heterólogo e no desenvolvimento de classificações para identificar agentes de modulação de gene.
Reagentes de detecção de SNP
[00142]Em um aspecto específico da presente invenção, os SNPs descritos nas tabelas 1 e/ou 2, e suas sequências de transcrição associadas (referidas na tabela 1 como SEQ ID NO: 1), sequências genômicas (referidas na tabela 2 como SEQ ID NOS: 4-9) e sequências de contexto (sequências de contexto baseadas em transcrição são referidas na tabela 1 como SEQ ID NO: 3; sequências de contexto baseadas em genômica são providas na tabela 2 como SEQ ID NOS: 10-132), po- dem ser utilizados para projetar reagentes de detecção de SNP. As sequências reais referidas nas tabelas são providas na Listagem de Sequências. Como usado aqui, um “reagente de detecção de SNP” é um reagente que detecta especificamente uma posição de SNP alvo específico descrito aqui, e que é preferivelmente específico para um nucleotídeo particular (alelo) da posição de SNP alvo (ou seja, o reagente de detecção pode preferivelmente diferenciar entre nucleotídeos alternativos diferentes em uma posição de SNP alvo, pelo que permite a identidade do nucleotídeo presente na posição de SNP alvo a ser determinada). Tipicamente, tal reagente de detecção hibridiza uma molécula de ácido nucléico contendo SNP alvo por pareamento de base complementar em modo específico de sequência, e descrimina a sequência de variante alvo de outras sequências de ácido nucléico, tais como uma forma conhecida na técnica em uma amostra de teste. Um exemplo de um reagente de detecção é uma sonda que hibridiza um ácido nucléico alvo contendo um ou mais dos SNPs referidos nas tabelas 1 e/ou 2. Em uma modalidade preferida, tal sonda pode diferenciar entre ácidos nucléicos tendo um nucleotídeo (alelo) particular em uma posição de SNP alvo de outros ácidos nucléicos que têm um nucleotídeo diferente na mesma posição de SNP alvo. Adicionalmente, um reagente de detecção pode hibridizar uma região específica 5’ e/ou 3’ de uma posição de SNP, particularmente uma região correspondendo a sequências de contexto referidas nas tabelas 1 e/ou 2 (sequências de contexto baseadas em transcrição são referidas na tabela 1 como SEQ ID NO: 3; sequências de contexto baseadas em genômica são referidas na tabela 2 como Seq ID NOS: 10-132). Outro exemplo de um reagente de detecção é um primer que age como um ponto de iniciação de extensão de nucleotídeo ao longo da fita complementar de um polinucleotídeo alvo. A informação de sequência de SNP provida aqui também é útil para projetar primers, por exemplo, primer de alelo específico, para amplificar (por exemplo, utilizando PCR) qualquer SNP da presente invenção.
[00143]Em uma modalidade preferida da invenção, um reagente de detecção de SNP é um primer ou sonda de polinucleotídeo de RNA ou DNA sintético ou isolado ou um oligômero de PNA, ou uma combinação de DNA, RNA e/ou PNA, que hibridiza um segmento de uma molécula de ácido nucléico alvo contendo um SNP identificado nas tabelas 1 e/ou 2. Um reagente de detecção na forma de um polinu- cleotídeo pode conter opcionalmente análogos de base modificados, intercaladores ou ligantes de fenda menores. Reagentes de detecção múltiplos, tais como sondas podem ser, por exemplo, afixados em um suporte sólido (por exemplo, coleções ou contas) ou fornecidos em solução (por exemplo, conjuntos de sonda/primer para reações enzimáticas, tais como PCR, RT-PCR, testes TaqMan ou reações de extensão de primer) para formar um kit de detecção de SNP.
[00144]Uma sonda ou primer é tipicamente um oligonucleotídeo substancialmente purificado ou oligômero de PNA. Tal oligonucleotídeo compreende tipicamente uma região de sequência de nucleotídeo complementar que hibridiza sob condições limitadas a pelo menos 8, 10, 12, 16, 18, 20, 22, 25, 30, 40, 50, 55, 60, 65, 70, 80, 90, 100, 120 (ou qualquer outro número intermediário) ou mais nucleotí- deos consecutivos em uma molécula de ácido nucléico alvo. Dependendo da avaliação particular, os nucleotídeos consecutivos podem tanto incluir a posição de SNP alvo quanto ser uma região específica próxima o bastante 5’ e/ou 3’ da posição de SNP para realizar a avaliação desejada.
[00145]Outras sequências de sonda ou primer preferidas podem ser prontamente determinadas utilizando as sequências de transcrição (SEQ ID NO: 1), sequências genômicas (SEQ ID NOS: 4-9) e sequências de contexto de SNP (sequências de contexto baseadas em transcrição são referidas na tabela 1 como SEQ ID NO: 3); sequências de contexto baseadas em genômica são referidas na tabela 2 como SEQ ID NOS: 10-132) descritas na Listagem de Sequências e nas tabelas 1 e 2. As sequências reais referidas nas tabelas são providas na Listagem de Sequên- cias. Será aparente para qualquer pessoa versada na técnica que tais primers e sondas são diretamente úteis como reagentes para genotipar os SNPs da presente invenção, e podem ser incorporados em qualquer formato de kit/sistema.
[00146]Para produzir uma sonda ou primer específico para uma sequência contendo SNP alvo, o gene/transcrição e/ou a sequência de contexto em volta do SNP de interesse é tipicamente examinado utilizando um algorítimo de computador que inicia na extremidade 5’ ou 3’ da sequência de nucleotídeo. Algorítimos típicos irão, então, identificar oligômeros de comprimento definido que são únicos para a sequência de contexto de gene/SNP, tendo um conteúdo GC dentro de uma faixa adequada para hibridização, faltar estrutura secundária prevista que pode interferir na hibridização, e/ou possuir outras características desejadas ou que faltam outras características desejadas.
[00147]Um primer ou sonda da presente invenção é tipicamente pelo menos aproximadamente 8 nucleotídeos em comprimento. Em uma modalidade da invenção, um primer ou sonda é pelo menos 10 nucleotídeos em comprimento. Em uma modalidade preferida da invenção, um primer ou sonda é pelo menos 12 nucleotí- deos em comprimento. Em uma modalidade mais preferida, um primer ou sonda é pelo menos aproximadamente 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 nucleotídeos em comprimento. Enquanto o comprimento máximo de uma sonda pode ser tão longa quanto a sequência alvo a ser detectada, dependendo do tipo de avaliação na qual ela é empregada, ele é tipicamente menor do que aproximadamente 50, 60, 65 ou 70 nucleotídeos em comprimento. No caso de um primer, ele é tipicamente menor do que aproximadamente 30 nucleotídeos em comprimento. Em uma modalidadeespecífica preferida da invenção, um primer ou uma sonda está dentro do comprimento de aproximadamente 18 e aproximadamente 28 nucleotídeos. Entretanto, em outras modalidades, tais coleções de ácido nucléico e outras modalidades nas quais sondas são afixadas em um substrato, as sondas podem ser maiores, tais como na ordem de 30-70, 75, 80, 90, 100 ou mais nucleotídeos em comprimento (ver a seção abaixo intitulada “Kits e sistemas de detecção de SNP”).
[00148]Para analisar SNPs, pode ser apropriado utilizar oligonucleotídeos específicos para alelos de SNP alternativos. Tais oligonucleotídeos que detectam variações de nucleotídeo simples nas sequências alvo podem ser referidas por tais termos como “oligonucleotídeos de alelo específico”, “sondas de alelo específico” ou “primers de alelo específico”. O projeto e o uso de sondas de alelo específico para analisar polimorfismos é descrito em, por exemplo, Mutation Detection: A Practical Approach, Cotton e outros, eds, Oxford University Press (1998); Saiki e outros, Nature 324:163-166 (1986); Dattagupta, EP 235.726; e Saiki, WO 89/11548.
[00149]Enquanto o projeto de cada primer ou sonda de alelo específico depende de variáveis, tais como a composição precisa das sequências de nucleotídeo que flanqueiam uma posição de SNP em uma molécula de ácido nucléico alvo, e o comprimento do primer ou sonda, outro fator no uso de primers e sondas é limitador da condição sob a qual a hibridização entre a sonda ou primer e a sequência alvo é realizada. Condições altamente limitadoras utilizam tampões com resistência iônica baixa e/ou temperatura de reação elevada, e tendem a requerer uma combinação mais perfeita entre sonda/primer e uma sequência alvo para formar um duplex estável. Se a limitação é muito alta, entretanto, a hibridização pode não ocorrer de modo algum. Ao contrário, condições de limitação baixas utilizam tampões com resistência iônica lata e/ou baixa temperatura de reação, e permitem a formação de duplex estáveis com mais bases descombinadas entre uma sonda/primer e uma sequência alvo. Como exemplo e nã limitação, condições exemplares para condições de hibri- dização de limitação alta utilizando uma sonda de alelo específico são como a seguir:pré-hibridização com uma solução contendo 5X EDTA fostado salino padrão (SSPE), 0,5% de NaDOdSO4 (SDS) a 55 °C e sonda incubando as moléculas de ácido nucléico alvo na mesma solução na mesma temperatura, seguido por lavagem com uma solução contendo 2X SSPE e 0,1% de SDS a 55 °C ou temperatura ambiente.
[00150]Condições de hibridização de limitação moderada podem ser utilizadas para reações de extensão de primer de alelo específico com uma solução contendo, por exemplo, aproximadamente 50 mM de KCl a aproximadamente 46 °C. Alternativamente, a reação pode ocorrer a uma temperatura elevada, tal como 60 °C. Em outra modalidade, uma condição de hibridização moderadamente limitada adequada para reações de avaliação da ligação de oligonucleotídeo (OLA) em que duas sondas são ligadas se elas são completamente complementares à sequência alvo podem utilizar uma solução de aproximadamente 10 mM de KCl e temperatura de 46 °C.
[00151]Em uma avaliação baseada em hibridização, sondas de alelo específico podem ser projetadas para hibridizar um segmento de um DNA alvo de um indivíduo, mas não hibridizar um segmento correspondente de outro indivíduo devido à presença de formas polimórficas diferentes (por exemplo, alelos/nucleotídeos de SNP alternativos) nos segmentos de DNA respectivos de dois indivíduos. Condições de hibridização deveriam ser suficientemente limitadoras que existisse uma diferença significativa detectável na intensidade de hibridização entre alelos, e preferivelmente uma resposta essencialmente binária, pela qual uma sonda hibridiza apenas um dos alelos ou significativamente mais fortemente um alelo. Enquanto uma sonda pode ser projetada para hibridizar uma sequência alvo que contenha um local de SNP de modo que o local de SNP se alinha em qualquer lugar ao londo da sequência da sonda, a sonda é preferivelmente projetada para hibridizar um segmento da sequência alvo de modo que o local de SNP se alinhe com uma posição central da sonda (por exemplo, uma posição dentro da sonda que é pelo menos três nucleotí- deos de qualquer extremidade da sonda). Este projeto de sonda geralmente alcança boa descriminação em hibridização entre formas alélicas diferentes.
[00152]Em outra modalidade, uma sonda ou primer pode ser projetada para hibridizar um segmento de DNA alvo de modo que o SNP se alinhe com qualquer extremidade 5’ ou 3’ da sonda ou primer. Em uma modalidade preferida específica que é particularmente adequada para uso em uma avaliação de ligação de oligonu- cleotídeo (Patente US N° 4.988.617), o nucleotídeo mais a 3’ da sonda se alinha com a posição de SNP na sequência alvo.
[00153]Sondas de oligonucleotídeos e primers podem ser preparados por métodos bem conhecidos na técnica. Métodos de sintese química incluem, mas não estão limitados a, método de fosfotriéster descrito por Narang e outros, Methods in Enzymology 68:90 (1979); método de fosfodiéster descrito por Brown e outros, Methods in Enzymology 68:109 (1979); médoto de dietilfosfoamidato descrito por Beau- cage e outros, Tetrahedron Letters 22:1859 (1981); e método de suporte sólido descrito na Patente US N° 4.458.066.
[00154]Sondas de alelos específicos são geralmente utilizadas em pares (ou, menos comumente, em conjuntos de 3 ou 4, tais como se uma posição de SNP é conhecida por ter 3 ou 4 alelos, respectivamente, ou para avaliar ambas as fitas de uma molécula de ácido nucléico para um alelo de SNP alvo). E tais pares podem ser indênticos exceto por uma descombinação de nucleotídeo que representa as variantes alélicas da posição de SNP. Comumente, um elemento de um par combina perfeitamente com uma forma de referência de uma sequência alvo que tem um alelo de SNP mais comum (ou seja, o alelo que é mais frequente na população alvo) e o outro elemento do par combina perfeitamente com uma forma da sequência alvo que tem um alelo de SNP menos comum (ou seja, o alelo que é mais raro na população alvo). No caso de uma coleção, múltiplos pares de sondas podem ser imobilizados no mesmo suporte para analisar simultaneamente os múltiplos polimorfismos dife-rentes.
[00155] Em um tipo de avaliação baseada em PCR, um primer de alelo específico hibridiza um região em uma molécula de ácido nucléico alvo que sobrepõe uma posição de SNP e apenas amplificação de primers de uma forma alélica a qual o primer exibe complementariedade perfeita. Gibbs, Nucleic Acid Res 17:2427-2448 (1989). Tipicamente, o nucleotídeo mais 3’ do primer está alinhado com e complementarà posição de SNP da molécula de ácido nucléico alvo. Este primer é utilizado em conjunto com um segundo primer que hibridiza em um extremidade distal. A am-plificação prossegue a partir dos dois primers, produzindo um produto detectável que indica qual forma de alelo está presente na amostra de teste. Um controle é usualmente realizado com um segundo par de primers, um dos quais mostra uma des- combinação de base simples no local polimórfico e o outro deles exibe perfeita com- plementariedade na extremidade distal. A descombinação de base simples evita amplificação ou reduz substancialmente a eficiência da amplificação, de modo que tanto nenhum produto detectável é formado quando ele é formado em quantidade menores ou em um ritmo vagaroso. O método geralmente trabalha mais eficazmente quando a descombinação está na posição mais 3’ do oligonucleotídeo (ou seja, a posição mais 3’ do oligonucleotídeo se alinha à posição do SNP alvo) porque essa posição é mais desestabilizada pelo alongamento do primer (ver, por exemplo, WO 93/22456). Esta avaliação baseada em PCR pode ser utilizada como parte de uma avaliação TaqMan, descrita abaixo.
[00156]Em uma modalidade específica da invenção, um primer da invenção contém uma sequência substancialmente complementar a um segmento de uma molécula de ácido nucléico contendo SNP alvo exceto que o primer tem um nucleo- tídeo descombinado em uma das três posições de nucleotídeo na extremidade mais 3’ do primer, de modo que o nucleotídeo descombinado não baseia par com um ale- lo particular no local de SNP. Em uma modalidade preferida, o nucleotídeo descom- binado no primer é o segundo a partir do último nucleotídeo na posição mais 3’ do primer. Em uma modalidade mais preferida, o nucleotídeo descombinado no primer é o último nucleotídeo na posição mais 3’ do primer.
[00157]Em outra modalidade da invenção, um reagente de detecção de SNP da invenção é rotulado com um corante relator fluorogênico que emite um sinal de- tectável. Enquanto o corante relator preferido é um corante fluorescente, qualquer corante relator que pode ser ligado ao reagente de detecção, tal como uma sonda ou primer de nucleotídeo é adequado para uso na invenção. Tais corantes incluem, mas não estão limitados a, Acridina, AMCA, BODIPY, azul cascata, Cy2, Cy3, Cy5, Cy7, Dabcyl, Edans, Eosina, Eritrosina, Fluoresceína, 6-Fam, Tat, Joe, Hex, verde oregon, Rodamina, verde rodol, Tamra, Rox e vermelho Texas.
[00158]Em ainda outra modalidade da invenção, o reagente de detecção pode ser adicionalmente rotulado com um corante extintor, tal como Tamra, especialmente quando o reagente é utilizado para autoextinguir a sonda, tal como um TaqMan (Patente US N° 5.210.015 e 5.538.848) ou uma sonda marcadora molecular (Patente US N° 5.118.801 e 5.312.728), ou outras sondas marcadoras lineares ou sem haste (Livak e outros, PCR Method Appl 4:357-362 (1995); Tyagi e outros, Nature Biotechnology 14:303-308 (1996); Nazarenko e outros, Nucl Acids Res 25:2516-2521 (1997); Patente US No. 5.866.336 e 6.117.635.
[00159]Os reagentes de detecção da invenção podem também conter outros rótulos, incluindo, mas não limitado a, biotina para ligação de estreotavidina, hapteno para ligação de anticorpo, e oligonucleotídeo para ligação a outro oligonucleotídeo complementar, tal como pares de código de área.
[00160]A presente invenção também contempla reagentes que não contêm (ou que são complementares a) um nucleotídeo de SNP identificado aqui, mas são utilizados para avaliar um ou mais SNPs descritos aqui. Por exemplo, primers que flanqueiam, mas não hibridizam diretamente uma posição de SNP alvo provida aqui são úteis em reações de extensão de primer nas quais os primers hibridizam uma região adjacente à posição de SNP alvo (ou seja, dentre de um ou mais nucleotí- deos a partir do local de SNP alvo). Durante a reação de extensão de primer, um primer não é tipicamente capaz de se estender além do local de SNP alvo se um nucleotídeo (alelo) particular está presente naquele local de SNP, e o produto de extensão de primer pode ser detectado para determinar qual alelo de SNP está presente no local de SNP alvo. Por exemplo, ddNTPs particulares são tipicamente utilizado em reação de extensão de primer para terminar a extensão de primer um vez que ddNTP é incorporado ao produto de extensão (um produto de extensão de primer que inclui um ddNTP na extremidade mais 3’ do produto de extensão de primer, e no qual o ddNTP é um nucleotídeo de um SNP descrito aqui, é uma composição que é especificamente contemplada pela presente invenção). Portanto, os reagentes que se ligam a uma molécula de ácido nucléico em uma região adjacente ao local de SNP e que são utilizados para avaliar a posição de SNP, mesmo que as sequências de ligação não necessariamente incluam o local de SNP por si, também são contemplados pela presente invenção.
Kits e Sistemas de Detecção de SNP
[00161]Uma pessoa versada na técnica reconhecerá que, baseado no SNP e informação de sequência associada descritos aqui, os reagentes de detecção podem ser desenvolvidos e utilizados para avaliar qualquer SNP da presente invenção individualmente ou em combinação, e tais reagentes de deteclção podem ser prontamente incorporados em um dos formatos de kit ou sistema estabelecidos que são bem conhecidos na técnica. Os termos “kits” e “sistemas”, como usados aqui no contexto de reagentes de detecção de SNP, pretendem se referir a tais coisas como combinações de múltiplos reagentes de detecção de SNP, ou um ou mais reagentes de detecção de SNP em combinação com um ou mais outros tipos de elementos ou componenter (por exemplo, outros tipos de reagentes bioquímicos, recipientes, embalagens, tais como embalagens para venda comercial, substratos aos quais os reagentes de detecção de SNP são fixados, componentes de hardware eletrônicos, etc. Por conseguinte, a presente invenção provê adicionalmente kits e sistemas de detecção de SNP, incluindo, mas não limitado a, conjuntos de primer e sonda embalados (por exemplo, conjuntos de primer/sonda TaqMan), coleções/microcoleções de moléculas de ácido nucléico, e contas que contêm uma ou mais sondas, primers ou outros reagentes de detecção para detectar um ou mais SNPs da presente invenção. Os kits/sistemas podem opcionalmente incluir vários componentes de hardware eletrônicos; por exemplo, coleções (“chips de DNA”) e sistemas microfluidos (sistemas de “laboratório em pastilha”) providos por vários fabricantes tipicamente compreendendo componentes de hardware. Outros kits/sistemas (por exemplo, conjuntos de sonda/primer) podem não incluir componentes de hardware eletrônicos, mas podem compreender, por exemplo, um ou mais reagentes de detecção de SNP (junto com, opcionalmente, outros reagentes bioquímicos) embalados em um ou mais recipientes.
[00162]Em algumas modalidades, um kit de detecção de SNP contém tipicamente um ou mais reagentes de detecção e outros componentes (por exemplo, um tampão, enzimas, tais como polimerases ou ligases de DNA, nucleotídeos de extensão de cadeia, tais como desoxinucleotídeo trifosfato, e no caso de reações de sequenciamento de DNA tipo Sanger, nucleotídeos de terminação de cadeia, sequências de controle positivo, sequências de controle negativo, e semelhantes) ne-cessários para realizar uma avaliação ou reação, tal como amplificação e/ou detecção de molécula de ácido nucléico contendo SNP. Um kit pode ainda conter meios para determinar a quantidade de ácido nucléico alvo, e meios para comparar a quantidade de um padrão, e pode compreender instruções para utilizar o kit para detectar a molécula de ácido nucléico contendo SNP de interesse. Em uma modalidade da presente invenção, são providos kits que contêm os reagentes necessários para realizar uma ou mais avaliações para detectar um ou mais SNPs descritos aqui. Em uma modalidade preferida da presente invenção, os kits/sistemas de detecção de SNP estão na forma de uma coleção de ácido nucléicos, ou kits compartimentaliza- dos, incluindo sistemas microfluidos/laboratório em pastilha.
[00163]Os sistemas/kits de detecção de SNP podem conter, por exemplo, uma ou mais sondas, ou pares de sondas, que hibridizam uma molécula de ácido nucléico em ou próximo a cada posição de SNP alvo. Múltiplos pares de sondas de alelo específico podem ser incluídas em um kit/sistema para avaliar simultaneamente um grande número de SNPs, pelo menos um dos quais é um SNP da presente invenção. Em alguns kits/sistemas, as sondas de alelo específico para um substrato, tal como uma coleção ou conta. Por exemplo, o mesmo substrato pode compreender sondas de alelo específico para detectar pelo menos 1; 10; 100; 1000; 10000; 100000 (ou qualquer outro número intermediário) ou substancialmente todos os SNPs mostrados nas tabelas 1 e/ou 2.
[00164]Os termos “coleções”, “microcoleções” e “chips de DNA” são utilizados aqui intercambiavelmente para se referir a uma coleção de polinucleotídeos distintos afixados ao substrato, tal como vidro, plástico, papel, nailon ou outro tipo de membrana, filtro, chip ou qualquer outro suporte sólido adequado. Os polinucleotí- deos podem ser sintetizados diretamente no substrato, ou sintetizados separados do substrato e, então, afixados ao substrato. Em uma modalidade, a microcoleção é preparada e utilizada de acordo com os métodos descritos em Chee e outros, Patente US N° 5.837.832 e pedido PCT WO95/11995; D.J. Lockhart e outros, Nat Biotech 14:1675-1680 (1996); e M. Schenae outros, Proc Natl Acad Sci 93:10614-10619, todos os quais são incorporados aqui em sua totalidade pela referência. Em outras modalidades, tais coleções são produzidas pelos métodos descritos por Brown e outros, Patente US N° 5.807.522.
[00165]Coleções de ácido nucléico são revistas nas seguintes referências: Zammatteo e outros, “New chips for molecular biology and diagnostics”, Biotechnol Annu Ver 8:85-101 (2002); Sosnowski e outros, “Active microelectronic array system for DNA hybridization, genotyping and pharmacogenomic applications”, Psychiatr Genet 12(4):181-92 (Dec 2002); Heller, “DNA microarray technology: devices, systems and applications”, Annu Rev Biomed Eng 4:129-53 (2002); Epub Mar 22, 2002; Kolchinsky e outros, “Analysis of Snps and other genomic variations using gel-based chips”, Hum Mutat 19(4):343-60 (Apr 2002); e McGall e outros, “High-density genechip oligonucleotide probe array”, Adv Biochem Eng Biotechnol 77:21-42 (2002).
[00166]Qualquer número de sondas, tais como sondas de alelo específico, pode ser implementado em uma coleção, e cada sonda ou par de sondas pode hi- bridizar uma posição de SNP diferente. No caso de sondas de polinucleotídeo, elas podem ser sintetizadas em áreas designadas (ou sintetizadas separadamente para, então, serem afixadas nas áreas designadas) em um substrato utilizando um processoquímico dirigido por luz. Cada chip de DNA pode conter, por exemplo, milhares a milhões de sondas de polinucleotídeo sintéticas individuais arranjadas em um padrão como grade e miniaturizada (por exemplo, para o tamanho de uma moeda). Preferivelmente, a sondas são afixadas a um suporte sólido em uma coleção ende- reçável, ordenada.
[00167]Uma microcoleção pode ser composta de um grande número de po- linúcleotídeos de fita simple, única, usualmente tanto polinucleotídeos antisense sintéticos quanto fragmentos de cDNAs, fixados em um suporte sólido. Polinucleotídeos típicos são preferivelmente aproximadamente 6-60 nucleotídeos em comprimento, mais preferivelmente aproximadamente 15-30 nucleotídeos em comprimento, e mais preferivelmente aproximadamente 18-25 nucleotídeos em comprimento. Para certos tipos de microcoleções ou outros kits/sistemas de detecção, pode ser preferível utilizarpolinucleotídeos que são apenas 7-20 nucleotídeos em comprimento. Em outros tipos de coleções, tais como coleções utilizadas em conjunto com tecnologia de detecção quimioluminescente, comprimentos de sonda preferidos podem ser, por exemplo, aproximadamente 15-80 nucleotídeos em comprimento, aproximadamente 50-70 nucleotídeos em comprimento, mais preferivelmente aproximadamente 55-65 nucleotídeos em comprimento, e mais preferivelmente aproximadamente 60 nucleo- tídeos em comprimento. A microcoleção ou kit de detecção pode conter plonucleotí- deos que cobrem as sequências de 5’ ou 3’ conhecidas de um gene/transcrição ou local de SNP alvo, polinucleotídeos sequenciais que cobrem sequência de comprimento total de um gene/transcrição; ou polinucleotídeos únicos selecionads de áreas particulares ao longo do comprimento de uma sequência de gene/transcrição alvo, particularmente áreas correspondentes a um ou mais SNPs descritos na tabela 1 e/ou tabela 2. Os polinucleotídeos utilizados no kit de detecção ou microcoleção podem ser específicos para um SNP ou SNPs de interesse (por exemplo, específico para um alelo de SNP particular em um local de SNP alvo, ou específico para alelos de SNP particulares em múltiplos locais de SNP diferentes), ou específicos para um gene/transcrição polimórfica ou genes/transcrições de interesse.
[00168]Avaliações de hibridização baseadas em coleção de polinucleotídeos dependem das diferenças na estabilidade de hibridização das sondas para combinar e descombinar perfeitamente as variantes de sequência alvo. Para genotipagem de SNP, é geralmente preferível que as condições limitadoras utilizadas nas avaliações de hibridização sejam altas o bastante de modo que as moléculas de ácido nucléico difiram umas das outras em uma posição de SNP simples tão pequena que possa ser diferenciada (por exemplo, avaliações de hibridização de SNP típicas são porje- tadas de modo que a hibridização ocorrerá apenas se um nucleotídeo particular estiver presente em uma posição de SNP, mas não ocorrerá se um nucleotídeo alternativo estiver presente naquela posição). Tais condições de limitação elevadas podem ser preferíveis quando utilizando, por exemplo, coleções de ácido nucléico de sondas de alelo específico para detecção de SNP. Tais condições de limitação elevadas são descritas na seção precedente, e são bem conhecidas daqueles versados na técnica e podem ser encontradas em, por exemplo, Current Protocols in Molecular Biology, 6.3.1-6.3.6, John Wiley & Sons, NY (1989).
[00169]Em outras modalidades, as coleções são utilizadas em conjunto com tecnologia de detecção quimioluminescente. As seguintes patentes e pedidos de patentes, que são todas aqui incorporadas pela referência, provêem informações adicionais que dizem respeito à detecção quimioluminescente. Pedidos de patente US que descrevem aproximações quimioluminescentes para detecção de microcole- ção: 10/620332 e 10/620333. Patentes US que descrevem métodos e composições de dioxetano para realizar detecção quimioluminescente: N° 6.124.478; 6.107.024; 5.994.073; 5.981.768; 5.871.938; 5.843.681; 5.800.999 e 5.773.628. E pedido pubil- cado US que descrevem métodos e composições para controles de microcoleção: US 2002/0110828.
[00170]Em uma modalidade da invenção, uma coleção de ácido nucléico pode compreender uma coleção de sondas de aproximadamente 15-25 nucleotídeos em comprimento. Em modalidades adicionais, uma coleção de ácido nucléico pode compreender qualquer número de sondas, nas quais pelo menos uma sonda é capaz de detectar um ou mais SNPs descritos nas tabelas 1 e/ou 2, e/ou pelo menos uma sonda compreende um fragmento de uma das sequências selecionadas do grupo que consiste naquelas descritas na tabela 1, tabela 2, Listagem de Sequências e sequências complementares do mesmo, dito fragmento compreendendo pelo menos aproximadamente 8 nucleotídeos consecutivos, preferivelmente 10, 12, 15, 16, 18, 20, mais preferivelmente 22, 25, 30, 40, 47, 50, 55, 60, 65, 70, 80, 90, 100, ou mais nucleotídeos consecutivos (ou qualquer outro número intermediário) e contendo (ou sendo complementar a) um alelo de SNP novo descrito nas tabelas 1 e/ou 2. Em algumas modalidades, o nucleotídeo complementar ao local de SNP está em 5, 4, 3, 2 ou 1 nucleotídeo a partir do centro da sonda, mais preferivelmente no centro da sonda.
[00171]Uma sonda de polinucleotídeo pode ser sintetizada na superfície do substrato utilizando-se um procedimento de acoplamento químico e um aparelho de aplicação de jato de tinta, conforme descrito no pedido PCT WO 95/251116 (Baldes- chweiler e outros) que é incorporado aqui em sua totalidade pela referência. Em outro aspecto, uma coleção “gradeada” análoga a um dot (ou slot) bot pode ser usada para organizar e ligar fragmentos de cDNA ou oligonucleotídeos à superfície de um substrato utilizando um sistema de vácuo ou procedimentos de ligação térmica, UV, mecânica ou química. Uma coleção, tal como aquelas descritas acima, podem ser produzidas manualmente ou utilizando-se dispositivos disponíveis (aparelho de slot bot ou dot blot), materiais (qualquer suporte sólido adequado), e máquinas (incluindo instrumentos robóticos), e podem conter 8, 24, 96, 384, 1536, 6144 ou mais polinu- cleotídeos, ou qualquer outro número que empresta a si o uso eficiente de instrumentação comercialmente disponível.
[00172]Utilizando tais coleções ou outros kits/sistemas, a presente invenção provê métodos de identificação dos SNPs descritos aqui em uma amostra de teste. Tais métodos envolvem tipicamente incubação da amostra de teste de ácidos nu- cléicos com uma coleção compreendendo uma ou mais sondas correspondendo a pelo menos uma posição de SNP da presente invenção, e avaliando a ligação de uma ácido nucléico a partir de uma amostra de teste com uma ou mais das sondas. As condições para incubação de um reagente de detecção de SNP (ou um kit/sistema que emprega um ou mais de tais reagentes de detecção) com uma amostra de teste variam. As condições de incubação dependem de tais fatores como o formato empregado na avaliação, os métodos de detecção empregados e o tipo e a natureza dos reagentes de detecção utilizados na avaliação. Uma pessoa versada na técnica reconhecerá que qualquer formato de hibridização, amplificação e avalia-ção de coleção comumente disponíveis pode prontamente se adaptado para detectar os SNPs descritos aqui.
[00173]Um kit/sistema de detecção de SNP da presente invenção pode in- cluir componentes que são utilizados para preparar ácidos nucléicos a partir de uma amostra de teste para a amplificação e/ou detecção subsequente de uma molécula de ácido nucléico contendo SNP. Tais componentes de preparação de amostra podem ser utilizados para produzir extratos de ácido nucléico (incluindo DNA e/ou RNA), proteínas ou extratos de membrana a partir de quaisquer fluidos corporais (tais como sangue, soro, plasma, urina, saliva, muco, sucos gástricos, sêmen, lágri-ma, suor, etc.), pele, cabelo, células (especialmente células nucleadas), biópsias, coletas bucais ou espécimen de tecido. As amostras de teste utilizadas nos métodos descritos acima irão variar baseado em tais fatores como o formato da avaliação, natureza do método de detecção, e os tecidos, células ou extratos específicos utilizados como amostra de teste a ser avaliada. Métodos de preparação de ácidos nu- cléicos, proteínas e extratos de células são bem conhecidos na técnica, e podem ser prontamente adaptados para obter uma amostra que é compatível com o sistema utilizado. Sistemas de preparação de amostra automatizado para extrair ácidos nu- cléicos de uma amostra de teste estão disponíveis comercialmente, e exemplos são BioRobot 9600 de Qiagen, sistema de preparação de amostra PRISM®6700 da Applied Biosystems e sistema AmpliPrep COBAS da Roche Molecular System.
[00174]Outra forma de kit contemplada pela presente invenção é um kit compartimentalizado. Um kit compartimentalizado inlcui qualquer kit no qual reagentessão contidos em recipientes separados. Tais recipientes incluem, por exemplo, recipientes de vidro pequenos, recipientes de plástico, tiras de plástico, vidro ou papel, ou material de coleção, tal como sílica. Tais recipientes permitem a alguém transferir eficientemente reagentes de um compartimento para outro compartimento de modo que as amostras de teste e os reagentes não sejam contaminados com mistura, ou de um recipiente para outro vasilhame não incluído no kit, e os agentes ou soluções de cada recipiente podem ser adicionados de uma forma quantitativa de um compartimento para outro ou para outro vasilhame. Tais recipientes podem inclu- ir, por exemplo, um ou mais recipientes que irão receber a amostra de teste, um ou mais recipientes que contém pelo menos uma sonda ou outro reagente de detecção de SNP para detectar um ou mais SNPs da presente invenção, um ou mais recipientes que contém reagentes de lavagem (tais como solução salina tampão de fosfato, tampão tris, etc.), e um ou mais recipientes que contém os reagentes utilizados para revelar a presença da sonda ligada ou outros reagentes de detecção de SNP. O kit pode opcionalmente compreender ainda compartimentos e/ou reagentes para, por exemplo, amplificação de ácido nucléico ou outras reações enzimáticas, tais como reações de extensão de primer, hibridização, ligação, eletroforese (preferivelmente eletroforese capilar), espectometria de massa, e/ou detecção fluorescente induzida por laser. O kit pode incluir também instruções para utilização do kit. Kits comparti- mentalizados exemplares incluem dispositivos microfluidos conhecidos na técnica. Ver, por exemplo, Weigl e outros, “Lab-on-a-chip for drug development”, Adv Drug Deliv Ver 55(3):349-77 (Feb 2003). Em tais dispositivos microfluidos, os recipientes podem ser referidos como, por exemplo, “compartimentos”, “câmaras” ou “canais” microfluidos.
[00175]Dispositivos microfluidos, que podem também ser referidos com sistemas de “laboratório em pastilha”, sistemas micro-eletro-mecânico biomédico (bio- MEMs) ou sistemas integrados multicomponentes, são kits/sistemas exemplares da presente invenção para analisar SNPs. Tais sistemas miniaturizam e compartimenta- lizam processos tais como hibridização de sonda/alvo, amplificação de ácido nucléi- co, e reações de eletroforese capilar em um dispositivo funcional simples. Tais dispositivos microfluidos utilizam tipicamente reagentes de detecção em pelo menos um aspecto do sistema, e tais reagentes de detecção podem ser utilizados para detectar um ou mais SNPs da presente invenção. Um exemplo de um sistema microflu- ido está descrito na Patente US N° 5.589.136, que descreve a integração de amplificação de PCR e eletroforese capilar em chips. Sistemas microfluidos exemplares compreendem um padrão de microcanais projetados em um disco de vidro, silício, quartzo ou plástico incluído em um microchip. Os movimentos das amostras podem ser controlados por forças elétricas, eletro-osmóticas ou hidrostáticas aplicadas através de áreas diferentes do microchip para criar válvulas e bombas microscópicas funcionais se mover as partes. Variando a voltagem pode ser utilizado como um meio para controlar o fluxo de líquido nas interseções entre os canais micromanufa- turados e para modificar a taxa de fluxo de líquido para bombear através de seções diferentes do microchip. Ver, por exemplo, as Patentes US N° 6.153.073, Dubrow e outros e 6.156.181, Parce e outros.
[00176]Para genotipagem de SPNs, um sistema microfluido exemplar pode integrar, por exemplo, amplificação de ácido nucléico, extensão de primer, eletroforese capilar, e um método de detecção, tal como detecção de fluorescência induzida por laser. Em uma primeira etapa de um processo exemplar para utilizar tal sistema exemplar, as amostras de ácido nucléico são amplificadas, preferivelmente por PCR. Então, os produtos de amplificação são submetidos a reações de extensão de primer automatizada utilizando ddNTPs (fluorescência específica para cada ddNTP) e os primers de oligonucleotídeo apropriados para realizar reações de extensão de primer que hibridizam apenas acima do SNP orientado. Uma vez que a extensão na extremidade 3’ é completada, os primers são separados dos ddNTPs fluorescentes não incorporados por eletroforese capilar. O meio de separação utilizado na eletroforese capilar pode ser, por exemplo, poliacrilamida, polietilenoglicol ou dextrano. Os ddNTPs incorporados nos produtos de extensão de primer de nucleotídeo simples são identificados por detecção de fluorescência induzida por laser. Tal microchip exemplar pode ser utilizado para processar, por exemplo, pelo menos 96 a 384 amostras, ou mais, em paralelo.
USOS DE MOLÉCULAS DE ÁCIDO NUCLÉICO
[00177]As moléculas de ácido nucléico da presente invenção têm uma vari- edade de usos, especialmente para diagnóstico, prognóstico, tratamento e prevenção de CHD (particularmente MI) e aneurisma/dissecção, e para prever resposta ao medicamento, particularmente resposta a estatinas. Por exemplo, as moléculas de ácido nucléico da invenção são úteis para prever um risco do indivíduo de desenvolver CHD (particularmente o risco de experimentar um primeiro ou MI recorrente) ou aneurisma/dissecção, para prognosticar a progressão de CHD (por exemplo, a severidade ou as consequências de MI) ou aneurisma/dissecção em um indivíduo, na avaliação da probabilidade de um indivíduo que tem CHD ou aneurisma/dissecção (ou que está em risco elevado de CHD ou aneurisma/dissecção) de responder ao tratamento (ou prevenção) de CHD ou aneurisma/dissecção com estatina, e/ou prever a probabilidade que o indivíduo irá experimentar toxicidade ou outros efeitos colateraisindesejáveis do tratamento de estatina, etc. Por exemplo, as moléculas de ácido nucléico são úteis como sondas de hibridização, tais como para genotipagem de SNPs em RNA mensageiro, transcrição, cDNA, DNA genômico, DNA amplificado ou outras moléculas de ácido nucléico, e para isolar cDNA de comprimento total e clones genômicos que codificam os peptídeos de variantes descritos na tabela 1, bem como seus ortólogos.
[00178]Uma sonda pode hibridizar qualquer sequência de nucleotídeo ao longo do comprimento inteiro de uma molécula de ácido nucléico referida nas tabelas 1 e/ou 2. Preferivelmente, uma sonda da presente invenção hibridiza uma região de uma sequência alvo que engloba uma posição de SNP indicada nas tabelas 1 e/ou 2. Mais preferivelmente, uma sonda hibridiza uma sequência alvo contendo SNP de uma maneira de sequência específica de modo que ela distingue a sequência alvo de outras sequências de nucleotídeo que variam da sequência alvo apenas por qual nucleotídeo está presente no local de SNP. Tal sonda é particularmente útil para detectar a presença de um ácido nucléico contendo SNP em uma amostra de teste, ou para determinar qual nucleotídeo (alelo) está presente em um local de SNP particular (ou seja, genotipagem do local de SNP).
[00179]Uma sonda de hibridização de ácido nucléico pode ser utilizada para determinar a presença, nível, forma e/ou distribuição da expressão de ácido nucléi- co. O ácido nucléico cujo nível é determinado pode ser DNA ou RNA. Por conseguinte, sondas específicas para os SNPs descritos aqui podem ser utilizadas para avaliar a presença, expressão e/ou número de cópias de gene em uma dada célula, tecido ou organismo. Esses usos são relevantes para diagnóstico de disfunções en-volvendo aumento ou diminuição na expressão de gene em relação aos níveis normais. Técnicas in vitro para detecção de mRNA incluem, por exemplo, hibridizações Northern blot e hibridizações in situ. Técnicas in vitro para detectar DNA incluem hi- bridizações Southern blot e hibridizações in situ. Sambrook e Russel, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, NY, (2000).
[00180]Sondas podem ser utilizadas como parte de um kit de teste de diagnóstico para identificar células ou tecidos nas quais uma proteína de variante é expressada, tal como por medição do nível de ácido nucléico que codifica proteína de variante (por exemplo, mRNA) em uma amostra de células de um indivíduo ou determinar se um polinucleotídeo contém um SNP de interesse.
[00181]Portanto, as moléculas de ácido nucléico da invenção podem ser utilizadas como sondas de hibridização para detectar os SNPs descritos aqui, pelo que determina se um indivíduo com o polimorfismo está em risco de desenvolver CHD ou aneurisma/dissecção (ou já desenvolveu CHD ou aneurisma/dissecção em um estágio adiantado), ou a probabilidade que um indivíduo irá responder positivamente ao tratamento de estatina (incluindo tratamento preventivo) de CHD ou aneuris- ma/dissecção. A detecção de um SNP associado ao fenótipo de doença provê uma ferramenta de diagnóstico para uma doença ativa e/ou pré-disposição genética à doença.
[00182]Além disso, as moléculas de ácido nucléico da invenção são, portan- to, úteis para detectar um gene (informação de gene está descrita na tabela 2, por exemplo) que contém um SNP descrito aqui e/ou produtos de tais genes, tal como moléculas de transcrição de mRNA expressadas (informação de transcrição está descrita na tabela 1, por exemplo), e são, portanto, úteis para detectar expressão de gene. As moléculas de ácido nucléico podem opcionalmente ser implementadas em, por exemplo, um formato de coleção ou kit para uso na detecção de expressão de gene.
[00183]As moléculas de ácido nucléico da invenção também são úteis como primers para amplificar qualquer dada região de uma molécula de ácido nucléico, particularmente uma região contendo um SNP identificado na tabela 1 e/ou tabela 2.
[00184]As moléculas de ácido nucléico da invenção também são úteis para construir vetores recombinantes (descritos em maior detalhe abaixo). Tais vetores incluem vetores de expressão que expressam uma porção de, ou todo de, quaisquer das sequências de peptídeo de variante referidas na tabela 1. Os vetores também incluem vetores de inserção, utilizados para integrar outra sequência de molécula de ácido nucléico, tal como no genoma celular, para alterar expressão in situ de um gene e/ou produto de gene. Por exemplo, uma sequência de codificação endógena pode ser substituída por recombinação homóloga com toda ou parte da região de codificação contendo um ou mais SNPs especificamente introduzidos.
[00185]As moléculas de ácido nucléico da invenção são também úteis para expressar porções antigênicas das proteínas de variante, particularmente porções antigênicas que contêm uma sequência de aminoácido de variante (por exemplo, uma substituição de aminoácido) causada por um SNP descrito nas tabelas 1 e/ou 2.
[00186]As moléculas de ácido nucléico da invenção são também úteis para construir vetores contendo uma região regulatória de gene das moléculas de ácido nucléico da presente invenção.
[00187]As moléculas de ácido nucléico da invenção também são úteis para projetar ribozimas correspondendo a toda, ou um parte, de uma molécula de mRNA expressada de uma molécula de ácido nucléico contendo SNP descrita aqui.
[00188]As moléculas de ácido nucléico da invenção também são úteis para construir células hospedeiras que expressam uma parte, ou toda, das moléculas de ácido nucléico e peptídeos de variante.
[00189]As moléculas de ácido nucléico da invenção também são úteis para construir animais transgênicos que expressam toda, ou um parte, das moléculas de ácido nucléico e peptídeos de variante. A produção de células recombinantes e animaistransgênicos tendo as moléculas de ácido nucléico que contêm os SNPs descritos na tabelas 1 e/ou 2 permitem, por exemplo, projeto clínico eficaz de compostos de tratamento e regimes de dosagem.
[00190]As moléculas de ácido nucléico da invenção também são úteis em avaliações para seleção de medicamentos para identificar compostos que, por exemplo, modulam expressão de ácido nucléico.
[00191]As moléculas de ácido nucléico da invenção também são úteis em terapia de gene em pacientes cujas células têm expressão de gene anormal. Portanto, células recombinantes, que incluem células de paciente que foram engenheiradas ex vivo e retornaram ao paciente, podem ser introduzidas em um indivíduo onde as células recombinantes produzem a proteína desejada para tratar o indivíduo.
Métodos de genotipagem de SNP
[00192]O processo de determinar qual o nucleotídeo específico (ou seja, ale- lo) está presente em cada uma ou mais posições de SNP, tal como uma posição de SNP em uma molécula de ácido nucléico descrita na tabela 1 e/ou tabela 2, é referido como genotipagem de SNP. A presente invenção provê métodos de genotipagem de SNP, tais como para uso em avaliação de risco do indivíduo de desenvolver CHD (particularmente MI) ou aneurisma/dissecção, para avaliar um prognóstico de indivíduo para severidade e recuperação de doença, para prever a probabilidade que um indivíduo que teve CHD (por exemplo MI) ou aneurisma/dissecção previamente irá ter CHD ou aneurisma novamente no futuro (por exemplo, um ou mais MIs ou aneu- risma/dissecção recorrente), para implementar um regime preventivo ou de tratamento para um indivíduo baseado no indivíduo ter um suscetibilidade aumentada para desenvolver CHD (por exemplo, risco aumentado para MI) ou aneuris- ma/dissecção, na avaliação de uma probabilidade do indivíduo de responder ao tratamento de estatina (particularmente para tratamento ou prevenção de CHD ou aneurisma/dissecção), na seleção de um regime de tratamento ou preventivo (por exemplo, na decisão se administrar ou não tratamento de estatina a um indivíduo que tem CHD ou aneurisma/dissecção, ou que está em risco aumentado de desenvolver CHD ou aneurisma/dissecção no futuro), ou na formulação ou seleção de um tratamento basead em estatina particular ou regime preventivo, tal como dosagem e/ou frequência de administração de tratamento de estatina ou escolher qual for- ma/tipo de estatina será administrada, tal como uma composição farmacêutica ou composto particular, etc.), determinar a probabilidade de experimentar toxicidade ou outros efeitos colaterais indesejáveis do tratamento de estatina, ou selecionar indivíduos para um ensaio clínico de uma estatina (por exemplo, selecionar indivíduos para participar do ensaio que são mais prováveis de responder positivamente ao tratamento de estatina, e/ou excluir indivíduos do ensaio que são improváveis de responder positivamente ao tratamento de estatina), etc.
[00193]Amostras de ácidos nucléicos podem ser genotipadas para determinar qual alelo está presente em qualquer região genética dada (por exemplo, posição de SNP) de interesse por métodos bem conhecidos na técnica. A sequência vizinha pode ser utilizada para projetar reagentes de detecção de SNP, tais como sondas de oligonucleotídeos, que pode ser opcionalmente implementados em um formato de kit. Métodos de genotipagem de SNP exemplares são descritos em Chen e outros, “Single nucleotide plymorphism genotyping: biochemistry, protocol, cost and throughput”, Pharmacogenomics J 3(2):77-96 (2003); Kwok e outros, “Detection of single nucleotide polymorphisms”, Curr Issues Mol Biol 5(2):43-60 (Apr 2003); Shi e outros, “Technologies for individual genotyping: detection of genetic polymorphisms in drug targets and disease genes”, Am J Pharmacogenomics 2(3):197-205 (2002); e Kwok, “Methods for genotyping single nucleotide polymorphisms”, Annu Ver Genomics Hum Genet 2:235-58 (2001). Técnicas exemplares para genotipagem de SNP de alto rendimento são descritas em Marnellos, “High-throughput SNP analysis for genetic association studies”, Curr Opin Drug Discov Devel 6(3):317-21 (May 2003). Métodos de genotipagem de SNP comuns incluem, mas não estão limitados a, avaliações TaqMan, avaliações de marcadores moleculares, coleções de ácido nucléico, extensão de primer de alelo específico, PCR de alelo específico com detecção por espectrometria de massa, pirosequenciamento, extensão de primer multiplex ordenada em coleções genéticas, ligação com amplificação de grupo rolantes, ligação homogênea, OLA (Patente US N° 4.988.167), reação de ligação multiplex ordenada em coleções genéticas, polimorfismo de comprimento de restrição de fragmento, avaliações de marcador de extensão de base simples, e avaliação Invader. Tais métodos podem ser utilizados em combinação com mecanismos de detecção, tais como, por exemplo, detecção de luminescência ou quimioluminescência, detecção de fluorescência, detecção de fluorescência determinada pelo tempo, transferência de energia de ressonância de fluorescência, polarização de fluorescência, espectrome- tria de massa e detecção elétrica.
[00194]Vários métodos para detectar polimorfismos incluem, mas não estão limitados a, métodos nos quais proteção de agentes de divisão é utilizada para detectar bases descombinadas em duplexes de RNA/RNA ou RNA/DNA (Myers e outros, Science 230:1242 (1985); Cotton e outros, PNAS 85:4397 (1988); e Saleeba e outros, Meth. Enzymol 217:286-295 (1992)), comparação da mobilidade eletroforéti- ca de variante ou moléculas de ácido nucléico do tipo selvagem (Orita e outros, PNAS 86:2766 (1989); Cotton e outros, Mutat Res 285:125-144 (1993); e Hayashi e outros, Genet Anal Tech Appl 9:73-79 (1992)), e avaliação do movimento de frag-mentospolimórficos ou de tipo selvagem em géis de poliacrilamida contendo um gradiente de desnaturante utilziando eletroforese em gel de gradiente desnaturante (DGGE) (Myers e outros, Nature 313:495 (1985)). Variações de sequência em localizações específicas podem também ser avaliadas por avaliações de proteção de nuclease, tais como proteção de Rnase e S1 ou métodos de divisão química.
[00195]Em uma modalidade preferida, a genotipagem de SNP é realizada utilizando uma avaliação TaqMan, que é também conhecida como avaliação de nuclease 5’ (Patente US N° 5.210.015 e 5.538.848). A avaliação TaqMan detecta a acumulação de um produto amplificado específico durante PCR. A avaliação TaqMan utiliza uma sonda de oligonucleotídeo rotulada com um tinta relatora fluorescente e uma tinta de extinção. A tinta relatora é induzida pela irradiação em um comprimento de onda apropriado, ela transfere energia para a tinta de extinção na mesma sonda via um processo de transferência de energia de ressonância de fluorescência(FRET). Quando fixado à sonda, a tinta relatora induzida não emite um sinal. A proximidade da tinta de extinção para a tinta relatora na sonda intacta mantémuma fluorescência reduzida para o relator. A tinta relatora e a tinta de extinção pode estar nas extremidades mais 5’ e mais 3’, respectivamente, ou vice versa. Al-ternativamente, a tinta relatora pode estar na extremidade mais 5’ ou 3’ enquanto a tinta de extinção está fixada a um nucleotídeo interno, ou vice versa. Em ainda outra modalidade, ambas a relatora e a de extinção pode estar fixadas nos nucleotídeos internos a uma distância de cada outro tal que a fluorescência da relatora é reduzida.
[00196]Durante PCR, a atividade de nuclease 5’ de polimerase de DNA divide a sonda, pelo que separa a tinta relatora da tinta de extinção e resulta em fluorescênciaaumentada da relatora. A acumulação do produto de PCR é detectada diretamente pelo monitoramento do aumento na fluorescência da tinta relatora. A polimerase de DNA divide a sonda entre a tinta relatora e a tinta de extinção apenas se a sonda hibridiza o molde contendo SNP alvo que é amplificado durante PCR, e a sonda é projetada para hibridizar o local de SNP alvo apenas se um alelo de SNP particular está presente.
[00197]Sequências de sonda e primer TaqMan preferidas podem prontamente ser determinadas utilizando as informações de sequência de ácido nucléico associadas e de SNP providas aqui. Um número de programas de computador, tais como Primer Express (Applied Biosystems, Foster City, CA), podem ser utilizados para rapidamente obter conjuntos de sonda/primer ótimos. Será aparente para uma pessoa versada na técnica que tais primers e sondas para detectar os SNPs da presente invenção são úteis em, por exemplo, seleção para indivíduos que são suscetíveis ao desenvolvimento de CHD (particularmente MI), aneurisma/dissecção, e patologias relacionadas, ou em seleção de indivíduos que têm CHD ou aneuris- ma/dissecção (ou que são suscetíveis a CHD ou aneurisma/dissecção) para sua probabilidade de responder ao tratamento de estatina. Essas sondas e primers podem ser prontamente incorporados em um formato de kit. A presente invenção também inclui modificações da avaliação TaqMan bem conhecidas na técnica, tais como o uso de sondas de marcador molecular (Patente US N° 5.118.801 e 5.312.728) e outros formatos de variantes (Patente US N° 5.866.336 e 6.117.635).
[00198]Outro método preferido para genotipagem de SNPs da presente invenção é o uso de duas sondas de oligonucleotídeo em um OLA (ver, por exemplo, Patente US N° 4.988.617). Neste método, uma sonda hibridiza um segmento de um ácido nucléico alvo com sua extremidade mais 3’ alinhada com o local de SNP. Uma segunda sonda hibridiza um segmento adjacente à molécula de ácido nucléico alvo diretamente a 3’ à primeira sonda. As duas sondas justapostas hibridizam a molécula de ácido nucléico alvo, e são ligadas na presença de um agente de ligação, tal como uma ligase se existe complementariedade perfeita entre o nucleotídeo mais 3’ da primeira sonda com o local de SNP. Se existe uma descombinação, a ligação não ocorreria. Após a reação, as sonda ligadas são separadas da molécula de ácido nu- cléico alvo, e detectada como indicadores da presença de um SNP.
[00199]As seguintes patentes, pedidos de patentes, e pedidos de patente internacional publicados, que são todos aqui incorporados pela referência, provêem informação adicional referente a técnicas para realizar vários tipos de OLA. As seguintes patentes US descrevem estratégias de OLA para realizar detecção de SNP: N° 6.027.889; 6.268.148; 5.494.810; 5.830.711 e 6.054.564. WO 97/31256 e WO 00/56927 descrevem estratégias de OLA para realizar detecção de SNP utilizando coleções universais, em que uma sequência de código de área pode ser introduzida em uma das sondas de hibridização, e o produto resultante, ou produto amplificado, hibridizado para uma coleção de código de área universal. Pedido US 01/17329 (e 09/584.905) descreve OLA (ou LDR) seguido de PCR, em que os códigos de área são incorporados nas sondas de OLA, e produtos PCR amplificados são determinados por leitura de coleção de código de área universal ou eletroforética. Pedidos US 60/427818, 60/445636 e 60/445494 descrevem métodos de SNPlex e software para detecção de SNP multiplexado utilizando OLA seguido por PCR, em que códigos de área são incorporados nas sondas de OLA, e produtos de PCR amplificados são hibridizados com um reagente de código de área, e a identidade do SNP determinada por leitura eletroforética do conduto de área. Em algumas modalidades, OLA é realizado antes do PCR (ou outro método de amplificação de ácido nucléico). Em outras modalidades, PCR (ou outro método de amplificação de ácido nucléico) é realizado antes de OLA.
[00200]Outro método para genotipagem de SNP é baseado em espectrome- tria de massa. A espectrometria de massa leva vantagem da massa única de cada um dos quatro nucleotídeos de DNA. Os SNPs podem ser inequivocamente genoti- pados por espectrometria de massa pela medição das diferenças na massa dos ácidosnucléicos que têm alelos de SNP alternativos. A tecnologia de espectrometria de massa MALDI-TOF (Ionização de dessorção a laser assistida por matriz - Tempo de vôo) é preferida para determinações extremamente precisas de massa molecular, tal como SNPs. Aproximações numerosas para análise de SNP têm sido desenvolvidas com base em espectrometria de massa. Métodos baseados em espectrometria de massa preferidos de genotipagem de SNP incluem avaliações de extensão de primer, que pode ser também utilizado em combinação com outras aproximações, tais como formatos baseados em gel tradicionais e microcoleções.
[00201]Tipicamente, a avaliação de extensão de primer envolve projetar e temperar um primer para um produto de amplificação de PCR de molde acima (5’) a partir de uma posição de SNP alvo. Uma mistura de didesoxinucleotídeo trifosfatos (ddNTPs) e/ou desoxinucleotídeo trifosfatos (dNTPs) são adicionados a uma mistura de reação contendo o molde (por exemplo, uma molécula de ácido nucléico contendo SNP que foi tipicamente amplificada, tal como por PCR), primer e polimerase de DNA. A extensão do primer termina na primeira posição no molde onde um nucleotí- deo complementar a um dos ddNTPs na mistura ocorre. O primier pode ser tanto imediatamente adjacente (ou seja, o nucleotídeo na extremidade 3’ do primer hibridi- za o próximo nucleotídeo para o local de SNP alvo) ou dois ou mais nucleotídeos removidos da posição de SNP. Se o primer está vários nucleotídeos removidos da posição de SNP alvo, a única limitação é que a sequência de molde entre a extremidade 3’ do primer e a posição de SNP não pde conter um nucleotídeo do mesmo tipo que o que será detectado, ou isto irá causar terminação prematura do primer de extensão. Alternativamente, se todos os quatro ddNTPs sozinhos, com nenhum dNTP, são adicionados à mistura de reação, o primer irá sempre ser estendido por um único nucleotídeo, correspondendo à posição de SNP alvo. Neste caso, primers são projetados para ligar um nucleotídeo acima da posição de SNP (ou seja, o nu- cleotídeo na extremidade 3’ do primer hibridiza o nucleotídeo que é imediatamente adjacente ao local de SNP alvo no lado 5’ do local de SNP alvo). A extensão por um único nucleotídeo é preferível, pois ela minimiza a massa no total do primer estendido, pelo que aumenta a resolução das diferenças de massa entre os nucleotídeos de SNP alternativos. Além disso, ddNTPs rotulados em massa podem ser empregados nas reações de extensão de primer no ligar de dd NTPs não modificados. Isso aumenta a diferença de massa entre primers estendidos com esses ddNTPs, pelo que provê sensibilidade e precisão aumentadas, e é particularmente útil para tipificar posições de base de heterozigoto. Rotulagem em massa também alivia a necessidade de procedimentos de preparação de amostra intensivos e diminui a potência de determinação necessária do espectrômetro de massa.
[00202]Os primers estendidos podem, então, ser purificados e analisados por espectrometria de massa MALDI-TOF para determinar a identidade do nucleotí- deo presente na posição de SNP alvo. Em um método de análise, os produtos da reação de extensão de primer são combinados com cristais de absorção leves que formam uma matriz. A matriz é, então, atingida com uma fonte de energia, tal como um laser para ionizar e desorver as moléculas de ácido nucléico na fase gasosa. As moléculas ionizadas são, então, ejetadas em um tubo de vôo e aceleradas para baixo do tubo em direção ao detector. O tempo entre o evento de ionização, tal como um pulso de laser, e a colisão da molécula com o detector é o tempo de vôo da molécula. O tempo de vôo está precisamente correlacionado com a relação mass/carga (m/z) da molécula ionizada. Os íons com viagem m/z menores baixam o tubo mais rápido que íons com m/z maiores e, portanto, os íons mais leves alcançam o detector antes dos íons mais pesados. O tempo de vôo é, então, convertido em uma m/z correspondente, e altamente precisa. Desta maneira, os SNPs podem ser identificados com base nas pequenas diferenças em massa, e nas diferenças de tempo de vôo correspondentes, inerente às moléculas de ácido nucléico tendo nucleotídeos diferentes em uma posição de base simples. Para informações adicionais sobre o uso de avaliações de extensão de primer em conjunto com espectrometria de massa MALDI-TOF para genotipagem de SNP, ver, por exemplo, Wise e outros, “A standard protocol for single nucleotide primer extension in the human genome using ma- trix-assited laser desorption/ionization time-of-flight mass espectrometry”, Rapid Commun Mass Spectrom 17(11):1195-202 (2003).
[00203]As seguintes referências provêem informações adicionais descrevendométodos baseados em espectrometria de massa para genotipagem de SNP: Bocker, NP and mutation discovery using base-especific cleavage and MALDI- TOF mass spectrometry”, Bioinformatics 19 Suppl 1:144-153 (Jul 2003); Storm e outros, “MALDI-TOF mass spectrometry-based SNP genotyping”, Methods Mol Biol 212:241-62 ((2003); Jurinke e outros, “The use of Mass ARRAY technology for high throughput genotyping”, Adv Biochem Eng Biotechnol 77:57-74 (2002); e Jurinke e outros, “Automated genotyping using the DNA MassArray technology”, Methods Mol Biol 187:179-92 (2002).
[00204]Os SNPs podem também ser marcados por sequenciamento direto de DNA. Uma variedade de procedimentos de sequenciamento automatizados pode ser utilizada (por exemplo, Biotechniques 19:448 (1995)), incluindo sequenciamento por espectrometria de massa. Ver, por exemplo, publicação internacional PCT N° WO 94/16101; Cohen e outros, Adv Chromatogr 36:127-162 (1996); e Griffin e outros, Appl Biochem Biotechnol 38:147-159 (1993). As sequências de ácido nucléico da presente invenção permitem a um pessoa versada na técnica prontamente projetar primers de sequenciamento para tais procedimentos de sequenciamento automatizados. Instrumentação comercial, tal como analisadores de DNA da Applied Biosystems 377, 3100, 3700, 3730 e 3730x1 (Foster City, CA), é comumente utilizada na técnica de sequenciamento automatizado.
[00205]Outros métodos que podem ser utilizados para genotipar os SNPs da presente invenção incluem polimorfismo conformacional de fita simples (SSCP), e eletroforese em gel de gradiente de desnaturação (DGGE). Myers e outros, Nature 131:495 (1985). SSCP identifica diferenças de base pela alteração na migração ele- troforética de produtos de PCR de fita simples, conforme descrito em Orita e outros, Proc Nat Acad. Produtos de PCR de fita simples podem ser gerados pelo aquecimento ou de outro modo desnaturando produtos de PCR de fita dupla. Ácidos nu- cléicos de fita simples podem redobrar ou formar estruturas secundárias que são parcialmente dependentes da sequência de base. As mobilidades eletroforéticas diferentes dos produtos de amplificação de fita simples estão relacionadas às diferenças de sequência de base nas posições de SNP. DGGE diferencia alelos de SNP com base nas diferentes estabilidades dependentes de sequência e propriedades de fusão inerentes em DNA polimórfico e as diferenças correspondentes em padrões de migração eletroforética em um gel de gradiente de desnaturação. PCR technology: Principles and Applications for DNA Amplification Cápitulo 7, Erlich, ed, W.H. Free- mand and Co., NY (1992). Ribozimas de sequência específica (Patente US N° 5.498.531) podem também ser utilizadas para marcar SNPs com base no desenvolvimento ou perda de um local de divisão de ribozima. Sequências perfeitamente combinadas podem ser distinguidas de sequências descombinadas por avaliações de digestão de divisão de nuclease ou por diferenças na temperatura de fusão. Se o SNP afeta um local de divisão de enzima de restrição, o SNP pode ser identificado pelas alterações nos padrões de digestão de enzima de restrição, e as mudanças correspondentes em comprimentos de fragmentos de ácido nucléico determinadas por eletroforese em gel.
[00206]A genotipagem de SNP pode incluir as etapas de, por exemplo, coletar uma amostra biológica de um indivíduo humano (por exemplo, amostras de tecidos, células, fluidos, secreções, etc.), ácidos nucléicos isolados (por exemplo, DNA genômico, mRNA ou ambos) a partir de células da amostra, contatar os ácidos nu- cléicos com um ou mais primers que hibridizam especificamente um região do ácido nucléico isolado contendo um SNP alvo sob condições de modo que hibridização e amplificação de região de ácido nucléico alvo ocorrem, e determinar o nucleotídeo presente na posição de SNP de interesse, ou em algumas avaliações, detectar a presença ou ausência de um produto de amplificação (avaliações podem ser projetadas de modo que hibridização e/ou amplificação ocorrerão apenas se um alelo de SNP particular estiver presente ou ausente). Em algumas avaliações, o tamanho do produto de amplificação é detectado e comparado ao comprimento de uma amostra de controle; por exemplo, deleções e inserções podem ser detectadas pela mudança no tamanho do produto amplificado comparado ao genótipo normal.
[00207]A genotipagem de SNP é útil para numerosas aplicações práticas, conforme descrito abaixo. Exemplos de tais aplicações incluem, mas não estão limitadas a, análise de associação de doença a SNP, claissificação de pré-disposição a doença, diagnóstico de doença, prognóstico de doença, monitoramento de progressão de doença, determinação de estratégias terapêuticas baseadas em um genótipo do indivíduo (“farmacogenômica”), desenvolvimento de agentes terapêuticos baseados em genótipos de SNP associados a uma doença ou probabilidade de responder ao medicamento, extratificar uma população de pacientes para ensaio clínico para um regime de tratamento, prever a probabilidade que um indivíduo irá experimentar efeitos colaterais tóxicos de um agente terapêutico, e aplicações de identificação humana, tal como medicina legal.
Análise de Associação Genética entre SNPs e Traços Fenotípicos
[00208]A genotipagem de SPN para diagnóstico de doença, seleção de predisposição de doença, prognóstico de doença, determinação de responsividade à droga (farmacogenômica), seleção de toxicidade à droga, e outros usos descritos aqui, tipicamente invoca em estabelecer inicialmente uma associação genética entre um ou mais SNPs específicos e os traços fenotípicos particulares de interesse.
[00209]Diferentes modelos de estudo podem ser usados para estudos de associação genética. Modern Epidemiology 609-622, Lippincott, Williams & Wilkins (1998). Estudos observacionais são mais frequentemente realizados nos quais a resposta dos pacientes não sofrem interferência. O primeiro tipo de estudo observacional identifica uma amostra de pessoas nas quais a causa suspeita está ausente, e então a frequência de desenvolvimento da doença em duas amostras é comparada. Estas populações amostradas são chamadas coorte, e o estudo é um estudo prospectivo. O outro tipo de estudo observacional é um controle de casos ou um estudo retrospectivo. Em típicos estudos de caso-controle, as amostras são coletadas de indivíduos com o fenótipo de interesse (casos), tais como, certas manifestações da doença, e de indivíduos sem o fenótipo (controles) em uma população (população alvo) cujas conclusões devem ser extraídas. Então as possíveis causas da doença são investigadas retrospectivamente. Como o tempo e os custos para coletar amostras em estudos de caso-controle são consideravelmente menores que os para estudos de associação genética, os estudos de caso-controle são os modelos de estudo mais comumente usados em estudos de associação genética, pelo menos durante o estágio de exploração e verificação.
[00210]Em ambos os tipos de estudos observacionais, pode haver potenciais fatores de confusão que devem ser levados em consideração. Os fatores de confusão são aqueles que são associados com a(s) causa(s) real(is) de doença em si, e eles incluem informação demográfica, tal como, idade, sexo, afiliação étnica, bem como fatores ambientais. Quando fatores de confusão não são equiparados em casos e controles em um estudo, e não são propriamente controlados, falsos resul-tados de associação podem surgir. Se potenciais fatores de confusão são identificados, eles devem ser controlados por métodos de análise explicados abaixo.
[00211]Em um estudo de associação genética, a causa de interesse a ser testada é um certo alelo ou um SPN ou uma combinação de alelos ou um haplótipo de vários SNPs. Desse modo, espécimes de tecido (por exemplo, sangue total) das amostras individuais podem ser coletados e o DNA genômico, genotipado para o(s) SPN(s) de interesse. Além do traço fenotípico de interesse, outras informações, tais como, demográfica (por exemplo, idade, sexo, afiliação étnica, etc.), clínica, e informação ambiental que podem influenciar o resultado do traço podem ser coletadas para adicionalmente caracterizar e definir o conjunto de amostras. Em muitos casos, estes fatores são conhecidos por estarem associados com doenças e/ou freqüências de alelo SNP. Existem provavelmente interações gene-ambiente e/ou gene-gene também. Métodos de análise para indicar interações gene-ambiente e gene-gene (por exemplo, os efeitos de presença de ambos os alelos de suscetibilidade em dois genes diferentes podem ser maior que os efeitos dos alelos individuais com dois genes combinados) são discutidos abaixo.
[00212]Após todas as informações fenotípicas e genotípicas relevantes foram obtidas, as análises estatísticas são realizadas para determinar se existe algumacorrelação significante entre a presença de um alelo ou um genótipo com características fenotípicas de um indivíduo. Preferencialmente, os dados de inspeção e limpeza são primeiramente efetuados antes de realizar testes estatísticos para associação genética. Os dados clínicos e epidemiológicos das amostras podem ser resumidos por estatística descritiva com tabelas e gráficos. A validação de dados é preferencialmente efetuada para verificar completação de dados, entradas inconsistentes, e valor extremo. Os testes-t e testes qui-quadrado (Wilcoxon rank-sum (teste da soma dos pontos) testa se as distribuições não são normais) podem então ser usados para verificar diferenças significantes entre casos e controles para variáveis contínuas e discretas, respectivamente. Para assegurar a qualidade da genotipa- gem, testes de desequilíbrio de Hardy-Weinberg podem ser efetuados em casos e controles separadamente. O desvio significante do equilíbrio de Hardy-Weinberg (HWE) em ambos os casos e controles para marcadores individuais pode ser indicativo de erros de genotipagem. Se HWE é violado em uma maioria de marcadores, isto é indicativo de subestrutura de população que deve ser investigado posteriormente.Além disso, o desequilíbrio de Hardy-Weinberg em casos apenas pode indicar associação genética de marcadores com a doença. B. Weir, Genetic Data Analysis, Sinauer (1990).
[00213]Para testar se um alelo de um SNP único está associado com o estado de controle ou caso de um traço fenotípico, um versado na técnica pode compararfrequências de alelos em casos e controles. Os testes exatos de Fischer e os testes qui-quadrado padrões podem ser realizados em uma tabela 2x2 (2 alelos SNP x 2 resultados no traço categórico de interesse. Para testar se genótipos de um SNP são associados, teste qui-quadrado podem ser realizados em uma tabela 3x2 (3 ge- nótipos x 2 resultados). Testes de pontuação também são realizados para associação genotípica para contrastar as três frequências genotípicas (homozigotos maiores, heterozigotos e homozigotos menores) em casos e controles, e para buscar tendências usando 3 modos diferentes de hereditariedade, isto é dominante (com coeficientes de contraste 2, -1, -1), aditivo ou alélico (com coeficientes de contraste 1, 0, -1) e recessivo (cm coeficientes de contraste 1, 1, -2). Odd ratios (razões de chances) para alelos menores versus maiores, e odd ratios para variantes de hete- rozigoto e homozigoto versus os genótipos de tipo selvagem são calculadas com os limites de confiança desejados, geralmente 95%.
[00214]Para controlar confundidores e testar modificadores de efeito e de interação, análises estratificadas podem ser efetuadas usando fatores estratificados que são prováveis confundir, incluindo informações demográficas, tais como, idade, afiliação étnica e sexo, ou um elemento de interação ou modificador de efeito, tal como um gene maior conhecido (por exemplo, APOE para doença de Alzheimer ou genes HLA para doenças autoimunes), ou fatores ambientais, tais como, o fumo no câncer de pulmão. Testes estratificados de associação podem ser realizados usando testes de Cochran-Mantel-Haenszel que levam em consideração a natureza ordinal dos genótipos com 0, 1, e 2 alelos variantes. Testes exatos por StatXact também podem ser efetuados quando possíveis de forma computacional. Um outro modo para ajustar confusão de efeitos e testar interações é efetuar análise de regressão logística múltipla gradualmente usando pacotes estatísticos, tais como, SAS ou R. A regressão logística é uma técnica de construção modelo em que o modelo de melhor ajuste e mais parcimonioso é construído para descrever a relação entre o resultado dicotômico (por exemplo, genótipos de diferentes genes associados e os fatores demográficos e ambientais). O modelo mais comum é um em que a transformação de logit de odds ratios é expressa como uma combinação linear das variáveis (efeitos principais) e seus termos de produtos cruzados (interações). Hosmer e Le- meshow, Applied Logistic Regression, Wiley (2000). Para testar se certa variável ou interação está significantemente associada com o resultado, os coeficientes do modelo são primeiramente estimados e então testados para significância estatística de seu afastamento do zero.
[00215]Além de efetuar testes de associação de um marcador em um tempo, a análise de associação de haplótipos pode ser efetuada para estudar um número de marcadores que estão ligados juntos. Testes de associação de haplótipos podem ter melhor poder que testes de associação alélica ou genotípica quando os marcadores testados não são as mutações causadoras da doença por si só, mas estão em desequilíbrio de ligação com tais mutações. O teste será mesmo mais poderoso se a doença é realmente causada por uma combinação de alelos em um haplótipo (por exemplo, APOE é um haplóide formado por 2 SNPs que estão muito próximos um do outro). Para efetuar associação de haplótipo de forma eficaz, as medições de desequilíbrio de ligação marcador-marcador, o D’ e r2, são tipicamente calculados para marcadores dentro de um gene para elucidar a estrutura do haplóide. Estudos re- centes em desequilíbrio de ligação indicam que os SNPs dentro de um gene são organizados em padrão de bloco, e existe um elevado grau de desequilíbrio de ligação entre os blocos. Daly et al., Nature Genetics 29:232-235 (2001). A associação de haplótipos com os estados de doença podem ser efetuadas usando tais blocos uma vez que eles tenham sido elucidados.
[00216]Testes de associação de haplótipos podem ser realizados de um modo similar aos testes de associação alélica e genotípica. Cada haplótipo em um gene é análogo a um alelo em um marcador multi-alélico. Uma pessoa versada na técnica também pode comparar as frequências de haplótipos em casos ou teste de associação genética com diferentes pares de haplótipos. Foi proposto que testes de pontuação podem ser feitos em haplótipos usando o programa "haplo. score." Schaid et al., Am J Hum Genet 70:425-434 (2002). Neste método, os haplótipos são primeiramente deduzidos por algoritmo EM e testes de pontuação são realizados com uma estrutura de modelo linear generalizado (GLM) que permite o ajuste de outros fatores.
[00217]Uma importante decisão no desempenho de testes de associação genética é a determinação do nível de significância no qual a associação significante pode ser declara quando o valor de P dos testes alcança aquele nível. Em uma análiseexploratória em que ocorrências positivas serão seguidas de teste confirmativo subsequente, um valor não ajustado de P < 0,2 (um nível de significância no lado leniente), por exemplo, pode ser usado para gerar hipóteses para a associação sig- nificante de um SNP com certas características fenotípicas de uma doença. É preferido que um valor-P < 0,05 (um nível de significância tradicionalmente usado na arte) seja alcançado para que um valor-P <0,01 (um nível de significância no lado estrito) seja alcançado para uma associação a ser declarada. Quando as ocorrências são seguidas de análises confirmatórias em mais amostras da mesma origem ou em diferentes amostras de origens diferentes, ajustes para teste múltiplo serão efetuados de modo a evitar número de excesso de ocorrências enquanto mantendo as taxas de erro por experimento de 0,05. Embora existam diferentes métodos de ajuste para testes múltiplos para controlar diferentes tipos de taxas de erros, um método comum, mas um pouco conservador usado é a correção de Bonferroni para controlar a taxa de erro por família de testes ou por experimento. Westfall et al., Multiple comparisons and multiple tests, SAS Institute (1999). Permutation tests to control for the false discovery rates, FDR, pode ser mais poderoso. Benjamini e Hochberg, Journal of the Royal Statistical Society, Series B 57: 1289-1300 (1995); Westfall e Young, Resampling-based Multiple Testing, Wiley (1993). Tais métodos de controle por mul-tiplicidadesão preferidos quando os testes são dependentes e o controle por taxas de verificação falsa é suficiente quando oposto ao controle para as taxas de erro por experimento.
[00218]Em estudos de replicação usando amostras de diferentes populações após marcadores estatisticamente significantes terem sido identificados no estágio exploratório, as meta-análises então podem ser efetuadas pela combinação de evidências de diferentes estudos. Modern Epidemiology 643-673, Lippincott, Williams & Wilkins (1998). Se disponível, resultados de associação conhecidos na técnica para os mesmos SNPs podem ser incluídos nas meta-análises.
[00219]Uma vez que a genotipagem e a classificação de estado de doença podem envolver erros, análises de sensibilidade podem ser efetuadas para ver como os odds ratios e valores-p mudariam mediante várias estimativas nas taxas de erro de classificação de doença e genotipagem.
[00220]É bem conhecido que desvios sistemáticos de amostragem com base na sub-população entre casos e controles podem levar a resultados espórios em estudos de associação caso-controle quando a prevalência da doença está associada com diferentes grupos de sub-população. Ewens and Spielman, Am J Hum Genet 62:450-458 (1995). Tais desvios sistemáticos podem levar a uma perda de poder estatístico em estudos de associação genética. Para detectar a estratificação da população, Pritchard e Rosenberg sugeriram a tipagem de marcadores que são distintos das doenças e o uso de resultados de testes de associação naqueles marcadores para determinar se existe alguma estratificação de população.
[00221]Pritchard et al., Am J Hum Gen 65:220-228 (1999). Quando a estratificação é detectada, o método de controle genômico (GC) como proposto por Devlin e Roeder pode ser usado para o ajuste da inflação de estatísticas de teste devido à estratificação de população. Devlin et al., Biometrics 55:997-1004 (1999). O método GC é rigoroso para mudanças nos níveis de estrutura de população bem como é aplicável para modelos de pool de DNA. Devlin et al., Genet Epidem 21 :273-284 (2001).
[00222]Embora o método de Pritchard recomende usar 15-20 marcadores microssatélites distintos, foi sugerido usar mais que 30 marcadores bialélicos para conseguir poder suficiente para detectar estratificação de população. Para o método GC, foi mostrado que aproximadamente 60-70 marcadores bialélicos são suficientes para estimar o fator de inflação para as estatísticas de teste devido à estratificação de população. Bacanu et al., Am J Hum Genet 66: 1933-1944 (2000). Consequentemente, 70 SNPs intergênicos podem ser escolhidos em regiões distintas como indicado em um escaneamento de genoma. Kehoe et al., Hum MoI Genet 8:237-245 (1999).
[00223]Uma vez que fatores de risco do indivíduo, genético ou não genético, foram verificados para a predisposição a doença, a próxima etapa é estabelecer um esquema de classificação/predição para predizer a categoria (por exemplo, doença ou não doença) que um indivíduo terá dependendo de seus genótipos de SPNs associados e outros fatores de risco não genéticos. A regressão logística para traço discreto e regressão linear para traços contínuos são técnicas padrões para tais tarefas. Draper e Smith, Applied Regression Analysis, Wiley (1998). Além disso, outras técnicas podem ser usadas para estabelecer classificação. Tais técnicas incluem, mas estão limitadas a, MART, CART, rede neural, e análises discriminantes que são adequadas para uso na comparação do desempenho de diferentes métodos. The Elements of Statistical Learning, Hastie, Tibshirani & Friedman, Springer (2002).
Seleção de Predisposição e Diagnóstico de Doença
[00224]A informação de associação/correlação entre genótipos e fenótipos relacionados a doenças pode ser explorada de vários modos. Por exemplo, no caso de uma associação altamente significante estatisticamente entre um ou mais SPNs com predisposição a uma doença para a qual o tratamento é disponível, a detecção de um padrão de genótipo em um indivíduo pode justificar a administração imediata do tratamento, ou pelo menos a instituição de monitoramento regular do indivíduo. A detecção de alelos suscetíveis associados com doenças sérias em um casal con-templando ter filhos também pode ser valiosa para o casal em suas decisões reprodutivas. No caso de uma associação mais fraca, porém ainda estatisticamente signi- ficante entre um SNP e uma doença humana, intervenção terapêutica imediata ou monitoramento não pode ser justificado após detecção de alelo de suscetibilidade ou SNP. Entretanto, o sujeito pode ser motivado a iniciar simples mudanças no estilo de vida (por exemplo, dieta, exercícios) que podem ser acompanhadas de pouco ou nenhum custo para o indivíduo, mas conferiria benefícios potenciais na redução do risco do desenvolver condições para as quais aquele indivíduo pode ter um risco aumentado em virtude de ter o(s) alelo(s) de risco.
[00225]Os SPNs da invenção podem contribuir para o desenvolvimento de CHD (por exemplo, MI) ou aneurisma/dissecção, ou para responsividade de um indivíduo ao tratamento com estatina, em diferentes modos. Alguns polimorfismos ocorrem sem uma sequência que codifica proteína e contribui para fenótipo de doença por afetar a estrutura de proteína. Outros polimorfismos ocorrem em regiões de não codificação, mas podem exercer efeitos fenotípicos indiretamente por meio de in- fluência na, por exemplo, replicação, transcrição e/ou translação. Um único SNP pode afetar mais que um traço fenotípico. Do mesmo modo, um único traço fenotípico pode ser afetado por múltiplos SNPs em genes diferentes.
[00226]Como usado aqui, os termos “diagnosticar”, “diagnose” e “diagnósticos” incluem, mas não estão limitados a, qualquer um dos seguintes: detecção de CHD ou aneurisma/dissecção que um indivíduo pode presentemente ter, seleção de predisposição/suscetibilidade/preditiva (isto é, determinar se um indivíduo possui um risco aumentado ou diminuído de desenvolver CHD ou aneurisma/dissecção no futuro), prognosticar o curso futuro de CHD ou aneurisma/dissecção ou recorrência de CHD ou aneurisma/dissecção em um indivíduo, determinar um tipo particular ou subclasse de CHD ou aneurisma/dissecção em um indivíduo que correntemente ou previamente teve CHD ou aneurisma/dissecção, confirmar ou reforçar um diagnóstico feito previamente de CHD ou aneurisma/dissecção, avaliar a probabilidade de um indivíduo responder positivamente a um agente terapêutico ou tratamento particular, tal como, tratamento com estatina (particularmente tratamento ou prevenção de CDH ou aneurisma/dissecção usando estatinas), determinar ou selecionar uma es-tratégia terapêutica que um indivíduo é mais provável responder positivamente (por exemplo, selecionar um agente terapêutico particular tal como uma estatina, ou combinação de agentes terapêuticos, ou determinar um regime de dosagem, etc.) classificar (ou confirmar/reforçar) um indivíduo como um respondedor/não responde- dor (ou determinar um subtipo particular de respondedor/ não respondedor) com respeito a resposta do indivíduo a um tratamento com droga, tal como tratamento com estatina, e predizer se um paciente provavelmente experimentará efeitos tóxicos a partir de um composto terapêutico ou tratamento particular. Tais usos de diagnóstico podem ser baseados nos SNPs individualmente ou em uma combinação única ou haplótipos de SNP da presente invenção.
[00227]Os haplótipos são particularmente úteis pelo fato de que, por exem- plo, poucos SNPs podem ser genotipados para determinar se uma região genômica particular acolhe um locus que influencia um fenótipo particular, tal como em análises de associação de SNP com base em desequilíbrio de ligação.
[00228]O desequilíbrio de ligação (LD) se refere a co-hereditariedade de ale- los (por exemplo, nucleotídeos alternativos) em dois ou mais locais de SNP diferentes em frequências maiores de que seriam esperadas das frequências separadas de ocorrência de cada alelo em uma dada população. A frequência esperada de co- ocorrência de dois alelos que são independentemente hereditários é a frequência do primeiro alelo multiplicada pela frequência do segundo alelo. Os alelos que co- ocorrem em frequências esperadas são ditos estar em “equilíbrio de ligação”. Em contraste, LD se refere a qualquer associação genética não aleatória entre alelo(s) em dois ou mais locais de SNP diferentes, que é geralmente devido à proximidade física de dois loci ao longo de um cromossomo. O LD pode ocorrer quando dois ou mais locais de SNPs estão em uma estreita proximidade física um do outro em um dado cromossomo e, portanto, os alelos nestes locais de SNP tenderão a permane-cernão separados por gerações múltiplas com a consequência de que um nucleotí- deo particular (alelo) em um local de SNP mostrará uma associação não aleatória com um nucleotídeo particular (alelo) em um local de SNP diferente localizado próximo. Consequentemente, a genotipagem de um dos locais de SNP fornecerá quase a mesma informação que a genotipagem dos outros locais de SNP que estão em LD.
[00229]Vários graus de LD podem ser encontrados entre dois ou mais SNPs com o resultado sendo que alguns SNPs estão associados mais proximamente (isto é, em LD mais forte) que outros.Além disso, a distância física sobre a qual o LD se estende ao longo de um cromossomo difere entre regiões diferentes de genoma e, portanto o grau de separação física entre dois ou mais locais de SNP necessários para que ocorra o LD pode diferir entre regiões diferentes do genoma.
[00230]Para propósitos de diagnóstico e usos similares, se um local de SNP particular é verificado ser útil para, por exemplo, predizer uma suscetibilidade do indivíduo para CHD ou aneurisma/dissecção ou uma resposta do indivíduo ao tratamento com estatina, então o versado na técnica reconheceria que outros locais de SNP que estão em LD com este local de SNP também seriam úteis para os mesmos propósitos. Desse modo, o polimorfismo (por exemplo, SNPs e/ou haplótipos) que não são os polimorfismos que causam a doença real (causadores), mas estão em LD com tais polimorfismos causadores, também são úteis. Em tais exemplos, o ge- nótipo de polimorfismo(s) que está/estão em LD com o polimorfismo causador é pre- ditivo do genótipo do polimorfismo causador e, consequentemente, preditivo do fenó- tipo (por exemplo, CHD, aneurisma/dissecção, ou respondedor/não respondedor ao tratamento com estatina) que é influenciado pelo(s) polimorfismo(s) causador(es). Portanto, marcadores polimórficos que estão em LD com o(s) polimorfismo(s) cau- sador(es) é/são desconhecido(s).
[00231]Exemplos de polimorfismos que podem estar em LD com um ou mais polimorfismos causadores (e/ou em LD com um ou mais polimorfismos que possuem uma associação estatística significativa com uma condição) e, portanto, úteis para o diagnóstico da mesma condição que o(s) SNP(s) causador(es)/associado(s) é/são usado(s) para diagnosticar, incluem outros SNPs na mesma região de gene, de codificação de proteína, ou de codificação de transcrição de mRNA como o SNP causa- dor/associado, outros SNPs no mesmo exon ou mesmo intron como o SNP causa- dor/associado, outros SNPs no mesmo bloco de haplótipo como o SNP causa- dor/associado, outros SNPs na mesma região intergênica como o SNP causa- dor/associado, SNPs que estão fora porém próximos a um gene (por exemplo, dentro de 6kb em outro lado, 5’ ou 3’, de uma fronteira de gene) que acolhe um SNP causa-dor/associativo, etc. Tais SNPs de LD úteis podem ser selecionados dentre os SNPs descritos nas Tabelas 1 e 2, por exemplo.
[00232]O desequilíbrio de ligação no genoma humano é revisto em Wall et al, "Haplotype blocks and linkage disequilibrium in the human genome," Nat Rev Genet 4(8):587-97 (Aug. 2003); Gamer et al., "On selecting markers for association studies: patterns of linkage disequilibrium between two and three diallelic loci," Genet Epidemiol 24(l):57-67 (Jan. 2003); Ar-LDie et al., "Patterns of linkage disequilibrium in the human genome," Nat Rev Genet 3(4):299- 309 (Apr. 2002); erratum in Nat Rev Genet 3(7):566 (JuI. 2002); e Remm et al., "High-density genotyping and linkage disequilibrium in the human genome using chromosome 22 as a model," Curr Opin Chem Biol 6(l):24-30 (Feb. 2002); J.B.S. Haldane, "The combination of linkage values, and the calculation of distances between the loci of linked factors," J Genet 8:299-309 (1919); G. Mendel, Versuche tiber Pflanzen-Hybriden. VerhanLDungen des naturforschenden Vereines in Brünn (Proceedings of the Natural History Society of Brünn) (1866); Genes IV, B. Lewin, ed., Oxford University Press, N.Y. (1990); D.L. Haiti e A.G. Clark Principles of Population Genetics 2nd ed., Sinauer Associates, Inc., Mass. (1989); J.H. Gillespie Population Genetics: A Concise Guide. 2nded., Johns Hopkins University Press (2004); R.C. Lewontin, "The interaction of selection and linkage I General considerations; heterotic models," Genetics 49:49- 67 (1964); P.G. Hoel, Introduction to Mathematical Statistics 2nded., John Wiley & Sons, Inc., N.Y. (1954); R.R. Hudson, "Two-locus sampling distributions and their application," Genetics 159:1805-1817 (2001); A.P. Dempster, N.M. Laird, D.B. Rubin, "Maximum likelihood from incomplete data via the EM algorithm," JR Stat Soc 39: 1 -38 (1977); L. Excoffier, M. Slatkin, "Maximum-likelihood estimation of molecular haplotype frequencies in a diploid population," MoI Biol Evol 12(5):921-927 (1995); D.A. Tregouet, S. Escolano, L. Tiret, A. Mallet, J.L. Golmard, "A new algorithm for haplotype-based association analysis: the Stochastic-EM algorithm," Ann Hum Genet 68(Pt 2):165- 177 (2004); A.D. Long and CH. Langley CH, "The power of association studies to detect the contribution of candidate genetic loci to variation in complex traits," Genome Research 9:720-731 (1999); A. Agresti, Categorical Data Analysis, John Wiley & Sons, Inc., N.Y. (1990); K. Lange, Mathematical and Statistical Methods for Genetic Analysis, Springer-Verlag New York, Inc., N.Y. (1997); O consórcio internacional HapMap, "The International HapMap Project," Nature 426:789-796 (2003); The International HapMap Consortium, "A haplotype map of the human genome," Nature 437:1299-1320 (2005); G.A. Thorisson, A.V. Smith, L. Krishnan, L.D. Stein, "The International HapMap Project Web Site," Genome Research 15: 1591-1593 (2005); G. McVean, CCA. Spencer, R. Chaix, "Perspectives on human genetic variation from the HapMap project," PLoS Genetics 1(4):413- 418 (2005); J.N. Hirschhorn, MJ. Daly, "Genome-wide association studies for common diseases and complex traits," Nat Genet 6:95-108 (2005); SJ. Schrodi, "A probabilistic approach to large- scale association scans: a semi-Bayesian method to detect disease-predisposing alleles," SAGMB 4(1):31 (2005); W.Y.S. Wang, BJ. Barratt, D.G. Clayton, J.A. Todd, "Genome-wide association studies: theoretical and practical concerns," Nat Rev Genet 6: 109-118 (2005); J.K. Pritchard, M. Przeworski, "Linkage disequilibrium in humans: models and data," Am J Hum Genet 69:1-14 (2001).
[00233]Como discutido acima, um aspecto da presente invenção é a verificação de que SNPs que estão em certa distância de LD com um SNP interrogado também podem ser usados como marcadores para determinar se um indivíduo possui um risco aumentado ou diminuído de ter ou desenvolver CHD ou aneuris- ma/dissecção, ou uma probabilidade do indivíduo se beneficiar de um tratamento com droga tal como tratamento com estatina. Como usado aqui, o termo “SNP inter-rogado” se refere aos SNPs que foram verificados estarem associados com um risco aumentado ou diminuído de doença usando análises e resultados de genotipagem, ou outro método experimental apropriado como exemplificado nos exemplos de funcionamento descritos neste pedido. Como usado aqui, o termo “SNP LD” se refere a um SNP que foi caracterizado como uma associação de SNP com um risco aumen- tado ou diminuído de doenças devido aos mesmos estarem em LD com o “SNP interrogado” sob os métodos de cálculo descritos aqui no pedido. Abaixo, o requerente descreve os métodos de cálculo com o qual um com habilidade ordinária na técnica pode determinar se um SNP particular está em LD com um SNP interrogado. O parâmetro r2é comumente usado na técnica de genética para caracterizar a extensão do desequilíbrio de ligação entre os marcadores (Hudson, 2001). Como usado aqui, “em LD com” se refere a um SNP particular que é medido aproximadamente no limiar de um parâmetro tal como r2com um SNP interrogado.
[00234]Agora é trivial observar diretamente variantes genéticas em uma amostra de cromossomos obtida de uma população. Suponha que se tenham dados de genótipos em dois marcadores genéticos localizados no mesmo cromossomo, para os marcadores A e B. Além disso, suponha que dois alelos se segregam em cada um destes marcadores tal que os alelos A1 e A2 possam ser encontrados no marcador A e os alelos B1 e B2, no marcador B. Também admita que estes dois marcadores estão em um autossoma humano. Se um é para examinar um indivíduo específico e verifica que eles são heterozigotos em ambos os marcadores, tal que seu genótipo marcador dois é A1A2B1B2, então existem duas configurações possíveis: o indivíduo em questão pode ter os alelos A1B1 em um cromossomo e A2B2 no cromossomo remanescente; alternativamente, o indivíduo pode ter alelos A1B2 em um cromossomo e A2B1 no outro. O arranjo de alelos em um cromossomo é chamado um haplótipo. Nesta ilustração, o indivíduo pode ter haplótipos A1B1/A2B2 ou A1B2/A2B1 (vide Hartl e Clark (1989) para uma descrição mais completa). O conceito de equilíbrio de ligação relaciona-se com a frequência de haplótipos com a frequência de alelos.
[00235]Admita que uma amostra de indivíduos é selecionada a partir de uma grande população. Considerando os dois marcadores descritos acima, cada um tendo dois alelos, existem quatro possibilidades de haplótipos: A1B1, A1B2, A2B1 e A2B2. Denote as frequências destes quarto haplótipos com a seguinte notação. P11 = freq (A1B1) (1) P12 = freq (A1B2) (2) P21 = freq (A2B1) (3) P22 = freq (A2B2) (4)
[00236]As frequências de alelos em dois marcadores são então a soma de diferentes frequências de haplótipos, é direto escrever um conjunto similar de equações relacionando frequências de alelo de único marcador com frequências de ha- plótipos de dois marcadores: p1 = freq (A1) = P11 + P12 (5) p1 = freq (A1) = P21 + P22 (6) q1 = freq (B1) = P11 + P21 (7) q2 = freq (B2) = P12+ P22 (8)
[00237]Observe que as quarto frequências de haplótipos e as frequências de alelos em cada marcador precisam ser somadas para dar uma frequência de 1. P11 + P12 +P21 + P22 = 1 (9) p1 + p2 = 1 (10) q1 + q2 = 1 (11)
[00238]Se não houver correlação entre os alelos nos dois marcadores, seria esperado que a frequência de haplótipos fosse aproximadamente o produto dos ale- los compostos. Portanto, P11 ~ p1q1 (12) P12 ~p1q2 (13) P21 ~p2q1 (14) P22 ~p2q2 (15)
[00239]Estas equações aproximadas (12) - (15) representam o conceito de equilíbrio de ligação onde existe agrupamento entre os dois marcadores - os alelos nos dois marcadores ocorrem juntos de forma aleatória. Estas são representadas como aproximações porque equilíbrio de ligação e desequilíbrio de ligação são conceitos tipicamente considerados como propriedades de uma amostra de cromossomos, e como tais eles são suscetíveis a flutuações estocásticas devido ao processo de amostragem. Empiricamente, muitos pares de marcadores genéticos estarão em equilíbrio de ligação, mas certamente não todos os pares.
[00240]Tendo estabelecido o conceito de equilíbrio de ligação acima, os requerentes podem agora descrever o conceito de desequilíbrio de ligação (LD), que é o desvio do equilíbrio de ligação. Uma vez que a frequência de haplótipo A1B1 é aproximadamente o produto de frequências de alelos para A1 e B1 sobre a suposição de equilíbrio de ligação como determinado matematicamente em (12), uma medida simples para a quantidade de afastamento do equilíbrio de ligação é a diferença destas duas quantidades, D, D = P11 - p1q1 (16) D = 0 indica equilíbrio de ligação perfeito. O afastamento substancial de D = 0 indica LD na amostra de cromossomos examinada. Muitas propriedades de D são discutidas em Lewontin (1964) incluindo os valores máximos e mínimos que D pode assumir. Matematicamente, usando álgebra básica, pode-se mostrar que D também pode ser escrito somente em termos de haplótipos: D = P11P22 - P12P21 (17) Ao se transformar D elevando-o ao quadrado e subsequentemente dividindoo pelo produto de frequências de alelos de A1, A2, B1 e B2, a quantidade resultante, chamada r2, é equivalente ao quadrado do coeficiente de correlação de Person co- mumente usado em estatística (por exemplo, Hoel, 1954).
Figure img0004
Tal como com D, o valor de r2próximo de 0 indica equilíbrio de ligação entre os dois marcadores examinados no conjunto de amostra. Quando os valores de r2aumentam, os dois marcadores são ditos estar em equilíbrio de ligação. A faixa de valores que r2pode assumir é de 0 a 1. r2= 1 quando existe uma correlação perfeita entre os alelos nos dois marcadores.
[00241]Além disso, as quantidades discutidas acima são de amostra específica. E como tal, é necessário formular notação específica para os estudos de amostra. Na abordagem discutida, três tipos de amostras são de interesse primário: (i) uma amostra de cromossomos de indivíduos afetados por um fenótipo relacionado a doença (casos), (ii) uma amostra de cromossomos obtidos de indivíduos não afetados pelo fenótipo relacionado a doença (controles), e (iii) um conjunto de amostra padrão usado para a construção de haplótipos e cálculo de desequilíbrio de ligação de combinação em dupla (“pairwise”). Para as frequências de alelos usadas no desenvolvimento do método descrito abaixo, uma subscrição adicional será adicionada para denotar também os conjuntos de amostra de caso ou controle. p1,cs = freq (A1 em casos) (19) p2,cs = freq (A2 em casos) (20) q1,cs = freq (B1 em casos) (21) q2,cs = freq (B2 em casos) (22) Similarmente, p1,ct = freq (A1 em controles) (19) p2,ct = freq (A2 em controles) (20) q1,ct = freq (B1 em controles) (21) q2,ct = freq (B2 em controles) (22)
[00242]Como um conjunto de amostras bem aceito é necessário para cálculos de desequilíbrio de ligação rigorosos, os dados obtidos do projeto HapMap internacional (The International HapMap Consortium 2003, 2005; Thorisson et al, 2005; McVean et al., 2005) pode ser usado para o cálculo de valores de r2de combinação em dupla. De fato, as amostras genotipadas para o projeto Internacional HapMap foram selecionadas por serem exemplos representativos de várias subpopulações humanas com números suficientes de cromossomos examinados para deduzir con-clusões rigorosas e significativas a partir de padrões de variações genéticas observados. O website do projeto internacional HapMap (hapmap.org) contém uma descrição do projeto, métodos utilizados e amostras examinadas. É útil examinar dados empíricos para ter uma noção dos padrões presentes em tais dados.
[00243]As frequências de haplótipos foram argumentos explícitos na equação (18) acima. Entretanto, conhecendo-se a frequência de haplótipo de 2 marcadores requer que a fase seja determinada por amostras de heterozigotos em dupla. Quando a fase é desconhecida nos dados examinados, vários algoritmos podem ser usados para deduzir fase a partir dos dados de genótipo. Esta questão foi discutida anteriormente onde o indivíduo de heterozigoto em dupla com genótipo 2-SNP de A1A2B1B2 pode ter um ou dois conjuntos diferentes de cromossomos: A1B1/A2B2 ou A1B2/ A2B1. Tal algoritmo para estimar frequência de haplótipos é o algoritmo expec- tativa-maximização (EM) primeiramente formalizado por Dempster et al. (1977). Este algoritmo é frequentemente usado em genética para deduzir frequências de haplóti- pos a partir de dados de genótipos (por exemplo, Excoffier e Slatkin (1995); Tre- gouet et al. (2004)). Deve ser notado que para os dois casos SNP explorados aqui, os algoritmos EM têm erro muito pequeno contanto que as frequências de alelos e tamanho de amostras não sejam tão pequenas. O impacto nos valores de r2é tipicamentedesprezível.
[00244]Como marcadores genéticos correlacionados compartilham informações, a interrogação de marcadores de SNP em LD com um marcador de SNP associado a doença também pode ter poder suficiente para detectar associação de doença (Long e Langley (1999)). A relação entre o poder de verificar diretamente alelos associados a doença e o poder para detectar indiretamente associação a doença foi pesquisado por Pritchard e Przeworski (2001). Em uma derivação direta, pode ser mostrado que o poder para detectar associação a doença indiretamente em locus marcador no desequilíbrio de ligação com um lócus de associação a doença é aproximadamente o mesmo que o poder para detectar associação a doença diretamente no lócus de associação a doença se o tamanho da amostra for aumen- 1 tado por um fator de (o recíproco da equação 18) no marcador em comparação com o lócus de associação a doença.
[00245]Portanto, se calculado o poder para detectar associação a doença indiretamente com um experimento que tem N amostras, então o poder equivalente para detectar diretamente associação a doença (no lócus real de suscetibilidade a doença) necessitaria de um experimento usando aproximadamente r2N amostras. Esta relação elementar entre poder, tamanho da amostra e desequilíbrio de ligação pode ser usado para derivar um valor limiar de r2útil para determinar se os marcadores de genotipagem em desequilíbrio de ligação com um marcador SNP diretamente associado têm ou não têm poder suficiente para detectar associação de doença indiretamente. Para iniciar uma derivação do poder para detectar marcadores associados a doença através de um processo indireto, define o tamanho de amostra cromossomal eficaz como:
Figure img0005
[00246]Em que Ncs e Nct são os números de casos e controles diplóides, respectivamente. É necessário controlar situações em que os números de casos e controles não são equivalentes. Para tamanhos de amostras de casos e controles iguais, Ncs = Nct = N, o valor do número eficaz de cromossomos é simplesmente n = 2N - o esperado. Deixe o poder ser calculado por um nível α de significância (tal que valores-P tradicionais abaixo de α serão considerados estatisticamente significan- tes). Defina a função de distribuição Gaussiana padrão como Φ(β). Matematicamente,
Figure img0006
Alternativamente, a seguinte notação de função de erro (Erf) também pode ser usada,
Figure img0007
[00247]Por exemplo, Φ(1,644854) = 0,95. O valor de r2pode ser derivado para gerar uma quantidade mínima especificada de poder para detectar associação de doença através de interrogação indireta. Observe que o marcador SNP LD pode ser o único que está carregando o alelo de associação a doença, portanto, que esta abordagem constitui um modelo de ligação inferior onde todos os resultados de poder indireto são esperados ser pelo menos tão grandes quanto aqueles interrogados.
[00248]Denote para β a taxa de erro para não detecção de marcadores associadosa doença verdadeiro. Portanto, 1 - β é a definição clássica de poder do teste estatístico. Substituindo o resultado de Pritchard-Pzreworski no tamanho da amostra, o poder para detectar associação a doença em um nível de significância de α é dado pela aproximação
Figure img0008
onde Zu é o inverso da distribuição normal cumulativa padrão avaliada em u (u C (0,1)). Zu = Φ-1(u), onde Φ(Φ-1(u)) = Φ-1(Φ(u)) = u. Por exemplo, ajustando α = 0,05 e, portanto 1 - α/2 = 0,975, obtêm-se Z0,975, = 1,95996. A seguir, ajustar o poder para um valor igual a um limiar de um poder mínimo de T,
Figure img0009
e resolvendo para r2 , o seguinte limiar r2 é obtido:
Figure img0010
Figure img0011
Suponha que r2é calculado entre um SNP interrogado e vários outros SNPs com níveis variáveis de LD com o SNP interrogado. O valor limiar de r2é o valor mí- nimo de desequilíbrio de ligação entre o SNP interrogado e os SNPs LD potenciais tal que o SNP LD ainda retém um poder maior ou igual a T para detectar associação a doença. Por exemplo, suponha que o SNP rs200 é genotipado em um estudo de associação de doença caso-controle e é verificado estar associado com um fenótipo de doença. Além disso, suponha que a frequência de alelo menor em 1.000 cromossomos de caso foi verificada ser de 16% em contraste com um frequência de alelo menor de 10% em 1.000 cromossomos de controle. Dadas aquelas medições pode- se predizer, antes do experimento, que o poder para detectar associação a doenças em um nível de significância de 0,05 foi relativamente alto - aproximadamente 98% usando um teste de associação alélica. Aplicando a equação (32) pode-se calcular um valor mínimo de r2para estimar indiretamente associação de doença admitindo que o alelo menor em SNP rs200 é predisposição verdadeira da doença para um nível de limiar de poder. Caso se ajuste o nível de limiar de poder para ser 80%, então rT2= 0,489 dado o mesmo nível de significância e n[úmeros de cromossomos como acima. Consequentemente, qualquer SNP com um valor r2de combinação em dupla com rs200 maior que 0,489 é esperado ter poder maior que 80% para detectar a associação a doença. Adicionalmente, o mesmo está admitindo o modelo conservador onde o SNP LD é associado a doença apenas através de desequilíbrio de ligação com o SNP rs200 interrogado.
[00249]A contribuição ou associação de haplótipos de SNP e/ou SNPs particulares com fenótipos, tais como CHD ou aneurisma/dissecção, como resultado de um genótipo específico, ou indivíduos cujos genótipos colocam-nos em um risco aumentado ou diminuído de desenvolver um traço detectável em um tempo subse- qüente quando comparados com indivíduos que não possuem o tal genótipo. Como descrito aqui, os diagnósticos podem se baseados em um SNP único ou em um grupo de SNPs. A detecção combinada de uma pluralidade de SNPs (por exemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 24, 25, 30, 32, 48, 50, 64, 96, 100, ou qualquer outro número entre eles, ou mais, dos SNPs fornecidos na Tabela 1 e/ou Tabela 2) tipicamente aumenta a probabilidade de um diagnóstico exato. Por exemplo, a presença de um SNP único conhecido por se correlacionar com CHD pode indicar uma probabilidade de 80% de um indivíduo ter ou estar com risco de desenvolver os SNPs da presente invenção pode ser combinado com aqueles de outros polimorfismos ou outros fatores de risco de CHD ou aneurisma/dissecção, tais como sintomas de doença, características patológicas, histórico familiar, dieta, fatores ambientais ou fatores relacionados com o estilo de vida.
[00250]Será, obviamente, entendido por profissionais habilitados no tratamento ou diagnóstico de CHD ou aneurisma/dissecção que a presente invenção geralmentenão pretende fornecer uma identificação absoluta de indivíduos que apresentam o risco (ou menos risco) de desenvolver CHD ou aneurisma/dissecção, e/ou patologias relacionadas com CHD ou aneurisma/dissecção, mas de preferência para indicar certo grau aumentado (ou diminuído) ou a probabilidade de desenvolvimento de doença com base em resultados de associação estatisticamente significantes. Entretanto, esta informação é extremamente valiosa na medida em que a mesma pode ser usada para, por exemplo, iniciar tratamentos preventivos ou para permitir que um indivíduo carregue um ou mais haplótipos de SNP ou SNPs significantes para prever sinais de advertência, tais como, sintomas clínicos menores, ou para ter exames físicos agendados regularmente para monitorar o aparecimento de uma condição para identificar e ser tratado de uma condição em um estágio inicial. Particularmente com doenças que são extremamente debilitantes ou fatais se não tratadas a tempo, o conhecimento de uma predisposição potencial, mesmo se esta predisposição não seja absoluta, provavelmente contribuiria de uma maneira muito sig- nificante para a eficácia do tratamento.
[00251]As técnicas de diagnóstico da presente invenção podem empregar uma variedade de metodologias para determinar se um sujeito teste possui um padrão SNP ou um padrão de SNP associado com um risco aumentado ou diminuído de desenvolver um traço detectável ou se o indivíduo sofre de um traço detectável como um resultado de uma mutação/polimorfismo particular, incluindo, por exemplo, métodos que possibilitam análise de cromossomos de indivíduos para haplotipagem, estudos de família, analise de DNA de esperma único, ou híbridos somáticos. O traço analisado usando os diagnósticos da invenção pode ser qualquer traço detectável que seja comumente observado em patologias e distúrbios relacionados com CHD ou aneurisma/dissecção.
[00252]Um outro aspecto da presente invenção diz respeito a um método para determinar se um indivíduo apresenta risco (ou menos risco) de desenvolver um ou mais traços ou se um indivíduo expressa um ou mais traços como uma consequência de possuir um alelo que influencia traço ou que causa traço particular. Estes métodos geralmente envolvem a obtenção de uma amostra de ácido nucléico a partir de um indivíduo e o ensaio da amostra de ácido nucléico para determinar que (quais) nucleotídeo(s) está(ão) presentes em uma ou mais posições de SNP, em o(s) nucleotídeo(s) ensaiado(s) é/são indicativo(s) de um risco aumentado ou diminuído de desenvolver o traço ou indicativo de que o indivíduo expressa o traço como um resultado de possuir um alelo que influencia traço ou causa traço particular.
[00253]Em outra modalidade, os reagentes de detecção de SNP da presente invenção são usados para determinar se um indivíduo possui um ou m ais alelos que afetam o nível (por exemplo, a concentração de mRNA ou proteína em uma amostra, etc.) ou padrão (por exemplo, a cinética da expressão, taxa de decomposição, perfil de estabilidade, Km, Vmax, etc.) de expressão de gene (coletivamente, a “res- posta genética” de uma célula ou fluido corpóreo). Tal determinação pode ser executada pela seleção de uma expressão de proteína ou mRNA (por exemplo, pelo uso de arranjo de ácidos nucléicos, RT-PCR, ensaios de TaqMan, ou espectrometria de massa), identificação de genes que tem expressão alterada em um indivíduo, SNPs de genotipagem descritos na Tabela 1 e/ou Tabela 2 que podem afetar a expressão de genes que tem expressão alterada (por exemplo, SNPs que estão em e/ou em torno de outro(s) gene(s) que estão envolvidos em trajetos que pode afetar a expressão do gene(s) que tem expressão alterada ou todos os SNPs podem ser geno- tipados), e a correlação de genótipos de SNP com expressão de gene alterada. Desta maneira, os alelos de SNP específicos em locais de SNP particulares podem ser identificados pelo fato de que afetam a expressão de gene.
Farmacogenômicos e Desenvolvimento de Terapêuticos/Droga
[00254]A presente invenção fornece métodos para avaliar a farmacogenômi- ca de um sujeito abrigando alelos de SNP particulares ou haplótipos para um agente terapêutico particular ou composto farmacêutico, ou para uma classe de tais compostos. A farmacogenômica lida com situações que desempenham variações hereditárias (por exemplo, os SNPs) clinicamente significantes na resposta às drogas devido a disposição da droga alterada e/ou a ação anormal em pessoas afetadas. Ver, por exemplo, Roses, Nature 405, 857-865 (2000); Gould Romberg, Nature Biotechnology 19, 209-211 (2001); Eichelbaum, Clin Exp Pharmacol Physiol 23 (10-11): 983-985 (1996); e Linder, Clin Chen 43(2);254-266(1997). Os efeitos clínicos dessas variações podem resultar em severa toxicidade das drogas terapêuticas em certos indivíduos ou falha terapêutica de drogas em certo indivíduos como um resultado da variação individual no metabolismo. Desta maneira, o genótipo de SNP de um indivíduo pode determinar o modo que um composto terapêutico age no corpo ou o modo que o corpo metaboliza o composto. Por exemplo, os SNPs na droga que meta- bolizam enzimas podem afetar a atividade destas enzimas, que por sua vez podem alterar a intensidade e a duração da ação da droga, assim como o metabolismo da droga e a depuração.
[00255]A verificação dos SNPs em enzimas metabolizadoras da droga, transportadores de droga, proteínas para agentes farmacêuticos, e outros alvos de droga tem explicado porque alguns pacientes não obtêm os efeitos esperados da droga, mostram um exagerado efeito da droga, ou experimentam séria toxicidade a partir de dosagens padrões de droga. Os SNPs podem ser expressos no fenótipo do metabolizador extenso e no fenótipo do metabolizador pobre. Portanto, os SNPs podem levar às variantes alélicas de uma proteína na qual uma ou mais das funções da proteína em uma população são diferentes daquelas em outra população. Os SNPs e os peptídeos variantes codificados desta maneira fornecem alvos para determinar uma predisposição genética que pode afetar a modalidade do tratamento. Por exemplo, em um tratamento com base em ligante, os SNPs podem dar origem a domínios extracelulares aminos terminais e /ou outras regiões de ligação do ligante de um receptor que são mais ou menos ativas na ligação do ligante, desse modo afetando a ativação da proteína subsequente. Portanto, a dosagem do ligante seria necessariamente modificada para maximizar o efeito terapêutico dentro de uma dadapopulação contendo alelos SNP haplótipos.
[00256]Como uma alternativa à genotipagem, as proteínas variantes específicas que contêm sequências de aminoácidos variantes codificadas por alelos de SNP alternativos podem ser identificadas. Desse modo, a caracterização farmaco- genômica de um indivíduo permite a seleção de compostos efetivos e dosagens efi- cazs de tais compostos para usos profiláticos ou terapêuticos com base no genótipo de SNP do indivíduo, dessa maneira aumentando e otimizando o efeito da terapia. Além disso, a produção de células recombinantes e animais transgênicos que contêm particulares SNPs/haplótipos permitem o teste e o modelo clínico eficaz dos compostos de tratamento e regimes de dosagens. Por exemplo, os animais transgê- nicos podem ser produzidos para diferir somente em alelos de SNP específicos em um gene que é ortólogo para um gene de suscetibilidade a doença humana.
[00257]Os usos farmacogenômicos dos SNPs da presente invenção fornecem diversas vantagens significantes para o cuidado do paciente, particularmente ao prever uma predisposição do indivíduo ao CHD (por exemplo, Ml) ou aneuris- ma/dissecção e em prever uma responsividade do indivíduo ao uso de estantina (particularmente para o tratamento ou prevenção de CHD ou aneurisma/dissecção). A caracterização farmacogenômica de um genótipo de SNP de um indivíduo pode identificar aqueles indivíduos improváveis para responder ao tratamento com uma medicação particular e, desse modo, permitir aos médicos evitar a prescrição de medicação ineficaz a estes indivíduos. Por outro lado, a genotipagem de SNP de um indivíduo pode possibilitar aos médicos selecionar a medicação apropriada e o regime de dosagem que irá ser mais efetivo com base em um genótipo de SNP do indivíduo. Esta informação aumenta a confiança do médico ao prescrever as medicações e motiva os pacientes a obedecer aos regimes das drogas. Além disso, a far- macogenômica pode identificar pacientes predispostos à toxicidade e reações adversas a particulares drogas e dosagens de droga. Reações adversas à droga podem levar a mais que 100.000 mortes que podiam ser evitadas por ano somente nos Estados Unidos e, portanto, representam uma significante causa de hospitalização e morte, assim como um significante peso econômico no sistema de saúde (Pfost et al., Trends in Biotechnology, Ago. 2000). Desse modo, a farmacogenômica baseada nos SNPs aqui descritos tem o potencial de salvar vidas e reduzir os custos de saúde substancialmente.
[00258]A farmacogenômica é, em geral, mais discutida em Rose et al., "Pharmacogenetic analysis of clinically relevant genetic polymorphisms," Methods MoI Med 85:225-37 (2003). A farmacogenômica que se refere à doença de Alzheimer e outras doenças neurodegenerativas é discutida em Cacabelos, "Pharmacoge- nomics for the treatment of dementia," Ann Med 34(5):357- 79 (2002); Maimone et al., "Pharmacogenomics of neurodegenerative diseases," Eur J Pharmacol 413(1): 1 1-29 (Fev. 2001); and Poirier, "Apolipoprotein E: a pharmacogenetic target for the treatment of Alzheimer's disease," MoI Diagn 4(4):335-4l (Dez.1999). A farmacoge- nômica que se refere a doenças cardiovasculares é discutida em Siest et al., "Phar- macogenomics of drugs affecting the cardiovascular system," Clin Chem Lab Med 41(4):590-9 (Abr. 2003); Mukherjee et al., "Pharmacogenomics in cardiovascular diseases," Prog Cardiovasc Dis 44(6):479-98 (May-Jun. 2002); and Mooser et al. , "Cardiovascular pharmacogenetics in the SNP era," J Thromb Haemost 1 (7): 1398402 (JuI. 2003). A farmacogenômica que se ao câncer é discutida em McLeod et al, "Cancer pharmacogenomics: SNPs, chips, and the individual patient," Cancer Invest 21(4):630-40 (2003); and Watters et al, "Cancer pharmacogenomics: current and future applications," Biochim Biophys Acta 1603(2):99-111 (Mar. 2003).
[00259]Os SNPs da presente invenção também podem ser usados para identificar os alvos terapêuticos novos para CHD ou aneurisma/dissecção. Por exemplo, os genes que contêm as variantes associadas a doenças (“genes de variantes”) ou seus produtos, assim como os genes ou os seus produtos que são diretamente ou indiretamente regulados por, ou interagem com, estes genes variantes ou seus produtos, podem ser alvo para o desenvolvimento de terapêutica que, por exemplo, trata a doença ou previne ou atrasa o início da doença. A terapêutica pode ser composta de, por exemplo, pequenas moléculas, proteínas, fragmentos de proteína ou peptídeos, anticorpos, ácidos nucléicos, ou seus derivados ou miméticos que modulam as funções ou níveis de genes alvos ou produtos de genes.
[00260]As moléculas de ácido nucléico que contêm o SNP descritas aqui, e suas moléculas de ácido nucléico complementares, podem ser usadas como cons- trutos de antisense para controlar a expressão do gene nas células, tecidos, e organismos. A tecnologia antisense é bem estabelecida na arte e extensivamente revisa- da em Antisense Drug Technology: Principles, Strategies, and Applications, Crooke, ed., Marcel Dekker, Inc., N. Y. (2001). Uma molécula de ácido nucléico antisense é geralmente feita para ser complementar a uma região de mRNA expressa por um gene de modo que a molécula de antisense se hibridize com o mRNA e , desse modo, bloqueie a tradução do mRNA em uma proteína. Várias classes de oligonucleotí- deos antisense são usadas na arte, duas delas são clivadoras e bloqueadores. Cli- vadores, através da ligação aos RNA alvos, ativam as nucleases (por exemplo, RNaseH ou RNase L) que partem o RNA alvo. Bloqueadores, que também se ligam aos RNAs alvos inibem a tradução da proteína através do impedimento estérico dos ribossomos. Bloqueadores exemplares incluem ácidos nucléicos peptídeos, morfoli- nos, ácidos nucléicos fechados, e metilfosfonatos. Ver, por exemplo, Thompson, Drug Discovery Today 7(17): 912-917 (2002). Os oligonucleotídeos antisense são diretamente úteis como agentes terapêuticos, e são também úteis pra determinar e validar a função do gene (por exemplo, nos experimentos ”knock-out” ou “knockdown” do gene).
[00261]A tecnologia antisense é adicionalmente revisada em La very et al., "Antisense and RNAi: powerful tools in drug target discovery and validation," Curr Opin Drug Discov Devel 6(4):561- 9 (JuI. 2003); Stephens et al., "Antisense oligonucleotide therapy in cancer," Curr Opin MoI Ther 5(2): 118-22 (Apr. 2003); Kurreck, "Antisense technologies. Improvement through novel chemical modifications," Eur- JBiochem 270(8): 1628-44 (Apr. 2003); Dias et al., "Antisense oligonucleotides: basic concepts and mechanisms," MoI Cancer Ther l(5):347-55 (Mar. 2002); Chen, "Clinical development of antisense oligonucleotides as anti-cancer therapeutics," Methods MoI Med 75:621-36 (2003); Wang et al., "Antisense anticancer oligonucleotide therapeutics," Curr Cancer Drug Targets l(3): 177-96 (Nov. 2001); e Bennett, "Efficiency of antisense oligonucleotide drug discovery," Antisense Nucleic Acid Drug Dev 12(3):215-24 (Jun. 2002).
[00262]Os SNPs da presente invenção são particularmente úteis para a criação de reagentes antisense que são específicos para variantes de ácidos nucléicos particulares. Tendo por base a informação da SNP descrita aqui, os oligonucleotí- deos antisense podem ser produzidos visando especificamente as moléculas mRNA que contêm um ou mais particulares nucleotídeos SNP. Dessa maneira, a expressão de moléculas de mRNA que contêm um ou mais polimorfismos não desejados (por exemplo, os nucleotídeos da SNP que levam a uma proteína defeituosa, tal como uma substituição de aminoácido em um domínio catalítico) pode ser inibida ou com-pletamente bloqueada. Desta maneira, os oligonucleotídeos antisense podem ser usados especificamente para ligar uma forma polimórfica particular (por exemplo, um alelo SNP que codifica uma proteína defeituosa), desse modo, inibindo a tradução desta forma, mas a qual não se liga a uma forma polimórfica alternativa (por exemplo, um nucleotídeo SNP que codifica uma proteína que tem uma função normal).
[00263]As moléculas antisense podem ser usadas para inativar o mRNA para inibir a expressão do gene e produção de proteínas defeituosas. Portanto, estas moléculas podem ser usadas para tratar uma doença, tal como CHD ou aneuris- ma/dissecção, caracterizada por expressão de gene anormal ou não desejada ou de certas proteínas defeituosas. Esta técnica pode envolver a clivagem por meio de ri- bozimas que contêm sequências de nucleotídeos complementares a uma ou mais regiões no mRNA que atenuam a habilidade do mRNA para ser traduzido. As possíveisregiões de mRNA incluem, por exemplo, regiões de codificação da proteína e, particularmente, regiões de codificação da proteína que correspondem a atividades catalíticas, ligação substrato/ligante, ou outras atividades funcionais de uma proteína.
[00264]Os SNPs da presente invenção são também úteis para a criação de reagentes de interferência RNA que especificamente apontam como alvo as moléculas de ácido nucléico que tem particulares variantes SNP. A interferência de RNA (RNAi), também referida como silenciamento de genes, é baseada no uso de moléculas de RNA com filamento duplo (dsRNA) para desligar os genes. Quando introduzidos em uma célula, os dsRNAs são processados pela célula em pequenos fragmentos (geralmente aproximadamente 21, 22, ou 23 nucleotídeo de comprimento) conhecidos como pequena interferência de RNA (siRNA) que a célula usa em uma sequência de maneira específica para reconhecer e destruir RNAs complementares. Thompson, Drug Discovery Today 7(17): 912-917 (2002). Portanto, um aspecto da presente invenção especificamente contempla moléculas isoladas de ácido nucléico que são aproximadamente 18-26 nucleotídeos de comprimento, preferencialmente 19-25 nucleotídeos de comprimento, e mais preferencialmente 20, 21, 22, ou 23 nu- cleotídeos de comprimento, e o uso dessas moléculas de ácido nucléico para RNAi. Devido as moléculas de RNAi, incluindo os siRNAs, agirem em uma sequência de maneira específica, os SNPS da presente invenção podem ser usados para criar reagentes RNAi que reconhecem e destroem as moléculas de ácido nucléico que tem específicos alelos/nucleotídeos SNP (tais como alelos deletérios que levam à produção de proteínas defeituosas), enquanto não afetam as moléculas de ácido nucléico que tem alelos SNP (tais como alelos que codificam as proteínas que tem uma função normal). Como com os reagentes antisense, os reagentes RNAis podem ser diretamente úteis como agentes terapêuticos (por exemplo, para desligar os genes defeituosos, causadores de doenças), e são também úteis para caracterizar e validar a função do gene (por exemplo experimentos knock-out ou knock-down de gene).
[00265]As seguintes referências fornecem uma revisão adicional do RNAi: Reynolds et al., "Rational siRNA design for RNA interference," Nat Biotechnol 22(3):326-30 (Mar. 2004); Epub Feb. 1 , 2004; Chi et al., "Genomewide view of gene silencing by small interfering RNAs," PNAS 100(11):6343-6346 (2003); Vickers et al., "Efficient Reduction of Target RNAs by Small Interfering RNA and RNase H- dependent Antisense Agents," J Biol Chem 278:7108-7118 (2003); Agami, "RNAi and related mechanisms and their potential use for therapy," Curr Opin Chem Biol 6(6):829-34 (Dec. 2002); Lavery et al., "Antisense and RNAi: powerful tools in drug target discovery and validation," Curr Opin Drug Discov Devel 6(4):561-9 (JuI. 2003); Shi, "Mammalian RNAi for the masses," Trends Genet 19(1):9-12 (Jan. 2003); Shuey et al., "RNAi: gene-silencing in therapeutic intervention," Drug Discovery Today 7(20): 1040-1046 (Oct. 2002); McManus et al, Nat Rev Genet 3(10):737-47 (Oct. 2002); Xia et al., Nat Biotechnol 20(10):1006-10 (Oct. 2002); Plasterk et al, Curr Opin Genet Dev 10(5):562-7 (Oct. 2000); Bosher et al., Nat Cell Biol 2(2):E31-6 (Feb. 2000); e Hunter, Curr Biol 17; 9(12):R440-2 (Jun. 99).
[00266]Um sujeito sofrendo de uma condição patológica atribuída a um SNP, tal como CHD ou aneurisma/dissecção, pode ser tratado assim como corrigir o defeitogenético. Ver Kren et al., Proc Natl Acad Sci USA 96:10349-10354 (1999). Tal sujeito pode ser identificado por um método que pode detectar o polimorfismo em uma amostra biológica desenhada do sujeito. Tal defeito genético pode ser permanentemente corrigido pela administração a tal sujeito de um fragmento de ácido nucléico que incorpora uma sequência de reparo que supre o nucleotídeo tipo nor- mal/selvagem na posição do SNP. Esta sequência de reparo site específica pode englobar um oligonucleotídeo RNA/DNA que opera para promover o reparo endógeno de um DNA genômico de um sujeito. A sequência de reparo site específica é administrada em um veículo apropriado, tal como um complexo com polietilenoimina, encapsulada em lipossomas aniônicos, um vetor viral como um adenovírus, ou outra composição farmacêutica que promove a captação do ácido nucléico administrado. Um defeito genético que leva a uma patologia inata pode então ser superado, assim como os oligonucleotídeos induzem a incorporação da sequência normal no genoma do sujeito. Sobre a incorporação, o produto do gene normal é expresso, e a substituição é propagada, desse modo engendrando um reparo permanente e aprimora- mento terapêutico da condição clínica do sujeito.
[00267]Em casos nos quais um cSNP resulta em uma proteína variante que é atribuída ser a causa de, ou um fator que contribui para, uma condição patológica, um método de tratamento assim como uma condição pode incluir a administração a sujeito, que experimenta a patologia, de cognato tipo selvagem/normal de uma proteína variante. Uma vez administrada em regime de dosagem eficaz, o cognato tipo selvagem fornece a complementação ou remediação da condição patológica.
[00268]A invenção ainda prevê um método para identificar um composto ou agente que pode ser usado para tratar CHD ou aneurisma/dissecção. As SNPs descritas aqui são úteis são úteis como alvos para a identificação e/ou desenvolvimento dos agentes terapêuticos. Um método para identificar um agente terapêutico ou composto para modular a atividade e/ou expressão de um ácido nucléico que contêm SNP ou o produto codificado e, desta maneira, identificar um agente ou um composto que pode ser usado para tratar uma doença caracterizada por atividade não desejada ou expressão do ácido nucléico que contêm SNP ou o produto codifi-cado. Os ensaios podem ser realizados em sistemas com base em células e livre de células. Os ensaios com base em células podem incluir células que naturalmente expressam as moléculas de ácido nucléico de interesse ou células recombinantes geneticamente construídas para expressar certas moléculas de ácido nucléico.
[00269]A expressão de gene variável em um paciente com CHD ou aneu- risma/dissecção pode incluir, por exemplo, ou a expressão de uma sequência de ácido nucléico que contêm SNP (por exemplo, um gene que contêm um SNP pode ser transcrito em uma molécula de mRNA transcrito que contêm o SNP, que pode por sua vez ser traduzido em uma proteína variante) ou expressão alterada de uma sequência de ácido nucléico normal/ tipo selvagem devido a um ou mais SNPs (por exemplo, uma região reguladora/controle pode conter um SNP que afeta o nível ou padrão da expressão de um transcrito normal).
[00270]Os ensaios para expressão de gene variante podem envolver ensaios diretos de níveis de ácido nucléico (por exemplo, mRNA) , os níveis de proteína expressos, ou compostos colaterais envolvidos em uma via de sinal. Além disso, a expressão de genes regulados para cima ou para baixo em resposta à via de sinal pode também ser ensaiada. Nesta incorporação, as regiões reguladoras desses genes podem ser operacionalmente ligadas a um gene repórter tal como a luciferase.
[00271]Os moduladores da expressão de gene variante podem ser identificados em um método em que, por exemplo, uma célula está em contato com com- posto/agente candidato e a expressão de mRNA determinada. O nível de expressão de mRNA na presença do composto candidato é comparada ao nível de expressão de mRNA na ausência do composto candidato. O candidato pode então ser identificado como um modulador da expressão de gene variante com base nesta comparação e ser usado para tratar uma doença tal como CHD ou aneurisma/dissecção que é caracterizada pela expressão de gene variante (por exemplo, ou a expressão de um ácido nucléico que contêm SNP ou expressão alterada de uma molécula de ácidonucléico mRNAl/tipo selvagem devido a um ou mais SNPs que afetam a expressão da molécula de ácido nucléico) devido a uma ou mais SNPs da presente invenção. Quando a expressão de mRNA é estatisticamente significantemente maior na presença do composto candidato do que na sua ausência, o composto candidato é identificado como um estimulador da expressão do ácido nucléico. Quando a expressão do ácido nucléico é estatisticamente significantemente menor na presença do composto candidato do que na sua ausência, o composto candidato é identificado como um inibidor da expressão de ácido nucléico.
[00272]A invenção ainda fornece métodos de tratamento, com o SNP ou domínio de ácido nucléico associado (por exemplo, domínio catalítico, domínio de ligação ligante/substrato, região de regulação/controle, etc.) ou gene, ou o transcrito mRNA codificado, como um alvo, usando um composto identificado através da sele- ção da droga com um modulador de gene para modular a expressão do ácido nu- cléico variante. A modulação pode incluir ou a regulação para cima (isto é, a ativação ou agoniação) ou regulação para cima (isto é, supressão ou antagonização) da expressão do ácido nucléico.
[00273]A expressão de transcritos de mRNA e as proteínas codificadas, ou do tipo selvagem ou variante, podem ser alteradas em indivíduos com um alelo de SNP particular em um elemento regulação/controle, tal como um promotor ou domínio de ligação do fator de transcrição, que regula a expressão. Nesta situação, os métodos de tratamento e compostos podem ser identificados, como discutidos aqui, para regular ou superar o elemento regulação/controle de variante, desse modo gerandoníveis normais, ou saudáveis, de expressão do tipo selvagem ou proteína variante.
[00274]As moléculas de ácido nucléico que contêm SNP da presente invenção são também úteis para monitorar a eficácia dos compostos de modulação na expressão ou atividade de um gene variante, ou produto codificado, nos ensaios clínicos ou em um regime de tratamento. Desta maneira, o padrão de expressão do gene pode servir como um indicador para a contínua eficácia do tratamento com o composto, particularmente com compostos para os quais o paciente pode desenvolver resistência, assim como um indicador para toxicidades. O padrão de expressão do gene pode também servir como um indicativo marcador de uma resposta fisiológica das células afetadas para o composto. Portanto, tal monitoramento permitiria ou a administração aumentada do composto ou a administração de compostos alternativos para os quais o paciente não se tornou resistente. Similarmente, se o nível da expressão de ácido nucléico cai para abaixo de um nível desejado, a administração do composto poderia ser comensuravelmente diminuída.
[00275]Em outro aspecto da presente invenção, é fornecido um pacote farmacêutico que compreende um agente terapêutico (por exemplo, uma molécula pe- quena de droga, anticorpo, peptídeo, antisense ou molécula de ácido nucléico RNAi, etc.) e um conjunto de instruções para a administração do agente terapêutico a humanos diagnosticamente testados por um ou mais SNPs ou haplótipos SNP fornecidos pela presente invenção.
[00276]Os SNPs/haplótipos da presente invenção são também úteis para a melhora de muitos aspectos diferentes no processo de desenvolvimento da droga. Por exemplo, um aspecto da presente invenção inclui a seleção de indivíduos para ensaios clínicos com base em seus genótipos de SNP. Por exemplo, os indivíduos com genótipos de SNP, que indicam que eles irão responder positivamente à droga, podem ser incluídos nos ensaios, enquanto aqueles indivíduos dos quais os genóti- pos de SNP indicam que eles são menos prováveis a ou não responderiam à droga, ou que estão em risco de sofrerem os efeitos tóxicos ou outras reações adversas, podem ser excluídos dos ensaios clínicos. Isto não somente pode melhorar a segurança dos ensaios clínicos, mas também aumentar as chances que o ensaio demonstrará estatisticamente uma eficácia significante. Além disso, os SNPs da presente invenção podem explicar porque certas drogas previamente desenvolvidas se apresentam pobremente nos ensaios clínicos e podem ajudar a identificar um subconjunto da população que iria se beneficiar da droga que teria se apresentado pobremente nos ensaios clínicos, desse modo ao “resgatar” as drogas previamente desenvolvidas, e capacitar a droga para fazê-la disponível a uma particular população de pacientes com CHD ou aneurisma/dissecção que pode beneficiar-se dela.
[00277]Os SNPs têm muitos usos importantes na verificação da droga, seleção, e desenvolvimento. Existe uma alta probabilidade de que, para qualquer ge- ne/proteína selecionado como um potencial alvo de droga, variantes deste ge- ne/proteína existirão em uma população de pacientes. Desta maneira, a determinação do impacto de variantes de gene/proteína na seleção e liberação de um agente terapêutico deve ser um aspecto integral da verificação e do processo de desenvol- vimento da droga. Jazwinska, A Trends Guide to Genetic Variation and Genomic Medicine S30-S36 (Mar. 2002).
[00278]O conhecimento de variantes (por exemplo, SNPs e polimorfismos de aminoácido correspondentes) de um alvo terapêutico particular (por exemplo, um gene, transcrito de mRNA, ou proteína) possibilita a seleção paralela de variantes para identificar candidatos terapêuticos (por exemplo, pequenos compostos de moléculas, anticorpos, antisense ou compostos de ácido nucléico RNAi) que demonstrameficácia através de variantes. Rothberg, Nat Biotechnol 19(3):209-l 1 (Mar. 2001). Seria esperado de tais candidatos terapêuticos mostrassem igual eficácia através de um segmento maior da população de pacientes, desse modo, levando a um maior mercado potencial para o candidato terapêutico.
[00279]Além disso, identificar variantes de um potencial alvo terapêutico capacita a forma mais comum do alvo a ser usada para a seleção de candidatos terapêuticos, desse modo ajudando a assegurar que atividade experimental que é observada para os candidatos selecionados reflita a real atividade esperada em maior proporção de uma população de pacientes. Jazwinska, A Trends Guide to Genetic Variation and Genomic Medicine S30-S36 (Mar. 2002).
[00280]Adicionalmente, a seleção de candidatos terapêuticos contra todas as variantes conhecidas de um alvo pode possibilitar a precoce identificação das toxicidades potenciais e reações adversas relacionadas com variantes particulares. Por exemplo, a variabilidade na absorção da droga, distribuição, metabolismo e excreção (ADME) causados, por exemplo, por SNPs em alvos terapêuticos ou genes que metabolizam a droga, podem ser identificados, e esta informação pode ser utilizada durante o processo de desenvolvimento droga para minimizar a variabilidade na disposição da droga e desenvolver agentes terapêuticos que sejam mais seguros através de uma faixa mais ampla de uma população de pacientes. Os SNPs da presente invenção, incluindo as proteínas variantes e as moléculas de ácido nucléico polimórficas codificadas fornecidas nas Tabelas 1 e 2, são úteis na conjunção com uma variedade de métodos toxicológicos estabelecidos na técnica, tais como os enunciados em Current Protocols in Toxicology, John Wiley & Sons, Inc., N. Y.
[00281]Além disso, os agentes terapêuticos de quaisquer proteínas conhecidas no estudo (ou moléculas de ácido nucléico, ou RNA ou DNA) podem reagir de forma cruzada com as proteínas variantes (ou moléculas polimórficas de ácido nu- cléico) descritas na Tabela 1, desse modo significantemente afetando as propriedadesfarmacocinéticas da droga. Consequentemente, as variações de proteína e as moléculas de ácido nucléico que contêm SNP nas Tabelas 1 e 2 são úteis no desenvolvimento,seleção, e avaliação dos agentes terapêuticos que visam corresponder as formas de proteína conhecidas na arte (ou moléculas de ácido nucléico). Adicionalmente, como discutido acima, o conhecimento de todas as formas polimórficas de uma droga particular visa capacitar a criação de agentes terapêuticos que são eficazes contra a maioria ou todas as tais formas polimórficas do alvo da droga.
Composições Farmacêuticas e Administração das Mesmas
[00282] Qualquer uma dentre CHD, aneurisma/dissecção e/ou proteínas associadas com reposta a estatina, codificação de moléculas de ácido nucléico, descritas aqui podem ser usadas como alvos terapêuticos (ou diretamente usadas elas mesmas como compostos terapêuticos) para o tratamento ou prevenção de CHD, aneurisma/dissecção, ou patologias relacionadas, e a presente descrição possibilita que compostos terapêuticos (por exemplo, pequenas moléculas, anticorpos, proteínas terapêuticas, RNAi e moléculas antisense , etc.) sejam desenvolvidos para apontarem como alvo (ou são compreendidos de) qualquer um destes alvos.
[00283]Em geral, um composto terapêutico será administrado em uma quantidade terapeuticamente eficaz por qualquer um dos modos de administração aceitos por agentes que servem utilidades similares. A quantidade real do composto terapêutico desta invenção, isto é, o ingrediente ativo, dependerá de númerosos fatores, tais como a severidade da doença a ser tratada, a idade e a relativa saúde do sujeito, a potência do composto usado a rota e forma de administração e outros fatores.
[00284] As quantidades terapeuticamente eficazes dos compostos terapêuticos podem variar de aproximadamente 0,01 mg por quilograma do peso do corpo do receptor por dia, preferencialmente aproximadamente 0,1 - 20 mg / kg / dia. Desse modo, como um exemplo, para administração à uma pessoa com 70 kg, a faixa de dosagem seria mais preferencialmente aproximadamente 7 mg a 1,4g por dia.
[00285]No geral, os compostos terapêuticos serão administrados como composições farmacêuticas por qualquer uma das seguintes rotas: administração oral, sistêmica (por exemplo, transdérmica, intranasal ou por supositório), ou parenteral (por exemplo, intramuscular, intravenosa, ou subcutânea). A maneira preferida de administração é a oral ou parenteral usando um conveniente regime de dosagem diária que pode ser ajustado de acordo com o grau de aflição. As composições orais podem tomar a forma de tabletes, pílulas, cápsulas semissólidas, pós, formulações de liberação sustentadas, soluções, suspensões, elixires, aerossóis, ou quaisquer outras composições apropriadas.
[00286]A escolha da formulação depende de vários fatores, tais como o modo de administração da droga (por exemplo, para administração oral na forma de comprimido, pílulas, ou cápsulas são preferidas) e a biodisponibilidade da substância da droga. Recentemente, as formulações têm sido desenvolvidas especialmente para drogas que mostram pobre biodisponibilidade com base no princípio de que a biodisponibilidade pode ser aumentada pelo aumento da área superficial, isto é, diminuindo o tamanho da partícula. Por exemplo, a Patente U.S. No. 4,107,288 descreve uma formulação farmacêutica que tem partículas de tamanho que varia de 10 a 1.000 mm no qual o material ativo é suportado em uma matriz reticulada de ma- cromoléculas. A Patente U.S No. 5,145,684 descreve a produção de uma formulação farmacêutica na qual a substância da droga é pulverizada em nanopartículas (tamanho médio de partícula de 400 nm) na presença de um modificador de superfície e, então, disperso em um meio líquido para dar uma formulação farmacêutica que exibe notavelmente alta biodisponibilidade.
[00287] As composições farmacêuticas são compreendidas de, em geral, um composto terapêutico em combinação com pelo menos um excipiente farmaçeuti- camente aceitável. Os excipientes aceitáveis são não tóxicos, auxiliam administração, e não afetam adversamente o benefício terapêutico do composto terapêutico. Tais excipientes podem ser qualquer sólido, líquido, semissólido ou, no caso de uma composição aerossol, excipiente gasoso que está geralmente disponível para aquele com habilidade na técnica.
[00288] Os excipientes sólidos farmacêuticos incluem o amido, celulose, talco, glicose, lactose, sucrose, gelatina, malte, arroz, farinha, giz, sílica gel, estearato de magnésio, estearato de sódio, monoestearato de glicerol, cloreto de sódio, leite em pó desnatado e similar. Os excipientes líquidos e semissólidos podem ser selecionados do glicerol, propileno glicol, água, etanol e vários óleos, incluindo aqueles de origem de petróleo, vegetal, animal, ou sintética, por exemplo, óleo de amendoim, óleo de soja, óleo mineral, óleo de gergelim, etc. Os carreadores líquidos preferidos particularmente para soluções injetáveis incluem a água, sal, dextrose aquosa e gli- cóis.
[00289]Os gases comprimidos podem ser usados para dispersar em um composto desta invenção em forma de aerossol. Os gases inertes adequados para este propósito são o nitrogênio, dióxido de carbono, etc.
[00290]Outros excipientes farmacêuticos adequados e suas formulações são descritos em in Remington's Pharmaceutical Sciences 18th ed., E.W. Martin, ed., Mack Publishing Company (1990).
[00291]A quantidade do composto terapêutico em uma formulação pode variar dentro da faixa completa empregada por aqueles com habilidade na técnica. Ti- picamente, a formulação irá conter, em uma base percentual de peso (%p), de aproximadamente 0,01 - 99,99 %p do composto terapêutico com base na formulação total, com o balanço sendo um ou mais excipientes farmacêuticos adequados. Preferencialmente o composto está presente em um nível de aproximadamente 1 - 80% p.
[00292]Os compostos terapêuticos podem ser administrados individualmente ou em combinação com outros compostos terapêuticos ou em combinação com um ou mais outros ingrediente(s) ativo(s). Por exemplo, um inibidor ou estimulador de uma proteína associada a aneurisma/dissecção ou CHD pode ser administrado em combinação com outro agente que inibe ou estimula a atividade do mesmo ou um diferente CHD ou proteína associada com aneurisma dissecção para desse modo, neutralizar os efeitos do CHD ou aneurisma /dissecção. Para mais informação com respeito farmacologia, vide Current Protocols in Pharmacologic ,John WIley & Sons , Inc.,.N.Y.
Aplicações de Identificação humana
[00293]Em adição aos seus usos diagnósticos, terapêuticos e preventivos em CHD, aneurisma/dissecção, e patologias relacionados, assim como na predição da resposta ao tratamento com a droga, particularmente o tratamento com estatina , os SNPs fornecidos pela presente invenção são também úteis como marcadores de identificação humana para tais aplicação como forense, teste de paternidade e bio- metria. Vide, por exemplo, Gill, "An assessment of the utility of single nucleotide polymorphisms (SNPs) for forensic purposes," Int J Legal Med 114(4-5):204-10 (2001). As variações genéticas nas sequências de ácido nucléico entre indivíduos podem ser usadas como marcadores genéticos para identificar indivíduos e para associar uma amostra biológica com um indivíduo. A determinação da qual os nucleotídeos ocupam um conjunto de posições SNP em um indivíduo identifica um conjunto de marcadores de SNP que distingue o indivíduo. Quando mais as posições SNP são analisadas, mais baixa é a probabilidade de que o conjunto de SNPs em um indivíduo seja o mesmo do que em um indivíduo não relacionado. Preferencialmente, se os locais múltiplos são analisados, os locais não são legados (isto é, herdado independentemente). Desta maneira, os conjuntos preferidos de SNPs pode ser selecionado entre os SNPs descritos aqui os quais podem incluir os SNPs em diferentes grupos de cromossomos e/ou os SNPs que estão dispersos sobre as distancias substâncias ao longo do mesmo grupo de cromossomos.
[00294]Além disso, entre os SNPs descritos aqui, os SNPs preferidos para uso em certas aplicações de identificação forense/humana incluem os SNPs localizados em posições de códons (isto é, a terceira posição em certos códons que pode ser um ou dois ou mais nucleotídeos dos alternativos e ainda codificar o mesmo aminoácido), já que estes SNPs não afetem a proteína codificada. Os SNPs que não afetam a proteína codificada são esperados estar sob uma pressão menos seletiva e são, portanto, esperados ser mais polimórficos em uma população, que é tipicamente uma vantagem para as aplicações de identificação forense /humana, tal como a predição de características fenotípicas (por exemplo, inferindo a linhagem (‘ancestry”) ou inferindo uma ou mais características físicas de um indivíduo) de uma amostra de DNA, pode ser desejável para utilizar os SNPs que afetam a proteína codificada;
[00295]Para muitos dos SNPs descritos nas Tabelas 1 e 2 (que estão identificadas como origem de SNP “applera”. As tabelas 1 e 2 fornecem as frequências de alelo de SNP obtida pelo resequenciamento do DNA de cromossomos de 39 indivíduos (Tabelas 1 e 2 também fornecem uma informação de frequência de alelo para “ SNPs que originam “celera” e , quando disponível, os SNPs públicos de dbEST, HG BASE, e ou HGMD . As frequências de alelo fornecidas nas Tabelas 1 e 2 possibilitam que estes SNPs sejam prontamente usados para aplicações de identificação humana. Embora qualquer SNP descrito na Tabela 1 e/ou Tabela 2 seja usado para identificação humana, quanto mais próxima 50% está a frequência do alelo menor em um local de SNP particular, maior a habilidade desse SNP para discriminar entre os diferentes indivíduos em uma população desde que isto se torne crescentemente provável que dois indivíduos selecionados aleatoriamente poderiam ter diferentes alelos nesse local SNP. Usando as frequências de alelo de SNP fornecidas nas Tabelas 1 e 2, uma pessoa com habilidade ordinária na técnica da habilidades comuns na arte poderia facilmente selecionar um subconjunto de SNPs para o qual a frequência do alelo menor é, por exemplo, pelo menos 1%, 2%, 5%, 10%, 20%, 25%, 30%, 40%, 45% ou 50%, de qualquer outra frequência entre estes valores. Desse modo, já que as Tabelas 1 e 2 fornecem as frequências do alelo baseadas no rese- quenciamento de cromossomos de 39 indivíduos, um subconjunto de SNPs poderia facilmente ser selecionado para identificação humana, no qual a contagem total de alelos do menor alelo em um local de SNP particular é, por exemplo, pelo menos 1, 2, 4, 8, 10, 16, 20, 24, 30, 32, 36, 38, 39, 40, ou qualquer outro número entre esses valores.
[00296]Além disso, as Tabelas 1 e 2 também fornecem informação do grupo de população ( intercambiavelmente referida aqui como grupos éticos ou raciais) acoplada com a informação de frequência do alelo extensiva, por exemplo, o grupo de 39 indivíduos cujos DNAs foram resequenciados, foi feito de 20 caucasianos e 19 afro americanos. Esta informação do grupo de população possibilita mais refinamento da seleção de SNP para identificação humana, por exemplo, os SNPs preferidos para identificação humana podem ser selecionados das Tabelas 1 e 2 que têm frequências de alelo similar em ambas as populações caucasiana e afro americana; desse modo, por exemplo, os SNPs podem ser selecionados para que tenham poder discriminatório elevado igualmente em ambas as populações. Alternativamente, os SNPs podem ser selecionados para que haja uma diferença estatisticamente signifi- cante nas frequências de alelos entre as populações caucasianas e afro americanas (como exemplo extremo, um alelo particular pode ser observado somente no grupo afro americano ou caucasiano, mas não é observado em outro grupo de população); tais SNPs são úteis, por exemplo, para predição da raça / etnia de um agressor desconhecido a partir de uma mostra biológica, tal como um cabelo ou mancha sanguínea recuperada em uma cena de crime. Para discussão do uso de SNPs para prever a descendência de uma amostra de DNA, incluindo métodos estatísticos, vide Fru- dakis et al., "A Classifier for the SNP-Based Inference of Ancestry," Journal of Forensic Sciences 48(4):771-782 (2003).
[00297]Os SNPs têm numerosas vantagens sobre outros tipos de marcado-respolimórficos, tais como as repetições curtas também (STRs ), por exemplo, os SNPs podem ser facilmente marcados e são responsáveis pela automação fazendo dos SNPs os marcadores de escolha para bases de dados forenses. Os SNPs são encontrados em abundância muito maior por todo o genoma do que polimorfismos repetidos. As frequências de população de duas formas polimórficos podem usualmente ser determinadas com maior precisão do que aquelas de múltiplas formas polimórficas em locais multi-alélicos. Os SNPs são mutantemente mais estáveis do que polimorfismos repetidos. Os SNPS não suscetíveis a artefatos, tais como bandas de “sombra” que podem esconder a análise. As bandas de “sombra” são frequentemente encontradas ao analisar repetidos polimorfismos e são particularmente problemáticas ao analisar as amostras tais como as amostras da cena do crime que podem conter misturas de DNA de múltiplas fontes. Outra vantagem significante dos marcadores de SNP sobre os marcadores de STR é a necessidade de ácido nucléi- co muito mais curto para marcar um SNP. Por exemplo, os marcadores de STR são geralmente várias centenas de pares de base de comprimento de um SNP, por outro lado, compreendem um único nucleotídeo, e geralmente uma região conservada curta no outro lado da posição SNP para ligação prime e ou sonda. Isto faz os SNPs mais amenos para triplicar em amostras biológicas altamente degradadas ou enve- lhecidas que são frequentemente encontradas em casos forenses no quais o DNA pode ser fragmentado em pequenos pedaços.
[00298]Os SNPs também não estão sujeitos a microvariante e alelos “off- lader” frequentemente encontrados ao analisar o loci do STR. As microvariantes são deleções ou inserções dentro de uma unidade repetida que muda o tamanho do produto de DNA amplificado, de modo que o produto amplificado não migre na mesma taxa que os alelos de referência com unidades repetidas de tamanho normal. Quando separadas por tamanho, tal como por eletroforese em um gel de polia- crilamida, as microvariantes não se alinham com uma escada alélica de referência ou unidades repetidas de tamanho padrão, mas preferencialmente, migram entre os alelos de referência. A escada alélica de referência é usada para precisar o dimensi-onamento de alelos para classificação de alelo; Portanto, os alelos que não se alinham com a escada alélica de referência levam a problemas de análise substancial. Além disso, quando analisando polimorfismos repetidos multi-alélicos, ocasionalmente um alelo é encontrado, que consiste de mais ou menos unidades de repetição que foram vistas anteriormente na população, ou mais ou menos alelos de repetição que são incluídos em uma escada alélica. Estes alelos migrarão para fora da faixa de tamanho de alelos conhecidos em uma escada alélica e, portanto, são referidos como alelos fora da escada (“off-ladder”). Em casos extremos, o alelo pode conter poucas ou muitas repetições tal que o mesmo migra bem para fora da faixa da escada alélica de referência. Nesta situação, o alelo pode mesmo não ser observado, ou, com análise multiplex, o mesmo pode migrar dentro ou próximo da faixa de tamanho para outro local, além de confundir a análise.
[00299]A análise de SNP evita os problemas de microvariantes e alelos off ladder encontrados na análise de STR. Notadamente, as microvariantes e os alelos “off-ladder” podem fornecer problemas significantes e podem ser completamente perdidos, ao usar métodos de análise, tais como, arranjos de hibridização de oligo- nucleotídeos, que utiliza sondas de oligonucleotídeos especificas para certo alelos conhecidos. Além disso, os alelos “off-ladder” e as microvariantes encontradas na análise de STR, até mesmo quando tipificados corretamente, pode levar à análise estatística imprópria, já que suas frequências na população são geralmente desco-nhecidas ou pobremente caracterizadas e, portanto, a significância estatística de uma genótipo de combinação pode ser questionável. Todas estas vantagens da análise de SNP são consideráveis a luz das consequências da maioria dos casos de identificação de DNA, que podem levar ao aprisionamento da vida de um indivíduo, ou reassociação de restos para a família de um indivíduo falecido.
[00300]O DNA pode ser isolado de amostras biológicas, tais como sangue, osso, cabelo, saliva ou sêmen e a comparação com o DNA de uma fonte de referência em posições SNP particulares. Os marcadores SNP múltiplos podem ser ensaiados simultaneamente para aumentar o poder de discriminação e a significância estatística de um genótipo de correspondência. Por exemplo, as arranjos de oligonucleo- tídeos podem ser usados para genotipar um grande número de SNPs simultaneamente. Os SNPs fornecidos pela presente invenção podem ser testados em combinação com outros marcadores genéticos polifórmicos , tais como outros SNPs conhecidos na técnica ou STRs, para identificar um individuo ou associar um indivíduo com uma amostra biológica particular.
[00301] Além disso, os SNPs fornecidos pelo presente invenção podem ser genotipados para inclusão em um banco de dados de genótipos de DNA, por exemplo, um banco de dados de DNA criminal, tal como o Sistemade Index de DNA combinado do FBI ( CODIS). Um genótipo obtido de uma amostra biológica de origem desconhecida pode ser então ser questionada contra o banco de dados para encontrar um genótipo de combinação, com os SNPs da presente invenção fornecendo posições de nucleotídeos nas quais se podem comparar as sequências de DNA co-nhecidas e desconhecidas para identidade. Consequentemente, a presente inven- ção fornece o banco de dados que compreende os novos SNPs ou alelos de SNP da presente invenção (por exemplo, o banco de dados pode compreender informação indicado quais alelos são possuídos de membros individuais de uma população em um ou mais locais de SNP novos da presente invenção), tais como para uso em forense,biométrica ou outras aplicações de identificação humanas. Tal banco de dados tipicamente compreende um sistema com base em computador no qual os SNPs ou alelos de SNP da presente invenção são registrados em meio em um meio legível por computador.
[00302]Os SNPs da presente invenção podem ser também testados para uso em teste de paternidade. O objetivo do teste de paternidade é usualmente determinar se o macho é o pai de uma criança. Na maioria dos casos, a mãe da criança é conhecida e, desse modo, a contribuição da mãe para o genótipo da criança pode ser traçado. O teste de paternidade investiga se a parte do genótipo da criança não atribuído à da mãe é consistente com o suposto pai. O teste de paternidade pode ser realizado pela análise de conjuntos de polimórficos no suposto pai e na criança, com os SNPs da presente invenção fornecendo as posições dos nucleotídeos nas quais pode-se comparar as sequências de DNA do suposto pai e da criança para identidade. Se o conjunto de polimorfismos da criança atribuído ao pai não combina com o conjunto de polimorfismos do suposto pai, pode-se concluir, exceto o erro experimental, que o suposto pai não é o da criança. Se o conjunto de polimorfismos na criança atribuído ao do pai corresponde ao conjunto de polimorfismos do suposto pai, um cálculo estatístico pode ser realizado para determinar a probabilidade de combinação coincidente, e uma conclusão traçada para a verossimilhança de que o suposto pai seja o verdadeiro pai biológico da criança.
[00303]Em adição ao teste de paternidade os SNPs são úteis também para outros tipos de teste de consanguinidade, tais como para verificar as relações familiares para fins de imigração, ou para casos nos quais os alelos individuais são relaci- onados a indivíduo falecido para reclamar uma herança do indivíduo falecido etc. Para mais informação com respeito a utilidade dos SNPs para teste de paternidade e outros tipos de teste de consanguinidade incluindo métodos de análise estatística vide Krawczak, "Informativity assessment for biallelic single nucleotide polymorphisms," Electrophoresis 20(S): 1676-81 (Jun. 1999).
[00304] O uso de SNPs da presente invenção para identificação humana ainda se estende a vários sistemas de autenticação, comumente referidos como sistemasbiométricos que tipicamente convertem características físicas de humanos (ou outros organismos) em informação digital. Os sistemas biométricos incluem vários dispositivos tecnológicos que medem tais características únicas anatômicas ou fisiológicas como o dedo, polegar ou impressões da palma; geometria da mão padronização da veia na parte de traz da mão; padronização do vaso sanguíneo da retina e cor e textura da Iris; características faciais; padrões de voz; dinâmica de assinatura e tipagem de DNA. Tais medições fisiológicas podem ser usadas para verificar a identidade e, por exemplo, restringir ou permitir a avaliação com base na identificação. Exemplos de aplicações para biométrica incluem segurança da área física, segurança da rede e de computação, embarque e check-in de passageiros de aeronaves, transações financeiras, avaliações a arquivos médicos, distribuição de benefícios governamentais, votação, execução da lei, passaportes, vistos e imigração, prisões, várias aplicações militares e para avaliação restrito a artigos caros ou perigosos, tais como automóveis ou armas. Vide, por exemplo, O'Connor, Stanford Technology Law Review, and U.S. Patent No. 6,119,096.
[00305] Os grupos de SNPs, particularmente os SNPs fornecidos pela presente invenção, podem ser tipificados para unicamente identificar um indivíduo para aplicações biométricas, tais como, essas descritas acima. Tal tippificação de SNP pode prontamente ser realizada usando, por exemplo, chips/arranjos de DNA. Preferencialmente, um meio minimamente invasivo para obter uma mostra de DNA, é uti- lizado. Por exemplo, a amplificação do PCR, possibilita quantidades suficientes de DNA, para análise a ser obtida esfregaços bucais ou impressões digitais, que contemcélulas de pele que contem DNA e óleos que são naturalmente transferidos durante o contato.
[00306]Mais informações com relação às técnicas para uso de SNPs em aplicação de identificação forense / humana podem ser encontradas, por exemplo, em Current Protocols in Human Genetics 14.1-14.7, John Wiley & Sons, N.Y. (2002).
PROTEÍNAS VARIANTES, ANTICORPOS, VETORES, CÉLULAS HOSPEDEIRAS & USOS DOS MESMOS Proteínas Variantes Codificadas por Moléculas de Ácido Nucléico que Contém SNP
[00307]A presente invenção fornece moléculas de ácidos nucléicos que contêm SNP, muitas das quais codificam proteínas que têm sequências de aminoácidos conforme comparadas com proteínas do estado da técnica (por exemplo, tipo selvagem). As sequências de aminoácidos codificadas pelas moléculas de ácido nucléico polimórficas da presente invenção são referidas como SEQ ID NO: 2 na Tabela 1 e fornecidas na Listagem de sequências. Estas variantes serão geralmente referidas aqui como polipeptídeos/peptídeos/proteínas variantes, ou polipeptí- deos/peptídeos/proteínas polimórficos da presente invenção. Os termos “proteína”, “peptídeo” e “polipeptídeo” são usados aqui intercambiavelmente.
[00308]Uma proteína variante da presente invenção pode ser codificada por, por exemplo, uma substituição de nucleotídeo não sinônimo em qualquer uma das posições cSNP descritas aqui. Além disso, as proteínas variantes podem também incluir proteínas cuja expressão, estrutura e/ou função é alterada por um SNP descrito aqui, tal como um SNP que cria ou destrói um códon de parada, um SNP que afeta o entrelaçamento, e um SNP em elementos de controle/regulação, por exemplo, promotores, intensificadores ou fator de transcrição que ligam domínios.
[00309]Como usado aqui, uma proteína ou peptídeo é dota ser “isolada” ou “purificada” quando a mesma está substancialmente livre de material celular ou precursoresquímicos ou outras substâncias químicas. As proteínas variantes da presente invenção podem ser purificadas para homogeneidade ou outros graus inferiores de pureza. O nível de purificação será baseado no uso pretendido. A característica principal é que a preparação permite o funcionamento desejado da proteína variante, mesmo se na presença de quantidades consideráveis de outros componentes.
[00310]Como usado aqui, “substancialmente livre de material celular” inclui preparações de proteína variante que têm menos que 30% (em peso seco) de outras proteínas (isto é, proteína de contaminação), menos que 20% de outras proteínas, menos que 10% de outras proteínas, ou menos que 5% de outras proteínas. Quando a proteína variante é produzida de forma recombinante, a mesma pode também estar livre de meio de cultura, isto é, o meio de cultura representa menos que 20% do volume da preparação de proteína.
[00311]A expressão “substancialmente livre de precursores químicos ou ou-trassubstâncias químicas” inclui preparações de proteína variante na qual a mesma é separada dos precursores químicos ou de outras substâncias químicas que estão envolvidas nesta síntese. Em uma modalidade, a expressão “substancialmente livre de precursores químicos ou outras substâncias químicas” inclui preparações de proteína variante que tem menos que 30% (em peso seco) de precursores químicos ou outras substâncias químicas, menos que 20% de precursores químicos ou outras substâncias químicas, menos que 10% de precursores químicos ou outras substânciasquímicas, ou menos que 5% de precursores químicos ou outras substâncias químicas.
[00312]Uma proteína variante isolada pode ser purificada a partir de células que a expressam naturalmente, purificadas a partir de células que foram alteradas para expressá-la (células hospedeiras recombinantes), ou sintetizadas usando métodos de síntese de proteínas conhecidos. Por exemplo, uma molécula de ácido nu- cléico que contém SNP(s) que codificam a proteína variante pode ser clonada em um vetor de expressão, o vetor de expressão introduzido em uma célula hospedeira, e a proteína variante expressa em uma célula hospedeira. A proteína variante pode então ser isolada a partir das células por qualquer esquema de purificação apropria-do usando técnicas de purificação de proteína padrões. Exemplos destas técnicas são descritos em detalhe abaixo. Sambrook e Russell, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, N. Y. (2000).
[00313]A presente invenção fornece proteínas variantes que compreendem, consistem de ou consistem essencialmente de sequências de aminoácidos que contém um ou mais aminoácidos variantes codificados por um ou mais códons que contém um SNP da presente invenção.
[00314]Consequentemente, a presente invenção fornece proteínas variantes que consistem de sequências de aminoácidos que contém um ou mais polimorfismos de aminoácidos (ou truncamentos ou extensões devido à criação ou destruição de um códon de parada, respectivamente) codificados pelos SNPs fornecidos na Tabela 1 e/ou Tabela 2. Uma proteína consiste de uma sequência de aminoácido quando a sequência de aminoácidos é a sequência de aminoácido inteira da proteína.
[00315]A presente invenção fornece adicionalmente proteínas variantes que consistem essencialmente de sequências de aminoácidos que contem um ou mais polimorfismos de aminoácidos (ou truncamentos ou extensões devido à criação ou destruição de um códon de parada, respectivamente) codificados pelos SNPs fornecidos na Tabela 1 e/ou Tabela 2. Uma proteína consiste de uma sequência de ami- noácido quando tal sequência de aminoácidos está presente com apenas poucos resíduos de aminoácido no final da proteína.
[00316]A presente invenção adicionalmente fornece adicionalmente proteínas variantes que compreendem sequências de aminoácidos que contêm um ou mais polimorfismos de aminoácidos (ou truncamentos ou extensões devido à criação ou destruição de um códon de parada, respectivamente) codificados pelos SNPs fornecidos na Tabela 1 e/ou Tabela 2. Uma proteína compreende uma sequência de aminoácido quando a sequência de aminoácidos é pelo menos parte da sequência de aminoácido final da proteína. Em tal modelo, a proteína pode conter apenas a sequência de aminoácidos variante ou possuir resíduos de aminoácidos adicionais, tais como uma sequência de aminoácidos contígua que está naturalmente associada aos mesmos ou resíduos de aminoácidos heterólogos. Tal proteína pode ter poucos resíduos de aminoácidos adicionais ou pode compreender muito mais aminoácidos adicionais. Uma breve descrição de como vários tipos destas proteínas podem ser preparadas e isoladas é fornecida abaixo.
[00317]As proteínas variantes da presente invenção podem ser presas a sequências heterólogas para formar proteínas de fusão ou quiméricas. Tais proteínas de fusão ou quiméricas compreendem um proteína variante operativamente ligada a uma proteína heteróloga que tem uma sequência de aminoácidos não substancialmentehomóloga a proteína variante. “Ligada operativamente” indica que as sequências de codificação para a proteína variante e a proteína heteróloga são ligadas “inframe” (proteínas internas - inteínas). A proteína heteróloga pode ser fundida ao N- terminal e C-terminal da proteína variante. Em uma outra modalidade a proteína de fusão é codificada por um polinucleotídeo de fusão que é sintetizado por técnicas convencionais que incluem sintetizadores de DNA automatizados. Alternativamente, a amplificação de PCR de fragmentos de gene pode ser realizada usando primers âncora que originam saliências complementares entre dois fragmentos de genes consecutivos que podem subsequentemente ser recozidos e re-amplificados para gerar uma sequência de gene quimérica. Vide Ausubel et al., Current Protocols in Molecular Biology (1992). Além disso, muitos vetores de expressão que já codificam um grupamento de fusão estão comercialmente disponíveis (por exemplo, proteína GST). Um ácido nucléico que codifica proteína variante pode ser clonado em tal vetor de expressão tal que o grupamento de fusão seja ligado “in-frame” à proteína variante.
[00318]Em muitos usos, a proteína de fusão não afeta a atividade da proteína variante. A proteína de fusão pode incluir, mas está limitada a, proteínas de fusão enzimática, por exemplo, fusões de beta-galactosidase, fusões de GAL yeast two- hybrid, fusões poli-His, MYC-tagged, Hi-tagged e fusões Ig. Tais proteínas de fusão, particularmente as de fusão poli-His, podem facilitar suas purificações seguidas de expressão recombinante. Em certas células hospedeiras (por exemplo, células hospedeiras de mamíferos), a expressão e/ou secreção de uma proteína pode ser aumentada pelo uso de uma sequência de sinal heterólogo. As proteínas de fusão são adicionalmente descritas em, por exemplo, Terpe, "Overview of tag protein fusions: from molecular and biochemical fundamentals to commercial systems, "Appl Microbiol Biotechnol 60(5):523-33 (Jan. 2003); Epub Nov. 07, 2002; Graddis et al., "Designing proteins that work using recombinant technologies" Curr Pharm Biotechnol 3(4):285-97 (Dez. 2002); e Nilsson et al., "Affinity fusion strategies for detection, purification, and immobilization of recombinant proteins,"Protein Expr Purif 11 (1): 1-16 (Outubro 1997).
[00319]A presente invenção também diz respeito a variantes óbvios adicionais de polipeptídeos variantes da presente invenção, tais como formas maduras de ocorrência natural (por exemplo, variantes alélicos), variantes derivados de forma recombinante de ocorrência não natural, e ortólogos e parálogos de tais proteínas que compartilham homologia se sequência. Tais variantes podem rapidamente ser gerados usando técnicas conhecidas na arte no campo de tecnologia de ácido nu- cléico recombinante e bioquímica da proteína. É entendido que, entretanto, os vari- antes excluem aqueles conhecidos no estado da técnica da presente invenção.
[00320]Variantes adicionais de polipeptídeos variantes descritos na Tabela 1 podem compreender uma sequência de aminoácido que compartilha pelo menos 7080%, 80-85%, 85-90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99% de identidade de sequência com uma sequência de aminoácido descrita na Tabela 1 (ou um fragmento da mesma) e que inclui um novo resíduo de aminoácido (alelo) descrito na Tabela 1 (que é codificado por um alelo de SNP novo). Desse modo, um aspecto da presente invenção que é especialmente contemplado são polipeptídeos que têm certo grau de variação de sequência comparado com as sequências de po- lipeptídeos mostradas na Tabela 1, mas que contém um resíduo de aminoácido novo (alelo) codificado por um alelo de SNP novo descrito aqui. Em outras palavras, contanto que um polipeptídeo contenha um novo resíduo de aminoácido descrito aqui, outras porções de polipeptídeo que flanqueiam o novo resíduo de aminoácido podem variar de alguns graus das sequências de polipeptídeos mostradas na Tabela 1.
[00321]Formas pré-processadas de comprimento completo, bem como formas processadas maduras, de proteínas que compreendem uma das sequências de aminoácidos descritas aqui podem facilmente ser identificadas como tendo identidade de sequência completa para uma das proteínas variantes da presente invenção bem como sendo codificadas pelo mesmo lócus genético que as proteínas variantes fornecida aqui.
[00322]Os ortólogos de um peptídeo variante podem facilmente ser identificados como tendo algum grau de identidade/homologia de sequência significante para pelo menos uma porção de um peptídeo variante, bem como ser codificado por um gene de um outro organismos. Os ortólogos preferidos serão isolados a partir de mamíferos não humanos, preferencialmente primatas, para o desenvolvimento de agentes e alvos terapêuticos humanos. Tais ortólogos podem ser codificados por uma sequência de ácido nucléico que se hibridiza a uma molécula de ácido nucléico que codifica um peptídeo variante sob condições moderadas a rigorosas, dependendo do grau de parentesco de dois organismos que geram as proteínas homólogas.
[00323]Proteínas variantes incluem, mas não estão limitadas a, deleções que contém proteínas, adições e substituições na sequência de aminoácido causadas pelos SNPs da presente invenção. Uma classe de substituições são substituições de aminoácidos conservados, nas quais um dado aminoácido em um polipeptí- deo é substituído por um outro aminoácido de características semelhantes. Substituições típicas conservadoras são reposições, um por outro, entre os aminoácidos alifáticos Ala, VaI, Leu, e He; intercâmbio de resíduos de hidroxila Ser e Thr; troca de resíduos acídicos Asp e Glu; substituição entre os resíduos de amida Asn e Gln; troca de resíduos básicos de Lys e Arg; e reposições entre os resíduos aromáticos Phe e Tyr. Orientações com relação a que mudança de aminoácidos é provável ser fenotipicamente silenciosa são encontradas, por exemplo, em Bowie et al., Science 247:1306-1310 (1990).
[00324]Proteínas variantes podem ser completamente funcionais ou podem não apresentar funções em uma ou mais atividades, por exemplo, habilidade para se ligar a outra molécula, habilidade para catalisar um substrato, habilidade para mediar sinalização, etc. Variantes completamente funcionais contêm apenas variações conservadoras ou variações em resíduos não críticos ou regiões não críticas. Variantes funcionais também podem conter substituição de aminoácidos similares que não resultam em mudança ou uma mudança insignificante na função. Alternativamente, tais substituições podem afetar a função positivamente ou negativamente em alguns graus. Variantes não funcionais tipicamente contêm uma ou mais substituições de aminoácidos não conservadores, deleções inserções, inversões, truncamentos ou extensões, ou uma substituição, inserção, inversão, ou deleção de um resíduo crítico em uma região crítica.
[00325]Os aminoácidos que são essenciais para função de uma proteína podem ser identificados por métodos conhecidos na técnica, tais como, mutagênese sítio-dirigida ou mutagênese de alanina com escaneamento, particularmente usando a sequência de aminoácido e informação de polimorfismo fornecida na Tabela 1. Cunningham et al., Science 244: 1081-1085 (1989). O último procedimento introduz mutações únicas de alanina em cada resíduo na molécula. As moléculas mutantes resultantes são então testadas para atividade biológica, tal como atividade enzimáti- ca ou em ensaios, tais como, uma atividade proliferativa in vitro. Locais que são críticos para padrão de ligação/substrato de ligação podem também ser determinados por análise estrutural, tal como, cristalização, ressonância magnética nuclear ou marcação por fotoafinidade. Smith et al., J MoI Biol 224:899-904 (1992); de Vos et al., Science 255:306-312 (1992).
[00326]Os polipeptídeos podem conter aminoácidos diferentes dos 20 ami- noácidos comumente referidos como os 20 aminoácidos de ocorrência natural. Adicionalmente, muitos aminoácidos, incluindo os aminoácidos terminais, podem ser modificados por processos naturais, tais como, processamento e outras modificações pós-translacionais, ou por técnicas de modificação química bem conhecidas na arte. Consequentemente, as proteínas variantes da presente invenção também abrangem derivados ou análogos nos quais um resíduo de aminoácido substituído não é um codificado pelo código genético, no qual um grupo substituinte é incluído, no qual o polipeptídeo maduro é fundido com um outro composto, tal como um composto para aumentar a vida média do polipeptídeo (por exemplo, polietileno glicol), ou no qual aminoácidos adicionais são fundidos ao polipeptídeo maduro, tal como uma sequência líder ou secretória, ou uma sequência para purificação de polipeptí- deo maduro ou uma sequência de pró-proteína.
[00327]Modificações de proteína conhecidas incluem, mas não estão limitadas a, acetilação, acilação, ADP-ribosilação, amidação, fixação covalente de flavina, fixação covalente de um grupamento hemo, fixação covalente de um nucleotídeo ou derivado de nucleotídeo, fixação covalente de um lipídeo ou derivado der lipídeo, fixação covalente de fosfotidilinositol, reticulação, ciclização, formação de ponte dis- sulfeto, dimetilação, formação de reticulações covalentes, formação de cistina, formação de piroglutamato, formilação, gama carboxilação, glicosilação, formação de âncora GPI, hidroxilação, iodinação, metilação, miristoilação, oxidação, processo proteolítico, fosforilação, prenilação, racemização, selenoilação, sulfação, adição de aminoácidos mediada por transferência de RNA para proteínas, tais como, arginila- ção, e ubiquitinação.
[00328]Tais modificações de proteínas são bem conhecidas por aqueles versados na arte e foram descritas em maior detalhe na literatura científica. Modificações particularmente comuns, por exemplo, glicosilação, fixação de lipídeo, sulfa- ção, gama-carboxilação de resíduos de ácido glutâmico, hidroxilação e ribosilação- ADP, são descritas em textos mais básicos, tais como, Proteins - Structure and Molecular Properties 2ndEd., T.E. Creighton, W.H. Freeman e Company, N. Y. (1993); F. Wold, Posttranslational Covalent Modification of Proteins 1-12, B.C. Johnson, ed., Academic Press, N. Y. (1983); Seifter et al, Meth Enzymol 182:626-646 (1990); e Rattan et al., Ann NY Acad Sci 663:48-62 (1992).
[00329]A presente invenção fornece adicionalmente fragmentos de proteínas variantes nos quais os fragmentos contêm uma ou mais variações de sequência de aminoácido (por exemplo, substituições, ou truncamentos ou extensões devido a criação ou destruição de um códon de parada) codificadas por um ou mais SNPs descritos aqui. Os fragmentos os quais a invenção pertence, entretanto, não são para ser construídos como abrangendo fragmentos que foram descritos na técnica anterior antes da presente invenção.
[00330]Como usado aqui, um fragmento pode compreender pelo menos aproximadamente 4, 8, 10, 12, 14, 16, 18, 20, 25, 30, 50, 100 (ou qualquer outro número entre esses) ou resíduos de aminoácidos mais contíguos a partir de uma proteína variante, em que pelo menos um resíduo de aminoácido é afetado por um SNP da presente invenção, por exemplo, um resíduo de aminoácido variante codificado por uma substituição de nucleotídeo não sinônima em uma posição cSNP fornecido pela presente invenção. O aminoácido variante codificado por um cSNP pode ocupar qualquer posição de resíduo ao longo da sequência do fragmento. Tais frag-mentos podem ser escolhidos com base na habilidade de reter uma ou mais das ati-vidadesbiológicas da proteína variante ou habilidade de desempenhar uma função, por exemplo, age como um imunogênico. Fragmentos particularmente importantes são fragmentos biologicamente ativos. Tais fragmentos tipicamente compreenderam um domínio ou motivo de uma proteína variante da presente invenção, por exemplo, locais ativos, domínio de transmembrana, ou domínio de ligação ligante/substrato. Outros fragmentos incluem, mas não estão limitados a, fragmentos contendo motivo ou domínio, fragmentos de peptídeos solúveis, e fragmentos que contêm estruturas imunogênicas. Os domínios preditos e locais funcionais são facilmente identificáveis por programas de computadores bem conhecidos por aqueles com habilidade na técnica (por exemplo, análise PROSITE). Current Protocols in Protein Science, John Wiley & Sons, N.Y. (2002).
Usos de Proteínas Variantes
[00331]As proteínas variantes da presente invenção podem ser usadas de uma variedade de modos incluindo, mas não limitado a, ensaios para determinar a atividade biológica de uma proteína variante, tal como, em um painel de proteínas múltiplas para seleção de alto rendimento; levantar anticorpos ou induzir um outro tipo de resposta imune; com o um reagente (incluindo o reagente marcado) em ensaios modelados para determinar quantitativamente os níveis de proteína variante (ou seu padrão de ligação) em fluidos biológicos; como um marcador para células ou tecidos nos quais este é preferencialmente expresso (ou constitutivamente ou em um estágio particular de desenvolvimento ou diferenciação de tecido ou em um estado de doença); como um alvo para selecionar um agente terapêutico, e como um agente terapêutico direto para ser administrado em um sujeito humano. Qualquer das proteínas variantes descritas aqui pode ser desenvolvida em forma de kit ou grau de reagente para comercialização como produtos de pesquisa. Métodos para desempenhar os usos listados acima são bem conhecidos por aqueles com habilidade na arte. Vide, por exemplo, Molecular Cloning: A Laboratory Manual, Sambrook and Russell, Cold Spring Harbor Laboratory Press, N.Y. (2000), e Methods in Enzymology: Guide to Molecular Cloning Techniques, S.L. Berger and A.R. Kimmel, eds., Academic Press (1987).
[00332]Em uma modalidade específica, da invenção, os métodos da presente invenção incluem a detecção de uma ou mais proteínas variantes descritas aqui. As proteínas variantes são descritas na Tabela 1 e na Listagem de Sequências como a#1-a#1. A detecção de tais proteínas pode ser executada usando, por exemplo, anticorpos, compostos de moléculas pequenas, aptâmeros, ligantes/substratos, outrasproteínas ou fragmentos, ou outros agentes que ligam proteínas. Preferencialmente, agentes de proteínas de detecção são específicos para uma proteína variante da presente invenção e podem, portanto, fazer diferenciação entre uma proteína variantes da presente invenção e a proteína tipo selvagem ou uma outra forma variante. Estes podem geralmente ser executados pela, por exemplo, seleção ou modelagem de agentes de detecção que se ligam a região de uma proteína que se difere entre a proteína variante e tipo selvagem, tal como uma região de uma proteína que contém uma ou mais substituições que é/são codificada(s) por um cSNP não sinônimo da presente invenção, ou uma região de uma proteína que segue um SNP tipo mutação nonsense que cria um códon de parada, desse modo, levando a um poli- peptídeo curto, ou uma região de uma proteína que segue um SNP tipo mutação através de leitura que destrói um códon de parada, desse modo, levando a um poli- peptídeo longo no qual uma porção do polipeptídeo está presente em uma versão de polipeptídeo mas não do outra.
[00333]Em outro aspecto específico da invenção, as proteínas variantes da presente invenção são usadas como alvos para diagnosticar CHD ou aneuris- ma/dissecção ou para determinar a predisposição a CHD ou aneurisma/dissecção em um humano, para tratar e/ou prevenir CHD ou aneurisma/dissecção, ou para predizer uma resposta do indivíduo ao tratamento com estatina (particularmente tratamento ou prevenção de CHD ou aneurisma/dissecção usando estatinas), etc. Consequentemente, a invenção proporciona métodos para detectar a presença de, ou níveis de, uma ou mais proteínas variantes da presente invenção em uma célula, tecido, ou organismo. Tais métodos tipicamente envolvem contatar uma amostra de teste com um agente (por exemplo, um anticorpo, composto de molécula pequena, ou peptídeo) capaz de interagir com a proteína variante tal que a ligação específica do agente com a proteína variante possa ser detectada. Tal ensaio pode ser fornecido em uma forma de detecção única ou em uma forma de detecção múltipla tal como um arranjo, por exemplo, um arranjo de anticorpo ou aptâmero (arranjos para detecção de proteínas também podem ser referidos como “chips de proteínas”). A proteína variante de interesse pode ser isolada a partir de uma amostra de teste e ensaiada para a presença de uma sequência de aminoácidos variante codificada por um ou mais SPNs descritos pela presente invenção. Os SNPs podem causar mudanças na proteína e a função/atividade da proteína correspondente, tal como através de substituições não sinônimas em regiões que codificam proteína que podem levar a substituições de aminoácidos, deleções, inserções, e/ou rearranjos; formação ou destruição de códons de parada; ou alteração de elementos de controle tais como, promotores. Os SNPs também podem causar modificações pós-translacionais inapropriadas.
[00334]Um agente preferido para detectar uma proteína variante em uma amostra é um anticorpo capaz de se ligar seletivamente a uma forma variante de proteína (anticorpos são descritos com maior detalhe na próxima seção). Tais amostras incluem, por exemplo, tecidos células, e fluidos biológicos isolados a partir de um sujeito, bem como tecidos células e fluidos presentes dentro de um sujeito.
[00335]Métodos in vivo para detecção de proteínas variantes associadas com CHD ou aneurisma/dissecção que são descritos aqui e fragmentos dos mesmos incluem, mas não estão limitados a, ensaios imunossorvente ligado a enzima (ELISAs), radioimunoensaios (RIA), Western blots, imunoprecipitações, imunofluores- cência, e chips/arranjos de proteínas (por exemplo, arranjo de anticorpos ou aptâme- ros). Para informações adicionais com relação a imunoensaios e métodos de detecção de proteínas relacionadas, vide Current Protocols in Immunology, John Wiley & Sons, N.Y., and Hage, "Immunoassays,"Anal Chem 15;71(12):294R-304R (Jun. 1999).
[00336]Métodos analíticos adicionais para detectar variantes de aminoácidos incluem, mas não estão limitados a, mobilidade eletroforética alterada, digestão pep- tídica tríptica alterada, atividade de proteína alterada em ensaio sem células ou à base de células, alteração em ligante ou padrão de ligação de anticorpo, ponto isoe- létrico alterado, e sequenciamento direto de aminoácidos.
[00337]Alternativamente, as proteínas variantes podem ser detectadas in vivo em um sujeito pela introdução em um sujeito de um anticorpo marcado (ou outro tipo de reagente de detecção) específico para uma proteína variante. Por exemplo, o anticorpo pode ser marcado com um marcador radioativo cuja presença e localização em um sujeito pode ser detectada por técnicas de imagens padrões.
[00338]Outros usos de peptídeos variantes da presente invenção são baseados na classe ou ação de outras proteínas. Por exemplo, proteínas isoladas de humanos e seus ortólogos de mamíferos servem como alvo para identificar agentes (por exemplo, drogas de moléculas pequenas ou anticorpos) para uso em aplicações terapêuticas, particularmente para modular uma resposta biológica ou patológica em uma célula ou tecido que expressa a proteína. Agentes farmacêuticos que modulam atividade de proteína podem ser desenvolvidos.
[00339]Como uma alternativa para modular expressão de gene, compostos terapêuticos que modulam a função de proteína podem ser desenvolvidos. Por exemplo, muitos SNPs descritos aqui afetam a sequência de aminoácidos da proteína codificada (por exemplo, cSNPs não sinônimos e SNPs tipo mutação nonsense). Tais alterações na sequência de aminoácidos codificada afetam a função da proteína, particularmente se tais variações de sequência de aminoácidos ocorrem em domínios de proteína funcional, tais como, domínios catalíticos, domínios de ligação de ATP, ou domínios de ligação ligante/substrato. É bem estabelecido na técnica que proteínas variantes que têm variações de sequências de aminoácidos em domínios funcionais podem causar ou influenciar condições patológicas. Em tais exemplos, compostos (por exemplo, drogas de moléculas pequenas ou anticorpos) que apontam como alvo (“target”) a proteína variante e modulam (por exemplo, sobre ou sub- regulação) a função/atividade de proteína podem ser desenvolvidos.
[00340]Os métodos terapêuticos da presente invenção incluem adicionalmentemétodos que apontam como alvo uma ou mais proteínas variantes da presente invenção. As proteínas variantes podem ser alvos usando, por exemplo, compostos de moléculas pequenas, anticorpos, aptâmeros, ligantes/substratos, outras proteínas ou outros agentes que se ligam a proteínas. Adicionalmente, o técnico versado reconhecerá que as novas proteínas variantes (e moléculas polimórficas de ácido nucléico) descritas na Tabela 1 podem ser diretamente usadas como agentes terapêuticos por agir como inibidores competitivos de proteínas conhecidas correspon-dentes (ou moléculas de ácido nucléico tais como moléculas de mRNA).
[00341]As proteínas variantes da presente invenção são particularmente úteis em ensaios de seleção de droga, em sistemas sem células e à base de células. Sistemas à base de células podem utilizar células que expressam naturalmente a proteína, um espécime de biópsia, ou culturas celulares. Em uma modalidade, ensaiosà base de células envolvem células hospedeiras recombinantes que expressam a proteína variante. Ensaios sem células podem ser usados para detectar a habilidade de um composto de ligar-se diretamente a uma proteína variante ou ao fragmento de ácido nucléico que contém SNP correspondente que codifica a proteína variante.
[00342]Uma proteína variante da presente invenção, bem como fragmentos apropriados das mesmas, pode ser usada em ensaios de seleção de alto rendimento para testar compostos candidatos pela habilidade de ligar e/ou modular a atividade da proteína variante. Estes compostos candidatos podem ser adicionalmente selecionados contra uma proteína tendo função normal (por exemplo, uma proteína não variante/tipo selvagem) para determinar ainda o efeito do composto na atividade da proteína. Além disso, estes compostos podem ser testados em sistemas de invertebrados ou animais para determinar a atividade/eficácia in vivo. Os compostos podem ser identificados por ativar (agonistas) ou inativar (antagonistas) a proteína variante, e compostos diferentes podem ser identificados por causar vários graus de ativação ou inativação da proteína variante.
[00343]Ademais, as proteínas variantes podem ser usadas para selecionar um composto pela habilidade de estimular ou inibir a interação entre a proteína variante e uma molécula alvo que normalmente interage com a proteína. O alvo pode ser um ligante, um substrato ou um parceiro ligante que normalmente interage com a proteína (por exemplo, epinefrina ou norepinefrina). Tais ensaios tipicamente incluem as etapas de combinar a proteína variante com um composto candidato sob condições que permitem que a proteína variante, ou fragmento da mesma, interaja com a molécula alvo, e detecte a formação de um complexo entre a proteína e o alvo ou detecte a consequência bioquímica da interação com a proteína variante e o alvo, tal como qualquer um dos efeitos associados de transdução de sinal.
[00344]Os compostos candidatos incluem, por exemplo, 1) peptídeos, tais como, peptídeos solúveis, incluindo peptídeos de fusão de cauda Ig e membros de bibliotecas peptídicas aleatórias (vide, por exemplo, Lam et al., Nature 354:82-84 (1991); Houghten et al., Nature 354:84-86 (1991)) e bibliotecas moleculares derivadas de química combinatoria feitas de aminoácidos com configuração D- e/ou L-; 2) fosfopeptídeos (por exemplo, membros de bibliotecas de fosfopeptídeos direcionados, parcialmente degenerados, vide, por exemplo, Songyang et al., Cell 72:767-778 (1993)); 3) anticorpos (por exemplo, anticorpos de cadeia policlonal, monoclonal, humanizada, anti-idiotípica, quimérica, e única, bem como fragmentos de biblioteca de expressão Fab, F(ab')2, Fab; e 4) moléculas inorgânicas e orgânica pequenas (por exemplo, moléculas obtidas de bibliotecas de produto natural e de análise combinatória).
[00345]Um composto candidato da presente invenção é um fragmento solúvel de proteína variante que compete pela ligação com o ligante. Outros compostos candidatos incluem proteínas mutantes ou fragmentos apropriados que contêm mutações que afetam a função da proteína variante e, desse modo, compete pelo ligan- te. Consequentemente, um fragmento que compete pelo ligante, por exemplo, com uma afinidade mais elevada, ou um fragmento que se liga a ligante, mas não permite liberação, é abrangido pela invenção.
[00346]A invenção inclui adicionalmente outros ensaios de ponto final para identificar compostos que modulam (estimulam ou inibem) atividade de proteína variante. Os ensaios tipicamente envolvem um ensaio de eventos no trajeto de trans- dução de sinal que indica a atividade de proteína. Desse modo, as expressões de genes que são sobre ou sub-reguladas em resposta a proteína variante dependente de cascata de sinalização pode ser ensaiada. Em uma modalidade, a região de regulação de tais genes pode estar ligada de forma operável a um marcador que seja facilmente detectável, tal como, luciferase. Alternativamente, a fosforilação da proteína variante, ou um alvo de proteína também podem ser medidos. Quaisquer das funções biológicas ou bioquímicas mediadas pela proteína variante podem ser usadas como um ensaio de ponto final. Estas incluem todos os eventos bioquímicos e biológicos descritos aqui, nas referências citadas aqui, incorporadas para referência a estes alvos de ensaio de ponto final, e outras funções conhecidas por aqueles de habilidade ordinária na técnica.
[00347]Compostos de ligação e/ou ativação também podem ser selecionados pelo uso de proteínas variantes quiméricas nas quais um domínio extracelular terminal de um aminoácido ou partes do mesmo, pode ser reposto por sub-regiões ou domínios heterólogos. Por exemplo, uma região de ligação a substrato pode ser usada por interagir com um substrato diferente daquele que é normalmente reconhecido por uma proteína variante. Consequentemente, um conjunto diferente de componentes de transdução de sinalização é disponível como um ensaio de ponto final por ativação. Isto permite que os ensaios sejam efetuados em outras células que não a célula hospedeira específica da qual a proteína variante é derivada.
[00348]As proteínas variantes são também úteis em ensaios de ligação por competição em métodos designados para verificar compostos que interagem com a proteína variante. Desse modo, um composto pode ser exposto a uma proteína variante sob condições que permitam que o composto se ligue ou, de outro modo, interaja com a proteína variante. Um parceiro de ligação, tal como um ligante, que normalmente interage com a proteína variante é também adicionado à mistura. Se o composto de teste interage com a proteína variante ou com seu parceiro de ligação, diminui-se a quantidade de complexo formado ou a atividade da proteína variante. Este tipo de ensaio é particularmente útil na seleção de compostos que interagem com regiões específicas da proteína variante. Hodgson, Bio/technology, 10(9), 97380 (Set. 1992).
[00349]Para efetuar ensaios de seleção de droga sem células, é às vezes desejável imobilizar a proteína variante ou um fragmento da mesma, ou sua molécula alvo, para facilitar a separação de complexos a partir de formas não complexadas de um de uma ou de ambas as proteínas, bem como acomodar automação do ensaio. Qualquer método para imobilizar proteínas em matrizes pode ser usado em ensaios de seleção de droga. Em uma modalidade, uma proteína de fusão que contém um domínio adicionado permite que a proteína seja ligada a uma matriz. Por exemplo, proteínas de fusão glutationa-S-transferase/125I podem ser adsorvidas em esferas de sefarose glutationa (Sigma Chemical, St. Louis, MO) ou em placas microtiter derivadas de glutationa, que são então combinadas com os lisados celulares (por exemplo, 35S-marcado) e um composto candidato, tal como um candidato a droga, e uma mistura incubada sob condições conducentes para complexar a formação (por exemplo, em condições fisiológicas para sal e pH). Após a incubação, as esferas podem ser lavadas para remover qualquer marca não ligada, e a matriz foi imobilizada e as radiomarcas foram determinadas diretamente, ou no sobrenadante depois que os complexos são dissociados. Alternativamente, os complexos podem ser dissociados da matriz, separados por SDS-PAGE, e o nível de material ligado encontrado na fração de esfera foi quantificado a partir do gel usando técnicas ele- troforéticas padrões.
[00350]Tanto a proteína variante quanto suas moléculas alvo podem ser imobilizadas utilizando conjugação de biotina e estreptavidina. Alternativamente, anticorpos reativos com a proteína variante, mas que não interferem na ligação da proteína variante a sua molécula alvo, podem ser derivados nos poços da placa, e a proteína variante, aprisionada nos poços pela conjugação de anticorpos. As preparações de moléculas alvo e de um composto candidato são incubadas nos poços que apresentam proteína variante e a quantidade de complexo aprisionado no poço pode ser quantificada. Métodos para detectar tais complexos, em adição a aqueles descritos acima para complexos GST imobilizados, incluem imunodetecção de complexos usando anticorpos reativos com a molécula de proteína alvo, ou que são reativos com proteína variante e competem com a molécula alvo, e ensaios ligados a enzima que conta com a detecção de uma atividade enzimática associada com a molécula alvo.
[00351]Moduladores de atividade de proteína variante identificada de acordo com estes ensaios de seleção de droga podem ser usados para tratar um sujeito com um distúrbio mediado pelo trajeto de proteína, tal como CHD ou aneuris- ma/dissecção. Estes métodos de tratamento tipicamente incluem as etapas de administrar os moduladores de atividade de proteína em uma composição farmacêutica para um sujeito que necessita de tal tratamento.
[00352]As proteínas variantes, ou fragmentos das mesmas, descritas aqui podem por elas mesmas ser usadas diretamente para tratar um distúrbio caracterizado por uma ausência de atividade ou expressão indesejável, ou inadequada da proteína variante. Consequentemente, métodos para tratar incluem o uso de uma proteína variante descrita aqui ou fragmentos das mesmas.
[00353]Ainda em outro aspecto da presente invenção, as proteínas variantes podem ser usadas como “proteínas iscas” em um ensaio híbrido duplo ou ensaio híbrido triplo para identificar outras proteínas que se ligam a, ou interagem com a, proteína variante e estão envolvidas na atividade de proteína variante. Vide, por exemplo, Patente U.S. No. 5.283.317; Zervos et al., Cell 72:223-232 (1993); Madura et al., J Biol Chem 268:12046-12054 (1993); Bartel et al., Biotechniques 14:920-924 (1993); Iwabuchi et al., Oncogene 8:1693-1696 (1993); e Brent, WO 94/10300. Tais proteínas que se ligam a proteínas variantes provavelmente também estão envolvidas na propagação de sinais pelas proteínas variantes ou alvos de proteínas variantes como, por exemplo, elementos de um trajeto de sinalização mediado por proteína. Alternativamente, tais proteínas que se ligam a proteínas variantes são inibidores de proteína variante.
[00354]O sistema híbrido duplo é baseado na natureza modular da maioria dos fatores de transcrição, que tipicamente consiste de domínios de ativação e de ligação a DNA separáveis. Resumidamente, o ensaio tipicamente utiliza dois diferentes construtos de DNA. Em um construto, o gene que codifica uma proteína variante é fundido a um gene que codifica o domínio de ligação de DNA de um fator de transcrição conhecido, (por exemplo, GAL-4). No outro construto, uma sequência de DNA, a partir de uma biblioteca de sequências de DNA, que codifica uma proteína não identificada (“presas” ou “amostra”) é fundida a um gene que codifica o domínio de ativação do fator de transcrição conhecido. Se as proteínas “isca” e “presa” são capazes de interagir, in vivo, formando um complexo dependente de proteína variante, os domínios de ativação de ligação de DNA do fator de transcrição são mantidos em proximidade estreita. Esta proximidade permite a transcrição de um gene repórter (por exemplo, LacZ) que é operavelmente ligado a um local de regulação trans- cricional responsivo ao fator de transcrição. A expressão do gene receptor pode ser detectada, e colônias celulares que contêm o fator de transcrição funcional podem ser isoladas e usadas para obter o gene clonado que codifica a proteína que interage com a proteína variante.
Anticorpos Direcionados a Proteínas variantes
[00355]A presente invenção também fornece anticorpos que se ligam seletivamente as proteínas variantes descritas aqui. Tais anticorpos podem ser usados para detectar quantitativamente ou qualitativamente as proteínas variantes da presente invenção. Como usado aqui, um anticorpo se liga seletivamente a uma proteína variante alvo, isto é, o anticorpo não se liga significativamente a proteínas normais, tipo selvagem, ou conhecidas na técnica, que não contêm uma sequência de aminoácidos variante devido a um ou mais SNPs da presente invenção (sequências de aminoácidos variantes podem ser devidas de, por exemplo, cSNPs não sinôni- mos, SNPs nonsense que criam um códon de parada, por meio disso, causando um truncamento de um polipeptídeo ou SNPs que causam mutações através de leitura resultando em uma extensão de um polipeptídeo).
[00356]Como usado aqui, um anticorpo é definido em termos consistentes com aqueles reconhecidos na técnica: eles são proteínas de multi-subunidade produzidas por um organismo em resposta a um desafio antigênico. Os anticorpos da presente invenção incluem o anticorpo monoclonal e o policlonal, tal como fragmentosproteolítico antígeno-reativos de cada anticorpo, tal como fragmentos Fab, F(ab)'2 e Fv. Além disso, um anticorpo da presente invenção inclui adicionalmente qualquer um de uma variedade de moléculas que se ligam a antígeno projetadas, tal como um anticorpo quimérico (Patentes U.S. Nos. 4,816,567 e 4,816,397; Morrison et al, Proc Natl Acad Sci USA 81:6851 (1984); Neuberger et al, Nature 312:604 (1984)), a humanized antibody (Patentes U.S. Nos. 5,693,762; 5,585,089 e 5,565,332), um Fv de cadeia simples (Patente U.S. No. 4,946,778; Ward et al, Nature 334:544 (1989)), um anticorpo bi-específicico com duas ligações específicas (Segal et al, J Immunol Methods 248:1 (2001); Carter, J Immunol Methods 248:7 (2001)), um diacorpo, um triacorpo e um tetracorpo (Todorovska et al, J Immunol Methods 248:47 (2001)), bem como um Fab conjugado (dímero ou trímero), e um minicorpo.
[00357]Muitos métodos são conhecidos na técnica para geração e/ou identificação de anticorpos para um dado antígeno desejável. Harlow, Antibodies, Cold Spring Harbor Press, N. Y. (1989). Em geral, um peptídeo isolado (por exemplo, uma proteína variante da presente invenção) foi usado como um imunogene e foi administrado em um organismo de mamífero, tal como um rato, coelho, hamster ou camundongo.Também uma proteína de comprimento completo, um fragmento de pep- tídeo antigênico (por exemplo, um fragmento de peptídeo contendo uma região que varia entre uma proteína variante e uma proteína tipo selvagem correspondente), ou uma proteína de fusão podem ser usadas. Uma proteína usada como um imonogene pode ser de ocorrência natural, produzida de formas sintética ou recombinante, e pode ser administrada em combinação com um adjuvante, incluindo, mas não limitado a, géis minerais de Freund (completo e incompleto), tal como, hidróxido de alumínio, substância com superfície ativa, tal como, lisolecitina, polióis plurônicos, poli- ânions, peptídeos, emulsões de óleos, hemocianina de megathura crenulata, dinitro- fenol, e semelhantes.
[00358]Anticorpos Monoclonais podem ser produzidos por tecnologia de hi- bridoma, que imortaliza células que secretam um anticorpo monoclonal específico. Kohler e Milstein, Nature 256:495 (1975). As linhagens celulares imortalizadas podem ser criadas in vitro por fusão de dois diferentes tipos de células, tipicamente linfócitos, e células de tumor. As células de hibridomas podem ser cultivadas in vitro ou in vivo. Adicionalmente, anticorpos completamente de humanos podem ser gerados por animais transgênicos. He et al, J Immunol 169:595 (2002). Tecnologias fago Fd e fagomido Fd podem ser usadas para gerar e selecionar anticorpos recombinan- tes in vitro. Hoogenboom e Chames, Immunol Today 21 :371 (2000); Liu et al, J MoI Biol 315: 1063 (2002). As regiões que determinam complementaridade de um anticorpo podem ser identificadas, e peptídeos sintéticos que correspondem a tais regiões podem ser usados para mediar as ligações de antígenos. Patente U.S. No. 5,637,677.
[00359]Os anticorpos são preferencialmente preparados junto a regiões ou fragmentos discreto de uma proteína variante que contêm uma sequência de amino- ácidos variante como comparado a proteína tipo selvagem correspondente (por exemplo, uma região da proteína variante que inclui um aminoácido codificado por um cSNP não sinônimo, uma região afetada por truncamento causado por um SNP nonsense que cria um códon de parada, ou uma região resultante da destruição de um códon de parada devido a mutação através de leitura causada por um SNP). Além disso, regiões preferidas incluirão aquelas envolvidas em interações de parceria tipo função/atividade e/ou proteína/ligação. Tais fragmentos podem ser selecionados por uma propriedade física, tal como fragmentos que correspondem a regiões que são localizadas na superfície da proteína, por exemplo, regiões hidrofílicas, ou que podem ser selecionados com base na singularidade de sequência, ou com base na posição do(s) resíduo(s) de aminoácidos variantes codificados pelos SNPs fornecidos pela presente invenção. Um fragmento antigênico tipicamente compreenderá pelo menos aproximadamente de 8-10 resíduos de aminoácidos contíguos em que pelo menos um dos resíduos de aminoácidos é um aminoácido afetado pelo SNP descrito aqui. O peptídeo antigênico pode compreender, entretanto, pelo menos 12, 14, 16, 20, 25, 50, 100 (ou qualquer outro número entre) ou mais resíduos de ami- noácidos, contanto que pelo menos um aminoácido seja afetado pelo SNP aqui descrito.
[00360]A detecção de um anticorpo da presente invenção pode ser facilitada por acoplamento (isto é, ligação de forma física) o anticorpo ou um fragmento reativo a antígeno do mesmo para uma substância detectável. As substâncias detectáveis incluem, mas não são limitados a, enzimas variadas, grupos prostéticos, materiais fluorescentes, materiais luminescentes, materiais bioluminescentes, e materiais radioativos. Exemplos de enzimas adequadas incluem peroxidase de rábano silvestre, fosfatase alcalina, β- galactosidase, ou acetilcolinesterase; exemplos de complexos de grupo prostético adequados incluem estreptavidina/biotina e avidina/biotina; exemplos de materiais fluorescentes adequados incluem umbeliferona, fluoresceina, fluoresceina isotiocianato, rodamina, diclorotriazinilamina fluoresceína, cloreto de dansila e ou ficoeritrina; um exemplo de um material luminescente inclui luminol; exemplos de materiais bioluminescente incluem luciferase, luciferina, e aequorina, e exemplos de material radioativo adequado incluem 125I, 131I, 35S ou 3H.
[00361]Anticorpos, particularmente o uso de anticorpos como agentes terapêuticos, são revistos em: Morgan, "Antibody therapy for Alzheimer's disease,"Expert Rev Vaccines (l):53-9 (Fev. 2003); Ross et al, "Anticancer antibody,"Am J Clin Pathol 119(4):472-85 (Abr. 2003); Goldenberg, "Advancing role of radiolabeled antibody in the therapy of cancer,"Cancer Immunol Immunother 52(5):281-96 (May 2003); Epub Mar. 11, 2003; Ross et al, "Antibody-based therapeutics in oncology,"Expert Rev Anticancer Ther 3(l):107-21 (Fev. 2003); Cao et al, "Bispecific antibody conjugates in therapeutics," Adv Drug Deliv Rev 55(2): 171-97 (Fev. 2003); von Mehren et al., "Monoclonal antibody therapy for cancer,"Annu Rev Med 54:343-69 (2003); Epub Dez. 3, 2001; Hudson et al, "Engineered antibody," Nat Med 9(1): 12934 (Jan. 2003); Brekke et al., "Therapeutic antibody for human diseases at the dawn of the twenty-first century," Nat Rev Drug Discov 2(l):52-62 (Jan. 2003); Erratum in: Nat Rev Drug Discov 2(3):240 (Mar. 2003); Houdebine, "Antibody manufacture in transgenic animals and comparisons with other systems," Curr Opin Biotechnol 13(6):625-9 (Dez. 2002); Andreakos et al., "Monoclonal antibody in immune e inflammatory diseases,"Curr Opin Biotechnol 13(6):615-20 (Dez. 2002); Kellermann et al., "Anticorpo discovery: the use of transgenic mice to generate human monoclonal anticorpos for therapeutics,"Curr Opin Biotechnol 13(6):593-7 (Dec. 2002); Pini et al., "Phage display e colony filter screening for high-throughput selection of antibody libraries,"Comb Chem High Throughput Screen 5(7):503-10 (Nov. 2002); Batra et al., "Pharmacokinetics e biodisrribution of genetically engineered antibody,"Curr Opin Biotechnol 13(6):603-8 (Dez. 2002); and Tangri et al, "Rationally engineered protein or antibody with absent or reduced imonogeneicity," Curr Med Chem 9(24):2191-9 (Dec. 2002).
Usos de Anticorpos
[00362]Os anticorpos podem ser usados para isolar as proteínas variantes da presente invenção a partir de uma fonte de células naturais ou a partir de células hospedeiras recombinantes por técnicas padrão, tal como cromatografia de afinida- de ou imunoprecipitação. Além disso, anticorpos são úteis para detectar a presença de uma proteína variante da presente invenção em células e ou tecidos para determinar o padrão de expressão da proteína variante entre tecidos variados em um organismo e sobre o curso de desenvolvimento normal ou progressão da doença. Além disso, anticorpos podem ser usados para detectar proteína variante in situ, in vitro, em um fluído do corpo, ou em um lisado de célula ou sobrenadante para avaliar a quantidade e o padrão de expressão. Ademais, os anticorpos podem ser usados para avaliar a distribuição abnormal do tecido, expressão abnormal durante o desenvolvimento, ou expressão em uma condição anormal, tal como em CHD ou aneu- risma/dissecção, ou durante o tratamento com estatina. Adicionalmente, a detecção de anticorpos de fragmentos circulantes da proteína variante de comprimento completo pode se usada para identificar resultado.
[00363]Os anticorpos para as proteínas variantes da presente invenção são também úteis em análise farmacogênica. Desse modo, anticorpos contra proteínas variantes codificadas pelos alelos alternativos de SNP podem ser usados para identificarindivíduos que necessitam de modalidades de tratamento modificado.
[00364]Adicionalmente, os anticorpos podem ser usados para avaliar a expressão da proteína variante em estados de doença, tais como, em estágio ativo da doença ou em um indivíduo com uma predisposição a uma doença relacionada com função de proteína, tal como, durante tratamento com estatina. Anticorpos específicos para uma proteína variante codificados por um SNP que contém molécula de ácido nucléico da presente invenção pode ser usado para o ensaio da presença de proteína variante, tal como para diagnosticar CHD ou aneurisma/dissecção ou predizer uma resposta de indivíduo ao tratamento com estatina ou predisposi- ção/suscetibilidade a CHD ou aneurisma/dissecção, como indicado pela presença da proteína variante.
[00365]Os anticorpos também são úteis como ferramentas de diagnóstico para avaliar as proteínas variantes em conjunção com análise por mobilidade ele- troforética, ponto isoelétrico, digestão de peptídeo tríptico e outros ensaios físicos bem conhecidos na técnica.
[00366]Os anticorpos também são úteis para tipificação de tecido. Desse modo, onde uma proteína variante específica tenha sido correlacionada com expressão em um tecido específico, os anticorpos que são específicos para esta proteína podem ser usados para identificar um tipo de tecido.
[00367]Os anticorpos também são úteis para avaliar localização subcelular aberrante de uma proteína variante nas células em vários tecidos. Os usos de diagnóstico podem ser aplicados, não apenas em teste genético, mas também no monitoramento de uma modalidade de tratamento. Consequentemente, onde o tratamentoé finalmente objetivado na correção do nível de expressão ou a presença de proteína variante ou distribuição de tecido aberrante ou expressão de desenvolvimento de uma proteína variante, anticorpos direcionados contra a proteína variante ou fragmentos relevantes podem ser usados para monitorar a eficácia terapêutica.
[00368]Os anticorpos também são úteis para inibir a função de proteína, por exemplo, pelo bloqueio da ligação de uma proteína variante a um parceiro de ligação. Estes usos também podem ser aplicados em um contexto terapêutico no qual o tratamento envolve a inibição de uma função de proteína variante. Um anticorpo pode ser usado, por exemplo, para bloquear ou inibir competitivamente ligação, desse modo modulando (agonizando ou antagonizando) a atividade de uma proteína variante. Os anticorpos podem ser preparados contra fragmentos de proteína variante específico que contém locais requeridos para função ou contar uma proteína variante intacta que esteja associada com uma célula ou membrana celular. Para administração in vivo, um anticorpo pode estar ligado a uma carga útil terapêutica adicional, tal como um radionucleotídeo, uma enzima, um epítopo imunogênico, ou um agente citotóxico. Agentes citotóxicos adequados incluem, mas estão limitados a, toxina bacteriana, tal como, difteria, e toxina de planta tal como ricina. A meia vida in vivo de um anticorpo ou fragmento do mesmo pode ser prolongada pela peguilação através da conjugação com polietileno glicol. Leong et al, Cytokine 16:106 (2001).
[00369]A invenção também abrange kits para uso de anticorpos, tais como kits para detectar a presença de uma proteína variante em uma amostra de teste. Um kit exemplar pode compreender anticorpos tais como um anticorpo marcado ou capaz de ser marcado e um composto ou agente para detectar proteínas variantes em uma amostra biológica; meios para determinar a quantidade, ou presen- ça/ausência de proteína variante em uma amostra; meios para comparar a quantidade de proteína variante na amostra com um padrão; e instruções para uso.
Vetores e células Hospedeiras
[00370]A presente invenção também fornece vetores que contêm as moléculas de ácido nucléico que contêm SNP descritas aqui. O termo “vetor” se refere a um veículo, preferencialmente uma molécula de ácido nucléico que pode transportar uma molécula de ácido nucléico que contém SNP. Quando o vetor é uma molécula de ácido nucléico, a molécula de ácido nucléico que contém o SNP pode ser ligada de forma covalente ao ácido nucléico do vetor. Tais vetores incluem, mas não estão limitados a, um plasmídeo, fago com filamento único ou duplo, vetor viral de DNA ou RNA com filamento único ou duplo, ou cromossomo artificial, tal como, BAC, PAC, YAC ou MAC.
[00371]Um vetor pode ser mantido em uma célula hospedeira como um elemento extracromossomal onde o mesmo se replica e produz cópias adicionais de moléculas de ácido nucléico que contêm SNP. Alternativamente, o vetor pode interagir dentro do genoma de célula hospedeira e produz cópias adicionais de moléculas de ácido nucléico que contêm SNP quando a célula hospedeira replica.
[00372]A invenção fornece vetores para a manutenção (vetores de clonagem) ou vetores para expressão (vetor de expressão) de moléculas de ácido nucléi- co que contêm SNP. Os vetores podem funcionar em células procarióticas ou euca- rióticas ou em ambas (vetores ponte “shuttle vectors”).
[00373]Vetores de expressão tipicamente contêm regiões de regulação de ação cis que são operáveis ligadas no vetor as moléculas de ácido nucléico que contêm SNP tal que a transcrição de moléculas de ácido nucléico que contêm SNP é permitida em uma célula hospedeira. As moléculas de ácido nucléico que contêm SNP também podem ser introduzidas dentro da célula hospedeira com uma molécula de ácido nucléico separado capaz de afetar a transcrição. Desse modo, uma segundamolécula de ácido nucléico pode fornecer um fator de ação trans que interage com a região de controle de regulação cis para permitir a transcrição das moléculas de ácido nucléico que contêm SNP a partir do vetor. Alternativamente, um fator de ação trans pode ser suprido pela célula hospedeira. Finalmente, um fator de ação trans pode ser produzido a partir do vetor por si mesmo. É entendido, entretanto, que em algumas modalidades, transcrição e/ou tradução de moléculas de ácido nu- cléico podem ocorrer em um sistema sem células.
[00374]As sequências de regulação para as quais as moléculas de ácido nu- cléico que contêm SNP descritas aqui podem ser operavelmente ligadas incluem promotores para direcionar a transcrição de mRNA. Estes incluem, mas estão limitados a, promotor da esquerda a partir de bacteriófago À, o lac, TRP e promotores TAC a partir de E. coli, os promotores precoces e tardios de SV40,promotor CMV imediatamente precoce, os promotores tardios e precoces de adenovirus e repetições terminais longas de retrovírus.
[00375] Além de conter os locais para iniciação de transcrição e controle, vetores de expressão podem também conter sequências necessárias para terminação de transcrição e, na região transcrita, um local que se liga a ribossomo para tradução. Outros elementos de controle de regulação para expressão incluem códons de iniciação e terminação bem como sinalização de poliadenilação. Uma pessoa de ha- bilidade ordinária na técnica estaria ciente de numerosas sequências de regulação que são úteis em vetores de expressão. Vide, por exemplo, Sambrook e Russell, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, N. Y. (2000).
[00376]Uma variedade de vetores de expressão pode ser usada para expressar uma molécula de ácido nucléico que contém SNP. Tais vetores incluem vetores cromossomais, epissomais e derivados de vírus, por exemplo, vetores derivados de plasmídeos bacterianos, derivados de bacteriófago, derivados de epissomos de levedura, derivados de elementos cromossomais de levedura, incluindo cromossomos artificiais de levedura, derivados de vírus, tais como, baculovirus, papilovirus, tais como SV 40, vírus vaccínia, adenovirus, poxvírus, vírus pseudorabios e retroví- rus. Os vetores também podem ser derivados de combinações destas fontes, tais como aqueles derivados de elementos genéticos de bacteriófago e plasmídeo, por exemplo, cosmídeos e fagomídeos. A clonagem apropriada e vetores de expressão para hospedeiras procarióticas e eucarióticas são descritos em Sambrook e Russell, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y. (2000).
[00377]A sequência de regulação em um vetor pode fornecer expressão constitutiva em uma ou mais células hospedeiras (por exemplo, expressões específicas de tecido) ou podem fornecer expressão induzível em um ou mais tipos de células, tais como, pela temperatura, aditivo nutriente ou fator exógeno, por exemplo, um hormônio ou outro ligante. Uma variedade de vetores que fornecem expressão constitutiva ou induzível de uma sequência de ácido nucléico em células hospedeirasprocarióticas e eucarióticas é bem conhecida por aqueles de habilidade ordinária na técnica.
[00378]Uma molécula de ácido nucléico que contém SNP pode ser inserida no vetor por metodologia bem conhecida na técnica. Geralmente, a molécula de áci- do nucléico que contém SNP que será finalmente expressa é unida a um vetor de expressão pela clivagem da molécula de ácido nucléico que contém SNP e do vetor de expressão com uma ou mais enzimas de restrição e então ligam os fragmentos juntos. Procedimentos para digestão e ligação de enzima de restrição são bem conhecidos por aqueles de habilidade ordinária na técnica.
[00379] O vetor que contém a molécula de ácido nucléico apropriada pode ser introduzido em uma célula hospedeira para propagação ou expressão usando técnicas bem conhecidas. Células hospedeiras bacterianas incluem, mas estão limitadas a, Escherichia coli, Streptomyces spp., e Salmonella typhimurium. Células hospedeiras eucarióticas incluem, mas não estão limitadas a, leveduras, células de inseto, tal como Drosophila spp., células de animal, tal como células COS e CHO e células de plantas.
[00380] Como descrito aqui, pode ser desejável expressar o peptídeo variante como uma proteína de fusão. Consequentemente, a invenção fornece vetores de fusão que permitem a produção de peptídeos variantes. Os vetores de fusão podem, por exemplo, aumentar a expressão de uma proteína recombinante, aumenta a solubilidade da proteína recombinante, e auxilia na purificação da proteína por agir, por exemplo, como um ligante para purificação de afinidade. Um local de clivagem pro- teolítica pode ser introduzido na junção do grupamento de fusão de modo que o pep- tídeo variante desejado possa finalmente ser separado do grupamento de fusão. En-zimasproteolíticas adequadas para tal uso incluem, mas não estão limitadas a, fator Xa, trombina e enteroquinase. Vetores de expressão de fusão típicos incluem pGEX (Smith et al, Gene 67:31-40 (1988)), pMAL (New England Biolabs, Beverly, Mass.) e pRIT5 (Pharmacia, Piscataway, NJ.) que funde glutatione S-transferase (GST), proteína que se liga a maltose E, ou proteína A, respectivamente, a proteína alvo re- combinante. Exemplos de vetores expressão de E. coli de não fusão induzíveis adequados incluem pTrc (Amann et al., Gene 69:301-315 (1988)) e pET Hd (Studier et al., Gene Expression Technology: Methods in Enzymology 185:60-89 (1990)).
[00381]A expressão de proteína recombinante pode ser maximizada em um hospedeiro bacteriano pelo fornecimento de uma base genética em que a célula hospedeira possui uma capacidade prejudicada para clivar de forma proteolítica a proteína recombinante (S. Gottesman, Gene Expressão Technology: Methods in Enzymology 185: 119-128, Academic Press, Calif. (1990)). Alternativamente, a sequência de molécula de ácido nucléico que contêm SNP de interesse pode ser alterada para fornecer códon preferencial útil para uma célula hospedeira específica, por exemplo, E. coli. Wada et al., Nucleic Acids Res 20:2111 - 2118 (1992).
[00382]As moléculas de ácido nucléico que contêm SNP também podem ser expressas pelos vetores de expressão que são operativos em leveduras. Exemplos de vetores para expressão em levedura (por exemplo, S. cerevisiae) incluem pYepSecl (Baldari et al., EMBO J 6:229-234 (1987)), pMFa (Kurjan et al., Cell 30:933-943 (1982)), pJRY88 (Schultz et al, Gene 54:113-123 (1987)), e pYES2 (Invi- trogen Corporation, San Diego, Calif.).
[00383]As moléculas de ácido nucléico que contêm SNP também podem ser expressas em células de insetos usando, por exemplo, vetores de expressão de ba- culovírus. Os vetores de baculovírus disponíveis para expressão de proteínas em células de inseto cultivadas (por exemplo, células Sf 9) incluem a série pAC (Smith et al., MoI Cell Biol 3:2156-2165 (1983)) e the pVL series (Lucklow et al., Virology 170:31-39 (1989)).
[00384]Em certas modalidades da invenção, as moléculas de ácido nucléico que contêm SNP descritas aqui são expressas em células de mamíferos usando vetores de expressão de mamíferos. Exemplos de vetores de expressão de mamíferos incluem pCDM8 (B. Seed, Nature 329:840 (1987)) e pMT2PC (Kaufman et al., EMBO J 6:181-195 (1987)).
[00385]A invenção também abrange vetores nos quais as moléculas de áci- do nucléico que contêm SNP descritas aqui são clonadas no vetor em orientação reversa, mas são ligadas de forma operável a uma sequência reguladora que permite a transcrição de RNA antisense. Desse modo, uma transcrição antisense pode ser produzida para as sequências de ácido nucléico descritas aqui, incluindo ambas as regiões de codificação e não-codificação. A expressão deste de RNA antisense (sequências reguladoras, constitutivas ou expressão induzível, expressão específica para tecido).
[00386] A invenção também diz respeito a células hospedeiras recombinan- tes que contêm os vetores descritos aqui. Portanto, as células hospedeiras incluem, por exemplo, células procarióticas, células eucarióticas inferiores, tais como levedura, outras células eucarióticas tais como células de inseto, e células eucarióticas maiores, tais como células de mamífero.
[00387]As células de hospedeiro recombinantes podem ser preparadas pela introdução de construtos de vetores descritos aqui nas células por técnicas facilmentedisponíveis para pessoas de habilidade ordinária na técnica. Estas incluem, mas não estão limitas a, transfecção por fosfato de cálcio, transfecção mediada dextrana- DEAE, transfecção mediada por lipídeo catiônico, eletroporação, transdução, infecção, lipofecção e outras técnicas tais como aquelas descritas em Sambrook e Russell, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, N. Y. (2000).
[00388]As células hospedeiras contêm também mais de um vetor. Desse modo as sequências de nucleotídeos que contêm SNP podem ser introduzidas em diferentes vetores na mesma célula. Similarmente, as moléculas de ácido nucléico que contêm SNP podem ser introduzidas individualmente ou com outras moléculas de ácido nucléico que não estão relacionadas com as moléculas de ácido nucléico que contêm ácido nucléico, tais como aquelas que fornecem fatores de ação trans para vetores de expressão. Quando mais de um vetor é introduzido em uma célula, os vetores podem ser introduzidos de forma independente, co-introduzidos, ou unidos ao vetor de molécula de ácido nucléico.
[00389]No caso de vetores de bacteriófago e virais, estes podem ser introduzidos nas células com vírus empacotado ou encapsulado por procedimentos padrões para infecção e transdução. Os vetores virais podem ser de competente repli- cação ou defeituosa replicação. No caso em que a replicação viral é defeituosa, a replicação pode ocorrer em células hospedeiras que fornecem função que complementam os defeitos.
[00390]Os vetores geralmente incluem marcadores selecionados que possibilitam a seleção da sub-população de células que contêm os construtos de vetores recombinantes. O marcador pode ser inserido no mesmo vetor que contém as moléculas de ácido nucléico que contêm SNP descritas aqui ou pode estar em um vetor separado. Os marcadores incluem, por exemplo, genes resistentes a tetraciclina ou ampicilina para células hospedeiras procarióticas, e genes com resistência a neomi- cina ou dihidrofolato redutase para células hospedeiras eucarióticas. Entretanto, qualquer marcador que forneça seleção para um traço fenotípico pode ser eficaz.
[00391]Embora as proteínas variantes maduras possam ser produzidas em bactérias, leveduras, células de mamífero e outras células sobre o controle de sequências de regulação apropriadas, os sistemas de tradução e transcrição sem célulastambém podem ser usados para produzir estas proteínas variantes usando RNA derivado de construtos descritos aqui.
[00392]Onde a secreção de proteína variante é desejada que é difícil de alcançar com domínio de multi-transmembrana que contém proteínas tais como receptores acoplados a proteína g (GPCRs), sinais de secreção apropriados podem ser incorporados no vetor. A sequência de sinal pode ser endógena para os peptídeos ou heteróloga para estes peptídeos.
[00393]Onde a proteína variante não é secretada no meio, a proteína pode ser isolada da célula hospedeira por procedimentos padrões de rompimento, incluindo congelamento/descongelamento, sonicação, rompimento mecânico, uso de agentes de lise e semelhantes. A proteína variante pode então ser recuperada e purificada por métos de purificação bem conhecidos incluindo, por exemplo, precipitação com sulfato de amônio, extração ácida cromatografia de troca aniônica ou catiônica, cromatografia de fosfocelulose, cromatografia de interação hidrofóbica, cromatogra- fia de afinidade, cromatografia de hidroxiapatita, cromatografia de lectina, ou croma- tografia líquida de alta eficiência.
[00394]É também entendido que dependendo da célula hospedeira na qual a produção recombinante de proteínas variantes descritas aqui ocorre, elas podem ter vários padrões de glicosilação, ou podem ser não glicosiladas, como quando produzidas em bactérias. Além disso, as proteínas variantes podem incluir uma metionina inicial modificada em alguns casos com um resultado de um processo mediado por hóspede. Para maiores informações relacionadas a vetores e células hospederias vide Current Protocols in Molecular Biology, John Wiley & Sons, N.Y.
Usos de vetores e células hospedeiras e animais transgênicos
[00395]As células hospedeiras recombinantes as proteínas variantes descritas aqui possuem uma variedade de uso. As células são úteis para produzir uma proteína variante que pode ser adicionalmente purificada em uma preparação de quantidades desejadas da proteína ou fragmentos da mesma. Desse modo, células hospedeiras que contêm vetores de expressão são úteis para produção de proteína variante.
[00396]As células hospedeiras também são úteis para a condução de ensaios a base de célula envolvendo a proteína variante ou fragmentos da proteína variante, tais como aqueles descritos acima bem como outras formas conhecidas na técnica. Desse modo, uma célula hospedeira recombinante que expressa uma proteína variante é útil para ensaiar compostos que estimulam ou inibem a função de proteína variante. Tal habilidade de um composto modular função de proteína variante não pode ser evidente para ensaios de composto na proteína tipo selvagem/nativa, ou de ensaios sem células do composto. Células hospedeiras recombinantes tam-bém são úteis para ensaiar alterações funcionais nas proteínas variantes quando comparada com uma função conhecida.
[00397]Células hospedeiras projetadas geneticamente podem ser adicionalmente usadas para produzir animais transgênicos não humanos. Um animal trans- gênico é preferencialmente um mamífero não humano, por exemplo, um roedor tal como um rato ou camundongo no qual uma ou mais células do animal inclui um transgênico. Um transgene é DNA exógeno que contém um SNP da presente invenção o qual é integrado no genoma de uma célula a partir da qual um animal transgê- nico se desenvolve e permanece no genoma do animal maduro em um ou mais dos seus tipos de células ou tecidos. Tais animais são úteis para estudar a função de uma proteína variante in vivo, e identificar e avaliar moduladores de atividade de proteína variante. Outros exemplos de animais transgênicos incluem, mas não estão limitados a primatas não humanos, ovelha, cachorros, vacas, cabras, galinhas e anfíbios.
[00398]Mamíferos transgênicos não humanos tais como vacas e cabras podem se usados para produzir proteínas variantes que podem ser secretadas no leite do animal e então ser recuperadas.
[00399]Um animal transgênico pode ser produzido pela introdução de uma molécula de ácido nucléico que contém SNP no pronúcleo masculino de um oócito fertilizado, por exemplo, pela microinjeção ou infecção retroviral, e permitindo que o oócito se desenvolva em um animal feminino criado pseudo-gestante. Quaisquer moléculas de ácido nucléico que contêm um ou mais SNPs da presente invenção podem potencialmente ser introduzidas como um transgene no genoma de um animal não humano.
[00400]Quaisquer das sequências de regulação ou outras sequências úteis em vetores de expressão podem formar parte da sequência transgênica. Isto inclui sequências intrônicas e sinalizações de poliadenilação, se não já incluídas. Um se- quência(s) de regulação específica para tecido pode ser operável ligada ao transgene para direcionar a expressão da proteína variante em células ou tecidos particulares.
[00401]Métodos para gerar animais transgênicos via manipulação de embrião e microinjeção, animais particularmente, tais como, camundongos, se tornaram convencionais na técnica e estão descritos, por exemplo, nas Patentes U.S. Nos. 4,736,866 e 4,870,009, ambas de Leder et al.; Nos. 4,873,191 de Wagner et al., e in B. Hogan, Manipulating the Mouse Embryo, Cold Spring Harbor Laboratory Press, N. Y. (1986). Métodos similares são usados paraa produção de outros animais transgê- nicos. Um animal transgênico iniciador pode ser identificado com base na presença de transgene em seu genoma e/ou expressão de mRNA transgênico em tecidos ou células de animais. Um animal transgênico iniciador pode então ser usado para dar cria a animais adicionais portadores do transgene. Além disso, os animais transgêni- cos portadores de um transgene podem também ser criados para outros animais transgênicos portadores de outros transgenes. Um animal transgênico também inclui um animal não humano no qual o animal inteiro, ou tecidos no animal, tenham sido produzidos usando as células hospedeiras recombinantes de forma homóloga descritas aqui.
[00402]Em uma outra modalidade, animais não humanos transgênicos, podem ser produzidos, os quais contêm sistemas selecionados que permitem a expressão regulada do transgene. Um exemplo de tal sistema é o sistema de recombinase crê/IoxP de bacteriófago P1. Lakso et al., PNAS 89:6232-6236 (1992). Um outro exemplo de um sistema de recombinase é o sistema de recombinase FLP de S. cerevisiae. O'Gorman et al., Science 251:1351-1355 (1991). Se um sistema de recombinase cre/loxP é usado para regular expressão de transgene, animais que contêm transgenes que codificam a recombinase cre e uma proteína selecionada são geralmente necessários. Tais animais podem ser fornecidos através da construção de animais transgênicos “duplos”, por exemplo, pelo acasalamento de dois animais transgênicos, um contendo um transgene que codifica uma proteína variante selecionada e o outro contendo um transgene que codifica uma recombinase.
[00403]Clones de animais transgênicos não-humanos descritos aqui também podem ser produzidos de acordo com métodos descritos, por exemplo, em I. Wilmut et al., Nature 385:810-813 (1997) e Publicações Internacionais de PCT Nos. WO 97/07668 e WO 97/07669. Em resumo, uma célula (por exemplo, uma célula somática) a partir do animal transgênico pode ser isolada e induzida para sair do ciclo de crescimento e entrar na fase G°. A célula quiescente pode então ser fundida, por exemplo, através do uso de pulsos elétricos, para um oócito enucleado a partir de um animal da mesma espécie do qual a célula quiescente é isolada. O oócito reconstruído é, então, cultivado tal que se desenvolva para mórula ou blastócito e então transferido para o animal feminino criado pseudo-gestante. O filhote nascido deste animal feminino criado será um clone do animal a partir do qual a célula (por exemplo, célula somática) é isolada.
[00404]Os animais transgênicos que contêm células recombinantes que expressam as proteínas recombinantes descritas aqui são úteis para conduzir os ensaios descritos aqui em um contexto in vivo. Consequentemente, os vários fatores fisiológicos que estão presentes in vivo e que podem influenciar a ligação do ligante ou do substrato, ativação de proteína variante, transdução de sinalização, ou outros processos ou interações, não podem ser evidentes para ensaios com base em células ou sem células in vitro. Desse modo, os animais transgênicos não humanos da presente invenção podem ser usados para ensaiar funções de proteína variante in vivo bem como as atividades de um agente terapêutico ou composto que modula a atividade/função ou expressão da proteína variante. Tais animais são também adequados para avaliação dos efeitos de mutações nulas (isto é, mutações que eliminam substancialmente ou completamente uma ou mais funções da proteína variante).
[00405]Para informações adicionais com relação a animais transgênicos, vide Houdebine, "Antibody manufacture in transgenic animals e comparisons with other systems,"Curr Opin Biotechnol 13(6):625-9 (Dez. 2002); Petters et al., "Transgenic animals as models for human disease,"Transgenic Res 9(4-5):347-51, discussion 345-6 (2000); Wolf et al., "Use of transgenic animals in understanding molecular mechanisms of toxicity," J Pharm Pharmacol 50(6):567-74 (Jun. 1998); Echelard, "Recombinant protein production in transgenic animals," Curr Opin Biotechnol 7(5):536- 40 (Out. 1996); Houdebine, "Transgenic animal bioreactors,"Transgenic Res 9(4-5):305-20 (2000); Pirity et al., "Embryonic stem cells, creating transgenic animals," Methods Cell Biol 57:279-93 (1998); e Robl et al., "Artificial chromosome vectors e expression of complex proteins in transgenic animals,"Theriogenology 59(1):107-13 (Jan. 2003).
EXEMPLOS
[00406]Os exemplos seguintes são propostos para ilustrar, mas não limitar, a invenção reivindicada.
EXEMPLO 1 Polimorfismo Genético Designado hCV3054799 no Gene KIF6 que está Associado com o risco de CHD e benefício Proveniente da terapia com estatina para redução de eventos Coronários
[00407]A fim de identificar marcadores genéticos associados com CHD (par-ticularmente MI, incluindo MI recorrente) ou o efeito do tratamento com estatina em CHD, amostras foram genotipadas em dois testes clínicos: o estudo de Colesterol e eventos Recorrentes (CARE) (um teste duplo-cego multicentral aleatório na preven- ção secundária da MI com pravastatina (Pravachol®); Sacks et al., Am. J. Cardiol. 68 : 1436- 1446 [ 1991 ]), e o Estudo de Prevenção Coronária do Oeste da Escócia (WOSCOPS) (um teste duplo-cego multicentral aleatório na prevenção primária de CHD com pravastatina (Pravachol®); Shepherd et al., N Eng J Med 333 (20), pp. 1301-7, Nov. 16, 1995; Packard et al., N Eng J Med 343 (16), pp. 1148-55, Out. 19, 2000).
[00408]Um MI bem documentado foi um dos critérios de inclusão para entrar no estudo CARE. Pacientes foram incluídos no teste CARE a partir de 80 centros de estudo participantes. Homens e mulheres pós-menopausa seriam elegíveis para o teste caso eles tivessem tido um MI agudo entre 3 e 20 meses antes da aleatoriza- ção, com 21 a 75 anos de idade, e tivessem níveis de colesterol total no plasma menor que 240 mg/decilitro, níveis de colesterol LDL de 115 a 174 mg/decilitro, níveis de triglicerídeos em jejum menores que 350 mg/decilitro, níveis de glicose não maiores que 220 mg/decilitro, frações de ejeção ventricular esquerda não menores que 25%, e insuficiência cardíaca congestiva não sintomática. Os pacientes foram selecionados aleatoriamente para receber também 40 mg de pravastatina uma vez por dia ou um placebo combinado (“matching placebo”). O ponto final primário do teste foi a morte causada por CHD ou MI não fatal e a duração média do acompanhamento foi 5,0 anos (variação, 4,0 to 6,2 anos). Para este estudo genético de CARE, um ponto final de composto compreendido de MI recorrente fatal ou não fatal foi usado. Os modelos de coorte de WOSCOPS original e o estudo caso-controle aninhado foi descrito (Shepherd et al., N Eng J Med 333 (20), pp. 1301-7, Nov. 16, 1995; Packard et al., N Eng J Med 343 (16), pp. 1148-55, Out. 19, 2000). O objetivo do teste WOSCOPS foi avaliar a eficácia da pravastatina na redução do risco de MI primária ou morte Coronariana entre homens escoceses com hipercolesterolemia (Colesterol LDL em jejum > 155 mg/dl). Participantes do estudo WOSCOPS tinham 45-64 anos de idade e seguiram uma média de 4,9 anos para eventos coronários. Os estudos de caso-controle aninhados incluíram como casos todos os pacientes WOSCOPS que experimentaram eventos coronários (MI não fatal confirmado, morte por CHD, ou um procedimento de revascularização; N=580). Os controles foram idade- e tabagismo- combinados para pacientes não afetados.
[00409]Para genotipar SNPs em amostras de pacientes com CARE, o DNA foi extraído de amostras de sangue usando métodos convencionais de extração de DNA, tais como, o kit QIAamp do Qiagen. Os genótipos foram obtidos por um método similar ao que foi descrito por Iannone (M. A. Iannone et al., Cyto-metry 39(2): 131-140 [Fev. 1, 2000]; também descrito na seção "SNP DETECTION REAGENTS," supracitada). Em resumo, o DNA alvo foi amplificado por PCR multiplex, o produto amplificado foi submetido a um ensaio de ligação oligo multiplex (OLA), os produtos ligados específicos foram hibridizados para um único e universal "código postal"sequências oligoméricas covalentemente anexadas a Microesferas Luminex xMAP® Multi-Analyto COOH, e estas hibridizações produtos/microesferas foram detectadas em um sistema multiplex automatizado rápido (instrumento Luminex 100).
[00410]As referências são feitas nas Tabelas 5 e 6 para os dados que permitem concluir que indivíduos portadores de determinados alelo hCV3054799 Arg tiveram um risco aumentado de desenvolver MI recorrente em CARE e eventos CHD em WOSCOPS, e que eles responderam ao tratamento com estatina mostrando uma diminuição nos eventos de CHD. No grupo de placebo (“placebo arm”) do CARE, portadores de alelo de risco KIF6 719 Arg tiveram um Hazard Ratio (razão de falhas) para MI recorrente de 1,50 (95% CI 1,05 para 2,15, Tabela 5) em um modelo ajustado por idade, sexo, tabagismo, histórico de hipertensão, histórico de diabetes, índice de massa corporal, LDL-C, e HDL-C. No grupo de placebo de WOSCOPS, foi encon-trado que os portadores de alelo de risco KIF6 719 Arg tinha uma taxa de probabilidade para CHD de 1,55 (95% CI 1,14 a 2,09, Tabela 5) em um modelo ajustado para histórico de hipertensão, histórico de diabetes, índice de massa corporal, LDL-C, e HDL-C (casos e controles foram ajustados em termos de idade e tabagismo).
[00411]Em CARE, tratamento com pravastatina reduziu o risco relativo de MI recorrente em 37% entre portadores de alelo de risco 719Arg (HR ajustado 0,63, 95% CI 0,46 to 0,87, Tabela 6), e entre portadores em WOSCOPS em tratamento com pravastatina resultou em uma Odds Ratio para CHD primário de 0,50 (95% CI 0,38 a 0,68, Tabela 6). As frequências de genótipo para KIF6 Trp719Arg foram 40,6%, 46,5%, e 12,8%, para TrpTrp, ArgTrp, e ArgArg, respectivamente, em CARE coorte. No grupo de controle WOSCOPS, as frequências foram 44,2%, 43,6%, e 12,2%, respectivamente. Os dados nas Tabelas 5 e 6 foram derivados da seguinte forma:
[00412]Ao analisar pacientes com CARE, análises estatísticas foram efetuadas com SAS versão 9. Cox modelos de risco proporcional (testes WaId) foram usados em CARE para avaliar a associação de genótipo com o risco de MI incidente no grupo de placebo e com o efeito da pravastatina em MI comparado ao placebo em subgrupos definidos por genótipos. Em análise de pacientes WOSCOPS, um modelo de regressão logístico condicional foi usado em WOSCOPS uma vez que os controles foram combinados previamente aos casos. A coluna intitulada "No teste MI" lista o número de pacientes que sofreram um MI recorrente durante o período de testes clínicos.
[00413]HR representa o Hazard Ratio (razão de falhas), que é um conceito similar ao Odds Ratio (OR) (razão de chances). O HR em análises de eventos sem sobreviventes é o efeito de uma variável explicativa de um evento de perigo ou de risco. Por exemplo, a mesma descreve a verossimilhança para desenvolver MI com base na comparação da taxa de eventos coronários entre portadores de determinado alelo e não portadores; por essa taxa, HR= 1,5 significaria que portadores de determinado alelo tem risco 50% maior de eventos coronários durante o acompanhamento do estudo que os não portadores. HR pode também descrever o efeito da te-rapia com estatina em eventos coronários, com base na comparação da taxa de eventos coronários entre pacientes tratados com estatina e paciente tratados com placebo (ou outra estatina), em subgrupos definidos por genótipo de SNP; portanto, HR=0,5 significaria que, for exemplo, portadores de determinado alelo, tiveram 50% de redução de eventos coronários pela terapia com estatina se comparados ao placebo. Na Tabela 6, valores de interação de p foram calculados. Uma interação (ou efeito de modificação) é formada quando uma terceira variável modifica a relação entre uma exposição e resultado. Uma interação de p < 0,05 indica que uma terceira variável (genótipo) modifica a relação entre uma exposição (tratamento com estati- na) e resultado (MI). O genótipo e interação da droga estão presentes quando o efeito de estatinas (taxa de incidência da doença em grupo tratado com estatina, como comparado ao placebo) difere em pacientes com diferentes genótipos. O alelo de risco hCV3054799 previu o risco de MI em CARE e foi associado com odds de CHD em WOSCOPS.
[00414]Em ambos os testes, portadores de alelo de risco KIF6 719Arg (aproximadamente 60% da população) receberam benefício significante da terapia com pravastatina em termos da redução de eventos coronários ao passo que, os não portadores não receberam benefício significante. Além disso, a redução de risco nominal foi maior em portadores de alelo KJF6 719Arg que em não portadores: em CARE, uma redução de risco significante de 37% foi observada em portadores ao passo que uma redução de risco insignificante de 20% foi observada em não portadores, e em WOSCOPS, uma redução de risco significante de 50% foi observada em portadores ao passo que uma redução de risco insignificante de 9% foi observada em não portadores. Uma interação significante entre o genótipo e o tratamento foi observada em WOSCOPS (interação p = 0,01) e não alcançou importância em CARE (p = 0,39) (Tabela 6) (Lakoubova et al., "Associação do polimorfismo Trp719Arg em proteína 6 como a quitosina com o infarto do miocárdio e doença co- ronariana cardíaca em 2 testes prospectivos: os testes CARE e WOSCOPS", J. Am Coll Cardiol. 2008 Jan 29;51(4):435-43, que é incorporada aqui por referência em sua totalidade).
EXEMPLO 2 Portadores de alelo de risco hCV3054799 Beneficiado a partir do Tratamento com Atorvastatina (Lipitor®) em Adição ao Tratamento com Pravastatina (Prava- chol®)
[00415]Como foi discutido anteriormente no EXEMPLO 1, portadores de ale- lo de risco KIF6 719Arg tiveram uma maior redução de MI recorrente e CHD primário nos testes CARE e WOSCOPS (respectivamente) pelo tratamento com pravastatina (Pravachol®), quando comparado ao placebo, que os não portadores (no grupo de placebos destes estudos, foi observado que portadores de alelo KIF6 719Arg tiveram uma incidência 50% maior de CHD comparado aos não portadores). Dadas as observações anteriores de que em CARE e WOSCOPS, portadores de variante de risco KIF6 719Arg tiveram uma maior redução de eventos CHD a partir da terapia com pravastatina, quando comparado ao placebo, que os não portadores, foi determinado se no estudo PROVE-IT ("Terapia de Infecção e Avaliação de Pravastatina ou Atorvastatina"), a terapia intensiva com dose elevada de atorvastatina (Lipitor®), quando comparado com tratamento com a dose padrão de pravastatina, pode resultar em uma maior redução de eventos CHD recorrentes em portadores que em não portadores. Além disso, com este teste, foi determinado se portadores de alelo de risco KIF6 719Arg se beneficiariam de terapia intensiva com dose elevada de ator- vastatina se comparado com a dose padrão de pravastatina, apenas com os portadores de alelo de risco KIF6 719Arg beneficiados pela dose padrão de pravastatina quando comparado a placebo.
[00416]Para estudos adicionais o efeito do tratamento com estatina em portadores de KIF6 719Arg, um estudo de associação genética foi conduzido em uma população derivada do estudo referido como "Terapia de Infecção e Avaliação de Pravastatina ou Atorvastatina -Trombose em Infarto do Miocárdio"(PROVE-IT-TIMI) que avaliou o efeito da atorvastatina quando comparada a pravastatina na prevenção da morte ou maiores eventos cardiovasculares em pacientes com uma síndrome coronária aguda. O modelo do protocolo de PROVE-IT foi descrito previamente (Christopher P. Cannon., et al., Lipídeo moderado versus Intensivo sendo diminuídos com estatinas após síndromes coronárias agudas. N Engl J Med, 2004, 350 (15): pp. 1495-04).
[00417]Resumidamente, este foi um teste aleatório que usou um modelo fatorial dois por dois para comparar o efeito da terapia intensiva com estatina (80 mg de atorvastatina por dia) e terapia moderada com estatina (40 mg de pravastatina por dia) no risco de eventos coronários recorrentes após síndromes coronárias agudas. Pacientes foram acompanhados por 18 a 36 meses, com um acompanhamento médio de 24 meses. Este estudo genético compreendeu 2.061 pacientes que forneceram consentimento informado escrito para a análise genética entre os 4.162 pacientes em coorte de PROVE-IT.
[00418]Para esta análise genética, a avaliação foi limitada para pacientes PROVE-IT que (1) submeteram com sucesso a extração de DNA e genotipagem como descritas neste documento, 32 pacientes foram excluídos devido à quantidade ou qualidade de DNA inadequada; (2) são brancos (uma vez que os não brancos compreenderam apenas 10,4% da população e que forneceram potência suficiente para uma análise separada, e a estratificação da população pode ter comprometido uma análise combinada); (3) tinha informação para todas as co-variáveis ajustadas no modelo 1 e 2, 93 pacientes foram excluídos devido a perdas de informações. Dos 1.724 pacientes que satisfizeram o critério listado acima, 1.344 (78,0%) eram do sexo masculino. Para este estudo genético, foi usado um ponto final de composto de morte de qualquer causa ou evento cardiovascular, o qual incluiu o MI, angina instá- vel documentada que exigiu hospitalização, revascularização (realizadas pelo menos 30 dias após a aleatorização), e derrame cerebral (Iakoubova et al., "Polymorphism em KIF6 gene e benefit from statins after acute coronary syndromes: results from the PROVE IT-TIMI 22 study", J Am Coll Cardiol. 2008 Jan 29;51(4):449-55). Este estudo foi aprovado pela comissão de revisão institucional de Brigham e Hospital de Mulheres e todos os centros participantes. Os genótipos KIF6 foram determinados usando PCR alelo-específico em tempo real como anteriormente descrito. Modelos perigosos proporcionais de Cox (testes WaId) foram usados para avaliar o efeito do tratamento de atorvastatina- no CHD incidente nos portadores de KIF6 719Arg e não portadores. As variáveis contínuas testadas foram a idade, níveis de linha de base de LDL-C e linha de base HDL-C. As variáveis categóricas testadas foram tabagismo (atual versus não atual), hipertensão, e diabetes de linha de base. Todos os valores p relatados são bilaterais.
[00419]A terapia com atorvastatina com dose elevada, quando comparada a terapia com pravastatina com dose padrão, resultou em benefício substancial e sig- nificante em portadores de alelo KIF6 719Arg, mas não em não portadores. Em portadores (58,7% da população de PROVE-IT) a terapia com dose elevada de atorvas- tatina, quando comparado a dose padrão de pravastatina, reduziu o risco relativo de eventos coronários para 44 %. O hazard ratio foi 0,56 (95 % intervalo de confiança 0,42 a 0,75; P < 0,0001) após ajustes por idade, sexo, tabagismo, histórico de hipertensão, histórico de diabetes, níveis de linha de base de LDL-C e HDL-C. Em contraste, em não portadores, a terapia com atorvastatina com dose elevada, quando comparado a dose padrão de pravastatina, resultou no hazard ratio ajustado de 0,97 (95 % intervalo de confiança 0,72 a 1,31; P = 0,84). Esta diferença entre portadores e não portadores que se beneficiaram de dose elevada de atorvastatina foi signifi- cante (P = 0,01 para interação entre o genótipo e o tratamento) (Tabela 7).
[00420]Desse modo, os dados na Tabela 7 mostram o efeito de atorvastati- na, quando comparado a pravastatina, em incidência de eventos coronários em coorte de PROVE-IT. Como visto na Tabela 7, os portadores de alelo KIF6 719Arg beneficiados pela terapia com atorvastatina, quando comparado a pravastatina, e não portadores não receberam benefício significante da atorvastatina. Esta constatação, juntamente com as observações prévias nos estudos CARE e WOSCOPS de que portadores de alelo KIF6 719Arg de risco receberam maior benefício pela pravastati- na que os não portadores, quando comparado a placebo, indica que ambas as esta- tinas (pravastatina e atorvastatina) reduzem significantemente e substancialmente eventos coronários em portadores de alelo KIF6 719Arg, mas não reduz significan- temente e substancialmente os eventos coronários em não portadores. Além disso, a dose elevada de atorvastatina é mais efetiva que a pravastatina na redução de eventos coronários em portadores de alelo KIF6 719Arg (Iakoubova et al., "Polymorphism in KIF6 gene and benefit from statins after acute coronary syndromes: results from the PROVE IT-TIMI 22 study", JAm Coll Cardiol. 2008 Jan 29;51(4):449-55, que é incorporada aqui por referência em sua totalidade).
[00421]Desse modo, pela razão do mostrado no Exemplo 2 de que portadores de alelo KIF6 719Arg se beneficiam de tipos múltiplos diferentes de estatinas (por exemplo, tanto a pravastatina, que é uma estatina hidrofílica, quanto a atorvas- tatina, que é uma estatina lipofílica), este SNP, bem como os outros SNPs associados com a resposta a estatina descritos aqui, é esperado ter similar utilidades sobre a classe total de estatinas, particularmente uma vez que isto foi mostrado ser útil especificamente para as estatinas hidrofílica e lipofílica. Portanto, o SNP KIF6 Trp719Arg é amplamente útil na predição do efeito terapêutico para toda a classe de estatinas, tal como para determinar se um indivíduo será beneficiado por qualquer das estatinas, incluindo, mas não limitada a, fluvastatina (Lescol®), lovastatina (Me- vacor®), rosuvastatina (Crestor®), e sinvastatina (Zocor®), bem como terapias de combinação que incluem uma estatina tal como sinvastatina + ezetimiba (Vytorin®), lovastatina + niacina de liberação extendida (Advicor®), e atorvastatina + besilato de anlodipino (Caduet®).
[00422]Além disso, em portadores de alelo KIF6 719Arg, o benefício signifi- cante e substancial a partir da terapia com atorvastatina com dose elevada, comparado com terapia com pravastatina com dose padrão, foi evidente já nos 30 dias após a aleatorização e permaneceram significantes em todo o teste: o Hazard Ratio não ajustado em 30 dias foi: 0,18 (95% CI, 0,04 to 0,81). Em contraste ao rápido benefício visto nos portadores de alelo KIF6 719Arg, em não portadores não houve benefício significante de terapia intensiva, comparado com terapia moderada, em qualquer ponto do tempo.
[00423]Um vez que os níveis de colesterol LDL-C, CRP e triglicerídeo são fatores de risco para eventos cardiovasculares e podem ser reduzidos por terapia intensiva com estatina, foi analisado se as mudanças nos níveis destes fatores de risco em resposta ao tratamento com atorvastatina em dose elevada ou com pravas- tatina em dose padrão se diferenciaram entre portadores e não portadores de alelo KIF6 719Arg. Nenhuma evidência foi constatada no grupo de atorvastatina com dose elevada ou no grupo com pravastatina com dose padrão de que estes fatores de risco se diferenciaram entre portadores e não portadores a qualquer tempo durante a terapia. Especificamente, em ambos os grupos de tratamento, nenhuma diferença significante nos níveis de LDL-C médio, CRP, ou triglicerídeos foi constatada quando se comparam portadores de não portadores de alelo KIF6 719 Arg de linha de base ou em qualquer visita agendada durante o estudo (p > 0,3).
[00424]Estes dados sugerem que esta superioridade prematura de terapia intensiva com estatina para redução de evento coronário em portadores pode ser devido a um efeito de placa estabilizadora de regime de tratamento intensivo, um efeito pleiotrópico que foi proposto para explicar o benefício prematuro da terapia com estatina que parece não ser devido à diminuição de LDL. Um mecanismo pleio- trópico seria consistente com a observação descrita aqui de que em tratamento os níveis de LDL-C médio não diferem entre portadores e não portadores. Adicional-mente, este benefício prematuro a partir da terapia intensiva com estatina em portadores de alelo KIF6 719Arg é provável ser distinta do mecanismo anti-inflamatório relacionado com a redução de níveis de CRP na linha de base ou durante os testes (Iakoubova et al., "Polymorphism em KIF6 gene and benefit from statins after acute coronary syndromes: results from the PROVE IT-TIMI 22 atudy", J Am Coll Cardiol. 2008 Jan 29;51(4):449-55, que é incorporado aqui por referência em sua totalidade).
EXEMPLO 3: Portadores de Idade Avançada de Variante KIF6 719Arg que estão em Grande Risco para CDH e Também se Beneficiaram da Terapia com Estatina ao passo que não Portadores não se Beneficiaram: Resultados do Estudo PROSPER
[00425]A variante de polimorfismo Trp719Arg(rs20455/hCV3054799) em KIF6 é mostrada nos Exemplos 1 e 2 acima estar associada com maior risco para CHD, particularmente MI, e maior benefício da terapia com estatina. A análise descrita aqui no Exemplo 3 diz respeito à confirmação de que portadores com idade avançada desta variante apresentam maior risco para eventos coronários, e se portadores com idade avançada recebem benefício significante da terapia com estatina.
[00426]Nesta análise, o polimorfismo KIF6 Trp719Arg foi analisado em amostras de "Prospective Study of Pravastatina no Elderly at Risk" teste (PROSPER) (PROSPER is descrito adicionalmente em Shepherd et al., Lancet. 2002 Nov 23;360(9346): 1623-30). PROSPER foi um teste secundário e primário para homens e mulheres com idade avançada (70-82 anos de idade). Uma fração substancial de pacientes no teste PROSPER teve um MI e outras doenças vasculares antes do registro no teste, e o resto dos pacientes não teve um evento vascular antes do registro. Uma vez que uma interação entre o estado portador KIF6 e eventos vasculares anteriores tenha sido observada, grupos com e sem eventos vascula- res anteriores foram genotipados separadamente.
[00427]5752 pacientes foram genotipadas no teste PROSPER, e modelos perigosos de Cox proporcional foram usados para pesquisar (1) o risco para eventos coronários no portado de 719Arg comparado com não portadores em um grupo placebo, e (2) o efeito de terapia com estatina de acordo com o estado do portador de 719Arg em um grupo (“arm”) de sinvastatina.
[00428]A Tabela 8 mostra o número de pacientes de três portadores e genó- tipos (homozigoto + heterozigoto menor) no grupo placebo de teste de PROSPER. Dentre aqueles no grupo placebo com doença vascular anterior, os portadores de 719Arg (59,0%) apresentaram nominalmente risco maior para eventos coronários comparado com não portadores: Hazard Ratio = 1,25 (95% CI 0,95 to 1,64; (Tabela 9). Para heterozigotos comparados com não portadores, o Hazard Ratio = 1,33 (95% CI 1,01 to 1,77; Tabela 9).
[00429]A Tabela 10 mostra o número de pacientes de três portadores e ge- nótipos no grupo placebo de teste de PROSPER. A Tabela 11 mostra o número de pacientes de três carreadores e genótipos (homozigoto + heterozigoto menor) no grupo de pravastatina de teste PROSPER. Para avaliar o efeito de pravastatina, riscos estimados foram usados para comparar o grupo de pravastatina com o grupo placebo em subgrupos definidos por genótipos.
[00430]Entre os portadores de 719Arg com doença vascular anterior, um benefício substancial e significante da terapia com pravastatina foi observado (Hazard Ratio 0,92, 95% CI 0,68 to 1,25; Tabela 12). A interação entre o estado portador de 719Arg e tratamento com pravastatina é mostrado na Tabela 13 (p = 0,12).
[00431]Desse modo, portadores com idade avançada de alelo KIF6 719Arg apresentaram maior risco para CHD (por exemplo, MI) comparado com não portadores, e os portadores com idade avançada de alelo KIF6 719Arg receberam benefício significante da terapia com estatina enquanto que os não portadores não receberam.
EXEMPLO 4: Identificação de SNPs em Desequilíbrio de Ligação com o KIF6 SNP - Análise de 27 SNPs Tagging em CARE e WOSCOPS
[00432]Para identificar SNPs em Desequilíbrio de Ligação com o SNP KIF6 Trp719Arg (rs20455/hCV3054799) que também pode estar associado com CDH, 27 SNPs ( que podem ser referidos aqui como “SNPs de identificação” (tagging SNPs) na região genômica em torno do SNP KIF 6 Trp719Arg foram analisados em amostras dos testes de CARE e WOSCOPS (os testes CARE e WOSCOPS são descritos mais adiante no Exemplo 1) (Iakoubova et al., J Am Coll Cardiol. 2008 Jan 29;51(4):435-43, particularmente o Apêndice Online, que é incorporado aqui por referência em sua totalidade).
[00433]Para testar a associação entre CHD e outros SNPs que podem estar em desequilíbrio de ligação com o SNP KIF6 Trp719Arg, 27 SNPs de identificação foram selecionados, incluindo Trp719Arg em regiões genômicas que flaqueiam o SNP Trp719Arg usando identificação de combinação em dupla (“pairwise”) em Tagger (de Bakker et al., Nat Genet 2005;37: 1217-23) como implementado em Ha- ploview (Bar-rett et al., Bioinformatics 2005;21 :263-5). Estas regiões genômicas de flanqueamento têm amplitude de 95,5kb no gene KIF6 (a partir das posições de nu- cleotídeos 39,347,330 to 39,442,863 no cromossomo 6 (posições de nucleotídeos com base em liberação de #19, Oct 2005; The International HapMap Project. Nature 2003;426:789-96) e contém 148 SNPs que possuem frequências de alelos maiores que 2% em HapMap public release <#>19. Os 27 SNPs de identificação (incluindo o SNP Trp719Arg identificaram 117 destes 148 SNPs com um r2médio de 0,93 (91% de SNPs foram identificados com r2> 0,8; o mínimo r2de identificação 0,7). Os outros 31 dos 148 SNPs são menos prováveis de serem responsáveis pela associação observada de SNP KIF6 Trp719Arg e doença porque eles não estavam em desequilíbrio de ligação forte com o Trp719Arg SNP (r2< 0,25). Estes 27 SNPs de identificação foram genotipados em amostras de CARE e WOSCOPS e o desequilíbrio de ligação foi avaliado entre KIF6 Trp719Arg e os outros SNPs de identificação usando valores r2dos grupos placebo em ambos os estudos.
[00434]Com base nesta análise, foi constatado que cindo destes 27 SNPs de identificação (KIF6 Trp719Arg, bem como rs9471077, rs9394584, rsl 1755763, e rs9471080) estavam associados com MI recorrente no grupo placebo de CARE e com CHD no grupo placebo de WOSCOPS (p < 0,15; meta-análise p < 0,05), com KIF6 Trp719Arg e rs9471077 estando particularmente fortemente associados (Tabela 14). O risco estimado e o valor-p foram calculados com base no modelo genético apresentado na Tabela 14 para cada SNP. As contagens de genótipo no CARE e WOSCOPS também estão apresentadas na Tabela 14. Os resultados de meta- análise fornecidos na Tabela 14 mostram o risco estimado e o valor-p tanto dos mo-delosgenotípicos quanto dos modelos genéticos (aditivo, dominante, recessivo) que geraram valor-p inferior em uma análise de CARE e WOSGOPS combinadas.
[00435]Os valores de SNPs na Tabela 14 (diferente dos SNP KIF 6 Trp719Arg, que é mostrado em outra parte aqui para ser associado com resposta a droga, particularmente se beneficiam do tratamento com estatina) foram adicionalmente analisados para determinar se indivíduos com risco aumentado de CHD se beneficiaram do tratamento com pravastatina. Além do SNP KIF 6 Trp719Arg, quatro outros SNPs na Tabela 14 (rs9471080/hCV29992177, rs9394584/hCV30225864, rs9471077/hCV3054813, e rs9462535/hCV3054808, que é descrito aqui abaixo no Exemplo 4 "Exemplo 4 - Análise Suplementar” seção abaixo) foram constatados estarem associados com benefício pelo tratamento com pravastatina em amostras de CARE e WOSCOPS (isto é mostrado na Tabela 22), em adição a suas associações com risco de CHD (como mostrado na Tabela 14). Desse modo, estes quatro SNPs estão associados com ambos os riscos de CHD (particularmente MI) e benefício por estatina.
[00436]O rs9471077 está em desequilíbrio de ligação com o SNP Trp719Arg (r2= 0,79 em pacientes tratados com placebo), e as razões de risco para Trp719Arg e rs9471077 foram similares no grupo placebo de CARE e WOSCOPS, Após ajustar para fatores de risco convencionais, os Hazard Ratios foram 1,57 e 1,54 (p = 0,01 e 0,02) em CARE para Trp719Arg e rs9471077, respectivamente, e os Odds Ratios ajustados foram 1,59 e 1,46 (p = 0,003 e 0,01) em WOSCOPS para Trp719Arg e rs9471077, respectivamente. Nenhum haplótipo na região KIF 6 foi associado mais significativamente com o MI recorrente em CARE e com CHD em WOSCOPS que o SNP KIF6 Trp719Arg individualmente. A associação de SNP rs9471077 (um SNP intrônico) com CHD é mais provavelmente explicada pelo seu desequilíbrio de reação (r2= 0,79) com o misssense de SNP Trp719Arg, que pode desempenhar um papel funcional na patogênese de CHD e MI.
Exemplo 4 - Análise Suplementar: Análise de Mapeamento Fino de SNPs na Região Genômica em torno do SNP KIF6
[00437]Na análise descrita aqui, outros SNPs em torno do SNP KIF6 foram analisados em CARE (o teste CARE está descrito ainda no Exemplo 1) para identificar SNPs associados com CHD (particularmente RMI) e/ou resposta a droga, em adição aos SNPs descritos no Exemplo 4 acima. Estes marcadores foram localizados por mapeamento fino da região genômica em torno do SNP KIF6 rs20455. A região genômica em torno de KIF6 SNP rs20455 que foi a partir das posições de nucleotídeos 39,335,279 a 39,679,743 de cromossomo 6 (posições de nucleotídeos com base na construção 36 da posição de HapMap (mapa de haplótipos)).
[00438]CARE foi um teste de prevenção secundário. Todos os pacientes no teste CARE tiveram MI dentro de 10 meses antes do registro no teste. Durante os 5 anos de acompanhamento, 264 pacientes experimentaram um outro MI e 2649 pacientes experimentaram um outro MI. Em um grupo tratado com placebo, 150 pacientes entre estes 264 pacientes experimentaram um outro MI. Em um grupo tratado com pravastatina, 114 pacientes experimentaram um outro MI e 1359 pacientes nes- te grupo não desenvolveram um outro MI.
[00439]Foi analisado se indivíduos com genótipos diferentes em certos poli-morfismosgenéticos estavam associados ou não com MI recorrente (RMI) no grupo placebo de CARE. Para esta análise, o seguinte foi comparado usando teste exato de Fischer (Tabela 15): a proporção de eventos de RMI entre indivíduos homozigo- tos menores (portadores de talassemia minor) comparados com a proporção de eventos de RMI entre indivíduos de homozigoto maior; a proporção de eventos RMI entre indivíduos heterozigotos comparada com a proporção de eventos RMI entre indivíduos homozigotos maiores; e a proporção de eventos RMI entre indivíduos he- terozigotos e homozigotos menores comparada com a proporção de eventos RMI entre indivíduos homozigotos maiores. Os resultados de associação para RMI recorrente e contagens de genótipos para diferentes genótipos no grupo placebo de CARE de seis marcadores são mostrados na Tabela 5.
[00440]Para determinar associação com resposta a droga, o teste exato de Fischer foi usado para avaliar o efeito de pravastatina comparado com placebo em subgrupos CARE definidos por genótipos, como segue: a proporção de eventos de RMI entre indivíduos homozigotos menores tratados com pravastatina comparada com a proporção de eventos de RMI entre indivíduos homozigotos menores tratados com placebo; a proporção de eventos de RMI entre indivíduos heterozigotos tratados com pravastatina comparada com a proporção de eventos de RMI entre indivíduos heterozigotos tratados com placebo. A proporção de eventos RMI entre indivíduos homozigotos maiores tratados com pravastatina comparada com a proporção de eventos de RMI entre indivíduos homozigotos maiores tratados com placebo; e a proporção de eventos de RMI entre indivíduos heterozigotos ou homozigotos menores tratado com placebo. As estimativas de Odds Ratios e que correspondem a intervalos de confiança de 95% foram calculados (Tabela 16). As expectativas de desvios a partir de Hardy-Weinberg foram avaliadas usando um teste exato no coorte de CARE. A análise na população de CARE foi efetuada usando RMI como um ponto final. Os polimorfismos genéticos que mostram uma associação significante (valor-p de < 0,05) com um efeito de tratamento com pravastatina em risco de RMI em qualquer dos modelos ou modos descritos acima estão listados na Tabela 16.
[00441]Em análises adicionais, amostras de CARE e WOSCOPS foram combinadas e modelos de regressão logística foram usados para calcular o risco, intervalos de confiança de 95% (95%CI), e valores-p bilaterais (vide "Meta- Analysis" na Tabela 14) para a associação de cada SNP com CHD quando ajustado para cada estudo. Por exemplo, o SNP rs9462535 (hCV3054808), que foi identificado por mapeamento fino da região genômica que cerca o Trp719Arg e analisado em amostras de testes de CARE como já descrito (e apresentado nas Tabelas 15-16), foi adicionalmente analisado em amostras de testes de WOSCOPS, e em uma meta-análise que combina CARE e WOSCOPS. Com base nesta análise suplementar em WOSCOPS e na meta-análise que combina CARE e WOSCOPS, o SNP rs9462535 (hCV3054808) foi adicionalmente confirmado estar associado com CHD (Tabela 14).
Exemplo 5: Marcadores genéticos para Predisposição a Aneurisma ou Dissecção
[00442]A análise descrita aqui no Exemplo 5 se refere a determinação de se o SNP KIF6 (hCV3054799/rs20455) está associado ou não com aneurisma da aorta ou dissecção.
[00443]Para determinar se o SNP KIF6 (hCV3054799) está associado com o aneurisma da aorta ou dissecção, este SNP foi analisado usando os dois seguintes ponto finais: (1) uso de aneurisma da aorta ou dissecção aórtica como um ponto final, que comparou pacientes com aneurisma ou dissecção contra pacientes sem aneurisma ou dissecção (mostrado na Tabela 17), e (2) uso de dissecção aórtica como um ponto final, que comparou pacientes com dissecção contra pacientes sem dissecção (mostrado na Tabela 18).
[00444]As populações de estudo foram como segue. Pacientes caucasianos com aneurismas de aorta torácica (TAA) ou dissecção de aorta torácica foram geno- tipados para a análise de ponto final de dissecção ou aneurisma. 128 pacientes caucasianos com dissecção de aorta torácica foram genotipados para análise de ponto final de dissecção. 180 pacientes sem aneurisma ou dissecção foram usados como controles para ambas as análises. Todas as amostras foram dos Estados Unidos e Hungria (As amostras dos Estados Unidos podem ser referidas aqui como as amostras de “Yale University”).
[00445]Com base nesta análise, o SNP KIF6 (hCV3054799) foi constatado estar associado (valor-p < 0,05) com aneurisma ou dissecção e com dissecção apenas, e o alelo de risco em ambos os exemplos foi o mesmo alelo que estava previamente associado com MI para este SNP (as contagens de genótipo para ambos os pontos finais estão mostardas na Tabela 19 e 20). Alem disso, os genótipos deste SNP em controles não se afastaram das distribuições esperadas sob o equilíbrio de Hardy- Weinberg (valor-p > 0,01).
Exemplo 5 - Análise Suplementar
[00446]A análise descrita aqui nesta seção “Exemplo 5 - Análise Suplementar” se refere a determinação de se o SNP KIF6 (hCV3054799/rs20455) está associado ou não com aneurisma e dissecção da aorta independentemente de CHD.
[00447]Para esta análise, usando as amostras de Yale Universitydo Exemplo 5 acima (que inclui indivíduos com aneurisma ou dissecção da aorta torácica, juntamente com os controles, como descrito acima no Exemplo 5), os indivíduos que tiveram um evento de CHD foram removidos de ambas os conjuntos de amostras de caso e controle. Para esta análise, CHD foi definida como MI, angioplastia coronária transluminal percutânea (PTCA), ou enxerto de desvio de artéria coronária (CABG).
[00448]O SNP KIF6 foi então analisado neste conjunto de amostras (que excluiu indivíduos com CHD) para associação nos dois pontos finais seguintes: 1) dis- secção apenas, e 2) aneurisma ou dissecção. Os resultados desta análise estão apresentados na Tabela 21.
[00449]Como mostrado na tabela 21, o SNP KIF6 (hCV3054799/rs20455) está associado com dissecção, bem como aneurisma ou dissecção, entre pacientes sem CHD. Portanto, a associação de SNP KIF6 (hCV3054799/rs20455) com aneu- risma/dissecção é independente de CHD.
[00450]Desse modo, o SNP KIF6 (hCV3054799/rs20455) está associado com o risco para aneurisma da aorta ou dissecção da aorta (como mostrado no Exemplo 5 e na seção “Exemplo 5 - Análise Suplementar”), bem como risco para outros eventos coronarianos, tais como, CHD (incluindo MI). Portanto, este SNP mostrou estar associado com múltiplos eventos coronários diferentes e é, portanto, esperado ter utilidades similares em outros eventos coronários. Consequentemente, o SNP KIF6 (hCV3054799/rs20455), bem como os outros SNPs descritos aqui, é amplamente útil com relação ao espectro completo de eventos coronarianos. Além disso, o SNP(hCV3054799/rs20455) também foi associado com eventos cardiovasculares como o derrame cerebral (vide, por exemplo, Pedido de Patente U.S. provisional 61/066,584, Luke et al., depositado em 20 de Dezembro de 2008). Portanto, este SNP mostrou estar associado com múltiplos eventos cardiovasculares diferentes e é, portanto, esperado ter utilidades similares em outros eventos cardiovasculares. Consequentemente, o SNP KIF6 (hCV3054799/rs20455), bem como outros SNPs descritos aqui, é amplamente útil como relação ao espectro completo de eventos cardiovasculares. Ademais, este SNP mostrou especificamente estar associado com benefício do tratamento com estatina para redução de eventos de MI, angina instável, revascularização e derrame cerebral. (vide, por exemplo, Exemplo 2). O SN KIF6 P (hCV3054799/rs20455), bem como os outros SNPs descritos aqui, é também particularmente útil para determinar um risco de indivíduo para placa vunerável.
Exemplo 6: SNPs LD Associadas com CHD e resposta a Droga
[00451]Uma outra pesquisa foi conduzida para identificar SNPs adicionais que são calculados para estar em desequilíbrio de ligação (LD) com certos “SNPs interrogados” que foram constatados estar associados com CHD (particularmente MI), aneurisma/dissecção e/ou resposta a droga (particularmente resposta a estati- na), como descrito aqui e mostrado nas tabelas. Os SNPs interrogados são mostrados na coluna 1 (que indica os números de identificação hCV de cada SNP interrogado) e a coluna 2 (que indica os números de identificação RS públicos de cada SNP interrogado) da tabela 4. A metodologia é descrita anteriormente no presente pedido. Para resumir brevemente, o limiar de poder (T) foi estabelecido em um nível apropriado, tal como 51%, para detectar associação de doença usando marcadores LD. Este limiar de poder é baseado na equação (31) acima, que incorpora dados de frequência de alelos a partir de estudos anteriores de associação de doença, a taxa de erro prevista para a não detecção de marcadores associados com doença verdadeira, e um nível de significância de 0,05. Usando este cálculo de poder e tamanho da amostra, um nível de limiar de LD, ou valor r2, foi derivado para cada SNP interrogado (r2T , equações (32) e (33) acima). O valor limiar r2T é o valor mínimo de desequilíbrio de ligação entre o SNP interrogado e seus SNPs LD possível tal que o SNP não interrogado ainda retêm um poder maior ou igual a T para detectar associação a doença.
[00452]Com base na metodologia acima, os SNOs LD foram constatados para os SNPs interrogados. Vários SNP LD exemplares para os SNPs interrogados estão listados na Tabela 4; cada SNP LD está associado com seu respectivo SNP interrogado. Também são mostrados os SNP IDs (números RS) para os SNP LD e o interrogado, quando disponível, o valor de limiar r2e o poder usado para determinar o mesmo, e o valor de r2de desequilíbrio de ligação entre o SNP interrogado e seu SNP LD correspondente. Como no Exemplo 4, o SNP rs20455 (hCV3054799) (o SNP KIF6 que é mostrado aqui estar associado com CHD, particularmente MI, bem como aneurisma/dissecção e resposta a droga, particularmente resposta a estatina) foi calculado para estar em LD com o rs6924090 (hCV29161261) em um valor r2de 1, com base em um cálculo de poder de 51%, desse modo estabelecendo o último SNP como um marcador associado com CHD, aneurisma/dissecção, ou resposta a droga também.
[00453]Todas as publicações e patentes citadas nesta especificação são incorporadas aqui por referência em sua totalidade. Modificações e variações de composições descritas, métodos e sistemas da invenção. Embora a invenção tenha sido descrita com relação as modalidades específicas e certos exemplos de trabalho, deve ser entendido que a invenção como reivindicada não deve ser limitada indevidamente a tais modalidades específicas. Certamente, várias modificações dos modos descritos acima para realização da invenção, que são óbvios para aqueles com habilidade no campo da biologia molecular, genética e campos relacionados, são pre-tendidas estar dentro do escopo das reivindicações que seguem.
Figure img0012
Figure img0013
Figure img0014
Figure img0015
Figure img0016
Figure img0017
Figure img0018
Figure img0019
Figure img0020
Figure img0021
Figure img0022
Figure img0023
Figure img0024
Figure img0025
Figure img0026
Figure img0027
Figure img0028
Figure img0029
Figure img0030
Figure img0031
Figure img0032
Figure img0033
Figure img0034
Figure img0035
Figure img0036
Figure img0037
Figure img0038
Figure img0039
Figure img0040
Figure img0041
Figure img0042
Figure img0043
Figure img0044
Figure img0045
Figure img0046
Figure img0047
Figure img0048
Figure img0049
Figure img0050
Figure img0051
Figure img0052
Figure img0053
Figure img0054
Figure img0055
Figure img0056
Figure img0057
Figure img0058
Figure img0059

Claims (20)

1. Método in vitro para identificar um indivíduo que apresente um risco alterado para desenvolver doença cardíaca coronária (CHD) ou aneurisma/dissecção, CARACTERIZADO pelo fato de que compreende detectar o polimorfismo de nucleo- tídeo único (SNP) na sequência de nucleotídeos da SEQ ID NO: 16 nos ácidos nu- cleicos do dito indivíduo, em que o indivíduo tem um risco aumentado para desenvolver CHD ou aneurisma/dissecção devido a presença de A na posição 101 da SEQ ID NO: 16 ou a presença de T na posição 101 do seu complemento.
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que compreende ainda avaliar a probabilidade de um indivíduo responder ao tratamento com inibidor da HMG-CoA redutase para reduzir o risco do indivíduo ter CHD ou aneurisma/dissecção, em que compreende ainda detectar o polimorfismo de nu- cleotídeo único (SNP) na sequência de nucleotídeos da SEQ ID NO: 16 nos ácidos nucleicos do dito indivíduo, em que o indivíduo tem uma maior probabilidade de responder ao tratamento com inibidor da HMG-CoA redutase devido a presença de A na posição 101 da SEQ ID NO: 16 ou a presença de T na posição 101 do seu complemento.
3. Método, de acordo com a reivindicação 1 ou 2, CARACTERIZADO pelo fato de que os ditos ácidos nucleicos são um extrato de ácido nucleico de uma amostra biológica do dito indivíduo.
4. Método, de acordo com a reivindicação 3, CARACTERIZADO pelo fato de que a dita amostra biológica é sangue, saliva ou swab bucal do indivíduo.
5. Método, de acordo com a reivindicação 3, CARACTERIZADO pelo fato de que compreende ainda preparar o dito extrato de ácido nucleico da dita amostra biológica antes da dita etapa de detecção.
6. Método, de acordo com qualquer uma das reivindicações 1 a 5, CARACTERIZADO pelo fato de que a dita etapa de detecção compreende amplifi- cação de ácido nucleico.
7. Método, de acordo com a reivindicação 6, CARACTERIZADO pelo fato de que a dita amplificação de ácido nucleico é feita pela reação em cadeia da polimera- se.
8. Método, de acordo com qualquer uma das reivindicações 1 a 7, CARACTERIZADO pelo fato de que compreende colocar em contato os ácidos nu- cleicos do indivíduo com um reagente de detecção, e determinar qual nucleotídeo está presente ou ausente na posição 101 da SEQ ID NO: 16.
9. Método, de acordo com a reivindicação 8, CARACTERIZADO pelo fato de que o reagente de detecção é uma sonda ou primer de polinucleotídeo.
10. Método, de acordo com a reivindicação 9, CARACTERIZADO pelo fato de que a extremidade 3’ do reagente de detecção hibridiza com o SNP no ácido nu- cleico.
11. Método, de acordo com a reivindicação 9, CARACTERIZADO pelo fato de que o reagente de detecção é marcado com um corante repórter.
12. Método, de acordo com a reivindicação 1 ou 2, CARACTERIZADO pelo fato de que a dita etapa de detecção é realizada usando sequenciamento, digestão com 5’ nuclease, ensaio de marcação molecular, ensaio de ligação de oligonucleotí- deo, análise de polimorfismo de conformação de fita única, eletroforese em gel com gradiente desnaturante (DGGE) ou um método alelo-específico.
13. Método, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de que o dito método alelo-específico é selecionado a partir do grupo que consiste em hibridização de sonda alelo-específica, extensão de primer alelo-específico e amplificação alelo-específica.
14. Método, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de que o dito método alelo-específico é feito utilizando um primer alelo-específico que consiste na sequência de nucleotídeos da SEQ ID NO: 166 ou SEQ ID NO: 167.
15. Método, de acordo com qualquer uma das reivindicações 12 a 14, CARACTERIZADO pelo fato de que o dito método alelo-específico detecta o dito A ou dito T.
16. Método, de acordo com a reivindicação 1 ou 2, CARACTERIZADO pelo fato de que o dito indivíduo é homozigoto para o dito A ou dito T.
17. Método, de acordo com a reivindicação 1 ou 2, CARACTERIZADO pelo fato de que o dito indivíduo é heterozigoto para o dito A ou dito T.
18. Método, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que o inibidor da HMG-CoA redutase é selecionado a partir do grupo que consiste em pravastatina, atorvastatina, fluvastatina, lovastatina, rosuvastatina e sinvasta- tina.
19. Método, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que o tratamento com inibidor da HMG-CoA redutase compreende um inibidor da HMG-CoA redutase em combinação com pelo menos um agente terapêutico adicional.
20. Método, de acordo com a reivindicação 19, CARACTERIZADO pelo fato de que o tratamento com inibidor de HMG-CoA redutase é selecionado a partir do grupo que consiste em: sinvastatina em combinação com ezetimiba; lovastatina em combinação com niacina de liberação estendida; e atorvastatina em combinação com besilato de amlodipina.
BRPI0809143A 2007-03-22 2008-03-24 método in vitro para identificar um indivíduo que apresente um risco alterado para desenvolver doença cardíaca coronária (chd) ou aneurisma/dissecção BRPI0809143B8 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US91988507P 2007-03-22 2007-03-22
US60/919,885 2007-03-22
PCT/US2008/003857 WO2008118415A2 (en) 2007-03-22 2008-03-24 Genetic polymorphisms associated with coronary events and drug response

Publications (3)

Publication Number Publication Date
BRPI0809143A2 BRPI0809143A2 (pt) 2016-11-16
BRPI0809143B1 true BRPI0809143B1 (pt) 2020-12-01
BRPI0809143B8 BRPI0809143B8 (pt) 2021-07-27

Family

ID=39789193

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0809143A BRPI0809143B8 (pt) 2007-03-22 2008-03-24 método in vitro para identificar um indivíduo que apresente um risco alterado para desenvolver doença cardíaca coronária (chd) ou aneurisma/dissecção

Country Status (6)

Country Link
US (7) US7695916B2 (pt)
EP (2) EP2592157B1 (pt)
JP (2) JP5697339B2 (pt)
BR (1) BRPI0809143B8 (pt)
CA (1) CA2680024C (pt)
WO (1) WO2008118415A2 (pt)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7799530B2 (en) 2005-09-23 2010-09-21 Celera Corporation Genetic polymorphisms associated with cardiovascular disorders and drug response, methods of detection and uses thereof
US7695916B2 (en) * 2007-03-22 2010-04-13 Celera Corporation Genetic polymorphisms associated with coronary events and drug response, methods of detection and uses thereof
WO2010081764A2 (de) * 2009-01-16 2010-07-22 Siemens Aktiengesellschaft Genomweite analyse zur endothelialen dysfunktion
EA201270020A1 (ru) * 2009-06-15 2012-07-30 Кардиодкс, Инк. Определение риска развития атеросклеротической болезни сердца
CN106929568A (zh) * 2009-10-07 2017-07-07 弗·哈夫曼-拉罗切有限公司 用于治疗、诊断和监控狼疮的方法
RU2707959C2 (ru) * 2015-01-27 2019-12-03 Астразенека Аб Способ лечения или профилактики атеротромботических явлений у пациентов с инфарктом миокарда в анамнезе
US11216742B2 (en) 2019-03-04 2022-01-04 Iocurrents, Inc. Data compression and communication using machine learning
US20230203584A1 (en) * 2020-05-08 2023-06-29 The General Hospital Corporation Methods of predicting aneurysms of the ascending and descending aorta

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006510341A (ja) * 2002-02-27 2006-03-30 バイエル・ヘルスケア・アクチェンゲゼルシャフト 有害薬剤反応および薬剤効力を予測する単一ヌクレオチド多型
AU2003245488A1 (en) * 2002-06-13 2003-12-31 Regulome Corporation Functional sites
EP2186913B1 (en) * 2003-11-26 2016-02-10 Celera Corporation Genetic polymorphisms associated with cardiovascular disorders and drug response, methods of detection and uses thereof
US20070059710A1 (en) * 2004-02-27 2007-03-15 Applera Corporation Genetic polymorphisms associated with stroke, methods of detection and uses thereof
US7799530B2 (en) * 2005-09-23 2010-09-21 Celera Corporation Genetic polymorphisms associated with cardiovascular disorders and drug response, methods of detection and uses thereof
US7695916B2 (en) * 2007-03-22 2010-04-13 Celera Corporation Genetic polymorphisms associated with coronary events and drug response, methods of detection and uses thereof

Also Published As

Publication number Publication date
EP2140024A4 (en) 2010-06-09
JP5697339B2 (ja) 2015-04-08
EP2140024B1 (en) 2012-12-19
JP2010521969A (ja) 2010-07-01
CA2680024A1 (en) 2008-10-02
EP2592157B1 (en) 2017-08-16
US20140072550A1 (en) 2014-03-13
EP2592157A1 (en) 2013-05-15
WO2008118415A2 (en) 2008-10-02
US20170022563A1 (en) 2017-01-26
BRPI0809143B8 (pt) 2021-07-27
EP2140024A2 (en) 2010-01-06
US20080241846A1 (en) 2008-10-02
WO2008118415A3 (en) 2008-12-11
US10988809B2 (en) 2021-04-27
US7695916B2 (en) 2010-04-13
US20220154277A1 (en) 2022-05-19
US8148070B2 (en) 2012-04-03
JP2013138686A (ja) 2013-07-18
CA2680024C (en) 2017-07-04
BRPI0809143A2 (pt) 2016-11-16
US20130058914A1 (en) 2013-03-07
US11814684B2 (en) 2023-11-14
US10435749B2 (en) 2019-10-08
US20100120040A1 (en) 2010-05-13
US20200123610A1 (en) 2020-04-23

Similar Documents

Publication Publication Date Title
US12077825B2 (en) Genetic polymorphisms associated with stroke, methods of detection and uses thereof
US11827937B2 (en) Genetic polymorphisms associated with statin response and cardiovascular diseases, methods of detection and uses thereof
JP5111380B2 (ja) 心臓血管障害および薬物応答に関連する遺伝的多型、その検出方法および使用
US11814684B2 (en) Genetic polymorphisms associated with coronary events and drug response, methods of detection and uses thereof
WO2010006215A1 (en) Genetic polymorphisms associated with cardiovascular diseases, methods of detection and uses thereof
JP2009521905A (ja) 冠動脈心疾患に関連する遺伝的多型、その検出方法および使用
CA2649920A1 (en) Genetic polymorphisms associated with coronary heart disease, methods of detection and uses thereof

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B07D Technical examination (opinion) related to article 229 of industrial property law [chapter 7.4 patent gazette]
B07G Grant request does not fulfill article 229-c lpi (prior consent of anvisa) [chapter 7.7 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 01/12/2020, OBSERVADAS AS CONDICOES LEGAIS.

B16C Correction of notification of the grant [chapter 16.3 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 24/03/2008, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO