BRPI0713098A2 - método para determinar a origem anatÈmica de uma célula ou população celular derivada do intestino grosso de um indivìduo, método de detecção para determinar a origem anatÈmica de uma célula ou população celular derivada do intestino grosso de um indivìduo, sistema de detecção, meio de armazenagem legìvel por computador, arranjo de ácido nucleico, uso de um arranjo, método para determinar o inìcio ou predisposição para o inìcio de uma anormalidade celular ou uma condição destinguida por uma anormalidade celular no intestino grosso, kit de diagnóstico para ensaiar amostras biológicas - Google Patents
método para determinar a origem anatÈmica de uma célula ou população celular derivada do intestino grosso de um indivìduo, método de detecção para determinar a origem anatÈmica de uma célula ou população celular derivada do intestino grosso de um indivìduo, sistema de detecção, meio de armazenagem legìvel por computador, arranjo de ácido nucleico, uso de um arranjo, método para determinar o inìcio ou predisposição para o inìcio de uma anormalidade celular ou uma condição destinguida por uma anormalidade celular no intestino grosso, kit de diagnóstico para ensaiar amostras biológicas Download PDFInfo
- Publication number
- BRPI0713098A2 BRPI0713098A2 BRPI0713098-8A BRPI0713098A BRPI0713098A2 BR PI0713098 A2 BRPI0713098 A2 BR PI0713098A2 BR PI0713098 A BRPI0713098 A BR PI0713098A BR PI0713098 A2 BRPI0713098 A2 BR PI0713098A2
- Authority
- BR
- Brazil
- Prior art keywords
- gene
- probe number
- affymetrix probe
- detected
- genes detected
- Prior art date
Links
- 210000002429 large intestine Anatomy 0.000 title claims abstract description 233
- 238000000034 method Methods 0.000 title claims abstract description 175
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 78
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 72
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 70
- 238000001514 detection method Methods 0.000 title claims abstract description 48
- 230000005856 abnormality Effects 0.000 title claims abstract description 23
- 230000001413 cellular effect Effects 0.000 title claims abstract description 22
- 239000012472 biological sample Substances 0.000 title claims description 39
- 238000003860 storage Methods 0.000 title claims description 5
- 238000009007 Diagnostic Kit Methods 0.000 title claims description 3
- 230000014509 gene expression Effects 0.000 claims abstract description 365
- 210000000936 intestine Anatomy 0.000 claims abstract description 12
- 108090000623 proteins and genes Proteins 0.000 claims description 1852
- 239000000523 sample Substances 0.000 claims description 1063
- -1 REGIA Proteins 0.000 claims description 69
- 238000004458 analytical method Methods 0.000 claims description 48
- 238000012545 processing Methods 0.000 claims description 39
- 238000012549 training Methods 0.000 claims description 38
- 210000004534 cecum Anatomy 0.000 claims description 34
- 210000000664 rectum Anatomy 0.000 claims description 34
- 102000004169 proteins and genes Human genes 0.000 claims description 30
- 239000003550 marker Substances 0.000 claims description 22
- 239000012634 fragment Substances 0.000 claims description 19
- 238000012706 support-vector machine Methods 0.000 claims description 19
- 102100033175 Ethanolamine kinase 1 Human genes 0.000 claims description 18
- 101000851032 Homo sapiens Ethanolamine kinase 1 Proteins 0.000 claims description 18
- 101001090074 Homo sapiens Small nuclear protein PRAC1 Proteins 0.000 claims description 18
- 102100027819 Cytosolic beta-glucosidase Human genes 0.000 claims description 17
- 101000859692 Homo sapiens Cytosolic beta-glucosidase Proteins 0.000 claims description 17
- 102100034766 Small nuclear protein PRAC1 Human genes 0.000 claims description 17
- 102100029232 Alpha-N-acetylgalactosaminide alpha-2,6-sialyltransferase 6 Human genes 0.000 claims description 16
- 102100030860 Exocyst complex component 3 Human genes 0.000 claims description 16
- 101000634076 Homo sapiens Alpha-N-acetylgalactosaminide alpha-2,6-sialyltransferase 6 Proteins 0.000 claims description 16
- 101000938444 Homo sapiens Exocyst complex component 3 Proteins 0.000 claims description 16
- 101000623897 Homo sapiens Mucin-12 Proteins 0.000 claims description 16
- 102100023143 Mucin-12 Human genes 0.000 claims description 16
- 102100022749 Aminopeptidase N Human genes 0.000 claims description 15
- 108010049990 CD13 Antigens Proteins 0.000 claims description 15
- 108091034117 Oligonucleotide Proteins 0.000 claims description 15
- 108020004999 messenger RNA Proteins 0.000 claims description 15
- 239000002773 nucleotide Substances 0.000 claims description 15
- 125000003729 nucleotide group Chemical group 0.000 claims description 15
- 108010001496 Galectin 2 Proteins 0.000 claims description 14
- 102100039558 Galectin-3 Human genes 0.000 claims description 14
- 101000998774 Homo sapiens Insulin-like peptide INSL5 Proteins 0.000 claims description 14
- 102100033266 Insulin-like peptide INSL5 Human genes 0.000 claims description 14
- 102100027336 Regenerating islet-derived protein 3-alpha Human genes 0.000 claims description 14
- 102000017906 ADRA2A Human genes 0.000 claims description 13
- 108010020070 Cytochrome P-450 CYP2B6 Proteins 0.000 claims description 13
- 102000009666 Cytochrome P-450 CYP2B6 Human genes 0.000 claims description 13
- 108010000543 Cytochrome P-450 CYP2C9 Proteins 0.000 claims description 13
- 102100029358 Cytochrome P450 2C9 Human genes 0.000 claims description 13
- 101000756842 Homo sapiens Alpha-2A adrenergic receptor Proteins 0.000 claims description 13
- 101000595669 Homo sapiens Pituitary homeobox 2 Proteins 0.000 claims description 13
- 101000891842 Homo sapiens Protein FAM3B Proteins 0.000 claims description 13
- 102100036090 Pituitary homeobox 2 Human genes 0.000 claims description 13
- 102100040307 Protein FAM3B Human genes 0.000 claims description 13
- 108091002660 WAP Four-Disulfide Core Domain Protein 2 Proteins 0.000 claims description 13
- 102000021095 WAP Four-Disulfide Core Domain Protein 2 Human genes 0.000 claims description 13
- 108010067083 3 beta-hydroxysteroid dehydrogenase type II Proteins 0.000 claims description 12
- 102100031974 CMP-N-acetylneuraminate-beta-galactosamide-alpha-2,3-sialyltransferase 4 Human genes 0.000 claims description 12
- 102100029368 Cytochrome P450 2C18 Human genes 0.000 claims description 12
- 101000703754 Homo sapiens CMP-N-acetylneuraminate-beta-galactosamide-alpha-2,3-sialyltransferase 4 Proteins 0.000 claims description 12
- 101000991618 Homo sapiens Meprin A subunit beta Proteins 0.000 claims description 12
- 101000995194 Homo sapiens Nebulette Proteins 0.000 claims description 12
- 102100030876 Meprin A subunit beta Human genes 0.000 claims description 12
- 102100034431 Nebulette Human genes 0.000 claims description 12
- 108091006529 SLC28A2 Proteins 0.000 claims description 12
- 102100021541 Sodium/nucleoside cotransporter 2 Human genes 0.000 claims description 12
- 102100039081 Steroid Delta-isomerase Human genes 0.000 claims description 12
- 102100035473 2'-5'-oligoadenylate synthase-like protein Human genes 0.000 claims description 11
- 102100021420 Defensin-5 Human genes 0.000 claims description 11
- 102100040896 Growth/differentiation factor 15 Human genes 0.000 claims description 11
- 101000597360 Homo sapiens 2'-5'-oligoadenylate synthase-like protein Proteins 0.000 claims description 11
- 101001041589 Homo sapiens Defensin-5 Proteins 0.000 claims description 11
- 101000893549 Homo sapiens Growth/differentiation factor 15 Proteins 0.000 claims description 11
- 101000902205 Homo sapiens Inactive cytidine monophosphate-N-acetylneuraminic acid hydroxylase Proteins 0.000 claims description 11
- 101000972276 Homo sapiens Mucin-5B Proteins 0.000 claims description 11
- 101000591211 Homo sapiens Receptor-type tyrosine-protein phosphatase O Proteins 0.000 claims description 11
- 101000695838 Homo sapiens Receptor-type tyrosine-protein phosphatase U Proteins 0.000 claims description 11
- 102100022247 Inactive cytidine monophosphate-N-acetylneuraminic acid hydroxylase Human genes 0.000 claims description 11
- 102100022494 Mucin-5B Human genes 0.000 claims description 11
- 102100034086 Receptor-type tyrosine-protein phosphatase O Human genes 0.000 claims description 11
- 108091006583 SLC14A2 Proteins 0.000 claims description 11
- 108091006788 SLC20A1 Proteins 0.000 claims description 11
- 102100030053 Secreted frizzled-related protein 3 Human genes 0.000 claims description 11
- 108010005020 Serine Peptidase Inhibitor Kazal-Type 5 Proteins 0.000 claims description 11
- 102100025420 Serine protease inhibitor Kazal-type 5 Human genes 0.000 claims description 11
- 102100029797 Sodium-dependent phosphate transporter 1 Human genes 0.000 claims description 11
- 102100031085 Urea transporter 2 Human genes 0.000 claims description 11
- 108010020277 WD repeat containing planar cell polarity effector Proteins 0.000 claims description 11
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 11
- 210000001815 ascending colon Anatomy 0.000 claims description 11
- 102100023702 C-C motif chemokine 13 Human genes 0.000 claims description 10
- 102100038767 Carbohydrate sulfotransferase 5 Human genes 0.000 claims description 10
- 102100039992 Gliomedin Human genes 0.000 claims description 10
- 102100040227 Homeobox protein Hox-D13 Human genes 0.000 claims description 10
- 101000978379 Homo sapiens C-C motif chemokine 13 Proteins 0.000 claims description 10
- 101000882994 Homo sapiens Carbohydrate sulfotransferase 5 Proteins 0.000 claims description 10
- 101000886916 Homo sapiens Gliomedin Proteins 0.000 claims description 10
- 101001037168 Homo sapiens Homeobox protein Hox-D13 Proteins 0.000 claims description 10
- 101001044940 Homo sapiens Insulin-like growth factor-binding protein 2 Proteins 0.000 claims description 10
- 101000947690 Homo sapiens Major facilitator superfamily domain-containing protein 4A Proteins 0.000 claims description 10
- 101000983161 Homo sapiens Phospholipase A2, membrane associated Proteins 0.000 claims description 10
- 102100022710 Insulin-like growth factor-binding protein 2 Human genes 0.000 claims description 10
- 102100036204 Major facilitator superfamily domain-containing protein 4A Human genes 0.000 claims description 10
- 102100026831 Phospholipase A2, membrane associated Human genes 0.000 claims description 10
- 108091006307 SLC2A10 Proteins 0.000 claims description 10
- 108091006649 SLC9A3 Proteins 0.000 claims description 10
- 102100030375 Sodium/hydrogen exchanger 3 Human genes 0.000 claims description 10
- 102100039670 Solute carrier family 2, facilitated glucose transporter member 10 Human genes 0.000 claims description 10
- 108010088412 Trefoil Factor-1 Proteins 0.000 claims description 10
- 102100039175 Trefoil factor 1 Human genes 0.000 claims description 10
- 210000001731 descending colon Anatomy 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 102100023826 ADP-ribosylation factor 4 Human genes 0.000 claims description 9
- 102100039164 Acetyl-CoA carboxylase 1 Human genes 0.000 claims description 9
- 102100037232 Amiloride-sensitive sodium channel subunit beta Human genes 0.000 claims description 9
- 102100021253 Antileukoproteinase Human genes 0.000 claims description 9
- 102100023046 Band 4.1-like protein 3 Human genes 0.000 claims description 9
- 102100029335 Beta-crystallin A2 Human genes 0.000 claims description 9
- 102100035344 Cadherin-related family member 1 Human genes 0.000 claims description 9
- 102100032215 Cathepsin E Human genes 0.000 claims description 9
- 102100033488 DENN domain-containing protein 10 Human genes 0.000 claims description 9
- 102100034108 DnaJ homolog subfamily C member 12 Human genes 0.000 claims description 9
- 101150016325 EPHA3 gene Proteins 0.000 claims description 9
- 102100030324 Ephrin type-A receptor 3 Human genes 0.000 claims description 9
- 108010013996 Fibromodulin Proteins 0.000 claims description 9
- 102000017177 Fibromodulin Human genes 0.000 claims description 9
- 102100029284 Hepatocyte nuclear factor 3-beta Human genes 0.000 claims description 9
- 102100021086 Homeobox protein Hox-D4 Human genes 0.000 claims description 9
- 101000684189 Homo sapiens ADP-ribosylation factor 4 Proteins 0.000 claims description 9
- 101000963424 Homo sapiens Acetyl-CoA carboxylase 1 Proteins 0.000 claims description 9
- 101000740426 Homo sapiens Amiloride-sensitive sodium channel subunit beta Proteins 0.000 claims description 9
- 101000615334 Homo sapiens Antileukoproteinase Proteins 0.000 claims description 9
- 101001049975 Homo sapiens Band 4.1-like protein 3 Proteins 0.000 claims description 9
- 101000919133 Homo sapiens Beta-crystallin A2 Proteins 0.000 claims description 9
- 101000737767 Homo sapiens Cadherin-related family member 1 Proteins 0.000 claims description 9
- 101000869031 Homo sapiens Cathepsin E Proteins 0.000 claims description 9
- 101000870988 Homo sapiens DENN domain-containing protein 10 Proteins 0.000 claims description 9
- 101000870234 Homo sapiens DnaJ homolog subfamily C member 12 Proteins 0.000 claims description 9
- 101001062347 Homo sapiens Hepatocyte nuclear factor 3-beta Proteins 0.000 claims description 9
- 101001041136 Homo sapiens Homeobox protein Hox-D4 Proteins 0.000 claims description 9
- 101001077604 Homo sapiens Insulin receptor substrate 1 Proteins 0.000 claims description 9
- 101000739168 Homo sapiens Mammaglobin-B Proteins 0.000 claims description 9
- 101000627861 Homo sapiens Matrix metalloproteinase-28 Proteins 0.000 claims description 9
- 101001055386 Homo sapiens Melanophilin Proteins 0.000 claims description 9
- 101000951325 Homo sapiens Mitoferrin-1 Proteins 0.000 claims description 9
- 101001023037 Homo sapiens Myoferlin Proteins 0.000 claims description 9
- 101001072470 Homo sapiens N-acetylglucosamine-1-phosphotransferase subunits alpha/beta Proteins 0.000 claims description 9
- 101000582929 Homo sapiens Plasmolipin Proteins 0.000 claims description 9
- 101000886222 Homo sapiens Polypeptide N-acetylgalactosaminyltransferase 5 Proteins 0.000 claims description 9
- 101000933607 Homo sapiens Protein BTG3 Proteins 0.000 claims description 9
- 101000911753 Homo sapiens Protein FAM107B Proteins 0.000 claims description 9
- 101000735466 Homo sapiens Protein mono-ADP-ribosyltransferase PARP8 Proteins 0.000 claims description 9
- 101000633417 Homo sapiens Putative neuropeptide Y receptor type 6 Proteins 0.000 claims description 9
- 101000580716 Homo sapiens RNA-binding protein 24 Proteins 0.000 claims description 9
- 101001104105 Homo sapiens Rap1 GTPase-activating protein 2 Proteins 0.000 claims description 9
- 101000632535 Homo sapiens SH3 domain-binding protein 4 Proteins 0.000 claims description 9
- 101000642262 Homo sapiens Spondin-1 Proteins 0.000 claims description 9
- 101000879389 Homo sapiens Syntabulin Proteins 0.000 claims description 9
- 101000787917 Homo sapiens Transmembrane protein 200A Proteins 0.000 claims description 9
- 101000762128 Homo sapiens Tumor suppressor candidate 3 Proteins 0.000 claims description 9
- 102100025087 Insulin receptor substrate 1 Human genes 0.000 claims description 9
- 102100037267 Mammaglobin-B Human genes 0.000 claims description 9
- 102100026799 Matrix metalloproteinase-28 Human genes 0.000 claims description 9
- 102100026158 Melanophilin Human genes 0.000 claims description 9
- 102100037984 Mitoferrin-1 Human genes 0.000 claims description 9
- 102100035083 Myoferlin Human genes 0.000 claims description 9
- 102100036710 N-acetylglucosamine-1-phosphotransferase subunits alpha/beta Human genes 0.000 claims description 9
- 102100030265 Plasmolipin Human genes 0.000 claims description 9
- 102100039697 Polypeptide N-acetylgalactosaminyltransferase 5 Human genes 0.000 claims description 9
- 102100026035 Protein BTG3 Human genes 0.000 claims description 9
- 102100026983 Protein FAM107B Human genes 0.000 claims description 9
- 102100034933 Protein mono-ADP-ribosyltransferase PARP8 Human genes 0.000 claims description 9
- 102100029544 Putative neuropeptide Y receptor type 6 Human genes 0.000 claims description 9
- 102100027487 RNA-binding protein 24 Human genes 0.000 claims description 9
- 102100040091 Rap1 GTPase-activating protein 2 Human genes 0.000 claims description 9
- 102100028409 SH3 domain-binding protein 4 Human genes 0.000 claims description 9
- 102100036428 Spondin-1 Human genes 0.000 claims description 9
- 101000879712 Streptomyces lividans Protease inhibitor Proteins 0.000 claims description 9
- 102100037396 Syntabulin Human genes 0.000 claims description 9
- 102100025940 Transmembrane protein 200A Human genes 0.000 claims description 9
- 102100024248 Tumor suppressor candidate 3 Human genes 0.000 claims description 9
- 102100029153 UDP-glucuronosyltransferase 1A3 Human genes 0.000 claims description 9
- 101710205493 UDP-glucuronosyltransferase 1A3 Proteins 0.000 claims description 9
- 102100040210 UDP-glucuronosyltransferase 1A8 Human genes 0.000 claims description 9
- 108010074998 UGT1A8 UDP-glucuronosyltransferase Proteins 0.000 claims description 9
- 102100035905 1-acylglycerol-3-phosphate O-acyltransferase ABHD5 Human genes 0.000 claims description 8
- 102100033893 Arylsulfatase J Human genes 0.000 claims description 8
- 102100023054 Band 4.1-like protein 4A Human genes 0.000 claims description 8
- 102100039888 Beta-1,3-galactosyl-O-glycosyl-glycoprotein beta-1,6-N-acetylglucosaminyltransferase Human genes 0.000 claims description 8
- 102100032756 Cysteine-rich protein 1 Human genes 0.000 claims description 8
- 102100036504 Dehydrogenase/reductase SDR family member 9 Human genes 0.000 claims description 8
- 102100035493 E3 ubiquitin-protein ligase NEDD4-like Human genes 0.000 claims description 8
- 102100021957 Endonuclease domain-containing 1 protein Human genes 0.000 claims description 8
- 102100036813 Eukaryotic peptide chain release factor GTP-binding subunit ERF3B Human genes 0.000 claims description 8
- 102100038514 FERM domain-containing protein 3 Human genes 0.000 claims description 8
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 claims description 8
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 claims description 8
- 102100039397 Gap junction beta-3 protein Human genes 0.000 claims description 8
- 102100021383 Guanine nucleotide exchange factor DBS Human genes 0.000 claims description 8
- 102100025056 Homeobox protein Hox-B6 Human genes 0.000 claims description 8
- 102100022599 Homeobox protein Hox-C6 Human genes 0.000 claims description 8
- 102100040228 Homeobox protein Hox-D3 Human genes 0.000 claims description 8
- 101000929840 Homo sapiens 1-acylglycerol-3-phosphate O-acyltransferase ABHD5 Proteins 0.000 claims description 8
- 101000925514 Homo sapiens Arylsulfatase J Proteins 0.000 claims description 8
- 101001049968 Homo sapiens Band 4.1-like protein 4A Proteins 0.000 claims description 8
- 101000887645 Homo sapiens Beta-1,3-galactosyl-O-glycosyl-glycoprotein beta-1,6-N-acetylglucosaminyltransferase Proteins 0.000 claims description 8
- 101000945426 Homo sapiens CB1 cannabinoid receptor-interacting protein 1 Proteins 0.000 claims description 8
- 101000942084 Homo sapiens Cysteine-rich protein 1 Proteins 0.000 claims description 8
- 101000919360 Homo sapiens Cytochrome P450 2C18 Proteins 0.000 claims description 8
- 101000928746 Homo sapiens Dehydrogenase/reductase SDR family member 9 Proteins 0.000 claims description 8
- 101001023703 Homo sapiens E3 ubiquitin-protein ligase NEDD4-like Proteins 0.000 claims description 8
- 101000897352 Homo sapiens Endonuclease domain-containing 1 protein Proteins 0.000 claims description 8
- 101000851786 Homo sapiens Eukaryotic peptide chain release factor GTP-binding subunit ERF3B Proteins 0.000 claims description 8
- 101001030545 Homo sapiens FERM domain-containing protein 3 Proteins 0.000 claims description 8
- 101000889136 Homo sapiens Gap junction beta-3 protein Proteins 0.000 claims description 8
- 101000615232 Homo sapiens Guanine nucleotide exchange factor DBS Proteins 0.000 claims description 8
- 101001077542 Homo sapiens Homeobox protein Hox-B6 Proteins 0.000 claims description 8
- 101001045154 Homo sapiens Homeobox protein Hox-C6 Proteins 0.000 claims description 8
- 101001037158 Homo sapiens Homeobox protein Hox-D3 Proteins 0.000 claims description 8
- 101001053263 Homo sapiens Insulin gene enhancer protein ISL-1 Proteins 0.000 claims description 8
- 101001044098 Homo sapiens LINE-1 type transposase domain-containing protein 1 Proteins 0.000 claims description 8
- 101000577881 Homo sapiens Macrophage metalloelastase Proteins 0.000 claims description 8
- 101001133056 Homo sapiens Mucin-1 Proteins 0.000 claims description 8
- 101001121539 Homo sapiens P2Y purinoceptor 14 Proteins 0.000 claims description 8
- 101000608154 Homo sapiens Peroxiredoxin-like 2A Proteins 0.000 claims description 8
- 101001094649 Homo sapiens Popeye domain-containing protein 3 Proteins 0.000 claims description 8
- 101001047102 Homo sapiens Potassium voltage-gated channel subfamily G member 1 Proteins 0.000 claims description 8
- 101000891845 Homo sapiens Protein FAM3C Proteins 0.000 claims description 8
- 101001090077 Homo sapiens Putative protein PRAC2 Proteins 0.000 claims description 8
- 101000665882 Homo sapiens Retinol-binding protein 4 Proteins 0.000 claims description 8
- 101000631713 Homo sapiens Signal peptide, CUB and EGF-like domain-containing protein 2 Proteins 0.000 claims description 8
- 101001131204 Homo sapiens Sulfhydryl oxidase 1 Proteins 0.000 claims description 8
- 101000744938 Homo sapiens Zinc finger protein 493 Proteins 0.000 claims description 8
- 102100024392 Insulin gene enhancer protein ISL-1 Human genes 0.000 claims description 8
- 102100021610 LINE-1 type transposase domain-containing protein 1 Human genes 0.000 claims description 8
- 102100027998 Macrophage metalloelastase Human genes 0.000 claims description 8
- 102100034256 Mucin-1 Human genes 0.000 claims description 8
- 102100025808 P2Y purinoceptor 14 Human genes 0.000 claims description 8
- 102100039896 Peroxiredoxin-like 2A Human genes 0.000 claims description 8
- 102100035477 Popeye domain-containing protein 3 Human genes 0.000 claims description 8
- 102100022783 Potassium voltage-gated channel subfamily G member 1 Human genes 0.000 claims description 8
- 102100040823 Protein FAM3C Human genes 0.000 claims description 8
- 102100034783 Putative protein PRAC2 Human genes 0.000 claims description 8
- 102100038246 Retinol-binding protein 4 Human genes 0.000 claims description 8
- 102100028932 Signal peptide, CUB and EGF-like domain-containing protein 2 Human genes 0.000 claims description 8
- 102100034371 Sulfhydryl oxidase 1 Human genes 0.000 claims description 8
- 102100039971 Zinc finger protein 493 Human genes 0.000 claims description 8
- 238000001574 biopsy Methods 0.000 claims description 8
- 238000000491 multivariate analysis Methods 0.000 claims description 8
- 102100024273 BTB/POZ domain-containing protein 3 Human genes 0.000 claims description 7
- 102100039077 Cytosolic 10-formyltetrahydrofolate dehydrogenase Human genes 0.000 claims description 7
- 102100025137 Early activation antigen CD69 Human genes 0.000 claims description 7
- 101000761886 Homo sapiens BTB/POZ domain-containing protein 3 Proteins 0.000 claims description 7
- 101000959030 Homo sapiens Cytosolic 10-formyltetrahydrofolate dehydrogenase Proteins 0.000 claims description 7
- 101000865479 Homo sapiens Defensin-6 Proteins 0.000 claims description 7
- 101000934374 Homo sapiens Early activation antigen CD69 Proteins 0.000 claims description 7
- 101000583239 Homo sapiens Nicotinate-nucleotide pyrophosphorylase [carboxylating] Proteins 0.000 claims description 7
- 101000734572 Homo sapiens Phosphoenolpyruvate carboxykinase, cytosolic [GTP] Proteins 0.000 claims description 7
- 101000581815 Homo sapiens Regenerating islet-derived protein 3-alpha Proteins 0.000 claims description 7
- 101000654479 Homo sapiens SID1 transmembrane family member 1 Proteins 0.000 claims description 7
- 101000844519 Homo sapiens Transient receptor potential cation channel subfamily M member 6 Proteins 0.000 claims description 7
- 101000830742 Homo sapiens Tryptophan 5-hydroxylase 1 Proteins 0.000 claims description 7
- 102100030830 Nicotinate-nucleotide pyrophosphorylase [carboxylating] Human genes 0.000 claims description 7
- 102100034796 Phosphoenolpyruvate carboxykinase, cytosolic [GTP] Human genes 0.000 claims description 7
- 102100031454 SID1 transmembrane family member 1 Human genes 0.000 claims description 7
- 102000003608 TRPM6 Human genes 0.000 claims description 7
- 102100024971 Tryptophan 5-hydroxylase 1 Human genes 0.000 claims description 7
- 102100040198 UDP-glucuronosyltransferase 1-6 Human genes 0.000 claims description 7
- 101710008381 UGT1A6 Proteins 0.000 claims description 7
- 239000003795 chemical substances by application Substances 0.000 claims description 7
- 102100029963 Beta-galactoside alpha-2,6-sialyltransferase 2 Human genes 0.000 claims description 6
- 102100034871 C-C motif chemokine 8 Human genes 0.000 claims description 6
- 102100027238 Calpain-13 Human genes 0.000 claims description 6
- 102100030862 Eyes absent homolog 2 Human genes 0.000 claims description 6
- 102100028636 HLA class II histocompatibility antigen, DR beta 4 chain Human genes 0.000 claims description 6
- 108010040960 HLA-DRB4 Chains Proteins 0.000 claims description 6
- 101000863891 Homo sapiens Beta-galactoside alpha-2,6-sialyltransferase 2 Proteins 0.000 claims description 6
- 101000946794 Homo sapiens C-C motif chemokine 8 Proteins 0.000 claims description 6
- 101000984469 Homo sapiens Calpain-13 Proteins 0.000 claims description 6
- 101000938438 Homo sapiens Eyes absent homolog 2 Proteins 0.000 claims description 6
- 101000972489 Homo sapiens Laminin subunit alpha-1 Proteins 0.000 claims description 6
- 101000638903 Homo sapiens U3 small nucleolar RNA-associated protein 25 homolog Proteins 0.000 claims description 6
- 108090000320 Hyaluronan Synthases Proteins 0.000 claims description 6
- 102000003918 Hyaluronan Synthases Human genes 0.000 claims description 6
- 102100022746 Laminin subunit alpha-1 Human genes 0.000 claims description 6
- 108091006694 SLC23A3 Proteins 0.000 claims description 6
- 108091006920 SLC38A2 Proteins 0.000 claims description 6
- 108091007630 SLC51A1 Proteins 0.000 claims description 6
- 102100033774 Sodium-coupled neutral amino acid transporter 2 Human genes 0.000 claims description 6
- 102100034248 Solute carrier family 23 member 3 Human genes 0.000 claims description 6
- 102100031542 U3 small nucleolar RNA-associated protein 25 homolog Human genes 0.000 claims description 6
- 239000003153 chemical reaction reagent Substances 0.000 claims description 6
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 claims description 5
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 claims description 5
- 101000692648 Avena sativa Phytochrome A type 3 Proteins 0.000 claims description 5
- 102100029274 Hexokinase HKDC1 Human genes 0.000 claims description 5
- 101000988521 Homo sapiens Hexokinase HKDC1 Proteins 0.000 claims description 5
- 102100039506 Organic solute transporter subunit alpha Human genes 0.000 claims description 5
- 102100040255 Tubulin-specific chaperone C Human genes 0.000 claims description 5
- 102000004311 liver X receptors Human genes 0.000 claims description 5
- 108090000865 liver X receptors Proteins 0.000 claims description 5
- 238000002271 resection Methods 0.000 claims description 5
- 108010093459 tubulin-specific chaperone C Proteins 0.000 claims description 5
- 102100038495 Bile acid receptor Human genes 0.000 claims description 4
- 102100023701 C-C motif chemokine 18 Human genes 0.000 claims description 4
- 101000603876 Homo sapiens Bile acid receptor Proteins 0.000 claims description 4
- 101000978371 Homo sapiens C-C motif chemokine 18 Proteins 0.000 claims description 4
- 108091006925 SLC37A3 Proteins 0.000 claims description 4
- 102100038952 Sugar phosphate exchanger 3 Human genes 0.000 claims description 4
- 108010012052 cytochrome P-450 CYP2C subfamily Proteins 0.000 claims description 4
- 238000012417 linear regression Methods 0.000 claims description 4
- 108040000983 polyphosphate:AMP phosphotransferase activity proteins Proteins 0.000 claims description 4
- 241000792859 Enema Species 0.000 claims description 3
- 101000623904 Homo sapiens Mucin-17 Proteins 0.000 claims description 3
- 101000830603 Homo sapiens Tumor necrosis factor ligand superfamily member 11 Proteins 0.000 claims description 3
- 102100023125 Mucin-17 Human genes 0.000 claims description 3
- 108091006629 SLC13A2 Proteins 0.000 claims description 3
- 102100036804 Solute carrier family 13 member 2 Human genes 0.000 claims description 3
- 102100024568 Tumor necrosis factor ligand superfamily member 11 Human genes 0.000 claims description 3
- 239000007920 enema Substances 0.000 claims description 3
- 229940095399 enema Drugs 0.000 claims description 3
- 230000001747 exhibiting effect Effects 0.000 claims description 3
- 230000003902 lesion Effects 0.000 claims description 3
- 102100029184 Calmodulin regulator protein PCP4 Human genes 0.000 claims description 2
- 102100033183 Epithelial membrane protein 1 Human genes 0.000 claims description 2
- 102100034051 Heat shock protein HSP 90-alpha Human genes 0.000 claims description 2
- 101000988362 Homo sapiens Calmodulin regulator protein PCP4 Proteins 0.000 claims description 2
- 101000850989 Homo sapiens Epithelial membrane protein 1 Proteins 0.000 claims description 2
- 101001016865 Homo sapiens Heat shock protein HSP 90-alpha Proteins 0.000 claims description 2
- 101001078626 Homo sapiens Heat shock protein HSP 90-alpha A2 Proteins 0.000 claims description 2
- 101000610551 Homo sapiens Prominin-1 Proteins 0.000 claims description 2
- 102100040120 Prominin-1 Human genes 0.000 claims description 2
- 230000002550 fecal effect Effects 0.000 claims description 2
- 102100026096 Claudin-8 Human genes 0.000 claims 6
- 101000912659 Homo sapiens Claudin-8 Proteins 0.000 claims 6
- 102100021088 Homeobox protein Hox-B13 Human genes 0.000 claims 3
- 101001041145 Homo sapiens Homeobox protein Hox-B13 Proteins 0.000 claims 3
- 108010041834 Growth Differentiation Factor 15 Proteins 0.000 claims 2
- 102000000597 Growth Differentiation Factor 15 Human genes 0.000 claims 2
- 101000997654 Homo sapiens N-acetylmannosamine kinase Proteins 0.000 claims 2
- 101150079573 MOCS1 gene Proteins 0.000 claims 2
- 102100033341 N-acetylmannosamine kinase Human genes 0.000 claims 2
- 102100030680 SH3 and multiple ankyrin repeat domains protein 2 Human genes 0.000 claims 2
- 101710067890 SHANK2 Proteins 0.000 claims 2
- 101150036080 at gene Proteins 0.000 claims 2
- 102100029463 Aquaporin-8 Human genes 0.000 claims 1
- 102100020671 Calcium-transporting ATPase type 2C member 2 Human genes 0.000 claims 1
- 102100025172 Calpain-1 catalytic subunit Human genes 0.000 claims 1
- 102100030099 Chloride anion exchanger Human genes 0.000 claims 1
- 101000771417 Homo sapiens Aquaporin-8 Proteins 0.000 claims 1
- 101000785236 Homo sapiens Calcium-transporting ATPase type 2C member 2 Proteins 0.000 claims 1
- 101000934069 Homo sapiens Calpain-1 catalytic subunit Proteins 0.000 claims 1
- 101000727806 Homo sapiens Chloride anion exchanger Proteins 0.000 claims 1
- 101001006782 Homo sapiens Kinesin-associated protein 3 Proteins 0.000 claims 1
- 101001018298 Homo sapiens Microtubule-associated serine/threonine-protein kinase 4 Proteins 0.000 claims 1
- 101000892008 Homo sapiens Protein CASC2, isoform 3 Proteins 0.000 claims 1
- 101000947111 Homo sapiens Protein CASC2, isoforms 1/2 Proteins 0.000 claims 1
- 101000946012 Homo sapiens UPF0488 protein C8orf33 Proteins 0.000 claims 1
- 102100027930 Kinesin-associated protein 3 Human genes 0.000 claims 1
- 102100033252 Microtubule-associated serine/threonine-protein kinase 4 Human genes 0.000 claims 1
- 102100035599 Protein CASC2, isoforms 1/2 Human genes 0.000 claims 1
- 102100034692 UPF0488 protein C8orf33 Human genes 0.000 claims 1
- 102000027528 liver X receptor-like Human genes 0.000 claims 1
- 108091008780 liver X receptor-like Proteins 0.000 claims 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 abstract description 5
- 230000000112 colonic effect Effects 0.000 abstract description 4
- 210000001072 colon Anatomy 0.000 abstract description 3
- 238000003745 diagnosis Methods 0.000 abstract description 3
- 210000004027 cell Anatomy 0.000 description 231
- 210000001519 tissue Anatomy 0.000 description 94
- 238000009396 hybridization Methods 0.000 description 44
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 32
- 238000012360 testing method Methods 0.000 description 30
- 208000003200 Adenoma Diseases 0.000 description 27
- 238000000513 principal component analysis Methods 0.000 description 27
- 238000002493 microarray Methods 0.000 description 26
- 239000007787 solid Substances 0.000 description 25
- 238000009739 binding Methods 0.000 description 24
- 230000027455 binding Effects 0.000 description 23
- 230000004807 localization Effects 0.000 description 19
- 102000003899 claudin 8 Human genes 0.000 description 17
- 108090000239 claudin 8 Proteins 0.000 description 17
- 206010028980 Neoplasm Diseases 0.000 description 16
- 230000008859 change Effects 0.000 description 15
- 210000003384 transverse colon Anatomy 0.000 description 15
- 238000010200 validation analysis Methods 0.000 description 15
- 238000003556 assay Methods 0.000 description 14
- 239000002299 complementary DNA Substances 0.000 description 13
- 238000000018 DNA microarray Methods 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 11
- 238000012216 screening Methods 0.000 description 11
- 239000000758 substrate Substances 0.000 description 11
- 102000004190 Enzymes Human genes 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 10
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 10
- 239000000427 antigen Substances 0.000 description 10
- 229940088598 enzyme Drugs 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 239000002853 nucleic acid probe Substances 0.000 description 10
- 239000013615 primer Substances 0.000 description 10
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 9
- 239000011324 bead Substances 0.000 description 9
- 201000011510 cancer Diseases 0.000 description 9
- 239000002751 oligonucleotide probe Substances 0.000 description 9
- 102000040430 polynucleotide Human genes 0.000 description 9
- 108091033319 polynucleotide Proteins 0.000 description 9
- 239000002157 polynucleotide Substances 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 238000012795 verification Methods 0.000 description 9
- 238000005406 washing Methods 0.000 description 9
- 206010001233 Adenoma benign Diseases 0.000 description 8
- 241000252983 Caecum Species 0.000 description 8
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 8
- 102100021090 Homeobox protein Hox-A9 Human genes 0.000 description 8
- 102100034782 Homogentisate 1,2-dioxygenase Human genes 0.000 description 8
- 208000009956 adenocarcinoma Diseases 0.000 description 8
- 102000004891 aquaporin 8 Human genes 0.000 description 8
- 108090001000 aquaporin 8 Proteins 0.000 description 8
- 230000001174 ascending effect Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 108010027263 homeobox protein HOXA9 Proteins 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 108090000765 processed proteins & peptides Proteins 0.000 description 8
- 239000007790 solid phase Substances 0.000 description 8
- 102100021430 Cyclic pyranopterin monophosphate synthase Human genes 0.000 description 7
- 101000969676 Homo sapiens Cyclic pyranopterin monophosphate synthase Proteins 0.000 description 7
- 101000872475 Homo sapiens Homogentisate 1,2-dioxygenase Proteins 0.000 description 7
- 101000745469 Homo sapiens Lambda-crystallin homolog Proteins 0.000 description 7
- 101000629402 Homo sapiens Mesoderm posterior protein 1 Proteins 0.000 description 7
- 101000590830 Homo sapiens Monocarboxylate transporter 1 Proteins 0.000 description 7
- 101000871508 Homo sapiens PTB domain-containing engulfment adapter protein 1 Proteins 0.000 description 7
- 101001095095 Homo sapiens Proline-rich acidic protein 1 Proteins 0.000 description 7
- 101000686903 Homo sapiens Reticulophagy regulator 1 Proteins 0.000 description 7
- 102100039324 Lambda-crystallin homolog Human genes 0.000 description 7
- 102100026822 Mesoderm posterior protein 1 Human genes 0.000 description 7
- 102100034068 Monocarboxylate transporter 1 Human genes 0.000 description 7
- 102100033719 PTB domain-containing engulfment adapter protein 1 Human genes 0.000 description 7
- 102100037034 Proline-rich acidic protein 1 Human genes 0.000 description 7
- 102100024734 Reticulophagy regulator 1 Human genes 0.000 description 7
- 108010090804 Streptavidin Proteins 0.000 description 7
- 108091007433 antigens Proteins 0.000 description 7
- 102000036639 antigens Human genes 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 150000003839 salts Chemical class 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- 235000000346 sugar Nutrition 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- 102100033350 ATP-dependent translocase ABCB1 Human genes 0.000 description 6
- 102100029790 Defensin-6 Human genes 0.000 description 6
- 101001033715 Homo sapiens Insulinoma-associated protein 1 Proteins 0.000 description 6
- 102100039091 Insulinoma-associated protein 1 Human genes 0.000 description 6
- 108010047230 Member 1 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000003908 quality control method Methods 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 201000009030 Carcinoma Diseases 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- 102100026761 Eukaryotic translation initiation factor 5A-1 Human genes 0.000 description 5
- 108700005087 Homeobox Genes Proteins 0.000 description 5
- 101001054354 Homo sapiens Eukaryotic translation initiation factor 5A-1 Proteins 0.000 description 5
- 101000764535 Homo sapiens Lymphotoxin-alpha Proteins 0.000 description 5
- 102100026238 Lymphotoxin-alpha Human genes 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 210000001035 gastrointestinal tract Anatomy 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 238000011065 in-situ storage Methods 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 210000004379 membrane Anatomy 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 101150045515 O gene Proteins 0.000 description 4
- 125000003277 amino group Chemical group 0.000 description 4
- 230000000712 assembly Effects 0.000 description 4
- 238000000429 assembly Methods 0.000 description 4
- 239000011230 binding agent Substances 0.000 description 4
- 238000010195 expression analysis Methods 0.000 description 4
- 125000000524 functional group Chemical group 0.000 description 4
- 230000000762 glandular Effects 0.000 description 4
- 238000003018 immunoassay Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000001613 neoplastic effect Effects 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 210000001599 sigmoid colon Anatomy 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 206010052360 Colorectal adenocarcinoma Diseases 0.000 description 3
- 108010063954 Mucins Proteins 0.000 description 3
- 102000015728 Mucins Human genes 0.000 description 3
- 238000000692 Student's t-test Methods 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 150000001720 carbohydrates Chemical class 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 239000000919 ceramic Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- BFMYDTVEBKDAKJ-UHFFFAOYSA-L disodium;(2',7'-dibromo-3',6'-dioxido-3-oxospiro[2-benzofuran-1,9'-xanthene]-4'-yl)mercury;hydrate Chemical compound O.[Na+].[Na+].O1C(=O)C2=CC=CC=C2C21C1=CC(Br)=C([O-])C([Hg])=C1OC1=C2C=C(Br)C([O-])=C1 BFMYDTVEBKDAKJ-UHFFFAOYSA-L 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 230000036210 malignancy Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 239000011049 pearl Substances 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- 238000012353 t test Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 238000006412 Alper carbonylation reaction Methods 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108010083123 CDX2 Transcription Factor Proteins 0.000 description 2
- 102100040836 Claudin-1 Human genes 0.000 description 2
- 102100039588 Claudin-15 Human genes 0.000 description 2
- 108090000997 Claudin-15 Proteins 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- 239000004971 Cross linker Substances 0.000 description 2
- 239000003155 DNA primer Substances 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 102100031671 Homeobox protein CDX-2 Human genes 0.000 description 2
- 101000749331 Homo sapiens Claudin-1 Proteins 0.000 description 2
- 101000581402 Homo sapiens Melanin-concentrating hormone receptor 1 Proteins 0.000 description 2
- 102100027375 Melanin-concentrating hormone receptor 1 Human genes 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 239000004743 Polypropylene Substances 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 230000004520 agglutination Effects 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 210000003484 anatomy Anatomy 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 201000002758 colorectal adenoma Diseases 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 208000002445 cystadenocarcinoma Diseases 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000009274 differential gene expression Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000013020 embryo development Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 230000001605 fetal effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 238000002509 fluorescent in situ hybridization Methods 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- 210000003405 ileum Anatomy 0.000 description 2
- 230000003100 immobilizing effect Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000007791 liquid phase Substances 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 210000003750 lower gastrointestinal tract Anatomy 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 210000004249 mesenteric artery inferior Anatomy 0.000 description 2
- 210000001363 mesenteric artery superior Anatomy 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 244000005706 microflora Species 0.000 description 2
- 229940051875 mucins Drugs 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 230000005868 ontogenesis Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 238000000206 photolithography Methods 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 229920001155 polypropylene Polymers 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 210000000813 small intestine Anatomy 0.000 description 2
- 230000003393 splenic effect Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 101150025032 13 gene Proteins 0.000 description 1
- 102100022586 17-beta-hydroxysteroid dehydrogenase type 2 Human genes 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- JTLDBJGKDYQKGB-UHFFFAOYSA-N 3,4-bis(4-methoxyphenyl)-2-methylbenzoic acid Chemical compound C1=CC(OC)=CC=C1C1=CC=C(C(O)=O)C(C)=C1C1=CC=C(OC)C=C1 JTLDBJGKDYQKGB-UHFFFAOYSA-N 0.000 description 1
- 125000002103 4,4'-dimethoxytriphenylmethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C(*)(C1=C([H])C([H])=C(OC([H])([H])[H])C([H])=C1[H])C1=C([H])C([H])=C(OC([H])([H])[H])C([H])=C1[H] 0.000 description 1
- 101150021183 65 gene Proteins 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241001633635 Ademon Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 206010001497 Agitation Diseases 0.000 description 1
- 102100031936 Anterior gradient protein 2 homolog Human genes 0.000 description 1
- 101100328890 Arabidopsis thaliana COL3 gene Proteins 0.000 description 1
- 101100071393 Arabidopsis thaliana HR1 gene Proteins 0.000 description 1
- 102100021979 Asporin Human genes 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 102000053028 CD36 Antigens Human genes 0.000 description 1
- 108010045374 CD36 Antigens Proteins 0.000 description 1
- 102100024644 Carbonic anhydrase 4 Human genes 0.000 description 1
- 101710167916 Carbonic anhydrase 4 Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102100031584 Cell division cycle-associated 7-like protein Human genes 0.000 description 1
- 102000002029 Claudin Human genes 0.000 description 1
- 108050009302 Claudin Proteins 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 206010048832 Colon adenoma Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 108020003215 DNA Probes Proteins 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 206010058314 Dysplasia Diseases 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 208000007659 Fibroadenoma Diseases 0.000 description 1
- 208000004463 Follicular Adenocarcinoma Diseases 0.000 description 1
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 102100039708 Glucose-6-phosphate exchanger SLC37A2 Human genes 0.000 description 1
- SXRSQZLOMIGNAQ-UHFFFAOYSA-N Glutaraldehyde Chemical compound O=CCCCC=O SXRSQZLOMIGNAQ-UHFFFAOYSA-N 0.000 description 1
- 229920002683 Glycosaminoglycan Polymers 0.000 description 1
- 101150033506 HOX gene Proteins 0.000 description 1
- 101150111172 HOX13 gene Proteins 0.000 description 1
- 102100031672 Homeobox protein CDX-1 Human genes 0.000 description 1
- 102100039544 Homeobox protein Hox-D10 Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101001045223 Homo sapiens 17-beta-hydroxysteroid dehydrogenase type 2 Proteins 0.000 description 1
- 101000775021 Homo sapiens Anterior gradient protein 2 homolog Proteins 0.000 description 1
- 101000752724 Homo sapiens Asporin Proteins 0.000 description 1
- 101100220069 Homo sapiens CDCA7L gene Proteins 0.000 description 1
- 101000777808 Homo sapiens Homeobox protein CDX-1 Proteins 0.000 description 1
- 101000962573 Homo sapiens Homeobox protein Hox-D10 Proteins 0.000 description 1
- 101001018097 Homo sapiens L-selectin Proteins 0.000 description 1
- 101000972282 Homo sapiens Mucin-5AC Proteins 0.000 description 1
- 101000973778 Homo sapiens NAD(P)H dehydrogenase [quinone] 1 Proteins 0.000 description 1
- 101001120760 Homo sapiens Olfactomedin-4 Proteins 0.000 description 1
- 101000721757 Homo sapiens Olfactory receptor 51E2 Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 102100033467 L-selectin Human genes 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100127662 Mus musculus Lama1 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 102100022365 NAD(P)H dehydrogenase [quinone] 1 Human genes 0.000 description 1
- 102000034570 NR1 subfamily Human genes 0.000 description 1
- 108020001305 NR1 subfamily Proteins 0.000 description 1
- 101100445008 Nematostella vectensis etnk gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 102100026071 Olfactomedin-4 Human genes 0.000 description 1
- 102100025128 Olfactory receptor 51E2 Human genes 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 108010004729 Phycoerythrin Proteins 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 229920000954 Polyglycolide Polymers 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108020004518 RNA Probes Proteins 0.000 description 1
- 239000003391 RNA probe Substances 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 238000010240 RT-PCR analysis Methods 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000037054 SLC-Transporter Human genes 0.000 description 1
- 108091006207 SLC-Transporter Proteins 0.000 description 1
- 108091006910 SLC37A2 Proteins 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 239000004809 Teflon Substances 0.000 description 1
- 229920006362 Teflon® Polymers 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 201000002143 bronchus adenoma Diseases 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 231100000315 carcinogenic Toxicity 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 239000003593 chromogenic compound Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 208000035850 clinical syndrome Diseases 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000012875 competitive assay Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000013367 dietary fats Nutrition 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 230000005672 electromagnetic field Effects 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 238000001839 endoscopy Methods 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 230000009786 epithelial differentiation Effects 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000012520 frozen sample Substances 0.000 description 1
- 238000011990 functional testing Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000008297 genomic mechanism Effects 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 230000007773 growth pattern Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 125000004404 heteroalkyl group Chemical group 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011503 in vivo imaging Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 210000004347 intestinal mucosa Anatomy 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 239000000696 magnetic material Substances 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 238000001000 micrograph Methods 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000004877 mucosa Anatomy 0.000 description 1
- 210000005170 neoplastic cell Anatomy 0.000 description 1
- 230000010309 neoplastic transformation Effects 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000036963 noncompetitive effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 230000000414 obstructive effect Effects 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 125000004043 oxo group Chemical group O=* 0.000 description 1
- 208000004019 papillary adenocarcinoma Diseases 0.000 description 1
- 230000002572 peristaltic effect Effects 0.000 description 1
- 230000008823 permeabilization Effects 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000004713 phosphodiesters Chemical group 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 229920001308 poly(aminoacid) Polymers 0.000 description 1
- 229920000747 poly(lactic acid) Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 239000004633 polyglycolic acid Substances 0.000 description 1
- 239000004626 polylactic acid Substances 0.000 description 1
- 229920000193 polymethacrylate Polymers 0.000 description 1
- 239000004800 polyvinyl chloride Substances 0.000 description 1
- 229920000915 polyvinyl chloride Polymers 0.000 description 1
- 238000002600 positron emission tomography Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 230000026447 protein localization Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000000275 quality assurance Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000011808 rodent model Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 229920002379 silicone rubber Polymers 0.000 description 1
- 239000011343 solid material Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- IIACRCGMVDHOTQ-UHFFFAOYSA-M sulfamate Chemical compound NS([O-])(=O)=O IIACRCGMVDHOTQ-UHFFFAOYSA-M 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- KUAZQDVKQLNFPE-UHFFFAOYSA-N thiram Chemical compound CN(C)C(=S)SSC(=S)N(C)C KUAZQDVKQLNFPE-UHFFFAOYSA-N 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000003519 ventilatory effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6881—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Pathology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Data Mining & Analysis (AREA)
- Cell Biology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
MéTODO PARA DETERMINAR A ORIGEM ANATÈMICA DE UMA CéLULA OU POPULAçãO CELULAR DERIVADA DO INTESTINO GROSSO DE UM INDIVìDUO, MéTODO DE DETECçãO PARA DETERMINAR A ORIGEM ANATÈMICA DE UMA CéLULA OU POPULAçãO CELULAR DERIVADA DO INTESTINO GROSSO DE UM INDIVìDUO, SISTEMA DE DETECçãO, MEIO DE ARMAZENAGEM LEGìVEL POR COMPUTADOR, ARRANJO DE áCIDO NUCLEICO, USO DE UM ARRANJO, MéTODO PARA DETERMINAR O INìCIO OU PREDISPOSIçãO PARA O INìCIO DE UMA ANORMALIDADE CELULAR OU UMA CONDIçãO DISTINGUIDA POR UMA ANORMALIDADE CELULAR NO INTESTINO GROSSO, KIT DE DIAGNóSTICO PARA ENSAIAR AMOSTRAS BIOLóGICAS. A presente invenção diz respeito no geral a uma série de moléculas de ácido nucléico, os perfis de expressão dos quais caracterizam a origem anatómica da célula ou população de células dentro do intestino grosso. Mais particularmente, a presente invenção diz respeito a uma série de moléculas de ácido nucléico, os perfis de expressão das quais caracterizam a origem proximal ou distal da célula ou população de células dentro do intestino grosso. Os perfis de expressão da presente invenção são úteis na faixa de aplicações incluindo, mas não limitado a determinar a origem anatómica da célula ou população de células que foram derivadas do intestino grosso. Além disso, visto que a progressão da célula normal é frequentemente caracterizada pela desdiferenciação, o método da presente invenção também fornece um meio de identificar a anormalidade celular com base na expressão de um perfil de expressão incorreto em relação àquele que deve ser expressado pelas células objeto quando considerada sua localização anatómica dentro do cólon. Consequentemente, este aspecto da invenção fornece um meio valioso de identificar a existência de células colónicas do intestino grosso, estas sendo indicativas de uma anormalidade dentro do intestino grosso tal como o início ou pré disposição ao início da condição tal como um neoplasma colorretal.
Description
"MÉTODO PARA DETERMINAR A ORIGEM ANATÔMICA DE UMA CÉLULA OU POPULAÇÃO CELULAR DERIVADA DO INTESTINO GROSSO DE UM INDIVÍDUO, MÉTODO DE DETECÇÃO PARA DETERMINAR A ORIGEM ANATÔMICA DE UMA CÉLULA OU POPULAÇÃO CELULAR DERIVADA DO INTESTINO GROSSO DE UM INDIVÍDUO, SISTEMA DE DETECÇÃO, MEIO DE ARMAZENAGEM LEGÍVEL POR COMPUTADOR, ARRANJO DE ÁCIDO NUCLEICO, USO DE UM ARRANJO, MÉTODO PARA DETERMINAR O INÍCIO OU PREDISPOSIÇÃO PARA O INÍCIO DE UMA ANORMALIDADE CELULAR OU UMA CONDIÇÃO DISTINGUIDA POR UMA ANORMALIDADE CELULAR NO INTESTINO GROSSO, KIT DE DIAGNÓSTICO PARA ENSAIAR AMOSTRAS BIOLÓGICAS"
CAMPO DA INVENÇÃO
A presente invenção diz respeito no geral ao conjunto das moléculas de ácido nucléico, aos perfis de expressão que caracterizam a origem anatômica de uma célula ou população de células dentro do intestino grosso. Mais particularmente, a presente invenção diz respeito a um conjunto de moléculas de ácido nucléico, os perfis de expressão das quais caracterizam a origem proximal ou distai de uma célula ou população de células dentro do intestino grosso. Os perfis de expressão da presente invenção são úteis dentro de uma faixa de aplicações incluindo, mas não limitadas à determinação da origem anatômica de uma célula ou população de células as quais foram derivadas do intestino grosso. Entretanto visto que a progressão de uma célula normal em direção a um estado neoplástico que é freqüentemente caracterizado pela desdiferenciação fenotípica, o método da presente invenção também fornece um meio de identificar uma anormalidade celular com base na expressão de um perfil de expressão incorreto em relação àquele que deve ser expressado pelas células objeto quando consideradas em consideração com a sua localização anatômica dentro do cólon. Consequentemente, este aspecto da invenção fornece um meio valioso de identificar a existência de células do cólon no intestino grosso, estas sendo indicativas de uma anormalidade dentro do intestino grosso tal como o início ou predisposição para o início de uma condição tal como uma neoplasia colorretal.
FUNDAMENTOS DA INVENÇÃO
Os detalhes bibliográficos das publicações aludidas pelo autor neste relatório descritivo são colecionados alfabeticamente no final da descrição.
Referência a qualquer técnica anterior neste relatório descritivo não é, e não deve ser interpretada como uma admissão ou qualquer forma de sugestão de que esta técnica anterior forme parte do conhecimento geral comum na Austrália.
Adenomas são tumores benignos de origem epitelial que são derivados de tecido glandular ou exibem estruturas glandulares claramente definidas. Alguns adenomas mostram elementos de tecidos reconhecíveis, tais como tecidos fibrosos (fibroadenomas), enquanto outros, como adenomas brônquicos, produzem compostos ativos que dão origem às síndromes clínicas. Tumores em certos órgãos, incluindo a glândula pituitária, são freqüentemente classificados pela suas afinidades no fingimento histológico, por exemplo, eosinófilos, basófilos e adenomas cromofóbicos.
Os adenomas podem se tornar carcinogênicos e são então denominados adenocarcinoma. Consequentemente, adenocarcinomas são definidos como tumores epiteliais malignos que surgem de estruturas glandulares, que são partes constituintes da maioria dos órgãos do corpo. Este termo também é aplicado aos tumores que mostram um padrão de crescimento glandular. Estes tumores podem ser subclassificados de acordo com a substância que eles produzem, por exemplo adenocarcinomas que secretam muco ou serosos, ou ao arranjo microscópico de sua células dentro de padrões, por exemplo adenocarcinomas papilares ou foliculares. Estes carcinomas podem ser sólidos ou císticos (cistadenocarcinoma). Cada órgão pode produzir tumores mostrando uma grande variedade de tipos histológicos, por exemplo, o ovário pode produzir tanto muconous quanto cistadenocarcinoma. No geral, a incidência global de carcinoma dentro de um adenoma é de aproximadamente 5%. Entretanto, isto esta relacionado com a tamanho e, embora seja rara em adenomas de menos do que 1 centímetro, é estimado em 40 a 50% entre as lesões vilosas que são maiores do que 4 centímetros. Adenomas com graus mais altos de displasia têm uma incidência mais alta de carcinoma. Uma vez que um adenoma esporádico tenha se desenvolvido, a chance de um novo adenoma ocorrer é de aproximadamente 30% dentro de 26 meses.
Os adenomas colorretais representam uma classe de adenomas que estão apresentando uma incidência crescente, particularmente nos países mais prósperos. As causas de adenoma, e sua mudança para adenocarcinoma, são ainda objeto de intensa pesquisa. Até o momento, tem sido especulado que, além da predisposição genética, fatores ambientais (tais como dieta) desempenham um papel no desenvolvimento dessa condição. A maioria dos estudos indicam que os fatores ambientais relevantes dizem respeito a gordura dietética alta, baixa fibra e carboidratos refinados altos.
Os adenomas colônicos são proliferações localizadas de epitélio displástico que são inicialmente planos. Eles são classificados pela sua aparência grosseira quer séssil (plano) ou penduculado (tendo um talo). Enquanto adenomas pequenos (menos que 0,5 milímetros) exibem uma superfície lisa castanha, adenomas penduculados têm uma cabeça com uma superfície arredondada ou lobulada marron avermelhada. Os adenomas sésseis exibem uma superfície vilosa mais delicada. Adenomas penduculados são mais prováveis de serem tubulares ou tubovilosos enquanto que as lesões sésseis são mais prováveis de serem vilosas. Os adenomas sésseis são mais comuns no ceco e no reto enquanto que os adenomas penduculados globais são igualmente divididos entre o sigmóides-reto e o resto do intestino grosso.
Os adenomas são no geral assintomáticos, tornando difícil portanto seu diagnóstico e tratamento precoces. É tecnicamente impossível prognosticar a presença ou ausência do carcinoma com base na aparência grosseira de adenomas, embora ademonas maiores são considerados exibir uma incidência mais alta de malignidade concorrente do que os adenomas menores. Os adenomas sésseis exibem incidência mais alta de malignidade do que os adenomas penduculados do mesmo tamanho. Alguns adenomas resultam na produção de perda de sangue nas fezes microscópica. Entrentanto, visto que o sangue nas fezes também pode ser indicativo de condições não adenomatosas e sintomas obstrutivos no geral não são observados na ausência de mudança maligna, o diagnóstico preciso de adenoma é tornado difícil sem a aplicação de procedimentos altamente invasivos tais como análise de biópsia. Consequentemente existe uma necessidade contínua para elucidar não apenas as causas de adenoma e sua mudança para malignidade mas para desenvolver protocolos de diagnóstico mais informativos, em particular protocolos que possibilitarão o diagnóstico rápido, de rotina e preciso de adenoma e adenocarcinoma em um estágio inicial tal como o estágio e pré maligno. Para esta finalidade estudos de adenocarcinoma colorretal têm sugerido incidência, histopatologia e prognóstico variáveis entre tumores proximais e distais.
Em termos de prosseguir nesta linha de investigação o advento do perfil de expressão de gene tem levado a um entendimento melhorado do desenvolvimento da mucosa intestinal. Por exemplo, a regulagem de fatores de transcrição envolvidos na produção e manutenção do equilíbrio do eixo radial da base da cripta para o lúmen e aqueles que dão origem à diferenciação de célula epitelial são agora melhor entendidos como um resultado da análise da expressão de gene do microconjunto. [Peifer, 2002, Nature 420: 274-5, 277; Traber, 1999, Adv Exp Med Biol 470:114]. Similarmente, o entendimento tem melhorado dos eventos genéticos desenvolvimentalmente programados dentro do intestino embrionário, especialmente aqueles mecanismos de controle molecular responsáveis pelas diferenças epiteliais regionais entre o intestino delgado e o intestino grosso.
[de Santa Barbara et al., 2003, Cell Mol Life Sci 60: 1322-1332; Park et al., 2005, Genesis 41: 1-12] Por outro lado, pouco é conhecido a cerca da variação da expressão de gene proximal-distal ao longo do eixo longitudinal do intestino grosso. [Bates et al. 2002, Gastroenterology 122: 1467-1482] Estudos epidemiológicos de adenocarcinoma colorretal sugerem suporte para a incidência variável, histopatologia e prognóstico entre tumores proximais e distais. [Bonithon-Kopp e Benhamiche, 1999, Eur J Câncer Prev 8 Supl 1: S3- 12; Bufill, 1990, Ann Intern Med 113: 779-788; Deng et al., 2002, Br J Câncer 86: 574-579; Distler e Holt, 1997, Dig Dis 15: 302-311]. Assim um entendimento da variação específica de localização poderia fornecer discernimento valioso naquelas doenças que têm padrões de distribuição características ao longo do colorreto, incluindo câncer colorretal. [Birkenkamp-Demtroder et al., 2005, Gut 54:374-384; Caldero et al., 1989, Virchows Arch A Pathol Anal- Histopathol 415: 347-356; Garcia-Hirschfeld Garcia et al., 1999, Rev Esp Enferm Dig 91: 481-488].
O colorreto (também chamado de intestino grosso) é freqüentemente dividido por conveniência clínica em seis regiões anatômicas partindo da região terminal do íleo: o ceco; o cólon ascendente; o cólon transversal; o cólon descendente, o cólon sigmóide; e o reto. Alternativamente, estes segmentos podem ser agrupados para dividir o intestino grosso em um modelo de duas regiões compreendendo o intestino grosso proximal e distai. A região proximal ("direita") é no geral considerada incluir o ceco, cólon ascendente, e o cólon transversal enquanto que a região distai ("esquerda") inclui a flexura esplênica, o cólon descendente, a flexura sigmóide e o reto. Esta divisão é sustentada pela ontogênese embrionária distinta destas regiões cuja junção é dois terços ao longo do cólon transversal e também pelo fornecimento arterial distinto a cada região. Enquanto que o intestino grosso proximal desenvolve-se a partir do intestino intermediário embrionário e é abastecido pela artéria mesentérica superior, o intestino grosso distai forma-se a partir do intestino traseiro embrionário e é abastecido pela artéria mesentérica inferior. [Yamada e Alpers, 2003, Textbook of Gastroenterology, 2 Vol. Set]. Um compreensivo de revisões de diferenças proximais-distais são fornecidas em [Iacopetta, 2002, Int J Câncer 101: 403- 408].
Em trabalho que levou até a presente invenção foi determinado que um painel de genes são diferencialmente expressados entre as seções proximais e distais do intestino grosso humano. Consequentemente, este permitiu o desenvolvimento de meios para determinar se uma célula derivada do intestino grosso de interesse é de origem proximal ou origem distai. As amostras de células ou tecidos derivadas do intestino grosso normal podem ser portanto rotineiramente caracterizadas em termos de sua origem anatômica dentro do intestino grosso. Além disso ainda, visto que a maioria das condições de doença são caracterizadas por alguma mudança no perfil fenotípico ou transcrição de gene das células doentes, isto sendo particularmente verdadeiro de células que são predispostas a ou se tornaram neoplásticas, o método da presente invenção fornece um meio conveniente de identificar células anormais ou células que são predispostas a se tomarem anormais. Mais particularmente, onde uma célula de origem anatômica do intestino grosso conhecida expressa um ou mais genes ou perfis de genes que não são característicos daquela localização, a célula é classificada como anormal e pode depois passar por outra análise para elucidar a natureza desta anormalidade.
SUMÁRIO DA INVENÇÃO
Por todo este relatório descritivo e as reivindicações que seguem, a menos que o contexto requeira de outro modo, a palavra "compreendem", e as variações tais como "compreende" e "compreendendo", será entendido implicar a inclusão de um número inteiro ou etapa ou grupo de inteiros ou etapas estabelecidos mas não a exclusão de qualquer outro número inteiro ou etapa ou grupo de números inteiros ou etapas.
Como aqui usado, o termo "derivado de" deve ser interpretado indicar que um número inteiro particular ou grupo de inteiro originado das espécies especificadas, mas não foi necessariamente obtido diretamente da fonte especificada. Além disso, como aqui usado as formas singulares de "a", "e" e "o" incluem referendos plurais a menos que o contexto claramente dite de outro modo.
A menos que de outro modo definido, todos os termos técnicos e científicos aqui usados têm o mesmo significado como habitualmente entendido por uma pessoa de habilidade na técnica à qual esta invenção pertence.
Um aspecto da presente invenção está direcionada a um método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, o dito método compreendendo medir o nível de expressão de um ou mais genes selecionados de:
(i) o gene ou genes detectados pela sonda Affymetrix número: 218888_s_at
o gene detectado pela sonda Affymetrix número: 225290_at o gene detectado pela sonda Affymetrix número: 226432_at o gene detectado pela sonda Affymetrix número: 231576_at o gene detectado pela sonda Affymetrix número: 235733_at o gene detectado pela sonda Affymetrix número: 236894_at o gene detectado pela sonda Affymetrix número: 239656_at o gene detectado pela sonda Affymetrix número: 242059_at o gene detectado pela sonda Affymetrix número: 242683_at
APOBEC1, FLJ22761, KIF AP3, SLC14A2,
C10orf45, FTHFD, LOC375295, SLC20A1,
C10orf58, GCNT1, ME3, SLC23A3,
CCL8, HAS3, MEP1B, SLC38A2,
CLDNl 5, HOXB6, NPY6R, SLC9A3,
DEFA5, HOXD4, NR1H3, TBCC,
EYA2, HSD3B2, HR1H4, ZNF493,
OSTalfa, PAP,
AFARPl ou o gene ou genes detectados pela sonda Affymetrix número: 202234_s_at,
ANPEP ou o gene ou genes detectados pela sonda Affymetrix número 202888_s_at,
CCL13 ou o gene ou genes detectados pela sonda Affymetrix número: 206407_s_at
CRYL1 ou o gene ou genes detectados pela sonda Affymetrix número: 220753_s_at,
CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número: 206754_s_at,
CYP2C 18, ou o gene ou genes detectados pela sonda Affymetrix número: 208126_s_at,
CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número: 214421_x_at ou 220017_x_at,
EPB41L3 ou o gene ou genes detectados pela sonda Affymetrix número: 211776_s_at
ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 222262_s_at ou 224453_s_at,
FAM45A ou o gene ou genes detectados pela sonda Affymetrix número: 221804_s_at ou 222955_s_at,
FGFR2 ou o gene ou genes detectados pela sonda Affymetrix número: 203639_s_at,
GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 219954_s_at,
GSPT2 ou o gene ou genes detectados pela sonda Affymetrix número: 20554l_s_at,
GULP1 ou o gene ou genes detectados pela sonda Affymetrix número: 215 913_s_at,
HOXA9 ou o gene ou genes detectados pela sonda Affymetrix número: 205366_s_at ou 21455 l_s_at,
HOXC6 ou o gene ou genes detectados pela sonda Affymetrix número: 206858_s_at,
HOXD3 ou o gene ou genes detectados pela sonda Affymetrix número: 20660 l_s_at,
ME2 ou o gene ou genes detectados pela sonda Affymetrix número: 21015 3_s_at,
MESPl ou o gene ou genes detectados pela sonda Affymetrix número: 224476_s_at,
MOCS1 ou o gene ou genes detectados pela sonda Affymetrix número: 213181 _s_at,
MSCP ou o gene ou genes detectados pela sonda Affymetrix número: 218136_s_at ou 221920_s_at,
NET02 ou o gene ou genes detectados pela sonda Affymetrix número: 222774_s_at,
OASL ou o gene ou genes detectados pela sonda Affymetrix número: 210757_s_at,
PITX2 ou o gene ou genes detectados pela sonda Affymetrix número: 207558_s_at, PRAPl ou o gene ou genes detectados pela sonda Affymetrix número: 243669_s_at,
SCUBE2 ou o gene ou genes detectados pela sonda Affymetrix número: 219197_s_at,
SEC6L1 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
SLC16A1 ou o gene ou genes detectados pela sonda Affymetrix número: 202236_s_at ou 209900_s_at,
UGT1A3 ou o gene ou genes detectados pela sonda Affymetrix número: 208596_s_at,
UGT1A8 ou o gene ou genes detectados pela sonda Affymetrix número: 221305_s_at ou
(ii) o gene detectado pela sonda Affymetrix número:
230105_at
o gene detectado pela sonda Affymetrix número: 230269_at o gene detectado pela sonda Affymetrix número: 238378_at o gene detectado pela sonda Affymetrix número: 239814_at o gene detectado pela sonda Affymetrix número: 239994_at o gene detectado pela sonda Affymetrix número: 240856_at o gene detectado pela sonda Affymetrix número: 242414_at o gene detectado pela sonda Affymetrix número: 244553_at
ACACA, FMOD, LOCl 51162, Sl OOP, C13orfl 1, FRMD3, MCF2L, SCGB2A1, C20orf56, GALNT5, MMP28, SCNN1B, CAPNl 3, GARNL4, MUCl 1, SHANK2, CLDN8, GCG, MUC12, SIAT2, COLM, GNE, MUC17, SIAT4C, CRIP1, HGD, MUC5B, SIAT7F, DNAJC12, HOXB13, NEDD4L, SIDTl, FAM3C, INSL5, PARP8, SLCl 3 A2, FBX025, IRS1, PCDH21, SLPI, FLJ20366, ISL1, PI3, SPINK5, FLJ20989, KIAA0703, PRAC, SST, KIAA0830, PRAC2, TFF1, KIAAl913, PTTGIIP, TNFSFl 1, LAMA1, QPRT, TPH1, LGALS2, QSCN6, WFDC2,
RBM24,
ARF4 ou o gene ou genes detectados pela sonda Affymetrix número: 201097_s_at,
BTG3 ou o gene ou genes detectados pela sonda Affymetrix número: 213134_x_at ou 205548_s_at,
CHST5 ou o gene ou genes detectados pela sonda Affymetrix número: 221164_x_at ou 223942_x_at,
CMAH ou o gene ou genes detectados pela sonda Affymetrix número: 205518_s_at,
CRYBA2 ou o gene ou genes detectados pela sonda Affymetrix número: 220136_s_at
CTSE ou o gene ou genes detectados pela sonda Affymetrix número: 205927_s_at,
DKFZp761Nl 114 ou o gene ou genes detectados pela sonda Affymetrix número: 242372_s_at,
EPB41L4A ou o gene ou genes detectados pela sonda Affymetrix número: 228256_s_at,
EPHA3 ou o gene ou genes detectados pela sonda Affymetrix número: 206070_s_at,
FAS ou o gene ou genes detectados pela sonda Affymetrix número: 20478 l_s_at, FER1L3 ou o gene ou genes detectados pela sonda Affymetrix número: 201798_s_at ou 211864_s_at,
FLJ20152 ou o gene ou genes detectados pela sonda Affymetrix número: 218532_s_at ou 218510_x_at,
FLJ23548 ou o gene ou genes detectados pela sonda Affymetrix número: 218187_s_at,
FNl ou o gene ou genes detectados pela sonda Affymetrix número: 211719_s_at ou 210495_x_at ou 212464_at ou 216442_x_at,
FOXA2 ou o gene ou genes detectados pela sonda Affymetrix número: 210103_s_at,
FRZB ou o gene ou genes detectados pela sonda Affymetrix número: 203698_s_at,
GDF15 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_x_at,
GJB3 ou o gene ou genes detectados pela sonda Affymetrix número: 205490_s_at,
HOXD13 ou o gene ou genes detectados pela sonda Affymetrix número: 207397_s_at,
INSMl ou o gene ou genes detectados pela sonda Affymetrix número: 206502_s_at,
MGC4170 ou o gene ou genes detectados pela sonda Affymetrix número: 212959_s_at,
MLPH ou o gene ou genes detectados pela sonda Affymetrix número: 21821 l_s_at,
NEBL ou o gene ou genes detectados pela sonda Affymetrix número: 203962_s_at,
PLA2G2A ou o gene ou genes detectados pela sonda Affymetrix número: 203649_s_at,
PTPRO ou o gene ou genes detectados pela sonda Affymetrix número: 208121_s_at,
PYY ou o gene ou genes detectados pela sonda Affymetrix número: 207080_s_at ou 211253_x_at,
SH3BP4 ou o gene ou genes detectados pela sonda Affymetrix número: 222258_s_at,
SLC28A2 ou o gene ou genes detectados pela sonda Affymetrix número: 207249_s_at,
SLC2A10 ou o gene ou genes detectados pela sonda Affymetrix número: 221024_s_at,
SPONl ou o gene ou genes detectados pela sonda Affymetrix número: 213994_s_at ou 209437_s_at,
STS ou o gene ou genes detectados pela sonda Affymetrix número: 203769_s_at
TM4SF11 ou o gene ou genes detectados pela sonda Affymetrix número: 204519_s_at,
TUSC3 ou o gene ou genes detectados pela sonda Affymetrix número: 213432_s_at ou 209228_x_at,
em uma amostra biológica do dito indivíduo em que um nível alto de expressão dos genes do grupo (i) em relação aos níveis de controle do intestino grosso distai normais é indicativo de uma origem do intestino grosso proximal e um nível alto de expressão dos genes do grupo (ii) em relação aos níveis de controle do intestino grosso proximal normais é indicativo de uma origem do intestino grosso distai.
Em um outro aspecto é fornecido um método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, o dito método compreendendo medir o nível de expressão de um ou mais genes selecionados de:
(i) PITX2 ou o gene ou genes detectados pela sonda Affymetrix número 207558_s_at, ETNKl ou o gene ou genes detectados pela sonda Affymetrix número 222262_s_at ou 224453_s_at, FAM3B,
CYP2C18 ou o gene ou genes detectados pela sonda Affymetrix número 208126_s_at,
GBA3 ou o gene ou genes detectados pela sonda Affymetrix número 219954_s_at, MEP1B, ADRA2A, HSD3B2,
CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número 206754_s_at,
SLCl 4A2 ou o gene ou genes detectados pela sonda Affymetrix número 226432_s_at,
CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número 231576_s_at, DEFA5,
OASL ou o gene ou genes detectados pela sonda Affymetrix número 210797_s_at,
SLC37A3, REGIA, MEP1B, NR1H4; ou
(ii) DKFZp761N1114 ou o gene ou genes detectados pela sonda Affymetrix número 242374_s_at,
PRAC, INSL5, HOXB13 ou WFDC2 em uma amostra biológica do dito indivíduo em que um nível alto de expressão dos genes do grupo (i) em relação aos níveis de controle do intestino grosso distai normais é indicativo de uma origem do intestino grosso proximal e um nível alto de expressão dos genes do grupo (ii) em relação aos níveis de controle do intestino grosso proximal normais como indicativo de uma origem do intestino grosso distai.
Em um outro aspecto, a presente invenção fornece um método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, que inclui:
avaliar dados de treinamento, que inclui dados de treinamento de expressão que representa a expressão de genes em células ou populações celulares derivadas de origens proximais-distais conhecidas de um intestino grosso, e dados de treinamento de origem proximal-distal que representam as associações das ditas células ou populações celulares com as ditas origens proximais-distais;
processar os dados de treinamento usando análise multivariada para gerar dados de classificação para gerar dados de origem proximal-distal indicativos de uma origem proximal-distal de uma célula ou população celular adicionais derivadas de um intestino grosso, com base nos dados de expressão adicionais que representam a expressão de genes na dita célula ou população celular adicionais.
A presente invenção também fornece um método de detecção para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, que inclui:
avaliar os dados de expressão primários que representam a expressão de genes em células ou populações celulares derivadas de origens conhecidas proximal-distal de pelo menos um intestino grosso;
processar os dados de expressão primários usando análise multivariada para gerar dados de modelo multivariado representativo de associações entre os dados de expressão primários e origens proximais-distais das ditas células ou populações celulares;
avaliar os segundos dados de expressão que representam a expressão de genes em uma célula ou população celular derivada do intestino grosso de um indivíduo; e
processar os segundos dados de expressão e os dados de modelo multivariado para gerar dados de origem proximal-distal representativos de uma origem proximal-distal das ditas célula ou população celular.
Preferivelmente, a etapa de avaliar os dados de expressão primários inclui avaliar os dados de expressão terciários dos quais os ditos os dados de expressão primários são um subconjunto, e o método inclui processar os ditos dados de expressão terciários para selecionar um subconjunto dos dados de expressão terciários que correspondam a um subconjunto de genes diferencialmente expressado sozinho ou em combinação ao longo do eixo proximal-distal do dito intestino grosso, o subconjunto selecionado sendo os ditos dados de expressão primários.
A presente invenção também fornece um método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, que inclui:
avaliar os dados de expressão primários que representam a expressão de genes em células ou populações celulares derivadas de origens conhecidas proximal-distal de um intestino grosso derivadas do intestino grosso;
processar os dados de expressão primários usando um método de núcleo para gerar dados de classificação para processar os segundos dados de expressão que representam a expressão dos ditos genes em pelo menos uma célula ou população celular secundárias de um intestino grosso para gerar dados de origem proximal-distal que representam a origem proximal- distai da dita pelo menos uma célula ou população celular secundárias.
A presente invenção também fornece um método de detecção para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, que inclui:
avaliar os dados de expressão primários que representam a expressão de genes em células ou populações celulares derivadas de origens conhecidas proximal-distal de um intestino grosso derivadas do intestino grosso;
processar os dados de expressão primários usando a análise de componentes principais para gerar dados de componente principal que correspondam a pelo menos uma combinação linear da expressão dos ditos genes, os ditos dados de componente principal sendo indicativo de pelo menos uma das origens proximais-distais das ditas células ou populações celulares.
A presente invenção também fornece um método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, que inclui:
avaliar dados de expressão que representem a expressão de genes em células ou populações celulares derivadas de origens conhecidas proximal-distal de pelo menos um intestino grosso; e
processar os dados de expressão usando análise de variação canônica para gerar dados de variação canônica indicativos de pelo menos uma das origens proximais-distais das ditas células ou populações celulares.
A presente invenção também fornece um método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, que inclui:
avaliar dados de treinamento, que inclui a expressão de dados de treinamento que representam a expressão de genes em células ou populações celulares derivadas de origens conhecidas proximal-distal de pelo menos um intestino grosso, e dados de treinamento de origem proximal-distal que representam as associações das ditas células ou populações celulares com as ditas origens proximais-distais;
processar os dados de treinamento para gerar dados de classificação que representam uma combinação linear ou não linear de níveis de expressão dos ditos genes, os ditos dados de classificação sendo adaptados para gerar dados de origem proximal-distal adicionais indicativos de uma origem proximal-distal de uma célula ou subpopulação celular adicionais tiradas de um intestino grosso, com base nos dados de expressão adicionais que representam a expressão dos ditos genes na dita célula ou subpopulação celular adicionais.
A presente invenção também fornece um sistema de detecção tendo componentes para executar qualquer um dos métodos acima.
A presente invenção também fornece um meio de armazenagem legível por computador tendo armazenado nele instruções de programa para executar qualquer um dos métodos acima.
A presente invenção também fornece um sistema de detecção, que inclui:
meios para avaliar dados de treinamento, que inclui a expressão de dados de treinamento que representam a expressão de genes em células ou populações celulares derivadas de pelo menos um intestino grosso, e dados de treinamento de origem proximal-distal que representam as associações das ditas células ou populações celulares com as ditas origens proximais-distais;
meios para processar os dados de treinamento para gerar dados de classificação que representam uma combinação linear ou não linear de níveis de expressão dos ditos genes, os ditos dados de classificação sendo adaptados para gerar dados de origem proximal-distal indicativo de uma origem proximal-distal de uma célula ou população celular adicionais tiradas de um intestino grosso, com base nos dados de expressão adicionais que representam a expressão dos ditos genes na dita célula ou população celular adicionais.
Em um outro aspecto é fornecido um método para determinar o início ou a predisposição para o início de uma anormalidade celular ou uma condição caracterizada por uma anormalidade celular no intestino grosso, o dito método compreendendo determinar, de acordo com um dos métodos mais acima descritos, o perfil de expressão de um gene proximal-distal de uma amostra biológica derivada de uma origem proximal ou distai conhecida no intestino grosso em que a detecção de um perfil de expressão de gene que é incompatível com o perfil de expressão de gene do intestino grosso proximal- distal normal é indicativo da anormalidade da célula ou população celular que expressam o dito perfil.
Um aspecto relacionado da presente invenção fornece conjunto de ácido nucléico, conjunto este que compreende uma pluralidade de:
(i) moléculas de ácido nucléico que compreendem uma seqüência de nucleotídeo que corresponde a qualquer um dos genes marcadores de localização mais acima descritos ou uma seqüência que exiba pelo menos 80% de identidade com esta ou um derivado, fragmento, variante ou homólogo funcionais das ditas moléculas de ácido nucléico; ou
(ii) moléculas de ácido nucléico que compreendem uma seqüência de nucleotídeo capaz de hibridização a qualquer uma ou mais das seqüências de (i) sob condições de severidade baixa a 42°C ou um derivado, fragmento, variante ou homólogo funcionais das ditas moléculas de ácido nucléico
(iii) sondas de ácido nucléico ou oligonucleotídeos que compreendem uma seqüência de nucleotídeo capaz de hibridização a qualquer uma ou mais das seqüências de (i) sob condições de severidade baixa a 42°C ou um derivado, fragmento, variante ou homólogo funcionais das ditas moléculas de ácido nucléico
(iv) proteínas codificadas pelas moléculas de ácido nucléico de
(i) ou (ii) ou um derivado, fragmento, variante ou homólogo
em que o nível de expressão do dito ácido nucléico é indicativo da origem proximal-distal de uma célula ou subpopulação celular derivada do intestino grosso.
DESCRIÇÃO RESUMIDA DOS DESENHOS A Figura 1 é uma representação gráfica da comparação do número de conjuntos de sonda diferenciais quando o divisor entre as regiões proximal e distai é movida.
A Figura 2 é uma representação gráfica do número relativo de transcritos elevados no intestino grosso proximal e distai.
A Figura 3 é uma representação gráfica de um exemplo típico de um modelo de dois genes.
A Figura 4 é uma representação gráfica da direção relativa de aumentar a expressão de transcritos que exibem uma mudança gradual ao longo do colorreto.
A Figura 5 é uma representação gráfica de genes que exibem comportamento de modelo de cinco segmentos.
A Figura 6a é uma representação gráfica de um exemplo típico do primeiro e segundo componentes principais gerados pela aplicação da análise de componente principal (PCA) a todos os 44.928 conjuntos de sonda do conjunto de dados de verificação, que revela pouca, se alguma, estrutura;
A Figura 6b é um gráfico do primeiro e segundo componentes principais gerados pela aplicação da PCA a um subconjunto de 115 conjuntos de sonda que são cada um diferencialmente expressados em amostras de tecido do ceco e reto (isto é, as extremidades proximal e distai extremas do intestino grosso), que revela duas classes que correspondem às porções proximal e distai do intestino grosso; A Figura 7 A é um gráfico do primeiro componente principal da Figura 6A como uma função da localização de tecido ao longo do eixo proximal-distal do intestino grosso;
A Figura 7B é um gráfico do primeiro componente principal da Figura 6B como uma função da localização de tecido ao longo do eixo proximal-distal do intestino grosso;
A Figura 8A é um gráfico da primeira e segunda variáveis canônicas gerado pela análise de perfil;
A Figura 8B é um gráfico da primeira variável canônica da Figura 8A como uma função da localização de tecido ao longo do eixo proximal-distal do intestino grosso;
A Figura 9 é um gráfico das estimativas de erro validadas cruzadas de vetores de suporte gerados a partir dos respectivos subconjuntos de genes como uma função do número de genes em cada subconjunto;
A Figura 10 é um diagrama de bloco de uma forma de realização preferida de um sistema de detecção; e
A Figura 11 é um diagrama de fluxo de uma forma de realização preferida de um método de detecção executado pelo sistema de detecção.
DESCRIÇÃO DETALHADA DA INVENÇÃO
A presente invenção é fundamentada, em parte, na elucidação do perfil de expressão de genes que caracterizam a origem anatômica de uma célula ou população celular do intestino grosso em termos de uma origem proximal versus uma origem distai. Esta verificação tem agora facilitado o desenvolvimento de meios de rotina de caracterizar, em termos da sua origem anatômica, uma população celular derivada do intestino grosso. Além disso ainda, visto que alguns distúrbios celulares são caracterizados por uma mudança no perfil de expressão de gene da célula doente em relação a uma célula normal correspondente, a presente invenção também fornece um meio de triar rotineiramente células do intestino grosso, que foram derivadas de um local anatômico conhecido dentro do intestino grosso, quanto a quaisquer mudanças para o perfil de expressão de gene que esperar-se-ia ser expressado com base naquela localização particular. Onde o perfil de expressão de gene correto não é observado, a célula está exibindo uma anormalidade e deve ser ainda avaliado por via de diagnosticar a condição específica da anormalidade. Em particular, seria avaliado pela pessoa de habilidade na técnica que as células neoplásticas, ou células pré dispostas a isto, algumas vezes passam pela desdiferenciação - isto sendo evidenciado por uma mudança para o fenótipo de expressão de gene da célula para um fenótipo menos diferenciado. Consequentemente, qualquer mudança nas características de perfil de expressão de gene de uma célula de intestino grosso de origem proximal ou distai pode ser indicativa do início ou predisposição ao início de um neoplasma do intestino grosso, tal como um adenoma ou um adenocarcinoma. Também é fornecido pela presente invenção conjuntos de ácido nucléico, tais como microarranjos, para o uso no método da invenção.
Consequentemente, um aspecto da presente invenção é direcionado a um método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, o dito método compreendendo medir o nível de expressão de um ou mais genes selecionados de:
(i) o gene ou genes detectados pela sonda Affymetrix número: .218888_s_at
o gene detectado pela sonda Affymetrix número: 225290_at o gene detectado pela sonda Affymetrix número: 226432_at o gene detectado pela sonda Affymetrix número: 231576_at o gene detectado pela sonda Affymetrix número: 235733_at o gene detectado pela sonda Affymetrix número: 236894_at o gene detectado pela sonda Affymetrix número: 239656_at o gene detectado pela sonda Affymetrix número: 242059_at o gene detectado pela sonda Affymetrix número: 242683_at
ABHD5, FAM3B, IGFBP2, POPDC3, ADRA2A, FLJ10884, KCNG1, REGIA, APOBEC1, FLJ22761, KIF AP3, SLC14A2, C10orf45, FTFíFD, LOC3 75295, SLC20A1, C10orf58, GCNT1, ME3, SLC23A3, CCL8, HAS3, MEP1B, SLC38A2, CLDNl 5, HOXB6, NPY6R, SLC9A3, DEF A5, HOXD4, NR1H3, TBCC, EYA2, HSD3B2, HR1H4, ZNF493, OSTalfa, PAP,
AFARPl ou o gene ou genes detectados pela sonda Affymetrix número: 202234_s_at,
ANPEP ou o gene ou genes detectados pela sonda Affymetrix número 202888_s_at,
CCL13 ou o gene ou genes detectados pela sonda Affymetrix número: 206407_s_at
CRYL1 ou o gene ou genes detectados pela sonda Affymetrix número: 220753_s_at,
CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número: 206754_s_at,
CYP2C18, ou o gene ou genes detectados pela sonda Affymetrix número: 208126_s_at,
CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número: 214421_x_at ou 220017_x_at,
EPB41L3 ou o gene ou genes detectados pela sonda Affymetrix número: 211776_s_at ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 222262_s_at ou 224453_s_at,
FAM45A ou o gene ou genes detectados pela sonda Affymetrix número: 221804_s_at ou 222955_s_at,
FGFR2 ou o gene ou genes detectados pela sonda Affymetrix número: 203639_s_at,
GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 219954_s_at,
GSPT2 ou o gene ou genes detectados pela sonda Affymetrix número: 205 541_s_at,
GULPl ou o gene ou genes detectados pela sonda Affymetrix número: 215913_s_at,
HOXA9 ou o gene ou genes detectados pela sonda Affymetrix número: 205366_s_at ou 214551_s_at,
HOXC6 ou o gene ou genes detectados pela sonda Affymetrix número: 206858_s_at,
HOXD3 ou o gene ou genes detectados pela sonda Affymetrix número: 20660l_s_at,
ME2 ou o gene ou genes detectados pela sonda Affymetrix número: 210153_s_at,
MESPl ou o gene ou genes detectados pela sonda Affymetrix número: 224476_s_at,
MOCS1 ou o gene ou genes detectados pela sonda Affymetrix número: 213181 _s_at,
MSCP ou o gene ou genes detectados pela sonda Affymetrix número: 218136_s_at ou 221920_s_at,
NET02 ou o gene ou genes detectados pela sonda Affymetrix número: 222774_s_at,
OASL ou o gene ou genes detectados pela sonda Affymetrix número: 210757_s_at,
PITX2 ou o gene ou genes detectados pela sonda Affymetrix número: 207558_s_at,
PRAPl ou o gene ou genes detectados pela sonda Affymetrix número: 243669_s_at,
SCUBE2 ou o gene ou genes detectados pela sonda Affymetrix número: 219197_s_at,
SEC6L1 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
SLC16A1 ou o gene ou genes detectados pela sonda Affymetrix número: 202236_s_at ou 209900_s_at,
UGT1A3 ou o gene ou genes detectados pela sonda Affymetrix número: 208596_s_at,
UGT1A8 ou o gene ou genes detectados pela sonda Affymetrix número: 2213 05_s_at ou
(ii) o gene detectado pela sonda Affymetrix número: .230105_at
o gene detectado pela sonda Affymetrix número: 230269_at o gene detectado pela sonda Affymetrix número: 238378_at o gene detectado pela sonda Affymetrix número: 239814_at o gene detectado pela sonda Affymetrix número: 239994_at o gene detectado pela sonda Affymetrix número: 240856_at o gene detectado pela sonda Affymetrix número: 242414_at o gene detectado pela sonda Affymetrix número: 244553_at
ACACA, FMOD, LOC151162, Sl OOP, C13orfl 1, FRMD3, MCF2L, SCGB2A1, C20orf56, GALNT5, MMP28, SCNN1B, CAPN13, GARNL4, MUCl 1, SHANK2, CLDN8, GCG, MUC12, SIAT2, COLM, GNE, MUC17, SIAT4C, CRIP1, HGD, MUC5B, SIAT7F, DNAJC12, HOXB13, NEDD4L, SIDT1, FAM3C, INSL5, PARP8, SLCl 3 A2, FBX025, IRS1, PCDH21, SLPI, FLJ20366, ISL1, PI3, SPINK5, FLJ20989, KIAA0703, PRAC, SST, KIAA0830, PRAC2, TFF1, KIAA1913, PTTGIIP, TNFSFl 1, LAMAl, QPRT, TPHl, LGALS2, QSCN6, WFDC2,
RBM24,
ARF4 ou o gene ou genes detectados pela sonda Affymetrix número: 201097_s_at,
BTG3 ou o gene ou genes detectados pela sonda Affymetrix número: 213134_x_at ou 205548_s_at,
CHST5 ou o gene ou genes detectados pela sonda Affymetrix número: 221164_x_at ou 223942_x_at,
CMAH ou o gene ou genes detectados pela sonda Affymetrix número: 205518_s_at,
CRYBA2 ou o gene ou genes detectados pela sonda Affymetrix número: 220136_s_at
CTSE ou o gene ou genes detectados pela sonda Affymetrix número: 205927_s_at, DKFZp761N1114 ou o gene ou genes detectados pela sonda
Affymetrix número: 242372_s_at,
EPB41L4A ou o gene ou genes detectados pela sonda Affymetrix número: 228256_s_at,
EPHA3 ou o gene ou genes detectados pela sonda Affymetrix número: 206070_s_at,
FAS ou o gene ou genes detectados pela sonda Affymetrix número: 20478l_s_at,
FER1L3 ou o gene ou genes detectados pela sonda Affymetrix número: 201798_s_at ou 211864_s_at,
FLJ20152 ou o gene ou genes detectados pela sonda Affymetrix número: 218532_s_at ou 218510_x_at,
FLJ23548 ou o gene ou genes detectados pela sonda Affymetrix número: 218187_s_at,
FNl ou o gene ou genes detectados pela sonda Affymetrix número: 211719_s_at ou 210495_x_at ou 212464_at ou 216442_x_at,
FOXA2 ou o gene ou genes detectados pela sonda Affymetrix número: 210103_s_at,
FRZB ou o gene ou genes detectados pela sonda Affymetrix número: 203698_s_at,
GDF15 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_x_at,
GJB3 ou o gene ou genes detectados pela sonda Affymetrix número: 205490_s_at,
HOXD13 ou o gene ou genes detectados pela sonda Affymetrix número: 207397_s_at,
INSMl ou o gene ou genes detectados pela sonda Affymetrix número: 206502_s_at,
MGC4170 ou o gene ou genes detectados pela sonda Affymetrix número: 212959_s_at,
MLPH ou o gene ou genes detectados pela sonda Affymetrix número: 21821 l_s_at,
NEBL ou o gene ou genes detectados pela sonda Affymetrix número: 203962_s_at, PLA2G2A ou o gene ou genes detectados pela sonda Affymetrix número: 203649_s_at,
PTPRO ou o gene ou genes detectados pela sonda Affymetrix número: 208121_s_at,
PYY ou o gene ou genes detectados pela sonda Affymetrix número: 207080_s_at ou 211253_x_at,
SH3BP4 ou o gene ou genes detectados pela sonda Affymetrix número: 222258_s_at,
SLC28A2 ou o gene ou genes detectados pela sonda Affymetrix número: 207249_s_at
SLC2A10 ou o gene ou genes detectados pela sonda Affymetrix número: 221024_s_at
SPONl ou o gene ou genes detectados pela sonda Affymetrix número: 213994_s_at ou 209437_s_at
STS ou o gene ou genes detectados pela sonda Affymetrix número: 203769_s_at
TM4SF11 ou o gene ou genes detectados pela sonda Affymetrix número: 204519_s_at,
TUSC3 ou o gene ou genes detectados pela sonda Affymetrix número: 213432_s_at ou 209228_x_at,
em uma amostra biológica do dito indivíduo em que um nível alto de expressão dos genes do grupo (i) em relação aos níveis de controle do intestino grosso distai normais é indicativo de uma origem do intestino grosso proximal e um nível alto de expressão dos genes do grupo (ii) em relação aos níveis de controle do intestino grosso proximal normais é indicativo de uma origem do intestino grosso distai.
Como detalhado mais acima, o método da presente invenção é fundamentado na determinação de que a localização distai versus proximal de uma célula dentro do intestino grosso pode agora ser averiguada em virtude do perfil de expressão de genes que são únicos para as células de cada uma destas localizações. Consequentemente, referência para determinar a "origem anatômica" ou "localização anatômica" de uma célula ou população celular "derivadas do intestino grosso" deve ser entendido como uma referência para determinar se a célula em questão origina-se da região distai do intestino grosso ou da região proximal do intestino grosso. Ainda para isto, por "origem" ou "localização" é intencionado a localização da célula ou células sob investigação exatamente antes do momento que a célula foi colhida do intestino grosso ou, onde a célula naturalmente descolou do intestino grosso (por exemplo, onde ela foi descartada e é encontrada em uma amostra de fezes), no tempo imediatamente antes do descolamento da célula do intestino grosso. Sem limitar a presente invenção a qualquer teoria ou modo de ação, o intestino grosso não tem nenhuma função digestiva, como tal, mas absorve grandes quantidades de água e eletrólitos do alimento não digerido passado proveniente do intestino delgado. Em intervalos regulares, os movimentos peristálticos movem os conteúdos desidratados (fezes) na direção do reto. Por conveniência clínica o intestino grosso é no geral dividido em seis regiões anatômicas começando depois da região terminal do íleo - estas sendo: (i) o ceco;
(ii) o cólon ascendente;
(iii) o cólon transversal;
(iv) o cólon descendente;
(ν) o cólon sigmóide; e
(vi) o reto.
Estes segmentos também podem ser agrupados para dividir o intestino grosso em um modelo de duas regiões que compreendem o intestino grosso proximal e distai. A região proximal é no geral entendida incluir o ceco e o cólon ascendente enquanto que a região distai inclui a flexura esplênica, o cólon descendente, a flexura sigmóide e o reto. Esta divisão entre a região proximal e distai do intestino grosso é considerada ocorrer aproximadamente dois terços ao longo ao cólon transversal. Esta divisão e sustentada pela ontogênese embrionária distinta destas regiões cuja junção e dois terços ao longo do cólon transversal e também pelo fornecimento arterial distinto a cada região. Consequentemente, os tecidos do cólon transversal podem ser proximais ou distais dependendo de qual lado desta junção corresponde ao seu ponto de origem. Seria avaliado que embora o método da presente invenção possa necessariamente não indicar de qual parte do intestino grosso proximal ou distai uma célula é originada, o mesmo fornecerá informação valiosa em relação a se o tecido é de origem proximal ou origem distai. Embora o intestino grosso proximal se desenvolva a partir do intestino intermediário embrionário e seja abastecido pela artéria mesentérica superior, o intestino grosso distai forma-se a partir do intestino posterior embrionário e
é abastecido pela artéria mesentérica inferior.
<image>image see original document page 31</image>
Consequentemente, referência à região "proximal" do intestino grosso deve ser entendida como uma referência à seção do intestino grosso que compreende o ceco e o cólon ascendente, enquanto referência à região "distai" do intestino grosso deve ser entendido como uma referência à dobra esplênica, cólon descendente, dobra sigmóide e reto. A região do cólon transversal compreende tanto a região proximal quanto a distai, as proporções relativas das quais dependerá de onde a junção dos tecidos proximal e distai ocorre. Especificamente, o tecido do cólon transversal pode ser da região proximal ou distai dependendo da distância relativa entre as dobras hepática e esplênica.
De acordo com a presente invenção, foi determinado que os genes detalhados nos parágrafos (i) e (ii), acima, são modulados, em termos de mudanças diferenciais aos seus níveis de expressão dependendo se a célula que expressa aquele gene está localizada na região proximal do intestino grosso ou na região distai do intestino grosso. Para facilidade de referência, estes genes e seus transcritos de mRNA são representados em texto em itálicos enquanto que os seus produtos de expressão de proteína são representados em texto não em itálicos. Esses genes são coletivamente aludidos como "marcadores de localização".
Cada um dos genes detalhados nos sub-parágrafos (i) e (ii), acima, são bem conhecidos pela pessoa habilitada na técnica, como o é seus produtos de expressão de proteína codificada. A identificação destes genes como marcadores da localização de célula colorretal (intestino grosso) ocorreu em virtude da análise de expressão diferencial usando Affymetrix HG133A ou chips de gene HG133B. Para esta finalidade, cada chip de gene é caracterizada por aproximadamente 45.000 conjuntos de sonda que detectam o RNA transcrito de aproximadamente 35.000 genes. Em média, aproximadamente 11 pares de sonda detectam as regiões de sobreposição ou consecutivas do transcrito de RNA de um único gene. No geral, os genes a partir dos quais os transcritos de RNA são identificáveis pelas sondas Affymetrix são genes bem conhecidos e caracterizados. Entretanto, até o grau em que algumas das sondas detectam transcritos de RNA que não são ainda definidos, estes genes são indicados como "o gene ou genes detectados pela sonda Affymetrix x". Em alguns casos vários genes podem ser detectáveis por uma única sonda. Isto também é indicado onde apropriado. Deve ser entendido, entretanto, que isto não é intencionado como uma limitação de como o nível de expressão do gene objeto pode ser detectado. No primeiro caso, seria entendido que o transcrito de gene objeto também é detectável por outras sondas que estariam presentes na chip de gene da Affymetrix. A referência a uma única sonda é meramente incluída como um identificador do transcrito de gene de interesse. Em termos de triar verdadeiramente quanto ao transcrito, entretanto, pode-se utilizar uma sonda direcionada a qualquer região do transcrito e não apenas à região de transcrito de 600 pares de base terminal à qual as sondas Affymetrix são no geral direcionadas.
Referência a cada um dos genes detalhados acima e seus produtos de expressão transcritos e traduzidos devem ser portanto entendidos como uma referência a todas as formas destas moléculas e aos fragmentos, mutantes ou variantes destas. Como seria avaliado pela pessoa de habilidade na técnica, alguns genes são conhecidos exibir variação alélica entre os indivíduos. Consequentemente, a presente invenção deve ser entendida estender-se a tais variantes que, em termos das presentes aplicações em diagnóstico, alcançam o mesmo resultado a despeito do fato de que variantes genéticas menores entre as seqüências de ácido nucléico reais podem existir entre os indivíduos. A presente invenção portanto deve ser entendida estender-se a todos os RNAs (por exemplo, mRNA, transcrito de RNA primário, miRNA, tRNA, rRNA etc), cDNA e isoformas peptídicas que surgem da união alternativa ou qualquer outra mutação, variação polimérica ou alélica. Também deve ser entendido incluir referência a quaisquer polipeptídeos de subunidade tais como formas precursoras que podem ser geradas, se existirem como um monômero, multímero, proteína de fusão ou outro complexo.
Sem limitar a presente invenção a qualquer teoria ou modo de ação, embora cada um dos genes mais acima descritos seja diferencialmente expressado, isoladamente ou em combinação, como entre as células do intestino grosso distai e proximal, e é portanto diagnóstico da origem anatômica de qualquer amostra de célula dada, a expressão de alguns destes genes exibiram níveis particularmente significantes de sensibilidade, especificidade, valor preditivo positivo e/ou valor preditivo negativo. Consequentemente, em uma forma de realização preferida, poder-se-ia triar e avaliar quanto ao nível de expressão de um ou mais destes genes.
A presente invenção portanto preferivelmente fornece um método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, o dito método compreendendo medir o nível de expressão de um ou mais genes selecionados de:
(i) PITX2 ou o gene ou genes detectados pela sonda Affymetrix número: 207558_s_at,
ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 222262_s_at ou 224453_s_at, FAM3B,
CYP2C18 ou o gene ou genes detectados pela sonda Affymetrix número: 208126_s_at,
GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 219954_s_at, MEP1B, ADRA2A, HSD3B2,
CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número: 206754_s_at, SLC14A2 ou o gene ou genes detectados pela sonda Affymetrix número: 226432_s_at,
CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número: 231576_s_at, DEF A5,
OASL ou o gene ou genes detectados pela sonda Affymetrix número: 210797_s_at,
SLC37A3, REGIA, MEP1B, NRlH4; ou
(ii) DKFZp761Nl 114 ou o gene ou genes detectados pela sonda Affymetrix número: 242374_s_at, PRAC, INSL5, HOXB13 ou WFDC2
em uma amostra biológica do dito indivíduo em que um nível alto de expressão dos genes do grupo (i) em relação aos níveis de controle do intestino grosso distai normais é indicativo de uma origem do intestino grosso proximal e um nível alto de expressão dos genes do grupo (ii) em relação aos níveis de controle do intestino grosso proximal normais como indicativo de uma origem do intestino grosso distai.
Preferivelmente, os ditos genes são ETNKl e/ou GBA3 e/ou
PRAC.
O método de detecção da presente invenção pode ser realizado em qualquer amostra biológica adequada. Para esta finalidade, referência a uma "amostra biológica" deve ser entendida como uma referência a qualquer amostra de material biológico derivado de um animal tal como, mas não limitado a, material celular, biofluidos (por exemplo, sangue), fezes, espécimes de biópsia de tecido, espécimes cirúrgicos ou fluido que foi introduzido no corpo de um animal e subseqüentemente removido (tal como, por exemplo, a solução recuperada de uma lavagem de enema). A amostra biológica que é testada de acordo com o método da presente invenção pode ser testada diretamente ou pode requerer alguma forma de tratamento antes de testar. Por exemplo, uma biópsia ou amostra cirúrgica podem requerer homogeneização antes de testar ou podem requerer divisão em pedaços para o teste in situ dos níveis de expressão qualitativos de genes individuais.
Alternativamente, uma amostra de célula pode requerer a permeabilização antes de testar. Além disso, até o grau em que a amostra biológica não esteja na forma líquida, (se tal forma é requerida para o teste) a mesma pode requerer a adição de um reagente, tal como um tampão, para mobilizar a amostra.
Até o grau em que o gene marcador de localização esteja presente em uma amostra biológica, a amostra biológica pode ser diretamente testada ou ainda todo ou algum do material de ácido nucléico presente na amostra biológica pode ser isolada antes de testar. Já em um outro exemplo, a amostra pode ser parcialmente purificada ou de outro modo enriquecida antes da análise. Por exemplo, até o grau em que uma amostra biológica compreenda uma população de célula muito diversa, pode ser desejável enriquecer uma sub-população de interesse particular. Está dentro do escopo da presente invenção para a população de célula alvo ou moléculas derivadas desta sejam pré tratadas antes de testar, por exemplo, a inativação de vírus vivo ou sendo conduzida em um gel. Também deve ser entendido que a amostra biológica pode ser recém colhida ou a mesma pode ter sido armazenada (por exemplo pelo congelamento) antes de testar ou de outro modo tratada antes de testar (tal como submentendo-se à cultura).
A escolha de qual tipo de amostra é a mais adequada para testar de acordo com o método aqui divulgado será dependente da natureza da situação. Preferivelmente, a dita amostra é uma amostra fecal, lavagem de enema, ressecção cirúrgica ou biópsia de tecido.
Como detalhado mais acima, a presente invenção é planejada para caracterizar uma célula ou população celular, que sejam derivadas do intestino grosso, em termos de sua origem anatômica dentro do intestino grosso. Consequentemente, referência à "célula ou população celular" deve ser entendida como uma referência a uma célula individual ou um grupo de células. O dito grupo de células pode ser uma população difusa de células, uma suspensão de célula, uma população encapsulada de células ou uma população de células que tomam a forma de tecido.
Referência à "expressão" deve ser entendida como uma referência à transcrição e/ou tradução de uma molécula de ácido nucléico. Nesse aspecto, a presente invenção é exemplificada com respeito à triagem quanto a marcadores de localização que tomam a forma de transcritos de RNA (por exemplo, RNA primário, mRNA, miRNA, tRNA, rRNA). Referência a "RNA" deve ser entendida abranger referência a qualquer forma de RNA, tal como RNA primário, mRNA, miRNA, tRNA ou rRNA. Sem limitar a presente invenção de nenhum modo, a modulação da transcrição de gene que leva à síntese de RNA aumentada ou diminuída também correlacionar-se-á com a tradução de alguns destes transcritos de RNA (tais como mRNA) para produzir um produto de expressão. Consequentemente, a presente invenção também estende-se ao método de detecciologia que é direcionado para triar quanto aos níveis modulados ou padrões de expressão dos produtos de expressão do marcador de localização como um indicador da origem proximal ou distai de uma célula ou população celular. Embora um método seja triar quanto aos transcritos de mRNA e/ou o produto de expressão de proteína correspondente, deve ser entendido que a presente invenção não é limitada nesse aspecto e estende-se à triagem quanto a qualquer outra forma de marcador de localização tal como, por exemplo, um transcrito de RNA primário. Está bem dentro da habilidade da pessoa de habilidade na técnica determinar o alvo de triagem mais apropriado para qualquer situação dada. Preferivelmente, os produtos de expressão de proteína são o subconjunto de análise.
Referência às "moléculas de ácido nucléico" deve ser entendida como uma referência tanto às moléculas de ácido desoxirribonucléico quanto às moléculas de ácido ribonucléico. A presente invenção portanto estende-se tanto a triar diretamente quanto aos níveis de mRNA em uma amostra biológica ou triar quanto ao cDNA complementar que foi transcrito de modo reverso a partir de uma população de mRNA de interesse. Está bem dentro da habilidade da pessoa habilitada na técnica planejar a metodologia direcionada à triagem quanto a DNA ou RNA. Como detalhado acima, o método da presente invenção também estende-se à triagem quanto ao produto de expressão da proteína traduzido a partir do mRNA objeto.
O método da presente invenção é fundamentado na correlação dos níveis de expressão dos marcadores de localização de uma amostra biológica com os níveis proximal e distai normais destes marcadores. O "nível normal" é o nível de marcador expressado por uma célula ou população celular de origem proximal no intestino grosso e o nível de marcador expressado por uma célula ou população celular de origem distai. Consequentemente, existem dois valores de nível normal que são relevantes ao método de detecção da presente invenção. Seria avaliado que estes valores de nível normal são calculados com base nos níveis de expressão de células derivadas do intestino grosso que não exibem uma anormalidade ou predisposição a uma anormalidade que alteraria os níveis ou padrões de expressão destes marcadores.
O nível normal pode ser determinado usando tecidos derivados do mesmo indivíduo que é o objeto de teste, entretanto, seria avaliado que isto pode ser bastante invasivo para o indivíduo interessado e é portanto provável ser mais conveniente analisar os resultados de teste em relação a um resultado padrão que reflita resultados individuais ou coletivos obtidos de indivíduos saudáveis, outros que não o paciente em questão. Esta última forma de análise é de fato o método preferido de análise visto que o mesmo permite o planejamento de kits que requerem a coleta e análise de uma única amostra biológica, sendo uma amostra de teste de interesse. Os resultados padrão que fornecem os níveis de referência normais proximal e distai podem ser calculados por qualquer meio adequado que seria bem conhecido pela pessoa de habilidade na técnica. Por exemplo, uma população de tecidos normais pode ser avaliada em termos do nível de expressão dos marcadores de localização da presente invenção, fornecendo deste modo um valor padrão ou faixa de valores contra os quais todas as amostras de teste futuras são analisadas. Também deve ser entendido que os níveis de referência normais proximal e distai podem ser determinados a partir dos pacientes de um grupo específico e para o uso com respeito para testar amostras derivadas deste grupo. Consequentemente, podem ser determinados vários valores padrão ou faixas que correspondam aos grupos que diferem com respeito às características tais como idade, gênero, etnicidade ou situação de saúde. O dito "nível normal" pode ser um nível separado ou uma faixa de níveis. Os resultados de amostras biológicas que são testadas são preferivelmente avaliadas contra os níveis de referência normais tanto proximais quanto distais. Um aumento na expressão dos genes do grupo (i), mais acima definidos, em relação aos níveis distais normais é indicativo do tecido de teste sendo de origem proximal enquanto que um aumento na expressão dos genes do grupo (ii), mais acima definidos, em relação aos níveis proximais normais é indicativo do tecido sendo de origem distai. Também seria avaliado, entretanto, que também pode-se conduzir a etapa correlativa definida analisando-se os resultados que são obtidos do ponto de vista de determinar se o resultado obtido é o mesmo como um nível normal ou distai, indicando deste modo que a amostra de teste é da mesma origem como mostra de nível de referência normal contra a qual a mesma foi avaliada.
Deve ser entendido que o "indivíduo" que é o objeto de teste pode ser qualquer primata. Preferivelmente o primata é um ser humano.
Como detalhado mais acima, deve ser entendido que embora a presente invenção seja exemplificada com respeito à detecção de moléculas de ácido nucléico, a mesma também abrange métodos de detecção com base no teste quanto ao produto de expressão dos marcadores de localização objetos. A presente invenção também deve ser entendida significar métodos de detecção com base na identificação de produto de proteína ou material de ácido nucléico em uma ou mais amostras biológicas, entretanto, deve ser entendido que alguns dos marcadores de localização podem se correlacionar aos genes ou fragmentos de gene que não codificam um produto de expressão da proteína. Consequentemente, até o grau em que isto ocorre não seria possível testar quanto a um produto de expressão e o marcador objeto deve ser avaliado com base nos perfis de expressão de ácido nucléico.
O termo "proteína" deve ser entendido abranger peptídeos, polipeptídeos e proteínas. A proteína pode ser glicosilada ou não glicosilada e/ou pode conter uma faixa de outras moléculas fundidas, ligadas, unidas ou de outro modo associadas com a proteína tais como aminoácidos, lipídeos, carboidratos ou outros peptídeos, polipeptídeos ou proteínas. Referência aqui a uma "proteína" inclui uma proteína que compreende uma seqüência de aminoácidos assim como uma proteína associada com outras moléculas tais como aminoácidos, lipídeos, carboidratos ou outros peptídeos, polipeptídeos ou proteínas.
As proteínas marcadoras de localização da presente invenção podem estar na forma multimérica significando que duas ou mais moléculas estão associadas juntas. Onde as mesmas moléculas de proteína estão associadas juntas, o complexo é um homomultímero. Um exemplo de um homomultímero é um homodímero. Onde pelo menos uma proteína marcadora está associada com pelo menos uma proteína não marcadora, então o complexo é um heteromultímero tal como um heterodímero.
Referência a um "fragmento" deve ser entendido como uma referência a uma porção das moléculas de ácido nucléico objeto. Isto é particularmente relevante com respeito à triagem quanto a níveis de RNA modulados em amostras de fezes visto que o RNA objeto é provável de ter sido degradado ou de outro modo fragmentado devido ao ambiente do intestino. Pode-se portanto de fato detectar fragmentos da molécula de RNA objeto, fragmentos estes que são identificados em virtude do uso de uma sonda específica adequada.
Em um outro aspecto, a presente invenção fornece um método para determinar a origem anatômica de uma célula ou população celular derivadas do intestino grosso de um indivíduo, que inclui:
avaliar dados de treinamento, que incluem a expressão de dados de treinamento que representam a expressão de genes em células ou populações celulares derivadas de origens conhecidas proximal-distal de um intestino grosso, e dados de treinamento de origem proximal-distal que representam as associações das ditas células ou populações celulares com as ditas origens proximais-distais;
processar os dados de treinamento usando a análise multivariada para gerar dados de classificação para gerar dados de origem proximal-distal indicativos de uma origem proximal-distal de uma célula ou população celular adicionais derivadas de um intestino grosso, com base nos dados de expressão adicionais que representam a expressão de genes na dita célula ou população celular adicionais.
A presente invenção também fornece um método de detecção para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, que inclui:
avaliar os dados de expressão primários que representam a expressão de genes em células ou populações celulares derivadas de origens conhecidas proximal-distal de pelo menos um intestino grosso;
processar os dados de expressão selecionados usando a análise multivariada para gerar dados de modelo multivariado representativos de associações entre os dados de expressão selecionados e origens proximais- distais das ditas células ou populações celulares;
receber os segundos dados de expressão que representam a expressão de genes em uma célula ou população celular derivada do intestino grosso de um indivíduo; e
processar os segundos dados de expressão e os dados de modelo multivariado para gerar dados de origem proximal-distal representativos de uma origem proximal-distal das ditas célula ou população celular.
Preferivelmente, a etapa de avaliar os dados de expressão primários inclui avaliar os dados de expressão terciários dos quais os ditos dados de expressão primários são um subconjunto e o método inclui processar os ditos dados de expressão terciários para selecionar um subconjunto dos dados de expressão terciários que corresponde a um subconjunto de genes diferencialmente expressados sozinhos ou em combinação ao longo do eixo proximal-distal do dito intestino grosso, o subconjunto selecionado sendo os ditos dados de expressão primários.
Preferivelmente, o método inclui processar os ditos outros dados de expressão e os ditos dados de classificação multivariados para gerar os ditos dados de origem proximal-distal que representam as ditas origens proximais-distais.
Mais preferivelmente, os dados de expressão selecionados correspondem aos genes selecionados de:
o gene ou genes detectados pela sonda Affymetrix número: .218888 s at
o gene detectado pela sonda Affymetrix número: 225290 _at o gene detectado pela sonda Affymetrix número: 226432_ at o gene detectado pela sonda Affymetrix número: 231576_ _at o gene detectado pela sonda Affymetrix número: 235733_ at o gene detectado pela sonda Affymetrix número: 236894 at o gene detectado pela sonda Affymetrix número: 239656 at o gene detectado pela sonda Affymetrix número: 242059 at o gene detectado pela sonda Affymetrix número: 242683 at o gene detectado pela sonda Affymetrix número: 230105 at o gene detectado pela sonda Affymetrix número: 230269 at o gene detectado pela sonda Affymetrix número: 238378_ at o gene detectado pela sonda Affymetrix número: 239814 at o gene detectado pela sonda Affymetrix número: 239994 at o gene detectado pela sonda Affymetrix número: 240856 at o gene detectado pela sonda Affymetrix número: 242414_ at o gene detectado pela sonda Affymetrix número: 244553_ at o gene detectado pela sonda Affymetrix número: 217320 o gene detectado pela sonda Affymetrix número: 236141 o gene detectado pela sonda Affymetrix número: 236513 o gene detectado pela sonda Affymetrix número: 238143 ABHD5, FAM3B, IGFBP2, POPDC3, ADRA2A, FLJ10884, KCNG1, REGIA, APOBEC1, FLJ22761, KIF AP3, SLC14A2, C10orf45, FTHFD, LOC375295, SLC20A1, C10orf58, GCNT1, ME3, SLC23A3, CCL8, HAS3, MEP1B, SLC38A2, CLDNl 5, ΗΟΧΒ6, NPY6R, SLC9A3, DEFA5, HOXD4, NR1H3, TBCC, EY Α2, HSD3B2, HR1H4, ZNF493,
OSTalfa, PAP,
AFARPl ou o gene ou genes detectados pela sonda Affymetrix número: 202234_s_at,
ANPEP ou o gene ou genes detectados pela sonda Affymetrix número 202888_s_at,
CCL13 ou o gene ou genes detectados pela sonda Affymetrix número: 206407_s_at
CRYLl ou o gene ou genes detectados pela sonda Affymetrix número: 220753_s_at,
CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número: 206754_s_at,
CYP2C18, ou o gene ou genes detectados pela sonda Affymetrix número: 208126_s_at,
CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número: 214421_x_at ou 220017_x_at,
EPB41L3 ou o gene ou genes detectados pela sonda Affymetrix número: 211776_s_at
ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 222262_s_at ou 224453_s_at,
FAM45A ou o gene ou genes detectados pela sonda Affymetrix número: 221804_s_at ou 222955_s_at,
FGFR2 ou o gene ou genes detectados pela sonda Affymetrix número: 203639_s_at,
GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 219954_s_at, GSPT2 ou o gene ou genes detectados pela sonda Affymetrix número: 20554l_s_at,
GULPl ou o gene ou genes detectados pela sonda Affymetrix número: 215 913_s_at,
HOXA9 ou o gene ou genes detectados pela sonda Affymetrix número: 205366_s_at ou 214551_s_at,
HOXC6 ou o gene ou genes detectados pela sonda Affymetrix número: 206858_s_at,
HOXD3 ou o gene ou genes detectados pela sonda Affymetrix número: 20660l_s_at,
ME2 ou o gene ou genes detectados pela sonda Affymetrix número: 210153_s_at,
MESPl ou o gene ou genes detectados pela sonda Affymetrix número: 224476_s_at,
MOCS1 ou o gene ou genes detectados pela sonda Affymetrix número: 21318 l_s_at,
MSCP ou o gene ou genes detectados pela sonda Affymetrix número: 21813 6_s_at ou 221920_s_at,
NET02 ou o gene ou genes detectados pela sonda Affymetrix número: 222774_s_at,
OASL ou o gene ou genes detectados pela sonda Affymetrix número: 210757_s_at,
PITX2 ou o gene ou genes detectados pela sonda Affymetrix número: 207558_s_at,
PRAPl ou o gene ou genes detectados pela sonda Affymetrix número: 243669_s_at,
SCUBE2 ou o gene ou genes detectados pela sonda Affymetrix número: 219197_s_at,
SEC6L1 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
SLC16A1 ou o gene ou genes detectados pela sonda Affymetrix número: 202236_s_at ou 209900_s_at,
UGT1A3 ou o gene ou genes detectados pela sonda Affymetrix número: 208596_s_at,
UGT1A8 ou o gene ou genes detectados pela sonda Affymetrix número: 221305_s_at
ACACA, FMOD, LOC151162, Sl OOP, C13orfl 1, FRMD3, MCF2L, SCGB2A1, C20orf56, GALNT5, MMP28, SCNN1B, CAPNl 3, GARNL4, MUCl 1, SHANK2, CLDN8, GCG, MUC12, SIAT2, COLM, GNE, MUC17, SIAT4C, CRIP1, HGD, MUC5B, SIAT7F, DNAJC12, HOXB13, NEDD4L, SIDTl, FAM3C, INSL5, PARP8, SLCl 3 A2, FBX025, IRS1, PCDH21, SLPI, FLJ20366, ISL1, PI3, SPINK5, FLJ20989, KIAA0703, PRAC, SST, KIAA0830, PRAC2, TFF1, KIAA1913, PTTGIIP, TNFSFl 1, LAMAl, QPRT, TPH1, LGALS2, QSCN6, WFDC2,
RBM24,
ARF4 ou o gene ou genes detectados pela sonda Affymetrix número: 201097_s_at,
BTG3 ou o gene ou genes detectados pela sonda Affymetrix número: 213134_x_at ou 205548_s_at,
CHSTS ou o gene ou genes detectados pela sonda Affymetrix número: 221164_x_at ou 223942_x_at,
CMAH ou o gene ou genes detectados pela sonda Affymetrix número: 205518_s_at,
CRYBA2 ou o gene ou genes detectados pela sonda Affymetrix número: 220136_s_at
CTSE ou o gene ou genes detectados pela sonda Affymetrix número: 205927_s_at,
DKFZp761N1114 ou o gene ou genes detectados pela sonda Affymetrix número: 242372_s_at
EPB41L4A ou o gene ou genes detectados pela sonda Affymetrix número: 228256_s_at,
EPHA3 ou o gene ou genes detectados pela sonda Affymetrix número: 206070_s_at,
FAS ou o gene ou genes detectados pela sonda Affymetrix número: 20478l_s_at,
FER1L3 ou o gene ou genes detectados pela sonda Affymetrix número: 201798_s_at ou 211864_s_at,
FLJ20152 ou o gene ou genes detectados pela sonda Affymetrix número: 218532_s_at ou 218510_x_at,
FLJ23548 ou o gene ou genes detectados pela sonda Affymetrix número: 218187_s_at
FNl ou o gene ou genes detectados pela sonda Affymetrix número: 211719_s_at ou 210495_x_at ou 212464_at ou 216442_x_at,
FOXA2 ou o gene ou genes detectados pela sonda Affymetrix número: 210103_s_at,
FRZB ou o gene ou genes detectados pela sonda Affymetrix número: 203698_s_at,
GDF15 ou o gene ou genes detectados pela sonda Affymetrix número: 2215 77 x_at, GJB3 ou o gene ou genes detectados pela sonda Affymetrix número: 205490_s_at,
HOXD13 ou o gene ou genes detectados pela sonda Affymetrix número: 207397_s_at,
INSMl ou o gene ou genes detectados pela sonda Affymetrix número: 206502_s_at,
MGC4170 ou o gene ou genes detectados pela sonda Affymetrix número: 212959_s_at,
MLPH ou o gene ou genes detectados pela sonda Affymetrix número: 218211 _s_at,
NEBL ou o gene ou genes detectados pela sonda Affymetrix número: 203962_s_at,
PLA2G2A ou o gene ou genes detectados pela sonda Affymetrix número: 203649_s_at,
PTPRO ou o gene ou genes detectados pela sonda Affymetrix número: 208121_s_at,
PYY ou o gene ou genes detectados pela sonda Affymetrix número: 207080_s_at ou 211253_x_at,
SH3BP4 ou o gene ou genes detectados pela sonda Affymetrix número: 222258_s_at,
SLC28A2 ou o gene ou genes detectados pela sonda Affymetrix número: 207249_s_at,
SLC2A10 ou o gene ou genes detectados pela sonda Affymetrix número: 221024_s_at,
SPONl ou o gene ou genes detectados pela sonda Affymetrix número: 213994_s_at ou 209437_s_at,
STS ou o gene ou genes detectados pela sonda Affymetrix número: 203769_s_at TM4SF11 ou o gene ou genes detectados pela sonda Affymetrix número: 204519_s_at, TUSC3 ou o gene ou genes detectados pela sonda Affymetrix número: 213432_s_at ou 209228_x_at,
AQP8 LGALS2 EFNAl ORF51E2 CCLll C60RF105 EMPl PROMl CLDN8 CCLll FST REG3A MMP12 CD69 GHR SCNNlB P2RY14 CLC HLA-DRB 4 ST3GAL4 CCL18 CPM HOXDlO ST6GALNAC6 ACSLl DEFA6 HSD17B2 AGR2 DHRS9 HSPCA ASPN IGHD
MTlM
SUD ou o gene ou genes detectados pela Affymetrix sonda número: 200832_s_at,
ABCB1 ou o gene ou genes detectados pela sonda Affymetrix número: 211994_s_at,
BTBD3 ou o gene ou genes detectados pela sonda Affymetrix número: 202946_s_at,
CAl ou o gene ou genes detectados pela sonda Affymetrix número: 205950_s_at,
DHRS9 ou o gene ou genes detectados pela sonda Affymetrix número: 224009_x_at ou 223952_x_at,
DKFZP564I1171 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at
EIF5A ou o gene ou genes detectados pela sonda Affymetrix número: 201123_s_at,
IGHD ou o gene ou genes detectados pela sonda Affymetrix número: 214973_x_at,
PCKl ou o gene ou genes detectados pela sonda Affymetrix número: 208383_s_at,
RBP4 ou o gene ou genes detectados pela sonda Affymetrix número: 219140_s_at,
TRPM6 ou o gene ou genes detectados pela sonda Affymetrix número: 224412_s_at,
UGT1A6 ou o gene ou genes detectados pela sonda Affymetrix número: 215125_s_at.
A presente invenção também fornece um método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, que inclui:
avaliar os dados de expressão primários que representam a expressão de genes em células ou populações celulares derivadas de origens conhecidas proximal-distal de pelo menos um intestino grosso; e
processar os dados de expressão primários usando método de núcleo para gerar dados de classificação para processar os segundos dados de expressão que representam a expressão dos ditos genes em pelo menos uma célula ou população celular secundárias de um intestino grosso para gerar dados de origem proximal-distal que representam a origem proximal-distal da dita pelo menos uma célula ou população celular secundárias.
Preferivelmente, o método inclui processar os ditos segundos dados de expressão e os ditos dados de classificação para gerar dados de origem proximal-distal que representam as ditas localizações.
Preferivelmente, o dito método de núcleo inclui uma máquina vetorial de sustentação (SVM).
Mais preferivelmente, os ditos dados de classificação são representativos de genes selecionados de:
o gene ou genes detectados pela sonda Affymetrix número: .218888_s_at
o gene detectado pela sonda Affymetrix número: 225290_at ο gene detectado pela sonda Affymetrix número: 226432_ at O gene detectado pela sonda Affymetrix número: 231576_ at O gene detectado pela sonda Affymetrix número: 235733_ at O gene detectado pela sonda Affymetrix número: 236894_ at O gene detectado pela sonda Affymetrix número: 239656 at O gene detectado pela sonda Affymetrix número: 242059 at O gene detectado pela sonda Affymetrix número: 242683 at O gene detectado pela sonda Affymetrix número: 230105 _at O gene detectado pela sonda Affymetrix número: 230269 at O gene detectado pela sonda Affymetrix número: 238378_ _at O gene detectado pela sonda Affymetrix número: 239814 at O gene detectado pela sonda Affymetrix número: 239994 at O gene detectado pela sonda Affymetrix número: 240856 at O gene detectado pela sonda Affymetrix número: 242414_ at O gene detectado pela sonda Affymetrix número: 244553_ at O gene detectado pela sonda Affymetrix número: 217320 O gene detectado pela sonda Affymetrix número: 236141 O gene detectado pela sonda Affymetrix número: 236513 O gene detectado pela sonda Affymetrix número: 238143
ABHD5, FAM3B, IGFBP2, POPDC3, ADRA2A, FLJ10884, KCNG1, REGIA, APOBEC1, FLJ22761, KIF AP3, SLC14A2, C10orf45, FTHFD, LOC375295, SLC20A1, C10orf58, GCNTl, ME3, SLC23A3, CCL8, HAS3, MEP1B, SLC38A2, CLDNl 5, HOXB6, NPY6R, SLC9A3, DEF A5, HOXD4, NRl H3, TBCC, EYA2, HSD3B2, HR1H4, ZNF493,
OSTalfa, PAP,
AFARPl ou o gene ou genes detectados pela sonda Affymetrix número: 202234_s_at,
ANPEP ou o gene ou genes detectados pela sonda Affymetrix número: 202888_s_at,
CCL13 ou o gene ou genes detectados pela sonda Affymetrix número: 206407_s_at
CRYLl ou o gene ou genes detectados pela sonda Affymetrix número: 220753_s_at, CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número: 206754_s_at,
CYP2C18, ou o gene ou genes detectados pela sonda Affymetrix número: 208126_s_at,
CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número: 21442l_x_at ou 220017_x_at
EPB41L3 ou o gene ou genes detectados pela sonda Affymetrix número: 211776_s_at
ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 222262_s_at ou 224453_s_at,
FAM45A ou o gene ou genes detectados pela sonda Affymetrix número: 221804_s_at ou 222955_s_at
FGFR2 ou o gene ou genes detectados pela sonda Affymetrix número: 203639_s_at,
GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 219954_s_at,
GSPT2 ou o gene ou genes detectados pela sonda Affymetrix número: 20554l_s_at,
GULPl ou o gene ou genes detectados pela sonda Affymetrix número: 215913_s_at, ΗΟΧΑ9 ou o gene ou genes detectados pela sonda Affymetrix número: 205366_s_at ou 214551_s_at,
H0XC6 ou o gene ou genes detectados pela sonda Affymetrix número: 206858_s_at,
HOXD3 ou o gene ou genes detectados pela sonda Affymetrix número: 20660l_s_at,
ME2 ou o gene ou genes detectados pela sonda Affymetrix número: 210153_s_at,
MESPl ou o gene ou genes detectados pela sonda Affymetrix número: 224476_s_at,
MOCSl ou o gene ou genes detectados pela sonda Affymetrix número: 213181 _s_at,
MSCP ou o gene ou genes detectados pela sonda Affymetrix número: 218136_s_at ou 221920_s_at,
NET02 ou o gene ou genes detectados pela sonda Affymetrix número: 222774_s_at,
OASL ou o gene ou genes detectados pela sonda Affymetrix número: 210757_s_at,
PITX2 ou o gene ou genes detectados pela sonda Affymetrix número: 207558_s_at,
PRAPl ou o gene ou genes detectados pela sonda Affymetrix número: 243669_s_at,
SCUBE2 ou o gene ou genes detectados pela sonda Affymetrix número: 219197_s_at,
SEC6L1 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
SLC16Al ou o gene ou genes detectados pela sonda Affymetrix número: 202236_s_at ou 209900_s_at,
UGT1A3 ou o gene ou genes detectados pela sonda Affymetrix número: 208596_s_at,
UGT1A8 ou o gene ou genes detectados pela sonda Affymetrix número: 221305_s_at
ACACA, FMOD, LOC151162, Sl OOP, C13orfl 1, FRMD3, MCF2L, SCGB2A1, C20orf56, GALNT5, MMP28, SCNN1B, CAPN13, GARNL4, MUCl 1, SHANK2, CLDN8, GCG, MUC12, SIAT2, COLM, GNE, MUC17, SIAT4C, CRIP1, HGD, MUC5B, SIAT7F, DNAJC12, HOXB13, NEDD4L, SIDTl, FAM3C, INSL5, PARP8, SLCl 3 A2, FBX025, IRS1, PCDH21, SLPI, FLJ20366, ISL1, PI3, SPINK5, FLJ20989, KIAAO703, PRAC, SST, KIAA0830, PRAC2, TFF1, KIAA1913, PTTGIIP, TNFSF11, LAMA1, QPRT, TPHl, LGALS2, QSCN6, WFDC2,
RBM24,
ARF4 ou o gene ou genes detectados pela sonda Affymetrix número: 201097_s_at,
BTG3 ou o gene ou genes detectados pela sonda Affymetrix número: 213134_x_at ou 205548_s_at,
CHSTS ou o gene ou genes detectados pela sonda Affymetrix número: 221164_x_at ou 223942_x_at,
CMAH ou o gene ou genes detectados pela sonda Affymetrix número: 205518_s_at,
CRYBA2 ou o gene ou genes detectados pela sonda Affymetrix número: 220136_s_at
CTSE ou o gene ou genes detectados pela sonda Affymetrix número: 205927_s_at,
DKFZp761N1114 ou o gene ou genes detectados pela sonda Affymetrix número: 242372_s_at,
EPB41L4A ou o gene ou genes detectados pela sonda Affymetrix número: 228256_s_at,
EPHA3 ou o gene ou genes detectados pela sonda Affymetrix número: 206070_s_at,
FAS ou o gene ou genes detectados pela sonda Affymetrix número: 20478 l_s_at,
FER1L3 ou o gene ou genes detectados pela sonda Affymetrix número: 201798_s_at ou 211864_s_at,
FLJ20152 ou o gene ou genes detectados pela sonda Affymetrix número: 218532_s_at ou 218 510_x_at,
FLJ23548 ou o gene ou genes detectados pela sonda Affymetrix número: 218187_s_at,
FNl ou o gene ou genes detectados pela sonda Affymetrix número: 211719_s_at ou 210495_x_at ou 212464_at ou 216442_x_at, FOXA2 ou o gene ou genes detectados pela sonda Affymetrix número: 210103_s_at,
FRZB ou o gene ou genes detectados pela sonda Affymetrix número: 203698_s_at,
GDF15 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_x_at,
GJB3 ou o gene ou genes detectados pela sonda Affymetrix número: 205490_s_at,
HOXD13 ou o gene ou genes detectados pela sonda Affymetrix número: 207397_s_at, INSMl ou o gene ou genes detectados pela sonda Affymetrix número: 206502_s_at,
MGC4170 ou o gene ou genes detectados pela sonda Affymetrix número: 212959_s_at,
MLPH ou o gene ou genes detectados pela sonda Affymetrix número: 21821 l_s_at,
NEBL ou o gene ou genes detectados pela sonda Affymetrix número: 203962_s_at,
PLA2G2A ou o gene ou genes detectados pela sonda Affymetrix número: 203649_s_at
PTPRO ou o gene ou genes detectados pela sonda Affymetrix número: 208121_s_at,
PYY ou o gene ou genes detectados pela sonda Affymetrix número: 207080_s_at ou 211253_x_at,
SH3BP4 ou o gene ou genes detectados pela sonda Affymetrix número: 222258_s_at,
SLC28A2 ou o gene ou genes detectados pela sonda Affymetrix número: 207249_s_at,
SLC2A10 ou o gene ou genes detectados pela sonda Affymetrix número: 221024_s_at
SPONl ou o gene ou genes detectados pela sonda Affymetrix número: 213994_s_at ou 209437_s_at,
STS ou o gene ou genes detectados pela sonda Affymetrix número: 203769_s_at
TM4SF11 ou o gene ou genes detectados pela sonda Affymetrix número: 204519_s_at,
TUSC3 ou o gene ou genes detectados pela sonda Affymetrix número: 213432_s_at ou 209228_x_at,
AQP8 LGALS2 EFNAl ORF51E2 CCLll C60RF105 EMPl PROMl CLDN8 CCLll FST REG3A MMP12 CD69 GHR SCNNlB P2RY14 CLC HLA-DRB4 ST3GAL4 CCL18 CPM HOXDlO ST6GALNAC6 ACSLl DEFA6 HSD17B2 AGR2 DHRS9 HSPCA ASPN IGHD
MTlM
SCD ou o gene ou genes detectados pela sonda Affymetrix número: 200832_s_at,
ABCB1 ou o gene ou genes detectados pela sonda Affymetrix número: 211994_s_at,
BTBD3 ou o gene ou genes detectados pela sonda Affymetrix número: 202946_s_at,
CAl ou o gene ou genes detectados pela sonda Affymetrix número: 205950_s_at,
DHRS9 ou o gene ou genes detectados pela sonda Affymetrix número: 224009_x_at ou 223952_x_at,
DKFZP56411171 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
EIF5A ou o gene ou genes detectados pela sonda Affymetrix número: 201123_s_at,
IGHD ou o gene ou genes detectados pela sonda Affymetrix número: 214973_x_at,
PCKl ou o gene ou genes detectados pela sonda Affymetrix número: 208383_s_at,
RBP4 ou o gene ou genes detectados pela sonda Affymetrix número: 219140_s_at, TRPM6 ou o gene ou genes detectados pela sonda Affymetrix número: 224412_s_at,
UGT1A6 ou o gene ou genes detectados pela sonda Affymetrix número: 215125_s_at,
Ainda mais preferivelmente, os ditos dados de classificação são representativos de um subconjunto de 13 genes.
O mais preferivelmente, os ditos 13 genes são
PRAC,
CCLl 1,
FRZB ou o gene ou genes detectados pela sonda Affymetrix número: 203698_s_at,
GDF15 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_x_at, CLDN8,
SEC6L1 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_x_at,
GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 279954_s_at, DEF A5, SPINK5, OSTalfa,
ANPEP ou o gene ou genes detectados pela sonda Affymetrix número: 202888_s_at, e MUC5.
A presente invenção também fornece um método de detecção para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, que inclui:
avaliar os dados de expressão primários que representam a expressão de genes em células ou populações celulares derivadas de origens conhecidas proximal-distal de pelo menos um intestino grosso;
processar os primeiros dados usando a análise de componentes principais para gerar dados de componente principal que correspondem a pelo menos uma combinação linear da expressão dos ditos genes, os ditos dados de componente principal sendo indicativo de pelo menos uma das ditas origens proximais-distais das ditas células ou populações celulares.
Preferivelmente, as ditas etapas de avaliar os dados de expressão primários inclui avaliar os dados de expressão terciários dos quais os ditos dados de expressão primários são um subconjunto, e o método inclui processar os ditos dados de expressão terciários para selecionar um subconjunto dos dados de expressão terciários selecionados que correspondem a um subconjunto de genes diferencialmente expressados ao longo do eixo proximal-distal do dito pelo menos um intestino grosso, o subconjunto selecionado sendo os ditos dados de expressão primários.
Preferivelmente, Os dados de expressão selecionados correspondem aos genes selecionados de:
o gene ou genes detectados pela sonda Affymetrix número: .218888_s_at
o gene detectado pela sonda Affymetrix número: 225290_at o gene detectado pela sonda Affymetrix número: 226432_at o gene detectado pela sonda Affymetrix número: 231576_at o gene detectado pela sonda Affymetrix número: 235733_at o gene detectado pela sonda Affymetrix número: 236894_at o gene detectado pela sonda Affymetrix número: 239656_at o gene detectado pela sonda Affymetrix número: 242059_at o gene detectado pela sonda Affymetrix número: 242683_at o gene detectado pela sonda Affymetrix número: 230105_at o gene detectado pela sonda Affymetrix número: 230269_at o gene detectado pela sonda Affymetrix número: 238378_at o gene detectado pela sonda Affymetrix número: 239814_at o gene detectado pela sonda Affymetrix número: 239994_at o gene detectado pela sonda Affymetrix número: 240856_at o gene detectado pela sonda Affymetrix número: 242414_at o gene detectado pela sonda Affymetrix número: 244553_at o gene detectado pela sonda Affymetrix número: 217320 o gene detectado pela sonda Affymetrix número: 236141 o gene detectado pela sonda Affymetrix número: 236513 o gene detectado pela sonda Affymetrix número: 238143
ABHD5, FAM3B, IGFBP2, POPDC3, ADRA2A, FLJ10884, KCNG1, REGIA, APOBEC1, FLJ22761, KIF AP3, SLC14A2, C10orf45, FTHFD, LOC375295, SLC20A1, C10orf58, GCNT1, ME3, SLC23A3, CCL8, HAS3, MEP1B, SLC38A2, CLDNl 5, HOXB6, NPY6R, SLC9A3, DEFA5, HOXD4, NR1H3, TBCC, EYA2, HSD3B2, HRl H4, ZNF493, OSTalfa, PAP,
AFARPl ou o gene ou genes detectados pela sonda Affymetrix número: 202234_s_at,
ANPEP ou o gene ou genes detectados pela sonda Affymetrix número: 202888_s_at,
CCL13 ou o gene ou genes detectados pela sonda Affymetrix número: 206407_s_at
CRYLl ou o gene ou genes detectados pela sonda Affymetrix número: 220753_s_at,
CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número: 206754_s_at,
CYP2C18, ou o gene ou genes detectados pela sonda Affymetrix número: 208126_s_at,
CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número: 214421_x_at ou 220017_x_at,
EPB41L3 ou o gene ou genes detectados pela sonda Affymetrix número: 211776_s_at
ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 222262_s_at ou 224453__s_at,
FAM45A ou o gene ou genes detectados pela sonda Affymetrix número: 221804_s_at ou 222955_s_at,
FGFR2 ou o gene ou genes detectados pela sonda Affymetrix número: 203639_s_at,
GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 219954_s_at,
GSPT2 ou o gene ou genes detectados pela sonda Affymetrix número: 20554l_s_at,
GULP 1 ou o gene ou genes detectados pela sonda Affymetrix número: 215913_s_at,
HOXA9 ou o gene ou genes detectados pela sonda Affymetrix número: 205366_s_at ou 21455l_s_at,
HOXC6 ou o gene ou genes detectados pela sonda Affymetrix número: 206858_s_at,
HOXD3 ou o gene ou genes detectados pela sonda Affymetrix número: 20660l_s_at,
ME2 ou o gene ou genes detectados pela sonda Affymetrix número: 210153_s_at,
MESPl ou o gene ou genes detectados pela sonda Affymetrix número: 224476_s_at, MOCSl ou o gene ou genes detectados pela sonda Affymetrix número: 213181 _s_at,
MSCP ou o gene ou genes detectados pela sonda Affymetrix número: 218136_s_at ou 221920_s_at,
NET02 ou o gene ou genes detectados pela sonda Affymetrix número: 222774_s_at,
OASL ou o gene ou genes detectados pela sonda Affymetrix número: 210757_s_at,
PITX2 ou o gene ou genes detectados pela sonda Affymetrix número: 207558_s_at,
PRAPl ou o gene ou genes detectados pela sonda Affymetrix número: 243669_s_at,
SCUBE2 ou o gene ou genes detectados pela sonda Affymetrix número: 219197_s_at,
SEC6L1 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
SLC16A1 ou o gene ou genes detectados pela sonda Affymetrix número: 202236_s_at ou 209900_s_at
UGT1A3 ou o gene ou genes detectados pela sonda Affymetrix número: 208596_s_at,
UGT1A8 ou o gene ou genes detectados pela sonda Affymetrix número: 221305_s_at
ACACA, FMOD, LOCl 51162, Sl OOP, C13orfl 1, FRMD3, MCF2L, SCGB2A1, C20orf56, GALNT5, MMP28, SCNN1B, CAPN13, GARNL4, MUCl 1, SHANK2, CLDN8, GCG, MUC12, SIAT2, COLM, GNE, MUC17, SIAT4C, CRIP1, HGD, MUC5B, SIAT7F, DNAJC12, HOXB13, NEDD4L, SIDTl, FAM3C, INSL5, PARP8, SLC13A2, FBX025, IRS1, PCDH21, SLPI, FLJ20366, ISL1, PI3, SPINK5, FLJ20989, KIAA0703, PRAC, SST, KIAA0830, PRAC2, TFF1, KIAA1913, PTTGIIP, TNFSFl 1, LAMAl, QPRT, TPHl, LGALS2, QSCN6, WFDC2,
RBM24,
ARF4 ou o gene ou genes detectados pela sonda Affymetrix número: 201097_s_at,
BTG3 ou o gene ou genes detectados pela sonda Affymetrix número: 213134_x_at ou 205548_s_at,
CHST5 ou o gene ou genes detectados pela sonda Affymetrix número: 221164_x_at ou 223942_x_at,
CMAH ou o gene ou genes detectados pela sonda Affymetrix número: 205518_s_at,
CRYBA2 ou o gene ou genes detectados pela sonda Affymetrix número: 220136_s_at
CTSE ou o gene ou genes detectados pela sonda Affymetrix número: 205927_s_at,
DKFZp761N1114 ou o gene ou genes detectados pela sonda Affymetrix número: 242372_s_at,
EPB41L4A ou o gene ou genes detectados pela sonda Affymetrix número: 228256_s_at,
EPHA3 ou o gene ou genes detectados pela sonda Affymetrix número: 206070_s_at,
FAS ou o gene ou genes detectados pela sonda Affymetrix número: 20478l_s_at,
FER1L3 ou o gene ou genes detectados pela sonda Affymetrix número: 201798_s_at ou 211864_s_at,
FLJ20152 ou o gene ou genes detectados pela sonda Affymetrix número: 218532_s_at ou 218 510_x_at,
FL323548 ou o gene ou genes detectados pela sonda Affymetrix número: 218187_s_at,
FNl ou o gene ou genes detectados pela sonda Affymetrix número: 211719_s_at ou 210495_x_at ou 212464_at ou 216442_x_at,
FOXA2 ou o gene ou genes detectados pela sonda Affymetrix número: 210103_s_at,
FRZB ou o gene ou genes detectados pela sonda Affymetrix número: 203698_s_at,
GDF15 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_x_at,
GJB3 ou o gene ou genes detectados pela sonda Affymetrix número: 205490_s_at,
HOXD13 ou o gene ou genes detectados pela sonda Affymetrix número: 207397_s_at,
INSMl ou o gene ou genes detectados pela sonda Affymetrix número: 206502_s_at,
MGC4170 ou o gene ou genes detectados pela sonda Affymetrix número: 212959_s_at,
MLPH ou o gene ou genes detectados pela sonda Affymetrix número: 21821 l_s_at,
NEBL ou o gene ou genes detectados pela sonda Affymetrix número: 203962_s_at,
PLA2G2A ou o gene ou genes detectados pela sonda Affymetrix número: 203649_s_at PTPRO ou o gene ou genes detectados pela sonda Affymetrix número: 20812l_s_at,
PYY ou o gene ou genes detectados pela sonda Affymetrix número: 207080_s_at ou 211253_x_at, SH3BP4 ou o gene ou genes detectados pela sonda Affymetrix número: 222258_s_at,
SLC28A2 ou o gene ou genes detectados pela sonda Affymetrix número: 207249_s_at,
SLC2A10 ou o gene ou genes detectados pela sonda Affymetrix número: 221024_s_at,
SPONl ou o gene ou genes detectados pela sonda Affymetrix número: 213994_s_at ou 209437_s_at,
STS ou o gene ou genes detectados pela sonda Affymetrix número: 203769_s_at
TM4SF11 ou o gene ou genes detectados pela sonda Affymetrix número: 204519_s_at,
TUSC3 ou o gene ou genes detectados pela sonda Affymetrix número: 213432_s_at ou 209228_x_at,
AQP8 LGALS2 EFNAl ORF51E2 CCLll C60RF105 EMPl PROMl CLDN8 CCLll FST REG3A MMP12 CD69 GHR SCNNlB P2RY14 CLC HLA-DRB4 ST3GAL4 CCL18 CPM HOXDlO ST6GALNAC6 ACSLl DEFA6 HSDl 7B2 AGR2 DHRS9 HSPCA ASPN IGHD
MTlM
SCD ou o gene ou genes detectados pela sonda Affymetrix número: 200832_s_at,
ABCB1 ou o gene ou genes detectados pela sonda Affymetrix número: 211994_s_at,
BTBD3 ou o gene ou genes detectados pela sonda Affymetrix número: 202946_s_at,
CAl ou o gene ou genes detectados pela sonda Affymetrix número: 205950_s_at,
DHRS9 ou o gene ou genes detectados pela sonda Affymetrix número: 224009_x_at ou 223952_x_at,
DKFZP56411171 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
EIF5A ou o gene ou genes detectados pela sonda Affymetrix número: 201123_s_at,
IGHD ou o gene ou genes detectados pela sonda Affymetrix número: 214973_x_at,
PCKl ou o gene ou genes detectados pela sonda Affymetrix número: 208383_s_at,
RBP4 ou o gene ou genes detectados pela sonda Affymetrix número: 219140_s_at,
TRPM6 ou o gene ou genes detectados pela sonda Affymetrix número: 224412_s_at,
UGT1A6 ou o gene ou genes detectados pela sonda Affymetrix número: 215125_s_at,
A presente invenção também fornece um método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, que inclui:
avaliar os dados de expressão primários que representam a expressão de genes em uma célula ou população celular derivada de origens conhecidas proximal-distal de pelo menos um intestino grosso; e processar os dados de expressão usando análise de variação canônica para gerar dados de variação canônica indicativos de pelo menos uma das origens proximais-distais das ditas células ou populações celulares.
Preferivelmente, a dita análise de variação canônica inclui a análise de perfil.
Preferivelmente, os ditos subconjuntos de gene incluem genes selecionados de:
o gene ou genes detectados pela sonda Affymetrix número: .218888 s at
0 gene detectado pela sonda Affymetrix número: 225290 at o gene detectado pela sonda Affymetrix número: 226432_ at 0 gene detectado pela sonda Affymetrix número: 231576 at O gene detectado pela sonda Affymetrix número: 235733_ at O gene detectado pela sonda Affymetrix número: 236894 at O gene detectado pela sonda Affymetrix número: 239656 at O gene detectado pela sonda Affymetrix número: 242059 at O gene detectado pela sonda Affymetrix número: 242683_ at O gene detectado pela sonda Affymetrix número: 230105 at O gene detectado pela sonda Affymetrix número: 230269 at O gene detectado pela sonda Affymetrix número: 238378, at O gene detectado pela sonda Affymetrix número: 239814_ at O gene detectado pela sonda Affymetrix número: 239994 at O gene detectado pela sonda Affymetrix número: 240856 at O gene detectado pela sonda Affymetrix número: 242414_ at O gene detectado pela sonda Affymetrix número: 244553_ at O gene detectado pela sonda Affymetrix número: 217320 O gene detectado pela sonda Affymetrix número: 236141 O gene detectado pela sonda Affymetrix número: 236513 O gene detectado pela sonda Affymetrix número: 238143 ABHD5, FAM3B, IGFBP2, POPDC3, ADRA2A, FLJ10884, KCNG1, REGIA, APOBEC1, FLJ22761, KIF AP3, SLCl 4 A2, C10orf45, FTHFD, LOC375295, SLC20A1, C10orf58, GCNT1, ME3, SLC23A3, CCL8, HAS3, MEP1B, SLC38A2, CLDNl 5, HOXB6, NPY6R, SLC9A3, DEF A5, HOXD4, NRl H3, TBCC, EYA2, HSD3B2, HR1H4, OSTalfa, PAP, ZNF493,
AFARPl ou o gene ou genes detectados pela sonda Affymetrix número: 202234_s_at,
ANPEP ou o gene ou genes detectados pela sonda Affymetrix número: 202888_s_at,
CCL13 ou o gene ou genes detectados pela sonda Affymetrix número: 206407_s_at
CRYL1 ou o gene ou genes detectados pela sonda Affymetrix número: 220753_s_at,
CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número: 206754_s_at,
CYP2C 18, ou o gene ou genes detectados pela sonda Affymetrix número: 208126_s_at,
CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número: 21442l_x_at ou 220017_x_at,
EPB41L3 ou o gene ou genes detectados pela sonda Affymetrix número: 211776_s_at
ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 222262 s at ou 224453 s at, FAM45A ou o gene ou genes detectados pela sonda Affymetrix número: 221804_s_at ou 222955_s_at,
FGFR2 ou o gene ou genes detectados pela sonda Affymetrix número: 203639_s_at,
GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 219954_s_at,
GSPT2 ou o gene ou genes detectados pela sonda Affymetrix número: 205541_s_at,
GULPl ou o gene ou genes detectados pela sonda Affymetrix número: 215913_s_at,
HOXA9 ou o gene ou genes detectados pela sonda Affymetrix número: 205366_s_at ou 21455 l_s_at
HOXC6 ou o gene ou genes detectados pela sonda Affymetrix número: 206858_s_at,
HOXD3 ou o gene ou genes detectados pela sonda Affymetrix número: 20660 l_s_at,
ME2 ou o gene ou genes detectados pela sonda Affymetrix número: 210153_s_at,
MESPl ou o gene ou genes detectados pela sonda Affymetrix número: 224476_s_at,
MOCSl ou o gene ou genes detectados pela sonda Affymetrix número: 213181 _s_at,
MSCP ou o gene ou genes detectados pela sonda Affymetrix número: 218136_s_at ou 221920_s_at,
NET02 ou o gene ou genes detectados pela sonda Affymetrix número: 222774_s_at,
OASL ou o gene ou genes detectados pela sonda Affymetrix número: 210757_s_at,
PITX2 ou o gene ou genes detectados pela sonda Affymetrix número: 207558_s_at,
PRAPl ou o gene ou genes detectados pela sonda Affymetrix número: 243669_s_at,
SCUBE2 ou o gene ou genes detectados pela sonda Affymetrix número: 219197_s_at,
SEC6L1 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
SLC16Al ou o gene ou genes detectados pela sonda Affymetrix número: 202236_s_at ou 209900_s_at,
UGT1A3 ou o gene ou genes detectados pela sonda Affymetrix número: 208596_s_at,
UGT1A8 ou o gene ou genes detectados pela sonda Affymetrix número: 221305_s_at
ACACA, FMOD, LOC151162, Sl OOP, C13orfl 1, FRMD3, MCF2L, SCGB2A1, C20orf56, GALNT5, MMP28, SCNN1B, CAPNl 3, GARNL4, MUCl 1, SHANK2, CLDN8, GCG, MUC12, SIAT2, COLM, GNE, MUC17, SIAT4C, CRIP1, HGD, MUC5B, SIAT7F, DNAJC12, HOXB13, NEDD4L, SIDTl, FAM3C, INSL5, PARP8, SLCl 3 A2, FBX025, IRS1, PCDH21, SLPI, FLJ20366, ISL1, PI3, SPINK5, FLJ20989, KIAA0703, PRAC, SST, KIAA0830, PRAC2, TFF1, KIAA1913, PTTGlIP, TNFSFl 1, LAMA1, QPRT, TPH1, LGALS2, QSCN6, WFDC2, RBM24,
ARF4 ou o gene ou genes detectados pela sonda Affymetrix número: 201097_s_at,
BTG3 ou o gene ou genes detectados pela sonda Affymetrix número: 213134_x_at ou 205548_s_at,
CHST5 ou o gene ou genes detectados pela sonda Affymetrix número: 221164_x_at ou 223942_x_at,
CMAH ou o gene ou genes detectados pela sonda Affymetrix número: 205518_s_at, CRYBA2 ou o gene ou genes detectados pela sonda Affymetrix número: 220136_s_at
CTSE ou o gene ou genes detectados pela sonda Affymetrix número: 205927_s_at,
DKFZp761Nl 114 ou o gene ou genes detectados pela sonda Affymetrix número: 2423 72_s_at,
EPB41L4A ou o gene ou genes detectados pela sonda Affymetrix número: 228256_s_at,
EPHA3 ou o gene ou genes detectados pela sonda Affymetrix número: 206070_s_at, FAS ou o gene ou genes detectados pela sonda Affymetrix número: 20478l_s_at,
FER1L3 ou o gene ou genes detectados pela sonda Affymetrix número: 201798_s_at ou 211864_s_at,
FLJ20152 ou o gene ou genes detectados pela sonda Affymetrix número: 218532_s_at ou 218510_x_at,
FLJ23548 ou o gene ou genes detectados pela sonda Affymetrix número: 218187_s_at,
FNl ou o gene ou genes detectados pela sonda Affymetrix número: 211719 s at ou 210495_x at ou 212464_at ou 216442_x_at, FOXA2 ou o gene ou genes detectados pela sonda Affymetrix número: 210103_s_at,
FRZB ou o gene ou genes detectados pela sonda Affymetrix número: 203698_s_at,
GDF15 ou o gene ou genes detectados pela sonda Affymetrix número: 2215 77_x_at,
GJB 3 ou o gene ou genes detectados pela sonda Affymetrix número: 205490_s_at,
HOXD13 ou o gene ou genes detectados pela sonda Affymetrix número: 207397_s_at,
INSMl ou o gene ou genes detectados pela sonda Affymetrix número: 206502_s_at,
MGC4170 ou o gene ou genes detectados pela sonda Affymetrix número: 212959_s_at,
MLPH ou o gene ou genes detectados pela sonda Affymetrix número: 21821 l_s_at,
NEBL ou o gene ou genes detectados pela sonda Affymetrix número: 203962_s_at,
PLA2G2A ou o gene ou genes detectados pela sonda Affymetrix número: 203649_s_at,
PTPRO ou o gene ou genes detectados pela sonda Affymetrix número: 208121_s_at,
PYY ou o gene ou genes detectados pela sonda Affymetrix número: 207080_s_at ou 211253_x_at,
SH3BP4 ou o gene ou genes detectados pela sonda Affymetrix número: 222258_s_at,
SLC28A2 ou o gene ou genes detectados pela sonda Affymetrix número: 207249_s_at,
SLC2A10 ou o gene ou genes detectados pela sonda Affymetrix número: 221024_s_at,
SPONl ou o gene ou genes detectados pela sonda Affymetrix número: 213994_s_at ou 209437_s_at,
STS ou o gene ou genes detectados pela sonda Affymetrix número: 203769_s_at
TM4SF11 ou o gene ou genes detectados pela sonda Affymetrix número: 204519_s_at,
TUSC3 ou o gene ou genes detectados pela sonda Affymetrix número: 213432 s atou209228 χ at
AQP8 LGALS2 EFNAl ORF51E2 CCLll C60RF105 EMPl PROMl CLDN8 CCLll FST REG3A MMP12 CD69 GHR SCNNlB P2RY14 CLC HLA-DRB4 ST3GAL4 CCL18 CPM HOXDlO ST6GALNAC6 ACSLl DEFA6 HSD17B2 AGR2 DHRS9 HSPCA ASPN IGHD
MTlM
SCD ou o gene ou genes detectados pela sonda Affymetrix número: 200832_s_at,
ABCB1 ou o gene ou genes detectados pela sonda Affymetrix número: 211994_s_at,
BTBD3 ou o gene ou genes detectados pela sonda Affymetrix número: 202946_s_at,
CAl ou o gene ou genes detectados pela sonda Affymetrix número: 205950_s_at,
DHRS9 ou o gene ou genes detectados pela sonda Affymetrix número: 224009 χ at ou 223952_x_at, DKFZP56411171 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
EIFSA ou o gene ou genes detectados pela sonda Affymetrix número: 201123_s_at,
IGHD ou o gene ou genes detectados pela sonda Affymetrix número: 214973_x_at,
PCKl ou o gene ou genes detectados pela sonda Affymetrix número: 208383_s_at,
RBP4 ou o gene ou genes detectados pela sonda Affymetrix número: 219140_s_at,
TRPM6 ou o gene ou genes detectados pela sonda Affymetrix número: 224412_s_at,
UGT1A6 ou o gene ou genes detectados pela sonda Affymetrix número: 215125_s_at,
A presente invenção também fornece um método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, que inclui:
avaliar dados de treinamento, que inclui a expressão de dados de treinamento que representam a expressão de genes em células ou populações celulares derivadas de origens conhecidas proximal-distal de pelo menos um intestino grosso, e dados de treinamento de origem proximal-distal que representam as associações das ditas células ou populações celulares com as ditas origens proximais-distais;
processar os dados de treinamento para gerar dados de classificação que representam uma combinação linear ou não linear de níveis de expressão dos ditos genes, os ditos dados de classificação sendo adaptados para gerar dados de origem proximal-distal adicionais indicativo de uma origem proximal-distal de uma célula ou subpopulação celular adicionais tiradas de um intestino grosso, com base nos dados de expressão adicionais que representam a expressão dos ditos genes na dita célula ou subpopulação celular adicionais.
Vantajosamente, o dito processamento pode incluir processar os ditos dados de treinamento com GeneRave.
Preferivelmente, os ditos subconjuntos de gene incluem genes selecionados de:
o gene ou genes detectados pela sonda Affymetrix número: .218888 s at
o gene detectado pela sonda Affymetrix número: 225290_ at o gene detectado pela sonda Affymetrix número: 226432_ at 0 gene detectado pela sonda Affymetrix número: 231576_ at O gene detectado pela sonda Affymetrix número: 235733_ at O gene detectado pela sonda Affymetrix número: 236894 at O gene detectado pela sonda Affymetrix número: 239656 at O gene detectado pela sonda Affymetrix número: 242059_ at O gene detectado pela sonda Affymetrix número: 242683_ at O gene detectado pela sonda Affymetrix número: 230105 at O gene detectado pela sonda Affymetrix número: 230269 at O gene detectado pela sonda Affymetrix número: 238378_ at O gene detectado pela sonda Affymetrix número: 239814 at O gene detectado pela sonda Affymetrix número: 239994 at O gene detectado pela sonda Affymetrix número: 240856_ at O gene detectado pela sonda Affymetrix número: 242414_ at O gene detectado pela sonda Affymetrix número: 244553_ at O gene detectado pela sonda Affymetrix número: 217320 O gene detectado pela sonda Affymetrix número: 236141 O gene detectado pela sonda Affymetrix número: 236513 O gene detectado pela sonda Affymetrix número: 238143 ABHD5, FAM3B, IGFBP2, POPDC3, ADRA2A, FLJ10884, KCNG1, REGIA, APOBEC1, FLJ22761, KIF AP3, SLC14A2, C10orf45, FTHFD, LOC375295, SLC20A1, C10orf58, GCNT1, ME3, SLC23A3, CCL8, HAS3, MEP1B, SLC38A2, CLDNl 5, HOXB6, NPY6R, SLC9A3, DEFA5, HOXD4, NR1H3, TBCC, EYA2, HSD3B2, HR1H4, ZNF493,
OSTalfa,
P AP,
AFARPl ou o gene ou genes detectados pela sonda Affymetrix número: 202234_s_at,
ANPEP ou o gene ou genes detectados pela sonda Affymetrix número: 202888_s_at,
CCL13 ou o gene ou genes detectados pela sonda Affymetrix número: 206407_s_at
CRYL1 ou o gene ou genes detectados pela sonda Affymetrix número: 220753_s_at,
CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número: 206754_s_at,
CYP2C18, ou o gene ou genes detectados pela sonda Affymetrix número: 208126_s_at,
CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número: 214421_x_at ou 220017_x_at,
EPB41L3 ou o gene ou genes detectados pela sonda Affymetrix número: 211776_s_at
ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 222262_s_at ou 224453_s_at,
FAM45A ou o gene ou genes detectados pela sonda Affymetrix número: 221804_s_at ou 222955_s_at,
FGFR2 ou o gene ou genes detectados pela sonda Affymetrix número: 203639_s_at,
GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 219954_s_at,
GSPT2 ou o gene ou genes detectados pela sonda Affymetrix número: 20554l_s_at,
GULPl ou o gene ou genes detectados pela sonda Affymetrix número: 215 913_s_at,
HOXA9 ou o gene ou genes detectados pela sonda Affymetrix número: 205366_s_at ou 21455 l_s_at,
HOXC6 ou o gene ou genes detectados pela sonda Affymetrix número: 206858_s_at,
H0XD3 ou o gene ou genes detectados pela sonda Affymetrix número: 20660l_s_at,
ME2 ou o gene ou genes detectados pela sonda Affymetrix número: 210153_s_at,
MESPl ou o gene ou genes detectados pela sonda Affymetrix número: 224476_s_at,
MOCSl ou o gene ou genes detectados pela sonda Affymetrix número: 213181 _s_at,
MSCP ou o gene ou genes detectados pela sonda Affymetrix número: 218136_s_at ou 221920_s_at,
NET02 ou o gene ou genes detectados pela sonda Affymetrix número: 222774_s_at,
OASL ou o gene ou genes detectados pela sonda Affymetrix número: 210757_s_at,
PITX2 ou o gene ou genes detectados pela sonda Affymetrix número: 207558_s_at, PRAP1 ou o gene ou genes detectados pela sonda Affymetrix número: 243669_s_at,
SCUBE2 ou o gene ou genes detectados pela sonda Affymetrix número: 219197_s_at,
SEC6L1 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
SLC16A1 ou o gene ou genes detectados pela sonda Affymetrix número: 202236_s_at ou 209900_s_at,
UGT1A3 ou o gene ou genes detectados pela sonda Affymetrix número: 208596_s_at,
UGT1A8 ou o gene ou genes detectados pela sonda Affymetrix número: 221305_s_at
ACACA, FMOD, LOC151162, Sl OOP, C13orfl 1, FRMD3, MCF2L, SCGB2A1, C20orf56, GALNT5, MMP28, SCNN1B, CAPN13, GARNL4, MUCl 1, SHANK2, CLDN8, GCG, MUC12, SIAT2, COLM, GNE, MUC17, SIAT4C, CRIP1, HGD, MUC5B, SIAT7F, DNAJC12, HOXB13, NEDD4L, SIDTl, FAM3C, INSL5, PARP8, SLCl 3 A2, FBX025, IRS1, PCDH21, SLPI, FLJ20366, ISL1, PI3, SPINK5, FLJ20989, KIAA0703, PRAC, SST, KIAA0830, PRAC2, TFF1, KIAA1913, PTTGIIP, TNFSFl 1, LAMA1, QPRT, TPHl, LGALS2, QSCN6, WFDC2,
RBM24, ARF4 ou o gene ou genes detectados pela sonda Affymetrix número: 201097_s_at,
BTG3 ou o gene ou genes detectados pela sonda Affymetrix número: 213134_x_at ou 205548_s_at, CHST5 ou o gene ou genes detectados pela sonda Affymetrix número: 221164_x_at ou 223942_x_at,
CMAH ou o gene ou genes detectados pela sonda Affymetrix número: 205518_s_at,
CRYBA2 ou o gene ou genes detectados pela sonda Affymetrix número: 220136_s_at
CTSE ou o gene ou genes detectados pela sonda Affymetrix número: 205927_s_at,
DKFZp761Nl 114 ou o gene ou genes detectados pela sonda Affymetrix número: 242372_s_at,
EPB41L4A ou o gene ou genes detectados pela sonda Affymetrix número: 228256_s_at,
EPHA3 ou o gene ou genes detectados pela sonda Affymetrix número: 206070_s_at,
FAS ou o gene ou genes detectados pela sonda Affymetrix número: 20478 l_s_at,
FER1L3 ou o gene ou genes detectados pela sonda Affymetrix número: 201798_s_at ou 211864_s_at,
FLJ20152 ou o gene ou genes detectados pela sonda Affymetrix número: 218532_s_at ou 218510_x_at,
FLJ23548 ou o gene ou genes detectados pela sonda Affymetrix número: 218187_s_at,
FNl ou o gene ou genes detectados pela sonda Affymetrix número: 211719_s_at ou 210495_x_at ou 212464_at ou 216442_x_at,
FOXA2 ou o gene ou genes detectados pela sonda Affymetrix número: 210103_s_at,
FRZB ou o gene ou genes detectados pela sonda Affymetrix número: 203698_s_at,
GDF15 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_x_at,
GJB3 ou o gene ou genes detectados pela sonda Affymetrix número: 205490_s_at,
HOXD13 ou o gene ou genes detectados pela sonda Affymetrix número: 207397_s_at,
INSMl ou o gene ou genes detectados pela sonda Affymetrix número: 206502_s_at,
MGC4170 ou o gene ou genes detectados pela sonda Affymetrix número: 212959_s_at,
MLPH ou o gene ou genes detectados pela sonda Affymetrix número: 218211 _s_at,
NEBL ou o gene ou genes detectados pela sonda Affymetrix número: 203962_s_at,
PLA2G2A ou o gene ou genes detectados pela sonda Affymetrix número: 203649_s_at,
PTPRO ou o gene ou genes detectados pela sonda Affymetrix número: 208121_s_at,
PYY ou o gene ou genes detectados pela sonda Affymetrix número: 207080_s_at ou 211253_x_at,
SH3BP4 ou o gene ou genes detectados pela sonda Affymetrix número: 222258_s_at,
SLC28A2 ou o gene ou genes detectados pela sonda Affymetrix número: 207249_s_at,
SLC2A10 ou o gene ou genes detectados pela sonda Affymetrix número: 221024_s_at, SPONl ou o gene ou genes detectados pela sonda Affymetrix número: 213994_s_at ou 209437_s_at,
STS ou o gene ou genes detectados pela sonda Affymetrix número: 203769_s_at, TM4SF11 ou o gene ou genes detectados pela sonda Affymetrix número: 204519_s_at,
TUSC3 ou o gene ou genes detectados pela sonda Affymetrix número: 213432_s_at ou 209228_x_at,
AQP8 LGALS2 EFNAl ORF51E2 CCLll C60RF105 EMPl PROMl CLDN8 CCLll FST REG3A MMP12 CD69 GHR SCNNlB P2RY14 CLC HLA-DRB4 ST3GAL4 CCL18 CPM HOXDlO ST6GALNAC6 ACSLl DEFA6 HSD17B2 AGR2 DHRS 9 HSPCA ASPN IGHD
MTlM
SCD ou o gene ou genes detectados pela sonda Affymetrix número: 200832_s_at,
ABCB1 ou o gene ou genes detectados pela sonda Affymetrix número: 211994_s_at,
BTBD3 ou o gene ou genes detectados pela sonda Affymetrix número: 202946_s_at, CAl ou o gene ou genes detectados pela sonda Affymetrix número: 205950_s_at,
DHRS9 ou o gene ou genes detectados pela sonda Affymetrix número: 224009_x_at ou 223952_x_at,
DKFZP56411171 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
EIF5A ou o gene ou genes detectados pela sonda Affymetrix número: 201123_s_at,
IGHD ou o gene ou genes detectados pela sonda Affymetrix número: 214973_x_at,
PCKl ou o gene ou genes detectados pela sonda Affymetrix número: 208383_s_at,
RBP4 ou o gene ou genes detectados pelar sonda Affymetrix número: 219140_s_at,
TRPM6 ou o gene ou genes detectados pela sonda Affymetrix número: 224412_s_at,
UGT1A6 ou o gene ou genes detectados pela sonda Affymetrix número: 215125_s_at.
Vantajosamente, os ditos subconjuntos de gene podem incluir .7 genes.
Preferivelmente, os ditos 7 genes são SEC6L1, PRAC, SPINK5, SEC6L1, ANPEP, DEFA5, e CLDN8.
Em uma outra forma de realização preferida, os ditos subconjuntos de gene são um ou mais dos seguintes subconjuntos:
(i) SCD ou o gene ou genes detectados pela sonda Affymetrix
número: 200832_s_at, MMP12 P2RY14 CLDN8 ETNK 1
(ii) PCP4
SLC28A2 ou o gene ou genes detectados pela sonda Affymetrix número: 207249_s_at, CCL18 RBP4 ou o gene ou genes detectados pela sonda Affymetrix número: 219140_s_at,
DKFZP56411171 PRAC
(iii) EIF5A ou o gene ou genes detectados pela sonda Affymetrix número: 201123_s_at,
IGFBP2
GDF15 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_s_at,
DKFZP564I1171 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at,
MUC12
(iv) HLA-DRB4
HOXB13
INSL5
(v) ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 222262_s_at,
ANPEP ou o gene ou genes detectados pela sonda Affymetrix número: 202888_s_at,
DEFA5
CHST5 ou o gene ou genes detectados pela sonda Affymetrix número: 221164_x_at,
o gene detectado pela Sonda Affymetrix Ns 226432_at COLM
(vi) SCNNlB
FNl ou o gene ou genes detectados pela sonda Affymetrix número: 211719_x_at,
ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 224453 s_at, O gene detectado pela Sonda Affymetrix N2 225290_at OSTalfa HOXDlO Sonda Na 230269 (vii) SLC20A1
HSPCA
O gene detectado pela Sonda Affymetrix No. 217320_at CCL18 HOXB13 (viii) CD69
OLFM4 ou o gene ou genes detectados pela sonda Affymetrix número: 212768_s_at,
UGT1A6 ou o gene ou genes detectados pela sonda Affymetrix número: 215125_s_at, CHST5 ou o gene ou genes detectados pela sonda Affymetrix número: 223942_x_at,
O gene detectado pela Sonda Affymetrix No. 231576_at MUCll
(ix) PLA2G2A ou o gene ou genes detectados pela sonda Affymetrix número: 203649_s_at,
REG3A
CCL13 ou o gene ou genes detectados pela sonda Affymetrix número: 206407_s_at, GCG
UGT1A3 ou o gene ou genes detectados pela sonda Affymetrix número: 208596_s_at,
FNl ou o gene ou genes detectados pela sonda Affymetrix número: 210485_x_at, MTlM OR51E2
(χ) SLC16A1 ou ο gene ou genes detectados pela sonda Affymetrix número: 202236_s_at, WFDC2
S10013
PTPRO ou o gene ou genes detectados pela sonda Affymetrix número: 208121_s_at, CCLll ASPN
FAM3B
(xi) EMPl
NEBL ou o gene ou genes detectados pela sonda Affymetrix número: 203962_s_at, TFFl
CMAH ou o gene ou genes detectados pela sonda Affymetrix
número: 205518_s_at,
PYY ou o gene ou genes detectados pela sonda Affymetrix número: 207080_s_at, ECATll
NET02 ou o gene ou genes detectados pela sonda Affymetrix
número: 222774_s_at,
(xii) HSD17B2 HGD
CAl ou o gene ou genes detectados pela sonda Affymetrix
número: 205950_s_at,
CPM LGALS2
IGHD ou o gene ou genes detectados pela sonda Affymetrix número: 214973 x_at, FNl ou o gene ou genes detectados pela sonda Affymetrix número: 216442_xs_at,
(xiii) CLC DEFA6
FNl ou o gene ou genes detectados pela sonda Affymetrix
número: 212464_s_at, FST
O gene detectado pela Sonda Affymetrix No. 236513_at O gene detectado pela Sonda Affymetrix No. 240856_at ETNKl
(xiv) PITX2 ou o gene ou genes detectados pela sonda Affymetrix número: 207558_s_at,
DHRS9 ou o gene ou genes detectados pela sonda Affymetrix número: 224009_x_at, DKFZp761Nl 114
KIAA1913
(xv) GHR HSD3B2 MEPlB
HOXA9 ou o gene ou genes detectados pela sonda Affymetrix
número: 213651_s_at,
TRPM6 ou o gene ou genes detectados pela sonda Affymetrix número: 224412_s_at,
O gene detectado pela Sonda Affymetrix N- 239994_at (xvi) SPINK5
PCKl ou o gene ou genes detectados pela sonda Affymetrix número: 208383_s_at,
ADRA2A
NQOl ou o gene ou genes detectados pela sonda Affymetrix número: 210519_s_at, GBA3
O gene detectado pela Sonda Affymetrix No. 228004_at
(xvii) SCGB2A1 NR1H4
NET02 ou o gene ou genes detectados pela sonda Affymetrix
número: 218888_s_at,
ST6GALNAC6
(xviii) NEBL
PROMl ou o gene ou genes detectados pela sonda Affymetrix número: 204304_s_at,
AGR2 REGIA
UGT1A8 ou o gene ou genes detectados pela sonda Affymetrix número: 221305_s_at, DKFZp761N1114 ou o gene ou genes detectados pela sonda
Affymetrix número: 242372_s_at,
(xix) ACSLl ST3GAL4
GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 219954_s_at,
SLC2A10 ou o gene ou genes detectados pela sonda Affymetrix número: 221024_s_at,
DHRS9 ou o gene ou genes detectados pela sonda Affymetrix número: 223952_s_at, LAMA 1
(xx) EFNAl
BTBD3 ou o gene ou genes detectados pela sonda Affymetrix número: 202946_s_at, PI3 ABCB1 ou o gene ou genes detectados pela sonda Affymetrix número: 209994_s_at, C10orf45 BCMPll Cóorfl 05 CAPN13 CPM
O gene detectado pela Sonda Affymetrix No. 236141_at O gene detectado pela Sonda Affymetrix No. 238143_at Referência à "origem proximal-distal" deve ser entendida como uma referência às células ou dados de expressão de uma origem proximal ou uma origem distai. Referência às "células ou subpopulações celulares", "intestino grosso", "proximal", "distai", "origem", "localizações", "gene" e "expressão" deve ser entendida ter o mesmo significado como mais acima fornecido.
A presente invenção também fornece um sistema de detecção tendo componentes para executar qualquer um dos métodos acima.
A presente invenção também fornece um meio de armazenagem legível por computador tendo armazenado nele instruções de programa para executar qualquer um dos métodos acima.
A presente invenção também fornece um sistema de detecção, que inclui:
meios para avaliar dados de treinamento, que inclui a expressão de dados de treinamento que representam a expressão de genes em células ou populações celulares derivadas de pelo menos um intestino grosso, e dados de treinamento de origem proximal-distal que representam as associações das ditas células ou célula populações com as ditas origens proximais-distais;
meios para processar os dados de treinamento usando a análise multivariada para gerar dados de classificação que representam uma combinação linear ou não linear de níveis de expressão dos ditos genes, os ditos dados de classificação sendo adaptados para gerar dados de origem proximal-distal indicativos de uma origem proximal-distal de uma célula ou população celular adicionais tiradas de um intestino grosso, com base nos dados de expressão adicionais que representam a expressão dos ditos genes na dita célula ou população celular adicionais.
Como detalhado mais acima, o método da presente invenção é útil para identificar células anormais com base em que uma célula de origem distai ou proximal que não esteja expressando as características de perfil de expressão de gene daquela origem anatômica está exibindo um perfil de expressão anormal e portanto deve passar por outra análise para determinar o grau e natureza completos da anormalidade objeto. Por exemplo, algumas células de adenoma ou adenocarcinoma colorretais podem exibir um perfil de expressão no intestino grosso proximal-distal incorreto devido aos eventos de desdiferenciação que são característicos da transformação neoplástica destas células.
Consequentemente, em um outro aspecto é fornecido um método para determinar o início ou predisposição ao início de uma anormalidade celular ou uma condição caracterizada por uma anormalidade celular no intestino grosso, o dito método compreendendo determinar, de acordo com um dos métodos mais acima descritos, o perfil de expressão de um gene proximal-distal de uma amostra biológica derivada de uma origem proximal ou distai conhecida no intestino grosso em que a detecção de um perfil de expressão de gene que seja incompatível com o perfil de expressão de gene do intestino grosso proximal-distal normal é indicativo da anormalidade da célula ou população celular que expressam o dito perfil.
Referência a "perfil de expressão de gene" deve ser entendida como uma referência aos resultados da expressão de gene univaríados ou multivariados mais acima descritos. Por exemplo, o "perfil" pode correlacionar-se com o nível de expressão de um ou mais genes marcadores como mais acima debatido ou o resultado da análise multivariada dos genes e/ou conjuntos de gene mais acima descritos. Consequentemente, referência a "perfil de expressão de gene proximal-distal" é uma referência às características de perfil de expressão de gene de células de origem do intestino grosso proximal e aquelas de células de origem do intestino grosso distai.
Seria avaliado que as células que são o objeto de análise no contexto da presente invenção são de origem proximal ou distai conhecida. Esta informação pode ser determinada por qualquer método adequado mas é mais convenientemente satisfeita isolando-se a amostra biológica de uma localização definida no intestino grosso por intermédio de uma biópsia. Entretanto, outros métodos adequados de colher ou de outro modo determinar a origem anatômica da amostra biológica não são excluídos.
A anormalidade de uma célula ou população celular da amostra biológica está fundamentada na detecção de um perfil de expressão de gene que é incompatível com aquele do perfil que normalmente caracterizaria uma célula de sua origem proximal ou distai particular. Por "incompatível" é intencionado que o nível de expressão de um ou mais dos genes que são analisados não é compatível com aquele que é tipicamente observado em um controle normal.
O método da presente invenção é útil como um teste autônomo ou como um monitor corrente destes indivíduos considerados como estando em risco do desenvolvimento de doença ou como um monitor da eficácia de regimes de tratamento terapêuticos ou profiláticos tais como a ablação de células doentes que são caracterizadas por um perfil de expressão de gene anormal. Nestas situações, o mapeamento da modulação de níveis de expressão ou perfis de expressão de marcador de localização em qualquer uma ou mais classes de amostras biológicas é um indicador valioso da situação de um indivíduo ou da eficácia de um regime terapêutico ou profilático que esteja correntemente em uso. Consequentemente, o método da presente invenção deve ser entendido estender-se ao monitoramento para a modulação de níveis de ou perfis de expressão de marcador de localização em um indivíduo em relação a um nível normal (como mais acima definido) ou em relação a um ou mais níveis ou perfis de expressão de gene marcador mais no início determinados a partir de uma amostra biológica do dito indivíduo.
Meios de testar quanto aos marcadores de localização expressados objetos em uma amostra biológica podem ser obtidos por qualquer método adequado, que seria bem conhecido pela pessoa de habilidade na técnica, tais como mas não limitados a:
(i) Detecção in vivo.
A formação de imagem molecular pode ser usada a seguir da administração das sondas ou reagentes de formação de imagem capazes de divulgar a expressão alterada dos marcadores nos tecidos intestinais.
A formação de imagem molecular (Moore et al., BBA, 1402: .239-249, 1988; Weissleder et al., Nature Medicine 6: 351-355, 2000) é a formação de imagem in vivo da expressão molecular que correlaciona-se com as macro-características correntemente visualizadas usando as técnicas de formação de imagem de diagnóstico "clássicas" tais como Raio X, tomografia computadorizada (CT), MRI, tomografia de Emissão de Pósitron (PET) ou endoscopia.
(ii) A detecção de supra-regulagem da expressão de RNA nas células pela Hibridização In Situ Fluorescente (FISH), ou em extratos das células pelas tecnologias tais como a Transcriptase Reversa Quantitativa- Reação da Cadeia da Polimerase (QRT-PCR) ou qualificação citométrica de fluxo dos produtos da RT-PCR (Wedemeyer et al., Clinicai Chemistiy 48: 9 .1398-1405,2002). (iii) A avaliação de perfis de expressão de RNA a partir de extratos celulares, por exemplo pelas tecnologias de conjunto (Alon et ai, Proc. Natl. Acad. Sei. USA: 96, 6745-6750, Junho de 1999).
Um "microarranjo" é um conjunto linear ou multidimensional de regiões preferivelmente separadas, cada uma tendo uma área definida, formada na superfície de um suporte sólido. A densidade das regiões separadas em um microarranjo é determinada pelo número total de polinucleotídeos alvo a serem detectados na superfície de um único suporte de fase sólida, preferivelmente pelo menos cerca de 50/cm , mais preferivelmente pelo menos cerca de 100/cm , ainda mais preferivelmente pelo menos cerca de 500/cm , e ainda mais preferivelmente pelo menos cerca de 1.000/cm2. Como aqui usado, um microarranjo de DNA é um conjunto de sondas de oligonucleotídeo colocadas em um chip ou outras superfícies usadas para amplificar ou clonar polinucleotídeos alvo. Visto que a posição de cada grupo particular de sondas no conjunto é conhecida, as identidades dos polinucleotídeos alvo podem ser determinadas com base na sua ligação a uma posição particular no microarranjo.
Desenvolvimentos recentes na tecnologia de microarranjo de DNA torna possível conduzir um ensaio em larga escala de uma pluralidade de moléculas de ácido nucléico alvo em um único suporte de fase sólida. A Pat. U.S. N° 5.837.832 (Chee et al.) e os pedidos de patente relacionados descrevem a imobilização de um conjunto de sondas de oligonucleotídeo para a hibridização e detecção de seqüências de ácido nucléico específicas em uma amostra. Os polinucleotídeos alvo de interesse isolados de um tecido de interesse são hibridizados à chip de DNA e as seqüências específicas detectadas com base na preferência dos polinucleotídeos alvos e no grau de hibridização nas localizações de sonda separadas. Um uso importante dos conjuntos é na análise da expressão de gene diferencial, onde o perfil de expressão de genes em células ou tecidos diferentes, freqüentemente um tecido de interesse e um tecido de controle, é comparado e quaisquer diferenças na expressão de gene entre os respectivos tecidos são identificados. Tal informação é útil para a identificação dos tipos de genes expressados em um tipo de tecido particular e diagnóstico de condições com base no perfil de expressão.
Em um exemplo, o RNA da amostra de interesse é submetido à transcrição reversa para se obter cDNA rotulado. Ver a Pat. U.S. N° .6.410.229 (Lockhart et al.). O cDNA é depois hibridizado aos oligonucleotídeos ou cDNAs de seqüência conhecida ordenada em uma chip ou outra superfície em uma ordem conhecida. Em um outro exemplo, o RNA é isolado de uma amostra biológica e hibridizado a um chip no qual são ancoradas sondas de cDNA. As localizações do oligonucleotídeo ao qual o cDNA rotulado hibridiza fornece informação de seqüência no cDNA, enquanto que a quantidade de RNA ou cDNA hibridizados rotulados fornece uma estimativa da representação relativa do RNA ou cDNA de interesse. Ver Schena, et al. Science 270: 467-470 (1995). Por exemplo, o uso de um microarranjo de cDNA para analisar os padrões de expressão de gene em câncer humano é descrito por DeRisi, et al. (Nature Genetics 14: 457-460 (1996)).
Em uma forma de realização preferida, as sondas de ácido nucléico que correspondem aos ácidos nucléicos objetos são fabricadas. As sondas de ácido nucléico ligadas ao biochip são planejadas como sendo substancialmente complementar aos ácidos nucléicos da amostra biológica tal que a hibridização específica da seqüência alvo e das sondas da presente invenção ocorra. Esta complementaridade não precisa ser perfeita, em que pode haver qualquer número de desemparelhamentos de par de base que interferirão com a hibridização entre a seqüência alvo e os ácidos nucléicos de filamento único da presente invenção. É esperado que a homologia global dos genes ao nível de nucleotídeo provavelmente serão de cerca de 40% ou maior, provavelmente de cerca de 60% ou maior, e ainda mais provavelmente de cerca de 80% ou maior; e além disso que haverá seqüências contíguas correspondentes de cerca de 8 a 12 nucleotídeos ou mais longas. Entretanto, se o número de mutações é tão grande que nenhuma hibridização possa ocorrer mesmo sob o mínimo de condições de severidade de hibridização, a seqüência não é uma seqüência alvo complementar. Assim, por "substancialmente complementar" aqui é intencionado que as sondas sejam suficientemente complementar às seqüências alvo para hibridizar sob condições de reação normal, particularmente condições de alta severidade.
Uma sonda de ácido nucléico é no geral de filamento único mas pode ser até certo grau de filamento único e até certo grau de filamento duplo. A filamentabilidade da sonda é ditada pela estrutura, composição e propriedades da seqüência alvo. No geral, as sondas de oligonucleotídeo variam de cerca de 6, 8, 10, 12, 15, 20, 30 a cerca de 100 bases de comprimento, com cerca de 10 a cerca de 80 bases sendo preferidas, e de cerca de 15 a cerca de 40 bases sendo particularmente preferida. Isto é, no geral genes inteiros são raramente usados como sondas. Em algumas formas de realização, ácidos nucléicos muito longos podem ser usados, até centenas de bases. As sondas são suficientemente específicas para hibridizar a uma seqüência padrão complementar sob condições conhecidas por aqueles de habilidade na técnica. O número de desemparelhamentos entre as seqüências da sonda e suas seqüências padrão (alvo) complementares às quais elas hibridizam durante a hibridização no geral não excede 15%, usualmente não excede 10% e preferivelmente não excede 5%, como determinado por BLAST (ajustes de default).
As sondas de oligonucleotídeo podem incluir as bases heterocíclicas que ocorrem de modo natural normalmente encontradas em ácidos nucléicos (uracila, citosina, timina, adenina e guanina), assim como bases modificadas e análogos de base. Qualquer base modificada ou análogo de base compatível com a hibridização da sonda a uma seqüência alvo é útil na prática da invenção. A porção de açúcar ou glicosídeo da sonda pode compreender desoxirribose, ribose, e/ou formas modificadas destes açúcares, tais como, por exemplo, 2'-0-alquil ribose. Em uma forma de realização preferida, a porção de açúcar é 2'-desoxirribose; entretanto, qualquer porção de açúcar que seja compatível com a capacidade da sonda para hibridizar a um seqüência alvo pode ser usada.
Em uma forma de realização, as unidades de nucleosídeo da sonda são ligadas por uma cadeia principal de fosfodiéster, como é bem conhecido na técnica. Em formas de realização adicionais, as ligações internucleotídeo podem incluir qualquer ligação conhecida por uma pessoa de habilidade na técnica que seja compatível com hibridização específica da sonda que inclui, mas não limitada a fosforotioato, metilfosfonato, sulfamato (por exemplo, Pat. U.S. N° 5.470.967) e poliamida (isto é, ácidos nucléicos peptídicos). Os ácidos nucléicos peptídicos são descritos em Nielsen et ai. (1991) Science 254: 1497-1500, Pat. U.S. N2 5.714.331, e Nielsen (1999) Curr. Opin. Biotechnol. 10: 71-75.
Em certas formas de realização, a sonda pode ser uma molécula quimérica; isto é, pode compreender mais do que um tipo de base ou subunidade de açúcar, e/ou as ligações pode ser de mais do que um tipo dentro do mesmo iniciador. A sonda pode compreender uma porção para facilitar a hibridização à sua seqüência alvo, como são conhecidos na técnica, por exemplo, intercaladores e/ou aglutinantes de ranhura menor. Variações das bases, açúcares, e cadeia principal internucleosídica, assim como a presença de qualquer grupo pendente na sonda, serão compatíveis com a capacidade da sonda para ligar, em uma maneira específica de semente, com a sua seqüência alvo. Um número grande de modificações estruturais, são possíveis dentro destas ligações. Vantajosamente, as sondas de acordo com a presente invenção podem ter características estruturais tal que elas permitam a amplificação de sinal, tais características estruturais sendo, por exemplo, sondas de DNA ramificadas como aquelas descritas por Urdea et al. (Nucleic Acids Symp. Ser., 24: 197-200 (1991)) ou na Patente Européia Ns EP- .0225.807. Além disso, métodos sintéticos para preparar as várias bases heterocíclicas, açúcares, nucleosídeos e nucleotídeos que formam a sonda, e a preparação de oligonucleotídeos de seqüência específica pré determinada, são bem desenvolvidos e conhecidos na técnica. Um método preferido para a síntese de oligonucleotídeo incorpora a divulgação da Pat. U.S. N° 5.419.966.
Sondas múltiplas podem ser planejadas para um ácido nucléico alvo particular para se responsabilizarem pelo polimorfismo e/ou estrutura secundária no ácido nucléico alvo, redundância de dados e outros. Em algumas formas de realização, onde mais do que uma sonda por seqüência é usada, sondas de sobreposição ou sondas para seções diferentes de um único gene alvo são usadas. Isto é, duas, três, quatro ou mais sondas, são usadas para desenvolver em uma redundância para um alvo particular. As sondas podem ser de sobreposição (isto é, ter alguma seqüência em comum), ou são específicas para seqüências distintas de um gene. Quando polinucleotídeos de alvo múltiplo devam ser detectados de acordo com a presente invenção, cada sonda ou grupo de sonda que corresponde a um polinucleotídeo alvo particular é situada em uma área separada do microarranjo.
As sondas podem estar em solução, tal como em reservatórios ou na superfície de um microarranjo, ou ligadas a um suporte sólido. Exemplos de materiais de suporte sólido que podem ser usados incluem um plástico, uma cerâmica, um metal, uma resina, um gel e uma membrana. Os tipos úteis de suportes sólidos incluem placas, pérolas, material magnético, micropérolas, chips de hibridização, membranas, cristais, cerâmicas e monocamadas auto-montantes. Um exemplo compreende uma matriz bidimensional ou tridimensional, tal como um gel ou chip de hibridização com sítios de ligação de sonda múltipla (Pevzner et al., J. Biomol. Struc. & Dyn. 9: 399-410, 1991; Maskos e Southern, Nuc. Acids Res. 20: 1679-84, .1992).
As lascas de hibridização podem ser usadas para construir conjuntos de sonda muito grandes que são subseqüentemente hibridizadas com um ácido nucléico alvo. A análise do padrão de hibridização do chip pode ajudar na identificação da seqüência de nucleotídeo alvo. Os padrões podem ser manualmente analisados ou analisados por computador, mas está claro que o sequenciamento posicionai pela hibridização leva por si só á análise de computador e automação. Em um outro exemplo, pode-se usar um chip Affymetrix em um suporte estrutural de fase sólida em combinação com um método com base em pérola fluorescente. Já em um outro exemplo, pode- se utilizar um microarranjo de cDNA. Nesse aspecto, os oligonucleotídeos descritos por Lockkart et al (isto é, sondas de síntese Affymetrix in situ na fase sólida) são particularmente preferidos, isto é, fotolitografia.
Como será avaliado por aqueles na técnica, os ácidos nucléicos podem ser ligados ou imobilizados a um suporte sólido em uma ampla variedade de modos. Por "imobilizado" aqui é intencionada a associação ou ligação entre a sonda de ácido nucléico e o suporte sólido é suficiente para ser estável sob as condições de ligação, lavagem, análise e remoção. A ligação pode ser covalente ou não covalente. por "ligação não covalente" e equivalentes gramaticais aqui é intencionado uma ou mais das interações eletrostáticas, hidrofílicas e hidrofóbicas. Incluídas na ligação não covalente está a ligação covalente de uma molécula, tal como estreptavidina, ao suporte e a ligação não covalente da sonda biotinilada à estreptavidina. Por "ligação covalente" e equivalentes gramaticais aqui é intencionado que as duas porções, o suporte sólido e a sonda, sejam ligados por pelo menos uma ligação, que inclui ligações sigma, ligações pi e ligações de coordenação. As ligações covalentes podem ser formadas diretamente entre a sonda e o suporte sólido ou podem ser formadas por um reticulador ou pela inclusão de um grupo reativo específico no suporte sólido ou na sonda ou ambas as moléculas. A imobilização também pode envolver uma combinação de interações covalentes e não covalentes.
As sondas de ácido nucléico podem ser ligadas ao suporte sólido pela ligação covalente tal como pela conjugação com um agente de ligação ou pela ligação covalente ou não covalente tais como interações eletrostáticas, ligações de hidrogênio ou ligação de anticorpo-antígeno, ou pelas suas combinações. Os agentes de ligação típicos incluem biotina/avidina, biotina/estreptavidina, proteína A de Staphylococcus tfwrews/fragmento Fc de anticorpo IgG e quimeras de estreptavidina/proteína A (T. Sano e C. R. Cantor, Bio/Technology 9: 1378-81 (1991)), ou derivados ou combinações destes agentes. Os ácidos nucléicos podem ser ligados ao suporte sólido por uma ligação fotoclivável, uma ligação eletrostática, uma ligação de dissulfeto, uma ligação de peptídeo, uma ligação de diéster ou uma combinação destes tipos de ligações. A série também pode ser ligada ao suporte sólido por uma ligação seletivamente liberável tal como 4,4'- dimetoxitritila ou seus derivados. Verificou-se que derivados úteis incluem o ácido 3 ou 4 [bis-(4-metoxifenil)]-metil-benzóico, ácido N-succinimidil-3 ou .4 [bis-(4-metoxifenil)]-metil-benzóico, ácido N-succinimidil-3 ou 4 [bis-(4- metoxifenil)]-hidroximetil-benzóico, ácido N-succinimidil-3 ou 4 [bis-(4- metoxifenil)]-clorometil-benzóico e sais destes ácidos.
No geral, as sondas são ligadas ao biochip em uma ampla variedade de modos, como será avaliado por aqueles na técnica. Como aqui descrito, os ácidos nucléicos podem ser sintetizados primeiro, com a ligação subsequente ao biochip, ou podem ser diretamente sintetizados no biochip.
O biochip compreende um substrato sólido adequado. Por "substrato" ou "suporte sólido" ou outros equivalentes gramaticais aqui é intencionado qualquer material que possa ser modificada para conter sítios individuais separados apropriados para a ligação ou associação das sondas de ácido nucléico e é avaliável a pelo menos um método de detecção. O suporte de fase sólida da presente invenção pode ser de qualquer material sólido e estruturas adequadas para sustentar a hibridização e síntese de nucleotídeo. Preferivelmente, o suporte de fase sólida compreende pelo menos uma superfície substancialmente rígida em que os iniciadores possam ser imobilizados e a reação de transcriptase reversa realizada. Os substratos com os quais os elementos de microarranjo de polinucleotídeo são estavelmente associados e podem ser fabricados a partir de uma variedade de materiais, que incluem plásticos, cerâmicas, metais, acrilamida, celulose, nitrocelulose, vidro, poliestireno, vinil acetato de polietileno, polipropileno, polimetacrilato, polietileno, óxido de polietileno, polissilicatos, policarbonatos, Teflon.RTM., fluorocarbonetos, náilon, borracha de silicona, polianidridos, ácido poliglicólico, ácido poliláctico, poliortoésteres, polipropilfumerato, colágeno, glicosaminoglicanos e poliaminoácidos. Os substratos podem ser bidimensionais ou tridimensionais na forma, tais como géis, membranas, películas finas, vidros, placas, cilindros, pérolas, pérolas magnéticas, fibras ópticas, fibras tecidas, etc. Uma forma preferida de conjunto é um conjunto tridimensional. Um conjunto tridimensional preferido é uma coleção de pérolas rotuladas. Cada pérola rotulada tem iniciadores diferentes ligados a ela. Os rótulos são detectáveis por meios de sinalização tais como cor (Luminex, Illumina) e campo eletromagnético (Pharmaseq) e os sinais nas pérolas rotuladas podem ser ainda remotamente detectados (por exemplo, usando fibras ópticas). O tamanho do suporte sólido pode ser de qualquer um dos tamanhos de microarranjo padrão, úteis para a tecnologia de microarranjo de DNA e o tamanho pode ser feito de encomenda para se ajustar à máquina particular que é usada para conduzir uma reação da invenção. No geral, os substratos permitem a detecção óptica e não fluorescem apreciavelmente.
Em uma forma de realização, a superfície do biochip e da sonda pode ser derivada com grupos funcionais químicos para a ligação subsequente dos dois. Assim, por exemplo, o biochip é derivado com um grupo funcional químico que inclui, mas não limitado a, grupos amino, grupos carbóxi, grupos oxo e grupos tiol, com grupos amino sendo particularmente preferidos. Usando estes grupos funcionais, as sondas podem ser ligadas usando grupos funcionais nas sondas. Por exemplo, ácidos nucléicos contendo grupos amino podem ser ligados às superfícies que compreendem grupos amino, por exemplo usando ligadores como são conhecidos na técnica; por exemplo, ligadores homo- ou heterobifimcionais como são bem conhecidos (ver o catálogo de 1994 da Pierce Chemical Company, seção técnica sobre reticuladores, páginas 155 a 200, incorporados aqui por referência). Além disso, em alguns casos, ligadores adicionais, tais como grupos alquila (que incluem grupos substituídos e heteroalquila) podem ser usados.
Nesta forma de realização, os oligonucleotídeos são sintetizados como é conhecido na técnica e depois ligados à superfície do suporte sólido. Como será avaliado por aqueles habilitados na técnica, o terminal 5' ou 3' pode ser ligado ao suporte sólido, ou a ligação pode ser por intermédio de um nucleosídeo interno. Em uma forma de realização adicional, a imobilização ao suporte sólido pode ser muito forte, embora não covalente. Por exemplo, oligonucleotídeos biotinilados podem ser fabricados, que se ligam às superfícies covalentemente revestidas com estreptavidina, resultando em ligação.
As séries podem ser produzidas de acordo com qualquer metodologia conveniente, tal como pré formando os elementos do microarranjo de polinucleotídeo e depois estavelmente associando-os com a superfície. Alternativamente, os oligonucleotídeos podem ser sintetizados na superfície, como é conhecido na técnica. Várias configurações de arranjo diferentes e métodos para a sua produção são conhecidos por aqueles de habilidade na técnica e divulgados na WO 95/25116 e WO 95/35505 (técnicas fotolitográficas), Pat. U.S. N- 5.445.934 (síntese in situ pela fotolitografia), Pat. U.S. N° 5.384.261 (síntese in situ pelos caminhos de fluxo mecanicamente direcionados); e Pat. U.S. N2 5.700.637 (síntese pelo manchamento, impressão ou ligação); a divulgação das quais são aqui incorporadas em sua totalidade por referência. Um outro método para ligar DNA às pérolas usa ligandos específicos ligados à extremidade do DNA para ligar às moléculas de ligação de ligando ligadas a uma pérola. Os pares parceiros de ligação de ligando possíveis incluem biotina- avidina/estreptavidina, ou vários pares de anticorpo/antígeno tais como anticorpo de digoxigenina-antidigoxigenina (Smith et al., Science 258: 1122- .1126 (1992)). A ligação química covalente de DNA ao suporte pode ser realizada pelo uso de agentes de ligação padrão para ligar o 5'-fosfato no DNA às microesferas revestidas através de uma ligação de fosfoamidato. Métodos para a imobilização de oligonucleotídeos aos substratos de estado sólido são bem estabelecidos. Ver Pease et al., Proc. Natl. Acad. Sei. USA .91(11): 5022-5026 (1994). Um método preferido de ligar oligonucleotídeos aos substratos de estado sólido é descrito por Guo et al., Nucleic Acids Res. .22: 5456-5465 (1994). A imobilização pode ser realizada pela síntese de DNA in situ (Maskos e Southern, supra) ou pela ligação covalente de oligonucleotídeos quimicamente sintetizados (Guo et al., supra) em combinação com tecnologias de arranjo robótico.
Além da tecnologia de fase sólida representada pelos arranjos de biochip, a expressão de gene também pode ser quantificada usando arranjos de fase líquida. Um tal sistema é a reação da cadeia da polimerase cinética (PCR). A PCR cinética permite a amplificação e quantificação simultâneas de seqüências de ácido nucléico específicas. A especificidade é derivada de iniciadores de oligonucleotídeo sintéticos planejados para aderir preferencialmente as seqüências de ácido nucléico de filamento único que se agrupam no sítio alvo. Este par de iniciadores de oligonucleotídeo formam complexos específicos, não covalentemente ligados em cada filamento da seqüência alvo. Estes complexos facilitam a transcrição in vitro de DNA de filamento duplo em orientações opostas. A ciclagem de temperatura da mistura de reação cria um ciclo contínuo de ligação, transcrição e re-fusão de iniciador do ácido nucléico aos filamentos individuais. O resultado é um aumento exponencial do produto de dsDNA alvo. Este produto pode ser quantificado em tempo real através do uso de um corante de intercalação ou uma sonda específica de seqüência. SYBR(r) Green 1, é um exemplo de um corante de intercalação, que preferencialmente se liga ao dsDNA resultando em um aumento concomitante no sinal fluorescente. As sondas específicas de seqüência, tais como usadas com a tecnologia de TaqMan.RTM., consiste de um fluorocromo e uma molécula de extinção covalentemente ligada às extremidades opostas de um oligonucleotídeo. A sonda é planejada para ligar de modo selecionável a seqüência de DNA alvo entre os dois iniciadores. Quando os filamentos de DNA são sintetizados durante a reação de PCR, o fluorocromo é clivado da sonda pela atividade de exonuclease da polimerase que resulta no sinal de desextinção. O método de sinalização de sonda pode ser mais específica do que o método do corante de intercalação, mas em cada caso, a força do sinal é proporcional ao produto de dsDNA produzido. Cada tipo de método de quantificação pode ser usado em arranjos de fase líquida de multirreservatórios com cada reservatório representando iniciadores e/ou sondas específicas para as seqüências de ácido nucléico de interesse. Quando usado com preparações de RNA mensageiro de tecidos ou linhagens de célula, um arranjo de reações de sonda/iniciador pode simultaneamente quantificar a expressão de produtos de gene múltiplos de interesse. Ver Germer et ai., Genoma Res. 10: 258-266 (2000); Heid et ai, Genoma Res. 6: .986-994 (1996).
(iv) Medição de níveis de proteína de marcador de localização alterados em extratos de célula, por exemplo pelo imunoensaio.
O teste quanto ao produto de expressão de marcador de localização proteináceo em uma amostra biológica pode ser realizado por qualquer um de vários métodos adequados que são bem conhecidos por aqueles habilitados na técnica. Os exemplos de métodos adequados incluem, mas não são limitados à triagem de anticorpo de seções de tecido, espécimes de biópsia ou amostras de fluido corporal.
Até o grau em que os métodos com base em anticorpo de diagnóstico são usados, a presença da proteína marcadora pode ser determinada de vários modos tais como pela Western blotting, ELISA ou procedimentos de citometria de fluxo. Estes, naturalmente, incluem ensaios tanto de sítio único quanto de sítio duplo ou "intercalado" dos tipos não competitivos, assim como nos ensaios de ligação competitivos tradicionais. Estes ensaios também incluem a ligação direta de um anticorpo rotulado a um alvo.
Ensaios intercalados estão entre os ensaios mais úteis e habitualmente usados e são favorecidos para o uso na presente invenção. Diversas variações da técnica de ensaio de intercalação existem e todas são intencionadas a serem abrangidas pela presente invenção. Em resumo, em um ensaio avançado típico, um anticorpo não rotulado é imobilizado em um substrato sólido e a amostra a ser testada levada em contato com a molécula ligada. Depois de um período adequado de incubação, por um período de tempo suficiente para permitir a formação de um complexo de anticorpo- antígeno, um segundo anticorpo específico para o antígeno, rotulado com uma molécula repórter capaz de produzir um sinal detectável é depois adicionado e incubado, permitindo o tempo suficiente para a formação de um outro complexo de anticorpo rotulado com anticorpo-antígeno. Qualquer material não reagido é lavado e a presença do antígeno é determinada pela observação de um sinal produzido pela molécula repórter. Os resultados podem ser qualitativos, pela simples observação do sinal visível, ou pode ser quantificada comparando-se com uma amostra de controle. Variações no ensaio avançado incluem um ensaio simultâneo, em que tanto a amostra quanto o anticorpo rotulado são adicionados simultaneamente ao anticorpo ligado. Estas técnicas são bem conhecidas por aqueles habilitados na técnica, que incluem quaisquer variações menores como estará facilmente evidente.
No ensaio intercalado avançado típico, um primeiro anticorpo tendo especificidade quanto ao marcador ou partes antigênicas deste, é covalente ou passivamente ligado a uma superfície sólida. A superfície sólida é tipicamente vidro ou um polímero, os polímeros mais habitualmente usados sendo celulose, poliacrilamida, náilon, poliestireno, cloreto de polivinila ou polipropileno. Os suportes sólidos podem estar na forma de tubos, pérolas, discos de microplacas ou qualquer outra superfície adequada para conduzir um imunoensaio. Os processos de ligação são bem conhecidos na técnica e no geral consistem de reticular, ligar covalentemente ou absorver fisicamente, o complexo de polímero-anticorpo é lavado na preparação para a amostra de teste. Uma alíquota da amostra a ser testada é depois adicionada ao complexo de fase sólida e incubada por um período de tempo suficiente (por exemplo, 2 a 40 minutos) e sob condições adequadas (por exemplo, 25°C) para permitir a ligação de qualquer subunidade presente no anticorpo. A seguir do período de incubação, a fase sólida da subunidade de anticorpo é lavada e secada e incubada com um segundo anticorpo específico para uma porção do antígeno. O segundo anticorpo é ligado a uma molécula repórter que é usado para indicar a ligação do segundo anticorpo ao antígeno.
Um método alternativo envolve imobilizar as moléculas alvo na amostra biológica e depois expor o alvo imobilizado ao anticorpo específico que pode ser rotulado ou não com uma molécula repórter. Dependendo da quantidade de alvo e da força do sinal da molécula repórter, um alvo ligado pode ser detectável pela rotulação direta com o anticorpo. Alternativamente, um segundo anticorpo rotulado, específico para o primeiro anticorpo é exposto ao complexo alvo-primeiro anticorpo para formar um complexo terciário do alvo-primeiro anticorpo-segundo anticorpo. O complexo é detectado pelo sinal emitido pela molécula repórter.
Por "molécula repórter" como usado no presente relatório descritivo, é intencionada uma molécula que, pela sua natureza química, fornece um sinal analiticamente identificável que permite a detecção de anticorpo ligado a antígeno. A detecção pode ser qualitativa ou quantitativa. As moléculas repórter mais habitualmente usadas neste tipo de ensaio são enzimas, fluoróforos ou radionuclídeo contendo moléculas (isto é, radioisótopos) e moléculas quimioluminescentes.
No caso de um imunoensaio de enzima, uma enzima é conjugada ao segundo anticorpo, no geral por meio de glutaraldeído ou periodoato. Como será facilmente reconhecido, entretanto, uma ampla variedade de técnicas de conjugação diferentes existe, que são facilmente disponíveis ao técnico habilitado. As enzimas habitualmente usadas incluem peroxidase de rábano, glicose oxidase, beta-galactosidase e fosfatase alcalina, entre outras. Os substratos a serem usados com as enzimas específicas são no geral escolhidos para a produção, na hidrólise pela enzima correspondente, de uma mudança de cor detectável. Os exemplos de enzimas adequadas incluem fosfatase alcalina e peroxidase. Também é possível utilizar substratos fluorogênicos, que produzem um produto fluorescente ao invés dos substratos cromogênicos mencionados acima. Em todos os casos, o anticorpo rotulado com a enzima é adicionado ao complexo de primeiro anticorpo-hapteno, deixado ligar e depois o reagente em excesso é retirado por lavagem. Uma solução contendo o substrato apropriado é depois adicionado ao complexo de anticorpo-antígeno-anticorpo. O substrato reagirá com a enzima ligada ao segundo anticorpo, dando um sinal visual qualitativo, que pode ser ainda quantificado, de modo usual espectrofotometricamente, para dar uma indicação da quantidade de antígeno que estava presente na amostra. "Molécula repórter" também estende-se ao uso de aglutinação de célula ou inibição da aglutinação tal como as células sangüíneas vermelhas em pérolas de látex e outros.
Alternativamente, compostos fluorescentes, tais como fluoresceína e rodamina, podem ser quimicamente ligados aos anticorpos sem alterar a sua capacidade de ligação. Quando ativado pela iluminação com luz de um comprimento de onda particular, o anticorpo rotulado com fluorocromo absorve a energia luminosa, induzindo um estado de excitabilidade na molécula, seguido pela emissão da luz em uma cor característica visualmente detectável com um microscópio óptico. Como no EIA, o anticorpo rotulado fluorescente é deixado ligar ao complexo primeiro anticorpo-hapteno. Depois de separar por lavagem o reagente não ligado, o complexo terciário remanescente é depois exposto à luz do comprimento de onda apropriado a fluorescência observada indica a presença do hapteno de interesse. As técnicas de imunofluorescência e EIA são ambas muito bem estabelecidas na técnica e são particularmente preferidas para o presente método. Entretanto, outras moléculas repórter, tais como radioisótopo, moléculas quimioluminescente ou bioluminescentes, também podem ser utilizadas.
(v)Determinar a expressão alterada de marcadores de localização de proteína na superfície da célula, por exemplo pela imunoistoquímica.
(vi)Determinar a expressão de proteína alterada com base em qualquer teste funcional adequado, teste enzimático ou teste imunológico além daqueles detalhados nos pontos (iv) e (vi) acima.
Uma pessoa de habilidade comum na técnica pode determinar, como um questão de procedimento de rotina, a adequabilidade de aplicar um dado método a um tipo particular de amostra biológica.
Sem limitar a presente invenção de nenhum modo e como detalhado acima, os níveis de expressão de gene podem ser medidos por uma variedade de métodos conhecidos na técnica. Por exemplo, transcrição de gene ou produtos de tradução podem ser medidos. Os produtos de transcrição de gene, isto é, RNA, podem ser medidos, por exemplo, pelos ensaios de hibridização, ensaios de escoamento, Northern blots, ou outros métodos conhecidos na técnica.
Os ensaios de hibridização no geral envolvem o uso de sondas de oligonucleotídeo que hibridizam aos produtos de transcrição de RNA de filamento único. Assim, as sondas de oligonucleotídeo são complementares ao produto de expressão do RNA transcrito. Tipicamente, uma sonda específica de seqüência pode ser direcionada para hibridizar ao RNA ou cDNA. Uma "sonda de ácido nucléico", como aqui usada, pode ser uma sonda de DNA ou uma sonda de RNA que hibridiza a uma seqüência complementar. Uma pessoa de habilidade na técnica saberia como planejar uma tal sonda tal que a hibridização específica de seqüência ocorrerá. Uma pessoa de habilidade na técnica saberá ainda como quantificar a quantidade da hibridização específica de seqüência como uma medida da quantidade de expressão de gene para o gene que foi transcrito para produzir o RNA específico.
A amostra de hibridização é mantida sob condições que são suficientes para permitir a hibridização específica da sonda de ácido nucléico a um produto de expressão de gene específico. "Hibridização específica", como aqui usada, indica hibridização quase exata (por exemplo, com pouco se algum desemparelhamento). A hibridização específica pode ser realizada sob condições de alta severidade ou condições de severidade moderada. Em uma forma de realização, as condições de hibridização para a hibridização específica são de severidade alta. Por exemplo, certas condições de severidade alta podem ser usadas para distinguir ácidos nucléicos perfeitamente complementares daqueles de menos complementaridade. "Condições de severidade alta", "condições de severidade moderada" e "condições de severidade baixa" para as hibridizações de ácido nucléico são explicadas nas páginas 2.10.1 a 2.10.16 e páginas 6.3.1 a 6.3.6 em Current Protocols in Molecular Biology (Ausubel, F. et ai., "Current Protocols in Molecular Biology", John Wiley & Sons, (1998), as divulgações inteiras das quais são aqui incorporadas por referência). As condições exatas que determinam a severidade de hibridização dependem não apenas da força iônica (por exemplo, 0,2 χ SSC, 0,1 χ SSC), temperatura (por exemplo, temperatura ambiente, 42°C, 68°C) e a concentração de agentes desestabilizadores tais como formamida ou agentes desnaturantes tais como SDS, mas também sobre fatores tais como o comprimento da seqüência de ácido nucléico, composição base, desemparelhamento percentual entre seqüências hibridizadoras e a freqüência de ocorrência de subconjuntos daquela seqüência dentro de outras seqüências não idênticas. Assim, condições equivalentes podem ser determinadas variando-se um ou mais destes parâmetros enquanto se mantém um grau similar de identidade ou similaridade entre as duas moléculas de ácido nucléico. Tipicamente, condições são usadas tais que as seqüências de pelo menos cerca de 60%, de pelo menos cerca de 70%, de pelo menos cerca de 80%, de pelo menos cerca de 90% ou de pelo menos cerca de 95% ou mais idênticas entre si permaneçam hibridizadas entre si. Pela variação das condições de hibridização de um nível de severidade na qual nenhuma hibridização ocorre a um nível no qual a hibridização é primeiro observada, as condições que permitirão que uma dada seqüência hibridiza (por exemplo, seletivamente) com as seqüências mais complementares na amostra podem ser determinadas.
As condições exemplares que descrevem a determinação das condições de lavagem para condições de severidade moderada ou baixa são descritas em Kraus, M. e Aaronson, S., 1991. Methods Enzymol., 200: 546- 556; e em, Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, (1998). A lavagem é a etapa em que as condições são usualmente ajustadas de modo a determinar um nível mínimo de complementaridade dos híbridos. No geral, partindo da temperatura mais baixa na qual apenas a hibridização homóloga ocorre, cada°C em que a temperatura de lavagem final é reduzida (mantendo a concentração de SSC constante) permite um aumento de 1% na porcentagem de emparelhamento máximo entre as seqüências que hibridizam. No geral, dobrando a concentração de SSC resulta em um aumento na Tm de cerca de 17°C. Usando estas diretrizes, a temperatura de lavagem pode ser determinada empiricamente para severidade alta, moderada ou baixa, dependendo do nível de emparelhamento procurado. Por exemplo, uma lavagem de severidade baixa pode compreender lavar em uma solução contendo 0,2 χ SSC/0,1% de SDS por 10 minutos na temperatura ambiente; uma lavagem de severidade moderada pode compreender lavar em uma solução pré aquecida (42°C) contendo 0,2 χ SSC/0,1% de SDS por 15 minutos a 42°C; e uma lavagem de severidade alta pode compreender lavar em solução pré aquecida (68°C) contendo 0,1 χ SSC/0,1% de SDS por 15 minutos a 68°C. Além disso, as lavagens podem ser realizadas repetida ou seqüencialmente para se obter um resultado desejado como conhecido na técnica. As condições equivalentes podem ser determinadas variando-se um ou mais dos parâmetros dados como um exemplo, como conhecido na técnica, enquanto se mantém um grau similar de complementaridade entre as moléculas de ácido nucléico alvo e o iniciador ou sonda usados (por exemplo, a seqüência a ser hibridizada).
Um aspecto relacionado da presente invenção fornece conjunto de ácido nucléico, conjunto este que compreende uma pluralidade de:
(i) moléculas de ácido nucléico que compreendem uma seqüência de nucleotídeo que corresponde a qualquer um dos genes
marcadores de localização mais acima descritos ou uma seqüência que exiba pelo menos 80% de identidade a esta ou um derivado, fragmento, variante ou homólogo funcionais das ditas moléculas de ácido nucléico; ou
(ii) moléculas de ácido nucléico que compreendem uma seqüência de nucleotídeo capaz de hibridização a qualquer uma ou mais das seqüências de (i) sob condições de severidade baixa a 42°C ou um derivado, fragmento, variante ou homólogo funcionais das ditas moléculas de ácido nucléico
(iii) sondas de ácido nucléico ou oligonucleotídeos que
compreendem uma seqüência de nucleotídeo capaz de hibridização a qualquer uma ou mais das seqüências de (i) sob condições de severidade baixa a 42°C ou um derivado, fragmento, variante ou homólogo funcionais das ditas moléculas de ácido nucléico (iv) proteínas codificadas pelas moléculas de ácido nucléico de
(i) ou (ii) ou um derivado, fragmento ou, homólogo destas em que o nível de expressão do dito ácido nucléico é indicativo da origem proximal-distal de uma célula ou subpopulação celular derivadas do intestino grosso.
Referência aqui a uma severidade baixa a 42°C inclui e abrange de pelo menos cerca de 1% v/v a pelo menos cerca de 15% v/v de formamida e de pelo menos cerca de 1 M a pelo menos cerca de 2 M de sal para hibridização e pelo menos cerca de 1 M a pelo menos cerca de 2 M de sal para as condições de lavagem. As condições de severidade alternativas podem ser aplicadas onde necessário, tal como severidade média, que inclui e abrange pelo menos cerca de 16% v/v, pelo menos cerca de 30% v/v de formamida e de pelo menos cerca de 0,5 M a pelo menos cerca de 0,9 M de sal para hibridização e pelo menos cerca de 0,5 M a pelo menos cerca de 0,9 M de sal para as condições de lavagem, ou severidade alta, que inclui e abrange de pelo menos cerca de 31% v/v a pelo menos cerca de 50% v/v de formamida e de pelo menos cerca de 0,01 Ma pelo menos cerca de 0,15 M de sal para a hibridização e pelo menos cerca de 0,01 Ma pelo menos cerca de 0,15 M de sal para as condições de lavagem. No geral, a lavagem é realizada na Tm = 69,3 + 0,41 (G + C)% [19] = ~12°C. Entretanto, a Tm de um DNA duplex diminui em I0C com cada aumento de 1% no número de desemparelhados com pares de base (Bonner et al (1973) J Mol. Biol. 81: 123).
Uma biblioteca ou arranjo de marcadores de ácido nucléico ou proteína fornecem informação rica e altamente valiosa. Além disso, dois ou mais arranjos ou perfis (informação obtida a partir do usa de um arranjo) de tais seqüências são ferramentas úteis para comparar um conjunto de teste de resultados com uma referência, tal como uma outra amostra ou calibrador armazenado. No uso de um arranjo, membros de ácido nucléico individuais tipicamente são imobilizados em locais separados e deixadas reagir quanto as reações de ligação. Iniciadores associados com conjuntos montados de marcadores são úteis para preparar bibliotecas das seqüências ou diretamente detectar marcadores de outras amostras biológicas.
Uma biblioteca (ou arranjo, quando da alusão de ácidos nucléicos fisicamente separados que correspondem a pelo menos algumas seqüências em uma biblioteca) de genes marcadores exibe propriedades altamente desejáveis. Estas propriedades são associadas com condições específicas e podem ser caracterizadas como perfis regulatórios. Um perfil, como aqui chamado refere-se a um conjunto de membros que fornecem informação de diagnóstico do tecido a partir do qual marcadores foram originalmente derivados. Um perfil em muitos casos compreende uma série de manchas em um arranjo feito de seqüências depositadas.
Um perfil do paciente característico é no geral preparado pelo uso de um arranjo. Um perfil de arranjo pode ser comparado com um ou mais outros perfis de arranjo ou outros perfis de referência. Os resultados comparativos podem fornecer informação rica pertinente a estados de doença, estado de desenvolvimento, receptividade à terapia e outras informação a cerca do paciente.
Um outro aspecto da presente invenção fornece um kit de diagnóstico para ensaiar amostras biológicas que compreendem um agente para detectar um ou mais marcadores proximais-distais e reagentes úteis para facilitar a detecção pelo agente no primeiro compartimento. Outros meios também podem ser incluídos, por exemplo, para receber uma amostra biológica. O agente pode ser qualquer molécula de detecção adequada.
A presente invenção é ainda descrita pelos seguintes exemplos não limitantes:
EXEMPLO 1
MAPA DA EXPRESSÃO DE TRANSCRITO DIFERENCIAL NO INTESTINO GROSSO NORMAL
MATERIAIS E MÉTODOS
Dados da expressão de gene
Para explorar a variação da expressão de gene humano ao longo do intestino grosso não neoplástico, nós usamos dados de expressão de gene coletados usando o sistema de microarranjo GeneChip®oligonucleotide da Affymetrix (Santa Clara, CA USA) descrito em [Lipshutz et al., 1999, Nat Genet 21: 20-24]. Os dados são dois conjuntos de dados do Human Genome 133 GeneChip independentes da Affymetrix (Santa Clara, CA USA): uma base de dados de microarranjo comercial grande de HGU-133 A&B chip data para 'verificação' e um conjunto de dados de microarranjo HGU-133 Plus 2.0 menor gerado por nós para 'validação'.
O conjunto de dados maior foi analisado para identificar padrões de expressão de gene e o conjunto de expressão secundário independentemente derivado foi usado para validar estes padrões. Assim, o primeiro conjunto de dados foi minado para a geração de hipótese enquanto que o segundo conjunto foi usado para testar a hipótese.
Os dados para este estudo são microarranjos de oligonucleotídeo hibridizados ao cRNA rotulado sintetizado a partir de transcritos de poli-A mRNA isolado de espécimes de tecido colorretal. A plataforma Affymetrix que nós usamos é planejada para quantificar transcritos de mRNA alvo usando um painel de 11 sondas de oligonucleotídeo de emparelhamento perfeito de 25 pares de base (e 11 sondas desemparelhadas), chamado de um conjunto de sonda. Para determinar a relevância biológica da intensidade de ligação do conjunto de sonda, nós anotamos as listas de conjunto de sonda resultantes usando as bibliotecas Affymetrix metafiles e BioConductor mais correntes disponíveis. Nós observamos que existem conjuntos de sonda múltiplos na plataforma de microarranjo teoricamente reativos a qualquer 'gene' alvo dado. Como nosso foco é explorar as dinâmicas da expressão de transcrito ao longo do intestino grosso e não elucidar os mecanismos genômicos subjacentes, não exploramos mais este fenômeno.
Não obstante, estes detalhes de anotação fundamental devem ser considerados quando da interpretação da relevância biológica destes dados e nós alertamos o leitor (e outros pesquisadores que usam estas técnicas) para serem cautelosos do perigo de usar os termos 'genes' e 'conjunto de sonda' intercambiavelmente.
Conjunto de dados de 'Verificação'
A expressão de genes e descrições clínicas para 184 espécimes de tecido colorretal foram adquiridos da GeneLogic Inc. (Gaithersburg, MD, USA).
Os dados de microarranjo de tecido individuais foram selecionados com as seguintes características: mucosa colorretal não neoplástica (confirmada pela histologia) a partir de espécime de tecido de outro modo saudável (isto é, nenhuma evidência de inflamação ou outra doença no sítio de espécime) com um sítio anatomicamente identificável de ressecção designado como um de: ceco, cólon ascendente, cólon descendente, cólon sigmóide ou reto.
Para cada tecido selecionado da base de dados geneLogic, nós recebemos arquivos eletrônicos de dados brutos contendo um total de 44.928 conjuntos de sonda (HGU133A e HGUl33B, combinados), descritores experimentais e clínicos para cada tecido e imagens de microscópio digitalmente arquivados das preparações de histologia. Cada registro de dados foi manualmente avaliado quanto a consistência clínica e uma amostra de registros foi aleatoriamente escolhida para auditoria de histopatologia usando imagens de histologia digitalmente arquivadas. Uma análise de controle de qualidade foi realizada para identificar e remover arranjos que não atinjam as medidas de controle de qualidade essenciais como definido pelo fabricante. [Affymetrix, 2001; Wilson e Miller, 2005, Bioinformatics].
Os níveis de expressão de gene foram calculados pelas técnicas de normalização tanto da Microarray Suite (MAS) 5.0 (Affymetrix) quanto da Robust Multichip Average (RMA). [Affymetrix, 2001; Hubbell et al., 2002, Bioinformatics 18: 1585-1592; Irizarry et ai, 2003, Nucleic Acids Res 31: el5] Os dados normalizados MAS foram usados para realizar as rotinas de controle de qualidade padrão e o conjunto de dados finais foi normalizado com RMA para todas as análises subsequentes.
Conjunto de dados de 'Validação'
Os espécimes colorretais no conjunto de 'validação' foram coletados a partir de um banco de tecido hospitalar de orientação terciário no metropolitan Adelaide (Repatriation General Hospital e Flinders Medicai Centre). O banco de tecido e este projeto foram aprovados pelo Research and Etics Committee of the Repatriation General Hospital e o consentimento do paciente foi recebido para cada tecido estudado. A seguir da ressecção cirúrgica, os espécimes foram colocados em um receptáculo estéril e coletado da sala de operações. O tempo de ressecção operativa para a coleta da sala de operações foi variável mas não mais do que 30 minutos. As amostras, aproximadamente 125 mm3 (5x5x5 mm) no tamanho, foram tiradas do tecido macroscopicamente normal tão distante da patologia quanto possível, definidos tanto pela região colônica assim como pela distância proximal ou distai em relação à patologia. Os tecidos foram colocados em criofrascos, depois imediatamente imersos em nitrogênio líquido e armazenados a -150°C até o processamento.
As amostras congeladas foram processadas pelos autores usando protocolos padrão e kits comercialmente disponíveis. Em resumo, tecidos congelados foram homogeneizados usando um moinho de pérolas de carbeto (Mixer Mill MM 300, Qiagen, Melbourne, Austrália) na presença de Tampão de Lise de RNA Promega SV gelado (Promega, Sydney, Austrália) para neutralizar a atividade de RNase. Os lisados de tecido homogeneizado para cada tecido foram aliquotados aos volumes convenientes e armazenados a -80°C. O RNA total foi extraído de lisados de tecido usando o sistema de RNA Promega SV Total de acordo com as instruções do fabricante e a integridade foi avaliada visualmente pela eletroforese em gel.
Para medir a expressão relativa de transcritos de mRNA, as amostras de RNA de tecido foram analisadas usando Affymetrix HG Ul33 Plus 2.0 GeneChips (Affymetrix, Santa Clara, CA USA) de acordo com os protocolos do fabricante [Affymetrix, 2004]. O cRNA rotulado com biotina foi preparado usando 5 μg (1,0 μg/μL) de RNA total (aprox. 1 μg de mRNA) com o kit de "cDNA de um ciclo" (incorporando um iniciador de T7- oligo(dT)) e o kit de rotulação geneChip IVT. O cRNA transcrito in vitro foi fragmentado (20 μg) e analisado quanto aos propósitos de controle de qualidade pela espectrofotometria e eletroforese em gel antes da hibridização. Finalmente, um coquetel de hibridização foi preparado com 15 μg de cRNA (0,5 μg/μL) e hibridizados aos microarranjos HG Ul33 Plus 2.0 por 16 horas a 45°C em uma câmara de Hibridização Affymetrix 640. Cada amostra de cRNA foi reforçada com controles de hibridização eucarióticos padrão para monitorar a qualidade.
Os microarranjos hibridizados foram tingidos com estreptavidina fícoeritirina e lavados com uma solução contendo anticorpos anti-estreptavidina biotinilados usando o Affymetrix Fluidics Station 450. Finalmente, os microarranjos tingidos e lavados foram escaneados com o Affymetrix Scanner 3000.
O pacote de software da Affymetrix foi usado para transformar os arquivos de imagem de microarranjo bruto para o formato digitalizado. Como para o conjunto Discovery acima, os níveis de expressão de gene para o conjunto de dados de validação foram gerados usando MAS 5.0 (Affymetrix) com propósitos de controle de qualidade e com o método da normalização RMA para dados de expressão.
Análise Estatística
Como mostrado na Figura 10, um sistema de detecção inclui módulos de detecção 1002 a 1007, que incluem um módulo de máquina vetorial de sustentação (SVM) 1002, um analisador de perfil 1004, um analisador principal de componente 1006 e um módulo classificador 1007. O sistema de detecção executa os métodos de detecção que geram dados de localização representativos da origem ao longo do eixo proximal-distal do intestino grosso de uma célula, ou população de célula, deste intestino. Os dados de localização são gerados pelo processamento de dados de expressão de gene que representam a expressão de genes dentro desta célula ou população de célula. Na forma de realização descrita, o sistema de detecção é um sistema de computador padrão tal como um sistema de computador com base no Intel IA-32 e os módulos de detecção 1002 a 1007 são implementados como módulos de software armazenados em armazenagem não volátil (por exemplo, disco rígido) 1020 associados com o sistema de computador. Entretanto, estará evidente que pelo menos partes dos módulos de detecção1002 a 1007 ou os métodos de detecção aqui descritos alternativamente podem ser implementados como um ou mais componentes de hardware dedicado, tal como circuitos integrados específicos de aplicação (ASICs).
Na forma de realização descrita, o sistema de detecção também inclui módulos C++ 1008 para fornecer suporte de linguagem C++, que inclui bibliotecas C++ e um módulo R 1012 que fornece suporte para a linguagem de programação estatística Rea biblioteca MASS descrita em [Venables e Ripley, 2002] e disponível do depósito de fonte aberta CRAN em http://cran.r-project.org. O sistema também inclui a aplicação do software BioConductor 1010 disponível da http://www.bioconductor.org, que, junto com o analisador de perfil 1004 e o analisador de componente principal 1006, são implementados na linguagem de programação R, como descrito em http://www.r-project.org. O SVM 1002 é implementado na linguagem de programação C++. O módulo classificador 1007 é a aplicação geneRave, como descrito em http://www.bioinformatics.csiro.au/products.shtml e referências aí fornecidas. O sistema também inclui o Microarranjo Suite (MAS) 5.0 1014 e a aplicação de normalização Robust Multichip Average (RMA) 1016, ambos disponíveis da Affymetrix e descritos em http://www.affymetrix.com. As aplicações de software são executadas sob o controle de um sistema de operação padrão 1018, tal como Linux ou MacOS 10.4 e o sistema de computador inclui componentes de hardware de computador padrão, que inclui pelo menos um processador 1022, memória de acesso aleatória 1024, um teclado 1026, um dispositivo de indicação padrão tal como um mouse 1028 e uma tela de vídeo 1030, todos os quais são interconectados por intermédio de um barramento de sistema 1032, como mostrado.
Os métodos de detecção incluem métodos de classificação da forma geral da Figura 11. Primeiro, na etapa 1102, o sistema recebe ou de outro modo acessa dados de expressão que representam a expressão de genes em células de origem proximal-distal conhecida. Na etapa 1104, uma multivariada ou outra forma de classificação ou método de decisão é aplicado aos dados de expressão para gerar dados de classificação, como descrito abaixo. Tipicamente, os dados de expressão representam a expressão de genes que, sozinhos ou em combinação, já são conhecidos como sendo diferencialmente expressados ao longo do eixo proximal-distal do intestino grosso. Entretanto, o método também pode ser usado para identificar tais genes e/ou combinações de gene, como descrito abaixo. Na etapa 1106, os dados de classificação são aplicados aos dados de expressão adicionais que representam a expressão dos mesmos genes em uma célula de origem desconhecida para prognosticar a origem proximal-distal desta célula ao longo do intestino grosso.
Além disso, estará evidente àqueles habilitados na técnica que a função classificadora ou discriminante resultante representada pelos dados de classificação inicialmente gerados pode ser ajustada com base nos princípios teóricos de decisão para melhorar os resultados de classificação e a sua utilidade. Por exemplo, um ponto de vista anterior na probabilidade de resultados pode ser incorporado, e/ou uma superfície de decisão pode ser modificada com base nos custos diferentes de casos de má classificação. Estes e outros métodos relevantes de teoria de decisão, minimizando perda de funções e custo de má classificação são descritos em [Krzanowski e Marriott, 1995].
Para todas as análises estatísticas, nós usamos o software de fonte aberta disponível da BioConductor para o ambiente de estatísticas R (R sendo uma implementação de fonte aberta do ambiente de análise estatística S). (Bioconductor, www.bioconductor.org) [Gautier et al., 2004, Bioinformatics 20: 307-315; Gentleman et al., 2004, Genome Biol 5: R80],
Os métodos lineares usados para gerar e processos lineares e combinações não lineares de níveis de expressão de gene, que incluem a regressão linear, regressão linear múltipla, análise discriminante linear, regressão de logística, modelos lineares generalizados e análise de componentes principais, são todos descritos em [Hastie, 2001], por exemplo. Estes métodos são implementados em R. Os gradientes de expressão de gene foram analisados usando três técnicas analíticas. Primeiro, nós comparamos a variação da expressão do gene de genes individuais ao longo do intestino grosso na maneira univariada usual. Em seguida, nós exploramos ainda aqueles genes particulares que exibem diferenças de expressão estatisticamente significantes com modelos lineares para comparar mudança de expressão dicótoma (proximal vs. distai) com um modelo gradual (multissegmento) de mudança. Finalmente, nós aplicamos técnicas multivariadas para entender a variação de expressão ampla de genoma sutil ao longo do eixo proximal-distal. Tais variações de expressão amplas de genoma foram interrogadas usando métodos não paramétricos como descritos em [Ripley, 1996], que incluem métodos do vizinho mais próximo.
Mapas de expressão de gene individuais
Expressão diferencial Univariada
Os transcritos de gene diferencialmente expressados entre o intestino grosso proximal e distai foram identificados usando um teste t moderado implementado na biblioteca de Biocondutor 'limma' para R [Smyth, 2005]. Estimativas de significância (valores p) foram corrigidas para ajustar quanto ao teste de hipótese múltipla (MET) usando a correção de Bonferroni conservativa. Os subconjuntos de tecido limitados ao ceco vs. o reto foram similarmente testados.
Os transcritos de gene identificados como sendo diferencialmente expressados também foram avaliados nos espécimes de 'Validação' em uma base de conjunto de sonda-ao lado de-conjunto de sonda usando testes t modificados. Para avaliar a significância do número total de conjuntos de sonda diferenciais que foram do mesmo modo diferenciais nos dados de validação, o número de conjuntos de sonda 'validados' foram comparados a uma distribuição nula estimada usando uma simulação de Monte Cario. Comparação modelo de intestino grosso multi-segmentado vs. intestino grosso bi-segmentado
Para avaliar a natureza da variação da expressão de gene inter- segmento nós analisamos conjuntos de sonda diferencialmente expressados quanto ao ajuste relativo aos modelos lineares em uma matriz de trabalho multi-segmentada vs. uma bi-segmentada. A meta desta análise é explorar se a expressão intersegmentada de conjuntos de sonda que são conhecidas como sendo diferencialmente expressadas entre as extremidades de terminal do intestino grosso são melhores modeladas por um modelo linear de cinco segmentos que aproxima uma graduação contínua ou por um gradiente dicótomo 'proximal' vs. 'distai' mais simples. Como nossos dados são apenas identificados pela designação de segmento colorretal e não por uma medição contínua ao longo do comprimento do intestino grosso, nós aproximamos o modelo contínuo usando as localizações de segmento de tecido. Nós escolhemos conjuntos de sonda que são diferencialmente expressados entre os segmentos mais terminais (ceco e reto) de modo a maximizar a probabilidade de identificar transcritos que variam ao longo do eixo proximal-distal do intestino grosso.
Nós primeiro modelamos a expressão destes conjuntos de sonda ao longo do eixo proximal-distal do intestino grosso usando um modelo linear robusto de cinco fatores de acordo com uma matriz indicadora definida pelo segmento colorretal para cada tecido. Para este modelo cada tecido foi designado pelas localizações de biópsia a um de: ceco, ascendente, descendente, sigmóide ou reto. (Pelas razões descritas abaixo, tecidos transversais não foram incluídos nesta análise). Este modelo de cinco segmentos foi depois comparado com um modelo linear robusto de dois fatores com uma matriz de planejamento que corresponde às regiões proximal e distai teóricas do intestino grosso. Os mesmos dados foram usados para ambas as comparações de modelo, entretanto para os dois modelos de segmento, o primeiro fator (que corresponde aos tecidos proximais) incluiu todos os tecidos do ceco e cólon ascendente enquanto que o segundo fator (que corresponde ao intestino grosso distai) incluiu todos os tecidos dos segmentos descendente, sigmóide e reto.
Quando da comparação destes modelos distintos para cada conjunto de sonda, nós usamos um teste F para avaliar a hipótese Ha de que o ajuste melhorado (residual de regressão reduzido) fornecido pelo modelo de cinco segmentos mais complexo foi significantemente melhor do que o modelo de dois segmentos mais simples. Uma redução residual não significante indica uma insuficiência para rejeitar a hipótese nula HO: de que não existe valor inerente para adotar um modelo de cinco segmentos mais complexo em relação à alternativa mais simples.
Mapeamento do padrão de expressão de gene multivariado
RESULTADOS
Coleta de dados da expressão de gene
Conjuntos de Dados de verificação e Validação Um conjunto de dados de verificação foi gerado usando dados da hibridização de cRNA aos microarranjos HG Ul33A/B GeneChip da Affymetrix que foram adquiridos da GeneLogic Inc.
Os dados de 184 tecidos normais que atingem os critérios de inclusão e os critérios de garantia de qualidade para o HG U133A/B GeneChip foram analisados e usados para a geração de hipótese. Os tecidos compreenderam subconjuntos de segmento como seguem: 29 cecos, 45 ascendentes, 13 descendentes, 54 sigmóides e 43 retos. Para cada tecido, 44.928 conjuntos de sonda foram corrigidos no fundo e normalizados usando pré-processamento de RMA.
Para construir o conjunto de dados de 'validação', 19 HG Ul33 Plus2.0 GeneChips foram hibridizados a cRNA rotulado preparado a partir de 8 espécimes de tecido proximal e 11 espécimes distais. Devido aos parâmetros de controle de qualidade severos para a aceitabilidade de tecido e GeneChip, estes conjuntos de dados de validação não incluíram tecidos suficientes para explorar modelos de segmento múltiplo. Cada microarranjo mediu a expressão de transcrito para 54.675 conjuntos de sonda.
A junção teórica entre o intestino grosso proximal e distai é aproximadamente dois terços do comprimento do cólon transversal medido a partir da dobra hepática. [Yamada e Alpers, 2003, supra] Visto que os dados de amostra não foram específicos para a distância ao longo do cólon transversal, estes tecidos foram excluídos da análise de verificação.
Variação de gene ao longo do intestino grosso Mudanças da expressão de gene individual Expressão diferencial uni variada
Para explorar o ponto de divisão 'natural' entre os segmentos anatômicos do intestino grosso, nós medimos o número absoluto de mudanças de expressão do conjunto de sonda quando o 'divisor' hipotético foi movido gradualmente do ceco para o reto. A Figura 1 mostra o número de conjuntos de sonda que foi diferencialmente expressado para todas as combinações contínuas inter-segmento. Embora não estatisticamente significante, o número máximo de diferenças de conjunto de sonda, 206, ocorre quando as regiões proximal e distai são divididas entre os segmentos ascendentes e descendentes. Visto que este ponto divisor é compatível tanto com o nosso entendimento de desenvolvimento embrionário quanto a separação usual dos segmentos proximal e distai, nosso trabalho assume que os tecidos proximal e distai são separados neste modelo.
Um total de 206 conjuntos de sonda, que correspondem a aproximadamente 154 alvos de gene conhecidos, foram diferencialmente expressados mais altos nas amostras colorretais proximal ou distai comparadas com a região correspondente (Bonferroni corrigido ρ < 0,05). Destes 206 conjuntos de sonda, 31 (16,5%) também foram diferencialmente expressados nos dados de validação com uma diferença signifícante (31/206, ρ « 0,05 pela estimativa Monte Cario).
Um total de 115 conjuntos de sonda foram diferencialmente expressados apenas entre tecidos selecionados do ceco (n = 29) e do reto (n =43). Embora 102 (89%) destes conjuntos de sonda estejam incluídos nos 206 conjuntos de sonda que diferem entre intestino grosso proximal e distai descrito acima, a expressão de gene do ceco vs. reto é útil, em princípio, para isolar aqueles transcritos que são diferentes entre as extremidades mais terminais do intestino grosso. Neste subconjunto, 28 conjuntos de sonda (24,3%) foram do mesmo modo diferencialmente expressados no reto vs. o ceco nos dados de validação (28/115, ρ « 10-5 pela estimativa Monte Cario).
Os conjuntos de sonda diferencialmente expressados e as estatísticas de diferença para os conjuntos de sonda com expressão elevada em tecidos proximal e distai são mostrados nas Tabelas 1 e 2, respectivamente. A Figura 2 compara o número de conjuntos de sonda expressados significantemente mais altos no intestino proximal (n = 94) ou distai (n = 126) (ou ceco e reto), respectivamente.
Modelos de expressão de gene de segmento múltiplo
Uma análise quanto a expressão diferencial também foi feita para todas as cinco transições inter-segmento na ordem do ceco para o reto (isto é, ceco vs. ascendente, ascendente vs. transversal, etc.). De modo interessante, nenhum transcrito foi diferencialmente expressado a um grau signifícante entre quaisquer dois segmentos contíguos (teste t moderado; ρ <0,05).
Para explorar a natureza exata destas mudanças de expressão de transcrito de gene, nós construímos e comparamos modelos lineares robustos adaptados para os dados de expressão com base nas localizações para cada amostra de tecido. Dois modelos lineares robustos da expressão de conjunto de sonda univariado foram comparados para cada um dos 115 conjuntos de sonda diferencialmente expressado entre os dois segmentos de terminal do intestino grosso, o ceco e reto. Em particular, nós interrogamos se a expressão destes transcritos que foram diferencialmente expressado entre estes segmentos de terminal foram melhor explicados (em termos de ajuste residual) por um modelo de dois segmentos simples ou pelo modelo de cinco segmentos mais descritivo.
Dos 115 conjuntos de sonda diferencialmente expressados, a análise falhou em rejeitar a hipótese nula de que um modelo complexo não melhora significantemente o ajuste de modelo para os dados de expressão do gene observado para 65 (57%) dos casos (teste F, ρ > 0,05). Assim, mais do que metade destes transcritos diferencialmente expressados ao longo do intestino grosso são satisfatoriamente modelados pelo modelo de expressão de dois segmentos por meio do qual a expressão é dicótoma e definida pelas localizações proximal vs. distai. O conjunto de sonda mais diferencialmente expressado entre o ceco e reto é o transcrito para PRAC. Uma comparação dos modelos de dois segmentos e de segmento múltiplo para este transcrito são mostrados na Figura 3.
Para os 50 (43%) conjuntos de sonda remanescentes, a hipótese nula foi rejeitada (p < 0,05), sugerindo que um modelo de cinco fatores dependente das localizações de segmento de fato melhora a eficácia preditiva de tal expressão de transcritos ao longo do eixo proximal-distal em uma maneira significante. A inspeção destes modelos confirma que a maioria dos modelos são crescentemente monotônicos ou decrescentemente monotônicos em tecidos progredindo ao longo do intestino grosso.
De maneira interessante, 41 (82%) dos 50 modelos de segmento múltiplo mostram um aumento gradual através do intestino grosso enquanto que apenas 9 modelos (18%) indicam uma diminuição gradual da expressão proximal para distai (mostrado na Figura 4). Os modelos para ambos os transportadores de soluto orgânico, alfa (OSTalfa) e homeobox gene B13 (HOXB13) são significantemente melhorados com o modelo de cinco segmentos como ilustrado na Figura 5.
Padrões da expressão de gene ao longo do intestino grosso Além das análises de mudanças de gene individuais ao longo do intestino grosso, nós usamos técnicas analíticas multivariadas para explorar padrões de mudanças de gene ao longo do eixo proximal-distal.
Análise de Componentes Principais Supervisionada Para visualizar e explorar a variabilidade da estrutura de expressão em um nível de órgão, a análise de componente principal (PCA) e uma variante de PCA conhecida como PCA Supervisionada foram aplicadas aos dados de expressão de gene usando o analisador de componente principal (PCA) 1006 do sistema de detecção. A PCA é descrita em [Venables e Ripley, 2002] e foi implementada em R. A descrição detalhada de PCA supervisionada pode ser encontrada em [Bair et al., 2004]. Inicialmente, os dados de expressão que representam a
expressão de gene de todos os 44.928 conjuntos de sonda do conjunto de dados 'Discovery' foram processados pelo módulo PCA 1006 usando a análise de componentes principais (PCA). A PCA é um método padrão para simplificar um conjunto de dados multidimensional pela geração de transformações lineares das dimensões do conjunto de dados para reduzir o número de dimensões. Os dados transformados são fornecidos como dados de componente principal que representam um conjunto sortido de "componentes principais", tal que o primeiro componente principal tem a maior variação, o segundo componente principal a segunda maior variação e assim por diante. O resultado de aplicar PCA ao conjunto de dados completos inclui os dados de componente multivariado ou principal mostrados na Figura 6A, que é um gráfico em que o primeiro componente principal é plotado no eixo χ e o segundo componente principal no eixo y. A inspeção desta perspectiva de dimensão não produz nenhuma estrutura óbvia dentro dos dados que são compatíveis com segmento de tecido, sugerindo que as fontes maiores da variação da expressão de gene medidos através de todos os genes é independente da localização de tecido.
Para investigar se um subconjunto de todos os genes seria usado para gerar um ou mais componentes principais indicativos da localização de tecido, os dados de expressão foram analisados pela PCA supervisionada. Como descrito em [Bair et al, 2004], a PCA supervisionada é similar à análise padrão de componentes principais mas usa apenas um subconjunto das características/genes (usualmente selecionados por algum meio univariado) para gerar os componentes principais. Neste caso, o conjunto de genes diferencialmente expressado entre o ceco e o reto (isto é, as extremidades extremas do intestino grosso) foram selecionados para a análise de PCA. Entretanto, outras formas de seleção de característica alternativamente podem ser usadas. Especificamente, uma matriz de dados reduzida foi gerada pela inclusão não apenas dos 115 conjuntos de sonda que são diferencialmente expressados entre as amostras de tecido tiradas do ceco e reto, mas para todos os 184 tecidos normais de todos os segmentos do intestino grosso. A PCA padrão foi depois realizada nestes dados específicos de característica. Como mostrado na Figura 6B, um gráfico dos primeiros dois componentes principais sugere a existência de duas sub-populações amplas dentro das 184 amostras de tecido, que correspondem aproximadamente ao divisor proximal vs. distai. Esta dependência da origem da célula é visualizada mais claramente se o primeiro componente principal é colocado em gráfico como uma função da origem da célula ao longo do intestino grosso, como mostrado na Figura 7B. Os símbolos na Figura 7B representam a distância interquartílica (isto é, metade dos dados) e as "barras de erro" indicam 1,5 χ a distância interquartílica. Os dados fora destes limites são considerados como sendo classificados à parte e são plotados individualmente. Embora exista talvez a sugestão de uma separação fraca entre o cólon sigmóide e o reto, os tecidos anteriores do ceco e cólon ascendente fortemente se sobrepõem com separação deficiente.
Embora os dados de componente principal possam ser usados para prognosticar a origem de células com base na expressão de genes a partir destas células, outros métodos de análise são preferidos para esta tarefa, como descritos abaixo.
Análise de Perfil (Análise de Variação Canônica)
Os padrões de expressão ao longo do intestino foram também analisados pelo analisador de perfil 1004 usando a Análise de Perfil para visualizar a variação de expressão inter versus intra-segmento. Como descrito em [Kiiveri, 1992], a análise de perfil é uma modificação da análise de variação canônica padrão adaptada aos casos onde o número de variáveis excede o número de observações. O método modela a matriz de covariação de classe dentro de ρ χ ρ Zw por intermédio de um modelo analítico de fator [Kiiveri, 1992] com um número relativamente baixo de fatores independentes. Os testes de permuta são usados para determinar a significância de cada termo (isto é, gene) em cada uma das variáveis canônicas. Pelo que inclui apenas termos significantes, a análise de perfil fornece uma capacidade de seleção de característica.
Este método é no geral útil como uma ferramenta exploratória para caracterizar a estrutura de variação de classe. A análise de variação canônica é implementada na biblioteca R MASS, como descrito em |"Venables e Ripley, 20021. A Análise de perfil foi implementada em uma biblioteca patenteada em R, como descrito em TKiiveri 19921.
Dado o conhecimento a priori de rótulos de segmento para tecidos, a análise de perfil tenta identificar o subespaço de transcrito de gene limitado que fornece separação inter-classe máxima de cada um dos cinco segmentos do intestino grosso enquanto se minimiza a variação intraclasse (isto é, com cada segmento). Os resultados da análise de perfil do conjunto de dados completos incluem os dados de variável canôníca mostrados na Figura 8A, como um gráfico em que a primeira variável canônica é plotada ao longo do eixo χ e a segunda variável canônica ao longo do eixo y. Está evidente que os segmentos de tecido correlacionam-se com a primeira variável canônica, mas as variáveis canônicas segunda e subsequentes fornecem pouca ou nenhuma informação de separação de classe. Este resultado sugere que os mesmos conjuntos de sonda estão envolvidos na separação de cada um dos segmentos colorretais, isto é, as fontes maiores de diferença de uma perspectiva de segmento de tecido são aquelas usadas para gerar a primeira dimensão de variável canônica e por este motivo todos os segmentos são melhor agrupados por este mesmo conjunto de característica de conjuntos de sonda. Como mostrado na Figura 8B, mesmo quando a primeira variável canônica é usada, nenhum dos segmentos é perfeitamente separado, embora a ordem natural dos segmentos seja claramente preservada. Como com a PCA descrita acima, os dados de variação canônica podem ser usados para classificar a origem proximal-distal de células na origem desconhecida, mas os métodos descritos abaixo são preferidos para este propósito.
Máquinas de Vetor de Suporte
Embora os métodos multivariados descritos acima sejam úteis para investigar a variação da expressão de gene ao longo do intestino grosso, o aprendizado de máquina supervisionada foi usado para identificar genes que também são preditivos da localização de tecido em uma maneira robusta e para identificar os subconjuntos menores de conjuntos de sonda/genes que podem ser usados para prognosticar a localização de tecido com uma taxa de erro validado de cruzamento baixo.
Nas formas de realização descritas, a forma particular de aprendizado de máquina usado é uma máquina vetorial de sustentação (SVM), como fornecida pelo módulo SVM 1002; entretanto, estará evidente ao destinatário habilitado que outros métodos de núcleo podem ser alternativamente usados. Como descrito em [Scholkopf, 2004], métodos de núcleo são extensões de métodos lineares por meio dos quais as variáveis são mapeadas em um outro espaço onde as características essenciais deste mapeamento são capturadas por um núcleo simples. Os métodos de núcleo podem ser particularmente vantajosos em casos onde as observações são linearmente separáveis no espaço de núcleo mas não no espaço de dados originais.
O SVM 1002 determina a combinação de características (transcritos de gene) que maximamente separa as observações (isto é, tecidos) ao longo de uma fronteira de classe-decisão, usando a metodologia de SVM padrão, como descrito em [Cristianini e Shawe-Tailor, 2000].
Especificamente, a máquina Vetorial de suporte (SVM) 1002 foi usada para gerar dados de classificação que representam o sub-conjunto menor de conjuntos de sonda do conjunto de dados completo cuja expressão permite a separação máxima de células que se originam do ceco e reto. O SVM 1002 foi treinado usando um núcleo linear e os dados de classificação gerados em cada iteração foi avaliado usando a validação cruzada de 10 vezes. Os transcritos de gene contribuintes mais baixos de cada subconjunto de transcritos foram recursivamente eliminados para identificar o menor conjunto de transcritos com alta precisão de prognóstico.
A taxa de erro de SVM validada cruzada como uma função do número de conjuntos de sonda incluídos no modelo (visto que eles foram sucessivamente eliminados) é mostrada na Figura 9. O conjunto de característica menor que produz uma taxa de erro validada cruzada perfeita (0%) inclui os 13 conjuntos de sonda mostrados na Tabela 3.
Para medir a utilidade deste modelo em um conjunto de dados independente, os dados de classificação para os treze modelos de característica foram testados quanto ao desempenho de prognóstico proximal vs. distai nos dados de validação. Usando um modelo de análise discriminante linear tradicional construído com estes 13 conjuntos de sonda, os oito tecidos proximais e os onze distais foram prognosticados com 100% de precisão.
Modelo Classificador
Como uma alternativa para o SVM 1002, um classificador 1007 também foi usado para processar os dados de expressão completos de amostras de tecido tiradas de localizações conhecidas ao longo do eixo proximal-distal do intestino grosso para identificar combinações de genes que podem ser usados para identificar a origem de uma célula ou população de célula de origem desconhecida ao longo do intestino grosso. Na forma de realização descrita, o classificador GeneRave linear foi usado, como descrito em http://www.bioinformatics.csiro.au/overview.shtml. GeneRave é preferido em casos onde o número de variáveis excede o número de observações, entretanto, estará evidente àqueles habilitados na técnica que outros classificadores poderiam ser alternativamente usados, que incluem classificadores não lineares e classificadores com base na regressão logística regularizada.
Como descrito em [Kiiveri 20021, o classificador geneRave 1007 gera dados de classificação que representam combinações lineares de níveis de expressão para identificar subconjuntos de genes que podem ser usados para identificar com precisão as localizações de uma amostra de localizações desconhecidas. GeneRave 1007 usa um modelo de rede Bayesian para selecionar genes pela eliminação de genes que em combinação linear com outros genes não têm nenhuma correlação com as localizações das quais as amostras de tecido correspondentes foram tiradas. O resultado da análise geneRave do conjunto de dados
completo em dados de classificação que correspondem a um conjunto de 7 genes cujos níveis de expressão podem ser usados para identificar acuradamente a origem de uma célula correspondente ao longo do eixo proximal-distal do intestino grosso. Os 7 genes são SEC6L1, PRAC, SPINK5, SEC6L1, ANPEP, DEFΑ5 e CLDN8.
Debate
Um mapa da expressão diferencial de gene ao longo do intestino grosso
A análise de expressão univariada identificou 206 conjuntos de sonda que correspondem a 154 alvos de gene único que são diferencialmente expressados entre as regiões do intestino grosso proximais normais e distais normais em adultos humanos. Um subconjunto de 115 conjuntos de sonda (89% comuns à lista proximal vs. distai) é do mesmo modo diferencialmente expressado entre os segmentos colorretais terminais do ceco e reto. De maneira interessante, nós não encontramos nenhum transcrito que fosse expressado de modo significantemente diferente entre quaisquer dois segmentos adjacentes.
Para estimar a validade destas verificações, nós também medimos a mudança da expressão destes transcritos de gene em um conjunto independente de dados de microarranjo. Trinta e um (31) dos 206 conjuntos de sonda diferencialmente expressados em nosso conjunto de dados de verificação inicial de 184 amostras de tecidos colorretais também foram diferencialmente expressados nos dados de validação de 19 espécimes.
Usando uma simulação de Monte Cario, nós mostramos que um tal número grande de conjuntos de sonda diferenciais em ambos os conjuntos de dados é extremamente improvável.
Quase todos (28/31, 90%) destes transcritos 'validados' foram do mesmo modo diferencialmente expressados entre os dois segmentos de terminal do ceco e reto. 57 de 154 (37%) dos alvos de gene correspondentes foram confirmados ser diferencialmente expressados entre a intestino grosso proximal e distai pelos meios independentes.
Expressão de transcrito diferencial para genes individuais
O conjunto de sonda mais significantemente diferencial que nós observamos em nossos dados de verificação foi contra o transcrito de gene para PRAC. PRAC é altamente expressado no intestino grosso distai em relação aos tecidos proximais. Além disso, PRAC parece ser expressado em um padrão baixo-alto ao longo do intestino grosso com uma mudança de expressão acentuada ocorrendo entre os espécimes colorretais ascendentes e descendentes.
Verificou-se oito (8) conjuntos de sonda que correspondem a sete (7) genes HOX a serem diferencialmente expressados entre o intestino grosso proximal e distai. Os 39 membros da família de gene de homeobox mamífero consistem de fatores de transcrição altamente conservados que especificam a identidade de segmentos de corpo ao longo do eixo anterior- posterior do embrião em desenvolvimento [Hostikka e Capecchi, 1998, Mech Dev 70: 133-145; Kosaki et al., 2002, Teratology 65: 50-62]. Os quatro grupos de parálogos de gene HOX são expressados em uma seqüência de anterior para posterior, por exemplo, de HOXAl para HOXl3. [Montgomery et al., 1999, Gastroenterology 116: 702-731] Verificou-se que: os genes HOX de número mais baixo são expressados mais altos nos tecidos proximais (HOXD3, HOXD4, HOXB6, HOXC6 e HOXA9), enquanto que os genes de número mais alto são mais expressados no intestino grosso (HOXB13 e HOXDl 3).
De maneira interessante, houve uma ausência visível em nossas verificações de alguns transcritos de gene que foram previamente mostrados como sendo diferencialmente expressados ao longo do eixo proximal-distal. Nossos dados não demonstram um gradiente de expressão significante para os genes de homeobox caudais CDXl ou CDX2, fatores de transcrição que foram mostrados estar envolvidos no desenvolvimento padrão do intestino através de uma faixa de vertebrados. (Chalmers et al., 2000) (James et al., 1994) (Silberg et al., 2000). Em particular, acredita-se que CDX2 desempenhe um papel na manutenção do fenótipo colônico no intestino grosso adulto e foi recentemente mostrado estar presente em concentrações relativamente altas no intestino grosso proximal mas ausente no intestino grosso distai (James et al., 1994) (Silberg et al., 2000). Nem a análise estatística nem a inspeção visual da expressão de conjunto de sonda para este gene mostram a expressão diferencial ao longo do intestino grosso em nossos dados (dados não mostrados).
Observou-se a expressão de transcrito diferencial signifícante para vários dos genes de transporte carregadores de soluto. Enquanto a expressão de conjunto de sonda para SLC2A10, SLCl 3A2 e SLC28A2 é mais alta no intestino grosso distai, os membros da família de carregador de soluto SLC9A3, SLC14A2, SLC16A1, SLC20A1, SCL23A3 e SLC37A2 são mais altos nos tecidos proximais.
Nossos resultados mostram que conjuntos de sonda contra todos os três dos cinco membros do grupo do cromossoma 7q22 de mucinas ligadas à membrana previamente acreditadas serem expressadas no intestino grosso, MUCl 1, MUC12 e MUC17, são diferencialmente expressados em níveis altos no intestino distai [Byrd e Bresalier, 2004, Câncer Metastasis Rev 23: 77-99; Williams et al, 1999, Câncer Res 59: 4083-4089; Gum et al., 2002, Biochem Biophys Res Commun 291: 466-475], Nós também confirmamos este padrão de expressão diferencial para MUC12 e MUCI7 nos dados de validação independentes. Relatos anteriores também incitaram a questão a cerca de se as seqüências genômicas para MUCll e MUC12 são de genes intimamente relacionados ou talvez ainda do mesmo gene. [Byrd e Bresalier, 2004, supra]. A análise de correlação dos conjuntos de sonda MUCll e MUC12 mostram uma correlação forte, positiva na extremidade mais baixa da faixa de expressão do conjunto de sonda com uma correlação mais fraca conforme a expressão aumenta (dados não mostrados). Este perfil de correlação poderia ser devido à variabilidade aumentada em níveis mais altos de expressão ou, possivelmente, porque os níveis de expressão no intestino grosso distai (onde eles são mais altos) reflete um controle transcricional distinto.
Além disso, embora pesquisas anteriores tenham sugerido que a mucina secretada, que forma gel MUC5B fosse apenas fracamente expressada no intestino grosso [Byrd e Bresalier, 2004, supra], nossos resultados mostram que os conjuntos de sonda reativos para este transcrito são expressados mais altos no intestino grosso distai como para as mucinas ligadas a membrana.
Alguns dos padrões de expressão que nós relatamos aqui para seres humanos foram mostrados ser similarmente padronizados nos tratos gastrointestinais de modelos de roedor. Entretanto, vários genes específicos anteriormente mostrados serem diferencialmente expressados ao longo dos intestinos grossos de camundongos e ratos não foram encontrados por nós como sendo assim expressados. Tais transcritos de alvos de gene incluem, anidrase carbônica IV (Fleming et al., 1995), membro 1 da família 4 de carregador de soluto (também conhecido como AE1) (Raj endran et al., 2000), CD36/translocase de ácido graxo (Chen et al., 2001) e receptor 4 equivalente a toll (Ortega-Cava et al., 2003). Por outro lado, nossos dados estão de acordo com estudos iniciais de expressão de aquaporina-8 (AQP8), um gene cujo produto de expressão é suspeito estar envolvido na absorção de água no intestino grosso de rato normal (Calamita et al., 2001). Nós observamos que AQP8 é significantemente expressado a um nível alto no intestino grosso humano proximal comparado com os tecidos distais (p < 0,006, dados não mostrados). A família das proteínas de junção firme de claudina também podem desempenhar um papel na manutenção da integridade da barreira da água no intestino grosso (Jeansonne et al., 2003). Verificou-se que a expressão de claudina-8 (CLDN8) é muito mais altamente expressada nos tecidos colorretais distais. Ao contrário, claudina-15 (CLDN15), que também acredita-se esteja localizada nas fibrilas de junção firme foi expressada em um nível alto nos tecidos colorretais proximais (Colégio et al., 2002).
A natureza da mudança da expressão de gene ao longo do intestino grosso
Embora uma meta deste trabalho fosse entender quais
transcritos de gene são diferencialmente expressados ao longo do intestino grosso, um segundo objetivo foi explorar a natureza destas mudanças de expressão ao longo do eixo proximal-distal na região ou item específico de segmento.
Nós observamos dois padrões amplos de mudança de
expressão de transcrito estatisticamente significante ao longo do colorreto. O padrão maior é descrito por aqueles 65 transcritos de gene que foram bem adaptados por um modelo de expressão de dois segmentos. Nós sugerimos que a expressão destes transcritos seja dicótoma na natureza - elevados nos segmentos proximais e reduzidos em segmentos distais, ou vice e versa.
Tais dados são compatíveis com a visão anatômica convencional de que o divisor 'natural' entre o intestino grosso proximal e distai ocorre entre o cólon ascendente e descendente. Esta verificação é contrária a um relato recente por Komuro et al. de que um ponto de interrupção entre o cólon descendente e o sigmóide produz a expressão diferencial máxima (Komuro et al., 2005). Entretanto, nós observamos que além de analisar este padrão em espécimes de câncer colorretal, Komuro et al. também escolheram incluir o cólon transversal em sua análise. Nós intencionalmente excluímos tecidos deste segmento para evitar a influência de confusão possível relacionada com o ponto de fusão do intestino intermediário-intestino traseiro prognosticado aproximadamente dois terços do comprimento do cólon transversal.
Um segundo conjunto de 50 transcritos não demonstram uma mudança de dicótomo, mas ao invés mostram uma melhora signifícante no ajuste pela aplicação dos dados de expressão a um modelo de cinco segmentos que sustentam um gradiente de expressão mais gradual movendo ao longo do intestino grosso a partir do ceco para o reto.
Estes dois padrões de expressão característicos sugerem que a expressão de gene ao longo do eixo proximal-distal seja talvez coordenada por dois sistemas subjacentes de organização.
Nós observamos que a maioria dos transcritos diferencialmente expressados nos tecidos normais do adulto aqui medidos são expressados em um padrão que é compatível com um padrão de intestino intermediário vs. intestino traseiro de desenvolvimento embrionário. Além disso, métodos multivariados que incluem PCA supervisionada e análise de variação canônica também sugerem que a fonte primária de variação entre estes dados são explicadas pelos divisores proximal vs. distai. Em um estudo recente Glebov et al. verificou-se que o número de genes diferencialmente expressados entre o cólon ascendente e descendente no adulto é substancialmente maior do que o número de genes igualmente identificados em intestinos grossos de fetais de 17 a 24 semanas de idade. Glebov et al. levantaram a hipótese de que o padrão de expressão de gene do intestino grosso do adulto é possivelmente ajustado concorrentemente com a expressão do fenótipo colônico do adulto em ~30 semanas de gestação ou talvez ainda em resposta aos conteúdos luminais pós natal do trato gastrointestinal. Embora nós não tenhamos explorado a expressão de gene no intestino grosso fetal, nós observamos padrões de expressão no adulto que sustentam uma origem embrionária compatível com a fusão do intestino intermediário- intestino traseiro.
A maioria destes transcritos que exibem uma mudança de expressão gradual entre o ceco e o reto exibem um padrão prototípico de expressão aumentada movendo do ceco para o reto. Este padrão não é observado no intestino intermediário-intestino traseiro diferencial transcrito onde o número de transcritos elevados proximalmente é aproximadamente igual ao número elevados na região distai. Nós propusemos que o padrão crescente distalmente característico nestes transcritos seria uma função de fatores extrínsecos em comparação com o padrão de intestino intermediário- intestino traseiro intrinsecamente definido. Tais fatores incluiriam o efeito de conteúdos luminais que se movem em uma maneira unidirecional do ceco para o reto e/ou as mudanças regionais na microflora ao longo do intestino grosso. Outro trabalho será requerido para investigar se tais controles extrínsecos estão funcionando em uma maneira positiva de induzir a atividade transcricional ou através de um silenciamento transcricional reduzido.
Mudanças na expressão de gene em adaptação ao longo do intestino grosso
Para explorar a expressão de genes em adaptação ao longo do intestino grosso, nós também aplicamos a análise de componente principal e análise de perfil destes dados de expressão. Existe evidência forte quanto a um padrão de expressão de gene proximal versus distai com estas técnicas de visualização multivariada. Além disso, a análise de perfil, que simultaneamente maximiza as diferenças de expressão inter-segmento enquanto tenta diminuir a variação intra-segmento, sugere que o mesmo conjunto de genes que são responsáveis pela variabilidade entre o ceco para o reto também melhor separam os segmentos individuais. Embora estes resultados multivariados não excluam um gradiente proximal-distal sutil, a natureza bimodal evidente destas plotagens multivariadas sugere que a fonte maior de variação de expressão nestes tecidos é compatível com um padrão derivado de intestino intermediário vs. intestino traseiro.
Um conjunto menor de genes pode ser informativo Finalmente, o método de classificação sofisticado de máquinas de vetor de suporte é usado para selecionar um subconjunto de conjuntos de sonda informativos que podem ser usados para fornecer uma classificação estável, robusta de tecidos proximais versus distais. Conjuntos de sonda 'selecionados' pelo SVM 1002 são um subconjunto dos transcritos diferenciais identificados pelos métodos univariados, acima. Pela avaliação destes 13 modelos de transcrito no conjunto de validação independente, a robustez destes prognosticadores é ainda demonstrada.
Aqueles habilitados na técnica avaliarão que a invenção aqui descrita é susceptível às variações e modificações outras que não aquelas especificamente descritas. Deve ser entendido que a invenção inclui todas de tais variações e modificações. A invenção também inclui todas das etapas, características, composições e compostos aludidos ou indicados neste relatórios descritivo, individual ou coletivamente e qualquer e todas as combinações de qualquer duas ou mais das ditas etapas ou características.
Conclusões
Nosso trabalho sugere que a abundância de transcrito e talvez a regulagem transcricional, segue dois padrões amplos ao longo do eixo proximal- distal do intestino grosso. O padrão dominante é um padrão de expressão dicótoma compatível com as origens embrionárias de intestino intermediário- intestino traseiro do intestino proximal e distai. Os transcritos que seguem este padrão são de maneira aproximadamente idêntica divididos naqueles que são elevados distalmente e aqueles elevados proximalmente. O segundo padrão que nós observamos é caracterizado por uma mudança gradual nos níveis de transcrito do ceco para o reto, quase todos dos quais exibem expressão aumentada contra os tecidos distais. Nós propusemos que os tecidos que exibem os padrões de intestino intermediário-intestino traseiro dicótomos são prováveis de refletir as origens embrionárias intrínsecas do intestino grosso enquanto que aqueles que exibem uma mudança gradual refletem fatores extrínsecos tais como fluxo luminal e mudanças na microflora. Quando juntos, estes padrões constituem um mapa de expressão de gene do intestino grosso. Este é o primeiro de tal mapa de um órgão humano inteiro. TABELA 1: Lista de genes diferencialmenta expressados mais alto em tecidoe proximais em relacao aos tecidos distais.
<table>table see original document page 139</column></row><table> <table>table see original document page 140</column></row><table> <table>table see original document page 141</column></row><table> <table>table see original document page 142</column></row><table> <table>table see original document page 143</column></row><table> <table>table see original document page 144</column></row><table> <table>table see original document page 145</column></row><table> <table>table see original document page 146</column></row><table> <table>table see original document page 147</column></row><table> <table>table see original document page 148</column></row><table> TABELA 3: Modelo de prognostico de intestino grosso de 13 genes para a descoberta de localizacao de gene pelo SVM Maquina Ventorial de Suporte- Modelo 13 Genes
<table>table see original document page 149</column></row><table> <table>table see original document page 150</column></row><table> <table>table see original document page 151</column></row><table> BIBLIOGRAFIA
Affymetrix. 2001a. GeneChip Expression Analysis Data Analysis Fundamentais.
Affymetrix. 2001b. Statistical Algorithms Reference Guide. Affymetrix. 2004. Gene Expression Analysis: Technical Manual. 701021 Rev 5.
Alon, A., Barkai, N., Notterman, D. A., Gish, K., Ybarra, S.,
Mach, D. e
Levine, A. J. Broad patterns of gene expression revealed by clustering analysis of tumor and normal colon tissues probed by oligonucleotide arrays. Proc. Natl. Acad. Sei. USA: 96, 6745-6750, Junho de 1999
Ausubel, F. et al., "Current Protocols in Molecular Biology", John Wiley & Sons, 1998
Bair, E., T. Hastie, P. Debashis e R. Tibshirani. 2004. Predietion by supervised principal components. Stanford University
Bara, J., J. Nardelli, C. Gadenne, M. Prade e P. Burtin. 1984. Differences in the expression of mucus-associated antigens between proximal and distai human colon adenocarcinomas. Br J Câncer 49: 495-501.
Bates, M. D., C. R. Erwin, L. P. Sanford, D. Wiginton, J. A.
Bezerra, L.
C. Schatzman, A. G. Jegga, C. Ley-Ebert, S. S. Williams, K. A. Steinbrecher, B. W. Warner, Μ. B. Cohen e B. J. Aronow. 2002. Novel genes and fiinctional relationships in the adult mouse gastrointestinal tract identifíed by microarray analysis. Gastroenterology 122: 1467-1482.
Birkenkamp-Demtroder, K., S. H. Olesen, F. B. Sorensen, S. Laurberg, P. Laiho, L. A. Aaltonen e T. F. Orntoft 2005. Differential gene expression in colon câncer of the caecum versus the sigmoid and rectosigmoid. Gut 54: 374-384. Bonithon-Kopp, C. e A. M. Benhamiche. 1999. Are there several colorectal cancers? Epidemiological data. Eur J Câncer Prev 8 Supl 1: S3-12.
Bonner Τ. I., Brenner D. J., Neufeld B. R. e Britten R. J.
(1973) Reduction in the rate of DNA reassociation by sequence divergence. J. Mol.Biol. 81: 123-125
Bufill, J. A. 1990. Colorectal câncer: evidence for distinct genetic categories based on proximal or distai tumor location. Ann Intern Med 113: 779-788.
Byrd, J. C. e R. S. Bresalier. 2004. Mucins and mucin binding
proteins in colorectal câncer. Câncer Metastasis Rev 23: 77-99.
Calamita, G., A. Mazzone, A. Bizzoca, A. Cavalier, G. Cassano, D. Thomas e M. Svelto. 2001. Expression and immunolocalization of the aquaporin-8 water channel in rat gastrointestinal tract. Eur J Cell Biol 80:711-719.
Caldero, J., E. Campo, C. Ascaso, J. Ramos, M. J. Panades e J. M. Rene. 1989. Regional distribution of glycoconjugates in normal, transitional and neoplastic human colonic mucosa. A histochemical study using lectins. Virchows Arch A Pathol Anat Histopathol 415: 347-356. Chalmers, A. D., J. M. Slack e C. W. Beck. 2000. Regional
gene expression in the epithelia of the Xenopus tadpole gut. Mech Dev 96:125-128.
Chen, M., Y. Yang, E. Braunstein, Κ. E. Georgeson e C. M. Harmon. 2001. Gut expression and regulation of FAT/CD36: possible role in fatty acid transport in rat enterocytes. Am J Physiol Endocrinol Metab 281: E916-23.
Colégio, O. R., C. M. Van Itallie, H. J. McCrea, C. Rahner e J. M. Anderson. 2002. Claudins create charge-selective channels in the paracellular pathway between epithelial cells. Am JPhysiol Cell Physiol 283: C142-7.
Cristianini, Ν. e J. Shawe-Taylor. 2000. An Introduction to Support Vector Machines and Other Kemel-based Learning Methods.
Cristianini, N., Shawe-Taylor, J. Support Vector Machines.2000. Cambridge University Press. Cambridge.
Cuff, Μ. A., D. W. Lambert e S. P. Shirazi-Beechey. 2002. Substrate-induced regulation of the human colonic monocarboxylate transporter, MCTl. JPhysiol 539: 361-371.
de Santa Barbara, P., G. R. van den Brink e D. J. Roberts. 2003. Development and differentiation of the intestinal epithelium. Cell Mol Life Sci 60: 1322-1332.
Deng, G., E. Peng, J. Gum, J. Terdiman, M. Sleisenger e Y. S. Kim. 2002. Methylation of hMLHl promoter correlates with the gene silencing with a region-specific manner in colorectal câncer. Br J Câncer 86: 574-579.
DeRisi, et al., Nature Genetics, 14: 457-460 (1996)
Distler, P. e P. R. Holt. 1997. Are right- and left-sided colon neoplasms distinct tumors? Dig Dis 15: 302-311.
Drmanac R., Labat I. e Crkvenjakov R., An algorithm for the DNA sequence generation from k-tuple word contents of the minimal number ofrandom fragments../. Biomol. Struc. & Dyn. 5: 1085-1102, 1991
Filipe, Μ. I. e A. C. Branfoot. 1976. Mucin histochemistry of the colon. Curr Top Pathol 63: 143-178.
Fleming, R. E., S. Parkkila, A. K. Parkkila, H. Rajaniemi, A. Waheed e W. S. Sly. 1995. Carbonic anhydrase IV expression in rat and human gastrointestinal tract regional, cellular, and subcellular localization. J Clin Invest 96: 2907-2913.
Garcia-Hirschfeld Garcia, J., A. Blanes Berenguel, L. Vicioso Recio, A. Marquez Moreno, J. Rubio Garrido e A. Matilla Vicente. 1999. Colon câncer: p53 expression and DNA ploidy. Their relation to proximal or distai tumor site. Rev Esp Enferm Dig 91: 481-488.
Gautier, L., L. Cope, Β. M. Bolstad e R. A. Irizarry. 2004. affy—analysis of Affymetrix GeneChip data at the probe levei. Bioinformatics 20:307-315.
Gentleman, R. C., V. J. Carey, D. M. Bates, B. Bolstad, M. Dettling, S. Dudoit, B. Ellis, L. Gautier, Y. Ge, J. Gentry, K. Hornik, T. Hothorn, W. Huber, S. Iacus, R. Irizarry, F. Leisch, C. Li, M. Maechler, A. J. Rossini, G. Sawitzki, C. Smith, G. Smyth, L. Tierney, J. Y. Yang e J. Zhang. 2004. Bioconductor: open software development for computational biology and bioinformatics. Genuine Biol 5: R80.
Germer S, Holland M J, Higuchi R. 2000, High-throughput SNP allele-frequency determination in pooled DNA samples by kinetic PCR. Genome Res. 10(2): 258-66.
Glebov, O. K., L. M. Rodriguez, K. Nakahara, J. Jenkins, J.
Cliatt, C. J. Humbyrd, J. DeNobile, P. Soballe, R. Simon, G. Wright, P. Lynch, S. Patterson, H. Lynch, S. Gallinger, A. Buchbinder, G. Gordon, E. Hawk e I. R. Kirsch. 2003. Distinguishing right from Ieft colon by the pattern of gene expression. CancerEpidemiol Biomarkers Prev 12: 755-762.
Gum, J. R. J., S. C. Crawley, J. W. Hicks, D. E. Szymkowski e Y. S. Kim. 2002. MUC17, a novel membrane-tethered mucin. Biochem Biophys Res Commun 291: 466-475.
Guo Z, Guilfoyle R A, Thiel A J, Wang R, Smith L M. 1994, Direct fluorescence analysis of genetic polymorphisms by hybridization with oligonucleotide arrays on glass supports. Nucleic Acids Res. 22(24): 5456-65
Hastie, T, Tibshirani, R, Friedman, J, The Elements of Statistical Learning. Springer, 2001. Nova Iorque. Capítulo 4: Linear Methods for Classification. Hostikka, S. L. e M. R. Capecchi. 1998. The mouse Hoxcl 1 gene: genomic structure and expression pattern. Mech Dev 70: 133-145. Hubbell, E., W. Μ. Liu e R. Mei. 2002. Robust estimators for expression analysis. Bioinformatics 18: 1585-1592.
Iacopetta, B. 2002. Are there two sides to eoloreetal câncer? IntJCancer 101: 403-408.
Irizarry, R. Α., Β. M. Bolstad, F. Collin, L. M. Cope, B. Hobbs
e Τ. P. Speed. 2003. Summaries of Affymetrix GeneChip probe levei data. Nucleic Acids Res 31: el5.
James, R., T. Erler e J. Kazenwadel. 1994. Strueture of the murine homeobox gene cdx2. Expression in embryonic and adult intestinal epithelium. J Biol Chem 269: 15229-15237.
Jeansonne, B., Q. Lu, D. A. Goodenough e Υ. H. Chen. 2003. Claudin-8 interacts with multi-PDZ domain protein 1 (MUPPl) and reduces paracellular conductance in epithelial cells. Cell Mol Biol (Noisy-le-grand)49: 13-21.
Kiiveri, Η. Τ. A bayesian approach to variable selection when
the number of variables is very large Science and Statistics: A Festschrift for Terry Speed, 2003 Institute of Mathematical Statistics, Lecture Notes- Monograph Series, Vol. 3, páginas 127-143
Kiiveri, H., Thomas, M., Dunne, R., Method and Apparatus for Identifying Diagnostic Components of Asystem with a characteristic response, Pedido de Patente Internacional N- PCT/AU2002/000934
Komuro, K., M. Tada, E. Tamoto, A. Kawakami, A. Matsunaga, K. Teramoto, G. Shindoh, M. Takada, K. Murakawa, M. Kanai, N. Kobayashi, Y. Fujiwara, N. Nishimura, J. Hamada, A. Ishizu, H. Ikeda, S. Kondo, H. Katoh, T. Moriuchi e T. Yoshiki. 2005. Right- and left-sided eoloreetal cancers display distinet expression profiles and the anatomical stratification allows a high accuracy prediction of lymph node metastasis. J SurgRes 124: 216-224.
Kondo, T., P. Dolle, J. Zakany e D. Duboule. 1996. Function of posterior HoxD genes in the morphogenesis of the anal sphincter. Development 122: 2651-2659.
Kosaki, K., R. Kosaki, T. Suzuki, H. Yoshihashi, T. Takahashi, K. Sasaki, M. Tomita, W. McGinnis e N. Matsuo. 2002. Complete mutation analysis panei of the 39 human HOX genes. Teratology 65: 50-62.
Krzanowski, W e Marriott, F, Multivariate Analysis Part II. Classification Covariance Structures and Repeated Measures. 1995. Oxford Univ Press. Oxford. UK. Lipshutz, R. J., S. P. Fodor, T. R. Gingeras e D. J. Lockhart. 1999. High density synthetic oligonucleotide arrays. Nat Genet 21: 20-24.
Liu, X. F., P. Olsson, C. D. Wolfgang, Τ. K. Bera, P. Duray, B. Lee e I. Pastan. 2001. PRAC: A novel small nuclear protein that is specifically expressed in human prostate and colon. Prostate 47: 125-131.
Macfarlane, G. T., G. R. Gibson e J. H. Cummings. 1992.
Comparison of fermentation reactions in different regions of the human colon. J Appl Bacteriol 72: 57-64.
Maskos e Southern, Nuc. Acids Res. 20: 1679-84, 1992 Miklos, G. L. e R. Maleszka. 2004. Microarray reality checks in the context of a complex disease. Nat Biotechnol 22: 615-621.
Montgomery, R. K., A. E. Mulberg e R. J. Grand. 1999.
Development of the human gastrointestinal tract: twenty years of progress. Gastroenterology 116: 702-731.
Moore, A., Basilion, J., Chiocca, e., e Weissleder, R., Measuring Transferrin Receptor Gene Expression by NMR Imaging. BBA, 1402:239-249,1988
Ortega-Cava, C. F., S. Ishihara, M. A. Rumi, K. Kawashima, N. Ishimura, H. Kazumori, J. Udagawa, Y. Kadowaki e Y. Kinoshita. 2003. Strategic compartmentalization of Toll-Iike receptor 4 in the mouse gut. J Immunol 170: 3977-3985. Park, Υ. K., J. L. Franklin, S. Η. Settle, S. Ε. Levy5 Ε. Chung, L. Η. Jeyakumar, Y. Shyr, Μ. K. Washington, R. H. Whitehead, B. J. Aronow e R. J. Coffey. 2005. Gene expression profile analysis of mouse colon embryonic development. Genesis 41: 1-12.
Pease A C, Solas D, Sullivan E J, Cronin M T, Holmes C P,
Fodor S P., 1994, Light-generated oligonucleotide arrays for rapid DNA sequence analysis. Proc Natl Acad Sci USA. 91(11): 5022-6
Peifer, M. 2002. Developmental biology: colon construction. Nature 420: 274-5, 277. Pevzner P A., 1989, I-Tuple DNA sequencing: computer
analysis., JBiomol StructDyn. 7(1): 63-73
Pevzner P A, Lysov YuP, Khrapko K R, Belyavsky A V, Florentiev V L, Mirzabekov AD., 1991, Improved chips for sequencing by hybridization., J Biomol Struct Dyn. 9(2): 399-410 R: A Language and Environment for Statistical Computing, R
Development Core Team, R Foundation for Statistical Computing, Viena, Áustria, 2007, ISBN 3-900051-07-0.
Rajendran, V. M., J. Black, T. A. Ardito, P. Sangan, S. L. Alper, C. Schweinfest, M. Kashgarian e H. J. Binder. 2000. Regulation of DRA and AEl in rat colon by dietary Na depletion. Am J Physiol Gastrointest Liver Physiol 279: G931-42.
Ripley, B D, Cambridge Univ Press. 1996. Pattern Recognition and Neural Networks. Capítulo 6: Non-parametric methods.
Sano T, Cantor CR., 1991, A streptavidin-protein A chimera that allows one-step production of a variety of specific antibody conjugates., Biotechnology(NY). 9(12): 1378-81
Schena, etal. Science 270: 467-470, 1995 Scholkopf, B, Tsuda, K, e Vert, J P Kernel Methods in Computational Biology. 2004. MIT Press. Cambridge MA. Silberg, D. G., G. Ρ. Swain, Ε. R. Suh e P. G. Traber. 2000. Cdxl and cdx2 expression during intestinal development. Gastroenterology119: 961-971.
Singh, S., R. Poulsom, A. M. Hanby, L. A. Rogers, N. A.
Wright, M. C. Sheppard e M. J. Langman. 1998. Expression of oestrogen receptor and oestrogen-inducible genes pS2 and ERD5 in large bowel mucosa and câncer. J Pathol 184: 153-160.
Smith S B, Finzi L, Bustamante C., 1992, Direct Mechanical Measurements of the Elasticity of Single DNA Molecules by Using Magnetic Beads, Science 258: 1122-1126
Smyth, G. 2005. Limma: linear models for microarray data. In Bioinformatics and Computational Biology Solutions using R and Bioconductor. (eds. Gentleman, R., V. Carey, S. Dudoit, R. Irizarray e W. Huber), pp. 397-420. Springer, Nova Iorque. Traber, P. G. 1999. Transcriptional regulation in intestinal
development. Implications for colorectal câncer. Adv Exp Med Biol 470: 1-14.
Urdea et ai., Nucleic Acids Symp. Ser., 24: 197-200, 1991 Venables, W. e Ripley, B. D., Modern Applied Statistics with S, Springer-Verlag. Nova Iorque, 2002.
Wedemeyer, N., Potter, T., Wetzlich, S. e Gohde, W. Flow Cytometric Quantification of Competitive Reverse Transcriptase-PCR products, Clinicai Chemistry 48: 9 1398-1405, 2002
Weissleder, R., Moore, A., Ph. D., Mahmood-Bhorade, U., Benveniste, H., Chiocca, Ε. A., Basilion, J. P. High resolution in vivo imaging of transgene expression, Nature Medicine 6: 351-355, 2000
Williams, S. J., M. A. McGuckin, D. C. Gotley, H. J. Eyre, G. R. Sutherland e Τ. M. Antalis. 1999. Two novel mucin genes down-regulated in colorectal câncer identified by differential display. Câncer Res 59: 4083- .4089.
Wilson, C. e C. J. Miller. 2005. Simpleaffy: a BioConductor package for Affymetrix quality control and data analysis. Bioinformatics
Yamada, T. e D. H. Alpers. 2003. Textbook of Gastroenterology, 2 Vol. Set.
Claims (50)
1. Método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, caracterizado pelo fato de que inclui: avaliar os dados de treinamento, incluindo a expressão dos dados de treinamento que representam a expressão de genes nas células ou populações celulares derivadas de origens proximal-distal conhecidas de pelo menos um intestino grosso, e a origem proximal-distal dos dados de treinamento que representam associações das ditas células ou populações celulares com as ditas origens proximal-distal; processar os dados de treinamento para gerar dados de classificação que representam uma combinação linear ou não linear de níveis de expressão do dito genes, os ditos dados de classificação sendo adaptados para gerar outros dados de origem proximal-distal indicativos de uma origem proximal-distal de uma outra célula ou subpopulação celular tirada de um intestino grosso, com base em outros dados de expressão que representam a expressão do dito genes na dita outra célula ou subpopulação celular.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que inclui processar os ditos dados de classificação e os ditos outros dados de expressão para gerar os ditos outros dados de origem proximal- distal.
3. Método de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o dito processamento é fundamentado na regressão estatística, linear generalizada, e/ou regressão linear múltipla.
4. Método de acordo com qualquer uma das reivindicações de 1 a 3, caracterizado pelo fato de que o dito processar inclui processar os ditos dados de treinamento com GeneRave.
5. Método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, caracterizado pelo fato de que inclui: avaliar os dados de treinamento, incluindo expressão os dados de treinamento que representam a expressão de genes nas células ou populações celulares derivadas de origens proximal-distal conhecidas de um intestino grosso, e origem proximal-distal dos dados de treinamento que representam associações das ditas células ou populações celulares com as ditas origens proximal-distal; processar os dados de treinamento usando análise multivariada para gerar dados de classificação para gerar dados de origem proximal-distal indicativos de uma origem proximal-distal de uma outra célula ou população celular derivada de um intestino grosso, com base em outros dados de expressão que representam a expressão de genes na dita outra célula ou população celular.
6. Método de acordo com a reivindicação 5, caracterizado pelo fato de que inclui processar os ditos outros dados de expressão e os ditos dados de classificação para gerar os ditos dados de origem proximal-distal.
7. Método de detecção para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, caracterizado pelo fato de que inclui: avaliar os primeiros dados de expressão que representam a expressão de genes nas células ou populações celulares derivada de origens proximal-distal conhecidas de pelo menos um intestino grosso; processar os primeiros dados de expressão usando análise multivariada para gerar dados modelo multivariados representativos de associações entre os primeiros dados de expressão e origem proximal-distal das ditas células ou populações celulares, os ditos dados modelo multivariados sendo adaptados para gerar dados de origem proximal-distal representativos de origem proximal-distal de uma célula ou população celular com base na segunda dado de expressão que representa a expressão de genes nas ou população celular derivada do intestino grosso de um indivíduo.
8. Método de acordo com a reivindicação 7, caracterizado pelo fato de que inclui avaliar os ditos segunda expressão dados que representam a expressão de genes em uma célula ou população celular derivada do intestino 5 grosso de um indivíduo; e processar os ditos dados de expressão e os dados modelo multivariados para gerar os ditos dados de origem proximal-distal representativos de uma origem proximal-distal das ditas célula ou população celular.
9. Método de acordo com a reivindicação 7, caracterizado pelo fato de que a dita etapa de avaliar primeiros dados de expressão inclui avaliar a terceira dados de expressão dos quais os ditos primeiros dados de expressão é um subconjunto, e o método inclui processar os ditos terceiro dados de expressão para selecionar um subconjunto do terceiro dados de expressão correspondendo a um subconjunto de genes diferencialmente expressados sozinhos ou em combinação junto o eixo proximal-distal dos ditos intestino grosso, o subconjunto selecionado sendo os ditos primeiros dados de expressão.
10. Método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, caracterizado pelo fato de que inclui: avaliar primeiros dados de expressão que representam a expressão de genes nas células ou populações celulares derivada de origens proximal-distal conhecidas de pelo menos um intestino grosso; e processar os primeiros dados de expressão usando um método kernel para gerar dados de classificação para processar os ditos dados de expressão que representam a expressão do dito genes em pelo menos um segunda célula ou população celular de um intestino grosso para gerar dados de origem proximal-distal que representam a origem proximal-distal dos ditos pelo menos uma segunda célula ou população celular.
11. Método de acordo com a reivindicação 10, caracterizado pelo fato de que os ditos método kernel inclui um máquina de vetor de suporte (SVM).
12. Método de acordo com a reivindicação 10 ou 11, caracterizado pelo fato de que o método inclui processar os ditos segunda dados de expressão e os ditos dados de classificação para gerar os ditos dados de origem proximal-distal.
13. Método de detecção para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, caracterizado pelo fato de que inclui: avaliar primeiros dados de expressão que representam a expressão de genes nas células ou populações celulares derivada de origens proximal-distal conhecidas de pelo menos um intestino grosso; processar os primeiros dados de expressão usando principal para gerar principal dados correspondentes a pelo menos um combinação linear a expressão do dito genes, os ditos principal dados sendo indicativos de pelo menos um dos ditos origem proximal-distal das ditas células ou populações celulares.
14. Método de acordo com a reivindicação 13, caracterizado pelo fato de que a dita etapa de avaliar primeiros dados de expressão inclui avaliar terceiro dados de expressão de que os ditos primeiros dados de expressão é um subconjunto, e o método inclui processar os ditos terceiro dados de expressão um subconjunto terceiro dados de expressão a um subconjunto de genes expressados junto ao eixo proximal-distal dos ditos um intestino grosso, subconjunto sendo os ditos primeiros dados de expressão.
15. Método de acordo com a reivindicação 13 ou 14, caracterizado pelo fato de que inclui processar os ditos principal dados e segunda dados de expressão que representam a expressão do dito genes em pelo menos um segunda célula ou população celular de um intestino grosso para gerar dados de origem proximal-distal que representam a origem proximal-distal.
16. Método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, caracterizado pelo fato de que inclui: avaliar primeiros dados de expressão que representam a expressão de genes in um célula ou população celular derivada de origens proximal-distal conhecidas de pelo menos um intestino grosso; e processar a dados de expressão usando análise de variante canônica para gerar dados indicativos de pelo menos uma das origens proximais-distais das ditas células ou populações celulares.
17. Método de acordo com a reivindicação 16, caracterizado pelo fato de que a dita análise variada canônica inclui análise de perfil.
18. Método de acordo com a reivindicação 16 ou 17, caracterizado pelo fato de que os ditos dados variados canônicos correspondem a um subconjunto do dito genes.
19. Método de acordo com qualquer uma das reivindicações de a 27, caracterizado pelo fato de que inclui processar os ditos dados variados canônicos e segunda dados de expressão que representam a expressão do dito genes em pelo menos um segunda célula ou população celular de um intestino grosso para gerar dados de origem proximal-distal que representam a origem proximal-distal de os ditos pelo menos uma segunda célula ou população celular.
20. Método de acordo com qualquer uma das reivindicações de -1 a 19, caracterizado pelo fato de que inclui modificar os dados de classificação com base classificação da origem proximal-distal indicada pelos dados de origem proximal-distal.
21. Método de acordo com qualquer uma das reivindicações de .1 a 10, caracterizado pelo fato de que os ditos origem proximal-distal é determinado usando um método não paramétrico.
22. Método de acordo com a reivindicação 21, caracterizado pelo fato de que os ditos método não paramétrico inclui um método do vizinho mais próximo.
23. Método de acordo com qualquer uma das reivindicações de 1 a 22, caracterizado pelo fato de que o dito genes incluem genes selecionados de: o gene ou genes detectados pela sonda Affymetrix número:218888 s at o gene detectado pela sonda Affymetrix número: 225290_ at o gene detectado pela sonda Affymetrix número: 226432_ at o gene detectado pela sonda Affymetrix número: 231576_ at o gene detectado pela sonda Affymetrix número: 235733_ at o gene detectado pela sonda Affymetrix número: 236894_ at o gene detectado pela sonda Affymetrix número: 239656_ at o gene detectado pela sonda Affymetrix número: 242059_ at o gene detectado pela sonda Affymetrix número: 242683_ at o gene detectado pela sonda Affymetrix número: 230105_ at o gene detectado pela sonda Affymetrix número: 230269 at o gene detectado pela sonda Affymetrix número: 238378 at o gene detectado pela sonda Affymetrix número: 239814_ at o gene detectado pela sonda Affymetrix número: 239994 at o gene detectado pela sonda Affymetrix número: 240856. at o gene detectado pela sonda Affymetrix número: 242414. at o gene detectado pela sonda Affymetrix número: 244553. at o gene detectado pela sonda Affymetrix número: 217320 o gene detectado pela sonda Affymetrix número: 236141 o gene detectado pela sonda Affymetrix número: 236513 o gene detectado pela sonda Affymetrix número: 238143 ABHD5, FAM3B, IGFBP2, POPDC3, ADRA2A, FLJ10884, KCNG1, REGIA, APOBEC1, FLJ22761, KIFAP3, SLC14A2, C10orf45, FTHFD, LOC375295, SLC20A1, C10orf58, GCNTl, ME3, SLC23A3, CCL8, HAS3, MEP1B, SLC38A2, CLDNl5, HOXB6, NPY6R, SLC9A3, DEFA5, HOXD4, NR1H3, TBCC, EYA2, HSD3B2, HR1H4, ZNF493, OSTalpha, PAP, AFARPl ou o gene ou genes detectados pela sonda Affymetrix número: 202234_s_at, ANPEP ou o gene ou genes detectados pela sonda Affymetrix número: 202888_s_at, CCL13 ou o gene ou genes detectados pela sonda Affymetrix número: 206407_s_at CRYLl ou o gene ou genes detectados pela sonda Affymetrix número: 220753_s_at, CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número: 206754_s_at, CYP2C18, ou o gene ou genes detectados pela sonda Affymetrix número: 208126 s at, CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número: 21442 l_x_at ou 220017_x_at, EPB41L3 ou o gene ou genes detectados pela sonda Affymetrix número: 211776_s_at ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 222262_s_at ou 224453_s_at, FAM45A ou o gene ou genes detectados pela sonda Affymetrix número: 221804_s_at ou 222955_s_at, FGFR2 ou o gene ou genes detectados pela sonda Affymetrix número: 203639_s_at, GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 219954_s_at, GSPT2 ou o gene ou genes detectados pela sonda Affymetrix número: 205541_s_at, GULPl ou o gene ou genes detectados pela sonda Affymetrix número: 215913_s_at, H0XA9 ou o gene ou genes detectados pela sonda Affymetrix número: 205366_s_at ou 214551_s_at, H0XC6 ou o gene ou genes detectados pela sonda Affymetrix número: 206858_s_at, H0XD3 ou o gene ou genes detectados pela sonda Affymetrix número: 20660 l_s_at, ME2 ou o gene ou genes detectados pela sonda Affymetrix número: MESPl ou o gene ou genes detectados pela sonda Affymetrix número: 224476 s at MOCS 1 ou o gene ou genes detectados pela sonda Affymetrix número: 213181 _s_at, MSCP ou o gene ou genes detectados pela sonda Affymetrix número: 21813 6_s_at ou 221920_s_at, NET02 ou o gene ou genes detectados pela sonda Affymetrix número: 222774_s_at, OASL ou o gene ou genes detectados pela sonda Affymetrix número: 210757_s_at, PITX2 ou o gene ou genes detectados pela sonda Affymetrix número: 207558 s at PRAPl ou o gene ou genes detectados pela sonda Affymetrix número: 243669_s_at, SCUBE2 ou o gene ou genes detectados pela sonda Affymetrix número: 219197_s_at, SEC6L1 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at, SLC16Al ou o gene ou genes detectados pela sonda Affymetrix número: 202236_s_at ou 209900_s_at, UGT1A3 ou o gene ou genes detectados pela sonda Affymetrix número: 208596_s_at, UGT1A8 ou o gene ou genes detectados pela sonda Affymetrix número: 221305_s_at ACACA, FMOD, LOC151162, SlOOP, C13orfll, FRMD3, MCF2L, SCGB2A1, C20orf56, GALNT5, MMP28, SCNN1B, CAPN13, GARNL4, MUCl 1, SHANK2, CLDN8, GCG, MUC12, SIAT2, COLM, GNE, MUC17, SIAT4C, CRIP1, HGD5 MUC5B, SIAT7F, DNAJC12, HOXB13, NEDD4L, SIDT1, FAM3C, INSL5, PARP8, SLC13A2, FBX025, IRS1, PCDH21 ,SLPI, FLJ20366, ISL1, PI3, SPINK5, FLJ20989, KIAA0703, PRAC, SST, KIAA0830, PRAC2, TFF1, KIAA1913, PTTG1IP, TNFSFl 1, LAMAl, QPRT,TPH1, LGALS2, QSCN6, WFDC2, RBM24, ARF4 ou o gene ou genes detectados pela sonda Affymetrix número: 201097_s_at, BTG3 ou o gene ou genes detectados pela sonda Affymetrix número: 213134 χ atou 205548 _s_at CHST5 ou o gene ou genes detectados pela sonda Affymetrix número: 221164xat ou 223942_x_at, CMAH ou o gene ou genes detectados pela sonda Affymetrix número: 205518_s_at, CRYBA2 ou o gene ou genes detectados pela sonda Affymetrix número: 220136_s_at CTSE ou o gene ou genes detectados pela sonda Affymetrix número: 205927_s_at, DKFZp761N1114 ou o gene ou genes detectados pela sonda Affymetrix número: 242372_s_at, EPB41L4A ou o gene ou genes detectados pela sonda Affymetrix número: 228256 s at EPHA3 ou o gene ou genes detectados pela sonda Affymetrix número: 206070 s at, FAS ou o gene ou genes detectados pela sonda Affymetrix número: 20478 l_s_at, FER1L3 ou o gene ou genes detectados pela sonda Affymetrix número: 201798sat ou 211864_s_at, Fl 120152 ou o gene ou genes detectados pela sonda Affymetrix número: 218532_s_at ou 218510_x_at, FLJ23548 ou o gene ou genes detectados pela sonda Affymetrix número: 218187_s_at, FNl ou o gene ou genes detectados pela sonda Affymetrix número: 211719_s_at ou 210495_x_at ou 212464 at ou 216442_x_at, FOXA2 ou o gene ou genes detectados pela sonda Affymetrix número: 210103_s_at, FRZB ou o gene ou genes detectados pela sonda Affymetrix número: 203698_s_at, GDF15 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_x_at, GJB3 ou o gene ou genes detectados pela sonda Affymetrix número: 205490_s_at, HOXD13 ou o gene ou genes detectados pela sonda Affymetrix número: 207397_s_at, INSMl ou o gene ou genes detectados pela sonda Affymetrix número: 206502_s_at, MGC4170 ou o gene ou genes detectados pela sonda Affymetrix número: 212959_s_at, MLPH ou o gene ou genes detectados pela sonda Affymetrix número: 21821 l_s_at, NEBL ou o gene ou genes detectados pela sonda Affymetrix número: 203962_s_at, PLA2G2A ou o gene ou genes detectados pela sonda Affymetrix número: 203649_s_at, PTPRO ou o gene ou genes detectados pela sonda Affymetrix número: 208121 s at, PYY ou o gene ou genes detectados pela sonda Affymetrix número: 207080_s_at ou 211253x_at, SH3BP4 ou o gene ou genes detectados pela sonda Affymetrix número: 222258_s_at, SLC28A2 ou o gene ou genes detectados pela sonda Affymetrix número: 207249_ s _at SLC2A10 ou o gene ou genes detectados pela sonda Affymetrix número: 221024_s_at, SPONl ou o gene ou genes detectados pela sonda Affymetrix número: 213994 s at ou 209437 s at STS ou o gene ou genes detectados pela sonda Affymetrix número: 203769_s_at TM4SF11 ou o gene ou genes detectados pela sonda Affymetrix número: 204519_s_at, TUSC3 ou o gene ou genes detectados pela sonda Affymetrix número: 213432 s at ou 209228_x_at, AQP8 LGALS2 EFNAl ORF51E2 CCLll C60RF105 EMPl PROMl CLDN8 CCLll FST REG3A MMP12 CD69 GHR SCNNlB P2RY14 CLC HLA-DRB4 ST3GAL4 CCL18 CPM HOXDlO ST6GALNAC6 ACSLl DEFA6 HSD17B2 AGR2 DHRS9 HSPCA ASPN IGHD MTlM SCD ou o gene ou genes detectados pela sonda Affymetrix número 200832_s_at, ABCBlor o gene ou genes detectados pela sonda Affymetrix número: 211994_s_at, BTBD3 ou o gene ou genes detectados pela sonda Affymetrix número: 202946 _ s _at CAl ou o gene ou genes detectados pela sonda Affymetrix número: 205950_s_at, DHRS9 ou o gene ou genes detectados pela sonda Affymetrix número: 224009_x_at ou 223952_x_at, DKFZP56411171 ou o gene ou genes detectados pela sonda Affymetrix número: 225457_s_at, EIF5A ou o gene ou genes detectados pela sonda Affymetrix número: 201123_s_at, IGHD ou o gene ou genes detectados pela sonda Affymetrix número: 214973_x_at, PCKl ou o gene ou genes detectados pela sonda Affymetrix número: 208383_s_at, RBP4 ou o gene ou genes detectados pela sonda Affymetrix número: 219140_s_at, TRPM6 ou o gene ou genes detectados pela sonda Affymetrix número: 224412_s_at, UGT1A6 ou o gene ou genes detectados pela sonda Affymetrix número: 215125 s at.
24. Método de acordo com qualquer uma das reivindicações de -1 a 23, caracterizado pelo fato de que o dito genes incluem apenas 7 genes.
25. Método de acordo com qualquer uma das reivindicações de -1 a 24, caracterizado pelo fato de que o dito genes incluem SEC6L1, PRAC, SP1NK5, SEC6L1, ANPEP, DEFA5, e CLDN8.
26. Método de acordo com qualquer uma das reivindicações de -1 a 23, caracterizado pelo fato de que o dito genes incluem um ou mais dos seguintes grupos de genes: (i) SCD ou o gene ou genes detectados pela sonda Affymetrix número: 200832 s_at, MMP12 P2RY14 CLDN8 ETNKl (ii) PCP4 SLC28A2 ou o gene ou genes detectados pela sonda Affymetrix número: 207249_s_at, CCL18 (iii) RBP4 ou o gene ou genes detectados pela sonda Affymetrix número: 219140_s_at, DKFZP56411171 PRAC (iv) EDF5A ou o gene ou genes detectados pela sonda Affymetrix número: 201123_s_at, IGFBP2 (v) GDF 15 ou o gene ou genes detectados pela sonda Affymetrix número: 221577 s at (vi) DKFZP56411171 ou o gene ou genes detectados pela sonda Affymetrix número: 225457 s at (vii) ANPEP ou o gene ou genes detectados pela sonda Affymetrix número: 202888 s at (viii) CHST5 ou o gene ou genes detectados pela sonda Affymetrix número: 221164_x_at, (ix) O gene detectado pela sonda Affymetrix No. 226432 at COLM SCNNlB (x) FNl ou o gene ou genes detectados pela sonda Affymetrix número: 211719 χ at ETNKlor o gene ou genes detectados pela sonda Affymetrix número: 224453_s_at, O gene detectado pela sonda Affymetrix No. 225290_at SLC20A1 HSPCA O gene detectado pela sonda Affymetrix No. 217320_at CCLl 8 PTPRO ou o gene ou genes detectados pela sonda Affymetrix número: 208121_s_at, NEBL ou o gene ou genes detectados pela sonda Affymetrix número: 203962_s_at, TFFl CMAH ou o gene ou genes detectados pela sonda Affymetrix número: O gene detectado pela sonda Affymetrix No. 239994_at SPINK5 PCKl ou o gene ou genes detectados pela sonda Affymetrix número: 208383_s_at,
27. Método de acordo com qualquer uma das reivindicações de 1 a 23, caracterizado pelo fato de que os ditos dados de classificação é representativo de um subconjunto de 13 genes.
28. Método de acordo com qualquer uma das reivindicações de 1 a 27, caracterizado pelo fato de que o dito genes incluem: PRAC, CCLl 1, FRZB ou o gene ou genes detectados pela sonda Affymetrix número: 203698_s_at„ GDF 15 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_x_at, CLDN8, SEC6L1 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_x_at, GBA3 ou o gene ou genes detectados pela sonda Affymetrix número: 279954_s_at, DEFA5, SPINK5, ANPEP ou o gene ou genes detectados pela sonda Affymetrix número: 202888_s_at, e MUC 5.
29. Sistema de detecção, caracterizado pelo fato de que tem componentes para executar o método como definido em qualquer uma das reivindicações de 1 a 28.
30. Meio de armazenagem legível por computador, caracterizado pelo fato de que tem armazenado nele instruções de programa para executar o método de acordo com qualquer uma das reivindicações de 1 a 28.
31. Sistema de detecção, caracterizado pelo fato de que inclui: meios de avaliar os dados de treinamento, que inclui expressão os dados de treinamento que representam a expressão de genes nas células ou populações celulares derivada de pelo menos um intestino grosso, e origem proximal-distal os dados de treinamento que representam associações das ditas células ou célula populações com os ditos origem proximal-distals; meios para processar os dados de treinamento para gerar dados de classificação que representam um combinação linear ou não linear de níveis de expressão do dito genes, os ditos dados de classificação para gerar dados de origem proximal-distal indicativos de uma origem proximal-distal de um outra célula ou população celular tomada de um intestino grosso, com base em outros dados de expressão que representam a expressão do dito genes na dita outra célula ou população celular.
32. Método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, o dito método caracterizado pelo fato de que compreende medir a expressão de um ou mais genes selecionados de: (i) PITX2 ou o gene ou genes detectados pela sonda Affymetrix número 207558_s_at, ETNKl ou o gene ou genes detectados pela sonda Affymetrix número 222262_s_at ou 224453_s_at, FAM3B, CYP2C 18 ou o gene ou genes detectados pela sonda Affymetrix número 208126_s_at, GBA3 ou o gene ou genes detectados pela sonda Affymetrix número 219954_s_at, MEP1B, ADRA2A, HSD3B2, CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número 206754_s_at, SLC14A2 ou o gene ou genes detectados pela sonda Affymetrix número 226432_s_at, CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número 231576_s_at, DEFA5, OASL ou o gene ou genes detectados pela sonda Affymetrix número 210797_s_at, SLC37A3, REGIA, MEP 1B, NR1H4; ou (ii) DKFZp761N1114 ou o gene ou genes detectados pela sonda Affymetrix número 242374_s_at, PRAC, INSL5, HOXB13 ou WFDC2 em uma amostra de os ditos indivíduo em que um de expressão de o (i) relativo ao normal distai intestino grosso é indicativo de uma origem intestino grosso proximal e um nível de expressão mais alto de expressão dos genes do grupo (ii) relativo a níveis de controle do intestino grosso proximal normal como indicativo de um intestino grosso distai.
33. Método para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo, os ditos método caracterizado pelo fato de que compreende medir o nível de expressão de um ou mais genes selecionados de: (i) o gene ou genes detectados pela sonda Affymetrix número:218888_s_at o gene detectado pela sonda Affymetrix número: 225290_at o gene detectado pela sonda Affymetrix número: 226432_at o gene detectado pela sonda Affymetrix número: 231576_at o gene detectado pela sonda Affymetrix número: 235733_at o gene detectado pela sonda Affymetrix número: 236894_at o gene detectado pela sonda Affymetrix número: 239656_at o gene detectado pela sonda Affymetrix número: 242059_at o gene detectado pela sonda Affymetrix número: 242683_at ABHD5, FAM3B, IGFBP2, POPDC3, ADRA2A, FLJ10884, KCNGl, REGIA, APOBEC1, FLJ22761, KIF AP3, SLC14A2, C10orf45, FTHFD, LOC375295, SLC20A1, C10orf58, GCNT1, ME3, SLC23A3, CCL8, HAS3, MEP1B, SLC38A2, CLDNl 5, H0XB6, NPY6R, SLC9A3, DEF A5, HOXD4, NR1H3, TBCC5 EYA2, HSD3B2, HR1H4, ZNF493, OSTalpha, PAP, AFARPl ou o gene ou genes detectados pela sonda Affymetrix número: 202234_s_at, ANPEP ou o gene ou genes detectados pela sonda Affymetrix número 202888_s_at, CCL13 ou o gene ou genes detectados pela sonda Affymetrix número: 206407_s_at CRYLl ou o gene ou genes detectados pela sonda Affymetrix número: 220753_s_at, CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número: 206754_s_at, CYP2C18, ou o gene ou genes detectados pela sonda Affymetrix número: CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número: 214421_x_at ou 220017_x_at, EPB41L3 ou o gene ou genes detectados pela sonda Affymetrix número: 211776_s_at ETNKl ou o gene ou genes detectados pela sonda Affymetrix número: 222262_s_at ou 224453 _ s _at FAM45A ou o gene ou genes detectados pela sonda Affymetrix número: .221804_s_at ou 222955 _ s_ at FGFR2 ou o gene ou genes detectados pela sonda Affymetrix número:203639_s_at, HOXC6 ou o gene ou genes detectados pela sonda Affymetrix número:5 20685 8_s_at, HOXD3 ou o gene ou genes detectados pela sonda Affymetrix número:20660 l_s_at, ME2 ou o gene ou genes detectados pela sonda Affymetrix número:210153_s_at, MESPl ou o gene ou genes detectados pela sonda Affymetrix número:224476_s_at, MOCS 1 ou o gene ou genes detectados pela sonda Affymetrix número:213181_s_at, MSCP ou o gene ou genes detectados pela sonda Affymetrix número: (ii) o gene detectado pela sonda Affymetrix número: 230105_at o gene detectado pela sonda Affymetrix número: 230269_at o gene detectado pela sonda Affymetrix número: 238378_at o gene detectado pela sonda Affymetrix número: 239814_at o gene detectado pela sonda Affymetrix número: 239994_at o gene detectado pela sonda Affymetrix número: 240856_at o gene detectado pela sonda Affymetrix número: 242414_at o gene detectado pela sonda Affymetrix número: 244553_at ACACA, FMOD, LOC151162, SlOOP, C13orfll, FRMD3, MCF2L, SCGB2A1, C20orf56, GALNT5, MMP28, SCNN1B, CAPNl 3, GARNL4, MUCl 1, SHANK2, CLDN8, GCG, MUC12, SIAT2, COLM, GNE, MUC17, SIAT4C, CRIP1, HGD, MUC5B, SIAT7F, DNAJC12, HOXB13, NEDD4L, SIDT1, FAM3C, INSL5, PARP8, SLC13A2, FB X025, IRS1, PCDH21, SLPI, FLJ20366, ISLl, PI3, SPINK5, Fl 120989, KIAA0703, PRAC, SST KIAA0830, PRAC2 THF1, KIAA1913, PTTGIIP, TNFSF11, LAMAl, QPRT, TPHl, LGALS2, QSCN6, WFDC2, RBM24, ARF4 ou o gene ou genes detectados pela sonda Affymetrix número: 201097_s_at, BTG3 ou o gene ou genes detectados pela sonda Affymetrix número: 213134_x_at ou 205548_s_at, CHST5 ou o gene ou genes detectados pela sonda Affymetrix número: 221164_x_at ou 223942_ x_ at CMAH ou o gene ou genes detectados pela sonda Affymetrix número: 205518_s_at, CRYBA2 ou o gene ou genes detectados pela sonda Affymetrix número: 220136_s_at CTSE ou o gene ou genes detectados pela sonda Affymetrix número: 205927_s_at, DKFZp761N1114 ou o gene ou genes detectados pela sonda Affymetrix número: EPB41L4A ou o gene ou genes detectados pela sonda Affymetrix número: 228256_s_at, EPHA3 ou o gene ou genes detectados pela sonda Affymetrix número: 206070_s_at, FAS ou o gene ou genes detectados pela sonda Affymetrix número: 20478l_s_at, FER1L3 ou o gene ou genes detectados pela sonda Affymetrix número: 201798_s_at ou 211864_s_at, Fl 120152 ou o gene ou genes detectados pela sonda Affymetrix número: 218532_s_at ou 218510_x_at, FLJ23548 ou o gene ou genes detectados pela sonda Affymetrix número: 218187_s_at, FNl ou o gene ou genes detectados pela sonda Affymetrix número: 211719_s_at ou 210495 χ at ou 212464 at ou 216442 χ at FOXA2 ou o gene ou genes detectados pela sonda Affymetrix número: 210103_s_at, FRZB ou o gene ou genes detectados pela sonda Affymetrix número: 203698_s_at, GDF15 ou o gene ou genes detectados pela sonda Affymetrix número: 221577_x_at, GJB3 ou o gene ou genes detectados pela sonda Affymetrix número: 205490_s_at, HOXD13 ou o gene ou genes detectados pela sonda Affymetrix número: 207397_s_at, INSMl ou o gene ou genes detectados pela sonda Affymetrix número: 206502_s_at, MGC4170 ou o gene ou genes detectados pela sonda Affymetrix número: 212959_s_at, MLPH ou o gene ou genes detectados pela sonda Affymetrix número: 21821 l_s_at, NEBL ou o gene ou genes detectados pela sonda Affymetrix número: 203962_s_at, PLA2G2A ou o gene ou genes detectados pela sonda Affymetrix número: .203649_s_at, PTPRO ou o gene ou genes detectados pela sonda Affymetrix número: 208121_s_at, PYY ou o gene ou genes detectados pela sonda Affymetrix número: 207080_s_at ou 211253_x_at, SH3BP4 ou o gene ou genes detectados pela sonda Affymetrix número: 222258_s_at, SLC28A2 ou o gene ou genes detectados pela sonda Affymetrix número: 207249_s_at, SLC2A10 ou o gene ou genes detectados pela sonda Affymetrix número: 221024_s_at, SPONl ou o gene ou genes detectados pela sonda Affymetrix número: 213994_s_atou209437_s_at, STS OU o gene ou genes detectados pela sonda Affymetrix número: 203769_s_at TM4SF11 ou o gene ou genes detectados pela sonda Affymetrix número: 204519_s_at, TUSC3 ou o gene ou genes detectados pela sonda Affymetrix número: 213432_s_at ou 209228_x_at, em uma amostra biológica de os ditos indivíduo em que um de expressão de normal distai intestino grosso é indicativos de um proximal intestino grosso e um expressão de o genes (ii) relativa ao intestino grosso proximal normal é indicativo de uma origem de intestino grosso distai.
34. Método de acordo com a reivindicação 32 ou 33 caracterizado pelo fato de que a dita região proximal compreende o ceco e o cólon ascendente.
35. Método de acordo com a reivindicação 33 caracterizado pelo fato de que os ditos região distai compreende, cólon descendente, flexão sigmóide e reto.
36. Método de acordo com a reivindicação 32 ou 33, 34 ou 35 caracterizado pelo fato de que o dito gene é ETNKl.
37. Método de acordo com a reivindicação 32 ou 33 ou 34 ou 35 caracterizado pelo fato de que o dito gene é GB A3.
38. Método de acordo com a reivindicação 32 ou 33 ou 34 ou 35, caracterizado pelo fato de que o dito gene é PRAC.
39. Método de acordo com qualquer uma das reivindicações de 32 a 38 caracterizado pelo fato de que a dita amostra biológica é uma amostra fecal, lavagem de enema, ressecção cirúrgica ou biópsia de tecido.
40. Arranjo de ácido nucleico, caracterizado pelo fato de que compreende uma pluralidade de: (i) moléculas de ácido nucleico que compreende uma seqüência de nucleotídeo que corresponde a qualquer uma das locação de genes marcadores listados na reivindicação 33 ou uma seqüência exibindo pelo menos 80% de identidade ou um derivado funcional, fragmento, variante ou homólogo das ditas moléculas de ácido nucleico; ou (ii) moléculas de ácido nucleico que compreende um seqüência de nu capaz de hibridizar a qualquer seqüência de (i) sob condições de severidade baixa a 42°C, fragmento, variante ou homólogo as ditas moléculas de ácido nucleico (iii) sondas de ácido nucleico ou oligonucleotídeos que compreendem uma seqüência de nucleotídeo capaz de hibridizar a 42°C ou um derivado funcional, fragmento, variante ou homólogo das ditas moléculas de ácido nucleico em que o nível de expressão dos ditos ácido nucleico é indicativos da origem proximal-distal de uma célula ou subpopulação celular derivada do intestino grosso.
41. Arranjo de acordo com a reivindicação 40, caracterizado pelo fato de que os ditos marcadores de localização são os marcadores listados nas reivindicações 32 ou 33.
42. Arranjo de ácido nucleico, caracterizado pelo fato de que compreende uma pluralidade de: (i) moléculas de ácido nucleico que compreende uma seqüência de nucleotídeo que corresponde a qualquer uma das locação de genes marcadores listados na reivindicação 33 ou uma seqüência exibindo pelo menos 80% de identidade ou um derivado funcional, fragmento, variante ou homólogo das ditas moléculas de ácido nucleico; ou (ii) moléculas de ácido nucleico que compreende um seqüência de nu capaz de hibridizar a qualquer seqüência de (i) sob condições de severidade baixa a 42°C, fragmento, variante ou homólogo as ditas moléculas de ácido nucleico (iii) sondas de ácido nucleico ou oligonucleotídeos que compreendem uma seqüência de nucleotídeo capaz de hibridizar a 42°C ou um derivado funcional, fragmento, variante ou homólogo das ditas moléculas de ácido nucleico em que o nível de expressão dos ditos ácido nucleico é indicativos da origem proximal-distal de uma célula ou subpopulação celular derivada do intestino grosso.
43. Arranjo de acordo com qualquer uma das reivindicações de 40 a 42 caracterizado pelo fato de que o dito arranjo é usado no método como definido em qualquer uma das reivindicações de 32 a 39.
44. Uso de um arranjo como definido em qualquer uma das reivindicações de 40 a 42, caracterizado pelo fato de ser para determinar a origem anatômica de uma célula ou população celular derivada do intestino grosso de um indivíduo.
45. Método de acordo com a reivindicação 23, caracterizado pelo fato de que os ditos genes são selecionados de: PITX2 ou o gene ou genes detectados pela sonda Affymetrix número 207558_s_at, ETNKl ou o gene ou genes detectados pela sonda Affymetrix número 222262_s_at ou 224453_s_at, FAM3B, CYP2C 18 ou o gene ou genes detectados pela sonda Affymetrix número 208126_s_at, GBA3 ou o gene ou genes detectados pela sonda Affymetrix número 219954_s_at, MEP1B, ADRA2A, HSD3B2, CYP2B6 ou o gene ou genes detectados pela sonda Affymetrix número 206754_s_at, SLC 14A2 ou o gene ou genes detectados pela sonda Affymetrix número 226432_s_at, CYP2C9 ou o gene ou genes detectados pela sonda Affymetrix número 231576_s_at, DEFA5, OASL ou o gene ou genes detectados pela sonda Affymetrix número 210797_s_at, SLC37A3, REGIA, ΜΕΡΙ Β, NR1H4; ou DKFZp761N1114 ou o gene ou genes detectados pela sonda Affymetrix número 242374_s_at, PRAC, INSL5, HOXB13 ou WFDC2
46. Método de acordo com qualquer uma das reivindicações de1 a 39 ou 45, caracterizado pelo fato de que os ditos níveis de expressão é a expressão de proteína.
47. Método de acordo com qualquer uma das reivindicações de1 a 39 ou 45, caracterizado pelo fato de que os ditos níveis de expressão é expressão de mRNA.
48. Método para determinar o início ou predisposição para o início de uma anormalidade celular ou uma condição distinguida por uma anormalidade celular no intestino grosso, o dito método caracterizado pelo fato de que compreende determinar, com o método de acordo com qualquer uma das reivindicações de 1 a 39 ou 45 a 47, o perfil de expressão de gene proximal-distal de uma amostra biológica derivada de uma origem proximal ou distai no intestino grosso em que a detecção proximal-distal intestino grosso é indicativo da célula ou população celular expressando os ditos perfis.
49. Kit de diagnóstico para ensaiar amostras biológicas, caracterizado pelo fato de que compreende um agente para detectar um ou mais marcadores proximal-distal e reagentes úteis para facilitar a detecção pelos ditos agentes.
50. Kit de acordo com a reivindicação 49, caracterizado pelo fato de que é usado o método de acordo com qualquer uma das reivindicações de 1 a 39 ou 45 a 47.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US80231206P | 2006-05-22 | 2006-05-22 | |
| US60/802312 | 2006-05-22 | ||
| PCT/AU2007/000703 WO2007134395A1 (en) | 2006-05-22 | 2007-05-22 | Detection method |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| BRPI0713098A2 true BRPI0713098A2 (pt) | 2012-10-16 |
Family
ID=38722870
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| BRPI0713098-8A BRPI0713098A2 (pt) | 2006-05-22 | 2007-05-22 | método para determinar a origem anatÈmica de uma célula ou população celular derivada do intestino grosso de um indivìduo, método de detecção para determinar a origem anatÈmica de uma célula ou população celular derivada do intestino grosso de um indivìduo, sistema de detecção, meio de armazenagem legìvel por computador, arranjo de ácido nucleico, uso de um arranjo, método para determinar o inìcio ou predisposição para o inìcio de uma anormalidade celular ou uma condição destinguida por uma anormalidade celular no intestino grosso, kit de diagnóstico para ensaiar amostras biológicas |
Country Status (10)
| Country | Link |
|---|---|
| US (2) | US20090325810A1 (pt) |
| EP (2) | EP2767595B1 (pt) |
| JP (1) | JP2010527577A (pt) |
| CN (1) | CN101506379A (pt) |
| AU (1) | AU2007252306B2 (pt) |
| BR (1) | BRPI0713098A2 (pt) |
| NZ (1) | NZ573190A (pt) |
| RU (1) | RU2008150483A (pt) |
| WO (1) | WO2007134395A1 (pt) |
| ZA (1) | ZA200810140B (pt) |
Families Citing this family (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101344519B (zh) * | 2008-08-21 | 2012-08-22 | 上海交通大学 | 用于优化结直肠癌诊断的肿瘤标志物多分割点设置系统 |
| AU2010323235B2 (en) * | 2009-11-26 | 2013-05-23 | F. Hoffmann-La Roche Ag | Marker protein for type 2 diabetes |
| EP2533796A4 (en) | 2010-02-12 | 2013-12-04 | Ngm Biopharmaceuticals Inc | METHOD FOR THE TREATMENT OF GLUCOSE TISSUE CHANGES |
| WO2012054975A1 (en) | 2010-10-28 | 2012-05-03 | Clinical Genomics Pty. Ltd. | Method of microvesicle enrichment |
| BR112014028122B1 (pt) | 2012-05-11 | 2022-08-23 | Commonwealth Scientific And Industrial Research Organisation | Método para triar o princípio ou a predisposição ao princípio de neoplasma no intestino grosso ou para monitorar neoplasma no intestino grosso em indivíduo |
| CA2906830C (en) | 2013-03-15 | 2021-07-06 | Protagonist Therapeutics, Inc. | Hepcidin analogues and uses therof |
| SI3143037T1 (sl) | 2014-05-16 | 2021-11-30 | Protagonist Therapeutics, Inc. | Antagonisti integrin alpha4beta7 tioeterskih peptidov |
| EP4378536A3 (en) | 2014-07-17 | 2024-10-09 | Protagonist Therapeutics, Inc. | Oral peptide inhibitors of interleukin-23 receptor and their use to treat inflammatory bowel diseases |
| MX376755B (es) * | 2014-08-01 | 2025-03-07 | Ariosa Diagnostics Inc | Detección de ácidos nucleicos diana mediante el uso de hibridación. |
| CN105044360A (zh) * | 2015-07-22 | 2015-11-11 | 浙江大学医学院附属邵逸夫医院 | Rbp4作为结直肠癌血清标记物的应用及诊断试剂盒 |
| US20190002503A1 (en) | 2015-12-30 | 2019-01-03 | Protagonist Therapeutics, Inc. | Analogues of hepcidin mimetics with improved in vivo half lives |
| CN105938521A (zh) * | 2016-07-04 | 2016-09-14 | 苏州大学附属儿童医院 | 一种强直性脊柱炎预警模型建立方法及装置 |
| US20200064357A1 (en) * | 2016-11-09 | 2020-02-27 | Protagonist Therapeutics, Inc. | Methods for determining and monitoring gastrointestinal inflammation |
| US11468559B2 (en) | 2017-04-25 | 2022-10-11 | The University Of Chicago | Cellular analysis |
| US11450121B2 (en) * | 2017-06-27 | 2022-09-20 | The Regents Of The University Of California | Label-free digital brightfield analysis of nucleic acid amplification |
| US10636512B2 (en) | 2017-07-14 | 2020-04-28 | Cofactor Genomics, Inc. | Immuno-oncology applications using next generation sequencing |
| CN108179192A (zh) * | 2018-02-06 | 2018-06-19 | 徐州医科大学 | 一种基因多态性变异位点早期诊断子宫内膜癌的试剂盒 |
| US11753443B2 (en) | 2018-02-08 | 2023-09-12 | Protagonist Therapeutics, Inc. | Conjugated hepcidin mimetics |
| CN108490178B (zh) * | 2018-02-13 | 2019-08-30 | 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) | 用于npc诊断及预后预测的标志物及其应用 |
| WO2019200398A1 (en) * | 2018-04-13 | 2019-10-17 | Dana-Farber Cancer Institute, Inc. | Ultra-sensitive detection of cancer by algorithmic analysis |
| TW202019948A (zh) | 2018-07-12 | 2020-06-01 | 美商領導醫療有限公司 | 介白素-23受體之肽抑制劑及其治療發炎疾病之用途 |
| CN110055338B (zh) * | 2019-04-11 | 2023-09-05 | 珠海铂华生物工程有限公司 | 一种弥漫性大b细胞淋巴瘤基因突变检测试剂盒 |
| CN110456072A (zh) * | 2019-08-15 | 2019-11-15 | 深圳市盛波尔生命科学技术有限责任公司 | 胰岛再生原蛋白1α的应用及其检测方法 |
| JP2023511551A (ja) | 2020-01-15 | 2023-03-20 | ヤンセン バイオテツク,インコーポレーテツド | インターロイキン23受容体のペプチド阻害剤及び炎症性疾患を治療するためのその使用 |
| MX2023005994A (es) | 2020-11-20 | 2023-08-11 | Janssen Pharmaceutica Nv | Composiciones de inhibidores peptidicos del receptor de interleucina-23. |
Family Cites Families (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4868105A (en) | 1985-12-11 | 1989-09-19 | Chiron Corporation | Solution phase nucleic acid sandwich assay |
| US5700637A (en) | 1988-05-03 | 1997-12-23 | Isis Innovation Limited | Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays |
| US6040138A (en) | 1995-09-15 | 2000-03-21 | Affymetrix, Inc. | Expression monitoring by hybridization to high density oligonucleotide arrays |
| US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
| US5470967A (en) | 1990-04-10 | 1995-11-28 | The Dupont Merck Pharmaceutical Company | Oligonucleotide analogs with sulfamate linkages |
| US5714331A (en) | 1991-05-24 | 1998-02-03 | Buchardt, Deceased; Ole | Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility |
| US5419966A (en) | 1991-06-10 | 1995-05-30 | Microprobe Corporation | Solid support for synthesis of 3'-tailed oligonucleotides |
| US5384261A (en) | 1991-11-22 | 1995-01-24 | Affymax Technologies N.V. | Very large scale immobilized polymer synthesis using mechanically directed flow paths |
| US5837832A (en) | 1993-06-25 | 1998-11-17 | Affymetrix, Inc. | Arrays of nucleic acid probes on biological chips |
| US6015880A (en) | 1994-03-16 | 2000-01-18 | California Institute Of Technology | Method and substrate for performing multiple sequential reactions on a matrix |
| US5807522A (en) | 1994-06-17 | 1998-09-15 | The Board Of Trustees Of The Leland Stanford Junior University | Methods for fabricating microarrays of biological samples |
| ES2548381T3 (es) * | 2000-03-27 | 2015-10-16 | Thomas Jefferson University | Composiciones para el tratamiento e imágenes de células de cáncer estomacales y de esófago |
| EP1410035A2 (en) * | 2000-12-08 | 2004-04-21 | EOS Biotechnology, Inc. | Methods of diagnosing colorectal cancer and/or breast cancer, compositions, and methods of screening for colorectal cancer and/or breast cancer modulators |
| WO2004081564A1 (en) * | 2003-03-14 | 2004-09-23 | Peter Maccallum Cancer Institute | Expression profiling of tumours |
-
2007
- 2007-05-22 BR BRPI0713098-8A patent/BRPI0713098A2/pt not_active Application Discontinuation
- 2007-05-22 CN CNA2007800278087A patent/CN101506379A/zh active Pending
- 2007-05-22 WO PCT/AU2007/000703 patent/WO2007134395A1/en not_active Ceased
- 2007-05-22 AU AU2007252306A patent/AU2007252306B2/en active Active
- 2007-05-22 RU RU2008150483/13A patent/RU2008150483A/ru not_active Application Discontinuation
- 2007-05-22 EP EP13161597.3A patent/EP2767595B1/en active Active
- 2007-05-22 NZ NZ573190A patent/NZ573190A/en not_active IP Right Cessation
- 2007-05-22 JP JP2009511302A patent/JP2010527577A/ja not_active Withdrawn
- 2007-05-22 EP EP07718949A patent/EP2024509A4/en not_active Withdrawn
- 2007-05-22 US US12/301,949 patent/US20090325810A1/en not_active Abandoned
-
2008
- 2008-11-28 ZA ZA2008/10140A patent/ZA200810140B/en unknown
-
2017
- 2017-02-22 US US15/439,453 patent/US20170260585A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| EP2767595A1 (en) | 2014-08-20 |
| US20170260585A1 (en) | 2017-09-14 |
| EP2024509A1 (en) | 2009-02-18 |
| JP2010527577A (ja) | 2010-08-19 |
| ZA200810140B (en) | 2009-12-30 |
| WO2007134395A1 (en) | 2007-11-29 |
| EP2024509A4 (en) | 2010-08-04 |
| AU2007252306A1 (en) | 2007-11-29 |
| CN101506379A (zh) | 2009-08-12 |
| EP2767595B1 (en) | 2018-09-19 |
| AU2007252306B2 (en) | 2013-10-17 |
| US20090325810A1 (en) | 2009-12-31 |
| NZ573190A (en) | 2012-03-30 |
| RU2008150483A (ru) | 2010-06-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| BRPI0713098A2 (pt) | método para determinar a origem anatÈmica de uma célula ou população celular derivada do intestino grosso de um indivìduo, método de detecção para determinar a origem anatÈmica de uma célula ou população celular derivada do intestino grosso de um indivìduo, sistema de detecção, meio de armazenagem legìvel por computador, arranjo de ácido nucleico, uso de um arranjo, método para determinar o inìcio ou predisposição para o inìcio de uma anormalidade celular ou uma condição destinguida por uma anormalidade celular no intestino grosso, kit de diagnóstico para ensaiar amostras biológicas | |
| US20230272476A1 (en) | Nano46 genes and methods to predict breast cancer outcome | |
| US11549148B2 (en) | Neuroendocrine tumors | |
| Lee et al. | A novel prognostic subtype of human hepatocellular carcinoma derived from hepatic progenitor cells | |
| ES2656487T3 (es) | Evaluación de la respuesta a la terapia de neoplasmas neuroendocrinos gastroenteropancreáticas (GEP-NEN) | |
| ES3027507T3 (en) | Method to use gene expression to determine likelihood of clinical outcome of renal cancer | |
| Sumazin et al. | Hepatoblastomas with carcinoma features represent a biological spectrum of aggressive neoplasms in children and young adults | |
| ES2492498T3 (es) | Panel de biomarcadores para el diagnóstico y la predicción de rechazo de injerto | |
| TWI582236B (zh) | 黑色素癌之預後預測 | |
| JP4435259B2 (ja) | 微量胃癌細胞の検出法 | |
| US20140040264A1 (en) | Method for estimation of information flow in biological networks | |
| WO2015073949A1 (en) | Method of subtyping high-grade bladder cancer and uses thereof | |
| CA2939539A1 (en) | Prostate cancer survival and recurrence | |
| CN102089443A (zh) | 用于测定受试者中结肠直肠癌的概率的方法和装置 | |
| US20130345077A1 (en) | Diagnosis of lymph node involvement in rectal cancer | |
| CA2504403A1 (en) | Prognostic for hematological malignancy | |
| CN103687963A (zh) | 利用与转移相关的多基因标签来确定肝细胞癌的预后的方法 | |
| BR112020012280A2 (pt) | composições e métodos para diagnosticar cânceres de pulmão usando perfis de expressão de gene | |
| WO2013172947A1 (en) | Method and system for predicting recurrence and non-recurrence of melanoma using sentinel lymph node biomarkers | |
| JP4317854B2 (ja) | 微量胃癌細胞の検出法 | |
| CN117355616A (zh) | 用于肝细胞癌的dna甲基化生物标志物 | |
| JP2014518086A (ja) | 腫瘍起源の決定 | |
| US12595516B2 (en) | Neuroendocrine tumors | |
| WO2025217467A1 (en) | Occult blood mrna biomarkers paired with dna/rna mutations and dna methylation | |
| WO2025080943A1 (en) | Compositions and methods for fecal occult blood test in diagnosing gastrointestinal disease |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| B11A | Dismissal acc. art.33 of ipl - examination not requested within 36 months of filing | ||
| B11Y | Definitive dismissal - extension of time limit for request of examination expired [chapter 11.1.1 patent gazette] |