TITRE
Combinaison de biomarqueurs pour le pronostic d' une réponse ou non-réponse à un traitement anti-VHC
DOMAINE DE L'INVENTION
La demande est relative à des moyens qui permettent d'établir un pronostic de forte probabilité de réponse ou de non-réponse à un traitement anti- Virus de l'Hépatite C (VHC). De manière avantageuse, les moyens de l'invention permettent d'établir ce pronostic avant que le traitement anti-VHC n'ait même débuté.
ARRIÈRE-PLAN DE L'INVENTION
Une infection par le virus de l'hépatite C (VHC) conduit, dans la grande majorité des cas, à une hépatite C chronique. L'hépatite C chronique peut évoluer vers une cirrhose hépatique, avec des complications d'hypertension portale, et vers un carcinome hépatocellulaire. Un des objectifs du traitement contre une infection par VHC, plus particulièrement contre l'hépatite C chronique, est de parvenir à ce que les atteintes tissulaires du foie induites par l'infection virale régressent, voire soient éliminées, ou à tout le moins qu'elles ne progressent pas. Ceci permet notamment de diminuer ou d'éliminer le risque de survenue de complications et de carcinome hépatocellulaire. Les traitements actuellement disponibles pour répondre à cet objectif sont des traitements, qui visent à éradiquer le virus. Ces traitements doivent dans un premier temps induire une diminution significative de la charge virale en VHC, de sorte à pouvoir atteindre un niveau indétectable en fin de traitement. Les traitements anti-VHC actuels comprennent l'administration d'une combinaison d'interféron pégylé et de ribavirine. La durée de ces traitements est longue : ils sont généralement administrés sur une durée qui est d'au moins 24 semaines et qui peut aller jusqu'à 48 semaines voire plus. Or, les traitements anti-VHC entraînent des effets secondaires majeurs pour le patient.
Concernant l'interféron, les effets secondaires sont fréquents et nombreux. L'effet secondaire le plus fréquent est le syndrome pseudo-grippal (fièvre, arthralgies, céphalées, frissons). Les autres effets secondaires possibles sont : une asthénie, un amaigrissement, une perte modérée de cheveux, des troubles du sommeil, des troubles de l'humeur avec une irritabilité qui peut avoir des répercussions dans la vie quotidienne, des difficultés de concentration et une sécheresse cutanée. Certains effets secondaires rares peuvent être graves et doivent être anticipés comme les troubles psychiatriques. Une dépression peut
survenir dans environ 10 % des cas. Celle ci doit être dépistée et traitée car elle peut avoir des conséquences graves (tentative de suicide). Une dysthyroïdie peut se déclarer. Le traitement par interféron est en outre contre-indiqué pendant la grossesse.
Concernant la ribavirine, le principal effet secondaire est l'anémie hémolytique. Une anémie conduit à un arrêt du traitement dans environ 5 % des cas. Une décompensation d'une coronaropathie ou d'une cardiopathie sous jacente, liée à l'anémie, peut survenir. Une neutropénie est observée chez environ 20% des malades recevant l'association interféron pégylé et ribavirine, et représente la cause majeure de réduction de la dose d' interféron pégylé. Le coût de ces traitements est également très élevé.
Pouvoir prédire, avant d'avoir même commencé à administrer le traitement anti-VHC, si un patient donné va ou non répondre au traitement est donc d'une importance clinique et économique majeure.
La recherche de tels moyens de prédiction a conduit à analyser différents facteurs cliniques, biologiques et viraux.
Certains facteurs cliniques propres au patient, tels que l'âge, le poids, l'ethnie et le score de fibrose hépatique, sont connus pour influencer l'efficacité du traitement anti-VHC. Par exemple, le taux de patients répondant au traitement anti-VHC est plus faible parmi les patients dont le score de fibrose hépatique est F3 ou F4, par rapport à ceux dont le score de fibrose hépatique est Fl ou F2 (scores selon le système de scores F Metavir). En eux-mêmes, ces facteurs cliniques ne permettent néanmoins pas de prédire de manière fiable, avant démarrage du traitement, si un patient donné va ou non répondre à un traitement anti-VHC. En eux-mêmes, ces facteurs ne sont donc pas de bons indicateurs pronostiques pré-thérapeutiques.
Pour tenter de prédire, avant éventuelle administration du traitement, si un patient va ou non répondre à un traitement anti-VHC, ce sont des facteurs viraux qui sont actuellement utilisés.
Il a en effet été constaté que les patients qui sont infectés par un VHC de génotype 2 ou 3 répondent mieux au traitement anti-VHC que ceux qui sont infectés par un VHC de génotype 5 ou 6, qui eux-mêmes répondent mieux au traitement anti-VHC que ceux qui sont infectés par un VHC de génotype 1 ou 4. Toutefois, la distribution des différents génotypes n'est pas homogène selon les localisations géographiques, et la seule détection du génotype viral n'apporte donc pas une solution prédictive applicable à l'ensemble des patients. Il existe en outre des différences entre les sous-types viraux. De fait, la connaissance de la nature du génotype viral permet essentiellement d'ajuster la posologie
et/ou la durée du traitement, mais ne permet pas en soi d'établir un pronostic fiable avant démarrage du traitement.
Diverses combinaisons de facteurs biologiques et/ou cliniques et/ou viraux ont par ailleurs été testées, pour tenter de prédire, avant éventuelle administration du traitement, si un patient va ou non répondre à un traitement anti-VHC. Mais les combinaisons qui ont jusqu'ici été testées n'atteignent pas des performances satisfaisantes de prédiction.
Par exemple, Hidetsugu Saito et al. 2010 sont parvenus à identifier des combinaisons de facteurs biologiques, cliniques et viraux dont les performances de prédiction sont fiables lorsqu'elles sont appliquées en cours de traitement, mais n'en sont pas pour autant parvenus à établir une combinaison qui soit suffisamment fiable lorsqu'elle est appliquée avant démarrage du traitement anti-VHC.
Chen et al. 2005 et Chen et al. 2010 ont proposé une signature transcriptomique pour prédire, avant qu'un traitement anti-VHC ne soit administré, si un patient va être répondeur ou non-répondeur à ce traitement. Cette signature combine les niveaux d'expression de dix-huit gènes (G1P2, OAS2, G1P3, OAS3, RPLP2, CEB1, IFIT1, VIPERIN, RPS28, PI3KAP1, MX1, DUSP1, ATF5, LAP3, USP18, LGP1, ETEF1, STXBP5).
En outre, au moins deux de ces gènes codent pour des protéines qui sont exclusivement membranaires (G1P3 et VIPERIN) ; le produit de leur expression ne peut donc pas être détecté dans le sang circulant.
Asselah et al. 2008 ont analysé le niveau d'expression de cinquante-huit gènes avant application du traitement anti-VHC chez quarante patients atteints d'hépatite C chronique, parmi lesquels quatorze d'entre eux sont non-répondeurs au traitement anti-VHC. Ils ont ainsi identifié deux signatures susceptibles de permettre de prédire, avant qu'un traitement anti-VHC ne soit administré, si un patient va être non-répondeur à ce traitement.
La première signature est basée sur les niveaux d'expression de deux gènes, à savoir IFI27 et CXCL9, qui sont analysés selon la méthode KNN (méthode k-nearest neighbour).
La deuxième signature est basée sur les niveaux d'expression de trois gènes, à savoir IFI27, CXCL9 et IFI-6-16, qui sont analysés selon la méthode WV (méthode weighted voting). Pour chacune de ces deux signatures, Asselah et al. 2008 indiquent que le fait d'ajouter des gènes supplémentaires ne permet pas d'améliorer l'exactitude de la classification.
Il existe donc toujours un besoin pour des moyens qui permettraient de pronostiquer, avant que l'on ait seulement commencé à administrer le traitement anti-VHC, si le patient a une
forte probabilité de répondre, ou au contraire, une forte probabilité de ne pas répondre au traitement.
RÉSUMÉ DE L'INVENTION
La demande est relative à des moyens qui permettent d'établir un pronostic de forte probabilité de réponse ou de non-réponse à un traitement anti-VHC.
De manière avantageuse, les moyens de l'invention permettent d'établir ce pronostic avant que le traitement anti-VHC n'ait même débuté.
Les inventeurs ont identifié des gènes dont les niveaux d'expression sont des biomarqueurs pronostiques de la réponse ou de la non-réponse au traitement anti-VHC. Plus particulièrement, les inventeurs proposent d'établir le profil d'expression de ces gènes, et d'utiliser ce profil à titre de signature pronostique de la réponse ou non-réponse au traitement anti-VHC.
La demande fournit des moyens qui sont spécialement adaptés à cet effet. Les moyens de l'invention mettent notamment en œuvre le dosage ou la mesure des niveaux d'expression de gènes choisis, lesdits gènes choisis étant choisis parmi la liste de gènes suivants :
HERC5, IL8, STAT2, CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18.
Plus particulièrement, lesdits gènes choisis comprennent :
au moins deux gènes parmi HERC5, IL8, STAT2 ; et
- au moins un gène parmi CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18.
Optionnellement, les moyens de l'invention peuvent en outre mettre en œuvre le dosage ou la mesure d'un ou plusieurs autres facteurs cliniques et/ou d'un ou plusieurs autres facteurs virologiques et/ou d'un ou plusieurs autres facteurs biologiques.
Les moyens de l'invention comprennent notamment :
des méthodes qui comprennent le dosage ou la mesure des niveaux d'expression de gènes choisis ;
des produits ou réactifs qui sont spécialement adaptés au dosage ou à la mesure de ces niveaux d'expression de gènes ;
des articles manufacturés, des compositions, des compositions pharmaceutiques, des kits, des tubes, des supports solides comprenant de tels produits ou réactifs, ainsi que
des systèmes informatiques (notamment, produit programme d'ordinateur et dispositif informatique), qui sont spécialement adaptés à la mise en œuvre des moyens de l'invention.
DESCRIPTION DÉTAILLÉE DE L'INVENTION
Le stade d'atteinte tissulaire du foie, plus particulièrement la nature et l'étendue des lésions tissulaires hépatiques, est évalué par un score de fibrose hépatique, notamment par le système de score F Metavir, qui comprend cinq stades de F0 à F4.
Lorsque le score de fibrose hépatique est d'au plus Fl, le praticien peut éventuellement décider de ne pas administrer de traitement anti-VHC, alors que, lorsque le score est d'au moins F2, il est actuellement préconisé d'administrer un traitement anti-VHC, et cela quelque soit le degré d'activité nécrotico-inflammatoire.
Comme les traitements anti-VHC sont de très longue durée (généralement de 6 à 12 mois, voire plus), ils induisent des effets secondaires particulièrement graves, et sont très coûteux, la présente demande propose des moyens qui sont destinés à aider à la décision d'administrer ou de ne pas administrer de traitement anti-VHC.
Les moyens de l'invention permettent un pronostic de forte probabilité de réponse ou de non-réponse au traitement anti-VHC. De manière avantageuse, les moyens de l'invention permettent d'établir ce pronostic avant que ce traitement n'ait même débuté.
Les moyens de l'invention comprennent la mesure ou le dosage des niveaux d'expression de gènes choisis. Ils concernent les sujets qui sont infectés par un ou plusieurs virus de l'hépatite, dont au moins un VHC, et plus particulièrement ceux de ces sujets qui présentent un score de fibrose hépatique d'au moins Fl, plus particulièrement d'au moins F2 selon le système de score F Metavir.
Dans la demande, à moins que cela ne soit autrement spécifié, ou que le contexte n'en dicte autrement, tous les termes ont leur sens habituel dans le(s) domaine(s) concerné(s). L'expression « traitement anti-VHC », « traitement de l'hépatite C », ou une expression équivalente, ou, par voie de raccourci, le terme « traitement », signifie un traitement à visée thérapeutique, qui est destiné à induire une diminution de la charge en VHC du patient, de sorte à pouvoir atteindre, en fin de traitement, un niveau indétectable de charge en VHC, voire une éradication du ou des VHC. D'un point de vue clinique, le but
thérapeutique souhaité est notamment de stopper, faire régresser, voire d'éliminer les lésions tissulaires du foie, c'est-à-dire, à tout le moins, d'empêcher que le score de fibrose hépatique n'augmente, voire de permettre que ce score diminue, de préférence qu'il diminue jusqu'à un score d'au plus Fl .
Le traitement anti-VHC comprend au moins l'administration d'interféron, plus particulièrement d'interféron alpha, notamment d'interféron alpha-2a ou d'interféron alpha-2b, ou d'une pro-drogue de l'interféron.
Cet interféron est généralement une version produite par ingénierie génétique de la cytokine humaine naturelle. Cet interféron peut néanmoins être un interféron qui dérive de cellules d'ovaires de hamster chinois (cellules CHO), tel que l'interféron oméga (par exemple, l'interféron oméga qui est disponible auprès de Intarcia Therapeutics, Hayward, Californie, USA).
Cet interféron peut notamment être lié à d'autres composés, groupements ou molécules chimiques, notamment à du polyéthylène glycol (par exemple, le PEG-INTRON® commercialisé par Schering Plough Corporation, Kenilworth, New Jersey, USA, ou le PEGASYS® commercialisé par F. Hoffmann-La Roche Ltd. ; Basel, Suisse).
La forme pégylée de l'interféron a une durée de vie plus longue dans le corps humain, ce qui permet de limiter le rythme d'administration à une seule administration par semaine (en l'occurrence, à une seule injection par semaine), au lieu de trois administrations par semaine pour la forme non pégylée.
La forme pégylée de l'interféron est donc actuellement la forme préférée d'interféron. Un interféron pégylé peut par exemple être administré :
à une dose d'environ 1,5 g/kg/semaine pour l'interféron alpha-2b pégylé (tel que le PEG-INTRON®),
- à une concentration de 180 g/kg/semaine pour l'interféron alpha-2a pégylé (tel que le PEGASYS®).
En sus de l'interféron, un traitement anti-VHC comprend généralement l'administration d'au moins un autre agent antiviral.
En sus de l'interféron, le traitement anti-VHC actuel comprend généralement l'administration de ribavirine.
La ribavirine est un analogue nucléosidique de la guanosine.
Dans le cadre de la demande, et selon un mode particulier de l'invention, le traitement anti-VHC comprend l'administration d'interféron et l'administration de :
- ribavirine (par exemple, la ribavirine REBETOL® commercialisée par Plough Corporation, Kenilworth, New Jersey, USA, ou la ribavirine COPEGUS® commercialisée par Roche Corporation ; F. Hoffmann-La Roche Ltd. ; Basel, Suisse), ou
- d'un analogue de la ribavirine, ou
- d'une pro-drogue de la ribavirine ou d'un des ses analogues.
Les pro-drogues de la ribavirine comprennent notamment la taribavirin (par exemple, la taribavirin qui est disponible auprès de Valeant, Aliso Viejo, Californie, USA).
L'administration de la ribavirine est généralement journalière.
La ribavirine peut par exemple être administrée à raison de 800 à 1200 mg/kg/jour.
Un traitement anti-VHC peut par exemple comprendre l'administration de :
d'interféron alpha-2b pégylé (tel que PEG-INTRON®) à une dose d'environ 1,5 g/kg/semaine, et de ribavirine à une dose de 800 à 1 200 mg/kg/jour (si l'hépatopathie implique un VHC de génotype 2 ou 3, une dose d'environ 800 mg/kg/jour est généralement conseillée), ou
- d'interféron alpha-2a pégylé (tel que PEGASYS®) à une concentration de 180 g/kg/semaine et de ribavirine à raison de 1000 à 1200 mg/kg/jour.
En sus de l'interféron, ou de l'interféron et de la ribavirine, le traitement anti-VHC traitement peut en outre comprendre l'administration d'au moins un autre agent antiviral générique ou spécifique du VHC, tel que :
- au moins un inhibiteur de protéase de VHC, tel qu'un inhibiteur de la protéase NS3, et/ou
au moins un inhibiteur de la polymérase du VHC, tel qu'un inhibiteur de la polymérase NS5B,
plus particulièrement au moins un inhibiteur de protéase de VHC, tel qu'un inhibiteur de la protéase NS3.
Ledit inhibiteur de la protéase NS3 peut par exemple être le telaprevir (VX-950 ; Vertex, Cambridge, Massachusetts, USA) ou le boceprevir (SCH-503034 ; Schering-Plough, Kenilworth, New Jersey, USA). La combinaison d'interféron (ou d'un analogue ou d'une pro-drogue de l'interféron), de ribavirine (ou d'un analogue ou d'une pro-drogue de la ribavirine) et d'un inhibiteur de protéase de VHC, tel que le telaprevir ou le boceprevir (ou d'un analogue ou d'une pro-drogue de cet inhibiteur de protéase), est une trithérapie qui est notamment envisagée pour le traitement des patients qui sont infectés par au moins un VHC de génotype 1 ou 4.
Ledit inhibiteur de la polymérase NS5B peut par exemple être un analogue nucléosidique tel que R1479, ou sa pro-drogue le R1626 (Roche, Basel, Suisse), ou l'analogue nucléosidique PSI-6130, ou sa pro-drogue le R7128 (Pharmasset, Princeton, NJ ; U.S. A. ; Roche, Basel, Suisse).
En sus du ou des agents anti-viraux, le traitement anti-VHC peut en outre comprendre l'administration d'au moins un autre produit, sans activité anti-virale directe, tel qu'un adjuvant de médication, par exemple une hormone qui stimule la production d'érythrocytes et/ou de leucocytes, tel que l'érythropoïétine (EPO).
La durée du traitement anti-VHC est généralement d'au moins 24 semaines environ, très généralement d'environ 24 à 48 semaines, mais parfois plus. Par exemple, elle peut être :
- d'environ 24 semaines pour une hépatopathie à VHC de génotype 2 ou 3,
- d'environ 48 semaines pour une hépatopathie à VHC de génotype 1, 4 ou 5, ou pour un patient non-répondeur au traitement au bout de 24 semaines.
Les expressions « répondeur » ou « non-répondeur » sont entendues conformément à leur sens habituel dans le domaine médical. L'expression « répondeur » ou « non-répondeur » s'entend comme « répondeur au traitement anti-VHC » ou « non-répondeur au traitement anti-VHC », respectivement.
Il est considéré qu'un sujet est :
- un sujet répondeur au traitement (patient classé R), lorsque la charge virale de VHC est devenue indétectable dans le sang du patient à l'issue d'un traitement anti-VHC associant administration d'interféron et administration de ribavirine (ou d'une prodrogue ou d'un analogue de ces principes actifs), et que cette charge virale reste indétectable 6 mois après l'arrêt de ce traitement ;
- un sujet non répondeur au traitement (patient classé R), lorsque la charge virale de VHC reste détectable dans le sang du patient à l'issue de ce traitement anti-VHC ;
- un sujet répondeur-rechuteur (patient classé RR), lorsque la charge virale de VHC est devenue indétectable dans le sang du patient à l'issue de ce traitement anti-VHC, mais qu'elle est redevenue détectable 6 mois après l'arrêt de ce traitement anti-VHC.
Ce traitement anti-VHC est généralement administré :
- sur environ 24 semaines pour une hépatopathie à VHC de génotype 2 ou 3,
- sur environ 48 semaines pour une hépatopathie à VHC de génotype 1, 4, 5 ou 6.
Le traitement peut être l'un des traitements ci-dessus mentionnés, tels que notamment un traitement comprenant ou consistant en l'administration de ribavirine (ou d'une prodrogue ou d'un analogue de ce principe actif) et d'interféron alpha-2a ou d'interféron
alpha-2b, plus particulièrement d'interféron pégylé (plus particulièrement, d'interféron alpha-2a pégylé ou d'interféron alpha-2b pégylé), ou d'une pro-drogue ou d'un analogue de ce principe actif. L'interféron est usuellement administré à un rythme d'une fois par semaine, alors que la ribavirine est usuellement administrée à un rythme de deux fois par jour.
Des exemples de traitement comprennent notamment les exemples suivants :
- traitement par administration :
o d'interféron alpha-2b pégylé (PEG-INTRON®; Schering Plough Corporation ; Kenilworth, NJ ; U.S. A.) à une dose de 1,5 g/kg/semaine, et o de ribavirine (REBETOL® ; Schering Plough Corporation ; Kenilworth,
NJ ; U.S.A.), en fonction du poids du patient et du/des génotypes de VHC, à une dose de :
■ 800 à 1200 mg/kg/jour pour ceux des patients qui étaient infectés par au moins un génotype 1 et/ou 4 et/ou 5 et/ou 6 de VHC, ou à une dose de
■ 800 mg/kg/jour pour ceux des patients qui étaient infectés par au moins un génotype 2 et/ou 3 de VHC,
ou
- traitement par administration :
o d'interféron alpha-2a pégylé (PEGASYS® ; Roche Corporation ; F.
Hoffmann-La Roche Ltd. ; Basel, Suisse) à une dose de 180 g/kg/semaine, et
o de ribavirine (COPEGUS® ; Roche Corporation ; F. Hoffmann-La Roche Ltd. ; Basel, Suisse) à une dose de 1000 à 1200 mg/kg/jour.
L'un ou l'autre de ces deux exemples de traitement peut être administré pendant 24 semaines pour ceux des sujets qui étaient infectés par au moins un génotype 2 et/ou 3 de VHC, et pendant 48 semaines pour ceux des sujets qui étaient infectés par au moins un génotype 1 et/ou 4 et/ou 5 et/ou 6 de VHC.
La charge virale de VHC peut être considérée indétectable dans le sang du sujet, lorsque le dosage des ARN de VHC dans le sérum du sujet a conduit à une valeur inférieure à 12 Unités Internationales (UI) par mL de sérum, telle que mesurée par un test de quantification de l'ARN de VHC, par exemple telle que mesurée par un test de quantification réalisé à l'aide du kit VERSANT® HCV-RNA 3.0 (bDNA) ASSAY de la
société Siemens Healthcare Diagnostics (limite de quantification = 615 - 7 690 000 UI/mL), en suivant les recommandations du fabricant de ce kit.
Les inventeurs ont identifié des gènes dont les niveaux d'expression constituent des biomarqueurs qui, lorsqu'ils sont pris en combinaison, sont pertinents pour déterminer le statut « répondeur » (R) ou « non répondeur » ( R) d'un sujet.
Les inventeurs ont en outre observé que, selon ces combinaisons de niveaux d'expression, la population des sujets répondeurs-rechuteurs (RR) ségrége très fortement avec celle des répondeurs (R) : les sujets RR sont majoritairement classés comme des R {cf. exemples ci- dessous).
Les gènes ainsi identifiés sont les vingt-huit gènes suivants : HERC5, IL8, STAT2, CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18.
La plupart de ces gènes codent des protéines dont la localisation n'est pas transmembranaire, ou à tout le moins ne l'est pas exclusivement. La plupart de ces gènes codent donc des protéines qui sont susceptibles d'être détectées dans un fluide biologique du sujet, tel que le sang, le sérum ou le plasma. C'est en fait le cas des vingt-huit gènes listés ci-dessus, à l'exception des sept gènes suivants, qui codent des protéines membranaires strictes : CLDN1, G1P3, IFI27, IFITM1, ITGA2, OCLN, PLSCR1.
Les inventeurs ont en outre identifié que les combinaisons les plus pertinentes comprennent :
au moins deux gènes parmi HERC5, IL8, STAT2 ; et
- au moins un gène parmi CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18.
Chacun de ces gènes est individuellement connu de la personne du métier, et est entendu conformément à sa signification dans le domaine. Un rappel de leurs identités respectives est présenté à titre indicatif dans le tableau 1 ci-dessous.
Tableau 1 : identité des gènes
Nom (en français) Nom (en anglais) Numéro
Symbole Alias
de la protéine codée de la protéine codée d'accession NM protéine 5 contenant un domaine
HECT domain and RCCl-like
HERC5 HECT et des domaines de type CBE1, CEBP1 NM_016323 domain-containing protein 5
RCC1
CXCL8, GCP-1, GCP1, LECT,
IL8 interleukine 8 interleukin 8 LUCT, LYNAP, MDNCF, MONAP, NM_000584
NAF, NAP-1, NAP1
transducteur de signal et activateur Signal Transducer and Activator of
STAT2 PI 13, ISGF-3, STAT113, MGC59816 NM_005419 de transcription 2 Transcription 2
CCL21 ligand 21 à chémokine (motif C-C) chémokine (C-C motif) ligand 21 ECL, SLC, SCYA21 NM_002989
CLDN1 Claudine 1 Claudin-1 CLD&, SEMP1, ILVASC NM_021101
CXCL6 ligand 6 à chémokine (motif CXC) chémokine (CXC motif) ligand 6 CKA-3, GCP-2, GCP2, SCYB6 NM_002993 protéine 01 en boîte à tête de
FOXOl Forkhead box protein 01 FKH1, FKHR, F0X01A NM_002015 fourchette
Tableau 1 (suite) : identité des gènes
Nom (en français) Nom (en anglais) Numéro
Symbole Alias
de la protéine codée de la protéine codée d'accession NM protéine inductible par l'interféron interferon alpha inducible protein
G1P2 ISG15, IFI15 M_005101.3 alpha (clone IFI-15K) (clone IFI-15K)
protéine 6 inductible par 6-16, FAM14C, IFI616, IFI-6-16,
G1P3 interferon alpha-inducible protein 6 M_022873 l'interféron alpha IFI6
protéine 27 inductible par
IFI27 interferon alpha-inducible protein 27 P27, ISG12, FAM14D, ISG12A M_005532 l'interféron alpha
protéine de 35kDa induite par
IFI35 interferon-induced 35kDa protein IFP35, FLJ21753 M_005533 l'interféron
IFI44 protéine 44 induite par l'interféron interferon-induced protein 44 P44, MTAP44 M_006417 protéine à répétitions
interferon-induced protein with G10P1, IFI56, ISG56, IFI-56,
IFIT1 tétratricopeptidiques 1 induite par M_001548 tetratricopeptide repeats 1 IFNAI1, RNM561
l'interféron
protéine à répétitions
interferon-induced protein with IRG2, IFI60, ISG60, RIG-G, CIG-49,
IFIT4 tétratricopeptidiques 3 induite par M_001549 tetratricopeptide repeats 3 GARG-49, IFIT3
l'interféron
Tableau 1 (suite) : identité des gènes
Nom (en français) Nom (en anglais) Numéro
Symbole Alias
de la protéine codée de la protéine codée d'accession NM protéine 1 transmembranaire interferon-induced transmembrane
IFITM1 9-27, CD225, IFI17, LEU13 M_003641 induite par l'interféron protein 1
CD49B, BR, GPla, CD49B, VLA-2,
ITGA2 intégrine alpha 2 integrin alpha-2 M_002203
VLAA2
protéine se liant à LGALS3
lectin, galactosidase-binding,
LGALS3BP (lectine, se liant à la galactosidase, 90K, MAC-2-BP M_005567.3 soluble, 3 binding protein
soluble, 3)
MDK midkine midkine EGF2 M_001012334 protéine de résistance 1 du
Myxovirus (Influenzae virus)
Myxovirus
MX1 résistance protein 1 IFI78 M_002462
(protéine 78 induite par
(interferon induced protein 78)
l'interféron)
OAS1 synthétase 1 2'-5'-oligoadénylate 2'-5'-oligoadenylate synthétase 1 OIAS, IFI-4, OIASI M_016816
OAS2 synthétase 2 2'-5'-oligoadénylate 2'-5'-oligoadenylate synthétase 2 MGC78578 M_016817
OAS3 synthétase 3 2'-5'-oligoadénylate 2'-5'-oligoadenylate synthétase 3 plOO, MGC133260 M_006187
Tableau 1 (suite et fin) : identité des gènes
Nom (en français) Nom (en anglais) Numéro
Symbole Alias
de la protéine codée de la protéine codée d'accession NM
OCLN occludine occludin - M_002538
PLSCR1 scramblase phospholipide 1 phospholipid scramblase 1 M MTR A 1 B M_021105 protéine 2 contenant un domaine
radical S-adenosyl méthionine
RSAD2 de radical de méthionine de S- Cig5, vigl, cig33, 2510004LOlRik M_080657 domain-containing protein 2
adénosyl
transducteur de signal et activateur Signal Transducer and Activator of
STAT1 ISGF-3, STAT91, DKFZp686B04100 M_007315 de transcription 1 alpha/beta Transcription 1 -alpha/beta
STMN2 stathmine 2 Stathmin-2 SCG10, SCGN10, SGC10 M_007029
USP18 hydrolase carboxy-terminale Ubl Ubl carboxyl-terminal hydrolase 18 ISG43, UBP43 M_017414 phosphoprotéine ribosomale acide human acidic ribosomal
RPLPO 36B4 M_001002
PO humaine phosphoprotein PO
TBP protéine se liant à une boîte TATA TATA box binding protein - M_003194
Aucun de ces gènes n'est un gène de virus d'hépatite. Il s'agit de gènes de mammifères, plus particulièrement de gènes humains. En sus des niveaux d'expression de gènes choisis parmi la liste de vingt-huit gènes de l'invention (HERC5, IL8, STAT2, CCL21, CLDNl, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18), les moyens de l'invention peuvent en outre comprendre la mesure d'autres facteurs, notamment d'un ou plusieurs facteurs cliniques et/ou d'un ou plusieurs facteurs virologiques et/ou d'un ou plusieurs facteurs biologiques autres que le niveau d'expression de gènes choisis parmi ladite liste de vingt-huit gènes.
Plus particulièrement, en sus des niveaux d'expression de gènes choisis parmi ladite liste de vingt-huit gènes de l'invention, les moyens de l'invention peuvent optionnellement comprendre :
le dosage du niveau d'expression de gènes de mammifères (plus particulièrement de gènes humains) autres que ceux de ladite liste de vingt-huit gènes, par exemple pour doser le niveau de transcription de gènes qui sont ci-dessous listés en tant que « autres facteurs biologiques », tels que le gène codant la phosphatase alcaline (PAL) ; cf. exemple 2d) ci-dessous, et/ou
le dosage de métabolites intracorporels (par exemple, le cholestérol), et/ou
le dosage d'éléments figurés du sang (par exemple les plaquettes), et/ou
le dosage de la quantité de fer circulant.
II s'agit toutefois de dosages optionnels.
Conformément à la demande, le nombre de gènes de mammifères (plus particulièrement de gènes humains), dont le niveau d'expression est dosé, et qui ne sont pas des gènes choisis parmi ladite liste de vingt-huit gènes de l'invention (par exemple gène codant la gamma glutamyl transpeptidase et/ou gène codant la phosphatase alcaline), est de préférence au maximum de 18, plus particulièrement de 14 ou moins, plus particulièrement de 11 ou moins, plus particulièrement de 6 ou moins, plus particulièrement de 4 ou 3 ou 2 ou 1 ou 0, plus particulièrement de 3 ou 2 ou 1 ou 0, notamment de 2 ou 1 ou 0.
Par suite, en comptabilisant ces « autres » gènes de mammifères (plus particulièrement ces « autres » gènes humains), dont le niveau d'expression peut être éventuellement dosé, ainsi que le nombre maximal des vingt-huit gènes qui peuvent être des gènes choisis conformément à l'invention, le nombre total de gènes dont le niveau d'expression est dosé dans une méthode conforme à la demande, est de préférence de 3 à 46 gènes, plus particulièrement de 3 à 42, plus particulièrement de 3 à 39, plus particulièrement de 3 à 34, plus particulièrement de 3 à 32, plus particulièrement de 3 à 31, plus particulièrement de 3 à 30, plus particulièrement de 3 à 29, notamment de 3 à 28, plus particulièrement de 3 à 27, plus particulièrement de 3 à 26, plus particulièrement de 3 à 25, plus particulièrement de 3 à 24, plus particulièrement de 3 à 23, plus particulièrement de 3 à 22, plus particulièrement de 3 à 21, plus particulièrement de 3 à 20, plus particulièrement de 3 à 19, plus particulièrement de 3 à 18, plus particulièrement de 3 à 17, plus particulièrement de 3 à 16, plus particulièrement de 3 à 15, plus particulièrement de 3 à 14, plus particulièrement de 3 à 13, plus particulièrement de 3 à 12, plus particulièrement de 3 à 11, plus particulièrement de 3 à 10, plus particulièrement de 3 à 9, plus particulièrement de 3 à 8, plus particulièrement de 3 à 7 (par exemple de 4, 5, 6 ou 7), plus particulièrement de 3 à 6 (par exemple de 4, 5 ou 6).
En outre, comme cela est présenté plus en détail ci-dessous, et comme cela est illustré en exemples, le nombre de gènes choisis parmi la liste de vingt-huit gènes de l'invention (HERC5, IL8, STAT2, CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFITl, IFIT4, IFITMl, ITGA2, LGALS3BP, MDK, MXl, OASl, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18) peut avantageusement être de 3, 4, 5 ou 6, plus particulièrement de 3, 4 ou 5, notamment de 4 ou 5.
Selon un mode de réalisation, le nombre total de gènes dont le niveau d'expression est dosé, est de :
- 3, 4, 5 ou 6 gènes choisis parmi ladite liste de vingt-huit gènes de l'invention, et
- 0, 1, 2, 3 ou 4 « autres » gènes de mammifère, plus particulièrement de 0, 1, 2 ou 3 « autres » gènes de mammifère, plus particulièrement de 0, 1 ou 2 « autres » gènes de mammifère.
Selon un mode de réalisation, le nombre total de gènes de mammifère dont le niveau d'expression est dosé dans une méthode conforme à la demande, est donc de 3 à 10, plus particulièrement de 3 à 9, plus particulièrement de 3 à 8, plus particulièrement de 3 à 7,
plus particulièrement de 3 à 6, plus particulièrement de 3 à 5, plus particulièrement de 3 à 4.
Les moyens de l'invention peuvent optionnellement comprendre le dosage du produit d'expression (ARN ou protéique) d'un ou plusieurs gènes non humains, plus particulièrement d'un ou plusieurs gènes viraux, plus particulièrement d'un ou plusieurs gènes de virus d'hépatite, plus particulièrement d'un ou plusieurs gènes de VHC.
Les moyens de l'invention peuvent optionnellement comprendre la détermination du ou des génotypes du ou des VHC dont le sujet est infecté.
Les moyens de l'invention peuvent optionnellement comprendre la détermination d'un ou plusieurs facteurs cliniques dudit sujet tels que la charge virale avant traitement (CVavantTTT dans les exemples ci-dessous).
Les moyens de l'invention peuvent optionnellement comprendre la détermination d'un ou plusieurs facteurs biologiques dudit sujet autres que le niveau d'expression d'un gène de ce sujet, tels que par exemple le dosage du cholestérol dudit sujet.
Une caractéristique des moyens de l'invention est qu'ils comprennent le fait de doser (ou mesurer) le niveau auquel des gènes choisis s'expriment dans l'organisme dudit sujet. L'expression « niveau d'expression d'un gène » ou expression équivalente désigne ici tant le niveau auquel ce gène est transcrit en ARN, plus particulièrement en ARNm, que le niveau auquel est exprimée une protéine codée par ce gène.
Le terme « doser » ou « mesurer » ou terme équivalent est entendu selon son sens commun dans le domaine, et fait référence au fait de quantifier.
On peut doser le niveau de transcription (ARN) de chacun desdits gènes, ou doser le niveau de traduction (protéine) de chacun desdits gènes, ou bien encore doser le niveau de transcription pour certains desdits gènes choisis et le niveau de traduction pour les autres de ces gènes choisis. Selon un mode de réalisation de l'invention, on dose soit le niveau de transcription soit le niveau de traduction de chacun desdits gènes choisis.
Le fait de doser (ou mesurer) le niveau de transcription d'un gène comprend le fait de quantifier des ARN transcrits de ce gène, plus particulièrement de déterminer la concentration d'ARN transcrits par ce gène (par exemple, la quantité de ces ARN rapportée à la quantité totale d'ARN initialement présente dans l'échantillon, telle que par exemple une valeur de Ct normalisée par la méthode du 2~ACt ; cf. ci-dessous).
Le fait de doser (ou mesurer) le niveau de traduction d'un gène comprend le fait de quantifier des protéines codées par ce gène, plus particulièrement de déterminer la concentration en protéines codées par ce gène (par exemple, la quantité de cette protéine par volume de fluide biologique).
Certaines protéines codées par un gène de mammifère, notamment un gène humain, peuvent parfois subir des modifications post-traductionnelles telles que, par exemple, un clivage en polypeptides et/ou peptides. Le cas échéant, le fait de doser (ou mesurer) le niveau de traduction d'un gène peut alors comprendre le fait de quantifier ou de déterminer la concentration non pas de la ou des protéines elles-mêmes, mais d'une ou de formes post-traductionnelles de cette ou ces protéines, telles que par exemple, des polypeptides et/ou peptides qui sont des fragments spécifiques de cette ou ces protéines. Pour doser ou mesurer le niveau d'expression d'un gène, l'on peut donc quantifier :
des ARN transcrits de ce gène, ou
des protéines exprimées par ce gène, ou des formes post-traductionnelles de telles protéines, telles que par exemple des polypeptides ou peptides qui sont des fragments spécifiques de ces protéines.
La demande est relative aux objets définis dans les revendications telles que déposées, aux objets décrits ci-dessous et aux objets illustrés en partie « exemples ».
La demande est notamment relative à des moyens qui permettent de pronostiquer si un sujet infecté par un ou des VHC a une forte probabilité de répondre à un traitement anti- VHC qui comprendra l'administration d'interféron et de ribavirine, ou si, au contraire, ce sujet a une forte probabilité de ne pas répondre à ce traitement anti-VHC. Les moyens de l'invention comprennent notamment :
des méthodes qui comprennent le dosage ou la mesure des niveaux d'expression de gènes choisis (niveaux de transcription ou de traduction);
des produits ou réactifs qui sont spécialement adaptés au dosage ou à la mesure de ces niveaux d'expression de gènes ;
- des articles manufacturés, des compositions, des compositions pharmaceutiques, des kits, des tubes, des supports solides comprenant de tels produits ou réactifs, ainsi que
des systèmes informatiques (notamment, produit programme d'ordinateur et dispositif informatique), qui sont spécialement adaptés à la mise en œuvre des moyens de l'invention. Les moyens de l'invention, plus particulièrement la méthode de l'invention, sont mis en œuvre avant traitement de l'infection à VHC, et, de manière avantageuse, peuvent être mis en œuvre avant que le traitement anti-VHC n'ait commencé, plus particulièrement avant que tout traitement anti-VHC n'ait commencé. Selon un aspect de l'invention, la demande est ainsi relative à une méthode, plus particulièrement une méthode in vitro, pour pronostiquer si un sujet infecté par un ou des VHC a une forte probabilité de répondre à un traitement anti-VHC qui comprendra l'administration d'interféron et de ribavirine, ou si, au contraire, ce sujet a une forte probabilité de ne pas répondre à ce traitement anti-VHC.
La méthode comprend le fait de doser les niveaux auxquels des gènes choisis sont transcrits ou traduits, lesdits gènes choisis étant des gènes choisis parmi la liste de gènes suivants : HERC5, IL8, STAT2, CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18.
Plus particulièrement, la méthode de pronostic de la demande comprend le fait de doser les niveaux auxquels des gènes choisis sont transcrits ou traduits, lesdits gènes choisis étant :
au moins deux gènes parmi HERC5, IL8, STAT2 ; et
- au moins un gène parmi CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1,
OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18.
Ces dosages peuvent être faits dans un échantillon préalablement obtenu à partir dudit sujet.
Dans la méthode pronostique de l'invention, le nombre total des gènes ainsi choisis peut notamment être de 3, 4, 5 ou 6, plus particulièrement de 3, 4 ou 5, notamment de 4 ou 5. Ceci étant, comme cela est présenté et illustré plus en détail ci-dessous, la méthode pronostique de l'invention peut en outre comprendre le dosage ou la mesure d'un ou plusieurs autres facteurs, notamment d'un ou plusieurs facteurs virologiques et/ou d'un ou plusieurs facteurs cliniques et/ou d'un ou plusieurs facteurs biologiques autres que les
niveaux d'expression de gènes choisis parmi HERC5, IL8, STAT2, CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18.
Une méthode pronostique de l'invention peut donc être définie par le fait qu'elle comprend l'étape de procéder à des mesures, qui comprennent ou sont constituées des mesures suivantes :
dans un échantillon préalablement obtenu à partir dudit sujet, doser les niveaux auxquels des gènes choisis sont transcrits ou traduits, lesdits gènes choisis étant :
o au moins deux gènes parmi HERC5, IL8, STAT2 ; et
o au moins un gène parmi CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18,
optionnellement, mesurer ou déterminer, pour ledit sujet, la valeur d'un ou plusieurs facteurs cliniques et/ou d'un ou plusieurs facteurs virologiques et/ou d'un ou plusieurs facteurs biologiques autres que les niveaux d'expression de gènes choisis parmi HERC5, IL8, STAT2, CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STATL STMN2, USP18.
La demande est également relative à une méthode de thérapie anti-VHC, qui comprend le fait de pronostiquer la réponse d'un sujet à un traitement anti-VHC à l'aide de la méthode pronostique de l'invention. Si ledit sujet est pronostiqué non-répondeur, le praticien peut choisir de ne pas lui administrer un traitement qui comprend (plus particulièrement qui est essentiellement constitué de) administration d'interféron et administration de ribavirine (ou de leurs pro-drogues), plus particulièrement de ne pas lui administrer un tel traitement à titre de traitement de première intention. Dans une telle situation, le praticien peut par exemple choisir d'administrer un traitement anti-VHC qui ne comprend pas (ou qui n'est pas essentiellement constitué de) administration d'interféron et administration de ribavirine (ou de leurs pro-drogues), plus particulièrement de lui administrer un tel traitement à titre de traitement de première intention. Le praticien peut alternativement choisir de ne pas lui administrer de traitement anti-VHC, à tout le moins en première intention. Si ledit sujet est pronostiqué répondeur, le praticien peut choisir d'administrer
un traitement anti-VHC, notamment un traitement qui comprend (plus particulièrement qui est essentiellement constitué de) administration d'interféron et administration de ribavirine (ou de leurs pro-drogues), plus particulièrement d'administrer en première intention un traitement qui comprend (plus particulièrement qui est essentiellement constitué de) administration d'interféron et administration de ribavirine (ou de leurs prodrogues).
Le dosage (ou la mesure) du niveau d'expression desdits gènes choisis peut être fait dans un échantillon préalablement obtenu à partir dudit sujet, tel que :
- un échantillon biologique prélevé ou collecté dudit sujet, ou
- un échantillon comprenant des acides nucléiques (notamment des ARN) et/ou protéines et/ou polypeptides et/ou peptides dudit échantillon biologique, notamment un échantillon comprenant des acides nucléiques et/ou protéines et/ou polypeptides et/ou peptides qui ont été, ou sont susceptibles d'avoir été extraits et/ou purifiés dudit échantillon biologique, ou
- un échantillon comprenant des ADNc qui ont été, ou sont susceptibles d'avoir été obtenus par transcription inverse desdits ARN.
Un échantillon biologique collecté ou prélevé dudit sujet peut par exemple être un échantillon prélevé ou collecté, ou susceptible d'être prélevé ou collecté, à partir :
- d'un organe ou tissu interne dudit sujet, notamment de son foie ou de son parenchyme hépatique, ou
d'un fluide biologique dudit sujet, notamment un fluide intracorporel tel que le sang, le sérum, le plasma, ou de l'urine.
Un échantillon biologique collecté ou prélevé dudit sujet peut par exemple être un échantillon comprenant une portion de tissu dudit sujet, notamment une portion de tissu hépatique, plus particulièrement une portion de parenchyme hépatique.
Un échantillon biologique collecté ou prélevé dudit sujet peut par exemple être un échantillon comprenant des cellules qui ont été, ou sont susceptibles d'être, prélevées ou collectées d'un tissu dudit sujet, notamment d'un tissu hépatique, plus particulièrement des cellules hépatiques.
Un échantillon biologique collecté ou prélevé dudit sujet peut par exemple être un échantillon de fluide biologique, tel qu'un échantillon de sang, de sérum, de plasma ou d'urine, plus particulièrement un échantillon de fluide intracorporel tel qu'un échantillon de sang ou de sérum ou de plasma. C'est notamment le cas lorsque lesdits gènes choisis
parmi ladite liste de vingt-huit gènes de l'invention codent pour des protéines qui ont une localisation extracellulaire, ou à tout le moins pour ceux desdits gènes choisis qui codent des protéines ayant une telle localisation.
Selon un mode de réalisation de l'invention, ledit échantillon biologique est donc un échantillon de fluide biologique dudit sujet, tel qu'un échantillon de fluide intracorporel, tel que du sang, du sérum, du plasma, ou échantillon d'urine, et les niveaux d'expression desdits gènes choisis qui sont dosés peuvent être des niveaux de traduction protéique.
Le prélèvement ou la collecte dudit échantillon biologique peut être fait par insertion d'un instrument de prélèvement, notamment par insertion d'une aiguille ou d'un cathéter, dans le corps dudit sujet. Cet instrument peut par exemple être inséré :
- dans un organe ou tissu interne dudit sujet, notamment dans son foie ou dans parenchyme hépatique, par exemple,
- pour prélever un échantillon de foie ou de parenchyme hépatique, ce prélèvement pouvant par exemple être fait par ponction biopsique hépatique (PBH), plus particulièrement par PBH par voie transjugulaire ou par voie transpariétale, ou
- pour prélever ou collecter des cellules à partir du compartiment hépatique (prélèvement de cellules, et non de tissu), plus particulièrement à partir du parenchyme hépatique, notamment pour prélever des cellules hépatiques, ce prélèvement ou cette collecte pouvant par exemple être fait par cyto-ponction hépatique ;
et/ou
- dans une veine, une artère ou un vaisseau dudit sujet pour prélever un fluide biologique dudit sujet, tel que du sang.
Les moyens de l'invention ne sont pas limités à une mise en œuvre sur une biopsie de tissu, notamment de tissu hépatique. Ils peuvent être mis en œuvre sur un échantillon obtenu, ou susceptible d'être obtenu par un prélèvement de taille ou volume nettement plus réduit qu'un échantillon de tissu, à savoir un échantillon qui se limite à quelques cellules. Les moyens de l'invention peuvent notamment être mis en œuvre sur un échantillon obtenu, ou susceptible d'être obtenu par cyto-ponction hépatique.
La quantité ou le volume de matière prélevé par cyto-ponction hépatique est beaucoup plus réduit que celui prélevé par PBH. Outre le gain immédiat pour le patient en termes de diminution d'invasivité de la technique de prélèvement et de diminution de la morbidité associée, la cyto-ponction hépatique présente l'avantage de pouvoir être répétée à des temps distincts sur le même patient (par exemple, pour déterminer l'évolution de la fibrose
hépatique entre deux instants), alors que la PBH ne peut être raisonnablement répétée sur le même patient. La cyto-ponction hépatique présente donc, contrairement à la PBH, l'avantage de permettre de suivre l'évolution clinique du patient.
Ainsi, conformément à l'invention, ledit échantillon biologique peut avantageusement être :
- un prélèvement ou une collecte de cellules à partir du compartiment hépatique (prélèvement ou collecte de cellules, et non de tissu), plus particulièrement à partir du parenchyme hépatique, c'est-à-dire un échantillon biologique obtenu, ou susceptible d'être obtenu par cyto-ponction hépatique ;
et/ou
- un prélèvement ou une collecte de fluide biologique dudit sujet, tel que du sang ou de l'urine, notamment du sang.
Le dosage (ou la mesure) peut être fait dans un échantillon biologique qui a été collecté ou prélevé dudit sujet, et qui a été plus avant transformé, par exemple :
par extraction et/ou purification des acides nucléiques, notamment des ARN, plus particulièrement des ARNm, et/ou par transcription inverse de ces ARN, notamment de ces ARNm, ou
par extraction et/ou purification des protéines et/ou polypeptides et/ou peptides, ou par extraction et/ou purification d'une fraction protéique, telle que le sérum ou le plasma extrait du sang.
Par exemple, lorsque l'échantillon biologique collecté ou prélevé est un fluide biologique tel que du sang ou de l'urine, cet échantillon peut, avant de réaliser le dosage ou la mesure, être transformé :
par extraction d'acides nucléiques, notamment d'ARN, plus particulièrement d'ARNm, et/ou par transcription inverse de ces ARN, notamment de ces ARNm (le plus généralement, par extraction des ARN et transcription inverse de ces ARN), ou
par séparation et/ou extraction de la fraction sérique, ou par extraction ou purification des protéines et/ou polypeptides et/ou peptides sériques.
Ainsi, selon un mode de réalisation de l'invention, ledit échantillon obtenu à partir dudit sujet comprend (par exemple dans une solution), ou est, un échantillon de fluide biologique dudit sujet, tel qu'un échantillon de sang, de sérum, de plasma ou d'urine, et/ou est un échantillon qui comprend (par exemple dans une solution) :
des ARN, notamment des ARNm, susceptibles d'avoir été extraits ou purifiés d'un fluide biologique, tel que du sang ou de l'urine, notamment du sang ; et/ou des ADNc susceptibles d'avoir été obtenus par transcription inverse de tels ARN ; et/ou des protéines et/ou polypeptides et/ou peptides susceptibles d'avoir été extraits ou purifiés d'un fluide biologique, tel que du sang ou de l'urine, notamment du sang, et/ou susceptibles d'avoir été codés par de tels ARN,
de préférence,
des protéines et/ou polypeptides et/ou peptides susceptibles d'avoir été extraits ou purifiés d'un fluide biologique, tel que du sang ou de l'urine, notamment du sang, et/ou susceptibles d'avoir été codés par de tels ARN.
Lorsque ledit échantillon obtenu à partir dudit sujet comprend un échantillon biologique obtenu, ou susceptible d'être obtenu par prélèvement d'un fluide biologique, tel que du sang ou de l'urine, ou lorsque ledit échantillon obtenu à partir dudit sujet est issu, ou susceptible d'être issu d'un tel échantillon biologique par extraction et/ou purification de molécules contenues dans cet échantillon biologique, le dosage est de préférence un dosage de protéines et/ou polypeptides et/ou peptides, plutôt qu'un dosage d'acides nucléiques.
Lorsque l'échantillon biologique collecté ou prélevé est un échantillon comprenant une portion de tissu, notamment une portion de tissu hépatique, plus particulièrement une portion de parenchyme hépatique, tel que par exemple un échantillon biologique prélevé ou susceptible d'être prélevé par ponction biopsique hépatique (PBH), ou lorsque l'échantillon biologique collecté ou prélevé est un échantillon comprenant des cellules obtenues, ou susceptibles d'être obtenues à partir d'un tel tissu, tel que par exemple un échantillon collecté, ou susceptible d'être collecté, par cyto-ponction hépatique, cet échantillon biologique peut être transformé :
par extraction d'acides nucléiques, notamment d'ARN, plus particulièrement d'ARNm, et/ou par transcription inverse de ces ARN, notamment de ces ARNm (le plus généralement, par extraction de ces ARN et transcription inverse de ces ARN), ou
- par séparation et/ou extraction des protéines et/ou polypeptides et/ou peptides.
Une étape de lyse des cellules, notamment de lyse des cellules hépatiques, contenues dans ledit échantillon biologique, peut être préalablement réalisée de sorte à rendre acides nucléiques, ou le cas échéant, protéines et/ou polypeptides et/ou peptides, directement accessibles à l'analyse.
Ainsi, selon un mode de réalisation de l'invention, ledit échantillon obtenu à partir dudit sujet est un échantillon de tissu dudit sujet, notamment de tissu hépatique, plus particulièrement de parenchyme hépatique, ou est un échantillon de cellules d'un tel tissu, et/ou est un échantillon qui comprend (par exemple dans une solution):
- des cellules hépatiques, plus particulièrement des cellules du parenchyme hépatique, par exemple des cellules obtenues, ou susceptibles d'être obtenues par dissociation des cellules d'une biopsie de tissu hépatique ou par cyto-ponction hépatique; et/ou des ARN, notamment des ARNm, susceptibles d'avoir été extraits ou purifiés de telles cellules ; et/ou
- des ADNc susceptibles d'avoir été obtenus par transcription inverse de tels ARN ; et/ou
des protéines et/ou polypeptides et/ou peptides susceptibles d'avoir été extraits ou purifiés de telles cellules, et/ou susceptibles d'avoir été codés par de tels ARN. Conformément à l'invention, ledit sujet est un humain ou un animal non-humain, notamment un humain ou un mammifère non-humain, plus particulièrement un humain.
Du fait de la sélection particulière de gènes proposée par l'invention, le statut de répondeur ou de non-répondeur dudit sujet peut être déduit, ou déterminé à partir, des valeurs des mesures obtenues pour ledit sujet, notamment par induction statistique et/ou classification statistique, par exemple vis-à-vis de cohortes de référence (pré-)établies selon leur statut de répondeur ou de non-répondeur.
En sus du fait de doser (ou mesurer) le niveau auquel des gènes choisis s'expriment dans l'organisme dudit sujet, une méthode de l'invention peut donc en outre comprendre une étape de déduction ou détermination du statut de répondeur ou de non-répondeur dudit sujet à partir des valeurs des mesures obtenues pour ledit sujet. Cette étape de déduction ou détermination est une étape par laquelle les valeurs des mesures obtenues pour ledit sujet sont analysées pour en induire le statut de répondeur ou de non-répondeur dudit sujet.
La déduction ou détermination du statut de répondeur ou de non-répondeur dudit sujet peut être faite en comparant les valeurs des mesures obtenues pour ledit sujet à leurs valeurs, ou à la distribution de leurs valeurs, dans des cohortes de référence pré-établies selon leur statut de répondeur ou non-répondeur au traitement anti-VHC, pour classer ledit
sujet dans celle de ces cohortes de référence vis-à-vis de laquelle il a la plus forte probabilité d'appartenance (c'est-à-dire pour attribuer audit sujet son statut de répondeur ou de non-répondeur). Les individus qui composent ces cohortes sont des individus, pour lesquels il a été établi, par application du traitement anti-VHC, qu'ils sont répondeurs ou non-répondeurs à ce traitement.
Les dosages effectués sur ledit sujet et sur les individus des cohortes ou sous-populations de référence sont des dosages de niveaux d'expression (transcription ou traduction) de gènes.
Pour doser le niveau de transcription d'un gène, on dose son niveau de transcription en ARN. Un tel dosage peut par exemple comprendre la mesure de la concentration en ARN transcrits de chacun desdits gènes choisis, soit par mesure de la concentration de ces ARN, soit par mesure de la concentration des ADNc obtenus par transcription inverse de ces ARN. Le dosage d'acides nucléiques est bien connu de la personne du métier. Par exemple, le dosage d'ARN ou des ADNc correspondants peut se faire par amplification d'acide nucléique, notamment par PCR. Des réactifs sont décrits ci-dessous à cet effet {cf. exemple 1 ci-dessous). Des exemples d'amorces et sondes appropriés en sont également donnés {cf. par exemple tableau 10 ci-dessous). Les conditions d'amplification d'acides nucléiques peuvent être choisies par la personne du métier. Des exemples de conditions d'amplification sont donnés dans la partie « exemples » qui suit {cf. exemple 1 ci- dessous).
Pour doser le niveau de traduction d'un gène, on dose son niveau de traduction en protéines. Un tel dosage peut par exemple comprendre la mesure de la concentration en protéines traduites à partir de chacun desdits gènes choisis (par exemple, dosage des protéines dans la circulation générale, notamment dans le sérum). Le dosage de protéines est bien connu de la personne du métier. Par exemple, les protéines (et/ou polypeptides et/ou peptides) peuvent être dosées par ELISA ou par toute autre méthode immunométrique connue de la personne du métier, ou par une méthode utilisant la spectrométrie de masse connue de la personne du métier.
Les valeurs de dosage sont des valeurs de concentration ou de proportion, ou des valeurs qui représentent une concentration ou une proportion. L'objectif est qu'au sein d'une même combinaison, les valeurs de dosage des niveaux d'expression de chacun desdits gènes choisis reflètent le plus précisément possible, à tout le moins l'une par rapport à
l'autre, le degré auquel chacun de ces gènes est exprimé (degré de transcription ou degré de traduction), notamment en étant proportionnelles à ces degrés respectifs.
Par exemple, dans le cas du dosage du niveau d'expression d'un gène par dosage des ARN transcrits, c'est-à-dire dans le cas du dosage du niveau de transcription de ce gène, le dosage se fait généralement par amplification des ARN par transcription inverse et PCR (RT-PCR), et par mesure de valeurs de Ct {Cycle threshold).
Une valeur de Ct donne une mesure de la quantité initiale des ARN amplifiés (plus la valeur de Ct est faible, plus la quantité de ces acides nucléiques est élevée). Les valeurs de Ct mesurées pour un ARN cible (CtCibie) sont généralement rapportées à la quantité d'ARN total initialement présente dans l'échantillon, par exemple en déduisant de ce CtCibie la valeur d'un Ct de référence (Ctréférence), telle que la valeur de Ct qui a été mesurée dans les mêmes conditions opératoires pour l'ARN d'un gène contrôle endogène dont le niveau d'expression est stable (par exemple un gène impliqué dans une cascade métabolique cellulaire, tel que RPLPO ou TBP ; cf. exemple 1 ci-dessous).
Selon un mode de réalisation de l'invention, la différence (CtCibie - Ctréférence), ou ACt, peut en outre être exploitée par la méthode connue sous le nom de méthode du 2~ACt (Livak et Schmittgen 2001 ; Schmittgen et Livak 2008), sous la forme :
2 -ACt _ 2 - (Ct cible - Ct référence)
Ainsi, selon un mode de réalisation l'invention, le dosage des niveaux auxquels chacun desdits gènes choisis sont transcrits est réalisée par :
amplification, d'un fragment des ARN transcrits par chacun desdits gènes choisis, par exemple par transcription inverse et PCR de ces fragments d'ARN, pour obtenir les valeurs de Ct de chacun de ces ARN,
optionnellement, normalisation de chacune de ces valeurs de Ct par rapport à la valeur de Ct obtenue pour l'ARN d'un gène contrôle endogène, tel que RPLPO ou TBP, par exemple par la méthode du 2"ACt,
optionnellement, transformation Box-Cox desdites valeurs normalisées de Ct.
Dans le cas du dosage du niveau d'expression d'un gène par dosage des protéines exprimées par ce gène, c'est-à-dire dans le cas du dosage du niveau de traduction de ce gène, le dosage se fait généralement par une méthode immunométrique à l'aide d'anticorps spécifiques, et par expression des mesures ainsi faites en quantités pondérales ou en unités internationales, à l'aide d'une gamme étalon. Des exemples d'anticorps spécifiques sont indiqués dans le tableau 27 ci-dessous. Des exemples de moyens de
dosage protéique sont donnés en tableau 16 ci-dessous. Une valeur de dosage du niveau de traduction d'un gène peut par exemple être exprimée en quantité de cette protéine par volume de fluide biologique, par exemple, par volume de sérum (par exemple, en mg/mL ou en μg/mL ou en ng/mL ou en pg/mL).
Si souhaité ou requis, la distribution des valeurs de dosage obtenues sur les individus d'une cohorte peut être lissée, de sorte à la rapprocher d'une loi gaussienne.
A cet effet, les valeurs de dosage obtenues sur les individus de cette cohorte, par exemple les valeurs obtenues par la méthode du 2"ACt, peuvent être transformées par une transformation de type Box-Cox (Box et Cox, 1964 ; cf. tableaux 6 et 25 ci-dessous ; cf. exemple 2 ci-dessous).
La demande est donc notamment relative à une méthode in vitro pour pronostiquer si un sujet infecté par un ou des VHC a une forte probabilité d'être répondeur à un traitement anti-VHC qui comprendra l'administration d'interféron et de ribavirine, ou si, au contraire, ce sujet a une forte probabilité de ne pas être répondeur à ce traitement anti¬
VHC,
ladite méthode comprenant les étapes suivantes :
i) procéder aux mesures suivantes :
- dans un échantillon préalablement obtenu à partir dudit sujet, doser les niveaux auxquels des gènes choisis sont transcrits ou traduits, lesdits gènes choisis étant :
- au moins deux gènes parmi HERC5, IL8, STAT2, et
- au moins un gène parmi CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1,
OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18,
- optionnellement, mesurer ou déterminer, pour ledit sujet, la valeur d'un ou plusieurs facteurs cliniques et/ou d'un ou plusieurs facteurs virologiques et/ou d'un ou plusieurs facteurs biologiques autres que les niveaux d'expression de gènes choisis parmi HERC5, IL8, STAT2, CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK,
MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18, ii) comparer les valeurs des mesures obtenues pour ledit sujet à l'étape i), à leurs valeurs, ou à la distribution de leurs valeurs, dans des cohortes de référence préétablies selon leur statut de répondeur ou non-répondeur au traitement anti-VHC,
pour classer ledit sujet dans celle de ces cohortes de référence vis-à-vis de laquelle il a la plus forte probabilité d'appartenance.
La comparaison de l'étape ii) peut notamment être faite en combinant les valeurs de dosage (ou de mesure) obtenues pour ledit sujet dans un modèle de classification multivariée.
Un tel modèle de classification multivariée compare (de manière combinée) les valeurs des mesures obtenues pour ledit sujet à leurs valeurs, ou à la distribution de leurs valeurs, dans des cohortes de référence pré-établies selon leur statut de répondeur ou non- répondeur au traitement anti-VHC, pour classer ledit sujet dans celle de ces cohortes de référence vis-à-vis de laquelle il a la plus forte probabilité d'appartenance, par exemple en lui attribuant une valeur de sortie indicatrice du statut de répondeur ou de non-répondeur du dit sujet.
Un tel modèle de classification multivariée peut être construit, notamment préalablement construit, en faisant une comparaison inter-cohorte des valeurs de mesures obtenues pour lesdites cohortes de référence ou des distributions de ces valeurs de mesures.
Plus particulièrement, un tel modèle de classification multivariée peut être construit, notamment préalablement construit, en dosant ou mesurant les niveaux d'expression desdits gènes choisis dans des cohortes de référence pré-établies selon leur statut de répondeur ou non-répondeur au traitement anti-VHC, et en analysant ces valeurs de dosage, ou leur distribution, par une méthode statistique multivariée pour construire un modèle de classification multivariée qui induit ou détermine un statut de répondeur ou non-répondeur au traitement anti-VHCà partir des valeurs de niveaux d'expression desdits gènes choisis.
Si, en sus des valeurs de dosage des niveaux de transcription ou de traduction desdits gènes choisis, les valeurs dosées pour ledit sujet comprennent la ou les valeurs d'un ou plusieurs autres facteurs, tels qu'un ou plusieurs facteurs virologiques et/ou un ou plusieurs facteurs cliniques et/ou un ou plusieurs des autres facteurs biologiques {cf. ci- dessous et dans les exemples), le modèle de classification est bien sûr construit, notamment préalablement construit, en dosant ou mesurant les mêmes valeurs dans des cohortes de référence pré-établies selon leur statut de répondeur ou non-répondeur au traitement anti-VHC, et en analysant ces valeurs, ou leur distribution, par une méthode statistique multivariée pour construire un modèle de classification multivariée qui induit
ou détermine un statut de répondeur ou non-répondeur au traitement anti-VHC à partir de ces valeurs.
Par exemple, un modèle peut être construit par une fonction mathématique, une technique non paramétrique, une procédure de classification heuristique ou encore une approche de prédiction probabiliste. Un exemple typique de classification fondée sur la quantification du niveau d'expression de biomarqueurs consiste en la discrimination de sujets "sains" versus "malades". La formalisation de ce problème consiste en m échantillons indépendants, décrits par n variables aléatoires. Chaque individu i (i =1,... , m) est caractérisé par un vecteur x, décrivant les n valeurs caractéristiques:
x,j, i=\, ...m j=\, ...n
Ces valeurs caractéristiques peuvent par exemple représenter des valeurs d'expression génique et/ou des intensités de données protéiques et/ou des intensités de données métaboliques et/ou des données cliniques.
Chaque échantillon x, est associé à une valeur discrète ^, représentant le statut clinique de l'individu i. A titre d'exemple, y, = 0 si le patient i a un statut de non-répondeur au traitement anti-VHC, y, = 1 si le patient i a un statut de répondeur au traitement anti-VHC. Un modèle offre une règle décisionnelle (par exemple, une fonction mathématique, un algorithme ou une procédure), qui utilise l'information disponible depuis x pour prédire .y dans chaque échantillon observé. L'objectif est d'utiliser ce modèle afin de prédire le statut clinique du patient p, à savoir yp, à partir des valeurs biologiques et/ou cliniques disponibles, à savoir xp.
Différents modèles de classification multivariée sont connus de la personne du métier {cf. Hastie, Tibishirani et Friedman, 2009 ; Falissard, 2005 ; Theodoridis et Koutroumbos 2009).
Ils sont généralement construits par traitement et interprétation des données selon, par exemple :
- une méthode d'analyse statistique multivariée, par exemple :
o une fonction mathématique linéaire ou non linéaire, notamment une fonction mathématique linéaire, tel qu'une fonction générée par la méthode mROC (méthode ROC multivariée), ou
o une méthode ROC (Receiver Operating Characteristics) ;
o une méthode de régression, linéaire ou non linéaire, comme par exemple la régression logistique ;
o une méthode PLS-DA {Partial Least Squares - Discriminant Analysis) ;
o une méthode LDA (Linear Discriminant Analysis) ;
- une méthode par apprentissage ou intelligence artificielle, par exemple, un algorithme d'apprentissage ou d'intelligence artificielle, une méthode de classification non paramétrique, ou heuristique, ou de prédiction probabiliste, telle que :
o un arbre décisionnel ; ou
o une méthode de type boosting, fondée sur des classifieurs binaires (ex :
Adaboosi) ou une méthode liée au boosting (bagging) ; ou o une méthode des k plus proches voisins (k-nearest neighbors ou KN ), ou plus généralement la méthode des k plus proches voisins pondérés (weighed k-nearest neighbors ou WKNN), ou
o une méthode (par exemple, un algorithme) Machines à Vecteurs de support {Support Vector Machine ou S VM) ; ou
o une forêt aléatoire (Random Forest ou RF); ou
o un réseau bayésien ; ou
o un réseau de neurones (Neural Network) ; ou
o un treillis de Galois (ou Formai Concept Analysis).
Les règles décisionnelles des modèles de classification multivariée peuvent par exemple être fondées sur une formule mathématique du type .y =f(x1}x2, ...xn) oùf est une fonction mathématique linéaire ou non linéaire (régression logistique, mROC, par exemple), ou sur un algorithme d'apprentissage automatique ou d'intelligence artificielle dont les caractéristiques consistent en une série de paramètres de réglage identifiés comme étant les plus efficaces pour la discrimination des sujets (par exemple, KNN, WKNN, SVM, RF).
La méthode ROC multivariée (mROC) est une généralisation de la méthode ROC (Receiver Operating Characteristic) (cf. Reiser et Faraggi 1997 ; Su et Liu 1993, Shapiro, 1999). Elle calcule l'aire sous la courbe ROC (Area Under the Curve ou AUC) relative à une combinaison linéaire de biomarqueurs et/ou de transformations de biomarqueurs (dans le cas d'une normalisation), sous l'hypothèse d'une distribution normale multivariée. La méthode mROC a notamment été décrite dans Kramar et al. 1999 et Kramar et al. 2001. Référence est également faite aux exemples ci-dessous, notamment au point 2 de l'exemple 1 ci-dessous (modèle mROC).
Le logiciel mROC version 1.0, disponible commercialement auprès des concepteurs (A. Kramar, A. Fortune, D. Farragi et B. Reiser) peut par exemple être utilisé pour construire un modèle mROC.
Andrew Kramar et Antoine Fortune peuvent être contactés auprès de, ou via, l'Unité de Biostatistique du Centre Régional de Lutte contre le Cancer (CRLC) Val d'Aurelle - Paul Lamarque (208, rue des Apothicaires ; Parc Euromédecine ; 34298 Montpellier Cedex 5 ; France).
David Faraggi et Benjamin Reiser peuvent être contactés auprès du, ou via le, Département de Statistique de l'Université de Haifa (Mount Carmel ; Haifa 31905 ; Israël).
La famille des méthodes d'intelligence artificielle ou d'apprentissage automatique est une famille d'algorithmes qui, au lieu de procéder à une généralisation explicite, comparent les exemples d'un nouveau problème avec les exemples considérés en apprentissage et qui ont été stockés en mémoire. Ces algorithmes construisent directement les hypothèses à partir des exemples d'apprentissage eux-mêmes. Un exemple simple de ce type d'algorithme est l'algorithme des k plus proches voisins {k-nearest neighbors ou KNN), et une de ses extensions possibles connue sous le nom d'algorithme des k plus proches voisins pondérés (weighted k nearest neighbors ou WKNN) (Hechenbichler et Schliep, 2004).
Dans le contexte de classification d'une nouvelle observation x, l'idée fondatrice simple est de faire voter les plus proches voisins de cette observation. La classe (ou statut clinique) de x est déterminée en fonction de la classe majoritaire parmi les k plus proches voisins de l'observation x.
Des bibliothèques de fonctions spécifiques KKNN sont disponibles par exemple dans le logiciel R (http://www. R-project.org/). Le logiciel R a été initialement développé par John Chambers et les laboratoires Bell (cf. Chambers 2008). La version actuelle de cette suite logicielle est la version 2.11.1. Le code source est disponible librement sous les termes de la licence publique générale « Free Software Foundation' s GNU », sur le site http://www. R-project.org/. Ce logiciel peut être utilisé pour construire un modèle WKNN. Référence est également faite aux exemples ci-dessous, notamment au point 2 de l'exemple 1 ci-dessous (modèle WKNN).
Une Forêt Aléatoire (Random Forest ou RF) est constituée d'un ensemble d'arbres simples de prévision, chacun étant capable de produire une réponse lorsqu'on lui présente un sous-ensemble de prédicteurs (Breiman 2001 ; Liaw et Wiener 2002). Les calculs sont réalisés avec le logiciel R. Ce logiciel peut être utilisé pour construire des modèles RF. Référence est également faite aux exemples ci-dessous, notamment au point 2 de l'exemple 1 ci-dessous (modèle RF).
Un réseau de neurones est constitué d'un graphe pondéré orienté dont les nœuds symbolisent les neurones. Le réseau est construit à partir d'exemples de chaque classe (par exemple, F2 versus Fl), et est ensuite utilisé pour déterminer à quelle classe appartient un nouvel élément ; cf. Intrator et Intrator 1993, Riedmiller et Braun 1993, Riedmiller 1994, Anastasiadis et. al. 2005 ; cf. http://cran.r-project.org/web/packages/neuralnet/index.html. Le logiciel R librement disponible sur http://www.r-project.org/, (version 1.3 de Neuralnet, écrit par Stefan Fritsch et Frauke Guenther, suivant le travail de Marc Suling) peut par exemple être utilisé pour construire un réseau de neurones.
Référence est également faite aux exemples ci-dessous, notamment au point 2 de l'exemple 1 ci-dessous (modèle NN).
La comparaison de ladite étape ii) peut donc être notamment réalisée en suivant une méthode, et/ou en utilisant un algorithme ou un logiciel :
- mROC,
- KNN, WKNN, plus particulièrement WKNN,
- RF, ou
- NN,
plus particulièrement mROC.
Chacun de ces algorithmes, logiciels ou méthodes permet de construire un modèle de classification multivariée, à partir des valeurs de mesures de chacune desdites cohortes de référence, et de combiner les valeurs de mesures obtenues sur ledit sujet dans ce modèle pour en induire son statut de répondeur ou de non-répondeur.
Selon un mode de réalisation de l'invention, le modèle de classification multivariée mis en œuvre dans la méthode de l'invention est exprimé par une fonction mathématique, linéaire ou non linéaire, plus particulièrement une fonction linéaire (par exemple, un modèle mROC). Le statut de répondeur ou de non-répondeur dudit sujet est alors induit par combinaison desdites valeurs de mesures obtenues pour ledit sujet dans cette fonction mathématique, notamment une fonction linéaire ou non linéaire, pour obtenir une valeur de sortie, plus particulièrement une valeur numérique de sortie, indicatrice du statut de répondeur ou de non-répondeur dudit sujet.
Selon un mode de réalisation de l'invention, le modèle de classification multivariée mis en œuvre dans la méthode de l'invention est un modèle par apprentissage ou intelligence artificielle, un modèle de classification non paramétrique, ou heuristique, ou de prédiction probabiliste (par exemple, un modèle WKNN, RF ou NN). Le statut de répondeur ou de non-répondeur dudit sujet est alors induit par combinaison desdites valeurs de mesures
obtenues pour ledit sujet dans un modèle de classification non paramétrique, ou heuristique, ou de prédiction probabiliste (par exemple, un modèle WKNN, RF ou NN), pour obtenir une valeur de sortie, plus particulièrement une étiquette de sortie, indicatrice du statut de répondeur ou de non-répondeur dudit sujet.
De manière alternative ou complémentaire, ladite comparaison de l'étape ii) peut comprendre le fait de comparer les valeurs des mesures obtenues pour ledit sujet, à au moins une valeur de référence qui discrimine entre un statut de répondeur ou de non- répondeur, pour classer ledit sujet dans le groupe des individus répondeurs ou dans le groupes des individus non-répondeurs.
Par exemple, les valeurs des mesures peuvent être comparées à leurs valeurs de référence dans :
- une sous-population d'individus qui sont de la même espèce que ledit sujet, qui sont infectés par le VHC, auxquels le traitement anti-VHC a été administré, et qui se sont montrés répondeurs à ce traitement, et/ou
- une sous-population d'individus de sujets qui sont de la même espèce que ledit sujet, qui sont infectés par le VHC, auxquels le traitement anti-VHC a été administré, et qui se sont montrés non-répondeurs à ce traitement,
ou à une valeur de référence qui représente la combinaison de ces valeurs de référence. Une valeur de référence peut par exemple être :
- la valeur du dosage du niveau d'expression de chacun desdits gènes choisis dans chacun des individus pour chacune des sous-populations ou cohortes de référence, ou
- un critère de position, par exemple la moyenne ou la médiane, ou un quartile, ou le minimum, ou le maximum de ces valeurs dans chacune de ces sous-populations ou cohortes de référence, ou
- une combinaison de ces valeurs ou moyennes, ou médiane, ou quartile, ou minimum, ou maximum.
La ou les valeurs de référence utilisées doivent permettre de discriminer le statut de répondeur de celui de non-répondeur.
II peut par exemple s'agir d'un seuil de décision ou de prédiction, établi en fonction de la distribution des valeurs des mesures dans chacune desdites sous-populations ou cohortes, et en fonction des niveaux de sensibilité (Se) et de spécificité (Spe) fixés par l'utilisateur (Se = VP / (VP + FN) et Sp = VN / (VN + FP), avec VP = le nombre de vrais positifs, FN = le nombre de faux négatifs, VN = le nombre de vrais négatifs, FP = le nombre de faux
positifs). Ce seuil de décision ou prédiction peut notamment être un seuil optimal qui attribue un poids équitable à la sensibilité (Se) et à la spécificité (Spe), tel que le seuil maximisant l'indice de Youden (J) défini par J = Se + Spe -1.
Alternativement ou complémentairement, il peut y avoir comparaison à plusieurs valeurs de référence. C'est notamment le cas lorsque les valeurs des mesures obtenues pour ledit sujet sont comparées à leurs valeurs dans chacune desdites sous-populations ou cohortes de référence, par exemple à l'aide d'une méthode de classification par apprentissage automatique ou par intelligence artificielle.
Ainsi, la comparaison de l'étape ii) peut par exemple être faite comme suit :
- choisir les niveaux de sensibilité (Se) et spécificité (Spe) que l'on souhaite donner à la méthode,
établir une fonction mathématique, linéaire ou non linéaire, notamment une fonction mathématique linéaire (par exemple, par la méthode mROC), à partir des valeurs de dosage desdits gènes dans chacune desdites sous-populations ou cohortes, et calculer le seuil de décision ou prédiction associé à cette fonction du fait des choix de niveaux de sensibilité (Se) et spécificité (Spe) faits (par exemple, en calculant le seuil maximisant l'indice de Youden),
combiner les valeurs de dosage obtenues pour ledit sujet dans cette fonction mathématique, pour obtenir une valeur de sortie, qui, comparée audit seuil de décision ou prédiction, permet d'attribuer un statut de répondeur ou un statut de non-répondeur audit sujet, c'est-à-dire de classer ledit sujet dans celle de ces sous- populations ou cohortes de référence, vis-à-vis de laquelle il a la plus forte probabilité d'appartenance. L'invention repose notamment sur la démonstration que, lorsqu'ils sont pris en combinaison, les niveaux d'expression de :
au moins deux gènes parmi HERC5, IL8, STAT2 ; et
- au moins un gène parmi CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18,
sont des biomarqueurs qui donnent une « signature » prédictive du statut de répondeur ou de non-répondeur.
La personne du métier disposant d'une combinaison de gènes décrite par l'invention est en mesure de construire un modèle de classification multivariée, notamment un modèle d'analyse statistique multivariée (par exemple une fonction mathématique linéaire ou non linéaire) ou un modèle d'apprentissage ou d'intelligence artificielle (par exemple, un algorithme d'apprentissage ou d'intelligence artificielle), à l'aide de ses connaissances générales dans le domaine des techniques et moyens statistiques, notamment dans le domaine du traitement et de l'interprétation statistiques de données, plus particulièrement de données biologiques. Un modèle de classification multivariée peut par exemple être construit, notamment préalablement construit, comme suit :
a) pour une population d'individus qui sont de la même espèce que ledit sujet, et qui sont infectés par un ou des VHC, déterminer pour chacun de ces individus, s'il répond ou ne répond pas à un traitement anti-VHC qui comprend l'administration d'interféron et de ribavirine, et classer ces individus en sous- populations distinctes selon qu'ils se sont montrés répondeurs ou non- répondeurs à ce traitement, constituant ainsi des cohortes de référence établies selon la réponse ou non-réponse de ces individus au traitement anti-VHC ; b) dans au moins un échantillon qui a été préalablement obtenu à partir de chacun desdits individus, dont la nature est identique à celle de l'échantillon dudit sujet, procéder aux mêmes mesures que celles faites pour ledit sujet à ladite étape i) ;
c) faire une comparaison inter-cohorte des valeurs des mesures obtenues à l'étape b), ou de la distribution de ces valeurs, pour construire un modèle de classification multivariée, qui induit un statut de répondeur au traitement anti-
VHC ou un statut de non-répondeur à ce traitement, à partir de la combinaison desdites valeurs de mesures obtenues à l'étape b).
Si ledit ou lesdits sujets dont on cherche à déterminer le statut de répondeur ou de non- répondeur présentent cette fibrose du fait d'une affection chronique hépatique particulière connue, par exemple, du fait d'une infection par un génotype particulier de VHC, on utilise avantageusement des individus de situation clinique comparable. Les individus sont par ailleurs choisis de sorte à constituer une cohorte statistiquement acceptable, ne présentant pas de biais particulier, notamment pas de biais clinique particulier. L'objectif
est de construire un modèle de classification multivariée qui soit le plus pertinent possible d'un point de vue statistique.
De préférence, les cohortes ou sous-populations d'individus comprennent le plus d'individus possibles. Si le nombre d'individus est trop faible, la comparaison ou le modèle construit peut ne pas être suffisamment fiable et généralisable en vue des applications médicales visées.
Notamment, on utilisera des cohortes ou sous-populations qui comprennent chacune au moins 30 individus, par exemple au moins 40 individus, de préférence au moins 50 individus, plus particulièrement au moins 70 individus, de manière encore plus particulière au moins 100 individus.
De préférence, un nombre comparable d'individus est présent dans chaque cohorte ou sous-population. Par exemple, le nombre d'individus d'une cohorte ou sous-population ne dépasse pas le seuil de 3 fois le nombre d'individus d'une autre cohorte, plus particulièrement le seuil de 2,5 fois le nombre d'individus d'une autre cohorte.
Lorsque l'analyse statistique menée utilise une fonction mathématique, telle que par exemple dans le cas d'une méthode mROC, le nombre d'individus requis par cohorte peut éventuellement être de l'ordre de 20 à 40 individus par cohorte de référence. Dans le cas d'une méthode d'analyse par apprentissage automatique, telle qu'une méthode KNN, WKNN, RF ou NN, il est préférable d'avoir au moins 30 individus par cohorte, de préférence au moins 70 individus, de manière encore plus particulière au moins 100 individus. Dans les exemples qui suivent, le nombre total d'individus compris dans l'ensemble des cohortes est de plus de 120.
Les individus qui composent les cohortes de référence sont des individus qui ont reçu un traitement anti-VHC, et dont le statut de répondeur ou de non-répondeur a été déterminé après application de ce traitement, notamment par mesure de la charge en VHC de ces individus à l'issue du traitement, et si cette charge est alors devenue indétectable, 6 mois après traitement.
Pour déterminer le statut de répondeur ou de non-répondeur d'un individu, et par suite, affecter cet individu à une cohorte de référence, la personne du métier peut mettre en œuvre tout moyen qu'elle juge approprié. Le test de quantification de l'ARN de VHC VERSANT® HCV-RNA 3.0 (bDNA) ASSAY de la société Siemens Healthcare Diagnostics (limite de quantification = 615 - 7 690 000 UI/mL) est un exemple de moyen permettant de mesurer la charge virale, et de déterminer si cette charge est devenue indétectable à l'issue du traitement et le reste 6 mois après traitement (individus
répondeurs), ou si cette charge est toujours détectable à l'issue du traitement (individus non-répondeurs).
Bien qu'il faille bien sûr limiter le nombre d'échantillons pris sur un même individu, notamment en cas de ponction biopsie hépatique, plusieurs échantillons peuvent être collectés sur un même individu. Dans ce cas, les résultats de dosage des différents échantillons d'un même individu sont considérés dans leur moyenne résultante ; il n'est pas considéré qu'ils puissent être équivalents à des valeurs de dosage obtenues sur des individus distincts.
La comparaison des valeurs des mesures dans chacune desdites cohortes peut se faire par tout moyen connu de la personne du métier. Elle se fait généralement par traitement et interprétation statistiques de ces valeurs. Cette comparaison statistique multivariée permet de construire un modèle de classification multivariée qui induit une valeur de statut de répondeur ou de non-répondeur à partir de la combinaison de ces valeurs.
Une fois que ledit modèle de classification multivariée est construit, il peut être utilisé pour l'analyse des valeurs des mesures obtenues pour ledit sujet, et surtout être ré-utilisé pour l'analyse des valeurs des mesures d'autres sujets. Ainsi, le ledit modèle de classification multivariée peut être établi de manière indépendante des mesures effectuées pour ledit ou lesdits sujets, et peut être préalablement construit.
Si besoin en était, plutôt que de constituer des cohortes et réunir les données des individus qui les constituent, la personne du métier peut, pour construire des exemples de modèles de classification multivariée conformes à l'invention, utiliser, à titre d'individus de cohortes, les sujets qui sont décrits en partie exemples ci-dessous, et peut, à titre de données d'individus de cohortes, utiliser les données qui sont présentées pour ces sujets dans les exemples ci-dessous, plus particulièrement en tableaux 12 à 15 ci-dessous.
De préférence, ledit modèle de classification multivariée est un système particulièrement discriminant. Avantageusement, ledit modèle de classification multivariée présente une aire sous la courbe ROC (ou AUC) et/ou une valeur d'erreur LOOCV particulière(s). L'acronyme « AUC » désigne Area Under the Curve, c'est-à-dire l'aire sous la courbe ROC (Receiver Operating Characteristic). L'acronyme « LOOCV » désigne Leave-One- Out-Cross-Validation, cf. Hastie, Tibishirani et Friedman, 2009.
La caractéristique d'AUC vient notamment s'appliquer aux modèles de classification multivariée, qui sont définis par une fonction mathématique, comme par exemple les modèles utilisant une méthode mROC de classification.
Les modèles d'intelligence artificielle ou d'apprentissage automatique multivariés ne sont quant à eux pas à proprement parler définis par une fonction mathématique. Néanmoins, dès lors qu'ils impliquent un seuil décisionnel (threshold), ils peuvent être appréhendés au moyen d'une courbe ROC, et donc d'un calcul d'AUC. C'est par exemple le cas des modèles utilisant une méthode RF {Random Forest). En effet, dans le cas de la méthode RF, une courbe ROC peut être calculée à partir des prédictions des échantillons OOB (Out-Of-Bag, ou « hors-du-sac » selon la traduction en langue française).
Ceux des modèles d'intelligence artificielle ou d'apprentissage automatique multivariés, qui ne pourraient être caractérisés par une valeur d'AUC, peuvent par contre, comme tous les autres modèles d'intelligence artificielle ou d'apprentissage automatique multivariés, être caractérisés par la valeur du paramètre « erreur de classification » qui leur est associée, telle que par exemple la valeur de l'erreur LOOCV.
Ladite valeur particulière d'AUC peut notamment être d'au moins 0,84, ou d'au moins 0,85 de préférence, avec un intervalle de confiance à 95% à au plus ± 11%, plus particulièrement à moins de ± 10,5%, encore plus particulièrement à moins de ± 9,5%, notamment à moins de ± 8,5%) ; cf. par exemple, combinaisons n°l à n°30 en tableaux 7 et 26 ci-dessous.
Ladite valeur particulière d'AUC peut être d'au moins 0,86, ou d'au moins 0,87, ou d'au moins 0,88, ou d'au moins 0,89, ou d'au moins 0,90 (de préférence, avec un intervalle de confiance à 95% à au plus ± 11%, plus particulièrement à moins de ± 10,5%, encore plus particulièrement à moins de ± 9,5%, notamment à moins de ± 8,5%). Cela peut notamment être le cas lorsqu'une des combinaisons n°l à n°30 présentée en tableau 2 ci-dessous est combinée à un ou plusieurs autres facteurs biologiques et/ou un ou plusieurs facteurs virologiques et/ou un ou plusieurs facteurs cliniques, par exemple à au moins un facteur virologique et/ou au moins un moins autre facteur biologique ; cf. par exemple, combinaison n°29 en outre combinée à deux autres facteurs (en l'occurrence charge virale avant traitement et concentration en gamma glutamyl transpeptidase) en tableau 26 ci- dessous.
Avantageusement, ladite valeur particulière d'erreur LOOCV est d'au plus 17%, ou d'au plus 16%), ou d'au plus 15%, ou d'au plus 14% (cf. par exemple, combinaisons n°l à 30 en tableau 3 ci-dessous).
Ladite valeur particulière d'erreur LOOCV peut être d'au plus 13%, ou d'au plus 12%, ou d'au plus 11%), ou d'au plus 10%, ou d'au plus 9%, ou d'au plus 8%, ou d'au plus 7%, ou d'au plus 6%>, ou d'au plus 5%, ou d'au plus 4%, ou d'au plus 3%, ou d'au plus 2%, ou d'au plus 1%). Cela peut notamment être le cas lorsqu'une des combinaisons n°l à n°30 présentée en tableau 2 ci-dessous est combinée à un ou plusieurs autres facteurs biologiques et/ou un ou plusieurs facteurs virologiques et/ou un ou plusieurs facteurs cliniques, par exemple à au moins un facteur virologique et/ou au moins un moins autre facteur biologique. Les performances diagnostiques d'un biomarqueur sont généralement caractérisées selon au moins un des deux indices suivants :
la sensibilité (Se), qui représente sa capacité à détecter la population dite
"pathologique" constituée d'individus dits "cas" (en l'occurrence, les patients qui ont un statut de non-répondeurs) ;
- la spécificité (Sp ou Spe), qui représente sa capacité à détecter la population dite
"saine", constituée des patients dits "contrôles" (en l'occurrence, les patients qui ont un statut de répondeurs).
Lorsqu'un biomarqueur génère des valeurs continues (par exemple, des valeurs de concentration), différentes positions de seuil prédictif {Prédiction Threshold ou PT) peuvent être définies afin d'assigner un échantillon à la classe positive (test positif : y = \).
La comparaison de la concentration du biomarqueur à la valeur PT permet de classer le sujet dans la cohorte à laquelle il a la plus forte probabilité d'appartenance.
Par exemple, si l'on considère une cohorte d'individus qui présentent un statut de répondeurs et une cohorte d'individus qui présentent un statut de non-répondeurs, et si l'on considère un sujet ou patient p, dont le statut doit être déterminé, pour lequel la valeur de la combinaison des mesures est V (V étant égal à Z dans le cas des modèles mROC), la règle décisionnelle est la suivante :
- lorsque la valeur moyenne de la combinaison des mesures dans la cohorte des individus "répondeurs" est inférieure à celle de la cohorte des individus "non-répondeurs" :
- si V > PT : le test est positif, un statut de non-répondeur est assigné audit patient p,
- si V < PT : le test est négatif, un statut de répondeur est assigné audit patient p,
ou
- lorsque la valeur moyenne de la combinaison des mesures dans la cohorte des individus "répondeurs" est supérieure à celle de la cohorte des individus "non-répondeurs" :
- si V > PT : le test est négatif, un statut de répondeur est assigné audit patient p, - si V < PT : le test est positif, un statut de non-répondeur est assigné audit patient p.
Comme la combinaison de biomarqueurs de l'invention est effectivement discriminante, les distributions, supposées gaussiennes, de la combinaison de biomarqueurs dans chaque population d'intérêt se différencient nettement. Il convient alors de définir la valeur seuil optimale qui conférera à cette combinaison de biomarqueurs les meilleures performances diagnostiques.
En effet, pour un seuil donné PT, les valeurs suivantes peuvent être calculées :
le nombre de vrais positifs : VP ;
- le nombre de faux négatifs : FN ;
le nombre de faux positifs : FP ;
le nombre de vrais négatifs : VN.
Les calculs des paramètres de sensibilité (Se) et spécificité (Sp) se déduisent des formules suivantes :
Se = VP / (VP + FN) ;
Sp = VN / (VN + FP).
La sensibilité peut donc être considérée comme étant la probabilité que le test soit positif sachant que le statut du sujet est un statut de non-répondeur ; et la spécificité peut être considérée comme étant la probabilité que le test soit négatif sachant que le statut du sujet est un statut de répondeur.
Une courbe ROC peut être utilisée pour visualiser le pouvoir prédictif du biomarqueur (ou pour l'approche multivariée, le pouvoir prédictif de la combinaison de biomarqueurs intégrés dans le modèle) pour différentes valeurs PT (Swets 1988). Chaque point de la courbe représente la Sensibilité versus (1 -Spécificité) pour une valeur spécifique PT.
Par exemple, si les concentrations du biomarqueur d'intérêt varient de 0 à 35, différentes valeurs PT peuvent être successivement positionnées à 0,5 ; 1 ; 1,5 ; ... ; 35. Ainsi, pour
chaque valeur PT, les échantillons testés sont classifiés, la sensibilité et la spécificité sont calculées et les points résultants sont reportés sur un graphique.
Plus la courbe ROC est proche de la première diagonale (droite reliant le coin bas gauche au coin haut droit), plus les performances discriminantes du modèle sont pauvres. Un test à fort pouvoir discriminant occupera la partie supérieure gauche du graphique. Un test peu discriminant avoisinera la première diagonale du graphique. L'aire sous la courbe ROC (AUC) est un bon indicateur de performance diagnostique. Celle-ci varie de 0,5 (biomarqueur non discriminant) à 1 (biomarqueur parfaitement discriminant). La valeur 0,76 induit un biomarqueur discriminant.
Une courbe ROC peut être approximée par deux principales techniques : paramétrique et non paramétrique (Shapiro 1999). Dans le premier cas, les données sont supposées suivre une distribution statistique spécifique (par exemple, gaussienne), qui est alors ajustée aux données observées pour produire une courbe ROC lissée. Des approches non paramétriques considèrent l'estimation de Se et (1-Sp) à partir des données observées. La courbe ROC empirique résultante n'est pas une fonction mathématique lissée, mais une courbe constante par morceaux.
Le choix du seuil ou du seuil optimal, noté δ (delta), dépend des priorités de l'utilisateur en termes de sensibilité et spécificité. Dans le cas de poids équitables attribués aux sensibilité et spécificité, ce dernier peut être défini comme le seuil maximisant l'indice de Youden (J = Se + Sp - 1).
Avantageusement, les moyens de l'invention permettent d'atteindre :
- une sensibilité [Se = VP / (VP + FN)] d'au moins 77% (ou plus), et/ou
- une spécificité [Sp = VN / (VN + FP)] d'au moins 80% (ou plus).
Conformément à l'invention, la sensibilité peut être d'au moins 77%, ou d'au moins 78%, ou d'au moins 79%, ou d'au moins 80%, ou d'au moins 81%, ou d'au moins 82%, ou d'au moins 83%, ou d'au moins 84% (cf., par exemple, combinaisons n° 1 à 30 en tableaux 3 et 23 ci-dessous).
Plus particulièrement, la sensibilité peut être d'au moins 80%, d'au moins 81%, ou d'au moins 82%, ou d'au moins 83%, ou d'au moins 84% (cf., par exemple, combinaisons n° 1 à 18 en tableau 3 ; cf. également la combinaison n°29 combinée à d'autres facteurs (en
l'occurrence un autre facteur biologique et un facteur virologique) en tableau 23 ci- dessous).
Alternativement ou complémentairement, la spécificité peut être d'au moins 79%, d'au moins 80%>, ou d'au moins 81%>, ou d'au moins 82%, ou d'au moins 83%>, ou d'au moins 84%o, ou d'au moins 85%>, ou d'au moins 86%>, ou d'au moins 87%, ou d'au moins 88%>, ou d'au moins 89%>, ou d'au moins 90% {cf., par exemple, combinaisons n° 1 à 30 en tableaux 3 et 23 ci-dessous).
Plus particulièrement, la spécificité peut être d'au moins 84%>, ou d'au moins 85%>, ou d'au moins 86%>, ou d'au moins 87%, ou d'au moins 88%, ou d'au moins 89%, ou d'au moins 90% {cf., par exemple, combinaisons n° 1 à 24 en tableau 3).
Toutes les combinaisons de ces seuils de sensibilité et de ces seuils de spécificité sont explicitement incluses dans le contenu de la demande {cf., par exemple, combinaisons n° 1 à 30 en tableaux 3 et 23 ci-dessous).
Plus particulièrement, toutes les combinaisons comprenant au moins la combinaison d'un seuil de sensibilité et d'un seuil de spécificité sont explicitement incluses dans le contenu de la demande. Alternativement ou complémentairement à ces caractéristiques de sensibilité et/ou spécificité, les Valeurs de Prédiction Négative (VPN) atteintes, ou susceptibles d'être atteintes, par les moyens de l'invention sont particulièrement élevées.
La VPN est égale à VN / (VN+FN), avec VN = Vrais Négatifs et FN = Faux Négatifs, et représente donc la probabilité que le sujet testé soit répondeur au traitement anti-VHC, sachant que le test de l'invention est négatif.
Conformément à l'invention, la VPN peut être d'au moins 80%, ou d'au moins 81%, ou d'au moins 82%, ou d'au moins 83%, ou d'au moins 84%, ou d'au moins 85%, ou d'au moins 86%, ou d'au moins 87% {cf., par exemple, combinaisons n° 1 à 30 en tableaux 3 et 23 ci-dessous).
Plus particulièrement, la VPN peut être d'au moins d'au moins 84%, ou d'au moins 85%, ou d'au moins 86%, ou d'au moins 87% {cf., par exemple, combinaisons n° 2 à 6, 14 à 28 en tableau 3 ; cf. également la combinaison n°29 combinée à d'autres facteurs (en l'occurrence un autre facteur biologique et un facteur virologique) en tableau 23 ci- dessous).
Toutes les combinaisons de seuils de VPN et/ou de seuils de sensibilité et/ou de seuils de spécificité sont explicitement incluses dans le contenu de la demande.
Plus particulièrement, toutes les combinaisons comprenant au moins la combinaison d'un seuil de sensibilité et d'un seuil de VPN sont explicitement incluses dans le contenu de la demande.
Alternativement ou complémentairement à ces caractéristiques de sensibilité et/ou spécificité et/ou de VPN, les Valeurs de Prédiction Positive (VPP) atteintes, ou susceptibles d'être atteintes, par les moyens de l'invention sont particulièrement élevées. La VPP est égale à VP / (VP + FP) avec VP = les Vrais Positifs et FP = Faux Positifs, et représente donc la probabilité que le sujet testé soit non-répondeur, sachant que le test de l'invention est positif.
Conformément à l'invention, la VPP peut être d'au moins d'au moins 72%, ou d'au moins 73%), ou d'au moins 74%, ou d'au moins 75%, ou d'au moins 76%, ou d'au moins 77%, ou d'au moins 78%, au d'au moins 79%, ou d'au moins 80%, ou d'au moins 81%, ou d'au moins 82%, ou d'au moins 83%, ou d'au moins 84%, ou d'au moins 85%, ou d'au moins 86%), ou d'au moins 87%, ou d'au moins 88%, ou d'au moins 89% {cf., par exemple, combinaisons n° 1 à 30 en tableaux 3 et 23 ci-dessous).
Plus particulièrement, la VPP peut être d'au moins 78%, au d'au moins 79%, ou d'au moins 80%, ou d'au moins 81%, ou d'au moins 82%, ou d'au moins 83%, ou d'au moins 84%), ou d'au moins 85%, ou d'au moins 86%, ou d'au moins 87%, ou d'au moins 88%, ou d'au moins 89% {cf., par exemple, combinaisons n° 1 à 24 en tableau 3 ci-dessous).
Toutes les combinaisons de seuils de VPP et/ou VPN et/ou de seuils de sensibilité et/ou de seuils de spécificité sont explicitement incluses dans le contenu de la demande.
Plus particulièrement, toutes les combinaisons comprenant au moins la combinaison d'un seuil de sensibilité et d'un seuil de VPP sont explicitement incluses dans le contenu de la demande. Plus particulièrement, toutes les combinaisons comprenant au moins un desdits seuils de VPN et/ou au moins un desdits seuils de sensibilité, plus particulièrement au moins un desdits seuils de VPN et un desdits seuils de sensibilité, plus particulièrement au moins un desdits seuils de VPN et un desdits seuils de sensibilité et un desdits seuils de spécificité, sont incluses dans la demande.
Les combinaisons prédictives de l'invention comprennent des combinaisons des niveaux d'expression de gènes, choisis comme ci-dessus indiqué.
Comme indiqué plus en détail ci-dessous, et comme illustré dans les exemples ci-dessous {cf. exemple 2d) ci-dessous), il peut néanmoins être choisi de faire intervenir dans ces combinaisons un ou plusieurs facteurs autres que les niveaux d'expression de ces gènes, pour combiner cet ou ces autres facteurs et les niveaux d'expression des gènes choisis en une règle décisionnelle.
Cet ou ces autres facteurs sont préférablement choisis de sorte à construire un modèle de classification dont le pouvoir prédictif est encore amélioré par rapport au modèle qui ne comprendrait pas cet ou ces autres facteurs.
En sus du niveau d'expression desdits gènes choisis, on peut donc également mesurer ou doser un ou plusieurs autres facteurs, tels qu'un ou plusieurs facteurs cliniques et/ou un ou plusieurs facteurs virologiques et/ou un ou plusieurs facteurs biologiques autres que le niveau d'expression desdits gènes choisis {cf. par exemple, les tableaux 23 à 26 ci- dessous, qui en présentent un exemple pour la combinaison n°29).
La(les) valeur(s) de cet(ces) autre(s) facteur(s) peuvent alors être prises en compte pour construire le modèle de classification multivariée, et peuvent ainsi conduire à des performances de classification encore améliorées, plus particulièrement à des caractéristiques de sensibilité et/ou spécificité et/ou VPN et/ou VPP augmentées.
Par exemple, si l'on compare les valeurs présentées pour la combinaison n°29 en tableaux 3 et 7 d'une part, et en tableaux 23 et 26 d'autre part {cf. ci-dessous), on constate que les valeurs de sensibilité, spécificité, VPN, VPP et AUC augmentent (sans pour autant faire diminuer la spécificité) lorsqu'à la combinaison des niveaux de transcription desdits gènes choisis, sont outre combinés d'autres facteurs, notamment un autre facteur biologique (en l'occurrence, PAL) et un facteur virologique (en l'occurrence, CVavantTTT).
Avantageusement, lorsqu'un ou plusieurs autres facteurs sont combinés à une combinaison de gènes choisis parmi ladite liste de vingt-huit gènes de l'invention, au moins l'une des caractéristiques d'AUC (le cas échéant, d'erreur LOOCV), de sensibilité, de spécificité, de VPN et de VPP, s'en trouve améliorée.
Comme précédemment indiqué, et comme illustré ci-dessous, les moyens de l'invention font intervenir le dosage du niveau d'expression de :
au moins deux gènes parmi HERC5, IL8, STAT2 ; et
- au moins un gène parmi CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS 1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18.
Avantageusement, le nombre total des gènes ainsi choisis est de 3, 4, 5 ou 6, plus particulièrement de 3, 4, ou 5, par exemple 4 ou 5.
Le choix des gènes est fait selon les exigences ou souhaits de performances à atteindre, par exemple en fonction de la sensibilité et/ou spécificité et/ou VPN et/ou VPP que l'on souhaite ou désire atteindre. Bien entendu, plus le nombre de gènes choisis est faible, plus la mise en œuvre des moyens de l'invention est simple.
Tous les choix possibles de gènes sont explicitement inclus dans la demande.
De manière similaire à ce qui a été indiqué ci-dessus pour les seuils de sensibilité, les seuils de spécificité, les seuils de VPN, les seuils de VPP, et le nombre total de gènes choisis, toutes les combinaisons de gènes choisis dans chacune des listes de gènes et/ou de nombres totaux de gènes choisis et/ou de seuils de sensibilité et/ou de seuils de spécificité et/ou de seuils de VPN et/ou de seuils de VPP sont explicitement incluses dans le contenu de la demande.
Trente exemples de combinaisons de gènes conformes à l'invention sont présentés dans le tableau 2 ci-dessous.
Les tableaux 3 à 7 ci-dessous illustrent les performances de la combinaison des niveaux de transcription de quatre ou cinq gènes (en l'occurrence, valeur de Ct qui a été mesurée pour les transcrits ARN de ce gène et qui a été normalisée par la méthode du 2~ACt).
Les tableaux 23 à 26 ci-dessous illustrent les performances de la combinaison des niveaux de transcription de cinq gènes choisis conformément à l'invention (combinaison n°29), lorsque ces niveaux sont en outre combinés à d'autres facteurs (en l'occurrence, un autre facteur biologique tel que la concentration en phosphatase alcaline, et un facteur virologique tel que la charge en VHC avant traitement).
Par exemple, lesdits gènes choisis parmi ladite liste de vingt-huit gènes de l'invention sont :
- HERC5, IFI44, IL8, MDK (combinaison n° l), ou
- HERC5, IFI44, IL8, MDK, OAS 1 (combinaison n°2), ou
- G1P2, IL8, OCLN, STAT2, USP18 (combinaison n°3), ou
- CXCL6, IFIT4, IL8, STAT1, STAT2 (combinaison n°4), ou
- CXCL6, IL8, MX1, PLSCR1, STAT2 (combinaison n°5), ou
- CXCL6, IL8, MX1, STAT1, STAT2 (combinaison n°6), ou
- HERC5, IFI44, IL8, MDK, STMN2 (combinaison n°7), ou
- HERC5, IL8, PLSCR1, STMN2 (combinaison n°8), ou
- HERC5, IFI35, IFIT1, IL8, MX1 (combinaison n°9), ou
- HERC5, IFI44, IL8, OAS1, RSAD2 (combinaison n°10), ou
- HERC5, IFI44, IL8, ITGA2, MDK (combinaison n°l l), ou
- HERC5, IFIT1, IL8, MX1 (combinaison n°12), ou
- HERC5, IL8, MDK, OAS3, RSAD2 (combinaison n°13), ou
- CCL21, G1P2, IL8, MDK, STAT2 (combinaison n°14), ou
- G1P2, IFITM1, IL8, OCLN, STAT2 (combinaison n°15), ou
- G1P2IL8, OAS1, OCLN, STAT2 (combinaison n°16), ou
- CLDNl, IL8, OAS2, OAS3, STAT2 (combinaison n°17), ou
- CXCL6, IFITM1, IL8, MX1, STAT2 (combinaison n°18), ou
- CXCL6, IFIT1, IL8, STAT2 (combinaison n°19), ou
- FOXOl, G1P2, IL8, MDK, STAT2 (combinaison n°20), ou
- CXCL6, G1P2, IL8, MDK, STAT2 (combinaison n°21), ou
- CXCL6, IL8, OAS2, STAT1, STAT2 (combinaison n°22), ou
- FOXOl, IFI27, IFITM1, IL8, STAT2 (combinaison n°23), ou
- HERC5, IFI35, IFI44, IL8, OAS2 (combinaison n°24), ou
- IL8, CCL21, G1P3, HERC5, RSAD2 (combinaison n°25), ou
- IL8, G1P3, HERC5, OAS3, RSAD2 (combinaison n°26), ou
- IL8, ITGA2, G1P3, HERC5, RSAD2 (combinaison n°27), ou
- IL8, STMN2, G1P3, HERC5, RSAD2 (combinaison n°28), ou
- IL8, CLDNl, G1P3, HERC5, RSAD2 (combinaison n°29), ou
- IL8, G1P3, HERC5, LGALS3BP, RSAD2 (combinaison n°30).
Selon un mode de réalisation de l'invention, lesdits au moins deux gènes choisis parmi HERC5, IL8, STAT2 comprennent IL8, plus particulièrement IL8 et HERC5 ou IL8 et STAT2. C'est notamment des combinaisons n°l à n°30 ci-dessus listées.
Selon un mode de réalisation alternatif ou complémentaire de l'invention, le nombre de gènes choisis parmi CCL21, CLDNl, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44,
IFIT1, IFIT4, IFITMl, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCRl, RSAD2, STATl, STMN2 et USP18, est de 1, 2, 3 ou 4, plus particulièrement de 1, 2 ou 3, par exemple de 2 ou 3. Selon un mode de réalisation alternatif ou complémentaire de l'invention, le nombre de gènes choisis parmi CCL21, CLDNl, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITMl, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCRl, RSAD2, STATl, STMN2 et USP18, est d'au moins deux, et ces au moins deux gènes comprennent au moins deux gènes parmi :
CXCL6, IFI44, MDK, MX1 et RSAD2.
Selon un mode de réalisation alternatif ou complémentaire de l'invention, ledit au moins un gène choisi parmi CCL21, CLDNl, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITMl, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCRl, RSAD2, STATl, STMN2 et USP18, est :
CXCL6, IFI44, MDK, MX1 ou RSAD2.
C'est notamment le cas des combinaisons n°l, 2, 4, 5, 6, 7, 9, 10, 11, 13, 14, 18, 19, 20, 21, 22, 24, 25, 26, 27, 28, 29 et 30 ci-dessus listées.
Selon un mode de réalisation alternatif ou complémentaire de l'invention, le nombre de gènes choisis parmi CCL21, CLDNl, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITMl, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCRl, RSAD2, STATl, STMN2 et USP18, est d'au moins deux, et ces au moins deux gènes comprennent IFI44 et MDK. C'est notamment le cas des combinaisons n°l, 2, 7 et 11 ci-dessus listées.
Selon un mode de réalisation alternatif ou complémentaire de l'invention, lesdits gènes choisis à l'étape i) ne comprennent pas CLDNl, G1P3, IFI27, IFITMl, ITGA2, OCLN et PLSCRl . C'est notamment le cas des combinaisons n°l, 2, 4, 6, 7, 9, 10, 12, 13, 14, 19, 20, 21, 22 et 24 ci-dessus listées. Les gènes CLDNl, G1P3, IFI27, IFITMl, ITGA2, OCLN et PLSCR sont ceux des gènes de ladite liste de vingt-huit gènes de l'invention, qui codent une protéine dont la localisation est strictement membranaire.
Selon un mode de réalisation alternatif ou complémentaire de l'invention, lesdits gènes choisis conformément à l'invention ne comprennent aucun gène qui code une protéine dont la localisation est strictement membranaire.
De tels gènes ne permettent pas le dosage de leurs niveaux d'expression dans un échantillon de fluide biologique dudit sujet (tel qu'un échantillon de fluide intracorporel, tel que sang, sérum, plasma, ou un échantillon d'urine). Selon un mode de réalisation alternatif ou complémentaire de l'invention :
- le nombre de gènes choisis parmi CCL21, CLDNl, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITMl, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCRl, RSAD2, STATl, STMN2 et USP18, est d'au moins deux, et ces au moins deux gènes comprennent au moins deux gènes parmi CXCL6, IFI44, MDK, MX1 et RSAD2, plus particulièrement parmi IFI44, MDK, MX1 ou
RSAD2, et
lesdits gènes choisis à l'étape i) ne comprennent pas CLDNl, G1P3, IFI27, IFITMl, ITGA2, OCLN et PLSCRl, et/ou lesdits gènes choisis conformément à l'invention ne comprennent aucun gène qui code une protéine dont la localisation est strictement membranaire.
C'est notamment le cas des combinaisons n°l, 2, 5, 11, 18, 25, 26, 27, 28, 29 et 30 ci- dessus listées.
Tableau 2 : exemples de combinaisons des niveaux d'expression de quatre ou cinq gènes n° de la
Gènes choisis
combinaison
1
HERC5 IFI44 IL8 MDK
2
HERC5 IFI44 IL8 MDK OAS1
3
G1P2 IL8 OCLN STAT2 USP18
4
CXCL6 IFIT4 IL8 STAT1 STAT2
5
CXCL6 IL8 MX1 PLSCR1 STAT2
6
CXCL6 IL8 MX1 STAT1 STAT2
7
HERC5 IFI44 IL8 MDK STMN2
8
HERC5 IL8 PLSCR1 STMN2
9
HERC5 IFI35 IFIT1 IL8 MX1
10
HERC5 IFI44 IL8 OAS1 RSAD2
11
HERC5 IFI44 IL8 ITGA2 MDK
12
HERC5 IFIT1 IL8 MX1
13
HERC5 IL8 MDK OAS3 RSAD2
14
CCL21 G1P2 IL8 MDK STAT2
Tableau 2 (suite et fin) : exemples de combinaisons des niveaux d'expression de quatre ou cinq gènes n° de la
Gènes choisis
combinaison
15
G1P2 IFITM1 IL8 OCLN STAT2
16
G1P2 IL8 OAS1 OCLN STAT2
17
CLDN1 IL8 OAS2 OAS3 STAT2
18
CXCL6 IFITM1 IL8 MX1 STAT2
19
CXCL6 IFIT1 IL8 STAT2
20
FOXOl G1P2 IL8 MDK STAT2
21
CXCL6 G1P2 IL8 MDK STAT2
22
CXCL6 IL8 OAS2 STAT1 STAT2
23
FOXOl IFI27 IFITM1 IL8 STAT2
24
HERC5 IFI35 IFI44 IL8 OAS2
25
IL8 CCL21 G1P3 HERC5 RSAD2
26
IL8 G1P3 HERC5 OAS3 RSAD2
27
IL8 ITGA2 G1P3 HERC5 RSAD2
28
IL8 STMN2 G1P3 HERC5 RSAD2
29
IL8 CLDN1 G1P3 HERC5 RSAD2
30
IL8 G1P3 HERC5 LGALS3BP RSAD2
Tableau 3 : valeurs de sensibilité (Se), spécificité (Spe), Valeur Prédictive Négative (VPN), Valeur Prédictive Positive (VPP), et d'err LOOCV qui peuvent être associées aux combinaisons des niveaux de transcription de quatre ou cinq gènes choisis conformémen l'invention (transcrits ARN, plus particulièrement ARN d'un prélèvement de tissu ou cellules hépatiques)
Erreur LOOCV = erreur calculée par validation croisée ou « Leave-One-Out Cross Validation » (Hastie, Tibishirani et Friedman, 2009) ; ND = déterminée
Tableau 3 (suite) : valeurs de sensibilité (Se), spécificité (Spe), Valeur Prédictive Négative (VPN), Valeur Prédictive Positive (VPP) d'erreur LOOCV qui peuvent être associées aux combinaisons des niveaux de transcription (ARN) de quatre ou cinq gènes cho conformément à l'invention (transcrits ARN, plus particulièrement ARN d'un prélèvement de tissu ou cellules hépatiques)
Erreur LOOCV = erreur calculée par validation croisée ou « Leave-One-Out Cross Validation » (Hastie, Tibishirani et Friedman, 2009) ; ND = déterminée
Tableau 3 (suite et fin) : valeurs de sensibilité (Se), spécificité (Spe), Valeur Prédictive Négative (VPN), Valeur Prédictive Positive (VPP) d'erreur LOOCV qui peuvent être associées aux combinaisons des niveaux de transcription (ARN) de quatre ou cinq gènes choisis conformément à l'invention (transcrits ARN, plus particulièrement ARN d'un prélèvement de tissu ou cellules hépatiques)
Erreur LOOCV = erreur calculée par validation croisée ou « Leave-One-Out Cross Validation » (Hastie, Tibishirani et Friedman, 2009) ; ND = déterminée
ND = non déterminée
Tableau 4 : exemples de paramètres de réglage pour des modèles de classification établis selon la méthode WKNN n° de la combinaison
Distance (D) Nombre de voisins (k) Kernel (K)
{cf. tableaux 2 et 3 ci-dessus)
1 1 5 inverse
2 2 4 triangulaire
7 1 6 triangulaire
8 1 7 cosine
9 1 14 tri-pondéré
10 1 6 cosine
11 2 3 inverse
12 1 10 triangulaire
13 2 3 inverse
Tableau 5 : exemples de modèles mROC (fonction Z) combinant les niveaux de transcription de quatre ou cinq gènes choisis (transc ARN, plus particulièrement ARN d'un prélèvement de tissu ou cellules hépatiques), et exemple de seuil PT pour ces fonctions l'occurrence, seuil maximisant l'indice de Youden δ)
n° de Fonction Z combinant les niveaux de Nom de la Seuil combinaison transcription (ARN) des gènes choisis fonction PT
{cf. tableaux 2 et 3 (δ) ci-dessus)
25 Z = 0,218 x CCL21* + 0,441 x G1P3* + 0,98 x HERC5* + 0,121 x IL8 - 0,482 x RSAD2* Z25ARN -2, 182
26 Z = 0,437 x G1P3* + 0,99 x HERC5* + 0,131 x IL8 + 0,151 x OAS3* - 0,522 x RSAD2* Z26ARN -1,239
27 Z = 0,508 x G1P3* + 1,036 x HERC5* + 0,124 x IL8 + 0,084 x ITGA2 - 0,467 x RSAD2* Z27ARN -1,444
28 Z = 0,511 x G1P3* + 1,038 x HERC5* + 0,127 x IL8 - 0,468 x RSAD2* + 0,017 x STMN2 Z28ARN -1,472
29 Z = 0,134 x CLDNl* + 0,488 x G1P3* + 0,966 x HERC5* + 0,129 x IL8 - 0,487 x RSAD2* Z29ARN -1,281
30 Z = 0,4 x G1P3*+ 1,028 x HERC5* + 0,13 x IL8 + 0, 11 x LGALS3BP* - 0,481 x RSAD2* Z30ARN -1,594
Tableau 6 : liste des gènes, pour lesquels il est conseillé de normaliser les valeurs de dosage mesurées (notamment, les valeurs de dosage niveaux de transcription ARN, plus particulièrement lorsque ces ARN proviennent d'un prélèvement de tissu ou cellules hépatiques), exemple par une normalisation Box-Cox, et exemple de valeurs de paramètre Box-Cox (λ) utilisables dans les fonctions Z indiquées tableau 5 ci-dessus.
Gènes, pour lesquels
Exemple de valeur de
il est conseillé de
paramètre Box-Cox (λ)
normaliser la valeur
utilisable pour les fonctions Z
du niveau de
du tableau 5 ci-dessus
transcription (ARN)
CCL21 0,02
G1P3 0, 19
HERC5 0, 19
RSAD2 -0,05
OAS3 0, 13
CLDN1 0,68
LGALS3BP -0,06
Tableau 7 : AUC des fonctions Z du tableau 5 n° de combinaison Nom de la fonction AUC AUC limite AUC limite
{cf. tableau 2 ci-dessus) {cf. tableau 5 ci-dessus) inférieure supérieure
25 Z25ARN
0,854 0,759 0,916
26 Z26ARN
0,853 0,758 0,915
27 Z27ARN
0,854 0,757 0,916
28 Z28ARN
0,855 0,759 0,917
29 Z29ARN
0,857 0,761 0,919
30 Z30ARN
0,856 0,761 0,917
En sus des niveaux d'expression desdits gènes choisis parmi la liste de dix-sept gènes de l'invention, les moyens de l'invention peuvent en outre comprendre la combinaison d'un ou plusieurs autres facteurs, tels que :
- un ou plusieurs facteurs cliniques, tels que :
o sexe (féminin F ou masculin M),
o âge à la date du prélèvement (Age), par exemple, âge à la date de la PBH, âge à la date de la cytoponction hépatique, âge à la date du prélèvement de sang, de sérum, de plasma ou d'urine,
o âge du patient à la date de la contamination,
o âge du patient au début du traitement,
o indice de masse corporelle (IMC),
o indice de sensibilité à l'insuline (HOMA),
o diabète,
o consommation d'alcool,
o degré de stéatose,
o mode de contamination,
o activité Metavir,
o score de fibrose hépatique mesuré selon le système Metavir (score F Metavir) ou selon le système Ishak ;
et/ou
- un ou plusieurs facteurs virologiques, tels que :
o génotype viral, plus particulièrement génotype du ou des VHC, o durée de l'infection,
o charge virale avant traitement, plus particulièrement charge en VHC avant traitement (CVavantTTT),
o charge virale, plus particulièrement charge en VHC, mesurée chez le patient à la date du début du traitement (charge virale à J0), o charge virale, plus particulièrement charge en VHC, mesurée chez le patient à la date du prélèvement (charge virale à PBH, charge virale à la date de la cytoponction hépatique, charge virale à la date du prélèvement de sang, de sérum, de plasma ou d'urine) ;
et/ou
- un ou plusieurs facteurs biologiques autres que les niveaux d'expression desdits gènes choisis, qui peuvent notamment être choisis parmi des concentrations, teneurs ou taux en protéines intracorporelles, des concentrations, teneurs ou taux en métabolites intracorporels, des concentrations, teneurs ou taux en éléments figurés du sang, des mesures représentatives de la quantité de fer circulant, de tels que :
o concentration en haptoglobine (Hapto),
o concentration en apolipoprotéine Al (ApoAl),
o teneur en bilirubine totale (BLT),
o concentration en gamma glutamyl transpeptidase (GGT),
o concentration en aspartate aminotransférase (AST),
o concentration en alanine aminotransférase (ALT),
o teneur en plaquettes (PLQ),
o taux de prothrombine (TP),
o teneur en cholestérol HDL (Chol-HDL),
o teneur en cholestérol total,
o concentration en ferritine (Ferritine),
o teneur glycémique (glycémie),
o concentration en peptide C,
o teneur en insuline (insulinémie),
o concentration en triglycérides (TG),
o teneur en albumine,
o coefficient de saturation en fer de la transferrine (CS),
o concentration en phosphatase alcaline (PAL).
Les tableaux 23 à 26 ci-dessous (combinaison n°29) illustrent les performances de la combinaison des niveaux de transcription de cinq gènes (en l'occurrence, valeur de Ct qui a été mesurée pour les transcrits ARN de ce gène et qui a été normalisée par la méthode du 2"ACt), combinée en outre à un ou plusieurs autres facteurs biologiques et/ou un ou plusieurs virologiques et/ou un ou plusieurs facteurs cliniques (en l'occurrence à un autre facteur biologique tel que la concentration en phosphatase alcaline, et un facteur virologique tel que la charge en VHC avant traitement).
Cet ou ces autres facteurs peuvent être mesurés sur un échantillon de nature différente de celui utilisé pour mesurer les niveaux d'expression desdits gènes choisis. Par exemple,
l'échantillon biologique pour la mesure des niveaux d'expression desdits gènes choisis parmi ladite liste de vingt-huit gènes de l'invention peut être un échantillon de PBH ou de cyto-ponction hépatique, et l'échantillon biologique pour la mesure des valeurs desdits autres facteurs peut être un échantillon de fluide biologique, tel que sang, plasma ou sérum ou urine. De même, la nature du niveau d'expression mesuré peut être différente ; par exemple, pour la mesure du niveau d'expression desdits gènes choisis, on peut mesurer les niveaux de leur transcription en ARN, alors que, pour ceux desdits autres facteurs qui sont des facteurs biologiques, le niveau d'expression mesuré sera généralement une concentration protéique.
Le dosage ou la mesure de certains de ces facteurs pourrait parfois être considéré comme le dosage du niveau de traduction (mesure de la concentration protéique) d'un gène autre qu'un gène choisi conformément à l'invention (par exemple PAL ; cf. exemple 2d) ci- dessous).
Le nombre de gènes dont le niveau d'expression est dosé, et qui ne sont pas des gènes choisis parmi ladite liste de vingt-huit gènes de l'invention (par exemple PAL), est de préférence au maximum de 18, plus particulièrement de 14 ou moins, plus particulièrement de 11 ou moins, plus particulièrement de 6 ou moins, plus particulièrement de 4 ou 3 ou 2 ou 1 ou 0, plus particulièrement de 3 ou 2 ou 1 ou 0, notamment de 2 ou 1 ou 0.
Avantageusement, cet ou ces autres facteurs sont ou comprennent un ou plusieurs facteurs biologiques, notamment la concentration en phosphatase alcaline (PAL).
L'exemple 2d) ci-dessus donne une illustration de telles combinaisons.
Alternativement ou complémentairement, cet ou ces facteurs peuvent plus particulièrement être ou comprendre un ou plusieurs facteurs parmi les facteurs virologiques suivants :
o charge virale avant traitement (CVavantTTT) ; et/ou
o génotype du ou des VHC.
L'exemple 2d) et 3b) ci-dessus donne une illustration de telles combinaisons.
Alternativement ou complémentairement, ce ou ces facteurs peuvent plus particulièrement être ou comprendre un ou plusieurs facteurs cliniques, notamment le facteur clinique score
de fibrose hépatique, qui peut être mesuré selon le système Metavir (score F Metavir) ou selon le système Ishak.
Selon un mode de réalisation particulier de l'invention, en sus du dosage des niveaux d'expression de gènes choisis parmi ladite liste de vingt-huit gènes de l'invention, les moyens de l'invention peuvent en outre comprendre le dosage ou la mesure des autres facteurs suivants :
- un ou plusieurs facteurs cliniques qui est ou comprennent le score de fibrose hépatique (qui peut être mesuré selon le système Metavir (score F Metavir) ou selon le système Ishak) ; et/ou
- un ou plusieurs facteurs virologiques qui est ou comprennent le génotype du ou des VHC et/ou la charge en VHC avant traitement ; et/ou
- un ou plusieurs facteurs biologiques autres que les niveaux d'expression de gènes choisis parmi CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18, qui est ou comprennent la concentration en phosphatase alcaline (PAL).
Alternativement ou complémentairement, en sus du dosage des niveaux d'expression de gènes choisis parmi ladite liste de vingt-huit gènes de l'invention, les moyens de l'invention peuvent en outre comprendre :
le fait de déterminer le score de fibrose hépatique dudit sujet, plus particulièrement le fait de déterminer si le score de fibrose hépatique dudit sujet est un score qui, selon le système de score Metavir, est d'au plus Fl ou d'au moins F2, plus particulièrement d'au moins F2 ; et/ou
le fait de déterminer si le ou les VHC dont est infecté ledit sujet comprennent un VHC de génotype 1, 4, 5 ou 6, plus particulièrement de génotype 1 ou 4, plus particulièrement de génotype 1.
Ces déterminations peuvent être faites lors de l'étape i), ou être faites indépendamment de l'étape i).
Tableau 23 : valeurs de sensibilité (Se), spécificité (Spe), Valeur Prédictive Négative (VPN), Valeur Prédictive Positive (VPP), et d'err LOOCV qui peuvent être associées à une combinaison des niveaux de transcription de cinq gènes choisis conformément à l'invent (transcrits ARN, plus particulièrement lorsque ces ARN sont issus d'un prélèvement de tissu ou cellules hépatiques), combinée en out d'autres facteurs biologiques et/ou à des facteurs cliniques et/ou à des facteurs virologiques
(*) : les valeurs de Se, Spe, VPN, VPP et Erreur LOOCV indiquées sont celles de la fonction du tableau 24 ci-dessous
(§) : plus particulièrement, ARN issus d'un prélèvement de tissu ou cellules hépatiques
10 ND = non déterminée
Tableau 24 : exemple de modèle mROC (fonction Z) pour une combinaison de cinq gènes choisis conformément à l'invention (dosage leurs niveaux de transcription en ARN), combinée en outre à d'autres facteurs (facteurs biologiques autres que les niveaux d'expressio gènes choisis conformément à l'invention et/ou facteurs cliniques et/ou facteurs virologiques), et exemple de seuil PT pour cette fonction l'occurrence, seuil maximisant l'indice de Youden δ),
(§) : plus particulièrement, ARN issus d'un prélèvement de tissu ou cellules hépatiques
Tableau 25 : exemple de valeurs de paramètre Box-Cox (λ) utilisables dans la fonction Z indiquée au tableau 23 ci-dessus.
(*) : paramètre lambda des transformations Box-Cox [BMQ* = (ΒΜ0)λ-1)/λ] Tableau 26 : pour la fonction du tableau 24, valeur d'AUC
Nom de la AUC AUC limite AUC limite
fonction inférieure supérieure
Z29ARNsupp
0,904 0,828 0,948
{cf. tableau 24)
Selon un aspect complémentaire de l'invention, la demande est relative à des produits ou réactifs pour la détection et/ou la détermination et/ou le dosage desdites mesures, plus particulièrement pour la détection et/ou le dosage des niveaux d'expression desdits gènes choisis, et à des articles manufacturés, des compositions, des compositions pharmaceutiques, des kits, des tubes, des supports solides comprenant de tels réactifs, ainsi qu'à des systèmes informatiques (notamment, produit programme d'ordinateur et dispositif informatique), qui sont spécialement adaptés à la mise en œuvre d'une méthode de l'invention. La demande est notamment relative à un réactif qui détecte de manière spécifique un produit de transcription (ARN) d'un desdits gènes choisis parmi ladite liste de vingt-huit gènes de l'invention, ou un produit de traduction d'un desdits gènes choisis parmi ladite liste de vingt-huit gènes de l'invention (protéine, ou forme post-traductionnelle de cette protéine, telle que fragment spécifique de cette protéine).
La demande est notamment relative à des réactifs qui détectent de manière spécifique chacun des produits de transcription (ARN) desdits gènes choisis parmi ladite liste de vingt-huit gènes de l'invention, ou chacun des produits de traduction desdits gènes choisis parmi ladite liste de vingt-huit gènes de l'invention (protéine, ou forme post- traductionnelle de cette protéine, telle que fragment spécifique de cette protéine).
Avantageusement, un ensemble de tels réactifs est formé, qui détecte chacun desdits produits de transcription desdits gènes choisis et/ou qui détecte chacun desdits produits de traduction desdits gènes choisis parmi ladite liste de vingt-huit gènes de l'invention, c'est- à-dire un ensemble de réactifs qui détecte de manière spécifique au moins un produit d'expression pour chacun de ces gènes.
De préférence, lesdits réactifs non seulement détectent spécifiquement un produit de transcription ou traduction, mais permettent également de le quantifier.
La demande est notamment relative à un article manufacturé comprenant lesdits réactifs comme produit de combinaison (ou sous forme combinée, ou en préparation combinée), notamment pour leur utilisation simultanée, séparée ou étalée dans le temps. Cet article manufacturé peut par exemple se présenter sous la forme d'un ensemble de réactifs, ou d'un kit.
Bien entendu les caractéristiques de combinaisons de gènes choisies décrites ci-dessus, ainsi que celles illustrées ci-dessous, s'appliquent aux réactifs de l'invention mutatis mutandis.
Lesdits réactifs peuvent par exemple s'hybrider de manière spécifique à l'ARN desdits gènes choisis et/ou à l'ADNc correspondant à ces ARN (en conditions au moins stringentes d'hybridation), ou se lier de manière spécifique aux protéines codées par lesdits gènes choisis (ou à des fragments spécifiques de ces protéines), par exemple selon une réaction de type antigène-anticorps.
Des conditions au moins stringentes d'hybridation sont connues de la personne du métier. II peut par exemple s'agir des conditions suivantes :
pour une hybridation sur filtre : dans 5xSSC, 2% dodécyl sulfate de sodium (SDS), 100 microgrammes/mL d'ADN simple-brin à 55-65°C pendant 8 heures, et lavage dans 0,2xSSC et 0,2% SDS à 60-65°C pendant trente minutes ;
pour une hybridation par PCR : les conditions de PCR indiquées en exemple 1 ci- dessous.
Lesdits réactifs de l'invention peuvent notamment être :
des acides nucléiques (ADN, ARN, ARNm, ADNc), y compris des aptamères oligonucléotidiques, optionnellement marqués pour permettre leur détection, notamment avec des marqueurs fluorescents bien connus de la personne du métier, ou
des ligands de protéines, tels que des protéines, polypeptides ou peptides, par exemple des aptamères, et/ou des anticorps ou fragments d'anticorps.
Les acides nucléiques de l'invention peuvent par exemple être des amorces et/ou des sondes {cf. SEQ ID NO : 1 à 56 dans le tableau 10 ci-dessous), notamment des paires d'amorces {cf. les paires d'amorces indiquées dans le tableau 10 ci-dessous). Pour chacun desdits gènes choisis parmi ladite liste de vingt-huit gènes de l'invention, la personne du métier peut construire une paire d'amorces et/ou une sonde qui s'hybrident spécifiquement à ce gène. Un article manufacturé de l'invention peut donc comprendre le nombre d'amorces et/ou sondes nécessaire à la détection des ARN ou ADNc de chacun desdits gènes choisis.
La séquence des acides nucléiques de l'invention peut par exemple être constituée de 9 à 40 nucléotides, plus particulièrement de 10 à 30 nucléotides, plus particulièrement de 14 à 29 nucléotides, plus particulièrement de 19 à 24 nucléotides.
Les séquences des amorces d'une même paire peuvent par exemple être les séquences d'un fragment de la séquence d'un desdits gènes choisis et d'un fragment de sa séquence complémentaire {cf. tableau 1 indiquant les numéros d'accession de séquences de ces gènes). L'une et/ou l'autre de ces deux séquences d'amorces peuvent ne pas être strictement identiques à la séquence d'un fragment du gène ou de sa séquence complémentaire ; l'une et/ou l'autre de ces deux séquences d'amorces peuvent :
en dériver par une ou plusieurs substitutions et/ou additions et/ou dél étions nucléotidiques, plus particulièrement par une ou plusieurs substitutions nucléotidiques, et/ou présenter une identité de séquence d'au moins 80%, ou d'au moins 85%, ou d'au moins 90%, ou d'au moins 95% avec la séquence de ce fragment ou de sa séquence complémentaire (identité calculée sur la plus longue des deux séquences alignées - alignement optimal),
dans la mesure où la paire d'amorces en résultant a conservé la capacité à s'hybrider spécifiquement à un desdits gènes choisis.
Une paire d'amorces de l'invention présente avantageusement un delta Tm de 1°C environ ou moins. Selon un mode de réalisation de l'invention, une paire d'amorces de l'invention cible un amplicon de 70 à 120 pb environ (c'est-à-dire que l'amorce sens et l'amorce antisens s'hybrident à des positions telles sur l'acide nucléique cible, que amplicon produit par élongation de ces amorces hybridées a une longueur de 70 à 120 pb environ).
Des exemples de telles amorces et paires d'amorces sont présentées dans le tableau 10 ci- dessous (SEQ ID NO: 1 à 56, formant 28 paires d'amorces).
La séquence d'une sonde de l'invention, peut par exemple être :
la séquence d'un fragment de la séquence d'un desdits gènes choisis {cf. tableau 1 indiquant les numéros d'accession de séquences de ces gènes), ledit fragment s'hybridant de manière spécifique à la séquence de ce gène ;
- une séquence :
o qui dérive de la séquence d'un tel fragment par une ou plusieurs substitutions et/ou additions et/ou délétions nucléotidiques, plus particulièrement par une ou plusieurs substitutions nucléotidiques, et/ou une séquence qui présente une identité de séquence d'au moins 80%, ou d'au moins 85%, ou d'au moins 90%, ou d'au moins 95% avec la séquence de ce fragment ou de sa séquence complémentaire (identité calculée sur la plus longue des deux séquences alignées -alignement optimal-), mais
o qui a conservé la capacité à s'hybrider spécifiquement à un desdits gènes choisis ;
et/ou
- une séquence complémentaire de telles séquences.
Une sonde de l'invention peut notamment être une sonde pour amplification en temps réel, destinée à être utilisée avec une paire d'amorces de l'invention. Alternativement, la détection en PCR en temps réel peut utiliser des molécules dites intercalentes (par exemple ; SYB green) qui ont la propriété de s'intercaler dans les structures doubles brins. Les ligands de l'invention qui se lient de manière spécifique aux protéines codées par les gènes choisis parmi ladite liste de vingt-huit gènes de l'invention (ou à des fragments spécifiques de ces protéines) peuvent être par exemple des protéines, polypeptides ou peptides, par exemple des aptamères, ou des anticorps ou fragments d'anticorps.
Pour chacun desdits gènes choisis, la personne du métier peut produire un tel ligand.
Des anticorps peuvent par exemple être produits par immunisation d'un mammifère non- humain (tel qu'un lapin) par une protéine codée par ledit gène choisi, ou par un fragment antigénique d'une telle protéine, éventuellement associée ou couplée à un adjuvant d'immunisation (tel qu'un adjuvant de Freund ou tel que KLH -keyhole limpet hemocyanin-), par exemple par injection intrapéritonéale ou sous-cutanée, et par collecte des anticorps ainsi obtenus dans le sérum dudit mammifère.
Des anticorps monoclonaux peuvent être produits selon une technique d'hybridation lymphocytaire (hybridomes) telle que la technique de Kôhler and Milstein 1975 (cf. également US 4 376 110), la technique d'hybridomes à cellules B humaines (Kosbor et a\. 1983; Cole et al. 1983), ou la technique d'immortalisation des lymphocytes à l'aide du virus d'Epstein-Barr -EBV- (Cole et al. 1985). De tels anticorps peuvent par exemple être des IgG, IgM, IgE, IgA, IgD ou toute sous-classe de ces immunoglobulines.
Des anticorps modifiés par génie génétique peuvent être produits, tels que des anticorps recombinant, chimères, humanisés par greffage d'un ou plusieurs CDR -Complementary Determining Région- .
Les anticorps mis en œuvre dans l'invention peuvent être des fragments d'anticorps ou des dérivés artificiels de tels fragments, dans la mesure où ces fragments ou dérivés présentent ladite propriété de liaison spécifique. De tels fragments peuvent par exemple être des fragments Fab, F(ab')2, Fv, Fab/c, scFv (single chain Fragment variable).
Des exemples d'anticorps sont donnés dans le tableau 27 suivant.
Tableau 27 : exemples d'anticorps spécifiques
AcM = anticorps monoclonal
AcP = anticorps polyclonal
Tableau 27 (suite) : exemples d'anticorps spécifiques
AcM = anticorps monoclona
AcP = anticorps polyclonal
Tableau 27 (suite et fin) : exemples d'anticorps spécifiques
AcM = anticorps monoclona
AcP = anticorps polyclonal
D'autres exemples de moyens de dosage des niveaux de transcription de gènes choisis sont par ailleurs présentés dans le tableau 16 ci-dessous (kits d'immuno-essai).
Lesdits réactifs peuvent en outre comprendre un marqueur pour leur détection (par exemple, un fluor ophore).
Lesdits réactifs peuvent être sous la forme de composition(s), de composition(s) pharmaceutique(s), par exemple dans un(des) tube(s) ou dans un(des) puit(s) d'une plaque d'amplification d'acide nucléique.
Lesdits réactifs peuvent être en mélange, ou sous formes distinctes ou physiquement séparées l'une de l'autre.
Lesdits réactifs peuvent être fixés à un support solide, par exemple un support en polymère, en plastique, notamment en polystyrène, en verre ou en silicium.
Lesdits réactifs peuvent être attachés directement ou indirectement audit support solide, par exemple via un agent de liaison ou de capture qui est attaché au support solide. Cet agent de liaison ou de capture peut comprendre une partie fixée audit support solide et une partie qui comprend un ligand qui se lie de manière spécifique à un desdits gènes choisis.
Un tel ligand peut par exemple être un anticorps, un anticorps monoclonal, notamment un anticorps humain tel qu'une IgG, IgM ou IgA, ou un fragment d'un tel anticorps ayant conservé la spécificité de liaison.
Ledit support solide peut par exemple être une plaque en plastique, notamment en polystyrène, comprenant plusieurs puits d'analyse, telle qu'une plaque de titrage ou microtitrage protéique, par exemple, une plaque ELISA.
Ledit support solide peut encore être des microbilles magnétiques ou non, pour microtitrages, par exemple selon la technique décrite par Luminex.
Ledit support solide peut par exemple être une puce à acide nucléique, à protéine ou à peptide, par exemple une puce en plastique, verre ou silicium.
Lesdits réactifs peuvent ne pas être fixés à un support solide et peuvent par exemple être contenus dans une solution, telle qu'un tampon, par exemple pour leur conservation jusqu'à utilisation. Plus particulièrement, les réactifs peuvent être des acides nucléiques non liés à un support solide, dont la séquence nucléotidique est adaptée à l'amplification spécifique (cas d'amorces ou de paires d'amorces) et/ou à l'hybridation spécifique (cas de sondes) du produit de transcription (ARN) d'un desdits gènes choisis parmi ladite liste de vingt-huit gènes de l'invention.
En sus de réactifs qui détectent les produits de transcription ou de traduction de gènes de mammifères, plus particulièrement de gènes humains, et notamment de gènes choisis parmi ladite liste de vingt-huit gènes de l'invention, un article manufacturé conforme à la demande peut optionnellement comprendre d'autres réactifs, par exemple des réactifs permettent de doser ou déterminer un ou plusieurs facteurs virologiques et/ou un ou plusieurs facteurs cliniques.
Par exemple, un article manufacturé conforme à la demande peut comprendre des réactifs qui détectent de manière spécifique un ou des virus de l'hépatite, et/ou son ou leur génotype.
Selon un mode de réalisation, la demande est relative à un article manufacturé comprenant des réactifs en préparation combinée pour leur utilisation simultanée, séparée ou étalée dans le temps, lesdits réactifs étant constitués :
- de réactifs qui détectent de manière spécifique (de préférence, qui détectent de manière spécifique et permettent de quantifier) chacun des produits de transcription ou de traduction de 3 à 46 gènes de mammifères, plus particulièrement de 3 à 46 gènes humains, (par exemple, en s'hybridant de manière spécifique à ARN de ces gènes et/ou à l'ADNc obtenu par transcription inverse de ces ARN, ou en se liant de manière spécifique aux protéines codées par ces gènes), lesdits 3 à 46 gènes de mammifères, ou, le cas échéant, lesdits 3 à 46 gènes humains, comprenant lesdits gènes choisis parmi ladite liste de vingt- huit gènes de l'invention,
et
- optionnellement, de réactifs qui détectent de manière spécifique (de préférence qui détectent de manière spécifique et permettent de quantifier) un virus de l'hépatite et/ou le génotype d'un virus de l'hépatite.
Dans cet article manufacturé, le nombre de gènes de mammifères, plus particulièrement de gènes humains dont les produits de transcription ou de traduction peuvent être détectés est de 3 à 36, plus particulièrement de 3 à 33, plus particulièrement 3 à 28, plus particulièrement de 3 à 26, plus particulièrement de 3 à 25, plus particulièrement de 3 à 24, plus particulièrement de 3 à 23, plus particulièrement de 3 à 22, plus particulièrement de 3 à 20, plus particulièrement de 3 à 19, plus particulièrement de 3 à 10, plus particulièrement de 3 à 9, plus particulièrement de 3 à 8, plus particulièrement de 3 à 7 (par exemple de 4, 5, 6 ou 7), plus particulièrement de 3 à 6 (par exemple de 4, 5 ou 6), plus particulièrement de 3 à 5 (par exemple, 3, 4 ou 5).
Les gènes de mammifères, plus particulièrement les gènes humains, dont les produits de transcription ou de traduction peuvent être détectés par les réactifs contenus dans l'article manufacturé de la demande comprennent lesdits gènes choisis parmi ladite liste de vingt- huit gènes de l'invention, et optionnellement d'autres gènes, qui ne sont pas des gènes choisis parmi ladite liste de vingt-huit gènes de l'invention, mais dont le produit d'expression, plus particulièrement, de traduction peut être d'intérêt, tels que les gènes ici listés en tant que « autres facteurs biologiques » (par exemple, le gène codant la phosphatase alcaline ou PAL).
Dans l'article manufacturé de la demande, le nombre de réactifs qui détectent de manière spécifique le produit d'expression de gènes de mammifère (plus particulièrement de gènes humains) qui ne sont pas des gènes choisis parmi ladite liste de vingt-huit gènes de l'invention (par exemple, un réactif détectant de manière spécifique PAL), est de préférence au maximum de 5, plus particulièrement de 4 ou moins, plus particulièrement de 3 ou moins, plus particulièrement de 2 ou moins, plus particulièrement de 2 ou 1 ou 0. Ledit article manufacturé peut donc par exemple être :
- un ou des tubes,
- un kit, notamment un kit comprenant un ou des tubes,
- un support solide, par exemple, en plastique, polystyrène, verre, silicium ou polymère, ou comprenant un matériau magnétique tel que de l'oxyde de fer, tel que :
o une plaque en plastique comprenant plusieurs puits d'analyse telle que :
■ une plaque d'amplification d'acide nucléique comportant des puits destinés à recevoir un échantillon biologique et un mélange réactionnel d'amplification d'acide nucléique, ■ une plaque de titrage ou microtitrage protéique, plus particulièrement une plaque ELISA,
o des microbilles magnétiques (par exemple, des microbilles faites à partir d'oxyde de fer, et recouvertes d'un polymère auquel les protéines ou polypeptides peuvent adhérer ou être attachées par couplage chimique) ; o une puce à acide nucléique, à protéine, à polypeptide ou à peptide.
Optionnellement, l'article manufacturé de l'invention comprend en outre des instructions (par exemple, une feuille d'instructions) pour doser le niveau d'expression desdits gènes choisis sur un échantillon biologique collecté ou obtenu dudit sujet, plus particulièrement pour mettre en œuvre une méthode de l'invention.
Ledit article manufacturé peut en outre comprendre un ou plusieurs des éléments suivants :
- un instrument pour le prélèvement dudit échantillon, notamment :
o une aiguille et/ou une seringue, plus particulièrement une aiguille et/ou une seringue pour le prélèvement d'un liquide intracorporel, tel que du sang, et/ou
o une aiguille adaptés à la cyto-ponction hépatique, par exemple une aiguille de diamètre 18 à 22G), et/ou
o une aiguille et/ou un cathéter et/ou un pistolet à biopsie adaptés à la PBH ; - un produit programme d'ordinateur ou logiciel, notamment un produit programme d'ordinateur ou logiciel d'analyse statistique, par exemple un produit programme d'ordinateur de l'invention tel que ci-dessous décrit ;
des réactifs d'extraction d'ARN ;
- une transcriptase inverse ;
- une polymérase, par exemple une Taq polymérase ;
des nucléotides (dNTP).
La demande est notamment relative audit article manufacturé, ou auxdits réactifs, pour leur utilisation dans une méthode pour pronostiquer si un sujet infecté par un ou des VHC a une forte probabilité de répondre à un traitement anti-VHC qui comprendra l'administration d'interféron et de ribavirine (ou de leurs pro-drogues), ou si, au contraire, ce sujet a une forte probabilité de ne pas répondre à ce traitement anti-VHC, plus particulièrement audit article manufacturé, ou auxdits réactifs, pour leur utilisation dans une méthode pronostique de l'invention.
Cette utilisation peut notamment comprendre :
- le prélèvement d'un échantillon biologique dudit sujet, notamment par insertion d'une aiguille ou cathéter dans le corps dudit sujet, et
- la mise en œuvre desdits réactifs dans ladite méthode sur cet échantillon biologique, ou sur un échantillon comprenant des acides nucléiques et/ou protéines et/ou polypeptides et/ou peptides extraits ou purifiés dudit échantillon biologique, ou sur un échantillon comprenant des ADNc susceptibles d'avoir été obtenus par transcription inverse desdits acides nucléiques.
Cette utilisation peut par exemple comprendre :
le prélèvement d'un échantillon biologique dudit sujet, optionnellement transformé par :
o extraction ou purification des ARN dudit échantillon prélevé et, optionnellement par transcription inverse des ARN extraits, ou par
o extraction ou purification de ses protéines dudit échantillon prélevé, et la mise en œuvre desdits réactifs de l'invention sur cet échantillon biologique optionnellement transformé.
Ledit prélèvement d'échantillon biologique peut être fait par insertion d'un instrument de prélèvement, notamment par insertion d'une aiguille ou d'un cathéter, dans le corps dudit sujet.
L'insertion de l'instrument de prélèvement est notamment faite pour prélever du fluide intracorporel dudit sujet (tel que par exemple du sang) et/ou une portion de tissu hépatique dudit sujet (par exemple par PBH) et/ou des cellules hépatiques dudit sujet (par exemple par cyto-ponction hépatique).
Cet instrument peut donc par exemple être inséré :
- dans une veine, une artère ou un vaisseau sanguin dudit sujet pour prélever du sang dudit sujet ; et/ou
- dans le foie dudit sujet, pour prélever un échantillon de parenchyme hépatique, c'est-à- dire pour faire une ponction biopsie hépatique (PBH), par exemple par voie transjugulaire ou par voie transpariétale ; et/ou
- à travers la peau jusqu'au foie dudit sujet, de sorte à faire une cyto-ponction hépatique. La demande est notamment relative audit article manufacturé, ou auxdits réactifs, pour leur utilisation dans une méthode pour le traitement d'une hépatopathie qui comporte une atteinte tissulaire du foie, plus particulièrement une fibrose hépatique, plus particulièrement une méthode de thérapie anti-VHC, plus particulièrement dans une méthode de thérapie anti-VHC qui comprend administration d'interféron et administration de ribavirine (ou de leurs pro-drogues), plus particulièrement dans une méthode de thérapie anti-VHC qui comprend, à titre de traitement de première intention, administration d'interféron et administration de ribavirine (ou de leurs pro-drogues).
Cette utilisation peut notamment comprendre la mise en œuvre desdits réactifs dans une méthode de l'invention pour pronostiquer si un sujet infecté par un ou des VHC a une forte probabilité de répondre à un traitement anti-VHC qui comprendra l'administration d'interféron et de ribavirine, ou si, au contraire, ce sujet a une forte probabilité de ne pas répondre à ce traitement anti-VHC.
Si ledit sujet est pronostiqué non-répondeur, le praticien peut choisir de ne pas lui administrer un traitement qui comprend (plus particulièrement qui est essentiellement
constitué de) administration d'interféron et administration de ribavirine (ou de leurs prodrogues), plus particulièrement de ne pas lui administrer un tel traitement à titre de traitement de première intention. Dans une telle situation, le praticien peut par exemple choisir d'administrer un traitement anti-VHC qui ne comprend pas (ou qui n'est pas essentiellement constitué de) administration d'interféron et administration de ribavirine (ou de leurs pro-drogues), plus particulièrement de lui administrer un tel traitement à titre de traitement de première intention. Le praticien peut alternativement choisir de ne pas lui administrer de traitement anti-VHC, à tout le moins en première intention. Si ledit sujet est pronostiqué répondeur, le praticien peut choisir d'administrer un traitement anti-VHC, notamment un traitement qui comprend (plus particulièrement qui est essentiellement constitué de) administration d'interféron et administration de ribavirine (ou de leurs prodrogues), plus particulièrement d'administrer en première intention un traitement qui comprend (plus particulièrement qui est essentiellement constitué de) administration d'interféron et administration de ribavirine (ou de leurs pro-drogues).
Cette utilisation peut par exemple comprendre :
la mise en œuvre desdits réactifs de l'invention sur échantillon biologique qui a été prélevé dudit sujet, et qui optionnellement a été transformé, par exemple :
o par extraction et/ou purification des ARN dudit échantillon prélevé et, optionnellement par transcription inverse des ARN extraits, ou o par extraction et/ou purification des protéines et/ou polypeptides et/ou peptides dudit échantillon prélevé,
pour pronostiquer si un sujet infecté par un ou des VHC a une forte probabilité de répondre à un traitement anti-VHC qui comprendra l'administration d'interféron et de ribavirine, ou si, au contraire, ce sujet a une forte probabilité de ne pas répondre à ce traitement anti-VHC,
optionnellement, déterminer le génotype de VHC dont est infecté ledit patient et/ou déterminer son score de fibrose hépatique (plus particulièrement, déterminer si ce score est un score d'au moins F2 selon le système Metavir).
Si ledit sujet est pronostiqué non-répondeur, le praticien peut choisir de ne pas lui administrer un traitement qui comprend (plus particulièrement qui est essentiellement constitué de) administration d'interféron et administration de ribavirine (ou de leurs prodrogues), plus particulièrement de ne pas lui administrer un tel traitement à titre de traitement de première intention. Dans une telle situation, le praticien peut par exemple choisir d'administrer un traitement anti-VHC qui ne comprend pas (ou qui n'est pas
essentiellement constitué de) administration d'interféron et administration de ribavirine (ou de leurs pro-drogues), plus particulièrement de lui administrer un tel traitement à titre de traitement de première intention. Le praticien peut alternativement choisir de ne pas lui administrer de traitement anti-VHC, à tout le moins en première intention. Si ledit sujet est pronostiqué répondeur, le praticien peut choisir d'administrer un traitement anti-VHC, notamment un traitement qui comprend (plus particulièrement qui est essentiellement constitué de) administration d'interféron et administration de ribavirine (ou de leurs prodrogues), plus particulièrement d'administrer en première intention un traitement qui comprend (plus particulièrement qui est essentiellement constitué de) administration d'interféron et administration de ribavirine (ou de leurs pro-drogues).
Ledit traitement peut par exemple être un traitement anti-VHC comme ci-dessus décrit et ci-dessous illustré.
La demande est également relative à un médicament ou association médicamenteuse destiné au traitement d'une hépatopathie comportant une atteinte tissulaire du foie, plus particulièrement une fibrose hépatique (tel que interféron standard ou interféron pégylé, en monothérapie, ou en plurithérapie associant un ou plusieurs autres principes actifs, notamment de la ribavirine), notamment un traitement anti-VHC, pour son utilisation dans la méthode de traitement de l'invention. La demande est également relative à un produit programme d'ordinateur, destiné à être stocké dans une mémoire d'une unité de traitement, ou sur un support mémoire amovible destiné à coopérer avec un lecteur de ladite unité de traitement. Le produit programme d'ordinateur de l'invention comprend des instructions pour la mise en œuvre d'une méthode de l'invention, notamment pour la mise en œuvre d'une analyse statistique adaptée à la mise en œuvre d'une méthode de l'invention (notamment adaptée à l'analyse statistique multivariée des mesures, et plus particulièrement des niveaux d'expression desdits gènes choisis) et/ou pour la construction d'un modèle de classification multivariée adapté à la mise en œuvre d'une méthode de l'invention.
La demande est également relative à une installation informatique, un dispositif informatique, ou ordinateur, comprenant une unité de traitement dans la mémoire de laquelle sont stockés ou enregistrés :
- un produit programme d'ordinateur de l'invention, et, optionnellement,
des dosages, ou des valeurs de dosage, des niveaux d'expression (transcription et/ou traduction) desdits gènes choisis.
Le terme "comprenant", avec lequel "incluant" ou "contenant" est synonyme, est un terme ouvert, et n'exclut pas la présence d'un ou plusieurs élément(s), ingrédient(s) ou étape(s) de méthode additionnel(s) qui ne serait(seraient) pas explicitement indiqué(s), tandis que le terme "consistant" ou "constitué" est un terme fermé, qui exclut la présence de tout autre élément additionnel, étape, ou ingrédient qui ne serait pas explicitement exposé. Le terme "consistant essentiellement" ou " essentiellement constitué" est un terme partiellement ouvert, qui n'exclut pas la présence d'un ou plusieurs élément(s), ingrédient(s) ou étape(s) additionnel(s), dans la mesure où cet(s) élément(s), ingrédient(s) ou étape(s) additionnel (s) n'affecte(nt) pas matériellement les propriétés de base de l'invention.
Par conséquent, le terme "comprenant" (ou "comprend(comprennent)") inclut les termes "consistant", "constitué", aussi bien que les termes "consistant essentiellement" et " essentiellement constitué".
Dans le but de faciliter la lecture de la demande, la description a été séparée en divers paragraphes, sections et modes de réalisation. Il ne doit pas être considéré que ces séparations déconnectent la substance d'un paragraphe, section ou mode de réalisation, de celle d'un autre paragraphe, section ou mode réalisation. Au contraire, la description englobe toutes les combinaisons possibles des différents paragraphes, sections, phrases et modes de réalisations qu'elle contient.
Le contenu des références bibliographiques citées dans la demande est spécifiquement incorporé par référence dans le contenu de la demande.
Les exemples qui suivent sont donnés à titre purement illustratif. Ils ne limitent en aucune façon l'invention.
EXEMPLES
EXEMPLE 1 : CONSTRUCTION DE MODELES DE CLASSIFICATION 1. Populations et patients, dosage du niveau d'expression de gènes, détermination de la réponse au traitement :
L'étude réalisée a été approuvée par le Comité Ethique local, conformément à la Déclaration d'Helsinki, et tous les patients ont donné leur consentement éclairé par écrit.
Présentation des patients
Les patients sont des patients adultes infectés par le virus de l'hépatite C (VHC), suivis à l'Hôpital Beaujon (Clichy, France).
Le diagnostic clinique d'infection par le virus de l'hépatite C des patients sélectionnés a été établi sur la base de la détection d'anticorps dirigés contre des protéines du VHC et de la détection d'ARN circulant du VHC.
La sérologie du VHC de dépistage a été réalisée par le test Abbott de 3eme génération (AxSYM™ HCV Version 3.0 (Abbott) Technique MEIA ; index > 1 = positif ; index < 1 = négatif) et le test de quantification de l'ARN de VHC VERSANT® HCV-RNA 3.0 (bDNA) ASSAY de la société Siemens Healthcare Diagnostics (limite de quantification = 615 - 7 690 OOO UI/mL). Afin d'établir une cohorte homogène et parfaitement représentative de la pathologie exemplifiée, les patients susceptibles de présenter des affections chroniques hépatiques d'origines autres que le virus de l'hépatite C (telles qu'une affection chronique hépatique due à une infection par le virus de l'hépatite B) ont été exclus de l'étude. D'autres critères d'exclusion ont en outre été appliqués, à savoir consommation d'alcool excessive, hémochromatose, hépatite auto-immune, maladie de Wilson, déficience en a-1 antitrypsine, angiocholite sclérosante primitive, cirrhose biliaire primitive, la prise antérieure d'un traitement anti-VHC.
Cent quarante patients ont ainsi été sélectionnés. Le tableau 8 ci-dessous présente les données cliniques, biologiques et virologiques des patients ainsi sélectionnés. Ces données ont été collectées avant que le patient ne reçoive de traitement antiviral, en l'occurrence lors de la ponction biopsique hépatique (PB H). Dans le tableau 8 ci-dessous :
UI = Unité Internationale
Patients NR = patients non répondeurs au traitement ;
Patients R = patients répondeurs au traitement ;
Patients RR= patients répondeurs-rechuteurs ;
cf. ci-dessous pour la définition de ces trois sous-populations ou cohortes.
Tableau 8 : données cliniques, biologiques et virologiques (ensemble des patients sélectionnés)
Données cliniques, biologiques et Patients Patients NR Patients R Patients RR
virologiques
n 140 51 68 21
Sexe : mâle (%) / femelle (%) 89 (64) / 51 (36) 31 (61) / 20 (39) 43 (63) / 25 (37) 15 (71) / 6 (29)
Age [moyenne ± déviation 45,8 ± 8,5 (27-72) 47,3 ± 8,6 (33-72) 44,7 ± 9,0 (27-65) 44,4 ± 4,9 (34-66) standard (gamme)]
Source d'infection [n(%)]
transfusion sanguine 30(21) 11(22) 16(23) 3(14) administration intraveineuse 42(30) 17(33) 21(31) 4(19)
d'une drogue
inconnue 68(49) 23(45) 31(46) 14(67)
Alanine aminotransférase 106 ± 73 (18-459) 112 ± 81 (30-354) 102 ± 74 (20-459) 100 ± 36 (18 176)
(ALT) UI/L [moyenne ±
déviation standard (gamme)]
Tableau 8 (suite et fin) : données cliniques, biologiques et virologiques
Données cliniques, biologiques et Patients Patients NR Patients R Patients RR
virologiques
Génotypes VHC [n(%)]
1 76 (54,3) 40 (78,4) 28 (41,2) 8 (38, 1)
2 13 (9,3) 10 (14,7) 3 (14,3)
3 19 (13,6) 3 (5,9) 12 (17,6) 4 (19,0)
4 31 (22, 1) 8 (15,7) 17 (25,0) 6 (28,6)
5 1 (0,7) 0 10,5) 0
Score de fibrose (score F
Metavir) [n(%)]
0 1 (0,7) 0 1 (1,5) 0
1 45 (32, 1) 15 (29,5) 26 (38,2) 4 (19,0)
2 53 (37,9) 18 (35,3) 29 (42,7) 6 (28,6)
3 18 (12,9) 9 (17,6) 3 (4,4) 6 (28,6)
4 22 (15,7) 9 (17,6) 9 (13,2) 4 (19,0) inconnu 1 (0,7) 0 0 1 (4,8)
Prélèvements des échantillons :
Une biopsie ponction hépatique (PBH) a été réalisée sur chaque patient, avant qu'il ne reçoive le traitement antiviral. Les PBH ont été réalisées en respectant les bonnes pratiques cliniques. Les biopsies ont été immédiatement stockées à -80°C en vue de l'extraction des ARN totaux, et traitées avec de la paraffine pour des études histologiques. Un échantillon de sérum a été prélevé sur chacun des patients inclus dans l'étude dans un délai de +/- 6 mois par rapport à la date de la biopsie, mais toujours avant que le patient n'ait reçu le traitement antiviral.
Traitement des échantillons de biopsies hépatiques (pour le dosage des ARN) :
Les niveaux d'expression des gènes (en l'occurrence, niveau de transcription en ARN) ont été dosés sur chacune des 140 biopsies (1 biopsie par patient).
Les biopsies hépatiques ont été broyées dans de l'azote en utilisant un pilon et un mortier en céramique (broyage 100% manuel).
La poudre a été récupérée à l'aide d'un scalpel (Swann Morton 22, Référence 0208). a) Extraction des ARN
La poudre ainsi obtenue a été solubilisée dans 1 mL de RNAble® Réf. GEXEXT00, Laboratoires Eurobio, France, auquel ont été ajoutés 100 μΕ de chloroforme.
Le mélange obtenu a été placé dans la glace ou à 4°C pendant 5 minutes puis a été centrifugé à 13 000 g pendant 15 minutes.
La phase supérieure aqueuse contenant les ARN a été récupérée dans un tube neuf et 1 volume d'isopropanol y a été ajouté.
Le tube a été agité par retournement et a été placé à 4°C toute la nuit, puis a été centrifugé à 13 000 g pendant 15 minutes. Le surnageant a été éliminé, et le culot contenant les ARN a été repris dans un volume d'éthanol à 70% (préparé extemporanément) et à nouveau centrifugé.
Le culot de précipité d'ARN obtenu a été séché à l'air libre pendant environ 1 heure, puis dissout dans 15 μΕ d'eau puis stocké à -80°C. b) Dosage des ARN
L'évaluation de la concentration des ARN extraits a été réalisée par la mesure de la densité optique par un spectromètre (Nanodrop), et a été vérifiée après un cycle de congélation/décongélation.
Les ARN extraits ont ensuite été dilués pour obtenir une solution à 50 ng^L.
Les contrôles qualités de l'ARN ont été réalisés par PCR temps réel {cf. ci-dessous), par ciblage d'un gène contrôle (dit endogène), à expression ubiquitaire, pour vérifier que l'ARN n'a pas été dégradé (en l'occurrence, ciblage de RPLPO).
Etape de transcription inverse (Reverse Transcription ou RT) :
La transcription inverse a été réalisée sur 200 ng d'ARN dans un mélange réactionnel réalisé dans un volume de 20 iL comprenant les réactifs suivants :
Tableau 9 :
Les réactions de transcription inverse ont été effectuées aux températures suivantes :
à 20°C pendant 10 minutes, puis
à 42°C pendant 30 minutes, et
à 99°C pendant 5 minutes.
A ce stade, les mélanges réactionnels ont été congelés, ou aliquotés, ou directement utilisés pour une amplification par PCR temps réel. Etape de PCR en temps réel quantitative (PCRq) :
L'amplification a été réalisée en utilisant un light Cycler® 480 (Roche Diagnostics, Mannheim, Allemagne). Les résultats sont générés par le logiciel light Cycler® Software 4.05/ 4.1.
La technologie Light Cycler® permet le suivi en continu de l'apparition des produits d'amplification grâce à l'émission d'une quantité de fluorescence proportionnelle à la quantité de produit amplifié, elle-même dépendante de la quantité de cibles initialement présentes dans l'échantillon à analyser. La quantification (en valeurs relatives) de l'expression génique est réalisée par la méthode connue sous le nom de 2"Δα (2"Δα = 2" (ctcibie - ct référence) . c Liyak et Schmittgen 2001 ; Schmitten et Livak 2008), exploitant les valeurs de « Cycle Threshold » ou Ct déterminées par l'appareil de PCR quantitative en temps réel. Plus la valeur de Ct est faible, plus la quantité initiale d'ARN transcrit est élevée.
Les mélanges réactionnels et le protocole utilisés sont décrits dans la notice de la trousse LIGHT CYCLER® 480 SYBR GREEN I MASTER MIX (Roche Diagnostics, Mannheim, Allemagne ; US 4,683,202 ; US 4,683,195 ; US 4,965, 188 ; US 6,569,627).
Après l'étape de transcription inverse, les mélanges réactionnels (cDNAs) ont été dilués au l/40eme (pour la vérification de la qualité) ou au l/100eme (pour les gènes cibles) avant leur utilisation en PCRq.
Pour chaque gène, les PCRq ont été réalisées dans un volume réactionnel de 10 μΕ sur une plaque à 384 puits :
5 μΕ de la réaction de transcription inverse diluée au l/40eme (ou au l/100eme) ;
4,8 μΕ de mélange réactionnel de la trousse light Cycler® 480 SYBR Green I Master mix
0, 1 μΕ d'une solution à 50μΜ pour chacune des 2 amorces, soit un volume final de 0,5 μΜ pour chaque amorce.
Les mélanges réactionnels sont généralement préparés pour des plaques de 384 puits. Les amorces suivantes ont été utilisées :
Tableau 10 : exemples d'amorces
Symbole Amorce sens SEQ ID NO : Amorce antisens SEQ ID NO :
HERC5 CCT GGG CCA CAC TGA GAG TAA A 1 GAG CCA CCA CAA GCG ACA AA 2
IL8 CAC CGG AAG GAA CCA TCT CAC TGT 3 TCC TTG GCA AAA CTG CAC CTT CA 4
STAT2 GAG TCA GGG TTT GAT TTG GGA CTT 5 CTG TCA CAC CTA GTG GCC CCT TA 6
CCL21 CTC CAT CCC AGC TAT CCT GTT CTT 7 TCT GCA CAT AGC TCT GCC TGA GA 8
CLDN1 TAT TTC TTC TTG CAG GTC TGG CTA 9 CAA ATT CGT ACC TGG CAT TGA CT 10
CXCL6 GTT TAC GCG TTA CGC TGA GAG TAA A 11 CGT TCT TCA GGG AGG CTA CCA 12
FOXOl GTC AAG AGC GTG CCC TAC TTC A 13 TGA ACT TGC TGT GTA GGG ACA GAT TAT 14
G1P2 GAG GCA GCG AAC TCA TCT TTG CCA 15 CCG CCA GCA TCT TCA CCG TCA 16
G1P3 GAT GAG CTG GTC TGC GAT CCT GAA 17 CCA CCA GCC CCG AGG CTC T 18
Tableau 10 (suite) : exemples d'amorces
Symbole Amorce sens SEQ ID NO : Amorce antisens SEQ ID NO :
IFI27 TGG GTA CTC TGC AGT CAC TGG GA 19 CCG CAA TGG CAG ACC CAA T 20
IFI35 AGG CCA GAC TCA AGA TGA GGC TGT 21 GGG CAC TGA AAA TGG GAC CTT GT 22
IFI44 AAA ATC TTG GAC TTG CTC AAA ATT GTA 23 CTT TCA TCC AGT GAA TCT TCG CA 24
IFIT1 GAG CAA CCA TGA GTA CAA ATG GTG A 25 CGT CAT CAA TGG ATA ACT CCC ATG T 26
IFIT4 ATC AGC CTG GTC ACC AGC TTT 27 ATT CTT GGT GAC CTC ACT CAT GAC T 28
IFITM1 TCA ACA CCC TCT TCT TGA ACT GGT 29 CAA CCA TCT TCC TGT CCC TAG ACT T 30
ITGA2 AGG TGC CTG CAG AAG AAT ATG GT 31 GAC AAC ATC AGA GGG CTC CTG TAT 32
LGALS3BP TGA CCC CTC CGA GGC TCT TC 33 ATG TCA CCA TCG TTC ACG CCT T 34
MDK GGG CAG CGA GAT GCA GCA C 35 CCA CTC AGC GCA CTC GCT CC 36
MX1 ACA CAC CGT GAC GGA TAT GGT C 37 GGC GGT TCT GTG GAG GTT AAA 38
Tableau 10 (suite et fin) : exemples d'amorces
Symbole Amorce sens SEQ ID NO : Amorce antisens SEQ ID NO :
OAS1 CTG AAG GAA AGG TGC TTC CGA G 39 GCC TGA GGA GCC ACC CTT TAC 40
OAS2 TGA AGC ACT GGT ACA AAG AGT GTG A 41 TGA GCA GCT CCA AGG CAT ACT T 42
OAS3 TCG ACA TCA TCT TGC GCT GC 43 CCA AAT GAG CCC CCT TTA CTG A 44
OCLN CCC AAT GTC GAG GAG TGG GTT A 45 AGT ATG CCA TGG GAC TGT CAA CTC T 46
PLSCR1 GAA TGC TTC TCA CCC GGA AAC A 47 AGC CAC TAT ATC CTG GAG GTC CTT G 48
RSAD2 AGC AAA GAG AGG ATT GCT TTT GC 49 AGG TAT TCT CCC CGG TCT TGA A 50
STAT1 AGC ATG AAA TCA AGA GCC TGG A 51 ACC ATT GGT CTC GTG TTC TCT GTT 52
STMN2 GCG GAG GAA AAG CTG ATC CTG A 53 TCC GCA GCA TGC CTC TCC TT 54
USP18 CCG TGG GAA ACA GGT CTT GAA 55 ATG GAG AAT CGC ATG AGG TGG 56
RPLPO GGC GAC CTG GAA GTC CAA CT 57 CCA TCAG CAC CAC AGC CTT C 58
Les PCRq ont été réalisées suivant les conditions de température suivantes :
- une étape d'initiation de la dénaturation à 95°C pendant 10 minutes ;
- 50 cycles de :
- dénaturation à 95°C pendant 15 secondes ;
- hybridation / élongation à 65°C pendant 30 secondes.
Chaque échantillon cible est amplifié en duplicate. Afin de s'affranchir des variations des quantités initiales d'ARN total d'un échantillon à l'autre, on réalise en parallèle sur le même échantillon l'amplification en duplicate des ARN d'un gène utilisé comme contrôle endogène, tel qu'un gène impliqué dans des cascades métabolique cellulaires, par exemple RPLP0 (aussi connu sous le nom 36B4 ; GENBANK accession NM 001002) ou TBP (GENBANK accession NM_003194). En l'occurrence, c'est le gène RPLP0 qui a été ici utilisé comme contrôle endogène. La qualité de l'extraction d'ARN faite à partir des 140 biopsies a été évaluée sur la base de la valeur de Ct du gène de référence RPLP0. La classification a été réalisée de la façon suivante :
- Ct RPLP0 inférieur à 22 : qualité ARN très bonne ;
- Ct RPLP0 de 22 à 24 : qualité ARN bonne ;
- Ct RPLP0 supérieur à 24 et inférieur à 26 : qualité ARN moyenne ;
- Ct RPLP0 supérieur ou égal à 26 : qualité ARN mauvaise.
Afin d'augmenter la fiabilité des analyses bio-stastistiques, seules les données provenant d'extraction d'ARN de très bonne et bonne qualité (Ct RPLP0 < 24) ont été retenues, 128 biopsies [91,4% des 140 échantillons] dont 107 présentant un statut de répondeur ou non répondeur strict ; cf. tableau 11 ci-dessous.
La quantité de transcrits d'un gène cible a été déduite du Ct (« Cycle threshold ») qui correspond au nombre de cycles de PCR nécessaire pour obtenir un signal de fluorescence significatif. Les échantillons cibles ont été normalisés sur la base de leur contenu en RPLP0 (ou, le cas échéant, en TBP), conformément à la méthode du 2~ACt.
Cette valeur de dosage normalisée est ici de manière générale notée « BMQ » (pour biomarqueur).
Les valeurs BMQ obtenues pour chacun des 128 patients sont présentées dans les tableaux 12 à 15 ci-dessous.
Traitement des échantillons de sérum (pour le dosage des protéines sériques) :
Les dosages protéiques peuvent être réalisés à l'aide des kits indiqués dans le tableau 16 ci-dessous, en suivant les recommandations du fabricant.
B09072 et B09072A - FP/BA 91 REPONSE n°l
CONFIDENTIAL & ATTORNEY PRIVILEGED Projet n°l
Tableau 11 : données cliniques, biologiques et virologiques
B09072 et B09072A - FP/B A 92 REPONSE n°l CONFIDENTIAL & ATTORNEY PRIVILEGED Projet n°l
Tableau 11 ( suite et fin) : données cliniques, biokmiques et virolo2iques
Tableau 12 : valeurs BMQ des patients pour les gènes HERC5, IL8, STAT2, CXCL6, GIP2, IFI35 et IFI44 (Ct normalisé conformément à la méthode du 2 ~ACt)
Statut
Patient (NR, R HERC5 IL8 STAT2 CXCL6 G1P2 IFI35 IFI44 ouRR)
45 R 0,588 1,641 1,072 0,092 0,959 0,415 0,056
50 R 0,144 0,444 0,730 0,027 1,586 0,174 0,018
55 R 0,235 1,395 0,307 0,053 1,275 0,082 0,034
59 R 0,269 0,329 0,454 0,000 0,877 0,240 0,039
62 R 0,280 0,058 0,771 0,080 0,943 0,318 0,074
63 R 1,129 0,199 0,904 0,000 12,295 0,523 0,291
65 R 0,258 0,168 0,448 0,013 1,613 0,209 0,055
66 R 0,374 0,420 0,580 0,119 0,308 0,103 0,018
71 R 0,255 0,228 0,304 0,000 0,564 0,087 0,015
72 R 0,097 0,064 0,290 0,052 0,176 0,074 0,010
73 R 1,409 0,191 0,691 0,027 1,064 0,181 0,180
76 R 0,293 1,257 1,091 0,051 0,653 0,163 0,067
86 R 0,259 0,451 0,564 0,102 14,123 0,244 0,086
88 R 0,660 0,297 0,745 0,072 2,042 0,172 0,092
90 R 0,342 0,089 0,516 0,045 1,912 0,207 0,046
91 R 0,149 0,040 0,270 0,096 0,664 0,130 0,042
92 R 0,025 0,087 0,127 0,027 0,049 0,046 0,006
125 R 0,248 0,000 0,126 0,000 1,257 0,099 0,047
222 R 0,631 0,330 0,318 0,023 5,187 0,253 0,181
227 R 0,145 0,260 0,210 0,000 0,119 0,062 0,036
306 R 0,380 0,372 0,976 0,186 3,568 0,559 0,130
344 R 0,429 0,923 1,683 0,330 0,646 0,114 0,181
346 R 0,503 0,182 2,267 0,029 0,601 0,293 0,146
366 R 0,194 0,179 0,279 0,020 0,159 0,081 0,029
501 R 0,151 0,601 0,443 0,070 1,424 0,200 0,067
502 R 0,158 2,676 0,189 0,557 0,465 0,074 0,016
503 R 0,154 0,109 0,230 0,011 0,755 0,131 0,026
504 R 0,150 2,289 0,274 0,142 0,563 0,162 0,034
506 R 0,042 10,483 0,347 0,343 0,678 0,115 0,043
508 R 0,114 0,446 0,545 0,000 0,143 0,084 0,040
513 R 0,105 0,538 0,332 0,000 0,280 0,086 0,038
523 R 0,028 2,329 0,212 0,176 0,134 0,070 0,009
Tableau 12 (suite) : valeurs BMQ des patients pour les gènes HERC5, IL8, STAT2, CXCL6, GIP2, IFI35 et IFI44 (Ct normalisé conformément à la méthode du 2 ACt)
Statut
Patient (NR, R HERC5 IL8 STAT2 CXCL6 G1P2 IFI35 IFI44 ouRR)
528 R 0,253 4,547 0,883 1,189 1,261 0,263 0,056
529 R 0,188 0,354 0,350 0,053 1,210 0,127 0,037
530 R 0,218 0,000 1,240 0,000 0,144 0,130 0,042
532 R 0,173 0,387 0,561 0,032 0,245 0,073 0,019
535 R 0,804 0,328 0,609 0,026 15,348 0,446 0,138
536 R 0,212 0,119 0,448 0,180 0,313 0,125 0,035
537 R 0,052 0,058 0,182 0,027 0,080 0,047 0,010
538 R 0,422 0,041 0,413 0,000 5,152 0,375 0,068
546 R 0,408 0,000 0,735 0,062 0,236 0,164 0,076
556 R 0,409 0,063 0,221 0,000 6,869 0,254 0,170
560 R 0,203 0,530 0,270 0,082 3,249 0,157 0,058
565 R 0,538 1,079 0,079 0,000 4,857 0,301 0,124
567 R 0,238 1,297 0,051 0,356 2,497 0,262 0,059
568 R 0,034 0,127 0,005 0,000 0,055 0,038 0,003
569 R 0,077 0,559 0,018 0,000 0,092 0,202 0,031
570 R 0,113 0,371 0,868 0,000 0,118 0,207 0,060
571 R 0,325 0,804 0,747 0,036 0,609 0,245 0,111
572 R 0,169 0,064 0,243 0,005 2,129 0,125 0,050
575 R 1,653 0,892 1,952 0,226 15,348 1,061 0,350
577 R 0,215 0,262 0,841 0,084 0,224 0,159 0,057
581 R 0,084 2,549 0,309 0,129 1,210 0,126 0,041
583 R 0,231 0,230 0,551 0,367 1,297 0,432 0,058
585 R 0,396 0,818 0,660 0,112 3,411 0,331 0,094
598 R 0,050 0,660 0,201 0,033 0,200 0,073 0,023
601 R 0,431 0,459 1,133 0,077 1,053 0,249 0,199
604 R 0,200 0,084 0,473 0,082 1,061 0,221 0,079
605 R 0,847 0,178 0,622 0,000 5,315 0,228 0,149
613 R 0,083 0,111 0,419 0,000 0,108 0,161 0,028
614 R 0,132 0,218 0,541 0,078 0,135 0,098 0,040
629 R 0,070 0,152 0,644 0,000 0,074 0,113 0,026
639 R 0,121 0,399 0,895 0,000 0,109 0,119 0,042
6 NR 0,247 2,648 0,624 0,000 0,685 0,113 0,046
Tableau 12 (suite) : valeurs BMQ des patients pour les gènes HERC5, IL8, STAT2, CXCL6, GIP2, IFI35 et IFI44 (Ct normalisé conformément à la méthode du 2 ACt)
Statut
Patient (NR, R HERC5 IL8 STAT2 CXCL6 G1P2 IFI35 IFI44 ouRR)
46 NR 0,563 0,911 1,693 0,115 8,969 0,329 0,177
58 NR 0,607 0,616 0,787 0,152 13,881 0,490 0,149
75 NR 1,035 0,908 2,158 0,082 8,664 0,601 0,319
80 NR 0,570 0,745 0,493 0,096 0,963 0,146 0,057
83 NR 2,549 0,231 2,063 0,154 6,169 0,798 0,218
145 NR 1,283 0,755 0,838 0,196 7,490 0,423 0,183
167 NR 0,653 0,923 0,502 0,112 5,046 0,405 0,075
308 NR 0,886 0,853 0,440 0,115 6,658 0,437 0,154
509 NR 0,719 1,157 0,637 0,218 6,126 0,264 0,102
516 NR 0,358 0,844 0,559 0,049 3,160 0,232 0,098
521 NR 1,670 3,732 3,745 0,170 4,362 1,292 0,785
524 NR 0,236 0,949 0,578 0,025 0,286 0,120 0,028
526 NR 0,418 2,370 0,940 0,169 5,260 0,441 0,127
527 NR 0,868 0,657 1,057 0,060 9,318 0,495 0,192
534 NR 0,667 1,828 0,853 0,194 2,129 0,340 0,114
549 NR 0,639 0,979 1,759 0,080 2,297 0,434 0,290
574 NR 1,210 5,756 2,540 0,139 4,959 0,877 0,735
582 NR 0,476 2,949 0,455 0,409 4,675 0,230 0,081
596 NR 0,374 0,883 0,639 0,080 0,914 0,230 0,066
602 NR 0,047 0,936 0,180 0,059 0,091 0,086 0,012
618 NR 0,547 1,035 1,206 0,294 4,757 0,486 0,273
619 NR 0,276 0,301 1,218 0,064 1,542 0,284 0,237
636 NR 2,395 0,270 3,063 0,081 18,765 1,010 0,898
645 NR 0,026 0,000 0,124 0,000 0,069 0,058 0,008
646 NR 1,113 0,518 1,866 0,087 35,383 1,177 0,221
647 NR 0,859 0,192 1,283 0,110 20,393 0,883 0,216
649 NR 1,083 2,742 1,161 0,167 3,918 0,288 0,110
650 NR 1,000 5,816 2,354 0,446 12,381 0,990 0,294
651 NR 0,705 0,940 1,094 0,150 4,773 0,394 0,093
657 NR 0,356 4,840 0,787 2,412 2,949 0,322 0,135
658 NR 0,236 0,557 0,392 0,000 0,322 0,081 0,048
659 NR 0,547 4,423 0,536 0,237 0,690 0,150 0,067
Tableau 12 (suite et fin) : valeurs BMQ des patients pour les gènes HERC5, IL8, STAT2, CXCL6, GIP2, IFI35 et IFI44 (Ct normalisé conformément à la méthode du
2-ACt)
Statut
Patient (NR, R HERC5 IL8 STAT2 CXCL6 G1P2 IFI35 IFI44 ouRR)
660 NR 0,874 1,113 0,856 0,308 6,612 0,284 0,138
662 NR 1,050 0,046 0,426 0,051 5,483 0,179 0,066
664 NR 0,420 0,953 1,157 0,139 2,704 0,316 0,066
665 NR 0,176 0,949 0,495 0,061 0,576 0,118 0,024
666 NR 0,578 2,799 1,275 0,000 5,796 0,358 0,100
67 NR 0,133 0,104 0,369 0,036 0,314 0,125 0,021
563 NR 0,208 0,330 0,085 0,063 0,235 0,221 0,030
573 NR 0,940 0,323 0,990 0,064 6,892 0,543 0,207
599 NR 0,826 0,262 0,221 0,005 1,248 0,115 0,050
641 NR 0,408 0,657 0,462 0,150 2,454 0,204 0,048
642 NR 0,516 13,408 1,993 1,682 6,635 0,807 0,285
49 RR 0,521 0,284 1,853 0,000 1,905 0,262 0,177
56 RR 0,468 0,363 0,607 0,000 3,249 0,225 0,115
60 RR 0,690 0,145 0,841 0,000 7,945 0,362 0,126
87 RR 1,072 1,608 1,310 0,117 11,432 0,570 0,183
505 RR 0,476 0,410 0,325 0,000 4,084 0,263 0,138
514 RR 0,200 1,053 1,193 0,066 0,525 0,224 0,055
531 RR 0,039 0,053 0,101 0,004 0,103 0,036 0,010
533 RR 0,135 3,084 0,405 0,189 1,145 0,132 0,038
543 RR 0,486 0,597 1,157 0,059 1,548 0,375 0,204
554 RR 0,033 1,072 0,324 0,125 0,148 0,096 0,011
557 RR 0,355 0,700 0,304 0,061 3,317 0,248 0,073
558 RR 0,045 0,983 0,030 0,097 0,289 0,067 0,023
559 RR 0,076 0,536 0,113 0,069 0,871 0,101 0,015
562 RR 0,459 1,380 0,216 0,140 3,668 0,305 0,122
576 RR 0,493 1,064 0,956 0,127 5,187 0,332 0,198
579 RR 0,370 0,483 0,490 0,072 0,147 0,065 0,059
588 RR 0,025 0,255 0,384 0,041 0,053 0,059 0,016
589 RR 0,697 0,315 0,750 0,033 7,387 0,324 0,159
591 RR 0,412 0,113 0,262 0,048 2,378 0,179 0,071
592 RR 0,959 7,781 1,149 1,094 6,000 0,355 0,196
643 RR 0,083 15,835 0,597 1,197 0,390 0,228 0,026
Tableau 13 : valeurs BMQ des patients pour les gènes IFITl, IFIT4, ITGA2, MDK, MXl, OASl et OAS3 (Ct normalisé conformément à la méthode du 2"ACt)
Statut
Patient (NR, R IFITl IFIT4 ITGA2 MDK MXl OASl OAS3 ou RR)
45 R 0,020 0,753 0,408 0,037 0,254 1,014 1,879
50 R 0,011 0, 111 0, 166 0, 132 0,681 0,826 1,479
55 R 0,034 0,305 0,275 0,054 1,035 0,883 0,911
59 R 0,017 0,426 0,000 0,090 0,771 1,380 0,856
62 R 0,020 0,607 0, 160 0,043 0,986 1,444 1,821
63 R 0,261 4,347 0,063 0, 106 4,042 3,506 5,676
65 R 0,023 0,256 0,000 0, 105 0,582 0,908 0,979
66 R 0,011 0, 179 0,066 0,054 0,361 0,378 0,465
71 R 0,013 0, 193 0,000 0,021 0,455 0,437 0,760
72 R 0,008 0,092 0, 115 0,001 0,245 0, 162 0,391
73 R 0,048 0,885 0,000 0,055 0,841 1,364 0,568
76 R 0,024 0,391 0,376 0,045 0,717 1, 161 1,283
86 R 0,045 0,491 0,070 0,060 1,474 1,053 2,007
88 R 0,046 0,620 0,000 0,024 1, 165 0,976 1,227
90 R 0,033 0,372 0,030 0, 115 1,500 0,853 1,057
91 R 0,017 0,211 0,082 0,051 0,796 0,651 0,518
92 R 0,003 0,064 0,045 0,001 0,052 0, 187 0,084
125 R 0,026 0,345 0, 198 0,058 0,465 0,963 0, 102
222 R 0,089 2,250 0,074 0,063 1,840 1,537 1, 137
227 R 0,011 0,259 0,071 0,002 0,218 0,301 0, 120
306 R 0,032 1,886 0,553 0, 125 3,732 3,972 2,204
344 R 0,047 0,858 0,022 0,045 1,766 1,378 1,388
346 R 0,037 0,695 0,422 0,032 1,352 2,519 0,965
366 R 0,014 0, 137 0,273 0,012 0,297 0,325 0,547
501 R 0,027 0,358 0,094 0,046 1,017 0,826 0,083
502 R 0,007 0, 139 0,693 0,056 0,476 0,299 0,019
503 R 0,018 0,257 0,000 0,014 0,690 0,936 0,059
504 R 0,012 0,376 0,000 0,028 0,301 0,747 0,067
506 R 0,017 0,289 0,702 0,057 0,415 0,525 0, 173
508 R 0,006 0,349 0,080 0,032 0, 163 0,588 0, 143
513 R 0,012 0,298 0,425 0,034 0,409 0,553 0, 113
523 R 0,003 0,079 0,214 0,045 0,052 0, 140 0,062
Tableau 13 (suite) : valeurs BMQ des patients pour les gènes IFITl, IFIT4, ITGA2, MDK, MXl, OASl et OAS3 (Ct normalisé conformément à la méthode du 2 ~ACt)
Statut
Patient (NR, R IFITl IFIT4 ITGA2 MDK MXl OASl OAS3 ou RR)
528 R 0,018 0,432 0,285 0, 188 2,092 1,647 0,787
529 R 0,014 0,207 0, 136 0,084 0,920 0,669 0,331
530 R 0,008 0,281 0,216 0,023 0,498 0,847 0,200
532 R 0,010 0, 152 0, 121 0,207 0,288 0, 179 0,329
535 R 0,075 1, 161 0,000 0,057 2,969 1,892 2,770
536 R 0,012 0,221 0,087 0,010 0,443 0,351 0,406
537 R 0,004 0,072 0, 140 0,014 0, 196 0, 154 0, 131
538 R 0,039 0,536 0,072 0, 108 2,462 1,705 1,210
546 R 0,012 0,372 0,644 0,039 0,355 1,061 0,667
556 R 0,073 1, 189 0,093 0,011 2, 121 2,676 2,266
560 R 0,049 0,370 0, 172 0,028 1,257 0,930 1, 149
565 R 0, 135 1,625 0,071 0,049 3,042 1,879 2,042
567 R 0,051 0,412 0,399 0,038 1,834 0,963 1,306
568 R 0,004 0,054 0,000 0,005 0, 146 0, 146 0, 184
569 R 0,021 0,216 0,000 0,008 0,566 0,633 0,683
570 R 0,012 0,441 0,000 0,046 0,785 0,889 0,707
571 R 0,018 0,509 0,000 0,050 12,000 0,883 1,275
572 R 0,028 0,206 0,080 0,009 1,253 0,674 0,626
575 R 0, 123 3,837 0,543 0,525 7,945 6,431 9,849
577 R 0,020 0,525 0,000 0,024 12,951 1, 117 1, 181
581 R 0,030 0,329 0,367 0,034 1,959 0,683 1, 165
583 R 0,015 0,737 0, 118 0,056 1,495 1,542 1,575
585 R 0,038 0,886 0,217 0,063 2,445 2,445 1,474
598 R 0,010 0, 103 0,056 0,009 0,214 0,203 0,365
601 R 0,053 1,376 0,507 0, 125 3,482 0,631 2,979
604 R 0,021 0,481 0, 173 0, 157 1,376 1,244 1,711
605 R 0,078 0,953 0, 109 0, 173 2,313 1,586 2,313
613 R 0,011 2,313 0,753 0,017 0, 177 0,620 0,446
614 R 0,004 0,211 0,525 0,036 0,233 0,371 0,444
629 R 0,006 0,225 0,000 0,012 0,356 0,420 0,449
639 R 0,007 0,292 0,541 0,031 0,305 0,486 0,367
6 NR 0,010 0, 171 17,569 0,688 0,457 0,228 0,702
Tableau 13 (suite) : valeurs BMQ des patients pour les gènes IFITl, IFIT4, ITGA2, MDK, MXl, OASl et OAS3 (Ct normalisé conformément à la méthode du 2 ~ACt)
Statut
Patient (NR,R IFITl IFIT4 ITGA2 MDK MXl OASl OAS3 ouRR)
46 R 0,080 1,283 0,091 0,308 2,173 3,543 3,811
58 R 0,100 1,231 0,175 0,631 2,838 2,313 2,657
75 NR 0,198 3,306 0,459 1,248 7,062 3,959 6,612
80 NR 0,022 0,331 0,152 0,030 0,829 0,559 0,969
83 NR 0,235 2,732 0,237 0,476 6,498 3,411 7,037
145 NR 0,079 1,292 0,270 0,255 3,340 2,395 0,563
167 NR 0,100 1,214 0,231 0,521 0,463 2,204 2,549
308 NR 0,044 1,253 0,000 0,446 1,711 2,305 1,693
509 NR 0,061 0,908 0,444 0,172 3,021 1,324 0,651
516 NR 0,063 1,072 0,105 0,043 1,079 1,664 0,261
521 NR 0,349 7,648 1,193 1,676 8,140 6,233 2,114
524 NR 0,009 0,270 0,142 0,028 0,294 0,444 0,167
526 NR 0,063 0,997 0,282 0,189 2,630 2,305 1,035
527 NR 0,066 0,956 0,582 0,276 5,598 2,732 1,586
534 NR 0,083 1,046 0,300 0,140 2,173 1,608 2,395
549 NR 0,064 1,414 0,323 0,156 3,506 4,084 3,306
574 NR 0,163 3,193 0,435 0,191 10,629 6,277 6,916
582 NR 0,038 0,624 0,547 0,034 2,898 1,057 2,282
596 NR 0,035 0,551 0,262 0,069 1,682 1,017 1,390
602 NR 0,005 0,110 0,169 0,012 0,151 0,154 0,240
618 NR 0,072 1,796 0,000 0,152 2,949 4,213 3,238
619 NR 0,033 1,602 0,557 0,075 3,193 1,474 2,949
636 NR 0,256 6,364 0,277 0,712 15,242 9,580 13,690
645 NR 0,002 0,134 0,179 0,032 0,052 0,141 0,268
646 NR 0,091 4,611 0,000 0,314 1,564 5,389 10,666
647 NR 0,111 3,084 0,000 0,053 3,317 3,771 7,362
649 NR 0,048 0,993 0,104 0,053 0,448 1,474 1,366
650 NR 0,154 2,505 0,179 0,233 3,864 5,028 6,364
651 NR 0,031 0,859 0,218 0,253 1,925 2,488 2,114
657 NR 0,075 0,990 0,620 0,782 0,979 1,376 2,158
658 NR 0,021 0,379 0,271 0,018 0,410 0,518 0,308
659 NR 0,025 0,467 0,251 0,024 1,039 0,898 1,068
Tableau 13 (suite et fin) : valeurs BMQ des patients pour les gènes IFITl, IFIT4, ITGA2, MDK, MXl, OASl et OAS3 (Ct normalisé conformément à la méthode du 2
AC
Statut
Patient (NR, R IFITl IFIT4 ITGA2 MDK MXl OASl OAS3 ou RR)
660 R 0,077 0,760 0,206 0,037 1,061 1,979 1,688
662 R 0,019 0,284 0,072 0,047 1,803 0,790 1, 110
664 NR 0,071 0,681 0,013 0,046 1,495 1, 165 1,723
665 NR 0,024 0, 182 0,000 0,026 0,258 0,366 0,514
666 NR 0,058 0,676 0,000 0,221 2,780 6,233 2,878
67 NR 0,007 0, 144 0, 188 0,017 0,264 0,374 0,545
563 NR 0,012 0,534 0,232 0,011 0,269 0,568 0,908
573 NR 0, 123 1,747 0, 105 0,047 3,850 3,375 4,362
599 NR 0,020 0,271 0,000 0,010 0,793 0,463 0,657
641 NR 0,027 0,459 0, 138 0,028 0,717 0,914 1, 110
642 NR 0,089 3,824 1,352 0,688 1,939 6,342 6, 169
49 RR 0,045 0,678 0,202 0,076 0,859 2,471 1,952
56 RR 0,057 0,889 0,067 0,349 1,853 1,591 2,014
60 RR 0,031 0,642 0,000 0, 192 1,853 1,790 2,227
87 RR 0, 153 1,564 0,384 0,077 7,362 2,387 3,904
505 RR 0,049 1,404 0,000 0,037 1,338 1,641 0,622
514 RR 0,016 0,451 0, 123 0,021 1,333 1,320 0,279
531 RR 0,004 0,094 0,209 0,034 0,214 0, 150 0, 115
533 RR 0,024 0,289 0, 155 0,041 1,050 0,662 1,000
543 RR 0,031 0,940 0, 179 0,075 1,747 1,532 1,409
554 RR 0,005 0, 176 0,091 0,014 0,328 0,366 0,325
557 RR 0,053 0,605 0,216 0,001 1,952 0,946 0,787
558 RR 0,009 0, 102 0, 186 0,006 0,305 0,270 0,315
559 RR 0,015 0, 191 0,091 0,007 1,091 0,349 0,572
562 RR 0,050 0,911 0,367 0,075 2,049 1,424 2,266
576 RR 0,073 1,521 0,435 0,069 0,245 3, 117 2,630
579 RR 0,008 0,247 0,000 0,006 0,202 0,465 0,331
588 RR 0,006 0, 105 0,246 0,008 0, 158 0,249 0,219
589 RR 0,054 1,434 0,205 0,054 3,605 1,959 3, 117
591 RR 0,035 0,432 0, 171 0,035 1,569 0,818 0,747
592 RR 0,089 1,270 1,925 0, 138 3,758 0,549 2,639
643 RR 0,011 0,261 0,755 0,054 0,299 0,859 1, 137
Tableau 14 : valeurs BMQ des patients pour les gènes OCLN, PLSCRl, RSAD2, STATl, STMN2 etUSP18 (Ct normalisé conformément à la méthode du 2 ACt)
Statut
Patient (NR,R OCLN PLSCRl RSAD2 STATl STMN2 USP18 ouRR)
45 R 0,072 0,584 0,597 0,541 0,000 0,821
50 R 0,016 0,228 0,194 0,137 0,127 0,732
55 R 0,015 0,242 0,221 0,114 0,253 0,584
59 R 0,023 0,361 0,283 0,080 0,046 0,835
62 R 0,031 0,662 0,568 0,370 0,103 1,569
63 R 0,028 0,877 5,637 0,705 0,174 3,031
65 R 0,022 0,313 0,480 0,135 0,164 0,485
66 R 0,035 0,346 0,100 0,148 0,061 0,434
71 R 0,013 0,224 0,322 0,071 0,000 0,599
72 R 0,016 0,075 0,054 0,041 0,000 0,218
73 R 0,048 0,483 2,493 0,064 0,007 0,467
76 R 0,031 0,476 0,340 0,363 0,143 0,629
86 R 0,027 0,432 0,681 0,289 0,119 0,883
88 R 0,045 0,278 0,557 0,309 0,125 0,753
90 R 0,019 0,320 0,376 0,232 0,081 0,352
91 R 0,018 0,304 0,248 0,170 0,000 0,376
92 R 0,008 0,097 0,052 0,054 0,038 0,075
125 R 0,012 0,173 0,448 0,129 0,108 0,354
222 R 0,019 0,158 1,235 0,483 0,000 0,856
227 R 0,020 0,119 0,099 0,077 0,000 0,295
306 R 0,030 0,973 1,925 0,536 0,115 2,144
344 R 0,042 0,493 2,785 0,335 0,000 1,150
346 R 0,043 0,605 1,691 0,212 0,000 0,520
366 R 0,021 0,196 0,420 0,099 0,000 0,625
501 R 0,028 0,297 0,490 0,297 0,336 0,495
502 R 0,015 0,195 0,099 0,139 1,261 0,254
503 R 0,017 0,188 0,241 0,085 0,054 0,251
504 R 0,018 0,170 0,237 0,128 0,307 0,574
506 R 0,018 0,207 0,186 0,285 2,858 0,398
508 R 0,000 0,129 0,176 0,357 0,205 0,228
513 R 0,008 0,137 0,220 0,137 0,057 0,485
523 R 0,010 0,070 0,053 0,137 1,083 0,158
Tableau 14 (suite) : valeurs BMQ des patients pour les gènes OCLN, PLSCRl, RSAD2, STATl, STMN2 etUSP18 (Ct normalisé conformément à la méthode du 2
ACt^
Statut
Patient (NR,R OCLN PLSCRl RSAD2 STATl STMN2 USP18
ouRR)
528 R 0,020 0,118 0,354 0,209 2,878 0,536
529 R 0,016 0,218 0,356 0,138 0,070 0,448
530 R 0,050 0,354 0,185 0,124 0,266 0,382
532 R 0,022 0,117 0,112 0,068 0,000 0,288
535 R 0,021 0,119 2,454 0,195 0,000 1,682
536 R 0,018 0,154 0,182 0,134 0,292 0,497
537 R 0,017 0,104 0,065 0,051 0,066 0,117
538 R 0,028 0,267 1,181 0,254 0,063 1,189
546 R 0,057 0,379 0,260 0,177 0,000 0,631
556 R 0,011 0,250 1,729 0,260 0,076 0,956
560 R 0,018 0,401 0,480 0,254 0,140 0,395
565 R 0,013 0,486 2,144 0,350 0,226 1,223
567 R 0,021 0,387 0,740 0,275 0,312 0,609
568 R 0,005 0,064 0,056 0,028 0,146 0,080
569 R 0,027 0,202 0,147 0,134 0,000 1,161
570 R 0,036 0,395 0,202 0,283 0,707 0,963
571 R 0,034 0,547 0,497 0,620 0,147 0,597
572 R 0,014 0,240 0,252 0,089 0,060 0,576
575 R 0,074 1,619 5,011 0,847 0,223 3,904
577 R 0,021 0,405 0,304 0,181 0,000 1,310
581 R 0,016 0,296 0,295 0,177 1,778 0,574
583 R 0,022 0,493 0,402 0,247 0,363 0,898
585 R 0,016 0,605 1,292 0,432 0,067 1,449
598 R 0,009 0,131 0,090 0,084 0,108 0,207
601 R 0,019 0,167 0,790 0,511 0,000 1,815
604 R 0,020 0,475 0,609 0,156 0,163 1,050
605 R 0,022 0,485 1,218 0,287 0,074 1,035
613 R 0,035 0,264 0,152 0,120 0,000 0,379
614 R 0,026 0,305 0,067 0,202 0,193 0,262
629 R 0,035 0,150 0,122 0,092 0,000 0,760
639 R 0,025 0,257 0,202 0,126 0,000 0,667
6 R 0,020 0,755 0,266 0,151 87,730 0,224
Tableau 14 (suite) : valeurs BMQ des patients pour les gènes OCLN, PLSCRl, RSAD2, STATl, STMN2 etUSP18 (Ct normalisé conformément à la méthode du 2
AC
Statut
Patient (NR, R OCLN PLSCRl RSAD2 STATl STMN2 USP18
ou RR)
46 R 0,063 0,690 2,395 0,367 0,620 1,613
58 R 0,041 0,503 1,439 0,283 0,041 1,753
75 NR 0,079 1, 197 2,959 0,943 0,298 3,434
80 NR 0,027 0,283 0,309 0, 147 0, 179 0,441
83 NR 0,088 1,315 4,362 0,700 0,330 2,918
145 NR 0,047 0,653 1,469 0,578 0,315 1,253
167 NR 0,027 0,559 0, 129 0,467 0,580 1,821
308 NR 0,049 0,069 1,057 0,209 0,000 2,362
509 NR 0,025 0,428 1,564 0,580 0, 110 0,973
516 NR 0,031 0,282 0,892 0,416 0, 189 0,917
521 NR 0,077 0,973 6,681 2,258 0,880 7,808
524 NR 0,027 0,230 0, 168 0, 183 0,362 0,281
526 NR 0,028 0,311 0,973 0,301 0, 131 2,007
527 NR 0,036 0,532 2, 121 0,425 0,369 1,919
534 NR 0,024 0,236 1,338 0,234 0, 106 1,240
549 NR 0,041 0,446 1,202 0,707 0,000 2,667
574 NR 0,063 1,847 6,042 1,619 0,509 2,723
582 NR 0,033 0,620 1,050 0,272 2,523 0,551
596 NR 0,020 0,382 0,324 0,352 0, 164 0,541
602 NR 0,014 0, 174 0,080 0, 124 0,022 0, 180
618 NR 0,022 0,039 2,305 0,648 0,700 2,092
619 NR 0,010 0,441 1,010 0,460 0,000 1, 193
636 NR 0,082 1,847 12,773 2, 196 0,363 6, 105
645 NR 0,000 0, 105 0, 163 0,022 0,000 0, 126
646 NR 0,063 2, 151 3,945 0,435 0,000 7, 111
647 NR 0,045 1,925 3,543 0,662 0, 170 3,000
649 NR 0,041 0,631 0,559 0,354 0, 105 0,993
650 NR 0,080 1,266 3,732 0,824 0,547 4,098
651 NR 0,055 0,545 0,868 0,206 0,000 1,717
657 NR 0,046 0,541 0,732 0,418 1,676 1,244
658 NR 0,019 0,309 0, 140 0,259 0, 173 0,538
659 NR 0,023 0,422 0,676 0,248 0, 123 0,438
Tableau 14 (suite et fin) : valeurs BMQ des patients pour les gènes OCLN, PLSCRl, RSAD2, STATl, STMN2 etUSP18 (Ct normalisé conformément à la méthode du 2
AC
Statut
Patient (NR,R OCLN PLSCRl RSAD2 STATl STMN2 USP18
ouRR)
660 R 0,037 0,603 1,385 0,291 0,123 0,785
662 R 0,023 0,398 1,189 0,115 0,091 0,507
664 NR 0,046 0,449 0,674 0,315 0,710 1,117
665 NR 0,015 0,153 0,141 0,122 0,156 0,349
666 NR 0,040 0,605 1,210 0,310 0,262 1,301
67 NR 0,017 0,272 0,091 0,078 0,221 0,349
563 NR 0,019 0,199 0,098 0,139 0,000 0,215
573 NR 0,034 0,785 3,458 0,898 0,139 2,173
599 NR 0,008 0,198 0,219 0,088 0,023 0,409
641 NR 0,026 0,448 0,519 0,180 0,031 0,829
642 NR 0,116 1,580 0,862 1,094 1,919 2,532
49 RR 0,048 0,707 0,593 0,296 0,336 1,014
56 RR 0,018 0,273 1,283 0,345 0,212 1,046
60 RR 0,037 0,540 1,283 0,205 0,000 1,516
87 RR 0,039 0,624 3,294 0,697 0,105 1,741
505 RR 0,012 0,241 1,153 0,299 0,386 1,218
514 RR 0,060 0,422 0,460 0,300 0,073 0,727
531 RR 0,001 0,050 0,149 0,027 0,011 0,119
533 RR 0,020 0,183 0,530 0,226 1,569 0,676
543 RR 0,064 0,151 0,582 0,674 0,247 1,039
554 RR 0,024 0,115 0,091 0,160 0,179 0,384
557 RR 0,016 0,226 0,930 0,240 0,340 0,807
558 RR 0,009 0,096 0,084 0,067 0,351 0,194
559 RR 0,008 0,189 0,306 0,100 0,128 0,182
562 RR 0,037 0,518 1,177 0,365 0,904 1,061
576 RR 0,019 0,763 2,121 0,527 0,702 1,177
579 RR 0,018 0,137 0,163 0,127 0,188 0,235
588 RR 0,019 0,094 0,038 0,059 0,138 0,253
589 RR 0,023 0,609 1,735 0,412 0,284 1,064
591 RR 0,021 0,372 0,584 0,248 0,140 0,584
592 RR 0,041 0,973 1,747 0,868 4,141 1,297
643 RR 0,039 0,380 0,052 0,190 1,790 0,597
Tableau 15 : valeurs BMQ des patients pour les gènes CCL21, CLDNl, FOXOl, G1P2, G1P3, IFI27, LGALS3BP et OAS2 (Ct normalisé conformément à la méthode du 2"ACt)
Statut
Patient (NR,R CCL21 CLDNl FOXOl G1P2 G1P3 IFI27 IFITM1 LGALS3BP OAS2 ouRR)
45 R 0,033 3,732 0,402 0,959 0,020 0,120 0,162 0,063 0,152
50 R 0,013 1,409 0,083 1,586 0,097 0,844 0,189 0,087 0,202
55 R 0,006 0,856 0,026 1,275 0,060 0,949 0,115 0,046 0,224
59 R 0,006 1,840 0,071 0,877 0,089 0,705 0,195 0,045 0,109
62 R 0,017 3,042 0,101 0,943 0,141 1,653 0,232 0,113 0,271
63 R 0,025 2,235 0,064 12,295 0,401 2,479 0,714 0,115 0,595
65 R 0,012 1,664 0,092 1,613 0,061 1,235 0,150 0,048 0,776
66 R 0,013 1,400 0,154 0,308 0,012 0,115 0,079 0,028 0,076
71 R 0,002 0,607 0,082 0,564 0,038 0,331 0,065 0,014 0,086
72 R 0,005 0,406 0,050 0,176 0,006 0,124 0,050 0,015 0,094
73 R 0,004 2,230 0,174 1,064 0,038 0,171 0,109 0,060 0,230
76 R 0,012 2,403 0,166 0,653 0,041 0,498 0,148 0,064 0,153
86 R 0,023 1,361 0,124 14,123 0,329 2,063 0,378 0,103 0,328
88 R 0,010 1,828 0,102 2,042 0,124 2,549 0,163 0,034 0,201
90 R 0,012 1,357 0,067 1,912 0,150 0,702 0,182 0,048 0,280
91 R 0,008 1,261 0,056 0,664 0,038 0,495 0,096 0,023 0,152
92 R 0,005 0,224 0,026 0,049 0,003 0,043 0,024 0,008 0,019
125 R 0,005 0,801 0,028 1,257 0,077 2,166 0,128 0,012 0,088
222 R 0,016 0,774 0,052 5,187 0,091 1,641 0,313 0,021 0,582
227 R 0,003 0,801 0,060 0,119 0,005 0,042 0,052 0,014 0,030
Tableau 15 (suite) : valeurs BMQ des patients pour les gènes CCL21, CLDNl, FOXOl, G1P2, G1P3, IFI27, LGALS3BP et OAS2 (Ct normalisé conformément à la méthode du 2"ACt)
Statut
Patient (NR, R CCL21 CLDNl FOXOl G1P2 G1P3 IFI27 IFITM1 LGALS3BP OAS2 ou RR)
306 R 0,018 2,612 0, 128 3,568 0, 137 2,021 0,835 0,273 0,516
344 R 0,067 2,500 0,489 0,646 0,099 0,892 0, 196 0,037 0,211
346 R 0,004 2,088 0,342 0,601 0,340 1,521 0,718 0, 133 0,324
366 R 0,009 2,031 0, 161 0, 159 0,014 0,042 0,088 0,015 0,049
501 R 0,016 2,007 0,034 1,424 0, 112 0,801 0, 113 0,032 0,290
502 R 0,009 0,953 0,065 0,465 0,020 0,056 0,055 0,022 0, 104
503 R 0,004 1,790 0,390 0,755 0,067 0, 160 0, 133 0,024 0, 128
504 R 0,012 0,796 0,078 0,563 0,037 0,232 0,237 0,044 0,091
506 R 0,019 0,815 0,053 0,678 0,028 0,847 0,084 0,016 0,085
508 R 0,013 0,892 0,070 0, 143 0,004 0,046 0,072 0,028 0,073
513 R 0,006 0,223 0, 118 0,280 0,045 0,265 0, 139 0,035 0,081
523 R 0,018 0,901 0,049 0, 134 0,005 0,221 0,039 0,028 0,034
528 R 0,022 1,945 0, 140 1,261 0,099 1, 129 0,304 0,082 0,807
529 R 0,012 1,444 0,048 1,210 0, 130 1, 153 0, 137 0,031 0, 149
530 R 0,009 2,266 0,295 0, 144 0,015 0,073 0, 168 0,052 0,053
532 R 0,010 2,049 0,340 0,245 0,074 0, 161 0,066 0,029 0,020
535 R 0,025 0,002 0,060 15,348 0,324 3,732 0,431 0,053 0,394
536 R 0,010 1,784 0, 105 0,313 0,025 0,588 0,014 0,015 0,066
537 R 0,007 0,946 0,066 0,080 0,006 0, 102 0,050 0,012 0,029
538 R 0,014 1,966 0,064 5, 152 0,237 2,282 0,403 0,068 0,452
546 R 0,012 1,670 0,253 0,236 0,030 0,309 0, 134 0,056 0, 108
556 R 0,008 0,859 0,017 6,869 0,071 2,437 0,252 0,022 6,084
Tableau 15 (suite) : valeurs BMQ des patients pour les gènes CCL21, CLDNl, FOXOl, G1P2, G1P3, IFI27, LGALS3BP et OAS2 (Ct normalisé conformément à la méthode du 2" )
Statut
Patient (NR,R CCL21 CLDNl FOXOl G1P2 G1P3 IFI27 IFITM1 LGALS3BP OAS2 ouRR)
560 R 0,008 1,647 0,071 3,249 0,093 1,753 0,166 0,038 0,220
565 R 0,006 0,829 0,134 4,857 0,065 2,056 0,220 0,022 0,503
567 R 0,006 1,235 0,050 2,497 0,101 1,050 0,108 0,068 0,134
568 R 0,002 0,740 0,018 0,055 0,005 0,087 0,035 0,007 0,023
569 R 0,003 2,313 0,086 0,092 0,016 0,167 0,177 0,047 0,072
570 R 0,006 2,028 0,493 0,118 0,023 0,186 0,221 0,028 0,085
571 R 0,026 2,378 0,205 0,609 0,033 0,063 0,116 0,057 0,155
572 R 0,005 1,161 0,038 2,129 0,115 2,021 0,148 0,020 0,125
575 R 0,036 3,706 0,202 15,348 0,821 9,254 1,414 0,360 1,157
577 R 0,007 2,035 0,052 0,224 0,022 0,047 0,116 0,093 0,046
581 R 0,006 1,357 0,082 1,210 0,072 0,332 0,085 0,036 0,138
583 R 0,015 1,117 0,045 1,297 0,106 1,641 0,386 0,146 0,113
585 R 0,017 1,575 0,064 3,411 0,155 0,886 0,403 0,121 0,228
598 R 0,008 0,732 0,017 0,200 0,024 0,486 0,053 0,009 0,040
601 R 0,005 1,275 0,056 1,053 0,253 1,759 0,362 0,069 0,157
604 R 0,011 1,310 0,063 1,061 0,123 3,470 0,248 0,124 0,003
605 R 0,009 1,153 0,064 5,315 0,258 2,338 0,311 0,048 0,023
613 R 0,007 3,000 0,087 0,108 0,011 0,053 0,113 0,035 0,049
614 R 0,011 1,705 0,249 0,135 0,005 0,084 0,056 0,057 0,041
629 R 0,003 2,437 0,142 0,074 0,009 0,588 0,065 0,059 0,036
639 R 0,005 1,553 0,033 0,109 0,005 0,043 0,086 0,021 0,021
6 R 0,004 0,237 0,355 0,685 0,041 0,388 0,083 0,044 0,092
Tableau 15 (suite) : valeurs BMQ des patients pour les gènes CCL21, CLDNl, FOXOl, G1P2, G1P3, IFI27, LGALS3BP et OAS2 (Ct normalisé conformément à la méthode du 2"ACt)
Statut
Patient (NR, R CCL21 CLDNl FOXOl G1P2 G1P3 IFI27 IFITM1 LGALS3BP OAS2 ou RR)
46 R 0,021 4, 112 0,295 8,969 0,209 3,329 0,511 0, 164 0,850
58 R 0,016 1,966 0,072 13,881 0,476 5,464 0,467 0, 149 0,512
75 NR 0,033 4, 170 0,215 8,664 0,607 1,993 0,877 0,265 1,035
80 NR 0,018 2,329 0, 144 0,963 0,031 0,288 0, 131 0,032 0,088
83 NR 0,073 5,776 0,220 6, 169 0,730 7,701 0,892 0, 164 1,266
145 NR 0,023 2,959 0, 186 7,490 0,360 2,770 0,345 0, 193 0,601
167 NR 0,018 1,500 0,098 5,046 0,434 1,765 0,283 0,099 0,750
308 NR 0,022 2,305 0, 144 6,658 0,545 6,821 0,613 0,251 0,485
509 NR 0,025 1,464 0,060 6, 126 0, 198 1,459 0,312 0,045 0,521
516 NR 0,017 1,591 0,309 3, 160 0, 199 1,007 0,222 0,065 0,266
521 NR 0,052 4,317 1,253 4,362 1,315 4,377 1,315 0,576 0,774
524 NR 0,009 2,523 0,094 0,286 0,017 0, 108 0,072 0,042 0,068
526 NR 0,028 1,741 0,084 5,260 0,293 3, 106 0,413 0, 130 0,459
527 NR 0,045 1,636 0,238 9,318 0,432 3,811 0,468 0,457 0,904
534 NR 0,017 2,742 0,058 2, 129 0,259 0,990 0,402 0,048 0,491
549 NR 0,023 2,878 0,314 2,297 0,245 1,490 0,415 0, 142 0,370
574 NR 0,031 3,986 0,512 4,959 0,305 3,945 1,042 0,241 1,343
582 NR 0,012 2,549 0,077 4,675 0, 120 0,470 0, 143 0,037 0,277
596 NR 0,017 1,945 0,077 0,914 0,079 0,622 0, 189 0,059 0,221
602 NR 0,010 1,479 0,055 0,091 0,005 0,087 0,047 0,019 0,040
Tableau 15 (suite) : valeurs BMQ des patients pour les gènes CCL21, CLDNl, FOXOl, G1P2, G1P3, IFI27, LGALS3BP et OAS2 (Ct normalisé conformément à la méthode du 2"ACt)
Statut
Patient (NR, R CCL21 CLDNl FOXOl G1P2 G1P3 IFI27 IFITM1 LGALS3BP OAS2 ou RR)
618 R 0,025 3,399 0, 137 4,757 0,475 4,070 0,603 0,221 0,601
619 R 0,011 1,253 0,080 1,542 0,387 1,444 0,432 0, 151 0,266
636 NR 0,048 6, 169 0,089 18,765 0,969 6,498 1,659 0,459 1,729
645 NR 0,004 0,009 0,642 0,069 0,009 0,081 0,071 0,017 0,011
646 NR 0,018 2,305 0,284 35,383 0,463 11,551 1,210 0,529 1,526
647 NR 0,028 3,021 0,287 20,393 0,297 5,979 0,936 0,097 1,564
649 NR 0,034 3,543 0,286 3,918 0, 109 1, 157 0,334 0,051 0,332
650 NR 0,022 3,272 0,254 12,381 0,465 2, 181 0,889 0,241 0,821
651 NR 0,009 3,238 0,392 4,773 0,416 6,298 0,398 0, 146 0,306
657 NR 0,013 2,362 0, 114 2,949 0,202 2,258 0,236 0,075 0,315
658 NR 0,009 1,361 0, 116 0,322 0,016 0,279 0, 125 0,019 0, 101
659 NR 0,006 1,847 0, 127 0,690 0,026 0,094 0,085 0,016 0, 175
660 NR 0,021 2,979 0, 150 6,612 0,399 2,523 0,334 0,074 0,286
662 NR 0,022 1,206 0,059 5,483 0,087 1,619 0, 180 0,049 0,053
664 NR 0,029 3, 106 0, 116 2,704 0, 184 0,917 0,371 0,063 0,002
665 NR 0,014 0,298 0,040 0,576 0,067 0,505 0,059 0,042 0,057
666 NR 0,028 3,387 0, 159 5,796 0,351 3, 127 0,326 0,095 0,774
67 NR 0,006 1,404 0,088 0,314 0,011 0, 146 0,051 0,034 0,069
563 NR 0,005 1,608 0,050 0,235 0,010 0,070 0, 128 0,038 0,058
573 NR 0,028 2,809 0,446 6,892 0,403 2,576 0,488 0, 134 0,660
599 NR 0,005 0,505 0,050 1,248 0,065 1,516 0, 109 0,013 0,079
641 NR 0,012 1,636 0, 174 2,454 0, 148 1,828 0, 187 0,035 0,259
Tableau 15 (suite et fin) : valeurs BMQ des patients pour les gènes CCL21, CLDNl, FOXOl, G1P2, G1P3, IFI27, LGALS3BP et OAS2 (Ct normalisé conformément à la méthode du 2"ACt)
Statut
Patient (NR,R CCL21 CLDNl FOXOl G1P2 G1P3 IFI27 IFITM1 LGALS3BP OAS2 ouRR)
642 R 0,046 2,949 0,200 6,635 0,382 2,990 0,917 0,429 0,877
49 RR 0,018 3,986 0,084 1,905 0,261 0,549 0,480 0,128 0,467
56 RR 0,011 1,087 0,092 3,249 0,270 1,741 0,264 0,062 0,252
60 RR 0,015 2,462 0,128 7,945 0,230 4,332 0,435 0,059 0,201
87 RR 0,021 3,605 0,123 11,432 0,361 3,193 0,521 0,104 1,057
505 RR 0,006 0,844 0,010 4,084 0,188 3,042 0,226 0,082 0,357
514 RR 0,011 2,488 0,352 0,525 0,031 0,200 0,184 0,082 0,194
531 RR 0,002 0,099 0,091 0,103 0,013 0,091 0,049 0,006 0,025
533 RR 0,008 1,548 0,059 1,145 0,073 0,702 0,072 0,046 0,092
543 RR 0,040 1,173 0,131 1,548 0,098 2,085 0,570 0,112 0,139
554 RR 0,005 1,772 0,100 0,148 0,009 0,094 0,035 0,029 0,062
557 RR 0,007 1,597 0,065 3,317 0,090 1,419 0,199 0,057 0,213
558 RR 0,002 0,730 0,070 0,289 0,019 0,331 0,032 0,015 0,048
559 RR 0,005 0,730 0,082 0,871 0,047 0,467 0,054 0,028 0,025
562 RR 0,007 2,828 0,102 3,668 0,242 1,676 0,266 0,112 0,271
576 RR 0,010 1,625 0,113 5,187 0,272 1,625 0,590 0,136 0,164
579 RR 0,004 1,206 0,053 0,147 0,006 0,034 0,060 0,019 0,021
588 RR 0,002 2,063 0,044 0,053 0,004 0,018 0,033 0,127 0,028
589 RR 0,012 2,694 0,048 7,387 0,280 2,305 0,387 0,094 0,435
591 RR 0,013 1,693 0,137 2,378 0,125 1,347 0,161 0,140 0,246
592 RR 0,020 2,297 0,191 6,000 0,204 1,010 0,468 0,158 0,553
643 RR 0,014 2,063 0,189 0,390 0,015 0,088 0,115 0,058 0,081
Tableau 16 : kits pour les dosages protéiques
Marqueurs IL8 LGALS3BP MDK CCL21
QUANTIKINE HUMAN
HUMAN MID INE HUMAN CCL21/6Ckine
Kit EIA CXCL8/IL-8 90K/Mac-2 BP ELISA
ELISA IMMUNOASSAY
IMMUNOASSAY
Fournisseur R&D Systems Abnova Abnova R&D Systems
Référence D8000C KA0140 KA0028 V.02 D6C00
Type d'ELISA Sandwich Sandwich Sandwich Sandwich
Sérum, plasma,
sérum, surnageant de Sérum, plasma, tissu,
Types d'échantillons milieu de culture sérum, plasma
culture cellulaire milieu de culture cellulaire
cellulaire
prise d'essai 50μΙ. 20μΙ. 25μΙ, ΙΟΟμΕ
Tableau 16 (suite) : kits pour les dosages protéiques
phase solide mAc anti-IL8 mAc anti-LGALS3BP pAc anti MDK mAc anti-CCL21 mAc-HRP anti- conjugué pAc-HRP anti-IL8 pAc-biotin anti-MDK pAc-HRP anti-CCL21
LGALS3BP sensibilité 3,5 pg/mL 0,92 ng/mL 0,33 ng/mL 9,9 pg/mL gamme de détection 31,2-2000 pg/mL 12,5 à 200 ng/mL 2 - 10 ng/mL 91-371 pg/mL
Tableau 16 (suite et fin) : kits pour les dosages protéiques
pAc = anticorps polyclonal
mAc = anticorps monoclonal
Administration du traitement anti-viral et analyse de la réponse du patient :
Après PBH et prélèvement de sérum, chaque patient a reçu un traitement antiviral qui est actuellement considéré comme le traitement standard de l'hépatite C, à savoir un traitement basé sur l'association de deux agents antiviraux, en l'occurrence alpha interféron et ribavirine.
Dans le cadre de l'essai ici décrit, tous les patients ont reçu le traitement suivant :
soit :
o de l'interféron alpha-2b pégylé (PEG-INTRON®; Schering Plough
Corporation ; Kenilworth, NJ ; U.S. A.) à une dose de 1,5 g/kg/semaine, et o de la ribavirine (REBETOL® ; Schering Plough Corporation ; Kenilworth, NJ ; U.S. A.) à une dose de :
■ 800 à 1200 mg/kg/jour pour ceux des patients qui étaient infectés par au moins un génotype 1 et/ou 4 et/ou 5 de VHC, ou à une dose de
■ 800 mg/kg/jour pour ceux des patients qui étaient infectés par au moins un génotype 2 et/ou 3 de VHC,
soit :
o de l'interféron alpha-2a pégylé (PEGASYS® ; Roche Corporation ; F.
Hoffmann-La Roche Ltd. ; Basel, Suisse) à une dose de 180 g/kg/semaine, et
o de la ribavirine (COPEGUS® ; Roche Corporation ; F. Hoffmann-La Roche Ltd. ; Basel, Suisse) à une dose de 1000 à 1200 mg/kg/jour.
Le traitement a été administré pendant 24 semaines pour ceux des patients qui étaient infectés par au moins un génotype 2 et/ou 3 de VHC, et pendant 48 semaines pour ceux des patients qui étaient infectés par au moins un génotype 1 et/ou 4 et/ou 5 de VHC.
La charge virale a été mesurée en semaine 24, à la fin du traitement et 6 mois après la fin du traitement, par quantification des ARN de VHC présents dans le sérum de chaque patient, à l'aide du test de quantification de l'ARN de VHC VERSANT® HCV RNA 3.0 (bDNA) ASSAY de la société Siemens Healthcare Diagnostics (limite de quantification = 615 - 7 690 OOO UI/mL).
Chaque patient a été classé en fonction de sa réponse au traitement telle que mesurée par le test de mesure de la charge virale sérique en VHC.
Un patient a été considéré être :
- un patient répondeur au traitement (patient classé R), lorsque la charge virale de VHC est devenue indétectable dans le sang du patient à l'issue du traitement et qu'elle est restée indétectable 6 mois après l'arrêt du traitement ;
- un patient non répondeur au traitement (patient classé NR), lorsque la charge virale de VHC est restée détectable dans le sang du patient à l'issue du traitement ;
- un patient répondeur-rechuteur (patient classé RR), lorsque la charge virale de VHC est devenue indétectable dans le sang du patient à l'issue du traitement, mais qu'elle est redevenue détectable 6 mois après l'arrêt du traitement.
La charge virale de VHC a été considérée indétectable dans le sang du patient, lorsque le dosage des ARN de VHC dans le sérum du patient a conduit à une valeur inférieure à 12 Unités Internationales (UI) par mL de sérum, telle que mesurée par le test de quantification de l'ARN de VHC VERSANT® HCV RNA 3.0 (bDNA) ASSAY de la société Siemens Healthcare Diagnostics ci-dessus indiqué.
Trois sous-populations, ou cohortes, ont ainsi été formées (sous-population des patients R, sous-population des patients NR et sous-population des patients RR). 2. Comparaison des valeurs de dosage des sous-populations NR et R pour établir un modèle de classification multivariée
Les valeurs de dosage obtenues au §1. ci-dessus pour les sous-populations « répondeurs » (R) et « non répondeurs » (NR) ont été comparées entre elles pour construire un modèle de classification multivariée qui, à partir de la combinaison de ces valeurs, classe le patient test parmi les patients qui ont une forte probabilité de répondre au traitement anti-VHC (classe de R) ou parmi la classe des patients qui ont une forte probabilité de ne pas répondre au traitement anti-VHC (classe des NR).
Les valeurs de dosage obtenues au §1. ci-dessus pour la sous-population « répondeurs- rechuteurs » (RR) ont également été comparées aux valeurs de dosage obtenues pour les sous-populations R et NR. Il a été observé que la sous-population RR ségrége très fortement avec celle des R : les patients RR sont majoritairement classés comme des R.
Un modèle de classification peut par exemple être obtenu en suivant une méthode d'analyse statistique multivariée, ou une méthode d'analyse mathématique multivariée.
Modèles mROC :
Une méthode d'analyse mathématique multivariée appropriée est la méthode mROC (méthode Receiver Operating Characteristic multivariée).
En utilisant les valeurs de dosage obtenues au §1. ci-dessus pour les sous-populations R et NR, des modèles mROC ont été construits comme décrit dans Kramar et al. 1999 et Kramar et al. 2001. A cet effet, le logiciel mROC version 1.0, disponible commercialement auprès des concepteurs (Andrew Kramar, Antoine Fortune, David Farragi, Benjamin Reiser) a été utilisé.
Andrew Kramar et Antoine Fortune peuvent être contactés auprès de, ou via, l'Unité de Biostatistique du Centre Régional de Lutte contre le Cancer (CRLC) Val d'Aurelle - Paul Lamarque (208, rue des Apothicaires ; Parc Euromédecine ; 34298 Montpellier Cedex 5 ; France).
David Faraggi et Benjamin Reiser peuvent être contactés auprès du, ou via le, Département de Statistique de l'Université de Haifa (Mount Carmel ; Haifa 31905 ; Israël).
A partir des données de dosage entrées, la méthode mROC génère une règle décisionnelle sous la forme d'une fonction linéaire [Z = f(BMQi
; BMQ
2, BMQ
3, ... )] du type Z =
où BMQi, BMQ2, BMQ3... sont les valeurs de dosage des niveaux d'expression de chacun des gènes choisis, et
l'utilisateur identifie la valeur de référence ou seuil (δ) qui confère les meilleures performances à cette combinaison.
Cette fonction et ce seuil constituent un modèle de classification multivariée. La fonction f calculée par la méthode mROC a ensuite été appliquée aux valeurs de dosage du niveau d'expression des gènes BMQi, BMQ2, BMQ3... mesurées pour un sujet test p. La valeur Z calculée pour un sujet test p a ensuite été comparée au seuil δ.
Par exemple, lorsque la valeur moyenne de la combinaison des niveaux d'expression desdits gènes choisis dans la cohorte des individus « R » est inférieure à celle de la cohorte des individus « NR » :
- si Z > δ, le test est positif : il est déclaré que le sujet p est un patient NR (sujet pronostiqué non-répondeur au traitement) ; et
- si Z < δ, le test est négatif : il est déclaré que le sujet p est un patient R (sujet pronostiqué répondeur au traitement).
Inversement, lorsque la valeur moyenne de la combinaison des niveaux d'expression desdits gènes choisis dans la cohorte des individus « R » est supérieure à celle de la cohorte des individus « NR » :
- si Z > δ, le test est négatif : il est déclaré que le sujet p est un patient R (sujet pronostiqué répondeur au traitement) ; et
- si Z < δ, le test est positif : il est déclaré que le sujet p est un patient NR (sujet pronostiqué non-répondeur au traitement).
Modèles WKNN :
Une méthode d'analyse statistique multivariée appropriée est la méthode WKNN (Weighed k Nearest Neighbors).
En utilisant les valeurs de dosage obtenues au §1. ci-dessus pour les sous-populations R et NR, des modèles WKNN ont été construits comme décrit dans Hechenbichler et Schliep
2004.
Schématiquement, une méthode WKNN attribue chaque nouveau cas (y,x) à la classe / de poids maximal dans un voisinage à k voisins selon la formule :
où r représente l'indice des classes cliniques d'intérêt (en l'occurrence, sous-population R ou sous-population NR), et est égal à 0 ou 1.
Pour construire les modèles WKNN, le logiciel R (librairie WKNN), librement disponible sur http://www.r-project.org/, a été utilisé. Les paramètres de réglage suivants ont été utilisés :
{cf., par exemple, combinaison n°l)
- Kernel (K) : inverse ;
- Distance (D) : minkowski de paramètre 1 ;
- Nombre de voisins (k) : 5 ;
ou {cf., par exemple, combinaison n°2)
- Kernel (K) : triangulaire ;
- Distance (D) : minkowski de paramètre 2 ;
- Nombre de voisins (k) : 4 ;
ou {cf., par exemple, combinaison n°7)
- Kernel (K) : triangulaire ;
- Distance (D) : minkowski de paramètre 1 ;
- Nombre de voisins (k) : 6 ;
ou {cf., par exemple, combinaison n°8)
- Kernel (K) : cosine ;
- Distance (D) : minkowski de paramètre 1 ; - Nombre de voisins (k) : 7 ;
ou {cf., par exemple, combinaison n°9)
- Kernel (K) : tri-pondéré ;
- Distance (D) : minkowski de paramètre 1 ;
- Nombre de voisins (k) : 14 ;
ou {cf., par exemple, combinaison n°10)
- Kernel (K) : cosine ;
- Distance (D) : minkowski de paramètre 1 ;
- Nombre de voisins (k) : 6 ;
ou {cf., par exemple, combinaisons n°l 1 et n°13) - Kernel (K) : inverse ;
- Distance (D) : minkowski de paramètre 2 ;
- Nombre de voisins (k) : 3 ;
ou {cf., par exemple, combinaison n°12)
- Kernel (K) : triangulaire ;
- Distance (D) : minkowski de paramètre 1 ;
- Nombre de voisins (k) : 10.
Les modèles WKNN ainsi construits ont ensuite été utilisés pour déterminer le statut R ou NR des sujets, en entrant les valeurs de dosage de ces sujets dans les modèles WKNN ainsi construits.
Les valeurs de dosage des niveaux d'expression des gènes choisis d'un sujet test p ont été comparées à celles de ces voisins (k). Le modèle WKNN calcule le poids devant être attribué à la classe « sous-population R » et celui devant être attribué à la classe « sous- population NR » pour ce sujet p. Le sujet p est alors classé par le modèle WKNN dans la classe majoritaire, par exemple, dans la classe « sous-population NR » si les poids des classes « sous-population R » et « sous-population NR » calculés par la méthode WKNN étaient de 0,3 et 0,7, respectivement.
L'erreur LOOCV (« Leave-One-Out-Cross- Validation ») est telle que définie dans Hastie, Tibishirani et Friedman, 2009.
Modèles à forêt aléatoire (Random Forest ou RF) :
En utilisant les valeurs de dosage obtenues au §1. ci-dessus pour les sous-populations R et NR, des modèles à forêt aléatoires (Random Forest ou RF) ont été construits comme décrit dans Breiman 2001, Liaw et Wiener 2002.
A cet effet, le logiciel R, librement disponible sur http://www.r-project.org/, a été utilisé. Les paramètres de réglage suivants ont été utilisés :
NumberOfTrees = 500 ;
NumberOfDescriptors = sqrt(D).
Les données numériques listées dans le fichier de sortie de R permettent d'évaluer les signatures avec le calcul des paramètres suivants : calcul des valeurs de Vrai Positif (VP), Faux Positif (FP), Vrai Négatif (VN) et Faux Négatif (FN), cf. ci-dessous.
Les données extraites du fichier sortie des modèles RF ainsi construits ont présenté la forme suivante :
"OOB estimate of error rate: taux d'erreur global
Confusion matrix:
NR R Class. error
NR VP FN taux d'erreur de classification des NR
R FP VN taux d'erreur de classification des R
ROC score (out-of-bag data): score ROC pour échantillons prédits "
OOB est l'acronyme de Out-Of-Bag, et représente une évaluation de l'erreur.
Ces données sorties indiquent directement les valeurs des paramètres VP (nombre de patients NR qui ont été classés NR), FP (nombre de patients R qui ont été classés NR), VN (nombre de patients R qui ont été classés R) et FN (nombre de patients NR qui ont été classés R).
Les formules ci-dessous permettent de calculer les valeurs de sensibilité (Se), de spécificité (Spe), de Valeur Prédictive Positive (VPP), et de Valeur Prédictive Négative (VPN) :
Se = VP/ (VP + FN) ;
Sp = VN / (VN + FP) ;
VPP = VP / (VP + FP) ;
VPN = VN / (VN + FN).
Les données sorties indiquent également de manière directe le taux d'erreur et le score ROC du modèle construit.
Les modèles RF ainsi construits ont ensuite été utilisés pour déterminer le score de fibrose hépatique de sujets tests. Les valeurs de dosage des niveaux d'expression des gènes de ces sujets tests ont été entrées dans un modèle RF, lequel génère des données sorties comme ci-dessus présentées, et classe le sujet testé dans la classe « sous-population R » ou « sous- population NR ».
L'erreur LOOCV est telle que définie dans Hastie, Tibishirani et Friedman, 2009. Modèles à réseaux de neurones :
Une autre méthode d'analyse statistique multivariée appropriée est une méthode à réseaux de neurones. Schématiquement, un réseau de neurones comprend un graphe pondéré orienté dont les nœuds symbolisent les neurones. Le réseau est construit à partir des valeurs de dosage des sous-populations (en l'occurrence, R versus NR), et est ensuite utilisé pour déterminer à quelle classe (en l'occurrence, R ou NR) appartient un nouvel élément (en l'occurrence, un patient test p).
En utilisant les valeurs de dosage obtenues au §1. ci-dessus pour les sous-populations R et NR, des modèles à réseaux de neurones ont été construits comme décrit dans Intrator et
Intrator 1993, Riedmiller et Braun 1993, Riedmiller 1994, Anastasiadis et. al. 2005 ; cf. http://cran.r-project.org/web/packages/neuralnet/index.html.
A cet effet, le logiciel R librement disponible sur http://www.r-project.org/, a été utilisé (version 1.3 de Neuralnet, écrit par Stefan Fritsch et Frauke Guenther, suivant le travail de Marc Suling).
Les options de calcul suivantes ont été utilisées :
« NumberOfiiiddenNodes = 1 et 2
WeightDecayfactor = 0.001
CrossValidate = True
CrossValidationFolds = 5
MaxNumberlterations = 2000
MaxNumberWeights= 2000 ».
Pour chacune des combinaisons, la matrice de confusion est extraite sous une forme du type suivant :
« Cross-validation results (5-fold):
Nodes Decay ROC Score Best
1 1
2 2 ***
Contingency Table (best CVmodel):
Predicted
Actual R NR
R VN FP NR FN VP
Dans cet exemple, on observe que le meilleur modèle est le modèle 2, signalé par « *** » dans la colonne « ScoreBest ».
Ces données sorties indiquent directement les valeurs des paramètres VP (nombre de patients NR qui ont été classés NR), FP (nombre de patients R qui ont été classés NR), VN (nombre de patients R qui ont été classés R) et FN (nombre de patients NR qui ont été classés R).
Les paramètres suivants sont évalués : la sensibilité (Se), la spécificité (Spe), la Valeur Prédictive Positive (VPP) et la Valeur Prédictive Négative (VPN) {cf. formules de Se, Spe, VPP et VPN ci-dessus).
Le score ROC est extrait directement du fichier de sortie sur la ligne identifiée par « *** » qui correspond au meilleur modèle. Le taux d'erreur est calculé par la formule suivante : Class_err = (FP + FN) / (FP + VP + FN + VN).
Les modèles à réseau de neurones ainsi construits ont ensuite été utilisés pour déterminer si un sujet test a une forte probabilité de répondre, ou au contraire de ne pas répondre, au traitement anti-VHC. Les valeurs de dosage des niveaux d'expression des gènes de ces sujets tests ont été entrées dans un modèle à réseau de neurones, lequel génère des données sorties comme ci-dessus présentées, et classe le sujet testé dans la classe « sous- population R » ou « sous-population NR ». 3. Exemples de modèles de classification obtenus :
Les inventeurs ont ainsi identifié des gènes dont les niveaux d'expression constituent des biomarqueurs qui, lorsqu'ils sont pris en combinaison, sont pertinents pour déterminer le statut « répondeur » (R) ou « non répondeur » (NR) d'un sujet.
Ces gènes sont les vingt-huit gènes suivants : HERC5, IL8, STAT2, CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18.
La plupart de ces gènes codent des protéines dont la localisation n'est pas transmembranaire, ou à tout le moins ne l'est pas exclusivement. La plupart de ces gènes codent donc des protéines qui sont susceptibles d'être détectées dans un fluide biologique du sujet, tel que le sang, le sérum ou le plasma. C'est en fait le cas des vingt-huit gènes listés ci-dessus, à l'exception des sept gènes suivent, qui codent des protéines membranaires strictes : CLDN1, G1P3, IFI27, IFITM1, ITGA2, OCLN, PLSCR1.
Les inventeurs ont en outre identifié que les combinaisons les plus pertinentes comprennent :
au moins deux gènes parmi HERC5, IL8, STAT2 ; et
- au moins un gène parmi CCL21, CLDN1, CXCL6, FOXOl, G1P2, G1P3, IFI27, IFI35, IFI44, IFIT1, IFIT4, IFITM1, ITGA2, LGALS3BP, MDK, MX1, OAS1, OAS2, OAS3, OCLN, PLSCR1, RSAD2, STAT1, STMN2, USP18. A titre illustratif, des exemples de combinaisons de biomarqueurs appropriées comprennent notamment les combinaisons de quatre ou cinq biomarqueurs (combinaisons des niveaux d'expression de quatre ou cinq gènes) présentées dans le tableau 2 ci-dessus, en partie descriptive.
Des exemples de modèles de classification qui peuvent être mis en œuvre avec ces combinaisons de biomarqueurs sont présentés dans les tableaux 3 à 5 ci-dessus (combinaison des niveaux de transcription de quatre ou cinq gènes choisis conformément à l'invention), cf. également les exemples ci-dessous. Les combinaisons prédictives de l'invention sont des combinaisons des niveaux d'expression de gènes, choisies comme ci-dessus indiqué.
Il peut néanmoins être choisi de faire intervenir dans ces combinaisons un ou plusieurs facteurs autres que les niveaux d'expression de ces gènes, pour combiner cet ou ces autres facteurs et les niveaux d'expression des gènes choisis en une règle décisionnelle.
Cet ou ces autres facteurs sont préférablement choisis de sorte à construire un modèle de classification dont le pouvoir prédictif est encore amélioré par rapport au modèle qui ne comprendrait pas cet ou ces autres facteurs {cf. exemple ci-dessous).
Cet ou ces autres facteurs peuvent par exemple être des facteurs cliniques, biologiques, virologiques, par exemple :
- un ou plusieurs facteurs cliniques, tels que sexe (féminin F ou masculin M), âge à la date du prélèvement (par exemple, âge à la date de la PBH, âge à la date de la cytoponction hépatique, âge à la date du prélèvement de sang, de sérum, de plasma ou d'urine), âge à la date de la contamination, âge à la date de début du traitement, indice de masse corporelle (IMC), indice de sensibilité à l'insuline (HOMA), diabète, consommation d'alcool, degré de stéatose, mode de contamination, activité Metavir, score de fibrose hépatique mesuré selon le système Metavir (score F Metavir) ou selon le système Ishak,
et/ou
- un ou plusieurs facteurs biologiques autres que les niveaux d'expression desdits gènes choisis, tels que concentration en haptoglobine (Hapto), concentration en apolipoprotéine Al (ApoAl), teneur en bilirubine totale (BLT), concentration en gamma glutamyl transpeptidase (GGT), concentration en aspartate aminotransférase (AST), concentration en alanine aminotransférase (ALT), teneur en plaquettes (PLQ), taux de prothrombine (TP), teneur en cholestérol HDL (Chol-HDL), teneur en cholestérol total, concentration en ferritine (Ferritine), teneur glycémique (glycémie), concentration en peptide C, teneur en insuline (insulinémie), concentration en triglycérides (TG), teneur en albumine, coefficient de saturation en fer de la transferrine (CS), concentration en phosphatase alcaline (PAL) ;
et/ou
- un ou plusieurs facteurs virologiques, tels que génotype viral, durée de l'infection, charge virale avant traitement (CVavantTTT), charge virale mesurée chez le patient à la date du début du traitement (charge virale à J0), charge virale mesurée chez le patient à la date du prélèvement (charge virale à PBH, charge virale à la date de la cytoponction hépatique, charge virale à la date du prélèvement de sang, de sérum, de plasma ou d'urine).
EXEMPLE 2 : ARN de biopsie ponction hépatique (BPH) / applications des modèles construits à des patients tests
2a) exemple d'application de la combinaison des niveaux d'expression (ARN) des gènes HERC5, IFI44, IL8 et MDK (combinaison n°l dans le tableau 2 ci-dessus) : Par la méthode WKNN {cf. exemple 1 ci-dessus), l'erreur LOOCV associée à la combinaison des niveaux de transcription (ARN) des gènes HERC5, IFI44, IL8 et MDK (combinaison n°l dans le tableau 2 ci-dessus) est de 15 {cf. tableau 3 ci-dessus).
Les meilleures performances de cette combinaison selon la méthode WKNN (calculées sur la population des 107 répondeurs et non-répondeurs présentée en tableau 11 ci-dessus) sont les suivantes :
sensibilité (Se) = 84% ; spécificité (Sp) = 86% {cf. tableau 3 ci-dessus).
Les paramètres de réglage utilisés pour la méthode WKNN ont été les suivants :
Kernel (K) : inverse,
Distance (D) : minkowski de paramètre 1,
Nombre de voisins (k) : 5.
Un exemple de prédiction sur 20 sujets (patients humains) est donné dans le tableau 17 ci- dessous, qui présente les valeurs de dosage des niveaux d'expression des gènes choisis (valeurs BMQ obtenues par la méthode du 2~ACt ; cf. exemple 1 ci-dessus).
Un ou plusieurs facteurs cliniques, biologiques et virologiques peuvent être combinés à ces biomarqueurs (niveaux d'expression de quatre gènes), et conduire à une règle décisionnelle dont le pouvoir prédictif est encore supérieur à celui de la règle ci-dessus présentée. Le tableau 18 suivant présente des exemples de tels facteurs cliniques, biologiques et virologiques, ainsi que leurs valeurs pour les sujets tests du tableau 17. ND = non déterminé
CV = charge virale
Tableau 17 : exemple d'application d'un modèle de classification basé sur la combinaison des niveaux d'expression des gènes HERC5, IFI44, IL8 et MDK (combinaison n°l du tableau 2 ci-dessus) modèle WKNN Statut
R ou NR, n° du (kernel = inverse ; distance = minkowski de paramètre 1 ; k = 5)
tel que sujet
n déterminé test Prédictio
HERC5 IFI44 IL8 MDK
WKNN après traitement
521 1,670 0,785 3,732 1,676 R NR
509 0,719 0, 102 1, 157 0, 172 R NR
308 0,886 0, 154 0,853 0,446 NR NR
167 0,653 0,075 0,923 0,521 NR NR
145 1,283 0, 183 0,755 0,255 NR NR
80 0,570 0,057 0,745 0,030 NR NR
75 1,035 0,319 0,908 1,248 NR NR
58 0,607 0, 149 0,616 0,631 NR NR
46 0,563 0, 177 0,911 0,308 NR NR
6 0,247 0,046 2,648 0,688 NR NR
91 0, 149 0,042 0,040 0,051 R R
90 0,342 0,046 0,089 0, 115 R R
86 0,259 0,086 0,451 0,060 R R
76 0,293 0,067 1,257 0,045 R R
72 0,097 0,010 0,064 0,001 R R
71 0,255 0,015 0,228 0,021 R R
65 0,258 0,055 0, 168 0, 105 R R
62 0,280 0,074 0,058 0,043 R R
59 0,269 0,039 0,329 0,090 R R
50 0, 144 0,018 0,444 0, 132 R R
Tableau 18 : exemples de données cliniques, virologiques, biologiques pour les sujets tests du tableau 17
Age au
Âge Stéatose
n° du sujet IMC Alcool Mode de Activité Fibrose Fibrose début
Sexe à la HOMA Diabète (score 0
test (kg/m2) (g/jour) contamination Metavir Ishak Metavir du
PBH à 3)
traitement
521 M 58,4 23,8 D Non 30 0 Transfusion 1 4 3 58,9
509 F 48,2 20,8 1,4 Non ND 0 Transfusion 1 4 3 48,4
308 M 34,9 27,7 ND Non 0 0 Zone endémique (Egypte) 1 1 1 35,4
167 F 48,6 37,8 2,3 Non ND 0 Transfusion 2 1 48,8
145 M 40,8 28,4 2,3 Non 10 0 Toxicomanie 1 2 1 42,2
80 F 36,6 31,6 ND Non 0 2 Transfusion 1 1 2 37,2
75 F 53,0 27,9 ND Non 0 0 ND 2 2 53,3
58 M 48, 1 25,2 2, 1 Non 0 0 Toxicomanie 1 3 2 48,2
46 M 54,4 26,9 2,4 Non 5 1 Inconnu 2 1 55, 1
6 M 59,0 19,6 1,2 Non 30 0 Toxicomanie 1 3 2 59,3
91 F 47,8 21,4 ND Non 0 0 ND 1 2 1 48,0
90 F 58,7 25,2 ND Non 0 2 Transfusion 1 3 2 59,0
86 M 50, 1 28,4 ND Oui 40 1 Inconnu 1 1 1 50,3
76 F 53,5 22,8 ND Non 0 0 Inconnu 3 2 53,6
72 M 37,2 29,0 2,2 Non 0 2 Zone endémique (Egypte) 1 3 2 37,3
71 M 43,3 20,2 0,6 Non 0 0 Inconnu 1 2 1 43,3
65 M 35,6 29,6 3,9 Non 0 0 Zone endémique (Egypte) 1 2 1 35,7
62 M 61,6 27,4 8,7 ND 50 1 Nosocomiale 1 3 2 61,7
59 F 50,9 23,7 1,5 Non 0 0 Transfusion 1 2 1 51,3
50 M 48, 1 28,4 3,4 Non 0 1 Zone endémique (Egypte) 2 2 2 48,7
Tableau 18 (suite): exemples de données cliniques, virologiques, biologiques pour les suiets tests du tableau 17 n° du sujet
Génotype Durée d'infection CV PBH (copies/mL. 10E3) CVavantTTT (copies/mL. 10E3) test
521 1 34,8 14654 14432
509 1 49, 1 8779 8779
308 4 ND 423 423
167 4 ND 12616 12616
145 1 25,8 26631 18304
80 1 38, 1 7606 12932
75 1 ND 3276 2347
58 1 30,9 5079 5079
46 1 ND 7903 9103
6 1 33,7 10450 10450
91 1 ND 3902 3902
90 1 ND 515 515
86 2 ND 57 57
76 1 ND 19227 19927
72 4 ND 1155 1155
71 4 ND 6935 6935
65 4 ND 1135 450
62 2 ND 14 185
59 5 26,8 524 1120
50 4 ND 445 445
Tableau 18 (suite): exemples de données cliniques, virologiques, biologiques pour les suiets tests du tableau 17
n° du sujet alpha2macroglobuline Haptoglobine Apo Al BLT GGT AST ALT PLQ Chol-HDL
TP (%)
test (g L) (g L) (g/L) (μιηοΙ/L) (U/L) (U/L) (U/L) (x 10E3/mm3) (mmol/L)
521 ND ND ND 11 127 83 166 189 100 1,62
509 4,24 0,39 1,89 13 43 154 243 121 86 1,88
308 ND ND ND 16 246 30 36 214 100 ND
167 2,9 0,54 1,64 15 378 163 144 183 78 1,28
145 2, 1 0,48 1,56 11 133 36 92 225 ND 1,25
80 ND ND ND 18 132 44 67 311 92 ND
75 ND ND ND 12 135 64 50 233 100 2, 15
58 3, 16 0,63 1,79 4 162 62 93 222 91 1,43
46 4,77 0,21 1,48 14 174 91 125 216 100 0,89
6 2,97 0,3 1,82 13 78 50 69 200 99 1,63
91 ND ND ND 9 39 64 79 353 99 ND
90 ND ND ND 11 21 61 119 359 100 ND
86 ND ND ND 13 287 53 105 160 100 ND
76 ND ND ND 14 81 90 157 209 96 ND
72 1,5 0,96 1,44 15 23 31 71 249 98 0,76
71 1,89 0,47 1,92 7 22 37 58 177 94 1,63
65 4,07 1, 15 1, 17 8 46 61 152 210 92 0,72
62 4,37 0,94 1,37 12 46 34 47 257 87 1
59 2,3 0,97 2,04 20 18 49 80 239 100 2, 13
50 5,21 1,09 1,6 14 160 93 167 161 89 0,81
Tableau 18 (suite et fin): exemples de données cliniques, virologiques, biologiques pour les sujets tests du tableau 17 n° du sujet Ferritine Glycémie Peptide C Insuline TG Albumine Chol Total PAL
CS (%)
test (μίΐ/L) (mmol/L) (ng/mL) (μϋΙ/mL) (mmol/L) (S/L) (mmol/L) (U/L)
521 514 6,2 ND ND 1,76 47 32 4,62 62
509 179 4,3 2,8 7,5 0,56 48 32 4,02 56
308 455 5, 1 ND ND 1, 13 48 46 4,81 73
167 702 5,22 2,3 9,82 0,62 43 70 4,58 114
145 260 5,7 2,87 8,99 1,2 40 43 5, 1 48
80 52 4,2 ND ND 0,97 47 30 5, 16 100
75 271 5,4 ND ND 0,69 44 40 4,72 149
58 693 5,4 2,35 8,79 0,93 46 33 4,93 51
46 D 4,9 3,03 11, 18 1,5 43 36 4,22 71
6 150 5,4 1,88 4,87 0,66 45 35 4,5 40
91 206 4,7 ND ND 1 43 36 4,5 72
90 137 4,2 ND ND 0,88 48 42 5,4 52
86 837 6,6 ND ND 0,69 48 46 5,82 77
76 156 4,2 ND ND 1, 12 47 36 4,96 58
72 397 5 2,34 9,74 3,57 47 27 4,72 70
71 101 4,5 0,81 3, 13 0,36 47 15 4,96 65
65 147 5,2 3,31 17,07 1,09 46 43 3,82 49
62 822 6,3 5,21 30,99 0,9 45 45 5 52
59 30 5 2, 18 6,65 0,71 46 27 5,46 77
50 182 5,2 3, 15 14,74 1,59 47 36 3,57 84
2b) exemple d'application de la combinaison des niveaux d'expression (ARN) des gènes HERC5, IFI44, IL8, MDK et OAS1 (combinaison n°2 dans le tableau 2 ci- dessus) : Par la méthode WKNN {cf. exemple 1 ci-dessus), l'erreur LOOCV associée à la combinaison des niveaux de transcription (ARN) des gènes HERC5, IFI44, IL8, MDK et OAS1 (combinaison n°2 dans le tableau 2 ci-dessus) est de 14 {cf. tableau 3 ci-dessus). Les meilleures performances de cette combinaison selon la méthode WKNN (calculées sur la population des 107 répondeurs et non répondeurs présentée en tableau 11 ci-dessus) sont les suivantes :
sensibilité (Se) = 82% ; spécificité (Sp) = 89% {cf. tableau 3 ci-dessus).
Les paramètres de réglage utilisés pour la méthode WKNN ont été les suivants :
Kernel (K) : triangulaire,
Distance (D) : minkowski de paramètre 2,
Nombre de voisins (k) : 4.
Un exemple de prédiction sur 20 sujets (mêmes patients humains qu'en exemple 2a) ci- dessus) est donné dans le tableau 19 ci-dessous, qui présente les valeurs de dosage des niveaux d'expression des gènes choisis (valeurs BMQ obtenues par la méthode du 2~ACt ; cf. exemple 1 ci-dessus).
Un ou plusieurs facteurs cliniques, biologiques et virologiques peuvent être combinés à ces biomarqueurs (niveaux d'expression de cinq gènes), et conduire à une règle décisionnelle dont le pouvoir prédictif est encore supérieur à celui de la règle ci-dessus présentée. Le tableau 18 précédent présente des exemples de tels facteurs cliniques, biologiques et virologiques, ainsi que leurs valeurs pour les sujets tests du tableau 19. ND = non déterminé
Tableau 19 : exemple d'application d'un modèle de classification basé sur la combinaison des niveaux d'expression des gènes HERC5, IFI44, IL8, MDK et OASl (combinaison n°2 du tableau 2 ci-dessus) modèle WKNN Statut
R ou NR, n° du (kernel = triangulaire ; distance = minkowski de paramètre 2 ; k = 4)
tel que sujet
déterminé test
HERC5 IFI44 IL8 MDK OASl Prédiction après
WKNN traitement
521 1,670 0,785 3,732 1,676 6,233 R NR
509 0,719 0, 102 1, 157 0, 172 1,324 R NR
308 0,886 0, 154 0,853 0,446 2,305 NR NR
167 0,653 0,075 0,923 0,521 2,204 NR NR
145 1,283 0, 183 0,755 0,255 2,395 NR NR
80 0,570 0,057 0,745 0,030 0,559 NR NR
75 1,035 0,319 0,908 1,248 3,959 NR NR
58 0,607 0, 149 0,616 0,631 2,313 NR NR
46 0,563 0, 177 0,911 0,308 3,543 NR NR
6 0,247 0,046 2,648 0,688 0,228 NR NR
91 0, 149 0,042 0,040 0,051 0,651 R R
90 0,342 0,046 0,089 0, 115 0,853 R R
86 0,259 0,086 0,451 0,060 1,053 R R
76 0,293 0,067 1,257 0,045 1, 161 R R
72 0,097 0,010 0,064 0,001 0, 162 R R
71 0,255 0,015 0,228 0,021 0,437 R R
65 0,258 0,055 0, 168 0, 105 0,908 R R
62 0,280 0,074 0,058 0,043 1,444 R R
59 0,269 0,039 0,329 0,090 1,380 R R
50 0, 144 0,018 0,444 0, 132 0,826 R R
2c) exemple d'application de la combinaison des niveaux d'expression (ARN) des gènes IL8, CLDN1, G1P3, HERC5 et RSAD2 (combinaison n°29 dans le tableau 2 ci- dessus) : L'AUC relative à la combinaison des niveaux d'expression des gènes IL8, CLDN1, G1P3, HERC5 et RSAD2 (combinaison n°29 dans le tableau 2 ci-dessus) calculée sur la population des 107 répondeurs et non-répondeurs présentée en tableau 1 1 ci-dessus est de 0,857 {cf. tableau 7 ci-dessus). Par la méthode mROC, le seuil maximisant l'indice de Youden (δ) pour cette combinaison est de -1,281 {cf. tableau 5 ci-dessus).
Pour le choix de ce seuil, les performances de la combinaison sont les suivantes :
Sensibilité (Se) = 77% ; spécificité (Spe) = 79% {cf. tableau 3 ci-dessus). Un exemple de règle décisionnelle est la règle suivante :
Z = 0, 134 x CLDN1* + 0,488 x G1P3* + 0,966 x HERC5* + 0, 129 x IL8 - 0,487 x RSAD2* (fonction Z29ARN ; cf. tableau 5 ci-dessus), où :
CLDN1, G1P3, HERC5, IL8 et RSAD2 sont les valeurs de dosage des biomarqueurs BMQ, c'est-à-dire les valeurs de dosage des niveaux d'expression des gènes indiqués (Ct normalisé conformément à la méthode de 2"ACt),
l'exposant t (ici porté par CLDN1, G1P3, HERC5 et RSAD2) indique que la valeur à appliquer dans la règle décisionnelle est la transformée Box-Cox (Box et Cox, 1964) de la valeur de dosage du niveau d'expression du gène considéré, afin de la
t λ
normaliser selon la formule suivante : BMQ = (BMQ -\)IX.
Dans l'exemple de règle décisionnelle ci-dessus indiquée, les paramètres λ sont de 0,68 pour CLDN1, 0, 19 pour G1P3, de 0, 19 pour HERC5 et de -0,05 pour RSAD2 (cf. tableau ci-dessus).
Si Z > -1,281 : le test diagnostic est positif (prédiction mROC = 1), le sujet est déclaré ' R' (sujet pronostiqué non-répondeur au traitement),
Si Z < -1,281 : le test est négatif (prédiction mROC = 0), le sujet est déclaré 'R' (sujet pronostiqué répondeur au traitement).
Un exemple de prédiction sur 20 sujets est donné dans le tableau 20 ci-dessous, qui présente les valeurs de dosage des niveaux d'expression des gènes choisis (valeurs BMQ obtenues par la méthode du 2~ACt ; cf. exemple 1 ci-dessus).
Un ou plusieurs facteurs cliniques, biologiques et virologiques peuvent être combinés à ces biomarqueurs indiqués ci-dessus (niveaux d'expression de cinq gènes), et conduire à une règle décisionnelle dont le pouvoir prédictif est encore supérieur à celui de la règle ci- dessus présentée. Le tableau 21 ci-dessus présente des exemples de tels facteurs cliniques, biologiques et virologiques, ainsi que leurs valeurs pour les patients tests du tableau 20. D = non déterminé
CV = charge virale
Tableau 20 : exemple d'application d'un modèle de classification basé sur la combinaison des niveaux d'expression des gènes IL8, CLDN1, G1P3, HERC5 et RSAD2 (combinaison n°29 du tableau 2 ci-dessus) modèle mROC
Statut
(fonction Z29ARN ; δ = = -1,281)
n° du sujet test R ou NR,
tel que déterminé après traitement
CLDN1 GIP3 HERC5 IL8 RSAD2 Z Prédiction mROC
46 4, 112 0,209 0,563 0,911 2,395 -1, 168 R NR
50 1,409 0,097 0, 144 0,444 0, 194 -1,546 R R
55 0,856 0,060 0,235 1,395 0,221 -1,362 R R
58 1,966 0,476 0,607 0,616 1,439 -0,779 NR NR
59 1,840 0,089 0,269 0,329 0,283 -1,291 R R
62 3,042 0, 141 0,280 0,058 0,568 -1,380 R R
65 1,664 0,061 0,258 0, 168 0,480 -1,745 R R
71 0,607 0,038 0,255 0,228 0,322 -1,809 R R
72 0,406 0,006 0,097 0,064 0,054 -1,970 R R
75 4, 170 0,607 1,035 0,908 2,959 -0,273 NR NR
76 2,403 0,041 0,293 1,257 0,340 -1,365 R R
80 2,329 0,031 0,570 0,745 0,309 -0,920 NR NR
83 5,776 0,730 2,549 0,231 4,362 0,630 NR NR
86 1,361 0,329 0,259 0,451 0,681 -1,348 R R
91 1,261 0,038 0, 149 0,040 0,248 -1,988 R R
145 2,959 0,360 1,283 0,755 1,469 -0,080 NR NR
167 1,500 0,434 0,653 0,923 0, 129 0,461 NR NR
308 2,305 0,545 0,886 0,853 1,057 -0, 162 NR NR
521 4,317 1,315 1,670 3,732 6,681 0,592 NR NR
526 1,741 0,293 0,418 2,370 0,973 -0,902 NR NR
Tableau 21 : exemples de données cliniques, virologiques, biologiques pour les suiets tests du tableau 20
Age au n° du Âge Stéatose
IMC Alcool Mode de Activité Fibrose Fibrose début sujet sexe à la HOMA Diabète (score 0 à
(kg/m2) (g/jour) contamination Metavir Ishak Metavir du test PBH 3) traitement
46 M 54,4 26,9 2,4 Non 5 1 Inconnu 2 2 1 55, 1
50 M 48, 1 28,4 3,4 Non 0 1 Zone endémique (Egypte) 2 2 2 48,7
55 F 48,2 22,2 3,5 Non 60 2 Inconnu 1 3 2 49,8
58 M 48, 1 25,2 2, 1 Non 0 0 Toxicomanie 1 3 2 48,2
59 F 50,9 23,7 1,5 Non 0 0 Transfusion 1 2 1 51,3
62 M 61,6 27,4 8,7 ND 50 1 Nosocomiale 1 3 2 61,7
65 M 35,6 29,6 3,9 Non 0 0 Zone endémique (Egypte) 1 2 1 35,7
71 M 43,3 20,2 0,6 Non 0 0 Inconnu 1 2 1 43,3
72 M 37,2 29,0 2,2 Non 0 2 Zone endémique (Egypte) 1 3 2 37,3
75 F 53,0 27,9 D Non 0 0 ND 2 2 2 53,3
76 F 53,5 22,8 D Non 0 0 Inconnu 2 3 2 53,6
80 F 36,6 31,6 ND Non 0 2 Transfusion 1 1 2 37,2
83 F 51,4 25,7 ND Non ND 2 NC 1 2 1 52,0
86 M 50, 1 28,4 ND Oui 40 1 Inconnu 1 1 1 50,3
91 F 47,8 21,4 ND Non 0 0 ND 1 2 1 48,0
145 M 40,8 28,4 2,3 Non 10 0 Toxicomanie 1 2 1 42,2
167 F 48,6 37,8 2,3 Non ND 0 Transfusion 2 2 1 48,8
308 M 34,9 27,7 ND Non 0 0 Zone endémique (Egypte) 1 1 1 35,4
521 M 58,4 23,8 ND Non 30 0 Transfusion 1 4 3 58,9
526 F 73,0 24,8 ND Non 0 1 Transfusion 2 6 4 73,2
Tableau 21 (suite) : exemples de données cliniques, virologiques, biologiques pour les suiets tests du tableau 20
n° du
sujet Génotype Durée d'infection CV PBH (copies/mL. 10E3) CV avant TTT (copies/mL .10E3) test
46 1 ND 7903 9103
50 4 ND 445 445
55 1 ND 150 299
58 1 30,9 5079 5079
59 5 26,8 524 1120
62 2 ND 14 185
65 4 ND 1135 450
71 4 ND 6935 6935
72 4 ND 1155 1155
75 1 ND 3276 2347
76 1 ND 19227 19927
80 1 38, 1 7606 12932
83 1 ND 1579 3928
86 2 ND 57 57
91 1 ND 3902 3902
145 1 25,8 26631 18304
167 4 ND 12616 12616
308 4 ND 423 423
521 1 34,8 14654 14432
526 1 38,4 778 778
Tableau 21 (suite) : exemples de données cliniques, virologiques, biologiques pour les suiets tests du tableau 20
n° du
alpha2macroglobuline Haptoglobine Apo Al BLT GGT AST ALT PLQ Chol-HDL sujet TP (%)
(x 10E3/mm3) (mmol/L) test (g L) (g L) (g/L) (μιηοΙ/L) (U/L) (U/L) (U/L)
46 4,77 0,21 1,48 14 174 91 125 216 100 0,89
50 5,21 1,09 1,6 14 160 93 167 161 89 0,81
55 4,4 0,38 1,4 13 118 210 314 156 95 1,05
58 3, 16 0,63 1,79 4 162 62 93 222 91 1,43
59 2,3 0,97 2,04 20 18 49 80 239 100 2, 13
62 4,37 0,94 1,37 12 46 34 47 257 87 1
65 4,07 1, 15 1, 17 8 46 61 152 210 92 0,72
71 1,89 0,47 1,92 7 22 37 58 177 94 1,63
72 1,5 0,96 1,44 15 23 31 71 249 98 0,76
75 ND ND ND 12 135 64 50 233 100 2, 15
76 ND ND ND 14 81 90 157 209 96 ND
80 ND ND ND 18 132 44 67 311 92 ND
83 ND ND ND 13 82 78 95 232 101 ND
86 ND ND ND 13 287 53 105 160 100 ND
91 ND ND ND 9 39 64 79 353 99 ND
145 2, 1 0,48 1,56 11 133 36 92 225 ND 1,25
167 2,9 0,54 1,64 15 378 163 144 183 78 1,28
308 ND ND ND 16 246 30 36 214 100 ND
521 ND ND ND 11 127 83 166 189 100 1,62
526 ND ND ND 17 172 128 210 187 77 ND
Tableau 21 (suite et fin) : exemples de données cliniques, virologiques, biologiques pour les suiets tests du tableau 20 n° du
Ferritine Glycémie Peptide C Insuline TG Albumine Chol Total PAL sujet CS (%)
(mmol/L) (ng/mL) (μϋΙ/mL) (mmol/L) (g L) (mmol/L) (U/L) test
46 D 4,9 3,03 11, 18 1,5 43 36 4,22 71
50 182 5,2 3, 15 14,74 1,59 47 36 3,57 84
55 943 5,6 4,04 14,04 0,68 46 43 4,88 55
58 693 5,4 2,35 8,79 0,93 46 33 4,93 51
59 30 5 2, 18 6,65 0,71 46 27 5,46 77
62 822 6,3 5,21 30,99 0,9 45 45 5 52
65 147 5,2 3,31 17,07 1,09 46 43 3,82 49
71 101 4,5 0,81 3, 13 0,36 47 15 4,96 65
72 397 5 2,34 9,74 3,57 47 27 4,72 70
75 271 5,4 ND ND 0,69 44 40 4,72 149
76 156 4,2 ND ND 1, 12 47 36 4,96 58
80 52 4,2 ND ND 0,97 47 30 5, 16 100
83 71 5,6 ND ND 0,76 44 37 3,68 97
86 837 6,6 ND ND 0,69 48 46 5,82 77
91 206 4,7 ND ND 1 43 36 4,5 72
145 260 5,7 2,87 8,99 1,2 40 43 5, 1 48
167 702 5,22 2,3 9,82 0,62 43 70 4,58 114
308 455 5, 1 ND ND 1, 13 48 46 4,81 73
521 514 6,2 ND ND 1,76 47 32 4,62 62
526 320 4,4 ND ND 0,7 41 35 4,33 108
2d) combinaison des niveaux d'expression (ARN) des gènes IL8, CLDN1, G1P3, HERC5 et RSAD2 (combinaison n°29 dans le tableau 2 ci-dessus), combinée en outre à des facteurs cliniques et/ou à d'autres facteurs biologiques et/ou à des facteurs virologiques :
Un ou plusieurs facteurs cliniques et/ou un ou plusieurs facteurs biologiques et/ou un ou plusieurs facteurs virologiques peuvent être combinés aux niveaux d'expression de gènes sélectionnés conformément à l'invention (en l'occurrence, niveaux de transcription ARN mesurés dans un échantillon de PBH), et ainsi conduire à une règle décisionnelle dont le pouvoir prédictif est encore supérieur à celui de la seule combinaison desdits niveaux d'expression.
Par exemple, la combinaison :
- des niveaux d'expression (ARN) des gènes IL8, CLDN1, G1P3, HERC5 et RSAD2 (combinaison n°29 dans le tableau 2 ci-dessus ; cf. exemple 2c ci-dessus),
de la valeur de (l'autre) facteur biologique suivant :
o concentration en phosphatase alcaline ou PAL (en UI/mL), et de la valeur du facteur virologique suivant :
o charge virale avant le début du traitement ou CVavantTTT (copies/mL.103)
conduit à une règle décisionnelle dont l'aire sous la courbe ROC (AUC), calculée sur ceux des 107 répondeurs et non-répondeurs du tableau 11 ci-dessus, pour lesquels les données biologiques et virologiques étaient disponibles (soit au total, 97 répondeurs et non- répondeurs ; cf. tableau 22 ci-dessous) est de 0,904 {cf. tableau 26 ci-dessus), alors qu'elle est de 0,857 {cf. tableau 7 ci-dessus), lorsque la combinaison des niveaux d'expression des gènes IL8, CLDN1, G1P3, HERC5 et RSAD2 est utilisée seule, sans être combinée aux facteurs clinique et virologique ci-dessus indiqués (PAL et CVavantTTT).
Par la méthode mROC {cf. exemple 1), le seuil maximisant l'indice de Youden pour cette combinaison est de 4,687 {cf. tableau 24 ci-dessus).
Pour le choix de ce seuil, les performances de la combinaison sont les suivantes :
Sensibilité (Se) = 81% ; spécificité (Spe) = 80% {cf. tableau 23 ci-dessus).
Un exemple de règle décisionnelle est la règle suivante :
Z = 0,3 x CLDNl* + 0,634 x GIP3* + 1, 154 x HERC5< + 0,114 x IL8 - 0,685 x RSAD2< +
0,036 x CVavantTTT* + 2, 139 x PAL*
(fonction Z29ARNsupp ; cf. tableau 24 ci-dessus), où :
- IL8, CLDNl, G1P3, HERC5 et RSAD2 sont les valeurs de dosage BMQ des biomarqueurs, c'est-à-dire les valeurs de dosage des niveaux d'expression des gènes indiqués (Ct normalisé conformément à la méthode de 2"ACt),
- CVavantTTT et PAL sont les valeurs du facteur virologique et du facteur biologique ci-dessus indiqués, et
- l'exposant t (ici porté par CLDNl, G1P3, HERC5, RSAD2, CVavantTTT et PAL) indique que la valeur à appliquer dans la règle décisionnelle est la transformée Box-
Cox (Box et Cox, 1964) de la valeur de dosage du niveau d'expression du gène considéré, afin de la normaliser selon la formule suivante : BMQ'= (BMÇ )/ .
Dans l'exemple de règle décisionnelle ci-dessus indiquée, les paramètres λ sont de 0,63 pour CLDNl, 0,21 pour G1P3, de 0,15 pour HERC5, de -0,02 pour RSAD2, de 0,2 pour CVavantTTT et de -0,26 pour PAL {cf. tableau 25 ci-dessus).
Si Z > 4,687 : le test diagnostic est positif (prédiction mROC = 1), le sujet est déclaré 'NR' . Si Z < 4,687 : le test est négatif (prédiction mROC = 0), le sujet est déclaré 'R'.
Tableau 22 : données cliniques, biologiques et virologiques
Tableau 22 (suite et fin) : données cliniques, biologiques et virologiques
Données cliniques, biologiques et virologiques Patients Patients NR Patients R
Génotypes VHC [n(%)]
1 60 (61,86) 36 (85,71) 24 (43,64)
2 8 (8,25) 0 (0) 8 (14,55)
3 11 (11,34) 2 (4,76) 9 (16,36)
4 17 (17,53) 4 (9,52) 13 (23,64)
5 1 (1,03) 0 (0) 1 (1,82)
Score de fibrose (score F Metavir) [n(%)]
1 33 (34,02) 12 (28,57) 21 (38, 18)
2 38 (39, 18) 15 (35,71) 23 (41,82)
3 11 (11,34) 8 (19,05) 3 (5,45)
4 15 (15,46) 7 (16,67) 8 (14,55)
RÉFÉRENCES BIBLIOGRAPHIQUES
Anastasiadis et al. 2005 ; New globally convergent training scheme based on the résilient propagation algorithm. Neurocomputing 64: 253-270.
Asselah et al. 2008 ; "Liver gene expression signature to predict response to pegylated interferon plus ribavirin combination therapy in patients with chronic hepatitis C"; Gut 57: 516-524.
Box et Cox 1964 ; An analysis of transformations. Journal of the Royal Statistical Society, Séries B 26: 211-243.
Breiman 2001 ; Random Forests. Machine Learning 45 : 5-32.
Chambers 2008 ; Software for data analysis : programming with R. Springer, New York, ISBN 978-0-387-75935-7.
Chen et al. 2005 ; Gastroenterology 128: 1437-1444.
Chen et al. 2010 ; Gastroenterology 138: 1123-1133.
Cole et al. 1983 ; Proc. Natl. Acad. Sci. USA 80: 2026-2030.
Cole et al. 1985 ; Monoclonal Antibodies And Cancer Therapy, Alan R. Liss, Inc., pp. 77- 96.
Falissard 2005 ; Comprendre et utiliser les statistiques dans les sciences de la vie, Masson.
Hastie, Tibishirani et Friedman, 2009 ; "The Eléments of Statistical Learning: Data Mining, Inference and Prédiction", 2nd Edition, Springer.
Hidetsugu Saito et al. 2010 ; "On-treatment prédictions of success in peg- interferon/ribavirin treatment using a novel formula"; World J. Gastroenterol. 16(1): 89- 97.
Intrator et Intrator 1993 ; Using Neural Nets for Interprétation of Nonlinear Models.
Proceedings of the Statistical Computing Section, San Francisco: American Statistical
Society (eds), pages 244-249.
Kôhler and Milstein 1975 ; Nature 256: 495-497
Kosbor et al. 1983 ; Immunology Today 4: 72.
Kramar et al. 1999 ; Critères ROC généralisés pour l 'évaluation de plusieurs marqueurs tumoraux. Revue d'Epidémiologie et Santé Publique 47 : 376-383.
Kramar et al. 2001 ; mROC: a computer program for combining tumour markers in predicting disease states. Computer methods and programs in biomedicine 66: 199-207.
Liaw et Wiener 2002 ; Classification and régression by Random Forest. R. News 2.3 : 18- 22.
Livak et Schmittgen 2001 ; Analysis of relative gene expression data using real-time quantitative PCR and the 2 (-Delta Delta C(T)) Method. Methods 25: 402-408.
Reiser et Faraggi 1997 ; Confidence intervais for the generalized ROC criterion. Biométries 53 : 644-652.
Riedmiller 1994 ; Rprop - Description and Implementation Détails. Technical Report. University of Karlsruhe.
Riedmiller et Braun 1993 ; A direct adaptive method for faster backpropagation learning: the RPROP algorithm. Proceedings of the IEEE International Conférence on Neural Networks (ICNN), San Francisco, pages 586-591.
Schmitten et Livak 2008 ; Analyzing real-time PCR data by the comparative Ct method. Nature Protocols 3(6) : 1101-1108.
Shapiro 1999 ; The interprétation of diagnostic tests. Statistical Methods in Médical Research, 8: 113-134.
Su et Liu 1993 ; Linear combinations of multiple diagnostic markers. Journal of the American Statistical Association 88: 1350-1355.
Swets 1988 ; Measuring the accuracy of diagnostic Systems. Science 240, 1285-1293. Theodoridis et Koutroumbos 2009 ; Pattern Récognition. Académie Press, Elsevier. US 4 376 110 (au nom de Hybritech Inc.).