Université de Liège Réseau des Bibliothèques

BICTEL/e - ULg
Serveur institutionnel des thèses de doctorat



Nouvelles thèses
dans BICTEL/e - ULg
  • Decock, Alice - Etude des produits de dissociation de H2O dans un échantillon de comètes d'origines variées
  • Brotcorne, Fany - Behavioral ecology of commensal long-tailed macaque (Macaca fascicularis) populations in Bali, Indonesia: impact of anthropic factors
  • Mishra, Bamdev - A Riemannian approach to large-scale constrained least-squares with symmetries
Présentation Recherche thèse Dépôt thèse Accès
gestionnaires
 
Page de résumé pour ULgetd-02282011-152054

Auteur : Zhang, Lixin
URN : ULgetd-02282011-152054
Langue : Anglais/English
Titre : Statistical methods for analysing serum protein electrophoretic data in External Quality Assessment (EQA) programmes
Intitulé du diplôme : Doctorat en sciences médicales
Département : Médecine - Département des sciences de la santé publique
Jury :
Nom : Titre :
DE MOOR, Georges Membre du jury/Committee Member
HAESBROECK, Gentiane Membre du jury/Committee Member
HENNY, Joseph Membre du jury/Committee Member
LIBEER, Jean-Claude Membre du jury/Committee Member
VAN CAMPENHOUT, Christel Membre du jury/Committee Member
CHAPELLE, Jean-Paul Président du jury/Committee Chair
ALBERT, Adelin Promoteur/Director
Mots-clés :
  • multivariate coefficient of variation/coefficient de variation multivarié
  • robust statistics/statistique robuste
  • clinical laboratory performance/performance analytique des laboratoires
  • Quality control/contrôle de qualité
  • outlying data profiles/profils hors-limites
  • electrophoresis/électrophorèse
Date de soutenance : 2010-12-03
Type d'accès : Restreint/Intranet
Résumé :

Les examens de laboratoire jouent un rôle essentiel dans la pratique médicale. Ils sont utilisés à des fins diagnostique, pronostique, thérapeutique ou encore pour dépister des maladies spécifiques dans des populations présumées en bonne santé (Tietz, 1986). Quotidiennement, les laboratoires de biologie clinique réalisent des millions de tests fournissant autant de données à interpréter. Les responsables des soins de santé ont toujours été préoccupés par la qualité globale du travail réalisé dans les laboratoires. En dépit de procédures de contrôle de qualité interne rigoureuses, les résultats obtenus pour un même échantillon dans deux laboratoires peuvent occasionnellement différer de façon notoire. Il serait inacceptable cependant qu’un résultat d’un test biologique soit considéré comme « normal » dans un laboratoire et « anormal » dans l’autre.

Les programmes d’Evaluation Externe de la Qualité (EEQ) ont précisément comme objectif de contrôler la performance analytique des laboratoires de biologie clinique à une grande échelle et généralement par le biais d’un organisme externe. Le but de l’EEQ est de s’assurer que les résultats des tests soient compatibles quel que soit le laboratoire qui réalise les analyses, en d’autres termes de garantir la comparabilité des laboratoires et par là-même d’administrer les meilleurs soins aux patients (Libeer, 1993). Les protocoles EEQ consistent à organiser des enquêtes dans lesquelles les laboratoires participants doivent réaliser des analyses sur un même échantillon contrôle comme s’il s’agissait d’analyses de routine. Il faut ensuite renvoyer les résultats de ces analyses au centre EEQ avec des informations détaillées sur les techniques de dosage utilisées. Les résultats sont alors soumis à une analyse statistique. En réalité, l’analyse statistique poursuit trois objectifs : (1) obtenir une estimation robuste de la concentration du constituant (moyenne) dans l’échantillon contrôle et de la variabilité entre les laboratoires (écart-type), une estimation robuste étant nécessaire car les résultats EEQ contiennent souvent des valeurs aberrantes qui peuvent sérieusement affecter la moyenne et de l’écart-type ; (2) évaluer la qualité des laboratoires en mettant en évidence les résultats « hors-limites » et les laboratoires « peu performants » et ce, à court et à long termes ; (3) évaluer et comparer la précision analytique des techniques/équipements utilisés par les participants (Albert, 1997). Depuis plusieurs dizaines d’années, des programmes EEQ ont été mis en place dans de nombreux pays et ils contrôlent la plupart des analyses de biologie clinique classiques comme le glucose, le cholestérol ou le calcium, ou encore les enzymes et les hormones.

Ce travail a débuté lorsque l’électrophorèse de protéines fut introduite dans le panel des analyses de laboratoire soumises à l’EEQ. Contrairement aux autres tests contrôlés jusqu’alors, l’électrophorèse de protéines fournit non pas une valeur mais cinq fractions, respectivement, l’albumine, les globulines α1, α2, β et , dont la somme fait 100% et dont l’interprétation doit se faire globalement. En d’autres termes, les données électrophorétiques obtenues dans l’EEQ doivent être analysées par des méthodes de la statistique multivariée (Zhang et al, 2008). Ceci nécessite l’adaptation à l’environnement EEQ de méthodes multivariées existantes (telles qu’on les trouve dans les ouvrages de référence) ou le développement d’approches nouvelles. Dans cette thèse, nous nous sommes fixé comme but d’apporter une solution théorique et pratique au problème de l’analyse et de l’interprétation des résultats d’électrophorèses dans le domaine de l’Evaluation Externe de la Qualité.

Dans l’introduction de ce travail, un bref rappel est fait des protocoles EEQ et de leur mise en pratique notamment en ayant recours à l’Internet. Les méthodes univariées de statistique robuste permettant d’estimer la moyenne et l’écart-type des résultats EEQ sont décrites et la notion de valeur « hors-limites » est définie. Ceci permet d’apprécier la qualité d’un laboratoire par rapport à ses pairs sur base du résultat qu’il a fourni. Le concept de coefficient de variation (CV) est aussi présenté comme un moyen de mesurer et de comparer la reproductibilité analytique des techniques de laboratoire. Finalement, on rappelle quelques notions relatives aux électrophorèses de protéines, leur utilité clinique et les méthodes de dosage utilisées. Les bases de données EEQ qui servent à illustrer la méthodologie statistique développée dans ce travail sont décrites en détail. Elles proviennent principalement des enquêtes de l’Evaluation Externe de la Qualité réalisées entre 2004 et 2008 en France et en Belgique.

La première partie de cette thèse concerne le problème de l’évaluation de la performance des laboratoires pour le dosage de l’électrophorèse de protéines. La façon la plus simple consiste à appliquer les méthodes univariées classiques à chaque fraction de l’électrophorèse. Cette façon de procéder cependant ignore que les fractions doivent être interprétées globalement car elles sont corrélées. De plus, elles sont linéairement dépendantes (car leur somme est égale à 100%), ce qui conduit à une matrice de variances-covariances singulière et donc non inversible. La première approche multivariée que nous proposons vise à retirer une des cinq fractions et ainsi éviter le problème de singularité, ensuite à obtenir une estimation robuste du vecteur moyen et de la matrice de variances-covariances par la technique du déterminant de covariance minimum (MCD) publiée par Rousseuw et Van Driessen (1999). On utilise alors la distance de Mahalanobis pour identifier les profils électrophorétiques « hors-limites » et détecter les laboratoires dont la qualité est insatisfaisante (Zhang et al. 2008). Appliquée aux bases de données EEQ, cette méthode simple s’avère ne pas être optimale car elle donne des corrélations peu fiables et décèle trop de laboratoires « hors-limites ». C’est la raison pour laquelle, une approche nouvelle est proposée dans laquelle une transformation log-ratio (Egozcue et al. 2003) est appliquée aux profils électrophorétiques avant de les analyser statistiquement. Cette méthode transforme les cinq fractions électrophorétiques en quatre variables indépendantes et sans dimension. La technique MCD est alors appliquée pour obtenir des estimations robustes du vecteur moyen et de la matrice de dispersion. Les estimations sont utilisées pour calculer la distance de Mahalanobis et mettre en lumière les laboratoires « hors-limites ». Appliquée aux bases de données EEQ, cette seconde approche est meilleure que la première, non seulement d’un point de vue théorique mais aussi pratique, en détectant un nombre plus raisonnable de laboratoires peu performants. Des méthodes de représentations graphiques des profils électrophorétiques sont aussi proposées au moyen du "MCD z-score plot" ou du "star plot" obtenu à partir de l’analyse en composantes principales (ACP) robuste.

La seconde partie de la thèse s’attache à l’évaluation et à la comparaison de la précision analytique des techniques de dosage d’électrophorèses utilisées par les laboratoires participants à l’EEQ. Ceci nous a conduit à rechercher des méthodes d’extension du coefficient de variation (CV) classique au cas multivariée. Les coefficients de variation multivariés publiés dans la littérature sont passés en revue, en ce compris ceux de Reyment (1960) et de Van Valen (1974, 2005). Reyment fut le premier à proposer une définition du CV multivarié et à donner une formule permettant de calculer l'erreur type de l'estimation. Van Valen suggéra une définition plus générale car applicable en toute circonstances mais qui malheureusement ne tient pas compte explicitement des corrélations entre les variables. Par ailleurs, nous avons exploité une idée de Voinov et Nikulin (1996) pour développer un CV multivarié basée sur la distance de Mahalanobis et qui est invariant par rapport à l’échelle utilisée. Nous l’avons appliqué aux données de l’EEQ franco-belge de 2004 et avons ainsi pu classer les techniques électrophorétiques par ordre décroissant de précision analytique (Zhang et al. 2010). Malheureusement, cette approche comme celle du CV de Reyment requiert une matrice de covariance non singulière et n’est donc pas applicable pour des groupes d’effectif faible (n < 5) de laboratoires utilisant la même technique. Nous avons dès lors proposé une définition originale et tout à fait générale du CV multivarié, notée CVm (Albert et Zhang, 2010). Cette nouvelle formulation jouit de propriétés intéressantes; elle est simple et facile à calculer, ne requiert aucune inversion de matrice (contrairement aux autres techniques) mais uniquement le calcul de formes quadratiques. On n’impose aucune restriction sur le nombre d’observations ni sur le nombre de variables du problème. Nous avons appliqué cette méthode CVm aux bases de données EEQ d’électrophorèses et nous avons pu démontrer en pratique sa grande flexibilité. Elle nous a permis de classer toutes les techniques électrophorétiques même pour des groupes de participants de petite taille (n = 2) et de mettre en évidence les plus précises, comme celle de l’électrophorèse capillaire de zone (CZE) complètement automatisée. Nous avons aussi appliqué la nouvelle méthode à des données de cytométrie de flux récoltées dans le cadre d’une enquête EEQ réalisée en Belgique en 2010 ainsi qu’à un échantillon de données de « microarray » publié dans la littérature (Golub et al. 1999), confirmant ainsi son applicabilité à des domaines variés. Enfin, nous présentons quelques développements théoriques personnels sur le CV de Reyment afin de corriger la définition initiale, entachée à notre sens d’une erreur de dimension, son estimation ainsi que la formule de l’erreur type.

En résumé, la méthodologie statistique développée dans ce travail propose une solution complète à l’analyse des données électrophorétiques ou de tout autre profil de tests de laboratoire récoltés dans le cadre d’enquêtes de l’Evaluation Externe de la Qualité.

Autre version :
Fichiers :
Nom du fichier Taille Temps de chargement évalué (HH:MI:SS)
Modem 56K ADSL
[Restreint/Intranet] PhThesis-LixinZHANG-2010.pdf 2.50 Mb 00:05:56 00:00:13
Fichiers accessibles par l'Internet [Public/Internet] ou que par l'Intranet [Restreint/Intranet].

Bien que le maximum ait été fait pour que les droits des ayants-droits soient respectés, si un de ceux-ci constatait qu'une oeuvre sur laquelle il a des droits a été utilisée dans BICTEL/e ULg sans son autorisation explicite, il est invité à prendre contact le plus rapidement possible avec la Direction du Réseau des Bibliothèques.


Parcourir BICTEL/e par Auteur|Département | Rechercher dans BICTEL/e


© Réseau des Bibliothèques de l'ULg, Grande traverse, 12 B37 4000 LIEGE