Université de Liège Réseau des Bibliothèques

BICTEL/e - ULg
Serveur institutionnel des thèses de doctorat



Nouvelles thèses
dans BICTEL/e - ULg
  • Brabant, Christian - Etude du rôle des mécanismes d’apprentissage dans le développement des effets renforçants de la cocaïne chez l’animal : implication des récepteurs histaminergiques H3
  • Boukary, Abdou Razac - Epidémiologie de la brucellose et de la tuberculose animales dans les milieux urbain, périurbain et rural au Niger
  • Bouabidi, Abderrahim - Etude Critique des Différentes Approches de Validation des Méthodes Analytiques
Présentation Recherche thèse Dépôt thèse Accès
gestionnaires
 
Page de résumé pour ULgetd-02112011-075542

Auteur : Sandor, Cynthia
E-mail de l'auteur : Cynthia.Sandor@student.ulg.ac.be
URN : ULgetd-02112011-075542
Langue : Français/French
Titre : Contribution au développement d'approches statistiques en vue d'identifier des gènes affectant des caractères complexes ayant un intérêt médical ou agronomique.
Intitulé du diplôme : Doctorat en sciences vétérinaires
Département : FMV - Département des productions animales
Jury :
Nom : Titre :
Coppieters, Wouter Membre du jury/Committee Member
Detilleux, Johann Membre du jury/Committee Member
Gillet, Laurent Membre du jury/Committee Member
Meuwissen, Théo Membre du jury/Committee Member
Przeworski, Molly Membre du jury/Committee Member
Saegerman, Claude Membre du jury/Committee Member
Schurmans, Stéphane Membre du jury/Committee Member
Vikkula, Miikka Membre du jury/Committee Member
Bureau, Fabrice Président du jury/Committee Chair
Farnir, Frédéric Promoteur/Director
Georges, Michel Promoteur/Director
Mots-clés :
  • agronomical/agronomique
  • medical/médicale
  • genetics/génétique
  • complex trait/caractères complexes
Date de soutenance : 2010-11-18
Type d'accès : Public/Internet
Résumé :

La plupart des caractères ayant un intérêt médical ou agronomique sont dits complexes. Ce qui signifie qu'ils

sont influencés par plusieurs gènes, des facteurs environnementaux et des interactions gènes-environnement.

L'identification de gènes affectant de tels caractères est un des sujets les plus importants de la génétique moderne: d'un point vu médical, cela offrirait de nouvelles perspectives, tant d'ordre diagnostic quethérapeutique, tandis que sur un plan agronomique, cela ouvrirait de nouvelles voies dans la sélection et la manipulation des animaux domestiques.

L'approche la plus efficace pour identifier des gènes impliqués dans des caractères complexes est le clonage

positionnel. Cette approche comporte trois étapes: (i) identifier les régions génomiques contenant les facteurs

génétiques impliqués dans les caractères étudiés, (ii) identifier les mutations causales (iii) et enfin étudier le

fonctionnement cellulaire et moléculaire des gènes responsables.

La première étape du clonage positionnel, appelé cartographie génétique consiste à regarder au sein d'un groupe d'individus, s’il existe une corrélation entre l'histoire des différents chromosomes et celle du caractère étudié. Les outils génétiques permettant de suivre l'état d'un chromosome chez un individu, ont connu ces dernières années des progrès remarquables, notamment grâce à l'apparition des plates-formes de génotypage à haut débit et au

développement de nouveaux marqueurs génétiques. Actuellement, la principale difficulté en cartographie génétique réside dans le choix de la meilleure stratégie pour détecter des variations génétiques affectant des caractères complexes, qui le plus souvent sont associés à des effets relativement modestes. Le choix d'une approche dépendra: (i) du caractère étudié – caractère discret ou continu (ii) du dataset – les individus sont

apparentés ou non et (iii) des outils génétiques disponibles.

Les travaux réalisés au cours de cette thèse s'inscrivent précisément dans cette problématique, c'est à dire

développer des approches statistiques afin d'identifier des gènes affectant des caractères complexes ayant un

intérêt médical ou agronomique.

La plupart des études de cartographie QTL (Quantitative Trait Loci, loci influençant un caractère continu), dans

des populations de bovins laitiers, exploitent la structure en GDD (Grand Daughter Design) des pedigrees et

procèdent en regardant au sein de familles de demi-frères paternelles, s’il existe des différences phénotypiques

entre les taureaux en fonction de l'homologue reçu. Étant donné que ce type d'approche exploite la transmission

de chromosome de taureau à taureau et que le chromosome X est d'origine maternelle chez les mâles, la

cartographie de QTL sur le chromosome X dans ce type d'espèce a longtemps été exclue. Pour cartographier des

QTL sur le X, nous avons proposé une approche retraçant l'histoire des différents segments chromosomiques

dans notre échantillon, sur base de son mode de transmission et de la structure de la population. Cette approche

suppose que s’il existe un QTL au niveau d'une région donnée, deux individus ayant reçu le même segment

chromosomique se ressembleront davantage que deux individus ayant reçu deux segments chromosomiques

différents. Cette approche suppose également qu'il existe une corrélation, appelée déséquilibre de liaison (DL)

entre les allèles QTL et allèles marqueurs. Afin d'évaluer l'intérêt d'une telle approche, nous avons caractérisé les niveaux de DL sur le X. Nous avons montré que le X exhibait dans ce type de population des niveaux de DL

particulièrement élevé et inattendu. Parmi les 48 caractères laitiers étudiés, nous avons trouvé en utilisant une méthode de type maximum de vraisemblance restreint (REML, Residual maximum likelihood estimation) 5 QTL

significatifs sur le X.

Au cours de ces dernières années, le nombre de publications chez les espèces de productions mettant en évidence

de l'empreinte parentale (y compris chez les oiseaux) comme étant associé aux QTL découverts (imprinted QTL,l'effet d'un allèle QTL dépendra de son origine parentale) n'a cessé de croitre. Ces résultats contredisent ceux de la biologie moléculaire, qui montrent que l'empreinte parentale est un phénomène rare et uniquement observé

chez les mammifères placentaires. Une précédente étude, pointe le problème d'ordre statistique soulevé par

toutes ces études détectant de l'empreinte parentale de façon quasi systématique. Ces études emploient un design de type line-cross qui suppose, pour cartographier des QTL et tester une hypothèse d'empreinte parentale, d'un

coté que les lignées parentales sont fixées pour les allèles QTL et de l'autre qu'elles peuvent ségréger pour

différents allèles marqueurs. Si cette hypothèse est fausse et que les lignées parentales ne sont pas fixées pour les

allèles QTL, tous les individus en F1 ne sont pas hétérozygotes ou pas hétérozygotes pour les mêmes allèles

QTL. Si le nombre de parents en F1 est restreint (cas typique du coté paternel), il sera possible d'avoir un effet de substitution allélique qui dépendra de l'origine parentale en F2 et de conclure erronément à de l'empreinte

parentale. Dans notre étude, nous avons montré que ce problème pouvait être exacerbé de 40 à 80% en cas de

DL. Pour tester une hypothèse d'empreinte parentale, il faut que les parents en F1 soient hétérozygotes pour des allèles marqueurs différents. En cas de DL la probabilité que des allèles marqueurs différents soient associés à

des allèles QTL augmente et la détection de fausse empreinte parentale également.

Depuis 2007, le nombre de loci à risque associés à des maladies complexes humaines et découverts dans des

études d'association génome-entier (GWAS = Genome Wide Association Study n'a cessé de croire. Beaucoup de ces loci tombent dans des régions non-codantes et une hypothèse avancée pour expliquer leur rôle biologique est qu'ils moduleraient le niveau d'expression de certains gènes à travers des éléments cis. Des investigations combinant des études d'expression sur un grand nombre de gènes avec des études GWA ont été mises en œuvre

afin de répertorier dans des bases de données les effets trans et cis de polymorphismes (appelés eQTL pour

Expression Quantitative Trait Locus) sur le niveau d'expression de ces gènes. En utilisant ces bases de données

d'eQTL, nous avons pu découvrir: (i) des SNP à risque pour la maladie de Crohn et présent dans une région

dépourvue de gène, régulaient probablement le niveau d'expression du gène PTGER4 (protaglandin E receptor

4), codant pour un récepteur à une prostaglandine et candidat sérieux à ce type désordre. (ii) Parmi les 39 SNPs à

risque dans la maladie, on observe 5 effets de type cis eQTL, non dus au hasard. Ces effets eQTL ouvrent de

nouvelles perspectives dans l'architecture génétique d'une maladie complexe: la maladie de Crohn.

L'intensité des recombinaisons ainsi que leur position dans le génome sont dictées par le rôle fondamental que

joue la recombinaison dans la ségrégation correcte des chromosomes lors de la première division méiotique.

Néanmoins, on observe, des différences entre individus de même sexe et de même âge aussi bien dans l'intensité

que dans la position des recombinaisons. Une idée pour explorer les causes génétiques sous-tendant ces

variations est d'appliquer des méthodes de cartographie QTL classique à la recombinaison elle-même, qui sera

traitée comme un phénotype quantitatif. Nous avons réalisé ce type d'étude à différente échelle, sur une

population de taureaux laitiers génotypés pour des milliers de marqueurs de type SNP, en exploitant le fait: (i)

qu'un grand nombre d'entre eux disposent d'un nombre suffisant de descendants pour estimer précisément leur

taux de recombinaison, (ii) qu'ils appartiennent à des familles de demi-frères paternelles, pour employer des

méthodes de cartographie QTL exploitant le DL et la liaison génétique. Dans cette étude, nous caractérisons

préalablement les niveaux de recombinaison sur différentes échelles: (i) distribution du phénotype, (ii)

répétabilité du caractère (iii) suivi d'une étude d'héritabilité. Nous montrons que plusieurs QTL affectent de

manière significative les taux de recombinaisons et cela à différentes échelles.

Plusieurs conclusions peuvent être tirées de ces études de cartographie génétiques tentant d'identifier des gènes influençant des caractères complexes d'intérêt agronomique ou médical.

D'un point vu statistique, on montre que dans la plupart des cas les loci identifiés représentent une faible part de la variation génétique totale (10-15%). Plusieurs hypothèses sont avancées pour expliquer la variation génétique

restante. (i) La première est que les études actuelles ne sont pas suffisamment puissantes pour détecter des loci même associés à des effets moyens. Cette faiblesse est illustrée par le fait qu'en réalisant une GWAS, dans laquelle on regroupe les données de GWAS individuelles, on augmente considérablement la puissance de

détection de loci associés au caractère étudié. (ii) Une autre hypothèse est que les études de cartographie

actuelles utilisent des outils génétiques qui ciblent un seul type de polymorphismes: des variations génétiques fréquentes dans la population. Or un caractère complexe peut très bien être influencé par des variations génétiques peu fréquentes dans la population, voire des mutations rares ou encore des polymorphismes

structuraux (p.e: CNV: Copy Number Variant). (iii) La plupart des études actuelles ne recherchent que des effets

de type additif. Il est fort probable qu'il existe des effets de type gène-gène, appelés épistasie, qui affectent des caractères complexes. Cependant, détecter de tels effets nécessite de mettre en œuvre des études beaucoup plus

puissantes que celles existantes actuellement.

D'un point vu biologique, si certains loci détectés se trouvent dans des gènes dont on connait le rôle dans le

caractère étudié, beaucoup d'entre eux se trouvent dans des régions non-codantes. Ce résultat n'a rien de

surprenant quand on sait que seulement 5 % du génome est conservé et donc fonctionnel et que parmi ces 5%, un

tiers correspond à des gènes. Toutefois, comprendre le rôle biologique de ces loci dans des caractères complexes

est un challenge. Une hypothèse avancée est que le niveau d'expression de certains gènes est peut-être régulé par

ces polymorphismes influençant des caractères complexes.

Pour améliorer nos connaissances sur les caractères complexes, il sera nécessaire, au cours des prochaines

années:

(i) d'étendre le design des études génétiques afin d'en augmenter leur puissance de détection. Ceci

passera notamment par: (1) une augmentation de la taille des échantillons, (2) étudier le même phénotype dans des populations ayant une origine différente (un polymorphisme, ayant le même effet dans deux populations différentes peut être plus facilement détecté dans la population où il est le plus fréquent), (3) améliorer la précision de l'estimation des phénotypes (4) étudier des phénotypes apparentés ou des sous-phénotypes (p.e.

Crohn et les colites ulcéro-hémorragiques) (5) s'intéresser davantage aux facteurs environnementaux.

(ii) Il faudra également étendre la palette des outils génétiques disponibles, pour rechercher des

polymorphismes peu fréquents ou des polymorphismes structuraux pouvant affecter des caractères complexes.

Ceci devrait être prochainement réalisable grâce à l'essor des technologies de séquençage à haut débit qui devrait permettre de cataloguer des polymorphismes avec une fréquence > 1% dans une population (1000 Genome

Project).On peut penser également qu'il sera possible dans quelques années de séquencer complètement tous les individus d'une étude de cartographie et d'identifier ainsi des mutations génétiques rares. Néanmoins, ces nouveaux outils génétiques bouleverseront les méthodes de cartographie génétique actuelles. Les approches futures devront

exploiter toute l'information disponible simultanément, c'est-à-dire combiner l'information concernant toutes les

variations génétiques possibles ainsi que les phénotypes et d'éventuels effets environnementaux.

En génétique animale, le problème des loci influençant un caractère complexe et écartés par manque de puissance statistique a été contourné par une approche dite de sélection génomique. Celle-ci a pour but de prendre en compte les signaux d’association sur l’entièreté du génome, indépendamment des seuils de signification associés, et de les intégrer en une prédiction la plus précise possible de la valeur d’élevage d’un individu. L’objectif passe donc de l’identification la plus précise possible de loci individuels à la prédiction la plus précise possible d’une valeur d’élevage individuelle globale, sans nécessairement savoir exactement quels sont les loci qui y contribuent, mais en intégrant plutôt de façon pondérée sur l’ensemble des possibilités.

Or il serait tout à fait imaginable d'adapter ce type d'approche à des maladies complexes humaines et de

déterminer à partir d'une GWAS un « risque relatif génome entier » (GWRR) pour chaque individu.

Autre version :
Fichiers :
Nom du fichier Taille Temps de chargement évalué (HH:MI:SS)
Modem 56K ADSL
[Public/Internet] thesis_cs.pdf 3.35 Mb 00:07:59 00:00:17

Bien que le maximum ait été fait pour que les droits des ayants-droits soient respectés, si un de ceux-ci constatait qu'une oeuvre sur laquelle il a des droits a été utilisée dans BICTEL/e ULg sans son autorisation explicite, il est invité à prendre contact le plus rapidement possible avec la Direction du Réseau des Bibliothèques.


Parcourir BICTEL/e par Auteur|Département | Rechercher dans BICTEL/e


© Réseau des Bibliothèques de l'ULg, Grande traverse, 12 B37 4000 LIEGE