Identification des cas CH du WGS en ISL et UKB

Nous avons utilisé le WGS de 45 510 Islandais et de 130 709 participants d’ascendance britannique de l’UKB.17,18. La profondeur moyenne de séquençage était de 33 × pour UKB et de 38 × pour ISL. Les participants ayant déjà reçu un diagnostic de troubles hématologiques ou des mesures hématologiques manifestement anormales à l’entrée ont été exclus. Nous avons identifié les personnes atteintes de CH sur la base d’une évolution de notre stratégie de codes-barres mutationnels1. Des codes-barres de mutation somatique en mosaïque ont été générés en modélisant les lectures de séquences de fractions alléliques variantes faibles (VAF) (Extended Data Fig. 1). Pour réduire la contamination par les variants germinaux à faible VAF et les erreurs de séquençage récurrentes, nous avons utilisé uniquement des mutations indicatrices observées une fois dans chaque cohorte et limitées dans la plage de VAF à 0,10-0,25. Les participants dont les codes-barres contenaient un nombre de mutations indicatrices supérieur à un seuil étaient considérés comme atteints de CH. Nous avons identifié 16 306 personnes atteintes d’HC, soit une prévalence sur les deux cohortes de 9,3 %.

Comme prévu dans les études précédentes, l’HC était rare chez les moins de 45 ans, mais sa fréquence augmentait considérablement par la suite, approchant 50 % à l’âge de 80 ans. Le tabagisme actuel et antérieur augmentait considérablement le risque d’HC (Données étendues, Fig. 1b, c) . Les années pack ont ​​encore augmenté le risque d’HC (P.= 8,57 × 10−7), alors que les années écoulées depuis l’arrêt du tabac étaient protectrices (P. = 3,54 × 10−10; Tableau supplémentaire 1), indiquant une relation dose-dépendante entre le tabagisme et le CH. Bien que les mécanismes par lesquels l’âge et le tabagisme favorisent l’HC restent encore à élucider, ces deux facteurs constituent clairement des facteurs de confusion potentiels dans les analyses épidémiologiques. Les participants atteints d’HC couraient un risque beaucoup plus élevé de mortalité toutes causes confondues et de recevoir ultérieurement un diagnostic de trouble hématologique. Le tabagisme était un facteur de risque indépendant de mortalité, mais pas de troubles hématologiques (Tableau supplémentaire 2).

Associations de CH avec la maladie

Dans l’analyse cas-témoins, le CH avait de fortes associations avec les néoplasies myéloïdes et lymphoïdes (Tableau 1 et Tableau supplémentaire 3). L’HC était également associée à des diagnostics existants ou ultérieurs de maladie pulmonaire obstructive chronique (MPOC), de cancer du poumon, de maladie artérielle périphérique (MAP), d’emphysème et d’abus d’alcool. Ces affections non hématologiques sont connues pour être liées au tabagisme et leur importance est considérablement atténuée une fois le tabagisme pris en compte. Cela suggère que les associations pourraient être dues à une confusion résiduelle provenant de divers aspects du comportement tabagique. Les associations de troubles hématologiques n’étaient pas atténuées de la même manière par les ajustements liés au tabagisme. L’analyse limitée aux n’ayant jamais fumé a produit des conclusions similaires (tableau supplémentaire 4).

Tableau 1 Associations entre l’hématopoïèse clonale et la maladie dans l’UKB

L’analyse cas-témoins n’a révélé aucune indication d’association entre le CH et les phénotypes clés de maladies cardiovasculaires, ni dans l’UKB ni dans l’ISL (Tableau supplémentaire 5). Non ajusté au tabagisme, aucun phénotype de MCV n’était significatif selon Bonferroni et, une fois ajusté, aucun n’était même nominalement significatif. Pour approfondir cela, nous avons effectué une analyse du délai d’apparition d’un événement CVD au UKB. Nous avons également examiné si le CH défini par des codes-barres mutationnels différait à cet égard du CH contenant une mutation CPLD. De plus, nous avons examiné CHIP tel que défini à l’aide de la stratégie de filtrage recommandée dans la réf. 19,20. Dans les trois cas, nous n’avons pas pu mesurer un risque accru de maladie cardiovasculaire chez les personnes atteintes d’HC. Nous avons cependant observé de forts effets liés aux facteurs de confusion potentiels dans le modèle multivarié (tableau 2). Le CH a également été impliqué dans des phénomènes pro-inflammatoires, une base suggérée pour son association avec les maladies cardiovasculaires.21,22. En conséquence, nous avons recherché des associations de CH avec un panel d’affections inflammatoires, mais nous n’en avons trouvé aucune (Tableau supplémentaire 5). En UKB, l’HC était associée à une maladie alcoolique du foie (Tableau 1), mais pas à une stéatose hépatique, contrairement à un rapport récent.23.

Tableau 2 Analyse du délai jusqu’à l’événement de trois modèles d’HC pour les critères d’évaluation des maladies cardiovasculairesun

Pour mieux comprendre l’augmentation du taux de mortalité attribuable au CH, nous avons examiné la principale cause de décès dans une méta-analyse de l’ISL et de l’UKB. Les participants atteints d’HC couraient un risque accru de décès dû à des troubles hématologiques myéloïdes et lymphoïdes, ainsi qu’au cancer du poumon, à la BPCO et à l’abus d’alcool (Tableau supplémentaire 6). Comme auparavant, les risques non hématologiques ont été atténués (mais pas éliminés) par l’ajustement au tabagisme. Les cardiopathies ischémiques chroniques et l’insuffisance cardiaque présentaient des risques relatifs (HR) nominalement significatifs, mais n’atteignaient pas le seuil de Bonferroni. Même si un nombre important de décès dus à un infarctus aigu du myocarde sont survenus dans la cohorte, leur fréquence n’était pas élevée chez les participants atteints d’HC.

Association de mutations somatiques en mosaïque avec CH

La plupart des études antérieures basées sur des séquences d’ADN ont identifié le CH à l’aide d’une liste prédéfinie de mutations CPLD déjà connues pour se produire dans la néoplasie myéloïde.4,13,14,15. Certaines études ont testé des gènes mutés pour une association statistique avec CH ou des preuves de sélection positive dans CH1,3,24,25. Notre méthode peut identifier CH indépendamment de la présence ou non d’une mutation CPLD. Ainsi, nous pouvons rechercher de manière relativement impartiale des gènes présentant des mutations qui pilotent le CH. Nous avons effectué un test de charge basé sur les gènes pour les mutations somatiques associées au CH (Fig. 1a et Tableau supplémentaire 7). Comme prévu par les études précédentes1,3,4mutations dans DNMT3A , TET2et ASXL1 étaient les plus significativement associés au CH. La plupart des autres gènes sont connus pour être couramment mutés dans la maladie myéloïde. Certains sont impliqués, de manière complémentaire ou unique, dans les néoplasies lymphoïdes26.

Fig. 1 : Association de mutations somatiques en mosaïque avec CH. unRésultats (−log dix (P. )) d’un test de charge basé sur les gènes utilisant SKAT-O pour l’association de mutations somatiques avec CH. Les données sont une méta-analyse d’ISL et d’UKB. Des tests de charge distincts ont été effectués pour inclure les mutations à impact élevé (rouge) ou modéré (vert ; comme évalué avec l’Ensembl VEP) et une combinaison des deux types (bleu) pour les gènes indiqués. P. peigne est le P.valeur pour les variantes combinées à impact élevé et modéré. L’annotation VEP à impact maximum (MaxImpact) a été utilisée pour classer chaque mutation. bGraphique Lollipop montrant le nombre de mutations somatiques dans le MTA2 gène détecté dans les cas CH en UKB. Les sucettes vertes sont des faux-sens, les noires sont des changements de cadre et les oranges sont des mutations d’épissage. Les structures de domaine et d’exon PFAM sont présentées ci-dessous. BAH, domaine d’homologie bromo-adjacent ; Domaine d’homologie 2 ELM2, Egl-27 et MTA1 ; GATA, domaine de doigt de zinc GATA ; MTA_R1, domaine MTA1 R1 de la protéine associée aux métastases ; Domaine SANT, Swi3-Ada2-N-Cor et TFIIIB. cle test d’association exact de Fisher donne des résultats dans l’UKB pour des mutations individuelles dans MTA2 . Le diamètre des cercles indique le nombre total de participants porteurs de la mutation (cas CH + contrôles). Les domaines SwissProt et la structure des exons du gène sont présentés ci-dessous. d,eUn péché b et c mais pour le CALR gène. FE, exactement Fisher.

Nous avons également examiné la distribution intragénique des mutations somatiques et utilisé les tests exacts de Fisher pour identifier les mutations individuelles qui pilotent le signal de chaque gène (Fig. 1b – e et Fig. 1 supplémentaire).. ASXL1 présentaient principalement des mutations de décalage de cadre ou non-sens dans le 13e (dernier) exon. ASXL1 l’activation dans la néoplasie myéloïde résulte généralement de mutations à gain de fonction qui produisent des protéines tronquées à l’extrémité C-terminale27. Cependant, nous avons également observé des mutations de troncature de protéines dans l’exon 12, à savoir Arg404Ter et Arg417Ter, fortement associées à CH (P. = 9,7 × 10−6 et 2,6 × 10−6, respectivement, UKB, test exact de Fisher). Ces mutations sont déconcertantes car on pourrait s’attendre à ce qu’elles induisent une désintégration non-sensée de l’organisme. ASXL1transcription28, ce qui éviterait un effet de gain de fonction. Une enquête plus approfondie est justifiée. L’association CH avec GNB1 était entièrement imputable aux mutations Lys57Glu (P. = 1,4 × 10−46UKB, test exact de Fisher). GNB1 les mutations affectant Lys57 prédominent dans les néoplasies myéloïdes, alors que les mutations à d’autres positions sont plus fréquentes dans les tumeurs malignes lymphoïdes29. Dans CALR des mutations à fort impact regroupées dans le neuvième (dernier) exon, suggérant un gain de fonction analogue à celui observé dans PPM1D et ASXL1 (Fig. 1d, e). De telles mutations sont présentes dans la thrombocytémie essentielle (ET) et la myélofibrose primaire30; cependant, ils n’ont pas été systématiquement impliqués en tant que mutations définissant le CH (Tableau supplémentaire 7). Nous avons obtenu des preuves solides reliant les impacts élevés PRR14L mutations en CH (P. = 3 × 10−11UKB, SKAT-O). PRR14Ln’est généralement pas reconnu comme un gène CH (Tableau supplémentaire 7); cependant, des mutations ont été observées dans la leucémie myélomonocytaire chronique et rarement chez les participants CH31.

Nous avons précédemment signalé une association provisoire entre CH et MYD88mutations dans ISL1. Nous confirmons cette conclusion de manière robuste ici (P.= 1,9 × 10−10UKB, SKAT-O), le signal le plus fort provenant de Leu252Pro. MYD88Les mutations de Leu252Pro (anciennement Leu265Pro) sont particulièrement liées au lymphome lymphoplasmocytaire/macroglobulinémie de Waldenström (LPL/MW), dont on ne s’attend pas à ce qu’elles comportent une composante importante transmissible par le sang.26,32,33. Cependant, MYD88des mutations surviennent également dans une minorité atypique de leucémie lymphoïde chronique (LLC) et Leu252Pro a été observé dans les cellules B normales de patients atteints de LPL/MW.34,35. Nous avons également rapporté une association CH avec des mutations dans MTA2(réf. 1) et confirmez cette découverte ici (P.= 7,9 × 10−7, UKB, SKAT-O). Des mutations faux-sens individuellement significatives ont été regroupées dans le domaine SANT (Fig. 1b, c), qui recrute l’histone désacétylase-1 dans le complexe de remodelage des nucléosomes et de désacétylase (NuRD).36. Même si nous avons pu démontrer de fortes associations entre les gènes CPLD courants et le CH, la plupart des cas ne pouvaient pas être expliqués par une mutation évidente du pilote (Extended Data Fig. 2). Plusieurs facteurs peuvent y contribuer ; une sensibilité plus faible pour la détection des mutations CPLD dans le WGS par rapport au séquençage de l’exome entier ou du panel, des mutations pilotes localisées…