|
Microbiologie du Covid-19
Introduction (I) En décembre 2019, nous avons appris l'existence d'un nouveau coronavirus, le SARS-CoV-2, communément appelé le Covid-19 (pour Coronavirus disease 2019). Nous allons décrire dans cet article les caractéristiques générales de ce virus et de ses variants. Nous verrons également quelle est l'efficacité des vaccins contre les variants et les impacts sur la situation sanitaire (cf. page 4). Nous décrirons dans d'autres articles les voies de transmission du virus, les pathologies, les séquelles de la maladie, les remèdes et vaccins pour l'éradiquer, les facteurs de risque et la question de l'immunité face au Covid-19 parmi d'autres sujets. Le premier article scientifique sur le SARS-CoV-2 fut publié le 17 décembre 2019 (cf. O.F. Fagbule, 2019). Le 1 janvier 2020, on dénombra déjà 4645 articles en pré-impression (pre-print) sur "PubMed" (et arXiv, bioRxiv, medRxiv et autre Research Square); on publiait un article toutes les 8 heures et leur nombre doublait tous les 14 jours. Le 19 mars 2020, on dépassa les 10000 articles. Le 10 décembre 2020 on franchit les 100000 articles. Début 2021, toutes les heures, plus de 16 articles étaient publiés sur le sujet mais seuls une poignée d'entre eux furent validés et publiés dans les grandes revues universitaires comme "Cell", "Nature", "Science" et autre "JAMA". Certains articles ont attendu près d'un an avant d'être validés.[1] Malheureusement, nous verrons à propos du dénialisme et des réfractaires aux mesures anti-Covid-19 que parmi les articles en pré-impression, beaucoup n'ont jamais été validés et propagent de fausses informations qui alimentent les sites de désinformation et les rumeurs. Comprendre la nature et le fonctionnement d'un virus comme le SARS-CoV-2 et ses effets sur l'organisme font appel à des compétences multidisciplinaires très spécialisées et très techniques touchant à la fois la microbiologie, la génétique et la médecine et des spécialités aussi diverses que l'épidémiologie, l'infectiologie, l'anatomie, l'imagerie, la pharmacologie et la psychiatrie. Mais faisons le pari d'expliquer avec des mots simples le mode opératoire de ce virus et de découvrir ses vulnérabilités. Virologie Le SARS-CoV-2 est vecteur chez l'être humain d'une pneumonie virale (cf. Jie Wu et al., 2020; OMS) qui peut devenir multi-organique. On reviendra en détails sur les pathologies des patients Covid. Sur le plan virologique, l'organisation génomique du SARS-CoV-2 est typique de la lignée B des Bêtacoronavirus, c'est-à-dire les Sarbecovirus, le même sous-genre que le SARS (ou SRAS, Syndrome Respiratoire Aigu Sévère) et le MERS (ou SRMO, Syndrome Respiratoire du Moyen-Orient). C'est une information très utile quand on découvre un nouveau virus car sur base de ce que l'on connaît du SARS par exemple, les virologues et les biochimistes parmi d'autres spécialistes peuvent faire des hypothèses raisonnables sur le fonctionnement du Covid-19 et les infectiologues peuvent prédire ses voies de transmission et proposer des moyens pour s'en protéger. Les études ultérieures du virus préciseront ce qui le différencie des autres coronavirus, y compris au niveau pathologique. Il est donc très important de connaître très tôt son génome et en corollaire le fonctionnement des protéines qu'il fabrique. On y reviendra. Le SARS-CoV-2 est un virus naturel qui parasite les animaux. Comme tous les coronavirus, il est zoonotique, c'est-à-dire qu'il se transmet entre animaux et entre humains également. On reviendra sur les zoonoses et les voies de transmission du Covid-19. A consulter : Graphen - Genomic epidemiology of novel coronavirus, Nextstrain GISAID hCoV-19 Reference sequence
Le SARS-CoV-2 est un virus à ARN mesurant entre 60 et 140 nm (0.06 à 0.14 micron) de diamètre dont l'enveloppe (péplos) est couverte d'épines (spikes) de 9 à 12 nm de longueur. Il comprend environ 29903 bases ou nucléotides formant 11 gènes codant pour les protéines et 12 protéines exprimées (cf. M.I. Hassan et al., 2020; N.Zhu et al., 2020). C'est une taille approximative car il existe un certain pléomorphisme (changement de forme selon l'environnement) et sa taille varie également selon les variants. Cette taille est déjà importante sachant que la majorité des virus à ARN contiennent entre 10 et 20 kb (par comparaison les virus humains contiennent entre 3 et 250 kb (cf. les virus). Toutes ces bases contiennent les instructions pour fabriquer 9860 acides aminés constituants les protéines du virus. Le génome du SARS-CoV-2 est linéaire, monocaténaire, c'est-à-dire qu'il comprend une seule chaîne nucléique ou simple brin (ss pour single strand). Il est à polarité positive (+) appelé "brin sens", ce qui signifie qu'il contient des séquences codantes servant directement d'ARN messager (ARNm) dans la cellule infectée. Comme tous les virus, l'ARN génomique du SARS-CoV-2 est protégé par une capside. Elle est constituée de protéines virales. A l'inverse d'autres groupes de virus, il existe une relation étroite entre les protéines de la capside et l'acide nucléique, d'où son nom de nucléocapside. La capside comprend des sous-unités appelées capsomères constitués de chaînes polypeptidiques. Chez le SARS-CoV-2, cette capside est organisée spatialement sous la forme d'une cavité sphérique. La capside virale remplit plusieurs fonctions essentielles. Outre son rôle protecteur de l'ARN viral, elle intervient à différentes étapes de la contamination de la cellule hôte. Structure et fonction des protéines clés Comment le SARS-CoV-2 infecte-t-il une cellule ? Une étude croisée conduite par 200 chercheurs internationaux sur la fonction des protéines des coronavirus confirme que "le Covid-19 est très proche des virus plus mortels comme le SARS et le MERS" (cf. N.J. Krogan et al., 2020), ce qui donne une idée de sa dangerosité. L'étude du cycle viral du SARS-CoV-2 (voir page suivante) permet de comprendre de quelle manière il contamine une cellule, se réplique, transcrit son information génétique et forme des virions qui émergent ensuite de la cellule infectée. Cela permet également de comprendre la pathogenèse, la manière dont se déclenche la maladie.
Mais l'analyse de l'arrangement de son génome est tout aussi importante sinon plus importante encore car elle permet de comprendre quels sont les gènes et les protéines clés impliqués dans la reconnaissance des cellules hôtes afin de mettre au point un médicament pour les neutraliser (cf. S.Jiang et al., 2020; D.Guo et al., S.Khan et al., 2020; M.G.Han et al., 2020; Z.Song et al., 2019; I.Tratner, 2003). Comme illustré à gauche et ci-dessus à droite, le génome du SARS-CoV-2 comprend 29 protéines divisées en plusieurs types. Il y a 4 glycoprotéines structurales (elles participent à l'édification du virus) qui sont codées par des transcrits indépendants : - la protéine S (spike signifiant épine), un trimère assurant la liaison au récepteur de la cellule hôte - la protéine E (enveloppe), gérant l'assemblage et la libération du virus - la protéine M (membrane), composée de trois domaines transmembranaires gérant la courbure et la forme du virus - la protéine N (nucléocapside), une ribonucléoprotéine qui protège le génome ARN. - les ORF (Open Reading Frame), une partie de l'ARN qui après traduction en acides aminés, ne contient pas de codons d'arrêt. Il permet d'identifier les zones correspondant à un gène. Ils comprennent un grand transcrit unique composé de 2 polyprotéines (ORF1a et ORF1b) qui code 16 protéines non structurales ("nsp" pour non structural protein), c'est-à-dire qui n'interviennent pas dans l'édification du virus. Elles sont maturées par protéase (voir plus bas) en deux parties, l'une constituée de 11 protéines nsp, l'autre de 5 protéines nsp qui participent au cycle de réplication du virus. Enfin, il y a 9 facteurs ou protéines accessoires situées sur le génome viral entre les protéines structurales S et E et conservées entre les coronavirus. Ces protéines accessoires sont codées de ORF3a et ORF9b. Leurs fonctions chez le Covid-19 sont en grande partie inconnues. Toute l'activité du virus étant basée sur ces protéines, il est essentiel de les caractériser, ce qui est du ressort de la protéomique. Nous verrons plus bas qu'on peut modéliser ces protéines pour analyser leurs différentes structures (cf. l'anatomie des cellules) afin de comprendre la manière dont sont assemblés leurs acides aminés et les autres molécules, comment elles s'activent et interagissent avec les autres protéines parmi d'autres sujets qui font appel à la chimie analytique. Ces protéines sont également classifiées en fonction de leur structure (cf. les bases PDB, UniProt, CATH, etc) ou de leur expression (cf. Expression Atlas), ce qui permet également de tracer leur évolution. On y reviendra à propos des mutations. A lire : Le SARS-CoV-2 (COVID-19) en chiffres (PDF), 2020
Les études in vitro ont permis de produire chacune des 29 protéines virales par des cellules humaines afin d'identifier leurs interactions dans ces cellules. Aidés par l'intelligence artificielle, les chercheurs ont découvert que le SARS-CoV-2 détournerait à son profit 332 protéines humaines pendant son cycle de vie. Si les chercheurs confirment les interactions entre les protéines virales et les protéines cellulaires humaines, ils ignorent encore si ces interactions ont un effet sur le processus contrôlé par la protéine de la cellule humaine. Ce sujet fait encore l'objet d'études. On y reviendra à propos de l'impact des protéines virales sur l'organisme (voir plus bas). La protéine S Le SARS-CoV-2 est un virus envelopppé. Cette membrane appelée péplos est constituée de lipides. Elle est très fragile et représente l'un des points faibles de ce virus d'où l'intérêt de se laver régulièrement les mains au savon ou, à défaut, d'utiliser un produit assainissant à base d'alcool. On y reviendra à propos de l'élimination des virus.
Le péplos porte différents types "d'épines" ou spicules. Il s'agit de glycoprotéines que le virus utilise pour se fixer sur la cellule et l'infecter. Les glycoprotéines sont des molécules liées entre elles par glycosylation, une réaction liant la protéine à de petites chaînes de sucres appelés oligosaccharides. Comparée à la protéine S recombinante (modifiée par recombinaison génétique), la protéine S du SARS-CoV-2 est plus fortement glycosylée, elle se présente principalement dans la conformation de préfusion fermée et grâce à trois charnières, sa tête présente plus de liberté d'orientation. On suppose que ces charnières permettent à la protéine S de scanner la surface de la cellule hôte à l'abri des anticorps grâce à une épaisse couche de glycane (cf. G.Hummer et al., 2020). La protéine S contient environ 1273 acides aminés codés par 3831 bases. Soulignons que les virus comptent parmi les rares micro-organismes utilisant 20 acides aminés différents (A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, Y) pour fabriquer leurs protéines alors que tous les autres organismes vivants n'utilisent que 7 à 13 acides aminés sur les 20 qu'ils possèdent (l'être humain n'utilise que 5 d'entre eux pour fabriquer son ADN - A, G, T et C - et son ARN - A, G, U et C - mais les combine par trois pour former 64 codons qui déterminent la synthèse des protéines). La protéine S est ce qu'on appelle le médiateur de la liaison au récepteur et de la fusion membranaire. Elle contient deux sous-unités, S1 et S2. La sous-unité S1 dite d'attachment contient un domaine de liaison au récepteur (RBD) qui est responsable de la reconnaissance et de la liaison avec le récepteur de surface cellulaire ACE2 (enzyme de conversion de l'angiotensine 2). La sous-unité S2 dite de fusion forme la "tige" de la structure et contient des éléments nécessaires à la fusion membranaire. Ce domaine RBD est composé de 223 acides aminés, dont 22 sont en contact avec le récepteur ACE2 sur les cellules humaines. RBD est l'une des régions où des mutations peuvent se produire. Grâce à cette protéine S de surface, le SARS-CoV-2 établit un pont ou lien moléculaire avec les cellules hôtes disposant des récepteurs ACE2, formant ensemble un trimère, c'est-à-dire trois molécules. Document Roche adapté par l'auteur. L'ACE2 est une protéine de clairance de l'angiotensine 2, c'est-à-dire qu'elle peut se débarrasser de cette substance en la convertissant en angiotensine dont l'effet est opposé à celle de l'angiotensine 2. Cette enzyme a des effets anti-fibrosante, anti-inflammatoire et provoque une vasodilatation parmi d'autres effets (cf. UniProt; Anne Claire N./SFPT, 2020; S.Jiang et al., 2020; M.& J.Smith, 2020). Des études sur des rats ont montré une corrélation positive entre le niveau d'expression d'ACE2 et le risque de déclarer une contamination par le SARS-CoV-2 (cf. D.C. Coutinho et al., 2014). Du fait que le SARS-CoV-2 se fixe sur l'ACE2, le virus entraine une diminution de l'activité de l'ACE2 qui est un facteur aggravant les lésions inflammatoires, en particulier pulmonaires (cf. K.Kuba et al., 2006). Malheureusement, presque toutes les cellules de tous les organes du corps humain contiennent des récepteurs ACE2. Autrement dit, le SARS-CoV-2 peut les infecter et nous verrons à propos des pathologies que de nombreux patients Covid ont souffert d'inflammations multi-organiques. Pour éviter ces pathologies graves et donc les infections, les chercheurs doivent trouver des stratégies thérapeutiques pour empêcher le virus de se lier à l'ACE2, par exemple en développant une forme soluble de la protéine ACE2 qui se fixerait sur le virus et qui agirait comme un leurre ou modifierait l'expression de l'ACE2. On y reviendra.
La protéine S comprend également des sucres dont le rôle reste en partie inconnu mais qui lui confèrent probablement la capacité de s'adapter et par exemple échapper aux défenses du système immunitaire. Il est donc essentiel de caractériser très finement cette protéine et si possible in vivo, dans les conditions réelles de son activité. Un indice de l'importance du sujet, selon Google Scholar, au 1 mai 2020 ces recherches avaient conduit à la publication de 4780 articles scientifiques consacrés à la protéine S et à plus de 50000 articles fin octobre 2021 (cf. Covid-19 ou SARS-CoV-2).
En analysant la liaison moléculaire établie par la protéine S aux rayons X, Fang Li de l'Université du Minnesota et ses collègues ont découvert que par rapport au virus du SARS qui sévit en 2002-2003, le SARS-CoV-2 a subi quelques mutations qui rendent le pont moléculaire plus compact que celui du SARS. Ces changements évolutifs bien qu'aléatoires ont permis au SARS-CoV-2 de se fixer plus facilement et plus fortement au récepteur ACE2, et par conséquent de mieux infecter les cellules humaines et se propager plus rapidement. Depuis sa transmission aux humains, de nouveaux variants encore plus transmissibles ou moins détectables par le système immunitaire sont également apparus (cf. page 3) et nous savons que le virus continue de muter chez les animaux. On y reviendra. Selon Li, les travaux de son équipe pourraient aboutir au "développement d'anticorps monoclonaux qui agiraient comme un médicament pour reconnaître et neutraliser cette liaison entre la protéine S et le récepteur" (cf. F.Li et al., 2020; Curie.fr). Une partie de la protéine S pourrait donc être une base pharmacologique et thérapeutique idéale, y compris pour développer un vaccin. On y reviendra. Concernant l'origine du SARS-CoV-2, des chercheurs ont découvert qu'un coronavirus de chauve-souris reconnaît le même récepteur humain que le SARS-CoV-2, mais le virus de la chauve-souris ne s'attache pas très bien au récepteur humain. Cependant, quelques mutations dans la protéine S ont pu améliorer la capacité du virus de la chauve-souris à se fixer au récepteur humain, ce qui a permis au virus de la chauve-souris de se transmettre aux humains et d'évoluer pour devenir le SARS-CoV-2. On reviendra en détails sur l'origine du SARS-CoV-2 et son évolution à propos des zoonoses. Les protéases Pour que la protéine S puisse s'attacher au récepteur ACE2 de la cellule hôte, elle doit d'abord être activée ou primée, ce qu'on appelle le "priming". Pour cela, une enzyme de notre organisme, c'est-à-dire une protéine catalytique appelée la protéase coupe la protéine S afin de la rendre fonctionnelle et infectieuse. Les chercheurs ont découvert que la protéine S peut être activée par la protéase transmembranaire à sérine 2, TMPRSS2 présente à la surface de la cellule hôte (cf. A.K.Shalek et al., 2020; D.Brann et al., 2020; S.Lukassen et al., 2020; F.Qi et al., 2020; C.Wu et al., 2020; H.Zhang et al., 2020) ou par la furine, une autre protéase à sérine (cf. M.Hoffmann et al., 202; L.Cantuti-Castelvetri et al., 2020). Ces protéases jouent un rôle essentiel dans la coupure des polyprotéines en ces différents éléments fonctionnels. Chez le SARS-CoV-2, la principale protéase se nomme Mpro ou 3CLpro et assure la plupart des coupures. Comme on le voit ci-dessous, la principale protéase Mpro est un dimère, c'est-à-dire un polymère formé de deux sous-unités identiques qui forment ensemble deux sites actifs (comme la saccharose est formée des dimères glucose et fructose). Le repli protéique est similaire aux sérines protéases comme la trypsine, mais c'est un acide aminé cystéine et une histidine proche qui effectuent la réaction de coupure protéique tandis qu'un domaine supplémentaire stabilise le dimère. Cette structure dispose d'un inhibiteur de type peptide lié dans le site actif. A voir : Quel est le rôle des protéines dans l'infection au Covid-19 ?, CNRS A lire : Bad News Wrapped in Protein: Inside the Coronavirus Genome, The New York Times, 2020
La coupure moléculaire de la protéine S ne peut se réaliser qu'à certains endroits précis appelés les sites de clivage. A ce jour, les biochimistes ont identifé pas moins de 11 sites de clivage sur la polyprotéine 1ab (replicase 1 ab) dans lesquels la principale protéase Mpro peut opérer (cf. R.Hilgenfeld et al., 2020). Notons que la réplicase 1ab est régulée par le gène ORF1ab qui est le plus long gène connu chez les coronavirus avec une longueur qui dépasse 20 kb, soit les deux-tiers du génome viral ! (voir schéma plus haut). Chez le SARS-CoV-2, le site de clivage contient un insert, c'est-à-dire un fragment supplémentaire de peptide comprenant 4 acides aminés qui est absent chez les protéines S du SARS par exemple et des coronavirus proches qu'on retrouve chez les autres mammifères comme la chauves-souris ou le pangolin (voir plus bas). Ce site de clivage ressemble à une boucle que peuvent exploiter les protéases cellulaires. Cette particularité semble jouer un rôle important dans l'évolution du virus et sa transmission à l'homme (cf. R. Hilgenfeld et al., 2020; B.Robson, 2020; J.A. Jaimes et al., 2020). Lorsque la protéase transmembranaire a "primé" (coupé) la protéine S, celle-ci peut s'attacher au récepteur ACE2. Ensuite, le Covid-19 doit fusionner son enveloppe virale avec la membrane cellulaire ou des compartiments cellulaires (des organites cellulaires assurant la même fonction et réunies dans une membrane comme le noyau ou le réticulum endoplasmique), ce qu'on appelle l'endocytose. Cette étape fait également appel à une protéase, une enzyme codée par le gène TMPRSS2 ou par la furine. Une première étape critique de l'infection par le SARS-CoV-2 est l'interaction du virus avec les récepteurs des cellules hôtes. Cette liaison au récepteur se produit par l'intermédiaire de la protéine S qui se lie à l'enzyme ACE2 des cellules humaines. L'enzyme ACE2 est largement considérée comme le principal point d'entrée du SARS-CoV-2 dans les cellules. Mais ce n'est pas la seule molécule que le virus peut exploiter pour infecter les cellules. En effet, l'ACE2 est exprimée à des niveaux très bas dans la plupart des cellules. Il n'est donc pas facile pour le virus de trouver des "portes d'entrée" cellulaires. Or nous savons d'expérience que le virus se propage rapidement. En fait, les différences observées dans les tissus infectés par les coronavirus suggèrent que des facteurs hôtes supplémentaires sont impliqués. Les chercheurs ont découvert un deuxième porte d'entrée : la neuropiline 1 (NRP1). Cette protéine transmembranaire est connue pour se lier aux substrats clivés par la furine évoquée plus haut et semble également participer au pouvoir infectieux du SARS-CoV-2. A voir : Neuropilin-1 drives SARS-CoV-2 infectivity
Comment se réalise cette liaison ? La séquence identifiée contient les acides aminés RRAR (Arg-Arg-Ala-Arg) qui sont reconnus par les furines. Ces enzymes clivent la protéine S en deux sous-unités, S1 et S2. La sous-unité S1 présente une séquence d'acides aminés CendR (Règle C-end ou C-end-Rule). Les peptides de ce type se fixent à la partie extracellulaire de NRP1 et NRP2. Ces molécules sont des récepteurs transmembranaires qui affectent de nombreux processus dans le corps humain. En effet, NRP1 joue un rôle important dans l'angiogenèse, c'est-à-dire la formation de nouveaux vaisseaux sanguins et dans la croissance des axones longs des neurones (cf. The Human Protein Atlas). On comprendra que les opérations de clivage et de fusion sont indispensables pour que le virus pénètre dans la cellule hôte et l'infecte. En l'absence de site de clivage à furine dans la protéine S, celle-ci ne peut pas se lier à NRP1 et le virus ne peut pas pénétrer dans la cellule. Dans un article publié dans la revue "Pain" le 1 octobre 2020, le neurologue Rajesh Khanna, spécialiste de la douleur à l'Université d'Arizona et ses collègues ont testé si la protéine S pouvait bloquer la signalisation de NRP1 et d'une autre protéine nommée VEGF, un facteur de croissance très connu de l'endothélium vasculaire qui intervient dans la signalisation de la douleur et qui se lie également à NRP1. Ils ont découvert qu'on peut utiliser un anticorps monoclonal bloquant contre NRP1 : "le déclenchement neuronal sensoriel déclenché par le VEGF-A a été bloqué par la protéine Spike et l'inhibiteur de NRP-1 EG00229". Leurs résultats furent confirmés par deux autres études publiées dans la revue "Science" le 20 octobre 2020 (G.Balistreri et al., 2020; B.Simonetti et al., 2020). Les deux groupes de chercheurs ont étudié des cellules humaines contaminées par le SARS-CoV-2 et ont constaté que NRP1 interagit avec la fameuse protéine S que le virus utilise pour pénétrer dans les cellules. Selon Balistreri, "Nous avons prouvé que la protéine S se lie à la neuropiline et que le récepteur a un potentiel infectieux". Selon Simonetti et ses collègues, "La neuropiline 1 facilite l'entrée du Covid-19 et l'infectiosité des cellules". Selon Khanna, "Nous avons mis du VEGF dans l'animal [dans la patte d'un rat], et observé une douleur intense au cours de 24 heures. Puis vint l'expérience vraiment cool: nous avons mis VEGF et Spike en même temps, et devinez quoi ? La douleur est partie". Selon Balistreri, cette étude a montré "ce qui arrive à la signalisation du neurone lorsque le virus chatouille le récepteur NRP1". Les "résultats sont solides", démontrant que l'activité des neurones a été modifiée "par le contact de la protéine S du virus à travers NRP1".
Dans une expérience faite sur des rats présentant une lésion nerveuse pour modéliser la douleur chronique, l'administration de la protéine S seule a atténué les comportements de douleur des animaux. Cette découverte suggère qu'un médicament ressemblant à la protéine S qui se lie à NRP1 pourrait agir potentiellement comme analgésique. De telles molécules sont d'ailleurs déjà en développement pour soulager les patients cancéreux (l'angiogénèse participe aussi au développement des gliomes et autres tumeurs en formant de nouveaux vaisseaux sanguins pour répondre aux besoins métaboliques des cellules cancéreuses). Dans deux autres études publiées dans la revue "Science" le 13 novembre 2020, les équipes de James L. Daly de l'Université de Bristol et de Ludovico Cantuti-Castelvetri de l'Université Technique de Munich ont montré que NRP1 favorise l'entrée du SARS-CoV-2 dans les cellules et expliquent comment NRP1 interagit avec la protéine S. Les résultats suggèrent l'interaction protéine S-NRP1 comme cible antivirale potentielle comme illustré dans le schéma présenté ci-dessus à gauche. Le récepteur NRP1 agit donc comme un cofacteur avec ACE2 mais il peut aussi le remplacer pour faciliter l'entrée du virus dans les cellules, y compris celles du système nerveux central, les deux récepteurs contribuant à aggraver l'infection. C'est par exemple grâce au récepteur NRP1 que le SARS-CoV-2 peut contaminer les astrocytes (les cellules gliales) du cortex cérébral et indirectement provoquer la mort des neurones. On y reviendra. Une équipe internationale de chercheurs dirigée par le bioinformaticien Chase W. Nelson du Musée Américain d'Histoire Naturelle (AMNH) a découvert un gène mystérieux dans le code génétique du SARS-CoV-2, un segment pratiquement caché dans le génome du virus et largement négligé jusqu'à présent. Les détails de cette découverte furent publiés dans la revue "eLife" le 1er octobre 2020. Le gène en question appelé ORF3d est ce qu'on appelle un gène chevauchant (overlapping) que les chercheurs considèrent comme une sorte de "gène dans un gène". En effet, du fait qu'il chevauche les séquences codées des gènes ORF3c et ORF3d-2, il se dissimule dans la chaîne de nucléotides. Selon Nelson, "en raison de leur grande taille, le génome du Covid-19 comme celui de ses parents sont peut-être plus enclins à la supercherie génomique que les autres virus à ARN". Ce chevauchement de gènes n'est pas une découverte en soi. Il en existe chez les bactéries, les virus et les cellules eucaryotes, y compris chez l'homme où ils représentent environ 10% du génome (cf. L.Zhang et al., 2008).
La question est de savoir si ORF3d représente vraiment une "couverture" génomique pour le virus bien qu'il sera difficile de le confirmer. En effet, les gènes chevauchants sont par définition difficiles à identifier dans les séquences génétiques, car les systèmes de balayage génomique peuvent facilement les manquer quand ils parcourent les chaînes de code génétique. Ils sont en effet programmés pour identifier des gènes individuels et non pas (encore) des instructions globales partagées entre les nucléotides des gènes adjacents dans une séquence. Pour les chercheurs, le fait que ce gène se cache en quelque sorte pose un grave problème pour comprendre comment fonctionne ce virus, bien que certains aspects de sa constitution génétique ont déjà été élucidés. Selon Nelson, "L'absence de gènes chevauchants nous met en danger de négliger des aspects importants de la biologie virale. Les gènes qui se chevauchent peuvent être l'un des nombreux moyens par lesquels les coronavirus ont évolué pour se répliquer efficacement, contrecarrer l'immunité de l'hôte ou se transmettre". Il faut donc à tout prix que les spécialistes comprennent la raison pour laquelle ORF3d existe sous cette forme, pourquoi il est caché dans le génome, chevauchant d'autres gènes. En parcourant les bases de données génomiques, les chercheurs ont découvert que le gène avait déjà été identifié chez un coronavirus mais qui affecte uniquement les pangolins vivant dans le Guangxi, en Chine. Il a également été classé à tort comme un gène non apparent, ORF3b présent chez d'autres coronavirus, y compris le SARS. Ces deux gènes codent pour des protéines totalement différentes et on ne peut donc pas appliquer nos connaissances à l'ORF3d du SARS-CoV-2. En revanche, en se basant sur des analyses sanguines antérieures faites sur des patients Covid, les chercheurs ont déjà découvert que ORF3d provoque une forte réponse en anticorps. A l'époque, Nelson avouait méconnaître ce gène : "Nous ne connaissons pas encore sa fonction ou s'il y a une signification clinique. Mais nous prédisons que ce gène a relativement peu de chance d'être détecté par une réponse des lymphocytes T, contrairement à la réponse des anticorps. Et peut-être que cela a quelque chose à voir avec la façon dont le gène est apparu". En résumé, ce gène ORF3d chevauchant s'ajoute aux 11 gènes déjà connus du SARS-CoV-2, ce qui représente un progrès important. Quant à savoir jusqu'à quel point, c'est tout l'enjeu des recherches en cours. Prochain chapitre
|