Commentaire : A la lumière de ce que l'on sait sur les virus, le coronavirus ne serait-il pas en fait nécessaire à notre évolution ? Ne ferait-il pas partie des mécanismes utilisés par la nature pour transmettre de l'information ? Au final ne nous serait-il pas d'une grande aide en apportant des briques à notre ADN ? On a tendance à considérer que les virus sont uniquement des grands méchants. L'article qui suit montre que ce n'est pas si simple et qu'ils sont peut-être à l'origine de la vie. Si les virus ont « inventé » l'ADN, avoir une peur panique d'un virus finalement très faiblement létal sauf pour les gens affaiblis, est peut-être juste une folie.


Depuis leur découverte, les virus sont restés exclus de l'arbre de l'évolution. Aujourd'hui, de nombreux biologistes discutent ce fait, et donnent aux virus un rôle primordial dans les changements subis par nos cellules ancestrales.

flu virus
Les virus posent un problème de fond aux biologistes : comment les situer dans l'ensemble du monde vivant ? Sont-ils seulement en vie ? D'après la théorie cellulaire élaborée au XIXe siècle, tout être vivant est constitué de cellules, ce qui n'est pas le cas des virus. Au milieu du XXe siècle, l'observation des cellules au microscope électronique a conduit à diviser le monde du vivant entre les cellules eucaryotes, qui possèdent un noyau entouré d'une membrane, et les cellules procaryotes, qui en sont dépourvues.

Les virus ont été arbitrairement rattachés à l'une de ces deux catégories en fonction de leurs hôtes. Les virus « procaryotes » étaient clairement opposés aux virus « eucaryotes ». On supposait alors que les virus avaient dû se former à partir de fragments d'acides nucléiques issus d'organismes cellulaires procaryotes ou eucaryotes, devenus par la suite autonomes et infectieux.

Modèles expérimentaux simples pour les pionniers de la biologie moléculaire, objets d'étude privilégiés pour la microbiologie médicale, les virus n'intéressaient généralement pas les évolutionnistes. Cette situation est en train d'évoluer. En effet, nous connaissons de mieux en mieux les virus grâce au séquençage de leurs génomes, et à l'analyse structurale de leurs protéines. Ces travaux ont montré que les virus forment un monde à part, qui coévolue depuis les temps les plus anciens avec le monde cellulaire.

Au début des années 1980, je travaillais sur des protéines impliquées dans la réplication de l'ADN, molécule qui porte notre information génétique. Or, certains virus codent pour leurs propres protéines de réplication des ADN polymérases qui synthétisent les nouveaux brins d'ADN ou des ADN topoisomérases qui contrôlent la structure de l'ADN. J'avais alors été frappé par une observation inattendue : certaines de ces protéines étaient très différentes de leurs homologues cellulaires. Par exemple, le virus T4, qui infecte la bactérie Escherichia coli, possède un ADN topoisomérase plus proche de celui des cellules eucaryotes que de celui des bactéries. Encore plus surprenant, l'ADN polymérase codé par le virus Φ29, infectant la bactérie Bacillus subtilis, ressemble à celui codé par un virus humain : l'adénovirus. Il était donc difficile de considérer toutes ces protéines comme des enzymes « procaryotes » ou « eucaryotes ».

Comment expliquer ces observations ? En 1983, j'ai imaginé une solution à la suite de la lecture d'un article paru dans la revue Pour la Science et dont l'auteur était Carl Woese, un biologiste évolutionniste américain de l'Université de l'Illinois. Dans son texte, Carl Woese présentait un nouveau schéma de classification du monde vivant, établi quelques années auparavant en collaboration avec son équipe. Selon lui, la division en deux grands groupes, eucaryotes et procaryotes, fondée sur les différences morphologiques des cellules, devait être remplacée par une division en trois lignées primordiales, ou domaines : les bactéries, les archées et les eucaryotes. Il définissait ainsi une nouvelle lignée : les « archéobactéries » que l'on nomme aujourd'hui les « archées ».

Cette nouvelle classification du vivant, plus précise que la précédente, est établie au regard du contenu génétique des ribosomes, des organites cellulaires responsables de la synthèse des protéines au sein des cellules. L'absence de ribosomes chez les virus les excluait sans semonce de ce nouveau paysage.

L'évolution cellulaire en trois lignées me suggérait toutefois une hypothèse excitante : pourquoi ne pas imaginer que les virus proviennent de domaines cellulaires, aujourd'hui disparus, qui auraient perdu leurs ribosomes ? Selon cette hypothèse, les enzymes atypiques codées par les virus seraient apparues dans ces anciennes lignées. Cela expliquerait pourquoi les enzymes virales sont si différentes de leurs homologues cellulaires.

La recherche de l'ancêtre

Nous savons aujourd'hui que tous les êtres cellulaires actuels descendent d'un même ancêtre, que l'on nomme luca, acronyme de l'anglais « Last Universal Common Ancestor ». Celui-ci devait être un organisme complexe dont les ribosomes étaient sans doute proches des ribosomes modernes. Par définition, les descendants de luca ont « éliminé » tous les descendants des autres lignées cellulaires qui coexistaient alors. Serait-il possible que les virus soient des reliques de ces nombreuses lignées cellulaires, des legs « vivants » de ces lointaines périodes de l'évolution ?

Si tel est le cas, l'étude des virus devait nous éclairer sur certains aspects de notre histoire la plus ancienne. Je publiais ces hypothèses en 1991 dans les actes d'un colloque sur les frontières du vivant, organisé à Blois. Elles sont passées complètement inaperçues pendant de longues années, avant de refaire surface récemment grâce à une série de découvertes spectaculaires. Aussi, la plupart des virologistes étaient peu informés des travaux de Carl Woese et des changements révolutionnaires qui s'opéraient dans le domaine de l'évolution. D'autres n'en saisissaient pas les enjeux. Il était difficile de remettre en cause l'exclusion des virus de l'arbre de la vie, faute de ribosomes.

Cette situation a finalement évolué et les communautés des virologistes et des évolutionnistes se sont rapprochées. Ainsi, Dennis Bamford, de l'université d'Helsinki, et ses collaborateurs ont découvert en 1999 des similarités de structure entre la protéine de capside du virus Φ6, qui infecte une bactérie, et celle de l'adénovirus, qui s'attaque à l'homme. Ils ont supposé que les protéines de capside de ces deux virus avaient évolué à partir de la capside d'un virus ancestral, déjà présent à l'époque de luca.

Plus récemment, Didier Raoult et ses collaborateurs, à Marseille, ont découvert un virus géant, le Mimivirus (voir Mimivirus : le plus gros des virus, par Didier Raoult, dans ce dossier), dont le génome est bien plus important que celui des plus petites bactéries. Ils n'ont pas hésité à supposer que ce virus serait une relique d'un quatrième domaine du vivant, hypothèse qui a soulevé de nombreuses polémiques ! La question de l'origine des virus se trouve ainsi posée pour la première fois avec force, à la fois par les évolutionnistes et par les virologistes.

Ces nouvelles idées bousculent les trois hypothèses communément admises sur l'origine des virus. Selon la première de ces hypothèses, les virus seraient apparus avant même les cellules. Dans les deux autres hypothèses, les virus sont d'origine cellulaire : ils correspondraient, soit à d'anciennes cellules parasites qui auraient évolué vers la forme virale suite à la perte complète de leur autonomie, soit à des fragments de génomes qui auraient échappé au contrôle de la cellule en devenant infectieux. Comment ces scénarios sont-ils perçus aujourd'hui si l'on considère les virus comme des organismes très anciens qui seraient apparus avant luca ?

Qui est apparu le premier ?

Revenons sur la première hypothèse, qui porte sur une origine primordiale des virus par rapport aux cellules. La logique voulait qu'on l'écartât : il était admis que les virus n'avaient pu apparaître avant les cellules, puisqu'ils ont précisément besoin de ces dernières pour se reproduire. Dernièrement, le bio-informaticien Eugène Koonin, qui travaille au Centre national de l'information biologique, à Bethesda près de Washington, a toutefois remis cette hypothèse à la mode. Il propose un modèle d'évolution dans lequel les cellules n'apparaissent qu'à la fin du processus évolutif qui a conduit aux trois domaines actuels. Selon son hypothèse, les virus sont apparus bien avant les cellules, à proximité des cheminées hydrothermales. Ils y infectaient à l'époque des systèmes moléculaires acellulaires qui évoluaient vers des formes de plus en plus complexes à l'intérieur des pores de cette cheminée.

Le modèle de Koonin rejoint une vision de l'évolution prébiotique partagée par les partisans d'un monde à ARN « pur et dur ». À la suite d'expériences qui ont montré que des macromolécules d'ARN étaient capables de catalyser des réactions chimiques, des spécialistes des origines de la vie ont imaginé un monde d'ARN sans cellules, peuplé « d'automates » moléculaires susceptibles d'auto­reproduction. Ces automates auraient conduit aux virus, et ensuite aux cellules.

Si tous les biologistes pensent aujourd'hui que l'ARN a bien précédé l'ADN dans l'évolution, tous ne partagent pas la version exclusive du monde à ARN. Une autre hypothèse, à laquelle j'adhère, imagine un monde à ARN dans lequel une cellule type possédait un génome à ARN, et contenait également des lipides, des sucres et sans doute des protéines, fabriquées par les ancêtres à ARN des ribosomes actuels.

Selon les défenseurs d'un monde à ARN cellulaire, une compétition « darwinienne » entre des entités cellulaires suffisamment évoluées est nécessaire pour que ce monde aboutisse à la synthèse des protéines. Si cette idée est juste, il devient plausible que les virus soient apparus après les cellules à ARN, soit avant les cellules à ADN. Appliquons cette idée dans le cadre des deux scénarios qui proposent une origine « cellulaire » des virus.

L'un de ces scénarios évoque l'existence de petites cellules à ARN qui vivaient sous forme de parasites à l'intérieur d'autres cellules à ARN. Ces entités auraient évolué vers la forme virale en perdant leur machinerie de synthèse protéique et en produisant une forme spécialisée pour l'infection, le virion (voir la figure 3a). La seconde possibilité requiert la transformation de fragments de génomes d'une cellule à ARN en virion. Dès lors, ces particules virales étaient capables de se transmettre directement d'une cellule à l'autre sans avoir à dépendre du mécanisme de division cellulaire, ce qui les rendait plus compétitives (voir la figure 3b).

Dans les deux cas, l'événement fondateur à l'origine des virus est l'invention de la capside qui autorise le transport de l'information génétique virale. Notons toutefois que la forme active du virus, celle qui correspond à un véritable organisme, est l'usine virale intracellulaire ; le virion n'est qu'un mode de transport sophistiqué qui permet aux « usines virales » de se propager au sein des « usines cellulaires ». Jean-Michel Claverie, de l'Institut de biologie structurale et microbiologie de Marseille, a récemment souligné le fait que l'on doit interpréter le virus en se focalisant non pas sur le virion, mais sur l'usine virale globale. Cela ouvre une voie radicalement nouvelle en virologie et rend totalement obsolète la question : « Les virus sont-ils vivants ? ».

Les usines virales apparaissent en effet bien vivantes, puisqu'elles sont capables de mobiliser tout le métabolisme et le mécanisme de synthèse des protéines de l'hôte pour fabriquer l'ensemble des protéines virales. Elles produisent une machinerie particulièrement efficace de reproduction du « soi ». Dans cette nouvelle vision, les virus sont définis comme des micro-organismes acellulaires. Ils représentent une seconde forme de vie terrestre à côté de la forme cellulaire propre aux archées, bactéries ou eucaryotes. Aussi, Didier Raoult et moi-même proposons de diviser le monde vivant en deux grands groupes : d'un côté les organismes avec ribosomes, les descendants de luca, et de l'autre les organismes avec capsides, les virus.

L'invention de l'ADN

Si les virus à ARN sont apparus les premiers, quelle est l'origine des virus à ADN ? Deux idées ont été avancées : soit ils descendent des virus à ARN, soit ils proviennent de cellules ancestrales à ADN. Cette dernière hypothèse a été récemment relancée par la découverte du Mimivirus : selon Jean-Michel Claverie, des parasites intracellulaires à ADN d'origine cellulaire auraient évolué vers la forme virale par l'invention de nouvelles capsides ou en empruntant celles de virus à ARN préexistants.

Il est toutefois fort probable que certains virus à ADN aient directement évolué à partir de virus à ARN. Cette supposition est confortée par l'existence de virus, comme les rétrovirus et les virus hépatiques, qui utilisent les deux types d'acides nucléiques dans leur cycle de réplication : ils passent alternativement d'une forme ARN à une forme ADN.

L'ADN serait-il lui-même une « invention » virale ? J'ai proposé une telle hypothèse en me fondant sur l'existence de virus qui ont modifié leur génome pour échapper aux défenses de leurs hôtes, tel le bactériophage T4. Un ou plusieurs virus à ARN auraient initialement modifié leurs génomes dans le cadre de la « course aux armements » entre cellules et virus (voir Le virus du sida garde une longueur d'avance, par François Clavel, dans ce dossier). Cette modification aurait apporté un avantage sélectif immédiat aux virus en question en rendant leur génome résistant aux mécanismes mis en place par les cellules de l'époque pour reconnaître et éliminer les ARN viraux. De mon point de vue, c'est la seule hypothèse qui permet actuellement de donner une explication de type darwinienne à l'apparition de l'ADN.

Lorsque l'on pose la question, « pourquoi l'ADN a-t-il remplacé l'ARN au cours de l'évolution ? », la réponse est généralement, « afin de permettre l'apparition de génomes de grande taille ». En effet, par rapport à l'ARN, l'ADN a perdu un oxygène réactif au niveau du sucre constitutif des nucléotides (voir la figure 2). Cette particularité protège l'ADN d'un phénomène d'auto-dégradation. L'ADN est ainsi plus stable que l'ARN. Pour autant, cette stabilité n'a pas produit instantanément un génome de grande taille dans le premier individu qui a transformé son ARN en ADN. Il a fallu du temps pour accroître la taille des génomes.

Dans mon hypothèse, l'invention de l'ADN a certes apporté un avantage évolutif aux virus par rapport aux cellules, mais ce n'est pas en premier lieu grâce à la nouvelle stabilité génétique. En effet, l'avantage immédiat acquis par les virus à ADN portait sur un caractère de résistance envers les défenses cellulaires « anti-ARN » ! En revanche, une fois mis en place, la stabilité plus grande de l'ADN a sans doute permis aux virus à ADN de prospérer et ensuite aux cellules à ADN d'acquérir des génomes de grande taille.

Si les premiers génomes à ADN sont apparus dans le monde viral, comment imagine-t-on le transfert de l'ADN des virus aux cellules ? On sait que de nombreux virus vivent aujourd'hui dans des cellules sans les tuer ni les endommager. De même, un virus à ADN aurait pu ainsi se maintenir pendant une longue période à l'intérieur d'une cellule à ARN. Suite à une mutation, ce virus aurait perdu sa capside et son caractère infectieux. En revanche, son génome à ADN aurait continué de se répliquer dans la cellule ARN, formant l'équivalent des plasmides, des chromosomes accessoires linéaires ou circulaires, que l'on trouve dans beaucoup de cellules actuelles. Ce « plasmide » à ADN d'origine virale aurait finalement contribué à la construction d'un chromosome cellulaire entièrement d'ADN.

L'origine des trois règnes

Selon ce scénario hypothétique, tous les êtres vivants cellulaires actuels seraient les descendants d'un ou de plusieurs virus à ADN qui auraient pris le contrôle de cellules à ARN ! Cette idée me semble expliquer la grande diversité des protéines virales qui participent aux processus de réplication de l'ADN.

Ces protéines seraient apparues très tôt dans l'évolution, avant luca, à l'époque où les virus à ADN infectaient encore des cellules à ARN. Certaines protéines de réplication virales n'auraient jamais été transférées aux cellules, ce qui expliquerait l'existence de protéines de réplication qui ne sont codées, aujourd'hui, que par des virus. D'autres, au contraire, auraient été transférées aux cellules en même temps que l'ADN, ou bien plus tard, grâce à des mécanismes de capture de gènes toujours à l'œuvre dans les cellules modernes.

Les versions « cellulaires » et « virales » de ces protéines seraient donc apparentées tout en présentant des caractéristiques particulières, puisqu'elles auraient divergé depuis longtemps. Ce serait le cas par exemple de l'ADN topoisomérase du bactériophage T4 ou de l'ADN polymérase de l'adénovirus, évoqués plus haut.

L'origine virale des protéines qui répliquent aujourd'hui l'ADN des cellules expliquerait également pourquoi les principales enzymes impliquées dans la réplication de l'ADN chez les bactéries ne sont pas homologues aux protéines correspondantes chez les archées et les eucaryotes. Cette observation surprenante est l'un des principaux acquis de la génomique comparative, une nouvelle discipline née du séquençage systématique des génomes. J'ai proposé récemment trois explications fondées sur l'apport des virus pour en rendre compte.

Dans la première hypothèse, les protéines de la réplication chez les archées et les eucaryotes étaient déjà présentes chez luca, et elles ont été remplacées par des analogues fonctionnels d'origine virale chez les bactéries (voir la figure 4a). Dans la deuxième hypothèse, toutes les protéines de la réplication d'origine virale ont été transmises indépendamment, d'une part aux bactéries, et de l'autre, aux archées et aux eucaryotes (voir la figure 4b). Dans ce cas, luca faisait encore partie du monde à ARN. Dans la troisième hypothèse, les archées, les bactéries et les eucaryotes seraient apparus indépendamment, suite à la fusion d'une cellule à ARN complexe et d'un gros virus à ADN (voir la figure 4c). Ce mécanisme se serait reproduit trois fois, de façon aléatoire, pour produire les trois formes de vie cellulaire.

Ces suppositions restent des hypothèses en construction, car aucune des trois n'est complètement satisfaisante. Les deux premières expliquent bien pourquoi les mécanismes de la réplication se ressemblent autant chez les archées et les eucaryotes. La troisième permet d'expliquer certaines différences non négligeables qui existent toutefois entre les systèmes de réplication des archées et des eucaryotes. Pour trouver une solution, il faut sans doute s'interroger sur l'incroyable complexité des cellules eucaryotes...

Vers le noyau cellulaire

Dans le scénario où « trois virus ont fondé les trois domaines du vivant », un virus géant à ADN serait à l'origine du génome des cellules eucaryotes. Cette idée rejoint en fait une hypothèse formulée en 2001 par Phillip Bell, de l'université australienne de Macqurie et Masaharu Takemura, de l'université de Nagoya, au Japon, sur l'origine virale du noyau de la cellule eucaryote. Ces auteurs fondaient leur hypothèse sur les nombreuses similarités qui existent entre le cycle intracellulaire des virus qui se répliquent dans le cytoplasme, et le cycle intracellulaire du noyau. En particulier, le recrutement des membranes présentes à l'intérieur des cellules, pour former, dans un cas, la membrane de l'usine virale, et dans l'autre, la membrane nucléaire.

Si le noyau des cellules eucaryotes est réellement d'origine virale, plusieurs virus ont dû contribuer à sa formation. Jean-Michel Claverie a récemment proposé une hypothèse qui expliquerait un tel mécanisme. Selon lui, des noyaux de cellules eucaryotes primitives, qui provenaient de virus à ADN, auraient donné naissance à de nouveaux virus à ADN, ceux-ci infectant à leur tour d'autres cellules eucaryotes en voie de formation. Cette évolution par « aller-retour » aurait conduit à la complexité actuelle de la cellule eucaryote par l'intégration du matériel génétique de plusieurs virus géants à ADN.

L'idée selon laquelle plusieurs virus ont participé à la construction de la cellule eucaryote expliquerait la diversité des ARN polymérases et des ADN polymérases chez les eucaryotes. Les analyses phylogénétiques suggèrent en effet que les différentes versions de ces enzymes ne sont pas issues de duplications qui se seraient produites dans une lignée eucaryote primordiale. Ainsi, une analyse réalisée par Jonathan Filée, ancien doctorant au sein de mon équipe à l'Institut de génétique et microbiologie de l'Université Paris-Sud, semble indiquer que l'ancêtre commun des ADN polymérases eucaryotes a également donné naissance aux enzymes d'archées et aux enzymes virales !

Voilà qui est a priori surprenant, sauf si l'on pense que cet ADN polymérase ancestral était lui-même codé par des virus et que ses descendants ont été introduits ensuite par différents virus chez les archées et dans la lignée ancestrale des eucaryotes. Ces analyses sont à considérer toutefois avec certaines réserves, car il est difficile de déterminer avec certitudes les relations de parenté entre protéines virales et cellulaires, par les méthodes de la phylogénie moléculaire.

Les séquences des protéines virales sont censées évoluer plus rapidement que celles des protéines cellulaires. Ainsi certains collègues continuent de penser que toutes les protéines virales sont d'origine cellulaires (et non l'inverse). Selon eux, les résultats obtenus par les analyses phylogénétiques sont biaisés par ces différences de vitesse évolutive. L'avenir nous dira qui a raison. La résolution de ce problème passe sans doute par une amélioration des méthodes de reconstruction phylogénétique et par l'étude d'un plus grand nombre de séquences virales et cellulaires.

À la conquête du monde viral

L'introduction des virus dans les schémas évolutifs a l'avantage de tendre vers une unification du monde vivant. Dans ces schémas, les virus et les plasmides sont non plus à la marge, mais au cœur des discussions sur l'origine et l'évolution des cellules modernes. Ce regain d'intérêt pour le monde viral va de pair avec une réévaluation de l'importance des virus dans la biosphère actuelle. Il est aujourd'hui admis que les virus sont beaucoup plus nombreux et divers que les cellules qui les hébergent. La diversité du monde viral s'est imposée par la découverte de nouvelles familles de virus chez les archées hyper-thermophiles qui vivent sous des conditions de chaleur extrêmes, au-delà de 80° C. Si certains d'entre eux ressemblent à des virus « bactériens » ou « eucaryotes », la grande majorité des virus d'archées ne présente aucune similarité détectable avec d'autres familles virales connues.

Les virus géants récemment mis au jour ont renforcé l'idée que la diversité virale est passée totalement inaperçue jusqu'ici. Dans ce contexte, la méthode classique de discrimination entre cellules et virus, fondée sur la taille, devient obsolète. On isole ainsi de plus en plus de virus qui ne sont plus « filtrants », c'est-à-dire dont la taille s'apparente à celle des bactéries et qui sont piégés par des filtres bactériologiques (voir La découverte d'un nouveau monde, par Claude Chastel, dans ce dossier). Il n'est pas exclu que la plupart des travaux de recherche systématique des virus aient ainsi sous-estimé la population virale...

L'hypothèse d'une ancienne et riche virosphère préexistant à luca expliquerait également le nombre relativement élevé de protéines orphelines présentes dans tous les génomes cellulaires séquencés. Ces orphelins proviendraient d'un gigantesque réservoir de gènes viraux qui pénètrent en permanence dans les génomes cellulaires. L'approvisionnement continu du génome s'accorde en particulier avec la présence de nombreux gènes qui n'ont pas d'homologues dans les génomes d'espèces proches. En outre, les multiples traces de génomes viraux inscrits dans les génomes cellulaires actuels sont un témoignage de ce processus, qui a sans doute beaucoup influé sur l'évolution cellulaire, notamment sur l'origine des génomes à ADN.

Toutes ces hypothèses s'appuient sur des informations limitées essentiellement aux virus qui attaquent l'homme, quelques organismes modèles ou des organismes à intérêt économique, comme les végétaux, les animaux domestiques, les bactéries lactiques, etc. Ces données préliminaires nous ont donné l'illusion que nous possédions une bonne connaissance du monde viral, et que les mêmes virus se retrouvaient partout. L'exemple des virus d'archées ou du Mimivirus montre qu'il n'en est rien. Nous avons sous-estimé la diversité virale, et les virus représentent une mine d'or inestimable, au sein de laquelle les générations futures de biologistes puiseront des millions de gènes et de protéines nouvelles d'intérêt académique ou industriel. Ces travaux ne manqueront pas de nous en apprendre plus sur l'origine et l'évolution des virus, mettant ainsi à l'épreuve les théories actuelles.