Histoire du projet SETI@home

Du projet SETI@home à BOINC

Jodie Foster dans le film "Contact" inspiré du roman de Carl Sagan.

Histoire d'un pari scientifique (I)

Comment le projet SETI@home est-il né ? Comment fonctionne ce logiciel et quel est l'avenir de ce programme scientifique ? Telles sont quelques-unes des questions auxquelles nous allons répondre dans cet article.

Les projets SETI tels BETA et SERENDIP V devant analyser les signaux reçus sur des millions de canaux, les scientifiques furent bientôt confrontés à des problèmes budgétaires pour assurer la maintenance et le suivi à long terme de ces programmes.

En effet, comment analyser les signaux de millions de sources célestes avec des ordinateurs limités par leur capacité mémoire et la vitesse de leur processeur ? Même un superordinateur puissant tel le Cray-XMP fut un jour étranglé par la quantité de données à traiter et de toute façon les scientifiques n'attendront jamais des années le résultat de ces calculs.

Il fallait trouver une autre solution capable de satisfaire les défenseurs de SETI, à savoir un système informatique plus rapide et plus puissant que n'importe quel système existant. Utopie ? Tel était le dilemme auquel étaient confrontés les radioastronomes à la fin des années 1990.

Des solutions inédites existaient. Beowulf, développée en 1993 par Donald Becker à la NASA était l'une d'entre elles : mettre des ordinateurs en parallèle afin d'obtenir un système équivalent à la somme des CPU utilisés. Idem pour la mémoire. Aujourd'hui nous appelons ce genre d'architecture un cluster (une grappe).

Tout un chacun peut monter un cluster qui coûte moins de 10% du superordinateur équivalent s'il fallait le construire : 10 PC cadencés à 1 GHz coûtent toujours moins cher qu'un système à 10 GHz qui de toute façon n'existe pas encore ! C'est ainsi que la revue "Scientific American" raconta voici quelques années le projet fou d'un professeur américain qui avait accumulé des ordinateurs relativement lents dans sa cave, transformant le système en un superordinateur fonctionnant en parallèle lui permettant de calculer les nombres premiers...

Mais à l'époque, ces solutions devaient être implémentées localement car il était exclu d'utiliser un tel système à travers le réseau Internet, le goulot d'étranglement étant la vitesse des communications entre l'utilisateur et le site central. L'ADSL existait bien, il s'appelait encore l'ISDN (RNIS) mais la connexion était très cher, tandis que du côté analogique les modems tournaient beaucoup plus lentement (1200 bauds à 56 Kbauds).


Philip Morrison vers 1975 et Carl Sagan vers 1980 : deux fervents défenseurs de SETI. Documents NGS et Carl Sagan Prod./Cosmos.

Répartir le traitement des données

SETI ne peut pas utiliser de superordinateurs car un signal interstellaire, s'il nous vient de plusieurs milliers d'années-lumière, s'affaiblit naturellement, c'est l'effet de fading et de dispersion du signal que l'on connnaît bien en ondes-courtes. Selon l'activité de la source d'émission, en l'espace de quelques heures la force du signal peut diminuer parfois d'un facteur 10 ou supérieur. Cet effet est inévitable et se produit chaque fois qu'une onde traverse notamment un nuage interstellaire chaud excité par des étoiles jeunes.

En pratique, si les radioastronomes doivent attendre quelques heures pour vérifier un signal suspect, celui-ci à toute les chances de s'évanouir ou d'être simplement oublié temporairement dans le flot des données. Dans le pire des cas, s'il s'agit d'un véritable signal artificiel, le radioastronome risque de perdre la signature d'une civilisation extraterrestre.

Etant donc contraint par nature de travailler en temps réel, tout le travail d'analyse doit se réaliser au pied du radiotélescope en dans un délai d'environ 20 minutes, travail qui est loin d'être une sinécure quand on pense que SERENDIP IV écoute simultanément 106 millions de canaux ! Dans de telles conditions comment pouvait-on malgré tout répartir le travail d'analyse ?

L'idée géniale de David Gedye

La bonne étoile apparut une fois de plus durant la fête de Noël de 1994. David Gedye, vice-président d'une société de formation online discutait avec des amis et émit l'idée qu'après avoir connu le 25^eme anniversaire d'Apollo 11, beaucoup de personnes aspiraient à une nouvelle grande découverte, quelque chose qui changerait notre place dans l'univers. Qu'est-ce qui pourrait mieux changer notre place dans l'univers que la découverte d'une civilisation extraterrestre ? Et ne serait-il pas génial si chacun pouvait y participer ? On pourrait utiliser la puissance de traitement de tous ces micro-ordinateurs qui font tourner des économiseurs d'écrans et autre screensaver... Tel était le pari de Gedye.

L'idée de SETI@home, telle était le nom de baptème du projet, naquit en 1996. David Gedye sera secondé par l'informaticien Craig Kasnoff et par l'astronome Woodruf Sullivan qui eurent l'idée ingénieuse d'utiliser Internet comme superordinateur. Cette solution tirant profit d'un traitement parallèle était intéressante : diffuser l'information chez des milliers d'utilisateurs potentiels, un rêve ! L'idée plut aux chercheurs de l'Université de Berkeley. Si les internautes pouvaient accéder aux données brutes enregistrées à l'observatoire radioastronomique d'Arecibo, ils pourraient télécharger les signaux enregistrés par SERENDIP IV.

Ces unités de travail seraient distribuées à toute personne qui en ferait la demande à travers le réseau Internet. Le logiciel rechercherait des signaux suspects gaussiens (aléatoire), des pulses et des triplets (des signaux répétitifs). Lorsqu'un module serait traité les résultats significatifs seraient renvoyés aux scientifiques qui n'auraient plus qu'à vérifier les signaux les plus forts en cas de suspicion. L'installation serait simple : un petit ordinateur, un modem, une ligne téléphonique reliée à Internet et un logiciel d'analyse de spectre qui serait fourni gracieusement par l'équipe SETI@home de Berkeley.

Le traitement des données

Evidemment SETI@home n'analyserait pas tout le spectre électromagnétique ni même un octave. Il serait centré sur le "trou d'eau" à 1421.5 MHz et analyserait une étroite bande passante de 2.5 MHz (entre 1418.75-1421.25 MHz).

Schéma du traitement des signaux SETI entre son enregistrement et son analyse par un utilisateur du client SETI@home.

Cette bande passante étant encore trop large pour une analyse en haute résolution, elle serait divisée en 256 segments de 10 kHz de largeur (exactement 9766 Hz). Ce séquencage serait effectué grâce à un logiciel appelé le "splitter". Ces morceaux de 10 kHz ont une taille assez petite pour être géré par un logiciel standard.

Pour enregistrer des signaux jusqu'à 10 kHz nous avons besoin d'enregistrer l'information à la vitesse de 20000 bits par seconde (kbps), c'est la fréquence dite de Nyquist. Un séquence d'environ 107 secondes de ces 10 kHz (20 kbps) de données seraient envoyées aux utilisateurs pour traitement. Mais quelle taille représentent ces données ?

Une séquence de 107 secondes multipliées par 20000 bits représentent environ 2.14 millions de bits, soit environ 0.27 MB sachant qu'il y a 8 bits dans un byte (octet). Ces morceaux de 270 KB représentent une unité de travail ou "work unit." Berkeley enverrait également quelque 70 KB d'informations complémentaires sur l'unité de travail, portant la taille totale du fichier de donnée à environ 340 KB ce qui est excessivement petit. Aujourd'hui encore la taille du fichier est très similaire; elle occupe environ 354 KB sur disque.

Un paramètre important du protocole de SETI@home est le taux angulaire de balayage du ciel ou "Angle Rate" (AR). En effet, l'antenne d'Arecibo utilise trois taux angulaires différents afin d'obtenir différentes résolutions spatiales : AR<0.2255°, 0.2255° £ AR £ 1.1274° et AR>1.1274°.

Pour découvrir un signal suspect, le client SETI@home réalise différents calculs sur différentes parties de l'unité de travail en fonction de son taux angulaire, sautant les parties non significatives calculées par les FFT. Ainsi pour toutes les unités de travail présentant un faible taux angulaire, le programme recherche les triplets dans certaines parties de l'unité et des triplets ainsi que des pulses dans les autres parties. Pour les unités de travail présentant un taux angulaire moyen le client recherche les signaux gaussiens, les pulses et les triplets et ce sur 80% de l'unité tandis que pour les taux angulaires élevés, le programme recherche uniquement les pulses et les triplets sur les deux-tiers de l'unité de travail. Ceci explique les différentes phases de traitement que l'on observe dans le tracé graphique de SETI@home.

Ceci explique également pourquoi le temps de calcul est plus long pour les unités de travail ayant un taux angulaire moyen car le programme doit rechercher les trois types de signaux. A l'inverse, les unités de travail présentant un taux angulaire élevé sont rapidement traitées car il y a moins de calculs à effectuer comparés aux autres unités.

Le protocole étant défini, David Gedye et Craig Kasnoff commencèrent à développer la première version du logiciel SETI@home. Ils seront épaulés par l'ingénieur software Brad Silen (qui travaille aujourd'hui sur le projet PlanetQuest, un autre projet distribué fonctionnant sous BOINC et recherchant des exoplanètes).

Finalement David Anderson du département informatique de l'Université de Californie à Berkeley (UCB) et directeur de la société Distributed Science fut nommé directeur du projet et Dan Werthimer du Space Sciences Lab fut nommé représentant scientifique. Tout ce que les scientifiques demandaient encore c'était un peu d'argent pour installer tout le hardware nécessaire au support de ce projet et supporter sa maintenance.

Trouver un financement

Malheureusement, même dans la Silicon Valley, réputée pour ces entrepreneurs audacieux et les investissements astronomiques il ne fut pas facile de rassembler les fonds - quelques centaines de milliers de dollars - pour alimenter le projet SETI@home. L'équipe de chercheurs reçut bien quelques donations, des PC de Sun Microsystems, mais pas assez d'argent pour lancer le projet.

En 1997, l'équipe de David Anderson continua à travailler sur le programme d'analyse de spectre et développa des prototypes des logiciels client et serveur pour MacOS, Windows et Unix. Mais en 1998, l'argent vint à manquer et les entreprises commerciales n'entrevoyaient pas de retour sur leurs investissements.

C'est alors que David Anderson et Dan Werthimer décidèrent de contacter la Planetary Society, la célèbre organisation scientifique internationale qui se consacre à l'exploration de l'espace et à SETI. Les scientifiques lui proposèrent d'écrire un logiciel d'analyse de spectre et de construire le plus grand superordinateur virtuel de la planète dédié à SETI. Mais elle devait financer une partie du projet. Idée excentrique ? Etrange ? Audacieuse ? Peut-être.

La Planetary Society n'accepta pas immédiatement de relever le défi. Elle pensait qu'il s'agissait d'un investissement à fond perdu et son directeur voulait un business plan avant de se prononcer. Par ailleurs la Society pensait que peu de gens y participeraient et que se serait un mauvais investissement. Quelques membres de la Society refusèrent toutefois de laisser tomber le projet car il était conforme à l'esprit de la société.

David Anderson et son équipe contactèrent Ann Druyan, la veuve de Carl Sagan qui fonda en 1996 le Carl Sagan Fund for the Future (CSFF) dont le but était justement de financer les projets qui se conformaient à la vision de son mari, pour ces passionnés épris par l'aventure de l'exploration spatiale et la recherche de vie extraterrestre. Annie sauta sur l'idée. C'était exactement le genre de projet que Carl aurait de tout coeur aimé suppporter. Comme le disent les Américains, les "naysayers" (négativistes) plièrent et la Planetary Society reçut un crédit de 50000 dollars ainsi qu'une provision. Le projet SETI@home releva la tête mais devait encore boucler son budget.

A travers "Star Trek" les studios de la Paramount Pictures ont financé la moitié du projet SETI@home.

Les promoteurs du projet savaient que leurs démarches ne serait pas aisées. Mais jamais à court d'idée, la Planetary Society se tourna alors vers le cinéma. Paramount Pictures cherchait à faire de la publicité autour de la sortie de son nouveau film " Star Trek : Insurrection ". Tout le monde savait à travers le générique de la série TV que l'un des crédos de Star Trek était "to seek out new life, and new civilizations" (la recherche de nouvelle formes de vie et de nouvelles civilisations). C'était exactement ce qu'allait faire SETI@home... Ils lancèrent l'idée aux directeurs des studios de la Paramount, qui acceptèrent de financer la seconde moitié du projet.

La Planetary Society put enfin rappeler David et Dan et leur annoncer la bonne nouvelle : vous avez gagné votre pari, SETI@home vivra !

Prochain chapitre

SETI@home

Page 1 - 2 - 3 - 4 - 5 -

Back to:

HOME