Découvrir de nouvelles planètes grâce au machine learning
Durant des siècles, les gens ont regardé les étoiles, consigné leurs observations et constaté certains schémas récurrents. Les planètes figurent parmi les premiers objets identifiés par les astronomes. Les Grecs les appelaient “planētai,” ou “errants”, en raison de leur mouvement en apparence irrégulier dans le ciel nocturne. Des siècles d'observations et de développement théorique ont permis de comprendre que la Terre et les autres planètes de notre système solaire tournent autour du Soleil, une étoile parmi tant d'autres. Aujourd'hui, poussés par la même curiosité humaine, les astronomes poursuivent leurs recherches afin d'étudier et de mieux comprendre les planètes. Grâce à des technologies comme les systèmes d'optique de télescope, les vols spatiaux, les caméras numériques et les ordinateurs puissants, il nous est désormais possible d'élargir notre compréhension au-delà de notre propre Soleil et de détecter les planètes gravitant autour d'autres étoiles. Étudier ces planètes, appelées exoplanètes, nous permet d'aborder certaines des interrogations les plus profondes de l'Homme. Qu'y a-t-il d'autre dans l'Univers ? Y a-t-il d'autres planètes et des systèmes solaires semblables au nôtre ?
Bien que la technologie ait facilité la recherche, découvrir des exoplanètes s'avère encore très difficile. Comparées à leurs étoiles hôtes, les exoplanètes sont petites, froides et sombres. Il est donc aussi difficile de les détecter que de repérer une luciole volant près d'une puissante lampe torche… mais avec l’aide du machine learning (ou "apprentissage automatique"), nous avons récemment fait de grands progrès !
Pour rechercher des exoplanètes, les astrophysiciens analysent généralement de grandes quantités de données provenant de la mission Kepler de la NASA. Pour cela, ils utilisent des logiciels automatisés et des analyses manuelles. Le télescope Kepler a observé environ 200 000 étoiles durant quatre ans. Prenant une photo toutes les 30 minutes il a créé environ 14 milliards de points de données. Ces 14 milliards de points de données équivalent approximativement à 2 quadrillions d'orbites de planètes possibles ! Il s'agit d'une énorme quantité d'informations à analyser, même pour les ordinateurs les plus puissants. Examiner ces données est un processus incroyablement laborieux et chronophage. Nous souhaitions voir s'il était possible d'accélérer ce processus et de le rendre plus efficace. C'est là que le machine learning intervient.
La luminosité mesurée d'une étoile diminue légèrement quand une planète en orbite bloque une partie de la lumière. Le télescope spatial Kepler a observé la luminosité de 200 000 étoiles pendant 4 ans pour rechercher ces signaux caractéristiques causés par des planètes en rotation.
Le machine learning est un moyen d'enseigner aux ordinateurs comment reconnaître des schémas. Cela se révèle particulièrement utile pour donner du sens à de grandes quantités de données. L'idée centrale est de laisser l'ordinateur apprendre par l'exemple plutôt que les humains ne programment des règles spécifiques.
Je suis un chercheur en apprentissage automatique au sein de l'équipe de Google AI passionné par l'espace, et j'ai commencé à travailler sur ce sujet en projet 20%. Dans le processus, j'ai tendu la main à Andrew, un astrophysicien de UT Austin, pour collaborer. Ensemble, nous avons appliqué cette technologie au ciel et avons enseigné à un système d'apprentissage automatique comment identifier les planètes autour des étoiles lointaines.
Grâce à un ensemble de données de plus de 15 000 signaux détectés par le télescope Kepler, nous avons utilisé TensorFlow pour apprendre à un modèle de machine learning à distinguer les schémas provoqués par des planètes de ceux provoqués par d'autres objets comme des taches stellaires et des systèmes binaires. Lorsque nous avons testé notre modèle sur des signaux jusque-là inconnus, il a correctement identifié ceux émis par des planètes et ceux qui ne l'étaient pas dans 96 % des cas. Nous savions alors que ce modèle fonctionnait !
Armés de notre modèle à l'efficacité prouvée, nous avons commencé à analyser les données du télescope Kepler à la quête de nouvelles planètes. Pour affiner la recherche, nous avons décidé d'étudier 670 étoiles déjà connues pour contenir au moins deux exoplanètes en orbite autour d'elles. Nous avons ainsi eu le bonheur de découvrir deux nouvelles planètes, Kepler 80g et Kepler 90i. Fait encore plus marquant, Kepler 90i est la huitième planète découverte en orbite autour de l'étoile Kepler 90, ce qui en fait le premier système solaire composé de huit planètes en orbite découvert en dehors du nôtre.
Nous avons utilisé 15 000 signaux de Kepler étiquetés pour entrainer notre modèle d'apprentissage automatique afin d'identifier les signaux de la planète. Nous avons utilisé ce modèle pour rechercher de nouvelles planètes dans des données provenant de 670 étoiles, et découvert deux planètes qui n’apparaissaient pas lors de recherches précédentes.
Voici quelques informations intéressantes sur la dernière planète récemment découverte : elle est 30 % plus grande que la Terre, et sa température en surface est d'environ 427°C, autant dire que ce n'est pas le meilleur endroit pour passer ses vacances ! De même, elle fait le tour de son étoile en à peine quatorze jours, ce qui signifie que vous fêteriez votre anniversaire toutes les deux semaines.
Légende: Kepler 90 est le premier système solaire de 8 planètes connu en dehors du nôtre. Dans ce système, les planètes sont en orbite plus près de leur étoile, et Kepler 90i fait sa révolution une fois tous les 14 jours. (Notez que les tailles des planètes et les distances par rapport aux étoiles ne sont pas à l'échelle.)
The sky's the limit ! (pour ainsi dire) quand il s'agit des possibilités offertes par cette technologie. Pour l'instant, nous n'avons utilisé notre modèle que pour étudier 670 étoiles sur les 200 000 possibles. Les données du télescope Kepler regorgent donc probablement de bien d'autres exoplanètes encore inconnues. Nous sommes convaincus que, tout comme le machine learning, les nouvelles idées et les nouvelles techniques contribueront aux découvertes intergalactiques des prochaines années.
Vers l'infini et au-delà!