Ein schärferer Blick auf die Milchstraße mit Gaia und maschinellem Lernen
Forschende unter der Leitung des Leibniz-Instituts für Astrophysik Potsdam (AIP) und des Institut de Ciéncies del Cosmos an der Universität Barcelona (ICCUB) haben ein neuartiges maschinelles Lernmodell genutzt, um Beobachtungsdaten von 217 Millionen Sternen der Gaia-Mission effizient zu verarbeiten. Die Ergebnisse sind den herkömmlichen Methoden zur Ermittlung von Sternparametern durchaus ebenbürtig. Der neue Ansatz eröffnet spannende Möglichkeiten, Eigenschaften wie die interstellare Extinktion und Metallizität in der gesamten Milchstraße zu kartieren, und so zum Verständnis der Sternpopulationen und der Struktur unserer Galaxie beizutragen.
Mit der dritten Datenveröffentlichung des Gaia-Satelliten der Europäischen Weltraumorganisation ESA erhielten Astronominnen und Astronomen Zugang zu verbesserten Messungen für 1,8 Milliarden Sterne – eine riesige Menge an Daten für die Erforschung der Milchstraße. Die effiziente Analyse eines so großen Datensatzes stellt jedoch eine Herausforderung dar. In der jetzt veröffentlichten Studie untersuchten die Forschenden den Einsatz von maschinellem Lernen zur Bestimmung wichtiger Sterneigenschaften anhand der spektrophotometrischen Daten von Gaia. Das Modell wurde auf qualitativ hochwertigen Daten von 8 Millionen Sternen trainiert und erzielte zuverlässige Vorhersagen mit geringen Unsicherheiten.
„Die zugrunde liegende Technik, ‚Extreme Gradient-Boosted Trees‘ genannt, ermöglicht die Ermittlung präziser stellarer Eigenschaften wie Temperatur, chemische Zusammensetzung und interstellare Staubverdunkelung mit einer bisher unerreichten Effizienz. Das entwickelte maschinelle Lernmodell, SHBoost, erledigt seine Aufgaben, einschließlich Modelltraining und Vorhersage, innerhalb von vier Stunden auf einem einzigen Grafikprozessor – ein Vorgang, für den zuvor zwei Wochen und 3000 Hochleistungsprozessoren erforderlich waren“, sagt Arman Khalatyan vom AIP und Erstautor der Studie. „Die Methode des maschinellen Lernens reduziert somit die Rechenzeit, den Energieverbrauch und den CO2-Ausstoß erheblich.“ Dies ist das erste Mal, dass eine solche Methode erfolgreich für alle Sterntypen gleichzeitig eingesetzt wurde.
Das Modell wird mit hochwertigen spektroskopischen Daten aus kleineren Himmelsdurchmusterungen trainiert und wendet diese Erkenntnisse dann auf den großen Datensatz der dritten Datenveröffentlichung von Gaia (DR3) an. Dabei werden die wichtigsten Sterneigenschaften nur mit Hilfe der photometrischen und astrometrischen Daten sowie den niedrig aufgelösten XP-Spektren von Gaia gewonnen. „Die hohe Qualität der Ergebnisse reduziert die Notwendigkeit zusätzlicher ressourcenintensiver spektroskopischer Beobachtungen auf der Suche nach guten Kandidaten für weitere Untersuchungen, wie z. B. seltene metallarme oder supermetallreiche Sterne, die für das Verständnis der frühesten Phasen der Entstehung der Milchstraße entscheidend sind.“ sagt Christina Chiappini, ebenfalls Wissenschaftlerin am AIP. Dies erweist sich als entscheidender Vorteil für die Vorbereitung künftiger Beobachtungen mit Multi-Objekt-Spektroskopie, wie z. B. das Projekt 4MIDABLE-LR, eine große Durchmusterung der galaktischen Scheibe und des Bulge, der zentralen Verdickung der Milchstraße, die Teil des 4MOST-Projekts an der Europäischen Südsternwarte (ESO) in Chile sein wird.
„Der neue Modellansatz liefert umfassende Karten der gesamten chemischen Zusammensetzung der Milchstraße und bestätigt die Verteilung von jungen und alten Sternen. Die Daten zeigen die Konzentration metallreicher Sterne in den inneren Regionen der Galaxie, einschließlich des Balkens und des Bulge, mit einer enormen statistischen Aussagekraft“, fügt Friedrich Anders vom ICCUB hinzu.
Das Team nutzte das Modell auch, um junge, massereiche, heiße Sterne in der gesamten Galaxie zu kartieren und zeigte dabei entfernte, bisher kaum untersuchte Sternentstehungsregionen auf. Die Daten enthüllen auch, dass es in unserer Milchstraße eine Reihe von „stellaren Leerräumen“ gibt, also Gebiete, die nur sehr wenige junge Sterne beherbergen. Außerdem wird aus den Daten ersichtlich, wo bisher die dreidimensionale Verteilung von interstellarem Staub noch unzureichend aufgelöst ist.
Da Gaia weiterhin Daten sammelt, macht die Fähigkeit von Modellen des maschinellen Lernens, die riesigen Datensätze schnell zu verarbeiten, diese zu einem unverzichtbaren Werkzeug für die zukünftige astronomische Forschung. Der Erfolg dieses Ansatzes zeigt das Potenzial des maschinellen Lernens, die Analyse großer Datenmengen in der Astronomie und anderen wissenschaftlichen Bereichen zu revolutionieren und gleichzeitig nachhaltigere Forschungspraktiken zu fördern.
Quelle: https://www.aip.de/de/news/milky-way-gaia-machine-learning/