DESY News: KI befreit schwache Signale aus einem Schleier von Rauschen

News-Suche

Meldungen vom Forschungszentrum DESY

https://www.desy.de/e409/e116959/e119238 https://www.desy.de/aktuelles/news_suche/index_ger.html news_suche news_search ger 1 1 8 both 0 1 %d.%m.%Y Pressemeldung
ger,eng
21.03.2024
Zurück

KI befreit schwache Signale aus einem Schleier von Rauschen

Neue Technik ebnet den Weg zur Verbesserung und Beschleunigung von Photon-Science-Experimenten

Forschende der Universität Zürich (UZH) haben Neuronale Netze (CNNs) eingesetzt, um das Rauschen aus Detektorbildern effektiv herauszufiltern und damit praktisch unsichtbare Streusignale sichtbar zu machen. Anhand von Daten der PETRA III-Strahlführung P21.1 hat die Arbeitsgruppe um Johan Chang, Professor am Institut für Physik der UZH, ein CNN-System so trainiert, dass eine Aufnahme mit 20-fach verkürzter Messzeit eine ebenso genaue physikalische Information liefert wie die ursprüngliche lange Messung. In ihrer Publikation in der aktuellen Ausgabe der Fachzeitschrift Nature Machine Intelligence zeigt das Team, dass ihr Ansatz für ein Einkristall-Beugungsexperiment funktioniert, und demonstriert dessen Potenzial für eine schnellere Datenerfassung auch für andere Streutechniken.

Download [612KB, 2000 x 887]
Die KI findet das Signal im Rauschen: Aus der Kurzzeitaufnahme (links) filtert das Neuronale Netzwerk ein Ladungsdichtesignal heraus (rote Ellipse im mittleren Bild), das vergleichbar deutlich wie das Signal der 20-fach längeren Messung (rechts) ist. Bild: UZH
In der Stoffklasse der korrelierten Elektronenmaterialien üben die Elektronen der äußeren Atomschalen eine starke Wechselwirkung aufeinander aus und beeinflussen sich auf komplexe Weise. Dadurch zeigen diese Materialien eine große Vielfalt ihrer makroskopischen Eigenschaften unter Bedingungen wie niedriger Temperatur und hohem Druck. So kann sich beispielsweise die elektrische Leitfähigkeit in ein und derselben Verbindung von einem Isolator zu einem Supraleiter ändern. Um das Auftreten und das Zusammenspiel der verschiedenen Zustände zu verstehen, müssen sehr feine strukturelle Eigenschaften untersucht werden. So zeigt beispielsweise der prototypische Hochtemperatursupraleiter La1.88Sr0.12CuO4, der in dieser Arbeit untersucht wurde, eine so genannte Ladungsdichtewellenordnung (CDW), die nur bei niedrigen Temperaturen auftritt. In Beugungsbildern, die an Röntgenlichtquellen wie PETRA III aufgenommen werden, zeigt sich der Effekt durch sehr schwache Reflexe, die senkrecht zu den starken Bragg-Reflexen des Kristallgitters angeordnet sind. „Die modernen einzelne Photonen zählenden Flächendetektoren erfassen problemlos das starke und das schwache Beugungssignal in einem Bild“, sagt Martin von Zimmermann, Wissenschaftler an der PETRA III-Strahlführung P21.1. "Allerdings erzeugt das Rauschen in den Detektorbildern, das von parasitärer Streuung an der Luft und den Kryostatfenstern herrührt, ähnliche Intensitäten auf dem Detektor wie das CDW-Signal und verdeckt es im Wesentlichen, wenn wir nur sehr kurze Zeit messen.“

Um schwächere Signale zuverlässiger zu identifizieren und das Signal-zu-Rausch-Verhältnis zu verbessern, haben die Forschenden zwei verschiedene neuronale Netze aufgebaut, um die gemessenen Daten zu „entrauschen“: „In einem ersten Schritt haben wir einen Datensatz gesammelt, der aus Paaren von Low-Count- (LC) und High-Count- (HC) Bildern mit jeweils einer bzw. 20 Sekunden Belichtungszeit besteht“, sagt Julia Küspert, Doktorandin in der Chang-Gruppe. Jens Oppliger, Erstautor der Studie und ebenfalls Doktorand in der Gruppe, erklärt das angewendete Verfahren weiter: „Wir haben dann ein CNN trainiert, um das schwache CDW-Signal in den verrauschten Low-Count-Daten in einem überwachten maschinellen Lernverfahren zu verbessern, wobei wir die entsprechenden High-Count-Bilder als Referenz verwendet haben. Das Training mit mehr als dreitausend solcher Detektorbildpaare dauerte etwa 10 bis 20 Stunden auf einer handelsüblichen GPU mit 10 GB VRAM. Einmal trainiert, erzeugt das Netzwerk entrauschte Bilder innerhalb eines Sekundenbruchteils. Obwohl die Rauschverteilung bei Streuexperimenten mit 2D-Detektoren gut bekannt ist, stellte sich heraus, dass es wichtig ist, mit echten Low-Count-Daten zu arbeiten, da diese zusätzliche Rauschkomponenten aus verschiedenen experimentellen Quellen wie beispielsweise dem Auslesen selbst enthalten. „Wir stellten fest, dass das Hinzufügen von simuliertem Rauschen zu den HC-Bildern zu einer weniger zuverlässigen Rauschfilterung führte als das Training mit experimentellen LC-Daten“, sagt Jens Oppliger.

Die Beschleunigung der Datenerfassung ermöglicht nicht nur eine hocheffiziente Nutzung der wertvollen Strahlzeit an Synchrotron- oder Freie-Elektronen-Laser-Strahlführungen, sondern eröffnet auch immer ausgefeiltere Untersuchungen von strahlenempfindlichen Proben und ultraschnellen Prozessen. Normalerweise wird durch die verkürzte Datenerfassungszeit die in einer Probe akkumulierte Röntgendosis minimiert. Überall dort, wo lange Belichtungen mit Röntgenstrahlen die Probe zerstören, z. B. bei biologischem Gewebe oder metastabilen Materialien, bietet der hier vorgestellte Rauschfilter das Potenzial, Einblicke in empfindliche Strukturen zu gewinnen, die bisher unzugänglich waren. Wertvoll ist außerdem, dass die durch künstliche Intelligenz (KI) unterstützte Datenentrauschung die Erfassung sehr schneller struktureller Veränderungen ermöglicht, die z. B. in gepulsten hohen Magnetfeldern oder unter Laserbestrahlung mit hoher Wiederholrate auftreten. „Herkömmliche Verfahren zur Rauschunterdrückung, die in der Bildgebung oder Akustik eingesetzt werden, wie Tiefpass- und Gaußfilter, führen bei Bildern mit hohem Rauschpegel oft zu auffälligen visuellen Artefakten. Unser CNN-basierter Rauschfilter vermeidet solche Probleme weitgehend und bewahrt so den wissenschaftlichen Inhalt der Messung. Das bedeutet, dass wir keinen Teil der in den Detektorbildern enthaltenen physikalischen Informationen verändern und stattdessen das trainierte KI-Modell nutzen, um Signal und Rauschen zu trennen“, sagt Oppliger. Die vorgestellte Methode basiert nicht auf spezifischen Beugungs- und Streudaten; daher plant das Forschungsteam, in einem nächsten Schritt die Fähigkeiten des Systems zur Extraktion schwacher Signale aus Streu-, Spektroskopie- und Elektronenmikroskopiedaten zu testen. Langfristig könnte eine Vielzahl wissenschaftlicher Disziplinen von solchen KI-basierten Werkzeugen zur effizienten Entfernung von starkem Rauschen profitieren.

 

Originalveröffentlichung

J. Oppliger, M.M. Denner, J. Küspert et al., Weak signal extraction enabled by deep neural network denoising of diffraction data.Nature Machine Intelligence 6, 180–186 (2024), DOI: 10.1038/s42256-024-00790-1