Analytic cloud platform for near real-time mass spectrometry processing on the fast data architecture [article]

Roman Zoun, Universitäts- Und Landesbibliothek Sachsen-Anhalt, Martin-Luther Universität, Gunter Saake, Dirk Benndorf
2020
Ein Massenspektrometer ist ein Gerät zum Messen von Biomarkern in biologischen Gemeinschaften. Diese Biomarker können genutzt werden, um Biogasanlagen zu optimieren und Energieeffizienter zu machen oder auch Krankheiten zu diagnostizieren. Die aktuellen Analysearbeitsabläufe eines Massenspektrometers sind sequenziell und beinhaltet Stunden von Wartezeiten zwischen den einzelnen Arbeitsschritten. Diese Situation ist nicht akzeptabel, besonders wenn es um klinische Diagnostik geht. Zusätzlich ist
more » ... eht. Zusätzlich ist die softwaregestützte Datenanalyse sehr komplex und braucht eine stabile Hardwareinfrastruktur, welche mit hohen Kosten und Aufwand einhergeht. In unserer Arbeit präsentieren wir einen konzeptionellen Beweis einer analytischen Plattform für Echtzeitanalyse von Massenspektrometer-Experimenten. Wir implementierten MStream, eine Cloudbasierte Plattform, welche auf der Fast-Data- Architektur aufsetzt und eine skalierbare, streambasierte Protein Identifikation ermöglicht. Wir diskutieren und lösen alle Herausforderungen, die für die Adaption einzelner Schritte einer streambasierter Lösung auf einer Cloudarchitektur benötigt waren. Die erste Herausforderung war die Konzepterstellung, die zweite Herausforderung war das streamen der Daten während der Messung direkt von dem Massenspektrometer. Die dritte Herausforderung war die Strukturierung der Daten für einen schnellen Durchsatz und die letzte Herausforderung war die streambasierte Validierung der Ergebnisse. Das Resultat ist MStream, eine prototypische Umsetzung einer Cloudplattform zur Echtzeitverarbeitung von Massenspektrometerdaten. Am Ende der Arbeit wird die Plattform evaluiert und die Ergebnisse zeigen eine bessere Performance im Vergleich zu aktuellen Software-Alternativen.
doi:10.25673/34165 fatcat:g63ebcyd65de7iuuk3oukbg4c4