Meine Daten sind deine Daten
Schon heute sind viele Datensätze frei verfügbar. Doch können andere Forschende diese auch tatsächlich nutzen? Dieser Frage geht ein departementübergreifendes Projekt nach.
Wenn Forschungsdaten offen zugänglich sind, wird die wissenschaftliche Arbeit nicht nur transparenter, effizienter und wirksamer, sondern lässt sich auch einfacher reproduzieren und verifizieren. So die Idee von Open Research Data. «Schon heute gibt es viele Datensätze, die grundsätzlich frei verfügbar sind», sagt Anna Daudrich, Forschungsdatenspezialistin an der Hochschulbibliothek der ZHAW. «Doch ob sich diese Daten so einfach wiederverwenden lassen, steht auf einem anderen Blatt.» Genau dieser Frage geht die ZHAW im Projekt ROADS derzeit auf den Grund. Der freie Zugriff auf bestehende Forschungsdaten ermögliche nicht nur, neue Fragestellungen anzugehen und stärker interdisziplinär zu arbeiten, sondern spare auch viele personelle und zeitliche Ressourcen, führt Daudrich aus, die das departementübergreifende Projekt leitet. «Zudem fordern heute auch Förderinstitutionen und öffentliche Geldgeber immer häufiger, dass die generierten Daten allen zur Verfügung stehen.» Die Wiederverwendbarkeit von Forschungsdaten ist eines der vier Prinzipen, an denen sich auch der Bund in seiner Nationalen Strategie zu Open Research Data orientiert. Diese sogenannten FAIR-Prinzipien besagen: Forschungsdaten müssen auffindbar, zugänglich, kompatibel und eben wiederverwendbar sein. Erst dann dienen sie auch anderen Wissenschaftlerinnen und Wissenschaftlern bei ihrer Arbeit. Wie aber müssen Daten dazu aufbereitet, dokumentiert und verwaltet werden?
Mangelnde Metadaten und fehlende Messstandards
Antworten auf diese Fragen erhofft sich Daudrich aus konkreten Anwendungsfällen, das heisst: Studierende und Dozierende der ZHAW suchen nach bestehenden Datensätzen und wenden diese im Rahmen einer Diplom-, Haus- oder Seminararbeit auf eine beispielhafte Forschungsfrage an. Daudrich arbeitet dabei mit ganz verschiedenen Departementen und Disziplinen der ZHAW zusammen: In die Analyse fliessen also Messdaten aus der Physiotherapie ebenso ein wie Umfragen aus der Angewandten Psychologie oder statistische Auswertungen aus der Lebensmittelwissenschaft.
Sharun Parayil Shaji und sein Betreuer Wolfgang Tress von der School of Engineering etwa haben sich für ein relativ neues globales Datenarchiv zu sogenannten Perowskit-Solarzellen entschieden. Perowskit ist ein Sammelbegriff für verschiedene Stoffe, deren Kristallstruktur dem natürlichen Mineral mit demselben Namen ähnelt. «Solarzellen aus Perowskit sind effizienter und benötigen bei der Herstellung weniger Energie als andere Materialien», sagt Tress, der am Institute of Computational Physics das Team Neuartige Halbleiterbauelemente leitet. «Für eine kommerzielle Anwendung sind sie aber noch zu wenig robust.» Die beiden Forscher wollten deshalb untersuchen, ob sich aus den bestehenden Daten allfällige Trends in Bezug auf die Stabilität von Perowskit-Solarzellen ablesen und maschinelle Lernmodelle trainieren lassen.
«Studierende sollten schon früh auf Open Research Data
sensibilisiert werden – lange bevor sie als Forschende tätig sind.»
Die Bilanz fällt eher ernüchternd aus: Sie hätten für ihre Analyse weder auf genügend Daten noch ausreichende Kontextinformationen zurückgreifen können, fasst Tress zusammen. Das grösste Problem seien aber die fehlenden Messstandards gewesen: «Es gibt heute keine eindeutigen Vorgaben, wie die Stabilität von Perowskit-Solarzellen erhoben werden soll.» Diese werde je nach Labor unter sehr unterschiedlichen Belastungsbedingungen gemessen: Einmal variiere vielleicht die Temperatur, ein anderes Mal die Lichtintensität. Der Professor kritisiert aber auch, dass das verwendete Datenarchiv seit seiner Erstellung 2021 kaum gepflegt oder aktualisiert worden sei. «Dabei wurde gerade in den letzten Jahren viel zum Thema publiziert.»
Wenn es denn gut geführt sei, ist der langfristig Nutzen eines solchen Archivs für Tress aber unbestritten. «Stabilitätsmessungen sind in der Regel sehr aufwendig», erklärt der Ingenieur und Physiker. «Viele Labore könnten diese alleine gar nicht durchführen.»
Grundlagen der Datenrecherche werden kaum vermittelt
Im Gegensatz zu Tress und Shaji haben sich die anderen Teilnehmenden für ihre Fallstudien grossmehrheitlich auf Datensätze aus eigenen Forschungsarbeiten gestützt, wie Projektleiterin Daudrich sagt. «Viele der gängigen Schwierigkeiten haben sich für sie darum gar nicht erst gestellt.» Wer mit eigenem Material arbeite, wisse von Anfang an, ob sich dieses auch für andere Fragen eigne. Auch fehlende Metadaten seien dann nicht so dramatisch. «Die meisten Forschenden erinnern sich auch ohne detaillierte Dokumentation noch an die Laborbedingungen.»
Das von der Rektorenkonferenz der Schweizerischen Hochschulen swissuniversities mitfinanzierte Projekt wird deshalb um ein halbes Jahr verlängert und läuft neu bis Ende Juni 2025. Für die zusätzlichen Fallstudien sollen nun ausschliesslich Datensätze anderer Wissenschaftlerinnen und Wissenschaftler nachgenutzt werden, betont Daudrich. «Erst so können wir ein vertieftes Verständnis für die typischen Herausforderungen rund um das Thema gewinnen.»
Denn Probleme gibt es genug: So erschweren den Studierenden heute nicht nur Qualitätsmängel die Wiederverwendung von Daten, sondern auch rechtliche Fragen; etwa wenn die Einwilligung von Probandinnen und Probanden diesbezüglich nicht klar formuliert ist. Gleichzeitig fehlt es vielerorts an grundsätzlichen Kenntnissen und Kompetenzen, wie Daudrich feststellt. «Das beginnt manchmal schon bei der Frage: Wo finde ich überhaupt geeignete Daten?» Während eine Einführung in die Literaturrecherche im Studium selbstverständlich sei, würden bislang zur Datenrecherche kaum Grundlagen vermittelt.
Die Wissenslücken der Studierenden bedeuten auch einen Mehraufwand für die betreuenden Dozentinnen und Dozenten. «Oft müssen sie dann die nachzunutzenden Daten suchen, diese in üblichere Formate konvertieren oder eine gängigere Software ausfindig machen», sagt Daudrich. Dies werfe auch Fragen nach dem Leistungsumfang auf, der schliesslich den Studierenden angerechnet werden kann.
Frühe Sensibilisierung für das Thema fördern
Von ROADS erhofft sich die ZHAW nicht nur Erkenntnisse darüber, ob existierende Forschungsdaten tatsächlich wiederverwendbar sind. Das Projekt soll auch dazu beitragen, die Datenkompetenz heutiger Studierender und Forschender an der ZHAW zu fördern und somit den Grundstein dafür zu legen, eine künftige Generation von Open Scientists auszubilden. Dazu sollen nicht nur departement- und fachspezifische Beratungen und Schulungen angeboten, sondern auch unterstützende Materialien wie Checklisten oder Leitfäden zum Thema Datennachnutzung entwickelt werden.
Der Weg zu Open Research Data dürfte noch lange sein, lohnenswert ist er für Anna Daudrich aber allemal. «Wichtig ist, schon möglichst früh im Studium für das Thema zu sensibilisieren – lange bevor die Studierenden selbst als Forschende tätig sind.» Auf diese Weise wüssten Wissenschaftlerinnen und Wissenschaftlerin nicht nur von Beginn weg, worauf es zu achten gelte, wenn sie existierende Daten nachnutzten – sondern seien sich auch bewusst: «Wenn ich meine Daten nicht ordentlich aufbereite und dokumentiere, haben andere bei der Nachnutzung später ein Problem.»
Würdigung mit dem ORD-Preis
Das Projekt ROADS wurde Ende November 2024 mit dem nationalen ORD-Preis ausgezeichnet. Dieser Preis würdigt seit 2023 Schweizer Forschende aller Karrierestufen für innovative Praktiken im Bereich Open Research Data. Die diesjährige Ausschreibung richtete sich an Projekte, die eine kollaborative und/oder interdisziplinäre Wiederverwendung von Forschungsdaten betreiben oder Bildungs- und/oder Outreach-Aktivitäten im Zusammenhang mit der Wiederverwendung von Forschungsdaten realisieren.
Erstes Studienbuch mit virtueller Lernumgebung
«Operating Systems and Infrastructure in Data Science» basiert auf Skripten von Data-Science-Vorlesungen an der School of Engineering. Zusätzlich zum Buch gibt es eine virtuelle Lernumgebung mit Gamification-Elementen. Lernende können Übungen spielerisch absolvieren und dabei Micro-Zertifizierungen erlangen. Diese Qualifikationsnachweise für kleine Lerneinheiten zeigen, dass die Studierenden gewisse Kenntnisse in Teilbereichen haben, die in Zeugnissen nicht alle aufgelistet werden können. Die Inhalte des Buchs sind Open Access auf der ZHAW digitalcollection verfügbar.
(Bild: alphaspirit/adobestock)
0 Kommentare
Sei der Erste der kommentiert!