Neurowissenschaften

Recherche

Neuroimaging-Daten werden derzeit in einer Vielzahl von Formaten und über verschiedene Plattformen verbreitet. Rohe Magnetresonanz-Bildgebungsdatensätze zum Testen neuer Algorithmen oder Erforschen neuer Hypothesen können über Ressourcen wie OpenfMRI gefunden werden. Um aus umfangreichen Studien sorgfältig kuratierte multimodale Datensätze zu erhalten, ist die Connectome Coordination Facility ein nützlicher Ausgangspunkt.

Die Neurosynth-Plattform ist ein nützliches Werkzeug, um Daten zu Spitzenaktivierungskoordinaten zu finden, die in der gesamten Literatur angegeben sind. Eine weitere nützliche Online-Ressource zum Auffinden von statistischen Karten ohne Schwellenwert, Parzellierungen und Atlanten, die in MRT-Studien erstellt wurden, ist die Neurovault-Plattform.

Klinische Datensätze können auch von spezialisierten Portalen wie der Alzheimer Disease Neuroimaging Initiative (ADNI) und dem Autism Brain Imaging Data Exchange (ABIDE) bezogen werden.

Daten sammeln und strukturieren

Rohdaten und abgeleitete Daten

Damit Daten effektiv genutzt und ihr Wiederverwendungspotenzial erhöht werden können, müssen sie angemessen organisiert, gespeichert, aufbereitet und dokumentiert werden.

Bei der Datenerfassung ist es wichtig, klar zwischen Rohdaten und abgeleiteten Daten zu unterscheiden. Letztere werden wahrscheinlich verarbeitet und nachbearbeitet, so dass Zwischen- und endgültige Datenversionen verfügbar sind und diese korrekt strukturiert und identifiziert werden müssen. Eine Namenskonvention, die die Art der Daten (Korrelationskarten, Gehirnmasken, T1-, T2-gewichtete usw.) eindeutig identifiziert, wird empfohlen und steht im Einklang mit einigen weit verbreiteten Community-Datenstrukturierungsstandards wie BIDS.

Software

Der gesamte Code für die Datenerfassung sollte in einem Versionskontrollsystem gespeichert werden. Der gesamte Analyse-Workflow sollte vollständig in einer Workflow-Engine automatisiert sein, die in einem Software-Container oder einer virtuellen Maschine gepackt ist, um die Reproduzierbarkeit der Berechnungen sicherzustellen.

Datensätze sollten versioniert werden, um die Herkunft zu verbessern, und einer automatisierten regelmäßigen Qualitätskontrolle unterzogen werden, um die Richtigkeit des Datensatzes zu bewerten und potenzielle Fehler zu erkennen.

Ethische und rechtliche Aspekte

In den Neurowissenschaften werden Daten von Teilnehmern (Probanden oder Patienten) routinemäßig im Rahmen von Studien oder Projekten erfasst, um eine bestimmte Forschungsfrage zu beantworten. In der Regel wird eine Vereinbarung zwischen Forschern und Probanden in Form einer fachspezifischen Einverständniserklärung getroffen. Diese Formulare sind für beide Seiten ein wertvolles Hilfsmittel, um genau anzugeben, wie und zu welchen Zwecken die Daten erfasst werden und was mit den Daten während eines Projekts geschehen wird, einschließlich etwaiger Pläne für eine zukünftige Weitergabe. Wenn das Einverständnisformular geschickt geschrieben wird, ist es möglich, die Verwendung der Daten für zukünftige Analyse- und Forschungsfragen zu sichern. Das Open Science Team der ULB bietet Beratung beim Verfassen von Einverständniserklärungen an. Weitere Informationen zu Einverständniserklärungen und Vorlagen finden Sie hier.

Die technischen Anstrengungen, die unternommen werden, um die sichere Weitergabe eines Datensatzes zu gewährleisten, dürfen nicht übersehen werden. Oft müssen Datensätze anonymisiert werden, wobei der Anonymisierungsgrad für jedes Forschungsprojekt spezifisch ist.

Datenformate und Metadaten

Imaging-Daten

Für Roh-Imaging-Daten ist DICOM der am häufigsten verwendete Standard, während NIfTI das Dateiformat für abgeleitete Daten ist, das von verschiedenen Neuroimaging Datenanalysepaketen unterstützt wird. Andere verfügbare Datenformate sind MINC und NRRD.

Bei Verwendung des NIfTI-Format wird empfohlen, ausreichende Metadaten aus den Rohdaten in zusätzlichen Dateien (z.B. * .TXT oder * .JSON) bereitzustellen. Eine Reihe von Konvertern steht zur Verfügung, um DICOM-Dateien in das NIfTI-Format umzuwandeln.

Metadaten

Metadaten spielen eine entscheidende Rolle bei der Vermittlung nicht nur wichtiger Studieninformationen, sondern auch technischer Parameter. In beiden Fällen werden Tabellendateien – durch Tabulatoren oder Kommas getrennte Dateien (* .CSV, * .TXT) – als Metadatendateiformate allgemein akzeptiert.

Die Menge der Metadaten hängt von der Art der durchgeführten Analyse (und Datenverarbeitung) ab. Für anatomische Daten sind häufig weitaus weniger Metadaten erforderlich als für funktionelle Studien (fMRI). Tools zum automatischen Extrahieren von Metadaten aus Rohdaten und zum Überprüfen der Vollständigkeit der extrahierten Metadaten sind über die entsprechenden NITRC– und GITHUB-Projektlinks verfügbar.

Datenübertragung

Die International Neuroinformatics Coordinating Facility (INCF) ist für den Aufbau einer internationalen Infrastruktur zur Förderung des Datenaustauschs, aber auch von Rechenressourcen verantwortlich. Das INCF befürwortet eine Reihe von Best Practices für den Datenaustausch im Bereich der Neuroinformatik. Die Best Practices von INCF konzentrieren sich auf die Annahme offener Standards, die Zitierbarkeit von Daten und die Implementierung von Tools, die von der Community gut beschrieben, unterstützt und übernommen werden.

Standards

Bei der Verbreitung Ihrer Ergebnisse sollten alle im Datensatz durchgeführten Analysen gemeldet werden. Datensätze sollten möglicherweise unter Verwendung geeigneter Community-Standards wie BIDS geteilt, und mit einem Ontologie-Ansatz oder einer ähnlichen Methode kommentiert werden, die eine halbautomatische maschinengesteuerte Analyse ermöglicht. Vor der Freigabe einer ersten Version der Daten sollte ein Qualitätssicherungstest durchgeführt werden.

Lizenzen für den Datenaustausch

Ausreichende Informationen zu den Bedingungen, unter denen der Datensatz zur Verfügung gestellt wird, müssen verfügbar sein. Während die Creative Commons eine Reihe von Lizenzen zur Verfügung stellen, die für die Übertragung offener Daten kompatibel und nützlich sind, beziehen sich die meisten davon auf Dokumente, bei denen CC0 die einzige verfügbare datenorientierte CC-Lizenz ist. Weitere zu berücksichtigende Optionen für die Datenlizenzierung sind die Open Data Commons– und die Open Definition-Initiative.