Biologie

Recherche

Während der Planungsphase eines Projektes prüfen Sie, den status quo  verfügbarer Datensätze für ihr Studienobjekt oder Standort. Auch wenn Daten für ein Projekt bereits vorhanden sind, es kann manchmal erforderlich sein, zusätzliche Datensätze von anderen Autoren, Regionen, Arten usw. zu erfassen.  Im Folgenden finden Sie einige nützliche Datenbanken und Ressourcen, mit denen Sie nach Datensätze suchen können.

  • Dryad: Internationales Repositorium für Daten, denen begutachtete Artikel in den grundlegenden und angewandten Biowissenschaften zugrunde liegen.
  • ITIS: maßgebliche taxonomische Informationen über Pflanzen, Tiere, Pilze und Mikroben
  • Protein DataBank: Ein weltweites Repository mit Informationen über die 3D-Strukturen großer biologischer Moleküle, einschließlich Proteinen und Nukleinsäuren.
  • Gfbiol Data Search: Suchmaschine des Bundes für biologische Daten
  • Knb: Das Wissensnetzwerk für das Biokomplexitäts-Repositorium

Daten sammeln und strukturieren

Daten können manuell oder automatisiert im Labor / Feld gesammelt werden oder Sie können nützliche Daten durch Literatur- oder Repositoriumsuche entdecken. Richten Sie vor der Datenerfassung ein Sammelprotokoll / eine Probenahmestrategie ein. Stellen Sie sicher, dass Sie Daten einheitlich und systematisch erfassen. Hier sind Biespiel Vorlagen zu finden für die Übermittlung von biologischen, Umweltproben, Auftrittsdaten- und und molekularen Sequenzdaten an das German Federation for Biological Data (gfbio).

Definieren Sie, welche Daten erstellt / gesammelt werden (Was? Wo? Wann? Wer? Wie?)

Datenformate und Metadaten

Die Sicherung der Rohdaten für Forschungsprojekte ist ein wichtiges Unterfangen, um sicherzustellen, dass die durchgeführten Forschungsarbeiten transparent bleiben und die Datenentwicklungsmethoden guten wissenschaftlichen Standards entsprechen. Im Allgemeinen sollte sichergestellt werden, dass die Rohdaten unverschlüsselt, nicht komprimiert (oder nach bekannten Standards komprimiert) und die verwendeten Formate nach Möglichkeit offen und gut dokumentiert sind.

Folgende Datenformate werden beim Arbeiten mit biologischen Datensätzen empfohlen:

  • CSV, TXT, JSON oder JSON-BON (für phylogenetische oder Sequenzdaten)
  • FASTA (für bioinformatische und biochemische Daten)
  • XML, CSV, TXT (für Datenbanken, Umwelt-/ ökologische Daten)

Bei der Entwicklung von Metadaten für ein Forschungsprojekt in den Biowissenschaften sollten sechs Fragen beantwortet werden (Wer? Wie? Wo? Wann? Was? Warum?). Die Metadaten sollten anschließend auch in einen kompatiblen Standard (z. B. EML, ABCD) konvertiert werden.

Datenübertragung

Die Weitergabe von Forschungsergebnissen ist heutzutage für viele Geldgebern unabdingbar. Viele Zeitschriften verlangen auch, dass die zugehörige Datensätze zum Zeitpunkt der Veröffentlichung eine Publikation verfügbar sind. Die Aufbereitung Ihrer Daten, um diese Anforderungen zu erfüllen, kann nicht nur für angehende Wissenschaftler, sondern auch für etablierte Gruppen ein entmutigender und zeitintensiver Prozess sein. Aus diesem Grund ist es wichtig, verfügbare Tools wie webbasierte, grafische Oberflächen und andere Tools zu verwenden, mit denen Forscher Daten für die Übermittlung einfach beschreiben und vorbereiten können. Hier sind ein paar Beispiel aus den GFBio , und Galaxy Projekten.

Beim Teilen von Daten ist es sehr wichtig, den Datenerstellern Anerkennung zu zollen und sicherzustellen, dass Ihre Forschungsergebnisse korrekt zugeordnet, zitiert und recherchiert sind.