Orientwissenschaften

Recherche

Forschungsdaten in den Orientwissenschaften sind nach wie vor stark textbasiert. Es gibt eine Reihe von Plattformen mit relevanten Daten, bislang jedoch kein dediziertes Repositorium für islamwissenschaftliche Forschungsdaten.

  • TextGrid Repository – textbasiertes Repositorium mit Forschungsdaten. Noch geringer Anteil orientwissenschaftlicher Daten.
  • DARIAH-DE – enthät Sammlungen verschiedener Bibliotheken und Kompetenzzentren mit Forschungsdaten verschiedener Felder der Geistes- und Kulturwissenschaften.
  • CLARIN Virtual Language Observatory – sammelt linguistische Ressourcen unterschiedlicher Art und Sprachen. Die Suche ist über Suchbegriffe oder Browsing möglich.
  • European Language Resources Association (ELRA) – ein Katalog zur Suche nach Sprachressourcen.
  • META-SHARE – eine Metasuche verschiedener Server für Sprachressourcen.
  • DataCite – eine Metasuche für Forschungsdaten aller Fächer und Sprachen in verschiedenster Form.
  • Zenodo – freies Repositorium für Open Access-Daten, das auch verschiedentlich Forschungsdaten enthält.

Daten sammeln und strukturieren

Die Orientwissenschaften umfassen linguistische, historische, politikwissenschaftliche, anthropologische und kunsthistorische Daten und sehr heterogenen Formaten und Typen. Je nach verwendeten Mitteln variieren die Datentypen. Umso wichtiger ist eine sorgfältige Organisation und Dokumentation dieser Daten, um eine spätere Nachnutzung zu vereinfachen.

Veröffentlichungen

Für die Verwaltung der Daten eignen sich beispielsweise die Möglichkeiten moderner Literaturverwaltungssoftware. Diese ermöglicht die Strukturierung und Ordnung von Datensätzen, einschließlich kooperativer Arbeit. Die ULB bietet Schulungen und Tutorials für eine Reihe von Referenzverwaltungssoftware an.

Daten

  • Verwenden Sie logische Strukturen und nachvollziehbare Dateinamenskonventionen. Ihre Daten sollen für andere nachvollziehbar geordnet sein.
  • Verwenden Sie Versionierung, um ältere Versionen Ihrer Daten eindeutig zu identifizieren. Dies ist nicht nur zeitsparend, sondern fördert auch die Überprüfbarkeit und Reproduzierbarkeit ihrer Daten.
  • Verwenden Sie keine Sonderzeichen und Leerzeichen beim Benennen der Daten. Nutzen Sie stattdessen den Unterstrich _.

Rechtliche, ethische und datenschutzrechtliche Aspekte

Orientwissenschaftliche Daten unterscheiden sich zwischen zeitgenössischer und historischer, zwischen qualitativer und quantitativer Forschung. Aus diesem Grund gibt es verschiedene Aspekte, die berücksichtigt werden müssen:
In historischer Forschung ist die Situation häufig am einfachsten, da auf Primärquellen in der Regel kein Urheberrecht mehr besteht und für Sekundärquellen die regulären Zitationsrichtlinien gelten.
Zeitgenössische Forschung umfasst häufig den Umgang mit personenbezogenen Daten, für die Richtlinien und Gesetzgebungen der Herkunftsländer sowie Sorgfalt im Hinblick auf politische Besonderheiten zu beachten sind. Hier gilt eine besondere Pflicht zur Beachtung ethischer und rechtlicher Gegebenheiten.
Qualitative und quantitative Forschung erfordert eine eingehende Pseudonymisierung oder Anonymisierung der Daten. Diese sollte so früh wie möglich vorbereitet und dokumentiert werden, um eventuelle Fragen frühzeitig klären zu können und Probleme zu adressieren.

Wenn personenbezogene Daten anfallen, muss besonderes Augenmerk auf Themen wie Einverständniserklärungen und das Löschen bestehender oder resultierender Urheberrechte oder geistiger Eigentumsrechte (IPRs) gelegt werden.

Bei der Ausarbeitung von Einverständniserklärungen sollte genau angegeben werden, wie und zu welchen Zwecken die Daten erfasst werden und was mit den Daten während eines Projekts geschehen wird, einschließlich etwaiger Pläne für eine künftige Weitergabe. Wenn das Einverständnisformular geschickt geschrieben wird, ist es möglich, die Verwendung der Daten für zukünftige Analyse- und Forschungsfragen zu sichern. Weitere Informationen zu Einverständniserklärungen und Vorlagen finden Sie hier.

Wenn Sie mit vorhandenen Datensätzen (Volkszählungsdaten, Kohortendatensätzen) oder speziellen Datenerfassungsinstrumenten (Fragebögen, Tests) arbeiten, müssen Sie zunächst alle mit diesen Ressourcen verbundenen Urheberrechts- und geistigen Eigentumsrechte klären. Andernfalls können neu erstellte Datensätze möglicherweise nicht wiederverwendet werden, wenn diese mit urheberrechtlich geschützten Ressourcen erstellt wurden.

Die Einhaltung rechtlicher und ethischer Vorschriften kann zeitaufwändig sein und in einigen Fällen zusätzliche Projektressourcen erfordern. Es kann sich daher lohnen, sich von den Diensten der Universität beraten zu lassen, die bei bestimmten Themen helfen können:

Datenschutzberatung, Abfassung von Rechts- und Kooperationsverträgen und sonstigen Unterlagen –> Rechtsabteilung der MLU

Anleitung beim Schreiben von Einverständniserklärungen, Beratung zur methodischen Umsetzung von Datenembargobeschränkungen, Archivierung von Closed Access-Sammlungen, Online-Veröffentlichung von Datenressourcen –> Das Open Science Team der ULB.

Datenformate und Metadaten

Die ULB bietet eine Liste der akzeptierten und bevorzugten Datenformate, mit denen die Lesbarkeit der Daten in Zukunft maximiert werden kann. Die Liste wird regelmäßig aktualisiert, um sicherzustellen, dass die gegebenen Ratschläge korrekt bleiben. Weitere nützliche Links und Ratschläge zur Auswahl der richtigen Datenformate für die Langzeitarchivierung finden Sie hier:

Die Bereitstellung guter Metadaten ist entscheidend, um Ihre Daten verständlich zu machen und ihre Verwendbarkeit sicherzustellen. Die Data Documentation Initiative (DDI) bietet einen geeigneten Standard für die Beschreibung sozialwissenschaftlicher Daten. Mit dem neuesten DDI-Standard können andere Informationen über den gesamten Forschungsdatenzyklus eines bestimmten Projekts oder einer Studie bereitgestellt werden – von der Konzeption und Planung über die Datenerfassung, -aufbereitung und -analyse bis hin zur Archivierung. Im Bereich der aggregierten statistischen Daten ist der SDMX-Standard ebenfalls weit verbreitet und anerkannt. Um Ihre Dokumentation weiter zu bereichern und interoperabel zu machen, können Sie einige der frei verfügbaren Dokumentationstools oder Konverter verwenden.

Die ULB bietet den Mitarbeitern der MLU Unterstützung bei der Erstellung von Dokumentationen und Beratung zur Verwendung einer Reihe von Metadatenstandards wie DC, METS / MODS und DDI sowie TEI. Kontaktieren Sie uns, wenn Sie Fragen haben.

Im Allgemeinen sollten beim Erstellen von Metadaten und Schreiben von Dokumentation Informationen zu den folgenden Themen enthalten sein:

  • Der Kontext Ihrer Datenerfassung, einschließlich wichtiger administrativer Bemerkungen
  • Die Struktur des Datensatzes, einschließlich der Beziehungen zwischen Datendateien und anderen Dokumenten
  • Art der durchgeführten Validierung, Reinigung und Qualitätssicherung
  • Zugangsbedingungen
  • Spezifische Vereinbarungen zur Wiederverwendbarkeit und Weiterverwendung der Ressourcen
  • Zitieren und Anerkennen von Aussagen 

Datenübertragung

Bei der Aufbereitung sozialwissenschaftlicher Daten zur Weiterverwendung durch andere sollten eine Reihe von Aspekten berücksichtigt werden:

  • Bitten Sie um frühzeitige Genehmigung, um Ihre Daten von befragten Teilnehmern wiederzuverwenden und weiterzugeben
  • Es sollte genügend Zeit eingeplant werden, um Studien- / projektspezifische Einwilligungsformulare zu erstellen
  • Die Anonymisierung der Datensätze sollte unter Berücksichtigung der Vereinbarungen in den Einverständniserklärungen erfolgen und von Personen mit guten Datenmanagementfähigkeiten und Erfahrung mit Qualitätskontrollprozessen überwacht werden
  • Daten sollten über sichere Datenübertragungsmethoden verfügbar gemacht werden
  • Zusammen mit den Datensätzen sollte eine unterstützende Dokumentation zur Verfügung gestellt werden.
  • Eine Datennutzervereinbarung und Lizenzierung sollten verwendet werden, um sicherzustellen, dass keine Versuche unternommen werden, Testteilnehmer erneut zu identifizieren oder zu kontaktieren, dass die Datenersteller anerkannt und korrekt zitiert werden und dass die genehmigten Bedingungen, unter denen der Datensatz verwendet werden kann, klar umrissen werden.