Blog of #DieDatenlaube
Die Gartenlaube, von 1853 bis 1937 erschienen, ist das erste erfolgreiche deutschsprachige illustrierte Massenblatt. Seit 2008 werden die Jahrgänge bis einschließlich 1899 von einer offenen Community des deutschsprachigen Portals Wikisource im Volltext transkribiert, illustriert und nach Artikeleinheiten zusammengefasst. Die Scans der Zeitschrift und die freigestellten Illustrationen sind zentral in Wikimedia Commons gespeichert. Seit 2019 erfolgt eine vollumfängliche bibliographische Erschließung all dieser Texte und Bilder mit Wikidata und da seit 2020 mit dem Projekt „Structured Data on Commons” auch die Erschließung der Mediendateien auf Commons mittels Wikidata-Entitäten möglich ist, werden die Illustrationen zunehmend auch dort bibliographisch verlinkt und inhaltlich beschrieben. Darüber hinaus bildet der vorliegende Quellenkorpus die Grundlagen von zahlreichen Referenzen in den Wikipedias oder schlicht an jeder anderen Stelle, an denen digitales Wissen verlinkt und belegt kommuniziert wird. Wiewohl der Zugriff auf Inhalte aus dem sogenannten Wiki*Versum in der alltäglichen Internetnutzung völlig selbstverständlich ist, und diese für unterschiedliche Anwendungen (Stichwort ‘KI’) eine wesentliche Datengrundlage bilden, gilt es in akademischen Kontexten vielfach noch als experimentell, Daten und Quellenmaterial aus Digitalisierungsprojekten oder neue Forschung in diesem Umfeld zu positionieren bzw. die offenen Werkzeuge zur Methodenentwicklung oder als Forschungsgegenstände zu benutzen.
Der „Gartenlaube”-Datensatz ist in einem weiteren Sinne bereits publiziert, da er unter den offenen und freien Prinzipien des Wiki*Versums erstellt wurde und laufend erweitert und gepflegt wird. Mit dem Knowledge-Graph Wikidata und der MediaWiki-API bestehen offene und gut dokumentierte Schnittstellen, um die Datensätze auch maschinell auszuwerten, abzufragen und zu visualisieren. Da Die Gartenlaube, bzw. das Projekt Die Datenlaube, durch die Verzahnung mehrerer Projektportale im Wiki*Versum (Commons, Wikisource, Wikidata, Wikipedia) dispers verteilt ist, aber prototypisch für das Potential dieses „ecosystems” angesehen werden kann und umgekehrt selbst wiederum nur Teile der Möglichkeiten beispielsweise der Datenbeschreibung und Erfassung in Wikidata nutzt, ist es umso spannender, im Rahmen eines *data papers *die im Projekt auftretende Datenqualität, -struktur und -verteilungen aggregierend zu beschreiben und gleichzeitig mittels reproduzierbarer Analyseskripten die Möglichkeit zu schaffen, andere Teil-Datenbestände des Wiki*Versums näher zu untersuchen und zu nutzen. Gleichzeitig soll die umfassende Beschreibung eines derartig profunden Datensatzes eine Anregung sein und auch als Handreichung dienen, welche Daten nötig sind bzw. wie Daten strukturiert werden müssen oder können, um Projekte und Datensätze im Wiki*Versum zu veröffentlichen. Denn gerade unter dem Gesichtspunkt der FAIR-Prinzipien, ist das Wiki*Versum, mit der Offenheit im Editieren, mit den klar definierten Creative Commons-Lizenzen und auch den technischen Möglichkeiten die Daten an anderen Stellen zu integrieren oder zu nutzen ein idealer Ort.
Christian Erlinger (0000-0001-7872-9617, Scholia: Q67173261) Stadt Wien Büchereien.
Jens Bemme (0000-0001-6860-0924, Scholia: Q56880673) SLUB Dresden.
Veröffentlicht und eingereicht: 11.02.2021 Q105450860