Become a Creator today!Start creating today - Share your story with the world!
Start for free
00:00:00
00:00:01
Avatar
496 Plays2 years ago

In dieser Folge spricht Jacqueline Klusik-Eckert mit Angela Kailus M.A. und Julia Rössel M.A. über die Rolle von Normdaten in der kunsthistorischen Forschung und Praxis. Der Ursprung von Normdaten hängt mit einem bibliothekarischen Systematisierungsbestrebungen in den 1970er Jahren zusammen. Wie hat sich der Umgang und die Konzepte von Normdaten im Zuge der Digitalisierung verändert? Mit einem Blick hinter die Kulissen der Gemeinsamen Normdatei (kurz GND) werden die Zusammenhänge von Identifikationsnummer und den dahinterliegenden Informationen erklärt. Welchen Mehrwert für die eigenen Daten erzielt man durch die Verwendung von Normdaten? Für welche Begriffe bzw. Entitäten gibt es Normdaten? Wo findet man sie? Woher kommt dieses Wissen und wie muss man mit dem Normdatensatz umgehen? Wir sprechen auch über den Unterschied eines institutionell gepflegten und autorisierten Normdatensatzes (GND über die Deutsche Nationalbibliothek) im Vergleich zu crowd-based Normdatensätzen (Wikidata).

Darüber hinaus stellt sich die Frage, inwieweit die Verwendung von Normdaten bereits Einzug in das Fach Kunstgeschichte gehalten hat.

Wir beleuchten die Herausforderung für sammelnde Institutionen bei der Erfassung von Objekten und der Anreicherung der Sammlungsdaten mit Normdaten. Welche Standards helfen bei der Erfassung und wofür soll man den Aufwand mit Normdaten überhaupt betreiben?

Dabei nehmen wir unterschiedliche Szenarien im Datenlebenszyklus unter die Lupe.

Wo begegnen wir als Forscher*innen diesen Daten, wie können wir sie nachnutzen und welche Verantwortung haben wir selbst als Produzent*innen von Forschungsdaten, wenn es um die Anreicherung der eigenen Daten mit Normdaten geht?

Angela Kailus M.A. ist stellvertretende Leiterin des Deutschen Dokumentationszentrums für Kunstgeschichte – Bildarchiv Foto Marburg, Philipps-Universität Marburg und Ansprechperson bei NFDI4Culture im Arbeitsbereich Standardisierung und Datenqualität.

Julia Rössel M.A. ist Kunsthistorikerin und Mitarbeiterin an der Deutschen Digitalen Bibliothek, Fachstelle Denkmalpflege, DDK, Marburg . Neben ihrer Promotion über „Wechsel der Mediensysteme – Graphische Sammlung und ihre digitale Übersetzung“ hat sie sich in den Bereichen Digitalisierung und Museum, Datenqualität und Standards spezialisiert.

Begleitmaterial zu den Folgen findest du auf der Homepage unter https://www.arthistoricum.net/themen/podcasts/arthistocast

Alle Folgen des Podcasts werden bei heidICON mit Metadaten und persistentem Identifier gespeichert. Die Folgen haben die Creative-Commons-Lizenz CC BY 4.0 und können heruntergeladen werden. Du findest sie unter

https://doi.org/10.11588/heidicon/1738702 

Bei Fragen, Anregungen, Kritik und gerne auch Lob kannst du gerne per Mail an uns schicken unter

podcast@digitale-kunstgeschichte.de

Recommended
Transcript

Einleitung und Fokus des Podcasts

00:00:07
Speaker
Artistocast, der Podcast zur digitalen Kunstgeschichte.
00:00:16
Speaker
Normdaten

Einführung in Normdaten

00:00:17
Speaker
sollen verwendet werden.
00:00:18
Speaker
Doch ist häufig unklar, was man darunter versteht.
00:00:22
Speaker
Man verwechselt sie auch manchmal mit Datenmodellen oder anderen Konzepten.
00:00:26
Speaker
Für wen sind Normdaten denn eigentlich da?
00:00:30
Speaker
Was hat das mit dem englischen Begriff Authority Files zu tun?
00:00:34
Speaker
Und wann ist die Verwendung sinnvoll?
00:00:37
Speaker
Es gibt so

Experteninterviews: Angela Kajus und Julia Rössel

00:00:38
Speaker
viele Fragen, auch welche man verwenden soll und warum man sich überhaupt die ganze Arbeit machen soll bei der Datenerfassung.
00:00:45
Speaker
Welchen Mehrwert generieren sie eigentlich, wenn wir Daten erfassen?
00:00:49
Speaker
Und was wissen wir eigentlich über die Qualität von Normdaten?
00:00:53
Speaker
Über das Thema Normdaten in der Kunstgeschichte habe ich mit zwei Spezialistinnen gesprochen, die aus unterschiedlicher Perspektive auf das Thema schauen.
00:01:02
Speaker
Angela Kajus ist stellvertretende Direktorin des Deutschen Dokumentationszentrum für Kunstgeschichte Bildarchiv Foto Marburg an der Philips Universität Marburg.
00:01:13
Speaker
Sie schöpft aus einem reichen Erfahrungsschatz im Zusammenhang mit dem Kuratieren des Bildindexs.
00:01:19
Speaker
Mit ihrem wissenden Blick hinter die Kulissen weiß sie, wie es um die Sammlungsdaten von Museen, Bibliotheken und Forschungsinstitutionen bestellt ist und wie sich die Akzeptanz von Normdaten in den letzten Jahren in der Fachcommunity geändert haben.
00:01:32
Speaker
Im Rahmen von NFDI for Culture ist sie im Arbeitsbereich Standardisierung und Datenqualität angesiedelt.
00:01:39
Speaker
Über den Zusammenhang von Erfassungsstandards und Datenqualität spreche ich auch mit Julia Rössel.
00:01:46
Speaker
Als Projektkoordinatorin

Was sind Normdaten? (Frage)

00:01:47
Speaker
von CONDA, kurz für Kontinuierliches Qualitätsmanagement dynamischer Forschungsdaten unter Anwendung von LIDU, hat sie sich als Wissenschaftlerin mit den Schwerpunkten Digitalisierung und Museen, Sammlungen, Datenqualität und Standards etabliert.
00:02:03
Speaker
Sie kann einen Einblick in die Prozesse der Datenerfassung von sammelnden Institutionen geben.
00:02:14
Speaker
Hallo Angela, schön, dass du da bist.
00:02:16
Speaker
Nun, wenn wir dich schon hier haben als Spezialistin, fangen wir doch mal mit der Begriffsschärfung an.
00:02:21
Speaker
Was sind Normdaten überhaupt?
00:02:24
Speaker
Eigentlich sind Normdaten eine bestimmte Form des kontrollierten Vokabulars.
00:02:29
Speaker
Sie dienen dem Beschreiben bestimmter Entitäten.
00:02:32
Speaker
Das heißt, Entitäten sind eindeutig zu bestimmende Objekte oder Dinge.
00:02:37
Speaker
Also es gibt vor allem Normdaten für die Bereiche Personen, Körperschaften, Geografika, also Ortsbegriffe, Werke, Konferenzen, aber auch so etwas wie Sachschlagworte, also Allgemeinbegriffe, die auch abstrakter sein können.
00:02:54
Speaker
Normdaten dienen immer der Identifikation und Verknüpfbarkeit dieser Entitäten.
00:03:00
Speaker
Das heißt, sie sind wie kleine Personalausweise für diese Entitäten.
00:03:05
Speaker
Sie dienen auch dazu, dass man gleichnamige Entitäten auseinanderhalten kann, dass man zum Beispiel Orte, die Neustadt heißen, voneinander unterscheiden kann und sich dazu aber nicht vermitteln.
00:03:17
Speaker
zunächst mal darauf einigen muss, wie ich dann dieses Neustart vielleicht hinten noch erweitere im Namen, sondern ich gebe sozusagen der Entität eine Art von Personalausweisnummer und kann sie daran zitieren,
00:03:31
Speaker
Und vor allem eine Maschine kann sie daran auch gut erkennen.
00:03:35
Speaker
Das heißt, anstatt

Die Entwicklung von Normdaten

00:03:36
Speaker
in meinen Daten jetzt irgendwie Neustadt an der Eich, Neustadt an der Donau und so weiter zu schreiben, füge ich die Nummer mit ein und der Computer kann dann identifizieren, um welches Neustadt es sich genau handelt.
00:03:48
Speaker
Und genauso dann bei Personen.
00:03:50
Speaker
Genau.
00:03:50
Speaker
Und auch gerade Neustadt an der Eich.
00:03:52
Speaker
Der eine sagt Neustadt an der Eich, der andere sagt Neustadt a.d.eich.
00:03:58
Speaker
Der Nächste sagt vielleicht nur Neustadt, weil er wohnt ja in Neustadt.
00:04:01
Speaker
Da ist es für ihn sowieso selbstverständlich, dass es das Neustadt ist.
00:04:05
Speaker
Also all diese Verhandlungsthemen würden abgeschnitten dadurch, dass man einfach die Nummer benutzt.
00:04:13
Speaker
Und wer entscheidet das eigentlich?
00:04:15
Speaker
Also seit wann wird das denn gemacht?
00:04:17
Speaker
Ab wann hält man das denn für sinnvoll, diese Identifikationsnummern zu benutzen?
00:04:23
Speaker
Das hat sich so langsam entwickelt, denn ursprünglich wurden Normdaten in den Bibliotheken entwickelt.
00:04:29
Speaker
Sie dienten vor allem dazu eine sogenannte Vorzugsbezeichnung für all die Entitäten, die vor allem bei der Titelerschließung von Bibliotheksbeständen benutzt wurden.
00:04:41
Speaker
Also am Anfang waren diese Normdaten Hilfen, um sozusagen den Vorzugsnamen zu finden und die Vorzugsbezeichnungen für bestimmte Dinge, also zum Beispiel für Verlagsorte oder für Autorennamen und dergleichen.
00:04:56
Speaker
Also waren sie am Anfang nur Konkordanzen zwischen Vorzugsbezeichnungen und Synonymen, also Alternativbezeichnungen.
00:05:05
Speaker
Und das begann bereits in den 70er Jahren, vor allem im Bibliotheksbereich.
00:05:10
Speaker
Es hat sich auch sozusagen
00:05:12
Speaker
jeder geografische Bibliotheksbereich auf der Welt selber auf die Socken gemacht, weil damals die Vernetzung noch nicht so groß war.
00:05:19
Speaker
Und ganz konkret hier unsere Deutsche Nationalbibliothek, die hier im deutschen Sprachraum ja federführend ist, begann damit ab 1974.
00:05:27
Speaker
Und

Bedeutung von Persistent Identifiers

00:05:32
Speaker
das war natürlich damals alles noch für Karteikartensortierungen gedacht, bei denen es sehr, sehr wichtig war, dass man die Dinge ausführt,
00:05:41
Speaker
sozusagen nach einem bestimmten Regelsystem ordnet und dann man es auf den Karteikarten wieder findet, also in linearen Systemen.
00:05:49
Speaker
Dann aber hat sich daraus langsam dann im Grunde so wie Linked Open Data oder Linked Data als Konzept immer wichtiger wurde, daraus entwickelt, dass man diese Normdaten auch verwenden kann, um tatsächlich diese Entitäten zu identifizieren.
00:06:09
Speaker
Und dann wird sozusagen in dem Kontext, dass Maschineninterpretierbarkeit immer wichtiger, wird eben auch diese ID immer wichtiger, die sozusagen jetzt wie eine Personalausweisnummer für die Entität wirkt.
00:06:24
Speaker
Das heißt, man hatte schon vorher ein strukturierendes, funktionierendes System von solchen Identifikationsnummern und hat das dann übertragen auf Datenverwaltung.
00:06:36
Speaker
Ja, und es begann auch damit, dass natürlich die Bibliotheken selber auch nicht mehr zufrieden waren, nur mit dieser Namenskonkordanz, sondern sie haben dann auch ab den 80er Jahren angefangen, tatsächlich zum Beispiel für ihre Autorennamendatensätze zu entwickeln, die individuelle Autoren meinten.
00:06:55
Speaker
Und das sind dann natürlich, die kann man heute immer noch in der GND finden, das sind die ersten Autoren,
00:07:02
Speaker
ersten qualifizierten Datensets, die an dieser Stelle dann auch natürlich weiter genutzt werden konnten.
00:07:09
Speaker
Außerdem haben die Bibliotheken schon sehr früh angefangen, Persistent Identifier für diese Normdatenentitäten zu verwenden.
00:07:17
Speaker
Denn das ist ja auch wichtig, dass sozusagen die Personalausweisnummer der Entität immer gleich bleibt.
00:07:23
Speaker
Und dass sie jetzt eben, da wir alle diese Dinge im Internet wiederfinden wollen, der Persistent Identifier eingebettet wird in einen Uniform Resource Identifier, also ein URI.
00:07:36
Speaker
Das heißt, man

Normdaten in der akademischen Forschung

00:07:37
Speaker
hat einmal diese Uri, um Dinge überhaupt im Internet wiederzufinden.
00:07:41
Speaker
Und das ist verknüpft mit einer persistenten Nummer, also auch dem Versprechen der Institution, die diese Nummer vergibt, dass sie für, ich sage jetzt mal in Anführungszeichen, immer auf diese Information verweist.
00:07:57
Speaker
Ja, genau.
00:07:58
Speaker
Und natürlich ist so etwas wie die GND auch ein lebendiges System.
00:08:02
Speaker
Das heißt, es passiert auch in der GND immer wieder, dass sie zum Beispiel zwei Personendatensätze zu ein und derselben Person haben.
00:08:11
Speaker
Und wenn das entdeckt wird, bleibt ein Identifier bestehen, der andere wird umgeleitet auf den, der bestehen bleibt.
00:08:17
Speaker
Also man hat sozusagen im Hintergrund ein Umleitungssystem,
00:08:22
Speaker
das an dieser Stelle dafür sorgt, dass auch Uris, die eigentlich nicht mehr gelten können, trotzdem noch funktional bleiben.
00:08:29
Speaker
Also für den Fall, dass man, ich denke jetzt mal an so kunsthistorische Forschung, man hat alle Werke einem Künstler zugeschrieben und irgendwann findet man heraus, die Hälfte der Werke gehört aber seiner Tochter, weil die eigentlich die Urheberin war.
00:08:43
Speaker
Und dann gibt es dann auf einmal eine neue Personalnummer für eine Person und die kann man dann einsetzen.
00:08:51
Speaker
Ja, hier haben wir ja zwei verschiedene Personen, die im Spiel sind.
00:08:54
Speaker
Wir haben einmal den Vater, den Künstler und dann die Tochter.
00:08:59
Speaker
Beide bekommen einen Personendatensatz und man müsste im Grunde in seiner Objektbeschreibung dann natürlich die einen Sachen abschreiben, also das heißt dem Vater nicht mehr zuschreiben, dafür aber der Tochter, die aber dann natürlich einen eigenen Personendatensatz hat.
00:09:15
Speaker
Bevor wir weiter ins Detail gehen, lass uns doch erst nochmal generell, also es leuchtet mir komplett ein, dass man sagt, man möchte solche Identifikationsnummern haben, also IDs.
00:09:26
Speaker
Es sorgt für eine Eindeutigkeit bei Orten, bei Namen, bei allen möglichen Kategorien, macht das auf jeden Fall Sinn.
00:09:34
Speaker
Sind das denn die einzigen Stärken von Normdaten, also diese Eindeutigkeit?
00:09:39
Speaker
Ja.
00:09:41
Speaker
Sie ist wirklich eine der Hauptstärken, nämlich weil sie dadurch durch eine hinterlegte Ontologie dann für die Maschinenkontexte diese Entitäten identifizierbar macht.
00:09:53
Speaker
Also eine ID ist ja erstmal eine Zeichenfolge, die nichts bedeutet.
00:09:59
Speaker
Da sie aber auf eine Entität zielt, die meinetwegen eine Person meint,
00:10:04
Speaker
kann die Maschine durch die hinterlegte Ontologie feststellen, dass es sich hier um Personen handelt.
00:10:09
Speaker
Und das ist natürlich eine ganz wichtige Eintrittskarte für semantische Anwendungen, für Link-Data-Anwendungen,
00:10:16
Speaker
ohne die man wahrscheinlich heutzutage im Internet überhaupt nichts mehr wiederfinden würde.
00:10:21
Speaker
Also da kann ich das so verstehen.

Linked Data und ihre Bedeutung

00:10:23
Speaker
Wenn man so eine Datentabelle hat, heißt das nun, dass da nicht nur in den Feldern irgendwelche Zeichenketten drin liegen, sondern dass durch die Anreicherung von Normdaten diese Zeichenketten mit Bedeutung versehen wurden?
00:10:38
Speaker
Ja, genau.
00:10:38
Speaker
Das möchte man genau erreichen.
00:10:40
Speaker
Das ist der Mehrwert.
00:10:42
Speaker
Denn das Ganze geht ja zurück auf die Idee zu Linked Data, die Tim Berners-Lee schon 2006 hatte und die er sehr lapidar formuliert hat.
00:10:52
Speaker
Er hat nämlich gesagt, verwendet Uniform Resource Identifier für Dinge.
00:10:58
Speaker
nicht nur für Daten, sondern für Dinge, also für digitale Objekte natürlich auch, aber für physische und konzeptuelle Entitäten, also für Personen, für Körperschaften, für Geografika, für Werke, für Sachbegriffe.
00:11:11
Speaker
Diese Dinge bekommen eine eindeutige Nummer und ich brauche zudem dann noch sozusagen ein Gerüst im Hintergrund, ein Wissensorganisationssystem, eine Ontologie,
00:11:21
Speaker
die dann wiederum für die Maschinenanwendbarkeit mitteilt, was das bedeutet.
00:11:27
Speaker
Also das heißt, die Nummer alleine reicht auch nicht, sondern ich muss sozusagen dahinter ein Ordnungssystem setzen, das dann sagt, dass diese Klasse der Personen hier gemeint ist.
00:11:37
Speaker
Also so funktioniert das dann.
00:11:39
Speaker
Ja, und dann kann man sozusagen mit diesem eigentlich recht simplen Trick, die Entitäten zu identifizieren über die Nummer, sozusagen diese Art von Bedeutung auch in die Maschinenanwendung hineintragen.
00:11:54
Speaker
Und benutzen das auch alle?
00:11:55
Speaker
Also ist das zu einem Standard bei der Datenerfassung geworden?
00:12:00
Speaker
Es wird immer wichtiger.
00:12:02
Speaker
Also das heißt, Standards sind ja nicht nur Regelwerke, die irgendjemand in die Welt setzt, sondern Standards leben dadurch, dass sie angewendet werden.
00:12:11
Speaker
Und diese Art von semantischen Anwendungen wird eigentlich immer wichtiger.
00:12:19
Speaker
Und sie sind im Grunde auch der Schlüssel, wie man bei der stetig steigenden Zahl digitaler Publikationen überhaupt noch etwas wiederfinden kann.
00:12:28
Speaker
Denn wir haben ja im Grunde seit Jahrzehnten die Situation, dass immer mehr Dinge digital publiziert werden und nicht auffindbar sind, weil sie in sehr verschiedenen Repositorien sind oder in sehr verschiedenen Darbietungsformen im Internet.
00:12:45
Speaker
Und dort ist eben diese Strategie, Dinge zu semantisieren,
00:12:50
Speaker
wird als großer Ausweg gesehen, weil man dadurch eben Dinge adressieren und wiederfinden kann.
00:12:56
Speaker
Und

Normdaten versus traditionelle Forschungsdaten

00:12:57
Speaker
sie den sozusagen für die Hauptfragen, die die Nutzer und Nutzerinnen haben, nämlich wer hat es gemacht, was ist es, wann ist es gemacht worden?
00:13:06
Speaker
Wie ist es gemacht worden?
00:13:07
Speaker
Also das sind im kunsthistorischen Kontext die Hauptfragen.
00:13:12
Speaker
Dafür wird es dann aufschließbar.
00:13:14
Speaker
Und deshalb muss man sich immer vorstellen, dass im Grunde diese semantisch auswertbare Schicht, die maschinenauswertbar ist, als strukturierte Datenschicht über den eigentlichen Forschungsdaten liegen sollte.
00:13:27
Speaker
Die eigentlichen Forschungsdaten können nach wie vor im Freitext oder in welchem Format auch immer hergestellt werden.
00:13:34
Speaker
Das ist eben auch sozusagen das primäre Ausdrucksmedium von Kunsthistorikerinnen und Kunsthistorikern und das soll es auch bleiben, da es ja darum geht, über historische Informationen zu referieren und diese auch dann diskursiv beschreiben zu können.
00:13:53
Speaker
Die strukturierte Datenschicht ersetzt dieses keinesfalls, sondern sorgt dafür, dass diese Dinge besser auffindbar werden.
00:14:00
Speaker
Und zusammengebracht werden können, damit man tatsächlich Dinge, die man noch nicht kannte, entdecken kann im Netz.
00:14:06
Speaker
Also es geht jetzt nicht darum, alles, was ich erforscht habe, irgendwie in diese Normdatenstruktur zu pressen, sondern eher es als Gerüst zu verstehen, das parallel läuft, was man sonst noch so alles erfasst haben möchte.
00:14:19
Speaker
Also ich stelle mir das gerade bildlich vor wie ein Buch und an den Seiten habe ich Post-its reingeklebt mit unterschiedlichen Farben, also mir so eine Systematik erstellt, um die Stellen wiederzufinden, um dann tiefer einsteigen zu können, um mir einen systematischen Zugang zu einem komplexen Inhalt in dem Buch zu verschaffen.
00:14:40
Speaker
Ja, genau.
00:14:41
Speaker
Das ist ein wirklich sehr gutes Bild für diese Dinge.
00:14:46
Speaker
Sie erwarten ja auch nicht, dass auf dem Post jetzt bereits der ganze wissenschaftliche Content steht, den Sie mitteilen möchten, sondern dort, das sind Hinweise, das sind Wegemarken, Hinweise, die man hineinsetzt in die Daten oder die im Grunde eine
00:15:03
Speaker
Sachverschlagwortung der Daten darstellen.
00:15:06
Speaker
Und welche Normdaten sind denn für die kunsthistorische Forschung im Moment besonders wichtig?
00:15:10
Speaker
Also welche sollte man kennen, um die eigenen Forschungsdaten anzureichen?
00:15:16
Speaker
Dort ist in erster Linie natürlich die GND zu nennen, denn die bietet einen sehr großen Fundus an den Entitäten, die für
00:15:25
Speaker
unser Fach wichtig sind, nämlich Personen, Körperschaften, Geografika, auch die Werke selbst inklusive der Bauwerke, Konferenzen und solche Dinge und natürlich auch die allgemeinen Schlagworte.
00:15:36
Speaker
Sie ist deshalb besonders wichtig, weil es eben die erste Referenz unter den deutschsprachigen Normdateien ist.
00:15:44
Speaker
Dann gibt es ebenfalls hochgeschätzt der Art in Architecture Thesaurus von Getty.
00:15:51
Speaker
der ein nach Isonormen durchgepflegtes Sachvokabular eben zu Objektbezeichnungen, zu Klassifikationsbegriffen, zu Material und Technik, zu Stil- und Epochenangaben bietet.
00:16:06
Speaker
Also das ist inhaltlich sozusagen deutlich besser als das, was in der GND ist, aber es ist leider zum großen Teil bisher nur auf Englisch und auch in verschiedenen anderen Sprachen, aber Deutsch ist leider nur mit 8000 Begriffen vorhanden.
00:16:21
Speaker
während es insgesamt etwa 74.000 gibt.
00:16:24
Speaker
Aber trotzdem, trotz dieser Sprachbarriere, wird es zum Beispiel in Museen und anderen Sammlungen doch durchaus viel verwendet.
00:16:31
Speaker
Und das Gleiche gilt auch für Icon Class, was meiner Meinung nach nach wie vor die Referenz erster Wahl für das Verschlagworten von Bildinhalten ist.
00:16:42
Speaker
Auch das liegt mehrsprachig vor.
00:16:45
Speaker
Es ist durchgängig auf Deutsch übersetzt.
00:16:47
Speaker
Und es ist natürlich eine Klassifikation und deshalb ein bisschen was anderes als Normdaten, aber er führt eigentlich den gleichen Zweck.
00:16:54
Speaker
Also das heißt, man kann vor allem Bildinhalte, die in der westlich-abendländischen Tradition stehen, die können Sie damit eigentlich sehr zielsicher und zielgenau verschlagworten und haben dann gleich die übergreifenden Kontexte sozusagen gleich mit im Kasten.
00:17:11
Speaker
Und

Die Rolle der GND in der akademischen Veröffentlichung

00:17:12
Speaker
das interessiert Kunsthistoriker ja auch immer.
00:17:14
Speaker
Was ist eigentlich dargestellt?
00:17:16
Speaker
Also das ist eine der Hauptfragen, die Kunsthistorikerinnen und Kunsthistoriker an Daten haben.
00:17:24
Speaker
Das heißt, ich muss mir auch immer überlegen, in welcher Sprache ich die Normdaten verknüpfen und auszeichnen möchte?
00:17:30
Speaker
Idealerweise nicht, muss man das nicht überlegen, denn sie brauchen ja nur den URI als Personalausweisnummer des jeweiligen Begriffs und können dann ein Normvokabular, das mehrsprachig vorliegt, natürlich auch potenziell in allen Sprachen hineinziehen, ihre Daten zu.
00:17:50
Speaker
Sie hätten also, wenn Sie zum Beispiel Ihre Daten mit Iconclass verschlagworten, die italienische Übersetzung gleich mit frei Haus, ohne dass Sie selber einen einzigen Brocken Italienisch können müssen oder dafür auch nur eine Minute Ressourcen Ihres eigenen Projektes aufwenden müssen.
00:18:07
Speaker
Ja, dann kann man sich ja dann die Übersetzung sparen, beziehungsweise macht sie gleichzeitig, wenn man die Forschungsergebnisse und die Forschungsdaten aufbereitet, mit.
00:18:17
Speaker
Also man publiziert zusätzlich international.
00:18:19
Speaker
Ja, genau.
00:18:21
Speaker
Jetzt hast du schon die GND genannt, die gemeinsame Normdatei kennen alle, die schon mal publiziert haben.
00:18:27
Speaker
Jeder, der ein Buch oder irgendwas Ähnliches veröffentlicht hat im deutschen Sprachraum, bekommt eine GND-ID, also so eine Personalausweisnummer.
00:18:36
Speaker
Was verbirgt sich denn hinter dieser ID?
00:18:38
Speaker
Du hast schon von einem Personendatensatz gesprochen, aber was kann ich mir denn darunter vorstellen?
00:18:43
Speaker
Also welche Informationen sind da hinterlegt und mit dieser Personalausweisnummer verknüpft?
00:18:51
Speaker
Damit sind eigentlich in erster Linie die Informationen verknüpft, die dazu dienen, diese Person zu identifizieren und auch referenzierbar zu machen.
00:19:01
Speaker
Das heißt, man möchte dort keine eingehende Biografie ablegen,
00:19:06
Speaker
die die GND vielleicht auch beinhalten könnte, aber das will sie eigentlich gar nicht, sondern man braucht nur die Merkmale, die die Person eindeutig identifizierbar machen.
00:19:15
Speaker
Deshalb reicht es zum Beispiel nicht aus, einen Nachnamen und Vornamen dort einzubringen, sondern sehr gut wäre, wenn man auch noch die Lebensdaten einer Person hätte und einen Beruf und vielleicht auch Länderzuordnungen, wo diejenige oder derjenige dann tätig war.
00:19:34
Speaker
Aber das ist es eigentlich auch schon.
00:19:37
Speaker
Und mehr braucht man nicht.
00:19:40
Speaker
Im Bereich der Literaturwissenschaften ist man auch noch immer sehr interessiert an den Beziehungen, die diese Person zu anderen Personen hatte, also Familien- und Verwandtschaftsverhältnisse oder auch wer mit wem in welchen literarischen Salons zusammengekommen ist.
00:19:55
Speaker
Aber das sind eigentlich schon zusätzliche Informationen, die auch wieder der Vernetzung dienen.
00:20:01
Speaker
Also das heißt, man könnte dann, wenn man nach Person 1 gesucht hat, hier Vorschläge bekommen, wo man Materialien zu Person 2 oder 3 oder 4 bekommt.
00:20:10
Speaker
die mit dieser Person 1 in Beziehung standen, auch noch entdecken kann.
00:20:14
Speaker
Das ist sozusagen für diese semantische Verlinkung von Datenquellen sehr wertvoll, aber es ist sozusagen ein zusätzlicher Zweck, den Normdaten erfüllen können.
00:20:26
Speaker
Die Informationen, die da stehen, also du hattest jetzt schon Lebensdaten gesagt, wirken wie abgeschlossen.
00:20:31
Speaker
Also

Qualitätskontrolle: GND vs. Wikidata

00:20:32
Speaker
gerade wenn wir es mit Werknormdaten zu tun haben, da steht so eine Kunstwerk, Masse, Größe, sowas dabei, manchmal auch Standorttitel.
00:20:40
Speaker
Das hat für mich immer so eine, wie soll ich sagen, so eine Autorität, wenn es von der GND kommt.
00:20:46
Speaker
Ist das immer abgeschlossenes Wissen?
00:20:48
Speaker
Also forscht da jemand nach und korrigiert die Sachen?
00:20:51
Speaker
Meine Frage zählt eher darauf ab, wie in Anführungszeichen autorisiert sind die Informationen denn, die mit so einem Personendatensatz oder Werknormdatensatz verbunden sind, die da drinstehen, dahinterstehen.
00:21:05
Speaker
Die Bibliotheken, die ja nach wie vor in erster Linie dafür zuständig sind, die GND zu erweitern und zu pflegen, versuchen natürlich wie alle wissenschaftlich seriösen Institutionen, dieses nach bestem Wissen und Gewissen zu machen.
00:21:20
Speaker
Sie haben dafür eine ganze Reihe von Nachschlagewerken, die konsultiert werden und
00:21:26
Speaker
die dann vor allem auch als Quelle belegt werden, vor allem für die Vorzugsbezeichnung, also für die Hauptansetzungsform der jeweiligen Entität.
00:21:35
Speaker
Und ansonsten ist es natürlich auch dort möglich, dass es Fehler gibt, dass es Lücken gibt, gerade weil die GND im Grunde schon auf eine sehr lange Geschichte zurückblicken kann.
00:21:46
Speaker
Das heißt, die Deutsche Nationalbibliothek musste an dieser Stelle viele Anstrengungen unternehmen,
00:21:51
Speaker
um die GND für diesen neuen Zweck im Semantic Web überhaupt tauglich zu machen.
00:21:57
Speaker
Und das hat sie in den letzten Jahren schon mit beeindruckenden Ergebnissen auch vorangetrieben.
00:22:03
Speaker
Aber nach wie vor ist es natürlich so, dass je mehr die GND genutzt wird, auch umso leichter auffallen kann, wenn es Fehler oder Lücken gibt.
00:22:13
Speaker
Und man kann für bestimmte Entitätenarten in der GND dieses auch bereits zurückmelden an eine Redaktion.
00:22:21
Speaker
Und die Deutsche Nationalbibliothek hat an dieser Stelle natürlich auch selber durchaus viel diskutiert, was an bestimmten Entitäten der GND noch verbessert werden könnte.
00:22:33
Speaker
Das betrifft eben insbesondere die Sachschlagworte, die im Grunde noch nicht homogen mit Oberbegriffssystemen durchzogen sind.
00:22:42
Speaker
Und die ja also doch auch sehr historisch gewachsen sind.
00:22:47
Speaker
Aber das wissen Sie eigentlich in der Deutschen Nationalbibliothek.
00:22:50
Speaker
Deshalb ist es eigentlich, nehmen Sie es pragmatisch für die Zwecke, die vorgesehen sind, eben Identifizierung und Referenzierung.
00:22:57
Speaker
Und sofern man dieses dadurch einlösen kann, ist eigentlich der Zweck des Normdatensatzes erfüllt.
00:23:05
Speaker
Und alles, was Sie sozusagen in Ihrer Forschung herausfinden über diese Entität, das gehört in Ihre Forschung.
00:23:12
Speaker
Und sie nehmen nur den GND-Datensatz, um diese auffindbar zu machen.
00:23:16
Speaker
Also man kann jetzt nicht verlangen, dass die GND, die jetzt die Normdaten bereitstellt, auch noch die dahinterliegenden Daten auf lexikalischem Niveau aufbereitet.
00:23:28
Speaker
Man muss bei den Informationen, die dahinter liegen, vorsichtig sein.
00:23:31
Speaker
Aber natürlich sollten es keine falschen Dinge drinstehen.
00:23:35
Speaker
Also falsche Geburtsdaten oder falsche Tätigkeitsorte und sowas.
00:23:42
Speaker
Das verwirrt,

Herausforderungen und strategische Bedeutung von Normdaten

00:23:43
Speaker
das greift die Autorität der Normdatei an und deshalb muss es natürlich korrigiert werden.
00:23:49
Speaker
Wir haben ja jetzt mit der Deutschen Nationalbibliothek eine Institution, die diesen Datensatz pflegt und für die Sicherheit dieser persistenten Identifier zuständig ist.
00:24:00
Speaker
Also wenn sich etwas ändert, sorgen die dafür, dass die Pfade umgelegt werden, dass die Links, die IDs eben persistent bleiben für immer oder zumindest so lange, wie wir die GND benutzen.
00:24:12
Speaker
Wie verhält es sich denn da im Vergleich zu anderen Normdaten, die crowdbasiert sind, also nicht an einer Institution hängen, sondern von vielen Menschen betreut werden?
00:24:24
Speaker
Wikidata zum Beispiel, die bieten ja auch eine Art von Normdaten an.
00:24:28
Speaker
Man kann sich da Datensätze anlegen und somit persistente Identifier erhalten.
00:24:35
Speaker
Ist das eine Konkurrenz oder geht das freundschaftlich Hand in Hand?
00:24:40
Speaker
Also wenn man jetzt nun vom ganzen Datenkosmos denkt.
00:24:46
Speaker
Ja, also natürlich wird es oft als Konkurrenz aufgebaut.
00:24:50
Speaker
Man kann natürlich in Wikidata sehr viel schneller selbst auch Daten einbringen, sei es durch eine sogenannte Datenspende, das heißt einen Massenimport, bei dem man auch dann Unterstützung bekommt in der Wikidata-Community oder auch durch das händische Selbstanlegen von Datensätzen.
00:25:06
Speaker
Und dann hat man in dem Augenblick, wo man das abspeichert, hat man natürlich auch so eine Concept-ID, also das heißt ein URI, der auf einen feststehenden persistenten Identifier bei Wikidata verweist.
00:25:20
Speaker
So weit, so gut.
00:25:21
Speaker
Aber das Ganze funktioniert natürlich nur so lange, wie Wikidata als freiwilligen Projekt sozusagen diese große Power entfaltet, die es im Augenblick hat.
00:25:31
Speaker
Also es geht so lange gut, wie es gut geht.
00:25:33
Speaker
Und ich bin sicher, dass, weil Wikidata für so viele Projekte auf der Welt sehr, sehr wichtig ist, dass es sozusagen nicht sehr schnell alarmen wird, also dass es wichtig bleiben wird und deshalb man immer sehen muss, was man da kriegt.
00:25:49
Speaker
Andererseits ist natürlich die Datenqualität in Wikidata auch sehr heterogen.
00:25:53
Speaker
Das heißt, wir haben auch eine ganze Reihe von Datensätzen, die sehr wenige Statements haben, also sehr, sehr flach sind.
00:26:00
Speaker
Und manchmal so flach, dass eben genau die Identifikation der Entität sehr schwierig ist.
00:26:07
Speaker
Oder manchmal auch sitzt man wirklich ratlos davor und fragt sich, ob das nun passt hier oder nicht.
00:26:14
Speaker
Bei der GND ist es natürlich so, dass die Deutsche Nationalbibliothek ihren
00:26:19
Speaker
Verantwortlichkeitsauftrag für diese Normdatei sehr ernst nimmt.
00:26:22
Speaker
Also das heißt, sie möchte dieses Datenangebot mit guter Qualität wirklich bis in alle Zukunft vorhalten und möchte deshalb auch den redaktionellen Zugriff
00:26:36
Speaker
sozusagen möchte dort ein Gatekeeper bleiben, sage ich jetzt mal.
00:26:40
Speaker
Also das heißt, es muss sozusagen nach bestimmten Redaktionsregeln gemacht werden.
00:26:45
Speaker
Und das ist sicherlich für die Qualität mittel- und langfristig auch wirklich gut, es so zu machen.
00:26:52
Speaker
Während bei Wikidata bekommt man halt, was man bekommt.
00:26:56
Speaker
Gerade in Bezug auf die Ontologie-
00:26:59
Speaker
Bei der Einbindung der einzelnen Datensätze ist es halt so, dass das sehr heterogen ist und auch sehr dynamisch.
00:27:05
Speaker
Das heißt, es ändert sich sehr häufig.
00:27:07
Speaker
Und wenn ich dann darauf meine jeweilige Anwendung baue, dann kann es durchaus sein, dass man da mal Überraschungen erlebt.
00:27:15
Speaker
Also, aber trotzdem, Wikidata ist sozusagen natürlich auch als sehr datengetriebenes und sehr technisches Projekt auch wirklich toll.
00:27:23
Speaker
Also, dass es dort eben an Hilfen gibt für Leute, die mit Wikidata etwas machen wollen.
00:27:28
Speaker
Und das ist schon gut.
00:27:29
Speaker
Es ist auch gut dokumentiert.
00:27:31
Speaker
Also, man kann da auch durchaus, es ist also nicht unverdient, der Ruf, den Wikidata hat.
00:27:38
Speaker
Und es ist auch tatsächlich wohl der größte Linked Open Data Hub, den es weltweit gibt.
00:27:46
Speaker
Jetzt haben wir ja schon

Entwicklung von Normdaten für Kunstwerke

00:27:47
Speaker
viel über die Chancen von Normdaten gesprochen, gerade wenn es um Personendaten geht, Institutionen, Ereignisse, also Dinge, die sich auch nicht wirklich ändern und Dinge, die für die Kunstgeschichte aber auch wichtig sind.
00:28:00
Speaker
Jetzt ist es besonders spannend, dass die GND gerade dabei ist, über die
00:28:06
Speaker
Werknormdaten anzulegen.
00:28:08
Speaker
Also dass man wirklich eine Identifikationsnummer für Kunstwerke hat.
00:28:13
Speaker
Das geht von jedem gezeichneten Blatt bis über jede gedruckte Version eines Kupferstichs.
00:28:19
Speaker
Das sind so Gemälden, Skulpturen, gemalten Wandfassaden, Gebäuden, Platzanlagen.
00:28:24
Speaker
Wie ist das möglich?
00:28:25
Speaker
Also wie geht man das an?
00:28:27
Speaker
Ja, also die gute Nachricht ist, dass diese Entitätenarten bereits in der GND vorgesehen sind.
00:28:35
Speaker
Also es gibt Werke, also vor allem Kunstwerke, die uns hier besonders interessieren.
00:28:40
Speaker
Es gibt auch die sogenannten Schriftdenkmäler.
00:28:43
Speaker
Das sind die unikal vorhandenen Handschriften.
00:28:47
Speaker
Und es gibt natürlich dann in der Abteilung Geografika die Bauwerke und Monumente.
00:28:54
Speaker
Und leider ist natürlich die Abdeckung noch nicht besonders groß, denn in der Geschichte war es ja so, dass diese Werknormdaten in der Regel nur dann angelegt wurden, wenn sie für die Sachverschlagwortung von Literatur gebraucht wurden.
00:29:11
Speaker
Also das heißt, wir finden dann dort eher die großen, die bedeutenden Werke.
00:29:15
Speaker
Und es wäre gut, wenn die GND an dieser Stelle ausgebaut würde,
00:29:22
Speaker
Wenn man dort, wenn ich jetzt mal von einer Utopie spreche, eigentlich dafür sorgen könnte, dass Museumsbestände per Massenimport in die GND hineinlaufen könnten.
00:29:34
Speaker
und dort eben dann diese Werknormdaten oder auch Bauwerknormdaten aus der Denkmalpflege tatsächlich erweitert werden könnten, sodass man dann auch in dem Spiel, dass man sozusagen semantisch alle Entitäten referenzieren möchte, über die man spricht in seinen Forschungsdaten, dieses dann auch für die Werke und die Bauwerke tun könnte.
00:29:59
Speaker
Das wäre natürlich ein wichtiger großer Schritt, auch wenn zum Beispiel die ganzen Informationen, die in Werkskatalogen irgendwo liegen, wenn die in Daten gebracht werden können.
00:30:09
Speaker
Genau.
00:30:10
Speaker
Dort gab es auch schon Teilprojekte, die dieses begonnen haben.
00:30:13
Speaker
Zum Beispiel ein Projekt an der Universität Heidelberg, das sich aus dem Illustrated Barch die Werknormdaten zur Druckgrafik vorgenommen hat und die in die GND im Rahmen eines Projektes eingepflegt hat.
00:30:27
Speaker
Und am Deutschen Dokumentationszentrum für Kunstgeschichte haben wir ja eine GND-Pilotagentur für Bauwerke, bei der die auch in Massenimporten Daten aus dem DIGIO und der Denkmalpflege eingebracht werden sollen, sodass auch die Bauwerkdaten an dieser Stelle wachsen können.
00:30:52
Speaker
Bei den vielen Vorteilen, oder auch wenn wir jetzt so eine Utopie haben oder hoffentlich bald Zukunft, wir wollen ja nicht utopisch bleiben, von diesen ganzen abgelegten und als verlinkten Daten verfügbaren Werke, da frage ich mich auch manchmal, was sind denn eigentlich die Grenzen von Normdaten?
00:31:10
Speaker
Also kann man sie auch falsch verwenden?
00:31:13
Speaker
Was kann man mit ihnen denn nicht machen?
00:31:15
Speaker
Putsch.

Richtige Anwendung von Normdaten URIs

00:31:18
Speaker
Eigentlich ist es für jede Entität, also jedes zu bestimmende Objekt, jedes Ding, über das man sprechen kann, könnte es im Prinzip Normdaten geben.
00:31:29
Speaker
Denn das sind ja, das heißt, man könnte es auch alles auf diese Art und Weise referenzierbar machen.
00:31:35
Speaker
Ob man das tun kann oder will und die Ressourcen dafür reichen, ist eine andere Frage.
00:31:40
Speaker
Aber vielleicht ist die Frage jetzt auch mehr auf die Anwenderebene gemünzt.
00:31:44
Speaker
Also das heißt, was, wenn ich Normdaten anwende, was kann ich da falsch machen?
00:31:49
Speaker
Also der gröbste Fehler ist natürlich, Normdaten nicht anzuwenden, einen Bogen darum zu machen und zu sagen, das brauche ich nicht.
00:31:58
Speaker
Dann weiter, leider häufiger Fehler ist vor allem in Sandungsdaten den URI-Daten.
00:32:06
Speaker
eines Normdatensatzes nicht zu zitieren, sondern nur die Vorzugsbezeichnung.
00:32:10
Speaker
Also nur den Namen dann aufzulisten.
00:32:12
Speaker
Ja, genau.
00:32:13
Speaker
Das heißt, man ist dann zufrieden, dass man den Hauptnamen einer Person gefunden hat und nimmt nicht die Nummer mit rüber.
00:32:21
Speaker
Und damit hat man sich ja dann, denn der Name kann sich ändern.
00:32:26
Speaker
Das ist auch bei der GND manchmal so und bei Wikidata sowieso.
00:32:30
Speaker
Also das heißt, Sie brauchen immer diese, wie soll ich sagen, Personalausweisnummer dieses Begriffs,
00:32:35
Speaker
der die unveränderliche Referenzierbarkeit herstellen soll.
00:32:42
Speaker
Dann, worauf man auch achten sollte, man sollte sehen, dass man innerhalb, dass man die richtigen Entitätenarten erwischt, wenn man referenziert.
00:32:52
Speaker
Also zum Beispiel, wenn man
00:32:54
Speaker
ein bestimmtes Kloster sucht, zum Beispiel Kloster Weingarten in der GND, das gibt es einmal als religiöse Körperschaft und andererseits aber auch als Bauwerk.
00:33:05
Speaker
Wenn ich jetzt das Bauwerk referenzieren will, sollte ich sehen, dass ich sozusagen in der richtigen Abteilung bin.
00:33:12
Speaker
Das ist eigentlich bei allen Normdaten der Fall, dass es immer sozusagen verwandte Begriffe gibt, wo man das Umfeld anschauen muss, um den richtigen Begriff dann auch mit seiner richtigen Nummer zu referenzieren.
00:33:27
Speaker
Und das eine meint das Bauwerk und das andere die Institution.
00:33:30
Speaker
Ja, genau, die Gemeinschaft.
00:33:32
Speaker
Das heißt, das Kloster als Institution, als religiöse Gemeinschaft kann man sicherlich in anderen Kontexten auch brauchen.
00:33:38
Speaker
Aber jetzt vielleicht, wenn ich über das Bauwerk sprechen will, dann nicht.
00:33:42
Speaker
Ja,

Digitalisierung von Sammlungen

00:33:43
Speaker
also das sind eigentlich die Hauptfehler, die man da machen kann.
00:33:51
Speaker
Angela Kajos hatte gerade schon das Erfassen von Sammlungsdaten angesprochen.
00:33:56
Speaker
Das ist etwas, was an den großen sammelnden Institutionen wie Museen, Archiven und Bibliotheken geschieht.
00:34:03
Speaker
Und das nicht von Zauberhand.
00:34:06
Speaker
Alle, die schon mal bei einer Erfassungskampagne mitgewirkt haben, wissen, wovon ich spreche.
00:34:11
Speaker
Hinter dem scheinbar einfachen Begriff Digitalisierung der Sammlung verbergen sich Stunden über Stunden an Besprechungen, Erfassungsstrategien und ein stetiges Abwägen, Entscheiden und im besten Fall Dokumentieren.
00:34:27
Speaker
Julia Rössel hat in ihrer Dissertation »Wechsel der Mediensysteme, grafische Sammlungen und ihre digitale Übersetzung« die Prozesse der Datenerfassung ansammelnden Institutionen untersucht.
00:34:39
Speaker
Normdaten spielen dabei mittlerweile eine große Rolle.
00:34:42
Speaker
Darum habe ich mit ihr über den Zusammenhang von Normdaten und Standards aus der Perspektive der Institution gesprochen.
00:34:49
Speaker
Aus der Perspektive der Institution, die Daten erfassen.
00:35:00
Speaker
Als Normdaten bezeichnet man kontrollierte Vokabulare oder Thesauri, in denen für jeden Begriff festgelegt wird, welche Ansetzung bei der Erfassung verwendet werden soll.
00:35:11
Speaker
Im Englischen sagt man auch Authority File, weil es eben ein Verzeichnet ist von normierten Begriffen zur Verwendung als Deskriptor in der Dokumentation.
00:35:20
Speaker
Das klingt jetzt ein bisschen komplizierter.
00:35:23
Speaker
Genauer gesagt,
00:35:25
Speaker
Bei der Verschlagwortung von Inhalten zum Beispiel muss ich mich, wenn ich eine Normdatei habe, nicht entscheiden, ob ich den Begriff Frau oder Frauen oder den Ausdruck weiblich gelesene Person verwende, sondern bekomme den Wert vorgegeben und kann den eben verwenden.
00:35:43
Speaker
Es geht also erstmal um eine sprachliche Normierung.
00:35:47
Speaker
Man kann Normdaten auch als Wertestandard bezeichnen und ich finde, der Begriff verdeutlicht ganz gut die Zielsetzung dieser Daten.
00:35:56
Speaker
Jetzt wird der Begriff Normdaten ganz häufig auch immer mit Standards in einem Satz genannt, manchmal auch zusammen in einem Topf geworfen.
00:36:06
Speaker
Normdaten sind Standards oder sind Standards Normdaten?
00:36:10
Speaker
Also wie verhält sich das da zueinander?
00:36:14
Speaker
Ich habe ja eben schon

Vorteile der Standardisierung von Daten

00:36:15
Speaker
mal den Begriff Wertestandard fallen lassen und im Prinzip sind Normdaten ja eigentlich genau das.
00:36:24
Speaker
Sie sagen, dieser Wert ist der Standardwert für ein bestimmtes Feld.
00:36:31
Speaker
zum Beispiel, innerhalb eines Systems.
00:36:34
Speaker
Dann gibt es aber auch noch Strukturstandards.
00:36:37
Speaker
Das heißt, für die Erfassung von Objekten der materiellen Kultur verwenden wir zum Beispiel am liebsten Lido, das heißt Lightweight Information Describing Objects und ist ein XML-Format beziehungsweise ein Austauschformat,
00:36:57
Speaker
in dem ganz genau vorgab oder ganz genau vorgegeben ist, auf welche Art und Weise ein Sammlungsobjekt erfasst werden kann.
00:37:09
Speaker
Und dafür gibt es eben, werden verschiedenste Entitäten vorgegeben.
00:37:14
Speaker
Also dazu gehört zum Beispiel der Objekttyp, ein Name oder Titel,
00:37:21
Speaker
Oder eben auch natürlich ganz wichtig, der Identifikator, die ID für den Datensatz, damit er eben auch wiedergefunden werden kann.
00:37:29
Speaker
Und innerhalb dieses Strukturstandards, ich nehme jetzt weiter das Beispiel Lido, kann man sowas wie Normdaten einbinden, weil das eben, wie gesagt, Wertestandards sind.
00:37:40
Speaker
Wir können für den Objekttyp, sagen wir mal, wir möchten einen Kupferstich verzeichnen,
00:37:47
Speaker
Entweder einfach nur sagen, es handelt sich um einen Kupferstich.
00:37:51
Speaker
Wir können aber auch den Normdaten, auf den Normdatensatz für Kupferstich im Art & Architecture Thesaurus, das ist eine wichtige Normdatei für die Kunstgeschichte, verweisen und haben dort verschiedene Sprachvarianten, aber vielleicht auch eine Erklärung, was genau damit gemeint ist.
00:38:15
Speaker
Und jetzt ist die Bereitstellung von Daten, wenn man sich an Standards zur Datenerfassung hält, die Daten dann auch mit Normdaten anreicht, eine sehr arbeitsintensive Geschichte.
00:38:27
Speaker
Also es ist nicht so, dass wenn man da eine Person abstellt in einer Institution und die kümmert sich dann um alles, es ist Teamwork, es ist auch immer Diskussion, einiges muss ausgehandelt werden in der Fachcommunity.
00:38:39
Speaker
Es ist ganz schön mit Aufwand verbunden, qualitätvolle, saubere Daten bereitzustellen.
00:38:46
Speaker
Egal welchen Standard und welche Normen Daten man dann benutzt.
00:38:51
Speaker
Hast du eine Idee, warum man das machen sollte?
00:38:54
Speaker
Warum sollten sich Institutionen, wir als Forscherinnen und Forscher, uns diesen Aufwand überhaupt geben?
00:39:04
Speaker
Ja,

Daten als wiederverwendbare Ressource

00:39:05
Speaker
also meine Idee oder meine Vorstellung von der Nutzung von Daten ist eben so, dass natürlich am Anfang hat man einen relativ hohen Arbeitsaufwand, aber mit der Idee eines Datenlebenszyklus im Hintergrund hat man eigentlich...
00:39:30
Speaker
davon dann auch später sehr viel.
00:39:34
Speaker
Also man kann das eigentlich schon an sehr konkreten Beispielen jetzt festmachen, wenn wir unsere Daten
00:39:43
Speaker
in einem System erfassen unsere Sammlungsdaten und dann haben wir sie publiziert und wir denken, okay, das reicht uns jetzt erst mal.
00:39:53
Speaker
Und dann kommt aber irgendwann die Anforderung, wir möchten gerne eine App machen, die die Besucherinnen des Museums vor Ort nutzen können.
00:40:06
Speaker
Und wenn wir unsere Daten als Ressourcen denken,
00:40:14
Speaker
dann wissen wir, okay, wir haben jetzt einen anderen Anwendungskontext und können uns hier nochmal überlegen, wir haben unser Datenset, unser riesiges Datenset, was davon brauchen wir eigentlich, um den Nutzerinnen die beste Experience innerhalb dieser App zu ermöglichen.
00:40:31
Speaker
Und
00:40:32
Speaker
dann können wir eben auswählen und können vielleicht auch noch anreichern um Informationen und können dann eben diese leicht veränderten Daten in der App nutzen.
00:40:47
Speaker
Und diese Vorstellung, dass man im Prinzip Daten als einen, ja, als Ressourcen versteht, die man stetig nutzt und die man immer wieder auf andere Arten und Weisen nutzen kann und immer wieder durch verschiedene Brillen vielleicht sehen und verstehen kann, das ist eine wichtige Grundlage, weil dann
00:41:17
Speaker
möchte man eben vielleicht auch genau dafür sorgen und überlegt sich, okay, wir haben jetzt diesen Anwendungskontext, aber vielleicht kommt später ein anderer Anwendungskontext und dann sorgen wir doch mal dafür, dass die Daten ein bisschen besser verständlich werden.
00:41:32
Speaker
Und man muss nicht immer wieder von Null anfangen.
00:41:34
Speaker
Und

Offene Datenpolitiken in kulturellen Institutionen

00:41:35
Speaker
man muss nicht immer wieder von Null anfangen, ganz genau.
00:41:37
Speaker
Man kann natürlich auch weiterhin Daten erfassen und das soll man bitte auch.
00:41:44
Speaker
Warum verwendet man in der Kunstgeschichte aktuell noch nicht so viele Normdaten?
00:41:49
Speaker
Die Anforderungen an kunsthistorische Daten haben sich in den letzten Jahrzehnten einfach stark verändert.
00:41:54
Speaker
Man hat mit einem lokalen Museumsmanagementsystem begonnen, das erst einmal das gemeinsame Arbeiten vor Ort erleichtern sollte.
00:42:03
Speaker
Und dann kam mit der verstärkten Internetpräsenz von Museen immer mehr der Bedarf, dass ihre Sammlungen ähnlich wie Bibliotheken online durchsuchbar gemacht werden sollten.
00:42:13
Speaker
Das heißt, es sollten nun Daten publiziert werden, die ursprünglich gar nicht dafür gedacht waren.
00:42:18
Speaker
Die Wahrnehmung dafür, dass Daten schließlich auch über Institutionsgrenzen hinaus miteinander verlinkt werden können, musste erstmal aufgebaut werden.
00:42:26
Speaker
Und diese Anforderung, die durch die Nutzung der Daten in einem anderen Kontext entsteht, muss sich auch in den Erfassungssystemen niederschlagen.
00:42:34
Speaker
Diese bzw.
00:42:36
Speaker
das zugrunde liegende Datenmodell müssen angepasst werden, zum Beispiel so, dass bei der Erfassung von Personen, ErfasserInnen auch die Möglichkeiten,
00:42:45
Speaker
haben oder besser noch dazu angeregt werden, direkt bei der Dateneingabe auch Normdaten zu verlinken.
00:42:52
Speaker
Das geht heute in einigen Systemen, zum Beispiel über Schnittstellen in den Datenbanksystemen, die automatisiert einen Abgleich mit der GND ermöglichen, so als Beispiel.
00:43:04
Speaker
Dann ist aber immer noch das Problem mit den Altdaten, also den Daten, die entstanden sind, bevor Normdaten erfasst wurden.
00:43:10
Speaker
Hier kann man natürlich nacharbeiten und es gibt hilfreiche Tools, die eine Anreicherung mit Normdatensystemen recht niedrigschwellig ermöglichen.
00:43:18
Speaker
Aber auch dafür braucht es natürlich Ressourcen und Know-how, die oft noch fehlen.
00:43:23
Speaker
Und was für Tools sind das?
00:43:25
Speaker
Ist es dann sowas wie Open Refine oder so?
00:43:28
Speaker
Genau.
00:43:28
Speaker
OpenRefine ist ein Beispiel, mit dem man seine Daten gut bereinigen und anreichern kann.
00:43:38
Speaker
Und dort gibt es eben auch Schnittstellen zu Normdatensystemen, wie zum Beispiel der Wikidata oder eben auch der GND.
00:43:47
Speaker
wo dann überprüft wird, findet sich dieser Wert auch in der Normdatei.
00:43:51
Speaker
Und dann wird diese Verlinkung automatisch erstellt.
00:43:54
Speaker
Dann kann man seine Daten wieder aus OpenRefine exportieren und hat im Prinzip angereicherte Daten.
00:43:59
Speaker
Ah, okay.
00:44:02
Speaker
Aber es kommt auch noch dazu, dass die Normdatensysteme ja nicht immer den Ansprüchen genügen.
00:44:07
Speaker
Die GND zum Beispiel ist ja eigentlich im bibliothekarischen Kontext entstanden und war dafür gemacht, die standardisierte Erfassung von Büchern zu ermöglichen.
00:44:17
Speaker
Kunsthistoriker erfassen aber natürlich viele Dinge genauer und spezialisierter und finden dann vielleicht bei den GND-Sachbegriffen kaum etwas.
00:44:27
Speaker
Aber auch der AET ist nicht vollständig oder unfehlbar.
00:44:31
Speaker
Oder es werden im Zuge der kunsthistorischen Erfassung bestimmte Personen genannt, die bislang unter dem Radar liefen und deshalb auch nicht in der GND sind.
00:44:41
Speaker
Aber deswegen gar keine Normdaten zu nutzen, ist, finde ich, auch nicht sinnvoll.
00:44:47
Speaker
Das ist, als würde ich ein Buch nicht lesen, weil ich einen Rechtschreibfehler auf der ersten Seite gefunden habe.
00:44:58
Speaker
Bei den sammelnden Institutionen wird viel Aufwand betrieben, um kunsthistorisch relevante Daten strukturiert und angereichert bereitzustellen.
00:45:07
Speaker
Immer mehr Institutionen leben eine offene Datenpolitik und stellen über einfach zugängliche Schnittstellen ihre Daten mit freien Lizenzen zur Verfügung.
00:45:17
Speaker
Aber wie wird das in der kunsthistorischen Forschung angenommen?
00:45:27
Speaker
Jetzt bist du ja schon eine ganze Weile dabei.
00:45:29
Speaker
Du kennst Datenbanken, Digitalisierungsprojekte, hast auch einen Blick hinter die Kulissen, was den Forschungsstand oder was den Stand der Forschungsdaten für Kunstgeschichte angeht.
00:45:38
Speaker
Du

Datenmanagement in der akademischen Lehre

00:45:39
Speaker
bist ja auch bei NFDI for Culture involviert.
00:45:42
Speaker
Würdest du sagen, dass wir im Fach auf einem guten Weg sind, auch datengetriebene Methoden in unseren Forschungskanon aufzunehmen?
00:45:51
Speaker
Also sind wir schon soweit?
00:45:52
Speaker
Ja.
00:45:55
Speaker
Ja, das ist natürlich ein schillernder Begriff, die datengetriebene Kunstgeschichte.
00:45:59
Speaker
Und eigentlich wäre das für mich eine Kunstgeschichte, die vor allem mit Software-Fragestellungen zu ergründen versucht, die überhaupt auch erst fragbar werden, wenn man sozusagen schreibt,
00:46:16
Speaker
Daten als Material auswertet.
00:46:18
Speaker
Das ist eigentlich jetzt in Bezug auf die Normdatenreferenzierung gar nicht so sehr der Fall, sondern die Normdatenreferenzierung ist wirklich im Grunde ein Register anlegen oder die bunten Post-its an mein Buch kleben, die Dinge auffindbar machen.
00:46:35
Speaker
Und das ist, denke ich, für jede Art von Daten, die in der Kunstgeschichte produziert werden, gut und nützlich und hilfreich.
00:46:43
Speaker
Es wird ja auch in den Repositorien, wo man seine Forschungsdaten einliefern kann, zunehmend auch gewünscht.
00:46:50
Speaker
Also es ist auch überall verbreitete Praxis, dass man zum Beispiel seine ORCID-ID als Verfasserin oder Verfasser dann dort angibt.
00:46:58
Speaker
Aber leider ist es oft noch optional, eine sozusagen inhaltliche Verschlagwortung seiner Forschungsdaten zu geben im Repositorium.
00:47:07
Speaker
Da gibt es sehr häufig bei Datasite jetzt auch schon die Felder dafür, aber man muss sie nicht ausfüllen und weil die Leute nicht verstehen, warum sie das tun sollen und weil sie schnell fertig werden wollen, lassen sie es dann bleiben.
00:47:18
Speaker
Also deshalb kann ich vielleicht auf diesem Weg hier auch nochmal den Appell an alle schicken, dass sie im Grunde sich diese Mühe machen, fünf Minuten mehr für die
00:47:27
Speaker
GND-Verschlagwortung ihrer Forschungsarbeiten aufwenden, sodass andere, die diese Arbeit noch nicht kennen, sie einfacher wiederfinden können.
00:47:35
Speaker
Ja, dass man selbst, wenn man jetzt nicht mit Algorithmen, künstlicher Intelligenz als Methode arbeitet, sondern noch sehr klassisch recherchiert und auf Informationssuche ist, ist ja auch gut zu wissen, was das da schon draußen alles so gibt, also was wo abgelegt ist und wo schon Informationen drin stecken, die ich vielleicht übernehmen kann für meine Forschung, also mir gewisse Grundlagenarbeit auch sparen kann.
00:47:56
Speaker
Ja.
00:47:59
Speaker
Wenn man sich jetzt damit überhaupt nicht auskennt, kann man natürlich sich entweder an die Forschungsdaten, Beratungsstellen der eigenen Institutionen wenden, aber gibt es dann für die Kunstgeschichte auch einen Ort, wo man sich beraten lassen kann?
00:48:13
Speaker
Also wie kommt man überhaupt in diese ganzen Informationen, die du hast?
00:48:18
Speaker
Von NFDI4Culture haben wir einen Helpdesk, der jede und jeden berät in seinem Projekt auf dem Kenntnisstand, wo die Person jeweils ist oder mit den Fragen, die sie jeweils eben hat.
00:48:32
Speaker
Und das betrifft jetzt nicht nur Normdaten oder Datenqualität, dort bin ich ja dann tätig, sondern eigentlich im Grunde alle Themen, die mit Forschungsdaten im gesamten Datendebenszyklus zu tun haben.
00:48:43
Speaker
Man kann sich dort also hinwenden,
00:48:45
Speaker
Man findet das auf der NFDI4Culture Webseite direkt.
00:48:48
Speaker
Aber natürlich, wenn man Forschungsdaten in ein Repositorium einbringen möchte, dann bekommt man direkt auch immer viel Rat und Hilfe bei dem Repositorium selbst.
00:48:59
Speaker
Also dort gibt es auch immer Personen, die einem helfen und die dort eben für eine kluge Weichenstellung auch zur Verfügung stehen.
00:49:07
Speaker
Oder es gibt eben Forschungsdatenmanagement, Beratungsstellen gibt es mittlerweile, glaube ich, an jeder Universität.
00:49:12
Speaker
Auch die haben natürlich an dieser Stelle einschlägige Informationen oder zumindest auch können einen verweisen, wenn man es noch genauer wissen möchte dann.
00:49:24
Speaker
Also es gibt genug

Zukünftige Möglichkeiten mit Normdaten

00:49:25
Speaker
Orte, an denen man sich informieren kann.
00:49:28
Speaker
Ich bin jetzt erstmal so am Überlegen, wann bin ich das erste Mal mit Normdaten in Berührung gekommen?
00:49:35
Speaker
Und das war, glaube ich, das muss nach meinem Magisterabschluss gewesen sein, da habe ich in einem Projekt an einem Museum gearbeitet, wir haben an einer Datenbank gesessen und da ging es eben um die Anreicherung über Normdaten.
00:49:49
Speaker
Aber mein ganzes Studium lang bin ich damit überhaupt nicht in Kontakt gekommen.
00:49:55
Speaker
Ist das etwas, was Einzug in die Lehre des Faches halten sollte?
00:49:58
Speaker
Also wenn es zum Standard werden sollte oder auch bereits in gewisser Weise ein Standard ist, gehört es zum Handwerkskatalog der Kunstgeschichte schon dazu, mit Normendaten umgehen zu können oder muss es dazugehören?
00:50:14
Speaker
Ich denke, dass man solche Forschungsdatenmanagement-Komponenten, und dazu gehört das ja auch, schon im Fach stärker vermitteln sollte.
00:50:22
Speaker
Also es gibt ja für alle Erstsemester gibt es eine Einführung in die Arbeitsmittel des Faches.
00:50:28
Speaker
Man geht zusammen in die Bibliothek oder man zeigt den Leuten, wo sie in welchen Katalogen was finden können.
00:50:34
Speaker
Und genauso müsste im Grunde von Anfang an die
00:50:37
Speaker
etwas Forschungsdatenmanagement vermittelt werden, was ja auch zunehmend auch der Fall ist.
00:50:43
Speaker
Also gerade die Universitäten merken auch, dass sie an der Stelle sozusagen die nachwachsenden Wissenschaftlerinnen und Wissenschaftler anders aufstellen müssen.
00:50:54
Speaker
Nur es könnte natürlich noch viel stärker und verbindlicher in den Curricula verankert werden.
00:51:01
Speaker
Also ganz einfach, damit man die wertvolle Forschung, die geleistet wird, am Ende dann auch sozusagen möglichst effektiv nachnutzbar macht.
00:51:09
Speaker
Und dazu muss man sie erst mal finden und entdecken.
00:51:12
Speaker
Oder man kann sich ja auch dann vorstellen, dass Sekundäranwendungen, die genau diese...
00:51:17
Speaker
semantische Auszeichnung der Forschungsdaten nutzen, auch in den Texten selber, wenn sie das, man kann es ja auch noch weiter treiben, dass man damit dann auch noch andere Dinge tun kann, dass also diese Forschungsdaten wiederum ganz anders noch wieder Grundlage werden können für neue Auswertungsmöglichkeiten.
00:51:37
Speaker
Mein Vorurteil, das ich gegenüber Normdaten hatte, war bisher immer so, da muss man noch mal nervig die Links raussuchen und die Personen verknüpfen.
00:51:47
Speaker
Im Gespräch mit dir ist mir nur klar geworden, was es für ein großes Fundament geben kann.
00:51:51
Speaker
Also nicht nur für das Wiederauffinden meiner eigenen Forschung, sondern auch, um neue Forschungsfragen zu ermöglichen, also auf neue Forschungsideen zu kommen.
00:52:02
Speaker
Stell dir mal vor, wenn wir uns unsere ganzen Forschungsergebnisse mit Normdaten, inneren Repositorien abgelegt hätten und gesetzt im Fall, alle machen das auch zugänglich mit offenen Lizenzen.
00:52:14
Speaker
Was wäre dann

Zukünftige Zusammenarbeit und Forschung

00:52:16
Speaker
für eine übergeordnete Analyse, eine Meta-Analyse möglich?
00:52:20
Speaker
Neue Fragestellungen könnten wir dann entwickeln, an die wir heute noch gar nicht denken können, weil wir diesen Datenpool nicht haben.
00:52:28
Speaker
Ja, oder die, die im Augenblick noch nur sehr schwierig umzusetzen sind.
00:52:33
Speaker
Also es gibt ja solche Fragestellungen schon, weil einfach die Daten noch in nicht sehr großer Anzahl entsprechend ausgerüstet sind.
00:52:42
Speaker
Also man kann ja auch weitergehen.
00:52:43
Speaker
Man könnte sich zum Beispiel vorstellen, dass ich meine diskursiven Texte mit Named Entity Recognition bearbeite und auf diese Art und Weise diese Entitätenreferenzierung in die Texte selbst als zusätzliche,
00:52:59
Speaker
sozusagen Referenzierungsschicht einbaue.
00:53:02
Speaker
Also ein Algorithmus, der über den Text läuft und erkennt, ah, diese Zeichenkette ist ein Personenname, Albrecht Dürer.
00:53:09
Speaker
Und über die Verknüpfung weiß das Programm, Albrecht Dürer ist eine Person und wird als Entität Person mit der ID verknüpft.
00:53:16
Speaker
Also aus der Zeichenkette wird auf einmal etwas, was mit Bedeutung versehen ist.
00:53:20
Speaker
Es wird annotiert, aufgelagert auf die Zeichenkette.
00:53:26
Speaker
Genau, und dann ist man sozusagen nochmal eine Ebene granularer rangegangen, als wenn man das nur in der Metadatenauszeichnung des ganzen Konvoluts an sich macht und hätte damit natürlich auch noch andere Nutzungsarten für den Text selbst zugelassen.
00:53:43
Speaker
Ich hoffe nun, dass ganz viele, die zuhören, Geistesblitze haben und ganz schnell zum Hörer greifen und ihre ComputerlingoistInnenbekannten oder KollegInnen aus den Institutionen anrufen.
00:53:56
Speaker
Da ist so viel Spannendes möglich, an so vielen Themen, an denen wir arbeiten können.
00:54:00
Speaker
Wir haben in der Kunstgeschichte so viele Texte, auch schon digitalisierte Texte, mit denen man arbeiten kann.
00:54:06
Speaker
Ja, genau.
00:54:07
Speaker
Das hoffe ich auch und ich hoffe, dass ich den Menschen, die hier zugehört haben, vielleicht auch ein bisschen Lust auf Normdaten und kontrollierte Vokabularik gemacht habe.
00:54:18
Speaker
Und ja, dass der Dialog einfach weitergeht.
00:54:29
Speaker
Forschung und die Art zu forschen verändert sich stetig.
00:54:32
Speaker
Und obwohl es mittlerweile viele Standards und genormte Vokabularie gibt, scheint es immer noch eine gewisse Unsicherheit in der Kunstgeschichte darüber zu geben.
00:54:41
Speaker
Der Dialog darf zwischen den Akteuren und der Wissenschaft nicht abbrechen.
00:54:45
Speaker
Er muss weiter gepflegt werden.
00:54:47
Speaker
Sind die von Institutionen aufbereiteten Daten überhaupt das, was wir in der Forschung brauchen?
00:54:53
Speaker
Oder anders gefragt, veröffentlichen wir unsere Forschungsdaten in einer Form, dass neue Erkenntnisse in das allgemeine Wissen und in die Institutionen zurückfließen können?
00:55:04
Speaker
Das Veröffentlichen

Ausblick auf zukünftige Episoden

00:55:05
Speaker
von Forschungsdaten gehört immer mehr zur guten wissenschaftlichen Praxis.
00:55:09
Speaker
Normdaten sind dabei ein wichtiges Element für die Wiederauffindbarkeit und die Identifikation von Schnittstellen, Synergien.
00:55:18
Speaker
Und ganz unabhängig, ob die Forschung an Universitäten, wissenschaftlichen Institutionen oder Museen geschieht, ein Forschungsdaten-Lebenszyklus funktioniert über institutionelle Grenzen hinweg.
00:55:30
Speaker
Wenn wir die Bereitschaft im Fach steigern, offener mit Daten umzugehen, eröffnen wir einen Möglichkeitsraum für neue Fragestellungen und Methoden wie einer datengetriebenen Kunstgeschichte.
00:55:42
Speaker
Und ist nicht das Ziel von Forschung und Wissenschaft, neue Erkenntnisse zu gewinnen über neue Methoden?
00:55:48
Speaker
Und was künstliche Intelligenz damit zu tun hat?
00:55:52
Speaker
Das besprechen wir besser in einer anderen Folge.
00:56:07
Speaker
Diese Folge wurde von Jacqueline Klosig-Eckert produziert im Auftrag des Arbeitskreises Digitale Kunstgeschichte.
00:56:13
Speaker
Unterstützt wird sie dabei von der Redaktion der Arbeitskreismitglieder Peter Bell, Lisa Diekmann, Peggy Große, Waltraud von Pippich und Holger Siemann.
00:56:23
Speaker
Finanziert wird AdHistocast, der Podcast zur digitalen Kunstgeschichte von NFDI for Culture, dem Konsortium in der nationalen Forschungsdateninfrastruktur, das sich mit Forschungsdaten zu materiellen und immateriellen Kulturgütern befasst.
00:56:37
Speaker
Unterstützt wird AdHistocast durch den Deutschen Verband für Kunstgeschichte.
00:56:43
Speaker
Du hast noch eine Frage oder Anregungen?
00:56:45
Speaker
Kontaktiere uns einfach unter podcast.digitale-kunstgeschichte.de