Become a Creator today!Start creating today - Share your story with the world!
Start for free
00:00:00
00:00:01
Avatar
843 Plays2 years ago

In dieser Folge geht es um die Frage, wie man Kunstgeschichte und ihre Forschung in Datenform bringen kann. Dabei dreht sich alles um die Frage, was wir wie verdaten wollen und können. Welche Szenarien der Nachnutzbarkeit haben wir und was sind gute Konzepte zur Datenerfassung?

Jacqueline Klusik-Eckert spricht mit dem Historiker und Data Engineer  Robert Nasarek. Es geht um die Herausforderungen der Kunstgeschichte sowohl die Objekte als auch die kunsthistorische Forschung in Datenform zu bringen.

Angefangen bei der Überlegung, was Daten überhaupt sind, muss auch kritisch hinterfragt werden, welche Informationen in Daten abgebildet werden und an welcher Stelle in der Forschung überhaupt erst von Wissen gesprochen werden kann. Mit vielen Beispielen aus seiner Arbeitspraxis erklärt er anschaulich, welche Vorüberlegungen überhaupt unternommen werden müssen und mit welchen Methoden man diese dann umsetzen kann, um Historisches in Datenform zu bringen.

Daten in der Kunstgeschichte können aber auch mehr als nur eine Herausforderung für die Erfassung sein. Durch gut strukturierte, normierte und offene Daten entstehen neue Forschungsfragen. Mit den passenden methodischen Ansätzen, die durch datengestützt oder datengetriebene Forschungsdesigns erst ermöglicht werden, können wir ganz neue Perspektiven auf unsere Untersuchungsgegenstände, die Geschichte und die Wissenschaft Kunstgeschichte werfen.

Begleitmaterial zur Folge unter https://blog.arthistoricum.net/beitrag/2023/05/03/arthistocast-folge-2

Unseren Podcast kann man auf vielen Wegen hören. Die Folge ist mit persistentem Identifier im Repositorium heidICON abgelegt und kann nach Belieben heruntergeladen und nachgenutzt werden, unter https://heidicon.ub.uni-heidelberg.de/#/detail/1744899

Recommended
Transcript

Einführung in die Kunstgeschichte

00:00:17
Speaker
Die Kunstgeschichte ist eine Bild-, Werk-, Schrift-, Buchwissenschaft.
00:00:21
Speaker
Um es mal verkürzt zu sagen, es geht um Material, um Maße, Vorderrückseiten, Seitenzahlen.
00:00:27
Speaker
Also wir forschen neben der Theorie an Bildern, Objekten, haptischen, an Ereignissen.
00:00:33
Speaker
Da sind wir doch mal ganz ehrlich, wie viel Zeit unserer Forschungs- und Arbeitszeit verbringen wir denn eigentlich an diesen Werken?
00:00:39
Speaker
Und wie oft ist unser Fenster zur Welt dieses leuchtende Display vor unserer Nase?
00:00:45
Speaker
Vieles aus unserem Alltag ist in irgendeiner Form maschinenlesbar, digitalisiert oder von Grund auf digital.
00:00:52
Speaker
Also ganz gleich, ob man digitalisiert oder digital hat, dahinter verbirgt sich immer eins, Daten.
00:00:59
Speaker
Also fangen wir mal von vorne an.

Definition und Verständnis von Daten

00:01:01
Speaker
Was sind Daten eigentlich?
00:01:03
Speaker
Als Geisteswissenschaftlerin will ich mich dem Begriff erstmal über eine Definition nähern, um auch gleich zu merken, es gibt unterschiedliche Definitionsansätze.
00:01:12
Speaker
Und noch dazu, verschiedene Fachbereiche benutzen verschiedene Definitionen.
00:01:17
Speaker
Also der erste Schritt zum etymologischen Wörterbuch.
00:01:20
Speaker
Da steht Daten, Plural von Datum, aus dem Lateinischen von dare, mit der Bedeutung für gegebene Größen, Angaben und Beleg.
00:01:28
Speaker
Also ein Datum ist zunächst erstmal was Gegebenes.
00:01:31
Speaker
Ganz umgangssprachlich kann ich darunter also was Gegebenes, Tatsachen, Ereignisse oder eben das tägliche Datum verstehen.
00:01:39
Speaker
Datum sind Informationen.
00:01:41
Speaker
Oder verbergen sich hinter Daten Informationen?
00:01:45
Speaker
Bevor ich nun einen Knoten ins Hirn bekomme, frage ich mal lieber gleich bei einem Experten nach.
00:01:56
Speaker
Ich habe heute Robert Nazarek zu Gast, selbst Data Engineer und Mitarbeiter am Germanischen Nationalmuseum Nürnberg in der Abteilung Museum und Kulturinformatik.
00:02:04
Speaker
Hallo Robert.
00:02:05
Speaker
Hallo.
00:02:07
Speaker
Auf deiner Homepage startest du gleich mit einer wunderbaren Metapher über deinen Werdegang.
00:02:11
Speaker
Da schreibst du über dich und ich zitiere jetzt mal.
00:02:14
Speaker
In den Tiefen der digitalen Geisteswissenschaften geboren, habe ich mich durch eine Menge schmutziger Daten aus historischen Quellen gegraben.
00:02:21
Speaker
Python, eine Programmiersprache, war meine Schaufel und ich habe meine Shanties in SQL gesungen.
00:02:27
Speaker
Also SQL, eine Datenbanksprache.
00:02:30
Speaker
Also wenn jemand mir über Daten in den Kulturwissenschaften und Daten in der Kunstgeschichte was erklären kann, dann bist du das.
00:02:37
Speaker
Ich starte also mal mit der Gretchenfrage und du darfst gerne ausweichen.
00:02:41
Speaker
Was sind Digite Halle Daten?

Herausforderungen in der Datenverarbeitung

00:02:44
Speaker
Ja, ich versuche das immer einfach zu halten, also möglichst.
00:02:48
Speaker
Bei Daten sind wir, man spricht davon, alle kennen die tausendmal schon gehört,
00:02:52
Speaker
Und ich sage mal so, wir reden ja über Digitaldaten, also nicht über die, die in Büchern stehen.
00:02:58
Speaker
Und grundsätzlich finde ich Daten, das sind immer strukturierte Informationen, also irgendeine Form.
00:03:03
Speaker
Also in den Informationen, die eine Form hat.
00:03:05
Speaker
Und dann kann man sagen, okay, es kann Text sein, es kann Zahl sein, es kann Bilder sein, Audio sein.
00:03:10
Speaker
Aber es gehört auch dazu, dass die halt strukturiert sind in zum Beispiel Tabellen oder in einer Datenbank oder in einem Textdokument oder so.
00:03:17
Speaker
Also grundsätzlich würde ich sagen, Daten sind alles, was eine strukturierte Information ist.
00:03:21
Speaker
Ganz simpel.
00:03:23
Speaker
Und wie kommen wir nun von dieser traditionellen Schriftbildwissenschaft zu den Daten?
00:03:26
Speaker
Ist alles in Daten abbildbar?
00:03:30
Speaker
Na, ich als Datenenthusiast sage natürlich, ja, alles.
00:03:33
Speaker
Man kann alles machen, weil wir ja in uns drin, in unserem Geist, in unserem Bewusstsein auch irgendwie immer strukturieren oder Zusammenhänge bilden.
00:03:41
Speaker
Und es ist nur die Frage, wie gut können wir das halt dem Computer beibringen oder wie gut in das Format bringen, was wir dann verarbeiten wollen.
00:03:48
Speaker
Das ist ja die Krux.
00:03:50
Speaker
Und wenn ich jetzt sagen würde, okay, was sind Daten, mit denen wir so umgehen, jetzt in der Kunstgeschichte oder halt in der Geisteswissenschaft, sind das ja oft so Dinge wie, okay, was ist jetzt ein Objekt, was sind das für Eigenschaften, was ist eine Person oder so und die hacken wir dann in kleine Stücke und die Schwierigkeit ist, dass wir als Menschen ja sehr, ähm,
00:04:13
Speaker
unstrukturiert Sachen bearbeiten können.
00:04:15
Speaker
Also wir können einen Text lesen und da stehen Wörter drin, da stehen Semantiken drin.
00:04:19
Speaker
Und das ist für uns alles verständlich, weil wir können das alles in Sekunden, Millisekunden schneller aufnehmen.
00:04:23
Speaker
Beim Computer ist es so, dass wir das ja in kleine Teile auseinandernehmen müssen.
00:04:28
Speaker
Wir lesen einen Text und den wollen wir dann in eine Form bringen und dann müssen wir sagen, okay, was steht denn da wie drin?
00:04:34
Speaker
Alles, was der Mensch an implizitem Wissen, Erfahrungen hat, um zum Beispiel zu verstehen, was eine Person ist oder was hinter dem Begriff Person und Personenname verbirgt,
00:04:43
Speaker
Das müssen wir dem Computer irgendwie anders beibringen und sagen, es gibt eine Spalte, die heißt Person, da ist die erste Zeile drin und so weiter und so fort.
00:04:51
Speaker
Und das ist, glaube ich, die Schwierigkeit, dass wir Sachen, die wir von uns mit implizitem Wissen verarbeiten können, dem Computer explizit beibringen müssen.
00:05:00
Speaker
Und das ist die Krux an der ganzen Sache.

Mensch vs. Maschine: Dateninterpretation

00:05:04
Speaker
Also immer dann, wenn es um Daten geht und dann schmeißen wir mal die ganzen Definitionsversuche über den Haufen, geht es darum,
00:05:12
Speaker
unsere Art und Weise, etwas zu sehen, zu verstehen, zu strukturieren, in eine Form zu packen, die auch maschinenlesbar ist.
00:05:21
Speaker
Ja, also Mensch und Maschine, das darf man aber nicht vergessen, weil es geht ja im Endeffekt später auch darum, dass Menschen das wieder interpretieren können oder verstehen können.
00:05:31
Speaker
Aber dieser Transformationsprozess, das ist halt wie gesagt genau, man geht von der Quelle, der Mensch bringt da Maschine, das sind Maschinen, das lesen kann, bei und die durch verschiedene andere Prozesse kommt wieder zum Menschen und, also zum Menschen und zur Maschine und beide müssen es dann verstehen können.
00:05:47
Speaker
Sprechen wir dann eigentlich die gleiche Sprache, wenn ich als Kunsthistorikerin mit dir als Data Engineer über jetzt Objekte und die Objektdaten spreche?
00:05:56
Speaker
Oder reden wir da manchmal aneinander vorbei?
00:05:58
Speaker
Also wir reden ganz oft aneinander vorbei, aber das machen wir auch sowieso.
00:06:02
Speaker
Überall in der Gesellschaft reden Leute aneinander vorbei und da ist es immer wichtig, vorher zu sagen, worüber reden wir und was verstehen wir darunter?
00:06:10
Speaker
Also das ist so, dass es natürlich so ist, wenn Fachgebiete weiter auseinander liegen,
00:06:14
Speaker
dass die zum Beispiel ein Historiker unter einem Künstler etwas anderes verstehen kann als ein Kunsthistoriker.
00:06:23
Speaker
Weil zum Beispiel Künstler kann etwas sein, ein altes Handwerk, ein mechanischer Künstler ist vielleicht irgendeine Art von Ingenieur im 18.
00:06:30
Speaker
Jahrhundert und wir verstehen unter Künstler jemanden, der
00:06:33
Speaker
ein Bild herstellt oder so.
00:06:34
Speaker
Also da geht es schon los.
00:06:36
Speaker
Und dasselbe ist es halt, wenn man über Daten redet oder Objekte, Entitäten.
00:06:40
Speaker
Das sind alles Begriffe, die man vielleicht nicht in verschiedenen Forschungsbereichen ständig verwendet.
00:06:47
Speaker
Und dann muss man sowieso darüber reden.
00:06:48
Speaker
Ich meine, das wird immer besser.
00:06:49
Speaker
Die Verständnis von Daten, Datentechnik und Computer- und Informationstechnik, die nimmt natürlich immer mehr Raum bei Leuten ein, weil immer mehr Leute mit Computer arbeiten.
00:07:00
Speaker
Und dann wird auch das Verständnis klarer, wenn man über Entitäten redet.
00:07:05
Speaker
Das ist ein Wort, das Leute jetzt immer mehr hören und auch wissen, was es ungefähr ist.
00:07:10
Speaker
Ja, und was ist es denn genau?
00:07:11
Speaker
Das ist ein Ding, über das wir reden wollen.
00:07:14
Speaker
Also das ist quasi, man versucht,
00:07:18
Speaker
Ja, in der Datentechnik versucht man ja immer, Sachen der wirklichen Welt schematisch zu beschreiben.
00:07:25
Speaker
Und eine Entität ist ein Ding, über das ich etwas aussagen will.
00:07:28
Speaker
Der Autor ist eine Entität, das Museumsobjekt ist eine Entität und jede Entität hat Eigenschaften.
00:07:35
Speaker
Also zum Beispiel der Autor hat die Eigenschaften eines Namens oder eines Geburtsortes oder von Werken und das Werk an sich kann wiederum eine Entität sein, also weil die ja wieder eigene Eigenschaften hat, wie Veröffentlichkeitsdatum, Herstellungsinformationen und so weiter und so fort.
00:07:50
Speaker
Können auch abstrakte Sachen Entitäten sein oder muss es immer irgendwas Fassbares, Greifbares haben?
00:07:57
Speaker
Das kann natürlich auch eine Idee sein oder ein, wenn man in die, jetzt ein bisschen tiefer reingeht, kann man sagen, naja, es

Bedeutung der Dokumentation für die Datennutzung

00:08:04
Speaker
gibt das Buch, was ich anfassen kann, aber es gibt auch den Text in dem Buch, der quasi unabhängig von dem physischen Objekt existiert.
00:08:12
Speaker
Es gibt auch Dinge wie Perspektiven oder Bezeichnungen, die quasi auf etwas angewendet werden, die aber nichts mit dem Informationsträger so zu tun haben.
00:08:23
Speaker
Und dann wird das halt spannend, weil
00:08:25
Speaker
immaterielle Sachen zu definieren und festzupacken und die in Verbindung mit der realen Welt zu stellen.
00:08:30
Speaker
Das ist so die Königsdisziplin der Verdatung.
00:08:33
Speaker
Also gibt es unzählige Dimensionen von Daten.
00:08:37
Speaker
Du hast jetzt schon ein paar genannt, Personendaten, Objektdaten, Daten, die messbar sind, Größe, Länge, Gewicht, Daten, die interpretierbar sind.
00:08:48
Speaker
Es sieht für mich alt aus, es sieht für mich neu aus, der Zustand sieht für mich so aus.
00:08:54
Speaker
Konzepte hattest du jetzt schon genannt.
00:08:56
Speaker
Dahinter verbirgt sich...
00:08:59
Speaker
Vielleicht auch die Vorstellung, oder man könnte jetzt meinen, dass man alles zu Daten machen könnte.
00:09:03
Speaker
Gibt es da auch Grenzen?
00:09:04
Speaker
Also was kann man nicht zu Daten machen?
00:09:06
Speaker
Das ist immer die Frage, weil...
00:09:09
Speaker
Was will man wirklich tun?
00:09:12
Speaker
Ich fange mal anders an.
00:09:13
Speaker
Ich sage mal so, man hat ja zum Beispiel in einem Forschungsprojekt eine Forschungsfrage und die will man beantworten.
00:09:19
Speaker
Man will zum Beispiel beantworten, wie ein Kunstobjekt, welchen Weg das genommen hat.
00:09:27
Speaker
Also wo war das zuerst und wem ist das gewechselt?
00:09:30
Speaker
Wann gab es so Lücken?
00:09:32
Speaker
Das möchte man zum Beispiel darstellen und möchte es beantworten, also Provenienzsachen.
00:09:35
Speaker
Ja, ja.
00:09:36
Speaker
Und dafür muss ich bestimmte Dinge aufnehmen.
00:09:38
Speaker
Ich muss zum Beispiel aufnehmen, wer war der Besitzer oder die Besitzerin zu einer bestimmten Zeit?
00:09:42
Speaker
Wann ist das gewechselt?
00:09:43
Speaker
Also verschiedene Datenpunkte.
00:09:44
Speaker
Und dann kann ich die Forschungsfrage beantworten.
00:09:47
Speaker
Dann gibt es Sachen, dass ich zum Beispiel für andere Leute Dinge aufnehme, also so Metadaten nennt man das ja, dass wenn andere sich irgendwie in die Datenbank einloggen oder was suchen, dass die Dinge finden, obwohl die nicht genau wissen, was jetzt ein bestimmter Datenpunkt ist, dass die zum Beispiel so übergeordnete Daten suchen, also Autoren oder Personen haben und etliches.
00:10:08
Speaker
Und dann gibt es halt so Sachen, die ich mache, um Funktionen zu erfüllen, zum Beispiel, dass ich suchen kann, dass ich editieren kann, dass ich analysieren kann.
00:10:15
Speaker
Und daran scheidet sich immer alles.
00:10:18
Speaker
Habe ich das quasi so aufgenommen, also meine Verdatung, meine Punkte, meine Entitäten, meine Eigenschaften von den Entitäten so gebildet, dass ich diese Funktion erfüllen kann, dass ich die Sachen finden kann oder halt nicht?
00:10:30
Speaker
Und deswegen kann man natürlich immer sagen, das ist nicht möglich, weil wenn ich es nicht aufgenommen habe, kann ich es nicht machen.
00:10:34
Speaker
Aber wenn ich mir das vorüberlege, habe ich bis jetzt noch nicht den Fall gehabt, dass Sachen nicht möglich sind.
00:10:39
Speaker
Wenn es natürlich die Datenpunkte nicht gibt, weil da zum Beispiel kein Name drinsteht, dann geht es natürlich nicht, weil ich es nicht weiß.
00:10:46
Speaker
Oder wenn ich zum Beispiel eine Person suche und ich nehme nur den Trivia-Namen von der Person und es gibt aber irgendwie eine Normierung, man hat Daten aufgenommen, hat alle Namen schön normiert und dann suchen Leute aber nach dem Namen, der im 15.
00:10:58
Speaker
Jahrhundert verwendet wurde, dann finde ich es auch nicht.
00:11:08
Speaker
Hier muss sich Robert mal bremsen.
00:11:10
Speaker
So selbstverständlich, wie er von Trivianamen und Normierung spricht, ist das Ganze nämlich nicht.
00:11:16
Speaker
Bei der Erschließung von Werken, Ereignissen oder allgemeiner gesagt bei der Sacherschließung muss man vorher gewisse Entscheidungen auf semantischer und syntaktischer Ebene treffen.
00:11:26
Speaker
Man braucht Regeln.
00:11:27
Speaker
Sonst enden Personennamen in dem Feld von Standorten oder einer im Team schreibt die Titel auf Italienisch und die nächste auf Englisch.
00:11:35
Speaker
Man einigt sich also besser vorher darauf, welche Reihenfolgen man einhält, welche Informationen überhaupt erfasst werden, in welcher Sprache man erfasst und sorgt für eine formale Ordnung, um die Lesbarkeit von Daten für Menschen zu erleichtern.
00:11:50
Speaker
Man versucht auch semantisch und sprachlich möglichst eindeutig zu sein, gerade wenn es um Titel, Themenbereiche oder KünstlerInnen-Namen geht.
00:11:59
Speaker
Das ist mit Vorüberlegungen verbunden.
00:12:02
Speaker
Die Geschichtsschreibung hält nicht viel auf einheitliche Schreibweisen von Namen oder Orten.
00:12:08
Speaker
Noch wilder wird es, wenn Personen Spitznamen oder Neubenennungen erhalten haben.
00:12:12
Speaker
Welchen Namen gebe ich nun in meinen strukturierten Daten an?
00:12:15
Speaker
Viele Institutionen entscheiden sich dafür, die am Haus tradierten Schreibweisen beizubehalten.
00:12:21
Speaker
Aber schon seit dem Beginn der großen Datenbanken in der Kunstgeschichte haben unterschiedliche Akteure versucht, eine Vereinheitlichung durch klare Regeln oder Wortlisten herbeizuführen.
00:12:32
Speaker
In der Dokumentationswissenschaft spricht man dann von einem Thesaurus, einem kontrollierten Vokabular, bei dem sowohl eine systematische Ordnung eines Themenfeldes möglich ist,
00:12:43
Speaker
als auch Synonyme, Ober- oder Unterbegriffe in einer Beziehung zueinander geordnet werden können.

Zweckgerichtete Datensammlung

00:12:50
Speaker
Den einen Thesaurus gibt es aber nicht.
00:12:53
Speaker
Dafür ist unser Fach und die Untersuchungsgegenstände einfach zu komplex.
00:12:58
Speaker
Und so existieren, meist friedlich, nebeneinander unterschiedliche Vokabulare, Thesauri, Normdaten.
00:13:06
Speaker
Es lohnt sich, auf die Bestehenden zurückzugreifen, um eine Anschlussfähigkeit der eigenen Daten an bereits bestehende Datenkonvolute zu erleichtern.
00:13:14
Speaker
Die bekanntesten, die man wahrscheinlich so kennt, das ist die GND, die gemeinsame Normdatei, mit einer Vereinheitlichung von Personen, Körperschaften, geografischen Orten und allen erdenkbaren Sachbegriffen.
00:13:27
Speaker
Schon lange etabliert sind auch die Thesauri von Getty, also zum Beispiel der Art and Architecture Thesaurus, AAT, oder die Union List of Artist Names, kurz ULAN, an denen man sich orientieren kann.
00:13:42
Speaker
Beinahe jedes Land hat da seine eigenen Listen.
00:13:44
Speaker
Da gibt es dann Thesauri für Orte, für Berufe, für Gattungen, naja, quasi über alles, was man irgendwie strukturieren kann.
00:13:51
Speaker
Und nicht zu vergessen, da gibt es auch noch Wikidata,
00:13:54
Speaker
Aber das alles klären wir besser in einer eigenen Folge über Normdaten.
00:14:05
Speaker
Also Daten und Informationssysteme können immer nur die Fragen und Funktionen beantworten, für die sie gebaut wurden.
00:14:10
Speaker
Und das ist halt das Ding.
00:14:12
Speaker
Menschen können Sachen verknüpfen, die können interpretieren, die können quasi durch Erfahrungen neues wissen.
00:14:17
Speaker
Deswegen ist es halt, wenn wir jetzt ein Interview führen, kann ich da viel mehr beantworten.
00:14:20
Speaker
Wenn du ChatGBT fragst, kann der auch ganz viel, aber der kann zum Beispiel nicht bewusst
00:14:25
Speaker
bestimmte Dinge reflektieren und dann eine Frage beantworten, die nicht auf seiner Datenbasis lagen.
00:14:30
Speaker
Menschen können das ein bisschen.
00:14:35
Speaker
Ich müsste die Antwort nehmen und dann dich fragen, ob das stimmt, was mir der Chatbot ausgespuckt hat.
00:14:40
Speaker
Wir können Wahrheit erzeugen.
00:14:42
Speaker
Menschen können das.
00:14:43
Speaker
Also wenn ich das dann richtig verstehe am Anfang, also ich kann jetzt nicht einfach so hergehen und sagen, ich mache jetzt mal alles zu Daten, sondern es ist clever, wenn man sie auch nachnutzen möchte und nicht nur die Maschinen damit füttern möchte, sondern wir als Menschen auch einen Mehrwert davon haben wollen.
00:15:00
Speaker
Es wäre clever, sich vorher Gedanken zu machen, für was brauche ich die eigentlich?
00:15:05
Speaker
Was ist das Ziel und was sollen sie mir aussagen?
00:15:10
Speaker
Also dann in ihrer Gesamtheit.
00:15:12
Speaker
Es gibt ja nicht nur, man legt ja nicht nur eine Person an, sondern man möchte ja jetzt zum Beispiel mal bei Personen bleiben, ein Personennetzwerk sehen.
00:15:21
Speaker
Dann hat man dann irgendwie tausend Personen da drin.
00:15:24
Speaker
Das wäre dann auch so eine Zielvorstellung,
00:15:26
Speaker
Genau, da schwingt es ja schon mit.
00:15:28
Speaker
Das ist ja schon drin.
00:15:29
Speaker
Also man muss immer sehen, Daten, also Fakten oder ganz am Anfang.
00:15:35
Speaker
Wenn wir einfach nur ein Blatt Papier vor uns liegen und da sind Zeichen drauf und Buchstaben, dann hat man so eine Grund, da ist irgendwas drauf geschrieben.
00:15:43
Speaker
Dann geht man weiter und liest ein Wort.
00:15:45
Speaker
Woher wissen wir, dass diese Zeichen ein bestimmtes Wort sind?
00:15:48
Speaker
Weil wir halt das gelernt haben, das verstehen können.
00:15:50
Speaker
Und irgendwann geht es halt los und sagt, okay, man hat Daten, aber Daten für sich.
00:15:54
Speaker
dass man eine Tabelle hat, da gibt es eine Zeile, da steht Personenname und drunter steht zum Beispiel Dürer.
00:16:00
Speaker
Dass das überhaupt eine Bedeutung hat, ist halt nur, dass wir das so interpretieren können.
00:16:04
Speaker
Das heißt, es gibt Daten, die kommen in Zusammenhänge, dann gibt es Informationen, dann lesen wir das, interpretieren wir das und dann wird vielleicht irgendwann Wissen draus.
00:16:13
Speaker
Also es gibt verschiedene Stufen von etwas auf der Welt existiert bis zu wir verstehen, was damit gemeint ist und können damit was anfangen.
00:16:23
Speaker
Und das ist immer gebunden an eine Zielvorstellung, an eine Fragestellung, an eine Funktion, an etwas.
00:16:30
Speaker
Also es ist nicht so, dass einfach wir sagen können, wir nehmen mal alles auf, was es auf der Welt gibt und dann werden wir schon irgendwie Wissen erzeugen, weil das so nicht funktioniert.
00:16:39
Speaker
Andersrum wird ein Schuh draus, dass man sagt, wir wollen etwas wissen, wir haben ein Ziel, wir haben eine Funktion, wir haben etwas und an dem richten wir aus, was wir davon wissen wollen.
00:16:50
Speaker
Und dann müssen wir es auch beschreiben.
00:16:52
Speaker
Und es ist auch so, dass man jetzt halt gemerkt hat, es bringt halt nichts, einfach Tabellen mit Daten zu füllen und dann wird es schon eine Antwort geben, sondern man muss wissen, was steht da drin, wie ist das gemeint, wie sind die definiert, wofür sind die da, in welchem System sind die später, was wollen die Menschen und Maschinen damit anfangen, die da reingucken.
00:17:11
Speaker
Und wenn ich das sauber mache, dann habe ich eigentlich eine ordentliche Datengetriebe in Wissenschaft oder dann kann ich heraus auch was erzeugen und sonst nicht.
00:17:21
Speaker
Und wenn ich das vorher vielleicht noch nicht weiß, also es gab ja jetzt auch unzählige Projekte in den letzten 30 Jahren, digitale Kunstgeschichte, die haben ja auch unglaublich viele Daten erzeugt.
00:17:33
Speaker
Es gibt mehr Datenbanken als Kunstgeschichtsinstitute.
00:17:38
Speaker
Wie könnte man das denn nachnutzen oder kann man die Sachen überhaupt nachnutzen oder bleiben die da in ihrer Datenbank drin und verstauben?
00:17:45
Speaker
Das ist jetzt eine schöne, interessante Frage, weil da haben ja Leute sich Mühe gegeben und über viele Monate, Jahre Daten eingetragen und haben dann gehofft, dass daraus neue Informationen, neues Wissen entsteht.
00:17:58
Speaker
Und jetzt kommt's.
00:18:00
Speaker
Die Frage ist natürlich, wie, also kann ich wirklich Fragen daran stellen, die dann mir eine Antwort geben können?
00:18:07
Speaker
Und jetzt ist es so...
00:18:09
Speaker
Es gibt so verschiedene Arten von Daten.
00:18:16
Speaker
Zum Beispiel ist es so, dass wenn man typischerweise Bibliotheken guckt, dann gibt es sehr grob gehaltene Informationen oder Daten, die dann sagen, okay, was ist der Autor, was ist der Werktitel und so weiter und so fort.
00:18:27
Speaker
Das heißt, sehr viele Leute unabhängig von ihren Fachrichtungen können damit was anfangen.
00:18:32
Speaker
Dann gibt es Forschungsprojekte, die ganz konkrete Fragen stellen.
00:18:35
Speaker
Zum Beispiel, was ich meinte mit diesem Künstler.
00:18:37
Speaker
Ein Projekt, das zur historischen Berufsforschung etwas macht, hat eine andere Vorstellung für einen Künstler als ein kunstgeschichtliches Projekt.
00:18:45
Speaker
Und dann ist es wichtig, dass dazu Kontext und Dokumentation gegeben wird.
00:18:49
Speaker
Und jetzt ist es so, gucke ich in die Datenbank rein und da steht zum Beispiel ganz oben drüber ein Name und die Tabelle heißt T1.
00:18:57
Speaker
und danach steht Bezeichnung und danach steht Ort und danach steht vielleicht Task 1 oder so, dann kann weder der Mensch noch die Maschine wahrscheinlich damit anfangen.
00:19:09
Speaker
Und jetzt ist es halt ganz spannend, haben die Leute, die damals die Daten mal gemacht haben, eine ordentliche Dokumentation gemacht?
00:19:14
Speaker
Das muss nicht unbedingt immer ein Standard sein.
00:19:16
Speaker
Also es muss nicht so sein, dass das, was da steht, es gibt ja schöne Standards in der Kunstgeschichte, auch überhaupt in der Geistwissenschaft,
00:19:23
Speaker
Dass das wirklich ein eindeutig definierter Begriff ist und es kann natürlich auch sein, dass die Forscher oder Forscherin einfach gut dokumentiert haben, gesagt haben, dieses Tabelle soll das und das aufnehmen.
00:19:34
Speaker
Da drin sollen zum Beispiel Personen in dem Kontext aufgenommen werden, die natürliche Personen sind und keine juristischen.
00:19:40
Speaker
Name heißt nur Nachname, da gibt es noch eine Tabelle, die heißt Orta und das ist mit Kopie.
00:19:44
Speaker
Geburtsorten verknüpft, ein Geburtsort wird so und so bezeichnet.
00:19:46
Speaker
Also wenn das existiert, dann kann man zumindest nachträglich, also nicht wenn das angebunden ist, aber zumindest nachträglich kann man das gut verstehen und nachnutzen.
00:19:55
Speaker
Wenn das halt irgendwelche Exit-Tabellen sind, die aus Projekten entstanden sind.
00:19:59
Speaker
wo keiner mehr weiß, was da drinsteht, die auch vielleicht sogar in Dateisystemen entstanden sind, die man nicht mal zusammenbringen kann, dann ist es halt verloren.
00:20:07
Speaker
Dann kann man es wahrscheinlich nochmal machen.
00:20:08
Speaker
Das ist dann zwar traurig, aber das sind ja die Lernprozesse.
00:20:13
Speaker
Wir leben ja auch nicht so, dass wir alles sofort perfekt machen, sondern wir lernen ja ständig daraus, wie wir damit umgehen.
00:20:19
Speaker
Und deswegen würde ich da jetzt nicht so traurig sein drüber, sondern ich würde sagen, ah, okay, das ist vielleicht ein gutes Beispiel, wie es nicht funktioniert.
00:20:27
Speaker
Aber bei vielen, vielen Projekten glaube ich, dass da eine Dokumentation besteht, dass da vielleicht auch Leute, weil sie halt Menschen sind und weil sie halt Dinge aus dem Kontext verstehen können, nachträglich dann auch ausnahmsgewinnen können.
00:20:38
Speaker
Da muss ein bisschen Arbeit reingesteckt werden, aber es geht schon.
00:20:40
Speaker
Aber wie viel das ist, das ist halt dann immer die Frage.
00:20:44
Speaker
Das heißt, die Daten sind da auch immer nur so gut wie der Kommentar und die Erklärung zu den Daten.
00:20:49
Speaker
Ja, auf jeden Fall.
00:20:50
Speaker
Also ich bin sehr, sehr stark davon überzeugt, dass Daten nur so gut sind wie die Doku, die darüber existiert.
00:20:58
Speaker
Weil, wie gesagt, wir Menschen verstehen viele Dinge aus dem Kontext daraus.
00:21:01
Speaker
Wir können aus impliziten Sachen viel rausnehmen.
00:21:05
Speaker
Computer können das nicht, da muss alles explizit sein, da muss genau dastehen, was das heißt.
00:21:10
Speaker
Und wenn ich das nicht mache, wird das nicht verständlich und nicht aussagekräftig.
00:21:14
Speaker
Das heißt, jedes Mal, wenn ich ein Datenprojekt mache,
00:21:18
Speaker
Es ist ganz wichtig, genau zu dokumentieren, was nehme ich da auf?
00:21:21
Speaker
Was ist die Fragestellung?
00:21:22
Speaker
Für wen mache ich das?
00:21:23
Speaker
Mache ich das halt für die Leute, die da drin forschen und oder für andere Menschen?
00:21:28
Speaker
Was wollen die Menschen wissen, die daran forschen?
00:21:30
Speaker
Was wollen die Menschen wissen, die das vielleicht nachnutzen?
00:21:33
Speaker
Und das muss ich wirklich aufschreiben, mir klar machen.
00:21:36
Speaker
Und ich meine User Stories ist, was man vielleicht mal hört und viele Leute denken, also
00:21:41
Speaker
kennen das jetzt inzwischen, weil es ja auch Metadatenkonzepte gibt oder Hauptforschungsdatenpläne und so weiter und so fort, da steht es vielleicht mal drin und machen das eher so stiefmütterlich, aber das ist ein ganz zentraler Punkt, weil wenn ich das nicht mache, dann nehme ich zum Beispiel, komme ich oft in die Situation, dass ich Daten aufnehme, die ich denke, oh, die könnten wichtig sein.

Iterative Datenmodellierung

00:22:01
Speaker
und benutze die nie wieder.
00:22:02
Speaker
Oder man verrennt sich und stellt plötzlich fest, von den vielen schönen Sachen, die ich machen wollte, schaffe ich das nicht mehr, weil ich gar nicht mehr die Fülle aufnehmen kann.
00:22:10
Speaker
Und deswegen ist es ganz wichtig zu sagen, okay, also erster Punkt, für wen mache ich das?
00:22:14
Speaker
Für mich, für mein Projekt, für andere Menschen?
00:22:18
Speaker
Was sind die Fragestellungen?
00:22:19
Speaker
Was brauche ich dazu, um diese Fragestellungen zu beantworten?
00:22:22
Speaker
Was ist das System, was ich nutze?
00:22:23
Speaker
Welche Funktion möchte ich anbieten?
00:22:25
Speaker
Gibt es eine Suche?
00:22:25
Speaker
Gibt es Bearbeitung?
00:22:27
Speaker
Gibt es irgendwelche fancy Viewer, die Sachen rausnehmen sollen und highlighten oder was auch immer?
00:22:32
Speaker
Wie will ich das anbieten?
00:22:34
Speaker
Also das sind so Fragen, die man hat und dann schreibt man sich das täglich auf und sagt zum Beispiel, ja, Maria, Kunststudentin an der Uni, sucht nach bestimmten Kunstwerken, sie möchte die alle nach Datum geordnet haben und dazu soll sie rechts ein Bild haben, wenn sie draufkommt, dass sie es sieht.
00:22:48
Speaker
Also wirklich ganz praktische Dinge, die wirklich...
00:22:52
Speaker
gemacht werden sollen damit.
00:22:54
Speaker
Ihr denkt euch praktisch dann so eine Persona aus mit so einem Nutzungsszenario.
00:22:57
Speaker
Genau.
00:22:58
Speaker
Und dann hat man vielleicht fünf, sechs Personas und merkt, okay, diese ganzen Nutzungsszenarien wären nice to have, aber wir haben nur drei Projektjahre.
00:23:06
Speaker
Konzentrieren wir uns auf die wichtigsten und priorisiert dann?
00:23:11
Speaker
Richtig.
00:23:11
Speaker
Also das ist, man sucht sich, also am Anfang ist ja quasi diese Planungsphase, die heißt ja nur, was wollen wir erstmal machen?
00:23:20
Speaker
Also richtig positivistisch rangehen, weil da macht man es ja noch nicht.
00:23:23
Speaker
Man nimmt sich aber explizit Zeit und sagt sich, okay, was wollen wir wirklich tun?
00:23:27
Speaker
Und wie sieht das praktisch aus?
00:23:29
Speaker
Und da muss man ja noch keine Daten aufgenommen haben.
00:23:31
Speaker
Also das ist ja wirklich nur die Fragestellung, das sind die Funktionen, die man hat.
00:23:35
Speaker
Hat man diese ganzen Personen, also fiktiven User-Stories,
00:23:39
Speaker
Und fängt an und sagt, okay, was muss ich denn dazu aufnehmen?
00:23:42
Speaker
Was geben die Quellen her?
00:23:43
Speaker
Und das ist so deduktive Datenschema, also deduktiv rangehend im Sinne von, ich habe vorher aus meiner Forschungsliteratur was gelesen, ich habe Bedürfnisse vorher mir festgelegt und dann weiß ich zum Beispiel, wenn man nach Personen suchen will, braucht man halt eine Person mit wahrscheinlich Personennamen.
00:24:00
Speaker
Und dann fängt man an, die Quellen oder den Forschungsgegenstand anzuschauen und stellt fest, hm,
00:24:05
Speaker
Ich habe jetzt hier Objekte und auf den Objekten gibt es etwas, was ich vorher gar nicht beachtet habe.
00:24:10
Speaker
Zum Beispiel, dass es ein bestimmtes Bildmotiv gibt oder ein bestimmtes Material, was irgendwie sehr heraussticht und deswegen induktiv aus der Arbeit vom Projekt einen neuen Datenpunkt erhebe.
00:24:22
Speaker
Vorher gehe ich also mit meinen normalen Fragen ran, die ich vorher hatte und bei der Arbeit fallen mir neue Sachen auf.
00:24:26
Speaker
So und jetzt kommt es ja, wie gewichte ich das?
00:24:30
Speaker
Was nehme ich wirklich auf, was nicht?
00:24:32
Speaker
Und dann ist es so, dass ich zum Beispiel empfehle zu sagen, wir gehen in Iterationen vor, gucken unseren Forschungsstand an und wissen zum Beispiel, ich habe 5000 Objekte, die ich untersuchen will.
00:24:42
Speaker
Sind die Objekte alle gleich geformt?
00:24:45
Speaker
Gibt es unterschiedliche Datendichten?
00:24:47
Speaker
Ist zu manchen sehr viel bekannt, zu manchen sehr wenig?
00:24:49
Speaker
Und dann bilde ich mir so eine kleine Stichprobe raus und sage zum Beispiel so, okay, ich habe zwar 5000 Objekte, aber ich gucke mir erst mal 50 an, die so ungefähr die Bandbreite der vorhandenen Forschungsgegenstände repräsentiert.
00:25:01
Speaker
Und dann sage ich, okay, was sind denn die wichtigsten Punkte für andere Leute, so kurative Daten?
00:25:06
Speaker
Was wollen die wissen, wenn ich das suche?
00:25:08
Speaker
Weil die sind meistens schnell aufzunehmen, also der Autor zum Beispiel oder der Künstler, Herstellungsdatum, Material, solche Sachen, die rattert man meistens gut durch.
00:25:18
Speaker
Und dann gibt es das Zweite.
00:25:20
Speaker
Was sind denn für mich richtig wichtige Daten, die ich brauche, um eine Forschungsfrage zu beantworten?
00:25:25
Speaker
Und das ist das, was ich auf jeden Fall erfüllen muss.
00:25:27
Speaker
Und dann kann ich 50 Objekte machen, gucken, ob das irgendwie gut klappt, baue mein Datenmodell und dann nehme ich die nächsten 50 und gucke halt rein, verändert sich da was, switcht da was um.
00:25:36
Speaker
Und dann habe ich zum Beispiel 100 Objekte aufgenommen, habe ein Datenmodell gebildet, habe die wichtigsten Sachen beantwortet, habe zum Beispiel alles zusammen, wenn ich das so weitermachen könnte, könnte ich die grundlegenden Funktionen erfüllen und dann rechne ich hoch.
00:25:47
Speaker
Wenn ich das mit allen Daten, also mit allen Objekten machen würde, mit allen 5000, reicht meine Zeit.
00:25:52
Speaker
Wenn die Zeit dann schon nicht reicht, dann habe ich ein richtiges Problem.
00:25:55
Speaker
Das heißt, irgendwie mal 200 aufnehmen und dann merken, oh Gott, wir haben bei der Hälfte was vergessen und dann müssen wir jetzt nachträglich nochmal neue Kategorien bilden und neue Klassifikationen einbauen, ist Worst-Case-Szenario?
00:26:07
Speaker
Naja, nicht unbedingt.
00:26:08
Speaker
Und wie gesagt, jetzt kommt ja auf die Zeit drauf an.
00:26:10
Speaker
Das ist
00:26:12
Speaker
Ich sage mal, die wichtigsten Sachen müssen wir erfüllen, weil da steht ja meistens im Projekteintrag oder im Antrag oder in der eigenen Vorhaben.
00:26:18
Speaker
Wenn das nicht so ist, dann muss ich natürlich kürzen, muss irgendwie bitter, also dann muss man überlegen, aber das sollte man sich vorher halt klar machen.
00:26:25
Speaker
Aber in den meisten Fällen würde ich sagen, ist es so, wenn man nicht halbwegs völlig überzogen war, ist es so, dass man dann ein bisschen Zeit hat oder sagt so, okay, das schaffe ich alles, ich habe hochgerechnet, wir haben ein Dreijahresprojekt, wenn ich das alles jetzt aufnehme, habe ich irgendwie ein Jahr Daten aufgenommen.
00:26:40
Speaker
Dann rechne ich ein Drittel drauf, weil immer was dazwischen kommt und sagst, okay, ich habe also quasi in meinem Projekt noch eineinhalb Jahre Zeit.
00:26:48
Speaker
Das ist jetzt fiktive Rechnung, aber so ungefähr rangehen und dann sagen, okay, was ist jetzt, was kommt zum Beispiel induktiv aus den Daten heraus?
00:26:55
Speaker
Also was sehe ich, ist jetzt interessant, was ist was, was ich nicht beachtet habe?
00:26:59
Speaker
Und dann gehe ich immer so die Durchläufe durch.
00:27:00
Speaker
Immer gucke dann rein, forme mein Datenmodell, rechne mal hoch, schaue, ob ich das quasi zeitlich schaffe, gucke, ob das auch wirklich gleichbleibend ist, also ob nicht nur irgendwie ich jetzt durch Zufall zwei Objekte gefunden habe, die super datendicht sind, wo Sachen drinstehen, die ich nie hatte, sondern ist das auch wirklich irgendwie verteilt.
00:27:15
Speaker
Ist das interessant für die Community?
00:27:16
Speaker
Mache ich mal einen Vortrag drüber, stelle das mal anderen Leuten vor, viel miteinander darüber reden, verstehen das die Menschen, was ich eigentlich machen will, finden das interessant, such den Kontakt zur Community.
00:27:26
Speaker
Und das sind Iterationen.
00:27:27
Speaker
Das heißt, ich mache das mehrmals und forme so Datenmodell und Zeitplan.
00:27:33
Speaker
Und wenn man das wirklich beachtet, was ich auch oft nicht mache, weil man ja gedrungen ist und was plötzlich vertieft in seinem Forschungsgegenstand ist, aber wenn man das sich beibringt und beachtet, dann ist man auf einem ganz guten Weg, weil dann hat man für sich seine Fragen beantwortet, gibt was an die Community zurück.
00:27:50
Speaker
weil man auch die mit beachtet hat und man hat ein Daten aufgenommen, ein Datenmodell gebaut, was halt zweckmäßig ist.
00:28:01
Speaker
Was ich da jetzt total spannend dran finde, und dann bin ich ja Kunsthistorikerin und komme aus meiner geisteswissenschaftlichen Haut nicht raus, ist die Mischung des Methodenansatzes.
00:28:10
Speaker
Also auf der einen Seite ein ganz klares methodisches Vorgehen definiert, mit einer Methode des Verfahrens und des Prozesses zum Erkenntnisgewinn.
00:28:20
Speaker
Also was möchte ich aus den Daten rauslesen?
00:28:21
Speaker
Für was mache ich das überhaupt?
00:28:23
Speaker
Die Zweckgebundenheit auch, überhaupt mit Daten zu arbeiten und nicht einfach so, na, dann machen wir halt mal ein paar Daten.
00:28:31
Speaker
Kombiniert mit deinem iterativen Vorgehen, das wahrscheinlich eher deine Informatikernatur ist, das finde ich eine total spannende Herangehensweise, weil da ist ja auch noch vieles offen.
00:28:45
Speaker
Man hat zwar dann diese Methode, man hat diesen Plan des Vorgehens, es heißt aber auch, dass da Raum zum Explorieren ist, zum Entdecken und zum Erkunden.
00:28:57
Speaker
Der Witz ist, dass es ja gar nicht informationstechnisch spezifisch ist, sondern das ist eine Heuristik, das machen eigentlich Geistwissenschaftler ständig.
00:29:04
Speaker
Das klingt jetzt so, weil das natürlich sagt, man holt sich Daten raus, man macht eine Stichprobe und bla bla bla.
00:29:08
Speaker
Aber im Prinzip ist es so, wenn man eine Quelle liest und man kennt sich mit dem Themengebiet überhaupt nicht aus.
00:29:13
Speaker
Also jetzt Geschichtswissenschaft, ich komme aus der Geschichtswissenschaft, das hört man vielleicht so ein bisschen raus.
00:29:17
Speaker
Aber man liest eine Quelle, kennt sich eigentlich nicht aus und hat keine Ahnung und liest die und an der Quelle bilden sich so langsam Punkte raus.
00:29:24
Speaker
dass man weiß, ah, okay, vielleicht ist das gemeint, vielleicht gibt es da irgendwie Zusammenhänge und dann liest man mit dem Vorwissen die nächste Quelle und versteht die natürlich besser.
00:29:32
Speaker
Und im Prinzip ist es auch so eine Form-Iteration, weil wenn man dann fünf Quellen gelesen hat und dann nochmal zur ersten zurückkehrt, dann versteht man die ja auch wieder viel, viel besser, weil man dann das Umwissen hat.
00:29:42
Speaker
Und ähnlich ist es bei dem Vorgang der Methodik mit den Daten.
00:29:46
Speaker
Ich hole mir ein Stück raus, versuche das zu verstehen und
00:29:51
Speaker
Also Verdatung und Datenmodelle bilden ist für mich auch eine Form von einer Hermeneutik, also von einem Sinnverstehen von etwas, dass ich mit einer bestimmten Methode an was rangehe und versuche, was ist der Kern der Sache?
00:30:02
Speaker
Was ist das, was die wirkliche Information trägt?
00:30:05
Speaker
Was ist wirklich gemeint, wenn ich von einer bestimmten Entität rede?
00:30:10
Speaker
Was ist denn unter Person gemeint?
00:30:12
Speaker
Ist es denn Person jetzt etwas, was nur menschliche Wesen sind, die leben?
00:30:16
Speaker
Oder sind es auch Dinge, die fiktiv sind?
00:30:18
Speaker
ist quasi eine Person in einem Buch, die es gar nicht wirklich gab, eine Person oder nicht.
00:30:26
Speaker
Und ein normaler Mensch denkt, also normaler Mensch, auch Datentechniker sind normale Menschen.
00:30:32
Speaker
Kunsthistorikerin auch.
00:30:36
Speaker
Ja, aber ich meine, dass man so eine Vorstellung hat davon, was ist eine Person.
00:30:41
Speaker
Und
00:30:42
Speaker
Datenmodelle bilden oder Daten aufnehmen, zwingt einen dazu, das zu hinterfragen, um was es da eigentlich geht.

Gemeinsame Definitionen in Datenprojekten

00:30:50
Speaker
Und ich finde, das ist eine wunderbare Sache, um sich mit seinem Forschungsgegenstand auseinanderzusetzen.
00:30:54
Speaker
Und das ist etwas, was halt nicht irgendwie, also für viele ist es lästig, weil sie dann plötzlich Sachen, die, es ist doch klar, was eine Person ist, sagen.
00:31:00
Speaker
Und dann sagen wir als Datentechniker, nee, ist es nicht.
00:31:03
Speaker
Was ist denn eine Person?
00:31:04
Speaker
Das ist ein Mensch.
00:31:06
Speaker
Ja, aber wie lebt der?
00:31:07
Speaker
Lebt der nicht?
00:31:07
Speaker
Ist der ein Buch?
00:31:08
Speaker
Das müssen wir alles aufnehmen, damit wir sagen können, okay, wenn du darüber redest, dann können wir das halt, wenn eine Suche startet, sagen, okay, das gehört alles dazu.
00:31:16
Speaker
Oder wir müssen nochmal teilen, juristische und natürliche Personen, weil man Institutionen trennen will und so weiter und so fort.
00:31:21
Speaker
Und das ist dann nervig für viele Leute, aber es ist halt wichtig, damit Mensch und Maschine wirklich weiß, worum es geht.
00:31:26
Speaker
Und ich finde das halt, das ist was Positives.
00:31:29
Speaker
Das ist was, was uns hilft, Dinge besser zu verstehen.
00:31:32
Speaker
Und darum geht es eigentlich.
00:31:33
Speaker
Ich glaube, ich habe auch noch nie mit Kunsthistorikerinnen und Kunsthistorikern so viel über Kategorien diskutiert, wie mit den Personen, die die Datenbanken gebaut haben.
00:31:46
Speaker
Ja, das ist das.
00:31:47
Speaker
Die Kategorie ist unser heiliges Ding, was wir so rumtragen und sagen, worum geht's?
00:31:53
Speaker
Wie beschreiben wir das?
00:31:54
Speaker
Was ist das wirklich?
00:31:58
Speaker
Jetzt kommen wir aber zu dem Knackpunkt.
00:31:59
Speaker
Also
00:32:01
Speaker
Ich nehme die Daten auf.
00:32:02
Speaker
Du hast vorhin das Wort verdaten gesagt.
00:32:04
Speaker
Also ich mache etwas zu Daten mit einer speziellen Zielvorstellung.
00:32:09
Speaker
Dann sitzt man ein Team zusammen, das macht man natürlich nicht alleine, debattiert Stunden um Stunden über die Kategorien, über die Definition der Kategorien.
00:32:18
Speaker
Und dann ist man auch ganz fix und dokumentiert das auch, dass alle wissen, was man eigentlich unter dem Begriff versteht.
00:32:25
Speaker
Wie schafft man es, dass nicht alle ihre eigenen Interpretationen und ihre eigenen Begriffe so wild durcheinander werfen?
00:32:34
Speaker
Du hast vorhin schon von Standards gesprochen.
00:32:36
Speaker
Also gibt es in der Kunstgeschichte Standards, auf die man sich schon geeinigt hat, wo man sagt, okay, ihr braucht nicht schon wieder die Personendiskussion führen.
00:32:44
Speaker
Wir haben das einmal für euch definiert.
00:32:47
Speaker
Hier ist unsere Definition, nehmt das bitte und dann können wir endlich bei anderen Kategorien weitermachen und über Wichtigeres sprechen.
00:32:53
Speaker
Oder ist das immer noch eine Sache, die in Verhandlung ist?
00:33:01
Speaker
Also, jetzt muss ich mich bloß ein bisschen vorsichtig ausdrücken, weil es gibt zwei...
00:33:08
Speaker
Also ich fange mit zwei Perspektiven an, die mir so begegnet sind.
00:33:12
Speaker
Perspektive eins ist die, ich weiß es am besten Perspektive, weil ich dazu schon sehr lange forsche und meine Definition ist sowieso die, an die sich alle halten müssen.
00:33:22
Speaker
Und das ist natürlich in der Wissenschaft, kommt das vor, auch zu öfter als man denkt.
00:33:28
Speaker
Und das ist halt so, weil das aber daran hängt, dass man zu einem bestimmten Forschungsgebiet forscht.
00:33:33
Speaker
Wenn das individuell bleibt oder bei wenigen Personen, dann ist es immer noch okay.
00:33:38
Speaker
Dann hat man zum Beispiel seine eigene Definition von Künstler oder was weiß ich.
00:33:42
Speaker
Jetzt geht es aber los, dass Daten oder von Titel oder von was auch immer man hat.
00:33:47
Speaker
Man hat das lange für sich, also in seinem Kontext oder in ihrem Kontext war das zweckmäßig.
00:33:56
Speaker
Und das Schöne an Daten und Computern ist ja, dass wir das dann alle weitergeben können.
00:34:00
Speaker
Dass wir nicht mehr ein Buch haben, was in einer Bibliothek steht.
00:34:02
Speaker
Man muss da hingehen und das Buch rausziehen und es lesen oder die Tabelle angucken, sondern wir können das ins Internet stellen und viele, viele, viele Leute können das nachnutzen.
00:34:10
Speaker
Und das heißt, es...
00:34:11
Speaker
Es ist halt schön, dass es dann nicht nur eine ganz spezifische, projektgebundene, personengebundene Definition gibt, sondern dass möglichst viele Leute damit was anfangen können.
00:34:19
Speaker
Und das führt dazu, dass man halt nicht komplett seine Definition vielleicht durchsetzt, sondern eine, die intersubjektiv geteilt wird.
00:34:27
Speaker
Standards sind ein Weg, dass sich diese schlauen Leute hingesetzt haben und gesagt haben, wir versuchen das mal, dass wir möglichst breite Definitionen aufstellen.
00:34:36
Speaker
Dass wir sagen, okay, dass möglichst viele Leute damit was anfangen können.
00:34:40
Speaker
Das heißt nicht, das ist ja das Missverständnis, dass das immer genau so perfekt auf mein Projekt passt.
00:34:45
Speaker
Das heißt, es ist ein Anfangspunkt.
00:34:47
Speaker
Das ist etwas, das kann passen.
00:34:49
Speaker
Das kann zum Beispiel Titel oder biologisches Objekt oder so, das kann irgendwie in mein Forschungsmodell passen oder halt nicht.
00:34:57
Speaker
Aber ich würde sagen, das haben Leute gemacht, damit man eine gute Orientierung hat.
00:35:01
Speaker
Zum Beispiel, dass man daran denkt, wir hatten vorhin schon eine Mission von Daten, dass es verschiedene Dimensionen gibt, die ich mitdenken will.
00:35:07
Speaker
Wir hatten dieses Kurative, das es für andere außerhalb meines Projektes zu nutzbringt oder nur innerhalb meines Projektes.
00:35:14
Speaker
Ist es so, dass es Chronologien gibt?
00:35:16
Speaker
Also beachte ich, dass es zu einem anderen Zeitpunkt der Geschichte vielleicht eine unterschiedliche Perspektive gab, wie ich die reinbringen kann?
00:35:24
Speaker
Ist es irgendwie wichtig, dass ich verdaten kann, dass es aktuell gültig ist oder dass es falsch ist?
00:35:33
Speaker
Kann ich zum Beispiel so Informationsstatus mitgeben?
00:35:37
Speaker
Also es sind so viele Dinge, die hat man sich bei Standard schon mal überlegt.
00:35:41
Speaker
Und vor allem hat man sich überlegt, was sind denn die grundsätzlichen Informationen, die ich überhaupt aufnehmen will.
00:35:49
Speaker
Und jetzt, wenn ich ein Beispiel bringen darf, ist es so, woran man das meistens merkt, ist, man hat einen sehr berühmten, echten, sag ich, echter Standard, weil der ist wirklich ISO-zertifiziert.
00:35:59
Speaker
Das ist das C-Doc-CAM.
00:36:01
Speaker
Also C-Doc-CAM, das ist ja jetzt eine Abkürzung.
00:36:03
Speaker
Für was steht das denn?
00:36:04
Speaker
Es sind zwei Teile.
00:36:05
Speaker
CIDOC ist das Institutionale Komitee für internationale Dokumentation.
00:36:10
Speaker
Ah ja, genau, vom ICOM, also vom Museumsverband.
00:36:13
Speaker
Ja, und das CRM, das ist der wichtige Punkt, das ist das Conceptual Reference Model.
00:36:18
Speaker
Und es geht halt darum, dass sich Leute ausgedacht haben, wie kann ich denn in den Sammlungen, Museumswissenschaften oder vielleicht sogar breiter in geisteswissenschaftlichen Glam-Institutionen Dinge beschreiben und definieren.
00:36:32
Speaker
Und der Witz daran ist, dass es nicht jetzt irgendeine Technik ist oder dass es irgendwie gebunden ist an ein Dateiformat oder irgendwie so ein Kram, sondern das ist eher so, dass man sich überlegt hat, gibt es Konzepte in unserem Themenbereich, in unserer Wissensdomäne, also Domäne im
00:36:47
Speaker
den akademischen oder gesellschaftlichen Bereich, in der wir uns bewegen, was wichtig ist, um Dinge zu beschreiben.
00:36:54
Speaker
Da haben sich aus vielen Ländern der Welt Leute zusammengesetzt und haben überlegt, okay, was brauchen wir?
00:36:59
Speaker
Und dann sind da so Sachen drin, wie zum Beispiel das menschengemachte Objekt,
00:37:05
Speaker
oder die Person oder der Herstellungsprozess.
00:37:08
Speaker
Und das Spannende daran ist, dass wir zum Beispiel andere Modelle haben.
00:37:12
Speaker
Es gibt zum Beispiel sowas wie ein Dublin Core.
00:37:14
Speaker
Das wird von Bibliotheken benutzt oder von Archiven, um vor allen Dingen halt bibliografische Daten aufzunehmen.
00:37:21
Speaker
Und jetzt gibt es was ganz Spannendes.
00:37:22
Speaker
Und zwar ist es so, dass man gemerkt hat, es gibt, oftmals sagt man,
00:37:28
Speaker
Versucht man Daten objektzentriert aufzunehmen.
00:37:31
Speaker
Man hat zum Beispiel eine Person und sagt, Person hat einen Namen.
00:37:33
Speaker
Oder Person hat einen Gegenstand gemacht.
00:37:36
Speaker
Oder eine Person ist an einem Geburtsort.
00:37:38
Speaker
Und das Spannende, was zum Beispiel C-Doc macht, was C-Doc CRM macht, ist, dass es sagt, ich bin eventbasiert, also prozessbasiert.
00:37:45
Speaker
Es ist nicht so, objektzentriert würde man sagen, objektzentriert.
00:37:49
Speaker
Person hat gemacht Gegenstand und das C-Doc sagt, Person war beteiligt an einer Herstellung, Herstellung hatte ein Resultat, Objekt.
00:37:59
Speaker
Wenn man das überlegt, stellt man fest, da kommt etwas rein, dass man gemerkt hat, die Welt besteht vielleicht nicht unbedingt aus direkten Verknüpfungen, sondern aus Prozessen, an die Dinge gebunden sind.
00:38:09
Speaker
Und sowas zum Beispiel, dass man das auf Anhieb, aus sich heraus, ohne Kenntnis zu der C-Doc, darauf kommt, das ist schmerzhaft.
00:38:19
Speaker
Weil man fängt dann an und dann stellt man während des Verdaten fest, verdammt, eigentlich stellt da was her und es hat auch ein Herstellungsdatum und jetzt muss ich das irgendwie zusammenbringen.
00:38:26
Speaker
Und dann sind Standards extrem gut, weil die ganz diese Überlegungen und diese Dritte und diese Fallstricke alle schon mal durchgegangen sind und dann halt gesagt haben, okay, wir haben eine Lösung dafür.
00:38:38
Speaker
Und es gibt verschiedene Metadatenstandards oder Metadatenschemen oder Datenschemata, eher so gesagt, die in verschiedenen Bereichen der Kunstgeschichte oder der Wissenschaft das schon mal gemacht haben.
00:38:53
Speaker
Und wie gesagt, es gibt C-Doc, das ist halt eventbasiert, sehr groß, sehr breit.
00:38:56
Speaker
Es gibt abgespeckte Versionen, Lido zum Beispiel.
00:39:00
Speaker
Das ist zum Beispiel ein bisschen flacher und das ist halt durch eine bestimmte Struktur gebunden.
00:39:04
Speaker
Also wie gesagt, da gibt es verschiedene Sachen, das will ich jetzt hier nicht direkt ausführen, aber es gibt so Nuancen und krasse Unterschiede.
00:39:10
Speaker
Und zum Beispiel ist es so, wenn man halt das durchgeht und sich das mal anguckt, dann stellt man fest, oh ja, das ist eigentlich eine gute Sache, wie ich das machen würde.
00:39:17
Speaker
Da ist jetzt zum Beispiel beim C-Doc halt nicht meine Muschelschale drin,
00:39:21
Speaker
sondern nur das biologische Objekt, aber dann verfeinere ich das.
00:39:23
Speaker
Also wie gesagt, man muss immer sagen, diese Standards und Meda-Daten-Schemen und Datenschemen, das ist nicht der Wahrheit letzter Schluss, das ist die Orientierung zu etwas.
00:39:31
Speaker
Und das hilft einem und es lohnt sich immer, das anzugucken.
00:39:34
Speaker
Immer, immer, immer.
00:39:35
Speaker
Also selbst wenn man so total überzeugt ist, dass das Projekt, das man hat, super individuell ist und ganz nur auf der eigenen Erfahrung beruhen muss, trotzdem lohnt es sich, allein schon wegen der Methodik da reinzugucken.
00:39:46
Speaker
Das heißt also, immer wenn wir von Daten sprechen, meinen wir nicht irgendwie einen Datenpunkt, einen Eintrag in irgendeinem Tabellenfeld, sondern wir sprechen eigentlich auch von den Konzepten, die dahinter liegen, also Metadaten-Schemata oder Datenschemata und Konzepten, wie diese Daten überhaupt aufgenommen wurden.

Datenrepräsentation und institutionelle Bereitschaft

00:40:07
Speaker
Verstehe ich das richtig?
00:40:07
Speaker
Ja, also auf jeden Fall, weil das ist,
00:40:11
Speaker
Wir denken das immer mit.
00:40:13
Speaker
Ein schönes Beispiel ist, ich mache ein Projekt über Keramiken oder Urnen.
00:40:18
Speaker
Sagen wir Urnen.
00:40:19
Speaker
Und ich mache dieses Projekt und ich erwähne nirgendwo in meinem Datentabelle, dass es um Urnen geht.
00:40:26
Speaker
Ich nehme das auf, ich mache die Materialien, ich mache die Hersteller, die Künstler, die Künstlerinnen, ich schreibe das alles schön auf, aber da steht nirgendwo keine Tabelle, steht, hallo, hier geht es um Ohren.
00:40:36
Speaker
Der Mensch weiß das, der sieht das und hat das Projekt gelesen und weiß, das ist ein Ohrenprojekt, aber der Computer oder wenn man nur die Tabelle anguckt, ich gebe es an jemanden und habe das nicht, der weiß es nicht.
00:40:47
Speaker
Und das sind zum Beispiel Sachen, der Kontext schwingt halt immer mit.
00:40:49
Speaker
Und das Schöne am Menschen ist, dass wir aus unseren Erfahrungen Kontexte und Bedeutungen implizit erschließen können.
00:40:57
Speaker
Und je mehr Informationen wir über das haben, je mehr Erfahrung haben, wird es leichter.
00:41:01
Speaker
Kann natürlich auch falsch sein, wenn wir falsche Annahme haben.
00:41:04
Speaker
Und das Schöne an Daten ist halt, wenn das gut gemacht ist, wenn die schön explizit sind, dann lassen die diesen Interpretationsspielraum, dann wird der kleiner.
00:41:13
Speaker
Und das ist für manche halt schwieriger, weil man sagt, dann kann ich halt weniger Informationen rausholen.
00:41:17
Speaker
Und ich sage, ja, aber es wird auch genauer, weil man halt weiß, worum es geht.
00:41:21
Speaker
Jetzt ist es ja so, dass wir nicht alle in unserer Forschung Daten produzieren oder beziehungsweise verdaten wollen.
00:41:28
Speaker
Das ist ganz oft die Aufgabe von großen datengebenden Institutionen.
00:41:33
Speaker
Du hattest ja bereits GLAM angesprochen, also Galleries, Libraries, Archives, Museums.
00:41:39
Speaker
Gerade in der digitalen Kunstgeschichte möchte man ja datengetriebene Wissenschaft machen.
00:41:44
Speaker
Das heißt, ich würde mir in meinen Forschungsmodellen die Daten von woanders hernehmen, sie aufeinander angleichen, anpassen und dann damit forschen.
00:41:55
Speaker
Sind diese Konzepte oder diese Art und Weise zu forschen von den datengebenden Institutionen überhaupt schon vorbereitet?
00:42:04
Speaker
Also sind die Metadatenschemata und die Art, wie wir Daten von Museen oder Bibliotheken bekommen, überhaupt dazu geeignet?
00:42:15
Speaker
Das ist sehr unterschiedlich.
00:42:17
Speaker
Aber ich meine, nehmen wir zum Beispiel ein Beispiel.
00:42:19
Speaker
Es gibt so arthistorikum.net und da gibt es verschiedene Untersektionen, also HiData und HiDicon und was ist das?
00:42:25
Speaker
Also gibt es verschiedene Repositorien und natürlich ist es so, dass wenn das gerade Leute sind oder Institutionen sind, die das schon länger machen, dann achten die natürlich darauf, dass bestimmte grundsätzliche Sachen erfüllt sind.
00:42:36
Speaker
Zum Beispiel, dass es ein Metadatenschema gibt, wo es halt klar ist, was ist denn unter einem bestimmten Bereich gemeint?
00:42:41
Speaker
Also oder einer bestimmten Entität oder eine Beschreibung davon.
00:42:44
Speaker
Also da kann man gucken und dann gibt es ja auch die wundervolle NFDE4Culture inzwischen.
00:42:50
Speaker
Da gibt es ein Helpdesk und da gibt es ein Resources, wo man sich Repositorien angucken kann.
00:42:55
Speaker
Und die achten ja zum Beispiel darauf, dass da, wenn etwas genannt wird, dass es halt grundsätzlich eine bestimmte Qualität erreicht.
00:43:03
Speaker
Da kann man einfach mal gucken.
00:43:04
Speaker
Ich bin ja zum Beispiel am Germanischen Nationalmuseum.
00:43:07
Speaker
Wir machen ja auch unabhängige Projekte, also oder von uns halt Projekte und wir haben ja schon seit langer, langer Zeit Forschungsdatensysteme, die zum Beispiel auf Standards aufbauen.
00:43:17
Speaker
Das heißt, wenn man bei uns ein Projekt anguckt, so die Tafelmalerei oder den Norbertkatalog und dort halt die Schnittstelle anfasst
00:43:25
Speaker
und sich die Daten lädt oder da reinschaut, dann sieht man, ah, die verwenden zum Beispiel Linked Open Data, also Daten, die nicht nur halt erreichbar sind und die findbar sind und die zugreifbar sind und also diese Fair-Prinzipien, die man kennt, sondern
00:43:42
Speaker
Wenn ich da reinschaue, dann sehe ich, ah, da gibt es eine Beschreibung zum Beispiel, was das heißt, weil Linked Open Data ist halt auch eine bestimmte Form von, wie speichere ich Daten und dass ich zum Beispiel zu all meinen Entitäten und Eigenschaften auch die Beschreibung speichere.
00:43:56
Speaker
Das heißt, unabhängig von der Oberfläche sehe ich, wenn ich die Daten lade, immer was die bedeuten.
00:44:03
Speaker
Und das ist zum Beispiel so ein Punkt, da kann man schon mal schauen, also welche Repositorien gibt es, die dafür sorgen, zum Beispiel wirklich Linked Open Data anzubieten, die auch wirklich da bleiben, wo sie sind, die ich erreichen kann, also diese Fertprinzipien.
00:44:16
Speaker
Ich finde es auch noch wichtig zu nennen, dass auch so Care-Prinzipien oder dass man halt auch mal drauf schaut, ob die auch so ethischen, moralischen Grundsätzen entsprechen.
00:44:23
Speaker
Das ist jetzt nur so nebenbei.
00:44:25
Speaker
Aber dass man da zum Beispiel schon mal reinguckt und sieht, kann ich das verstehen von mir aus, ohne jemanden zu fragen, der das Forschungsprojekt daran beteiligt war oder das geleitet hat.
00:44:35
Speaker
kann ich die Daten verstehen und so weiterverwenden.
00:44:38
Speaker
Und ich finde, die Tendenz ist immer stärker, dass es immer besser passiert.
00:44:41
Speaker
Leute machen sich immer mehr Gedanken darüber, können das unabhängig von Personen, die es erklären, andere Menschen verstehen.
00:44:48
Speaker
Und wir kommen, wenn wir das machen wollen, an Linked Open Data, also auch an den Semantiken von Daten nicht vorbei.
00:44:54
Speaker
Eine einfache Excel-Tabelle wird nicht mehr zukunftsträchtig sein.
00:44:58
Speaker
Erstens, weil es nicht das gute Format ist.
00:44:59
Speaker
Zweitens, weil es irgendwie die Doku dazu schwierig verbunden ist.
00:45:02
Speaker
Die kann verloren gehen oder es ist halt einfach kompliziert.
00:45:04
Speaker
Und ich glaube, dass wir uns immer mehr auf eine Form bewegen, dass zum Beispiel Bedeutung und Datenpunkte, also Werte, tatsächlich miteinander verknüpft sind.
00:45:14
Speaker
Und der Weg, also die Art heißt Linked Open Data.
00:45:18
Speaker
Und wenn man das schon hat, dann, das ist zwar manchmal auch komplizierter, weil es natürlich mehr Erkenntnisse braucht, aber es löst halt viele Probleme wie, kann ich es verstehen, kann ich daran, kann ich es verarbeiten, gibt es Computersysteme, die damit umgehen können und wenn das halt auch mehr Leute oder mehr Institutionen anbieten, mehr Leute nutzen, ist es natürlich wie bei allen, es wird irgendwie einfacher, es wird besser zu handelbar, es gibt bessere Systeme und die Tendenz ist auf jeden Fall stark da.
00:45:45
Speaker
Ja, das sehe ich schon.
00:45:46
Speaker
Würdest du auch sagen, dass durch die Bereitstellung von strukturierten Daten mit einem guten Linked Open Data Ansatz, dass sich dadurch auch Forschungsansätze geändert haben?
00:45:58
Speaker
Oder kannst du das in deinem Arbeitsalltag irgendwie beobachten, dass jetzt Fragestellungen außer Kunstgeschichte, außer Geschichtswissenschaften, Kulturwissenschaften kommen, die vorher vielleicht nicht so da waren?
00:46:11
Speaker
Ja, was ich stark merke, ist zum Beispiel, dass das Mindset,
00:46:17
Speaker
sich ein bisschen geändert hat, dass man zum Beispiel nicht mehr so, also für ForscherInnen war es mal sehr klar, wenn keine Quellen am Text stehen, dann ist das schon ein bisschen fragwürdig.
00:46:27
Speaker
Aber wenn man so in Bücher von renommierten ForscherInnen guckt, vor 70, 80 Jahren, dann stand da mal eine Quelle drunter und es war sehr viel Text und es gab wenig Nachweise.
00:46:37
Speaker
Und jetzt ist es zum Beispiel so, dass man schon mitbekommt, wenn das nicht datengestützt ist, also wenn man nicht offenlegt, wie man denn zu diesem Resultat kommt, was man hatte, wenn man nicht das quantifizieren kann.
00:46:49
Speaker
Also Aussagen wie zum Beispiel, der Dürer war sehr oft in Italien.
00:46:56
Speaker
Dann ist es halt, was heißt sehr oft?
00:46:59
Speaker
War der überhaupt da?
00:47:00
Speaker
Woher weißt du das?
00:47:02
Speaker
Und wenn dann natürlich man eine Grundlage hat, die sagt, guck mal, da gibt es aus den und den Quellen
00:47:07
Speaker
Die und die Datenpunkte, die das und das belegen, dann ist es natürlich viel glaubwürdiger und vor allem auch viel mehr, dass man andere Schlüsse daraus ziehen kann, als wenn man das einfach nur irgendwo geschrieben hat und aus irgendeinem Text gelesen hat und auch mal nicht mal die Quelle angegeben hat.
00:47:21
Speaker
Und ich finde halt, Daten ist halt eine Form von etwas präziser und valider, überprüfbarer für jeden bereitzustellen.
00:47:27
Speaker
Es ist halt, wie gesagt, nicht mehr nur an die Erfahrung einer einzelnen Person gebunden, sondern es wird davon halt gelöst, sodass es andere Leute halt überprüfen können.
00:47:34
Speaker
Und da zum Beispiel auch nutzen können, um Forscherstellen und Forscherinnenstellen Wahrheiten her zu
00:47:40
Speaker
Kann ich da Sachen zusammenbringen und stützen die sich oder widersprechen die sich?
00:47:45
Speaker
Ich kann ja nie sagen, ob etwas wirklich, wirklich wahr ist, aber ich kann halt beweisen, dass etwas falsch ist, weil ich zum Beispiel sehe, das deckt sich nicht, da gibt es Widersprüche, da habe ich was festgestellt, dass etwas darstellt, dass es nicht sein kann.
00:47:58
Speaker
Und das kann ich viel besser machen, wenn ich dazu Grundlagen habe, Argumente habe, die sich auf Daten stützen.
00:48:02
Speaker
Und ich denke, das hat sich schon geändert und das wird jetzt immer mehr vorausgesetzt.
00:48:06
Speaker
Das heißt, bevor wir zu einer datengetriebenen Kunstwissenschaft kommen, sind wir jetzt wahrscheinlich an dem Zeitpunkt, wo wir sagen, wir haben eine datengestützte Forschung.
00:48:16
Speaker
Immer mehr, ja.
00:48:17
Speaker
Das denke ich schon.
00:48:18
Speaker
Ich denke, es wird nicht immer und überall der Fall sein.
00:48:21
Speaker
Und vor allem Daten aufnehmen kostet ja auch Zeit und Geld und die vielen Dinge.
00:48:26
Speaker
Und dann muss man sich immer fragen, bringt das jetzt wirklich was?
00:48:28
Speaker
Weil wenn zum Schluss des Projektes
00:48:31
Speaker
ein Suchschlitz auf Entitäten oder auf Daten zeigt und das ist alles, was dann passiert, dann ist es schwierig.
00:48:38
Speaker
Wir werden immer Texte brauchen.
00:48:40
Speaker
Wir werden immer Bücher brauchen, wo Leute das zusammenfassen.

Datenanalyse und traditionelle Forschung

00:48:44
Speaker
Ob das denn ein Mensch sein wird in 50 Jahren oder eine KI, die dann quasi aus den Daten was generiert ist, sei dahingestellt.
00:48:50
Speaker
Aber wir brauchen immer zusammenhängende, erschließbare,
00:48:55
Speaker
sage ich mal, Texte oder Informationen, aus denen wir Wissen bilden können, wo das drinsteckt.
00:48:58
Speaker
Das ist halt für eine Tabelle ist das schwieriger, aber wir können die Tabelle nehmen als Beleg oder um daraus Analysen zu machen.
00:49:04
Speaker
Aber ich denke, es wird immer so sein, dass es Hand in Hand geht.
00:49:06
Speaker
Es wird immer so sein, dass wir das machen, wir werden Tabellen bilden, wir werden daraus Analysen machen, wir werden daraus Resultate bilden und dann werden wir diese Informationen nehmen und einen schönen, dichten Text packen, der unser Wissen darstellt.
00:49:18
Speaker
Also das ist halt eine andere Stufe und ich denke nicht, dass ich das ausschließe, sondern das sind halt quasi verschiedene Formen, um Sachen besser zu machen.
00:49:25
Speaker
Das heißt, wir müssen auf der einen Seite die Sprache der Maschine lernen, um es für die Maschine lesbar zu übersetzen und dann das Maschinenlesbare zurück übersetzen in Menschenverständliches.
00:49:40
Speaker
Da ist ganz schön viel Kommunikation dabei.
00:49:41
Speaker
Ich hatte gedacht, wenn wir jetzt über Daten sprechen, sprechen wir von Einsen und Nullen und Feldern und Werten.
00:49:48
Speaker
Wir sprechen aber jetzt schon die ganze Zeit über Kommunikation, um Definitionen, um Begriffe.
00:49:54
Speaker
Das heißt, wenn wir in der Kunstgeschichte uns die Frage stellen, was sind eigentlich Daten, wie arbeiten wir mit Daten, kommen wir doch immer wieder an den Punkt zurück, dass wir darüber sprechen müssen, was hinter den Daten liegt.
00:50:08
Speaker
was hinter den Daten liegt und was wir dann daraus machen.
00:50:11
Speaker
Also können wir, wenn wir, ich habe letztens bei Mastodon was Kleines programmiert, in dem ich eine Sentiment-Analyse gemacht habe.
00:50:20
Speaker
Ich habe halt gesagt, okay, wir haben einen Mastodon-Server, wir fertig haben.
00:50:23
Speaker
Und ich würde gerne wissen, wieso die Stimmung da ist.
00:50:26
Speaker
Dann habe ich einfach ein Programm genommen, also habe halt geguckt und habe gesagt, analysiere doch mal alle Tweets und ordne die ein in, die sind positiv gemeint, negativ gemeint oder neutral.
00:50:35
Speaker
So, wenn ich jetzt ein Mensch wäre, der sagen würde, wie ist die Stimmung da, dann müsste ich mir alle Tweets durchlesen.
00:50:42
Speaker
Müsst ihr dann sagen, okay, sind die positiv, negativ gemacht und dann müsste ich die quasi in eine Tabelle packen und sagen so, okay, heute gab es 15 positive, 2 neutrale, 10 negative und dann kann ich sagen, die Stimmung ist ungefähr so.
00:50:54
Speaker
Und das Ding ist, dass wenn ich sowas machen will, muss ich Daten aufnehmen, aber der Punkt, wo ich hin will, ist einfach zu sagen, wie war die Stimmung heute?
00:51:02
Speaker
Und dann schreibe ich einen Text, die Stimmung heute war gut.
00:51:05
Speaker
Und das ist aber etwas, was ich nicht an der Maschine meine, sondern ich meine es an andere Leute.
00:51:09
Speaker
Und so ist das mit allen Sachen, wo ich Daten benutze.
00:51:12
Speaker
Ich versuche zu zählen, zu quantifizieren, zu nehmen, aber im Endeffekt kommt daraus immer eine Information raus, die...
00:51:19
Speaker
Kann auch Datum sein, aber oftmals will ich damit eigentlich einen Text schreiben, den Menschen lesen können, um zu denken, ah, ich weiß jetzt nicht mehr über die Welt.
00:51:28
Speaker
Das ist ja das Ziel.
00:51:30
Speaker
Ich habe Dinge verstanden, ich weiß, die sind mir nützlich, um etwas besser zu verstehen.
00:51:35
Speaker
Und Daten sind da ein Zwischenpunkt dahin.
00:51:37
Speaker
Bei Entweder, ich bringe es auf dem Papier oder es ist in meinem Kopf.
00:51:40
Speaker
Aber die Tabelle ist nicht der Endpunkt.
00:51:43
Speaker
Das sollte er nie sein.
00:51:44
Speaker
Der sollte immer ein Schritt sein, um etwas besser zu verstehen, etwas darzustellen und etwas überprüfbar, belegbar zu haben, um das, was ich quasi als Resultat habe, zu belegen.
00:51:57
Speaker
Darum sollte es gehen.

Philosophische Fragen zu Daten und Wissen

00:52:06
Speaker
Wenn man in der Forschung über Daten spricht, assoziiert man damit meist etwas Konkretes, etwas Statisches, einen Datenpunkt.
00:52:13
Speaker
Man denkt schnell an Systeme, Mathematik und Statistik.
00:52:17
Speaker
Im Gespräch mit Robert Nasarek ist mir aufgefallen, wie oft wir dann doch in die Philosophie hineingerutscht sind.
00:52:23
Speaker
Es geht um Fragen wie, was wissen wir eigentlich, wie fassen wir das begrifflich, was sind Informationen, was sind Interpretationen.
00:52:31
Speaker
Die Daten, mit denen wir arbeiten, sind Ergebnisse uns leider meist unbekannter Prozesse und Entscheidungen.
00:52:38
Speaker
Immer wieder betonte Robert, dass das Sprechen über Daten, der Austausch darüber, im Fach und mit der Community dann essentiell ist.
00:52:46
Speaker
Wir haben im Gespräch auch auf die Perspektive gewechselt.
00:52:49
Speaker
Auf der einen Seite stehen die Personen und Institutionen, die Daten erstellen und bereitstellen.
00:52:54
Speaker
Und auf der anderen Seite stehen die Personen, die diese strukturierten Daten nachnutzen, um aus Informationen Wissen zu generieren.
00:53:02
Speaker
Und dann gibt es auch noch Daten, die beim Forschen entstehen, Forschungsdaten, Ergebnisse von Projekten sein können, Abschlussarbeiten, von unserem alltäglichen Forschen.
00:53:14
Speaker
Dass Daten nur so gut sind wie ihre mitgelieferten Dokumentationen, die Metadaten, ist nun auch klar.
00:53:19
Speaker
Diese müssen aber auch erstmal gefunden werden.
00:53:22
Speaker
Und dass man dann innerhalb von Datenbanken und Daten das findet, was man gesucht hat, ist nicht selbstverständlich.
00:53:28
Speaker
Einstieg in solche Informationssysteme ist für uns oft ein kleines weißes Feld.
00:53:32
Speaker
Der Suchschlitz.
00:53:33
Speaker
Von hier aus suchen wir nach Werken, Personen, Themen, Informationen.
00:53:38
Speaker
In der nächsten Folge spreche ich mit SpezialistInnen über die Praktiken des Suchens, die Herausforderungen, die Informationen findbar zu machen und die Frage, warum mir bei der Suche nach dem Dom von Worms auch immer wieder Bilder von Würmern ausgespielt werden.
00:54:04
Speaker
Diese Folge wurde von Jacqueline Klosig-Eckert produziert im Auftrag des Arbeitskreises Digitale Kunstgeschichte.
00:54:09
Speaker
Unterstützt wird sie dabei von der Redaktion der Arbeitskreismitglieder Peter Bell, Lisa Diekmann, Peggy Große, Waltraud von Pippich und Holger Siemann.
00:54:18
Speaker
Finanziert wird AdHistocast, der Podcast zur digitalen Kunstgeschichte von NFDI for Culture, dem Konsortium in der nationalen Forschungsdateninfrastruktur, das sich mit Forschungsdaten zu materiellen und immateriellen Kulturgütern befasst.
00:54:33
Speaker
Unterstützt wird AdHistocast durch den Deutschen Verband für Kunstgeschichte.
00:54:39
Speaker
Du hast noch eine Frage oder Anregungen?
00:54:42
Speaker
Kontaktiere uns einfach unter podcast.digitale-kunstgeschichte.de