Become a Creator today!Start creating today - Share your story with the world!
Start for free
00:00:00
00:00:01
Folge 9: Vernetztes Wissen - LOD und Knowledge Graph für die Kunstgeschichte image

Folge 9: Vernetztes Wissen - LOD und Knowledge Graph für die Kunstgeschichte

S1 E9 · #arthistoCast – der Podcast zur Digitalen Kunstgeschichte
Avatar
391 Plays1 year ago

In dieser Folge spricht Jacqueline Klusik-Eckert mit Harald Sack und Holger Simon über den Knowledge Graph und seine Bedeutung für die Kunstgeschichte. Schon jetzt finden sich viele Informationen über Kulturgüter und Geschichte digital im Netz. Datenbanken und Repositories bieten zwar verstärkt Zugang zu Informationen, sind aber oft in isolierten Silos verstreut. Institutionen nutzen unterschiedliche Systeme zur Datenbereitstellung, was zu einer fragmentierten Landschaft führt. Meta-Datenbanken wie Europeana und die Deutsche Digitale Bibliothek versuchen, diese Fragmentierung zu überwinden, aber ihr Erfolg ist begrenzt. Es scheint, als bräuchten wir eine Meta-Meta-Datenbank, um diese Silos zu durchbrechen. Die Grundidee des Internets und das Konzept Linked Open Data (LOD) versprechen hier Abhilfe zu leisten. Die Herausforderung besteht darin, dieses vernetzte Wissen digital abzubilden. Hier kommt der Knowledge Graph ins Spiel. Im Rahmen des NFDI 4 Culture Projekts entsteht ein solcher Wissensgraph. Während in anderen Bereichen die Technologie des Knowledge Graphs schon länger im Einsatz ist – Google hat seit 2012 einen solchen Graphen etabliert –, befindet sich die Kunstgeschichte möglicherweise noch am Anfang dieser Entwicklung. GLAM-Institutionen (Galleries, Libraries, Archives, Museums) haben eine wichtige Rolle bei der Datenbereitstellung, müssen aber auch Anreize für den Austausch schaffen und erhalten.

Für die Forschung eröffnet der Knowledge Graph neue Horizonte. Er ermöglicht nicht nur andere Fragestellungen und Visualisierungen von Datenmassen, sondern auch eine komplexere Anreicherung von Museumsinformationen. Aber letztendlich gewinnt der Mensch durch die Erkenntnisse, die aus diesen Daten gezogen werden.

Von der Modellierung im Graphen bei der Digitalisierung bis hin zur Unterstützung durch die NFDI gibt es verschiedene Wege, sich einzubringen. Doch letztendlich liegt die Herausforderung darin, wie wir als Gemeinschaft von Forschenden und Kulturerbebewahrenden diese komplexe Datenlandschaft gemeinsam gestalten und nutzen können.

Prof. Dr. Harald Sack isst Bereichsleiter für Information Service Engineering bei FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur und Professor am Karlsruher Institut für Technologie (KIT), Institut für Angewandte Informatik und Formale Beschreibungsverfahren (AIFB) mit der Forschungsgruppe „Information Service Engineering“. Und NFDI4Culture Co-Spockesperson von FIz Karlsruhe

Prof. Dr. Holger Simon ist Sprecher im AK Digitale Kunstgeschichte, Geschäftsführer der Pausanio GmbH & Co. KG, Er ist außerplanmäßiger Professor an der Universität zu Köln und im Culture Steering Board NFDI 4 Culture.

Begleitmaterial zu den Folgen findest du auf der Homepage unter https://www.arthistoricum.net/themen/podcasts/arthistocast

Alle Folgen des Podcasts werden bei heidICON mit Metadaten und persistentem Identifier gespeichert. Die Folgen haben die Creative-Commons-Lizenz CC BY 4.0 und können heruntergeladen werden. Du findest sie unter

https://doi.org/10.11588/heidicon/1738702

Bei Fragen, Anregungen, Kritik und gerne auch Lob kannst du gerne per Mail an uns schicken unter

podcast@digitale-kunstgeschichte.de

Recommended
Transcript

Herausforderungen der Digitalisierung in der Kunstgeschichte

00:00:07
Speaker
ArtistoCast, der Podcast zur digitalen Kunstgeschichte.
00:00:16
Speaker
Digitalisierung ist das eine.
00:00:18
Speaker
Systeme und Lösungen zu finden, die uns bei der Forschung wirklich weiterhelfen, ist das andere.
00:00:24
Speaker
Trotz einer steigenden Offenheit, Sammeln der Institutionen für das Bereitstellen von Daten, findet sich viel Wissen noch in Silos.

Fragmentierung und Integration von Datenbanken

00:00:33
Speaker
Da gibt es hier eine Datenbank, dort ein Repositorium, da hat ein Verlag für die Bereitstellung der Daten System A gewählt und das nächste Archivsystem B und so könnte man eigentlich das ganze Alphabet durchspielen.
00:00:47
Speaker
Sicherlich gibt es bereits Metadatenbanken, also es gibt die Europäaner, die Deutsche Digitale Bibliothek, die versuchen, diese verstreuten und in heterogenen Systemen abgelegten Informationen zusammenzubringen.
00:01:00
Speaker
Aber das ist mühsam und funktioniert irgendwie noch nicht gut genug.
00:01:04
Speaker
Und eigentlich bräuchten wir nun eine Meta-Meta-Datenbank, um diese Datensilos offenen zu können, um das Wissen zusammenzutragen.
00:01:12
Speaker
Kunsthistorische Forschung, unser Wissen, ist eigentlich vernetzt.
00:01:16
Speaker
Die bisherigen, meist relationalen Datenbanken sind es aber nicht.
00:01:21
Speaker
Wie lässt sich also nun unser Anspruch nach vernetzten Informationen, die die Grundlage für unser Wissen sind, in das Digitale übertragen?

Lösungen mit Wissensgraphen

00:01:30
Speaker
Die Lösung könnte der Knowledge Graph sein.
00:01:34
Speaker
Ich spreche heute mit Harald Sack und Holger Simon über diesen Wissensgrafen, der im Rahmen von NFDI for Culture entsteht.
00:01:42
Speaker
Prof. Dr. Harald Sack ist Bereichsleiter für Information Service Engineering bei FITZ-Karlsruhe, dem Leibniz-Institut für Informationsinfrastruktur und Professor am Karlsruher Institut KIT, dem Institut für Angewandte Informatik und Formale Beschreibungsverfahren mit der Forschungsgruppe Information Service Engineering.
00:02:03
Speaker
Und im Rahmen von NFDI for Culture ist der Co-Spokesperson von Fitz Karlsruhe.
00:02:09
Speaker
Prof. Dr. Holger Simon ist Sprecher im Arbeitskreis Digitale Kunstgeschichte, Geschäftsführer der Pausanio GmbH und Co.
00:02:16
Speaker
KG.
00:02:17
Speaker
Er ist außerplanmäßiger Professor an der Universität zu Köln und im Culture Steering Board NFDI for Culture.
00:02:24
Speaker
Beide stehen mir nun bei diesen drängenden Fragen zur Seite.
00:02:27
Speaker
Was ist das dahinterliegende Konzept hinter diesem Knowledge Graph?
00:02:31
Speaker
Wie viel Vision steckt hinter diesem Projekt?
00:02:34
Speaker
Und welche Rückschläge und Hürden gibt es jenseits der Technik?
00:02:38
Speaker
Und ich frage mich, ob wir in der Kunstgeschichte schon bereit für ein digitales, offenes, vernetztes Wissen sind.
00:02:45
Speaker
Knowledge Gap oder Knowledge Graph?
00:02:48
Speaker
Das ist hier die Frage.
00:02:57
Speaker
Wenn wir über Daten sprechen, und das haben wir hier in dem Podcast schon getan, Daten, Datenbanken, Normdaten, dann ist irgendwie immer an einer Stelle der Knowledge Graph gekommen oder Linked Open Data, also allgemein das Wissen im digitalen Raum.
00:03:13
Speaker
Jetzt habe ich eine Frage an dich, Holger.
00:03:15
Speaker
Wo kommt dieses Wissen im digitalen Raum eigentlich her, das vernetzt werden soll?
00:03:20
Speaker
Ja, ich meine, für die Kunst- und Kulturgeschichte kommt das Wissen, was wir dann in den digitalen Raum hinein vernetzen wollen, natürlich aus den einzelnen Institutionen.
00:03:29
Speaker
Das sind vor allem die Gedächtnisinstitutionen, das sind die Glambs, das sind die Galleries, die Libraries, die Archives, die Museums, die sozusagen dieses Wissen haben, bisher aber ganz stark analog.
00:03:42
Speaker
Und dieses Wissen so aufbereiten sollen, dass sie es digital zur Verfügung stellen.
00:03:47
Speaker
Und du sprachst ja schon an, das Thema Silo, bisher sind die dann auf Datenbanken in den Museen, ist schon eine ganze Menge drin.
00:03:56
Speaker
Da sind wir aber auch noch am Anfang.
00:03:58
Speaker
Und in diesen Datenbanken gibt es schon die einen oder anderen Informationen.
00:04:02
Speaker
Aber das wollen wir natürlich miteinander verbinden, sodass man da auch wirklich zu Wissen kommt.

Daten in vernetztes Wissen transformieren

00:04:09
Speaker
Also jetzt ganz einfach gefragt, kann man die Datenbanken nicht einfach zusammen kopieren?
00:04:15
Speaker
Naja, ganz so einfach kann man das nicht, weil das ist ja, ich glaube dafür ist, müssen wir einen ganz kurzen Schritt mal zurückgehen, dass wir nochmal gerade überlegen, was ist eigentlich das, was in den Datenbanken drin ist.
00:04:27
Speaker
Denn die Datenbanken bei den Museen, die unterscheiden sich nicht stark von digitalisierten Karteikarten.
00:04:34
Speaker
Ja, wieso sage ich das?
00:04:36
Speaker
Weil eine Karteikarte, da gibt es bestimmte Informationen, die in bestimmten Feldern notiert sind.
00:04:43
Speaker
Und Informationswissenschaften trennen wir zwischen Daten, Informationen und Wissen.
00:04:51
Speaker
Daten sind erstmal eine Zeichenkette und sobald ich die kontextualisiere, habe ich Informationen.
00:04:57
Speaker
Das ist eine Karteikarte.
00:04:58
Speaker
Ich schreibe unter Künstler, schreibe ich den Künstler rein.
00:05:02
Speaker
Ich schreibe unter Titel, schreibe ich einen Titel rein.
00:05:05
Speaker
Und da weiß ich, ah, diese Zeichenkette meint das.
00:05:08
Speaker
So, deswegen haben wir diese Karteikarten und was jetzt passiert ist in den letzten Jahren, seit den 80ern angefangen, nicht von Marburg aus und dann in den 90ern weiter, ist, dass wir das jetzt in Datenbanken gepackt haben.
00:05:20
Speaker
Und eine wunderbare Kontextualisierung von Daten, damit sie Informationen werden, ist eine Tabelle.
00:05:27
Speaker
Und diese gesamten Datenbanken, die wir haben, die meisten zumindest, sind relationale Datenbanken, heißt Tabellen.
00:05:33
Speaker
Also was haben wir in den Datenbanken bisher in den Museen?
00:05:36
Speaker
Das sind eigentlich nichts anderes als Karteikarten.
00:05:39
Speaker
Und auch das, was wir in den Webseiten sehen, sind nichts anderes als Karteikarten.
00:05:42
Speaker
Das sind Informationen.
00:05:44
Speaker
Zu wissen wird das Ganze natürlich jetzt erst ab dem Moment, wo wir das miteinander verknüpfen, wo wir
00:05:51
Speaker
sage ich mal, Aussagesätze machen.
00:05:54
Speaker
Also das, wie wir Menschen miteinander sprechen und Wissen miteinander teilen, indem wir Subjekt, Prädikat, Objekt zueinander setzen und genau so betreiben wir auch Wissenschaft.
00:06:04
Speaker
Das heißt, wir schreiben Bücher und zwar auch in Sprache, Subjekt, Prädikat, Objekt, um unser Wissen, was wir haben und unsere Erkenntnisse darzulegen.
00:06:13
Speaker
Das heißt, um Wissen,
00:06:15
Speaker
Die Forscher, die bisher auch damit zu tun haben, fanden deswegen auch die Datenbanken so langweilig, weil sie nichts anderes als Karteikarten, die hatten gar kein Interesse dran und sind in die Bibliothek gegangen und haben sich dort die Bücher geholt.
00:06:28
Speaker
Jetzt sind wir aber genau dabei, du sprachst den Knowledge Graphen an, um den es heute geht.
00:06:32
Speaker
Wir befinden uns mittendrin in einer Transformation vom Buch zum Knowledge Graphen.
00:06:38
Speaker
Das heißt, dass das gesamte digital erfasst und verknüpft wird.
00:06:42
Speaker
Und ab dem Moment geht es jetzt darum zu gucken, wie verknüpfe ich diese Informationen, die in Tabellen sind, so dass wir zur Sprache kommen, dass wir wirklich auch Bedeutung damit hineinsetzen können.
00:06:53
Speaker
Und das ist die große Herausforderung, an der vor allem Harald sagt ja, dabei ist sozusagen ganz tolle Technologie mit zu entwickeln, mit anderen zusammen, damit wir das so in so eine Technik bringen können.
00:07:06
Speaker
Was ist denn die Technologie hinter diesen Datenbanken, also um überhaupt zu so einem vernetzten Wissen zu kommen?
00:07:13
Speaker
Ja, danke, Holger, dass du mir quasi den Ball, so diese Steilvorlage da hier gegeben hast.
00:07:20
Speaker
Es stimmt natürlich, was du sagst.
00:07:21
Speaker
Also ich hole mal ein Stückchen weiter aus, einfach ohne die Frage jetzt direkt zu beantworten, weil ich das natürlich, was Holger gesagt hat, noch ein bisschen ergänzen möchte.
00:07:30
Speaker
Wenn wir von Datenbanken ausgehen, haben wir da drin wirklich Daten an sich stehen und die nutzen uns erst mal relativ wenig.
00:07:37
Speaker
Also da steht zum Beispiel 42,35.
00:07:40
Speaker
Jetzt ist die Frage, was nutzt uns 42,35, wenn wir nicht wissen, was das Ganze bedeutet?
00:07:45
Speaker
Das heißt, dass das beispielsweise, sagen wir mal, in der Kunstgeschichte vielleicht jetzt die Länge oder Breite von irgendeinem Kunstwerk ist oder irgend sowas, dann nutzt uns das relativ wenig.
00:07:55
Speaker
Selbst wenn wir nur wissen, es ist die Höhe.
00:07:57
Speaker
Und da steht 42,35, ja, sind das Zentimeter, Millimeter, sind das Meter?
00:08:02
Speaker
Lichtjahre werden es nicht sein, aber es ist trotzdem nicht ganz eindeutig.
00:08:05
Speaker
Das heißt, ich muss also zusätzlichen Kontext liefern.
00:08:08
Speaker
Das ist das, was Holger gesagt hat.
00:08:11
Speaker
In den Datenbanken ist das Problem, sollte dieser Kontext vorhanden sein, ist er gegeben in natürlicher Sprache.
00:08:16
Speaker
Das ist toll für uns Menschen, weil wir dann verstehen, okay, das ist jetzt die Breite oder Höhe in Zentimeter.
00:08:22
Speaker
Der Computer kann damit noch gar nichts anfangen, wenn das irgendwie in natürlicher Sprache erklärt ist.
00:08:27
Speaker
Und das ist auch das Problem, warum wir nicht so ohne weiteres jetzt so unterschiedliche Datenbanken einfach, wie man so schön sagt, miteinander zusammenschalten oder vernetzen können.
00:08:36
Speaker
Weil es ist nicht klar, was das eine Feld in der einen Datenbank bedeutet und wo ist das Korrespondierende dann in der anderen.
00:08:43
Speaker
Sind die denn gleich normiert?
00:08:44
Speaker
Passt das alles zusammen?
00:08:46
Speaker
Das kann natürlich wieder ein Mensch machen, der drauf guckt und sich die Beschreibungen in natürlicher Sprache durchliest.
00:08:51
Speaker
Der kann dann sagen, okay,
00:08:53
Speaker
Das passt nicht genau zusammen, da schalte ich jetzt irgendeine Funktion dazwischen, die irgendwie auf der einen Seite Millimeter, auf der anderen Seite in Zentimeter umrechnet oder so.
00:09:02
Speaker
Aber das ist natürlich ein gehöriger Aufwand, wenn man mal sieht, wie viel denn schon eigentlich in diesen vorhandenen Datenrepositorien und Datenbanken drinsteht.
00:09:12
Speaker
Und die Idee, die jetzt hinter diesen Wissensgrafen steckt, ist, wir wollen genau diese Beschreibung, was bedeuten die Daten,
00:09:22
Speaker
Also nicht nur maschinenlesbar, jeden möglichen Text kann ich quasi lesen mit der Maschine, aber das heißt noch nicht, dass ich ihn verstanden habe, sondern wirklich maschinenverstehbar, die Bedeutung.
00:09:35
Speaker
Die Semantik muss mit abgebildet werden und das explizit.
00:09:39
Speaker
Und das geht, das kann man mit Mitteln der symbolischen Wissensrepräsentation, also Logik hatte vielleicht jeder mal in der Schule, darauf basiert das Ganze.
00:09:48
Speaker
Logik ist was, was der Computer versteht und wir können mithilfe von sogenannten Beschreibungslogiken, das sind ganz bestimmte Arten von Logiken,
00:09:57
Speaker
angeben, was jetzt beispielsweise das bedeutet, dass eine Zahl, ein Datum eine Länge darstellt und was die zugehörige Maßeinheit dafür wäre und wie genau diese Länge jetzt mit anderen Dingen, die ja auch noch verzeichnet sind in der Datenbank, in Zusammenhang steht.
00:10:15
Speaker
Und das kann ich in Maschinen verstehbarer Form nutzen und vernetzen.
00:10:20
Speaker
Und daraus wird dann langsam aus den Daten, die ich habe, mithilfe dieser formalen semantischen Beschreibung, dann eine Wissensrepräsentation, in dem Sinne dann ein Wissensgraf, Graf einfach, weil man hier eben einzelne Objekte hat, das sind so die Knoten im Graphen, die mit anderen in Verbindung stehen.
00:10:39
Speaker
Das sind die Kanten zwischen den einzelnen Knoten, die alles miteinander dann verbinden.
00:10:45
Speaker
Das heißt, die Technologie, die dahinter steckt, ist notwendig, um die Übersetzungsleistung zwischen dem, was Menschen denken, Menschen wissen und irgendwie systematisch anlegen, auch für die Computer zu übersetzen, um sie dann wieder für Menschen nutzbar zu machen?

Semantische Webtechnologien für kulturelle Daten

00:11:01
Speaker
Ja, aber hauptsächlich, denke ich mal, geht es darum, dass eben Computer untereinander dieses Wissen oder diese Informationen austauschen können, ohne dass der Mensch sehr, sehr großen manuellen Aufwand betreiben muss.
00:11:15
Speaker
Und was ich sagte, es ist alles auch möglich ohne diese Technologie, aber dann eben nur jedes Mal mit sehr großem Aufwand, der jedes Mal wieder investiert werden muss in Form von Programmen, die geschrieben werden müssen, die diese Übersetzungen und Verknüpfungen dann Fall für Fall übernehmen.
00:11:33
Speaker
Ich glaube, jeder, der schon mal so eine Tabelle vor sich hatte oder mehrere Tabellen, die man aufeinander anpassen musste, weiß, wovon du jetzt sprichst, weil das ist wirklich äußerst mühsam.
00:11:43
Speaker
Manchmal fehlt auch die Dokumentation, was überhaupt gemeint wurde und so weiter.
00:11:47
Speaker
Wie geht man dann aber jetzt nun vor?
00:11:48
Speaker
Also kann man mit der Technologie, die dahinter steckt, also mit diesen neuen Beschreibungslogiken, einfach alle Daten nehmen oder verabschieden,
00:12:01
Speaker
Tabellen, die jetzt schon da sind?
00:12:03
Speaker
Oder muss man die von vornherein auf eine andere Art und Weise aufbauen, die Daten?
00:12:09
Speaker
Am einfachsten ist es natürlich, wenn man von vornherein mit diesen neuen Technologien, diesen semantischen Technologien, Beschreibungslogiken, ist wirklich nur das, was ganz, ganz unten unter der Motorhaube steckt.
00:12:19
Speaker
Normalerweise hat man da entsprechende Beschreibungssprachen, um jetzt dieses Wissen tatsächlich auch in Form darzustellen, dass es im Web verfügbar wird.
00:12:29
Speaker
Da kommt dann dieses semantische Web oder Semantic Web, wie man es nennt,
00:12:34
Speaker
mit ins Spiel.
00:12:34
Speaker
Das sind also webbasierte Beschreibungssprachen, mit denen ich dieses Wissen wirklich formalisiert fassen und explizit ausdrücken kann.
00:12:43
Speaker
Wenn man von vornherein anfängt, seine Inhalte, seine Daten in dieser Form zu annotieren oder auch darzustellen, ist es natürlich der geringste Aufwand.
00:12:52
Speaker
Aber wir haben natürlich jetzt schon
00:12:54
Speaker
Seit Jahrzehnten sehr, sehr große Datenbestände da.
00:12:57
Speaker
Das heißt Alt, ich möchte es nicht Lasten nennen, aber Altbestände.
00:13:01
Speaker
Und der Aufwand, das Ganze dann jetzt zusätzlich in eine Form zu bringen, dass es semantisch vernetzbar wird und dass eben die Inhalte verstanden werden, ist eben recht groß.
00:13:13
Speaker
Und es ist auch eine bestimmte Kompetenz.
00:13:16
Speaker
Also man muss wissen, wie man es macht.
00:13:18
Speaker
Und da gibt es leider noch nicht so viele Leute,
00:13:21
Speaker
Und da entsteht dann so eine Art Bottleneck und es wird sehr, sehr schwierig, das umzusetzen.
00:13:26
Speaker
Und viele Kulturinstitutionen scheuen sich natürlich, weil sie das oft nicht in eigener Regie machen, sondern dann eben mit einer IT-Abteilung oder irgendwas im Haus zusammenarbeiten, die eventuell noch wenig oder gar nichts von diesen neuen Techniken gehört haben und davon natürlich auch abraten, weil sie da keine Erfahrung haben und sagen, never change a running system.
00:13:44
Speaker
Und das Ganze, wenn wir es mal planen, ja, vielleicht in fünf bis zehn Jahren haben wir da eine Perspektive und da gerät es dann meist in Vergessenheit.
00:13:51
Speaker
Wir sind einfach schon souveräner im Umgang mit relationalen Datenbanken, was vielleicht für so ein Museum oder Kultureinrichtungen auch einfach aufzusetzen ist.
00:14:00
Speaker
Das lernt jeder im Informatikstudium oder kann man sich selbst auch einfach relativ einfach beibringen.
00:14:05
Speaker
Aber wenn es nun um den nächsten Schritt geht, brauchen wir die Übersetzungsleistungen.
00:14:08
Speaker
Vielleicht
00:14:10
Speaker
Wenn man die Karteikarten von Süderlin abschreibt, Süderlin kann ja auch nicht jeder lesen, um dann in eine neue Sprache, eine neue lesbare Sprache zu bringen.
00:14:20
Speaker
Sind das denn auch die Herausforderungen oder gibt es auch aus informationswissenschaftlicher Perspektive Herausforderungen an die Technik oder ist das alles schon fertig und da?
00:14:30
Speaker
Also…
00:14:31
Speaker
Die Technik an sich ist nicht neu.
00:14:33
Speaker
Also schon, man kann sagen, seit gut 20 Jahren sind wir dabei, semantische oder semantisch annotierte Systeme anzulegen und miteinander zu vernetzen.
00:14:45
Speaker
Allerdings ist es natürlich in der Forschung, dass wir das seit 20 Jahren machen.
00:14:50
Speaker
Man kann sagen, seit vielleicht gut zehn Jahren, 2012, sind die Wissensgrafen dann tatsächlich auch in der realen Welt angekommen.
00:14:58
Speaker
2012 glaube ich war, das hatte Google angefangen, die Suchergebnisse, die man eben in dieser Suchmaschine sieht, eben mit dem Google Knowledge Graph anzureichern und zu verbessern und es gab eben einen enormen Qualitätssprung in der Art, wie Suchergebnisse dann jetzt seit zehn Jahren repräsentiert werden, mit zusätzlichen Ergebnissen an der Seite und Fragen werden beantwortet und Dinge, die damit in Bezug stehen, werden angezeigt und das Ganze kommt basierend auf einem Knowledge Graph.
00:15:26
Speaker
Also seit
00:15:28
Speaker
2012 kann man sagen, ist das Ganze jetzt hier state of the art und wird mittlerweile von allen Suchmaschinenanbietern oder auch von allen größeren E-Commerce-Anbietern, also angefangen von Amazon über eBay oder auch bis hin zu Zalando, also alle oder auch Ikea, alle haben so einen großen Wissensgraf, der jetzt hier ihre Informationssysteme, ihre Shoppingsysteme, ihre Suchsysteme bedient.
00:15:55
Speaker
Weil der Vorteil ist, ist es einfach offener für mehr Daten, also ist es skalierbar?
00:16:01
Speaker
Also es ist ganz klar ein ökonomischer Vorteil, weil vorher gab es in so großen Unternehmen zahlreiche einzelne Datenbestände und Datenbanken, die alle in den unterschiedlichen Abteilungen dann doch miteinander ausgetauscht werden mussten.
00:16:14
Speaker
Und genau dieser Austausch, an jeder Stelle eine eigene Schnittstelle zu schaffen und dafür sorgen, dass das Ganze synchron bleibt, ist eben ein riesiger auch finanzieller Aufwand.
00:16:23
Speaker
Und das Ganze dann auf eine einheitliche Schnittstelle, nämlich diese semantische Schnittstelle auf Semantik-Web und Wissensgrafen, dann als Grundlage von diesem ganzen System dann herzunehmen und auch als Grundlage der dazugehörigen Datenintegrationsleistung, das bringt einen ökonomischen Vorteil.
00:16:40
Speaker
Und das haben eben die Großen dann jetzt vor, seit zehn Jahren schon gut erkannt.
00:16:46
Speaker
Und ich denke, dass den Vorteil, den jetzt Harald gerade beschreibt, der ist so noch gar nicht in den Museen oder in den Gedächtnisinstitutionen

Anwendung von Wissensgraphen in Museen

00:16:54
Speaker
bekannt.
00:16:54
Speaker
Also wir nutzen das wie selbstverständlich bei Google, haben dementsprechend die Erfolge dabei, merken aber gar nicht, dass wir eigentlich Schatzkisten im Keller schon haben, nämlich in den Datenbanken, die wir heben müssen.
00:17:07
Speaker
Und ab dem Moment, wo man jetzt kommt, Knowledge Graph ist erstmal, ey, was ist Knowledge Graph?
00:17:11
Speaker
Also ich brauche ein Verständnis dafür.
00:17:14
Speaker
Und ich muss kein Mathematikerin und Informatiker sein, um zu verstehen, aber es ist wichtig, finde ich, für uns in der Wissenschaft, in der Kunstgeschichte, dass wir verstehen, wie Wissen modelliert wird in einer relationalen Datenbank, in Tabellen oder in einem Graphen.
00:17:30
Speaker
Das muss ich verstehen, um zu merken, da ist ein qualitativer Sprung, da ist ein qualitativer Schritt und gleichzeitig, also ich brauche dieses Wissen,
00:17:41
Speaker
Und dann auf der anderen Seite ist eine große Scheu, oh, das ist jetzt alles ganz groß aufwendig, ganz viel, das ist also, jetzt muss ich schon wieder ran an die Datenbanken und die bringen mir doch gar nichts.
00:17:51
Speaker
Weil bei Karteikarten suche ich auch nicht, ich forsche in der Bibliothek.
00:17:56
Speaker
Diesen Sprung jetzt zu sagen, okay,
00:17:59
Speaker
Die Sachen muss sich so heben, dass sie zu wissen werden, vor allem miteinander vernetzt, wenn man sich vorstellt, all das, was wir schon mal aufgenommen haben in den relationalen Datenbanken, wenn wir das schaffen, schon miteinander zu vernetzen und dann auch mit den großen Wissensressourcen wie Wikipedia und anderen auch das noch miteinander zu verbinden, dann ist ungeheuer viel schon mal da.
00:18:21
Speaker
was wir sofort auch nutzen können.
00:18:23
Speaker
Und wir stehen gerade so an dieser Schwelle, wo wir merken, okay, da ist viel, jetzt müssen wir diesen Schritt noch machen, dass wir das Gesamte auch zusammenbringen.
00:18:34
Speaker
Und das ist ja auch eine der Hauptaufgaben und Intentionen von NFDI, also der nationalen Forschungsdateninfrastruktur in Deutschland oder das Konsortium, in dem Harald und ich ja tätig bin, NFDI for Culture, wo es darum geht, die Daten zu
00:18:50
Speaker
Forschungsdaten für materielle, immaterielle Kulturgüter so zugänglich zu machen, dass sie, wie Harald eben beschrieben hat, computerverstehbar sind, dass die Computer untereinander miteinander kommunizieren können, aber auch dann als nächsten Schritt, damit wir neue Methoden entwickeln können, um daraus mehr und bessere Erkenntnisse zu gewinnen.
00:19:09
Speaker
Denn das gesamte Ziel dient ja dazu, bessere Erkenntnisse zu gewinnen, die wir so entwickeln.
00:19:15
Speaker
im analogen gar nicht bekommen können, weil wir jetzt Zugriff haben auf wirklich dann Massendaten und das ist ja die Hoffnung, die letztlich auch dahinter steckt.
00:19:22
Speaker
Aber da sind wir gerade an dem Punkt, es liegt eigentlich alles vor, dass es möglich ist, da kommen wir gleich oder am Ende auch nochmal zu, wie man konkret auch mitmachen kann, was man ganz klar da auch für braucht und wie man das mit integrieren kann und was auch dafür schon entwickelt ist.
00:19:39
Speaker
Aber das ist sozusagen der wichtige Moment, an dem wir jetzt stehen, dass wir diese Daten auch zugänglich machen und das in dem Glamms ankommt, dass das, was da in der Kiste steht, wirklich Schatz ist und wichtig ist, weiterzuführen und ein ganz zentrales Element wird auch der Museumsarbeit und nicht sowas bisher immer so, da sitzt jemand an der Datenbank,
00:20:00
Speaker
Nee, das ist ein ganz wichtiger Teil der Aufgabe, das Gedächtnis, dementsprechendes Wissen dann zur Verfügung zu stellen.
00:20:10
Speaker
Jetzt sprichst du ja ganz viele unterschiedliche Aspekte an.
00:20:13
Speaker
Einen möchte ich mal herausgreifen, dieses vernetzte Wissen.
00:20:17
Speaker
Jeder sitzt auf seinen Schatzkästchen.
00:20:19
Speaker
Jeder, der kunsthistorisch forscht, kennt das ja.
00:20:21
Speaker
Man hat ja einen Bestand, über den man forscht, nicht immer nur an einer Institution.
00:20:26
Speaker
Im Museum A liegt eine Tafel, jetzt wenn man über Gemälde nachdenkt.
00:20:30
Speaker
In Institution B liegen die Quellen, in Institution C liegen noch ein paar Zeichnungen.
00:20:36
Speaker
Man muss sich dann jedes Mal aufs Neue darauf einstellen, wie sind eigentlich die Informationen dort aufbereitet, muss ich bei denen ins Archiv, in die Karteikarten, gibt es eine Datenbank.
00:20:46
Speaker
Kann ich mir also dann, gehen wir mal davon aus, dass der Knowledge Graph existiert und alles da drin ist, was wir haben, dass mir ein Einstiegsinterface reicht, um diese heterogen verstreuten Informationen zusammenzufinden?
00:21:01
Speaker
Auf jeden Fall.
00:21:02
Speaker
Also das ist, und ich meine, wir werden ja gleich nochmal auch dazu kommen, zum Culture Knowledge Graphen, der ja seit 2022 publiziert und öffentlich ist.
00:21:12
Speaker
Da gibt es genau eine Schnittstellung, und zwar heute schon.
00:21:16
Speaker
da draufgehe und eine Abfrage mache an den Graphen, kann ich über unterschiedliche Ressourcen, die aus ganz unterschiedlichen Bereichen kommen, kann ich suchen, übergreifende Suchen machen und mir die Sachen zusammenholen.
00:21:28
Speaker
Das geht jetzt schon.
00:21:29
Speaker
Das heißt, die Technik ist da.
00:21:31
Speaker
Wir können es.
00:21:31
Speaker
Was jetzt noch fehlt, ist das Nächste, dass wir aus den relationalen Datenbanken, also die Tabellen, so miteinander verbinden,
00:21:39
Speaker
dass sie wirklich zu Linked Data, zu verbundenen Daten werden, die dann in dem Netz auch sich mit anderen Daten, anderen Wissensquellen dann auch verbinden.
00:21:50
Speaker
Und das ist genau der Schritt, der jetzt gerade gemacht werden muss.
00:21:56
Speaker
Und wie funktioniert das?
00:21:57
Speaker
Also man kommt von einer normalen Objektdatenbank zum Beispiel oder der Sammlungsdatenbank und Ziel ist ein Knowledge Graph.
00:22:04
Speaker
Muss ich dann jetzt jemanden da hinsetzen und die Person fügt händisch Normdaten ein und hat irgendwie eine Ontologie neben sich liegen und bastelt da passend dran rum?
00:22:16
Speaker
Das wäre natürlich der Idealzustand, dass quasi wir davon ausgehen könnten, dass wir lauter Kulturinstitutionen haben, die schon fertige, eigene Wissensgrafen selbst vorhalten und die könnten wir dann miteinander föderieren.
00:22:31
Speaker
Das heißt von einem zentralen Punkt, von einem einzelnen Punkt, egal wo der ist, dann komplett vernetzt abfragbar machen.
00:22:38
Speaker
Das ist natürlich weit hergeholt und ich weiß genau, dass wir nicht in dem Zustand sind.
00:22:41
Speaker
Es gibt eine Handvoll weniger Kulturinstitutionen, bei denen man schon, oder nicht Institutionen, also es gibt ein paar Webadressen, bei denen man tatsächlich schon auf Wissensgrafen zugreifen kann.
00:22:53
Speaker
Allerdings viel zu wenige, kaum welche, muss ich eigentlich dann sagen.
00:22:59
Speaker
Aber trotzdem muss ich jetzt genau unserer Fachdisziplin hier schon mal auch gute Noten ausstellen, weil viele der vorhandenen Ressourcen sind schon digitalisiert.
00:23:10
Speaker
Und viele sind auch öffentlich zugreifbar, ohne dass mir jemand das recht streitig macht, dass ich darauf zugreifen darf oder nicht.
00:23:16
Speaker
Also in anderen Fachdisziplinen sieht das noch ganz anders aus.
00:23:19
Speaker
Also jetzt nicht nur wegen Urheberrechten oder Datenschutzgründen gibt es in anderen Disziplinen oftmals noch Vorbehalte wie, ich werde meine Forschungsdaten bestimmt nicht mit irgendjemand anderen teilen, weil ich habe dafür sehr viel Geld bezahlt.
00:23:31
Speaker
Das kam zwar vom Steuerzahler, aber trotzdem der Aufwand, wenn ich das mal rechne, der andere soll das mal schön selber machen.
00:23:37
Speaker
Und
00:23:38
Speaker
Solche eben, sagen wir mal, ethischen oder auch jetzt nicht unbedingt juristischen, aber auch psychologischen Schwellen, die müssen wir halt auch im Zuge dieser NFDI-Projekte versuchen abzubauen und die Leute eher wirklich zu einer Tausch- und einer Teilkultur motivieren.

Datenfreigabe und Austauschstrategien

00:24:00
Speaker
Das ist in der Wissenschaft ja so, man macht das eigentlich nur ungerne, wenn man nicht dafür am Ende auch belohnt wird.
00:24:06
Speaker
Und dieses Belohnungsprinzip muss in vielerlei Richtung gehen.
00:24:10
Speaker
Das eine ist natürlich, ich möchte vielleicht, dass meine Daten tatsächlich auch gefunden werden, weil dann hätte ich möglicherweise den Vorteil, ich werde auch mit meinen Daten, die ich zur Verfügung gestellt habe, zitiert.
00:24:24
Speaker
Das ist ja das Belohnungssystem der Wissenschaft, zielt darauf ab, dass irgendjemand anders mich positiv erwähnt.
00:24:30
Speaker
Je mehr, desto besser.
00:24:31
Speaker
Dann bekomme ich auch zukünftig Fördergelder oder auch die Professur, die ich anstrebe.
00:24:35
Speaker
Also Publish or Perish.
00:24:36
Speaker
Und das ist eine der Intentionen, mit denen wir versuchen, die Wissenschaftler davon zu überzeugen, ihre Daten auch zur Verfügung zu stellen.
00:24:44
Speaker
Und das andere ist natürlich auch die rechte Klärung, die manchmal auch wirklich gar nicht so einfach vonstatten geht, insbesondere wenn Urheber oder auch Persönlichkeitsrechte betroffen sind.
00:24:53
Speaker
Da haben wir auch
00:24:55
Speaker
Bestimmte Problemstellen natürlich auch in den Geisteswissenschaften, auch in der Kunstgeschichte, wenn es beispielsweise um Bildrechte geht oder eben um Urheberrechte von Bildwerken, die eben jetzt auch noch geschützt sind und ähnliche Sachen, die wir nicht so ohne weiteres und ohne Probleme jedem öffentlich im Netz zur Verfügung stellen können.
00:25:16
Speaker
Sollte das oder ist die Hürde dann erstmal überwunden, dann besteht natürlich die technologische Hürde, dass ich sagen muss, ich muss natürlich etwas Aufwand betreiben, um daran teilhaben zu können.
00:25:28
Speaker
Das haben wir auch in NFDI for Culture gesehen und hatten uns dann überlegt, ja, wir müssen eben vielleicht diese Hürde ein Stückchen runtersetzen für die Kulturinstitutionen.
00:25:37
Speaker
Und wir sind da jetzt mittlerweile einem mehrstufigen Verfahren zu einem ganzen Strauß oder Bündel von Lösungsmöglichkeiten gekommen, auf die wir jetzt mal kurz ansprechen könnten.
00:25:49
Speaker
Die einfachste Möglichkeit ist, wir haben uns vorgestellt, diese ganzen Daten liegen überall verteilt vor.
00:25:57
Speaker
Wir streben jetzt nicht an, alles zentralisiert an einer Stelle zu bündeln und nochmal zu speichern und zu replizieren.
00:26:03
Speaker
Das würde keinen Sinn machen.
00:26:05
Speaker
Die Mittel haben wir auch gar nicht.
00:26:07
Speaker
Nichtsdestotrotz wollen wir sowas zur Verfügung stellen wie einen zentralisierten Index.
00:26:11
Speaker
Also man muss es sich ähnlich vorstellen wie bei Google.
00:26:13
Speaker
Google hat ja auch nicht alle Webseiten, sondern hat eben den Inhalt oder die wichtigsten Inhalte dieser Webseiten irgendwo im Index drin, sodass ich sie durchsuchen kann.
00:26:22
Speaker
Sowas schaffen wir hier auch.
00:26:24
Speaker
Und das heißt, man muss jetzt in den Beteiligten...
00:26:28
Speaker
Datenrepositorien entscheiden, okay, was sind jetzt die wichtigen Dinge in meinen Daten, die ich zur Verfügung stelle?
00:26:34
Speaker
Was ist uns jetzt denn wichtig?
00:26:36
Speaker
Beispielsweise bei einem Kunstwerk ist vielleicht wichtig, der Urheber des Kunstwerks ist wichtig, was ist darauf abgebildet, ist wichtig.
00:26:42
Speaker
Vielleicht auch noch, wann ist das Kunstwerk geschaffen worden?
00:26:46
Speaker
Und dann muss man entscheiden, ist vielleicht auch noch irgendeine Provenienzgeschichte wichtig?
00:26:51
Speaker
Sollen wir diese Daten dann auch noch einstellen?
00:26:53
Speaker
Und genau für diesen Ausschnitt
00:26:57
Speaker
der Daten, die wir jetzt als wichtig erachten für eine Suche.
00:27:02
Speaker
Da haben wir eine Art Austauschformat, leichtgewichtiges Austausch-Datenformat definiert.
00:27:08
Speaker
Das basiert auf schema.org, haben vielleicht schon einige mal gehört, dass es von einem Datenformat, das Google mal aus der Taufe gehoben hat, um den Leuten die Möglichkeit zu geben, bessere oder eben
00:27:21
Speaker
vielschichtigere Informationen über die Suchmaschine Google zur Verfügung zu stellen.
00:27:25
Speaker
Also das beispielsweise dann, wenn ich nach einem Produkt suche, das ist eigentlich, war ja alles irgendwie bei Google ausgerichtet in Richtung E-Commerce und dass man damit auch Geld verdienen kann, dann möchte ich natürlich auch sagen, okay, ich habe das Produkt noch auf Lager, das kostet bei mir so viel und wenn du es bei mir bestellst, musst du so und so viele Tage warten und ähnliches.
00:27:43
Speaker
Und das kann ich in diesem Datenformat auf meiner Webseite, auf der dieses Produkt vorgestellt wird, in diesem Format mit angeben.
00:27:49
Speaker
Und dann weiß Google, okay, kann diese Daten tatsächlich quasi mithavisten, das heißt ernten oder erfassen und dann diese Daten mit anderen Produkten in Verbindung setzen.
00:28:00
Speaker
Und das ist für Werbetreibende natürlich, war das lange Zeit sowas wie der heilige Gral, dass ich eben direkt über die Suchmaschine schon einen Fuß in die Tür bekommen habe, wenn die Leute was Bestimmtes gesucht haben und gleich schon vergleichen konnten.
00:28:12
Speaker
Und ich bin da besser als meine Konkurrenten, dann ist das natürlich super.
00:28:16
Speaker
Und genau das gleiche Prinzip wenden wir jetzt an mit den Daten, die wir hier jetzt aus dem NFDI-Umfeld bekommen.
00:28:23
Speaker
Das heißt hier mit Forschungsdaten, beispielsweise aus der Kunstgeschichte und harvesten das oder wollen das ernten von allen beteiligten Institutionen.
00:28:34
Speaker
Und der Plan klingt eigentlich zu gut, um wahr zu sein.
00:28:37
Speaker
Das einzige Problem ist halt, dass selbst auch diese Hürde und auch dieser Vorteil, wenn das natürlich in die eigenen Webseiten mit eingebaut wird, dann wird auch meine Datensammlung bei Google sichtbarer, als sie jetzt schon vorher war.
00:28:48
Speaker
Aber es hilft halt leider, haben wir festgestellt, nicht viel.
00:28:51
Speaker
Leute finden das toll und sagen, ja, stellen wir mal so als Desiderat an unsere IT-Abteilung mit ein, so in fünf bis zehn Jahren.
00:29:00
Speaker
Können wir dann vielleicht damit rechnen, dass das gemacht wird?
00:29:02
Speaker
Und das heißt, dann stehen wir wieder genauso da wie vorher und wir mussten dann noch einen Schritt weiter auf die Kulturinstitutionen zugehen, weil
00:29:11
Speaker
Viele sagen ja, ja, wir haben schon jetzt für unsere Webseiten und für die Deutsche Digitale Bibliothek oder andere Bibliotheken bestimmte Schnittstellen geschaffen.
00:29:20
Speaker
Da gibt es so bestimmte Datenformate, Lido, OAI, PMH, also ich möchte sie gar nicht alle nennen, kennen die meisten Leute sowieso nicht.
00:29:27
Speaker
Da sind schon vorhandene Schnittstellen da, das heißt, die Daten wurden schon mal in andere Formate übersetzt.
00:29:34
Speaker
Und werden die jetzt auf breiter Basis genutzt, haben wir uns gedacht, okay, dann gehen wir eben den Schritt, dann machen wir einmal zentral diese Übersetzung von diesen schon bekannten Schnittstellenformaten in das Format unseres Knowledge Graphs oder dieses Austauschformats, das wir vorgeschlagen haben.
00:29:51
Speaker
Und das ist jetzt der Weg, den wir für eben viele Kulturinstitutionen gehen können, die bereits schon diese Arbeit geleistet haben, irgendwann im Vorfeld.
00:29:59
Speaker
Die können jetzt sehr, sehr leicht hiermit integriert werden.
00:30:03
Speaker
Du hattest jetzt ja auch gerade angesprochen, dass viele Institutionen ihre Daten bereits aufgebaut oder aufbereitet haben, um sie an andere Institutionen anknüpfungsfähig zu machen, also in Austauschformate übersetzt haben.

Skepsis gegenüber neuen Technologien in Kulturinstitutionen

00:30:16
Speaker
Jetzt kann ich natürlich auch Clam-Institutionen verstehen, die sagen, okay, da kommen alle fünf Jahre irgendwelche
00:30:23
Speaker
FachinformatikerInnen oder Institutionen oder Bewegungen mit Visionen um die Ecke und wollen, dass wir wieder was Neues machen, wieder eine neue Übersetzung.
00:30:33
Speaker
Also wie kann man denn jetzt diese Technologie auch in der Geschichte ein bisschen einbetten?
00:30:39
Speaker
Also ist es wirklich nur so eine fixe Idee oder ist es gekommen, um zu bleiben?
00:30:46
Speaker
Naja, also es ist ja jetzt nicht super neu.
00:30:49
Speaker
Ich hatte ja schon gesagt, seit zwei Jahrzehnten ist das in der Forschung angekommen.
00:30:54
Speaker
Und es ist eigentlich wirklich auch noch in den frühen Jahren des World Wide Web mit entstanden.
00:31:00
Speaker
Der Begründer, in Anführungszeichen Erfinder des World Wide Web, Tim Berners-Lee,
00:31:05
Speaker
Ich hatte schon relativ kurz, nachdem das in den 90er Jahren Fahrt aufgenommen hat, gesehen, das Problem, das wir im Web haben, ist, dass da sind sehr, sehr viele Dokumente, egal ob das jetzt Textdokumente, Bilddokumente, Videos oder sonst was sind, die sind miteinander vernetzt und das ist toll.
00:31:23
Speaker
Aber eigentlich kann man hier im Web noch relativ wenig anfangen mit den Dokumenten, weil das, was drinsteht,
00:31:32
Speaker
Das versteht der Computer nicht.
00:31:34
Speaker
Der sieht einfach nur ein Dokument, das kann dargestellt werden.
00:31:36
Speaker
Die Suchmaschine ist in der Lage, tatsächlich jetzt uns auch dann inhaltlich interessante Ergebnisse zu liefern.
00:31:43
Speaker
Aber es steckt ja noch viel mehr in den Dokumenten drin.
00:31:46
Speaker
Die bedeuten ja was.
00:31:46
Speaker
Wenn da eine Adresse steht, dann ist das klar.
00:31:49
Speaker
Wenn da eine Straße steht und da steht eine Hausnummer, dann bedeutet das ja was Bestimmtes.
00:31:53
Speaker
Das heißt, dass da eine geografische...
00:31:56
Speaker
Angabe mit verbunden ist, wo genau diese Person beispielsweise, die eine Adressangabe jetzt hier hat, verortet werden kann.
00:32:02
Speaker
Also ich möchte jetzt nicht gleich wieder in datenschutzrechtliche Diskussionen abstreifen, das ist jetzt nur ein Standardbeispiel, das man hier vernimmt.
00:32:11
Speaker
Aber, und da kam schon wirklich Ende der 90er Jahre der Gedanke auf, ja, wir haben ja in der KI Möglichkeiten, das Wissen oder die Bedeutung wirklich auch explizit zu erfassen.
00:32:23
Speaker
Nur die Verknüpfung zwischen diesen, ich hatte sie vorhin schon genannt, diesen Beschreibungslogiken, die dafür verwendet werden,
00:32:30
Speaker
Und dem World Wide Web, die war noch nicht gegeben.
00:32:32
Speaker
Und Tim Berners-Lee ist dann den Schritt weitergegangen, dass er einfach gesagt hat, okay, wir verbinden das miteinander.
00:32:39
Speaker
Wir bringen genau diese Beschreibungssprachen in das Web und bauen darauf so einen Technologiestack, einen Technologiestapel aus, mit dem ich dann in der Lage bin,
00:32:49
Speaker
das Web, wie wir es alle kennen, zu erweitern, um diese semantischen Layer, um Bedeutung dann tatsächlich auch auszudrücken, damit eben jetzt autonome Agenten, also jetzt nicht nur wir Menschen, sondern wirklich dann auch Programme in der Lage sind, Informationen zusammen zu sammeln und dann dem Nutzer zur Verfügung zu stellen.
00:33:10
Speaker
Also die ursprüngliche Version oder Vision ging viel, viel weiter als das, was Google mittlerweile geschaffen hat, weil Google ist ja immer noch
00:33:17
Speaker
Eine zentrale Instanz, die uns allen die Arbeit quasi abnimmt und versucht quasi schon von vornherein zu ergründen, was uns interessiert.
00:33:28
Speaker
Deshalb werden auch von Google so viele benutzerbezogene Daten von uns gesammelt, weil die Suche und alles wird ja so versucht anzupassen, damit das, was uns interessiert,
00:33:40
Speaker
von dort geliefert werden kann.
00:33:42
Speaker
Das Problem ist halt, dass es alles zentralisiert.
00:33:44
Speaker
Natürlich muss dann an einer zentralen Stelle die Information über alle Benutzer gespeichert sein.
00:33:49
Speaker
Und das ist natürlich manchmal deutlich mehr, als uns lieb ist.
00:33:53
Speaker
Aber die ursprüngliche Idee, die Intention von dem Semantik-Web geht genau in die andere Richtung, in die verteilte Richtung.
00:34:00
Speaker
Das genau eben nur mein lokales Endgerät, das heißt nur mein Computer,
00:34:05
Speaker
weiß quasi über mein Nutzungsverhalten Bescheid, was mich interessiert, was meine Vorlieben sind, wie ich ticke.
00:34:12
Speaker
Und kann dann aufgrund von autonomen Agenten, die er quasi losschicken kann ins Web, Informationen gezielt so zusammensammeln, dass sie zu meinem Informationsbedürfnis passen.
00:34:25
Speaker
Und davon muss kein anderer was wissen, beziehungsweise keine zentrale Stelle kann das dann mit anderen in Bezug setzen, um das Ganze dann in irgendeiner Art und Weise wirtschaftlich zu nutzen oder auszunutzen.
00:34:35
Speaker
Und das ist die Idee, die da eigentlich dahinter steckt.
00:34:39
Speaker
Und das ist eine, Harald, nicht diese Idee der dezentralen Daten, die eigentlich auch den Kulturorganisationen oder den GLAMS besonders entgegenkommt.
00:34:50
Speaker
Das heißt, sie selber haben die Daten und müssen sie jetzt nicht abgeben und irgendwie hin, sondern können sie haben und sie verbinden sie mit den anderen.
00:34:58
Speaker
Durch die Verbindung kommt genau ein Mehrwert zustande.
00:35:02
Speaker
Das heißt, Larry Page und Sergey Brine haben natürlich wunderbar hingeguckt seinerzeit, als sie den Aufsatz gelesen haben, haben das dann für sich genutzt für ihren eigenen Google-Graphen.
00:35:15
Speaker
Was ich aber spannend finde in dieser Geschichte ist,
00:35:18
Speaker
dass einer der Gründe, weswegen damals die Google-Gründer dann Google Books gegründet haben, ja genau das war, zu sagen, ja, wo liegt denn das Wissen, was ich brauche, um sozusagen meinen Graphen eigentlich wirklich verbessern zu können, nämlich in den Büchern.
00:35:33
Speaker
Also haben sie gesagt, so, wir bieten den Bibliotheken an, die ganzen Sachen zu digitalisieren, machen es selber, entwickeln dieses,
00:35:42
Speaker
dieses Natural Language Processing, mit dem es möglich ist, aus diesen Büchern sozusagen den Graphen mit zu füttern, diese Triple Spadons mit aufzubauen.
00:35:53
Speaker
Und in Europa wurde das ganz falsch verstanden.
00:35:55
Speaker
Es wurde so verstanden, nämlich, oh, da klaut Google plötzlich die gesamten Daten und alles.
00:36:01
Speaker
Und dabei war das in diesem Fall gar nicht so gedacht.
00:36:05
Speaker
Entwickelte dann die Europeana 2008, die genau als Gegenstück zu Google Books entstanden ist, 2008,
00:36:12
Speaker
Und 2012 wurde dann, also schon vorher gegründet, aber ging dann online die Deutsche Digitale Bibliothek als diejenige, die sozusagen Europäer zuarbeiten

Potenziale von Wissensgraphen in der Kunstgeschichtsforschung

00:36:24
Speaker
sollte.
00:36:24
Speaker
Aber dieser Grundgedanke dahinter, der eigentlich bei
00:36:28
Speaker
zu Google Books führte, nämlich einen Graphen aufzubauen, einen Wissensgraphen, der war weder in der Europäaner noch in der Deutschen Bibliothek, kam der an, geschweige denn, sind die beiden heute so sozusagen technisch, dass das möglich ist, deswegen muss man ja ran und das Gesamte nochmal neu anpacken.
00:36:44
Speaker
Ich finde das aber spannend, dass das eigentlich so zwei Linien sind,
00:36:48
Speaker
die sich hinten treffen wieder, weil die Europäische und Deutsche Digitale Bibliothek heute für uns ein ganz wichtiger Fundus ist, wo man schon sagen kann, da ist schon mal viel digitalisiert, wenngleich auch diese Grundidee des Grafen und so weiter da noch gar nicht umgesetzt.
00:37:03
Speaker
Das ist das, was wir jetzt machen müssen und was auch möglich ist, dementsprechend jetzt einzubinden.
00:37:10
Speaker
Gibt es denn auch schon Überlegungen, was denn der Mehrwert für die kunsthistorische Forschung oder auch die digitale Kunstgeschichtsforschung sein wird, wenn wir davon ausgehen, der Knowledge Graph ist da.
00:37:22
Speaker
Kunsthoreinstitutionen speisen dort ein, haben die Schnittstellen gebaut.
00:37:28
Speaker
Wir haben den Fundus, auf dem man suchen kann.
00:37:32
Speaker
Was ist eure Vision damit?
00:37:33
Speaker
Was sind Methoden oder auch Forschungsideen, die erst dann umsetzbar sind?
00:37:40
Speaker
Also einmal aus der Kunstgeschichte rauf finde ich ganz spannend, dass wir dann Daten haben,
00:37:48
Speaker
die dementsprechend als Graph modelliert sind, also wir dementsprechend auch mathematisch abrufen können durch eine Sparkle-Abfrage und die dann ganz anders visualisieren können.
00:38:01
Speaker
Also wir haben die Möglichkeiten damit, über Karten, über dementsprechend Zeitstrahlen, über explorative Suchen, ganz anders Vernetzungen, Verbindungen herzustellen, die dann auch darzustellen, die ganz neue Erkenntnisse uns geben, aufgrund dessen, wie diese Daten strukturiert sind.
00:38:18
Speaker
Das kann man alles auch aufwendig mit einzelnen relationalen Datenbanken machen.
00:38:23
Speaker
Also die Technik ist nicht neu, nur wir können es jetzt dann über Massendaten machen, nämlich wirklich über einen ganz großen Pool und können uns dementsprechend einen Ausschnitt raussuchen und sagen, zeige mir das genauso an und dadurch gewinnen wir Erkenntnis.
00:38:38
Speaker
Das heißt, ich denke, das ist ein Punkt ganz stark,
00:38:41
Speaker
Wir haben ganz neue Möglichkeiten, Methoden, Visualisierungen draufzusetzen, um zu neuen Erkenntnissen zu kommen.
00:38:48
Speaker
Das andere, denke ich, ist auch sowas von innerhalb, also gerade bei Museen auch mit, sie haben ganz neue Möglichkeiten, das, was sie selber als Wissen haben, innerhalb von
00:38:59
Speaker
der Institution über ihre Objekte anzureichern durch das Wissen der anderen durch den Graphen.
00:39:07
Speaker
Das heißt also mit dieser Verlinkung ist ja jetzt nicht nur gegeben, dass man von außen irgendwas machen kann, sondern ich habe mein eigenes Wissen, meine eigene Datenbank reichere ich eigentlich an, indem ich plötzlich die Möglichkeit habe, innerhalb des Graphen zuzufangen, nämlich auch das, was über Wikidata, über andere Sachen kommt, auch zu klassifizieren,
00:39:24
Speaker
Ich möchte nur die und die Informationen von den und den Institutionen haben.
00:39:29
Speaker
Also es ist ja nicht so, dass ich jetzt in einem Riesenball bin, wo alles gleich ist, sondern ich weiß ja, aha, das kommt von Wikipedia, das kommt von Institution XY, das kommt davon, dass ich dann auch aussuchen kann und darin mir Informationen reinhole in meine eigenen Sachen und zwar für die eigene Vermittlung bis hin in den Museumskontext mit hinein.
00:39:48
Speaker
Das heißt,
00:39:50
Speaker
Ich habe die Möglichkeit dann, als zweites halt, meine Daten anzureichern dadurch, um eigene Sachen zu machen.
00:39:58
Speaker
Und das dritte, was ich finde, ist, ich habe es eben nochmal im Satz ein bisschen auch erläutert, ist wirklich das, dass wir das als
00:40:06
Speaker
Massendaten zusammenfügen und echt über eine große Anzahl von Wissen drüber gehen können.
00:40:12
Speaker
Und da auch letztlich, wenn man sich dann vorstellt, dass unsere Forschungspublikationen und das, was drin ist, auch noch mehr und mehr damit verknüpft werden kann, glaube ich,
00:40:22
Speaker
kommen wir echt dahin, dass das, was ja Digitalität oder Computer auch als Vorteil für uns hat, nämlich, dass wir Komplexität damit bewältigen können, dass wir das, was wir Menschen so an vielen Beziehungen gar nicht herstellen können, der Computer uns helfen kann, um neue Erkenntnisse auch mitzubekommen.
00:40:39
Speaker
Am Ende
00:40:40
Speaker
müssen wir Menschen immer noch entscheiden, was möchte ich dann vermitteln, was möchte ich worüber oder was ist die eigentliche Erkenntnis, die ich dann rausziehe.
00:40:50
Speaker
Aber das Hilfsmittel wird in dem Falle der Computer.
00:40:53
Speaker
Und das ist der Unterschied vom Buch hier zum Knowledge Graph, weil es echt ein Sprung ist, der uns hilft, neues Wissen zu generieren und damit dann auch neue Erkenntnisse.
00:41:04
Speaker
Ich kann mir auch vorstellen, dass der Wissenskanon, den wir haben, sich dann dadurch stark verschiebt.
00:41:10
Speaker
Weil im Moment ist es ja oft so, dass man, wenn man Recherchen startet, erst mal dorthin geht, wo es die meisten Informationen gibt.
00:41:16
Speaker
Also man geht an Zentralinstitute oder an Institutionen mit großen Bibliotheken, an Häuser, die viel aus dem Bereich dieses Themas haben, nachdem man forscht.
00:41:26
Speaker
Ich stelle mir jetzt mal so vor, wenn es wirklich alles dann in diesem Knowledgecraft drin ist, gibt es ja nicht mehr diese Hierarchisierung von was ist die wichtige Institution und was ist irgendwie das kleine Dorfarchiv, das irgendwo liegt.
00:41:37
Speaker
Alles wird ja dann egalitärer und gleich zugänglich und in dem Moment eröffnet sich eine ganz neue Wissenswelt, auch hinsichtlich einer World Art History.
00:41:51
Speaker
Also ja, auf der einen Seite, du hast auf der Datenebene diese Gleichheit, ja.
00:41:58
Speaker
Und das mag sein, obwohl die Frage danach, ob alles drin ist, was heißt alles, aber sagen wir mal, es ist wirklich richtig viel drin.
00:42:07
Speaker
Letztlich ist es aber das, ich muss abfragen, ich muss Anwendungen machen und darüber entsteht der Gap dann wieder.
00:42:13
Speaker
Das heißt, ich bringe den Kanon darüber rein, wie gehe ich damit um?
00:42:17
Speaker
Und deswegen die Hoffnung damit, jetzt wird alles gleich,
00:42:21
Speaker
ist nicht das Thema, ob wir die Daten dementsprechend gleich hinbekommen und gleichwertig und auch zugänglich, sondern hat zu tun ganz stark damit, was uns interessiert und wie wir mit diesen Daten umgehen.
00:42:33
Speaker
Aber die Möglichkeit ist natürlich leichter, muss aber dafür die Sachen auch digitalisiert haben.
00:42:40
Speaker
Alles das, was nicht digitalisiert ist, ist nicht zugänglich und nicht drin.
00:42:44
Speaker
Da ist auch ein Gap.
00:42:45
Speaker
Und diese Diskussion werden wir dann auf jeden Fall auch weiterführen.
00:42:48
Speaker
Und jetzt, was kommt jetzt rein?
00:42:51
Speaker
Alles das, was schon Kanon ist.
00:42:52
Speaker
Weil guck rein, was in den ganzen Datenbanken ist.
00:42:55
Speaker
Das ist ja ganz stark auch das, vor allem, was als erstes reinkommt, was gerade Teil des Kanons auch mit ist.
00:43:01
Speaker
Gleichzeitig kommt all das auch jetzt rein, was wir in den Depots und so weiter haben, was wir nie zu sehen bekommen haben und auch worüber nie geforscht wurde.
00:43:08
Speaker
Und das ist der Vorteil dabei, ganz klar.
00:43:11
Speaker
Du hast jetzt schon den Gap angesprochen.
00:43:13
Speaker
Was ist denn diese Hürde, der große Graben, den man überspringen muss?
00:43:19
Speaker
Kann ich einfach als Kunsthistorikerin und Kunsthistoriker in diesem Knowledge Graph suchen?
00:43:24
Speaker
Also ähnlich wie bei Google mit einem Suchschlitz?
00:43:28
Speaker
Prinzipiell ja, natürlich.
00:43:30
Speaker
Aber sagen wir mal, die...
00:43:33
Speaker
Der wirkliche Mehrwert oder der wirkliche Nutzen wird dann erst offenbar, wenn man in der Lage ist, auch Werkzeuge anzuwenden, die genau dieses Wissen, das da abgebildet wird oder repräsentiert wird, auch wirklich nutzt.
00:43:48
Speaker
Die traditionelle Suche, wie wir sie kennen, ist eine sehr eindimensionale Geschichte, weil ich suche normalerweise irgendwas,
00:43:56
Speaker
von dem ich schon weiß, dass es existiert.
00:43:57
Speaker
Also ich suche ein Bild, auf dem Person XY abgebildet ist zum Beispiel.
00:44:02
Speaker
Dann gebe ich das so ein.
00:44:03
Speaker
Also ich möchte, was weiß ich, ein Kunstwerk und gebe den Namen der Person ein, die darauf abgebildet werden soll.
00:44:09
Speaker
Und das kann ich dann zentral quasi an so vernetzte Datenbanken stellen.
00:44:13
Speaker
Das konnte ich vorher auch schon.
00:44:16
Speaker
Aber wenn ich weiß, wie ich es richtig mache, dann kann ich wesentlich komplexere Abfragen stellen,
00:44:24
Speaker
Und da will ich dann gleich nochmal drauf eingehen, wie man das dann auch noch vereinfachen kann und welche Richtung das dann geht.
00:44:28
Speaker
Aber wenn man diese komplexen Abfragen stellen kann, kann ich beispielsweise hergehen jetzt und ich kann nach, also ich muss nicht mehr so konkret sein.
00:44:36
Speaker
Ich kann beispielsweise sagen, okay, gib mir Bilder zurück, bei denen spätbarocke Künstler abgebildet werden mit, ich nehme jetzt mal was ganz abwegiges, landwirtschaftlichen Nutztieren.
00:44:48
Speaker
Da gibt es einige.
00:44:49
Speaker
Ja, genau.
00:44:50
Speaker
Also worauf ich raus will, ist beispielsweise, vorher musste ich hergehen, musste jedes einzelne Nutztier, das mir einfällt, benennen und natürlich auch jeden Künstler, der in diese Kategorie fällt.
00:44:59
Speaker
Beziehungsweise, dass das Ganze auch noch spätbarock ist, muss ich raussuchen, ja, von welchem Jahr bis zu welchem Jahr geht das denn?
00:45:04
Speaker
Was interessiert mich denn da?
00:45:06
Speaker
Und das ist halt das Ding, wenn ich das vorhandene Wissen in diesem großen Wissensgraf mit externen Wissensquellen, wie jetzt beispielsweise Wikidata, verknüpfe,
00:45:17
Speaker
Dann kann ich sehr leicht feststellen, okay, Spätbarock geht von dann bis dann.
00:45:22
Speaker
Künstler finde ich da auch, nach wen ich suche.
00:45:24
Speaker
Da kann ich eine Gruppe nach Künstlern suchen, die genau eben deren Schaffenswerk genau in dieser Zeit des Spätbarock liegt.
00:45:31
Speaker
Plus ich finde auch noch heraus, welche Tiere als landwirtschaftliche Nutztiere gelten und kann dann diese Abfrage in Richtung dann unseres Wissensgrabs erweitert dann so stellen, dass dann
00:45:40
Speaker
Über was wird dort abgebildet, da gibt es ja in der Kunstgeschichte so ein schönes System, das heißt Icon Class, Holger wird das bestimmt kennen und da gibt es Trillionen von, ne so viele natürlich auch nicht, ich glaube knapp über 100.000 wahrscheinlich irgendwelche Codes, mit denen quasi kodiert werden kann, was genau denn jetzt passiert.
00:46:00
Speaker
Ja.
00:46:20
Speaker
dann kriege ich Ergebnisse aus allen möglichen angeschlossenen Kulturinstitutionen zurück.
00:46:26
Speaker
Und da muss es sich dann nicht nur um Bilder handeln, da kann es dann auch andere Kunstwerke sein, beispielsweise Plastiken können das sein oder es können Münzen sein auf denen, was abgebildet ist und ähnliches.
00:46:36
Speaker
Also es erweitert halt ganz einfach die Spannbreite auch der Ergebnisse, die ich erwarten kann.
00:46:43
Speaker
Ich werde Dinge finden, mit denen ich überhaupt nicht gerechnet habe.
00:46:47
Speaker
Und auf eine Art und Weise, ich muss aber wissen, wie ich diese Abfrage stelle.
00:46:51
Speaker
Und worauf ich jetzt hinaus möchte, wohin sich das Ganze ändern kann oder ändern wird, und das ist auch ein Stückchen auch noch jetzt ein kleiner Forschungsaspekt

Benutzerfreundlichkeit und Wissensgraphen

00:47:00
Speaker
an der Sache dran.
00:47:00
Speaker
Wir müssen natürlich herausfinden, wie setzen wir den Endbenutzer, der jetzt natürlich nicht über dieses Fachwissen verfügt, in die Lage, solche Abfragen stellen zu können.
00:47:14
Speaker
Und da kommen dann natürlich solche Frage-Antwort-Systeme dann zum Tragen, also dass ich in der Lage bin, genauso wie ich gerade meine Frage formuliert habe mit diesen abstrakten Begriffen, die müssen dann übersetzt werden in diese entsprechenden Abfragen an die beteiligten Wissensgrafen, an Wikidata, an unseren Wissensgrafen und das ist,
00:47:34
Speaker
Geht mir oder weniger gut, aber beispielsweise mithilfe von diesen neuen großen Sprachmodellen, Jet, GPT und Co., die sind schon ganz gut in der Lage, solche Schnittstellen zu schaffen und zu vereinfachen, dass auf der einen Seite meine natürlich gestellte Anfrage in eine formale Abfrage umgeschrieben wird oder umgekehrt die Ergebnisse, die ich bekomme, in schön lesbare Texte dann übersetzt werden.
00:48:03
Speaker
Im Moment ist es so, dass man an den Knowledge Graphen einen mit, was ist das, einen Sparkle Endpunkt, oder?
00:48:10
Speaker
Genau, also das ist für die Experten, die können dann so eine Sparkle Abfrage stellen.
00:48:14
Speaker
Das sieht so ähnlich aus wie bei relationalen Datenbanken.
00:48:18
Speaker
Da gab es auch eine Abfragesprache, gibt es immer noch SQL oder SQL.
00:48:22
Speaker
Ist eigentlich ganz einfach für denjenigen, der es kann.
00:48:25
Speaker
Jemand, der nicht in der Materie steckt, der muss natürlich einen Lernaufwand investieren, um dann solche Abfragen tatsächlich zu finden.
00:48:31
Speaker
gestalten zu können.
00:48:32
Speaker
Und nichtsdestotrotz ist immer so eine Art Suchschlitzabfrage möglich, in der ich eben Begriffe aufliste, die dann gesucht oder gefunden werden müssen.
00:48:42
Speaker
Allerdings auch wieder da nur eingeschränkt halt darauf mit der Art und Weise, also welche Ergebnisse kann ich denn da erwarten?
00:48:47
Speaker
Das muss dann auch tatsächlich im Index drinstehen, was ich da suche.
00:48:52
Speaker
Ja, aber ihr seid ja da dran, eine andere Art von Interface zu gestalten für alle, die Sparkle nicht kennen.
00:49:00
Speaker
Oder nicht dazu fähig sind.
00:49:02
Speaker
Genau, das ist unsere tägliche Arbeit.
00:49:05
Speaker
Jetzt macht ihr das ja auch schon eine ganze Weile, NFDI for Culture läuft schon seit ein paar Jahren.
00:49:09
Speaker
Was ist denn die häufigste Kritik am Knowledge Graph, der ihr begegnet?
00:49:16
Speaker
Dass noch zu wenig drin ist.
00:49:21
Speaker
Ja, ich glaube, also deswegen das, was bisher immer kommt, oh ja, da ist ja noch so gar nicht viel.
00:49:28
Speaker
Aber das ist, glaube ich, ganz klar.
00:49:29
Speaker
Das liegt jetzt daran, deswegen versuchen wir da jetzt ganz viele, die auch schon Daten haben, dazu zu bringen, sie dementsprechend zur Verfügung zu stellen.
00:49:36
Speaker
Und so, dass man auch nicht zur Verfügung zu stellen, ist auch schon wieder falsch.
00:49:40
Speaker
sondern dass wir sie so aufbereiten können, dass man sie mit in dem Graphen darüber ansprechen kann, zugänglich machen kann, dass man das dementsprechend hat.
00:49:51
Speaker
Aber ich glaube, ab dem Moment, wo da eine große Menge drin ist, wird man sofort den Nutzen sehen, ganz ähnlich wie bei KI, wo man lange dachte, ach, was ist das?
00:50:00
Speaker
Es ist was für Nerds.
00:50:01
Speaker
Ab dem Moment, wo Chatschie Bedi eine Anwendung bringt, die für alle sofort einen Mehrwert hat, merkt man, was da an Potenzial drin ist dabei.
00:50:10
Speaker
Genau und wir haben in NFDI4Culture auch diese ursprüngliche Eintrittshürde, nämlich eben die Arbeit, die ich investieren muss, um meine Daten da reinzubringen, jetzt so weit niedrig oder niederschwellig angesetzt, dass wir eben auf bereits vorhandene Schnittstellen zugreifen und jetzt…
00:50:25
Speaker
geht es auch wesentlich schneller, Dinge einzugliedern oder reinzubringen in den Wissensgraf.
00:50:30
Speaker
Jetzt kommen natürlich dann zusätzliche neue Fragestellungen, dass eben neue Arten von Objekten dann darin verortet werden.
00:50:39
Speaker
Und es ist wie immer die Frage, und da brauchen wir auch die Unterstützung der Wissensgrafie,
00:50:44
Speaker
Kulturwissenschaftler.
00:50:46
Speaker
Wir haben jetzt hier diese ganzen Daten.
00:50:47
Speaker
Was ist denn wichtig für eure Forschung, für eure Forschungsfragen?
00:50:51
Speaker
Was sollen wir denn davon wirklich jetzt abbilden in diesem großen Suchindex?
00:50:56
Speaker
Weil alles das, wir müssen nicht unbedingt wissen, wie viele Seiten ein Buch hat beispielsweise, aber es wäre vielleicht interessant zu wissen, A, wer hat es geschrieben, B, wer hat es verlegt oder C, über wen wird da geschrieben oder über was wird da geschrieben?
00:51:08
Speaker
Aber das wäre jetzt mal eine leidenhafte Vorstellung.
00:51:11
Speaker
Sagt uns doch mal konkret, was habt ihr für

Zusammenarbeit bei der Wissensgraph-Entwicklung

00:51:13
Speaker
Forschungsfragen?
00:51:13
Speaker
Und an der Stelle sind wir jetzt gerade, dass wir eben in unterschiedlichen Anwendungskontexten wirklich Forschungsfragen von Wissenschaftlern, die mit diesen Daten arbeiten wollen, zusammenstellen und sammeln.
00:51:26
Speaker
Und danach richten wir natürlich dann auch die Inhalte aus, die dann im Knowledge Graph zu finden sind.
00:51:31
Speaker
Und so kommt jetzt Stück für Stück, ziehen wir dann hoch und bringen wir damit rein und stellen zur Verfügung.
00:51:37
Speaker
Das ist ja wirklich keine einfache Aufgabe.
00:51:38
Speaker
Alleine die Frage, was ist euch wichtig?
00:51:42
Speaker
Eine Buchwissenschaftlerin würde auf die Frage, braucht man die Seitenzahlen ja oder nein anders antworten als ich als Kunsthistorikerin.
00:51:49
Speaker
Also das ist, glaube ich, auch die, unabhängig von technischer Möglichkeit, die Heterogenität,
00:51:56
Speaker
von dem, was Kultur ist und Kulturwissenschaften bei uns ausmacht, die überhaupt alle mitzunehmen und die Bedarfe abzufragen.
00:52:04
Speaker
Wie geht ihr da vor?
00:52:05
Speaker
Also es gibt ja jetzt nicht irgendwie so eine Mailing-Liste, die sagt so, hier, her mit euren Fragen.
00:52:12
Speaker
Ja, aber schon sehr explorativ, oder?
00:52:14
Speaker
Indem wir einfach jetzt auch mit denen arbeiten, die jetzt kommen.
00:52:17
Speaker
Und wie Harald gerade schon sagte, mit den ersten Forschungsfragen auch, wo man sagt, wir müssen ran, um zu lernen, was braucht es in dem Graphen, damit man auch dementsprechend Antworten darauf findet, auf die Fragen, die ich stelle.
00:52:33
Speaker
Und insofern sind wir da auch noch ganz am Anfang nicht.
00:52:37
Speaker
Also wenn man sieht, es ist jetzt möglich, aber der Graf ist noch nicht derjenige, mit dem wir komplett alle Fragen der Kunstgeschichte und Kulturgeschichte lösen können.
00:52:49
Speaker
Es wird ein Instrument sein, mit dem wir dann, wenn da viele
00:52:53
Speaker
Informationen drin sind, als Wissen miteinander verbunden und wenn es so drin verbunden ist, dass wir dann auch diese Informationen darin abfragen können, also genau das, was Harald gerade sagte, dass wir wissen, was ist wichtig oder was braucht ihr, was wir miteinander verknüpfen müssen, dass man dann einen Graphen hat, der dann auch wächst und dementsprechend mehr und mehr genutzt wird.
00:53:17
Speaker
Deswegen ist es aber wichtig jetzt am Anfang erstmal, dass wir so viel wie es geht an Informationen mit reinholen,
00:53:23
Speaker
Und dass wir die ersten Wissenschaftlerinnen mit drauf nehmen, die das auch schon nutzen, weil ganz ehrlich, in meinem eigenen Fach in der Kunstgeschichte, ich würde mal fast behaupten, also wer arbeitet wirklich digital oder forscht digital?
00:53:36
Speaker
Also digitales Forschen ist ja nicht PowerPoint nutzen.
00:53:39
Speaker
also 5% oder so, die sowas nutzen, aber die müssen wir jetzt gewinnen, um daran zu gehen, dass wir die Fragen stellen können und mit denen auch zu arbeiten, damit wir den Knowledge Graphen besser bekommen.
00:53:51
Speaker
Und das ist die Aufgabe von NFT for Culture, jetzt genau diese Community anzusprechen und dann auch dementsprechend das Schritt für Schritt, iterativ diesen Knowledge Graphen dann auch wirklich groß und zum Erfolg führen zu lassen.
00:54:07
Speaker
Und das ist auch, wenn ich das ergänzen darf, Holger, es geht ja nicht nur darum herauszufinden, was wollen die Kulturwissenschaftler oder was haben die für Fragen, sondern durch die Möglichkeiten, die wir jetzt schaffen, wird die Beantwortung von ganz neuen Fragestellungen, die vielleicht bisher noch gar nicht quasi zur Sprache gekommen sind, möglich.
00:54:30
Speaker
Das heißt, das ist so ein gegenseitiger, wechselseitiger Prozess der gegenseitigen Befruchtung, wo wir eben Schritt für Schritt vorgehen.
00:54:37
Speaker
Erstmal fragen, ja, was sind eure traditionellen Fragestellungen?
00:54:39
Speaker
Guckt mal, wir könnten aber auch dieses und jenes.
00:54:42
Speaker
Interessiert euch das vielleicht?
00:54:43
Speaker
Und so tasten wir uns da langsam von beiden Seiten vor, um wirklich das Potenzial wirklich ausnutzen zu können, das sich hier erschließt.
00:54:50
Speaker
Also zum Beispiel, die gesamte Provenienzforschung wird einen Vorteil davon haben, weil diese Art von Information so zusammenzufügen, dass ich dann feststellen kann, guck mal, wo überall das Objekt war und wie ich das miteinander verbinden kann, ist eigentlich nur über den Knowledge Graph möglich, denn alles andere ist Sisyphus-Arbeit im Archiv.
00:55:11
Speaker
Diese ganze Arbeit, es ist ja nicht Forschung, eine Quelle zu finden.
00:55:15
Speaker
Es ist Forschung, diese Quelle dann im richtigen Bezug zu setzen.
00:55:19
Speaker
Und dieses zu helfen, sie zu finden, bisher ist es aber immer das Gefühl, ich muss diese eine Quelle haben oder damit ich sozusagen, das ist der große Erfolg meiner Forschung.
00:55:27
Speaker
Nee, das ist fleißige Suche.
00:55:30
Speaker
Aber jetzt eigentlich, was bedeutet das für meine Fragestellung und so weiter?
00:55:35
Speaker
Und darin auch wirklich Energie reinzunehmen und dass wir aber die Informationen wirklich im Knowledge Graphen haben, der uns hilft, genau diese Fragen dann auch zu stellen und zu beantworten.
00:55:48
Speaker
Ich denke gerade darüber nach, wie viel Zeit ich in meiner Dissertation gespart hätte, wenn ich auf einen Knowledge Graph hätte zurückgreifen können.
00:55:58
Speaker
Ja, ich habe zum Beispiel den ganzen Holstein-Katalog durchgeblättert, komplett die gesamten Grafiken des 15., 16.
00:56:06
Speaker
Jahrhunderts für meine Dissertation, war echt Tage damit beschäftigt, das gut zu machen.
00:56:11
Speaker
Das ist heute mit Knowledge Graphen und Computer Vision ist es ein Klick, wenn ich dementsprechend die Daten auch drin habe.
00:56:19
Speaker
Das heißt, all die unsinnige Arbeit, die wird mir genommen, aber die wichtige muss ich tun.
00:56:24
Speaker
Wenn ich das Objekt habe, den Fund, dann muss ich immer noch zuordnen.
00:56:27
Speaker
Was ist davor, danach?
00:56:28
Speaker
Was bedeutet das für die Bildgeschichte?
00:56:30
Speaker
Und dann fängt Forschung eigentlich erst an.
00:56:33
Speaker
Es wirkt auch ein bisschen so, dass man dann forschen könnte ohne Fachgrenzen, oder?
00:56:36
Speaker
Ja.
00:56:38
Speaker
Ja, ganz genau so ist es.
00:56:39
Speaker
Also die NFDI beschränkt sich ja jetzt nicht nur auf die Kulturwissenschaften, sondern die soll die komplette Wissenschaftslandschaft abdecken.
00:56:46
Speaker
Und wir entwickeln ja nicht nur für die Kunstgeschichte hier jetzt Knowledge Graphen, sondern auch in anderen Fachdisziplinen.
00:56:53
Speaker
Und naheliegend ist ja dann die Quervernetzung in andere Bereiche, sodass dann Fragestellungen entstehen.
00:57:00
Speaker
die jetzt beispielsweise die Material- und Werkstoffwissenschaften oder die Chemie betreffen.
00:57:05
Speaker
Beispielsweise, wenn es darum geht, aus welchen Farben werden jetzt oder welche Farben werden verwendet in einer bestimmten Epoche, wie setzen die sich zusammen?
00:57:13
Speaker
Diese Information kann ich dann finden über eben jetzt hier den Bereich Chemie oder den Bereich Material- und Werkstoffwissenschaften, wo genau für Farben dann eben die einzelnen Komponenten und deren Eigenschaften dann auch hinterlegt sind.
00:57:25
Speaker
Und darauf aufbauend kann ich dann eben jetzt wirklich auch disziplinübergreifende Fragestellungen beantworten.
00:57:31
Speaker
Und da wird es dann auch wirklich spannend.
00:57:33
Speaker
Ja, es baut Hürden ab, die man sonst bei einer interdisziplinären Forschung immer wieder hat, wenn man sich in andere Fachbereiche eindenken und einlesen muss.
00:57:41
Speaker
Was sind da die Fachmagazine?
00:57:42
Speaker
Wo ist publiziert worden?
00:57:44
Speaker
Und so weiter und so fort.
00:57:45
Speaker
Also ich sehe da ganz ehrlich nur Vorteile für uns als Wissenschaftlerinnen und Wissenschaftler.

Integration von Sammlungen in Wissensgraphen

00:57:50
Speaker
Auf der einen Seite, was unsere Art und Weise zu forschen angeht,
00:57:54
Speaker
Auf der anderen Seite für Kulturinstitutionen, den Clam-Institutionen, sehe ich die Vorteile, dass sie einfach ihre Sammlungen in die Wissenswelt hineinkriegen, also auch noch zugänglicher machen, als es vielleicht jetzt schon über Homepages und Datenbanken passiert ist.
00:58:10
Speaker
Ich denke, dass viele, die zugehört haben, jetzt ähnlich denken wie ich, aber wie macht man dann jetzt mit?
00:58:14
Speaker
Also ich sitze auf einer Sammlung.
00:58:16
Speaker
Was muss ich tun, um sie in den Graphen reinzukriegen?
00:58:21
Speaker
Also die Grundlage, das, was du auf jeden Fall tun musst und was noch viel mehr geschehen muss, ist erstmal digitalisieren.
00:58:27
Speaker
Also das ist das, was man machen muss.
00:58:29
Speaker
Analoge passt nicht in den Graphen, wir brauchen es digital.
00:58:32
Speaker
Und dann bietet NFD4Culture gerade drei Möglichkeiten an.
00:58:38
Speaker
Das eine ist, du modellierst es gleich im Graphen, hast es also in Datenbanken, die gleich schon Graphen anbieten und darüber kann man es dann dementsprechend einbinden und zur Verfügung stellen, dass man den Graphen sozusagen, der schon da ist, vielleicht auch ein Sparkle Endpoint, den jemand schon hat, das werden aber die wenigsten sein.
00:58:58
Speaker
Die einfachste Sache ist die, dass wenn ich schon eine Datenbank habe, sie aber und die Informationen schon im Internet auch zur Verfügung stelle aus dieser Datenbank mit heraus, was ja einige schon haben.
00:59:11
Speaker
Es gibt ja viele Institutionen, Museen schon, die ihre Sachen aus der Datenbank in einer Website zeigen.
00:59:17
Speaker
Dann ist es sehr einfach,
00:59:19
Speaker
über dieses Culture Graph Interchange Format, das wir mitentwickelt haben, einfach es über die Webseite, dass wir es über die Webseite anfragen und darüber dann den Graphen mit modellieren.
00:59:32
Speaker
Das ist für die Institution wenig Aufwand oder man muss die Schema Org mit reinbringen einmal, dieses Plug-in.
00:59:40
Speaker
Das ist aber etwas, was man auf jeden Fall machen kann und was kein großer Aufwand ist, auch kein großer Kostenaufwand ist.
00:59:47
Speaker
Und dann können wir das mit integrieren.
00:59:48
Speaker
Also alle die, die die Sachen schon haben auf der Webseite, ist auch da wirklich die Integration relativ einfach.
00:59:55
Speaker
Und ein bisschen aufwendiger wird es, wenn ich es in meiner Datenbank habe, aber ich habe es noch nicht in der Webseite.
01:00:01
Speaker
Dann muss ich einen ordentlichen Export machen, zum Beispiel Lido.
01:00:05
Speaker
ein Lido Export, der mittlerweile auch Standard ist.
01:00:08
Speaker
Und wenn ich das habe, es gibt mittlerweile die Möglichkeit von Lido in so ein Lido RDF Format mitzukommen, dass man sozusagen das gleich in Linked Open Data auch mitbringt, dass man es mit reinnehmen kann.
01:00:20
Speaker
Das ist von beiden Seiten ein bisschen mehr Aufwand, das ist klar.
01:00:23
Speaker
Aber das ist die dritte Möglichkeit.
01:00:25
Speaker
Und insofern aber alles drei Möglichkeiten, glaube ich, mit denen man recht sofort anfangen kann.
01:00:30
Speaker
Für uns ist eher das Problem die Zeit.
01:00:32
Speaker
dass man das jetzt mit einbindet und so weiter.
01:00:35
Speaker
Aber da sind wir dran, dass das auf jeden Fall gelingen sollte.
01:00:45
Speaker
Inspiriert von den Ideen des Semantik-Web knüpft man bei NFDI for Culture einen Wissensgrafen aus Knoten und Kanten.
01:00:53
Speaker
Digitales Klöppeln, damit wir uns nicht nur schneller durch große Datenmengen schaufeln können, sondern auch bislang unbekannte Verknüpfungen sichtbar machen.
01:01:03
Speaker
Der Umgang mit dem Knowledge Graph verspricht ein großer Gewinn für die Forschung zu sein und das Information Retrieval, ich erinnere hier an die dritte Folge des Podcasts, zu verbessern.
01:01:15
Speaker
Auf der technischen Seite sind die Weichen schon gestellt.
01:01:19
Speaker
Offen ist, wie wir im Fach Kunstgeschichte unsere Kompetenzen weiterentwickeln, um mit diesem Angebot auch umgehen zu können.
01:01:26
Speaker
Denn nur wenn wir Angebote dieser Art nutzen und wiederum unsere Bedarfe an die Entwicklerinnen und Entwickler melden, bekommen wir digitale Werkzeuge, die wir wirklich brauchen.
01:01:37
Speaker
Der Austausch miteinander ist wichtig und wir sind es dem kulturellen Erbe ja auch irgendwie schuldig.
01:01:43
Speaker
Kulturhistorische Daten sind Daten von Bedeutung.
01:01:46
Speaker
Im Knowledge Graph werden sie zu semantischen Daten, zu Daten mit Bedeutung.
01:02:04
Speaker
Diese Folge wurde von Jacqueline Klosig-Eckardt produziert im Auftrag des Arbeitskreises Digitale Kunstgeschichte.
01:02:09
Speaker
Unterstützt wird sie dabei von der Redaktion der Arbeitskreismitglieder Peter Bell, Lisa Diekmann, Peggy Große, Waltraud von Pippich und Holger Siemann.
01:02:18
Speaker
Finanziert wird AdHistocast, der Podcast zur digitalen Kunstgeschichte von NFDI for Culture, dem Konsortium in der nationalen Forschungsdateninfrastruktur, das sich mit Forschungsdaten zu materiellen und immateriellen Kulturgütern befasst.
01:02:33
Speaker
Unterstützt wird AdHistocast durch den Deutschen Verband für Kunstgeschichte.
01:02:39
Speaker
Du hast noch eine Frage oder Anregungen?
01:02:42
Speaker
Kontaktiere uns einfach unter podcast.digitale-kunstgeschichte.de