back to blog

Was kann ChatGPT für Kultureinrichtungen tun?

Read Time 5 mins | Written by: Dr. Cecilia Maas

Welches Potenzial haben große Sprachmodelle wie ChatGPT für Kultureinrichtungen wie Archive, Bibliotheken und Museen? Welche falschen Erwartungen werden an sie gestellt?

ChatGPT ist das neue coole Kind im Block. Der Launch des neuen Sprachmodells von OpenAI hat ein breites Spektrum an Reaktionen ausgelöst, von Begeisterung bis hin zu Angst. Bei denjenigen unter uns, die es als ein Werkzeug mit enormem Potenzial sehen, herrscht noch viel Verwirrung und das Gefühl, dass ChatGPT alles kann und weiß.

Es heißt, dass sich KI von einem externen Werkzeug oder einer Prothese, die die menschlichen Fähigkeiten erweitert, hin zu einem anthropomorphen oder menschenähnlichen Wesen entwickelt, wobei Chatbots und virtuelle Assistenten wie Siri oder Alexa die besten Beispiele für Letzteres sind. Das wirft Fragen auf wie “Wird uns die KI die Arbeit wegnehmen?” oder andererseits “Wird uns die KI von all unseren unerwünschten Aufgaben befreien?”. 

Menschen in Kultureinrichtungen, deren Aufgabe es ist, das kulturelle Erbe zu bewahren, zu verstehen und zugänglich zu machen, können von den neuen Technologien profitieren, ohne die hohen wissenschaftlichen Standards ihrer Arbeit zu gefährden. 

Der Kultur- und Bildungssektor ist oft unterfinanziert und personell unterbesetzt und steht vor neuen Herausforderungen, um mit den aktuellen Formen des Kulturkonsums Schritt zu halten und das Engagement des Publikums aufrechtzuerhalten – es lohnt sich also, darüber nachzudenken, wie Technologie sie unterstützen kann.

In unserer Arbeit mit Kultureinrichtungen haben wir oft von der Unmöglichkeit gehört, neue Sammlungen zu katalogisieren, selbst wenn es sich um die sinnvollsten und spannendsten handelt, die man sich vorstellen kann – wegen Personalmangel oder fehlenden Ressourcen. Wenn du dies liest und in einem Museum, Archiv, einer Bibliothek oder ähnlichem arbeitest, hast du wahrscheinlich noch viele andere Aufgaben im Kopf, zu denen du nie kommst, entweder weil deine To-Do-Liste voller langweiligem Verwaltungskram ist oder weil dein Team einfach nicht groß genug ist, um ein neues und spannendes Projekt zu übernehmen. 

In diesem Beitrag geht es darum, was KI-Sprachmodelle wie ChatGPT tun können und was nicht, um Kultureinrichtungen dabei zu helfen, ihren Auftrag zu erfüllen und ihre Mitarbeiter:innen zufriedener mit dem Prozess und dem Ergebnis ihrer Arbeit zu machen.

ChatGPT ist der Superheld unter den Sprachmodellen – aber was sind seine Superkräfte?

Der erste Schritt, um das Potenzial von KI-Sprachmodellen für unsere Arbeit in Kultureinrichtungen nutzbar zu machen, besteht darin, zu verstehen, was sie sind und wofür sie trainiert werden. 

Beginnen wir mit ChatGPT, das inzwischen so bekannt ist, dass viele zumindest eine ungefähre Vorstellung davon haben, was es ist, aber das meiste, was folgt, gilt auch für viele andere Modelle. Um es kurz zu definieren: ChatGPT ist ein Sprachmodell, das darauf trainiert wurde, menschenähnliche Antworten auf Texteingaben zu geben. Es ist seine Konversationsfähigkeit, die uns so sehr beeindruckt hat, d. h. seine Fähigkeit, die Fragen oder Nachrichten, die wir in die Chat-Oberfläche schreiben, zu “verstehen” und mit einem Text zu antworten, der tatsächlich Sinn ergibt. Ob es darüber hinaus auch genau ist, ist eine andere Frage. Konzentrieren wir uns erst einmal darauf, warum es sich so menschenähnlich liest, und kommen wir später auf die Genauigkeit zurück. 

Wenn ChatGPT Sprache so gut verarbeiten kann, liegt das daran, dass es mit einer noch nie dagewesenen Menge an Daten trainiert wurde (etwa so viel wie mehrere Millionen Bücher). Was bedeutet es, dass ein Modell “lernen” kann? Das Konzept des Lernens, eine der vielen menschenähnlichen Metaphern, die in der künstlichen Intelligenz verwendet werden, bezieht sich eigentlich auf den Prozess, bei dem das Modell großen Mengen von Textdaten ausgesetzt wird und angewiesen wird, die Muster und Strukturen der Sprache zu erkennen. Während des Trainingsprozesses werden dem Sprachmodell Textbeispiele und die damit verbundenen Sprachmuster vorgelegt, z. B. Grammatikregeln, Wortverwendung und kontextuelle Bedeutung. Das Modell analysiert dann diese Muster und nutzt sie, um neuen Text zu erstellen, Vorhersagen darüber zu treffen, welche Wörter als nächstes in einem Satz kommen werden, oder um Fragen auf der Grundlage der in den Trainingsdaten verfügbaren Informationen zu beantworten. 

Wir müssen nur nett fragen

Da wir jetzt ungefähr wissen, wie ChatGPT trainiert wurde, können wir ableiten, was es wahrscheinlich gut kann. Wie du vielleicht gesehen hast, ist ChatGPT sehr gut bei Aufgaben, die ein allgemeines Wissen darüber erfordern, wie Sprache intern strukturiert ist (Grammatik, Vokabular, wie sich Wörter verbinden). Beispiele dafür sind das Zusammenfassen oder Umschreiben eines Textes, das Übersetzen in verschiedene Sprachen, das Erstellen eines Textes auf der Grundlage eines vorgegebenen Themas und von Anweisungen zu Format und Stil oder als Antwort auf eine Frage, usw. Das Modell kann auch Schlüsselwörter generieren, die das Thema eines größeren Textes beschreiben, oder die Wörter extrahieren, aus denen die Namen von Personen oder Orten bestehen.

All das kann sehr nützlich sein, um die Arbeit von Kultureinrichtungen zu unterstützen, oder? Aber ChatGPT kann das nicht einfach so, sondern wir müssen wissen, was wir von ihm verlangen und wie. 

Wir müssen die Sprachmodelle als Bausteine betrachten, mit denen wir etwas Neues bauen können, etwas, das wir brauchen. Die Chat-Implementierung, die auf der Website von OpenAI verfügbar ist, bietet uns eine Spielwiese, um das Potenzial zu sehen, aber um das Modell tatsächlich das tun zu lassen, was Kultureinrichtungen tun, müssen wir es in ein System integrieren, das darauf ausgelegt ist, unsere Ziele zu erreichen. Wenn wir zum Beispiel wollen, dass es uns bei der Erschließung großer Sammlungen hilft, müssen wir das Modell anweisen, Klassifizierungsaufgaben durchzuführen, um den textlichen Kontext der Objekte mit Begriffen aus einem Vokabular abzugleichen. Wenn wir möchten, dass das System uns beim Verfassen von Ausstellungsinhalten hilft, müssen wir es bitten, neue Texte auf der Grundlage von ausgewähltem Eingabematerial und einem bestimmten Stil zu erstellen. 

Was ist mit Halluzinationen?

Wir können jetzt auch darüber sprechen, was man von ChatGPT nicht erwarten darf und das Thema Genauigkeit ansprechen. 

Diejenigen, die mit dem Chatbot herumgespielt haben, haben vielleicht gesehen, dass (wie OpenAI deutlich mitteilt) die Informationen in den Antworten möglicherweise nicht korrekt sind und sich auf Fakten oder Personen beziehen, die nicht existieren. 

Dafür gibt es eine klare Erklärung: Die im Chatbot verfügbare Implementierung kann nur Informationen aus seinen Trainingsdaten extrahieren, die zwar riesig, aber dennoch begrenzt sind. Wenn du also nach etwas fragst, über das es nicht so viele Informationen gibt, ist die Wahrscheinlichkeit groß, dass die Antwort falsch ist. Anders wäre es, wenn wir mit einer Implementierung von ChatGPT interagieren würden, die Zugang zum Internet hat und nach relevanten Antworten auf eine Frage suchen kann. Wenn wir möchten, dass das System nur Informationen liefert, die auf bestimmten Quellen basieren, können wir auch den Korpus einschränken, den das Modell berücksichtigt. Wir könnten zum Beispiel Fragen zur Kunstgeschichte stellen und das Modell anweisen, nach möglichen Antworten in einem Korpus von Kunstgeschichtsbüchern zu suchen.

Wie kann ChatGPT für Kultureinrichtungen nützlich sein?

Große Sprachmodelle wie GPT haben in vielerlei Hinsicht großes Potenzial für die Arbeit von Kultur- und Kulturerbe-Institutionen:

Da sie auf einer riesigen Datenmenge trainiert werden, ermöglichen sie den Aufbau von Systemen, die komplexe Aufgaben erfüllen, ohne dass große Trainingsdatensätze benötigt werden. Um zum Beispiel große Sammlungen zu indexieren und zu katalogisieren, kann uns ein großes Sprachmodell wie das GPT dabei helfen, ein Textklassifizierungssystem zu entwickeln, das in der Lage ist, Textfragmenten Kategorien zuzuordnen und so automatisch Metadaten zu erzeugen. Damit stellt sich die Frage, wie wir mit den automatischen Metadaten umgehen und ob wir sie überprüfen, moderieren oder kennzeichnen müssen, um sie transparent zu machen. 

Da GPT in der Lage ist, Fragen zu “verstehen” und kohärente Antworten zu formulieren, indem es Informationen aus einem definierten Korpus sammelt, kann es dazu genutzt werden, neue Wege der Suche in Katalogen zu entwickeln, die nicht auf exakte Stichwortübereinstimmungen beschränkt sind. 

Dank der Fähigkeit von GPT, kohärente Texte zu schreiben und den Stil vorgegebener Beispiele zu imitieren, kann das Modell dazu verwendet werden, Zusammenfassungen langer Dokumente zu schreiben, was eine neue Form der Überprüfung der Relevanz eines Suchergebnisses ermöglicht, ohne dass das gesamte Dokument gelesen/gehört/gesehen werden muss.

GPT-Modelle sind mehrsprachig, d.h. sie werden auf Daten in vielen Sprachen trainiert und sind in der Lage, von einer Sprache in eine andere zu übersetzen und zu wechseln oder eine Frage oder Anfrage in einer Sprache zu erhalten und in einer anderen zu beantworten. GPT kann uns zum Beispiel helfen, Videos zu untertiteln, um sie zugänglich zu machen, oder Sammlungen in der Sprache des Nutzers zu durchsuchen.

Sprich uns an

Melde dich gerne bei uns, wenn du Lösungen für den Kultursektor mit Sprachmodellen und KI entwickeln möchtest.
Dr. Cecilia Maas

Co-Founder & Product Manager at aureka. Cecilia holds a PhD in History from the Freie Universität Berlin and has experience in applied social sciences. She is passionate about human-machine interaction and computer-assisted qualitative analysis.