Einführung und Vorstellung von Umut Dirik
00:00:10
Speaker
Hello und herzlich willkommen zu einer neuen Folge of Mic Rider Deep Talk. Heute virtuell bei mir im Studio zu Gast ist Umut Dirik. Umut ist selber Sprecher und auch Studiobetreiber und war lange im VDS, im Vorstand, im Verband Deutscher SprecherInnen. Hallo Umut, wie geht's dir?
00:00:30
Speaker
Hallo, vielen Dank für die nette Vorstellung, mir geht's bestens, ich hoffe dir auch.
00:00:35
Speaker
Sehr schön. Ja, ich freue mich jetzt auf einen netten Plausch mit dir, wie wir ihn ja schon in privater Atmosphäre hatten und sehr gute Gespräche zum Thema KI und technologische Entwicklungen geführt haben. Deswegen freue ich mich sehr vielleicht genau zum Kontext. Als du noch im VDS-Vorstand warst, warst du der KI-Guy. Du warst quasi der Beauftragte für diese Technologie. Ja, genau.
00:01:02
Speaker
Geht dir das ab, diese Funktion? Ich bin ja kein Funktionenreiter, überhaupt gar nicht. Ich bin natürlich nach wie vor super interessiert an KI und an der ganzen Entwicklung rund um die KI. Das war ich ja schon, bevor ich dieser KI-Guy wurde. Ich glaube, deswegen wurde ich das ja auch.
00:01:20
Speaker
und bin nach wie vor sehr interessiert. Jetzt bin ich nicht mehr in der Funktion des KI-Experten für den VDS, was aber nicht heißt, dass ich in der Sekunde, als ich diese Funktion nicht mehr innehatte, aufgehört habe, mich damit zu beschäftigen. Ich lese immer noch jeden Tag und werde natürlich auch noch von vielen Menschen als KI-Experte in Anführungszeichen so angenommen oder wahrgenommen. Die rufen mich an, fragen nach und fragen nach Einschätzungen oder nach Tipps.
00:01:45
Speaker
Und das hört ja nicht
Die Balance zwischen KI und realem Leben
00:01:46
Speaker
auf. Also ich bin jetzt auch ohne Funktionen nicht raus aus diesem KI-Wissen und bleibe ja dabei, bin ja neugierig. Genau. Nein, ist ja auch, finde ich, ein total gesunder Ansatz, um auch allein im Kopf handlungsfähig zu bleiben und irgendwie das Gefühl der Selbstbestimmung nicht zu verlieren. Sonst, so ging es mir zumindest, bevor ich mich so damit beschäftigt habe, waren große Ohnmachtsgefühle da und auch
00:02:09
Speaker
auch diffuse Ängste, weil man das halt nicht greifen kann, wenn man sich nicht auskennt, wenn man sich nicht informiert, wenn man das nicht einordnen kann. Und nur auf News und Schlagzeilen angewiesen ist quasi sicher eine Meinung. Man muss aber dazu sagen, wenn man sich den ganzen Tag damit beschäftigt, das trägt nicht immer dazu bei, dass man die beste Laune hat. Manchmal geht es dann schon auch, wenn man ganz viel KI liest.
00:02:33
Speaker
denkt man sich so, oh Gott, es gibt auch Schönheits in Leben. Und man muss dann auch manchmal wirklich einen klaren Schnitt machen und sagen so, entweder habe ich jetzt was zu tun, habe Arbeit oder aber ich gehe jetzt auch einfach mal raus und beschäftige mich mal nicht mit KI, weil es gibt auch ein Leben ganz ohne das KI-Universum.
00:02:49
Speaker
Absolut. Du hast vollkommen recht. Ich finde das auch, du musst mal dosieren. Ich glaube, der mittlere Weg ist wie so oft der richtige. Die Extreme sind beide nicht gesund. Aber ja, das ist total richtig. Es gibt noch eine Welt da draußen.
Umut Diriks Reise von Istanbul nach Deutschland
00:03:04
Speaker
Man kann noch irgendwie ein Baumhaus bauen oder keine Ahnung, sich mit etwas Haptischem beschäftigen, um sich in die echte Welt und ins Hier und Jetzt zurückzuholen.
00:03:17
Speaker
Aber tatsächlich, das ist ja eigentlich nur so ein Nebengewächs deiner Laufbahn, deiner Tätigkeit sozusagen. Warst du zuerst Sprecher oder warst du zuerst Studio und wie ist so deine Gewichtung in deinem Arbeitsalltag und warum tust du das, was du tust? Was ich tue? Nun, also wahrscheinlich war ich zuerst einmal
00:03:44
Speaker
Wobei man sich das nicht, ich kann das nicht wirklich trennen. Ich erzähl mal, wie ich überhaupt dazu kam. Dann ist es vielleicht einfacher nachzuvollziehen. Ich bin ja eigentlich kein gebürtiger Deutscher, wo ich jetzt schon sehr lange hier lebe und man mir das im besten Fall auch nicht anhört. Aber eigentlich ist der Deutsch für mich eine Fremdsprache.
00:03:59
Speaker
Ich kam mit sieben nach Deutschland, war knapp sieben nach Deutschland und wusste bis zum Tag der Einreise nicht mal, wo dieses Deutschland ist. Also ich kam aus Istanbul mitsamt den Eltern, wie das halt so ist, wenn die Eltern sich so der Karriere wegen entscheiden, in ein anderes Land zu gehen.
00:04:13
Speaker
Und dann haben die in weiser Voraussicht gesagt, ich werde wahrscheinlich nur gut in Deutschland bestehen können, wenn ich sehr gut Deutsch kann. Also haben sie mich auf eine Sprachschule geschickt und vor allem, viel wichtiger, haben mich zugeballert mit Hörspielkassetten, was eine sehr schlaue Entscheidung war. Also dafür bin ich den beiden immer noch sehr dankbar. Die lieben immer noch beide um die 80.
00:04:34
Speaker
Danke Ihnen jeden Tag dafür. Ich habe diese Hörspielkassetten natürlich als kleines Kind aufgesogen. Das war damals ja auch ohne Internet und ohne Ablenkungsmöglichkeiten. Da gab es dann nicht mal Privatfernsehen. Also entweder musstest du lesen oder hören, mehr gab es nicht.
00:04:49
Speaker
Und diese Hörspielkassetten haben mich natürlich dann irgendwann mal dazu verleitet, zu sagen, das will ich auch. Und habe dann so lange daran rumgeschraubt, bis meine Eltern irgendwann mal gesagt haben, na gut,
Karrierebeginn und Verbindung von Studioarbeit und Sprechertätigkeit
00:05:01
Speaker
dann darfst du mal. Dann durfte ich mir also zwei, drei Radiosender von innen angucken. So begann das. Und irgendwann mal mit 18 habe ich mich beworben bei Radiosendern, die gerade hier in Bayern gegründet wurden und die suchten Mitarbeiter. Und ich hatte das Glück, dass ich als einer der wenigen hier in Bayern einfach mal gerade aus Hochdeutsch rede.
00:05:19
Speaker
Also wahrscheinlich deswegen, weil ich so die ersten Jahre in Deutschland in Braunschweig, in der Nähe von Hannover, gelebt habe und Deutsch gelernt habe, wo man relativ sauberes Deutsch spricht und erst dann nach Bayern kam. Und so kam ich in den Hörfunk.
00:05:33
Speaker
Also das war jetzt die sehr schnelle Version. Und naja, dann fängst du an mit moderieren, ein bisschen Sprecherziehung und gleichzeitig aber ja auch schon die Auseinandersetzung mit technischen Dingen. Und ich kam natürlich auch, weil ich sehr sprachinteressiert war und auch jingleinteressiert war und so diese Verpackungselemente, die mich schon immer fasziniert haben, kam ich ganz schnell rein in die Produktionsseite. Also wie werden die Dinger hergestellt?
00:05:58
Speaker
Und wie werden sie gesprochen? Und deswegen ist die Frage, war es zuerst das Studio oder war es zuerst die Sprecherei? Das kann man fast nicht trennen. Faktisch ist natürlich so, dass ich dann ganz viel mit Sprache gearbeitet habe, mit meiner eigenen Stimme. Und das Studio, in dem ich jetzt arbeite, das mir gehört, das ich jetzt richtig als Freiberufler, als Selbstständiger betreibe, das ist natürlich erst viel später gegründet worden. Aber die Studioarbeit,
00:06:21
Speaker
Also das technische Arbeiten an Audiophiles war schon, seitdem ich 18 bin, Teil meines Lebens. Untersprechen natürlich. Ja, spannend. Ja, das wusste ich tatsächlich nicht. Aber ich kenne die, also ich habe mich auch in der Radio-Nahrungskette sozusagen vom Praktikanten über die Redaktion bis zur Station Voice hochgearbeitet und das ist natürlich untrennbar. Du produzierst immer deine Portraits, deine Albumrezensionen oder deine Interviews.
Sprache, Emotionen und KI
00:06:49
Speaker
selbst und machst die die künstlerisch sprecherische seite aber auch die redaktionelle als auch die postproduktion irgendwie und dann ist das so ein ein aber was was ich auch spannend finde was ich auch nicht wusste ist dass wir da auch eine patatele haben nämlich dass wir auch beide aus dem ausland hierher gekommen sind nach deutschland und hier erst
00:07:12
Speaker
Deutsch gelernt haben. Und bei mir war das ein bisschen früher. Ich bin mit gut zwei nach Deutschland gekommen und dann so mit zweieinhalb, fast drei in den Kindergarten und habe dort meine ersten Worte Deutsch gelernt, nachdem ich die ersten Wochen gemerkt habe, da geht ja mal gar nichts mit nonverbaler Kommunikation. Du bist voll, du bist einfach raus. Und das hat bei mir total dieses Bedürfnis geschürt und entfacht.
00:07:41
Speaker
wie du sagst, sehr, sehr gut Deutsch zu lernen. Und innerhalb von drei Wochen konnte ich dann plötzlich so, weil ich mich so reingefiegt habe in dieses, ich will das verstehen und ich will mit den anderen Kindern kommunizieren können. Ich will nicht immer der Einzige sein, der nicht mitspielt oder nicht versteht, worum es geht irgendwie. Und das ist mir tatsächlich geblieben, diese
00:08:02
Speaker
Dieser Schlüssel von Sprache ist ein total elementares zwischenmenschliches Faktum. Und ohne das geht halt nichts. Und ja, ich glaube, das hat mich dazu bewogen, eben auch so in diese Sprachaffinität und Arbeiten mit Sprache hinein zu...
00:08:26
Speaker
Die Sprache ist ja so eine direkte Verbindung zwischen zwei Menschen. Ich finde ja, dass meine Gedanken, die so in mir wabbern, die wabbern ja nicht in Deutsch oder in Türkisch oder in Englisch, die sind ja einfach da und ich artikuliere ja nur, bitte schön mit Zauber sprechen, Herr Kollege, ich artikuliere sie ja nur in einer Sprache. Aber viel wichtiger ist ja, dass die Informationen, die in mir
00:08:51
Speaker
wachsen oder wabbern, beim Gegenüber ankommen. Das ist für mich viel wichtiger, dass ich irgendwie das, was in mir gerade so ist, jemandem mitteilen kann, den Eindruck habe, auch in der Tiefe der Sprache und in der Tiefe der Emotionen, jetzt ist das, was ich wirklich sagen wollte, auch beim Gegenüber angekommen. Deswegen ist Sprache so wichtig. Ob das dann nun Deutsch ist oder Englisch oder
Vergleich von menschlichem und maschinellem Lernen
00:09:11
Speaker
Völlig egal. Viel wichtiger ist aber, dass man diese eine Sprache, mit der man kommuniziert, am häufigsten kommuniziert, wirklich auch in der kompletten Tiefe der Sprache beherrscht, damit man auch subtile Unterschiede in den Emotionen ausdrücken kann. Ich finde, das ist etwas, was bei manchen Menschen heutzutage so ein bisschen verloren geht. Da gibt es einfach
00:09:33
Speaker
zu wenig Auswahl in den Wörtern, die sie verwenden. Und das könnte, weil wir mit KI gestartet haben, durch KI sogar vielleicht noch beschleunigt werden. Dass so dieses, dass die feinen Nuancen verloren gehen in der Sprache.
00:09:47
Speaker
Ich fürchte auch, also es wird auf jeden Fall der Subtext verloren gehen, diese Meter, diese zweite Ebene, vielleicht auch eine dritte Bedeutungsebene, wenn man ganz besonders witzig ist oder ganz besonders tief drin ist. Oder wie du sagst, ich bin kein Wissenschaftler, ich kann das nicht begründen, aber ich weiß es aus eigener Erfahrung und auch, weil ich eine Studie gelesen habe, dass das eben
00:10:17
Speaker
Mitarbeiter einer Firma, denen E-Learnings vorgespielt wurden, der einen Hälfte von einem echten Menschen und der anderen Hälfte maschinell generierte Inhalte, dass die, die sich die E-Learnings eines echten Menschen angehört haben, fast 50%, also über 40% mehr Inhalt gemerkt haben, wiedergeben konnten. Ich kann total unterschreiben, dass das so ist, dass man
00:10:40
Speaker
wenn man länger etwas maschinell generiertes sich anhört, einfach abdriftet. Es prallt irgendwie ab. Also nachdem dieser Wow-Effekt vorbei ist nach 30 Sekunden von, oh echt, das ist eine Maschine, oh, die kann aber ganz schön toll modulieren, dass man dann in so einem Autopilot fast, also ich zumindest, wenn ich
00:11:03
Speaker
in ein Autopilot schaltet und das so an einem abprallt. Das stellt keinen direkten, organischen Bezug her zu mir. Ich kann es nicht besser beschreiben. Ich finde es hier viel spannender, weil ich überprüfen möchte, ob das nur bei mir so ist oder ob das vielleicht auch bei anderen Leuten so ist, die ursprünglich eine andere Muttersprache gelernt haben und danach eine zweite Sprache jetzt. Bei dir war es Rumänisch, richtig? Genau. Und dann später Deutsch. Hast du die Tiefe,
00:11:33
Speaker
der Wortwahl und der Emotionen, also das Ausdruck der Emotionen in beiden Sprachen, weil ich kann das für mich nicht mehr behaupten. Also auf Deutsch kann ich es. Im Türkischen, ich spreche Fließentürkisch mit leichtem deutschen Einschlag, wie mir die ganzen Istanbuler bestätigen, wenn ich in Istanbul bin, aber mir fehlen für die
00:11:53
Speaker
Ausdrucksform meiner tiefsten Emotionen fehlen mir die passenden Worte auf Türkisch, weil ich es nicht mehr so oft nutze und weil ich zugegeben auch weniger auf Türkisch lese als auf Deutsch.
Kulturelle Unterschiede in Sprache und Ausdruck
00:12:03
Speaker
Und das ist zumindest bei mir so und das bin ich ja ganz interessiert. Bei anderen Menschen ist es bei dir auch so. Würdest du in beiden Sprachen alle Emotionen gleich gut ausdrücken können?
00:12:12
Speaker
Nein, absolut nein. Also ganz, es ist, so wie du sagst, vielleicht noch mit dem Zusatz, dass ich andere Emotionen auf Rumänisch besser ausdrücken kann. Nämlich die fluchenden, die Kraftenausdrücke, die sind einfach auf Deutsch einfach sehr
00:12:33
Speaker
statisch und hölzern, wenn man so will. Du Arsch, du Wichser. Das ist so ein Wort, so eine Feststellung. Und auf Rumänisch, wie auch auf vielen anderen Sprachen, ist das sehr blumig, sind immer ganze Sätze, wo man jemanden wünscht, was ihm nicht alles passieren soll. Und das ist aber... Und das ist aber so... Für mich oder für mein, weiß ich nicht, kreatives Denken ist es viel befriedigender, weil man da auch total flexibel ist. Es gibt schon auch diese Standard-Schimpfworte,
00:13:03
Speaker
wie Arschloch oder so. Aber es wird fast wie eine Kunst zelebriert in Rumänien, das zu alternieren, darauf was aufzubauen und sich an diese Situation, an diese Konkrete, was auch immer mich jetzt gerade stört,
00:13:19
Speaker
anzupassen und das fast wie improvisiert sozusagen eine ganze Litanei an Schimpf setzen sozusagen loszulassen. Und das funktioniert tatsächlich besser auf Rumänisch, hat halt auch den Hintergrund, dass meine Familie und ich lange
00:13:37
Speaker
auf Rumänisch weiter gestritten haben, während wir uns auf Deutsch im Alltag unterhalten haben. Aber wenn es dann emotional wurde, wurde es dann immer auf Rumänisch. Aber tatsächlich, sonst ist es, wie du sagst, ich spreche auch fließend Rumänisch und kann mich da wunderbar verständigen. Aber ich habe nicht die Tiefe im Vokabular oder ich suche oft und muss dann umschreiben und finde dann Metaphern oder
00:14:07
Speaker
etwas ähnliches, was das dann ausdrückt. Aber ich finde, man merkt dann, ob jemand so straight ist in der Sprache und ganz klar weiß, wo er hin will mit dem Satz. Das macht dann den Unterschied zu jemandem, der nicht mehr im Alltag von 24 Stunden ist. Ich glaube, du hast auch noch was ganz anderes angeschnitten, was ich auch sehr spannend finde und was wahrscheinlich auch nur Leuten auffällt, deren Muttersprache nicht Deutsch ist, nicht erste Muttersprache nicht Deutsch ist. Deutsch ist natürlich schon eine sehr
00:14:36
Speaker
technische, technokratische Sprache, würde ich fast sagen, mit viel Staccato, mit vielen harten, kalten Silben, die hintereinander kommen, wie so Maschinengewehrseifen. Ich glaube, das fällt Deutschen gar nicht so auf, dass Deutsch keine weiche Sprache ist oder keine
00:14:53
Speaker
malerische oder keine literarische Sprache. Deutsch ist eher wirklich technisch. Und den meisten Deutschen, das ist jetzt unfair, das sind ja nur Klischees, aber wird auch zugeordnet, dass die ja eher so ein bisschen steifer sind und ein bisschen nüchterner und ein bisschen sachlicher und ein bisschen arbeitssamer. Und das spiegelt sich schon auch ein bisschen in der Sprache wider.
00:15:15
Speaker
Jede andere Sprache ist einfach emotionaler. Ob sie nun immer weicher ist, weiß ich gar nicht. Also wenn man zum Beispiel türkisch hört, das fällt mir immer wieder auf, dann klingt das ja eigentlich eher nach hart und laut. Und ganz oft fragen dann ja Deutsche, wieso maulen die sich immer an? Da muss man dann sagen, die maulen sich nicht an. Das ist einfach nur eine emotionalere Art, eine Sprache zu sprechen und sich auszudrücken, wohingegen ja Deutsch
00:15:41
Speaker
eigentlich wirklich eher so ein bisschen kühler wirkt.
Reichtum der deutschen Sprache und literarische Präzision
00:15:45
Speaker
Das soll die Sprache gar nicht mildern. Und Deutsch hat auch viele tolle Begrifflichkeiten und viele Dinge, die schön sind in der Sprache. Aber wenn man sie zuerst einmal hört, ohne vielleicht den Inhalt zu verstehen, klingt das eher nach einer Salve von kurzen, harten Silben.
00:16:00
Speaker
Ja, das erinnert mich an eines meiner Lieblingsmemes, wo steht quasi, tell someone you love them every day, because life is beautiful. But also scream at them in German, because life is also terrifying and confusing. Das finde ich trifft es so und ich würde fast alles unterschreiben, was du gesagt hast.
00:16:21
Speaker
bis auf die literarische Sprache. Ich finde, Deutsch ist eine sehr literarische Sprache, weil man so viel Vokabular zur Verfügung hat, weil man so viele Facetten in unterschiedlichen Worten ausdrücken kann, dass man sehr, sehr, sehr genau einen Zustand oder ein Gefühl oder etwas beschreiben kann. Und ich finde, das trifft es eher im literarischen Bereich. Bei einem anderen gebe ich dir total recht. Deutsch ist immer sehr
00:16:50
Speaker
sehr genau beschreibend, aber nicht so drin in der Emotionalität oder in dem, was man, und rumänisch oder so wie ich es türkisch verstehe, auch türkisch oder auch italienisch, andere littoromanische Sprachen, sind sehr unmittelbar in dem Gefühl verhaftet oder in dem, was man aussagen will. Und das wird dann über Modulation oder Melodie oder eben Lautstärke und so gleich auf allen Ebenen mittransportiert. Und Deutsch ist immer sehr
00:17:20
Speaker
gewählt und reserviert und überlegt und differenziert. Und das kann aber für Literatur, finde ich, ein totaler Vorteil sein. Ja, hast du vollkommen recht. Also klar, das sind ja auch wirklich tolle Werke. Ursprünglich auch schon auf Deutsch entstanden, keine Frage. Aber ich finde, dass die meisten südländischen Sprachen sind auch so wie das Temperament lebhafter und blumiger, meistens irgendwie farbenfroher.
00:17:43
Speaker
Das ist ja nichts wertend, das zuerst einmal, und das ist auch sicher nichts irgendwie, um Klischees zu erfüllen. Aber ich finde so, wenn man das das erste Mal wahrnimmt, denkt man sich im Deutschen, ja, das ist eher so ein bisschen kühler, ein bisschen mathematischer. Was für mich auch kühler ist als diese, allein schon die Je T'aime, ja.
00:18:06
Speaker
Oder, oder, hör mal Italienern zu, wenn sie sich streiten. Das ist irgendwie ganz anders als überhaupt Deutsch. Ich liebe das, vor allem weil ich ja auch alles verstehe. Und dann sitze ich immer wie die Fliege an der Wand irgendwo an einem Strand in Italien und lach mir ins Freustchen, weil es gehört auch eine gewisse Selbstverständlichkeit dazu, sich in der Öffentlichkeit hinzustellen und ohne Rücksicht auf Verluste lautstark
00:18:29
Speaker
zu debattieren oder sich zu streiten. Und scheißegal, was um einen rum passiert, das wäre in Deutschland, glaube ich, schwer möglich. Ich weiß nicht. Wenn ich an der Nord- oder Ostsee war, dann war das alles immer sehr viel gediegener und jeder so ein bisschen für sich. Aber wenn ich in Italien am Strand bin, dann ist es scheißegal, wenn jetzt da 500 Leute umher rum. Aber es muss jetzt gesagt werden und das muss jetzt mal gesagt werden. Und das finde ich immer sehr liebenswert und sehr relatable, sage ich jetzt mal.
00:18:56
Speaker
Ja, es soll ja auch überhaupt keine Kritik an der deutschen Sprache sein, sondern es ist ja nur eine Feststellung. Ja, es ist nur eine Beobachtung. Also auch rein so von der Stimmführung her sind hier andere Sprachen auch anders. Ich bin jedes Mal baff, wenn ich Spanisch höre und da stehen dann irgendwelche
00:19:15
Speaker
zarten Frauen, aus denen kommen diese harten Vokale, die so spanisch oder auch irgendwelche, also Jungs im Sinne von, die klingen doch wie 16, und dann kommt dieses Tiefe. Und dann denkst du so, wie macht ihr das? Und wo lernt man das? Das gibt es ja im Deutschen auch gar nicht.
Missverständnisse in der Kommunikation durch Social Media und KI
00:19:31
Speaker
Und das Gleiche, das kenne ich aus der türkischen und arabischen Sprachen, dass die dann so lauter aus sich herausbringen, bei denen man sich fragt, wie genau hast du die gebildet, bitte? Und vor allem so zartes Persönchen, wie kommt das aus dir raus? Das gibt es im Deutschen auch so nicht.
00:19:45
Speaker
Das ist echt eine andere Stimmführung, eine andere Lautbildung. Ja, ich möchte noch mal ganz kurz einen Schritt zurücktreten, weil du vorher eigentlich was sehr interessantes angesprochen hast, wozu ich noch nicht dazugekommen bin zur Beziehung in der Kommunikation und dass die durch KI ein
00:20:03
Speaker
eingeschränkt werden wird wahrscheinlich. Was ich nämlich schon die letzten fünf, sechs, acht Jahre festgestellt habe, ist, dass schon durch Social Media unsere Kommunikation sehr viel eindimensionaler und auch missverständlicher geworden ist dadurch.
00:20:23
Speaker
Und ich glaube, darauf baut das Problem mit KI eigentlich nur auf. Weil wenn du etwas postest oder kommentierst oder verschriftlicht, verknappst auf, auf, begrenzt auf, ich weiß nicht genau, ich war nie auf Twitter, aber 150 Zeichen, sag ich jetzt mal, irgendwie so, dann ist der Raum für potenzielle Missverständnisse oder Missinterpretationen so riesig,
00:20:48
Speaker
Weil eben diese ganze Metaebene fehlt von, was ist da für eine Anlautung mit dabei, was kommt da für eine Energie mit in der Melodie, in der Sprache, in der Mimikgestik und so weiter. Und ich glaube, dadurch graben wir uns ein gigantisches Loch oder Segen an dem Ast, an dem wir selbst sitzen, in dem wir unsere Kommunikation so torpedieren,
00:21:15
Speaker
Wir sehen ja, wie schnell die Emotionen hochkochen und man sich dann plötzlich einen Shitstorm einfängt, weil irgendjemand sich jetzt bemüßigt fühlt, das jetzt falsch verstehen zu wollen oder wie auch immer. Und wenn man dann aber miteinander redet, wenn man dann, also das hatte ich jetzt schon immer wieder, dass Menschen etwas, was ich geschrieben hatte, missverstanden haben und dann haben wir telefoniert und es war alles easy. Es war alles kein Problem. Und ach, so hast du das gemeint. Okay, ja, verstehe, in dem Kontext.
00:21:44
Speaker
Alles klar, ich habe das auf mich persönlich bezogen, weil das und das ist meine Situation und deswegen hat das da bei mir angedeckt. Aber dieser Raum fehlt total und wenn man dann aber nicht erwachsen genug ist, den Hörer in die Hand zu nehmen und sich ein klärendes Gespräch persönlich oder am Telefon anzutun, dann schaukelt sich das immer weiter hoch bis hin zu
00:22:08
Speaker
digitalen Mord und Totschlag. Soweit würde ich jetzt vielleicht nicht gehen, aber ich bin da viel abstrakter schon unterwegs und viel philosophischer. Ich finde ja, dass wenn wir zu viel KI-Sprache abbekommen, wird das vielleicht sogar uns irgendwann mal negativ beeinflussen, vor allem Kinder. Wie lernen Kinder Sprache? Kinder lernen ja eine Sprache, in der sie hören und imitieren. Kein Kind entscheidet sich ja
00:22:35
Speaker
türkisch zu lernen oder rumänisch oder deutsch oder spanisch ist, imitiert einfach das, was es hört, was es umgibt. Und mit der Zeit versteht es Zusammenhänge und imitiert auch Melodieführungen, Lautbildungen und so entstehen dann eben das irgendwelche
00:22:51
Speaker
rollt werden und irgendwo werden sie nicht gerollt und irgendwo gibt es Rachenlaute, die es in anderen Sprachen nicht gibt, weil die Kinder das einfach hören. Wir kriegen Laute in Afrika. Das gibt ja Laute oder Chinesisch. Da sind ja Laute mit dabei, die können wir gar nicht, weil wir sie als Kind nicht wahrgenommen haben, nicht geübt haben und das nie in unseren Gehirnen verankert wurde, wie diese Laute gebildet werden. Und wenn du ganz viel KI-Sprache hörst, das ist ja momentan zumindest, vielleicht wird das in 20, 30 Jahren anders, aber momentan ist es ja eine wirklich billige Kopie
00:23:22
Speaker
der Originalaufnahmen, also von Menschen. Das ist wie, wenn man eine hochauflösende Wav-Datei vergleicht mit einem schlechten MP3. Es ist schon irgendwie das Gleiche, aber dann doch nicht das Gleiche. Und es fehlt so, weil wir es über die Tiefe hatten, auch die Tiefe an Informationen. Und ich finde, dass wenn Kinder nur KI-Sprache zum Beispiel hören, weil ihnen nur noch KI-Stimmen Märchen vorlesen,
00:23:47
Speaker
die bekommen doch niemals diese Melodieführung hin, die normale Menschen haben, weil sie sie gar nicht hören. Also wie sollen Kinder das denn lernen? Weil die lernen ja nur durch Imitieren. Die lernen ja nur dadurch, dass man ihnen was vormacht und da speichern die sich ab und rufen es immer wieder auf und entwickeln es weiter. Wenn sie aber nichts vorgespielt bekommen, also gerade im Schauspiel, gerade bei Märchen. Jeder von uns wird ja
00:24:10
Speaker
Märchen gehört haben, entweder von den Eltern, also bei mir war das von den Eltern auf Türkisch, und dann Jahre später die gleichen Märchen nochmal von Sprechern und Schauspielern in Hörspielen. Aber man nimmt ja irgendwas mit daraus, also meine Sprache ist so gereift durch menschliches
00:24:29
Speaker
da bieten. Und wenn ich das nicht mehr habe, sondern ich nur noch irgendwelche KI-Stimmen höre, die mir zwar die richtigen Worte vorlesen und vielleicht auch an der richtigen Stelle zäsieren und inzwischen ja auch atmen und vielleicht so einen Hauch von Emotionen reinbekommen, weil sie jetzt mal aufgeregt klingen oder aggressiv oder ängstlich oder verliebt oder was auch immer. Aber das ist ja immer nur eine schlechte Imitation von Original Emotionen, die nur Menschen aus sich heraus produzieren können, weil sie einfach authentisch sind.
00:24:57
Speaker
Absolut, und du hast sicher das extremste Beispiel genannt, weil Märchen oder Geschichten für Kinderhörspiele und so weiter ja noch einen sehr hohen kreativen Anteil haben, einen sehr hohen künstlerischen Anteil haben.
00:25:13
Speaker
wo ich glaube, dass das jeder folgen kann, dass das fatale Konsequenzen hat für eben das Sprachgefühl, für die Tiefe, die Breite, die Variabilität eines Wortschatzes, eines kommunikativen Umgangs im Allgemeinen von unseren Kindern. Weil ich hoffe, dass die meisten Eltern den Anspruch haben,
00:25:35
Speaker
ihren Kindern auch dieses echte Menschliche mitzugeben, allein auch aus einem eigenen Nutz. Weil es ist doch das Schönste auf der Welt, wenn ich meiner Tochter etwas vorlese und die Stimmen mache, irgendwie, egal ob das jetzt super Profisprecher oder irgendwie hobbymäßig,
00:25:56
Speaker
ist und dann das Leuchten in ihren Augen zu sehen, wenn sie sich das wirklich bildlich vorstellt. Was glaubst du, was das für ein Moment in meiner Tochter war, als sie vor einem Jahr oder so begriffen hat, dass die
00:26:12
Speaker
Hörspiele auf den Toniboxen Geschichten sind, die von Schauspielern gesprochen werden. Das war, ich will das auch. Das ist echt, das kann man machen. Das ist ja der absolute Wahnsinn. Das erfüllt ihren Alltag so sehr.
00:26:30
Speaker
Und für sie war das halt, bis sie sieben war, echt. Für sie ist das so passiert und keine Ahnung, egal was sie sich da angehört hat, war so. Und jetzt ist sie aber halt, und jetzt begreift sie auch, was ich da eigentlich mache, weil sie kannte mich wenn dann aus Radio oder Fernsehen als Station-Voice oder in der Werbung und das hat sie nicht wirklich interessiert, weil das ist nicht, also damit
00:26:56
Speaker
Gehört Kinder nicht, na klar. Werbung geht erstmal bei den anderen Kindern vorbei. Aber ich verstehe nach wie vor sehr gut, was du sagst, weil mir ging das ja auch so. Ich habe das ja auch. Ich habe das so Deutsch gelernt und habe dann ja auch noch mal gesagt, ach so, das ist gar nicht echt, sondern das sind Schauspieler und die stehen vor Mikrofonen und machen das, das will ich auch. Ja, genauso hat mich das ja angetrieben. Ich möchte auch vor Mikrofonen mit Sprache, mit meiner Stimme arbeiten, auf Deutsch.
00:27:20
Speaker
Jetzt habe ich eine große Klammer aufgemacht, weil das natürlich mich selbst persönlich betrifft, aber was ich eigentlich mit der perfideren oder subtileren negativen Entwicklung gemeint hatte, waren diese typischen TikTok-Stimmen, die jetzt auf, ich sage jetzt mal, 10- bis 18-Jährige prägend einwirken, die alle maximal mittelgut sind aus der Dose, sehr robotterhaft, jetzt auch nicht das Widerspiegeln, was KI inzwischen schon
00:27:45
Speaker
theoretisch könnte, aber das, was halt eingesetzt wird und das prägt sehr wohl einen Umgangston, eine Art der Kommunikation. Es macht einfach einen Unterschied, ob das klingt wie aus der Dose mit einem potenziellen Vokabular von, sag ich jetzt mal, 2000 Worten oder so oder ob du
00:28:07
Speaker
menschlich, authentisch, spürbar, greifbar mit einem Vokabular von 30.000 Worten oder 50.000 Worten. Und mehr, natürlich. Ja, das macht mir auch Sorgen. Man muss sich ja nicht nur an Kindern festmachen. Ich glaube auch an Erwachsenen kann man das durchaus festmachen, dass nach und nach durch KI-Sprache die Fähigkeiten Sprache aus sich heraus zu generieren. Also nicht nur die Worte, sondern auch wirklich die
00:28:33
Speaker
feinen Unterschiede im Klang, diesen Subtext, den man ja manchmal auch einfach mitsprechen kann. Auch das wird verloren gehen. Und dass man Stimmungen erzeugen kann, nicht nur durch die Worte, sondern ja auch, wie man intoniert, wann man zäsiert, wie man atmet, wie schnell man spricht, wie laut man spricht. Das sind ja alles Nuancen, die werden ja einfach dir vorgegeben, wenn du einen Text liest oder durch deine Emotionen und die Interpretation des Textes. Da geht es ja nicht darum, dass man die Worte richtig vorliest. Da könntest du ja auch
00:29:03
Speaker
Nachrichtensprecher nehmen und sagen, wie ist das vor? Sondern irgendwas passiert ja mit Menschen, wenn sie keine Ahnung, irgendeine Mordszene vorlesen, dann macht das ja irgendwas mit dir und das überträgst du ja in die Art und Weise, wie du es vorträgst. Und eine KI wird das ganz schnell oder so schnell nicht begreifen können.
00:29:22
Speaker
Ich habe es selber schon erlebt, wenn du eine Szene, in der jemand umgebracht wird, ganz ruhig und ganz leise vorliest. Das klingt doch ganz anders, als wenn du das ganz hektisch und aggressiv vorliest. Das kann ja die Stimmung ganz ändern. Oder wenn du es richtig technokratisch vorliest, wie so eine Betriebsanleitung.
00:29:43
Speaker
Und dann genosse ich seine Leber mit Rotwein oder Hannibal. Das macht hier nochmal was Persides. Also was allein schon der Mensch in der Lage ist, aus sich heraus zu generieren, mit den gleichen Worten, die auf dem Papier stehen, was eine KI so schnell gar nicht hinbekommen wird.
00:30:00
Speaker
Das macht mich ja inzwischen auch ein bisschen entspannter, weil wir auch vorhin so über KI sprachen. Am Anfang ging es mir genauso wie dir. Ich war mir nicht sicher, wie weit oder wie schnell wird uns das einholen und wie groß werden die Probleme werden. Aber je länger ich mich damit beschäftige, desto klarer wird mir, KI wird ein Problem werden, früher oder später ja. Aber es wird deutlich länger brauchen, als ich es am Anfang befürchtet habe.
00:30:25
Speaker
Das wird so schnell uns nicht einholen, zumindest nicht in den relevanten Sprachaufnahmen.
00:30:31
Speaker
dass du irgendwelche Betriebsanleitungen oder so klassische, wie baue ich mein Ikea-Regal auf Videos, die wirst du irgendwann mal wirklich von einer KI-Stimme vorgelesen bekommen. Aber ganz ehrlich, das ist mir auch egal. Das Gleiche ist mit meinem Navigationssystem, das ich auch in meinem Auto habe, das natürlich theoretisch auch jeden Tag mein Sprachgefühl beleidigt, weil das natürlich ganz furchtbares Deutsch ist oder dieses zusammengesetzte synthetische irgendwas. Und das ist ja bei weitem noch keine KI. Das sind ja wirklich Sprachfragmente des HTTS eigentlich.
00:30:58
Speaker
Text-to-Speech. Genau. Nicht so tief im Kaninchenbau drin steckende... Also so wie früher halt Navigationssysteme oder wie Telefonmenüs oder wie Alex Haas und Siris dieser Welt sich zusammensetzen.
00:31:16
Speaker
Aber ich nehme das alles nicht wahr, weil es ja für mich einen ganz anderen Zweck erfüllt. Ich will von A nach B, im besten Fall zu irgendeiner Straße, in der ich noch nie in meinem Leben war. Und das Ding fährt mich da sicher hin. Dass es dabei irgendwie holprig klingt, ist mir ja zuerst egal. Aber wie gesagt, das ist ja die Befriedigung von einem Bedürfnis. Ja, ich will dahin, dann ist auch gut. Aber wenn ich Sprache höre, der Sprache wegen.
00:31:41
Speaker
dann bin ich mir sicher, das wird so schnell nicht kommen. Macht die Sache ein bisschen entspannter.
00:31:47
Speaker
Auch wenn ich mich mit Studiumenschen zum Beispiel unterhalte oder Creative Directors aus der Werbung, die ja so ein bisschen den Druck von beiden Seiten haben. Einerseits von der Klientenseite, die alle so ein bisschen mit den, oder sehr stark mit den Hufen scharren und dem Gefühl erlegen. Sie müssen jetzt auch irgendwas mit KI machen, weil das ist jetzt das Ding 2024. Und von der anderen Seite eben
00:32:13
Speaker
von der kreativen Seite wissen, dass das schwierig werden könnte. Dann auch für die Film- oder Werbe- oder Tonstudiobranche im nächsten Schritt. Die sagen auch, es ist eigentlich unmöglich ein
00:32:32
Speaker
eine digitale Stimmkopie für alle Nutzungszwecke einzurichten. Wenn du Werbung, Doku, Hörspiel, Games und E-Learnings da einspeist, dann wird immer der generische Mittelwert aus allem ausgespuckt und du kannst es nicht so differenziert kontrollieren, dass du dem System sagst, jetzt lässt er aber alles außer Hörbuch weg, was du gelernt hast, weil wir machen jetzt ein Hörbuch.
00:33:02
Speaker
Oder du nimmst jetzt sehr viele sarkastische, ironische und zynische Anteile mit rein, weil wir machen jetzt so eine, keine Ahnung, zynische Wutbürgerrede für irgendwas. Das ist inzwischen die Entwicklung, dass wenn man einen Klon von jemandem herstellen möchte, also wenn man sagen möchte, wir möchten einen Klon von Patrick,
00:33:22
Speaker
Dann machen Sie eigentlich, wenn Sie es gut machen, nicht nur einen Klon von dir, sondern fünf oder sechs. Du musstest dann verschiedene Styles präsentieren.
00:33:32
Speaker
einmal Patrick für Dokus, einmal Patrick als Station Voice, einmal Patrick in Hörbüchern und vielleicht noch einmal Patrick in Werbung und einmal ganz nüchtern und sachlich in so Erklärvideos. Und man müsste jedes Mal einen neuen Klon von dir machen, weil die Station Voice wird niemals Literatur lesen können und die Literaturstimme wird wahrscheinlich niemals irgendetwas hoch
00:34:00
Speaker
technisches so vorlesen, dass ich nicht den Eindruck habe, ich habe hier gerade ein Liebesroman, wenn ich ein blödes Regal aufbauen möchte. Das heißt, man muss jedes Mal oder man muss verschiedene Klone eines gleichen Menschen herstellen. Ich glaube, das ist inzwischen auch der Trend. Es gibt inzwischen sogar genau diese Bewegung, dass man sagt, der arme Mensch muss drei Tage in Studio, wenn es denn gut werden soll, und liest nur Dokus und dann nochmal drei Tage und liest nur Werbung und dann nochmal drei Tage und liest nur und dann hat man halt verschiedene Klone.
00:34:29
Speaker
Genau, aber darauf wollte ich hinaus, dass der Aufwand ein massiv höherer ist, wenn man ein überdurchschnittliches Ergebnis haben will, als uns die Tech-Branche suggeriert. Also es wird uns ja immer so ein LinkedIn-Puzzle-Stück präsentiert, wo irgendwas totgepromptet ist und zu Ende hingebogen ist, als der neue Wow-Effekt irgendwie vor die Nase gesetzt wird.
00:34:59
Speaker
Es wird das Gefühl vermittelt, das geht jetzt immer so. Aber dass das nur die halbe Wahrheit ist oder was dahinter steckt, ist ja entweder unfassbar viel.
00:35:10
Speaker
sehr spezifisches Trainingsmaterial oder unfassbar viel Promptingarbeit von hochspezialisierten Menschen, die das System so lange dorthin treten, bis sie es haben wollen. Also ein Professor der HFF Potsdam, der Filmhochschule dort, mit dem habe ich meinen gemeinsamen Vortrag gehalten. Er hat in der Technik des Large Language Models das genauso erklärt, wie wir
00:35:36
Speaker
das auch kennen, dieses berühmte Dreieck, wo die Qualität dann in der Mitte steht und man hat Zeit, Geld und menschliche Arbeit als Eckpunkte. Und wenn man sich Zeit und Geld sparen will, dann muss man einfach unverhältnismäßig viel mehr menschliche Arbeit hineinstecken, die dann aber eben wieder sehr viel mehr kostet oder sehr viel mehr Zeit braucht, weil es kaum Menschen gibt, die das auf dem Level
00:36:04
Speaker
können, um ein überdurchschnittliches Ergebnis oder etwas, was besser klingt als TikTok aus der Dose hinzubekommen. Was ja auch gleichzeitig passiert, es ändert sich auch was in der Gesellschaft. Die Menschen lernen ja zu akzeptieren, dass es diese künstlichen Spachen gibt.
00:36:22
Speaker
und dass das irgendwie okay geht. Das beginnt ja jetzt schon bei den Kindern. Also wenn du denen zuhörst oder zusiehst, wie sie diese TikTok-Videos angucken und diese furchtbare Sprache und sie dann ansprichst und sagst dann mal, aber merkst du, dass das ganz furchtbar ist? Nö. Das merken die nicht mehr so schlimm. Erwachsene merken das noch. Aber da wächst ja eine ganze Generation auf jetzt, die mit solchen Stimmen aufwächst. Die werden wahrscheinlich dann die Nuancen gar nicht mehr wahrnehmen. Und ich hatte jetzt auch schon hier Auszubildende,
00:36:52
Speaker
18-Jährige, die neben mir standen und sagten, wie, das ist eine KI? Und ich fragte, ja, aber hörst du das nicht? Nein. Wow, okay. Also da bist du dann ganz baff und sagst, ja, die sind einfach damit schon aufgewachsen. Also noch nicht so richtig aufgewachsen, aber für die ist das so vertraut, dass die nicht sofort sagen, das ist eine KI. Also jeder normale Mensch vielleicht nicht, aber jeder, der den ganzen Tag mit Sprache arbeitet, hört doch zwei Sätze und sagt, das ist nicht menschlich.
00:37:22
Speaker
Ja, aber wie du sagst, jeder, der mit Sprache arbeitet und es sind halt dann doch gar nicht so viele Menschen in der Gesamtbevölkerung. Weil ich hatte jetzt neulich auch eine kurze Anekdote dazu. Ich höre einen österreichischen investigativ journalistischen Podcast sehr, sehr gerne, die Dunkelkammer. Das ist ein toller Podcast, wirklich absolut große Verehrung für die Recherche und für die Arbeit, die dieser Mensch da reinsteckt, der gute Herr Nick Basch. Aber der hat tatsächlich vor zwei Wochen, glaube ich,
00:37:52
Speaker
dann sehr viele Leserbriefe bekommen zu einem Thema und da hat er sich spontan entschlossen, das von verschiedenen 11 Labs Stimmen vorlesen zu lassen, damit er nicht auch die ganzen Frauen und nicht die ganzen Leserbriefe vorlesen muss und das dann selbst beantworten muss. Aus dem ersten Gefühl heraus
00:38:10
Speaker
Aus seiner Sicht sprach da nichts dagegen, er hat das transparent gemacht, er hat das kommuniziert, ganz klar, okay. Trotzdem habe ich gemerkt, dass das in mir Abneigung auslöst und mir sauer aufstößt.
00:38:25
Speaker
weil es gerade in so einem hochqualitativen journalistischen Format noch viel stärker zur Gewöhnung und zur Normalisierung von synthetischen Stimmen beiträgt, auch wenn das nur Kommentare, Feedback und Leserbriefe waren, die das vorgelesen hat.
00:38:46
Speaker
Dort kann das, meiner Befürchtung nach, den allergrößten Schaden auslösen, wenn wir das nicht mehr differenzieren können, also im Journalismus, in der Berichterstattung. Und da wird es dann plötzlich schnell demokratiegefährdend, wenn es so normal ist, dass, ja klar, die Tagesschau, da gibt es vielleicht noch eine Moderatorin oder so, aber die Berichte innen,
00:39:13
Speaker
Die Voice-over in den einzelnen Segmenten sind dann schon KI. Und da fällt, finde ich, auch ein total wichtiger Kontrollinstanz, eine menschliche Momentmal-Faktencheck betrieben werden kann. Kann das wirklich stimmen? Sagt man das wirklich so? Ist das richtig? Und da halte ich es für extrem gefährlich.
00:39:35
Speaker
bringt uns gleich zum nächsten Thema, zu den Deepfakes, die ja damit immer leichter gemacht werden können. Und das gab es ja hier in Deutschland schon mit Tagesschausprechern und zwar nicht nur mit der Stimme, sondern wirklich auch mit Bildern, die dann schon KI gefakt waren. Und du hattest den Eindruck, dass, ich weiß nicht, es waren glaube ich zwei oder drei verschiedene Tagesschausprecher und Sprecherinnen, irgendwelche schlimmen Meldungen oder eines war ein Werbe-
00:39:59
Speaker
Video für irgendeine Börsenfirma, glaube ich, mit gut gemachten Fakes, also mit gut gemachten Stimmfakes. Und dann siehst du einen Tagesschau-Sprecher, du siehst das Setting der Tagesschau, du siehst diese Sprecher. Es sind dann auch die Stimmen, die schon einigermaßen gut sind. Dann weißt du nicht mehr, ist das echt oder nicht. Der gesunde Menschenverstand sagt, die Tagesschau wird schon nicht im Tagesschau-Setting sich hinsetzen und für irgendeinen komischen Finanzdienstleister ein Werbeswort sprechen. Natürlich nicht.
00:40:30
Speaker
Aber lass es was anderes sein, bei dem ich dann vielleicht selber denken würde, es könnte sein, da muss der erst mal hin und muss recherchieren und fragen, und stimmt das?
00:40:41
Speaker
Ich glaube auch, es wird gefährlicher, je plausibler die Nachrichten sind. Wenn das jetzt so absurde Verschwörungs-Scheiße ist mit irgendwelchen Kinderbluttrinkenden, was auch immer, okay, geschenkt. Aber wenn das plausibel ist, wenn es so passiert sein könnte, aber es ist halt Fake News, dann wird es richtig gefährlich.
00:41:03
Speaker
Und kurz abschließend wollte ich, wollte ich noch auch zur Verteidigung des guten Herrn Nick Basch sagen. Ich habe da tatsächlich hingeschrieben und ich war wohl nicht der Einzige, eh auch so ganz, ganz, wie ich es jetzt wiedergegeben habe, große Verehrung für das Format. Ich finde es grundsätzlich schwierig, das in einem journalistischen Ding einzugehen. Und er hat das tatsächlich auch anerkennend kommuniziert in der nächsten Folge, dass er das jetzt nicht mehr machen wird, weil eben relativ großes, große Abneigung, große
00:41:34
Speaker
klare Stellung dazu bezogen wurde aus der Hörerschaft, dass sie das nicht wollen. Das hat mich auch irgendwie bestärkt oder mir ein gewisses Vertrauen wiedergegeben von, hey, die Menschheit ist da irgendwie noch
00:41:49
Speaker
kritisch reflektierend dabei und frisst nicht alles, was man ihr so vor die Nase setzt. Das wollte ich nur ergänzen. Aber zu den Deepfakes. Ja, total schlimm. Du warst ja auch in der Gründungsphase von UVA dabei und das war etwas, worüber wir vor einem Jahr oder vor 18 Monaten schon gesprochen haben.
00:42:10
Speaker
mindestens genauso gefährlich wie, dass wir bald alle arbeitslos sind und dann in weiterer Folge die ganze Produktionsnahrungskette, also Tonstudios, Filmproduktionsfirmen und so weiter, dem folgen werden, ist ja, dass wir keine freien demokratischen Wahlen mehr haben oder zumindest nicht mehr wissen, uns nicht mehr darauf verlassen können, was wir sehen mit einer gewissen, ich nenne es jetzt mal Kontrolleinstanz, öffentlich-rechtlicher
00:42:40
Speaker
Sendeanstalten, an die ich persönlich zumindest einfach einen höheren Anspruch habe, weil das deren Aufgabe ist, möglichst objektiv, möglichst sachbezogen und faktisch zu berichten. Deswegen ist es auch so wichtig, dass man unbedingt fordert und durchsetzt, das passiert jetzt gerade, dass immer Content, der von einer künstlichen Intelligenz hergestellt wurde, auch als solcher
00:43:03
Speaker
gekennzeichnet werden muss. Also Content im Sinne von der Text ist geschrieben von, recherchiert von, vorgetragen von. Das ist mir ganz wichtig, weil
00:43:13
Speaker
Heutzutage kann ja auch die KI-Grütze recherchieren, aber das dann gut vortragen. Also es ist ja schon ganz oft belegt worden, dass es waren irgendwelche Urteile aus Amerika, also juristische Urteile, die wurden von einer KI recherchiert und in einem so schönen juristischen Text auf Englisch gepackt, dass dann alle gesagt haben, das klingt aber toll, aber bis dann irgendein echter Mensch, Jurist mal gesagt hat, aber das ist inhaltlich völliger Schwachsinn.
00:43:40
Speaker
Dieses Prozedenzurteil gab es nie und so habe ich mal gehört. Das hat er dann erfunden. Das wurde halt halluziniert. Das nennt man ja bei der KI so, wenn sie nicht genügend Informationen bekommt, dann reimt die sich irgendwas zusammen und packt das aber in so schöne eloquente Worte, dass man am Ende meinen könnte, ja, das muss doch alles richtig sein. Bis dann einer hingeht und das mal kontrolliert.
00:44:03
Speaker
und feststellt, das klingt zwar toll, aber es ist trotzdem inhaltlich einfach nicht richtig. Und deswegen ist ganz wichtig, ist ja auch ein Teil des AI-Acts, dass Elemente, die hergestellt worden sind, wie auch immer, ob nun geschrieben, vorgetragen oder nur recherchiert, immer gekennzeichnet werden müssen mit Achtung, hier ist eine künstliche Intelligenz.
00:44:22
Speaker
Weil man kann ja auch noch eine KI, das ist noch nicht passiert oder zumindest nicht, dass wir es wissen, man kann ja eine KI auch manipulieren. Also nicht nur, dass sie manipulativ wäre, man kann ja auch mit bestimmten Absichten eine KI so manipulieren, dass sie dir zwar plausibel klingende oder in sich logisch klingende Erklärungen, Texte, was auch immer liefert,
00:44:45
Speaker
Aber eine ganz bestimmte Intention, die man der KI vielleicht vorher vorgegeben hat, verfolgt. Das könnte man... Keine Ahnung, ich bin jetzt kein Verschwörungstheoretiker, aber das kannst du machen mit...
00:44:57
Speaker
Trump, das kannst du machen mit Russland und der Ukraine, das kannst du machen mit China, das kannst du machen mit irgendwelchen Islamisten. Das ist ja völlig egal, was du da vorgibst, aber die können die Ergebnisse der Textrecherche immer so manipulieren, dass am Ende in sich schlüssig klingende Texte erscheinen, die aber eine bestimmte politische Richtung verfolgen.
00:45:19
Speaker
Und deswegen muss das unbedingt immer klar sein, hier war eine KI entweder in der Recherche oder bei der Textgenerierung oder beim Vortrag, ob nun Bild oder Ton oder schriftlich, völlig egal, am Werk. Das möchte ich immer sehen und vorher wissen. Im Internet ist das ja so, wenn du irgendwie heutzutage eine Zeitung liest,
00:45:42
Speaker
Bild.de oder Spiegel.de, völlig egal. Da steht ja auch immer irgendwo rechts oben Anzeige über einem Artikel, der offensichtlich eine Werbung darstellt. Wenn man da draufklickt, merkt man nicht immer sofort, dass das Werbung ist. Du merkst es dann am Inhalt.
00:45:58
Speaker
Aber das Layout ist manchmal ja wie der Zeitungsartikel selber, also manchmal erscheint das ja im Spiegel.de oder Stern.de, ich möchte keine Zeitschrift wissen, das geht auch mit Fokus und mit bunter und suchst dir aus. Aber das erscheint im gleichen Design, mit den gleichen Schriftgrößen, mit den gleichen Schriftarten. Und du hast den Eindruck, das sei ein Artikel und nur ganz, wenn du oben hinguckst, rechts oben steht Kleine Anzeige, dann hast du gedacht, oh, das ist doch Nerv.
00:46:23
Speaker
Und das möchte ich bei KI auch immer. Am liebsten, dass weißt du, so rechts unten im Bildschirm oder wo auch immer, aufploppt und immer blinkt, Achtung, KI, Achtung, KI. Ich möchte es ja nur wissen. Was ich mit dieser Information mache, bleibt ja dann mir überlassen. Aber ich möchte immer die Option haben zu wissen, das ist jetzt nicht von einem Menschen generiert. Obwohl natürlich auch Menschen manipulative Texte schreiben können. Keine Frage.
00:46:47
Speaker
Absolut, aber dann kann ich zumindest eine informierte Entscheidung treffen, wie sehr ich dem Inhalt vertraue und wie sehr ich Fact-Checking betreibe oder ob ich das vielleicht gar nicht konsumieren will aus Prinzip. Da sehe ich auch tatsächlich ein großes Versäumnis des AI-Acts, da die Lücke tatsächlich vollständig zu schließen, weil es gibt ja leider die Ausnahme,
00:47:08
Speaker
unter anderem für Satire und freie Meinungsäußerung, dass man das nicht kennzeichnen müsse. Und ich weiß nicht, wie es in Deutschland ist, in Österreich betiteln sich diverse Rechtspopulisten immer wieder sehr gerne
00:47:24
Speaker
anlassbezogen, selbst als Satiriker, damit sie sich hinter, versuchen, hinter der Satire zu verstecken und der Kunstfreiheit oder der freien Meinungsäußerung zu einem künstlerischen Zweck sozusagen gewissen Konsequenzen zu entgehen, die sie eigentlich durch ihre Aussagen
00:47:47
Speaker
Ja, erwarten müssen. Ich hoffe, hier meint Deutschland, dass auch irgendwelche Rechtspopulisten sagen, ach, war nur ein Scherz, war nur Satire, aber ich befürchte, die meinen das ganz ernst, was die da erzählen. Jaja, nein. Aber was ich spannend finde, weil da war ich ein bisschen enttäuscht, dass das finale Wording relativ lax war und relativ großes carve-out sozusagen hatte für eben solche Sachen.
00:48:13
Speaker
Aber tatsächlich habe ich jetzt nur eine Schlagzeile, leider noch nicht den ganzen Bericht gelesen, dass aber diese ISO-Zertifizierungsbehörde einen sehr stringenten Vorschlag gebracht haben soll, also die diese ganzen ISO-Normen machen für wurscht, auch für Baubranche und so weiter.
00:48:36
Speaker
zur Kennzeichnung von KI-generiertem, aber auch in der Unterscheidung nur durch KI-verändertem Material. Also noch mal ein bisschen differenzierter, noch mal ein bisschen genauer. Und die scheinen das, was ich jetzt nur aus diesem, ich nenne es jetzt mal dem Klappentext des Berichtes herausgelesen habe, haben die keine so Ausnahmen im Sinn.
00:48:59
Speaker
Was sich jetzt durchsetzen wird, werden wir sehen, aber grundsätzlich sehen auch Behörden oder offizielle Stellen dieses Problems, wo jetzt die Politik entweder durch Lobbyarbeit oder durch eine falsche Einschätzung der Wichtigkeit dieses Loopholes vielleicht eben etwas versäumt haben oder nicht ernst genug genommen haben, wie auch immer.
00:49:26
Speaker
Also das hat mich zumindest auch wieder etwas positiver gestimmt, ob sich das dann durchsetzen wird, aber so ISO-Normen sind ja vor allem in Deutschland sehr beliebt. Weil zum Beispiel die DIN-Normen sind ja auch alle gar nicht verpflichtend zum Beispiel, aber sie sind Industriestandard. Sie werden auch bei Gerichtsurteilen zur Urteilsbegründung herangezogen, obwohl es alles nur Empfehlungen sind von diesem DIN-Institut.
00:49:56
Speaker
DIN A4-Seite bis zu wie dick muss eine Mauer zwischen zwei Steckdosen sein, damit das, keine Ahnung, so alles vorgibt. Das ist ja absurd. Bevor wir uns jetzt zu sehr mit DIN-Normen beschäftigen, ich frage jetzt einfach mal, ganz ketzerisch, weil die Frage stelle ich fast allen Kolleginnen und Kollegen aus der Sprecherbranche, wenn ich mit ihnen spreche, merkst du denn schon,
00:50:18
Speaker
rein wirtschaftlich, finanziell, dass es KI gibt und dass dir KI irgendwelche Jobs streitig macht oder schon gemacht hat.
00:50:30
Speaker
Also ich merke definitiv, es ist da und es hat mich konkret schon zwei Jobs gekostet, wo es zuerst darum, also bei dem einen Job ging es zuerst darum, einen Imagefilm zu machen für ein großes Unternehmen,
00:50:51
Speaker
Und die wollten dann aber ganz viele, ich glaube vier, waren das dann Cutdowns, 30 Sekunden draus machen und die dann auch online schalten im gesamten Dachraum. Und dir brauche ich es ja nicht erzählen, Umut. Das ist dann einfach verhältnismäßig sehr viel teurer, als wenn man sich einfach nur einen Imagefilm gönnt. Das habe ich denen auch so kommuniziert.
00:51:10
Speaker
Erstmal sind die aus allen Wolken gefallen, also die Agentur, die dazwischen war, hat mir kommuniziert, dass der Kunde da fast aus den Latschen gekippt wäre. Und dann habe ich noch einen Paketpreis sozusagen für Angeboten als kleines Entgegenkommen.
00:51:29
Speaker
wo dann aber auch nur mit dem Kopf geschüttelt wurde und gesagt wurde, nee, dann machen wir es halt mit KI. Ich sag, gut, machen wir es mit KI. Also macht ihr es mit KI, solange ihr es nicht mit meiner Stimme macht. Ihr wisst eh, wir haben darüber gesprochen, das kommuniziere ich schon immer vorab, dass was auch immer für ein Werk entsteht, auch wenn es nur ein Layout ist, dass das nicht
00:51:49
Speaker
eingespeist werden darf also was gar nicht geht ist wir haben es mal hochgeladen und es gefällt uns total gut können wir das so oder weißt du was ich meine haben sie haben sie auch nicht gemacht sondern sie haben tatsächlich die mülligste fünf dollar ich nenne jetzt keinen namen des herstellers
00:52:12
Speaker
billigste KI-Stimme genommen. Das klingt echt wie ein Navi von 1996. Richtig scheiße. Hat nicht mal den Firmennamen richtig betont. Aber es klang jetzt bei dir noch nicht so wirklich, dass es nach einem brachialen Einkommensverlust... Nein, überhaupt nicht. Das waren tatsächlich zwei konkrete Situationen. Eine davon habe ich dir jetzt erzählt, wo ich mir dann fast, nicht ins Fäustchen gelacht habe, aber mir gedacht habe, wie kann man eigentlich so bescheuert sein? Weil die stecken jetzt im Dachraum. Ich weiß nicht, wie viele
00:52:39
Speaker
zigtausend Euro in die Schaltungsbudgets und haben sich jetzt da bei mir irgendwie einen niedrigen vierstelligen Betrag eingespart und blasen aber 100.000 oder 200.000, ich weiß es nicht, Euro da hinein, dass ihre Außenwahrnehmung als Marke total belächelt oder nicht mehr ernst zu nehmen ist, weil
00:53:07
Speaker
Das ist ja ganz oft so bei Unternehmen, wenn man denen dann sagt, in Relation zu dem, was sie als Werbebudget am Ende verschalten, wie auch immer, in Relation dazu, die Sprachaufnahmen zu drücken, ist meistens wirklich albern, weil man sich dann fragt, es geht hier vielleicht um 1000, lass es um 2000, 3000 Euro gehen, aber ihr fasst danach 200.000, 300.000 Euro an und wir diskutieren am Ende über ein Prozent,
00:53:32
Speaker
oder weniger von eurem Gesamtbudget, was ihr euch einsparen wollt, indem ihr eure Kampagne kaputtmacht, weil ihr irgendeine wirklich schlechte, und was habt ihr dann davon? Ihr habt jetzt eine schlechte Kampagne, ihr habt irgendwie eine KI-Stimme und habt zwar 3000 Euro gespart, sage ich jetzt einfach mal in den Raum, aber könntet euch eigentlich die anderen 300.000 Euro auch noch sparen, weil das hat jetzt sowieso keinen Werbeeffekt mehr.
00:53:56
Speaker
Ich kann nur bei mir sagen, dass ich nicht auseinanderfummeln kann, ob es jetzt gerade eher eine Zurückhaltung in der Wirtschaft ist, weil ja auch der Wirtschaft geht es gerade momentan nicht so gut, oder ob es schon der Beginn von KI ist, dass so, naja sagen wir mal im Vergleich zu den letzten Vorjahren, liegen wir, ich mit dem Studio,
00:54:18
Speaker
Also vor allem mit dem Studio, nicht mit der Sprecherei, ein bisschen unter den Vorjahresergebnissen. Nicht schlimm, nicht bedrohlich, kann auch wirtschaftliche Schwankungen sein, kann aber natürlich auch sein, dass da schon ein bisschen KI mit im Spiel ist, weil man ja meistens eben nicht mitbekommt, welche Jobs man
00:54:33
Speaker
nicht bekommen hat. Das sollte ich gerade sagen. Das kann ich natürlich nicht sagen. Was ich dir auf jeden Fall sagen kann, ist, dass ich schon lange kein Layout mehr gesprochen habe. Das ist bei dir auch so. Genau. Das ist tatsächlich etwas, das ist jetzt nicht das, was das Kraut fett macht finanziell. Bei mir, Gott sei Dank, das heißt, das spüre ich finanziell wirtschaftlich.
00:54:50
Speaker
Gar nicht, kaum, aber vom Gefühl, was steht so an jeden Tag, waren die Layouts tatsächlich schon lange nicht mehr oder Pitches oder so. Das ist wahrscheinlich etwas, was wir uns abschminken können.
00:55:11
Speaker
Ich kann auch schwer urteilen darüber, ob das im Rest der Branche auch so ist, weil ich das Glück habe, mir so ein paar größere, feste Kunden aufgebaut zu haben, die auch gerne mit Menschen arbeiten und die
00:55:29
Speaker
Mit denen ich auch dieses Gespräch geführt habe und in der Kosten-Nutzen-Rechnung oder in der Abwägung in Haftungsfragen zum Beispiel oder in der Abwägung von ist das Endprodukt dann auch so urheberrechtlich schützbar, wie wir es gerne hätten als Marke, als Premium-Werbeprodukt und so.
00:55:49
Speaker
die sich dann alle dafür entschieden haben, nee, ganz klar, wir bleiben bei Menschen und das ist uns das auch wert und wir wissen, was wir daran haben. Die Sicherheit, die Verantwortung, die ich übernehme für den Inhalt, der dann über den ETA geht.
00:56:04
Speaker
Ich bin ja auch nochmal, oder wir sind dann auch nochmal eine Kontrollinstanz und nicht nur jetzt von der Qualität des Textes, sondern auch von der wirklich sachlichen Richtigkeit, von der faktischen Richtigkeit oder von der, ja, natürlich auch vom kreativen Teil. Du machst das dann ja genau richtig. Das ist ja auch das, was ich auch immer empfohlen habe, schon auf den Mitgliederversammlungen vom Verband deutscher SprecherInnen.
00:56:26
Speaker
dass man sich möglichst breit aufstellen sollte, also eine große Variante haben sollte, was die Kunden angeht, aber auch was die Tätigkeitsfelder angeht. Also du machst ja eben nicht nur Werbung und nicht nur Station Boys und nicht nur Corporate Videos, also Industrietexte, sondern du machst ja einen Potpourri daraus. Und das ist, glaube ich, auch so die Lösung des Ganzen, dass man eben sich nicht darauf fokussiert zu sagen, ich lese nur Audiodeskription.
00:56:51
Speaker
oder ich lese nur E-Learnings, weil dann könnte man irgendwann mal wirklich in die Prädolie kommen. Wenn man aber breit aufgestellt ist und vor allem auch vom Können und vom Talent her viel abdeckt, dann ist man, glaube ich, relativ gesichert.
00:57:06
Speaker
gewappnet, sagen wir mal, für die nächsten 10, 15 Jahre. Darüber hinaus kann man seriöserweise gar nicht gucken. Also, wie sich das entwickeln wird, Mitte der 30er Jahre, kann dir heute keiner wirklich sagen. Also, man ahnt, es wird wohl besser werden. Ob es so gut wird, dass man Angst haben müsste, seine Familie nicht mehr ernähren zu können, das kann dir heute keiner sagen.
00:57:28
Speaker
Ich glaube, du hast noch einen ganz wichtigen Punkt erwähnt, nämlich ohne dass ich mir jetzt da selbst Rosen streuen möchte, sondern das gilt für alle. Ich glaube, es ist unabdingbarer denn je, einfach scheiße gut zu sein in dem, was man tut.
00:57:45
Speaker
Es ist so, es ist leider wirklich so, weil die ersten, die jetzt kein Geld mehr verdienen, sind die Voice One, Two, Three und Fiverr SprecherInnen, die es halt alle für einen Fufi gemacht haben und diesen Markt gibt es und das ist, ich möchte das jetzt in der Form auch gar nicht werten, aber das ist der Markt, der als erstes gefressen wird, weil du kannst nicht mit einer Maschine mithalten, die auch durchschnittliche Qualität liefert, aber unfassbar unkompliziert ist im Umgang mit den Nutzungsrechten und
00:58:13
Speaker
einmal gepoppt, nie mehr gestoppt sozusagen. Viele Familien, genau. Manchmal bricht mein Werbe hindurch. Ich glaube, dass es sich auf zwei Märkte einpendeln wird. Das ist meine Prognose. Es wird einen Markt geben, wo
00:58:36
Speaker
das Geld bestimmt, weil es ist das Budget, it's on a budget, so. Dann ist egal, ob das ein Mensch macht, der das ganz okay macht, aber er passt ins Budget oder eine Maschine, die das ganz okay macht, aber sie macht keine Schere rein und will keine, so. Und es wird den Premiummarkt geben,
00:58:54
Speaker
der sich echte menschliche kommunikation ans revier heftet und sagt ich will aus aus unterschiedlichen gründen der qualität der haftung der rechtssicherheit es macht ja auch keinem spaß den ganzen tag vorm rechner zu sitzen und zu chatten mit einem mit einem chatbot am ende des tages ist ja auch nichts anderes und es gibt soll soll diese menschen geben die gerne mit anderen menschen zusammenarbeiten und aus dieser
00:59:19
Speaker
Aus dieser Symbiose entsteht dann etwas Neues, Kreatives, vielleicht mit einem größeren Wert oder mit einem größeren Facettenreichtum, als vorher gedacht oder geplant war. Und das merke ich auch, dass Leute mir sagen, ich habe das ausprobiert, aber ich habe echt keinen Bock. Es ist so stumpfe Arbeit am Ende des Tages und du musst so viel prompten, bis du dich aus dieser Mittelmäßigkeit herausgepromptet hast.
00:59:48
Speaker
Ich glaube auch nicht, dass das ein Job wäre, den irgendwie viele Menschen gerne machen, weil das ist ja auch nichts anderes als Fließbandarbeit. Du musst dann so lange in diese Promts rein hacken, bis Patrick Messe diesen einen Satz genauso sagt, wie er es wahrscheinlich gesagt hätte, wenn man es dir ins Gesicht sagen würde, sprich mal, dann machst du es ja einfach. Aber wenn du es mit einem Prompt machen musst, also eine KI-Stimme von dir, so weit zu manipulieren, dass sie so klingt, da brauchst du ja Stunden.
01:00:14
Speaker
Also Stand heute. Deswegen glaube ich nicht, dass das von Relevanz ist. Aber ich glaube, das ist etwas, was man vielleicht noch einmal wiederholen sollte, weil es so wichtig war. Man muss sich wirklich einzigartig und unersetzbar machen. Ich glaube, das ist schon etwas ganz Wichtiges, was man auch vielleicht jungen Kolleginnen und Kollegen mitgeben sollte. Weil am Ende überleben wirklich nur die Guten.
01:00:34
Speaker
Und, naja, die Promi-Stimmen, glaube ich schon auch. Also die Menschen, die eine Wiedererkennbarkeit in ihrer Stimme haben, eben weil sie als Menschen schon erkannt werden, sei es nun die Synchron-Stimmen von oder echte Schauspieler, deren Gesichter man auch kennt, die werden sowieso überleben. Also die werden den ganzen, Überleben klingt so hart, aber die werden von KI nicht so sehr betroffen werden.
01:00:59
Speaker
Die haben eine bessere Verhandlungsposition in Sachen Verträgen, die haben eine Öffentlichkeitswirksamkeit in ihren Statements, in ihrer Stimme. Ich finde es total wichtig, handwerklich an sich zu arbeiten und aber auch den Mehrwert
01:01:17
Speaker
den Mehrwert bieten zu lernen, der über das reine faktische Sprechen hinausgeht. Ob das jetzt eine Studiodienstleistung ist oder eine Texterdienstleistung oder eine Übersetzerdienstleistung oder was auch immer. Etwas, was artverwandt ist und in dem Produktionsprozess dir noch einen Spielstein mit dazu gibt, noch mehr Flexibilität in der Einsatzbarkeit oder ein Argument an die Hand gibt, weshalb
01:01:43
Speaker
du oder ich im Vergleich zu jemand anderem, der das vielleicht nicht beherrscht, aber handwerklich, sprecherisch genauso gut wäre, dann den Zuschlag bekommt. Also das finde ich, es wird, glaube ich, auch wichtiger denn je. Und wenn das nur ist, ich habe so einen geilen Humor und mit mir arbeitet man so, so gerne, weil ich, und ich spreche jetzt natürlich von mir selbst und nur von mir, weil ich bin der, der das kann. Aber also das einfach
01:02:12
Speaker
das Gefühl, wenn jemand, wenn ein Caster, ein Creative Director wäre auch immer dran denken, mit wem würde ich gerne diesen Auftrag
01:02:23
Speaker
machen, dann ist es doch der Jackpot, wenn er dann denkt, ja der Patrick, weil mit ihm war es so lustig, der hat so professionell gearbeitet und trotzdem hatten wir alle eine gute Zeit und noch Zeit für einen Scherz und der Kunde hat sich super wohlgefühlt und abgeholt und gesehen und gehört und diese Sachen, so diese Soft Skills, die
01:02:42
Speaker
die vielleicht lange belächelt wurden, die ich aber schon immer irgendwie gemerkt habe, da steckt eigentlich das Quäntchen drin, was den Unterschied macht. Ja, aber das hat, glaube ich, auch mit KI-Stimmen gar nichts zu tun. Das war ja schon früher, so weit bevor es KI-Stimmen gab und es wurde eine Rolle besetzt und man hatte irgendwie die Wahl zwischen fünf Männerstimmen, da hat man auch den genommen,
01:03:05
Speaker
den man am sympathischsten fand und bei dem man gesagt hat, mit dem kann man auch schnell und gut arbeiten. Und lustig ist er auch noch. Das hatte mit KI-Stunden gar nichts zu tun. Das ist immer so. Also be nice and be smart, unabhängig davon, ob das jetzt mit KI zu tun hat oder nicht. Das ist natürlich immer so. Ich buche ja auch Sprecherinnen und Sprecher hier im Studio. Und wenn ich manchmal weiß, die ist aber wirklich anstrengend oder der braucht immer so lange oder der ist so spröde und ich habe einen gleich guten Kandidaten, der
01:03:33
Speaker
auch noch sympathisch ist, was wähle ich dann? Logisch. Ich glaube, es wird tatsächlich, um dann nochmal auf K.I. zurückzukommen, wird tatsächlich mehr denn je um echte menschliche Beziehung gehen miteinander und nicht ein erfüllt die Voraussetzungen, also nehmen wir den. Also ich glaube, das wird sich noch zuspitzen, weil du das vollkommen recht, das war schon immer so.
01:03:59
Speaker
Aber es war mir noch nie so klar wie jetzt, dass es vom vernachlässigbaren Softskill, weil der räumt einfach alles ab, wenn ein Trailer spricht. Da kann ja noch so ein Arsch sein, den musst du einfach nehmen, weil das ist die Trailer-Stimme. Das wird weniger wichtig und das andere wird wichtiger, glaube ich. So sehe ich das auch.
01:04:24
Speaker
Ja, wie ist es denn bei dir persönlich? Wie gehst du denn damit um? Hat man dich schon gefragt, Umut, wir würden dich gerne klonen oder wir würden gerne eine KI-Zusammenarbeit machen? Ja, tatsächlich. Also bin ich schon angefragt worden und habe noch nicht darauf geantwortet. Ich habe die jetzt schon seit Monaten hingehalten. Eigentlich ist meine Antwort ja klar. Eigentlich will ich nicht geklont werden. Aber ich war natürlich zuerst einmal neugierig und habe gesagt, schick mir doch mal die Konditionen.
01:04:52
Speaker
die sie selber noch nicht so ganz parat hatten und auf Nachfrage und im Sparing miteinander, wurde klar, dass die aber inzwischen schon mal begriffen haben, dass sie gar nicht kommen brauchen mit, wir möchten alle Rechte für immer und auf alle Ewigkeiten für einen Fixbetrag, für einen festen Betrag, das ist es nicht. Da würde es jetzt eher um Konditionen gehen, zu welchen Bedingungen wird wann wie bezahlt, bei jeder Verwertung.
01:05:20
Speaker
Ich will da noch mal ein paar Nächte drüber schlafen, wobei ich schon seit Wochen drüber schlafe und irgendwie reift in mir der Gedanke, eigentlich will ich es nicht. Und noch ist es auch so, das gefragt da drauf, wie sind denn die Verdienstmöglichkeiten, was schätzt ihr so, kommen da Beträge raus, bei denen ich dann sage, ach nee, so wichtig wäre es mir dann nicht. Also wenn die jetzt sagen würden aus, sie verdienen jedes Jahr ein Einfamilienhaus, würde ich sagen,
01:05:47
Speaker
Wir sind, glaube ich, bei sowas alle käuflich. Wer das negiert, der lügt. Wer in dieser Branche arbeitet, dass man den Hampelmann macht, wenn jemand Geld auf den Tisch legt, der braucht nicht sagen, ich wäre nicht käuflich. Wir sind das alle. Im bestimmten Rahmen natürlich. Natürlich, natürlich. Also da habe ich auch kein Problem, das auszusprechen. Es gibt Sachen, die würden wir vielleicht auch für Geld nicht vorlesen. Ja, das kann man ja auch bei KI ausschließen, aber grundsätzlich sind wir schon.
01:06:15
Speaker
bereit, Gegengeld, Texte und Inhalte anderer Menschen vorzulesen, ob das jetzt nun Hörbücher sind oder Werbung oder Corporate Videos oder E-Learnings.
01:06:24
Speaker
irrelevant, aber wir arbeiten in einer Branche, in der es heißt, Dienstleistung, deine Stimme, deine Interpretation von Texten gegen Geld. Deswegen wäre es albern zu sagen, ich wäre nicht käuflich. Es ist nur eine Frage der Summe und der Kondition. Und bisher war es so, das kann ich mit gutem Gewissen sagen, passten die Konditionen nicht und auch die Bezahlung nicht.
01:06:46
Speaker
Was aber für mich nicht bedeutet, dass wenn jemand dann doch kommt mit dem Einfamilienhaus pro Jahr und wir schließen ein paar Sachen aus, die mir wichtig sind, also keine Politik, irgendwie keine Waffen und so was, kann man jeder für sich selber definieren. Wenn das alles geklärt ist,
01:07:06
Speaker
Sehe ich auch, so bin ich auch. Ich bin curious da in die Richtung, aber auch eher, um das besser einordnen zu lernen und zu sehen, wo steht denn die andere Seite, was haben die eigentlich für Vorstellungen, wie das ablaufen soll oder welche Art von, stellen sie sich überhaupt einen Vertrag vor oder wie, ja, ist das ein ernst gemeintes, zu Ende gedachtes Angebot und
01:07:33
Speaker
Wie sehr deckt sich das eben mit dir? Wie du beschrieben hast, wenn ich jetzt sage, ich kann dann endlich den ganzen Tag Töpfern oder Blockflöte lernen oder so und kann trotzdem die Familie ernähren davon und habe die Sicherheit,
01:07:47
Speaker
Das ist, glaube ich, der größte Knackpunkt, weil ich glaube, an Geld wird es nicht scheitern. Für mich wird es eher an der Sicherheit scheitern, dass das Stimmduplikat so sicher und auf einem Server in Deutschland und nicht irgendwie in den USA, Russland oder Israel liegt, wo wenn es dann gehackt
01:08:07
Speaker
würde oder in welcher Form auch immer abhanden kommt, außer Kontrolle gerät, dann ist das halt nicht wie ein Facebook Passwort. Dann lege ich mir nicht einfach eine neue Stimme zu. Das ist dann im schlimmsten Fall im Darknet und dann kann regelmäßig Identitätsdiebstahl mit meinem biometrischen Daten betrieben werden. Das heißt da bin ich am
01:08:29
Speaker
haglichsten und da ziehe ich mich am meisten, habe die höchsten Ansprüche und deswegen wird wahrscheinlich auch bei mir so schnell nicht eine KI-Zusammenarbeit zustande kommen. Aber wenn jemand kommt, der sagt, wir haben das
01:08:43
Speaker
alles durchgespielt, durchgedacht, zu Ende gedacht und haben einen Plan dafür. Und die Konditionen monetär und vom Mitspracherecht passen auch. Die Kontrolle sozusagen, was passiert dann damit. Okay, ich bin jetzt nicht grundsätzlich dagegen. Ich glaube nicht, dass KI der Teufel ist. Ich finde, man muss das differenziert betrachten und sich auch überlegen, dass ich immer in diesem Beispiel bringe, ist ja, ich hätte auch gerne eine bessere Krebsfrüherkennung, aber muss ich dafür meine Urheberrechte tatsächlich
01:09:11
Speaker
Opfern mich auf den Rücken legen und die Kehle freigeben? Also in welchem Kontext reden wir von KI? Und ich würde niemals zum Beispiel mir anmaßen zu sagen, dass Leute mit ALS oder Kehlkopfkrebs nicht wieder eine Stimme bekommen sollen. Unbedingt sollen die wieder eine Stimme bekommen.
01:09:31
Speaker
Ist das aber der Grund, weshalb wir eine Kreativbranche auslöschen oder zum Tode verurteilen müssen, tatsächlich? Oder kann man das in diesem medizinischen Kontext bitte belassen? Und so. Aber das interessiert mich auch. Gibt es einen Unterschied, weil du ja beide Positionen kennst, von dir als Sprecher zu dir als Studio? Also kommen auch Kunden zu dir mit Druck auf, finde mir wen anderen und automatisiere mir diesen Prozess? Liebes Studio Direkt Audio.
01:09:59
Speaker
Also du gehst du dann.
01:10:01
Speaker
Na ja, was natürlich kommt, ist die Anfrage nach, wir brauchen eine Layout-Version. Kannst du die ins Liefern, damit wir zum Beispiel die Stimme nehmen als Taktgeber für den Schnitt eines Videos, wenn es da um Erklärvideos geht und da gesagt wird, und jetzt machen sie das und das, und dann fügen sie jetzt das und das. Da müssen die ja wissen, wo müssen die Bilder hin in der Sprache. Deswegen brauchen sie ganz oft eine Arbeitsspur.
01:10:30
Speaker
Naja, habe ich früher selber immer gesprochen oder irgendwelche Kolleginnen oder Kollegen, die gerade da waren, meistens zu sogar weniger als Layout-Honorare, weil die ja wirklich nie das Studio verlassen haben. Die waren ja wirklich nur Sprachstimmgeber. Im Zweifelsfall hat es einfach die Praktikantin gemacht in schlechtem Deutsch. Hauptsache, sie hatten eine Sprachspur. Das wird inzwischen ganz automatisiert angefragt von, mach das mit einer KI-Stimme.
01:10:54
Speaker
Und da gibt es zwei Möglichkeiten. Entweder ich sage, nein, ich liefer dir keine KI-Stimme an, weil ich das grundsätzlich ablehne. Das ist aber albern, weil inzwischen kann das wirklich auch jede Praktikantin, jeder Praktikant selber machen innerhalb von drei Minuten. Oder du sagst, okay, kriegst du halt irgendwie eine halbe Arbeitsstunde dafür, dass ich einen
01:11:12
Speaker
120 Wörtertext aus einer KI ausspiele und dir die Datei zuschicke. Das ist das einzige, was ich bisher mit KI gemacht habe. Finde ich jetzt auch nicht weiter schlimm, weil das inzwischen wirklich so überall zugänglich ist, dass das auch in meinem Gewissen okay geht. Alles andere hatte ich jetzt bisher auch noch nicht. Und das große, dafür bin ich nicht groß genug, dafür ist mein Studio nicht groß genug, große Konzerne auf mich zukommen und sagen, wir brauchen jetzt eine
01:11:36
Speaker
wirklich gute KI-Stimme. Das machen wahrscheinlich wirklich die großen Big Player, die dann – ich spinne das in meiner Fantasie zusammen – kommen und sagen, wir brauchen für den nächsten VW Golf, für den Werbespot, brauchen wir einen echten Menschen, der den TV-Spot spricht oder die Hörfunkspots noch viel besser. Und wir brauchen aber den Klon dieser Stimme, damit die 500 Abbinder mit den 500 Autohäusern in Deutschland nicht der arme Originalsprecher sprechen muss.
01:12:04
Speaker
Da geht es auch nicht nur um Arbeitsvermeidung, sondern auch um Kostenvermeidung wahrscheinlich, sondern dass dann halt einfach der Klon die 500 Adressen von Kiel bis Bad Reichenheim runterspricht. Ja, das finde ich auch legitim.
01:12:21
Speaker
ändert nichts an der Tatsache, dass die Systeme mit aller Wahrscheinlichkeit nach illegal bezogenen Trainingsdaten trainiert wurden, aber das wäre zumindest ein legitimer Einsatzzweck, den auch jede Filmproduktionsfirma jetzt so fährt. Das ist dann, oft verlässt das dann das Haus gar nicht mehr und sie machen sich natürlich auch die Arbeit leichter im Rohschnitt, in den ersten Fassungen eben
01:12:49
Speaker
Ja, etwas zu haben, an dem man sich entlanghandeln kann, bis man dann zum finalen Produkt kommt. Und dann hat es für mich einen Werkzeugcharakter, der einem Menschen, der die Hauptarbeit oder eine andere Arbeit macht, immer noch nur unterstützt, anstatt ihn zu ersetzen. Aber weil keiner von uns lebt, von Layouts oder irgendwie Pitches. Also das ist ja nur ein nettes Zubrot.
01:13:19
Speaker
Und die Frage nach Identitätsdiebstahl, die du ja vorhin angesprochen hast. Naja, also, wenn man boshaft deine Identität klauen möchte, dann kann man das ja wahrscheinlich jetzt schon. Das ist und bleibt eine Straftat. Aber sobald es von dir fünf Minuten Audiomaterial oder meinetwegen 20 Minuten Audiomaterial in guter Qualität ohne Musik und ohne Schnitte gibt, also irgendein Doku, irgendein Hörbuch,
01:13:46
Speaker
Ab dann könnte man theoretisch dich ja schon klonen, zumindest für diesen einen Stil, den du da verwendet hast, bei einer Doku oder bei einem Hörbuch.
01:13:56
Speaker
Da darf man gar nicht drüber nachdenken, weil wenn jemand das möchte, dann kann er jetzt schon deine Identität klauen. Ist halt illegal, aber man könnte auch jetzt schon irgendwelche, bestimmt findet man hundert Fotos von dir, von mir auch im Internet, man könnte auch mein Gesicht jetzt schon klonen und wer das möchte für ein Rasierwasser verwenden. Also das geht nicht immer.
01:14:18
Speaker
Vielleicht passiert es ja auch schon, Umut, dass du in Indonesien das Gesicht von Wilkinson Sword bist oder so und keiner weiß es. Wer dieses Gesicht haben will, bitte. Ich habe nur dieses eine, es tut mir leid. Was ich sagen wollte ist, man darf da gar nicht drüber nachdenken. Wenn jemand boshaft in juristisch oder in justiziabler Absicht dir Schaden zufügen möchte, dann kann man das auch jetzt schon.
01:14:47
Speaker
Ich hatte ja auch schon die Fragen von Kollegen, kann man jetzt noch Demos verschicken oder hochladen? Na ja, ja. Also alles andere ist auch Schwachsinn. Es sind deine Arbeitsproben. Du kannst natürlich das maximal Mögliche dafür tun. Also es gibt so Paragraphen, die man auf die Seite implementiert, dass das Auslesen für KI-Zwecke verboten ist. Man kann Wasserzeichen reinrechnen oder rausrechnen, aber völlig wurscht. Wenn ich deine Identität klauen möchte, dann lade ich mir irgendein Hörbuch von dir runter und dann habe ich sie schon. Also die stimmliche Identität.
01:15:15
Speaker
Absolut, das ist vollkommen recht. Ich finde aber trotzdem nicht, dass dieses Faktum einen befreit, davon sich damit auseinanderzusetzen. Es ist unangenehm und schwer zu machen, weil die kriminelle Energie, je schwerer das ist, desto größer muss die kriminelle Energie sein.
01:15:34
Speaker
sehr ein Unterschied, ob mir ein fix und fertiges Muttermaterial, ein digitaler Klon in den Schoß fällt im Darknet oder ob ich tatsächlich hergehen muss, den Patrick stalken muss, suchen muss, wo sind die passenden Hörbeispiele. Ich persönlich habe zum Beispiel alle Hörbeispiele ohne Musik und Soundeffekte von meiner Website runtergenommen und habe nur noch etwas oben, wo man sich dann noch
01:16:01
Speaker
verhältnismäßig viel Arbeit machen müsste, um das Sounddesign und das Musikbett und die Effekte rauszurechnen, dann ist die Sprachqualität, also die Qualität des Muttermaterials wieder schlechter, dann braucht man wieder mehr. Sowas finde ich okay und es gibt mir auch das Gefühl,
01:16:19
Speaker
eben etwas getan zu haben, um mich besser zu fühlen. Es ist ja oft nicht die 100%ige Sicherheit, dass man etwas absolut verhindern kann, sondern es geht eher darum, wie paranoid gehe ich durch den Alltag. Ich glaube, viel wichtiger ist, dass man ein Bewusstsein dafür schafft, dass der Versuch, deine Stimme zu klonen, schon eine Straftat ist.
01:16:44
Speaker
und auch bleiben wird. Und das ist viel wichtiger, als dass ich den so schwer mache, weil ich glaube, dass selbst wenn ich irgendeinen Trailer von dir nehme, wo noch Musik drunter liegt, da gibt es bestimmt auch eine KI, die das zuerst mal rausrechnen kann und deine nackte Stimme da wieder rausholt, damit ich dann weiter damit eine KI trainieren könnte. Viel wichtiger ist, dass man das bei den Kunden schafft, weil ich hatte das schon.
01:17:03
Speaker
dass ein großes Videostudio, mit dem ich viel arbeite, die brauchten eine Nachaufnahme von einer Sprecherin. Und zwar sehr eilig, denen ist irgendwie ein paar Tage vor Abgabe des Videos aufgefallen, oh Gott, wir haben da irgendwas vergessen. Und da haben sie gesagt, habt ihr jetzt aber Pech, weil die gute Dame ist gerade drei Wochen irgendwo in Lateinamerika im Urlaub. Ich könnte sie jetzt versuchen, unter wüstesten Umständen zu erreichen, aber ich wusste, die ist auf so einem Roadtrip, und sie in irgendeinem Todsstudio zu zerren.
01:17:31
Speaker
Und dann haben die mich gefragt, können wir nicht einfach die jetzt schon existierenden rohen Sprachfalls irgendwo hochladen bei diesen lustigen Anbietern aus Amerika, um da aus dem Klon zu machen, damit dann dieser Klon vorliest, was wir brauchen. Und dann habe ich denen gesagt, das ist wirklich eine Straftat und dann kommt ihr in Teufels Küche und ihr werdet angezeigt und verliert das sofort. Also das ist richtig strafbewehrt. Also viel wichtig, die haben das gerafft, die sind erst mal erschrocken, weil vorher war ihnen das gar nicht so klar.
01:18:01
Speaker
Und dann haben die auch sofort davon abgelassen. Das ist mir viel wichtiger, dass man bei den Leuten so dieses Bewusstsein schafft, ihr könnt nicht einfach Klone erstellen. Auch wenn ihr es könntet, es ist gar nicht mehr so schwer. Also es gibt Firmen, die bieten dir ja an, ich glaube für umsonst oder für ein paar Dollar, für 20 Dollar Mitgliedschaft im Monat, lädst du einfach zwei Minuten Sprache hoch und kriegst danach den Klon.
01:18:23
Speaker
Nein, also die Tatsache, dass es geht, heißt noch leider nicht, dass man es darf, weder moralisch noch juristisch. Absolut. Du hast vollkommen recht. Und es ist eine große, edukative Aufgabe, gesamtgesellschaftlich, die auch
01:18:39
Speaker
finde ich, generationenübergreifend passieren muss, weil wir sind ja jetzt, sage ich jetzt mal, im besten Alter und auch noch mit der Materie stark vertraut und betroffen und emotional wie wirtschaftlich stark involviert. Aber in beide Richtungen, nämlich in die Richtung, wenn ich jetzt an Eltern, Großeltern, Generationen denke, wie auch an Kinder, Jugendliche, die da eben keinen oder kaum einen Bezug zu den Konsequenzen oder zu den Auswirkungen
01:19:05
Speaker
haben da finde ich kann man nicht genug drüber reden und das man muss ich finde es ist ein schmaler grad aber man muss ja nicht panik schaffen oder verbreiten sondern einfach nur helfen das besser einzuordnen und und
01:19:23
Speaker
richtig zu verstehen, welche Tragweite solche Entscheidungen haben. Ich glaube, das ist eine große Aufgabe von allen Menschen, auch beteiligt oder unbeteiligt an dieser Technologie. Wobei, ich glaube, es gibt kaum jemanden, der gar nicht betroffen ist davon.
01:19:46
Speaker
Aber damit das nicht so duster wird, wir hatten ja auch schon im Vorabgespräch mal drüber gesprochen, wie ist das denn jetzt mit so Youngsters, wenn jemand zu dir kommt, also ich gebe ab und zu auch Sprechunterricht, Doktor unterrichtest ab und zu auch inzwischen Leute, lohnt es sich denn noch, in die Sprecherei einzusteigen, also sich vielleicht beruflich darauf zu fokussieren, mit Stimme zu arbeiten, nicht für Gesang, sondern für Sprache, also für, sagen wir mal, Hörspiel, Hörbücher, was halt so ein Sprecher macht, Dokus, Jingles, Werbung,
01:20:16
Speaker
Die Frage ist, was antwortet man diesen jungen Kolleginnen und Kollegen? Das ist die spannende Frage. Das ist eine sehr gute Frage.
01:20:27
Speaker
Fragst du mich? Ich frage dich, ja, ich frage dich. Ich sag dir dann auch gleich, was ich für eine Meinung dazu habe. Ich neugier dich auf deine. Wenn jemand zu mir kommt, dann sag ich meistens, du hast dir wahrscheinlich den schlechtestmöglichen Zeitpunkt der letzten 100 Jahre ausgesucht, um etwas mit Stimme und Sprache zu machen. Aber das heißt nicht, dass du es nicht versuchen solltest. Ich will dir nur keine falschen Hoffnungen machen und ich will, dass du das richtig einordnest. Das heißt,
01:20:54
Speaker
Dann frage ich erst mal nach, was hast du für eine Erwartungshaltung? Soll das dein erstes Strandbein werden, dein zweites oder nur ein Hobby, das ab und zu mal vielleicht ein bisschen abwirft? Oder wie schnell hast du vor, dorthin zu kommen, wo du jetzt glaubst, dass du hin möchtest? Weil wenn du mir jetzt etwas so wie ein halbes Jahr oder ein Jahr sagst, dann werde ich dir sagen, dass das wird nicht funktionieren. Wenn du jetzt sagst, es ist kein Problem, wenn das jetzt drei, vier oder fünf Jahre dauert.
01:21:24
Speaker
Dann sag ich, okay, dann haben wir eher eine realistischere Einordnung.
Herausforderungen und Chancen in der Stimmbranche
01:21:30
Speaker
Wie lange das dauert, bis man sich so auf diesem schwierigen Markt und jetzt in dieser schwierigen wirtschaftlichen Situation, sehr labile geopolitische Situation plus technologischer Fortschritt, der uns bedroht, Fuß fassen kann.
01:21:46
Speaker
Wie du vorher schon richtig gesagt hast, je breiter man sich aufstellen kann, desto besser für die berufliche Zukunft. Das heißt, ich denke auch mehr in Richtung szenische Lesung in Person. Auch für mich in der Zukunft, weil selbst wenn alle Strecke reißen, die gesetzlichen Rahmenbedingungen völlig versagen und wir uns als Gesellschaft am KI stimmen im Social Media Internetbereich gewöhnen, dann wird das
01:22:15
Speaker
dass menschliche Bedürfnis nach echter menschlicher Interaktion und Kommunikation ja nicht wegfallen. Das heißt nur, dass sich das verlagert in ein eben mehr wie der Bühne, Theater, Live-Performance im weitesten Sinne. Und da kann man ja auch als Geschichtenerzähler wunderbar auch sein Geld verdienen. Und man muss sich dessen nur bewusst sein oder vielleicht flexibler sein im Kopf, wo dann die Reise hingeht.
01:22:42
Speaker
Und was wir eben auch schon gesagt haben, sage ich auch immer, es ist wichtiger denn je, dass du so gut wie möglich wirst, dass du so gut wirst, dass man nicht an dir vorbeikommt als Sprecherin. Sowas in die Richtung, sage ich dann. Du hast jetzt auch, also sagen wir mal, die sehr wirtschaftliche und die perspektivische Sichtweise geschildert. Ich komme ja von der emotionalen Ebene und würde dann eher sagen,
01:23:10
Speaker
Macht einfach. Also wer es unbedingt machen möchte, wer dafür brennt, die Leidenschaft hat und jetzt irgendwie nicht nur sagt, ich möchte mal TikTok-Star werden, ich möchte so ein bisschen sprechen lernen, sondern wer das wirklich meint und ernst meint, der sollte das unbedingt machen. Das ist mein Rat immer. Ich mache dann schon auch ähnliche Einschränkungen wie du und sage, na ja, es gibt aber so ein paar wirtschaftliche und vielleicht ein paar technische Punkte, die man berücksichtigen sollte, aber
01:23:38
Speaker
voll wie deinem Herzen. Ich sage das lieber auf Englisch. Ich glaube, da funktioniert das Wortspiel besser. Listen to your heart. It may be on the left, but it's always right. Und das ist so. Wenn du das unbedingt machen möchtest, dann mach es. Und man darf auch nicht vergessen, manchmal entwickeln sich Dinge ja auch ganz anders, als man es
01:24:02
Speaker
20 Jahre vorher geplant hat. Früher hat man zu irgendwelchen Menschen gesagt, studiert nicht auf Lehramt, zumindest in Deutschland. Es gibt hier eine Lehrerschwemme. Dann hat keiner mehr auf Lehramt studiert. Und auf einmal jabsen sie jetzt alle, wir haben keine Lehrer mehr, wir nehmen jetzt fachfremde Leute. Es geht immer so in Wellenbewegungen. Und auch in der Sprecherei gab es ja Entwicklungen, die konnte kein Mensch vorhersagen. Also, dass man heutzutage in Computerspielen spricht, war in den 90ern noch nicht wirklich absehbar.
01:24:31
Speaker
dass es TTS-Stimmen gibt, also diese Siris und Alexa sind Menüstimmen dieser Welt. Das konnte man vor 20 Jahren noch nicht mal erahnen, da gab es noch nicht mal das iPhone. Oder gerade so, ich weiß gar nicht, wann kam das aus? Anfang der 2000er. Ja, ich glaube knapp ab jetzt. Ja, genau, irgendwie so.
01:24:50
Speaker
dass es inzwischen eine so wüste Anzahl an Synchronisationsfirmen gibt und an Synchronjobs, weil es Netflix und Amazon und Apple und was weiß ich alles an Fernsehanbietern gibt.
Zukunft der Stimmfähigkeiten in einer von KI geprägten Welt
01:25:03
Speaker
Das konnte vor 20 Jahren noch, vor zehn Jahren noch keiner abschätzen. Das heißt also, es gibt immer wieder Entwicklungen in der Sprachbranche, die konnte kein Mensch voraussehen. Und wer weiß, vielleicht wird es, gerade weil es KI gibt,
01:25:18
Speaker
in 10 Jahren oder in 15 Jahren einen Bedarf geben an Menschen, vielleicht auch an jungen Menschen, an heute 10-Jährigen, die dann vielleicht 25 sind, die mit Sprache umgehen können. Und dann wäre es ja blöd, wenn es keine mehr gäbe, weil alle vor 15 Jahren beschlossen haben, nö, wir hören auf. Mitte der 20er-Jahre wurde die Weiterentwicklung der Sprachfähigkeiten gestoppt, weil alle gesagt haben, nö, nö, nö, brauchen wir nicht. Quatsch. Einfach machen.
01:25:44
Speaker
Wer weiß, vielleicht steht jemand da 2040 und sagt, jetzt brauchen wir den 20-Jährigen, die 20-Jährige, die mit Sprache umgehen können und bitte keine KI sind und alle sagen, ob wir nicht, kann nicht sein. Also macht einfach.
01:25:58
Speaker
Das war schon recht. Man muss den Leuten immer klar sagen, ja, es ist vielleicht gerade nicht der beste Zeitpunkt. Das ist richtig. Es könnte wirtschaftliche Schwierigkeiten geben und Anlaufschwierigkeiten und man sollte es nicht als Haupterwerbsjob sehen. Aber ich würde jungen Kollegen nicht raten, es nicht zu machen und ich würde auch den älteren
01:26:19
Speaker
sagen wir mal, im Erwachsenenalter arbeitenden Menschen in der Sprecherei nicht empfehlen, den Job komplett hinzuschmeißen. Ich würde Ihnen aber sagen, stellt euch entweder breit auf, falls ihr es noch nicht seid, und falls ihr es schon seid, sucht euch eine Option für den Fall.
01:26:35
Speaker
dass das mit der Sprecherei in den nächsten zehn Jahren nach unten geht. Wie gesagt, das sind ja meistens Wellenbewegungen. Es kann auch wieder nach oben gehen, kann halt 15 bis 20 Jahre brauchen. Und wenn ihr nicht die Luft habt oder gerade irgendwie ein Eigenheim abfinanzieren müsst, oder, oder, oder, dann ist es vielleicht irgendwie doof, wenn ihr ausschließlich darauf angewiesen seid. Also ich würde mir immer eine Zweitoption
01:26:57
Speaker
wünschen für Erwachsene. Und für die Youngsters würde ich sagen, ja, macht das und verfolgt das, aber ihr solltet vielleicht auch noch ein zweites Netz haben. Aber bei den Youngsters bin ich da inzwischen wirklich guter Dinge, weil die stehen ja sowieso irgendwie auf zehn Beinen gleichzeitig, die machen ja alles Mögliche. Deswegen bin ich da guter Dinge, also man sollte ihn nicht grundsätzlich abraten, so mache ich es zumindest. Ich rate Ihnen immer, hört auf euer Herz, wenn Sprache euer Dinge ist, macht's.
01:27:26
Speaker
Seid euch bewusst, dass das eventuell auch nicht so lukrativ sein kann oder aber in 15 Jahren richtig lukrativ wird, weil ihr dann zu einer Gruppe gehört, die hochbegehrt sind und die Gruppe an sich ist dann sehr klein und vielleicht auch noch inhomogen, weil da sind dann gute und schlechte mit dabei und so, da kristallisieren sich dann die Guten wieder raus. Aber ich würde auf keinen Fall den Leuten sagen, macht es nicht. Das würde ich nicht
Sprache als gesellschaftliches Fundament und Zukunftshoffnungen
01:27:51
Speaker
Ja, ich mag deinen Optimismus. Ich bin da grundsätzlich eigentlich auch so. Ich bin auch ein hoffnungsvoller, manchmal naiver Optimist und ich finde auch, bin mir sicher, dass das Pendel wieder in die andere Richtung ausschlagen wird. Allein aus diesem evolutionsbiologischen Grund, dass Sprache, Kommunikation einer der Gründe ist, weshalb wir überhaupt hier sind und wir uns über
01:28:15
Speaker
hunderte, tausend Kilometer irgendwie unterhalten können und weil wir, dass wir so viel hingekriegt haben, dass sich nicht alle sofort die Köppe einhauen, wenn sie sich begegnen und eine Meinungsverschiedenheit haben. Das haben wir nur der Sprache und der Kommunikation zu verdanken und der Fähigkeit, etwas zu behirnen, zu reflektieren und sich dann dazu zu verhalten. Und ich kann mir gut vorstellen, dass das im gesellschaftlichen Stellenwert
01:28:42
Speaker
wenn dieser KI-Hype mal ein bisschen wieder runtergekocht ist, eine sehr hohe Priorisierung bekommen wird und einen sehr hohen gesellschaftlichen Status. Ich finde, das ist ein schönes Schlussgefühl. Ich würde dir gerne zum Abschluss noch eine zweiteilige Frage stellen,
01:29:07
Speaker
Immer wieder gerne Stelle. Und das ist einerseits eben, wenn du einen Wunsch frei hättest für unsere Branche, was würdest du dir wünschen für die Zukunft? Und zweitens, was würdest du deinem 20-jährigen Ich sagen, wenn du ihm heute begegnen würdest und ihm einen Ratschlag geben könntest?
01:29:29
Speaker
Also, den zweiten Teil kann ich sofort beantworten, mach alles genauso nochmal. Ich habe jetzt in der ganzen beruflichen Welt eigentlich nichts falsch gemacht, ich glaube auch in meinem normalen Leben, also auch im nicht beruflichen Leben, nichts so gemacht, dass ich sagen würde, oh Gott, oh Gott, auf keinen Fall wiederholen, sondern ich würde einfach sagen, mach's genauso. Ich bin, glaube ich, durch mein Leben genauso gelaufen, wie ich es so richtig halte und würde jetzt meinem 20-jährigen ich sagen, mach's genauso.
01:29:55
Speaker
Auch wenn es jetzt KI gäbe. Und als ich mit 20 jetzt vor dem Problem stünde, würde ich sagen, ist mir egal. Ich glaube, vor 20, 30, 40 Jahren haben mir Leute auch schon gesagt, oh, du fängst im Privatfunk an, das ist doch der Untergang des Radios. Und irgendwelche Leute haben dann gesagt, jetzt kommt die CD und das ist der Untergang des Radios und jetzt kommt das MP3, das ist der Untergang des Radios. So what? Wir sitzen immer noch da und hören Radio und es sind immer noch Menschen, die mit Stimme arbeiten. Also ich würde den zweiten Teil deiner Frage so beantworten mit, nichts ändern, mach es einfach genau so noch.
01:30:23
Speaker
Der erste Teil, was ich mir für die Sprecherbranche wünsche, das ist natürlich ein bisschen komplizierter, die Antwort.
01:30:33
Speaker
Ich glaube, ein bisschen umfänglicher, ich möchte jetzt noch mal eine ganze Stunde reden, ich fasse das mal so im Geiste zusammen. Ich möchte, dass die Branche weiter bestehen bleibt und zwar unabhängig davon, ob es KI gibt oder nicht, dass wir die, die das jetzt auch schon praktizieren, auch die KI ignorierend genauso mit unserem Talent weitermachen, vielleicht ein bisschen schlauer werden im Umgang, welche Informationen stelle ich wo online.
01:30:58
Speaker
Aber dass die Branche an sich generell überlebt, dass es genügend Menschen gibt, die das auch wertschätzen. Also es muss ja immer einen geben, der das auch empfängt, was wir da so vortragen. Wie auch immer als Zuhörer, als Käufer von Podcasts, als Abonnent von irgendwelchen Streamingdiensten, was auch immer. Also dass die Branche weiter existiert und dass auch die Konsumenten weiter existieren und die auch wertschätzen, welche Arbeit geleistet wird und dass das natürlich auch einen Wert hat, dass man das auch bezahlen muss. Vor allem die Kreativ- und Werbebranche.
01:31:28
Speaker
sollte das zum Beispiel auch akzeptieren, dass nicht alles von einer KI generiert werden kann und dass die Branche an sich sich nicht so einnässt, wie ich das manchmal erlebe, dass man sich denkt, oh Gott, jetzt macht euch mal nicht so
01:31:44
Speaker
Ich bin ja grundsätzlich ein optimistischer Mensch, bin immer mit Optimismus durchs Leben gegangen. Ich habe auch immer gewarnt, wenn ich das für richtig geachtet habe, gerade in der Verbandsarbeit. Aber grundsätzlich wünsche ich der Branche, dass sie noch groß und lange lebt. Ich bin sogar ziemlich fest davon überzeugt, dass das so passieren wird. Das war jetzt sehr zusammengefasst, was ich sonst in einer Stunde erzählen würde.
01:32:11
Speaker
Ja, macht ja nix.
Abschluss und Ausblick auf zukünftige Interaktionen
01:32:13
Speaker
Naja, aber es muss ja auch nicht das letzte Mal gewesen sein, dass wir miteinander reden, Umut. Danke dir auf jeden Fall. Ich fand's sehr angenehm, sehr spannend, hab mir meinen Horizont wieder ein bisschen erweitert und ich hoffe, wie gesagt, wir sehen uns privater sowieso oder hören uns immer mal wieder und gerne auch, wenn du Lust hast, bei einer der nächsten Folgen.
01:32:34
Speaker
Vielen Dank, dass ich dabei sein durfte. Vielen Dank für die Einladung. Vielen Dank für die Zeit, die du geopfert hast. Und sehr gerne auch in persönlich bei einer Melange. Ja, unbedingt. Dann machen wir mit allen Sinnen. Alles klar. Danke auch an euch, dass ihr dran geblieben seid. In zwei Wochen geht es weiter mit der nächsten Folge Mike Rider Dieb Talk. Bis bald.