Become a Creator today!Start creating today - Share your story with the world!
Start for free
00:00:00
00:00:01
Duplicate Content und Kannibalisierung image

Duplicate Content und Kannibalisierung

E60 · Podcast für gute Websites
Avatar
184 Plays2 months ago

Was ist Duplicate Content? Was unterscheidet ihn von Kannibalisierung? Wann hab ich eigentlich ein Problem? Und mit welchen Mitteln kann ich es lösen? Wann sind eher die Tech-SEOs gefragt und wann sollten die redaktionellen Leute ein Wörtchen mitsprechen? Das besprechen André und Jolle in dieser Folge.

Wir hören uns gleich im Podcast! Schick uns deine Fragen und Anregungen gerne an [email protected].

Recommended
Transcript

Einleitung und Begrüßung

00:00:00
Speaker
In dieser Episode reden Joel und ich über Duplicate Content und Karnivalisierung. Viel Spaß dabei!
00:00:23
Speaker
Einen schönen guten Morgen, Mittag, Abend, wann auch immer du diese Episode vom Podcast für gute Websites eingeschaltet hast. Jolla und ich heißen dich herzlich willkommen.

Was ist Duplicate Content?

00:00:32
Speaker
Und wir haben heute mal wieder einen Gast, einen ungebetenen Gast und der heißt Duplicate Content.
00:00:41
Speaker
Hallöchen, ihr beiden. Hallo Andre, hallo. Nein, das wäre ja kein DC, das wäre ja quasi einfach nur ein Duplikat meiner Person. Ja, jetzt habe ich es ja schon gesagt, worüber wir heute mal sprechen möchten oder sollten, Jolle, weil auch dich ist bestimmt öfter schon im Alltag du von diesem ungebetenen Gast beglückt wurdest.
00:01:10
Speaker
Hast du so einen Case, wo du sagst, der dir so spontan einfällt, man, das war echt, das war mal ein krasses DC-Ding? Puh, so ein Projekt, wo ich jetzt wirklich sage, da war der Hase so richtig im Pfeffer begraben, fällt mir nicht direkt ein. Ich hab eher das Gefühl, das ist eigentlich auf jeder Domain, wo man so ein bisschen mal unter den Teppich guckt und den so ein bisschen angelupft, hat man solche Themen gerne.
00:01:39
Speaker
Vielleicht fällt mir auch noch ein größeres Projekt ein. Aktuell ist es so, Recency Bias treibt mich dazu, das Thema jetzt auch mit Blick auf den Indexierungsprozess von Google bei Canonicals und bei Haare-Flanken-Anwendungen mit zu berücksichtigen. Aber ich glaube,
00:01:58
Speaker
Wir fächern schon hart auf, lass doch einmal ein bisschen definieren, was wir darunter verstehen, was wir darunter nicht verstehen.

Herausforderungen und historische Kontexte von Duplicate Content

00:02:05
Speaker
Also zu Duplicate Content finde ich die Abgrenzung zu Kannibalisierung auch immer hochgradig spannend. Steigt doch da mal ein.
00:02:14
Speaker
Er ist natürlich noch schwieriger zu messen als DC ist in den 90ern, wollte ich gerade schon sagen. Lange Zeit gab es ja mal so, als man noch Textbinding gemacht hat und dann am Ende war die Einzigartigkeit des Text... Ja?
00:02:30
Speaker
Jolle guckt mich gerade ganz fragend an, was ich mit Tagspinning meine, oder? Nein, ich sage nur, was? So was hast du gemacht? Ich wollte nur vorausvoll schauen. Ich habe das natürlich nicht gemacht, jedenfalls nicht bei Kundenprojekten.
00:02:45
Speaker
Aber ich habe natürlich damit experimentiert, um zu schauen, was da so geht. Und der ein oder andere oder die eine oder andere wird es sich erinnern, beim Text spinning, da hat man quasi so Synonyme für das gleiche Wort und dann hat man quasi aus einem Satz fünf Varianten gemacht. Und da gab es dann früher Tools, die haben dir dann so die Einzigartigkeit des Satzes quasi dir gesagt, aber auch nur in Form der
00:03:16
Speaker
der Wörter und nicht der Inhaltlichkeit. Und das ist ja genau das Ding, was du auch mit Kannibalisierung meintest. Wenn du dich halt zu sehr im Text ähnelst, dann ist es natürlich auch für Google schwer, irgendwann zu erkennen, welches deiner Dokumente eigentlich gefunden werden soll zu dem Begriff. Und dann hat man gerne mal in der GSC so Bäumchen wechsel- dich-Klamotten, dass mal die eine URL dazu rankt, dann geht die eine wieder runter, dann geht die andere wieder hoch.
00:03:41
Speaker
Das ist dann meistens ein guter Indikator für inhaltliche Kannibalisierung und muss nicht zwingend Duplicate Content sein, aber oftmals eben ein nicht wirklich optimaler Inhalt. Also ein nicht klar definierter Inhalt, worum geht's.

Unterschiede zwischen Duplicate Content und Content-Kannibalisierung

00:04:00
Speaker
Das stimmt. Aber ich glaube, Duplicate Content so im allerschärfsten Sinne ist ja tatsächlich, wenn du wirklich die identische Seite unter unterschiedlichen URLs ausspielst. Also eine Zeit lang, das gibt es ja heute fast gar nicht mehr, aber HTTP und HTTPS.
00:04:19
Speaker
Aber ansonsten ist der Rest vom Pfad gleich. An der Seite ändert sich quasi die Sicherheit, aber inhaltlich nichts. Selbe mit trailing slash, also dem Schrägstrich am Ende der URL. Ja, nein, also ist der Content über beides abrufbar. Für den User ist das schwer zu erkennen, dass da überhaupt irgendwas Doppeltes stattgefunden hat. Das sieht man ja meistens nicht, wenn man nicht darauf achtet, denkt man einfach so, aha, ja, ich bin ja hier auf der Seite sowieso.
00:04:45
Speaker
Genau, das wäre so ein klassischer Fall von wirklich der identische Content ist einfach über unterschiedlichste URLs abrufbar. Manchmal hast du auch einfach im CMS kurbische Settings, dass das vielleicht über einen anderen Host oder sogar irgendwie noch so verwandte Schwester, Satelliten, Seiten irgendwie alles auch rausgepusht wird. Das gibt es selten nach. Aber das wäre so die richtig harte Dublette, würde ich mal sagen. Und bei Kannibalisierung sind wir dann in dem Bereich, dass es da einfach
00:05:12
Speaker
zwischen unterschiedlichen Dokumenten an Trennschärfe fehlt, sodass die für ähnliche Inhalte, Keywords jetzt mal so genannt, ranken. Da hast du ja auch so davon gesprochen, mal rank die eine URL, mal die andere. Oder in der Search Console kann ich sehen, die eine ist zwar viel weiter hinten als die andere, aber beide ranken eigentlich zu ähnlichen Keywords. Das ist ja so grob umrissen mal das Ding, das Problem aus meiner Sicht.
00:05:42
Speaker
Richtig. Und DC ist in meinen Augen auch eher ein Problem der Suchmaschine als für den User, weil der kriegt es oftmals gar nicht mit, weil er hat ja irgendeinen Weg gewählt, wie er auf die Seite gekommen ist, auf die er gerade gesurft hat, ist, wie auch immer. Und für den ist in dem Moment ja die Seite. Ob da jetzt ein Trading Slash ist am Ende oder Pong oder ob das auch ein HTTP oder HTTPS ist, ist im Grunde dann auch egal.
00:06:09
Speaker
Es ist eher ein technisches Thema, was halt für die Suchmaschinen nicht wirklich sexy ist.

Strategien zur Vermeidung von Duplicate Content

00:06:16
Speaker
Und das ist oftmals, ich würde sagen, sogar zu 80% oder 90% ein selbst auferlegtes Leid. Weil entweder es konnte ein Managementsystem das nicht hergibt, das sauber zu machen, oder aber ja, so in der strategischen Planung
00:06:39
Speaker
nicht so ganz klar ist, wie man zum Beispiel Content für unterschiedliche Zielgruppen, also ich habe ein Produkt, aber ich habe vielleicht zwei unterschiedliche Zielgruppen, wie man für diese Zielgruppen Landing Pages einer Seite oder eines Produktes anlegt, damit sie auch wirklich eine inhaltliche Unterscheidung haben. Und das, glaube ich, ist eher das Problem bei den meisten Seiten jedenfalls, die ich so gesehen habe. Technisches oder
00:07:08
Speaker
inhaltlich nicht klar wirkliches, uniges Dokument. Da fällt mir jetzt, jetzt wo wir drüber sprechen, doch direkt doch nochmal so ein richtiges Projekt ein. Ich nenne natürlich keine Namen, aber Hersteller verkauft B2B und B2C und hat dafür unterschiedliche, also gibt es nicht nur ein Projekt, ist uns schon mehrfach begegnet, hat einfach unterschiedliche Domains, um diese Zielgruppen differenziert anzusprechen.
00:07:36
Speaker
Produkte sind aber ähnlich oder zumindest nur die Kategorie Seiten, also welchen Zweck man jetzt mit dem einzelnen Tool dann irgendwie erschlägt im Shop, das ist dann doch schon irgendwie sehr ähnlich und da wird es dann natürlich interessant, wenn man irgendwie
00:07:53
Speaker
Auf zwei Domains eigentlich. Die Unterstellung ist ja, und dann hätten wir kein Problem, dass diese Zielgruppen total unterschiedlich suchen, anderen Intent haben und deswegen auch einfach andere Produkte suchen, die im Handling irgendwie unterschiedlich sind.
00:08:10
Speaker
Und wir haben aber extreme Schwierigkeiten in den Themen und Recherchen, diese Unterschiede, diese suggerierten, tatsächlich irgendwie datenbasiert aufzuzeigen und klar zuzuordnen, hier links um rechts rum, das ist ja ganz klar, hier ist die Trennlinie und alles, was links davon ist, gehört ja auf diese Domain und alles, was rechts davon ist, gehört ja auf die andere Domain. Krasse Schnittmengen. Genau, also jetzt ist mir doch noch so ein Projekt eingefallen oder mehrere eigentlich.
00:08:36
Speaker
Ich glaube auch, um es vielleicht ein bisschen beispielhaft darzustellen, wer sich ein bisschen mit Fotografie auskennt, der wird vielleicht wissen, dass es unterschiedliche Fotografen-Typen gibt, also zum Beispiel Tier-Fotografen, Wildlife-Fotografen, Portrait-Fotografen etc. Und was verbindet diese beiden?
00:08:59
Speaker
Meistens sehr lange Brennweiten bei den Objektiven, aber natürlich ganz unterschiedliche Kerndetails, die für die jeweiligen Fotografen-Typen
00:09:13
Speaker
relevant sind. Das heißt, wenn ich dieses als Kamerahersteller vielleicht dieses Objektiv habe und ich will dafür eine Landing-Page anlegen, dann ist der Kontext tatsächlich sehr relevant für das Produkt. Wenn ich jetzt sage, ich mache eine Landing-Page für dieses Objektiv, einmal für White-Life und einmal für Portrait-Fotografen, dann kann ich schon in DC reinlaufen, wenn ich nicht wirklich
00:09:41
Speaker
wirklich eine Unterscheidung habe. Und jetzt oft wird dann meistens ja nur die Bildwelt irgendwie ausgetauscht. Das wäre jetzt ein typischer Fall von DC, wenn ich es nicht richtig gut mache. Auf der anderen Seite, wenn man es richtig gut macht, hat man da aber auch enorme Chancen, eben mit diesem einen Produkt zu unterschiedlichen Suchverhalten auch gefunden zu werden.
00:10:06
Speaker
Das stimmt, das ist ja die Gier danach. Wir können eigentlich mit einem identischen Produktportfolio unterschiedliche Zielgruppen ansprechen und haben in Summe dann einfach mehr Abverkäufe, als wenn wir sagen, wir sind hier der Bauchladen für alle und wer halt eine Kamera will, der soll halt kommen.
00:10:23
Speaker
Ich weiß nicht, ob das vielleicht vor zehn Jahren noch besser funktioniert hat. Das ist mein Eindruck, dass es nicht mehr so gut klappt, weil diese Unterschiede so verschwimmen. Aber ich lasse mich gerne vom Gegenteil überzeugen, denn ich habe ja einfach nur eine Handvoll ausgewählter
00:10:40
Speaker
Projekte, wo ich das wirklich verfolge und mir ist es so noch nicht so begegnet, dass es mir so, also die Erfolgsbeispiele, also es gibt immer mal wieder welche, wo ich mich frage, krass, dass das funktioniert, also was ist ich, Media Saturn oder sowas, Mediamarkt, die haben ja echt identische Shops irgendwie, so ein bisschen versuchen die zu trennen, aber da wundere ich mich sehr, wie hart das funktioniert, das ist vielleicht so ein Beispiel.

Erfolgsgeschichten im Umgang mit Duplicate Content

00:11:04
Speaker
Die schaffen es ja dann wirklich so eine Art Serb-Domination, also tatsächlich in den Suchergebnissen mit unterschiedlichen Domains den Wettbewerb außen vor zu halten. Das ist natürlich irgendwie das, wo alle heiß drauf sind. Ich sehe mich aber sehr gehemmt, das Kunden zu empfehlen. Die Marktmacht muss man erstmal aufbringen und die Ressourcen.
00:11:23
Speaker
um so eine Brand aufzubauen oder zwei dann gleich, um das so zu bespaßen, Backlinks zu bekommen oder so, da lasse ich eher die Finger davon. Aber das wäre zum Beispiel ein Beispiel für hat geklappt und ich frage mich immer, wie lange funktioniert das noch? Vielleicht bin ich auch zu skeptisch und die machen einfach sechs Jahre lang weiterhin Abverkäufe. Wenn ich ihnen jetzt davon abgeraten hätte, wären sie schlecht beraten gewesen.
00:11:46
Speaker
Ich glaube, das Beispiel, das du jetzt gebracht hast, ist natürlich auch wieder nochmal etwas anderes, als wenn ich jetzt Hersteller wäre. Wenn ich jetzt so transaktionsgebundene Serbs bekomme, wo primär Shops auch ranken, da ist, glaube ich, bei fast allen zu einem sehr hohen Anteil DC vorhanden, weil die oftmals auch nur die Hersteller-Inhalte
00:12:11
Speaker
nehmen und nicht wirklich überarbeiten. Also einfach schon aufgrund der riesigen Produktmenge, die ein Media Markt wahrscheinlich jeden Monat kriegt an neuen Produkten, da würden die ja gar nicht hinterherkommen. Und ich glaube, dass da in dem Beispiel, was du gerade gesagt hast,
00:12:27
Speaker
nach wie vor die die die Brands einfach das A und O sind. Also wenn ich jetzt meinen meinen Wald und Wiesn Shop nehmen würde und dann einfach mal was ich die GoPro schlag mich tot einstellen würde, dann würde ich da eben nicht mit dem gleichen Content zu ranken, so dünn der auch sein mag. Das hatten wir ja vor ein paar Episoden mal, was man dann vielleicht für Möglichkeiten hätte, wenn man einen ganz anderen Intent bedienen würde. Nichtsdestotrotz
00:12:52
Speaker
ist das natürlich auch immer so ein Ding in der Beratung, dass natürlich, wenn es dann so um DC geht, gerne mal von der Seite, die sich vermeintlich verteidigen müsste, solche Beispiele dann eben halt gebracht werden. Mit dem Motto, Amazon, die ranken auch mit der Zoo-Ergebnisseite und dann gehst du drauf und es ist fast nichts wirklich Gutes drauf. Oder eben der Media Markt und Saturn sind fast gleich.
00:13:21
Speaker
Es ist halt immer, sich mit denen zu vergleichen, wenn es um die Beurteilung von DC geht, finde ich, ist sehr, sehr schwer. Ich hatte vor einiger Zeit mal eine Anfrage bekommen, wo es auch um DC geht, da vermeintlich würde die Webseite gar keinen DC haben. Und man wunderte sich, dass eben keine Seite wirklich gerankt hat. Aber sie haben dann immer nur so Variablen im Text ausgetauscht. Und angeblich wäre der aber unique gewesen. Spinning.
00:13:49
Speaker
Das war noch nicht mal Spinning, weil die nicht mal die Sätze umgebaut haben, sondern die haben einfach nur, weiß ich nicht, stell dir vor, irgendwie der Kopfhörer, Kopfhörer ist die Variable für den Produktnamen Sony Schlagmichtod KRX35, ist besonders gut, um Podcasts zu hören. Und der andere Kopfhörer von Kenwood, da wurde eben nur dieser
00:14:18
Speaker
die Modellbezeichnung da eben ausgetauscht. Der war auch besonders gut, um Podcasts zu hören? Natürlich war der auch gut, um Podcasts zu hören. Das stand dann auch im Text. Krass. Ja, ja, das stand dann auch im Text. Und was ich gerne immer genommen habe, und jetzt komme ich nicht auf den Namen, wie das immer so ist in dem Moment, wenn ich was erzählen möchte, irgendwas mit Zeit.
00:14:45
Speaker
ein Tool, wo man DC sichtbar machen konnte. Das war ziemlich cool. Du hast dann quasi die Domain rescannt, so ähnlich wie man das im Screaming Frog kennt. Und der hat dir dann nicht nur die Anzahl der Duplikate angezeigt, wie häufig sich gewisse Elemente auf der ganzen Website
00:15:07
Speaker
wiederholen, sondern auch von welchen Seiten zu welchen Seiten.

Technische Lösungen zur Verwaltung von Duplicate Content

00:15:11
Speaker
Und dann hast du es wirklich visuell aufbereitet bekommen und konntest das perfekt zeigen und ratzhaft war Ruhe. Und das kommt auf jeden Fall in die Show Notes rein. Wie gesagt, mir fällt es jetzt gerade vom Namen her nicht ein. Reichen wir nach.
00:15:27
Speaker
ganz furchtbar aus in der UI, aber das ist ein sagenhaft tolles Tool, wenn es darum geht, mal sich selbst zu visualisieren. Wo haben wir eigentlich Duplicate-Content und wo sollten wir vielleicht mal ran? Pack ich auf jeden Fall in die Shorts mit rein.
00:15:44
Speaker
Wir haben ja jetzt auch viele Beispiele gebracht, wo es so zwischen unterschiedlichen Domains darum geht. Vielleicht sprechen wir ja in ein paar Wochen auch noch mit meiner Kollegin Saskia, die zu Information Gain spricht. Da geht es ja auch darum, dass man nicht alles einfach wiederholt, sondern irgendwas Neues beiträgt. Aber lasst uns doch noch mal ein bisschen zu diesem klassischeren Fall ähnliche Inhalte
00:16:08
Speaker
auf einer Domain sprechen. Also wir haben jetzt noch gar nicht über das Canonical gesprochen. Das ist ja eigentlich das Werkzeug, wie du solche Sachen, wenn du bestimmte Gründe dafür hast, dass du eben unterschiedliche Seiten brauchst, zum Beispiel weil du für PAID eine andere Landingpage gestalten möchtest, als du für SEO haben möchtest oder nochmal für ein Newsletter oder irgendwie.
00:16:31
Speaker
Was weiß ich, mit irgendwelchen Parametern, Filtern oder so. Also, dass du aus Gründen, die ganz verschieden sein können, wirklich gute Gründe hast, mehrere Seiten zu einem Thema zu behalten. Also, wo dann die Lösung eben nicht ist, konsolidier das halt, lösche einen, migrier das zusammen und redirecte dann die Überflüssigen. So, also für diesen Case haben wir ja das Canonical, um einfach dann nochmal zu sagen, ja, das ist hier so der falsche Zwilling.
00:16:58
Speaker
Aber bitte, wenn es um Rankings geht, in den Index soll nur das eine Original, also die sogenannte kanonische Version. Das ist ja schon ein ziemlich starkes Tool, was uns Website-Betreibende also an die Hand gegeben wird, ist ja aber zum Beispiel von Google auch, also sie berücksichtigen es eigentlich schon okay, aber es ist kein, sie müssen nicht. Sie können sich, das sieht man ja gerne in der Search Console auch häufiger,
00:17:27
Speaker
Wenn Google uns dann mitteilt, wir haben uns für ein anderes Kanonikel entschieden, also nicht das, was du irgendwie in die Seite reingeschrieben hast. Was kannst du dafür Gründe geben, warum sowas passiert? Dass Google sich dafür entscheidet? Für eine andere. Für eine andere kanonische URL. Warum sie sich dafür entscheidet?
00:17:52
Speaker
Ja, kleine Prüfungssituationen. Ich wollte ja gar nicht so die Pistole auf die Brust setzen. Du hast aber jetzt, ich hätte jetzt gesagt, du musstest mal Martin Splitt fragen. Warum Sie das machen? Ehrlich gesagt, warum Sie das machen? Wenn ich, also mal angenommen, bei mir im Code steht alles richtig.
00:18:15
Speaker
Dann könnte ich dir ehrlich gesagt nicht so pauschal sagen. Also nicht mal nicht pauschal. Ich kann mir nicht mal ein Beispiel überlegen, wo das nicht passiert wird. Also wenn es richtig implementiert ist. Du hast ja nur so wahnsinnig gut gepflegte Seiten. Das kann vielleicht sein. Das kann sein. Also sagen wir mal, die Definition von ist im Code richtig gepflegt, kann jetzt variieren. Also klassisch jetzt das Canonical ist korrekt implementiert.
00:18:38
Speaker
Da kann es immer noch passieren, aber die Lösung ist eigentlich relativ einfach. Wir sprechen Shizuit nicht immer die gleiche Sprache. Das heißt, vielleicht setzt unsere interne Verlinkung massiv links auf die Seite, die harmonisiert ist. Das heißt, wir sprechen einfach nicht dieselbe Sprache.
00:18:57
Speaker
Muss ich nicht entschuldigen. Aber das ist ja so ein klassischer Fall. Also ich sage zwar, die Seite hier soll nicht ranken, sondern die andere, zeige dann aber, was weiß ich aus meinen Blogposts mit den Textlinks und dem schönen Ankertext massiv oder am besten auch aus der Navigation oder so, zeige aber immer wieder auf die, in Anführungszeichen, falsche Variante und wundere mich dann, dass Google sich in der Search Console dazu entschlossen hat.
00:19:20
Speaker
Na du, wenn du hier die ganzen Links zeigen zeigst, dann akzeptiere ich das halt auch als Signal. Oder auch in den Zeitmaps, das ist ein anderer Fall.
00:19:30
Speaker
BKs habe ich jetzt tatsächlich nicht in meinen Gedanken gerade dumm gehabt, weil du mir diese Frage, inklusive der Pistole, gestellt hast. Du hast zu gut geprägte Websites, André. Nein, tatsächlich ist es so, dass wir genau diesen Fall bei dem Projekt, dass wir in der Episode neulich über Erwachseneinhalte gesprochen haben. Da haben wir nämlich genau das. Vielleicht könnt ihr euch das kurz vorstellen. Ihr habt eine Produktseite, dort sind Darsteller gelistet oder
00:20:00
Speaker
Schauspielerinnen, die in diesem Film mitspielen und wenn man dann quasi ein Button, wo man sich alle Filme mit Schauspieler XY und dann klickt man da drauf und wo landet man meistens auf einer facetierten Suche, auf die man verweist. Und da sind natürlich Parameter drauf oder in diesen Links sind natürlich Parameter enthalten, damit eben auch die Suche weiß,
00:20:25
Speaker
zu welchem Darsteller sie nur Filme anzeigen soll. Und das ist so ein Paradebeispiel von internen Links, die man setzt auf eine Seite, die eigentlich per Canonical auf die Filmübersicht quasi, also auf die nicht gefilterte Seite verweist. Und dann hat man nämlich diese
00:20:42
Speaker
Den Fall, den du gerade beschrieben hast, du hast in der GSC eben unendlich viele von solchen Einträgen, das quasi auf eine andere kanonische URL verwirren wurde. Wie kann man das lösen?
00:20:56
Speaker
Entweder ignorieren, was irgendwann aber auch schwierig wird. Wenn man weiß, dass man es eigentlich richtig macht und wenn man weiß, dass eigentlich 90 oder 95 Prozent der Links, die dann in diesem Fehlerbericht in Anführungszeichen angezeigt werden, eben genau diesen Case beinhalten, dann ist ja auch gut, wenn man weiß, dass das so ist.
00:21:18
Speaker
Ich finde es immer ein bisschen dreckig, weil ich mag keine Reports, die einen irritieren, vor allem wenn man weiß, dass das Fass bei 1000 URLs vollgelaufen ist. Nichtsdestotrotz könnte man eben zwei Sachen machen.

Entscheidungen zur Indexierung von Inhalten

00:21:33
Speaker
Zum einen könnte man das nicht als Link setzen, sondern vielleicht, ich sage jetzt mal, früher hat man, wie hieß es noch?
00:21:44
Speaker
Genau, mit sowas gearbeitet. Oder aber, das könnte man natürlich auch machen, dass man Parameter von Crawling über die Robots TXT ausschließt.
00:21:56
Speaker
Das ist eine Idee. Mir fallen dazu noch zwei andere Sachen ein. Also Linkmaskierung muss man sich natürlich nochmal anschauen, dass man es möglichst barrierefrei hinbekommt. Ist ja nicht ganz gleichwertig für die User dann, wie man das benutzen kann. Was wichtig für 2025, da hatten wir ja Sandra schon einmal im Gespräch. Das andere ist, vielleicht muss man es gar nicht lösen, vielleicht ist ja die Tatsache, dass ich dort so gezielt hinlinken möchte, eher eine Indiz dafür, dass ich die Seite auch indexieren möchte.
00:22:24
Speaker
Also vielleicht möchte ich ja eine Landingpage für Filme von dieser Schauspielerin, Darstellerin haben. Und das ist vielleicht sogar etwas für eine Seite, die auch in der Suche gefunden werden sollte. Also wenn ich schon intern Links draufsetze, kann das einfach ein Indikator dafür sein, dass das eine wichtige Seite ist. Und dann sollte die vielleicht gar nicht parametrisiert, nicht indexierbar sein. Also mal von der anderen Seite rangehen.
00:22:50
Speaker
Das mag sein. Aber auch hier werden wir dann schon wieder sehr schnell bei ... Ihr merkt schon, deswegen fällt das Thema auch so spannend, zu besprechen. Das, was Jonne gerade gesagt hat, oder du gerade gesagt hast, finde ich durchaus richtig. Wenn du jetzt aber bedenkst, dass auch hier eine inhaltliche Kannibalisierung stattfinden würde, weil man natürlich eine Übersichtsseite hat zu der Schauspielerin an der Stelle. Die haben wir ja.
00:23:19
Speaker
Aber die List gibt ja eben auch noch andere Informationen, die rund um die Schauspielerin sich drehen und eben nicht nur die Filme oder Szenen von dieser Schauspielerin abbildet. Dann ist das nicht die richtige Landing-Page dazu. Jetzt mal so gesehen. Vor allem nicht, wenn wir eigentlich eine Suche haben, wo man richtig gute Filter setzen kann. Aber das ist eben genau der Punkt. Würden wir jetzt das mit einer statischen URL aufsetzen, hätten wir definitiv eine inhaltliche Kannibalisierung.
00:23:52
Speaker
Und noch eine Menge DC, weil du in unserem Fall über 20.000 Schauspieler, 20.000 neue URLs hättest, die ja eigentlich auch noch irgendwie Content bekommen müssten, wenn sie sich nicht zu 95 oder 98 Prozent ähneln sollten.
00:24:12
Speaker
Ja, dann ist die Entscheidung wahrscheinlich doch eher pro nicht indexieren. Ich wollte es nur als Idee mal aufnehmen. Das ist garantiert nicht immer die richtige Lösung. Und bei dieser Heavy Handle Landing Page habe ich auch noch mal überlegt, dass man natürlich mit Jumplings auch nochmal auf spezifische Bereiche in einer Seite, die dann vielleicht etwas gezielter ansteuert. Aber wenn so ein
00:24:35
Speaker
Majestro wie der Herr Goldman an so einer Seitenarchitektur arbeitet, dann wird das wahrscheinlich seinen Sinn haben, dass die so verlinkt sind und trotzdem nicht indexierbar. Das ist ja einfach nur ein Beispiel davon, dass es gute Gründe geben kann, aber man sich das überlegen muss.
00:24:53
Speaker
Richtig, richtig. Also da muss man sich schon wirklich ein bisschen mehr Gedanken zu machen, wie man das am besten saft. Aber ich finde den Ansatz eigentlich sehr gut, den du da gerade skizziert hast. Wie kann man rauskriegen, ob da großes Interesse ist, wenn vor allem auch vielleicht nicht wirklich
00:25:10
Speaker
über irgendwelche Tools ersichtlich Suchtraffic da ist, weil vielleicht das zu longtailig ist in eurem Fall, dass man einfach mal ein Event-Tracking draufsetzt über Google Analytics oder ein anderes Analysetool, um einfach mal zu gucken, ob diese Buttons oder was auch immer ihr da habt für Clickflächen, ob die überhaupt genutzt werden. Und wenn die halt viel genutzt werden, dann scheint da wohl durchaus ein Bedarf zu sein.
00:25:34
Speaker
Das stimmt, mir fällt noch mal ein, DC oder Kannibalisierung ist ja häufig auch ein Thema, was irgendwie redaktionell gelöst werden muss.

Redaktionelle und technische Aspekte der Content-Differenzierung

00:25:44
Speaker
Also wo so die Tech-Asios schnell an ihre Grenzen kommen, die räumen bei DC ordentlich auf, sagen, okay, hier Parameter nicht indexieren, kann auch nicht gesetzen, die URLs anständig aus dem System laufen lassen, sodass wir halt, was weiß ich, den Trailing Slash nicht haben oder 301 aufhaben und so. Dann ist das technisch erledigt.
00:26:00
Speaker
Aber sobald man irgendwie Content in Form von Text auf den Seiten hat und so die schreibende Zunft daran mitwirkt, dann hat man häufig, wenn man jetzt halt einfach auch Experte, Expertin zu einem bestimmten Themenkreis ist, und das will man ja auch, das wird ja auch von Google honoriert, wenn man sich sozusagen nicht mal über dieses und mal über jenes unterhält, sondern tatsächlich einen Fokus, also Themen, Schwergebiet irgendwie so hat,
00:26:27
Speaker
Dann kommt es ja automatisch dazu, dass spätestens im Shorthead, also bei den Focus-Keywords nenne ich es jetzt mal, eigentlich mit jedem longtailigeren Stück, du dazu halt auch rankst. Und da würde ich dann sagen, das ist eigentlich in der Regel kein Problem. Das ist klar, dass man immer so ein bisschen Beifang hat. Man rankt ja häufig zu Keywords, die man jetzt gar nicht so primär
00:26:51
Speaker
im Auge hatte, einfach weil man unterschiedliche Wörter aneinanderketten muss, um sinnvolle Texte zu schreiben. Das passiert automatisch. Und wenn man da auf einem Themengebiet unterwegs ist, erst recht. Aber trotzdem gibt es ja einfach so den Punkt, wo man irgendwann mal entscheiden muss.
00:27:06
Speaker
Diese Seiten müssen wir weiter voneinander differenzieren. Die sind sich zu ähnlich. Also die hatten vielleicht mal grundsätzlich eine unterschiedliche Idee. Die sind sich aber zu ähnlich. Die müssen wir differenzieren. In anderen Fällen war es einfach nur so, ja, also den Beitrag haben wir einfach vor fünf Jahren schon geschrieben. Da haben wir neulich nochmal geschrieben. Und jetzt geht nochmal eine Pressemitteilung dazu raus, die das Thema irgendwie aufgreift.
00:27:30
Speaker
Da ist es eigentlich dasselbe. Und dann muss man sich halt fragen, was de-enexiere ich und was konsolidiere ich eben irgendwie im Sinne von, das wird gelöscht, weitergeleitet, das brauchen wir gar nicht mehr. Oder ich muss es tatsächlich umschreiben, also mit einer anderen Seite zusammenführen, sodass ich, also die eine rankt ein bisschen zu was, die andere rankt ein bisschen zu was, beide sind so eher Mittel, die dann zusammenzubringen, sofern das inhaltlich passt. Und das lässt sich meistens eben halt nicht auf Knopfdruck so technisch umsetzen.
00:27:58
Speaker
Das heißt, da muss man tatsächlich mit Redaktionen ins Gespräch so. Aber der Schritt, den wir halt vorher mal gehen, ist sozusagen so eine Entscheidungshilfe an die Hand zu geben. Es gibt diese Seiten, da haben wir ein Kannibalisierungsproblem. Und jetzt haben wir halt die Option, löschen, weiterleiten, konsolidieren, deindexieren. Was machen wir denn jetzt davon?
00:28:18
Speaker
Ist dir das schon begegnet, dass du eine Art Entscheidungskonstrukt mit auf den Weg geben kannst, damit man das mit Redaktionen besprechen kann? Das machen wir tatsächlich relativ häufig. Da ich meistens fast immer nur technische Themen habe, muss ich tatsächlich sagen, mir fällt jetzt seit Langem nichts ein, wo das Thema Kannibalisierung
00:28:48
Speaker
ein Fokus bei mir war. Also von daher bin ich jetzt gespannt, was ihr dann mit auf den Weg gebt. Also einfach, ich könnte mir jetzt was überlegen, aber wenn du schon sagst, dass ihr das regelmäßig habt, bin ich sehr gespannt, wie ihr vorgeht. Naja, das Spannende ist ja, dass die Entscheidung einfach nicht immer so ist hopp oder top, sondern dass du immer irgendwie auch Businesskriterien mit hast, die du berücksichtigen musst. Das heißt, du kannst dir natürlich irgendwie so
00:29:13
Speaker
Seometriken aus der Search Console, wie hat das Contentpiece performt oder auch über Systrix oder solche Tools mal zu gucken. Also du hast vorhin ja angesprochen, manchmal wechseln so die URLs, mal rank die eine, mal die andere. Das ist ja ein guter Anhaltspunkt dafür, dass ich hier ein Karnivalisierungsproblem habe. Das ist ja, also diese ganze, habe ich ein Problem, dafür sind diese Seometriken irgendwie ganz gut.
00:29:37
Speaker
Ich kann auch einen Crawl dafür benutzen und mal gucken, irgendwie so URL-Inventar überhaupt ermitteln. Das ist allerdings eher noch so bei DC das Thema. Also über einen Crawl stelle ich selten diese Kannibalisierungsprobleme fest, sondern eher dieses, oh, das gibt es mit und ohne Slash. Das ist da so das Ding.
00:29:55
Speaker
Aber es gibt ja auch einfach Seiten, gerade weil sie vielleicht gar nicht gefunden werden, weil es duplicated Content oder kannibalisierter Content ist, der dann aber irgendwie fast extrem aus dem Newsletter verlinkt wird oder irgendwie über Social gepusht. Das heißt, ich brauche ja nochmal von den Seometriken ab,
00:30:13
Speaker
einfach eine Web-Analyse. Also gab es einfach Traffic auf diesem Content Piece. Das kann einfach ja bei SEO untergegangen sein, aber irgendwie in anderen Kanälen massiv gespielt sein oder was weiß ich, über die Hauptnavigation laufen die Leute da permanent drüber. Das ist halt auch nochmal ein Kriterium. Und bei Produkten würde ich natürlich auch nochmal so eine Business-Logik an, oder das kann ja auch Lied sein, egal, aber wenn man sagt,
00:30:38
Speaker
Hier habe ich einfach mehr Marge oder das ist uns wichtig, das brauchen wir unbedingt, weil darüber dieses oder jenes passiert, das ist eine wichtige Landingpage. Da können wir nicht aus SEO sagen, das scheint irgendwie doppelt zu sein, schmeiß das mal weg. Also da muss man sich halt dann erst drüber unterhalten. Eine andere Metrik wäre ja auch nochmal, gibt es irgendwie Backlinks drauf von externen

Bewertung und Konsolidierung von Inhalten

00:31:00
Speaker
und so.
00:31:00
Speaker
Dann kann man immer noch damit umgehen, also sagen, hier, das muss man vielleicht per 301 umbiegen. Dann sollte es aber nicht irgendwie gleichzeitig, wenn wir den 301 ersetzen, Designwechsel, Inhalt anders. Vorher gab es noch coole Features und ein Video und dann sagen wir Google, hey, bitte übertrag mal alle Ranking-Signale inklusive der Backlinks, aber wir haben eine ganz andere Seite hingelegt. Dann muss man vielleicht auch mal
00:31:24
Speaker
in einzelnen Schritten vorgehen. Also erst mal umbiegen, irgendwie konsolidieren und dann vielleicht wieder inhaltlich dran arbeiten. Also das ist dann quasi so das Feintuning. Also man legt ein paar Metriken an, die nicht nur SEO sind, sondern auch Business und Traffic und so weiter, berglings. Und dann guckt man halt, was man noch braucht und was tatsächlich weg kann. Wir erinnern uns an die Aussage von Hans, je weniger im Index, desto besser die Rankings. Also ausmisten, absolut.
00:31:53
Speaker
Und dann kommt man irgendwann an beim tatsächlich einzelnen Briefing zu, hey, aus diesen vier einzelnen Content Pieces, was weiß ich, zwei Pressemitteilungen, einen Blogpost und hier die eigentliche Landingpage oder so, da bauen wir jetzt mal einen geilen Content. Und das hier ist übrigens die URL, die wir behalten wollen. Das sind ja auch Geschichten, die man entscheiden muss. Genau, genau. Also da gibt es halt sehr viel. Was ich tatsächlich
00:32:20
Speaker
immer bevorzuge es. Ich hole immer erstmal gerne nicht nur einen Hammer, sondern die Keule raus und versuche nach Möglichkeit, wenn ich weiß, ich habe Seiten, die DC haben und die sind, wie ich vorhin schon meinte, mit den Parametern, also irgendwelche Parametergeschichten, die dann am Ende irgendwelchen Content zusammen
00:32:43
Speaker
oder einfach nur umwürfeln, aber der Text bleibt der gleiche. Und das habe ich wirklich in einem sehr, sehr hohen Maß, dass ich dann wirklich, bevor ich da irgendwie anfange mit Canonical, ich muss dazu sagen, ich setze eigentlich immer einen Canonical, ich bin niemand, der das weglässt.
00:32:58
Speaker
Welche die sagen, wenn das wirklich unik ist und ich kann das garantieren, warum sollte ich dann Canonical, also ich bin da viel zu faul, was zu entwickeln, was dann das Canonical weglässt. Also die Logik dafür zu bauen, das finde ich ist irgendwie kieselig.
00:33:14
Speaker
Vor allem du hast es ja auch gerne aufgeräumt in deinen Tools, die dir irgendwie Fehler anmeckern könnten. Wir wollen keinen Checklisten-SEO betreiben, nur um ein Tool zu befriedigen, aber ich würde auch sagen, selbstreferenziales Canonical ist ja Standard und deswegen nehme

Effizientes Crawl-Budget-Management

00:33:30
Speaker
ich das.
00:33:30
Speaker
Ich glaube nicht, dass es, also sofern es richtig eingebaut ist, hatte ich noch nicht gesehen, dass es schaden kann. Aber was ich sagen wollte, ich versuche halt, soviel es geht, aus dem Crawler rauszuhalten, von dem ich weiß, dass ich DC habe. Das ist schlicht und ergreifend aus dem Fall schon so, dass das Canonica Attribut erst analysiert wird, wenn der Crawler bereits die Arbeit geleistet hat. Und wenn die Arbeit geleistet ist,
00:33:58
Speaker
Wer ihr zuhört und vielleicht den Begriff kennt, Crawl Budget, das hört man immer mal wieder. Und Budget ist für mich halt immer so ein, eher in Form von Zeit, so mäßig das für mich. Wie viel Zeit sich Google oder Google mir quasi widmet und meiner Seite. Und warum nehme ich gerne Zeit? Weil ich ganz gerne immer dieses
00:34:24
Speaker
diesen Verbund zu Seitenladegeschwindigkeit und Seitenladezeitaufbau. Und wenn ich eine schnellere Website habe, das zu mehr Seiten schafft, Google in einem Abwasch auch quasi zu crawlen. Das ist jetzt vielleicht ein bisschen vereinfacht dargestellt, aber so versuche ich das immer auch.
00:34:40
Speaker
So ist es ja auch. Darzustellen, deswegen ist für mich das Budget eigentlich ein Zeitbudget. Und je mehr ich quasi von Seiten, die ich eh von denen ich weiß, die sind DC, beziehungsweise die verweisen auf eine andere Seite, dann brauch ich sie auch nicht erst scrollen lassen. Weil das ist so wie ein Gespräch an der Bar mit jemandem, der schon einen Tee hat und der wiederholt sich immer wieder und immer wieder. Und es kommt einfach nicht Sinnvolles dabei raus.
00:35:12
Speaker
Nein, aber so muss ich das für Google sich so ein bisschen anschühlen. Die erzählt dir immer wieder, geh mal dahin, da ist es eigentlich, mit dem du dich unterhalten sollst. Und das hast du von 100 URLs verweisen, 80 auf irgendwelche anderen Seiten? Ja, ganz ehrlich, da muss ich mir auch in Zukunft die Seite weniger anschauen.
00:35:34
Speaker
ein bisschen drastisch jetzt dargestellt. Aber man muss sich das ja auch mal bei großen Websites einfach mal vor Augen finden, was das letztendlich kostet. Und wenn wir beim Thema Kosten sind, ich habe früher immer in meinen Seminaren, habe ich immer gesagt, stellt euch mal vor, ihr müsstet bei Google für jede URL, die ihr im Google-Index haben wollt, jeden Monat ein Euro überweisen.
00:35:59
Speaker
wie ordentlich man auf einmal werden würde, was das ganze Thema Indexierung angeht. Also dann wäre das auf einmal ein ziemlich wichtiger Punkt, weil man nämlich jeden Monat irgendwie 10.000 Euro nach Google überweisen müsste, nur damit dann eben seine Arbeit, die man nicht richtig gemacht hat,
00:36:18
Speaker
Es kostet ja gefühlt nichts. Ich glaube einfach, dass das ein wichtiger Part ist, sich einfach mal vor Augen zu führen. Google hat letztendlich mit dem Crawlen Arbeit und diese Arbeit bezahlt Google. Und natürlich will Google auch das Geld nicht aus dem Fenster schmeißen. Und deswegen ist das so wichtig, dass man wirklich nur Seiten auch zeigt oder gibt, die relevant sind für einen selbst und natürlich für die Suchmaschine.
00:36:44
Speaker
Ja, total. Also schönes Bild. Und ich meine, indirekt über Serverkosten hat man das ja eigentlich auch, aber das fühlt halt irgendwie jetzt der einzelne Mitarbeiter im Unternehmen nicht so, dass sich wieder festgecrawlt hat

Technische Tools zur Verwaltung von Duplicate Content

00:36:59
Speaker
an einem Teilbereich. Und ich habe das vorhin tatsächlich bei den Maßnahmen auch völlig unterschlagen.
00:37:04
Speaker
dass einfach die Robotsperre auch eine Lösung sein kann, um sich irgendwie dieses Kannibalisierungsproblems einfach irgendwie herzuwerden. Also D-Index ist eins, aber auch bestimmte Seiten nicht crawlen zu lassen, schützt jetzt nicht immer vor Indexierung, das ist nicht so die ganz safe Variante, aber ja, mindert natürlich die Wahrscheinlichkeit.
00:37:27
Speaker
Aber du hast noch was gesagt gerade, was auch heute noch gar keine Rolle gespielt hat, nämlich das Meta-Tech-Robots, weil man natürlich auch Seiten, die man per Canonical weiterleitet, gleich mit Noindex ausstatten sollte.
00:37:45
Speaker
Jetzt ist Ruhe bei Jolle. Jetzt bin ich gespannt. Jetzt bin ich gespannt. Also ich dachte, das haben wir so indirekt schon gestriffen, als wir gesagt haben. Also löschen, konsolidieren und da also nur Index gehört für mich auch dazu. Okay, gut. Nur bitte nicht intern nur Follow machen. Dazu habe ich auch wieder spannende Diskussionen. Denn warum? Sag mal, was ist deine Logik?
00:38:14
Speaker
Naja, ein No-Follow über das Meta-Attribut vererbt sich ja auf alle internen Links. Also ich rede von dem Meta-Tech-Robots, was im Head ist. Und damit sage ich Google im Grunde, das ist eine Sackgasse, bitte folge keinem Link, der hier ist. Und das will ich ja nicht. Deswegen ist es wichtig, dass man da einfach ein No-Index setzt. Das Follow kann man schreiben, das kann man auch weglassen, weil Standard ist immer Follow.
00:38:39
Speaker
Aber das, finde ich, ist schon mal sehr, sehr wichtig. Und wenn das relevant ist, es gibt doch das No Archive, obwohl das mittlerweile ja auch aufgehoben ist, weil wir ja kein Cash mehr haben bei Google. Von daher kann man sich das eigentlich sparen. Wer hat mir gerade einen dabei? Fällt dir gerade auf. Ja, ich habe mich darüber nachgedacht. Wir haben das mit drin auf vielen Seiten, aber das brauchen wir ja gar nicht mehr, weil es den Google Cash ja in der Form nicht mehr gibt.
00:39:08
Speaker
Aber das führt ein bisschen weg vom Kannibalisierungs- und DC. Ja, aber das fiel mir gerade nur ein, weil ich gerade überlegt habe, was haben wir noch für Robots-Attribute, für Werte, um genau zu sein. Das Robots ist ja das Attribut.
00:39:23
Speaker
Aber ne, also das sollte man auf jeden Fall berücksichtigen. Kann noch Nickel sauber machen. Nur Index, wenn es Sinn macht und die Robots DXT gut benutzen. Da kann man eine ganze Menge mit erschlagen von seinem Problem. Gerade wenn man DC hat. Jawohl.

Abschluss und Verabschiedung

00:39:42
Speaker
Jolle, 40 Minuten. Ich glaube, da brauchen wir jetzt einen Haken hinter. Wenn man Fragen hat, dann weiß man, wie man uns, glaube ich, erreicht. Genau.
00:39:53
Speaker
Jawohl, das war meine Frage. Wir würden sonst hier gleich DC produzieren oder kannibalisieren wir uns? Das ist die Frage. Ja, vor allem am Paraisen. Na ja, in diesem Sinne, ich wünsche euch einen schönen Abend oder Morgen oder Mittag, wann auch immer ihr diese Folge gehört habt. Alles gut. Tschüss. Tschüss.