Was ist Indexierbarkeit? (Kann Google Ihre Seite finden & speichern?)

Damit Ihre Webseite in den Suchergebnissen von Google & Co. erscheinen kann, muss sie zwei grundlegende Hürden nehmen: Sie muss zuerst gefunden und gecrawlt werden, und anschließend muss sie **indexiert** werden. Die **Indexierbarkeit** beschreibt, ob und wie gut eine Suchmaschine in der Lage ist, den Inhalt einer Seite zu analysieren und in ihren riesigen Datenindex aufzunehmen.

Die schnelle Definition

Indexierbarkeit bezieht sich auf die Fähigkeit einer Suchmaschine wie Google, den Inhalt einer Webseite zu analysieren, zu verstehen und in ihren Index aufzunehmen. Eine Seite, die nicht indexierbar ist, kann nicht in den organischen Suchergebnissen erscheinen.

Warum Indexierbarkeit die absolute Basis ist

Ohne Indexierung gibt es keine Sichtbarkeit in der organischen Suche. Es ist der kritische zweite Schritt nach dem Crawling:

Voraussetzung für Rankings: Nur indexierte Seiten können für relevante Suchanfragen ranken. Wenn Ihre wichtigste Produktseite nicht indexiert ist, kann sie keinen organischen Traffic generieren, egal wie gut der Inhalt ist.
Effiziente Ressourcennutzung: Wenn Suchmaschinen-Bots Seiten crawlen, die nicht indexiert werden sollen (z.B. Login-Seiten, interne Suchergebnisse), verschwendet dies wertvolles Crawl Budget.
Kontrolle über Ihre Sichtbarkeit: Durch gezielte Steuerung der Indexierbarkeit können Sie sicherstellen, dass nur die relevanten und hochwertigen Seiten Ihrer Website in den Suchergebnissen erscheinen und keine unerwünschten oder doppelten Inhalte.
Grundlage für alle weiteren SEO-Maßnahmen: Bevor Sie über Keywords, Backlinks oder Nutzererfahrung nachdenken, müssen Sie sicherstellen, dass Ihre Inhalte überhaupt indexierbar sind.

Was kann die Indexierbarkeit verhindern oder beeinflussen?

Mehrere technische Faktoren bestimmen, ob und wie eine Seite indexiert wird:

Meta-Robots-Tag noindex: Dies ist die direkteste Anweisung an Suchmaschinen, eine Seite nicht zu indexieren. Wenn eine Seite das Tag <meta name="robots" content="noindex"> im <head>-Bereich enthält, wird sie (in der Regel) nicht im Index erscheinen. Überprüfen Sie dies unbedingt für wichtige Seiten!
X-Robots-Tag im HTTP-Header: Eine alternative Methode, um `noindex` (oder andere Anweisungen) über den HTTP-Header der Seite zu senden. Dies wird oft für Nicht-HTML-Dateien wie PDFs verwendet.
robots.txt-Datei: Obwohl die `robots.txt` primär das Crawling steuert, kann sie die Indexierung indirekt beeinflussen. Wenn eine Seite vom Crawling ausgeschlossen ist (Disallow:), kann Google sie oft trotzdem indexieren, wenn es Links von anderen Seiten dorthin findet. Es sieht dann aber nur die URL, nicht den Inhalt. Ein `noindex`-Tag ist die zuverlässigere Methode, um die Indexierung zu verhindern.
Passwortschutz / Login-Bereiche: Seiten, die nur nach einem Login zugänglich sind, können von Suchmaschinen-Crawlern nicht erreicht und somit nicht indexiert werden.
Fehlerhafte Canonical Tags: Wenn ein Canonical Tag fälschlicherweise auf eine andere, irrelevante oder nicht indexierbare Seite verweist, kann dies die Indexierung der eigentlichen Seite verhindern.
Serverfehler (5xx) oder dauerhafte Umleitungen (301) auf Fehlerseiten: Wenn Google wiederholt auf Fehler stößt, kann es die Seite aus dem Index entfernen.
Schlechte Website-Struktur / Interne Verlinkung: Wenn wichtige Seiten tief vergraben sind und kaum interne Links erhalten (Orphan Pages), findet Google sie möglicherweise nur schwer oder gar nicht.

Wie prüfen Sie die Indexierbarkeit Ihrer Seiten?

Google Search Console: Das wichtigste Tool. Der Bericht “Seiten” (unter Indexierung) zeigt genau an, welche Ihrer URLs indexiert sind und welche aus welchen Gründen ausgeschlossen wurden (z.B. durch `noindex`, 404-Fehler, Canonicalisierung).
`site:`-Suche bei Google: Geben Sie site:IhreDomain.de in die Google-Suche ein. Dies zeigt (ungefähr), welche Seiten Ihrer Domain Google im Index hat. Für spezifische Seiten: site:IhreDomain.de/Ihre-Unterseite. Erscheint die Seite hier nicht, ist sie wahrscheinlich nicht (korrekt) indexiert.
Quelltext prüfen: Schauen Sie im HTML-Quelltext (meist über Rechtsklick -> “Seitenquelltext anzeigen”) Ihrer Seite nach, ob im <head>-Bereich ein <meta name="robots" content="noindex">-Tag vorhanden ist.
SEO-Crawler-Tools: Tools wie Screaming Frog oder Sitebulb können Ihre Website crawlen und Berichte über indexierbare/nicht indexierbare Seiten erstellen.

Profi-Tipp: Indexieren Sie nur, was wertvoll ist!

Nicht jede Seite Ihrer Website *sollte* indexiert werden. Seiten ohne einzigartigen Mehrwert (z.B. interne Suchergebnisseiten, Tag-Übersichtsseiten mit wenig Inhalt, Login-Seiten, Warenkörbe) sollten Sie bewusst von der Indexierung ausschließen (mittels `noindex`-Tag). Das hilft Google, sich auf Ihre wirklich wichtigen Inhalte zu konzentrieren und vermeidet Probleme mit Thin oder Duplicate Content.

Zusammenfassung: Indexierbarkeit ist die Fähigkeit einer Suchmaschine, eine Webseite in ihren Index aufzunehmen. Sie ist die Grundvoraussetzung für jedes Ranking. Technische Faktoren wie Meta-Robots-Tags (`noindex`), die `robots.txt` und Canonical Tags steuern die Indexierbarkeit. Die Überwachung des Indexierungsstatus in der Google Search Console ist eine zentrale Aufgabe im technischen SEO.

WebSeo GmbH
Röderstraße 1
01454 Radeberg

Kontakt:
Telefon: 03528 4029727
E-Mail: info@webseo.de

Erstellt von:

Sven Hauswald