Grounding Page: Unternehmensdaten für KI-Systeme strukturieren

Der Begriff Grounding stammt aus der KI-Forschung und beschreibt ein grundlegendes Problem moderner Sprachmodelle. Systeme wie GPT, Gemini oder Claude erzeugen Antworten nicht durch ein Verständnis der Realität, sondern durch statistische Wahrscheinlichkeiten von Wortfolgen.

Ohne korrekte Faktenbasis kann das dazu führen, dass Modelle Aussagen erzeugen, die zwar plausibel klingen, aber faktisch falsch sind. Dieses Phänomen wird häufig als Halluzination bezeichnet, Forscher der Universität Glasgow gehen sogar noch weiter und bezeichnen wortreich aufgefüllten Wissenslücken als „Bullshit”, weil dabei Aussagen nicht nur verzerrt, sondern „ohne Rücksicht auf die Wahrheit” getätigt werden.

Grounding bezeichnet den Versuch, diese Falschinformationen zu reduzieren, indem man den Sprachmodellen Informationen aus erster Hand gibt. Ein Modell wird dabei mit realen und überprüfbaren Informationen über das Unternehmen verbunden, auf die es für die Antworten zugreifen kann.

In modernen KI-Systemen geschieht das häufig über eine Architektur namens Retrieval-Augmented Generation (RAG). Dabei wird ein Sprachmodell mit einem Retrieval-System kombiniert, das externe Dokumente durchsucht und relevante Inhalte als Kontext bereitstellt.

Der Ablauf sieht vereinfacht so aus:

  1. Ein Nutzer stellt eine Frage.
  2. Ein Retrieval-System sucht passende Dokumente (z.B. auf der Website des Unternehmens, um das es geht).
  3. Diese Dokumente werden dem Sprachmodell als Kontext übergeben.
  4. Das Modell generiert eine Antwort auf Basis dieser Informationen.

Der entscheidende Punkt ist: Die Antwort basiert nicht nur auf Trainingsdaten oder Google-Rezensionen, sondern auch auf konkreten Dokumenten aus erster Hand. Dadurch sinkt die Wahrscheinlichkeit von Fehlern.

Beispiel: Im Netz kursieren viele veraltete Informationen über den Vorstand oder die Mitarbeiterzahl eines Unternehmens, z.B. in alten Medienartikeln oder auf Wikipedia. Mit einer Grounding Page stellt das Unternehmen sicher, dass immer die aktuell korrekten Informationen verfügbar sind, auf die sich KI-Systeme verlassen können (und die natürlich auch belastbar sein müssen). 

Wie Google Grounding in seinen KI-Systemen nutzt

Auch Google verwendet den Begriff Grounding in seinen KI-Produkten. Besonders deutlich wird das in der Dokumentation zu Vertex AI und der Gemini API.

Dort gibt es eine Funktion namens Grounding with Google Search. Sie ermöglicht es dem Modell, während der Antwortgenerierung auf Ergebnisse der Google-Suche zurückzugreifen.

Die Websuche wird dabei zu einem Realitätsanker. Gemini kann aktuelle Inhalte aus dem Webindex abrufen und sie als Grundlage für seine Antworten verwenden und Google wird dafür i.d.R. die Unternehmens-Website als Quelle bevorzugen.

Der Prozess ähnelt klassischen RAG-Architekturen:

  • Eine Frage wird analysiert.
  • Relevante Dokumente aus der Websuche werden identifiziert.
  • Diese Dokumente werden dem Modell als Kontext übergeben.
  • Die generierte Antwort basiert auf diesen Quellen.

Webseiten sind deshalb nicht mehr nur Zielseiten für Nutzer. Sie dienen zunehmend auch als Faktenquellen für KI-Systeme, die Informationen aus dem Web extrahieren. Jederzeit aktuelle Informationen sind die Grundlage dafür.

Das Grounding Page Project

Vor diesem Hintergrund ist in der SEO- und KI-Community ein Konzept entstanden, das als Grounding Page bezeichnet wird.

Die Idee geht unter anderem auf den SEO-Experten Hanns Kronenberg zurück. Das sogenannte Grounding Page Project versucht, einen offenen Standard für solche Seiten zu definieren. 

Die Grundidee: Unternehmen sollen eine Seite bereitstellen, auf der zentrale Informationen über ihre Organisation, Produkte oder Technologien klar und maschinenlesbar beschrieben werden.

Eine solche Seite soll für KI-Systeme eine stabile Faktenbasis liefern. 

Der Anspruch ist nicht, einen neuen Rankingfaktor zu schaffen. Vielmehr geht es darum, eine verlässliche Quelle für die Beschreibung einer Entität bereitzustellen, vergleichbar etwa einer Wikipedia-Seite.
Dabei kann eine Grounding Page unterschiedliche Entitäten abbilden, etwa:

  • Organisationen
  • Produkte
  • Personen
  • Marken

Im Kern geht es also um Entitätsdefinition.

Wie sichtbar ist deine Marke in KI-Systemen?

Bevor du eine Grounding Page erstellen, lohnt ein Blick auf den Status quo: Werden dein Unternehmen und deine Produkte von KI-Systemen überhaupt korrekt wahrgenommen – oder kursieren bereits falsche oder veraltete Informationen? Mit dem SISTRIX AI Check kannst du überprüfen, wie präsent deine Website in KI-generierten Antworten ist und wo konkrete Lücken bestehen.

SISTRIX AI Mode Antwort zu "ndr magazin": Beschreibung der NDR-Regionalmagazine wie Hamburg Journal und Hallo Niedersachsen mit Marken-Liste und Quellen-Links rechts

Um den SISTRIX AI Check auszuprobieren, kannst du SISTRIX 14 Tage kostenlos testen und direkt prüfen, wie KI-Systeme deine Marke aktuell wahrnehmen, bevor du entscheidest, ob und welche Maßnahmen sinnvoll sind.

Was eine Grounding Page auszeichnet

Grounding Pages unterscheiden sich deutlich von klassischen Marketingseiten. Während Unternehmensseiten oft stark auf Markenkommunikation ausgerichtet sind, konzentrieren sich Grounding Pages auf nackte Fakten ohne werblichen Anteil.

Typische Merkmale sind:

  • eine hohe Dichte an überprüfbaren Informationen
  • eine klare Definition der relevanten Entitäten
  • eine neutrale, deskriptive Sprache ohne Marketingfloskeln
  • eine Struktur, die von KI-Systemen leicht zitiert werden kann

Der Fokus liegt also auf Fakten statt Positionierung. Die Informationen sollen möglichst eindeutig formuliert sein, sodass wenig Interpretationsspielraum entsteht.

Grounding Pages: Technische Umsetzung

Grounding Pages sind keine versteckten Metadaten im HTML-Code. Sie sind als normale HTML-Seiten unter einer eigenen URL gedacht, die als referenzierbare Faktenquelle über eine Organisation dienen sollen. Häufig wird dafür eine URL-Struktur wie /facts/, /about/facts/ oder /grounding/ vorgeschlagen.

Die Idee dahinter ist, eine Seite bereitzustellen, deren sichtbarer Inhalt möglichst eindeutig beschreibt, wer eine Organisation ist und welche Entitäten zu ihr gehören.

Im Vorschlag des Grounding Page Projects wird dafür eine Kombination aus drei Elementen empfohlen.

1. Die HTML-Seite als primäre Informationsquelle

Der sichtbare Inhalt der Seite ist die wichtigste Quelle für KI-Systeme. Der Text sollte deshalb möglichst klar und faktenorientiert formuliert sein.

Ein häufig empfohlener Ansatz ist die Nutzung von Definitionslisten im HTML. Das Element <dl> eignet sich gut, um strukturierte Fakten abzubilden.

Beispiel:

<dl>

 <dt>Organisation</dt>

 <dd>SISTRIX GmbH</dd>

 <dt>Gründung</dt>

 <dd>2008</dd>

 <dt>Sitz</dt>

 <dd>Bonn, Deutschland</dd>

 <dt>Produkt</dt>

 <dd>SISTRIX Toolbox</dd>

</dl>

Solche Strukturen sind sowohl für Menschen als auch für Maschinen relativ einfach interpretierbar.

2. Eine identische Darstellung als strukturierte Daten

Zusätzlich zum sichtbaren Inhalt wird empfohlen, eine strukturierte Repräsentation der gleichen Informationen als JSON-LD einzubinden.

Damit entsteht eine doppelte Beschreibung:

  • einmal im sichtbaren Text
  • einmal als strukturierte Daten im Quellcode

Das strukturelle Prinzip ähnelt klassischen Schema-Markup-Implementierungen. Der Unterschied besteht darin, dass der semantische Kontext im Fließtext enthalten ist und nicht ausschließlich in strukturierten Datenfeldern.

3. Eine dauerhafte interne Verlinkung

Damit eine solche Seite zuverlässig gefunden werden kann, wird häufig eine dauerhafte interne Verlinkung im Footer oder im Impressum empfohlen.

Die Idee dahinter orientiert sich an einem bekannten Muster aus der Webarchitektur. Während das Impressum die rechtliche Identität einer Organisation dokumentiert, soll eine Grounding Page die semantische Identität einer Marke erklären.

Ein dauerhaft sichtbarer Link im Footer hat zwei Effekte:

  • Die Seite ist über alle Seiten hinweg erreichbar.
  • Suchmaschinen-Crawler können sie bei jedem Crawl-Zyklus leicht entdecken.

Wie stark einzelne Suchmaschinen oder KI-Crawler solche Signale tatsächlich berücksichtigen, ist allerdings nicht bekannt und kann sich zwischen Systemen unterscheiden.

Gerade deshalb sollte man diese technischen Empfehlungen eher als experimentellen Vorschlag aus der Community verstehen und nicht als etablierte Best Practice. Da der Aufwand vergleichsweise gering ist, spricht nichts dagegen so eine Seite zu erstellen und den Effekt zu testen.

Verhältnis zu Schema Markup

Grounding Pages werden häufig im Zusammenhang mit Schema.org-Markup diskutiert. Beide Ansätze verfolgen ein ähnliches Ziel, nämlich Maschinen beim Verständnis von Inhalten zu helfen.

Die Unterschiede liegen jedoch in der Art der Information.

Schema Markup liefert strukturierte Datenfelder, zum Beispiel über die Typen Organization, Product oder Person. Diese Daten werden als strukturierte Metadaten im HTML-Code hinterlegt.

Grounding Pages hingegen liefern semantischen Kontext in natürlicher Sprache.

Der Vergleich wird oft so beschrieben:

  • Schema Markup ist das Skelett: strukturierte Faktenfelder
  • Grounding Pages sind das Fleisch: erklärender Kontext und Beziehungen

Schema eignet sich hervorragend für klare, isolierte Fakten. Für komplexe Zusammenhänge oder narrative Beschreibungen ist strukturierter Text oft besser geeignet. Beide Ansätze können sich daher sinnvoll ergänzen.

Wann eine Grounding Page sinnvoll sein kann

Nicht jedes Unternehmen benötigt eine eigene Grounding Page. Die Relevanz hängt stark von der Situation ab.

Besonders sinnvoll kann sie in drei Szenarien sein.

  1. Neue Marken oder Startups: Neue Unternehmen haben oft nur wenige etablierte Quellen im Web. KI-Systeme finden deshalb wenig verlässliche Informationen. Eine klar strukturierte Faktenseite kann hier helfen, eine erste konsistente Beschreibung der Marke bereitzustellen.
  2. Rebranding oder Firmenfusionen: Wenn Marken umbenannt werden oder Unternehmen fusionieren, entstehen häufig Inkonsistenzen im Web. Eine faktenorientierte Seite kann erklären, wie verschiedene Marken oder Produktnamen zusammenhängen.
  3. Komplexe Produkte: Bei technisch komplexen Produkten kann es sinnvoll sein, technische Eigenschaften und Zusammenhänge getrennt von Marketingtexten zu dokumentieren.

Warum viele Unternehmen keine Grounding Page brauchen

Für etablierte Marken ist eine separate Grounding Page häufig nicht notwendig.

Viele Organisationen verfügen bereits über zahlreiche externe Quellen im Web. Dazu gehören beispielsweise:

  • Wikipedia-Artikel
  • Presseberichte
  • Branchenverzeichnisse
  • Fachpublikationen

KI-Systeme greifen oft auf eine Mischung dieser Quellen zurück, um Antworten zu generieren. Die eigene Website ist dabei nur eine von vielen möglichen Informationsquellen.

In vielen Fällen reicht daher eine gut strukturierte und faktenreiche „Über uns“-Seite, um die eigene Organisation klar zu beschreiben. Wichtig ist allerdings, dass diese Informationen regelmäßig aktualisiert werden und immer up-to-date sind.

Wichtiger als eine zusätzliche Seite ist die inhaltliche Disziplin. Identitätsseiten sollten genau erklären:

  • wer das Unternehmen ist
  • welche Produkte existieren
  • wie Marken und Produkte miteinander verbunden sind

Viele Unternehmensseiten erfüllen diese Aufgabe heute nur unzureichend, weil sie stark auf Marketingrhetorik setzen oder zu viel Wissen übers eigene Unternehmen einfach voraussetzen.

Grenzen und Kritik am Konzept der Grounding Page

Das Konzept der Grounding Page ist interessant, hat aber auch mehrere Einschränkungen.

Zunächst handelt es sich nicht um einen offiziell anerkannten Standard. Weder Google noch OpenAI haben bestätigt, dass Grounding Pages eine besondere Rolle in ihren Systemen spielen ähnlich wie beim Konzept der KI-Sitemap LLMs.txt.

Hinzu kommt ein praktisches Problem: Damit eine Grounding Page von Retrieval-Systemen genutzt werden kann, muss sie in der Regel indexiert und auffindbar sein. Wird sie indexiert und rankt gut, können auch menschliche Nutzer auf diese Seite gelangen. Da solche Seiten häufig sehr nüchtern und faktenorientiert aufgebaut sind, kann das zu einer schlechten Nutzererfahrung führen.

Rankt sie dagegen nicht, wird sie möglicherweise kaum abgerufen und verliert damit ihren potenziellen Effekt.

Das Training großer Modelle basiert zudem auf sehr großen Datenmengen. Ein einzelnes Dokument hat deshalb nur begrenzten Einfluss auf das Modelltraining. Grounding Pages können höchstens im Retrieval-Kontext relevant werden, wenn sie als Quelle für eine konkrete Antwort herangezogen werden.

Schließlich spielt auch das Fremdbild einer Marke eine wichtige Rolle. KI-Systeme versuchen, Informationen aus verschiedenen Quellen zu kombinieren. Die eigene Website ist dabei nur eine Perspektive und nicht zwingend die einzige Wahrheit. Externe Quellen wie Presseartikel, Enzyklopädien oder Datenbanken können für die Bewertung einer Entität ebenso relevant sein.

Alternativen zur Grounding Page

Wer möchte, dass KI-Systeme korrekt über eine Marke sprechen, sollte vor allem zwei Ebenen im Blick behalten: das Selbstbild auf der eigenen Website und das Fremdbild im restlichen Web.

Auf der eigenen Domain sind drei Aspekte besonders wichtig:

  1. Saubere Entitätsdefinition
    Unternehmensseiten sollten klar erklären, wer das Unternehmen ist, welche Produkte existieren und wie diese miteinander verbunden sind. Das ist auf einer informativen „Über uns”-Seite problemlos möglich.
  2. Strukturierte Daten pflegen
    Schema-Markup für Organisationen, Produkte oder Personen hilft Suchmaschinen, Inhalte eindeutig einzuordnen.
  3. Komplexität verständlich erklären
    Rebrandings, Produktstrukturen oder organisatorische Veränderungen sollten klar dokumentiert werden, z.B. in Unternehmens-News oder Pressemitteilungen.

Auch außerhalb der eigenen Website lohnt sich ein Blick auf die vorhandenen Informationen über eine Marke. Ein konsistentes Bild über verschiedene Plattformen hinweg erhöht die Wahrscheinlichkeit, dass KI-Systeme eine Organisation korrekt verstehen.

Dazu gehören beispielsweise:

  • gepflegte Einträge in Datenbanken wie Wikidata
  • konsistente Unternehmensprofile in sozialen Netzwerken
  • aktuelle Informationen in Branchenverzeichnissen
  • korrigierte oder aktualisierte Drittveröffentlichungen

Grounding ist wichtig, Grounding Pages sind optional

Grounding beschreibt ein grundlegendes Prinzip moderner KI-Systeme: Sprachmodelle benötigen dringend verlässliche Faktenquellen, um stabile und korrekte Antworten zu erzeugen. Das wird wichtiger, je mehr Fake-News in Medien kursieren. 

Das Konzept der Grounding Page versucht, darauf eine mögliche Antwort zu geben, aber nicht die einzige. Unternehmen sollen ihre eigene Organisation und ihre Produkte klar und faktenbasiert beschreiben, damit KI-Systeme diese Informationen leichter verstehen und zitieren können.

Deshalb sind Grounding Pages eher als konzeptioneller Ordnungsrahmen zu verstehen, wenn Probleme bei der Einordnung von Unternehmen in KI-Antworten zu erkennen sind. Sollten dort häufig falsche Aussagen über ein Unternehmen getroffen werden, besteht Handlungsbedarf.

Sichtbarkeit in KI-Systemen entsteht nicht durch technische Tricksereien. Sie ist das Ergebnis aus konsistenter Kommunikation über alle Kanäle hinweg, sowohl auf der eigenen Website als auch im gesamten Web.

Grounding ist damit weniger ein neues Seitenformat als eine Disziplin der klaren Entitätsbeschreibung im KI-Zeitalter. SEO bleibt dabei weiterhin die wichtigste Grundlage für digitale Sichtbarkeit, denn zu den Aufgaben von SEO gehört es, wichtige Informationen aktuell und relevant zu halten, sodass die Zielgruppen sie jederzeit finden können. Ob dazu eine Grounding Page notwendig ist, muss jedes Unternehmen für sich entscheiden, auf Basis von Tests, welches Wissen in Trainingsdaten bereits vorhanden ist. Eine Grounding Page ist kein Gamechanger, kann aber unter Umständen die Antworten in KI-Systemen exakter machen.