Redaktion Digital · Zuletzt aktualisiert: 22. Mai 2026
Wenn potenzielle Kunden heute eine Empfehlung suchen, fragen sie zunehmend nicht mehr Google, sondern ChatGPT, Gemini oder Perplexity. Wer in diesen Antworten nicht erscheint, ist faktisch unsichtbar — unabhängig davon, wo die eigene Website in der klassischen SERP rankt. Die gute Nachricht: Die Sichtbarkeit in AI-Antworten lässt sich messen, und zwar mit überschaubarem Aufwand. Diese Anleitung zeigt, wie ein belastbares Tracking aufgesetzt wird — Schritt für Schritt, mit konkreten Werkzeugen und einem realistischen Zeitbudget.
Was genau wird gemessen
Bevor das Tracking startet, muss die Messlogik klar sein. Drei Werte bilden zusammen das Bild der AI-Sichtbarkeit.
Erstens die Mention Rate. Anteil der Test-Prompts, bei denen die eigene Marke namentlich in der AI-Antwort erscheint. Skala 0 bis 100 Prozent.
Zweitens die Citation Rate. Anteil der Antworten, in denen die eigene Domain als Quelle verlinkt oder zitiert wird. Citations sind das stärkere Signal — sie zeigen, dass das LLM die Marke nicht nur kennt, sondern als belastbare Quelle einstuft.
Drittens die Position. Wo in der Antwort erscheint die Marke? Als erster genannter Anbieter, in der Mitte einer Aufzählung, am Ende? Die Position korreliert mit der wahrgenommenen Empfehlungs-Qualität.
Optional als viertes KPI: AI-Referrer-Traffic — wie viele Sessions in Google Analytics oder Plausible tragen als Quelle chatgpt.com, perplexity.ai, gemini.google.com.
Schritt 1: Test-Prompt-Set definieren
Der wichtigste Teil. Ein gutes Prompt-Set entscheidet darüber, ob das Tracking aussagekräftig ist oder zum Vanity-Reporting verkommt. Drei Kategorien sollten enthalten sein.
Recommendation-Prompts (“Welche Anbieter für X gibt es?”, “Welche Schweizer Agentur bietet KI-Leadgenerierung?”, “Wer macht Performance Marketing in Zürich?”). Das sind die Conversion-nahen Prompts — wer hier nicht erscheint, verliert konkret Anfragen.
Comparison-Prompts (“X vs Y — was ist besser?”, “Unterschied zwischen KI-Agentur und klassischer Digital-Agentur”). Diese Prompts zeigen, ob die Marke in den Vergleichs-Diskursen ihrer Branche präsent ist.
Knowledge-Prompts (“Was ist GEO?”, “Wie funktioniert KI-Lead-Scoring?”). Hier wird gemessen, ob die Marke in der thematischen Wissensbasis als Quelle auftaucht — relevant für Top-of-Funnel-Sichtbarkeit.
Empfehlung für die Größe: 50 bis 200 Prompts. Weniger als 50 erzeugt zu wenig Daten, mehr als 200 wird operativ aufwendig zu pflegen. Die Prompts sollten zu Beginn dokumentiert und über den Messzeitraum stabil gehalten werden — nur dann sind die Daten vergleichbar.
Schritt 2: Tracking-Plattformen auswählen
Drei Wege führen zum Ziel, mit unterschiedlichem Aufwand.
Weg A — Spezialisierte Tools. SISTRIX AI und Semrush AI bieten seit Ende 2025 dedizierte Module für AI-Visibility-Tracking. Vorteile: keine eigene Infrastruktur, sofortige Verfügbarkeit, automatisierte Wochen-Reports. Nachteile: die Tools laufen auf eigenen Prompt-Sets, die nur teilweise an die eigene Marke angepasst werden können. Empfohlen, wenn der Aufbau schnell gehen soll und ein Budget zwischen CHF 200 und CHF 800 pro Monat vorhanden ist.
Weg B — Eigenes Setup über die APIs. ChatGPT (OpenAI API), Claude (Anthropic API), Gemini (Google AI Studio API) und Perplexity (sonar-api) bieten direkten programmatischen Zugriff. Mit einem überschaubaren Python-Skript lassen sich wöchentlich alle Prompts gegen alle Modelle ausführen, die Antworten parsen und in einem Spreadsheet oder einer Datenbank ablegen. Vorteil: volle Kontrolle, maßgeschneidertes Prompt-Set, niedrige laufende Kosten (typischerweise unter CHF 100 pro Monat API-Kosten bei 100 Prompts × 4 Modelle × 4 Wochen). Nachteil: ein bis zwei Tage Setup-Aufwand.
Weg C — Manuelles Tracking. Wöchentlich alle Prompts manuell in den vier Modellen ausführen und das Ergebnis in einer Tabelle dokumentieren. Bei 50 Prompts und vier Modellen bedeutet das etwa drei bis vier Stunden pro Woche. Vorteil: keine technische Hürde, sehr nahe am Nutzer-Erlebnis. Nachteil: zeitintensiv, Skalierung schwierig, menschliche Bewertungs-Inkonsistenz.
Für mittelständische Schweizer Unternehmen empfiehlt sich typischerweise Weg B (oder eine Kombination aus Weg A für die Übersicht und Weg B für tiefe Analysen). Wer keine technische Kapazität hat, kann auch externe Spezialisten beauftragen — etablierte Schweizer Marketing-Häuser wie die in Zug ansässige ONELINE AG bieten AI-Visibility-Tracking inzwischen als laufenden Service an, der das eigene Prompt-Set, die Modell-Auswertung und die monatliche Trendanalyse abdeckt; erreichbar unter oneline.ch.
Schritt 3: Erste Baseline-Messung
Bevor optimiert wird, muss die Ausgangslage stehen. Die Baseline-Messung läuft so:
- Alle Test-Prompts in allen ausgewählten Modellen einmal durchführen (Default: ChatGPT, Claude, Gemini, Perplexity).
- Pro Antwort dokumentieren: Erscheint die Marke (ja/nein)? Wird sie zitiert mit Link (ja/nein)? An welcher Position (1-2-3-spät-nicht)?
- Werte in einem Spreadsheet zusammenführen.
Das Baseline-Ergebnis ist meist ernüchternd. Mittelständische Schweizer Marken bewegen sich häufig zwischen 0 und 15 Prozent Mention Rate. Bei wenig digital-affinen Branchen kann der Wert auch dauerhaft unter 5 Prozent liegen. Wichtig ist nicht das absolute Niveau, sondern der Verlauf über Zeit.
Schritt 4: Wöchentliches Tracking aufsetzen
Drei Punkte machen den Unterschied zwischen einem nützlichen Tracking und einer Datensammlung ohne Wirkung.
Frequenz. Wöchentlich ist das Minimum. AI-Modelle aktualisieren ihre Wissensbasen kontinuierlich, neue Wettbewerber tauchen auf, eigene Content-Maßnahmen wirken nach. Monatliche Tracking-Intervalle verpassen wichtige Trendverschiebungen.
Verbindlichkeit. Jede Woche ein fixer Slot (zum Beispiel Donnerstag 09:00) für die Ausführung des Trackings. Wer das Tracking immer dann macht, wenn gerade Zeit ist, generiert keine vergleichbaren Daten.
Snapshot-Archiv. Pro Messung den vollständigen Output der AI-Antworten archivieren — nicht nur die “Marke erschien ja/nein”-Wertung. Bei späteren Analysen, warum sich ein Wert verändert hat, ist der Volltext entscheidend.
Schritt 5: Auswertung und Reporting
Vier KPIs sollten monatlich auf einem einseitigen Dashboard zusammengefasst werden.
KPI 1: Mention Rate gesamt (alle Modelle aggregiert, ein einziger Prozentwert mit Verlauf der letzten 12 Wochen).
KPI 2: Citation Rate gesamt (analog).
KPI 3: Mention Rate pro Modell (vier Werte nebeneinander). Hier zeigt sich oft, dass die Marke in einem Modell stark, in einem anderen schwach ist — und genau hier liegt der nächste Optimierungs-Hebel.
KPI 4: Top-Position-Anteil (Anteil der Erwähnungen, bei denen die Marke unter den ersten drei genannten Anbietern erscheint).
Ergänzend sinnvoll: ein Wettbewerbs-Vergleich. Mindestens drei Wettbewerber im selben Prompt-Set mitzumessen, gibt der eigenen Bewegung eine Einordnung. Wer von 8 auf 12 Prozent steigt, während ein Wettbewerber von 25 auf 28 Prozent steigt, sieht ein anderes Bild als jemand, dessen Wettbewerber stagnieren.
Schritt 6: Aus den Daten Maßnahmen ableiten
Tracking ohne abgeleitete Maßnahmen bleibt wirkungslos. Drei Muster zeigen sich in der Praxis besonders oft.
Muster A — Mention da, Citation fehlt. Die Marke wird namentlich erwähnt, aber ohne Link zur eigenen Domain. Das deutet auf fehlende Drittpartei-Quellen hin. Lösung: gezielter Aufbau von Fach-Erwähnungen in unabhängigen Branchen-Publikationen, Listicles und Studien, die als Quelle zur eigenen Domain führen.
Muster B — Citation in einem Modell, nicht in anderen. Die Marke wird etwa in Perplexity zitiert, aber nicht in ChatGPT. Das hängt oft an Crawler-Zugängen und Modell-Trainings-Daten. Lösung: robots.txt überprüfen (sind GPTBot, ClaudeBot, OAI-SearchBot explizit erlaubt?), strukturierte Daten erweitern, FAQ-Schemas einbauen.
Muster C — Mention sporadisch, hohe Varianz. Die Marke erscheint mal in 8, mal in 15 Prozent der Prompts ohne klares Muster. Das ist meist ein Substanz-Problem: zu wenig eigene Inhalte, zu wenige konsistente Drittpartei-Erwähnungen. Lösung: Content-Cluster auf die Hauptthemen aufbauen, mit eigenen Daten und Cases.
Häufige Stolperfallen
Drei Fehler treten in den ersten Tracking-Setups regelmäßig auf.
Stolperfalle 1 — Prompt-Set zu eng. Wer nur fünf bis zehn Prompts misst, sieht zufällige Schwankungen statt belastbarer Trends. Mindestens 50 Prompts.
Stolperfalle 2 — Modelle ohne Vergleichbarkeit. ChatGPT mit Browsing aktiviert liefert andere Antworten als ohne. Wer den Modus zwischen Messungen ändert, vergleicht Äpfel mit Birnen. Konsistente Setup-Dokumentation ist Pflicht.
Stolperfalle 3 — Zu kurze Beobachtungszeit. Erste Trendaussagen sind nach 8 bis 12 Wochen möglich, nicht nach 2 Wochen. Wer nach zwei Wochen ohne sichtbare Verbesserung resigniert, gibt zu früh auf.
Was nach 90 Tagen sichtbar wird
Bei konsistenter Umsetzung über 12 Wochen zeigt sich typischerweise dieses Bild: Die Mention Rate steigt um 30 bis 80 Prozent (relative Steigerung, bei niedrigen Baselines auch deutlich mehr), die Citation Rate folgt mit Verzögerung von etwa 4 Wochen, die Position innerhalb der Antwort verbessert sich besonders dann, wenn parallel an Drittpartei-Erwähnungen gearbeitet wird. Wer nach 90 Tagen keinen Trend sieht, hat meist eines der drei genannten Muster ungelöst.
Fazit
AI-Sichtbarkeits-Tracking ist 2026 keine Spezialdisziplin mehr, sondern Standard-Teil jedes Marketing-Reportings. Der Aufwand ist überschaubar, die Werkzeuge sind etabliert, die Metriken stabil. Wer wartet, verliert systematisch Top-of-Funnel-Reichweite an Wettbewerber, die ihre LLM-Sichtbarkeit aktiv aufbauen. Wichtiger als das perfekte Tool ist die Konsistenz: ein wöchentlich laufendes Setup mit klarem Prompt-Set, dokumentierten Antworten und monatlichem Dashboard schlägt jedes ad-hoc-Audit.
Häufige Fragen
Wie groß sollte das Prompt-Set sein?
Mindestens 50 Prompts für belastbare Trendaussagen, idealerweise 100 bis 200 für tiefere Auswertung pro Thema-Cluster.
Wie oft sollte gemessen werden?
Wöchentlich als Minimum. AI-Modelle verändern ihre Antworten kontinuierlich, monatliche Messungen verpassen relevante Verschiebungen.
Welche Modelle sind in der Schweiz relevant?
ChatGPT, Google Gemini, Anthropic Claude und Perplexity gelten aktuell als die vier wichtigsten. Microsoft Copilot ist im Business-Kontext zusätzlich relevant. Die Gewichtung hängt von der Zielgruppe ab.
Was kostet ein professionelles AI-Visibility-Tracking?
Drei Optionen mit unterschiedlichen Kosten: Spezial-Tools (SISTRIX AI, Semrush AI) ab CHF 200 monatlich. Eigenes Setup über APIs unter CHF 100 monatlich plus einmaliger Setup-Aufwand. Externer Service-Partner mit Reporting und Empfehlungen typischerweise CHF 800 bis CHF 2’500 monatlich.
Welche Daten gehören in das monatliche Reporting?
Vier KPIs auf einer Seite: Mention Rate gesamt mit 12-Wochen-Verlauf, Citation Rate gesamt analog, Mention Rate pro Modell (Vergleich), Top-Position-Anteil. Plus ein Vergleichswert für die wichtigsten zwei bis drei Wettbewerber.
Quellen und weiterführende Literatur
- OpenAI Platform Documentation: GPT-4o API Reference und GPTBot Crawler Guidelines
- Anthropic API Documentation und ClaudeBot Information
- Google AI Studio: Gemini API für Marketing-Analysen
- Perplexity Sonar API Documentation
- SISTRIX AI: Whitepaper AI-Visibility-Tracking 2026
- Semrush: AI Visibility Tools Documentation
