Das Web hat jetzt drei Zielgruppen, und die dritte haben wir gerade erst entdeckt
Zwanzig Jahre lang gab es eine klare Regel: Wer im Web publiziert, schreibt für zwei Zielgruppen. Für Menschen, die den Inhalt lesen. Und für Suchmaschinen, die ihn indexieren.
Wir haben SEO gelernt. Meta-Descriptions geschrieben. Überschriften für Googles Crawler strukturiert und gleichzeitig lesbar für Menschen gehalten. Diese Balance war das Handwerk.
Jetzt ist diese Ära vorbei. Es gibt eine dritte Zielgruppe: KI-Agenten und Large Language Models. Und die meisten Websites sprechen nicht richtig mit ihnen.
Was sich geändert hat
Eine wachsende Zahl von Websites serviert inzwischen Markdown neben HTML. Dokumentationsplattformen wie Mintlify und Fumadocs machen das. Persönliche Blogs wie der von Dries Buytaert, dem Gründer von Drupal, auch.
Der Mechanismus ist simpel: HTTP Content Negotiation. Wenn ein KI-Agent eine Seite mit dem Header Accept: text/markdown anfragt, liefert der Server sauberes Markdown statt aufgeblähtes HTML. Manche Websites kündigen ihre Markdown-Version zusätzlich über einen <link rel="alternate" type="text/markdown">-Tag im HTML an. Das gleiche Muster, das RSS-Feeds seit Jahren nutzen.
Dries Buytaert hat das als Experiment auf seinem Blog eingebaut. Innerhalb einer Stunde hatte er hunderte Anfragen von ClaudeBot, GPTBot, OpenAIs SearchBot und anderen KI-Crawlern. Sie haben den Markdown-Link gefunden, sind sofort umgestiegen und nie zurückgekommen.
Die Erkenntnis ist klar: KI-Agenten sind hungrig nach saubereren Content-Formaten. Und sie nutzen sie sofort, wenn sie sie finden.
Warum das für Website-Betreiber relevant ist
Wenn Du im Web publizierst, wird Dein Content bereits von LLMs konsumiert. Blog-Posts, Dokumentation, Produktseiten, Wissensdatenbanken. Die Frage ist nicht ob KI Deine Website liest. Die Frage ist, wie gut sie versteht, was sie liest.
Wenn ein LLM heute Deine Seite abruft, bekommt es alles: Navigationsmenüs, Cookie-Banner, Footer-Links, Wrapper-Divs, Script-Tags, Werbe-Markup. Der eigentliche Inhalt macht vielleicht 20 Prozent der übertragenen Daten aus. Der Rest ist Rauschen, das Tokens verschwendet, das Verständnis verschlechtert und nützlichen Kontext aus dem Kontextfenster des Modells drängt.
Markdown zu servieren ändert diese Gleichung komplett.
Token-Effizienz: Markdown ist kompakter als HTML. Der gleiche Artikel, der als HTML 15.000 Tokens braucht, kommt in Markdown mit 3.000 aus. Das ist keine kleine Optimierung. Es bedeutet, dass fünfmal mehr von Deinem Content in ein einzelnes LLM-Kontextfenster passt.
Signal vs Noise: Keine Navigation, kein Styling, kein JavaScript. Nur Deine Worte, Deine Struktur, Deine Bedeutung. Wenn ein KI-Agent Deinen Content zusammenfasst oder zitiert, arbeitet er mit dem, was Du tatsächlich geschrieben hast. Nicht mit dem, was Dein CMS drumherum gebaut hat.
Content-Treue: HTML-zu-Markdown-Konvertierung ist verlustbehaftet. Automatisierte Tools entfernen Tags heuristisch und verlieren manchmal Tabellen, Code-Blöcke oder semantische Struktur. Natives Markdown bewahrt Deine Absicht exakt so, wie Du sie geschrieben hast.
Auffindbarkeit in KI-Antworten: Das ist die neue Frontier. Generative Engine Optimization (GEO). So wie SEO bestimmt hat, ob Google Deinen Content zeigt, könnte bestimmen, wie gut KI-Agenten Deinen Content parsen können, ob sie Dich in Antworten zitieren. Content KI-lesbar zu machen ist das neue Content crawlbar machen.
Die unbequeme Kehrseite: Content für KI leichter konsumierbar zu machen, könnte beschleunigen, wie das Web ausgehöhlt wird. KI-Unternehmen bekommen bessere Trainingsdaten, Ersteller bekommen vielleicht weniger Besuche. Der Werteaustausch ist nicht geklärt. Aber die Entwicklungsrichtung ist klar. Und sie zu ignorieren, verlangsamt sie nicht.
Was wir bei Wortfreunde gebaut haben
Bei Wortfreunde analysieren wir Web-Content unserer Kunden. Ihre eigenen Websites, Konkurrenzseiten, Branchenpublikationen. Wir extrahieren Erkenntnisse über Positionierung, Schreibstil, Zielgruppen und Content-Strategie. Diese Analyse fliesst in KI-gestützte Content-Empfehlungen.
Die Qualität dieser Analyse hängt vollständig von der Qualität des extrahierten Contents ab. Bis jetzt lief unsere Scraping-Pipeline so: HTML abrufen, Navigation und Boilerplate mit Nokogiri entfernen, dann den Rest mit ReverseMarkdown zu Markdown konvertieren. Das funktioniert, ist aber verlustbehaftet. Wir raten, welche Teile des HTML Content sind und welche nicht. Wir verlieren manchmal bedeutungsvolle Struktur. Wir machen Arbeit, die die Website für uns hätte machen können.
Wir haben jetzt Markdown-First Content Negotiation zu unserer Scraping-Pipeline hinzugefügt. Der neue Ansatz hat drei Stufen.
Content Negotiation: Jede Anfrage enthält jetzt Accept: text/markdown als bevorzugtes Format. Wenn der Server das unterstützt, bekommen wir makelloses Markdown direkt. Kein Parsing, kein Raten, keine Konvertierungsartefakte. Das fügt null zusätzliche HTTP-Requests hinzu. Wir haben nur geändert, wonach wir fragen.
Alternate Link Discovery: Wenn der Server HTML zurückgibt, prüfen wir auf einen <link rel="alternate" type="text/markdown">-Tag. Falls vorhanden, holen wir die Markdown-Version. Das erfasst Websites wie die von Buytaert, die Markdown-Verfügbarkeit über Auto-Discovery bekanntgeben.
HTML-Konvertierung (Fallback): Für die grosse Mehrheit der Websites, die Markdown noch nicht unterstützen, läuft unsere bestehende Pipeline unverändert. Nokogiri entfernt Nicht-Content-Elemente, ReverseMarkdown konvertiert den Rest.
Das Ergebnis: Wenn eine Website Markdown anbietet, startet unsere Content-Analyse von einer saubereren, treueren Repräsentation dessen, was der Autor tatsächlich geschrieben hat. Besserer Input bedeutet bessere Analyse. Genauere Schreibstil-Erkennung, zuverlässigere Themenextraktion, weniger Artefakte im Content, den unsere KI verarbeitet.
Wir tracken auch, welche Methode für jede analysierte Seite verwendet wurde. Mit der Zeit zeigt uns das, wie schnell das Web Markdown-Serving übernimmt und welche Branchen oder Plattformen vorangehen.
Das grössere Bild
Das ist nicht nur eine technische Optimierung. Es ist ein Signal dafür, wie sich die Beziehung zwischen Content-Erstellern und KI entwickelt.
Die erste Generation der KI-Web-Interaktion war grob: alles scrapen, parsen was geht, auf das Beste hoffen. Die zweite Generation betreten wir jetzt: strukturierte Zusammenarbeit. Websites servieren explizit maschinenlesbare Formate. KI-Agenten deklarieren, was sie konsumieren können. Content Negotiation als gleichberechtigter Teil der Web-Architektur.
Für Content-Strategen und Website-Betreiber ist die umsetzbare Erkenntnis diese: Der gleiche Content kann alle drei Zielgruppen bedienen. Menschen, Suchmaschinen und KI. Wenn Du ihn richtig strukturierst. Markdown ist bereits das Format, in dem die meisten modernen CMS Content intern speichern. Es extern zu servieren ist oft eine Konfigurationsänderung, kein Rewrite.
Die Websites, die jetzt anfangen, werden einen Vorteil haben. Nicht weil die Technologie komplex ist. Das ist sie nicht. Sondern weil KI-Agenten sich merken, welche Quellen ihnen sauberen, verlässlichen Content gegeben haben. In einer Welt, in der KI zunehmend vermittelt, wie Menschen Informationen finden, könnte eine vertrauenswürdige Quelle für Maschinen zu sein genauso wichtig sein wie auf Seite eins von Google zu ranken.
Was Du jetzt tun kannst
Wenn Du eine Website betreibst, die regelmässig publiziert, gibt es drei konkrete Schritte.
Prüfe Dein CMS: Viele moderne Content-Management-Systeme speichern Inhalte bereits in Markdown oder können es exportieren. Wenn Dein System das kann, ist Markdown-Serving oft eine Plugin- oder Konfigurationsfrage.
Implementiere Content Negotiation: Der technische Aufwand ist überschaubar. Ein Server muss den Accept-Header auswerten und bei text/markdown eine andere Antwort liefern. Für statische Websites kann das ein einfaches Nginx- oder Apache-Rewrite-Rule sein.
Füge Auto-Discovery hinzu: Selbst wenn Du Content Negotiation nicht sofort implementieren willst, kannst Du einen <link rel="alternate" type="text/markdown">-Tag zu Deinem HTML hinzufügen. Das signalisiert KI-Agenten, dass eine sauberere Version verfügbar ist.
Die Websites, die heute anfangen, werden in zwei Jahren nicht erklären müssen, warum sie für KI optimiert haben. Sie werden erklären müssen, warum sie es nicht getan haben.
Danksagung
Dieser Artikel wurde inspiriert durch die hervorragende Arbeit von Benni Mack und Dries Buytaert. Beide haben wichtige Vorarbeit zu diesem Thema geleistet. Vielen Dank für die Inspiration und die praktischen Experimente, die zeigen, wie relevant dieses Thema bereits heute ist.