Andreas Ol: Die Seite wurde neu angelegt: „Die Text-Datei "robots.txt" steuert das (Such-)Verhalten der Webcrawler auf Internetseiten. == Allgemeines == Die Datei "robots.txt" befindet sich immer…“

2018-06-19T10:22:52Z

Die Seite wurde neu angelegt: „Die Text-Datei "robots.txt" steuert das (Such-)Verhalten der Webcrawler auf Internetseiten. == Allgemeines == Die Datei "robots.txt" befindet sich immer…“

Neue Seite

Die Text-Datei "robots.txt" steuert das (Such-)Verhalten der [[Webcrawler]] auf Internetseiten.

== Allgemeines ==

Die Datei "robots.txt" befindet sich immer im Root einer Internetpräsenz. Hierin wird geregelt, welche Bereiche der jeweiligen Website besucht werden dürfen und welche zu meiden sind. Auch ist eine Sperrung für Crawler einzelner Suchmaschinen möglich.

== Robots-Exclusion-Standard-Protokoll ==

Über die Übereinkunft im Robots-Exclusion-Standard-Protokoll (kurz ''REP''; weitere Informationen siehe [http://www.weltsicher.de/robots.html hier]) wird geregelt, dass Webcrawler zuerst diese Datei auslesen.
Wichtig ist, dass das Protokoll ausschließlich als Empfehlung verstanden werden darf. Man muss grundsätzlich auf die Mitarbeit der Crawler vertrauen, diese werden auch ''freundliche'' Webcrawler genannt.

== Quellen ==
[http://www.weltsicher.de/robots.html Allgemeines zum Robots-Exclusion-Standard-Protokoll]

[https://www.seo-book.de/onpage/was-der-seo-uber-die-robots-txt-wissen-sollte Zusammenfassung für SEO]]

Robots.txt - Versionsgeschichte

Andreas Ol: Die Seite wurde neu angelegt: „Die Text-Datei "robots.txt" steuert das (Such-)Verhalten der Webcrawler auf Internetseiten. == Allgemeines == Die Datei "robots.txt" befindet sich immer…“