<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="de">
	<id>https://somm.fernkurs-wiki.de/w/index.php?action=history&amp;feed=atom&amp;title=Robots.txt</id>
	<title>Robots.txt - Versionsgeschichte</title>
	<link rel="self" type="application/atom+xml" href="https://somm.fernkurs-wiki.de/w/index.php?action=history&amp;feed=atom&amp;title=Robots.txt"/>
	<link rel="alternate" type="text/html" href="https://somm.fernkurs-wiki.de/w/index.php?title=Robots.txt&amp;action=history"/>
	<updated>2026-04-13T22:05:26Z</updated>
	<subtitle>Versionsgeschichte dieser Seite in Social Media Manager</subtitle>
	<generator>MediaWiki 1.37.0</generator>
	<entry>
		<id>https://somm.fernkurs-wiki.de/w/index.php?title=Robots.txt&amp;diff=3798&amp;oldid=prev</id>
		<title>Andreas Ol: Die Seite wurde neu angelegt: „Die Text-Datei &quot;robots.txt&quot; steuert das (Such-)Verhalten der Webcrawler auf Internetseiten.   == Allgemeines ==  Die Datei &quot;robots.txt&quot; befindet sich immer…“</title>
		<link rel="alternate" type="text/html" href="https://somm.fernkurs-wiki.de/w/index.php?title=Robots.txt&amp;diff=3798&amp;oldid=prev"/>
		<updated>2018-06-19T10:22:52Z</updated>

		<summary type="html">&lt;p&gt;Die Seite wurde neu angelegt: „Die Text-Datei &amp;quot;robots.txt&amp;quot; steuert das (Such-)Verhalten der &lt;a href=&quot;/w/index.php/Webcrawler&quot; title=&quot;Webcrawler&quot;&gt;Webcrawler&lt;/a&gt; auf Internetseiten.   == Allgemeines ==  Die Datei &amp;quot;robots.txt&amp;quot; befindet sich immer…“&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Neue Seite&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Die Text-Datei &amp;quot;robots.txt&amp;quot; steuert das (Such-)Verhalten der [[Webcrawler]] auf Internetseiten. &lt;br /&gt;
&lt;br /&gt;
== Allgemeines ==&lt;br /&gt;
&lt;br /&gt;
Die Datei &amp;quot;robots.txt&amp;quot; befindet sich immer im Root einer Internetpräsenz. Hierin wird geregelt, welche Bereiche der jeweiligen Website besucht werden dürfen und welche zu meiden sind. Auch ist eine Sperrung für Crawler einzelner Suchmaschinen möglich. &lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Robots-Exclusion-Standard-Protokoll ==&lt;br /&gt;
&lt;br /&gt;
Über die Übereinkunft im Robots-Exclusion-Standard-Protokoll (kurz &amp;#039;&amp;#039;REP&amp;#039;&amp;#039;; weitere Informationen siehe [http://www.weltsicher.de/robots.html hier]) wird geregelt, dass Webcrawler zuerst diese Datei auslesen.&lt;br /&gt;
Wichtig ist, dass das Protokoll ausschließlich als Empfehlung verstanden werden darf. Man muss grundsätzlich auf die Mitarbeit der Crawler vertrauen, diese werden auch &amp;#039;&amp;#039;freundliche&amp;#039;&amp;#039; Webcrawler genannt. &lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
== Quellen ==&lt;br /&gt;
[http://www.weltsicher.de/robots.html Allgemeines zum Robots-Exclusion-Standard-Protokoll]&lt;br /&gt;
&lt;br /&gt;
[https://www.seo-book.de/onpage/was-der-seo-uber-die-robots-txt-wissen-sollte Zusammenfassung für SEO]]&lt;/div&gt;</summary>
		<author><name>Andreas Ol</name></author>
	</entry>
</feed>