Moin. Ich möchte nicht, dass man meine Homepage bei Google findet... Kann man das unterbinden?
Meine Homepage soll nicht bei Google gefunden werden
- KioTronic
- Erledigt
-
-
Du könntest versuchen mittels .htaccess den googlebot zu blockieren. Dann gibts es eine Robots.txt an welche sich Suchmaschienen aber nur freiwillig halten.
Wenn du mit einer index.php arbeitest könntest du den $_SERVER('HTTP_USER_AGENT') auf google prüfen und mit einem header('HTTP/1.0 403 Forbidden', true, 403);. antworten
https://www.sistrix.de/frag-si…meiner-website-verbieten/
-
Jede vernünftige Suchmaschine, auch Google, hält sich an die robots.txt, die genau dafür gedacht ist. Alle anderen Methoden mit .htaccess und so sind wenig sinnvoll.
Also einfach eine robots.txt in das Hauptverzeichnis der Website legen (http://www.example.com/robots.txt) mit
als Inhalt.
-
Also wenn du möchtest das Menschen die Seite finden können - die aber nicht im Google-Index auftauchen soll dann ist wirklich die robots.txt eine gute Lösung.
Wenn du allerdings allgemein möchtest das die Seite von Menschen wie von Suchmaschinen nicht aufgerufen werden kann würde ich durchaus auf einen Passwortschutz via .htaccess setzen.
HIer mal zwei entsprechende Anleitungen:
-
Also wenn du möchtest das Menschen die Seite finden können - die aber nicht im Google-Index auftauchen soll dann ist wirklich die robots.txt eine gute Lösung.
Wenn du allerdings allgemein möchtest das die Seite von Menschen wie von Suchmaschinen nicht aufgerufen werden kann würde ich durchaus auf einen Passwortschutz via .htaccess setzen.
HIer mal zwei entsprechende Anleitungen:
Thats what he said
-
Manch einer Denkt ich wäre noch nicht wach... das ist es aber natürlich nicht...
Geht natürlich nur darum das du es ohne Anleitung und Link gepostet hast
Der Jung muss noch selber Google benutzen...
-
Danke... mit der robot.txt habe ich nun die Datei erstellt... Aber davor war sie schon findbar. kann man das löschen?
-
Aber davor war sie schon findbar. kann man das löschen?
https://support.google.com/webmasters/answer/1663419?hl=de
Oder alternativ ein paar Wochen bzw. Monate warten, dann passiert das automatisch.
-
Hmmm entweder 3 Monate warten, oder dich mittels google webmastertools als Inhaber der Seite registrieren. Und im Anschluss sie da rauslöschen.
... das ist etwas skurril ... aber man muss sie erst anmelden und sie dann löschen zu lassen.... oder man wartet bis er sie scrollt und die robots.txt liest.
https://www.google.com/webmasters/
Du kannst übrigends mit einer Suche "site:webseite.de" prüfen was google alles von der Seite erfasst hat.
-
Unabhängig von der Anzeige bei Google noch ein Hinweis: Das Web-Archive (Wayback-Machine) ignoriert robots.txt-Dateien[1]. Wenn man seine Seite also nicht dauerhaft bei dem Web-Archive gespeichert haben will, hilft wohl nur ein Ausschluss via .htaccess etc.
[1] https://www.heise.de/newsticke…g-robots-txt-3693558.html