Hallo,
mich würde mal interessieren, welche Erfahrungen die Webserverbetreiber unter euch mit diversen Crawlern und Searchbots gemacht haben. Dadurch, dass mein Webserver von Spammern angegriffen wird, schaue ich mir die Logs ja nun etwas genauer an. Mir sind da 2 solcher bots besonders negativ aufgefallen.
- Ahrefsbot
User-agent | IP Adressen |
Mozilla/5.0 (compatible; AhrefsBot/3.1; +http://ahrefs.com/robot/) | 212.113.35.162, 212.113.37.105, 212.113.37.106, 213.186.119.131, 213.186.119.132, 213.186.119.133, 213.186.119.134, 213.186.119.135, 213.186.119.136, 213.186.119.137, 213.186.119.138, 213.186.119.139, 213.186.119.140, 213.186.119.141, 213.186.119.142, 213.186.119.143, 213.186.119.144, 213.186.120.196, 213.186.122.2, 213.186.122.3, 213.186.127.10, 213.186.127.11, 213.186.127.12, 213.186.127.13, 213.186.127.14, 213.186.127.2, 213.186.127.28, 213.186.127.3, 213.186.127.4, 213.186.127.5, 213.186.127.6, 213.186.127.7, 213.186.127.8, 213.186.127.9, nano2.dc.ukrtelecom.ua, node.beautystore.com.ua |
- Der bot wird in der Ukraine gehostet und scheint völlig außer Kontrolle zu sein.Die Betreiber behaupten zwar er würde eine robots.txt beachten, allerdings hat er sie ein meinem Fall nie abgerufen und stattdessen innerhalb von 13 Stunden meinen Webserver mit mehr als 12000 Anfragen bombardiert. Danach habe ich die Netzwerke in der Firewall blockiert. Immerhin reagieren die Betreiber konstruktiv auf Beschwerden via email.
- Pixray-Seeker
User-agent | IP Adressen |
Pixray-Seeker/1.1 (Pixray-Seeker; http://www.pixray.com/pixraybot; crawler@pixray.com) | 176.9.0.12, 176.9.0.13, 176.9.19.103, 176.9.7.28, 188.40.65.130, 188.40.66.214, 188.40.85.200, 46.4.116.100, 46.4.118.74, 46.4.118.75, 46.4.119.231, 46.4.121.154, 46.4.125.109, 46.4.19.85, 46.4.92.140, 46.4.92.141, 88.198.64.132, 88.198.65.99, 88.198.67.134, 88.198.67.197 |
- Dieser bot wird bei NAMEENTFERNT gehostet und zeigt auch ein etwas seltsames Verhalten. Er hat doch tatsächlich innerhalb von 22 Stunden sage und schreibe 58 mal die robots.txt abgerufen. Wie oft am Tag glauben die Betreiber werde ich meine Meinung und die robots.txt ändern? Sie 1-2 mal am Tag abzurufen ist doch eigentlich völlig ausreichend. Und obwohl ich in der robots.txt schon seit längerem stehen habe:Code
Display More# diese Robots sperren User-agent: * Disallow: /verzeichnisname User-agent: Pixray-Seeker User-agent: Baiduspider . .weitere User-agents . User-agent: AhrefsBot Disallow: /
hat ihn das nicht gehindert, trotzdem von einigen IPs aus zu versuchen die Webseiten zu durchsuchen.
Für mich sieht das so aus, als wäre hinter jeder IP Adresse ein eigenständiges unabhängiges Botsystem und die jeweils erhaltenen Daten werden nicht zwischen den verschiedenen Bots abgeglichen. Sowohl die Betreiber als auch NAMEENTFERNT reagieren sehr ignorant auf Beschwerden. Mehr als eine automatisierte Eingangsbestätigung, dass ein Ticket eröffnet wurde, kommt nicht zurück. Da der Bot sein Verhalten auch 3 Tage später nicht geändert hatte, habe ich die Netze ebenfalls in der Firewall blockiert.