# #robots.txt per http://www.istiutoetoile.it # #Nel sito è presente anche una sitemap che aiuterà i robots a scansionare meglio tutte le pagine importanti: # Sitemap: http://www.istiutoetoile.it/sitemap.xml # #Di seguito i contenuti da non indicizzare perchè sono irrilevanti per le ricerche degli utenti. # User-agent:* Disallow: /etoile_academy/staff.php Disallow: /etoile_academy/sede.php # Di seguito tutti i bot, spider che non portano benefici dalla scansione del sito. User-agent: UbiCrawler Disallow: / User-agent: DOC Disallow: / User-agent: Zao Disallow: / User-agent: sitecheck.internetseer.com Disallow: / User-agent: Zealbot Disallow: / User-agent: MSIECrawler Disallow: / User-agent: SiteSnagger Disallow: / User-agent: WebStripper Disallow: / User-agent: WebCopier Disallow: / User-agent: Fetch Disallow: / User-agent: Offline Explorer Disallow: / User-agent: Teleport Disallow: / User-agent: TeleportPro Disallow: / User-agent: WebZIP Disallow: / User-agent: linko Disallow: / User-agent: HTTrack Disallow: / User-agent: Microsoft.URL.Control Disallow: / User-agent: Xenu Disallow: / User-agent: larbin Disallow: / User-agent: libwww Disallow: / User-agent: ZyBORG Disallow: / User-agent: Download Ninja Disallow: / User-agent: wget Disallow: / User-agent: grub-client Disallow: / User-agent: k2spider Disallow: / User-agent: NPBot Disallow: / User-agent: WebReaper Disallow: /