Robots.Txt Dosyaları Hakkında
-
arkadaşlar robots.text dosyaları hakkında detaylı bilgisi olan varmı
teşekkürler -
Sitenizin arama motorlarında üst sıralarda çıkmasını ve sitenizin içeriğinin daha iyi indexlenmesi için ana dizininize
www.siteniz.com/robots.txt
robots.txt dosyası oluşturun ve içine şu kodu yazın:
Kod:
User-agent: *
allow: /
Bu kod bütün siteyi indexler.Buradaki Kod:
User-agent: *
parametresi bütün arama örümcekleri sitemi indexlesin demek.
Benim sitemi google indexlesin yeter derseniz
Kod:
User-agent:Googlebot
yapmanız gerekmektedir.bunu tavsiteye etmem hepsi gelsin indexlesin
Arama motorlarında çıkmasın dediginiz dizin varsa Disallow yapmanız gerekmektedir.Örnegin admin klasörü yada cgi-bin klasörü gibi dizinler için iyinet in kodunu inceleyebilirsiniz.
http://www.ornek.com/robots.txt
aşagıdaki kodu kullanan google.com içeriginin başka arama motorları tarafından indexlenmemesi için o şu kodu kullanıyor
http://www.google.com/robots.txt
Kod:
User-agent: *
Disallow: /search
Disallow: /groups
Disallow: /images
Disallow: /catalogs
Disallow: /catalog_list
Disallow: /news
Disallow: /pagead/
Disallow: /imgres
Disallow: /keyword/
Disallow: /u/
Disallow: /univ/
Disallow: /cobrand
Disallow: /custom
Disallow: /advanced_group_search
Disallow: /advanced_search
Disallow: /googlesite
Disallow: /preferences
Disallow: /setprefs
Disallow: /swr
Disallow: /url
Disallow: /wml
Disallow: /hws
Disallow: /bsd?
Disallow: /linux?
Disallow: /mac?
Disallow: /microsoft?
-
http://www.robotstxt.org/wc/robots.html
-
http://www.google.com/robots.txt
euhuehe =)=) -
tüm her yeri kayıtlasın dersek "admin" dosyalarını kayıtladığı zaman bir açık ortaya çıkabilirmi?
-
Admin dosyaların sadece admin panelinden link alıyorsa, ve normalde erişimi yoksa, googleın indexlemesinin bi sakıncası yok çünkü göremez orayı...
ama genede bulunduğu bi klasör vs varsa onun tamamını kapatmak sağlık acısından yararlıdır :)
Toplam Hit: 1281 Toplam Mesaj: 6
