Data Scrap Yardım
-
Herkese merhaba,aşağıdaki linkten 200 kadar var ,ve bu sayfalardan telefon ve mail adresini almak istiyorum..telefon tamamda,mail adresi javascript ile korunmuş bir türlü yapamadım.
yardımcı olurmusunuz.
link: http://www.ved.gov.ru/eng/companies/exporters/?action=companyinfo&id=49008 (id 49009,48567 gibi değişince diğer şirket geliyor)
-
sabahın köründe hiç uğraşasım yok
<td><span id="e876723063">[javascript protected email address]</span><script type="text/javascript">/*<![CDATA[*/eval("var a=\"_L@MTEsvyuZ5pFVg-0PUBrfOqDlQAWK2XRetNmwcxa+bnIC9H73zh.dJ6k1GioSj8Y4\";var b=a.split(\"\").sort().join(\"\");var c=\"bJdGJh@GF.a7h@1o\";var d=\"\";for(var e=0;e<c.length;e++)d+=b.charAt(a.indexOf(c.charAt(e)));document.getElementById(\"e876723063\").innerHTML=\"<a href=\\\"mailto:\"+d+\"\\\">\"+d+\"</a>\"")/*]]>*/</script></td>
-
end bunu yazdı
sabahın köründe hiç uğraşasım yok
id="e876723063">[javascript protected email address] < class="-attribute-name">// ="text/javascript">/*\"+d+\"\"")/*]]>*/ // ]]>
akşamda olur :)
-
regex ile a ve c verisini alsan; js'deki çözme fonksyionunu hangi programlama dili kullanıyorsan onunla yazsan ve çözsen olmaz mı?
çözen fonksiyon basit aslında.
-
Python kullanıyorsan bu şekilde yapabilirsin
import requests import js2py r = requests.get("http://www.ved.gov.ru/eng/companies/exporters/?action=companyinfo&id=49008") def extract_email(html): # regex bilmiyorum emailjs = html[html.find("CDATA[*")+1:html.rfind("*/")] emailjs = emailjs[emailjs.find("(")+2:emailjs.rfind(")")] s = emailjs.split('document')[0] + " d" email = js2py.eval_js(s.decode("string_escape")) return email mail = extract_email(r.content)
u'consol.s@mail.ru'
-
sancaks bunu yazdıend bunu yazdı
sabahın köründe hiç uğraşasım yok
id="e876723063">[javascript protected email address] < class="-attribute-name">// <!CDATA ="text/javascript">/*\"+d+\"\"")/*]]>*/ // ]]>
akşamda olur :)
ne lazım sana php mi?
-
end bunu yazdısancaks bunu yazdıend bunu yazdı
sabahın köründe hiç uğraşasım yok
id="e876723063">[javascript protected email address] < class="-attribute-name">// <!CDATA ="text/javascript">/*\"+d+\"\"")/*]]>*/ // ]]>
akşamda olur :)
ne lazım sana php mi?
hiç farketmez, şu 200-300 adresi çekeyim yeter