Phpde Sitelerden Güzelce Link Çekicem
-
<?php header('Content-Type: text/html ; charset=utf-8');
function link_al($urll) {
$url = file_get_contents($urll);
preg_match_all('/href="(.*?)"/i',$url,$gelen);
for ($i=0; $i<count($gelen[1]); $i++){
echo $gelen[1][$i]."<br>";
}
}
link_al("http://www.tahribat.com");
?>---
şimdi burada böyle birşey yaptım.Fakat bazen javascriptli ifadelerde çıkıyor.
bu örnek sadece başka türlü de alabilirim.İstediğim şu ;
eğer içinde http://, www, asp,php,html,htm,aspx vs.. gibi bir kaç dosya uzantısı varsa onu yazdırmak.
yukarıdaki kodun çıktısı
http://www.sudrap.org/paste/text/1685/
#
JavaScript:openWin('previous_weekly_polls.asp?PagePosition= ','poll','toolbar=0,location=0,status=0,menubar=0,scrollbars=1,resizable=0,width=505,height=250'
favicon.ico
StyleSheet.css
javascript:__doPostBack('lbtnEN','')gibi sonuçlar çıkmasın istiyorum.Yani benim için önemli olan linklerin düzgünce alınması
birazcık hastayım kafam dzgün çalışamadı. link deposu yapıcam.Yani tahribat.com yazdığında bütün linkleri çekicek sonra o linkleri açıcak onlardakinide çekicek, sonra onlardakinide...
böylece bir çok link elde edebilirim.Sonra bunu kullanabilirim.Fakat şu link kısmında regexp falan girecek galba :-/
-
hay...düzenleme yok
mesela
JavaScript:openWin('previous_weekly_polls.asp?PagePosition= ','poll','toolbar=0,location=0,status=0,menubar=0,scrollbars=1,resizable=0,width=505,height=250')
http:// falan aldığımda yukarıdaki "previous_weekly_polls.asp" kalmasın.. :-/
edit---
if (eregi('(^http)|(asp$)|(aspx$)|(htm$)',$gelen[1][$i])){
echo $gelen[1][$i]."
";
}yaptım şimdi düzeldi gibi gibi...
2.edit---
preg_match_all('/href="(.*?)"/i',$url,$gelen);
burada ahref=" yapmışım baz yerlerde ' oluyor.Onu nasıl yapabilirim ?
href=('|")
şeklinde mi ?
link havuzu versiyon 0.04 : http://www.sudrap.org/paste/text/1693/
Site sayfasında arama versiyon 0.01 :http://www.sudrap.org/paste/text/1694/
Klasördeki dosyaların içinde arama versiyon 0.01 :http://www.sudrap.org/paste/text/1695/
-
vallahi son halini verim
edit --- en son hali 2. mesajda güncenlenecektir---şöyle birşey yaptım.Tabi burda yine javascript falan varsa almıyor :-/
-
Dostum ben buna uzun gecelerimi verdim.WP-Bot yazacam diye çok uğraştım ama sonuçlar hep problemiydi. İnşallah sen düzgün şekilde yapabilirsin.
-
:-/ hocam sorma yaw..biraz problemli cidden.Yani mantık şu olacak
sitelerden linkler alınacak ikiye ayrılacak
site için - site dışı
daha sonra site içi linklerin başında site.com/ olup olmadığına bakılacak.Yoksa eklenecek.Sonra elde edilen linkler kaydedilecek.
Tabi bu arada linkler çiftlenirse silinecek.Sonra o linkler tek tek bakılacak....
-----
anlatması çok kolayda daha ilk aşamada iş takılıyor.kaldı ki linkler arttıkça biraz problemli olabilir.Benim amacım ne ?
amacım bir site içindeki bütün linkleri çekmek.Yani taribat.com da ne kadar link varsa hepsini link havuzu olarak toplayacağım.
-----
Ben bu konularda imkansız diye düşünmüyorum.Zamanında arama motorları yaptı mı ? yaptı program vardıböyle birşey demek ki oda yaptı.Onlar yaptıysa yapılabiliyormuş..O zaman yapıcam :)
Bittiğinde vericem tahribatta yine..güzel bir paylaşım olur.
fakat php fonksiyonlarını bu kadar fazla bilmiyorum.Yani bol bol düzenli ifade kullanmak lazım sanıyorum.Şimdi link olayını hallettim iki sorun var ilk aşamada
1 - javascript:asdfasdfasd("link.php") gibiyse link.php yi alamıyorum.
2 - linkler çiftlenebiliyor tabi bunu bi döngüyle halledebiliriz sanırım...
en son hali ; tabi biraz karışık :-/ programlamacı olarak baktığınızda performanssız falan gelebilir.Düzgünce çalışsa kodları daha performanslı yazıcam
--------
edit --- en son hali 2. mesajda güncenlenecektir--- -
en son eklenenler ;
- linkler daha düzenli gösteriliyor.Yani forum/index.php gibi bir durumda site.com/forum/index.php olacak
sorunlar ;
- link ikileme problemi var.onu href=" veya href=' şeklinde nasıl yazabilirim bilmiyorum ama onu çözdüğümde çözücem.Ayrıca javascript: li linkleri falna almaz
http://www.sudrap.org/paste/text/1689/
yukardaki linkten ulaşabilirsiniz son haline.Baya geliştiğini düşünüyorum.
iki tane döngüye sokmak zorundayım çünkü
preg_match_all('/href="(.*?)"/i',$url,$gelen);
ile
preg_match_all('/href=\'(.*?)\'/i',$url,$gelen);
farklı .Yani birinde href='index.php' varken diğerinde href="index.php" bunu nasıl aşabilirim fikri olan??
----
bu konuda ısrarla alt alta yazmamın sebebi bu işi çözücem ve bir çok kişinin işine yarayacağını düşünüyorum.bir kaç güne takır takır çalışır :) fakat bilenlerin birazcık yardım etmesi gerekiyor.
-
Zumsuk kolay gele seneye istedim yer kazanım sana bi prje suncam terminal le ilgili senin yapmak istedinin 3 kat fazlası
-
Mx0TBT bunu yazdı:
-----------------------------
Zumsuk kolay gele seneye istedim yer kazanım sana bi prje suncam terminal le ilgili senin yapmak istedinin 3 kat fazlası
-----------------------------:D dostum eyw ..Ta ben önümüzdeki senelerde
1-ufak terminalimsi birşey ya pıcam
2-kendi veritabanı sistemimi yapıcam.Dosyasal birşey oalcak(H)fazla performanslı olmayabilirler fakat şunu anladım ki bir şeyi öğrenmek istiyorsan oturup kasacaksın
--------------
Bu aradaa en son hali için ;
http://www.sudrap.org/paste/text/1693/
burada dayanamadım yine site içi arama motoru yapcıam linklerden faydalanıp :D.
O yüzden şimdi düşünme aşamasındayım.Phpde dosya içinde arama yapan birşey yaptım ufak çaplı.Onuda vereyim;
http://www.sudrap.org/paste/text/1694/
yukarıdaki site içinde arama yapıyor.Link havuzuyla bunu birleştirirseniz dbsiz ufak çapta arama motoru elde edersiniz.
http://www.sudrap.org/paste/text/1695/
son olarak verdiğim dizin içinde arama yapıyor.Yani bulunduğu dizin
/forum/arama.php
ise forum klasoru içindekileri arar.İsterseniz ./ yerine ../ yazarak bir üst klasördekileri falan aratabilirsiniz.Yada klasördeki klasörleri listeletip onları açarak daha köklü bir arama sağlayabilirsiniz.
--
bunların hepsini ikinci mesaja da ekleniyor
-
hocam phpclasses.org da çok uygun sınıflar mevcut yararlanabilirsin
tam içeriğini bilmiyorum ama örnek olarak şunu incelemekte fayda var.
http://www.phpclasses.org/browse/package/1701.html
-
K4R4B4S4N bunu yazdı:
-----------------------------hocam phpclasses.org da çok uygun sınıflar mevcut yararlanabilirsin
tam içeriğini bilmiyorum ama örnek olarak şunu incelemekte fayda var.
http://www.phpclasses.org/browse/package/1701.html
-----------------------------eyw hoca işime baya yarayacak siteymiş :)
herkesin problemi var çözücem bu işi...Burada da yayınlayacaım :D
-
Dosya kaydediyorumda şöyle birşey yapıyorum: http://www.sudrap.org/paste/text/1727/
şimdi burada strip_tags var fakat buradakileri ekliyor
Maalesef gereksiz karakterler çıkıyor benim istediğim örneğin tahribat yazdığımda sadece text çıksın şöyle ; http://www.sudrap.org/paste/text/1728/
burada sadece site anasayfasında kopyala yapıştır yaptım.
edit :
tam açıklamamışım.Mesela exploe ile arasındakileri alabiliyoruz.Fakat ben arasındakileri almak değil aksine silmek istiyorum bunu nasıl yapabilirim