Web Scraping İle İlgili Soru

  1. KısayolKısayol reportŞikayet pmÖzel Mesaj
    tereke34
    tereke34's avatar
    Kayıt Tarihi: 08/Şubat/2014
    Erkek

    Merhaba değerli Murid/ Murideler,

    Şu aralar webscraping işine merak saldım. şu an için excell ve google sheette importxml, importhtml fonksiyonlarıyla birşeyler yaptım. Hatta çokta iyi geldi. Anladığım kadarıyla işin aslı js ve python ile yapılıyor. O kadar derin kodlamaya girmeden önce şunu öğrenmek istiyorum;

    Diyelim ki bir websitede bir button aracılığıyla sağ köşede bir modal box açılıyor, bu modal box a veriler var. Bu verilerin scraping i mümkün mü?

    Çünkü excell ve google sheet buna müsade etmiyor. web scraping extensionları da modaldan veri yakalamıyor. Bir de xpath ın doğru olduğunu bildiğim halde bazı sitelerde importxml fonksiyonu ile veri gelmiyor. Google url yi fetch etmedi yazısı alıyorum. Konu hakkında daha önce tecrübesi olup bilgi paylaşan olursa çok işime yarar. En azından bir yol haritası çizebilirim.

    Örnek site: https://www.backmarket.de/shop/buzz-box-mobile-5453

     


    Nova Vida !
  2. KısayolKısayol reportŞikayet pmÖzel Mesaj
    end
    end's avatar
    Kayıt Tarihi: 16/Ekim/2016
    Erkek

    Adres çubuğunun başına view-source: ekle.

    Senin veri ayikladigin yer burası işte aslen.

    Burada aradığını bulamıyorsan JavaScript ile renderlanan, compute edilen bir şey vardır browser side'ta. Bunu almanın birden fazla yolu var. Headless browser da ayaklandirabilirsin, reverse engineering yaparak JavaScriptle yapılan işi kullandığın dile de portlayabilirsin. External web request vs.


    0x0480 takilin madem ﷽﷽﷽
  3. KısayolKısayol reportŞikayet pmÖzel Mesaj
    angels_demos
    angels_demos's avatar
    Kayıt Tarihi: 03/Haziran/2006
    Erkek

    Bs4 ve selenium ile hersey mumkun :D

  4. KısayolKısayol reportŞikayet pmÖzel Mesaj
    tereke34
    tereke34's avatar
    Kayıt Tarihi: 08/Şubat/2014
    Erkek
    end bunu yazdı

    Adres çubuğunun başına view-source: ekle.

    Senin veri ayikladigin yer burası işte aslen.

    Burada aradığını bulamıyorsan JavaScript ile renderlanan, compute edilen bir şey vardır browser side'ta. Bunu almanın birden fazla yolu var. Headless browser da ayaklandirabilirsin, reverse engineering yaparak JavaScriptle yapılan işi kullandığın dile de portlayabilirsin. External web request vs.

    hocam çok sağolasın, mantığını anladım, cevabı aldım. Hiç olmayan backend bilgimle beni aşar, ama öğrenecem artık :)


    Nova Vida !
  5. KısayolKısayol reportŞikayet pmÖzel Mesaj
    sunyy2003
    sunyy2003's avatar
    Kayıt Tarihi: 20/Ağustos/2005
    Erkek
    angels_demos bunu yazdı

    Bs4 ve selenium ile hersey mumkun :D

    Bir zamanlar ne kastirmistim selenium iyiydi


    bu hayat biterkende aklımda hep sen olacaksın B bu dilden firar eden her söz yaydan çıkmış ok gibi (sagopa kajmer) Sago sıcak ekmek üzerine bal kaymak. "Bla bla" larını tartıda tartar bakkal aylak. Aşkın bir sabunsa köpürt beni Pentax
Toplam Hit: 915 Toplam Mesaj: 5
javascript python web scrape web scraping