HTML Parsing For C#
-
Asayisci bunu yazdı
c# ile ufak bir başlangıç yaptım.
çözemediğim bir sıkıntı var.
var url = "https://www.amazon.com/s/ref=sr_il_to_photo?fst=as%3Aoff&rh=n%3A172282%2Cn%3A502394%2Ck%3Acamera%2Cp_n_condition-type%3A2224371011&keywords=camera&ie=UTF8&qid=1543763277&lo=none"; var httpClient = new HttpClient(); var html = httpClient.GetStringAsync(url); HtmlAgilityPack.HtmlDocument htmlDocument = new HtmlAgilityPack.HtmlDocument(); htmlDocument.LoadHtml(html.Result.ToString()); var ProducList = htmlDocument.DocumentNode.Descendants("ul") .Where(node => node.GetAttributeValue("id", "") .Contains("s-results-list-atf")).ToList(); int say = ProducList.ToList().Count;
kaynak koda bakıyorum 24 adet ürün olması gerekirken ProducList de sadece 4 ürün var.
sebebini çözemedim.
hala çözemedim :)
-
hocam yanlış anlama elbette bakmışsındır da
neden amazonun soap api ını kullanmıyosun html parselemekle uğraşıyosun ?
-
kota var bildiğim kadarıyla.
-
Asayisci bunu yazdı
kota var bildiğim kadarıyla.
Hocam amazon apiye kota koyduysa burada da hızlı isteklere karşı önlem almıştır mutlaka. Gelen anlık istek sayısı bir insanın yapamayacağı şekilde olursa ip ban atabilir (ki çok çok yüksek ihtimalle yapacaktır)
-
Yazilimci bunu yazdıAsayisci bunu yazdı
kota var bildiğim kadarıyla.
Hocam amazon apiye kota koyduysa burada da hızlı isteklere karşı önlem almıştır mutlaka. Gelen anlık istek sayısı bir insanın yapamayacağı şekilde olursa ip ban atabilir (ki çok çok yüksek ihtimalle yapacaktır)
yok aslında yapılan işlem bir kullanıcının yapabileceği şekilde oluyor. bununla ilgili javascript ile yazılmış onlarca proje var. (ücretli). herhangi bir sorun olmuyor. arama sonucuna göre atıyorum çıkan ilk 20 sayfayı html olarak alıp bölüp parçalıyor..