folder Tahribat.com Forumları
linefolder Database - Veritabanı
linefolder Aynı İsme Sahip Yazarları Unique Tutma



Aynı İsme Sahip Yazarları Unique Tutma

  1. KısayolKısayol reportŞikayet pmÖzel Mesaj
    Amatör Üye
    masteryoda
    masteryoda's avatar
    Kayıt Tarihi: 15/Mayıs/2012
    Erkek

    Merhaba,
    authors tablomuz olsun içerisinde id ve name alanları ben kitapyurdu,xyz,zyx sitelerinden tüm yazarları kaydetmek isteyeyim gayet normal olarak şöyle bir sorun çıkıyorki bazı yazarların ismi birebir aynı ama aslında ayrı kişiler bunları tabloda nasıl bir unique değer ile tutabilirim kitap yurdu burada id gibi bir değer de tutmuş ama diyelim bir yerden xml alıyor orada ki listede gelen mahmut coşkun kendi yazarlar tablosunda bulunan mahmut coşkun' dan farklı biri yeni bir mahmut coşkun veya kendisinde bulunan iki mahmut coşkundan biri ama hangisi?
    Yorum, öneri, hunharca eleştrilerinizi bekliyorum.
    örnek
    https://www.kitapyurdu.com/yazar/mahmut-coskun/52986.html

    https://www.kitapyurdu.com/yazar/mahmut-coskun/209780.html

    --------------------------------------------------------------------

    https://www.kitapyurdu.com/yazar/mahmut-sahin/16719.html

    https://www.kitapyurdu.com/yazar/mahmut-sahin/53460.html

    ----------------------------------------------------------------

  2. KısayolKısayol reportŞikayet pmÖzel Mesaj
    Retro
    by_Tet
    by_Tet's avatar
    Kayıt Tarihi: 22/Mayıs/2012
    Erkek

    Hocam zaten sırf bu durum için id'yi unique primary ve ai yapıyoruz.

    Daha geniş tablo oluşturma için database normalization öğrenmen gerekebilir, ancak özetle ID candır, kimlik numarasıdır, kafa kağıdıdır


    iyibu! yeniden..
  3. KısayolKısayol reportŞikayet pmÖzel Mesaj
    NoktaliVirgul
    NoktaliVirgul's avatar
    Kayıt Tarihi: 02/Temmuz/2007
    Erkek

    Bende oyumu otomatik artan id'den yana kullanıyorum.


    If my calculations are correct, when this baby hits eighty-eight miles per hour... you"re gonna see some serious shit.
  4. KısayolKısayol reportŞikayet pmÖzel Mesaj
    aLsanCaK
    aLsanCaK's avatar
    Kayıt Tarihi: 30/Kasım/2007
    Erkek

    dönen xml içinde sadece isim değil id yide dönersen sorun çözülür

  5. KısayolKısayol reportŞikayet pmÖzel Mesaj
    coder2
    coder2's avatar
    Kayıt Tarihi: 15/Mart/2007
    Erkek

    Sanırım sen şunu sormak istiyorsun ;  Kitapyurdu sitesinden yazarları çektim mahmut coşkun adında birden fazla yazar var. Sonra gittim başka bir siteden daha yazarları çekiyorum orada da mahmut coşkun adında bir veya birden fazla yazar bilgisi çektim. Bu mahmut coşkunları ne yapacağım ?

    Çektiğin sitelerde muhakkak id değerine göre tutuyordur bu isimleri. (Örnekte belirtmişsin zaten) Sitelerden yazarları çekerken varsa kısa biyografilerini çekip regex ile doğum tarihi vs buldurabilirsin belki. Ya da yazar isimlerini çekerken kitaplarının isimlerini de çektirirsin. (Kitap isimleri daha mantıklı bence) Sonra bunlara göre kıyaslama yaptırabilirsin diye düşünüyorum. Aynı isme sahip yazarların aynı isimlerde kitaplar yazması çok düşük bir olasılık olsa gerek.

    Tabi yazdığınız bot , yazarları ve diğer bilgileri çekip tablo veya tablolara kaydettikten sonra veritabanı yedeğini alıp bu ayıklama işine girmeni tavsiye ederim.


    Önceleri Kızlar Utanınca Kızarırdı Şimdilerde Kızarınca Utanıyorlar..
  6. KısayolKısayol reportŞikayet pmÖzel Mesaj
    TeRRoR
    TeRRoR's avatar
    Kayıt Tarihi: 06/Nisan/2007
    Erkek
    coder2 bunu yazdı

    Sanırım sen şunu sormak istiyorsun ;  Kitapyurdu sitesinden yazarları çektim mahmut coşkun adında birden fazla yazar var. Sonra gittim başka bir siteden daha yazarları çekiyorum orada da mahmut coşkun adında bir veya birden fazla yazar bilgisi çektim. Bu mahmut coşkunları ne yapacağım ?

    Çektiğin sitelerde muhakkak id değerine göre tutuyordur bu isimleri. (Örnekte belirtmişsin zaten) Sitelerden yazarları çekerken varsa kısa biyografilerini çekip regex ile doğum tarihi vs buldurabilirsin belki. Ya da yazar isimlerini çekerken kitaplarının isimlerini de çektirirsin. (Kitap isimleri daha mantıklı bence) Sonra bunlara göre kıyaslama yaptırabilirsin diye düşünüyorum. Aynı isme sahip yazarların aynı isimlerde kitaplar yazması çok düşük bir olasılık olsa gerek.

    Tabi yazdığınız bot , yazarları ve diğer bilgileri çekip tablo veya tablolara kaydettikten sonra veritabanı yedeğini alıp bu ayıklama işine girmeni tavsiye ederim.

    arkadaşın dediği yöntem iş görebilir. ayrıca bu işi botla daha hızlı yaptırmak için önce her siteyi ayrı ayrı gezip gerekli bilgileri topladıktan sonra normalize edersen hem orjinal verileri saklamış olursun (ileride bir yanlış farkedersen oradan düzeltme yapabilirsin) hemde botları paralel çalıştırıp işleri hızlandırırsın.


    herkes programcı olmak zorunda değildir, lütfen bir zorunluluk gibi programlama dilleri öğrenmeye çalışmayın. yabancı dil filan öğrenin amq.// s.kimin etini yerim, kasaba minnet etmem.// ince düşünene kalın girer.//
  7. KısayolKısayol reportŞikayet pmÖzel Mesaj
    SUPERBICO
    SUPERBICO's avatar
    Kayıt Tarihi: 13/Haziran/2008
    Erkek
    TeRRoR bunu yazdı
    coder2 bunu yazdı

    Sanırım sen şunu sormak istiyorsun ;  Kitapyurdu sitesinden yazarları çektim mahmut coşkun adında birden fazla yazar var. Sonra gittim başka bir siteden daha yazarları çekiyorum orada da mahmut coşkun adında bir veya birden fazla yazar bilgisi çektim. Bu mahmut coşkunları ne yapacağım ?

    Çektiğin sitelerde muhakkak id değerine göre tutuyordur bu isimleri. (Örnekte belirtmişsin zaten) Sitelerden yazarları çekerken varsa kısa biyografilerini çekip regex ile doğum tarihi vs buldurabilirsin belki. Ya da yazar isimlerini çekerken kitaplarının isimlerini de çektirirsin. (Kitap isimleri daha mantıklı bence) Sonra bunlara göre kıyaslama yaptırabilirsin diye düşünüyorum. Aynı isme sahip yazarların aynı isimlerde kitaplar yazması çok düşük bir olasılık olsa gerek.

    Tabi yazdığınız bot , yazarları ve diğer bilgileri çekip tablo veya tablolara kaydettikten sonra veritabanı yedeğini alıp bu ayıklama işine girmeni tavsiye ederim.

    arkadaşın dediği yöntem iş görebilir. ayrıca bu işi botla daha hızlı yaptırmak için önce her siteyi ayrı ayrı gezip gerekli bilgileri topladıktan sonra normalize edersen hem orjinal verileri saklamış olursun (ileride bir yanlış farkedersen oradan düzeltme yapabilirsin) hemde botları paralel çalıştırıp işleri hızlandırırsın.

    Arkadaşa katılıyorum. Tüm datalari toplayıp merge ederken, eşleşenleri filtre eder doğru şekilde eslestirirsin. Ismen aynı olanların idleri farklı olacağından bir hataya yol açmaz

  8. KısayolKısayol reportŞikayet pmÖzel Mesaj
    TeRRoR
    TeRRoR's avatar
    Kayıt Tarihi: 06/Nisan/2007
    Erkek
    SUPERBICO bunu yazdı
    TeRRoR bunu yazdı
    coder2 bunu yazdı

    Sanırım sen şunu sormak istiyorsun ;  Kitapyurdu sitesinden yazarları çektim mahmut coşkun adında birden fazla yazar var. Sonra gittim başka bir siteden daha yazarları çekiyorum orada da mahmut coşkun adında bir veya birden fazla yazar bilgisi çektim. Bu mahmut coşkunları ne yapacağım ?

    Çektiğin sitelerde muhakkak id değerine göre tutuyordur bu isimleri. (Örnekte belirtmişsin zaten) Sitelerden yazarları çekerken varsa kısa biyografilerini çekip regex ile doğum tarihi vs buldurabilirsin belki. Ya da yazar isimlerini çekerken kitaplarının isimlerini de çektirirsin. (Kitap isimleri daha mantıklı bence) Sonra bunlara göre kıyaslama yaptırabilirsin diye düşünüyorum. Aynı isme sahip yazarların aynı isimlerde kitaplar yazması çok düşük bir olasılık olsa gerek.

    Tabi yazdığınız bot , yazarları ve diğer bilgileri çekip tablo veya tablolara kaydettikten sonra veritabanı yedeğini alıp bu ayıklama işine girmeni tavsiye ederim.

    arkadaşın dediği yöntem iş görebilir. ayrıca bu işi botla daha hızlı yaptırmak için önce her siteyi ayrı ayrı gezip gerekli bilgileri topladıktan sonra normalize edersen hem orjinal verileri saklamış olursun (ileride bir yanlış farkedersen oradan düzeltme yapabilirsin) hemde botları paralel çalıştırıp işleri hızlandırırsın.

    Arkadaşa katılıyorum. Tüm datalari toplayıp merge ederken, eşleşenleri filtre eder doğru şekilde eslestirirsin. Ismen aynı olanların idleri farklı olacağından bir hataya yol açmaz

    hatta buna bir puntaj algoritması yazıp yeterli puanın altında kalan eşleşmeler için manuel seçenek sunarak editöre bırakabilirsin aynı/farklı seçimini.


    herkes programcı olmak zorunda değildir, lütfen bir zorunluluk gibi programlama dilleri öğrenmeye çalışmayın. yabancı dil filan öğrenin amq.// s.kimin etini yerim, kasaba minnet etmem.// ince düşünene kalın girer.//
  9. KısayolKısayol reportŞikayet pmÖzel Mesaj
    Reskam
    Reskam's avatar
    Kayıt Tarihi: 14/Mayıs/2012
    Erkek
    NoktaliVirgul bunu yazdı

    Bende oyumu otomatik artan id'den yana kullanıyorum.

    +1


    Memento Mori
  10. KısayolKısayol reportŞikayet pmÖzel Mesaj
    Amatör Üye
    masteryoda
    masteryoda's avatar
    Kayıt Tarihi: 15/Mayıs/2012
    Erkek

    @coder2 arkadaş anlamış ne demek istediğimi sanırım bende yazarın kitapları üzerinden gideceğim id önerisi sunan arkadaşlar sorum autoinc primary key sorusu değildi tamamen senaryo sorusuydu coder2, terror teşekkürler

  11. KısayolKısayol reportŞikayet pmÖzel Mesaj
    saybirs
    saybirs's avatar
    Kayıt Tarihi: 24/Temmuz/2009
    Erkek
    TeRRoR bunu yazdı
    coder2 bunu yazdı

    Sanırım sen şunu sormak istiyorsun ;  Kitapyurdu sitesinden yazarları çektim mahmut coşkun adında birden fazla yazar var. Sonra gittim başka bir siteden daha yazarları çekiyorum orada da mahmut coşkun adında bir veya birden fazla yazar bilgisi çektim. Bu mahmut coşkunları ne yapacağım ?

    Çektiğin sitelerde muhakkak id değerine göre tutuyordur bu isimleri. (Örnekte belirtmişsin zaten) Sitelerden yazarları çekerken varsa kısa biyografilerini çekip regex ile doğum tarihi vs buldurabilirsin belki. Ya da yazar isimlerini çekerken kitaplarının isimlerini de çektirirsin. (Kitap isimleri daha mantıklı bence) Sonra bunlara göre kıyaslama yaptırabilirsin diye düşünüyorum. Aynı isme sahip yazarların aynı isimlerde kitaplar yazması çok düşük bir olasılık olsa gerek.

    Tabi yazdığınız bot , yazarları ve diğer bilgileri çekip tablo veya tablolara kaydettikten sonra veritabanı yedeğini alıp bu ayıklama işine girmeni tavsiye ederim.

    arkadaşın dediği yöntem iş görebilir. ayrıca bu işi botla daha hızlı yaptırmak için önce her siteyi ayrı ayrı gezip gerekli bilgileri topladıktan sonra normalize edersen hem orjinal verileri saklamış olursun (ileride bir yanlış farkedersen oradan düzeltme yapabilirsin) hemde botları paralel çalıştırıp işleri hızlandırırsın.

    yazılımcısınız ya hıamına,

    @TeRRoR gerekli açıklamayı yapmış, anlatmaya gerek yok.

    saybirs tarafından 23/Oca/19 21:28 tarihinde düzenlenmiştir
Toplam Hit: 3260 Toplam Mesaj: 13
sql author unique