Programlama Genel
Türkçe Kelimelerin Eklerini Ve Kökünü Bulmak (E-Ticater Sitesinde Benzer Ürünleri Bulmak İçin)
Türkçe Kelimelerin Eklerini Ve Kökünü Bulmak (E-Ticater Sitesinde Benzer Ürünleri Bulmak İçin)
-
Merhaba Arkadaşlar, Hepimiz internette ürün alırken ürünün yanında benzer ürünleri görürüz. Ben de böyle birşey yapmam lazım.
Bir e-ticater sitesinde benzer ürünleri bulmak için bir algoritma geliştirmem lazım. Bu algoritmayı da ürünlerin başlıklarına göre aynı kelime nekadar varsa ürünler o kadar benzerdir şeklinde bir mantık uygulayarak yapmayı düşünüyorum. Ama bunu yapmak için kelimelerin eklerini atıp, yalın hallerini elde etmem lazım.
Türkçe NLP yazılımları var mı?
Bunu nasıl yapabiliriz? Böyle kelimeleri eklerine köklerine ayıran bir program var mı?
Yada Web sitesindeki benzer ürünleri daha başka nasıl yöntem ile bulabiliriz.?
Şimdiden Teşekkürler TBT.
Teşekkürler.
-
wm-t bunu yazdı
Merhaba Arkadaşlar, Hepimiz internette ürün alırken ürünün yanında benzer ürünleri görürüz. Ben de böyle birşey yapmam lazım.
Bir e-ticater sitesinde benzer ürünleri bulmak için bir algoritma geliştirmem lazım. Bu algoritmayı da ürünlerin başlıklarına göre aynı kelime nekadar varsa ürünler o kadar benzerdir şeklinde bir mantık uygulayarak yapmayı düşünüyorum. Ama bunu yapmak için kelimelerin eklerini atıp, yalın hallerini elde etmem lazım.
Türkçe NLP yazılımları var mı?
Bunu nasıl yapabiliriz? Böyle kelimeleri eklerine köklerine ayıran bir program var mı?
Yada Web sitesindeki benzer ürünleri daha başka nasıl yöntem ile bulabiliriz.?
Şimdiden Teşekkürler TBT.
Teşekkürler.
bunun icin benzer taglere sahip urunleri listeletebilirsin mesela?
-
Hocam Zemberek var bi stabil calisan. Gerci yakin zamanda arastirmadim pek.
https://github.com/ahmetaa/zemberek-nlp
Wrapperlari falan vardi diye hatirliyorum.
-
Zemberek var ancak onun da eksikleri var. Basit bir şekilde dediğin gibi çözebilirsin olayı veya ürün bilgileri, metinleriyle word2vec sistemini eğitim vectorleri herhangi bir clusterin algoritmasıyla gruplayabilirsin, daha şık olur bence. Tabi çok daha fazla data gerektirir.
-
Benzer ürünleri bir modül haline getirebilirsin, ürün düzenlemede seçerler hangilerini göstermek istiyorlarsa.
Aynı kategori özelliklerine sahip ürünleride gösterebilirsin.
Türkçe kelime algoritmasını yazıyorum şuanda =) -
override bunu yazdı
Benzer ürünleri bir modül haline getirebilirsin, ürün düzenlemede seçerler hangilerini göstermek istiyorlarsa.
Aynı kategori özelliklerine sahip ürünleride gösterebilirsin.
Türkçe kelime algoritmasını yazıyorum şuanda =)Hocam çok fazla ürün var, tek tek yapmak imkansız.
Nasıl bir algoritma üzerine çalışıyorsunuz?
-
söylediğin şekilde bulman zor, aslında kökleri olmadan bulman gerek.
mesela ürün "yeşil lavanta sıvı sabun" olsun, bunun altında diğer sıvı sabunları da göstermek istiyosun. sen tutup bütün kelimelerle ararsan lavantalı parfüm falanda gelecek.
(bence) yapman gereken şey bu ürün adında tanımlayıcı şeyi bulmak. (sıvı sabun) u. bunu da yerinde olsam nasıl yaparım, aynı kategorideki ürün adlarını alırım, sonra orda tekrarlayan sözcük öbeklerine bakarım. (mesela banyo ürünlerinde birden fazla "sıvı sabun" vardır.)
fakat burdan gelen sonuçları da filtrelemen gerekecektir, çünkü ürün adından başka şeylerde tekrarlayabilir, bunu da şöyle yaparsın, her kategorideki tekrarlayanları çıkarırsın, sonra bakarsın aynı şey diğer kategorilerde tekrarlanmışmı. (mesela "sıvı sabun" başka kategoride tekrarlanmamıştır. ama ürün adında "6lı kutu" yazıyosa bu "sodalar" kategorisinde de tekrarlanır falan) diğerlerinde tekrarlananları çıkartırsın bu listeden. sonra bu keywordlerle related ürünleri arar eşleştirirsin.
vaktim olsa eğlence için yapar githuba koyardım, düşünürken bile bayaa eğlendim
-
up
-
Up