Benzerlik Algoritmaları Hakkında
-
Merhaba hocalar,
Şu aralar uğraştığım bir projede benzerlik bulmam gerekiyor. Ancak hangi algoritmayı hangi durumda kullanmam doğru olur pek bir karara varamadım. Şöyle bir şema gördüm:

Benim elimdeki sayılar da continuos olan da var discrete de.
Biraz daha ayrıntıya inersem elimdeki textten özellik çıkarıyorum kimisi o özelliğin görülme sayısınıı ifade ederken kimisi kendi başına bir oran (örneğin kelime/cümle sayısı oranı). Böyle bir durumda neye göre nasıl bir seçim yapmalıyım?
-
Hacım continous taraftan gitmen senin için daha avantajlı. Sonuçta elindekiler sayı ve discrete de pek sayılmaz, kelimelerden oluşmuş vektörlerin olsaydı falan o taraf daha mantıklı olurdu senin için.
Euclidean yapabileceğin en basit uzaklık karşılaştırması, cosine kullanırsan da daha normalize bi karşılaştırma yapmış olursun burdan nasıl ifade ederim tam bilemedim. İkisini de dene hangisi daha düzgün sonuç verirse onu kullan en iyisi :)
-
Tam ne yapmaya calistigini anlayamadim hocam aciklar misin daha ayrintili
-
NmC bunu yazdı
Hacım continous taraftan gitmen senin için daha avantajlı. Sonuçta elindekiler sayı ve discrete de pek sayılmaz, kelimelerden oluşmuş vektörlerin olsaydı falan o taraf daha mantıklı olurdu senin için.
Euclidean yapabileceğin en basit uzaklık karşılaştırması, cosine kullanırsan da daha normalize bi karşılaştırma yapmış olursun burdan nasıl ifade ederim tam bilemedim. İkisini de dene hangisi daha düzgün sonuç verirse onu kullan en iyisi :)
sağol hocam ikisiyle de test edeyim ben. peki başka hangi algoritmalar, hangi koşullarda kullanılıyor benzerlik bulmada?
@anubisx hocam pm attım sana
-
Gormeyenler icin up
-
Lightsaber bunu yazdıNmC bunu yazdı
Hacım continous taraftan gitmen senin için daha avantajlı. Sonuçta elindekiler sayı ve discrete de pek sayılmaz, kelimelerden oluşmuş vektörlerin olsaydı falan o taraf daha mantıklı olurdu senin için.
Euclidean yapabileceğin en basit uzaklık karşılaştırması, cosine kullanırsan da daha normalize bi karşılaştırma yapmış olursun burdan nasıl ifade ederim tam bilemedim. İkisini de dene hangisi daha düzgün sonuç verirse onu kullan en iyisi :)
sağol hocam ikisiyle de test edeyim ben. peki başka hangi algoritmalar, hangi koşullarda kullanılıyor benzerlik bulmada?
@anubisx hocam pm attım sana
Bu sordukların aslında uzaklık fonksiyonları, euclidean,cosine,battacharya,manhattan,mahalonobis uzar gider. Matlabda falan çalışıyorsan pdist diye bir fonksiyon var onun parametrelerine bak istemediğin kadar var :))
