Metindeki Kelimeleri Ayrıştırıp Listelemek?
-
Merhaba arkadaşlar, bir sözlük projesi için bir metindeki tüm sözcükleri alt alta sıralamam gerekiyor. Tavsiyeleriniz nelerdir? Teşekkür ederim.
Örnek metin:
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed dictum sollicitudin arcu, vel accumsan est laoreet in.
Kelimelerin Listelenmiş Hali:
Lorem
ipsum
dolor
sit
amet,
consectetur
adipiscing
elit.
Sed
dictum
sollicitudin
arcu,
vel
accumsan
est
laoreet
in. -
Split("")
-
Eğer örnekteki gibi ise boşluğu göre metindeki kelimeleri bir diziye atabilirsin hocam.
<?php
$str = "Hello world. It's a beautiful day.";
print_r (explode(" ",$str));
?>PHP ile bu şekilde yapabilirsin mesela.
-
her programlama dilinde stringleri verdiğin stringe göre arayıp bölen bir fonksiyon illa oluyor hocam. boşluk ve satır sonu (/r/n) karakteri ile bölüp sonrasında 3 ten az harfli olanları çıkarabilirsin. (the, on, in gibi şeyleri istemezsni diye düşündüm)
-
Etiketlerde excell ve word yazmışsınız. Onlarda nasıl yaparsınız bilmiyorum fakat programlama dillerinde replace işlemi yaparak boşluk karakteri yerine
veya /n koyarak Alt satıra geçmesini sağlayabilirsiniz.Php için mesela;
$metin = "deneme sallamasyon vs vs vs"; echo str_replace(" ", "\n", $metin);
-
bende yazayım bare :)
foreach (var item in "Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed dictum sollicitudin arcu, vel accumsan est laoreet in.".Split(' ')) { Console.WriteLine(item); }
-
arkadaşların dediği gibi ama daha karmaşık ise regex de kullanabilirsin
-
metini at yapmaya çalışayım elimdeki toolda öyle bir özellik vardı
-
Birden fazla olan kelimeler de silinecek mi?
Edit
Aa bi dakka bi dakka sen gerçek @balik_ mısın geri dönmüşsün :D
noname tarafından 03/Ara/19 01:02 tarihinde düzenlenmiştir -
Zamanında lazım olmuştu yazmıştım. Linkte .exe si var, kaynak kodunu da bulursam atarım.
https://yadi.sk/d/Rj8oco7c006oA
-
ADSIZ bunu yazdı
Zamanında lazım olmuştu yazmıştım. Linkte .exe si var, kaynak kodunu da bulursam atarım.
Delimiterler de geliyor resimde görüldüğü üzere. Noktalama işaretlerinin olmaması lazım.