Python Herşeye Yeter Mi? (Veri Madenciliği Ve İstatistik)
-
Bioinformatik çalışmak istediğim için Python a başladım, öncesinde R la giriş yapmak istemiştim ancak hem hocalarım hem forum hemde internet aklımı çelerek Biopython un bioconductor den daha iyi olacağını R ın istatistik programı olduğu için kendini bu işe adamıyacaksan bulaşma ya getirilen diyaloglarla beni uzaklaştırdılar.
Daha önce hiç bir programlama dili tecrübem olmadığı için öncesinde çok zorlandım, programı yükleyince R studio tarzı birşey bekliyordum ancak cmd penceresi açılınca bi ağlayasım geldi, ama IDE mevzusunu öğrendim
şuan Canopy kullanıyorum ve bir kaç sorum olacak.
ana sorularım şu, ben veri ve metin madenciliğinede merak saldım ve boş zamanlarımda ilgilenmek istiyorum, rapidminer ı indirdim ancak bazen diyorumki kendimi çok fazla dağıtıp herşeyden biraz öğreniceğime şu pitonda gidebildiğim kadar ilerimi gitsem ki, çünkü öyle her pastadan tadıyim dedikmi hiç birini bitiremiyoruz. bu bağlamda rapidminer ı öğrenmeden ilerleyen zamanlarda veri madenciliği gibi meslek edinmeyeceğim ancak işim olduğunda başvurabileceğim bir kabiliyete pitonda mı devam etmeli yoksa rapidminer da mı?
Aynı şey istatistik içinde geçerli, SPSS, gPad gibi programlar öneriyolar, ben bi kikare,student t testi yapıcam o da kırkyılın başı, arada sırada grafik çizmem gerekicek felan, acaba bu ve benzeri işleri pitonda layıkıyla yapabilirmiyim? aslında sormak istediğim grafikleri hiç iyi yapamıyo gibi(görsel manada) ama bazı araçlar varmış onlarla iyi yaparmışım felan diyolar da anlamıyorm açarmısınız?
kısaca: Veri madenciliği için bir tool ya da IDE önerirmisiniz, ya da canopy de devam etmek ıstıyorum hangi araçları ekleyerek veri madenciliğini rapidpad gibi rahat bir arayüzle yapabilirim ya da hangi araçları ekleyerek çok güzel grafikler çıkarabilirim. birde 2.7 indirdim.
-
Çizdim
-
okey derdini anladım:)
sektöre baktın mı data scientist denilen adamlar ya R ya da python ile çalışıyorlar. R tam olarak bu konuya odaklanmış bir dil ama artık analiz sadece matematik formülleriyle değil hadoop kafka spark gibi analizleri destekleyecek alt yapı yazılımlarınada ihtiyaç duymaktadır.
python özellikle bu konuda öne geçer
-
-
https://www.youtube.com/watch?v=xDo2FpZ0duQ
<="//www.youtube.com//xDo2FpZ0duQ" width="425" height="350"> -
@sandman peki o zaman pythondan şaşmadan emin adımlarla gidicem, SPSS felan hiç uğraşmıyim ancak şu rapid miner gibi bir İDE si var mı ya da tool olarak ne kullanmam lazım veri ya da metin madenciliği yaparken ya da yoluma hem piton hemde rapidminer öğrenerek mi devam edeyim?
@KrypT hocam çok teşekkür ederim kısa zaman içinde detaylı inceliycem, bende biopython un kendi sitesinden indirme cookbok vardı ama burası seklemere aldıgım bir çok yardımcı siteden epey iyi, benim alana doğrudan hitap ediyor.
@piyasaya hitap etsede yine bilgimiz olmuş oldu çok sağol
-
Grafik çizme, t-testi gibi istatistiksel işlemleri pythonla yapmak için scipy da ki kütüphaneleri kullanabilirsin.
-
-
https://www.youtube.com/user/sentdex/playlists bi bak hocam
-
Python veri madenciliğinde aktif olarak rol alıyor istatislik çizelgeleri ise R ile tasarlanıyor.
Python herşeye yetermi derken genel bir başlık gömülü sistemlerde tam hakim olmasada diğer alanlara rahatlıkla hitap eden bir teknoloji.
-
Bioinformatiğe ben de oldukça meraklıyım ama doğru düzgün eğitim verecek birisini bulamadım üniversitede. Güzel bir şeyler bulursan benimle de paylaşırsan sevinirim hocam :)