Local De Çalışan Bir AI Arıyorum.
-
M-S-T-F bunu yazdı
Speech to text için Aİ tarafına girmeye gerek yok. Gereksiz iş yükü ve maliyet yaratır. Yıl 2020'de bile çokta anlaşılır olmayan türkçe youtube videolarının altyazıları için dandik bi laptopta çalıştırdığım pyhon scriptle yapıyordum. Video uzunluğuna göre 15-20 dakikalık videoda bir iki dakikada sonuç alıyordum. Doğruluk oranı genel olarak %80-90 civarlarında idi bazen karmaşık yerlerde zortluyordu ama 4-5 sene oldu ve illaki bir iyileştirme olmuştur. İngilizce videolarda falan muhtemelen çok daha başarılıdır.
Farklı diller için farklı kodlar illaki gerekir ancak eğer çok ihtiyaç varsa ve MK sorununa çözüm bulamıyorsanız bu tarz birşeyler ayarlarım uygun yollu. Ki aslında chatgpt ile kendinizde yapabilirsiniz muhtemelen...Chatgpt önermişsin ama chatgpt açık kaynaklı mı ? Ücretsiz mi ? localde çalışabiliyor mu ? Benim ihtiyaçlarım bunlar Whisper yeterli benim için. Konun ilk mesajını okursan neye ihtiyacım olduğunu anlarsın :D 15 20 dk lık video değil 10 saatlik videolar var.
Altyazı M.K. sorunu Real time process olmadığı için çok büyük bir sorun değil benim için. Videoya olan Srt üretildiğinde arama yapıp satırı silmem gerekiyor sadece bu kadar.
-
hypnot1c bunu yazdıM-S-T-F bunu yazdı
Speech to text için Aİ tarafına girmeye gerek yok. Gereksiz iş yükü ve maliyet yaratır. Yıl 2020'de bile çokta anlaşılır olmayan türkçe youtube videolarının altyazıları için dandik bi laptopta çalıştırdığım pyhon scriptle yapıyordum. Video uzunluğuna göre 15-20 dakikalık videoda bir iki dakikada sonuç alıyordum. Doğruluk oranı genel olarak %80-90 civarlarında idi bazen karmaşık yerlerde zortluyordu ama 4-5 sene oldu ve illaki bir iyileştirme olmuştur. İngilizce videolarda falan muhtemelen çok daha başarılıdır.
Farklı diller için farklı kodlar illaki gerekir ancak eğer çok ihtiyaç varsa ve MK sorununa çözüm bulamıyorsanız bu tarz birşeyler ayarlarım uygun yollu. Ki aslında chatgpt ile kendinizde yapabilirsiniz muhtemelen...Chatgpt önermişsin ama chatgpt açık kaynaklı mı ? Ücretsiz mi ? localde çalışabiliyor mu ? Benim ihtiyaçlarım bunlar Whisper yeterli benim için. Konun ilk mesajını okursan neye ihtiyacım olduğunu anlarsın :D 15 20 dk lık video değil 10 saatlik videolar var.
Altyazı M.K. sorunu Real time process olmadığı için çok büyük bir sorun değil benim için. Videoya olan Srt üretildiğinde arama yapıp satırı silmem gerekiyor sadece bu kadar.
Chatgpt önermiyorum, chatgptye bu bahsettiğim işi yapacak python kodunu ücretsiz sürümüyle yazdırıp lokalde free şekilde çalıştırabilirsin diyorum hocam. Ben mi anlatamadım sen mi anlamadın emin değilim. GPU gücüne göre bir iki gece açık bırakıp srtleri çıkarttırırsın python ile, istersen txt olarakta çıkarttırırsın. Ufak bir script ile hallolur.
-
M-S-T-F bunu yazdıhypnot1c bunu yazdıM-S-T-F bunu yazdı
Speech to text için Aİ tarafına girmeye gerek yok. Gereksiz iş yükü ve maliyet yaratır. Yıl 2020'de bile çokta anlaşılır olmayan türkçe youtube videolarının altyazıları için dandik bi laptopta çalıştırdığım pyhon scriptle yapıyordum. Video uzunluğuna göre 15-20 dakikalık videoda bir iki dakikada sonuç alıyordum. Doğruluk oranı genel olarak %80-90 civarlarında idi bazen karmaşık yerlerde zortluyordu ama 4-5 sene oldu ve illaki bir iyileştirme olmuştur. İngilizce videolarda falan muhtemelen çok daha başarılıdır.
Farklı diller için farklı kodlar illaki gerekir ancak eğer çok ihtiyaç varsa ve MK sorununa çözüm bulamıyorsanız bu tarz birşeyler ayarlarım uygun yollu. Ki aslında chatgpt ile kendinizde yapabilirsiniz muhtemelen...Chatgpt önermişsin ama chatgpt açık kaynaklı mı ? Ücretsiz mi ? localde çalışabiliyor mu ? Benim ihtiyaçlarım bunlar Whisper yeterli benim için. Konun ilk mesajını okursan neye ihtiyacım olduğunu anlarsın :D 15 20 dk lık video değil 10 saatlik videolar var.
Altyazı M.K. sorunu Real time process olmadığı için çok büyük bir sorun değil benim için. Videoya olan Srt üretildiğinde arama yapıp satırı silmem gerekiyor sadece bu kadar.
Chatgpt önermiyorum, chatgptye bu bahsettiğim işi yapacak python kodunu ücretsiz sürümüyle yazdırıp lokalde free şekilde çalıştırabilirsin diyorum hocam. Ben mi anlatamadım sen mi anlamadın emin değilim. GPU gücüne göre bir iki gece açık bırakıp srtleri çıkarttırırsın python ile, istersen txt olarakta çıkarttırırsın. Ufak bir script ile hallolur.
Anlatamadın.
Orda bir köy var uzakta o köy bizim köyümüz diyerek isim bile vermeden ufak bir scriptten bahsediyorsun. İsmi ne ? AI olmayan o scriptin?
Sen net olarak bir bilgi veremiyorsun ki :| Yorumun doğru bir yönlendirme bile değil. Yaparsın edersin gibilerinden yazmışsın. Bİr çok AI in temelinde zaten python dili kullanıyor. Bu senin mucizevi script AI kullanmıyor mu şimdi? ilk yorumunda illakı iyileştirme olmuştur dediğin şey AI'ın kendisi zaten.
Geceden bilgisayarı bırakmama gerek yok. 4 saatlik bir videoyu 15 20 dakikada hallediyor. CUDA çekirdeği çok yüksek bir ekran kartım olmasada.
Anlaşamayacağız gibi. Yazdıklarımı okumadıysan oku okuduysan da tekrar okursan sevinirim.
-
Copernic Search Engine www.copernic.com, video içlerini yakalayamıyor mu acaba?
-
https://anythingllm.com/
-
hocam localde çalışanlar çok basit oluyor işini göreceğini zannetmiyorum
-
xylgn_ bunu yazdı
hocam localde çalışanlar çok basit oluyor işini göreceğini zannetmiyorum
https://www.tahribat.com/forum/local-de-calisan-bir-ai-ariyorum-258188#msg3420008
-
hypnot1c bunu yazdı
Havalar soğuyunca tekrar bu soruna döndüm. Konuya denk gelen olur nasıl yaptığını soran olur diye ne yaptığımı yazayım. Bir çok text to speech AI var fakat benim istediğim tam tersi.
https://github.com/openai/whisper
Denk geldiğim Localde çalışan, açık kaynaklı Whisper'ı kullanıyorum. %80 %90 oranında doğru bir şekilde Türkçe altyazı çıkartıyor. Bu benim için yeterli bir değer. Fazlasıyla işimi görüyor. (RTX 2080 ekran kartında modeller arasında geçişler yaparak large-V3, medium, turbo değiştiriyorum duruma göre)
github sayfasında nasıl yükleneceği ile ilgili yönergeler var. Yinede yol göstermesi açısından şu videoya bakılabilir.
Ayrıca araştırırken Windows ortamında bile bu yükleme adımlarını otomatik olarak yapan Pinokio'ya denk geldim. İndirip otomatik olarak Whisper-WEBUI yüklenip bu işlem yapılabiliyor.
Videolar arasında bir konu üzerinde arama yapacağım zaman, çıkartılan altyazılarda arama yapıp o videonun zamanına giderek istediğimi bulabiliyorum artık. Yalnız şu aralar "Altyazı M.K." sorununa denk geliyorum. Bu nasıl çözülecek onu bekliyoruz.
ya bunu mikrofon yerine direkt bilgisayar audiosunu input olarak verebiliyor muyuz?
Denedim olmadı bir türlü.
-
Hocam denemediysen bi faster-whisperı dene. Ben bunu evimde local çalışan voice assistant için kullanıyorum şimdilik verdiğim sesli komutlarda bir problem olmadı hiç.
https://github.com/SYSTRAN/faster-whisper
yukarıdakinin direk standalone exe hali. Burdaki faster-whisper-xxl ı deneyebilirsin, faster-whisper a ek olarak birkaç ek özellik de içeriyor.
https://github.com/Purfview/whisper-standalone-win
-
torpedo_XL bunu yazdı
Hocam denemediysen bi faster-whisperı dene. Ben bunu evimde local çalışan voice assistant için kullanıyorum şimdilik verdiğim sesli komutlarda bir problem olmadı hiç.
https://github.com/SYSTRAN/faster-whisper
yukarıdakinin direk standalone exe hali. Burdaki faster-whisper-xxl ı deneyebilirsin, faster-whisper a ek olarak birkaç ek özellik de içeriyor.
https://github.com/Purfview/whisper-standalone-win
"This implementation is up to 4 times faster than openai/whisper for the same accuracy while using less memory. The efficiency can be further improved with 8-bit quantization on both CPU and GPU."
Hadi be. Vaad ettikleri doğruysa çok iyi :D Müsait bir zamanda deniyeceğim bunu. Karşılaştırma yapıp yazarım. Teşekkürler.
Türkçe dilinde daha iyi sonuçlar verdiği için Model olarak large-V3 ya da turbo modelini kullanıyorum. Aynı modelde 4 kat hızlı, aynı ya da daha iyi çeviri sonuçları veriyorsa buna geçerim.
Whisper --help ve manuelini kontrol ettiğim ama direkt olarak source'u audio file istiyor.
Yanlış anlamadıysam senin bilgisayarın ya da cihazın ses çıkışını source olarak göstermek istiyorsun değil mi? Araştırma odağım farklı olduğu için bir bilgim yok. Nasılsa whisper kullanırken video dosyasını direkt işleyemeyip ffmpeg ile sesi extract edip, edilen ses dosyasını whisper işliyorsa senin ihtiyacını yapan bir kütüphane, program, script olabilir.
Yani aklıma ilk insanlar gibi bir çözüm geldi ama çok saçma olabilir. Mikrofonu source olarak kullanabiliyorsan, iki ucu erkek 3.5mm stereo jackı cihazın audio_output ve mic portuna takabilirsin :|
hypnot1c tarafından 16/Eki/24 20:02 tarihinde düzenlenmiştir
ai yapay zeka local speech to text voice to text ne yapayi hal 9000