Kütüphaneler: cIntSpeech - sayfa 2

 
Gan Zhi Zhong #:

Gerçekten harika!

İşletim sistemi ve MT5 güncellemesi nedeniyle koddaki "dosya yolunu" değiştirmeniz yeterlidir ve ardından MT5'in en son sürümüyle Windows 11'de TTS uygulayabilirsiniz.

5 yıl içinde konu tamamen modası geçmiş olacak. Günümüzde aptal Microsoft TTS değil, doğal telaffuzlu modern AI modelleri kullanmalısınız. Doğru, RAM veya GPU gerektiriyor. Bu gerekli mi?
 
Edgar Akhmadeev #:
5 yıl içinde konu tamamen modası geçmiş olacak. Günümüzde aptal Microsoft TTS değil, doğal telaffuzlu modern AI modelleri kullanmalısınız. Doğru, RAM veya GPU gerektiriyor. Bu gerekli mi?

TTS'yi MT5 EA'ma entegre etmek sadece temel bir gerekliliktir.

Programlama konusunda kendi kendime öğrendim,

Bu yüzden bahsettiğiniz yapay zeka modellerinin avantajlarıyla da çok ilgileniyorum, ancak nereden başlayacağımı bilmiyorum. Bazı pratik örnekler verebilir misiniz?

Çok teşekkür ederim.

 
Gan Zhi Zhong #:

TTS'yi MT5 EA'ma entegre etmek sadece temel bir gerekliliktir.

Programlama konusunda kendi kendimi eğittim,

Bu yüzden bahsettiğiniz yapay zeka modellerinin faydalarıyla da çok ilgileniyorum, ancak nereden başlayacağımı bilmiyorum. Lütfen bazı pratik örnekler verebilir misiniz?

Çok memnun olurum.

TTS modellerini yüklemedim, sadece LLM, kalitelerini makalelerden ve incelemelerden biliyorum. Rusça sitelerde çok faydalı bilgiler var, ancak sizin için çalışmayacaktır. İngilizce olanları ise bilmiyorum. Ama YouTube'da pek çok şey bulabilirsiniz.

Ayrıca, donanım bağlamınızı bilmiyorum - modelleri nerede çalıştırabileceğinizi - CPU + RAM, GPU NVidia veya AMD, ne kadar VRAM. Çok şey buna bağlı.

Ayrıca, proje ticari ise, çevrimiçi ses modellerine (Text2Speech, Speech2Text) ücretli erişim kullanabilirsiniz. Bunlardan çok fazla var.

Donanımınıza bağlı olarak boyutları değişen huggingface'deki ses modellerini arayın. LLM metin üretimi için en popüler niceleme GGUF 4_K_M'dir. Kalite ve boyut arasında denge kurun.

Hangi yerel platformların ses modellerini desteklediğini size söyleyemem. Ben sadece metin için kullanıyorum - llama.cpp, ollama, GGUF formatındaki modelleri destekliyorlar (ağırlık ölçümü ile), bu da çok fazla bellek tasarrufu sağlıyor.

Belki ONNX formatını seçin, doğrudan MT5'te desteklenir, ancak yalnızca CPU'da, bu nedenle yavaştır ve çok fazla belleğe ihtiyaç duyar.

GitHub - ggml-org/llama.cpp: LLM inference in C/C++
GitHub - ggml-org/llama.cpp: LLM inference in C/C++
  • ggml-org
  • github.com
LLM inference in C/C++. Contribute to ggml-org/llama.cpp development by creating an account on GitHub.
 

Şimdi en iyi 3 yerel yapay zeka sentezleyicisinin Python'da olduğunu öğrendim: coqui TTS, Chatterbox TTS ve Piper TTS.

Henüz denemedim. Python ile hiç dost değilim, bu yüzden "pip install ..." yüklerken her zaman herhangi bir Python kütüphanesini çözemedim.

GitHub - coqui-ai/TTS: 🐸💬 - a deep learning toolkit for Text-to-Speech, battle-tested in research and production
GitHub - coqui-ai/TTS: 🐸💬 - a deep learning toolkit for Text-to-Speech, battle-tested in research and production
  • coqui-ai
  • github.com
📣 ⓍTTSv2 is here with 16 languages and better performance across the board. 📣 ⓍTTS fine-tuning code is out. Check the example recipes. 📣 ⓍTTS can now stream with 📣 ⓍTTS, our production TTS model that can speak 13 languages, is released Blog Post, Demo, Docs 📣 🐶Bark is now available for inference with unconstrained voice cloning. Docs 📣...
 
Edgar Akhmadeev #:

Şimdi en iyi 3 yerel yapay zeka sentezleyicisinin Python'da olduğunu öğrendim: coqui TTS, Chatterbox TTS ve Piper TTS.

Hiç denemedim. Python ile hiç aram yoktur, bu yüzden "pip install ..." yüklerken Python kütüphanelerini çözmeyi hep başaramadım.

Harika. Çok teşekkürler.