Skip to content

Linux Ses Tanıma Durumu

22 de Mayıs de 2021

Linux’ta konuşma tanıma, Windows ve Mac platformlarını takip ediyor çünkü hem Microsoft hem de Apple, temel işletim sistemlerine sesli komut veya sesli asistan yazılımı eklemek için önemli ölçüde zaman ve harcama yapmış. Durum, birçok son teknolojide olduğu gibi Linux için iç karartıcı olmasa da, özgür ve açık kaynak evreni, özellikle sesli komut araçlarıyla bir adım geride kalıyor.

Linux Konuşma Tanıma

Hiçbir Linux dağıtımı konuşma tanımaya odaklanmaz. Bununla birlikte, konuşma tanıma özelliğini destekleyen uygulamalar Sphinx, Kaldi, Julius ve Mozilla Deepspeech dahil olmak üzere bir dizi açık kaynaklı kitaplığa dayanır.

Negatif Alan / Mockup.Fotoğraflar
Bu kütüphaneler, AI’yı eğitmek ve bu nedenle konuşmayı metne doğru bir şekilde çevirmek için çeşitli sesler sunmak için bir konuşma topluluğuna güvenir. Bununla birlikte, açık kaynaklı projeler daha az karmaşıktır (çünkü AI’yı eğitmek için daha küçük katkılardan hoşlanırlar), bu da Linux için çoğu metinden konuşmaya uygulamalarının dönüşümü sık sık aşağıladığı anlamına gelir. Genellikle, o kadar kapsamlı bir şekilde beceriyorlar ki, orijinal konuşmanın ne olabileceği net değil.

Linux Konuşmadan Metne Seçenekleri

Beş çözüm yolundan birini kullanın.

  • Varsa, dağıtımınızın havuzlarında bulunan Linux uygulamalarına güvenin.
  • Amazon, Alexa’yı Raspberry Pi dahil olmak üzere Linux için kullanılabilir hale getirdi. Bu düzenlemenin çalışması için çok sayıda özel ince ayar yapmanız gerekecek, ancak işe yarayacak.
  • DictationIO aracılığıyla tarayıcınızdan Google Speech API’ye erişin. Bu hizmet yalnızca dikte için çalışır; sesli komut için kullanamazsınız. Google’ın yapay zekası tarafından desteklendiği için kalite iyidir.

Google Asistan, filtrelenen aramalar için bir konuşma metni görüntüler.

  • Triggercmd hizmeti aracılığıyla Linux için sesli komut yardımcı programı olarak Alexa veya Google Assistant gibi bir hizmeti kullanın. Triggercmd bilgisayarınızda çalışır; Alexa veya Google Assistant’ı çağırmak ve bu araçların komutunuza göre belirli Bash komut dosyalarını yürütmesini sağlamak için kullanın. “Ok Google, hesap makinesini açması için tetik komutunu iste” gibi bir şey söyleyin. Google Asistan, “hesap makinesini aç” ifadesiyle belirtilen Bash komut dosyasını çalıştırmak için Triggercmd ile bir aracı görevi görür.
  • Wine veya Dragon NaturallySpeaking gibi Windows için bir yazılımla sanal bir makine kullanın. Doğru ince ayar ile, bu çözüm sesli komut uygulamaları için çalışmasa da, Dragon motorunu transkripsiyon için kullanabilirsiniz.