DÜNYA ÇAPINDAKİ EN GÜÇLÜ SES TANIMA YAZILIMI!
Türk teknoloji şirketi CTD Systems, bir ilke imza atarak, Türkçe konuşmaları bilgisayarda yazıya dönüştüren "dikte" yazılımını geliştirdi.
Klavyeyi ortadan kaldıracak yeni teknoloji, kullanıcının sesini bir kez bilgisayara tanıtmasının ardından devreye giriyor ve sesle bilgisayara komut da verilebiliyor.
CTD System A.Ş Ar-Ge Müdürü Çetin Çetintürk, yaptığı açıklamada, Türk araştırmacıları ve girişimcilerinden oluşan şirketlerinin, konuşma tanıma sistemleri üzerine 8 yıldır yürüttüğü çalışmalar sonucu "dikte" isimli yazılımı geliştirmeyi başardığını bildirdi. Çetintürk, "dikte"nin bugüne kadar "dünyada yapılmış ilk ve tek Türkçe konuşma-tanıma sistemi" olduğunu belirtti.
Dikte, yaklaşık 25.000 (
yirmi beş bin ) adet önceden tanımlanmış kök kelimeden türetilen
milyarlarca farklı kelimeyi tanıyabilir. Kullanıcı, sisteme yeni
türetilmiş kelimeler ekleyebilir.
• Bugün için Dikte dünyada
yapılmış en yüksek kapasiteli ve kapasitesine göre en hızlı konuşma
tanıma sistemidir.
• Yeni bir kullanıcı sistemi kullanmaya başlamadan önce akustik
eğitim yapmalıdır. Başlangıç eğitiminin süresi 3-6 saattir. Eğitim
miktarının artırılması doğruluğu da artırır.
• Tanıma performansı bilgisayarın hızına, eğitim miktarına, eğitimin
kalitesine ve dikte ederken kullanıcının akıcı, doğru konuşmasına ve
doğru telaffuz etmesine bağlıdır.
• Dikte, bir öğrenen bir sistemdir. Sistem, her cümleden sonra
kullanıcının sesine biraz daha fazla uyum sağlamakla kalmayıp,
kullanıcının cümle kurma stilini ve kelimeleri kullanma şeklini de
öğrenir.
• Dikte’nin kullanılacağı bilgisayar en az Intel Core 2 işlemci ve 2
GB belleğe sahip olmalıdır. Dört çekirdekli işlemci tavsiye edilir.
Dikte Teknolojisi
Dikte bu güne kadar Dünyada yapılmış en yüksek kapasiteli ve kapasitesine göre en hızlı konuşma tanıma sistemidir.
Konuşma tanıma sistemleri kelime kapasitelerine göre
sınıflandırılırlar. Bir konuşma tanıma sisteminde kelime
kapasitesi tanıma işinin zorluğunu belirlemek için çok önemli
bir kriterdir. Çünkü tanınan temel birim kelimedir. Kelime
kapasitesi artırıldığında belirsizlik artacağı için doğru
orantılı olarak hata yüzdesi de artar, ayrıca doğru orantılı
olarak tanıma süresi ve işlemci yükü de artar.
Dünya üzerindeki en büyük konuşma tanıma sistemlerinin
kapasitesi 100 bin kelime civarındadır. Dikte Genel gerçek
zamanlı olarak 300 Milyar kelime tanıma kapasitesine sahiptir.
Aradaki fark 3 milyon kattır. Dikte 3 milyon kat daha yüksek
bir iş zorluğu ile karşı karşıya olmasına rağmen tanıma
doğruluğu ve hızı yönünden diğer sistemlerden geri kalmayan
bir performansa sahiptir.
Başka bir ifade ile bilinen algoritmalarla sağlıklı Türkçe
konuşma tanıma yapmak mümkün değildir. Bu nedenle Dikte
Genel’in Türkçe konuşma tanıma yapabilmesi için yeni
algoritmalar ve modeller icat edilmiştir.
Devamı > Milliyet
| Sonraki > |
|---|