Hunspell-tr Nedir
Hunspell-tr projesi imla denetimi için Hunspell’i kullanan Firefox, OpenOffice, LibreOffice, Mac OS X, Safari gibi pek çok yazılım için Hunspell uyumlu Türkçe imla denetimi sözlük dosyaları üretmeyi amaçlar. Bu sözlük dosyaları sayesinde tüm bu yazılımlarda etkili ve verimli Türkçe imla denetimi desteği mümkün olmaktadır.
Nasıl Çalışır
Hunspell C++ ile kodlanmış, dilden bağımsız, hızlı ve bellekte az yer kaplayan bir imla denetimi aracıdır. Hunspell her hangi bir dilde imla denetimi yapmak için 2 sözlük dosyasına ihtiyaç duyar.
1- Kökler sözlüğü (.dic uzantılı)
2- Ekler sözlüğü (.aff uzantılı)
Mesela bir dil için sözlük dosyamız aşağıdaki gibi olsun:
merhaba gel/MEK araba/LAR ev/LER |
Ek dosyamız da böyle olsun:
SFX LAR N 1 SFX LAR 0 lar . SFX LER N 1 SFX LER 0 ler . SFX MEK N 1 SFX MEK 0 mak . |
Bu dildeki mümkün tüm kelimeler aşağıdaki gibidir:
merhaba, gel, gelmek, araba, arabalar, ev, evler |
İngilizce gibi birçok dil için bu dosyalar el ile hazırlanabilirken; Türkçe gibi karmaşık morfolojiye sahip, sondan eklemeli diller için bu dosyaların elle hazırlanması mümkün görünmemektedir. Hunspell-tr bu dosyaların bir morfolojik çözümleyici yardımı ile otomatik olarak üretilmesini sağlayan araçtır.
Ne İşe Yarar
Üretilen sözlük dosyaları yukarıda bahsedilen bir çok yazılımda Türkçe imla denetiminin etkinleştirilmesi için yeterlidir. Hunspell-tr ile üretilen sözlük dosyaları kullanılarak şu ana kadar hazırlanan imla denetimi eklentileri şöyledir:
- Mozilla Firefox için imla denetimi eklentisi
- Apache OpenOffice için imla denetimi eklentisi
- LibreOffice için imla denetimi eklentisi
Hunspell-tr projesi geliştikçe, kullanıcı geri bildirimleri geldikçe ve sözlüğü üretmek için kullanılan derlem genişledikçe daha kapsamlı ve başarılı sözlük dosyaları üretilecektir. Sözlük dosyaları yenilendikçe yukarıda bahsedilen eklentiler de güncellenerek yeni sürüm numaraları ile yayınlanacaktır.
Mevcut Durum ve Yapılacaklar
Sözlük dosyaları yeterince büyük olmayan bir derlemdeki kelimeler analiz edilerek üretildiklerinden, bazı doğru kelimeler yanlış olarak tanımlanabiliyor. Yukarıdaki eklentileri kullanıyorsanız bu tür kelimeleri bildirerek katkıda bulunabilirsiniz.
Mevcut sözlük dosyaları yanlış tespitinde başarılı sayılabilir. Ancak yanlış kelimeler için yapılan öneriler konusunda biraz daha mesafe almak gerekiyor.
Hunspell OpenOffice gibi metin düzenleme araçları için “eş ve yakın anlamlı kelimeler” ve “kesme işareti” desteği de veriyor. Bunlar için bahsedilen 2 sözlük dosyasından ayrı olarak birer dosya hazırlanması gerekiyor.
26 Şubat 2015 at 03:34
Merhaba,
Libreoffice icin olan Türkçe imla denetimini yükledim. Gördügüm kadari ile icindeki TR.dic dosyasi 9mb kadar.
Bir de bu sitedeki TR dosyalarını buldum, burdakiler de 2. dosyanın icinde TR.dic dosyası 12mb kadar. Dosya ebadının büyük olması daha çok düzeltme anlamına mi geliyor? Bu dosyayi kullanmada sakınca olur mu?
https://code.google.com/p/tr-spell/downloads/list
Saygılarımla.
26 Şubat 2015 at 05:40
Dosya boyutunun daha büyük olması tam olarak o manaya gelmiyor. Hangi dosyanın daha iyi sonuç verdiğini anlamak için çeşitli kelimelerle test etmeniz gerekiyor. Ancak bahsettiğiniz sözlüğün TR.aff dosyasında küçük bir hata var. Bu da bazı yanlış kelimelerin doğru kabul edilmesine yol açıyor. Bu nedenle benim elimdeki testler hunspell-tr’nin biraz daha isabetli olduğunu gösteriyor. Bu arada yakında yeni bir güncelleme gelecek. Siz de fark ettiğiniz hataları bildirirseniz yeni versiyona ekleyebilirim.
02 Mart 2017 at 14:35
hocam en güncel hunspell-tr ve hunspell-ar dosyasını nereden indirebiliriz?
arapça ve türkçe için
teşekkürler