Harun Reşit Zafer

bâki kalan bu kubbede bir hoş sadâ imiş

Kategori: Türkçe Üzerine

Türkçe Dostu Bir Sohbet Botu

Eski bir yazımda Türkçe (ç, ı, ğ, ö, ş, ü) harflerinin Q klavye üzerindeki elverişsiz konumundan dolayı F klavyeye geçme çabamdan bahsetmiştim. O yazının üzerinden uzun zaman geçti ve ben F klavyeye hiç bir zaman geçemedim. Ancak bu sorun da kafamın bir köşesinde her zaman yer etti durdu. Zira Türkçe karakterleri göz ardı edince, yani ğ yerine g, ı yerine i yazınca tuşlama hızım gözle görülür biçimde artıyordu. Ama biraz daha hızlı yazabilmek için bu harfleri feda etmek de içimden gelmiyordu. Suç bu harflerin değildi tabii ki. Bu harfler aslında ait olmadıkları bir klavye düzenine sonradan sığıştırılmış, ikinci sınıf vatandaş muamelesi gören mülteciler gibiydiler Q klavye üzerinde. Yine de bu harfler alfabemizin olmazsa olmaz üyeleri, dilimizin vazgeçilmez sesleriydiler. Bu nedenle bir kaç yıl önce T23 projesine başlamıştım. Alfabemizdeki 29 harfi, bu 6 güzide harfin olmadığı 23 harfle tuşlayabilmekdi amaç. T23 ismi de buradan geliyor. okumaya devam

Nüve ile Türkçe Cümle Sonu Tespiti

Önceki yazımda Türkî diller için bir doğal dil işleme kütüphanesi olan Nüve‘den bahsetmiştim. Nüve 1.1 versiyonu ile birlikte cümle sonu tespit yeteneği de kazanmış durumda. Nüve’nin cümleleme modülü kural tabanlı çalışıyor ve mükemmel olduğu söylenemez ancak bir çok metin için iş görecek kadar başarılı olduğunu söyleyebilirim. Kullanacak arkadaşlar da gördükleri hataları bildirirerek başarımın artmasına yardımcı olabilir ve projeye katkıda bulunabilirler.

Nüve’yi projenize 2 şekilde ekleyebilirsiniz. okumaya devam

Türkçe Cümle Sonu Tespit Araçları için bir Karşılaştırma

Bu yazıda cümle sonu tespiti problemini ve Nüve başta olmak üzere Türkçe için belli başlı cümle sonu tespit araçlarını (Zemberek, OpenNLP, ITU Pipeline) incelemeye çalıştım.

Doğal dil işleme ve metin analizi çalışmalarında zaman zaman metni cümlelerine ayırmaya (cümlelemeye) ihtiyaç duyulur. Literatürde bu probleme “cümle sonu tespiti” (sentence boundary detection) denir. Metindeki satırsonu karakterleri (newline, \n, \r) paragrafları birbirinden ayırır. Cümleleme işlemi paragraflar üzerinde yapılır. Bir paragraf bir ya da daha fazla cümleden oluşabilir. okumaya devam

Türkçe Fiil Çekimleri Uygulaması

Türkçe fiillerin çekimlerini otomatik üreten bir programı kodlamayı uzun zaman önce düşünmüştüm. O zamandan beri vakit buldukça azar azar geliştirdiğim uygulamanın ilk sürümünü sonunda yayınlayabildim. Uygulama bu hali ile kime ne kadar fayda sağlar bilemiyorum. Ama ileriki sürümlerinin ilk-orta-lise öğrencilerine ve Türkçe öğrenmek isteyen yabancılara yararlı olmasını hedefliyorum. Bu bağlamda sizin de görüş ve önerilerinizi bekliyorum:

http://fiilcek.apphb.com/

Teknik detaylara gelecek olursak: okumaya devam

Türkçe İmla Denetimi Üzerine

Geçenlerde üzerinde çalıştığım bir proje gereği kapsamlı bir Türkçe kelime listesine ihtiyaç duydum. Buradaki listeden kastım standart bir Türkçe sözlükte bulunan kelimelerin listesi değil bunların ek almış hallerinin de bulunduğu geniş bir listeydi. Mesela “ev” kelimesinin “evim”, “evimiz”, “evimdeki” gibi biçimlerini de içeren bir liste. Peki, böyle bir liste kaç kelime ihtiva eder?

Soruyu şu şekilde de sorabilirdik: Türkçedeki “mümkün” tüm kelimelerin sayısı nedir? Mümkün (imkân dâhilinde) kelimesi size garip geldiyse hemen birkaç örnek vereyim; “bardaklaşıyordum”, “dondurmalandırmacı”  gibi. Bu garip kelimeler teorikte mümkün ve Türkçenin gramer kuralları açısından doğru ancak hali hazırda anlamlı değiller ve kullanılmıyorlar. Ama ileride mesela “bardaklaşmak” deyimi geçerli bir anlam kazanabilir. Tıpkı bir zamanlar “havalandırmacı” kelimesinin bir anlam ifade etmediği gibi. okumaya devam

Email ve Web adreslerini Nasıl Telaffuz Edelim

Makalenin alternatif başlığı “Maymun olmaya gerek var mı?” da olabilirdi. İnternet hayatımıza gireli (ülkemiz için konuşuyorum) 15 yıldan fazla oldu.  İnternet kullanım yaşı da epey düştü. İnterneti düzenli kullanıp da hala e-posta ve web adreslerinde Türkçe karakter olamayacağını bilmeyen kaç kişi vardır? O halde e-posta adresimizi veya internet adresimizi söylerken garip telaffuzlar üretmeye ne gerek var? Diyelim ki adım Çağrı Altınbaş, e-posta adresimi soran kişiye adımı “cagri altinbas et cimeyıl nokta kom”  diye telaffuz etmem şart mıdır? Normal telaffuz ettiğimde e-postalar  [email protected] mı gider? okumaya devam

© 2017 Harun Reşit Zafer

Temayı tasarlayanAnders NorenYukarı ↑