Harun Reşit Zafer

bâki kalan bu kubbede bir hoş sadâ imiş

Sayfa 2 / 14

GitHub Üzerinde Maven Repo’su Oluşturmak

Bu makalede adım adım Java projeleriniz için GitHub üzerinde Maven deposu (repository veya repo) oluşturmayı anlatacağım. Yazıya başlarken bir GitHub hesabınızın olduğunu ve Maven’ı biraz da olsa bildiğinizi kabul ediyorum. GitHub üzerindeki bazı Java projelerimin Maven kullanan geliştiriciler tarafından kolayca kullanılabilmeleri amacıyla GitHub üzerinde bana ait ancak herkesin erişimine açık bir Maven deposu oluşturmaya karar verdim. Son zamanlarda bir çok geliştirici de aynı yolu tercih ediyor zaten. Bunun için gereken adımları buraya güzelce not ederek hem bir dahaki sefere bakabileceğim hem de herkesin faydalanabileceği bir döküman ortaya çıkmasını amaçlıyorum. okumaya devam

Nüve ile Türkçe Cümle Sonu Tespiti

Önceki yazımda Türkî diller için bir doğal dil işleme kütüphanesi olan Nüve‘den bahsetmiştim. Nüve 1.1 versiyonu ile birlikte cümle sonu tespit yeteneği de kazanmış durumda. Nüve’nin cümleleme modülü kural tabanlı çalışıyor ve mükemmel olduğu söylenemez ancak bir çok metin için iş görecek kadar başarılı olduğunu söyleyebilirim. Kullanacak arkadaşlar da gördükleri hataları bildirirerek başarımın artmasına yardımcı olabilir ve projeye katkıda bulunabilirler.

Nüve’yi projenize 2 şekilde ekleyebilirsiniz. okumaya devam

Türkçe Cümle Sonu Tespit Araçları için bir Karşılaştırma

Bu yazıda cümle sonu tespiti problemini ve Nüve başta olmak üzere Türkçe için belli başlı cümle sonu tespit araçlarını (Zemberek, OpenNLP, ITU Pipeline) incelemeye çalıştım.

Doğal dil işleme ve metin analizi çalışmalarında zaman zaman metni cümlelerine ayırmaya (cümlelemeye) ihtiyaç duyulur. Literatürde bu probleme “cümle sonu tespiti” (sentence boundary detection) denir. Metindeki satırsonu karakterleri (newline, \n, \r) paragrafları birbirinden ayırır. Cümleleme işlemi paragraflar üzerinde yapılır. Bir paragraf bir ya da daha fazla cümleden oluşabilir. okumaya devam

Türkî Diller için Doğal Dil İşleme Kütüphanesi: Nüve

İnsan dili veya doğal dil günlük yaşantımızdaki en önemli iletişim kanalımız. Bilgiyi doğal dil biçiminde duyarak ya da okuyarak beynimize alır (input) , beynimizde işler (processing) ve yazılı ya da sözlü olarak dışarı aktarırız (output). İletişim organlarımız ile birlikte beynimiz, bu işi mükemmel biçimde yerine getirirken bilgisayarlar doğal dili işleyebilme konusunda henüz emekleme aşamasındalar. Yine de son 10 yıldır günlük yaşantımızda giderek artan biçimde doğal dil işleme tabanlı uygulamalardan istifade ediyoruz. MS Word gibi kelime işlemciler imla denetimi yaparken, Google Translate gibi uygulamalar otomatik çeviri yapıyor. E-posta hizmeti sağlayıcıları e-postalarımızın istenmeyen (spam) olup olmadığını bizim okumamıza gerek kalmadan tespit edebiliyor. Milyonlarca kullanıcının tweet ya da yorumlarını tek tek okumak zorunda olmadan bir ürün, kişi ya da kurum hakkındaki genel kanaati otomatik olarak tespit edebiliyoruz. okumaya devam

Linux’ta Toplu Dosya İsimlendirme

Bir klasördeki çok sayıda dosyanın ismini dizisel biçimde 01.txt, 02.txt olarak değiştirmeniz gerektiğinde aşağıdaki komutu kullanabilirsiniz:

find *.txt |
 
gawk 'BEGIN{ a=1 }{ printf "mv \"%s\" %04d.txt\n", $0,  a++ }' |
 
bash

-name parametresinden sonraki ‘.txt’ değeri yalnızca txt uzantılı dosyaların isimlerinin değiştirileceğini belirtir.
%04d.txt ifadesi ise 4 haneli olarak, yine txt uzantılı isimler verileceğini belirtir. 0001.txt, 0002.txt gibi. okumaya devam

Java OutOfMemoryError için Netbeans JVM Ayarları

Yaklaşık 650 MB’lık bir text dosyasını okumaya çalışınca aşağıdaki hatayı aldım:

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space

Java sanal makinesi varsayılan olarak 256 MB maksimum bellek ayırıyor. Programınız ihtiyacı bunun üzerinde olunca yukarıdaki hatayı alıyorsunuz. Ancak JVM’ye aşağıdaki komutlarla ilk ve maksimum bellek miktarını belirtebiliyorsunuz.

java -Xmx2048m -Xms256m okumaya devam

« Önceki yazılar Sonraki yazılar »

© 2017 Harun Reşit Zafer

Temayı tasarlayanAnders NorenYukarı ↑