Türkçe OCR Programı

OCR (Optical Character Recognition - Optik Karakter Tanıma), taranmış kağıt evraklar, PDF dosyalar veya dijital kamerayla çekilen resimler gibi belge türlerinin düzenlenebilir ve aranabilir verilere dönüştürülmesine olanak sağlayan bir teknolojidir. OCR, resimlerdeki harfleri seçip ayırarak harflerden kelimeleri ve kelimelerden de cümleleri oluşturur.

OCR'nin Çalışma Mantığı

OCR yazılımları kağıt vb. üzerindeki siyah noktalar topluluğunu yani harfleri, rakamları, sembolleri vb. algılayabilecek ve okuyabilecek bir yapıya sahiptirler. Her kelimeyi ayrı tutarak ve sayfayı satırlara bölerek analiz eder. Analiz sırasında harflerin yapısal karakterleri, yükseklikleri ve genişlikleri değerlendirilir. Programın kendi bilgi deposu, her bir karakter için tanımlanmış çeşitli parametrelerle doludur. Algılanan pikseller bu parametrelerden birisine uygun ise, harfin ortaya çıkması mümkün hale gelir.

Resim dosyalarının ve tarayıcının kaliteli olması OCR yazılımlarının metin tarama hatalarını çok düşük seviyeye indirir. Son yıllarda piyasaya sunulan OCR yazılımları hemen hemen her türlü karakter yakalayabilecek seviyelere ulaşmıştır. Türkçeye çevrilmesi ile beraber kullanılması kolaylaşmış, Kolay Belge OCR özelliği ile birlikte kullanım kolaylığı sağlamaktadır.

İlgilinizi Çekebilecek Diğer Makaleler