Osmanlıca OCR

Osmanlı Türkçesi ya da Osmanlıca, Osmanlı İmparatorluğu'nun ilk anayasası olan Kanun-ı Esasî’de geçtiği hâliyle Türkçe (Osmanlı Türkçesi: لسان توركى Lisān-ı Türkī; توركى Türkī; توركجه Türkçe; لسان عثمانى, Lisān-ı Osmānī), 13 ile 20. yüzyıllar arasında Anadolu'da ve Osmanlı Devleti'nin yayıldığı bütün ülkelerde kullanılmış olan, Arapça ve Farsçadan etkilenmiş Türk dili. Alfabe olarak Arap alfabesinin Farsça ve Türkçe için uyarlanmış bir biçimi kullanılmıştır. Halk arasında bazen yanlış kullanım olarak bu dil dönemi için “Eski Türkçe” tabiri de kullanılmaktadır.

Osmanlı Türkçesinin “lisan-ı Osmani”, “Osmanlı lisanı” diye adlandırılmasına ünlü sözlükçü, yazar Şemseddin Sami şu sözlerle karşı çıkmış ve tıpkı Kaşgarlı Mahmud, Yusuf Ulug Has Hacib, Ali Şir Nevai gibi dilin adının “Türkçe” olduğunu ifade etmiştir.

Osmanlı Türkçesi kendi arasında kronolojik esasa göre sınıflandırılmıştır:[kaynak belirtilmeli]

1. Eski Osmanlı Türkçesi: 13. yüzyıldan 15. yüzyılın ortalarına kadar.
2. Klasik Osmanlı Türkçesi: 15. yüzyılın ortalarından 19. yüzyıla kadar.
3. Yeni Osmanlı Türkçesi: Tanzimat döneminden 1908'e kadar.

Optik Karakter Tanıma ya da kısaca OKT (İngilizce: Optical Character Recognition, kısaca OCR), bilgisayar ortamında bulumayan yazılı dokümanların özel tarayıcılar veya normal olarak taranmış resimlerinin FineReader ve OmniPage gibi bazı özel programlar arayıcılığıyla bilgisayar ortamına düzenlenebilecek sayısal halde aktarılmasıdır. Okunmuş resim veya doküman metin dosyası olarak saklanabilir.

Kolay Belge'deki Osmanlıca OCR özelliği ile matbu Osmanlıca metinlerin metne çevrilmesi mümkündür. NLP ve Yapay Zeka teknikleri ile Osmanlıca metinlerin günümüz Türkçesine çevrilmesi ve sadeleştirilmesi çalışmaları da devam etmektedir.