OCR / HTR technologies and Armenian Heritage Preservation

dc.contributor.authorVidal-Gorene, Chahan
dc.date.accessioned2023-07-29T15:59:05Z
dc.date.available2023-07-29T15:59:05Z
dc.date.issued2023
dc.descriptionԲանբեր Հայաստանի գրադարանների ։ Գիտամեթոդական հանդես ։ Հատուկ թողարկում / Գլխավոր խմբագիր` Աննա Չուլյան ; Պատասխանատու խմբագիր՝ Հայկանուշ Ղազարյան ․- Երևան ։ «Գիրք» հրատարակչություն , 2023 ․- էջ 61 - 65
dc.description.abstractOCR (Optical Character Recognition) and HTR (Handwritten Text Recognition) are now ready for Armenian language. This technology may offer a greater valorization for documents by enabling improved accessibility, using by instance keywords search, and consists in a new challenge for Digital Libraries. Our presentation intends to propose a view on what is possible today, by introducing a state-of-the-art of the challenges raised by text recognition for Armenian. A focus will be drawn on the technology developed by Calfa for handwritten archives, ancient manuscripts and old printed books. We will present our feedback on three of our ongoing projects: processing catalogs of manuscripts (Mekhitarist, Venice), printed newspapers of Fundamental Scientific Library of NASRA, and handwritten correspondences (Mekhitarist, Venice). Methodology applied by Calfa leads to an accuracy higher than 95% for handwritten documents and higher than 99,5% for printed documents.
dc.identifier.doihttps://doi.org/10.52027/18294685-cvo2023.sp
dc.identifier.issnISSN 1829-4685
dc.identifier.urihttp://dspace.nla.am/handle/123456789/5625
dc.identifier.urihttps://doi.org/10.52027/18294685-cvo2023.sp
dc.language.isoen
dc.pagesէջ 61 - 65
dc.publication.placeԵրևան
dc.publisherՀայաստանի ազգային գրադարան / National Library of Armenia
dc.publishing.house«Գիրք» հրատարակչություն
dc.subjectԳրադարանագիտություն, մատենագիտություն և արխիվավարություն
dc.titleOCR / HTR technologies and Armenian Heritage Preservation
dc.typeArticle
Files
Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
doi.org/10.52027/18294685-cvo2023.sp.pdf
Size:
695.8 KB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description:
Collections