Публікації

Показано дописи з травень, 2019

OCR-технології

Оптичне розпізнавання символів (OCR) - це процес вилучення тексту з зображення сторінки. Зображення сторінки є електронне зображення тексту та інших можливих елементів (заголовків, зображень та ін.). Зображення сторінок можуть виходити в результаті сканування паперового документа або відкриття файлу зображення. Такі файли можна отримати по електронній пошті, по факсу або з власного сканера. Ці зображення не містять тексту для редагування. Вони являють собою безліч точок (пікселів), які всі разом утворюють малюнок тексту. За допомогою розпізнавання відбувається перевірка зображення тексту і створення тексту, який можна редагувати на комп'ютері, без повторного набору вручну. Зображення обробляється за допомогою технології оптичного розпізнавання, і з нього створюється текст. Під час розпізнавання програма OmniPage використовує параметри, вибрані на на панелі інструментів OmniPage для визначення потоку тексту на сторінці, а також створює впорядковані області навколо частин стор...