OCR-технології для розпізнавання паперових документів
Оптичне розпізнавання тексту ( англ. optical character recognition, OCR ) — це механічне або електронне переведення зображень рукописного, машинописного або друкованого тексту в послідовність кодів, що використовуються для представлення в текстовому редакторі . Розпізнавання широко використовується для конвертації книг і документів в електронний вигляд, для автоматизації систем обліку в бізнесі або для публікації тексту на веб-сторінці. Оптичне розпізнавання тексту дозволяє редагувати текст, здійснювати пошук слова або фрази, зберігати його в компактнішій формі, демонструвати або роздруковувати матеріал, не втрачаючи якості, аналізувати інформацію, а також застосовувати до тексту електронний переклад , форматування або перетворення в мовлення . Оптичне розпізнавання тексту є досліджуваною проблемою в галузях розпізнавання образів , штучного інтелекту і комп'ютерного зору .