Бесплатные идеи: OCR
04Дек07
OCR (Optical Character Recognition) — “оптическое распознавание символов”, процедура, которую нужно проделать, чтобы получить из отсканированного листа книги, обычный текст, пригодный для редактирования в каком-нибудь Word-е.
Недавно стала доступной бесплатно в исходных кодах, программа Tesseract. Это проект с богатой и длинной историей, одна из лучших открытых программ распознавания текста, которую вы можете запустить на своем сервере.
Сделайте веб-интерфейс для загрузки изображений со сканера на сервер и распознавания с помощью Tesseract — получится бесплатный онлайн OCR сервис.
Filed under: Идеи | Leave a Comment
Tags: ocr, tesseract

No Responses Yet to “Бесплатные идеи: OCR”