Картинку в текст переформатировать не так просто. И, пожалуй, не всегда возможно. Раньше использовали программу распознавания текста ABBYY FineReader. Говорят, что версия выше девятой способна распознать и файлы djvu и перевести их в pdf. Ну а те, уже в документ ворд. Сразу хочу предупредить, что в Интернете бесплатные версии ABBYY FineReader только старых типов и могут не подойти, а за новую придется платить. И еще распознавание не идеальное. Много ошибок, особенно, если это стихи или специальный текст. Потом текст придется перечитывать и править!
Вспомнил, как выходил из положения мой приятель. Он использовал ABBYY FineReader совсем старенькую. Что он делал. Он выставлял страницу djvu и нажимал кнопку Print Screen. Затем рисунок загонял в Point и делал формат bmp, а уж этот формат понимает распознаватель даже самый древний. Экспериментируйте!
Перевести djvu в pdf достаточно просто. Можно использовать любой pdf принтер, например pdf-factory. А вот распознование- это вечная головная боль такого перевода текста. Если бы это было так просто, то все тексты распространялись бы в pdf или, вообще, в word (docx). Но распознается очень криво, а формулы вообще не распознаются. Так что приходится либо куски текста использовать, либо, вообще картинки с текстом в свою работу вставлять (самый быстрый вариант).
Приветик! Я без проблем переделывал все в любой формат программой ABBYY FineReader 11. При распознавании выводиться второе окошко где можно проверить и подкорректировать ошибки. Причем распознавание происходит практически без ошибок, если объект распознавания хорошего качества.
Удачки.
Вот вам фотка. Программу естественно нужно настроить. Журнал не редактировал фотошопом потому много ошибок. Ни чего не исправлял в тексте.
Текст из djvu в ворд можно преобразовать следующим образом. Во первых необходимо сначала преобразовать дежавю в пдф, что делается очень просто с помощью виртуального пдф принтера. Далее нужно скачать программу ABBYY Fine Reader, а можно и онлайн сделать все необходимое, такой сервис так-же существует. И с помощью ABBYY Fine Reader можно распознать pdf файл в текстовый вид.
Добавить комментарий