Коль небо судьбою меня одарило этой, Осталось прибегнуть к тому, что содержит чарка
Сегодня днём и вечером игрался с конвертерами pdf в doc. Зачем они мне? А затем, что моя читалка электронных книг pdf читать-читает, да не очень хорошо. Вот и надумал я перегонять pdf в doc, а doc в свою очередь в fb2.
Только ничего из моей затеи не получилось. Ибо конвертеры эти большей частью распознают pdf-овские странички, как графику, и именно в таком виде вставляют их в doc-файлы. И получаются из них не электронные книги, а уроды.
Такая вот незадача
А ещё с FireFox отказался работать Type It Easy, и я больше не могу с прежней лёгкостью вставлять в текст типографские символы. Вроде бы мелочь, но… неаккуратненько как-то
Только ничего из моей затеи не получилось. Ибо конвертеры эти большей частью распознают pdf-овские странички, как графику, и именно в таком виде вставляют их в doc-файлы. И получаются из них не электронные книги, а уроды.
Такая вот незадача

А ещё с FireFox отказался работать Type It Easy, и я больше не могу с прежней лёгкостью вставлять в текст типографские символы. Вроде бы мелочь, но… неаккуратненько как-то
А там и может быть графика, особенно если это сканы.
Коротко говоря, pdf - это контейнер, может содержать текстовую информацию, и графическую. Тебе нужен FineReader. Правда качество распознавания может быть не очень.
Тогда это всё объясняет.
Тебе нужен FineReader.
Он у меня есть, восьмой. Но после него ж делать вычитку — это можно убиться веником
А сейчас десятка вышла, говорят, качество распознавания еще улучшилось, но есть и минусы (много памяти потребляет, весит больше в два раза за счет добавления поддержки иероглифов и т.д.)
В AdobeReader есть встроенная функция, "Сохранить как текст...". Дальше мне обычно html или doc нужен. Беру ICE BookReader и быстренько конвертирую.
Изредка вдогонку нужна обработка напильником (от колонтитулов, опознанных как текст, избавиться), но это максимум минута на файл.
Это если там есть текст... В таком случае и методы Цзинши прекрасно бы сработали.
ню-ню
Ха-ха-ха! Если бы такое кто-то придумал... Когда я занималась переводами с вёрсткой, мы разбирали все эти тонны пэдээфов с помощью иллюстратора. В pdf теоретически можно править текст, а практически нет. Только время убьёшь и нервы.
Ни разу не встречала сложного кодирования pdf файлов. Возможно просто везло.
Взять любой серьезный отчет серьезной организации, к примеру. Там минимум 128 бит будет.
Отчетов и аналитических записок мне хватает на работе, читать это в свободное от работы время организм не позволит