Регистрация   Вход
На главную » Профессиональная помощь »

Сканирование, распознавание и вычитка текстов


vetter: > 28.05.15 11:00


Я опять с Джоан Смит

А нет ли у кого ее сборника из Алой розы - Опасный флирт ("Франческа", "Босоногая баронесса" и "Опасный флирт") ?

прочла Босоногая баронесса - НЕТ КУСКА ТЕКСТА.

читаю Франческа - это вообще НЕЧТО!!!
то ли профперевод, то ли любительский, то ли это какая-то смесь... - то норамльные гладкие предложения, то жуткая корявость, то прямая речь оформлена, как прямая речь, то как косвенная, все "Вы, Вам, Ваш" и пр. с заглавной буквы.....

Хотелось бы все это проверить....

И это я еще не дошла до Опасного флирта

Да, кстати, если есть Неблагоразумная леди, то тоже бы хотелось кое-что уточнить - отсутствует кусок или его намеренно опустили в переводе....

...

shelmadina: > 28.05.15 13:47


Fedundra, а в первом посте темы ( там где про сканер) скриншоты не отображаются(
Не знаю то ли у меня что-то не так с настройками, то ли с книгой что-то не так, замучилась с этим безобразием , такое ощущение что книгу печатали на некачественной туалетной бумаге, терпение для вычитки нужно адское, но я зануда и вычитаю, правда поныть хочется. Там иногда приходится целые предложения перепечатывать Stena

...

vetter: > 28.05.15 14:34


shelmadina писал(а):
замучилась с этим безобразием , такое ощущение что книгу печатали на некачественной туалетной бумаге

У меня под рукой есть как раз эта книга. Отличный шрифт, лучше многих. Может, что-то было со сканером?
Счас попробую отсканить страничку и прицепить....

...

shelmadina: > 28.05.15 14:58


vetter писал(а):
shelmadina писал(а):
замучилась с этим безобразием , такое ощущение что книгу печатали на некачественной туалетной бумаге

У меня под рукой есть как раз эта книга. Отличный шрифт, лучше многих. Может, что-то было со сканером?
Счас попробую отсканить страничку и прицепить....
Шрифт хороший, но с таким качеством бумаги... брр

...

vetter: > 28.05.15 15:27


отличный вообще шрифт и бумага!






Хотите отсканю вам заново?

...

vetter: > 30.05.15 21:58


я таких файлов не оформляла, так что больше ничего сказать не могу.

наташу сделала, но пока не выкладываю, поскольку вычитать хочу, всегда попадается потом с десяток очепяток.
но застряла на джоан смит. вот там в файлах легкий кошмар. старые файлы, видимо и сканы были фиговые и вычитка..

...

shelmadina: > 01.06.15 22:47


vetter писал(а):
Я опять с Джоан Смит

А нет ли у кого ее сборника из Алой розы - Опасный флирт ("Франческа", "Босоногая баронесса" и "Опасный флирт") ?

прочла Босоногая баронесса - НЕТ КУСКА ТЕКСТА.

читаю Франческа - это вообще НЕЧТО!!!
то ли профперевод, то ли любительский, то ли это какая-то смесь... - то норамльные гладкие предложения, то жуткая корявость, то прямая речь оформлена, как прямая речь, то как косвенная, все "Вы, Вам, Ваш" и пр. с заглавной буквы.....

Хотелось бы все это проверить....

И это я еще не дошла до Опасного флирта

Да, кстати, если есть Неблагоразумная леди, то тоже бы хотелось кое-что уточнить - отсутствует кусок или его намеренно опустили в переводе....
у меня есть все 4 книги в PDF, правда с инета содранные, а не собственноручно отсканированные Embarassed
P.S. А вообще я нигде не видела книг в которых было бы столько ляпов в плане очепяток, пунктуации и т.п. как в "Алой Розе", то ли там наборщики такие, то ли... в общем печально, книги хорошие, а вот качество текста

...

vetter: > 02.06.15 16:38


shelmadina писал(а):
у меня есть все 4 книги в PDF

жалко, что там не картинки, но все равно скинь мне на почту. я сверю разные варианты.
почту писала в лику. если не осталось, напишу еще раз.

...

missis: > 01.07.15 11:45


Здравствуйте! Прочитала на страничке форума о том, что много невычитанных сканов. Могу предложить свои услуги. Образование гуманитарное, с грамматикой и орфографией дружу. Целыми днями сочиняю и пишу разные тексты. Сканирую, читаю и правлю тексты по мере необходимости.

...

vetter: > 01.07.15 11:50


missis писал(а):

Здравствуйте! Прочитала на страничке форума о том, что много невычитанных сканов. Могу предложить свои услуги. Образование гуманитарное, с грамматикой и орфографией дружу. Целыми днями сочиняю и пишу разные тексты. Сканирую, читаю и правлю тексты по мере необходимости.

Замечательно! Сейчас напишу вам в личку.

...

shelmadina: > 03.07.15 15:53


Larisa-F писал(а):
Привет!
vetter писал(а):
Если в тексте нет курсивов, то я предпочитаю сохранять в txt, а потом оттуда копировать в ворд.

А я сейчас научилась более-менее работать в FictionBook Editor (программа, в которой делают фб2) и теперь прямо из ABBYY FineReader 12 выгружаю как fb2. Если книжку делаю сама, то полностью вычитываю в FBE, а если кому-нибудь готовлю на вычитку, то оттуда уже конвертирую программой fb2batch.exe в ворд, получая RTF, сохраняю как DOC. Может кому-нибудь пригодится моя метода, сохраняются курсивы, не достают маркированные списки, табуляция, разрывы разделов и прочая мутотень...
Попробовала - спасло нервы при вычитке "Белокурой гейши", в ней столько курсивов что...ох... ругаться нельзя, так вот, спасибо за подсказку Flowers

Только когда конвертируешь файл в .rtf/.doc там много получается не разрывов, а двойных или тройных пробелов между словами, а так же пробелы между словами и знаками препинания.
Код:
7. Все большие пробелы по тексту заменяю на одинарные:
"В поле «Найти» введите « {2;}» (пробел и двойка с точкой-запятой, заключённая в фигурные скобки).
В поле «Заменить на» введите « » (пробел).
Нажмите кнопку «Больше >>».
Поставьте галочку «Подстановочные знаки».
Нажмите кнопку «Заменить всё».

Ругается ворд на это чуть ли не матерно)
Нашла выход: В поле "Найти" пишем ^w, в поле "Заменить" ставим пробел.
Это заменяет любое количество пробелов между словами на 1 пробел.
"Подстстановочные знаки включать не надо.
Ну и между словом и знаком препинания особо не мудрствуя, так же не включая подстановочные: Найти пробелзнак, Заменить знак.
На самом деле знаков литературных текстах с которыми такие фортеля выкидывает конвертация всего 4: ?!. и , Вот)
Может не ново, и все это знают, но решила поделиться)

...

Aleco: > 03.07.15 22:15


shelmadina писал(а):
а двойных или тройных пробелов между словами, а так же пробелы между словами и знаками препинания.

А там точно несколько пробелов?
Это можно легко проверить. В ворде есть значок "Показать непечатные символы" (похожа на большую букву П и сверху слева у нее крупная точка). Пробел обычно обозначается точкой, если небольшой кружок - пустое пространство, но в принципе одно и тоже.
Так если "точка" одна, то пробел один стоит.
Я заменяю легко: Заменить (или Ctrl + H), сверху сама набираю два пробела, внизу один, Заменить все, и так несколько раз пока не покажет при замене 0.

...

shelmadina: > 03.07.15 22:24


Aleco писал(а):
shelmadina писал(а):
а двойных или тройных пробелов между словами, а так же пробелы между словами и знаками препинания.

А там точно несколько пробелов?
Это можно легко проверить. В ворде есть значок "Показать непечатные символы" (похожа на большую букву П и сверху слева у нее крупная точка). Пробел обычно обозначается точкой, если небольшой кружок - пустое пространство, но в принципе одно и тоже.
Так если "точка" одна, то пробел один стоит.
Я заменяю легко: Заменить (или Ctrl + H), сверху сама набираю два пробела, внизу один, Заменить все, и так несколько раз пока не покажет при замене 0.
Да, так и смотрела количество пробелов, там было три-четыре, а местами и побольше, так что ^w всю эту пакость мигом заменил на 1 пробел)

...

Larisa-F: > 04.07.15 08:17


shelmadina писал(а):
Только когда конвертируешь файл в .rtf/.doc там много получается не разрывов, а двойных или тройных пробелов между словами, а так же пробелы между словами и знаками препинания.

К FBE умные люди написали скрипты, которыми очень рекомендую пользоваться. Некоторые из них даже с мизерными знаниями можно править под себя.
Я делаю так. Из ФР12 выгружаю в фб2, заполняю дескрипшен. Потом сверяю текст с дежавю-файлом, попутно оформляя заголовки, подзаголовки, аннотацию, эпиграф, стихи. Сноски я оформила в ФР12 фигурными скобками и теперь скриптом их перенесла куда надо. Когда текст полностью сверен, запускаю скрипты:
Иллюстрации — Унификация вложений и иллюстраций
Подзаголовки, пустые строки – Разметка подзаголовков, чистка пустых строк, удаление жирности и курсива (этот скрипт запускаю несколько раз, почему-то сразу все не изменяется)
Чистка – Генеральная уборка (этот регэксп рекомендую еще и в конце вычитки запустить)
Убираю ненужную жирность (если ее много образовалось, то можно выделить все, начиная с жирного места и нажать в меню b) или пропрыгать скриптом Поиск форматирования – Переход на следующую жирность (чтобы каждый раз не лезть в меню можно включить Вид – Панель скриптов и потом только нажимать на этот значок)
Так же убираю ненужный курсив, часто буква Я распознается в ФР12 курсивом, хотя в книжке она обычная.
Поиск по набору регэкспов golma1 – полезная вещь, много можно устранить недочетов. Вот этот скрипт я сама дополняла по аналогии. Этот скрипт находит наиболее часто встречающиеся ошибки распознавания в ФР.
Потом делаю проверку еще несколькими скриптами из меню Чистка. Чаще всего использую:
Разрыв предложения
Слипшиеся слова
Управляемое исправление абзацев
Точка, тире, буква.
Потом снова генеральная уборка и Сервис-Орфография. Полезно проверить, но потом все равно еще раз запускаю уже в ворде правописание, потому что не все ловит эта приблуда. Конечно, F8 - проверка на валидность файла.
Когда все это я сделала в FBE, конвертирую этот файл в RTF и сохраняю в Документ Word 97-2003. Это делает программа FB2 to Any. В ворде немного поправляю на свой вкус сноски (они переносятся с пропуском строки, убираю эту строку), библиоданные заменяю на полные из дескрипшена и меняю шрифт на курсив 10, прижимаю вправо. Номера страниц вставляю. Обложку уменьшаю. В конце текста «Внимание!...» тоже уменьшаю шрифт до 9. Правописание проверяю, вот и все. Да, при проверке правописания, если находятся какие-то ошибки, то их не забываю исправлять в фэбэшке.
Буду рада, если кому-нибудь пригодится мой опыт.
А может кто поделится своими знаниями. Буду очень благодарна.
shelmadina, вот при такой методе у меня почему-то не образовываются многочисленные пробелы... При конвертации в ворд иногда после курсива перед знаком препинания действительно возникает лишний пробел. Для этого у меня в ворде написан макрос, использую его.

...

vetter: > 04.07.15 12:47


Лариса, спасибо огромное! Ты как всегда осваиваешь все раньше всех!
К сожалению, не нашла в сети FB2 to Any для скачивания, правда, и не сильно рылась. Попробовала он-лайн преобразоавтелем - УЖАС что такое!
Можешь прислать мне его на почту, а заодно и свой скрипт?
Кстати, объясни, чтоб не копаться, где и как эти скрипты находить (сам текст, в смысле) и править?
Опробую сразу все, потренируюсь.

И еще вопрос. Возможно, ты ответила, но я не уловила.
Если отдаешь файл на вычитку в ворде, а у тебя готов fb2, то что потом делаешь с вычитанным вордовым файлом?
Как определяешь, что где исправлено? Или заново вордовый файл конвертишь в fb2?

...

Зарегистрируйтесь для получения дополнительных возможностей на сайте и форуме
Полная версия · Регистрация · Вход · Пользователи · VIP · Новости · Карта сайта · Контакты · Настроить это меню


Если Вы обнаружили на этой странице нарушение авторских прав, ошибку или хотите дополнить информацию, отправьте нам сообщение.
Если перед нажатием на ссылку выделить на странице мышкой какой-либо текст, он автоматически подставится в сообщение