Сканирование, распознавание и вычитка текстов

Ответить  На главную » Увлечения » Профессиональная помощь

vetter Цитировать: целиком, блоками, абзацами  
Бриллиантовая ледиНа форуме с: 10.10.2008
Сообщения: 3826
>28 Май 2015 11:00

Я опять с Джоан Смит

А нет ли у кого ее сборника из Алой розы - Опасный флирт ("Франческа", "Босоногая баронесса" и "Опасный флирт") ?

прочла Босоногая баронесса - НЕТ КУСКА ТЕКСТА.

читаю Франческа - это вообще НЕЧТО!!!
то ли профперевод, то ли любительский, то ли это какая-то смесь... - то норамльные гладкие предложения, то жуткая корявость, то прямая речь оформлена, как прямая речь, то как косвенная, все "Вы, Вам, Ваш" и пр. с заглавной буквы.....

Хотелось бы все это проверить....

И это я еще не дошла до Опасного флирта

Да, кстати, если есть Неблагоразумная леди, то тоже бы хотелось кое-что уточнить - отсутствует кусок или его намеренно опустили в переводе....
_________________
Ткни в меня!
Сделать подарок
Профиль ЛС  

shelmadina Цитировать: целиком, блоками, абзацами  
Лазуритовая ледиНа форуме с: 07.04.2010
Сообщения: 212
Откуда: Эстония
>28 Май 2015 13:47

Fedundra, а в первом посте темы ( там где про сканер) скриншоты не отображаются(
Не знаю то ли у меня что-то не так с настройками, то ли с книгой что-то не так, замучилась с этим безобразием , такое ощущение что книгу печатали на некачественной туалетной бумаге, терпение для вычитки нужно адское, но я зануда и вычитаю, правда поныть хочется. Там иногда приходится целые предложения перепечатывать Stena
_________________
За комплект спасибо Esmerald
Сделать подарок
Профиль ЛС  

vetter Цитировать: целиком, блоками, абзацами  
Бриллиантовая ледиНа форуме с: 10.10.2008
Сообщения: 3826
>28 Май 2015 14:34

shelmadina писал(а):
замучилась с этим безобразием , такое ощущение что книгу печатали на некачественной туалетной бумаге

У меня под рукой есть как раз эта книга. Отличный шрифт, лучше многих. Может, что-то было со сканером?
Счас попробую отсканить страничку и прицепить....
_________________
Ткни в меня!
Сделать подарок
Профиль ЛС  

shelmadina Цитировать: целиком, блоками, абзацами  
Лазуритовая ледиНа форуме с: 07.04.2010
Сообщения: 212
Откуда: Эстония
>28 Май 2015 14:58

vetter писал(а):
shelmadina писал(а):
замучилась с этим безобразием , такое ощущение что книгу печатали на некачественной туалетной бумаге

У меня под рукой есть как раз эта книга. Отличный шрифт, лучше многих. Может, что-то было со сканером?
Счас попробую отсканить страничку и прицепить....
Шрифт хороший, но с таким качеством бумаги... брр
_________________
За комплект спасибо Esmerald
Сделать подарок
Профиль ЛС  

vetter Цитировать: целиком, блоками, абзацами  
Бриллиантовая ледиНа форуме с: 10.10.2008
Сообщения: 3826
>28 Май 2015 15:27

отличный вообще шрифт и бумага!






Хотите отсканю вам заново?
_________________
Ткни в меня!
Сделать подарок
Профиль ЛС  

vetter Цитировать: целиком, блоками, абзацами  
Бриллиантовая ледиНа форуме с: 10.10.2008
Сообщения: 3826
>30 Май 2015 21:58

я таких файлов не оформляла, так что больше ничего сказать не могу.

наташу сделала, но пока не выкладываю, поскольку вычитать хочу, всегда попадается потом с десяток очепяток.
но застряла на джоан смит. вот там в файлах легкий кошмар. старые файлы, видимо и сканы были фиговые и вычитка..
_________________
Ткни в меня!
Сделать подарок
Профиль ЛС  

shelmadina Цитировать: целиком, блоками, абзацами  
Лазуритовая ледиНа форуме с: 07.04.2010
Сообщения: 212
Откуда: Эстония
>01 Июн 2015 22:47

vetter писал(а):
Я опять с Джоан Смит

А нет ли у кого ее сборника из Алой розы - Опасный флирт ("Франческа", "Босоногая баронесса" и "Опасный флирт") ?

прочла Босоногая баронесса - НЕТ КУСКА ТЕКСТА.

читаю Франческа - это вообще НЕЧТО!!!
то ли профперевод, то ли любительский, то ли это какая-то смесь... - то норамльные гладкие предложения, то жуткая корявость, то прямая речь оформлена, как прямая речь, то как косвенная, все "Вы, Вам, Ваш" и пр. с заглавной буквы.....

Хотелось бы все это проверить....

И это я еще не дошла до Опасного флирта

Да, кстати, если есть Неблагоразумная леди, то тоже бы хотелось кое-что уточнить - отсутствует кусок или его намеренно опустили в переводе....
у меня есть все 4 книги в PDF, правда с инета содранные, а не собственноручно отсканированные Embarassed
P.S. А вообще я нигде не видела книг в которых было бы столько ляпов в плане очепяток, пунктуации и т.п. как в "Алой Розе", то ли там наборщики такие, то ли... в общем печально, книги хорошие, а вот качество текста
_________________
За комплект спасибо Esmerald
Сделать подарок
Профиль ЛС  

vetter Цитировать: целиком, блоками, абзацами  
Бриллиантовая ледиНа форуме с: 10.10.2008
Сообщения: 3826
>02 Июн 2015 16:38

shelmadina писал(а):
у меня есть все 4 книги в PDF

жалко, что там не картинки, но все равно скинь мне на почту. я сверю разные варианты.
почту писала в лику. если не осталось, напишу еще раз.
_________________
Ткни в меня!
Сделать подарок
Профиль ЛС  

missis Цитировать: целиком, блоками, абзацами  
Золотая ледиНа форуме с: 02.10.2014
Сообщения: 523
>01 Июл 2015 11:45

Здравствуйте! Прочитала на страничке форума о том, что много невычитанных сканов. Могу предложить свои услуги. Образование гуманитарное, с грамматикой и орфографией дружу. Целыми днями сочиняю и пишу разные тексты. Сканирую, читаю и правлю тексты по мере необходимости.
Сделать подарок
Профиль ЛС  

vetter Цитировать: целиком, блоками, абзацами  
Бриллиантовая ледиНа форуме с: 10.10.2008
Сообщения: 3826
>01 Июл 2015 11:50

missis писал(а):

Здравствуйте! Прочитала на страничке форума о том, что много невычитанных сканов. Могу предложить свои услуги. Образование гуманитарное, с грамматикой и орфографией дружу. Целыми днями сочиняю и пишу разные тексты. Сканирую, читаю и правлю тексты по мере необходимости.

Замечательно! Сейчас напишу вам в личку.
_________________
Ткни в меня!
Сделать подарок
Профиль ЛС  

shelmadina Цитировать: целиком, блоками, абзацами  
Лазуритовая ледиНа форуме с: 07.04.2010
Сообщения: 212
Откуда: Эстония
>03 Июл 2015 15:53

Larisa-F писал(а):
Привет!
vetter писал(а):
Если в тексте нет курсивов, то я предпочитаю сохранять в txt, а потом оттуда копировать в ворд.

А я сейчас научилась более-менее работать в FictionBook Editor (программа, в которой делают фб2) и теперь прямо из ABBYY FineReader 12 выгружаю как fb2. Если книжку делаю сама, то полностью вычитываю в FBE, а если кому-нибудь готовлю на вычитку, то оттуда уже конвертирую программой fb2batch.exe в ворд, получая RTF, сохраняю как DOC. Может кому-нибудь пригодится моя метода, сохраняются курсивы, не достают маркированные списки, табуляция, разрывы разделов и прочая мутотень...
Попробовала - спасло нервы при вычитке "Белокурой гейши", в ней столько курсивов что...ох... ругаться нельзя, так вот, спасибо за подсказку Flowers

Только когда конвертируешь файл в .rtf/.doc там много получается не разрывов, а двойных или тройных пробелов между словами, а так же пробелы между словами и знаками препинания.
Код:
7. Все большие пробелы по тексту заменяю на одинарные:
"В поле «Найти» введите « {2;}» (пробел и двойка с точкой-запятой, заключённая в фигурные скобки).
В поле «Заменить на» введите « » (пробел).
Нажмите кнопку «Больше >>».
Поставьте галочку «Подстановочные знаки».
Нажмите кнопку «Заменить всё».

Ругается ворд на это чуть ли не матерно)
Нашла выход: В поле "Найти" пишем ^w, в поле "Заменить" ставим пробел.
Это заменяет любое количество пробелов между словами на 1 пробел.
"Подстстановочные знаки включать не надо.
Ну и между словом и знаком препинания особо не мудрствуя, так же не включая подстановочные: Найти пробелзнак, Заменить знак.
На самом деле знаков литературных текстах с которыми такие фортеля выкидывает конвертация всего 4: ?!. и , Вот)
Может не ново, и все это знают, но решила поделиться)
_________________
За комплект спасибо Esmerald
Сделать подарок
Профиль ЛС  

Aleco Цитировать: целиком, блоками, абзацами  
Бриллиантовая ледиНа форуме с: 22.07.2008
Сообщения: 3559
Откуда: Тверская область
>03 Июл 2015 22:15

shelmadina писал(а):
а двойных или тройных пробелов между словами, а так же пробелы между словами и знаками препинания.

А там точно несколько пробелов?
Это можно легко проверить. В ворде есть значок "Показать непечатные символы" (похожа на большую букву П и сверху слева у нее крупная точка). Пробел обычно обозначается точкой, если небольшой кружок - пустое пространство, но в принципе одно и тоже.
Так если "точка" одна, то пробел один стоит.
Я заменяю легко: Заменить (или Ctrl + H), сверху сама набираю два пробела, внизу один, Заменить все, и так несколько раз пока не покажет при замене 0.
_________________
Если тебе роют яму — не мешай! Закончат — сделаешь себе бассейн… Если тебе моют кости — благодари! Артроза не будет… Если тебе плюют в спину — гордись! Ты впереди… Если в жизни что-то не клеится, выбрось клей. Возьми гвозди. ЗАБЕЙ НА ВСЁ...
Сделать подарок
Профиль ЛС  

shelmadina Цитировать: целиком, блоками, абзацами  
Лазуритовая ледиНа форуме с: 07.04.2010
Сообщения: 212
Откуда: Эстония
>03 Июл 2015 22:24

Aleco писал(а):
shelmadina писал(а):
а двойных или тройных пробелов между словами, а так же пробелы между словами и знаками препинания.

А там точно несколько пробелов?
Это можно легко проверить. В ворде есть значок "Показать непечатные символы" (похожа на большую букву П и сверху слева у нее крупная точка). Пробел обычно обозначается точкой, если небольшой кружок - пустое пространство, но в принципе одно и тоже.
Так если "точка" одна, то пробел один стоит.
Я заменяю легко: Заменить (или Ctrl + H), сверху сама набираю два пробела, внизу один, Заменить все, и так несколько раз пока не покажет при замене 0.
Да, так и смотрела количество пробелов, там было три-четыре, а местами и побольше, так что ^w всю эту пакость мигом заменил на 1 пробел)
_________________
За комплект спасибо Esmerald
Сделать подарок
Профиль ЛС  

Larisa-F Цитировать: целиком, блоками, абзацами  
Бриллиантовая ледиНа форуме с: 24.09.2010
Сообщения: 597
Откуда: г. Москва
>04 Июл 2015 8:17

shelmadina писал(а):
Только когда конвертируешь файл в .rtf/.doc там много получается не разрывов, а двойных или тройных пробелов между словами, а так же пробелы между словами и знаками препинания.

К FBE умные люди написали скрипты, которыми очень рекомендую пользоваться. Некоторые из них даже с мизерными знаниями можно править под себя.
Я делаю так. Из ФР12 выгружаю в фб2, заполняю дескрипшен. Потом сверяю текст с дежавю-файлом, попутно оформляя заголовки, подзаголовки, аннотацию, эпиграф, стихи. Сноски я оформила в ФР12 фигурными скобками и теперь скриптом их перенесла куда надо. Когда текст полностью сверен, запускаю скрипты:
Иллюстрации — Унификация вложений и иллюстраций
Подзаголовки, пустые строки – Разметка подзаголовков, чистка пустых строк, удаление жирности и курсива (этот скрипт запускаю несколько раз, почему-то сразу все не изменяется)
Чистка – Генеральная уборка (этот регэксп рекомендую еще и в конце вычитки запустить)
Убираю ненужную жирность (если ее много образовалось, то можно выделить все, начиная с жирного места и нажать в меню b) или пропрыгать скриптом Поиск форматирования – Переход на следующую жирность (чтобы каждый раз не лезть в меню можно включить Вид – Панель скриптов и потом только нажимать на этот значок)
Так же убираю ненужный курсив, часто буква Я распознается в ФР12 курсивом, хотя в книжке она обычная.
Поиск по набору регэкспов golma1 – полезная вещь, много можно устранить недочетов. Вот этот скрипт я сама дополняла по аналогии. Этот скрипт находит наиболее часто встречающиеся ошибки распознавания в ФР.
Потом делаю проверку еще несколькими скриптами из меню Чистка. Чаще всего использую:
Разрыв предложения
Слипшиеся слова
Управляемое исправление абзацев
Точка, тире, буква.
Потом снова генеральная уборка и Сервис-Орфография. Полезно проверить, но потом все равно еще раз запускаю уже в ворде правописание, потому что не все ловит эта приблуда. Конечно, F8 - проверка на валидность файла.
Когда все это я сделала в FBE, конвертирую этот файл в RTF и сохраняю в Документ Word 97-2003. Это делает программа FB2 to Any. В ворде немного поправляю на свой вкус сноски (они переносятся с пропуском строки, убираю эту строку), библиоданные заменяю на полные из дескрипшена и меняю шрифт на курсив 10, прижимаю вправо. Номера страниц вставляю. Обложку уменьшаю. В конце текста «Внимание!...» тоже уменьшаю шрифт до 9. Правописание проверяю, вот и все. Да, при проверке правописания, если находятся какие-то ошибки, то их не забываю исправлять в фэбэшке.
Буду рада, если кому-нибудь пригодится мой опыт.
А может кто поделится своими знаниями. Буду очень благодарна.
shelmadina, вот при такой методе у меня почему-то не образовываются многочисленные пробелы... При конвертации в ворд иногда после курсива перед знаком препинания действительно возникает лишний пробел. Для этого у меня в ворде написан макрос, использую его.
_________________
Истину не знает никто, а правду знает каждый, и у каждого она своя.
Сделать подарок
Профиль ЛС  

vetter Цитировать: целиком, блоками, абзацами  
Бриллиантовая ледиНа форуме с: 10.10.2008
Сообщения: 3826
>04 Июл 2015 12:47

Лариса, спасибо огромное! Ты как всегда осваиваешь все раньше всех!
К сожалению, не нашла в сети FB2 to Any для скачивания, правда, и не сильно рылась. Попробовала он-лайн преобразоавтелем - УЖАС что такое!
Можешь прислать мне его на почту, а заодно и свой скрипт?
Кстати, объясни, чтоб не копаться, где и как эти скрипты находить (сам текст, в смысле) и править?
Опробую сразу все, потренируюсь.

И еще вопрос. Возможно, ты ответила, но я не уловила.
Если отдаешь файл на вычитку в ворде, а у тебя готов fb2, то что потом делаешь с вычитанным вордовым файлом?
Как определяешь, что где исправлено? Или заново вордовый файл конвертишь в fb2?
_________________
Ткни в меня!
Сделать подарок
Профиль ЛС  

Кстати... Как анонсировать своё событие?  

>01 Дек 2024 7:34

А знаете ли Вы, что...

...Вы можете привлечь читателей к редактуре Ваших текстов с помощью специального объявления о черновом варианте текста в статьях блога. Подробнее

Зарегистрироваться на сайте Lady.WebNice.Ru
Возможности зарегистрированных пользователей


Нам понравилось:

В теме «Клуб коллективного чтения»: Итак, на декабрь больше голосов было на 2 книги. Обе книги с "новогодней тематикой". 1. Кимберли Кейтс "Ангел Габриеля"... читать

В блоге автора miroslava: Работа женщин в прошлом (часть II)

В журнале «Little Scotland (Маленькая Шотландия)»: Горгульи, химеры, гротески. Чудовища наверху
 
Ответить  На главную » Увлечения » Профессиональная помощь » Сканирование, распознавание и вычитка текстов [8448] № ... Пред.  1 2 3 ... 200 201 202 203 204 205  След.

Зарегистрируйтесь для получения дополнительных возможностей на сайте и форуме

Показать сообщения:  
Перейти:  

Мобильная версия · Регистрация · Вход · Пользователи · VIP · Новости · Карта сайта · Контакты · Настроить это меню

Если Вы обнаружили на этой странице нарушение авторских прав, ошибку или хотите дополнить информацию, отправьте нам сообщение.
Если перед нажатием на ссылку выделить на странице мышкой какой-либо текст, он автоматически подставится в сообщение