Вычитка #5 (2010-I)

Теперь главная тема по вычитке здесь.

Архив тем:
1. 2008-I
2. 2008-II — 2009-I
3. 2009-II
4. 2009-III

таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA

Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: http://lib.rus.ec/stat/document-author/rusec. Книги из этого списка нуждаются в доработке: форматировании и вычитке.

Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе.

Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке http://lib.rus.ec/stat/tot и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования.

Присоединяйтесь к нам! :)
Обращение golma1'ы:

golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"!

Тем, кто не знаком с форматом fb2, рекомендую вначале заглянуть в эту книгу. Здесь в популярной форме даются описания и разъяснения основных моментов этого формата. Если вдруг что-то окажется непонятным, всегда можно обратиться с вопросом в форум, вам обязательно помогут. Нужные для работы с fb2-файлами программы вы найдёте здесь.

Книги, сделанные в fb2 и нуждающиеся в вычитке, следует и вычитывать в этом формате. При конвертировании файла в текстовый формат неизбежно теряются ценные детали форматирования, восстановить которые впоследствии если и возможно, то очень трудоёмко.

Под вычиткой подразумевается:
1. Исправление ошибок OCR.
2. Форматирование текста:
- разбиение текста на части, главы, подглавы (секции и вложенные секции, тэги title и subtitle)
- выделение жирным и наклонным шрифтом (тэги strong и emphasis)
- проставление разделений в тексте (тэг empty-line)
- проверка скриптами
3. Заполнение дескриптора (обложка, аннотация, выходные данные книги)
4. При необходимости конвертирование в fb2-формат.

Для вычитки можно пользоваться читалкой AlReader Vobis Edition или редактором FictionBookEditor. Ссылки на обе программы были даны выше.
В самом крайнем случае, файл fb2 можно открыть текстовым редактором, сохраняя при этом все тэги. В этом случае, если изменения вносятся только в текст, форматирование сохраняется.

Убедительная просьба - не конвертировать fb2-файлы в текстовый формат. Не забывайте, что fb2 является предпочтительным форматом нашей библиотеки и книги следует заливать, по возможности, в нём. И уж во всяком случае, не стоит заменять формат fb2 другим форматом.

Если почему-то вам не хочется разбираться в формате fb2, берите на вычитку книги, представленные в библиотеке в текстовом формате. Их можно заливать в том виде, в каком вы их скачали.
Также можно брать файлы в форматах djvu или pdf и распознать их в текстовый формат. Однако это касается преимущественно художественной литературы, т.е. произведений, состоящих в основном из текста. Книги с множеством иллюстраций, таблиц, формул лучше оставить в том виде, в каком они есть.

Если я что-то упустила или невнятно сформулировала, спрашивайте. :)

Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
Они помогут Вам разобраться в пользовании самой распространённой программой FBE.
Всем привет! :)

n_a_u написал:
Беру История конницы Джордж Тэйлор Денисон.

Отмечено.

Файл после добавления иллюстраций значительно увеличился в размерах, в несжатом виде занимает около 20Мб.
Как считаете, имеет ли смысл оставить в библиотеке две версии книги более легкую (без иллюстраций) и полную (со всеми иллюстрациями)?

n_a_u написал:
Файл после добавления иллюстраций значительно увеличился в размерах, в несжатом виде занимает около 20Мб.
Как считаете, имеет ли смысл оставить в библиотеке две версии книги более легкую (без иллюстраций) и полную (со всеми иллюстрациями)?

Обязательно оставить. :)
А оптимизировать картинки никак нельзя? Чтобы и качество не потерять, и размер уменьшить. ;)

golma1 написал:
n_a_u написал:
Файл после добавления иллюстраций значительно увеличился в размерах, в несжатом виде занимает около 20Мб.
Как считаете, имеет ли смысл оставить в библиотеке две версии книги более легкую (без иллюстраций) и полную (со всеми иллюстрациями)?

Обязательно оставить. :)
А оптимизировать картинки никак нельзя? Чтобы и качество не потерять, и размер уменьшить. ;)

Думаю что можно. Поработаю в этом направлении. :-)

n_a_u написал:
golma1 написал:
А оптимизировать картинки никак нельзя?
Поработаю в этом направлении. :-)
Могу помочь. Выложи иллюстрации, хочу глянуть.

Рыжий Тигра написал:
n_a_u написал:
golma1 написал:
А оптимизировать картинки никак нельзя?
Поработаю в этом направлении. :-)
Могу помочь. Выложи иллюстрации, хочу глянуть.

Иллюстрации лежат вот здесь

n_a_u написал:
Иллюстрации лежат вот здесь
Кошмар. Автор сайта или ленивый насчёт собрать все иллюстрации для выкачки одним архивом, или жадный и предполагает (в принципе справедливо), что выкачиывальщик поленится хренадцать дюжин раз щёлкать по ссылкам.
Но десяток иллюстраций я стянул: 001.gif 002.gif 003.gif 004.gif 137.gif 138.gif s01.gif s02.gif s03.gif s04.gif - итого 389407 байт; запуском
команда написал:
optipng.exe -O7 *.gif
перекрутил их все в PNG - получил 373717 байт.
Кажется, на этом можно остановиться: бо́льшую плотность даст только JPEG, но при настолько низком качестве, что вся затея теряет смысл: для, к примеру, экономии вдвое надо давать JPEG'у качество всего лишь 10, а тогда детали на штриховых иллюстрациях и надписи на картах начисто скрываются под толстым слоем "волосатых" артефактов. :(
PS. Кстати, а сколько весит весь комплект оригинальных иллюстраций?

Рыжий Тигра написал:
PS. Кстати, а сколько весит весь комплект оригинальных иллюстраций?

В том то и дело, что других иллюстраций в наличии нет. :(
Все эти гифы в комплекте получились немного больше 8 мегабайт.
Книжка после добавления в нее иллюстраций в формате png стала 12 мегабайт. Файл Denison_Istoriya_konnitsyi.zip залит в корень ftp. Можно здесь попросить библиотекарей добавить книжку? Или нужно в личку писать?

n_a_u написал:
Файл Denison_Istoriya_konnitsyi.zip залит в корень ftp.
Скачал, глянул иллюстрации - ОК, залил: http://lib.rus.ec/b/231474 - объединять с безрисуночной http://lib.rus.ec/b/207643 не стал - вдруг кому понадобится...

n_a_u написал:
Беру История конницы Джордж Тэйлор Денисон.

Готово. Пометьте пожалуйста в табличке.

n_a_u написал:
n_a_u написал:
Беру История конницы Джордж Тэйлор Денисон.

Готово. Пометьте пожалуйста в табличке.

Я отметила. Но почему-то не нашла новую книгу на сайте.

golma1 написал:
почему-то не нашла новую книгу на сайте.
Дык в аннотации к старой добавлено - http://lib.rus.ec/b/231474

Взял на вычитку А. Адамович, Д. Гранин, "Блокадная книга"(http://lib.rus.ec/b/212340), отметьте, пожалуйста, в таблице.

tutor63 написал:
Взял на вычитку А. Адамович, Д. Гранин, "Блокадная книга"(http://lib.rus.ec/b/212340), отметьте, пожалуйста, в таблице.

Эээээ.... Вообще-то в таблице она отмечена как сделанная.
Вы считаете, её нужно снова вычитывать?

Расскажите про ограничение в 10 мегабайт на загружаемый файл. Если размер FB2 больше 10 мегабайт, а в архиве он занимает меньше 10 мегабайт, то загрузка не пройдет? Проверяется размер несжатого FB2?

n_a_u написал:
Расскажите про ограничение в 10 мегабайт на загружаемый файл. Если размер FB2 больше 10 мегабайт, а в архиве он занимает меньше 10 мегабайт, то загрузка не пройдет? Проверяется размер несжатого FB2?

Несжатого.
Всё загружаемое распаковывается, после чего анализироуется и добавляется.
Файлы, тяжелее 10М, надо заливать на фтп для последующей обработки библиотекарями.

Добрый день!
Вычитываю "Дети капитана Гранта" на предмет ошибок OCR, отметьте пожалуйста.

chursik написал:
Добрый день!
Вычитываю "Дети капитана Гранта" на предмет ошибок OCR, отметьте пожалуйста.

Отмечено. :)

Добрый день!
На ошибки OCR книжку вычитала, залила в библиотеку, но требуется еще сверка с бумажным оригиналом, которого у меня, к сожалению, нет. Отметьте, пожалуйста.

golma1 написал:
chursik написал:
Добрый день!
Вычитываю "Дети капитана Гранта" на предмет ошибок OCR, отметьте пожалуйста.

Отмечено. :)

Добрый день!

Ошибки OCR вычитаны, книга залита в библиотеку. Нужна еще сверка с оригиналом, коего у меня, к сожалению, нет.

chursik написал:

Ошибки OCR вычитаны, книга залита в библиотеку. Нужна еще сверка с оригиналом, коего у меня, к сожалению, нет.

Спасибо. Отмечено.

Залил книгу http://lib.rus.ec/b/233246
Нужно определиться с серией и номером, в самой книге стоит "Повести о Шерлоке Холмсе - 04", но я не уверен, что это правильно. В любом случае, в библиотеке этой книги нет. Или правильно сказать - я не нашёл? :)

Можно ли поставить Эса де Кейрош«Перепискa Фрадике Мендеса» в fb2?Здесь есть только в PDF, уже с распознаваемым текстом (не в картинках) http://imwerden.de/cat/modules.php?name=books&pa=showbook&pid=2495

Можно ли поставить книги-воспоминания Маклакова в fb2?http://lib.rus.ec/a/7712

Здравствуйте. Залила "Письмовник" Михаила Шишкина (http://lib.rus.ec/b/239409). Возможно, он нуждается в правке, но я пока в этом не сильна. Посмотрите, пожалуйста.

Доброго времени суток!

Не имея опыта вычитки, но имея бумажный вариант на руках, хотелось бы попробовать вычитать

Цитата:
Абрамов Место покоя Моего http://lib.rus.ec/b/157708 вычитать (желательно с оригиналом)

Но при скачивании fb2 нарвался на
Цитата:
Вы захотели выкачать книгу ограниченного доступа

Выше сказано, что этому могут помочь волшебные люди - "библиотекари". Подскажите, как их отыскать =)

Спасибо большое,
Юрий ака WeeS

WeeS написал:

Выше сказано, что этому могут помочь волшебные люди - "библиотекари". Подскажите, как их отыскать =)

http://lib.rus.ec/stat/bibl

Пришлите мне Ваш е-мейл, я вышлю Вам книгу.

Надеюсь, Вы собираетесь вычитывать книгу в fb2. ;)

Аватар пользователя Trinki

Возьму на вычитку и правку книгу Юзефа Чельгрена Приключения в шхерах
Большая, просто огромная просьба - если у кого-то есть в бумаге или знаете, где найти полный pdf/djvu - откликнитесь, в книге не хватает 63-64 страниц!

Trinki написал:
Возьму на вычитку и правку книгу Юзефа Чельгрена Приключения в шхерах
Большая, просто огромная просьба - если у кого-то есть в бумаге или знаете, где найти полный pdf/djvu - откликнитесь, в книге не хватает 63-64 страниц!

Вот, нашла возможность купить эту книгу: http://detbook.ru/2009/05/2211.htm
Вот условия доставки: http://detbook.ru/pro-dostavku

Может, кого-нибудь сподвигнет. :)

А все остальные, лежащие в сети варианты, те же?
Я вот что, например, нашла:
http://tululu.ru/read55299/63/
http://tululu.ru/read55299/64/
Это не то?

Или можно написать "Андрею_из_Архангельска" - он сканировал.
http://publ.lib.ru/ARCHIVES/CH/CHEL%27GREN_Yuzef/_Chel%27gren_Yu..html

Аватар пользователя Trinki

golma1 написал:
А все остальные, лежащие в сети варианты, те же?

О, всецело извиняюсь, только что заглянула на сайт Мошкова, как в последнюю инстанцию, а там лежит полная версия! (разрыв в нашем файле со слов "Поганки не подозревали об опасности. Они были всецело заняты своими промысловыми делами. Над водой пооче-"). А ведь днем половину инета прошерстила.. Спасибо, golma1, если бы не спросили - и не посмотрела бы :)
Сделаем! :)

Поправил "Новые боги" Пехова (около пяти багов OCR). Поскольку на книге знак качества, перезалить система не дает, выкладываю сюда.

Зря вы это.
1.Из-за "около 5 багов OCR" не меняют книгу, негласное правило - более десяти.
2.Не меняют вообще фб2 книгу на txt. Уж ежели вычитываете - вычитывайте в ФБЭ.

Успехов

Аватар пользователя Trinki

Книга готова
Путаница в комментах получилась, но я про книгу "Приключения в шхерах" Юзефа Чельгрена.

Приветствую!
В своё время где-то на просторах и-нета выкачала подборку книг Дика Фрэнсиса в формате lit на англ. языке. Когда начала читать (я переводчик), обнаружила огромное количество ошибок распознавания OCR и пропущенные строки (из скачанного комплекта 4 книги у меня есть в бумажном виде). Текст книги For Kicks начала исправлять, сверяясь с бумагой, с целью выложить на torrents.ru, но работа осталась недоделанной. Сейчас решила посмотреть, в каком качестве лежит эта книга здесь, и обнаружила точно те же ошибки OCR и отсутствующие строки.
Вопрос: можно ли взять эту книгу: For Kicks на вычитку, она в платном доступе? Если можно, то как?

tanquana написал:
Приветствую!
В своё время где-то на просторах и-нета выкачала подборку книг Дика Фрэнсиса в формате lit на англ. языке. Когда начала читать (я переводчик), обнаружила огромное количество ошибок распознавания OCR и пропущенные строки (из скачанного комплекта 4 книги у меня есть в бумажном виде). Текст книги For Kicks начала исправлять, сверяясь с бумагой, с целью выложить на torrents.ru, но работа осталась недоделанной. Сейчас решила посмотреть, в каком качестве лежит эта книга здесь, и обнаружила точно те же ошибки OCR и отсутствующие строки.
Вопрос: можно ли взять эту книгу: For Kicks на вычитку, она в платном доступе? Если можно, то как?

Довольно странный вопрос.
В начале поста Вы пишете, что у Вас эта книга есть, а потом спрашиваете, как её скачать.
А, понял, у Вас она есть в формате LIT, а нужно FB2.
UPD
Выслал в личку

sem14
1) Поскольку правило негласное - откуда ж мне было его знать? К тому же, по-моему, зря. Нет предела совершенству, разве не так? Тем более баги заметные, вроде множественно встречающегося слова "падалыцик" :)
2) Это не txt, а полноценный fb2, сжатый раром. Просто движок позволяет заливать только определенные расширения, вот и переименовал.

tanquana
http://lib.ololo.cc/b/155653

Вы же сами понимаете, что нет предела совершенству.
Вы нашли около 5 опечаток, за вами найдут около 4-х. И не будет конца заменам, при том, что все варианты остаются на сервере.
Хотя падалыцик - не есть хорошо.

А насчёт расширений - вы ж не написали, а миелофон - в ремонте.

sem14

Цитата:
Вы нашли около 5 опечаток, за вами найдут около 4-х. И не будет конца заменам, при том, что все варианты остаются на сервере.

Насчет того, что конца не будет - вряд ли, когда-нибудь баги да иссякнут же. А вот что варианты остаются - не знал. Может, хотя бы временно?
Цитата:
А насчёт расширений - вы ж не написали, а миелофон - в ремонте.

Ну, я думал, что названия http://posters.ec/sites/default/files/Pehov_Kindret_4_Novyie_bogi.228605.rar__0.txt будет вполне достаточно для определения истинного содержимого. Тем более что fb2 в списке разрешенных для аттача расширений тоже нет

Здравствуйте. Очень бы хотелось увидеть в библиотеке научный труд обер-прокурора Святейшего Синода всея Руси - К.П. Победоносцева - Курс гражданского права. Тома I-III
На данном этапе есть полностью вычитанный трёхтомник в формате .doc (с оглавлением и примечаниями).
Скачать можно по ссылке (.doc в .zip архиве, вес около 10 mb)
Был бы признателен, если кто сможет, конвертировать книгу в fb2 и придать ей надлежащий вид (разбивка по секциям и пр.)
В библиотеке этой книги нет, в других кстати тоже.

Jin написал:
Здравствуйте. Очень бы хотелось увидеть в библиотеке научный труд обер-прокурора Святейшего Синода всея Руси - К.П. Победоносцева - Курс гражданского права. Тома I-III...
Был бы признателен, если кто сможет, конвертировать книгу в fb2 и придать ей надлежащий вид (разбивка по секциям и пр.)
В библиотеке этой книги нет, в других кстати тоже.
Пожалуй, возьмусь. Но дело не быстрое...

А в формате doc заливать можно? А то с созданием фэбэшек знакома плохо и только в теории...

Летисия написал:
А в формате doc заливать можно? А то с созданием фэбэшек знакома плохо и только в теории...

Если книги ещё нет в библиотеке, можно. Но, пожалуйста, обязательно проверьте перед заливкой.

Делаю антологию на англ. языке(THE SEVENTH PAN BOOK OF HORROR STORIES). Авторов в дескрипшн забивать на английском(потом алиасить), или на русском.

На языке, на котором книга. Тем более если это родной язык автора. Но чтобы не было потом проблем - алиасить авторов надо сразу же после заливки книги.

ОК, так и сделаем...

Аватар пользователя lovetodare

Брала на вычитку книгу из таблицы: Николай Гомолко - Шестой океан. Вычитка закончена. Формат ртф. Что делать с файлом? Прислать вам?

lovetodare написал:
Брала на вычитку книгу из таблицы: Николай Гомолко - Шестой океан. Вычитка закончена. Формат ртф. Что делать с файлом? Прислать вам?

Хммм... А в fb2 не получается вычитывать?
Выложите на страницу автора и объедините с существующим fb2.

Однако вопрос формата очень важен. Потому что Финна, например, я бы Вам прислала на почту. Но делать из fb2 текстовый формат? Не думаю, что это в этом случае целесообразно.
С Гомолко быть особый случай - книга была практически нечитабельна. А у Финна надо исправить всего лишь абзацы и пустые строки. Не думаю, что из-за этого стоит похерить труд верстальщика.

Аватар пользователя lovetodare

Гомолко изначально был в ртф формате, я его не переделывала. А у Финна нет текста в ртф формате? Может можно будет вычитать в нём, а потом перевести в fb2?

lovetodare написал:
Гомолко изначально был в ртф формате, я его не переделывала.

Вообще-то нет. http://lib.rus.ec/b/206336
Видно, Вы скачали сразу в rtf. Но это неважно в данном случае. Потому что предыдущая книга была нечитабельна совершенно. Так что огромное Вам спасибо.

lovetodare написал:
А у Финна нет текста в ртф формате? Может можно будет вычитать в нём, а потом перевести в fb2?

Это как раз то, чего хочется избежать - "потом перевести в fb2". Это значит, что вся работа верстальщика, сделавшего исходный файл - коту под хвост. Это неправильно. :(

А почему бы Вам не вычитывать в fb2? Насколько я поняла, Вы вычитываете на компьютере?
Поставьте FBE и читайте в нём. Ничего, кроме грамматических ошибок не исправляйте и будет тогда оптимальный вариант.
Если решитесь, перед заливкой новой книги отпишитесь кому-нибудь из библиотекарей, Вам подскажут, что ещё нужно сделать (повысить версию, заполнить хистори), чтобы книга загрузилась на сайт. Или сами сделают.
Попробуйте. В режиме чтения FBE очень похож на Word. :)

Аватар пользователя lovetodare

Ну, раз это просто и похоже на Word, тогда буду вычитывать в fb2. Надо же, в конце концов, и что-то новое узнавать. Книгу уже скачала. Вот только при попытке установать FBE, скачанный по вашей ссылке, у меня выходит сообщение NSIS Error. Скачала его же с вкладки "Программы" - там была августовская версия - то же самое! На табличке с Эррором - совет обратиться к автору инстоллера, чтобы получить новую копию...

Страницы

X