Вычитка #5 (2010-I)

Теперь главная тема по вычитке здесь.

Архив тем:
1. 2008-I
2. 2008-II — 2009-I
3. 2009-II
4. 2009-III

таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA

Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: http://lib.rus.ec/stat/document-author/rusec. Книги из этого списка нуждаются в доработке: форматировании и вычитке.

Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе.

Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке http://lib.rus.ec/stat/tot и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования.

Присоединяйтесь к нам! :)
Обращение golma1'ы:

golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"!

Тем, кто не знаком с форматом fb2, рекомендую вначале заглянуть в эту книгу. Здесь в популярной форме даются описания и разъяснения основных моментов этого формата. Если вдруг что-то окажется непонятным, всегда можно обратиться с вопросом в форум, вам обязательно помогут. Нужные для работы с fb2-файлами программы вы найдёте здесь.

Книги, сделанные в fb2 и нуждающиеся в вычитке, следует и вычитывать в этом формате. При конвертировании файла в текстовый формат неизбежно теряются ценные детали форматирования, восстановить которые впоследствии если и возможно, то очень трудоёмко.

Под вычиткой подразумевается:
1. Исправление ошибок OCR.
2. Форматирование текста:
- разбиение текста на части, главы, подглавы (секции и вложенные секции, тэги title и subtitle)
- выделение жирным и наклонным шрифтом (тэги strong и emphasis)
- проставление разделений в тексте (тэг empty-line)
- проверка скриптами
3. Заполнение дескриптора (обложка, аннотация, выходные данные книги)
4. При необходимости конвертирование в fb2-формат.

Для вычитки можно пользоваться читалкой AlReader Vobis Edition или редактором FictionBookEditor. Ссылки на обе программы были даны выше.
В самом крайнем случае, файл fb2 можно открыть текстовым редактором, сохраняя при этом все тэги. В этом случае, если изменения вносятся только в текст, форматирование сохраняется.

Убедительная просьба - не конвертировать fb2-файлы в текстовый формат. Не забывайте, что fb2 является предпочтительным форматом нашей библиотеки и книги следует заливать, по возможности, в нём. И уж во всяком случае, не стоит заменять формат fb2 другим форматом.

Если почему-то вам не хочется разбираться в формате fb2, берите на вычитку книги, представленные в библиотеке в текстовом формате. Их можно заливать в том виде, в каком вы их скачали.
Также можно брать файлы в форматах djvu или pdf и распознать их в текстовый формат. Однако это касается преимущественно художественной литературы, т.е. произведений, состоящих в основном из текста. Книги с множеством иллюстраций, таблиц, формул лучше оставить в том виде, в каком они есть.

Если я что-то упустила или невнятно сформулировала, спрашивайте. :)

Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
Они помогут Вам разобраться в пользовании самой распространённой программой FBE.
Всем привет! :)

Спасибо большое.

Учту на будущее такой способ, как поиск по тексту. Спасибо.

А вот как в фб2 оформить постраничные ссылки указателя на упомянутые термины или фильмы/книги.
Вот:

Удалить эту часть вообще? Надо ли как-то отмечать, что в бумажной книге она была?

Я оставляю в fb2 точно так как в книге, указатели пишутся для читателей, которые уже умеют думать, и как минимум дают количество упоминания термина в тексте. А в файле, уже имея термин, можно найти поиском, если это, конечно, кому-нибудь понадобится.
Но я не настаиваю на таком решении :)

Цитата:
оставляю в fb2 точно так как в книге,

В смысле, оставляете все как есть, с цифрами страничной разметки? Никаких пометок не делаете?
Цитата:
Но я не настаиваю на таком решении :)
Ну, к сожалению, никто больше другими идеями и не поделился :(

Tramell написал:
Цитата:
оставляю в fb2 точно так как в книге,

В смысле, оставляете все как есть, с цифрами страничной разметки? Никаких пометок не делаете?
Цитата:
Но я не настаиваю на таком решении :)
Ну, к сожалению, никто больше другими идеями и не поделился :(

Я этот раздел не сохраняю. Он изначально задуман для того, чтобы помочь читателю найти упоминание того или другого термина. В электронном варианте поиск работает по-другому - номера страниц ни к чему.

Можно сохранить список без номеров страниц: как пример терминов или названий, употреблённых в книге. Но и в этом я не вижу большого смысла.
Вы как верстальщик вправе принять собственное решение. :)

Поддерживаю. Тоже считаю, что данный список излишен. Хотя в одной книге такой список оставил с указанием того, что нумерация соответствует книжному изданию (http://lib.rus.ec/b/267303/read#n_8)

Да, прямо с цифрами страничной разметки, мне кажется, в конце книги (электронной) это не мешает, много времени не занимает, а страницы как раз и дают количество упоминаний, а править и прибавлять что то свое (например я встречал мнение, что хорошо бы привязать к коду) - это излишне и требует достаточных затрат времени.

Аватар пользователя PrePress

Tramell написал:
Цитата:
оставляю в fb2 точно так как в книге,
В смысле, оставляете все как есть, с цифрами страничной разметки? Никаких пометок не делаете?
Цитата:
Но я не настаиваю на таком решении :)
Ну, к сожалению, никто больше другими идеями и не поделился :(

В книге http://lib.rus.ec/b/368291/ в подобном списке портретов и иллюстраций http://lib.rus.ec/b/368291/read#t15 я оставил номера страниц и связал их ссылками с соответствующими картинками. Мне кажется, получилось неплохо, но времени на это (их было >400) ушло чуть ли не больше, чем на остальную работу.
А в предметном указателе позиций наверняка еще больше. Так что попробуйте оценить трудозатраты и решите, стоит ли оно того.

Удалять же раздел полностью не стоит, по-моему. Список сам по себе имеет некоторую ценность. А если кого что-то из него заинтересует, найдет нужную позицию поиском.

Ссылки к картинкам - это немного другое. И хоть тут позиций намного меньше, решила раздел совсем удалить.
Причины:
- В книге подробное оглавление и большинство нужных позиций можно найти даже не запуская поиск.
- Некоторые термины упоминаются на разных страницах. А одну ссылку на все оформить нельзя.
- В электронной книге все можно найти поиском, даже то, чего нет в указателе, а оставлять постраничные отметки, как бесполезный набор цифр как-то неправильно.
Ну и наконец:
- Это не настолько уж сугубо-научная книга.

Всем большое спасибо за советы и помощь в решении вопроса :)

Долго искал, где бы задать вопрос. Толком не понял, решил спросить здесь, возможно не совсем по теме.
Оцифровал и вычитал "Шестиклассников" Сальникова, но в моём экземпляре не хватает двадцати страниц. 111-114, 289-292, 299-310, издательство "Молодая гвардия",1960 год. Неаккуратно получается. Кто-нибудь может выслать сканы этих страниц? Если другое издание, то напишу с каких и до каких слов. Пишите в личку.

Ребята, может кто подскажет: установила для редактирования программу FB Editor. Вижу, что программка классная: и инструментов много полезных, и орфографию проверяет. Но у меня тормозит ужасающе: сделаешь один скрол, она тут же подвисает минуты на 3. Работать, естественно, абсолютно не возможно.
Может, у кого-нибудь была такая же проблема и как ее решать? Муж говорит, что скорее всего из-за того, что прога рассчитана на 32-битную Винду, а у нас стоит 64-х. Может, тогда есть версия для 64-х?
Плиз, ай нид хэлп :)

Chita-Drita написал:
...скорее всего из-за того, что прога рассчитана на 32-битную Винду, а у нас стоит 64-х. Может, тогда есть версия для 64-х?

Нормально на 64 работает (win 7). С "вистой" вроде были какие-то заморочки. Можно версию FBE попробовать сменить. Поновее или постарее взять.

J_Blood написал:
Chita-Drita написал:
...скорее всего из-за того, что прога рассчитана на 32-битную Винду, а у нас стоит 64-х. Может, тогда есть версия для 64-х?

Нормально на 64 работает (win 7). С "вистой" вроде были какие-то заморочки. Можно версию FBE попробовать сменить. Поновее или постарее взять.

+1.

Попробуйте версию 2.6.4.

А, еще можно попробовать словари не все устанавливать. Только которыми пользоваться собираетесь.

Chita-Drita написал:

Может, у кого-нибудь была такая же проблема и как ее решать? Муж говорит, что скорее всего из-за того, что прога рассчитана на 32-битную Винду, а у нас стоит 64-х. Может, тогда есть версия для 64-х?
Плиз, ай нид хэлп :)

Она тормозит на многоядерных процессорах и ХР.

Скачала версию 2.6.6 и словари устанавливала только русский и английский (их не устанавливать нельзя) и все равно та же лажа. Такое ощущение, что прога должна полностью подгрузить текст. Поставили эксперимент: создали текст из 20 строк, на нем она тоже подвисала, но когда все как бы подгрузила, то уже зависания при скролинге не было. Но у меня текст явно не из 20 строк. Сколько ж нужно ждать, чтоб она все подгрузила?
Есть какие-нить варианты решения или мысли?

А если антивирусник отключить?

Chita-Drita написал:

Есть какие-нить варианты решения или мысли?

Попробуйте предыдущие версии, начиная с 2.4.

Книга В. Ерофеева "Москва-Петушки" http://lib.rus.ec/b/142473 нуждается в вычитке.
У меня есть в бумаге издание 1991 года, Рига. Начал вычитывать по этому изданию, столкнулся с тем, что редакторская правка в нем сильно отличается от представленной в библиотеке версии. (издание 2002 года?)
Стоит ли вычитывать?

wvd написал:
Книга В. Ерофеева "Москва-Петушки" http://lib.rus.ec/b/142473 нуждается в вычитке.
У меня есть в бумаге издание 1991 года, Рига. Начал вычитывать по этому изданию, столкнулся с тем, что редакторская правка в нем сильно отличается от представленной в библиотеке версии. (издание 2002 года?)
Стоит ли вычитывать?

Если это разные редакции, то исправлять имеющуюся не надо. А вот создать новый файл с новой редакцией - очень даже нужно. :)
Можно взять имеющийся и внести необходимые изменения, но, во-первых, не объединять его с лежащим на сайте, а во-вторых, изменить выходные данные бумажного издания.

СтОит, но это будет новый файл (издание 1991 г.).

Цитата:
Книга В. Ерофеева "Москва-Петушки" http://lib.rus.ec/b/142473 нуждается в вычитке.
У меня есть в бумаге издание 1991 года, Рига. Начал вычитывать по этому изданию, столкнулся с тем, что редакторская правка в нем сильно отличается от представленной в библиотеке версии. (издание 2002 года?)
Стоит ли вычитывать?

Книгу добавил. http://lib.rus.ec/b/376180
Как теперь ее пометить, чтобы не удалили как дубль?

wvd написал:
Книгу добавил. http://lib.rus.ec/b/376180
Как теперь ее пометить, чтобы не удалили как дубль?

Вы проставили год издания - этого достаточно

Готов вычитать Арнольд Джозеф Тойнби книгу Цивилизация перед судом истории. В таблице по вычитке указано что требуется, а на странице самой книги - что уже вычитывается. Что делать?

Берите смело на вычитку, ею пытались заняться еще в 2009 году, но дело не довели до конца, увы :(

Roxana написал:
Берите смело на вычитку, ею пытались заняться еще в 2009 году, но дело не довели до конца, увы :(

Не получается скачать...просит денег...)))

Скиньте мне в личку вашу электронку, я вышлю книгу.

Я вычитала книгу Мэри Энн Шеффер "Клуб любителей книг и пирогов из картофельных очистков". Вроде загрузила новую версию, но на странице книги ничего не добавилось. Это нормально? Или должно было что-то появиться? Добавляю первый раз, так что полный чайник :)

А после загрузки было сообщение "Книга добавлена"? Просто я не вижу добавленной книги...

Похоже, поняла в чем ошибка.
Когда добавляешь файл, говорит, что версия, не выше, чем у прежней. Прочитала, как эту версию исправить, поставила 1,01, но теперь он пишет следующее: Warning 97: Unsupported version '1.01' on line 1
Плохой, негодный файл.
Это из-за чего?

Chita-Drita написал:
Похоже, поняла в чем ошибка.
Когда добавляешь файл, говорит, что версия, не выше, чем у прежней. Прочитала, как эту версию исправить, поставила 1,01, но теперь он пишет следующее: Warning 97: Unsupported version '1.01' on line 1
Плохой, негодный файл.
Это из-за чего?

А где Вы исправили версию? Нужно в
<version>1.0</version>

И лучше - 1.1.

Все получилось! Спасибо большое за помощь!

Я хочу тоже какую-нибудь книгу попробовать вычитывать. Но не совсем понимаю последовательность. Если к книге написано, что Отсканировано, но в строке Распознать никаких движений, значит книгу нужно сначала Распознавать, потом Вычитывать? И могу ли я тогда взять на себя и Распознавание тоже, нужна ли для этого книга в бумажном виде? И где делается распознание, уже в формате FB2? Может глупые вопросы, но я честно искала ответы на страницах сайта и не нашла. А заняться этим очень хочется.

Tigra-du написал:
Я хочу тоже какую-нибудь книгу попробовать вычитывать. Но не совсем понимаю последовательность. Если к книге написано, что Отсканировано, но в строке Распознать никаких движений, значит книгу нужно сначала Распознавать, потом Вычитывать? И могу ли я тогда взять на себя и Распознавание тоже, нужна ли для этого книга в бумажном виде? И где делается распознание, уже в формате FB2? Может глупые вопросы, но я честно искала ответы на страницах сайта и не нашла. А заняться этим очень хочется.

Посмотрите здесь http://lib.rus.ec/node/396101

Распознавание проводится программой Finereader - туда загружают сканы (изображения) и на выходе получают полуфабрикат текста (либо сразу сохраняется в fb2, либо копируется и вставляется в fbe (редактор fb2), либо сохраняется в ворд). Для распознавания не нужна бумажная книга, нужны сканы. Для вычитки бумажная книга не обязательна также, но иногда бывают спорные места, где без оригинала невозможно понять, что там, тогда можно посмотреть в скане (попросить сканировщика) или в бумажной книге (если она есть у вас).
Распознавание может либо выполнить сканировщик и прислать вам только текст, либо вы сами (по желанию), и тогда вам вышлют сканы.
Вот вроде не запуталась))) Если чего, поправьте)))

Всем спасибо за подсказки. Like Indigo, а можно твою книгу какую-нибудь взять для начала, на предмет распознавания и вычитки? Плиз ))

Я не против)) Посмотри в разделе Сканирование и вычитка, как раз добавила все свои книги. Если нажата кнопка Отсканировал, то сканы уже готовы. Выбирай любую и пиши в личку.

Читаю/вычитываю http://lib.rus.ec/b/383612 Не так чтобы много ошибок, но они есть. Для книги весом до мегабайта точно сделал бы замену, но она с множеством иллюстраций (кстати, очень похоже, что они сторонние. Хотя могу ошибаться) имеет 5М. Поэтому есть сомнение - перезаливать ли.

Аватар пользователя Isais

Насчет происхождения иллюстраций надо спрашивать ее верстальщика.
А вот если Вы, помимо вычитки, еще и занесете в файл всех авторов и переводчиков (по последним данным разведки - 108 гавриков, цифра не окончательная) - это будет значительное улучшение. Но это на мой взгляд. У коллег-библиотекарей может оказаться другое мнение.

...И вообще я ненавижу такие искусственные сборники (несмотря на то, что в юности лепил их в реале из художественных журналов). Это хозяйство замечательно смотрелось бы и в виде одинарных файлов: один рассказ = один файл.

Цитата:
А вот если Вы, помимо вычитки, еще и занесете в файл всех авторов и переводчиков

В дескрипшен... Такой момент - занесу, но думаю, что в файле надо оставить информацию (автор, переводчик, иллюстрация) как есть после каждого произведения. Так очень наглядно. А в дескрипшене не разберешься - кто и что.

tvnic написал:
Цитата:
А вот если Вы, помимо вычитки, еще и занесете в файл всех авторов и переводчиков

В дескрипшен... Такой момент - занесу, но думаю, что в файле надо оставить информацию (автор, переводчик, иллюстрация) как есть после каждого произведения. Так очень наглядно. А в дескрипшене не разберешься - кто и что.

В дескрипшен заносится не для наглядности, а для каталогизации. ;)
А вот то, что стоит в body, видят читатели. Поэтому там наглядность очень важна, да. :)

Цитата:
В дескрипшен заносится не для наглядности, а для каталогизации. ;)

Само собой. В частности можно легко определить, что конкретный автор в сборнике присутствует.
Я имел в иду, что просматривая дескрипшен, не поймешь - кто и что написал или перевел в сборнике. Если только не прописать эти подробности в "дополнительной информации".

Добрый день!!Нашёл книгу Сараскиной "Достоевский" PDF .Кто сможет выложить в fb2?
http://www.ludmila-saraskina.info/books/dostoevskij

Хочу вычитать, сверстать и попутно сделать fb2 "Путешествие Сократеса" http://lib.rus.ec/b/255930
Но во многом нужны сканы книги. Это ж никуда не годиться:

Долг г0" ^ меня сын'я возложил на него этот Д°чь тЫНа ^ меня нет> зато У меня есть такая способная
г°Ды Пе^Ь ™ знаешь> ради чего тебе пришлось все эти
возвести в изнурительных тренировках, почему я
п0т м такие надежды на тебя. И почему я передаю тебе
в°ей м Н — чт°бы ты не забыла, кто виновен в смерти
^ Я нееРИ И М°ИХ Родителей*

Может, у кого-то есть сканы? Или кто-то сможет их сделать. Или посоветовать, где мне лучше о них спросить.

dashaxp написал:
Хочу вычитать, сверстать и попутно сделать fb2 "Путешествие Сократеса" http://lib.rus.ec/b/255930
Но во многом нужны сканы книги. Это ж никуда не годиться:

Может, у кого-то есть сканы? Или кто-то сможет их сделать. Или посоветовать, где мне лучше о них спросить.


Сканов не нашла, зато нашла ПДФ, может, поможет http://www.multiupload.nl/OVJVNMADQG

подскажите кто-нибудь, на странице ''три прыжка ван луня'' альфреда деблина
стоит отметка что человек вычитывает c 2011-10-28
вроде времени уже столько прошло, стоит ли вообще ожидать что он еще занимается этим и книга появится, или это значит что он давно забил
я писал этому человеку в личные сообщения - ничего
оставлял заявку на вычитку и тоже ничего

del

Аватар пользователя Isais

v5mit написал:
подскажите кто-нибудь, на странице ''три прыжка ван луня'' альфреда деблина
стоит отметка что человек вычитывает c 2011-10-28
вроде времени уже столько прошло, стоит ли вообще ожидать что он еще занимается этим и книга появится, или это значит что он давно забил
я писал этому человеку в личные сообщения - ничего
оставлял заявку на вычитку и тоже ничего

Книга появится. Когда выполню свои обещания номер 1, номер 2, номер 3... В настоящий момент этот проект не на первом месте.
На все полученные письма отвечаю.

Страницы

X