Как да направя е-книга

Кратко ръководство как се правят електронни книги. Малко, но както се казва – от сърце!

Етапи:

  • Сканиране
  • Разпознаване (OCR)
  • Първа корекция
  • Втора корекция
  • Форматиране
  • Трета корекция
  • Публикуване

 

Сканиране

За да направим една електронна книга, първо трябва да сканираме хартиената. Целта е да получим картинки с резолюция 300 dpi. Ето такава:

 

А сега малко по-подробно.

Преди са започнете да сканирате, се подгответе морално, че може да съсипете книгата. В зависимост от качеството на книговезката работа хартиеното издание може просто да се попилее на листове, макар че обикновено оцелява.

Сканирането е механична и повтаряема работа, затова гледам да я свърша с минимален разход на време и мисъл. Въобще, на тема „креативен мързел“ мога да напиша дисертация. Схемата на работа, която съм възприел, е следната: сканирам кориците, след което отварям книгата някъде по средата, за да направя пре-скан. Определям си зоната на сканиране (с малки резерви) и повече никога не повтарям това действие за тази книга. След това се нагласям удобно и един разтвор след друг сканирам. Програмата, която ползвам, автоматично именува поредните файлове с „Untitled-...“, следвано от пореден номер, което ме устройва напълно. За преглед на свършената работа ползвам FastStone, която предлага бърз начин да преименувам файловете наведнъж, след като приключа с дневната си порция сканове. Само като ориентир: при сравнително бърз скенер може да се сканират от два до 4 разтвора за минута. Файловете запазвам във формат JPEG с високо качество, всички заедно в отделна папка.

Ако правите това за пръв път, добре е след като сканирате първите десетина разтвора, да тествате следващата стъпка: оптичното разпознаване на текста. Това е най-лесния начин да проверите дали не сте сбъркали нещо.

 

Оптично разпознаване на текста (OCR/Optical Character Recognition)

Целта на разпознаването е картинката (сканираната страница) да се превърне в текст, сякаш е писан в Word. Технологията е много интересна, но за малко хора, затова я подминаваме и се концентрираме върху процеса. За разпознаването е нужна програма. Abbyy Fine Reader е може би най-добрата и най-разпространената в zamunda.net. Работя с версия Professional 11 и нямам никакви забележки. Сваля се, инсталира се, пуска се и се отваря нов документ, ако няма вече отворен. Задават се езиците, на които е написан текста, който обработваме. Обикновено е български. Може да се включи и английски/испански/френски, ако има фрази от тези езици. Иначе ще трябва да си ги набираме на ръка след разпознаването. Не се задават повече езици, за да не се мъчи излишно програмата и за да са по-коректни резултатите от работата ѝ.

С Open (Open PDF File/Image) отиваме в папката, където са сканираните страници и ги избираме всичките. Обикновено отварям Options и изключвам изчитането на страниците при импорт, оставям включена опцията за анализа на страниците, както и тази за автоматично разделяне на страниците от разтворите и завъртането им.

След което натискам ОК и в зависимост от книгата и бързината на компа имам цигара или две време, за да си свърши работата Readera-a. Ако всичко дотук е извършено правилно, в резултат получавам страница след страница с означени зоните, в които ще се чете текста. Обикновено това е основното наборно поле, колон-цифрата (номера на страница) и по-рядко – някой и друг дефект по сканираното изображение. Страници, които са празни, или съдържат само илюстрации, се означават с червено и Reader-ът извежда за тях съобщение за грешка. Това е нормално.

За да не затормозявам програмката минавам страница по страница и изтривам (маркиране и Del) ненужните зони за разпознаване. След това съхранявам документа. Една особеност на Abbyy: необходимо е да се съхрани документа само веднъж, след това той сам си съхранява всички промени в момента, в който преминаваме на нова страница. Маркирам всички страници в лявата лента и давам команда Read (Read Selected Pages).

В резултат: в лявата част на екрана е сканираната страница-картинка, а в дясната – текстът, който е разчетен от програмата (може да е в различен вид: като максимално точно копие, като форматиран текст и т.н.).

 

Сега започва един от най-важните етапи: първата корекция.

 

Първа корекция

Корекциите са необходими, защото във всеки ръкопис винаги има грешки. Първата корекция се извършва в Abbyy веднага след автоматичното разпознаване. Основната цел на първата корекция: да съхрани структурата на книгата и да се махнат колкото се може повече грешки. С какво е особена корекцията в Abbyy? Това е единственото място, където на екрана съжителстват хартиения оригинал и разчетения текст. Сравнението между двете е най-лесно. Освен правописните грешки сега е добре да се отбележат местата, където има сюжетни разделители (обикновено празни редове или редове с три звездички); местата, където новата страница започва с нов ред, по-особено оформление на пасажи от книгата; смислови акценти (курсив), цитати, бележки под линия, стихотворения и т.н.

Отварям една голяма скоба.

На този етап трябва да имате вече ясна представа в какъв файлов формат ще направите електронната си книга. Ако ще я запазвате като Word-документ, с идеята след това да я конвертирате към EPUB, например, би трябвало да уточните форматираните получерни (bold) или курсивни (italic) участъци от текста, с които обикновено се обозначават смислови акценти, чужди думи, авторови мисли и т.н. Да форматирате с отстъпи/шрифт и всички възможности на Word-формата отделните пасажи на текста.

Лично аз, обаче, съм привърженик на SFB-формата (native-формата на Моята читанка). Преимуществата му накратко:

  • универсален и отворен: може да бъде четен по един и същи начин от всеки компютър и всяка операционна система. Без специализиран софтуер. И така ще е от тук до края на света.
  • от SFB можем да получим коректен EPUB/LRF/Mobi/FB2, както и всеки друг формат. Обратното не е вярно.

Затова горещо препоръчвам употребата на SFB и от тук нататък проследявам работата по електронната книга с цел получаване на коректен SFB-файл. Свръхкраткото, краткото и пълното ръководство за формата SFB се намират на Моята читанка.

Затваряне на скобата.

Първата коректура е единствения етап, когато чета книгата буква по буква и от кора до кора на екрана на компютъра и затова ми е най-лесно да сравнявам и да нанасям корекциите. За какво гледам:

  • правописни грешки от разпознаването;
  • започване на нова страница с нов ред;
  • завършване на страница. Често Abbyy пропуска преносото тире на края на страницата;
  • по-особени абзаци от текста: анотация, заглавия, подзаглавия, цитати и т.н. Маркирам ги с маркерите на SFB.
  • смислови акценти: курсив и получер текст. Маркирам ги с маркерите на SFB.
  • бележки под линия и препратки. Маркирам ги с маркерите на SFB.
  • проблеми от Abbyy. Например, ако вътре в абзаца следващия ред започва с цифра или дата, много често Abbyy го отчита като начало на нов абзац, като вмъква табулатор след цифрата/датата.
  • внимателно сравняване на цифри, дати, номера с оригинала;
  • заместване на „Б. пр.“ с „Б.пр.“ и тям подобни.

Списъкът не е пълен. Често в дадена книга преобладават едни или други грешки, което се дължи на хартия, шрифт, набор, напр. често Abbyy бърка „с“ и „е“. Тези грешни тенденции се виждат само с четене.

Когато тепърва започвах да правя електронни книжки, този етап се опитвах да си го спестя (ненавиждам четенето от екрана на компютъра), като разчитах на автоматичен коректор и следващото изчитане на моята си читанка за да елиминирам грешките. Убедих се, че не става.

В края на етапа първа корекция получавам текст (разбит на страници), който може да бъде записан като TXT-файл (т.е. – без ошрифтяване, курсиви и т.н.), без да загубя нищо от оформлението на книгата. Записвам го като Word или прост текстов файл. Една особеност: Abbyy обикновено обработва пряката реч с дълго тире и табулатор след него. При запис в Word-формат това се трансформира като „булет“ и е много лесно да загубите тиретата за пряка реч.

Заключителната част на първата корекция е да импортвам получения файл в InDesign (графичен дизайнер съм, разполагам с тази програма и съм свикнал с нея). Иначе може да се премине през Word или направо в Notepad++. В InDesign (прекрасно се оправя с проблема „пряка реч“), свързвам страниците една с друга, преглеждам какво съм изтървал при изчитането в Abbyy. След което преминавам към втора корекция.

 

Втора корекция

Това е автоматизирана проверка на правописа. Ползвам великолепната програма IDI Spellchecker. Следва кратка реклама на спелчекъра, която, за разлика от повечето рекламi, е 200% истина. IDI Spellchecker е създаден от Ивайло Димитров преди доста време и е най-добрия инструмент, който съм виждал досега (включая коректори и за руски, и за английски). Освен проверка на правописа (много коректна, между другото), той търси и намира смесени латински/български букви в думите; проблеми, свързани с малки/главни букви; начало/край на изречения и абзаци; малки и големи тирета, кавички; граматични грешки или несъгласуваности; липса на необходима запетайка и т.н., и т.н. Просто копирате текста през клипборда в програмата и тя заработва.

Има само две неща, с които следва да се съобрази човек: тъй като възможностите на програмата надхвърлят с много обичайната проверка на правописа, съответно и интерфейса ѝ е малко по-различен, но определено си заслужава човек да инвестира време в рвзучаването му. Ползвам тази програма за книжките; когато пиша постове за сайта на студиото или за личния ми сайт; когато искам да съм сигурен, че не съм направил механична грешка в бизнес-кореспонденцията си. Така че инвестицията си заслужава.

Другата особеност на IDI е, че работи само с чист текст. Т.е. ако вкарате вътре текста от word-файл, ще загубите форматирането. Понеже работя за SFB-формат, това въобще не ме вълнува.

Втората корекция с IDI Spellchecker се свежда до преглеждането на списъка с грешни думи или граматични конструкции, които програмата е намерила в текста и одобряването или отхвърлянето на предложената корекция, или нанасяне на корекцията на ръка. След което записвам текста като TXT-файл с кодиране UTF, защото преди да започна третата корекция, която правя с изчитане от рийдъра си, трябва да го форматирам като електронна книга.

 

Форматиране

Най-лесният (то по принцип си е лесно) начин да се научи човек да форматира, е да си свали някоя вече готова книга от Читанката като SFB-файл и да го разгледа внимателно с включена опция „Покажи невидимите знаци“. Следва половин-един час задълбочено четене на Ръководството за SFB-формата и човек е готов да започне. Може да пробва едно-друго в Пясъчника на Читанката.

За форматиране се използва обикновен текстов редактор (откакто намерих Notepad++, ползвам само него). Въвеждането на SFB-кодовете става на ръка (например за бележка под линия, курсив и т.п.) или чрез Find/Replace, когато трябва да се правят глобални замени.

Пример: означаване на нов абзац. В SFB начало на абзац се задава с [нов ред] + [табулатор]. В Notepad++ това изглежда така:

Имаме парче текст. Пускаме Find/Replace и търсим къде имаме нов ред, за да го заменим с нов ред + табулатор:

 

И натискаме ReplaceAll. Текстът се трансформира в:

 

При тази замяна ВСЕКИ нов ред започва с табулатор, дори и да няма текст след него (празен ред). Но в SFB празните редове не могат да започват с табулатор, затова търсим и заместваме:

 

ReplaceAll и табулатора е махнат от всички празни редове.

 

След като форматирам книжката (20-на минути) до SFB-формат, ползвам конвертора за форматиране от SFB към FB2, а след него от FB2 към EPUB (читанката ми ползва този формат) и си я зареждам в рийдъра. Kobo H20 има възможност за коментиране на текста, което ми е много удобно за третата корекция.

 

Трета корекция

Това е внимателно изчитане на готовата книжка и цели пълното премахване на грешките (което е все едно да стигнеш хоризонта). Маркирам всяка грешка като включвам и една-две думи преди или след нея. Така ми е по-лесно след това, защото почти не ми се налага да търся грешката в в самата книга в читанката си, а я търся (отново с Find) направо на компютъра.

 

Публикуване

След трета корекция форматирам и конвертирам окончателно книгата за публикуване, като се съобразявам с това къде и как ще бъде публикувана. Предлагам книжките, които съм обработил, в Моята читанка, затова обикновено спазвам стандартите им. Другото (и първо) място, където слагам готовата книжка, е на сайта ми и често поддържам различна версия за него, напр. в Читанката държат удареното „и“ да се означава с „й“, но Kobo поддържа новите стандарти, които включват кирилско „ѝ“, затова на моя сайт книжката е мъничко по-друга.

След публикуването разчиствам и архивирам всички файлове, с които съм работил и с това работата по една книжка приключва.

P.S. Много детайлно описание на целия процес може да бъде намерен в Наръчника на коректора на Моята читанка.