Artykuł archiwalny z 22.03.2017 r. – treść nieaktualna

EPUB Validator na komputer

Osoby które samodzielnie tworzą swoją e-książkę w for­macie ePub, chciałyby na pewno wiedzieć czy dobrze to robią. A dokładniej mówiąc, czy ich książka spełnia wymogi stan­dardu EPUB ustalone przez organizację IDPF (International Digital Publication Forum).

Można to bardzo łatwo zrobić na dwa sposoby.

Co prawda organizacja IDPF od stycznia 2017 roku już nie istnieje, została wchłonięta przez organizację W3C. Ale nadal można wejść na, archiwalne już, strony IDPF. Wciąż istnieje tam ciągle działający specjalny walidator, czyli taka wyspe­cjalizowana aplikacja do spraw­dza­nia jakości książek w for­macie EPUB. Link do strony z tym walidatorem jest nastę­pujący: www.validator.idpf.org.

Fot.1 Zrzut ekranu strony IDPF z walidatorem, (dostęp 22.03.2017).

Walidator sprawdza pliki w dwóch formatach, EPUB 2 oraz EPUB 3, które samodzielnie rozpoznaje. Wystarczy że plik ma rozszerzenie o nazwie .epub. Jedyne ograniczenie jest takie, że wielkość pliku nie może być więk­sza niż 10 MB.

Na fotografii 1. widać stronę IDPF z walidatorem. Aby sprawdzić swoją książkę, należy kliknąć przycisk z napisem Przeglądaj..., pojawi się wtedy okno z zasobami naszego wła­snego komputera, gdzie trzeba znaleźć tę książkę, którą chce­my sprawdzić w walidatorze. Następnie, dwukrotnie klikając w ikonę pliku naszej książki, sprawimy że książka ta zostanie umieszczona w walidatorze. Teraz wystarczy już tyko kliknąć przycisk z napisem Validate, i odczekać trochę na efekt koń­cowy, czyli wynik walidacji.

Fot.2 Zrzut ekranu strony IDPF z pozytywnym wynikiem walidatora, (dostęp 22.03.2017).

Gdy walidacja zakończy się pozytywnie to zobaczymy, tak jak na fotografii 2., wyświetlone dwa komunikaty. Pierwszy z nich jest o treści: Detected version: EPUB 3.0.1, co oznacza że walidator rozpoznał, że nasza książka jest w (najnowszym) formacie EPUB wersja 3.0.1. Natomiast drugi komunikat mówi nam: Results: Congratulations! No problems were found in Rok 3333 - wyd. V.epub. Co oznacza że nie znaleziono żad­nych błędów w sprawdzonej książce. Czyli że książka jest zgodna ze standardem EPUB 3. Określenie Back to validator na dole fotografii oznacza powrót do okna ponownego walidowania, gdybyśmy chcieli ponownie sprawdzić tę czy inną książkę.

Podczas procesu tworzenia książki zdarzają się błędy. Osoby mniej doświadczone popełniają ich więcej, te bardziej doświadczone popełniają ich mniej. Tak czy owak błędy, jakieś tam, zazwyczaj bywają i należy je po prostu usunąć. Pozy­tywny efekt walidacji jest na ogół zwieńczeniem wszystkich poprzednich, nieudanych, walidacji. Jedne błędy czasami usu­wa się w kilka minut, ale czasami bywa i tak, że przez kilka dni nie można dojść w czym rzecz, bo walidator ten nie jest ide­alny. Czasami sam błąd w ogóle nie jest przez walidator wy­kazany, tylko wykazane są zakłócenia jakie ów błąd powoduje. A miałem raz i tak, że walidator nie znalazł żadnych błędów, za to ja odkryłem pewne drobne zakłócenie w wyświetlaniu się książki. Zakłócenie to udało mi się usunąć dopiero po kilku miesiącach. Umiejętność rozwiązywania trudnych problemów przychodzi wraz z doświadczeniem popartym wieloma godzi­nami przy przeglądaniu własnego kodu, czytaniu anglojęzycz­nych specyfikacji organizacji IDPF i W3C, przeglądaniu roz­maitych portali internetowych, tutoriali i blogów. I nie są to dziesiątki godzin, nawet nie setki, są to tysiące godzin spę­dzonych przed ekranem komputera po to, by książka wyś­wietlała się jak najpiękniej.

Fot.3 Zrzut ekranu z mojego edytora kodów źródłowych z usuniętym zamknięciem znacznika <title>.

Zobaczmy teraz jaki będzie efekt, gdy w kodzie książki wprowadzimy na próbę jakiś błąd. Na fotografii 3. jest obraz kodu, jednej z wydanych przeze mnie książek, z usuniętym zamknięciem znacznika <title>.

Fot.4 Zrzut ekranu strony IDPF, tym razem z negatywnym wynikiem walidatora, i wykazem błędów, (dostęp 22.03.2017).

Fotografia 4. Po ponownym umieszczeniu książki w wali­datorze, tym razem z uszkodzonym kodem w postaci usu­niętego zamknięcia znacznika <title>, walidator pokazał listę błędów. Natomiast wyświetlony komunikat o treści: Results: The following problems were found in Rok 3333 - wyd. V.epub: mówi nam że w książce znaleziono błędy. Wykaz błędów jest w formie tabeli poniżej komunikatu.

Fot.5 Usunięte poprzednio zamknięcie znacznika <title> zostało przywró­cone. Zrzut ekranu z mojego edytora kodów źródłowych.

Fotografia 5. Usunięte poprzednio zamknięcie znacznika <title> zostało przywrócone do kodu książki.

Fot.6 Ponowna walidacja książki wskazuje na brak błędów. Zrzut ekranu strony IDPF, (dostęp 22.03.2017).

Fotografia 6. Po kolejnym sprawdzeniu książki w wali­datorze, walidator wskazuje na brak błędów, a więc książka jest na powrót „sprawna”.

No dobrze, ale co jeśli nasza książka ma więcej niż 10 MB, lub będziemy pracować nad książką w miejscu, gdzie nie będzie dostępu do internetu? Sprawa jest prosta, trzeba po­brać na swój komputer walidator. Komunikaty będą się trochę inaczej wyświetlały, bo w konsoli cmd. Ale wtedy wielkość pli­ku nie ma znaczenia, może to być nawet 300 MB, albo i więcej, jak sądzę. Na stronach IDPF z walidatorem, których fotografie są powyżej, można zauwa­żyć link z nazwą zapisaną w sposób wielbłądzi – EpubCheck. W ten to link należy kliknąć.

Fot.7 Zrzut ekranu z podstrony IDPF/epubcheck witryny internetowej GitHub, (dostęp 22.03.2017).

Fot.8 Przycisk z napisem: release v4.0.2. w powiększeniu. Zrzut ekranu z witryny internetowej GitHub, (dostęp 22.03.2017).

I po kliknięciu wyżej rzeczonego linka widzimy, tak jak na fotografii 7., jedną ze stron GitHub, który pełni rolę jakby forum dla otwartych, i nie tylko, rozmaitych projektów pro­gramistycznych. IDPF umieściła tam swój vali­dator, który można sobie pobrać. Na dole strony jest szaro-niebieski pro­stokątny przycisk z napisem: release v4.0.2, w powiększeniu na fotografii 8., i to właśnie w niego trzeba kliknąć.

Fot.9 Zrzut ekranu z kolejnej strony GitHub, (dostęp 22.03.2017).

Fot.10 Ta sama strona po przewinięciu w dół, widoczny plik epubcheck-4.0.2.zip. Zrzut ekranu z witryny internetowej GitHub, (dostęp 22.03.2017).

Wyświetli się nam kolejna strona GitHub, tak jak widać na fotografii 9. Stronę tę trzeba przewinąć do samego dołu, a tam, fotografia 10., pod Downloads mamy aż trzy rodzaje jakichś tajemniczych plików do pobrania. Wybieramy plik o nazwie epubcheck-4.0.2.zip i klikamy go, bo jest tam nasz walidator (epubcheck to po prostu nazwa jaką IDPF nadał swojemu walidatorowi, a 4.0.2 to numer ostatniej jego wersji). Link: www.github.com/idpf/epubcheck/releases/tag/v4.0.2

Fot.11 Czy chcesz otworzyć, lub zapisać plik epubcheck-4.0.2? Zrzut ekranu z witryny internetowej GitHub, (dostęp 22.03.2017).

Fot.12 Zapisz jako. Zrzut ekranu z witryny internetowej GitHub, (dostęp 22.03.2017).

Po kliknięciu pliku, pokaże nam się na dole ekranu komputera, tak jak na fotografii 11., pasek z zapytaniem czy chcemy otworzyć, lub zapisać plik epubcheck-4.0.2.zip (ten komputer z którego były robione niniejsze zrzuty ekranu, pra­cuje w systemie operacyjnym Windows 10). Na przycisku o na­zwie Zapisz klikamy w małą czarną strzałkę, rozwinie się wtedy krótkie menu, gdzie wybieramy opcję Zapisz jako, tak jak na fotografii 12., i ją klikamy.

Fot.13 Świeżo pobrany plik .zip z walidatorem zapisany w naszym komputerze.

Otworzy nam się okno z zasobami naszego komputera gdzie wybieramy sobie miejsce, w którym chcemy zapisać nasz nowo pobrany plik. I zapisujemy bez zmieniania nazwy. Mamy go teraz w naszym komputerze, a wygląda on tak jak na fotografii 13.

Fot.14 Nowy folder.

Fot.15 Tak wygląda Walidator.

Fot.16 Nowy folder już po zmianie nazwy na EpubValidator. W środku siedzi sobie walidator (to ten sam facet z fotografii 15.).

Teraz nasz plik zostawiamy na razie, i obok niego tworzymy nowy folder, taki sam jak na fotografii 14. Następnie wracamy do naszego folderu, tego z fotografii 13., i wchodzimy do niego, a tam widzimy nasz walidator, który wygląda tak jak ten na fotografii 15. Używając opcji wycinania, wycinamy go i wychodzimy z tego folderu, by wejść do utworzonego przed chwilą nowego folderu, i w tym folderze wklejamy to, co przed chwilą gdzie indziej wycieliśmy. Następnie wychodzimy z tego folderu i zmieniamy jego nazwę z Nowy folder na nazwę EpubValidator, tak jak na fotografii 16. Zanim przystąpimy do pozostałych czynności, usuwamy do kosza pusty folder epubcheck-4.0.2.zip, to ten z fotografii 13.

Fot.17 Okno zakładki Ten komputer.

Fot.18 Świeżo utworzony folder EpubTest umieszczony na twardym dysku komputera.

A teraz wejdziemy sobie na twardy dysk naszego kompu­tera, gdzie musimy się zachowywać ostrożnie. Trzeba uru­chomić okno z zakładką o nazwie Ten komputer. Na fotografii 17. widać okno tej zakładki, gdzie twardy dysk został za­znaczony niebieskim po­lem, które trzeba kliknąć by wejść do środka. Jak już jesteśmy w środku, to do istniejących tam fol­derów, dodajemy nowy folder o nazwie EpubTest, tak jak na fotografii 18. I na razie nic więcej nie robimy, pusty folder o nazwie EpubTest zostawiamy i wychodzimy z twardego dys­ku.

Fot.19 Okno konsoli wiersza polecenia, wraz z rozwiniętym menu do ustawiania konsoli według własnych potrzeb.

A teraz użyjemy konsoli cmd czyli konsoli wiersza polecenia systemu operacyjnego. Aby to zrobić należy kliknąć w przy­cisk Start. Przycisk Start znajduje się w lewym dolnym naroż­niku ekranu jako ikona okna. Jak już klikniemy w tę ikonę, pokaże nam się menu przycisku Start, a tam w oknie wyszu­kiwarki wpisujemy nazwę wiersz polecenia, lub krócej cmd. Od razu pojawi się nam pasek z napisem Wiersz polecenia Aplikacja komputerowa w który to pasek śmiało klikamy lewym przyciskiem myszki. Otworzy nam się okno konsoli dla użytkowników (po angielsku Users), co dla naszych potrzeb jest w pełni wystarczające, a wygląda ono tak jak na fotografii 19. W tym przypadku userem na rzeczonej fotografii jest niejaki Dariusz, czyli ja. Własnych ustawień konsoli możemy dokonać klikając w górną belkę okna konsoli. Rozwinie się wtedy menu z różnymi opcjami. Standardowo okno konsoli nie jest zbyt duże, ale można je sobie powiększyć, przesunąć, czy zmienić barwę wyświetlanych fontów, jak komu pasuje. Gdy okno konsoli mamy już ustawione według własnego upodo­bania, możemy przejść do… sprawdzania swoich książek w formacie EPUB, i to bez względu na to ile KB czy MB one mają, i bez potrzeby posiadania łącza internetowego.

Fot.20 Wnętrze folderu EpubTest z załadowaną do niego książką.

Książkę która ma być sprawdzona należy włożyć do folderu EpubTest, który utworzyliśmy na naszym twardym dysku o li­terze C (zazwyczaj jest to litera C). A więc do tego folderu, metodą kopiuj i wklej, przeniosłem VII wydanie książki pt. „Być, Albo Nie Być” Stanisława Bełzy, wielkość pliku w za­okrągleniu to 18 MB. Wnętrze folderu EpubTest z załadowaną książką wygląda tak jak na fotografii 20.

Fot.21 Widok konsoli wiersza polecenia. Wprowadzono polecenie sprawdzenia danej książki, teraz wystarczy tylko kliknąć przycisk enter na klawiaturze komputera i poczekać na wynik walidacji.

java -jar C:EpubValidator\epubcheck-4.0.2\epubcheck.jar C:\EpubTest\Byc,_Albo_Nie_Byc-wyd.VII.epub

Linijka tekstu powyżej to polecenie które należy wkleić do konsoli wiersza polecenia, czy jak kto woli nazwać, do konsoli cmd. Jak to wygląda w konsoli, pokazano na fotografii 21. Powyższe polecenie dotyczy książki której plik nosi nazwę Byc,_Albo_Nie_Byc -wyd.VII.epub, a sam plik z tą książką został wcześniej umieszczony w folderze EpubTest. Gdy w walidatorze będzie sprawdzana jakaś inna książka, to pełną nazwę pliku z tą książką należy podmienić w tym poleceniu. Podobnie należy postąpić z zawartością folderu EpubTest na twardym dysku. Plik z książką poprzednio sprawdzaną należy usunąć, a w jej miejsce należy wkleić plik z nową książką która ma być sprawdzona. Folder EpubTest raczej nie powi­nien być magazynem książek, a jedynie miejscem do testo­wania pojedyńczych książek.

java -jar C:EpubValidator\epubcheck-4.0.2\epubcheck.jar C:\EpubTest\Byc,_Albo_Nie_Byc-wyd.VII.epub

Dla lepszego zrozumienia, co podmieniamy, a co nie, ten sam wiersz polecenia został powtórzony i pokolorowany. Nie ruszamy tego co jest w zielonym polu, podmieniamy tylko to, co jest w niebieskim polu. Wystarczy usunąć o jeden znak za mało, lub o jeden za dużo, i walidator nie zadziała.

A co, jeśli jedną i tę samą książkę, będziemy chcieli walidować wielokrotnie? A na pewno będziemy chcieli, bo wielokrotnie będziemy musieli sprawdzić, czy wykryte przez walidator błędy, udało nam się usunąć. Wtedy w wierszu po­lecenia niczego nie podmieniamy, tylko zawsze wklejamy to sa­mo polecenie i naciskamy enter. Podmieniamy jedynie plik z książką w folderze EpubTest, na taki sam plik z taką samą książką, ale już z poprawkami.

A zatem, skoro wszystko jest już gotowe, naciśnijmy enter, i zobaczmy jak to działa.

Fot.22 Widok konsoli wiersza polecenia. Validating using EPUB version 3.0.1 rules.

Fotografia 22. W chwilę po naciśnięciu klawisza enter, w konsoli wyświetlił się następujący komunikat Validating using EPUB version 3.0.1 rules. Napis ten oznacza że wali­dator rozpoznał trzecią (czyli najnowszą) wersję formatu EPUB, i przystąpił do sprawdzania książki, pod kątem jej zgodności ze specyfikacją EPUB wersja 3.0.1.

Fot.23 Widok konsoli wiersza polecenia. No errors or warnings detected. epubcheck completed.

Fotografia 23. Po kolejnej, troszkę dłuższej chwili, wyświe­tlił się w konsoli kolejny komunikat. No errors or warnings detected. epubcheck completed. Komunikat ten oznacza, że nie wykryto błędów lub ostrzeżeń oraz, że walidacja została zakończona.

Ale gdyby w książce były elementy svg, czyli skalowalna grafika wektorowa, to validator wyrzuci błędy. Jest to wina validatora, jego twórcy zapomnieli o svg. Można temu zapo­biec wycinając po kolei z kodu wszystkie elementy svg, (należy wyciąć także i te elementy z pliku content.opf) i przenieść je sobie w takiej samej kolejności jak się wycinało, do notatnika, czy tam na przykład do arkusza tekstowego OpenOffice. Zachowując oczywiście pomiędzy kolejnymi ele­mentami svg odstępy. Oczywiście robimy to tylko na chwilę, tylko po to, żeby dokonać walidacji książki bez elementów svg, a jak walidacja przebiegnie pomyślnie, to wytniemy je z notatnika, w odwrotnej kolejności niż je wklejaliśmy, i na powrót wkleimy do książki w tych samych miejscach w któ­rych były. Jeśli tych elementów będzie dużo, to trzeba sobie zanotować na kartce papieru, gdzie co było. Co do samych elementów svg, to trzeba je sobie gdzieś indziej sprawdzić. Można to zrobić w następujący sposób. Wszystkie pliki xhtml z wnętrza naszej książki, można pojedyńczo wrzucać on-line do innego walidatora. Walidator ten nie bada poprawności e-książek w formacie EPUB, lecz tylko same pliki w formatach xhtml, svg, i kilku innych. Jak będą jakieś błędy w składni svg, czy xhtml, to ten walidator to pokaże. Oczywiście, i ten walidator nie jest bezbłędny. Każdy plik trzeba wrzucić dwa razy, i dwa razy go przetestować. Jeśli naprzemian raz będzie pokazana informacja o błędzie, a raz o poprawności pliku, to wszystko jest dobrze. A jeśli będzie prawdziwy błąd, to za każdym razem będzie pokazany ten sam błąd, i w którym miejscu się on znajduje. Ach te walidatory. Link do tego walidatora, na stronie organizacji W3C, jest następujący: https://validator.w3.org/nu/. Czyli najpierw testujemy poje­dyńcze pliki z naszej książki w walidatorze organizacji W3C, a potem całą naszą książkę (jeśli są elementy svg to je wyciąć) w walidatorze dla książek EPUB. Po udanej walidacji wstawić wycięte wcześniej elementy svg, i ostatni raz, przed publi­kacją, książkę przeczytać, i dokładnie przejrzeć.

Na koniec wrzućmy do walidatora tę samą książkę, ale z uszkodzonym kodem, i ponownie naciśnijmy enter.

Fot.24 Widok konsoli wiersza polecenia. Jakie piękne błędy.

Fotografia 24. Nasz walidator pokazał kilka błędów które należy znaleźć i usunąć.

Fot.25 Widok konsoli wiersza polecenia, po usunięciu błędów. No errors or warnings detected. epubcheck completed.

Fotografia 25. Po usunięciu błędów nasz walidator ponow­nie wyświetlił w konsoli No errors or warnings detected. epubcheck completed.

I tym miłym akcentem kończę ten poradnik, z nadzieją, że będzie on pomocny w tworzeniu książek w formacie EPUB.

Zapraszam do lektury wydanych przeze mnie książek oraz artykułów na tej stronie.

Dariusz Bugała

Artykuł jest z 22 Marca 2017 r.

23 Maja 2017 r. dodano rozszerzenie opisu konsoli.

20 Listopada 2018 r. dodano opis zakłóceń walidatora w przy­padku plików z elementami svg.