Výlet do historie a něco o e-knižních formátech *

Není nezajímavé, že “e-knihy” mají historii sahající opravdu hodně daleko zpět – mé první setkání s elektronickými knihami bylo v době, kdy klasický Palm byl vrchol techniky a jedno z nejlepších PDA. Tedy pokud to dnes ještě tak můžeme nazývat.

POZOR! V září 2016 došlo k aktualizaci a přepracování tohoto článku do podoby tipu na @365tipů. Takže případně pokračujte do Jak číst pdb ve Windows a v jaké podobě můžete mít e-knihy?

První e-knihy se tehdy daly číst právě třeba na Palmu a dodnes se zachoval tehdy používaný PDB formát. A dal se vytvářet z klasických textových souborů s pomocí konverzního programu v DOSu. Od té doby se nicméně situace změnila a formátů pro e-knihy existuje řada. A liší se různým druhem použitelnosti a hlavně i podporu u čteček (ať již software či hardware).

Následující přehled není úplný, některé méně časté či obskurní formáty byly vynechány (doporučím E-Book formats na MobileRead Wiki a Comparison of e-book formats na Wikipedii) – ty se kterými se setkáte nejčastěji jsou označeny hvězdičkou v prvním sloupci. V řadě případů je možné získat na internetu programy pro převod mezi jednotlivými formáty, ale v některých případech to je buď nemožné, nebo to vede ke ztrátě nějakých informací. Naštěstí v době Google není příliš problém rychle najít cokoliv o kterémkoliv z formátů – ať už jde o dostupné čtečky či programy pro převod.

Pokud chcete získávat e-knihy pro jakoukoliv čtečku, musíte předem vědět, jaké formáty podporuje – na webech nabízejících e-knihy je pak běžně nabízena možnost stahovat danou knihu ve více formátech. Pokud jde o knihy kupované, tak DRM (ochranu práv) nabízí vpodstatě pouze dva formáty – PDF for Digital Editions a ePub for Digital Editions.

Název PPopis a informace ČČtečky DRM
Textové soubory

.txt

Univerzální formát souboru, který ale pochopitelně neumožňuje žádné obrázky, grafiku, úpravu. Výhodou je malá velikost a přenositelnost na libovolné jiné platformy, ať už jde o software či hardware. Problémy pochopitelně mohou nastat u různorodých znakových sad.
Hypertext

.htm
.html

Výhodou e-knih v HTML je možnost čtení v libovolném webovém prohlížeči a cokoliv je možné dosáhnout v HTML (co se formátování a grafiky týče) je tak vpodstatě dostupné pro e-knihu. HTML je používáno v specifických e-knižních formátech (Kindle, Open eBook, Mobipocket, IPDF/EPUB). Aby čtečka (hw/sw) dokázala HTML správně zobrazovat, je nutné aby uměla odpovídající znakovou sadu – v případě českých e-knih to bývá problém.
Compressed CHM

.chm

.chm soubory jsou proprietární formát Microsoftu (Compressed HTML Help), který je možné zařadit i mezi e-knižní formáty.
Portable Document

.pdf

Adobe PDF soubory patří mezi hodně využívaný e-knižní formát – hlavně pro “věrnost” zachování původní předlohy – vlastnost, která může přinést problémy v okamžiku, kdy je nutné provést změny pro zobrazení na menších displejích. Podpora pro “re-flow” v Adobe Reader aplikacích má tento problém řešit, ale vyžaduje aby PDF dokument byl vytvářen s podporou pro tuto funkčnost. Adobe PDF mohou mít DRM (a najdete zde Adobe Content Server 4 produkt) – v takovém případě je nutné používat specifickou čtečku, kterou Adobe vytvořilo pro e-knihy (Adobe Digital Editions). Adobe Digital Editions ANO
Postscript

.ps

Jakkoliv PostScript nepatří mezi široce používaný formát v e-knihách, je vhodné jej zmínit.
Microsoft LIT

.lit

Microsoft Reader používá proprietární .LIT soubory, které umožnují DRM i volné použití. A setkat se s ním můžete vpodstatě hlavně na mobilních zařízení od Microsoftu. Microsoft Reader ANO
Palm Media

.pdb

Původní .PDB je jedním z nejpoužívanějších formátů pro e-knihy – umožňuje i chráněné knihy prostřednictvím kryptování (klíč je poskytnut při koupi  knihy). Někdy je tento formát označován jako “eReader” – podle www.ereader.com kde je hlavně používán. www.ereader.com ANO
Mobipocket

.prc
.mobi

Mobipocket je založený na Open eBook standardu a s pomocí XHTML a podpory JavaScriptu nabízí pokročilejší možnosti formátování i interakce. Cestu našel i do Amazon Kindle zařízení, kde .AZW je ve skutečnosti Mobipocket.  Jakkoliv jde o poměrně rozšířený formát, má řadu problémy se znakovými sadami jinými, než je US ASCII. Mobipocker Reader ANO
IDPF/EPUB

.epub

Otevřený standard vytvořený a prosazovaný IDPF (International Digital Publishing Forum) existuje ve třech verzí (OPS, Open Publication Structure 2.0 – OPF, Open Packaging Format 2.0 – OCF, OEBPS Container Format 1.0) a je poměrně široce podporovaný, včetně podpory od Adobe a doplnění možnosti DRM ochrany (pochopitelně už dávno překonané). Adobe Digital Editions ANO
Kindle

.azw

Formát založený na Mobipocket standardu umožňuje, pochopitelně, i DRM ochranu. Vyskytuje se prakticky výhradně na Amazon Kindle prohlížečích. ANO
Open eBook

.opf

XML formát vytvoření E-Book Systems.
TomeRaider

.tr2
.tr3

Proprietární formát vytvořený pro TomeRaider software podporuje na odpovídajících platformách plné HTML a CSS. TomeRaider Ebook Reader ANO
Plucker Proprietární formát pro Plucker software je ve skutečnosti komprimnovaný HTML archiv. Paradoxně se s ním setkáte poměrně dost často. Plucker
Newton eBook

.pkg

Formát používaný v Apple Newton operačním systému.
Apabi Reader

.ceb
.xeb

Formát používaný pro čínské e-knihy pochází pravděpodobně z Founder Electronics zařízení a v jiných prostředích je přístupný přes Apabi Reader – jde o binární formát.
Libris

.bin
.lbr

“Mobile Information Device Profile” pochází z Libris čtečky (Java čtečka pro mobilní zařízení)
Sony media

.lrf
.lrx

Proprietární formát použitý Sony pro čtečky umožňuje DRM – bývá označován i jako BroadBand eBook (BBeB). V září 2009 Sony tento formát opustilo a začalo podporovat ePub. ANO
SSreader

.pdf

Další z proprietárních formátu používaných v Číně – rozšířený hlavně pro nasazení v tamní Čínské národní knihovně.
DNL Reader

.dnl
.exe

Výstup z programu Desktop Author použitelný samostatně nebo v DNL Reader software.
DjVu.djvu Specifický formát specializující se na ukládání a zpracování obrázků.
TEI Lite

.xml

Další specifický a proprietární formát spojení s Text Encoding Initiative (TEI), která stojí za několika velkými a zajímavými projekty
FictionBoo

k.fb2

XML formát používaný v několika rozšířenějších čtečkách FBReader a Haali Reader ANO
DAISY

.dtb

XML formát používaný mezinárodním konzorciem knihoven (DAISY) a podporující i audio e-knihy. daisy.org
Arghos Reader

.aeh

Proprietární XML formát používaný společností Arghos Diffusion, umožňuje DRM a vyžaduje použití Arghos Player/Reader aplikace. Podporuje i řadu dalších formátů – video i PDF například. ANO

POZOR! V září 2016 došlo k aktualizaci a přepracování tohoto článku do podoby tipu na @365tipů. Takže případně pokračujte do Jak číst pdb ve Windows a v jaké podobě můžete mít e-knihy?

3 Responses to Výlet do historie a něco o e-knižních formátech *

  1. cteni eMap

    Uvedomil jsem si, ze pro eBook ctecky chybi format dat a ctecka pro elektronicke mapy. Mam na mysli rastrove mapy anebo velke obrazky. Vyuziti by bylo sirsi nez jen pro mapy.
    Obecne, eBook ctecky maji omezeni na velikost obrazku ktery umi zpracovat; jsou omezeny malym displejem a malym mnozstvim pameti, 64-256MB RAM; obrazky proto mohou mit maximalni rozmer kolem 800×600 a velikost do 10MB.
    Chybi format, ktery by spojil nekolik malych obrazku do velkeho a SW, ktery by tento format mohl zobrazit. Format, ktery by velky obrazek rozlozil na mozaiku malych obrazku a zobrazil pouze ty casti, ktere by meli byt viditelne. Hodilo by se to treba k prohlizeni map, planu anebo jinych rozmernych obrazku; treba obrazek sloziteho PDF dokumentu, ktery ctecka v eBook neumi zobrazit. Prave dnes jsem resil, jak na 7″ eBook ctecce precist obrazek dokumentu v PDF; ctecka bud zobrazovala nahled ktery byl necitelny a kdyz se udelal maximalni zoom na cast textu ktery jsem chtel cist, tak text byl necistelny, protoze SW v eBook jej z nejakeho duvodu nezobrazil v kvalite, jak jej vidim na PC; obrazek na ctecce byl prilis zrnity, necitelny, nizke rozliseni (soubor byl OK; problem je v eBook readeru; pro prohlizeni normalnich fotek to neni zasadni problem kdyz jsou detaily rozmazane…)
     

  2. Pingback: Nejčtenější za uplynulý týden (24. ledna 2011) | JustIT.cz

  3. Pingback: Nejčtenější za uplynulý týden (17. ledna 2011) | JustIT.cz