EPUBの特徴と課題
1.はじめに
今回は電子書籍の主流フォーマットであるEPUBの内容、特徴、課題について紹介します。
今回は電子書籍の主流フォーマットであるEPUBの内容、特徴、課題について紹介します。
2.EPUBの正体
EPUBというのは書籍に使用するデータやその他必要なファイルを「特殊なルールに基づいて」ZIP圧縮したZIPコンテナのことを指します。
ツールに頼らずEPUBをつくる、または都合上一度出来上がったEPUBを解凍して編集等する場合、単純なZIP圧縮をするだけではEPUBはつくれません。それは「特殊なルール」に沿ったものができないからです。ゆえに専用のツールを使ってEPUB化する必要があります。
EPUBというのは書籍に使用するデータやその他必要なファイルを「特殊なルールに基づいて」ZIP圧縮したZIPコンテナのことを指します。
ツールに頼らずEPUBをつくる、または都合上一度出来上がったEPUBを解凍して編集等する場合、単純なZIP圧縮をするだけではEPUBはつくれません。それは「特殊なルール」に沿ったものができないからです。ゆえに専用のツールを使ってEPUB化する必要があります。
3.EPUBの中身
数があるので、簡単に説明します。
①コンテンツ文書(.xhtml)
本の紙面だと思えばいいです。EPUBではXHTMLにそったHTML5で文書をつくることが求められます。
②スタイルシート(.css)
文書のレイアウトを行います。CSS2がベースですが、CSS3以降の内容も一部含みます。
③ナビゲーション文書(nav.xhtml)
目次情報やその他の情報を含んだ特殊なHTML5文書です。これは必須です。
なお、目次には当然リンクが含まれます。従来のHTML4系ではページ内リンクをname属性で行いました。ところが、HTML5ではname属性が廃止され、id属性に変わっているので編集などの際には注意が必要です。
また、SigilなどでつくられるEPUB2系(古いバージョン)のものでは、toc.ncxというファイルで目次などは表されていますが、EPUB3系(新バージョン)ではnav.xhtmlで行います。
④メディアオーバーレイ文書(.smil)
メディアオーバーレイは文章と録音音声を同期させるもので、いわゆる朗読などを可能にする機能のことです。この音声などを入れるファイルをSMILファイル(スマイルファイル)と呼びます。これが含まれている電子書籍はまだ多くありませんが、普及してくれば「本の声優朗読」なんて商品が出るかもしれません。
⑤パッケージ文書(.opf)
本の情報などを書き込む文書。大きく3つの部分からなります。
A:package要素(書誌情報や定義など)
B:manifest要素(使うファイルをすべて示す。また、各ファイルの内容をコアメディアタイプで示す)
C:spine要素(ファイルの表示順や閉じ方向を指定する)
野球で言えば……
A:package要素(チーム名、試合日時、対戦相手)
B:manifest要素(スタメン選手一覧・ポジション指定)
C:spine要素(打順)
のようなことです。
<ZIPをEPUBにする特殊ルール>
以下の条件をすべて満たしてください。
①ZIPコンテナの先頭にmimetypeファイルを置き、かつこのファイルのみ無圧縮とする。
②META-INFディレクトリ(フォルダ)を置き、その中にcontainer.xmlを置く。
③それ以外のファイルはすべてOEBPSディレクトリ(フォルダ)内に置く。
④以上3要件を満たしたうえでZIP圧縮を行う。
数があるので、簡単に説明します。
①コンテンツ文書(.xhtml)
本の紙面だと思えばいいです。EPUBではXHTMLにそったHTML5で文書をつくることが求められます。
②スタイルシート(.css)
文書のレイアウトを行います。CSS2がベースですが、CSS3以降の内容も一部含みます。
③ナビゲーション文書(nav.xhtml)
目次情報やその他の情報を含んだ特殊なHTML5文書です。これは必須です。
なお、目次には当然リンクが含まれます。従来のHTML4系ではページ内リンクをname属性で行いました。ところが、HTML5ではname属性が廃止され、id属性に変わっているので編集などの際には注意が必要です。
また、SigilなどでつくられるEPUB2系(古いバージョン)のものでは、toc.ncxというファイルで目次などは表されていますが、EPUB3系(新バージョン)ではnav.xhtmlで行います。
④メディアオーバーレイ文書(.smil)
メディアオーバーレイは文章と録音音声を同期させるもので、いわゆる朗読などを可能にする機能のことです。この音声などを入れるファイルをSMILファイル(スマイルファイル)と呼びます。これが含まれている電子書籍はまだ多くありませんが、普及してくれば「本の声優朗読」なんて商品が出るかもしれません。
⑤パッケージ文書(.opf)
本の情報などを書き込む文書。大きく3つの部分からなります。
A:package要素(書誌情報や定義など)
B:manifest要素(使うファイルをすべて示す。また、各ファイルの内容をコアメディアタイプで示す)
C:spine要素(ファイルの表示順や閉じ方向を指定する)
野球で言えば……
A:package要素(チーム名、試合日時、対戦相手)
B:manifest要素(スタメン選手一覧・ポジション指定)
C:spine要素(打順)
のようなことです。
<ZIPをEPUBにする特殊ルール>
以下の条件をすべて満たしてください。
①ZIPコンテナの先頭にmimetypeファイルを置き、かつこのファイルのみ無圧縮とする。
②META-INFディレクトリ(フォルダ)を置き、その中にcontainer.xmlを置く。
③それ以外のファイルはすべてOEBPSディレクトリ(フォルダ)内に置く。
④以上3要件を満たしたうえでZIP圧縮を行う。
4.EPUBの特徴
ここまでは気難しい中身の説明でしたが、これがどうすごいのかを考えてみましょう。
①勉強コストのダウン
HTMLやCSSというのはサイトをつくる際には必要な知識です。知らなくてもツールを使えばサイト構築できますが、カスタマイズしたいときにはやはり必要になってきます。またこれゆえに、高校などでは簡易ですがこれについて教えることになっています(私もホームページビルダーではありましたが一応習いました。そのあと独学でそれなりに勉強しました)。
このようにHTMLやCSSはマークアップ言語(PC用言語の一つ)の中でも知っている人が比較的多いものです。EPUBではこれをベースにしているので、一から新しいものを学ばなくても済むケースが多く普及しやすいのです。また、リーダーなどを開発する場合も既存のものを利用すればいいのでそのコストも少なくて済みます。
②日本語用の組版ができる
日本語は世界でも特殊な言語で、縦書き、ルビなど印欧系の言語では登場しない要素が複数存在します。EPUB2系ではこれを直接再現できずに無理やり表現していたのですが、EPUB3系ではこれが可能になっています。
Webの世界は横書きが普通ですが、小説などの縦書きが好ましいものでは悩みの種でした。これがEPUBではしっかり表現できます。
③様々なメディアの利用
これもEPUB3以降に可能になったことですが、音声や動画を電子書籍内に含めることが出来ます。これにより、従来の書籍の枠を超えた本が登場するかもしれません。ただ、それが含まれている本はまだかなり少ないと言えます。逆に言えばチャンスかもしれません。
④レイアウトの自動変更(リフロー)と固定レイアウト
いまどきのPCやスマホはモノによってディスプレイの大きさが違ったりします。EPUBではこれに対応して、ディスプレイの大きさに合わせて文字の折り返し位置などを自動で変える機能が付いています。これをリフローと呼びます。
一方、マンガや写真集など画像の大きさがころころ変わると困るものではそれ専用の設定をして固定レイアウトと呼ばれるものにすることもできます。
ここまでは気難しい中身の説明でしたが、これがどうすごいのかを考えてみましょう。
①勉強コストのダウン
HTMLやCSSというのはサイトをつくる際には必要な知識です。知らなくてもツールを使えばサイト構築できますが、カスタマイズしたいときにはやはり必要になってきます。またこれゆえに、高校などでは簡易ですがこれについて教えることになっています(私もホームページビルダーではありましたが一応習いました。そのあと独学でそれなりに勉強しました)。
このようにHTMLやCSSはマークアップ言語(PC用言語の一つ)の中でも知っている人が比較的多いものです。EPUBではこれをベースにしているので、一から新しいものを学ばなくても済むケースが多く普及しやすいのです。また、リーダーなどを開発する場合も既存のものを利用すればいいのでそのコストも少なくて済みます。
②日本語用の組版ができる
日本語は世界でも特殊な言語で、縦書き、ルビなど印欧系の言語では登場しない要素が複数存在します。EPUB2系ではこれを直接再現できずに無理やり表現していたのですが、EPUB3系ではこれが可能になっています。
Webの世界は横書きが普通ですが、小説などの縦書きが好ましいものでは悩みの種でした。これがEPUBではしっかり表現できます。
③様々なメディアの利用
これもEPUB3以降に可能になったことですが、音声や動画を電子書籍内に含めることが出来ます。これにより、従来の書籍の枠を超えた本が登場するかもしれません。ただ、それが含まれている本はまだかなり少ないと言えます。逆に言えばチャンスかもしれません。
④レイアウトの自動変更(リフロー)と固定レイアウト
いまどきのPCやスマホはモノによってディスプレイの大きさが違ったりします。EPUBではこれに対応して、ディスプレイの大きさに合わせて文字の折り返し位置などを自動で変える機能が付いています。これをリフローと呼びます。
一方、マンガや写真集など画像の大きさがころころ変わると困るものではそれ専用の設定をして固定レイアウトと呼ばれるものにすることもできます。
5.EPUBの課題
①リーダーの進化待ち
EPUBそのものは色々な機能や特徴を持っているわけですが、それを正確に読み取れるリーダーがまだ出てきていません。普通の本であれば問題なく読めるリーダーが増えていますが、あまり使われないような機能や負担がかかりすぎる機能には対応していないケースがあります。
ただ、いまだに縦書き未対応のリーダーもあるので、一度調べることをおすすめします。
②リフローと固定レイアウトの混在
リフローと固定レイアウトは混ぜて使えません。ソースコードとしては書けますが、それを読み取ってくれるリーダーがありません(おそらく)。
③ツールの少なさ
EPUB3に対応していて、EPUBチェッカーでもエラーがでないものをつくれるツールは数えるほどしかありません。また、それらのツールも細かい修正がやりづらいなど一長一短です。これゆえ、制作者がいまいち増えていかない可能性があります。
それから、検索エンジンで調べるといまだにSigilの利用を薦めるサイトが上位に出てくるケースが多いのも課題です。Sigilは古いEPUB2系のEPUBファイルをつくってしまうのでいまどきの配信ストアでははじかれてしまう可能性があります。しかし、Sigilは修正や細かい指定がやりやすいツールではあったので、将来的にこのようなツールが出てくることに期待したいところです。
④DRM(コピー防止のための暗号化)
これはEPUBというより電子書籍業界の課題ですが、通常配信ストアで購入したEPUBにはDRMがかかっています。なので、指定外のリーダーでは読めません。ゆえにバックアップなどがとれないというデメリットを抱えます(そもそも多くの配信ストアの電子書籍は普通にコピーなどはできませんが)。
これがどう影響するのか。例えばKindleの場合は本データをゲットするのではなく使用権(ライセンス)を買うという建前になっているので、本そのものが販売されなくくなった場合はそのライセンスも自動で消える可能性があります。バックアップを仮にとれたとしてもライセンスが無い以上それを読めないということになってしまうかもしれないわけです。
現状ではこの辺に配慮して運用されている感じですが、将来的にどうなるかは分かりません。
一方で、好き勝手にコピペ出来てしまうのも問題なので、この辺をどうするのかは業界全体で調整しないといけない分野だろうと思われます。
①リーダーの進化待ち
EPUBそのものは色々な機能や特徴を持っているわけですが、それを正確に読み取れるリーダーがまだ出てきていません。普通の本であれば問題なく読めるリーダーが増えていますが、あまり使われないような機能や負担がかかりすぎる機能には対応していないケースがあります。
ただ、いまだに縦書き未対応のリーダーもあるので、一度調べることをおすすめします。
②リフローと固定レイアウトの混在
リフローと固定レイアウトは混ぜて使えません。ソースコードとしては書けますが、それを読み取ってくれるリーダーがありません(おそらく)。
③ツールの少なさ
EPUB3に対応していて、EPUBチェッカーでもエラーがでないものをつくれるツールは数えるほどしかありません。また、それらのツールも細かい修正がやりづらいなど一長一短です。これゆえ、制作者がいまいち増えていかない可能性があります。
それから、検索エンジンで調べるといまだにSigilの利用を薦めるサイトが上位に出てくるケースが多いのも課題です。Sigilは古いEPUB2系のEPUBファイルをつくってしまうのでいまどきの配信ストアでははじかれてしまう可能性があります。しかし、Sigilは修正や細かい指定がやりやすいツールではあったので、将来的にこのようなツールが出てくることに期待したいところです。
④DRM(コピー防止のための暗号化)
これはEPUBというより電子書籍業界の課題ですが、通常配信ストアで購入したEPUBにはDRMがかかっています。なので、指定外のリーダーでは読めません。ゆえにバックアップなどがとれないというデメリットを抱えます(そもそも多くの配信ストアの電子書籍は普通にコピーなどはできませんが)。
これがどう影響するのか。例えばKindleの場合は本データをゲットするのではなく使用権(ライセンス)を買うという建前になっているので、本そのものが販売されなくくなった場合はそのライセンスも自動で消える可能性があります。バックアップを仮にとれたとしてもライセンスが無い以上それを読めないということになってしまうかもしれないわけです。
現状ではこの辺に配慮して運用されている感じですが、将来的にどうなるかは分かりません。
一方で、好き勝手にコピペ出来てしまうのも問題なので、この辺をどうするのかは業界全体で調整しないといけない分野だろうと思われます。
6.おわりに
というわけで、今回は長々とEPUBについて語ってみました。普通の人はツールを使えば問題なくつくることが出来るでしょうから、あまり関係ないかもしれませんがEPUBの可能性や仕様について理解していると将来的にいいことがあるかもしれません。
私も勉強していきたいと思います。
なお、このページは以下の論文をかなり参考にしています。興味ある方はぜひ読んでみてください。
○高瀬拓史 「EPUB概説:電子出版物とWeb標準」(『情報管理』Vol. 57 (2014) No.9 P 618-628)
というわけで、今回は長々とEPUBについて語ってみました。普通の人はツールを使えば問題なくつくることが出来るでしょうから、あまり関係ないかもしれませんがEPUBの可能性や仕様について理解していると将来的にいいことがあるかもしれません。
私も勉強していきたいと思います。
なお、このページは以下の論文をかなり参考にしています。興味ある方はぜひ読んでみてください。
○高瀬拓史 「EPUB概説:電子出版物とWeb標準」(『情報管理』Vol. 57 (2014) No.9 P 618-628)