2007-03-06 18:01:29segatang

電書可支援語言、字型與字數多寡探討

適逢有電書同好詢問電書可支援漢字的字數,在此提出個人對於電書可支援語言、字型與字數多寡探討。

**************************
個人曾在「各家新電書對繁體中文與簡體中文,以及其他語言的支援整理」
http://mypaper.pchome.com.tw/news/segatang/3/1281648656/20070203101903
指出「主要以本身支援的格式而言,若產品帶有虛擬列印轉對應的電書格式功能,或者可以直接讀取或轉換圖片,必可利用圖片顯示該語言。」

從此討論可推測得:
如果「電書格式是架構在電書硬體字庫」,則漢字數量將會受到「電書硬體字庫」的限制;但如果電書格式像EBK或眾所皆知的PDF,可內嵌字體,則漢字書量則是受到「PC字庫」的限制。(但如果是「未內嵌字體的PDF」則還是會受到電書硬體字庫控制。)

例如架構在漢字基因中文CPU的EBK103或104格式屬於前者;採用圖文分離內嵌文字的EBK2002理論上是PC字庫有多少漢字就可以內嵌多少漢字。

若由漢字多寡而言,似乎以目標能與Unicode無縫接軌,字庫亦包含繁中日韓等字型的GB簡體中文字庫為華人電書硬體內建字庫的可行選擇之一。
繁體中文由於目前存在Big5字庫與Big5字庫+Unicode補完計畫修正的unicode在PC與電書硬體之間的正確mapping問題,所以仍以採用「內嵌方式」為宜。

理想上如果電書硬體能有多套字庫,則可支援多種語言與字體,然而,字庫檔案容量大,電書硬體的記憶體容量又有限,個人覺得最具靈活性的方法是讓使用者可以更換適合需求的字庫,使「架構在電書硬體字庫的電書格式」不會出現缺字與亂碼。

之前iLiad總部即有預定提供使用者自行更換字庫的計畫,但尚不知道會在那一版的官方更新實現,不過已經有使用者研究出自行更換的方法。
http://myblog.pchome.com.tw/_/myblog/?blog_id=segatang&y=2007&m=02&an=97460&acn=18096

現在的SD卡讀取速度蠻快的,我記得PDA有許多程式已經可以將程式放置在SD卡上直接執行,這樣就不會佔用到原本就略小的硬體SDRAM了。

**********************************
話說回來,光是繁體中文的Big5內碼就有好多種版本(http://moztw.org/docs/big5/),當然也衍生許多問題不是我們使用者或單一廠商可以解決的...

個人認為能夠圖文分離內嵌任何語系文字,並保有版面的EBK格式是不錯的方案(其實跟把文字檔案轉成圖片是一樣的,EBK的容量要小上許多)。