DjvuToy是一款專門為Djvu文件推出的工具軟件,它的主要功能是幫助用戶處理DjVu格式的電子書文件,包括拆分合并、格式轉換以及文本處理等等,充分滿足用戶的各種需求。DjvuToy使用起來很方便,而且功能也是完全免費的,有需要的用戶敬請下載。

文件合并:將散頁DjVu文件合并成一個多頁DjVu。支持指向外部文件的共享數據段。
文件拆分:將多頁DjVu拆分成每頁一個文件,并可指定是否拆分共享數據段、是否生成索引。
頁面調整:插入、刪除、移動、旋轉多頁DjVu中的頁面。
生成索引:為文件夾下的散頁DjVu文件生成索引文件,打開索引文件即可瀏覽全部散頁文件,就像將散頁文件合并成了多頁文件一樣。
DjVu制作:圖像文件轉DjVu,支持PDG、BMP、GIF、PNG、TIFF、JPEG、JPEG 2000。
PDG轉DjVu:這個不用說了吧?
PDG壓縮:對清晰版進行無損壓縮,或將清晰版壓縮成快速版,或將黑白TIFF轉換成PDG。
DjVu頁寬設置:將多頁DjVu的頁面寬度或DPI設置為一個統一值。
轉為圖像:將多頁DjVu的每一頁轉換成一個圖像。
DjVu文本處理:包括OCR(生成可檢索的隱藏文本)、導出純文本、導出XML文本、導入XML文本、刪除文本。
DjVu注釋相關:包括導出、導入、刪除注釋。注釋(Annotation)可以是超鏈接、標注等。
DjVu轉PDF:一次將整本DjVu轉換成PDF,并可選擇是否轉換書簽(目錄) 、隱藏文字,沒有隱藏文字時還可以在轉換的同時進行OCR,并提供對自身所生成的雙層PDF進行校對所需的輔助功能。
查看DjVu文件結構:如果打算對DjVu文件內部格式進行研究,這個功能那是相當地有用,不然還是點“顯示設置”按鈕,把它藏起來算了。
本軟件安裝非常簡單:創建一個目錄,用WinZip將下載下來的ZIP包解壓縮到該目錄即可。
本軟件的刪除也很簡單:直接刪除從ZIP包中解壓縮出來的所有文件及運行過程中生成的文件即可。
ZIP包中包括下列文件:
DjVuToy.exe。這是軟件的主程序。
DjVuToy.dll。DjVu制作所需的文件,無此文件則不能使用該功能。
DjVuToy.htm。本幫助文件。
如果您下載到的ZIP包中還包括其它文件,毫無疑問不是我放進去的,有廣告或木馬之嫌疑,請立即刪除。
另外程序運行過程中還會生成以下文件:
DjVuToy.ini。這個是參數保存文件,第一次更改參數后生成。退出DjVuToy,刪除此文件,再重啟DjVuToy,即可恢復缺省參數。
DjVuToy_log.txt。這個是錯誤記錄文件,在轉換過程中出現錯誤時自動生成,沒有錯誤則自動刪除以前的錯誤記錄。
djvu_temp:如果運行了“DjVu制作”功能,就會生成此文件夾,用來存儲中間文件。
文件合并
功能:將多個DjVu文件合并成一個,并加掛書簽(如果有書簽描述文件)。
操作:按界面上標注的1、2、3、4操作即可。 如果希望在合并前調整頁面順序,可以選中“顯示文件列表”選項,在開始合并前先彈出頁面順序對話框;如果想在合并后再調整頁面順序,可以在合并后點擊“頁面調整”按鈕。
說明:只有在“合并后順便把書簽掛上”選項被選中,并且在散頁DjVu文件夾下存放有書簽接口文件(FreePic2Pdf.itf、FreePic2Pdf_bkmk.txt)時,合并出來的DjVu才會帶書簽。
接口文件來源有下列幾種:
1、通過“PDG轉DjVu”功能將PDG文件轉換成單頁DjVu文件時,自動按照bookcontents.dat生成的接口文件。
2、按照接口文件規范(詳見FreePic2Pdf使用說明),自己手工編輯。
在合并DjVu文件時,如果選了“合并過程中花時間查壞頁”選項,能夠自動跳過出錯頁,當然這樣可能導致書簽不準。
如果“包括子文件夾”選項未被選中,則所選文件夾下的所有DjVu文件(不包括子文件夾中的文件)合并成一個DjVu文件。由于這時目標文件是唯一的,因此“顯示文件列表”選項、“頁面調整按鈕”和“編輯界面最大化”選項是可用的。
如果“包括子文件夾”選項被選中,則本軟件自動周游所選文件夾下的所有子文件夾,將每一級子文件夾中的文件,合并成一個DjVu文件存放到上級文件夾或指定的文件夾。在這種情況下,如果“包括頂級文件夾”未被選中,則所選文件夾下的DjVu文件不會被合并,只有所選文件夾之下的子文件夾中的文件才會被合并;否則所選文件夾下的所有文件都會被合并。
由于在“包括子文件夾”選項被選中后,目標文件不唯一,因此“顯示文件列表”選項、“頁面調整按鈕”和“編輯界面最大化”選項不可用。
文件拆分
功能:將多頁DjVu文件每頁拆分成一個單獨的DjVu文件。
操作:按界面上標注的1、2、3、4操作即可。
選項說明:
如果“重新編號”選項被選中,則生成的文件名為“頁碼數字.djvu”,此時如果數字位數指定為0,則頁碼數字前面沒有0,否則用0補足指定的位數。
如果“重新編號”選項未被選中,則拆分后的DjVu文件名用合并前的文件名。
如果“生成索引”選項被選中,拆分后自動生成index.djvu,否則不生成。
如果“嵌入INCL段(拆分后文件可單獨打開)”選項被選中(缺省為選中),則拆分過程中會將所有共享數據段(共享字典、注釋等)嵌入拆分后的文件,保證拆分后的每一個文件均可單獨打開,但是文件總長度可能會增加(同一個共享段被嵌入到多個文件中);如果此選項未被選中,則所有共享數據段會被導出成單獨的文件,文件總長度基本保持不變,但拆分后的文件只有在與共享文件在一起時才能打開。
說明:拆分僅針對多頁DjVu,單頁、索引頁均不能再拆分。
頁面調整
功能:插入、刪除、移動、旋轉多頁DjVu中的頁面。
操作:按界面上標注的1、2操作,即可進入頁面調整界面。在其中按照工具條按鈕提示操作即可。
說明:刪除的頁面不可恢復,請在操作前做好備份。
頁面調整界面也可單獨啟動:在運行DjVuToy時以需要處理的DjVu文件路徑為參數,即可進入該界面。
生成索引
功能:為文件夾下的散頁DjVu文件生成索引文件,打開索引文件即可瀏覽全部散頁文件,就像將散頁文件合并成了多頁文件一樣。但是與多頁文件不同,索引文件不能掛書簽。
操作:按界面上標注的1、2、3、4操作即可。 如果希望在生成前調整頁面順序,可以選中“顯示文件列表”選項,在開始生成前先彈出頁面順序對話框;如果想在生成后再調整頁面順序,可以在生成后點擊“頁面調整”按鈕。
DjVu制作
功能:圖像文件轉DjVu,支持PDG、BMP、GIF、PNG、TIFF、JPEG、JPEG 2000。轉換的同時可以進行OCR,生成雙層DjVu。
操作:按界面上標注的1、2、3、4操作即可。 如果希望在生成前調整頁面順序,可以選中“顯示文件列表”選項,在開始生成前先彈出頁面順序對話框;如果想在生成后再調整頁面順序,可以在生成后點擊“頁面調整”按鈕。
如果“源”選擇了文件夾,則將文件夾中的所有圖像文件轉換成一個多頁DjVu(“目標”指定為DjVu文件),或散頁DjVu+index.djvu(“目標”指定為文件夾)。
如果“源”選擇了單個圖像文件,則轉換成與“源”同名的單頁DjVu。
如果“源”選擇了多個圖像文件,則每個圖像文件轉換成一個單頁DjVu,并生成index.djvu文件。
PDG轉換
功能:將PDG文件轉換成DjVu,并將bookcontents.dat轉換成書簽接口文件。
操作:按界面上標注的1、2、3、4操作即可。
參數說明:
黑白圖像壓縮:可選無損、清潔、有損。“無損”保證轉換出來的DjVu文件顯示效果與原PDG完全一樣;“清潔”可以去除圖像上的部分孤立噪點,當然也有可能去錯了把有用的點去掉了;“有損”對于以字母、數字為主的頁面來說,可以大幅提高壓縮比,對于中文頁面來說,可能對漢字筆畫造成損傷 ,因此建議慎用。
單層JPG(04H)無損轉換:如果此選項被選中,PDG中的單層JPG圖像數據流將無損嵌入DjVu文件,這樣生成的DjVu文件顯示效果與PDG相同,生成的文件長度比PDG文件略小,比JPG略大。如果此選項未被選中,則所有JPG圖像解碼后按照插圖參數重新壓縮。
T3插圖層采樣率:按照djvulibre的缺省設置,對于插圖應該按照1/3重新采樣,即將插圖長、寬均縮小至原來的1/3,以減小文件體積。但是從我實際操作的情況看,PDG本身的插圖已經夠不清晰,再這樣縮一把就更可憐了。所以缺省情況下采樣率為1/1,即不重新采樣。
插圖壓縮效果:這個是我自己總結的經驗值,一般選“快速版效果”即可。
DPI:對生成的DjVu文件的DPI進行設置。與其它DjVu制作軟件不同,在這里設置的任何DPI值均不會對圖像壓縮本身造成影響。各選項的具體含義:
使用固定DPI:所有頁面使用相同的DPI。
使用PDG文件DPI:圖像寬度超過1200象素則DPI為300,否則為150。
統一至最大寬度:最終頁面寬度=頁面最大象素寬度/固定DPI,每個頁面的DPI值=該頁象素寬度/最終頁面寬度,保證所有頁面具有相同的邏輯寬度。
統一至最小寬度:與上一項類似。注意選擇了這兩項中的任意一項,均需要先搜索所有PDG文件,找出最大或最小寬度。
統一至固定寬度:每個頁面的DPI值=該頁象素寬度/固定頁面寬度,保證所有頁面具有相同的邏輯寬度。
不理它,愛是多少就是多少:使用系統默認的DPI,轉換速度會稍微快那么一點點。轉換以后如果后悔了,想再改變DPI,可以用“頁面寬度”功能加以改變。
對于快速版PDG,因為本身的圖像質量已經夠糟糕了,實在不希望有人再對它進行反復壓縮,所以軟件在檢測到處理的是快速版PDG(原始數據流為DjVu)后,對于單層(無插圖層)的文件都是無損(黑白)或近似無損(彩色)轉換,只有在碰到多層(在Pdg2Pic中顯示為T3)PDG,才對插圖層重新壓縮,文字層保持無損。
對于清晰版PDG,則按照上述參數進行轉換。
對于索引色圖像(PNG),轉換成彩色DjVu。
為了避免因為某些原因造成轉換不完全,建議在使用本軟件前,先用PdgThumbViewer對需要轉換的PDG文件進行格式檢查。
PDG壓縮
功能:
對清晰版進行無損壓縮。通常清晰版PDG的文字部分采用CCITT壓縮,本功能將它重新壓縮成無損JB2格式。對中文頁面來說,約能砍掉20%的文件長度。
將清晰版壓縮成快速版。即長、寬各砍掉一半。此功能僅對寬度超過1200象素的文件起作用。
將黑白TIFF轉換成PDG。使用前,請先將TIFF更名成PDG。黑白TIFF可以用ComicEnhancer Pro生成。
對于名為PDG,實為PNG的文件,黑白的壓縮成JB2,24位真彩的按照“插圖”選項轉換成JPG或DjVu,索引色的仍然保持PNG格式。
注意:
不能進行反復壓縮,即已經用本軟件壓縮過的文件,再用同樣的參數再次壓縮并不會有效果。
所有壓縮過的PDG文件內部數據流均為DjVu格式,需要高版本的超星瀏覽器才能閱讀。我用超星3.8沒什么問題,更早的版本沒有試過。其它早期開發的第三方瀏覽器,如BXViewer讀起來可能也會有問題。
本軟件畢竟不是超星官方軟件,使用前請先對需要壓縮的PDG進行備份,壓縮后請及時進行檢查,使用本軟件造成的一切后果由使用者自行承擔。
操作:按界面上注明的1、2、3、4步驟執行即可。
選項說明:
轉換為快速版:如果此選項沒有選中,可以對清晰版進行無損壓縮,或將TIFF無損轉換成PDG;否則是將清晰版壓縮成快速版,或將TIFF轉換成快速版PDG。
插圖保持JPG格式:如果此選項被選中,在清晰版轉換成快速版時,插圖存儲為JPG格式,JPG質量由“JPG質量系數”選項決定。
插圖轉換成DjVu:如果此選項被選中,在清晰版轉換成快速版時,插圖存儲為DjVu格式,DjVu質量由“插圖壓縮效果”選項決定。
黑白圖縮小算法:在將清晰版縮小成快速版時,需要將圖像尺寸縮小一半,此參數決定縮小時的插值算法。如果沒有什么特殊情況,建議保持缺省的“nearest”。
Q:DjVuToy在將DjVu文件合并、切分、刪除、旋轉頁面,或改變頁面順序、改變頁面寬度時,會造成圖像質量下降嗎?
A:不會,圖像數據流保持不變。
Q:FreePic2Pdf接口文件有什么作用?
A:接口文件是從Pdg2Pic和FreePic2Pdf借用過來的,對多級書簽進行描述。接口文件的詳細格式說明和示例見FreePic2Pdf使用說明。 對書簽文件進行編輯推薦使用PdgCntEditor。
Q:有些PDG文件轉換不出來,怎么辦?
A:詳見Pdg2Pic的使用說明。
Q:為什么在合并文件時,如果選擇了“合并過程中花時間檢查壞頁”,DjVu會報告某些文件損壞,但是單獨用WinDjView看每頁都能正常顯示?
A:這種情況通常是下載的時候,散頁文件末尾被添加了垃圾數據。解決的辦法:
創建一個空文件夾,把問題散頁復制進去,然后用“文件合并”功能合并這個文件夾,得到一頁結果。
將此一頁結果更名為問題散頁的文件名,覆蓋原問題散頁,重新合并即可。
Q:為什么有些散頁DjVu文件合并后,從某頁開始就無法顯示,但是單獨用WinDjView看每頁都能正常顯示?
A:這種情況通常是下載的時候,散頁文件末尾被添加了垃圾數據,或文件數據不全。解決的辦法:
先定位有問題的散頁。辦法是把不能顯示的頁或其前、后頁對應的散頁刪除,重新合并。如果某頁刪除后合并結果正常,則該頁即為問題頁。
用WinDjView打開問題頁,如果能夠打開,多半是文件末尾被添加了垃圾數據,參照前述方法解決;如果不能打開,說明數據不全,只能重新下載。
Q:如何快速檢查合并后的DjVu文件是否有問題?
A:嚴格說來用WinDjView的縮略圖看是最保險的,不過如果希望盡量快,也可以用DjVuToy的“文件結構”功能,導出文件結構為文本文件,如果此過程中沒有報錯,基本沒有問題,否則可能有問題。