星期四, 1月 24, 2013

PDF-XChange Viewer 的 OCR 功能


由於免安裝版本不能辨認中文,所以使用安裝版本,下載程式後進行安裝。


下載版只能辨認4種語言,其後要下載其他 Lang Pack。


如果用其他 reader,不用 set 做 default。


個人不喜歡安裝 Ask Toolbar,所以選擇不安裝。


使用 Free Version。


第一次執行時會詢問是否設為 default。


照常打開 pdf,如果文件是使用 pdf writer/printer 等程式產生,我們可以 select 文件中的文字,然後 copy & paste,但如果文件上的文字,被當作圖案,例如經由 scanner 生成的 pdf,我們便不能 select 當中的文字,copy & paste 也只能把他當成圖片貼上。ocr 就是把這些pdf文件變成可讀取的文字。


下載中文 lang pack,安裝。


打開文件後,開啟 ocr 功能,Document > OCR Pages。


設定辨認的語言,如只有英文,設選取英文,執行時間會較快。


output 選 "Preserve Original Content& Add Text Layer。


辨認進行中。


完成後,畫面雖然並沒有改變,但現在能 select 文件中的文字。


Copy 當中的文字,然後貼去其他程式,如 word,當中所有中文字都認到。辨認能力也不作詳細測試。

2 則留言:

方翊企管顧問中心 說...

以中文辨識後,有些檔案後當機。

sopwill 說...

寫得很好
但載點呢