2009年5月7日 星期四

專利顯示Google書籍掃描的優勢

Google獲得的一項技術專利顯示,Google Book Search擁有其他數位圖書館所望塵莫及的優勢。

Google針對書籍掃瞄碰上彎曲頁面的矯正專利技術。

Google已發明出一套系統,利用兩台相機與紅外線,來自動解決書頁彎曲的問題。作法是為每個頁面建立一個3D模型,然後再把書頁彎曲翹起的部分弄平,如此一來即可在網路上呈現出平坦的頁面,而且不必把整本書拆開,或擺到平台式掃描器上壓平。

有了這項先進的技術,加上Google已掃描了超過700萬本書,任何想要標榜自家數位圖書館的競爭對手,恐怕來不及迎頭趕上。任何業者都可僱用不需什麼 技術的勞工,把書擺在普通掃描器上,然後操作某種光學字元辦識(optical character recognition;OCR)功能,把掃描到的書頁圖像轉換成文字資料。然而,要快速進行掃描並取得高畫質影像,又是另一回事。

以下是第7,508,978號專利對Google這套系統的描述:運用紅外線可將此圖案(pattern)顯示在書本上;紅外線相機拍照後,把它轉化成書頁的3D形狀。

首先,書被放在平坦的表面,上方再以紅外線投射器(infrared projector),在書頁上面顯示一個特別的迷宮式的圖案。

接下來,兩台紅外線相機從不同的角度,把紅外線圖案給拍攝下來。

專利說明寫道:「這些圖像(images)可用已知的立體成像技術(stereoscopic techniques)加以組合,以取得該圖案的3D對應(three-dimensional mapping)。此圖案落在書的表面上,使圖案的3D圖形與書頁的3D表面互相對應。」

下一步是,以傳統相機拍攝的書頁照片,彎曲的部分可以弄平(de-warped),這樣不但可讓光學字元辨識起來更加容易,而且在關鍵字搜尋結果旁呈現實際的書頁時,也能展示品質更佳的圖像。(唐慧文譯)

Related Posts Plugin for WordPress, Blogger...