Google獲得的一項技術專利顯示,Google Book Search擁有其他數位圖書館所望塵莫及的優勢。
Google已發明出一套系統,利用兩台相機與紅外線,來自動解決書頁彎曲的問題。作法是為每個頁面建立一個3D模型,然後再把書頁彎曲翹起的部分弄平,如此一來即可在網路上呈現出平坦的頁面,而且不必把整本書拆開,或擺到平台式掃描器上壓平。
有了這項先進的技術,加上Google已掃描了超過700萬本書,任何想要標榜自家數位圖書館的競爭對手,恐怕來不及迎頭趕上。任何業者都可僱用不需什麼 技術的勞工,把書擺在普通掃描器上,然後操作某種光學字元辦識(optical character recognition;OCR)功能,把掃描到的書頁圖像轉換成文字資料。然而,要快速進行掃描並取得高畫質影像,又是另一回事。
以下是第7,508,978號專利對Google這套系統的描述:運用紅外線可將此圖案(pattern)顯示在書本上;紅外線相機拍照後,把它轉化成書頁的3D形狀。
首先,書被放在平坦的表面,上方再以紅外線投射器(infrared projector),在書頁上面顯示一個特別的迷宮式的圖案。
接下來,兩台紅外線相機從不同的角度,把紅外線圖案給拍攝下來。
專利說明寫道:「這些圖像(images)可用已知的立體成像技術(stereoscopic techniques)加以組合,以取得該圖案的3D對應(three-dimensional mapping)。此圖案落在書的表面上,使圖案的3D圖形與書頁的3D表面互相對應。」
下一步是,以傳統相機拍攝的書頁照片,彎曲的部分可以弄平(de-warped),這樣不但可讓光學字元辨識起來更加容易,而且在關鍵字搜尋結果旁呈現實際的書頁時,也能展示品質更佳的圖像。(唐慧文譯)