【編者按】僅僅依賴大型合作知識庫Freebase的知識圖譜,限制了Google的發展速度,為了解決這一困境,Google創建了新的知識庫 Knowledge Vault。該知識庫在擴充知識上是快速和自動的,將有望超過知識圖譜,同時它能夠建立歷史和社會的模型,帶來量子級的飛躍。但它帶來的隱私問題同樣令人擔憂。
以下為原文
隨著知識圖譜的出現,Google 搜索不再是簡單的網頁鏈接,而是直接回答問題的知識引擎。不過,現有的知識圖譜仍然依賴大型合作知識庫 Freebase,信息的擴展是眾包形式。這限制了它的發展速度。現在,Google 決定將這個過程自動化。
據 newscientist 網站報道,Google 創建了名為 Knowledge Vault 的知識庫。它通過算法自動搜集網上信息,通過機器學習把數據變成可用知識。目前,Knowledge Vault 已經收集了 16 億件事實,其中,2.71 億件是“可信的事實”。這里的可信是說,Google 把新事實與已掌握知識對照后,認為其準確的可能性是 90%。
“他們完成的是一件非常驚人的事情”,法國 Telecom ParisTech 的數據科學家 Fabian Suchanek 說。
Knowledge Vault 仍然沒有知識圖譜龐大,但是,它在擴充知識上是快速和自動的,超過知識圖譜只是時間問題。Garntner 的技術分析師 Tom Austin 說,大型科技公司都在構建類似的知識庫。當機器系統掌握了全人類的知識,它的智力將遠遠超過現有的智能助手。“在這個十年結束的時候,我們將會看到智能的優先收件箱。它能夠給我們找到最重要的 10 封郵件,然后在無需我們打擾的情況下,處理完剩下的郵件,” 他說。
除了改善人機交互之外,知識庫也會推動現實增強技術的發展。未來,Knowledge Vault 可以驅動一個現實增強系統,讓我們從頭戴顯示屏上了解現實世界中的地標、建筑、商業網點等信息。
知識庫還能夠改變我們研究人類社會的方法。“這是最有遠見的事情”,Fabian Suchanek 說,“Knowledge Vault 能夠建立歷史和社會的模型。”
Suchaneck 已經做了一次以數據驅動的歷史研究。他把 YAGO 數據庫與法國報紙 Le Monde 的數據結合,展示了性別差距在政治界的歷史變化。
由于 Google 的知識庫是詳細和龐大的,我們甚至可以對未來做出一些精準的預測。“這是全新一代的技術,可以帶來巨大的改變,改善人們生活和娛樂,甚至改變他們戰爭的方式,” Austin 說,“這是一個量子級的飛躍。”
Knowledge Vault 帶來的也有隱私問題。它貪婪地收集任何可以找到的信息。“在幕后,Google 不僅僅有公開數據,” Suchanek 說,“它也從 Gmail、Google+ 和 Youtube 上收集信息。你我存儲在 Knowledge Vault 的方式,與 Elvis Presley(貓王)相同。”
原文鏈接: Knowledge Vault:Google 將建全球最大知識庫(責編/仲浩)