【編者按】一直以來,大數據的使用遠遠不及大數據收集能力,就起原因主要是目前企業的數據主要分散在不同的系統或組織,大數據戰略的殺手锏就是能夠更深度的,更豐富的挖掘所有數據系統中的有價值的信息,從而更準確的預測客戶行為,發現商業價值,但是目前很難將這些數據移到一個單獨的數據存儲中,另外,安全和監管問題也得不到保障,Oracle Big Data SQL的推出解決了現在面臨的難題。
以下為譯文:
發現企業或組織對數據管理架構的需求,Oracle推出Big Data SQL軟件來整合包括Hadoop、NoSQL和Oracle數據庫等在內的各種各樣的數據源。
一套完整的解決方案是使Oracle的大數據設備和Big Data SQL結合起來,Cloudera的 Hadoop 分布式和Oracle自己的 NoSQL 數據庫。開始時Oracle Big Data SQL只支持Apache Hive和Hadoop File System,其他供應商需要移植SQL關系數據庫到Hadoop上運行。
Oracle提供大數據設備和Big Data SQL的一套完整解決方案
Oracle Big Data SQL產品意味著管理員在處理非關系型數據庫或Hadoop中的信息時,不用再學習其他查詢語言,Oracle的大數據分析主管Neil Mendelson說。
我們可以使用我們已經習慣使用的Oracle SQL語言――完整的SQL語言,我們現在可以直接訪問這三個中的任何一個數據源或其中任意組合,他解釋道。
類似的工具都可以在開源社區如Stinger中獲得,這使得你可以使用SQL命令來查詢Hadoop中數據,或使用旨在NoSQL系統上實現SQL命令的CQL語言(Cassandra查詢語言)。
創建這個大數據管理系統的目標是希望SQL查詢能夠運行在不同的數據源上,并且使企業或組織能夠利用現有的技術維護企業級數據安全,以及管理敏感的信息。Oracle表示這項技術其獨特的架構和Smart Scan繼承于Oracle Exadata,同時能夠允許Oracle Big Data SQL查詢所有形式的結構化和非結構化數據,并且最小化數據移動。
這也促進了Oracle數據庫的安全功能,包括組織現有的安全策略,擴展到Hadoop和NoSQL數據。
Oracle的Dan McClary說,產品的開發已經有一段時間了,而且它超越了現有的技術。他同時表示Big Data SQL與HDFS DataNodes和YARN NodeManagers能夠co-resident,另外,從新的外部表的查詢被發送到這些服務能夠保證直接路徑讀取和數據本地化。
Cloudera創始人、董事長兼首席戰略官Mike Olson說:“在oracle的大數據設備上運行Cloudera的軟件集比DIY集群部署更具成本效益并且速度更快。在Hadoop查詢數據時,我們已經看到客戶對SQL強烈的需求。”
參考譯文:
Oracle Enables SQL Queries Across Hadoop, NoSQL and Oracle Database
Oracle: You wanted SQL on Hadoop? How about SQL on Hadoop and SQL ON NOSQL? (責編/魏偉)