【快訊】時至今日,R語言幾乎成為了數據科學領域的通用語言,被各個公司運用于數據分析產品中。經了解,CSDN云計算得知,Teradata公司近日亦將推出起基于R語言的大數據分析工具――Teradata Aster R,通過放寬內存和處理能力限制條件,擴展開源R語言分析能力。Teradata Aster R為R語言分析師提供企業級就緒(enterprise-ready)的商業分析解決方案,具有高度可擴展性、可靠性和易用性。
R是面向數據挖掘人員和數據科學家的一種開源統計語言及軟件。Rexer Analytics咨詢公司調查顯示,使用R語言的數據挖掘人員越來越多,70%的調查對象稱他們正在使用R語言。
然而在單服務器部署情況下,鑒于內存處理數據量大小的限制,復雜分析的性能必然會有所下降。本次推出的Teradata Aster R則通過在數據庫內并行執行R語言分析,放寬了處理能力及內存限制。
Teradata Labs總裁 Scott Gnau 表示:“Teradata Aster R為企業提供R語言分析能力。而針對R語言分析師,Teradata開發出他們熟悉的R語言和工具,并提供強大的處理能力及豐富的分析方法。分析師還能夠從多個數據源訪問海量整合數據。”
Teradata Aster R主要包含以下三大組件:
Teradata Aster R Library: 該語言庫預置100余種R語言功能,所有數據均支持并行運行,降低并行處理的復雜性。分析師無需花費數日進行并行算法編碼,即可實時的訪問R語言并行功能,如數據管理、訪問、探勘與操作、機器學習算法等。此外,Teradata還通過擁有專利的Teradata Aster nPath等高性能分析能力,增強開源R語言的分析能力。
Teradata Aster R Parallel Constructor:該組件擁有超過5500個R語言分析工具包,支持所有開源社區開發的新分析功能,可幫助分析師開發并行分析方法。
Teradata Aster SNAP Framework集成:開源R語言引擎已被整合至Teradata Aster無縫網絡分析處理框架(Teradata Aster SNAP Framework),可依據分析師特定探索需要,將多種分析引擎和文件存儲無縫整合。多種分析能力的無縫整合增強Teradata Aster R的分析能力。借助圖表、MapReduce、文本、統計、時序及R語言分析等多種分析功能,數據科學家可僅通過單一程序就能深度挖掘數據。
Teradata還為Aster R語言庫添加高性能圖表分析模塊,支持先前發布的圖形處理引擎Teradata Aster SQL-GR。數據科學家將能夠利用圖形分析能力,分析社交網絡,監測欺詐行為,并運行可信傳播(belief propagation)這一專業的可能性建模算法。
R語言分析用例
在線流媒體電影供應商必須預測未來收入,采取行動阻止潛在的消費者流失,并提升其視覺體驗。電影供應商將該任務分派給R語言分析師,幫助他們了解客戶的購買偏好及服務需求。但由于內存及處理能力限制,分析師無法訪問并整合所有需要的數據。在單服務器內存環境下很可能無法及時完成分析,因此分析師無法及時響應商業用戶的需求。
部署Teradata Aster R幫助分析師打破內存及處理能力限制,他們還可通過R語言控制臺,協調整個分析流程。而通過部署Apache Hadoop及Teradata,分析師可在數據庫內針對電影元數據、客戶搜索、觀看歷史記錄、賬戶信息等所有所需數據,輕松實現高速分析。基于這些客戶洞察,在線電影供應商將能夠針對客戶服務及防止客戶流失作出明智決策。據悉,Teradata Aster R計劃將于2014年第四季度上市。
免費訂閱“CSDN云計算”微信公眾號,實時掌握第一手云中消息!
CSDN作為國內最專業的云計算服務平臺,提供云計算、大數據、虛擬化、數據中心、OpenStack、CloudStack、Hadoop、Spark、機器學習、智能算法等相關云計算觀點,云計算技術,云計算平臺,云計算實踐,云計算產業資訊等服務。