阿里的數加平臺最近推出了機器學習數據實驗室,由因而基于ODPS創建,運算方面絲絕不是問題,繼承了ODPS的大數據計算能力。
算法方面,常見的2分類、多分類、線性回歸、聚類、圖計算等都有提供,純圖形的操作方式也很簡單。
計費方式同ODPS差不多,按IO和計算量計費,起步門坎很低。
有興趣可以玩1玩:https://data.aliyun.com/product/learn
老碼農玩了1段時間,覺得唯1的遺憾就是數據處理方式提供的比較少,不過在這方面R倒是個不錯的補充,阿里云也提供了RODPS這個R包供使用。這里簡單描寫下使用步驟。
1、使用R進行數據處理之前,先需要對ODPS項目中的大數據做抽樣。這個阿里云機器學習實驗室提供了分層、隨機、加權幾種抽樣方式。
2、將抽樣數據寫到ODPS項目中,在R中使用RODPS連接并獲得數據,存儲到data frame中。
3、接下來用R針對樣本做處理,如特點選擇,統計檢驗等。最后把處理結果輸出報表,或同步到ODPS項目中,使用阿里云提供的在線報表生成報表。