企業級大數據供應商Cloudera宣布該公司剛剛完成一筆9億美元的融資,通過觀察Hadoop領域的3大知名初創公司Cloudera、Hortonworks及MapR的融資對比,我們相信隨著這些初創公司融資規模的不斷擴大,Hadoop生態圈將愈加繁華;另外,本周還有一個消息值得關注,那就是Oracle2013年在軟件方面的總收入為297億美元,超過IBM躍居軟件行業第二,這對于Oracle也應該具有里程碑意義;當然還有云計算時代IT專業人員需要具備哪些技能,2014值得關注的開源軟件等等。
企業級大數據供應商Cloudera宣布該公司剛剛完成一筆9億美元的融資,這個金額包括了這個月 19日收獲了1.6億美元(T. Powe Price 領投、Google Ventures 等跟投的1.6億美元),以及近日剛剛確認從Intel手中取得的7.4億美元融資,芯片巨頭則獲得了大數據先鋒18%的股票。
Cloudera成立于2008年,專注于Hadoop開源技術的企業級應用,其創始團隊成員來自 Google、Facebook、Yahoo!、Oracle 等多家知名IT企業,而目前Cloudera的解決方案已為AOL、CBS、Ebay、摩根斯坦利、迪士尼等公司重度使用。
該公司最近一筆融資該歸結于2012年的6500萬美元,其A、B、C三輪融資分別為2009年的500萬、2010年的3600萬(A輪投資人的融資)、2011年的4000萬美元,而,這個Hadoop企業級服務提供商更計劃在2014年實現IPO。
還值得關注的有:微軟繼續保持第一的位置,年收入高達657億美元,與去年的620億美元上漲6%。Salesforce.com,自稱“軟件終結者”的公司,也首次進入十大軟件公司行列。
談到IT專業技能,人們往往想到軟件、硬件、網絡、編程語言等等,甚至以為考個證書在手就萬事大吉,其實不然,那么在競爭非常激烈的云計算時代,IT專業人員到底需要具備哪些技能,才能確保自己緊緊跟上時代的腳步,不被時代淘汰。
作者列舉了10項技能:商業和金融技能、技術技能、企業架構和業務需求分析、項目管理技能、合同和供應商的談判技巧、安全性和遵從性、數據集成和分析技能、移動應用開發和管理、熟悉開放混合云的知識、了解OpenStack。
Ceph,當下已成為OpenStack上最通用的存儲之一,也是是目前人氣最高的開源存儲項目之一。Ceph是一種為優秀的性能、可靠性和可擴展性而設計的統一的、分布式的存儲系統。Ceph項目起源于其創始人Sage Weil在加州大學Santa Cruz分校攻讀博士期間的研究課題。
項目的起始時間為2004年。在2006年的OSDI學術會議上,Sage發表了介紹Ceph的論文,并在該篇論文的末尾提供了Ceph項目的下載鏈接。由此,Ceph開始廣為人知。Ceph使用C++語言開發。對于一個典型的強調性能的系統項目,這一選擇可以理解。作為開源項目,Ceph遵循LGPL協議。根據Inktank官方網站上的信息,Cpeh的生態系統參加下圖:
事實上,Ceph最初針對的目標應用場景,就是大規模的、分布式的存儲系統。所謂“大規模”和“分布式”,是指至少能夠承載PB級別的數據,并且由成千上萬的存儲節點組成。
在大數據口號深入人心的今天,PB已經遠遠不是一個激動人心的系統設計目標了。但是,應該指出,Ceph項目起源于04年。那是一個商用處理器以單核為主流,常見硬盤容量只有幾十GB的年代。這和現在動輒6核12線程還要雙處理器、單塊硬盤3TB已經司空見慣的情況是不可同日而語的。因此,理解這個設計目標,應該考慮當時的實際情況。當然,如前所述,Ceph的設計并沒有理論上限,所以PB級別并不是實際應用的容量限制。
5.皮皮網陳超:易用與性能兼備,Spark蓬勃發展!
陳超就職于皮皮網,擔任數據平臺負責人,負責公司所有數據分析與數據挖掘相關的項目。近年來一直專注于分布式計算與機器學習相關領域。國內較早的Spark研究與使用者,Spark
Contributor。目前專注于基于Spark平臺的大數據處理。
Spark在機器學習方面有著無與倫比的優勢,特別適合需要多次迭代計算的算法。當然Spark的容錯和調度也自有其特點和優勢。最后Spark能把批處理和流處理做到一個很好的平衡。
Docker是一個開源的應用容器引擎,讓開發者可以打包其應用以及依賴包到一個可移植的容器中,然后發布到任意Linux發行版,也可實現虛擬化。容器完全使用了沙箱機制,相互之間不會有任何接口(類似iPhone的app)。幾乎沒有性能開銷,可以很容易地在機器和數據中心中運行。最重要的是,他們不依賴于任何語言、框架或包依賴。
Docker自身使用Go語言開發,并使用了Linux的cgroup、namespacing、支持寫時復制特性的AUFS文件系統以及LXC腳本。
OpenIoT是把物聯網和云計算相結合的開源解決方案,OpenIoT項目專注于提供一個開源的中間件框架,使得云環境中的物聯網IoT應用能實現公式化的自管理。因此,OpenIoT中間件框架將作為物聯網應用的宏偉藍圖,使得物聯網應用的交付變得自動化,更能適應云基礎設施。
OpenIoT創建了一個開源的中間件,可以從傳感器云中獲取海量信息,而無需顧慮具體使用的傳感器是什么。更多開源內容請參考 原文。
7. Sahara順利畢業,將加速OpenStack與Hadoop的融合
OpenStack Sahara(舊稱:Savanna)項目的負責人Sergey Lukjanov昨天正式宣布,Sahara從OpenStack孵化項目順利畢業,將從OpenStack下一版本Juno開始作為OpenStack核心項目之一。Sahara是在2013年由領先的Apache Hadoop貢獻方Hortonworks公司,最大的OpenStack 系統集成商Mirantis公司,以及全球領先的開源解決方案及最新版OpenStack的最大貢獻方紅帽公司聯合發起的,致力于共同在 OpenStack上實現Apache Hadoop,使OpenStack用戶能夠輕松供應和管理彈性Hadoop集群,加快Hadoop在OpenStack上的開發和部署進程。
Sahara項目的架構圖如下:
Apache Hadoop是MapReduce技術的一種實現,目前被各行業廣泛采用,已成為大數據處理的行業標準。Sahara項目旨在為OpenStack用戶提供一種簡單、快捷地部署以及管理Hadoop集群的方案,類似于亞馬遜Elastic MapReduce (EMR) 服務。
更多云計算熱點新聞: 光網絡SDN化的四大驅動力及兩條路徑、 【走近院士】懷進鵬:全球的計算模式可能重新形成、 高端實戰技術培訓:OpenStack企業應用之路、 騰訊薛偉:快速模型更新在精準廣告推薦中的應用、 【CSDN在線培訓QA】小米崔建偉答疑HBase在小米中的應用實踐,請繼續關注 CSDN云計算頻道。(審校/仲浩)
以“ 云計算大數據 推動智慧中國 ”為主題的 第六屆中國云計算大會 將于5月20-23日在北京國家會議中心隆重舉辦。產業觀察、技術培訓、主題論壇、行業研討,內容豐富,干貨十足。票價優惠,馬上 報名 !