端午節后6月6日, “2014中美大數據研討會”將于中國(北京)國際會議中心舉行。本屆峰會由中美創新協會和北京市科協聯合舉辦,聚焦于當前信息產業發展最快、創新最集中的領域:大數據。
眾所周知, 近年來云計算和移動互聯網的高速發展催生了大批面向消費者的移動應用公司,它們利用龐大的數據量和先進的機器學習算法為用戶提供精準周到的產品和服務;與此同時,越來越多的企業也開始運用互聯網和移動平臺進行市場營銷,并通過內部的大數據平臺進行業務優化和管理,這其中不乏傳統的電信、金融、教育和醫療機構。企業如何駕馭爆發式增長的數據,從中提煉出有用信息用于提升產品和服務;政府和公共事業部門如何通過數據采集和分析制定更為切實高效的民生、城管、和環保政策;創業者如何能夠把握機遇,成為大數據時代的弄潮兒 ---- 這些均是峰會所關注的話題。
免費訂閱“CSDN云計算”微信公眾號,實時掌握第一手云中消息!
CSDN作為國內最專業的云計算服務平臺,提供云計算、大數據、虛擬化、數據中心、OpenStack、CloudStack、Hadoop、Spark、機器學習、智能算法等相關云計算觀點,云計算技術,云計算平臺,云計算實踐,云計算產業資訊等服務。
本次峰會的演講嘉賓既有來自跨國科技企業的高管,也有國企和民營企業的領袖,更不乏創業新星、學術帶頭人、風險投資商和政府機構代表。其中有中國工程院院士,中國互聯網協會理事長鄔賀銓,曾任電信科學技術研究院副院長兼總工程師、中國工程院副院長。目前兼任國 家信息化專家咨詢委員會副主任、國家標準化專家委員會主任、工信部通信科技委主任、中國互聯網協會理事長、中國通信標準化 協會理事長、中國通信學會副理事長、中國電子學會副理事長、國家973計劃專家顧問組成員、國家“新一代寬帶無線移動通信網”科 技重大專項總師、“中國下一代互聯網示范工程”專家委員會主任、國家物聯網專家咨詢委員會組長、IEEE高級會員。
領英商務分析高級總監張溪夢,他是全球最大的職業社交網絡LinkedIn(領英網)的資深商務分析總監。他的團隊由60多位分析師、工程師、設計師、 咨詢師構成,負責給LinkedIn的各主要產品線和商業部門(如市場部、銷售部、運營部等)提供商務數據分析和決策支持, 幫助改善產品體驗和增進在線產品營收。張溪夢先生在硅谷有近十年的數據分析經驗,曾在eBay等著名公司的數據部門任職。 在美國獲得MBA學位之前他曾是一名優秀的腦外科醫生。
目前想參加這個會議可以申請,機會難得,同學們不要錯過,馬上報名吧:http://huiyi.csdn.net/meeting/info/917/tech
在會前我們聯系到了中美創新協會會長,谷歌公司數據科學家彭晨,通過郵件做了采訪。
我叫彭晨,家鄉是安徽合肥。2003年進入浙江大學信息學院自動控制專業學習,同時也是浙大竺可楨學院工程教育高級班的學員。2007年本科畢業后考入斯坦福大學管理科學與工程系攻讀博士學位,研究運籌學等數理方法在商業運營和決策優化中的應用。2011年9月博士畢業后加入谷歌總部,在谷歌的云計算基礎設施和平臺部門從事數據分析工作。業余時間也在經營一家叫作中美創新協會(China America Innovation Network,or CHAIN)的非盈利組織,希望能為推動中美兩地的創新創業貢獻綿薄之力。
進入大學后逐漸意識到自己不是一個純搞工程技術的料(慚愧!),因為對商業運營和企業運作我也有著濃厚的興趣。自控專業其實有大量的數學訓練,也會有機會接觸到運籌學、優化等相關領域。我逐漸發現運籌學這個學科可以很好的結合自己的理工科背景和對商科的興趣,于是通過參加數學建模競賽、歐萊雅工業大賽等學科競賽和活動逐漸確立了未來的深造方向,并最終很幸運的被斯坦福管理科學與工程系錄取。
在谷歌當下最有未來感的工作是做眼鏡、機器人、和無人駕駛汽車:)云平臺和數據中心相關的工作其實是the non-sexy part of Google―因為很多工作都是幕后的,雖然卓越的數據中心技術是谷歌的核心競爭力之一,也是谷歌為業內人士稱道并好奇的領域,但對于億萬普通互聯網用戶而言這部分的工作其實是透明的。當然,作為員工我們還是很自豪能夠親身參與到全球最牛逼的云計算平臺的創建和發展過程中去的。我在谷歌的主要職責是通過建立數學模型和大規模的數據分析幫助管理層、工程師、和產品人員制定更高效合理的云平臺運營和產品策略,具體工作例如流量需求預測,計算資源配置,資源定價,job scheduling algorithm的優化等等。這些工作近期也隨著谷歌正式進入公有云市場叫板AWS而變得更加具有戰略意義。
谷歌數據科學家的一天,我想取決于所在產品部門、本身的工作內容、和項目進展的不同階段應該都會略有不同吧。大體上對我而言建模和編程(R、Python、SQL等)等技術性工作占去大概60%的時間;剩下20%的時間在跟各種stakeholder開會--了解問題的商業背景、意義、優先順序,聆聽需求,討論階段性的項目進展等等;還有20%的時間是寫設計報告,寫slides,做dashboard,跟高層做匯報??偟膩碚f,谷歌的數據科學家還是一個對綜合能力要求相當高的職位,優秀的數據科學家一定程度上需要是軟件工程師、數學家、和咨詢師的三位一體;如果再算上數據可視化這一塊,那再有一些藝術天賦就更好了:)
Jim和我在一個大的部門。他的正式職位其實是一名機械設計工程師,負責研究怎樣設計最節能省電的服務器和相關技術(谷歌數據中心里所有的服務器都是自產自銷)。但就像你說的,谷歌很多的技術人員都是多面手,Jim通過使用人工神經網絡算法搭建了一個預測模型,可以根據環境參數非常精確的預估數據中心的能量利用率,對于進一步提高谷歌數據中心的運營效率有很大的意義。
在谷歌不能說所有工作都需要使用人工智能,但可以說絕大部分的決策都需要數據支持:從顯而易見的搜索結果排序、廣告競價模型,到不太容易想到的數據中心服務器里的散熱片該按什么角度擺放、移動應用上的某個button該是什么顏色、多大尺寸,再到完全難以致信的公司該提供什么福利最能調動員工的工作積極性,可以說但凡是一個正式的決策就需要有數據的支持。事實上谷歌的人力資源部門有一個由十幾名名校統計博士組成的分析師隊伍,專門研究不同的人力資源政策和員工績效之間的關聯,并根據研究結果隨時調整薪資福利、晉升制度,等等,確保員工始終有一個良好的工作狀態。這也可以解釋為什么谷歌連續四年被評為全美最佳雇主吧!人力資源部門尚且如此,工程技術部門就更不必說了。
中美創新協會是我和幾位朋友2011年夏天在硅谷共同創立的非盈利組織,我們最初的想法很簡單,就是想搭建一個跨中美的平臺去幫助創業者(尤其是華人創業者)尋找信息、投資、和合作伙伴等各種資源,提高創業的成功率。我們主要通過在硅谷當地舉辦各種活動來推動和協助創新創業,例如圍繞商業和技術熱點的圓桌討論、面向硅谷當地創業者的創業訓練營、聯系硅谷創業人員和國內投資機構的中美高技術項目視頻對接、以及馬上將要在北京舉辦的中美創新鏈接年會等等。未來我們希望更多的建設和發展網絡和移動平臺,將更多資源對接和整合的過程從線下向線上轉移。我們也希望更多的拓展在國內的影響力和輻射范圍,幫助國內更多的區域和城市同硅谷的創業者建立聯系。目前中美創新協會在中美兩地共有8000多名注冊會員,并有包括孵化器、風投、地方政府部門、律所、會計師事務所、媒體等在內的30多家合作機構。
值得一提的是我們的核心團隊成員基本都是硅谷各大科技公司的從業人員,大家對推動創新創業和中美交流有極大的熱忱,雖然是不拿一分錢的志愿者工作,但大家干的很起勁兒,因為我們相信自己是在為社會創造價值。就我個人而言,我非常相信連接(connection)的力量,把優秀的人和人、人和事、資源和資源連接起來,很多偉大的事情自然而然就會醞釀產生。從這個意義上講,中美創新協會就是力圖在做連接這件事:從點到線,再到網絡,始于有形,終于無形。
在中國的年會我們之前已經辦過兩屆,取得了不錯的成效。作為一個以搭建跨中美的平臺為宗旨的組織,我們需要通過在國內當地的活動來宣傳理念,擴大影響,傳遞價值;同時也想借此為協會自身下一步的發展尋找機會和合作伙伴。當然,我們確實也會帶來一些美國硅谷科技公司的高管、從業者和創業者,和國內同行近距離的交流溝通--這也同中美創新協會的宗旨相吻合。
為什么是大數據?其實去年的年會也是圍繞大數據,反響很好。我們覺得數據這個話題內涵豐富,外沿寬泛,用作大會的主題非常合適,可以融會貫通把很多不同的行業包攬進來。當然,大數據本身也的確是這兩年的技術和商業熱點,是目前信息行業創新最活躍最集中的領域。會議將以大數據為綱,觸及數據在五個不同商業/技術領域的實際應用和價值體現,可以宏觀的展示給大家當前大數據應用的實際狀況和所面臨的挑戰。我認為會是一場非常有價值的干貨分享和思維碰撞的活動。
都不是。首先不可否認當下的言必談大數據確有過熱、炒作之嫌,那個”big data is like teenager sex”的比方想必很多人也都聽說過。炒作的人有些是為了賣產品,有些是為了賣理念,有些純粹是為了賺吆喝,但對于創業者和數據從業人員來說,投資好拿了,工資漲高了,是好事。
但我認為大數據并不僅僅是一個buzzword,而是一場實實在在正在發生的變革,是科學技術和商業文明發展到一定階段的必然結果,是人類社會的必然發展方向。數據本身并不新,從結繩紀事時便有之;數據分析的理論方法也不新--統計、概率、優化,甚至機器學習里的基本算法都已經有至少好幾十年的歷史;人們利用數據的渴望也不新,千百年來不管是夜觀天象的天文學家還是嘗遍百草的醫藥學家都是數據收集和整理的先行者;到了最近幾十年,現代管理學的精髓就是要把企業管理指標化、數據化,從而優化企業的運營。之所以“大數據”突然鬧出這么大的動靜,無非是因為這是人類自數百萬年前誕生之日起,第一次可以精確的、系統的、實時的、全方位的、永久的獲取、記錄、分析、并保存海量的數據--關于我們的一切行為以及周遭的所有事物的數據,這種兒童進了糖果店的興奮是完全可以理解的。這一切得益于移動互聯網(包括智能硬件)和云計算技術的發展--前者解決了數據采集的問題,后者解決了數據處理分析和存儲的問題。所以,可以說人類文明發展的進程終于等來了移動計算和云計算,使得我們千百年來對于獲取信息和提煉信息的各種非分之想一夜之間成為可能。這里所蘊藏的機會,包括商機,是無限大的。我想我們任何一個人目前都很難推測大數據到底會在多快的時間內帶來多大的社會變革,因為我們真的只是站在這個新紀元的開端。我們應該感慨自己成為人類世代中的幸運兒,可以目睹并親身經歷人類社會向數據社會和智慧社會的過渡。
當然了,正因為數據和信息不等于人類生活的全部,大數據也不可能是“包治百病的靈丹妙藥”--失戀永遠都會是痛苦的吧!
其實對于硅谷的很多互聯網公司而言,大數據一點也不新。例如谷歌,從16年前誕生的那天起谷歌就是一家大數據公司,因為谷歌所做的事情是要不斷的索引全世界所有的網絡信息,并在它們之間建立關聯,聽起來就讓人頭大。理所當然的,大數據潮流中奠基性的一些技術框架,例如并行計算的Hadoop,就是基于谷歌11年前發明的Mapreduce和BigTable等技術發展而來的。所以要說大數據應用的成功案例,谷歌搜索就是第一個大案要案。當然,后來的社交網絡和電子商務網站也大量使用了大數據分析的技術,例如Facebook,LinkedIn的朋友推薦,Amazon和Netflix的相關商品和電影推薦等等,就是通過在海量數據上使用協同濾波等算法實現的。
而大數據之所以逐漸成為潮流,是因為在美國它已經走出了硅谷的互聯網和高科技公司,走入了很多傳統的電信、零售、金融、制造、物流、醫療、教育等行業,開始為不同的產業創造巨大價值。前不久美國知名零售商Target因為給一個未成年少女投遞嬰兒用品廣告而遭致少女父親的投訴和斥責,然而幾天后這名父親又致電Target道歉,因為事實是他的女兒確實未婚先孕了。Target正是通過大量的用戶購買行為分析預測出這名少女屬于潛在的孕婦群組,因此投遞了針對性的廣告。且不論這個廣告是該投還是不該投,一家零售商已經比一個父親更了解自己女兒的處境--通過數據。另外一些應用的實例還包括通用電氣--通用電氣賣出的每一臺飛機發動機上都裝載了大量的傳感器,這些傳感器在飛機的飛行途中每分每秒的向基站傳遞運行數據,通用可以準確的知道什么時候需要對發動機的哪個零部件進行維護,從而大大降低了維護成本并提升了飛行安全。
說到大數據應用的困境,目前業界的共識是用戶隱私保護和數據安全會是一大挑戰。作為商家,應該給用戶提供充分的數據使用透明度,并允許用戶自行選擇是否愿意貢獻自己的數據,在商業利益和用戶信任之前做出正確的權衡。
作為一家基于硅谷的、全部成員都是志愿者的非盈利組織,我們知道自己的斤兩,也并沒有試圖在規模上和其他的會議直接競爭比較。說到這次會議的特點,首先我們完全側重于大數據在具體領域的應用實踐,包括移動互聯、智能商務、金融支付、公共事業、穿戴設備,等等,而不會過多討論底層的云技術平臺和架構;我們希望通過本次會議幫助大家建立起對大數據廣泛應用前景的系統性認識,并在不同的產業之間進行橫向比較,探索新的潛在商機。其次我們會有幾位來自美國硅谷科技公司、戰斗在大數據分析最前沿的華人技術骨干和管理者,同大家分享大數據在美國的應用實踐,其中包括LinkedIn的資深商務分析總監張溪夢先生和Square的數據科學總監顏嶸博士。其他值得關注的還有大會的開場主題演講嘉賓,中國互聯網協會理事長鄔賀銓院士;此外,本次大會還特別邀請了多家新銳創業公司的創始人和核心團隊成員,包括快的打車的創始人陳偉星,中文語音助理出門問問的創始人李志飛,國內最大的移動新聞應用今日頭條的創始人張一鳴,國內目前聲勢最火的頭戴式虛擬現實游戲頭盔ANTVR(蟻視)的創始人覃政,前谷歌員工、現新銳移動后端服務提供商AVOSCloud的CEO江宏博士,國內最大的DSP之一品友互動的CTO沈學華博士等等;本次大會還邀請到了清華大學的智能交通專家吳建平教授和美國哈佛大學生物統計系的郭健教授跟大家探討大數據在公共領域的應用前景--這些都是峰會值得關注的看點。