多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > 服務器 > 大數據究竟是什么?一篇文章讓你認識并讀懂大數據

大數據究竟是什么?一篇文章讓你認識并讀懂大數據

來源:程序員人生   發布時間:2017-01-23 20:11:25 閱讀次數:4172次

本文轉自:http://www.199it.com/archives/167397.html

在寫這篇文章之前,我發現身旁很多IT人對這些熱門的新技術、新趨勢常常趨之若鶩卻又很難說的透徹,如果你問他大數據和你有甚么關系?估計很少能說出123來。究其緣由,1是由于大家對新技術有著相同的原始渴求,最少知其然在聊天時不會顯得很“土鱉”;2是在工作和生活環境中真正能參與實踐大數據的案例實在太少了,所以大家沒有必要花時間去知其所以然。

我希望有些不1樣,所以對該如何去認識大數據進行了1番思索,包括查閱了資料,翻閱了最新的專業書籍,但我其實不想把那些零散的資料碎片或不同理解論述簡單規整并堆積起來構成毫無價值的轉述或評論,我很真誠的希望進入事物探訪本質。

如果你說大數據就是數據大,或侃侃而談4個V,或許很有深度的談到BI或預測的價值,又或拿Google和Amazon舉例,技術流可能會聊起Hadoop和Cloud Computing,不管對錯,只是沒法勾畫對大數據的整體認識,不說是片面,但最少有些管窺蠡測、隔衣瘙癢了。……或許,“解構”是最好的方法。

怎樣結構大數據?

首先,我認為大數據就是互聯網發展到當今階段的1種表象或特點而已,沒有必要神話它或對它保持畏敬之心,在以云計算為代表的技術創新大幕的襯托下,這些本來很難搜集和使用的數據開始容易被利用起來了,通過各行各業的不斷創新,大數據會逐漸為人類創造更多的價值。

其次,想要系統的認知大數據,必須要全面而細致的分解它,我著手從3個層面來展開:

36大數據

第1層面是理論,理論是認知的必經途徑,也是被廣泛認同和傳播的基線。我會從大數據的特點定義理解行業對大數據的整體描繪和定性;從對大數據價值的探討來深入解析大數據的珍貴所在;從對大數據的現在和未來去洞悉大數據的發展趨勢;從大數據隱私這個特別而重要的視角審視人和數據之間的久長博弈。

第2層面是技術,技術是大數據價值體現的手段和前進的基石。我將分別從云計算、散布式處理技術、存儲技術和感知技術的發展來講明大數據從收集、處理、存儲到構成結果的全部進程。

第3層面是實踐,實踐是大數據的終究價值體現。我將分別從互聯網的大數據,政府的大數據,企業的大數據和個人的大數據4個方面來描繪大數據已展現的美好景象及行將實現的藍圖。

 和大數據相干的理論

? 特點定義

最早提出大數據時期到來的是麥肯錫:“數據,已滲透到現今每個行業和業務職能領域,成為重要的生產因素。人們對海量數據的發掘和應用,預示著新1波生產率增長和消費者盈余浪潮的到來。”

業界(IBM 最早定義)將大數據的特點歸納為4個“V”(量Volume,多樣Variety,價值Value,速Velocity),或說特點有4個層面:第1,數據體量巨大。大數據的起始計量單位最少是P(1000個T)、E(100萬個T)或Z(10億個T);第2,數據類型繁多。比如,網絡日志、視頻、圖片、地理位置信息等等。第3,價值密度低,商業價值高。第4,處理速度快。最后這1點也是和傳統的數據發掘技術有著本質的不同。

其實這些V其實不能真正說清楚大數據的所有特點,下面這張圖對大數據的1些相干特性做出了有效的說明。

36大數據

古語云:3分技術,7分數據,得數據者得天下。先不論誰說的,但是這句話的正確性已不用去論證了。維克托·邁爾-舍恩伯格在《大數據時期》1書及第了百般例證,都是為了說明1個道理:在大數據時期已到來的時候要用大數據思惟去發掘大數據的潛伏價值。書中,作者提及最多的是Google如何利用人們的搜索記錄發掘數據2次利用價值,比如預測某地流感爆發的趨勢;Amazon如何利用用戶的購買和閱讀歷史數據進行有針對性的書籍購買推薦,以此有效提升銷售量;Farecast如何利用過去10年所有的航線機票價格打折數據,來預測用戶購買機票的時機是不是適合。

那末,甚么是大數據思惟?維克托·邁爾-舍恩伯格認為,1-需要全部數據樣本而不是抽樣;2-關注效力而不是精確度;3-關注相干性而不是因果關系。

阿里巴巴的王堅對大數據也有1些獨特的見解,比如,

“今天的數據不是大,真正成心思的是數據變得在線了,這個恰正是互聯網的特點。”
“非互聯網時期的產品,功能1定是它的價值,今天互聯網的產品,數據1定是它的價值。”
“你千萬不要想著拿數據去改進1個業務,這不是大數據。你1定是去做了1件之前做不了的事情。”

特別是最后1點,我是非常認同的,大數據的真正價值在于創造,在于彌補無數個還未實現過的空白。

有人把數據比喻為蘊藏能量的煤礦。煤炭依照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的發掘本錢又不1樣。與此類似,大數據其實不在“大”,而在于“有用”。價值含量、發掘本錢比數量更加重要。

? 價值探討

大數據是甚么?投資者眼里是金光閃閃的兩個字:資產。比如,Facebook上市時,評估機構評定的有效資產中大部份都是其社交網站上的數據。

如果把大數據比作1種產業,那末這類產業實現盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。

Target 超市以20多種懷孕期間孕婦可能會購買的商品為基礎,將所有用戶的購買記錄作為數據來源,通過構建模型分析購買者的行動相干性,能準確的推斷出孕婦的具體臨盆時間,這樣Target的銷售部門就能夠有針對的在每一個懷孕顧客的不同階段寄送相應的產品優惠卷。

Target的例子是1個很典型的案例,這樣印證了維克托·邁爾-舍恩伯格提過的1個很有指點意義的觀點:通過找出1個關聯物并監控它,就能夠預測未來。Target通過監測購買者購買商品的時間和品種來準確預測顧客的孕期,這就是對數據的2次利用的典型案例。如果,我們通過收集駕駛員手機的GPS數據,就能夠分析出當前哪些道路正在堵車,并可和時發布道路交通提示;通過收集汽車的GPS位置數據,就能夠分析城市的哪些區域停車較多,這也代表該區域有著較為活躍的人群,這些分析數據合適賣給廣告投放商。

不管大數據的核心價值是否是預測,但是基于大數據構成決策的模式已為很多的企業帶來了盈利和名譽。

從大數據的價值鏈條來分析,存在3種模式:

1- 手握大數據,但是沒有益用好;比較典型的是金融機構,電信行業,政府機構等。

2- 沒有數據,但是知道如何幫助有數據的人利用它;比較典型的是IT咨詢和服務企業,比如,埃森哲,IBM,Oracle等。

3- 既有數據,又有大數據思惟;比較典型的是Google,Amazon,Mastercard等。

未來在大數據領域最具有價值的是兩種事物:1-具有大數據思惟的人,這類人可以將大數據的潛伏價值轉化為實際利益;2-還未有被大數據觸及過的業務領域。這些是還未被發掘的油井,金礦,是所謂的藍海。

Wal-Mart作為零售行業的巨頭,他們的分析人員會對每一個階段的銷售記錄進行了全面的分析,有1次他們無意中發現雖不相干但很有價值的數據,在美國的颶風來臨季節,超市的蛋撻和抵抗颶風物品居然銷量都有大幅增加,因而他們做了1個明智決策,就是將蛋撻的銷售位置移到了颶風物品銷售區域旁邊,看起來是為了方便用戶挑選,但是沒有想到蛋撻的銷量因此又提高了很多。

還有1個有趣的例子,1948年遼沈戰役期間,司令員林彪要求每天要進行例常的“逐日軍情匯報”,由值班顧問讀出下屬各個縱隊、師、團用電臺報告確當日戰況和緝獲情況。那幾近是重復著千篇1律枯燥無味的數據:每支部隊殲敵多少、俘虜多少;緝獲的火炮、車輛多少,槍枝、物質多少……有1天,顧問照例匯報當日的戰況,林彪突然打斷他:“剛才念的在胡家窩棚那個戰役的緝獲,你們聽到了嗎?”大家都很茫然,由于如此戰役每天都有幾10起,不都是差不多1模1樣的枯燥數字嗎?林彪掃視1周,見無人回答,便接連問了3句:“為何那里緝獲的短槍與長槍的比例比其它戰役略高?”“為何那里緝獲和擊毀的小車與大車的比例比其它戰役略高?”“為何在那里俘虜和擊斃的軍官與兵士的比例比其它戰役略高?”林彪司令員大步走向掛滿軍用地圖的墻壁,指著地圖上的那個點說:“我料想,不,我判定!敵人的指揮所就在這里!”果然,部隊很快就捉住了敵方的指揮官廖耀湘,并獲得這場重要戰役的成功。

這些例子真實的反應在各行各業,探求數據價值取決于掌控數據的人,關鍵是人的數據思惟;與其說是大數據創造了價值,不如說是大數據思惟觸發了新的價值增長。

? 現在和未來

我們先看看大數據在當下有怎樣的杰出表現:

  • 大數據幫助政府實現市場經濟調控、公共衛生安全防范、災害預警、社會輿論監督;
  • 大數據幫助城市預防犯法,實現智慧交通,提升緊急應急能力;
  • 大數據幫助醫療機構建立患者的疾病風險跟蹤機制,幫助醫藥企業提升藥品的臨床使用效果,幫助艾滋病研究機構為患者提供定制的藥物;
  • 大數據幫助航空公司節省運營本錢,幫助電信企業實現售后服務質量提升,幫助保險企業辨認訛詐騙保行動,幫助快遞公司監測分析運輸車輛的故障險情以提早預警維修,幫助電力公司有效辨認預警行將產生故障的裝備;
  • 大數據幫助電商公司向用戶推薦商品和服務,幫助旅游網站為旅游者提供心儀的旅游線路,幫助2手市場的買賣雙方找到最適合的交易目標,幫助用戶找到最適合的商品購買時期、商家和最優惠價格;
  • 大數據幫助企業提升營銷的針對性,下降物流和庫存的本錢,減少投資的風險,和幫助企業提升廣告投放精準度;
  • 大數據幫助文娛行業預測歌手,歌曲,電影,電視劇的受歡迎程度,并為投資者分析評估拍1部電影需要投入多少錢才最適合,否則就有可能收不回本錢;
  • 大數據幫助社交網站提供更準確的好友推薦,為用戶提供更精準的企業招聘信息,向用戶推薦可能喜歡的游戲和合適購買的商品。

其實,這些還遠遠不夠,未來大數據的身影應當無處不在,就算沒法準確預測大數據終會將人類社會帶往到哪一種終究形態,但我相信只要發展腳步在繼續,因大數據而產生的變革浪潮將很快淹沒地球的每個角落。

比如,Amazon的終究期望是:“最成功的書籍推薦應當只有1本書,就是用戶要買的下1本書。”

Google也希望當用戶在搜索時,最好的體驗是搜索結果只包括用戶所需要的內容,而這其實不需要用戶給予Google太多的提示。

而當物聯網發展到達1定范圍時,借助條形碼、2維碼、RFID等能夠唯1標識產品,傳感器、可穿著裝備、智能感知、視頻收集、增強現實等技術可實現實時的信息收集和分析,這些數據能夠支持智慧城市,智慧交通,智慧能源,智慧醫療,智慧環保的理念需要,這些都所謂的智慧將是大數據的收集數據來源和服務范圍。

未來的大數據除將更好的解決社會問題,商業營銷問題,科學技術問題,還有1個可預感的趨勢是以人為本的大數據方針。人材是地球的主宰,大部份的數據都與人類有關,要通過大數據解決人的問題。

比如,建立個人的數據中心,將每一個人的平常生活習慣,身體體征,社會網絡,知識能力,愛好性情,疾病嗜好,情緒波動……換言之就是記錄人從誕生那1刻起的每分每秒,將除思惟外的1切都貯存下來,這些數據可以被充分的利用:

  • 醫療機構將實時的監測用戶的身體健康狀態;
  • 教育機構更有針對的制定用戶喜歡的教育培訓計劃;
  • 服務行業為用戶提供即時健康的符適用戶生活習慣的食品和其它服務;
  • 社交網絡能為你提供適合的交友對象,并為志同道合的人群組織各種集會活動;
  • 政府能在用戶的心理健康出現問題時有效的干預,防范自殺,刑事案件的產生;
  • 金融機構能幫助用戶進行有效的理財管理,為用戶的資金提供更有效的使用建議和計劃;
  • 道路交通、汽車租賃及運輸行業可以為用戶提供更適合的出行線路和路途服務安排;

……

固然,上面的1切看起來都很美好,但是不是是以犧牲了用戶的自由為條件呢?只能說當新鮮事物帶來了革新的同時也一樣帶來了“病菌”。比如,在手機未普及前,大家喜歡聚在1起聊天,自從手機普及后特別是有了互聯網,大家不用聚在1起也能夠隨時隨地的聊天,只是“病菌”滋生了另外1種情形,大家漸漸習慣了和手機共渡時光,人與人之間情感交換恍如永久隔著1張“網”。

? 大數據隱私

你也許其實不敏感,當你在不同的網站上注冊了個人信息后,可能這些信息已被分散出去了,當你稀里糊涂的接到各種郵件,電話,短信的滋擾時,你不會想到自己的電話號碼,郵箱,生日,購買記錄,收入水平,家庭住址,親朋好友等私人信息早就被各種商業機構非法存儲或賤賣給其它任何有需要的企業或個人了。

更可怕的是,這些信息你永久沒法刪除,它們永久存在于互聯網的某些你不知道的角落。除非你更換掉自己的所有信息,但是這代價太大了。

用戶隱私問題1直是大數據利用難以繞開的1個問題,如被央視暴光過的分眾無線、羅維鄧白氏和網易郵箱都觸及侵犯用戶隱私。目前,中國并沒有專門的法律法規來界定用戶隱私,處理相干問題時多采取其他相干法規條例來解釋。但隨著民眾隱私意識的日趨增強,合法合規地獲得數據、分析數據和利用數據,是進行大數據分析時必須遵守的原則。

說到隱私被侵犯,愛德華?斯諾登應當占據1席之地,這位前美國中央情報局(CIA)雇員1手引爆了美國“棱鏡計劃”(PRISM)的內幕消息。“棱鏡”項目是1項由美國國家安全局(NSA)自2007年起開始實行的絕密電子監聽計劃,年耗資近2000億美元,用于監聽全美電話通話記錄,據稱還可使情報人員通過“后門”進入9家主要科技公司的服務器,包括微軟、雅虎、谷歌、Facebook、PalTalk、美國在線、Skype、YouTube、蘋果。這個事件引發了人們對政府使用大數據時對公民隱私侵犯的擔心。

再看看我們身旁,當微博,微信,QQ空間這些社交平臺肆意的吞噬著數億用戶的各種信息時,你就不要期望你還有隱私權了,就算你在某個地方刪除,但或許這些信息已被其他人轉載或保存了,更有可能已被百度或Google存為快照,早就提供給任意用戶搜索了。
因此在大數據的背景下,很多人都在積極的抵制無底線的數字化,這類大數據和個體之間的博弈還會1直繼續下去……

專家給予了我們1些如何有效保護大數據背景下隱私權的建議:1-減少信息的數字化;2-隱私權立法;3-數字隱私權基礎設施(類似DRM數字版權管理);4-人類改變認知(接受疏忽過去);5-創造良性的信息生態;6-語境化。

但是這些都很難立即見效或有實質性的改良。

比如,現在有1種職業叫刪帖人,專門負責幫人到各大網站刪帖,刪除評論。其實這些人就是通過黑客技術侵入各大網站,破獲管理員的密碼然落后行手工定向刪除。只不過他們保護的不是客戶的隱私,而大多是丑聞。還有1種職業叫人肉專家,他們負責從互聯網上找到1個與他們根本就無關系用戶的任意信息。這是很可怕的事情,也就是說,如果有人想找到你,只需要兩個條件:1-你上過網,留下過痕跡;2-你的親朋好友或僅僅是認識你的人上過網,留下過你的痕跡。這兩個條件滿足其1,人肉專家就能夠很輕松的找到你,可能還知道你現在正在某個餐廳和誰1起共進晚飯。

當很多互聯網企業意想到隱私對用戶的重要性時,為了繼續得到用戶的信任,他們采取了很多辦法,比如google許諾僅保存用戶的搜索記錄9個月,閱讀器廠商提供了無痕沖浪模式,社交網站謝絕公共搜索引擎的爬蟲進入,并將提供出去的數據全部采取匿名方式處理等。

在這類復雜的環境里面,很多人仍然沒有建立對信息隱私的保護意識,讓自己1直處于被滋擾,被精心設計,被利用,被監視的處境中。可是,我們能做的幾近微不足道,由于個人隱私數據已沒法由我們自己掌控了,就像1首詩里說到的:“如果你現在繼續麻痹,那就別期望這麻痹能抵擋得住被”扒光”那1刻的驚駭和失望……”

 和大數據相干的技術

? 云技術

大數據常和云計算聯系到1起,由于實時的大型數據集分析需要散布式處理框架來向數10、數百或乃至數萬的電腦分配工作。可以說,云計算充當了工業革命時期的發動機的角色,而大數據則是電。

云計算思想的起源是麥卡錫在上世紀60年代提出的:把計算能力作為1種像水和電1樣的公用事業提供給用戶。

如今,在Google、Amazon、Facebook等1批互聯網企業引領下,1種行之有效的模式出現了:云計算提供基礎架構平臺,大數據利用運行在這個平臺上。

業內是這么形容二者的關系:沒有大數據的信息積淀,則云計算的計算能力再強大,也難以找到用武之地;沒有云計算的處理能力,則大數據的信息積淀再豐富,也終究只是鏡花水月。

那末大數據到底需要哪些云計算技術呢?

這里暫且羅列1些,比如虛擬化技術,散布式處理技術,海量數據的存儲和管理技術,NoSQL、實時流數據處理、智能分析技術(類似模式辨認和自然語言理解)等。

云計算和大數據之間的關系可以用下面的1張圖來講明,二者之間結合后會產生以下效應:可以提供更多基于海量業務數據的創新型服務;通過云計算技術的不斷發展下降大數據業務的創新本錢。

36大數據

如果將云計算與大數據進行1些比較,最明顯的辨別在兩個方面:

第1,在概念上二者有所不同,云計算改變了IT,而大數據則改變了業務。但是大數據必須有云作為基礎架構,才能得以順暢運營。

第2,大數據和云計算的目標受眾不同,云計算是CIO等關心的技術層,是1個進階的IT解決方案。而大數據是CEO關注的、是業務層的產品,而大數據的決策者是業務層。

? 散布式處理技術

散布式處理系統可以將不同地點的或具有不同功能的或具有不同數據的多臺計算機用通訊網絡連接起來,在控制系統的統1管理控制下,調和地完成信息處理任務—這就是散布式處理系統的定義。

以Hadoop(Yahoo)為例進行說明,Hadoop是1個實現了MapReduce模式的能夠對大量數據進行散布式處理的軟件框架,是以1種可靠、高效、可伸縮的方式進行處理的。

而MapReduce是Google提出的1種云計算的核心計算模式,是1種散布式運算技術,也是簡化的散布式編程模式,MapReduce模式的主要思想是將自動分割要履行的問題(例如程序)拆解成map(映照)和reduce(化簡)的方式, 在數據被分割后通過Map 函數的程序將數據映照成不同的區塊,分配給計算機機群處理到達散布式運算的效果,在通過Reduce 函數的程序將結果匯整,從而輸出開發者需要的結果。

再來看看Hadoop的特性,第1,它是可靠的,由于它假定計算元素和存儲會失敗,因此它保護多個工作數據副本,確保能夠針對失敗的節點重新散布處理。其次,Hadoop 是高效的,由于它以并行的方式工作,通過并行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級數據。另外,Hadoop 依賴于社區服務器,因此它的本錢比較低,任何人都可使用。

你也能夠這么理解Hadoop的構成,Hadoop=HDFS(文件系統,數據存儲技術相干)+Hbase(數據庫)+MapReduce(數據處理)+……Others

Hadoop用到的1些技術有:

  • HDFS: Hadoop散布式文件系統(Distributed File System) - HDFS (HadoopDistributed File System)
  • MapReduce:并行計算框架
  • HBase: 類似Google BigTable的散布式NoSQL列數據庫
  • Hive:數據倉庫工具,由Facebook貢獻。
  • Zookeeper:散布式鎖設施,提供類似Google Chubby的功能,由Facebook貢獻。
  • Avro:新的數據序列化格式與傳輸工具,將逐漸取代Hadoop原本的IPC機制。
  • Pig:大數據分析平臺,為用戶提供多種接口。
  • Ambari:Hadoop管理工具,可以快捷的監控、部署、管理集群。
  • Sqoop:用于在Hadoop與傳統的數據庫間進行數據的傳遞。

說了這么多,舉個實際的例子,雖然這個例子有些陳腐,但是淘寶的海量數據技術架構還是有助于我們理解對大數據的運作處理機制:

淘寶大數據

如上圖所示,淘寶的海量數據產品技術架構分為5個層次,從上至下來看它們分別是:數據源,計算層,存儲層,查詢層和產品層。

數據來源層。寄存著淘寶各店的交易數據。在數據源層產生的數據,通過DataX,DbSync和Timetunel準實時的傳輸到下面第2點所述的“云梯”。
計算層。在這個計算層內,淘寶采取的是Hadoop集群,這個集群,我們暫且稱之為云梯,是計算層的主要組成部份。在云梯上,系統每天會對數據產品進行不同的MapReduce計算。
存儲層。在這1層,淘寶采取了兩個東西,1個使MyFox,1個是Prom。MyFox是基于MySQL的散布式關系型數據庫的集群,Prom是基于Hadoop Hbase技術的1個NoSQL的存儲集群。
查詢層。在這1層中,Glider是以HTTP協議對外提供restful方式的接口。數據產品通過1個唯1的URL來獲得到它想要的數據。同時,數據查詢即是通過MyFox來查詢的。

最后1層是產品層,這個就不用解釋了。

? 存儲技術

大數據可以抽象的分為大數據存儲和大數據分析,這二者的關系是:大數據存儲的目的是支持大數據分析。到目前為止,還是兩種截然不同的計算機技術領域:大數據存儲致力于研發可以擴大至PB乃至EB級別的數據存儲平臺;大數據分析關注在最短時間內處理大量不同類型的數據集。

提到存儲,有1個著名的摩爾定律相信大家都聽過:18個月集成電路的復雜性就增加1倍。所以,存儲器的本錢大約每18⑵4個月就降落1半。本錢的不斷降落也造就了大數據的可存儲性。

比如,Google大約管理著超過50萬臺服務器和100萬塊硬盤,而且Google還在不斷的擴大計算能力和存儲能力,其中很多的擴大都是基于在便宜服務器和普通存儲硬盤的基礎上進行的,這大大下降了其服務本錢,因此可以將更多的資金投入到技術的研發當中。

以Amazon舉例,Amazon S3 是1種面向 Internet 的存儲服務。該服務旨在讓開發人員能更輕松的進行網絡范圍計算。Amazon S3 提供1個簡明的 Web 服務界面,用戶可通過它隨時在 Web 上的任何位置存儲和檢索的任意大小的數據。 此服務讓所有開發人員都能訪問同1個具有高擴大性、可靠性、安全性和快速價廉的基礎設施,Amazon 用它來運行其全球的網站網絡。再看看S3的設計指標:在特定年度內為數據元提供 99.999999999% 的耐久性和 99.99% 的可用性,并能夠承受兩個設施中的數據同時丟失。

S3很成功也確切卓有成效,S3云的存儲對象已到達萬億級別,而且性能表現相當良好。S3云已擁萬億跨地域存儲對象,同時AWS的對象履行要求也到達百萬的峰值數量。目前全球范圍內已有數以10萬計的企業在通過AWS運行自己的全部或部份平常業務。這些企業用戶遍及190多個國家,幾近世界上的每一個角落都有Amazon用戶的身影。

? 感知技術

大數據的收集和感知技術的發展是緊密聯系的。以傳感器技術,指紋辨認技術,RFID技術,坐標定位技術等為基礎的感知能力提升一樣是物聯網發展的基石。全球的工業裝備、汽車、電表上有著無數的數碼傳感器,隨時丈量和傳遞著有關位置、運動、震動、溫度、濕度乃至空氣中化學物資的變化,都會產生海量的數據信息。

而隨著智能手機的普及,感知技術可謂迎來了發展的高峰期,除地理位置信息被廣泛的利用外,1些新的感知手段也開始登上舞臺,比如,最新的”iPhone 5S”在home鍵內嵌指紋傳感器,新型手機可通過呼氣直接檢測燃燒脂肪量,用于手機的嗅覺傳感器面世可以監測從空氣污染到危險的化學藥品,微軟正在研發可感知用戶當前心情智能手機技術,谷歌眼鏡InSight新技術可通過穿著進行人物辨認。

除此以外,還有很多與感知相干的技術革新讓我們線人1新:比如,牙齒傳感器實時監控口腔活動及飲食狀態,嬰兒穿著裝備可用大數據去養育寶寶,Intel正研發3D筆記本攝像頭可追蹤眼球讀懂情緒,日本公司開發新型可監控用戶心率的紡織材料,業界正在嘗試將生物測定技術引入支付領域等。

其實,這些感知被逐步捕獲的進程就是就世界被數據化的進程,1旦世界被完全數據化了,那末世界的本質也就是信息了。

就像1句名言所說,“人類之前延續的是文明,現在傳承的是信息。”

大數據的實踐

? 互聯網的大數據

互聯網上的數據每一年增長50%,每兩年便將翻1番,而目前世界上90%以上的數據是最近幾年才產生的。據IDC預測,到2020年全球將總共具有35ZB的數據量。互聯網是大數據發展的前哨陣地,隨著WEB2.0時期的發展,人們似乎都習慣了將自己的生活通過網絡進行數據化,方便分享和記錄并回想。

互聯網上的大數據很難清晰的界定分類界限,我們先看看BAT的大數據:

百度具有兩種類型的大數據:用戶搜索表征的需求數據;爬蟲和阿拉丁獲得的公共web數據。搜索巨頭百度圍繞數據而生。它對網頁數據的爬取、網頁內容的組織和解析,通過語義分析對搜索需求的精準理解進而從海量數據中找準結果,和精準的搜索引擎關鍵字廣告,實質上就是1個數據的獲得、組織、分析和發掘的進程。搜索引擎在大數據時期面臨的挑戰有:更多的暗網數據;更多的WEB化但是沒有結構化的數據;更多的WEB化、結構化但是封閉的數據。

阿里巴巴具有交易數據和信譽數據。這兩種數據更容易變現,發掘出商業價值。除此以外阿里巴巴還通過投資等方

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: 亚洲国产一区在线二区三区 | 俺去啦五月 | 国产偷啪视频一区 | 美女网站在线观看 | 精产国品一区 | 午夜色影院 | 女男羞羞视频网站免费 | 精品一区二区三区免费站 | 爱爱三级 | 日本免费大黄在线观看 | 国产高清中文字幕 | 永久免费视频网站在线观看 | 午夜爱爱小视频 | 伊人国产在线视频 | 国产激情久久久久久影院 | 亚洲第一页中文字幕 | 中文字幕亚洲高清综合 | 亚洲欧美专区 | 欧美一欧美一区二三区性 | 欧美末成年videos在线 | 久久久久国产精品 | 96免费精品视频在线 | 中文字幕校园春色 | 无人区乱码1区2区3区mv | 中文字幕第页 | 国产欧美另类 | 宅男午夜| 欧美性xxxxxbbbbbb精品 | 国产成人久久精品麻豆二区 | 欧洲天堂网 | 91久久澡人人爽人人添 | 亚洲综合视频网 | 欧美日韩乱 | 欧美jizz18性欧美 | 欧美成人看片一区二区三区尤物 | 久久不卡| 尤物网址在线观看日本 | 欧美日本一道道一区二区三 | 欧美成人免费全部观看天天性色 | 国产 日韩 欧美 亚洲 | 成 人 a v黄 色 |