多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > 互聯網 > 迭代不等于學習,聚類分析也不等于機器學習

迭代不等于學習,聚類分析也不等于機器學習

來源:程序員人生   發布時間:2014-10-19 08:00:00 閱讀次數:2737次

【編者按】機器學習的核心在于“學習”。學習能力原本用于判斷一個生命是否具有智能,而實現人工智能也必然需要機器具有學習能力,機器學習研究的目的是讓機器像人一樣,但是現在很多云計算企業包括一些初創公司利用機器學習為噱頭,這可能會讓很多人產生誤解,作者以自己親身經歷闡述了什么叫做“機器學習”,Bill Franks是Teradata的首席分析官,本文來自SmartDataCollective。


CSDN推薦:歡迎免費訂閱《Hadoop與大數據周刊》獲取更多Hadoop技術文獻、大數據技術分析、企業實戰經驗,生態圈發展趨勢。


以下為原文:

大數據規模和復雜度的增長給現有IT架構以及計算能力帶來了極大挑戰,機器學習領域的研究為處理未來更加龐大和復雜的數據提供了可能性,然而“機器學習”這個詞常常被誤用甚至濫用。

生活中,一些機器學習領域的術語被越來越多的引用,比如模式識別、無監督學習等等。近年來,機器學習被廣泛地應用到各行各業。我一直努力將許多傳統的數據挖掘和統計算法應用到機器學習,這是有益的嘗試,雖然大多數人還不太理解這些,很多時候,傳統算法被貼上新標簽以用于炒作,其中大多僅是對機器學習中的算法進行簡單分類,實際上并沒有從根本上作任何創新和改變。

機器學習研究的是怎樣用計算機模擬或實現人類學習活動,機器學習的核心在于“學習”。學習能力原本用于判斷一個生命是否具有智能,而實現人工智能也必然需要機器具有學習能力,機器學習研究的目的是讓機器像人一樣,通過外界環境的影響不斷改進機器自身的性能,一臺真正有學習能力的機器,應該做到隨著機器解決問題的增多,機器的性能或解決問題的能力不斷增強,而現在許多所謂的“機器學習”實際上不具備“學習”能力。

許多初創企業,特別是在云領域,經常宣傳自身機器學習的能力,有時候,算法是不能從用戶界面看到的,因此用戶可能無法知道界面下的算法是怎樣的運行機制。用戶可能會誤以為正在使用的某個新功能或算法已經接近人工智能,然而,如果他們知道他們花錢得到的只是一些處于早期、非常不成熟的工具,只是用來構建一個決策樹的新方式,他們會怎么想?

也許我的看法有些過時,但我一直認為相比數據挖掘,機器學習更接近人工智能。關于機器學習,我一直想得到一種可以動態自我調整并了解如何應用新規則的算法,而這有別于像k-均值聚類分析的迭代算法。可以說聚類算法每一次傳遞后都進行了“學習”并動態調整,然而,預先設定的規則并不會改變。一旦k-均值算法開始迭代,最后的答案就被注定了,即使我們當時還不知道答案是什么,開始迭代后發生的所有結果都可以按照需求手動復制。K-均值算法使用固定的規則,而且算法從來沒有“學會”用不同的方式解決問題。

與K-均值聚類算法類似,如今許多算法都被打上了機器學習標簽,其實只是多用了一些迭代,這遠遠談不上自適應或者“學習”。在高中時代,我第一次認識到真正的人工智能與一套復雜規則之間有著巨大的區別。在一次科學展覽的項目中,我為我的電腦寫了一段程序,讓電腦玩Isolation――Isolation是在8 x 6網格上進行的游戲,玩家將他們的棋子移到一個開放的空格,然后找到下一個可以移動到的空格,在你被對手困住無法移動之前,你需要先把對手困住,最先困住對方的人獲勝。

當我在玩這個游戲之前,我意識到在眾多可以選擇的空格中選擇一個會對之后的兩步或三步有戰略意義,當然直接影響到下一步行動,考慮到這點要比那些只考慮一步的人有更大的勝算。我的計算機程序利用了這樣的優勢,該程序首先確定下一步它可以移動到的空格,接著,該程序考慮除了當前的這一步,下一步還有多少種可能的行動方案,當然程序還會考慮到下下步的行動方案,最后程序會從所有可能情況中選擇一個最優的方案。

當我將我的程序放到科學展覽上演示時,大多數人都感到驚訝,可能因為很多人沒玩過這個游戲,我倒不覺得這個程序有多神奇,在我看來這就像是一個中等熟練的玩家打敗一個新手一樣,然而,很多人以為我的電腦真得有智能,特別是因為它的三個難度級別。難度級別之間的唯一區別是電腦會隨機選擇一個空格而不是選擇最佳的策略,人們認為程序背后有智能算法,事實上只是一些復雜的規則集合。

我在程序中采用了一些簡單的、重復性規則,足以使它可以在這樣一個策略游戲中打敗大多數人,然而計算機并不能真正地思考和學習,它只是需遵循我預先設定、迭代的規則。有句老話說“任何足夠先進的技術都與魔法無異”。我開始懷疑將基于規則足夠復雜的算法與人工智能或自適應機器學習區分開是不是真的很難?

判斷是不是機器學習最關鍵的還是看“機器是否具備學習能力”。其實機器學習經常被誤以為是機械學習,機械學習只是將外界環境提供的信息簡單存儲起來,沒有推理過程,通過使用復雜的、基于規則的算法給人一種“智能”的錯覺,實際上只是類似于“死記硬背”的學習方式。

真正的機器學習,不僅僅是存儲信息這么簡單,現實世界中信息包括語音信號、數字圖像等,通常都是高維數據,為了正確地理解這些數據,就需要對這些信息進行處理――降維,找出隱藏在高維數據中的低維結構。從數據分析的角度來說,機器學習過程就是數據挖掘的過程,機器通過挖掘出外界環境數據中潛在的規律,從而“理解”數據,理解外界環境,也就達到了“學習”的境界。機器學習還應該具有演繹、歸納和類比的能力,比如演繹能力中最重要的方法就是經典的三段論(大前提:學生需要學習;小前提:小明是學生;結論:小明需要學習),只需要為機器提供大前提和小前提,機器就可能給出正確的結論;而歸納能力則需要機器通過歸納求解出對事物總的概念描述,類似于人類抽象思維的能力;類比能力是演繹和推理的結合,這是機器學習最關鍵的部分,利用相似性將已存儲的信息與新事物進行匹配,檢驗相似程度,不斷更新機器已有的知識庫,以解決更多的問題。

我不明白將基于迭代規則的算法打上機器學習標簽是不是一種營銷的手段?因為有很多人只是跟風而已,他們不明白他們認為是學習和自適應的算法事實上只是一些復雜規則的集合。

原文鏈接:When Machine Learning Isn’t Learning  (編譯/毛夢琪 責編/魏偉)

以“ 云計算大數據 推動智慧中國 ”為主題的 第六屆中國云計算大會 將于5月20-23日在北京國家會議中心隆重舉辦。產業觀察、技術培訓、主題論壇、行業研討,內容豐富,干貨十足。票價優惠,馬上 報名 ! 

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: 黑人巨大粗xxxxxx | 欧美成人性色区 | 欧美深夜福利 | 哪里可以看免费毛片 | 午夜视频在线播放 | 国产成人精品本亚洲 | 超清中文乱码字幕在线观看 | 成人国产视频在线观看 | 婷婷激情丁香 | 欧美性xxxx偷拍 | 欧美一区二区在线播放 | 成人在线视频一区 | 亚洲成av人片在线观看 | 欧美在线一级精品 | 欧美日韩中文亚洲v在线综合 | 亚洲欧美在线看 | 久久久精品免费 | 免费理论片在线观看 | 免费一级肉体全黄毛片高清 | 日本亚洲国产精品久久 | 99久久免费国内精品 | 一区二区三区在线免费看 | 亚洲 欧美 国产 制服 动漫 | 国产欧美日韩综合一区二区三区 | 图片区小说区号综合区 | 国产一区二区三区免费在线视频 | 国内自拍网站 | 久久久久久一级毛片免费无遮挡 | 日韩精品一区二区三区毛片 | 日本一区二区不卡久久入口 | 毛片在线免费 | 91丨九色丨首页 | 日本天堂在线播放 | 精品久久久久久久一区二区手机版 | 波多野结衣久久 | 久久久亚洲精品视频 | 香蕉久久夜色精品国产2020 | 国产亚洲欧美另类久久久 | 在线观看免费视频片 | 成人久久久久久 | 国产精品亚洲精品日韩动图 |