機器學習的基礎圖表!(1)
來源:機器之心、深度學習愛好者
[ 導讀 ] 四大會計師事務所之一的普華永道(PwC)發布了多份解讀機器學習基礎的圖表,其中介紹了機器學習的基本概念、原理、歷史、未來趨勢和一些常見的算法。為便于讀者閱讀,我們對這些圖表進行了編譯和拆分,分三大部分對這些內容進行了呈現,希望能幫助你進一步擴展閱讀。
一、機器學習概覽
1. 什么是機器學習?
機器通過分析大量數據來進行學習。比如說,不需要通過編程來識別貓或人臉,它們可以通過使用圖片來進行訓練,從而歸納和識別特定的目標。
2. 機器學習和人工智能的關系
機器學習是一種重在尋找數據中的模式并使用這些模式來做出預測的研究和算法的門類。機器學習是人工智能領域的一部分,并且和知識發現與數據挖掘有所交集。
3. 機器學習的工作方式
①選擇數據:將你的數據分成三組:訓練數據、驗證數據和測試數據。
②模型數據:使用訓練數據來構建使用相關特征的模型。
③驗證模型:使用你的驗證數據接入你的模型。
④測試模型:使用你的測試數據檢查被驗證的模型的表現。
⑤使用模型:使用完全訓練好的模型在新數據上做預測。
⑥調優模型:使用更多數據、不同的特征或調整過的參數來提升算法的性能表現。
4. 機器學習所處的位置
①傳統編程:軟件工程師編寫程序來解決問題。首先存在一些數據→為了解決一個問題,軟件工程師編寫一個流程來告訴機器應該怎樣做→計算機遵照這一流程執行,然后得出結果。
②統計學:分析師比較變量之間的關系。
③機器學習:數據科學家使用訓練數據集來教計算機應該怎么做,然后系統執行該任務。首先存在大數據→機器會學習使用訓練數據集來進行分類,調節特定的算法來實現目標分類→該計算機可學習識別數據中的關系、趨勢和模式。
④智能應用:智能應用使用人工智能所得到的結果,如圖是一個精準農業的應用案例示意,該應用基于無人機所收集到的數據。
5. 機器學習的實際應用
機器學習有很多應用場景,這里給出了一些示例,你會怎么使用它?
快速三維地圖測繪和建模:要建造一架鐵路橋,PwC 的數據科學家和領域專家將機器學習應用到了無人機收集到的數據上。這種組合實現了工作成功中的精準監控和快速反饋。
增強分析以降低風險:為了檢測內部交易,PwC 將機器學習和其它分析技術結合了起來,從而開發了更為全面的用戶概況,并且獲得了對復雜可疑行為的更深度了解。
預測表現最佳的目標:PwC 使用機器學習和其它分析方法來評估 Melbourne Cup 賽場上不同賽馬的潛力。
二、機器學習的演化
幾十年來,人工智能研究者的各個「部落」一直以來都在彼此爭奪主導權。現在是這些部落聯合起來的時候了嗎?他們也可能不得不這樣做,因為合作和算法融合是實現真正通用人工智能(AGI)的唯一方式。這里給出了機器學習方法的演化之路以及未來的可能模樣。
1. 五大流派
①符號主義:使用符號、規則和邏輯來表征知識和進行邏輯推理,最喜歡的算法是:規則和決策樹
②貝葉斯派:獲取發生的可能性來進行概率推理,最喜歡的算法是:樸素貝葉斯或馬爾可夫
③聯結主義:使用概率矩陣和加權神經元來動態地識別和歸納模式,最喜歡的算法是:神經網絡
④進化主義:生成變化,然后為特定目標獲取其中最優的,最喜歡的算法是:遺傳算法
⑤Analogizer:根據約束條件來優化函數(盡可能走到更高,但同時不要離開道路),最喜歡的算法是:支持向量機
2. 演化的階段
1980 年代
主導流派:符號主義
架構:服務器或大型機
主導理論:知識工程
基本決策邏輯:決策支持系統,實用性有限
1990 年代到 2000 年
主導流派:貝葉斯
架構:小型服務器集群
主導理論:概率論
分類:可擴展的比較或對比,對許多任務都足夠好了
2010 年代早期到中期
主導流派:聯結主義
架構:大型服務器農場
主導理論:神經科學和概率
識別:更加精準的圖像和聲音識別、翻譯、情緒分析等
3. 這些流派有望合作,并將各自的方法融合到一起
2010 年代末期
主導流派:聯結主義+符號主義
架構:許多云
主導理論:記憶神經網絡、大規模集成、基于知識的推理
簡單的問答:范圍狹窄的、領域特定的知識共享
2020 年代+
主導流派:聯結主義+符號主義+貝葉斯+……
架構:云計算和霧計算
主導理論:感知的時候有網絡,推理和工作的時候有規則
簡單感知、推理和行動:有限制的自動化或人機交互
2040 年代+
主導流派:算法融合
架構:無處不在的服務器
主導理論:最佳組合的元學習
感知和響應:基于通過多種學習方式獲得的知識或經驗采取行動或做出回答
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。