新聞中心

        EEPW首頁 > 業(yè)界動態(tài) > ML(機器學習):輕松理解回歸觀念

        ML(機器學習):輕松理解回歸觀念

        作者:高煥堂(臺灣銘傳大學、長庚大學 教授) 時間:2021-03-30 來源:電子產品世界 收藏


        本文引用地址:http://www.104case.com/article/202103/424018.htm

        1   簡單的回歸觀念

        當今主流的AI 是機器學習(ML)。這種AI 的主要能力之一就是:從復雜的數據里探索潛在的規(guī)律?;镜母怕屎突貧w分析觀念,就是AI/ 機器學習探索規(guī)律的基礎技術。例如,有一群二維的數據點,有一條最具有代表性的直線:X*W+B=Y。在統計學上,這條線通稱為:回歸(Regression) 線。其中,X[ ] 和Y[ ] 值是已知的,而W 和B 是未知的,如圖1。

        1617157575361881.png

        圖1

        所謂“回歸分析”就是找尋最棒的W 和B 值。就得到這條線了。從上圖的Excel 畫面里,按下“尋找規(guī)律”按鈕,就會進行回歸分析,找出最適合的W和B 值,并輸出如圖2。

        1617157597930770.png

        圖2

        剛才的回歸分析已經找出最棒的W 和B 值了,也就是找到最具代表性的回歸曲線了。于是就繪出圖形如圖3。

        1617157617694880.png

        圖3

        這一條線就是X*1.3+3.3=Y 線性方程式的圖形表示。接下來,就拿圖3 里的“test data”來進行預測(Predict)。現在,請按下“Predict”,就拿新數據X 來預測出對應的E(Y/X) 值,如圖4。

        1617157633581259.png

        圖4

        這兩筆資料,就會對映到這回歸線上的兩個點,如圖5。

        這就意味著, 我們已知X 值為:1.5, 經由X*1.3+3.3=Y 線性方程式來計算出Y 值為:5.25。這就是一種預測的方法。

        1617157670882067.png

        圖5

        2   邏輯回歸

        一樣使用線性回歸:X*W+B=Y。將得出的Y 值,經由Sigmoid() 函數,可以計算出條件概率P(Y/X) 值。這是機器學習的二元分類的標準做法。例如,有7 瓶水,其攝氏溫度分別是:[-5,-2,-1,2,3,4,6]。此時人們常常將之區(qū)分為兩個類別:水與冰。就把這X 值和P(Y/X) 值,呈現于Excel 上,如圖6。

        1617157708833632.png

        圖6

        其數據的意義是:依據人們日常生活中的經驗,第1 瓶溫度是-5℃,有95% 的概率是屬于“冰”類。再如最后一瓶的溫度是6℃,有95% 的概率是屬于“水”類?,F在,可以按下“尋找規(guī)律”,就進行回歸分析,找出最棒的W 和B 值,如圖7。

        1617157725607719.png

        圖7

        就得到了線性方程式:X*0.689393699-0.071644135=Y。于是就繪出圖形如圖8。

        1617157755504798.png

        圖8

        這條直線就是AI 機器學習里,常常聽到的:分類線。只要經有Sigmoid() 函數進行轉換,就成為S 型的回歸曲線了。接著,按下“Sigmoid 圖”,就由Sigmoid()激活函數轉換,將直線轉換成為曲線,并繪出圖形如圖9。

        1617157774670507.png

        圖9

        因為Sigmoid() 函數能從線性公式計算出來Y 值轉換成為P(Y/X) 概率值。因此,這條曲線成為上述(Excel里) 數據的最佳代表曲線( 即回歸線)。這時候,就把7個瓶子區(qū)分為兩類了,如圖10。

        1617157793675102.png

        圖10

        于是您就可以了解了,AI/ 機器學習就是,通過這樣來一堆數據進行分門別類,簡稱為:分類(Classification)。剛才的回歸分析已經找出最棒的W 和B 值了,然后經由Sigmoid() 轉換,而找到最具代表性的回歸曲線。接下來,就能給予新的數據X,如圖11。

        1617157820437761.png

        圖11

        現在,按下“Predict”,就會通過這條回歸曲線而計算( 預測) 出相對應的P(Y/X) 條件概率值。如圖12。

        1617157847832093.png

        圖12

        其中,先計算:X*W+B=Y,得到了Y 值。再將Y值經由sigmoid() 函數計算出P(Y/X) 值。并且繪出圖形,如圖13。

        1617157871273695.png

        圖13

        以上說明了,我們先提供7 筆訓練數據(Training Data),按下“尋找規(guī)律”來進行訓練( 即回歸分析),找出最棒的W 和B 值。然后,拿5 筆新數據來(Test Data) 來進行分類,果然完美地分類了。

        現在,可以按下“繪圖P(Y= 兔/X)”,就會把各P(Y/X) 條件概率值繪出于一條數值線( 即一維空間),如圖14。

        1617157894927642.png

        圖14

        以上的X 只含有一個特征值。下一期里,將會說明多個特征值的例子。

        (注:本文來源于科技期刊《電子產品世界》2021年第2期,歡迎您寫論文時引用,并注明出處。)



        關鍵詞: 202102

        評論


        相關推薦

        技術專區(qū)

        關閉
        主站蜘蛛池模板: 乐陵市| 西平县| 当雄县| 永昌县| 尼玛县| 广灵县| 革吉县| 和田市| 嫩江县| 雷波县| 尼玛县| 时尚| 临颍县| 合山市| 尼木县| 米易县| 武威市| 桑日县| 黄石市| 武义县| 中超| 米易县| 龙泉市| 铜山县| 靖边县| 武平县| 东港市| 鄯善县| 荥阳市| 松原市| 琼海市| 普洱| 胶州市| 阜平县| 济阳县| 雷州市| 长宁县| 华阴市| 府谷县| 梁河县| 班戈县|