<fieldset id="wiwyo"></fieldset>

<del id="wiwyo"></del>

<ul id="wiwyo"></ul>

<ul id="wiwyo"></ul>

<tfoot id="wiwyo"></tfoot>

博客專欄

EEPW首頁 > 博客 > 線性回歸：不能忽視的三個問題

線性回歸：不能忽視的三個問題

發布人：數據派THU 時間：2023-08-04 來源：工程師

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

發布文章

前言

線性回歸是比較簡單的機器學習算法，很多書籍介紹的第一種機器學習算法就是線性回歸算法，筆者查閱的中文書籍都是給出線性回歸的表達式，然后告訴你怎么求參數最優化，可能部分同學會忽視一些問題，至少筆者忽視了。因此，本文重點介紹了平常容易忽視的三類問題，（1）線性回歸的理論依據是什么（2）過擬合意味著什么（3）模型優化的方向。

目錄

1、線性回歸的理論依據是什么

2、過擬合意味著什么

3、模型優化的方向

4、總結

線性回歸的理論依據

泰勒公式

若函數f(x)在包含x0的某個閉區間[a,b]上具有n階導數，且在開區間(a,b)上具有(n+1)階導數，則對閉區間[a,b]上任意一點x，成立下式：

結論：對于區間[a,b]上任意一點，函數值都可以用兩個向量內積的表達式近似，其中

是基函數（basis function），是相應的系數。

高階表達式表示兩者值的誤差（請回想您學過的線性回歸表達式）。

傅里葉級數

周期函數f(x)可以用向量內積近似，表示基函數，表示相應的系數，表示誤差。

線性回歸

由泰勒公式和傅里葉級數可知，當基函數的數量足夠多時，向量內積無限接近于函數值。線性回歸的向量內積表達式如下：

過擬合問題

過擬合定義

構建模型的訓練誤差很小或為0，測試誤差很大，這一現象稱為過擬合。

高斯噪聲數據模型

我們采集的樣本數據其實包含了噪聲，假設該噪聲的高斯噪聲模型，均值為0，方差為。

若樣本數據的標記為y1，理論標記為y，噪聲為η，則有：

y1 = y + η，（其中，η是高斯分布的抽樣）

上節的線性回歸表達式的方差表示的意義是噪聲高斯分布的隨機抽樣，書本的線性回歸表達式把方差也包含進去了。

過擬合原因

數學術語：當基函數的個數足夠大時，線性回歸表達式的方程恒相等。

如下圖：

機器學習術語：模型太過復雜以致于把無關緊要的噪聲也學進去了。

當線性回歸的系數向量間差異比較大時，則大概率設計的模型處于過擬合了。用數學角度去考慮，若某個系數很大，對于相差很近的x值，結果會有較大的差異，這是較明顯的過擬合現象。

過擬合的解決辦法是降低復雜度，后期會有相應的公眾號文章，請繼續關注。

模型的優化方向

模型的不同主要是體現在參數個數，參數大小以及正則化參數λ，優化模型的方法是調節上面三個參數（但不僅限于此，如核函數），目的是找到最優模型。

總結

本文通過泰勒公式和傅里葉級數的例子說明線性回歸的合理性，線性回歸表達式包含了方差項，該方差是高斯噪聲模型的隨機采樣，若訓練數據在線性回歸的表達式恒相等，那么就要考慮過擬合問題了，回歸系數間差異比較大也是判斷過擬合的一種方式。模型優化的方法有很多種，比較常見的方法是調節參數個數，參數大小以及正則化參數λ。

參考：Christopher M.Bishop <<Pattern Reconition and Machine Learning>>

*博客內容為網友個人發布，僅代表博主個人觀點，如有侵權請聯系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： AI

相關推薦

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

Nvidia的CEO談AI的未來：“我們將需要三臺電腦... 一臺來創建AI... 一臺來模擬AI... 一臺來運行AI”

智能計算 AI | 2024-07-31

國際奧委會：最大限度發揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會體育 | 2024-07-26

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過 Meta AI 模型安全系統

智能計算 Meta AI | 2024-07-31

2021春晚黑科技，火爆全網的\"打工牛\"是什么來頭？

視頻 AI 機器人 | 2021-02-26

CSR8670CSR8675智能語音Alexa藍牙方案開發

資源下載 AI 智能語音 | 2017-12-14

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

“破局AI開發，釋放邊緣算力開發者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

加大調整力度，教育部支持高校布局集成電路、AI 等專業

智能計算教育 AI 集成電路 | 2024-07-25

蘋果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋果 AI 谷歌定制芯片 | 2024-07-30

EEPW2018年3月刊(工業物聯網)

資源下載工業物聯網 AI | 2018-03-12

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

摩根士丹利：僅 GB200 AI 服務器業務，就為英偉達創造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

萬家樂JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬家樂 | 2013-01-17

繼上次海聯達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

WTC-AI太陽能熱水器電路圖

設計方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

海聯達（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

大嘴業話-AI目前市場分析

視頻人工智能，AI，ChatGPT，互聯網技術 | 2023-04-25

瑞薩電子AI單元解決方案成功提高GE醫療（日本）日野工廠的生產力

winni945 | 2018-09-12

WTC-AI型太陽能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

蘋果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

如何快速搭建手寫體識別演示系統

視頻 digikey AI 手寫體識別 | 2022-07-29

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

iPhone 16將不會預裝AI功能？計劃通過iOS 18.1發布

iPhone AI iOS | 2024-07-30

AI驅動的嵌入式聲音和振動識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

AI+機器視覺成趨勢，圖文詳解N大應用場景

智能計算安森美 AI 機器視覺 | 2024-07-31

釋說芯語16：硬科技：構建企業未來之路（附PPT）

jackwang | 2018-10-22

焦點

推薦視頻

更多>>

技術專區

關閉

主站蜘蛛池模板：峡江县| 建阳市| 桦川县| 阳西县| 缙云县| 如皋市| 什邡市| 兴城市| 垫江县| 盈江县| 新绛县| 竹山县| 鹿邑县| 吉隆县| 常宁市| 潍坊市| 桐庐县| 社旗县| 农安县| 阿克苏市| 合作市| 波密县| 长葛市| 手游| 柳州市| 浙江省| 类乌齐县| 宣恩县| 丹东市| 五华县| 外汇| 铁岭市| 夏津县| 弥渡县| 阿拉尔市| 本溪市| 舒兰市| 福建省| 怀宁县| 砀山县| 苍南县|

<ul id="suysy"></ul>

<cite id="suysy"><abbr id="suysy"></abbr></cite>