新聞中心

        人工智能之PCA算法

        作者: 時(shí)間:2018-06-19 來(lái)源:網(wǎng)絡(luò) 收藏

          前言:機(jī)器學(xué)習(xí)有關(guān)算法內(nèi)容,之機(jī)器學(xué)習(xí)主要有三大類:1)分類;2)回歸;3)聚類。今天我們重點(diǎn)探討一下算法。

        本文引用地址:http://www.104case.com/article/201806/381803.htm

          (主成分分析)是十大經(jīng)典機(jī)器學(xué)習(xí)算法之一。是Pearson在1901年提出的,后來(lái)由Hotelling在1933年加以發(fā)展提出的一種多變量的統(tǒng)計(jì)方法。



          對(duì)于維數(shù)比較多的數(shù)據(jù),首先需要做的事就是在盡量保證數(shù)據(jù)本質(zhì)的前提下將數(shù)據(jù)中的維數(shù)降低。降維是一種數(shù)據(jù)集預(yù)處理技術(shù),往往在數(shù)據(jù)應(yīng)用在其他算法之前使用,它可以去除掉數(shù)據(jù)的一些冗余信息和噪聲,使數(shù)據(jù)變得更加簡(jiǎn)單高效,從而實(shí)現(xiàn)提升數(shù)據(jù)處理速度的目的,節(jié)省大量的時(shí)間和成本。降維也成為了應(yīng)用非常廣泛的數(shù)據(jù)預(yù)處理方法。目前處理降維的技術(shù)有很多種,如SVD奇異值分解,主成分分析(PCA),因子分析(FA),獨(dú)立成分分析(ICA)等。今天重點(diǎn)介紹主成分分析(PCA)。



          PCA(主成分分析)算法目的是在“信息”損失較小的前提下,將高維的數(shù)據(jù)轉(zhuǎn)換到低維,通過(guò)析取主成分顯出的最大的個(gè)別差異,也可以用來(lái)削減回歸分析和聚類分析中變量的數(shù)目,從而減小計(jì)算量。

          PCA(主成分分析)通常用于高維數(shù)據(jù)集的探索與可視化,還可以用于數(shù)據(jù)壓縮,數(shù)據(jù)預(yù)處理等。

          PCA算法概念:

          PCA(PrincipalComponent Analysis)主成分分析,也稱為卡爾胡寧-勒夫變換(Karhunen-Loeve Transform),是一種用于探索高維數(shù)據(jù)結(jié)構(gòu)的技術(shù)。

          PCA是一種較為常用的降維技術(shù),PCA的思想是將維特征映射到維上,這維是全新的正交特征。這維特征稱為主元,是重新構(gòu)造出來(lái)的維特征。在PCA中,數(shù)據(jù)從原來(lái)的坐標(biāo)系轉(zhuǎn)換到新的坐標(biāo)系下,新的坐標(biāo)系的選擇與數(shù)據(jù)本身是密切相關(guān)的。第一個(gè)新坐標(biāo)軸選擇的是原始數(shù)據(jù)中方差最大的方向,第二個(gè)新坐標(biāo)軸選擇和第一個(gè)坐標(biāo)軸正交且具有最大方差的方向。該過(guò)程一直重復(fù),重復(fù)次數(shù)為原始數(shù)據(jù)中特征的數(shù)目。大部分方差都包含在最前面的幾個(gè)新坐標(biāo)軸中。因此,可以忽略余下的坐標(biāo)軸,即對(duì)數(shù)據(jù)進(jìn)行降維處理。




        上一頁(yè) 1 2 下一頁(yè)

        關(guān)鍵詞: 人工智能 PCA

        評(píng)論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 阿拉善左旗| 绥化市| 淳安县| 昌图县| 农安县| 甘谷县| 乌拉特前旗| 永修县| 武穴市| 仲巴县| 迭部县| 巴林左旗| 类乌齐县| 泽库县| 安多县| 平定县| 岳普湖县| 新郑市| 莲花县| 东港市| 萨迦县| 简阳市| 菏泽市| 北宁市| 武宣县| 利津县| 达日县| 进贤县| 石嘴山市| 云梦县| 石泉县| 丰镇市| 来宾市| 中西区| 方正县| 南昌市| 灵山县| 海口市| 五家渠市| 承德市| 齐齐哈尔市|