leileiya的個人博客分享 http://www.ueservicedoffices.com/u/leileiya

博文

[轉載][轉]Robust PCA

已有 7500 次閱讀 2015-12-7 11:24 |系統分類:科研筆記|文章來源:轉載

主成分分析,這種方法可以有效的找出數據中最“主要"的元素和結構,去除噪音和冗余,將原有的復雜數據降維,揭示隱藏在復雜數據背后的簡單結構。我們知道,最簡單的主成分分析方法就是PCA了。從線性代數的角度看,PCA的目標就是使用另一組基去重新描述得到的數據空間。希望在這組新的基下,能盡量揭示原有的數據間的關系。這個維度即最重要的“主元"。PCA的目標就是找到這樣的“主元”,最大程度的去除冗余和噪音的干擾。

      魯棒主成分分析(Robust PCA)考慮的是這樣一個問題:一般我們的數據矩陣X會包含結構信息,也包含噪聲。那么我們可以將這個矩陣分解為兩個矩陣相加,一個是低秩的(由于內部有一定的結構信息,造成各行或列間是線性相關的),另一個是稀疏的(由于含有噪聲,而噪聲是稀疏的),則魯棒主成分分析可以寫成以下的優化問題:

      與經典PCA問題一樣,魯棒PCA本質上也是尋找數據在低維空間上的最佳投影問題。對于低秩數據觀測矩陣X,假如X受到隨機(稀疏)噪聲的影響,則X的低秩性就會破壞,使X變成滿秩的。所以我們就需要將X分解成包含其真實結構的低秩矩陣和稀疏噪聲矩陣之和。找到了低秩矩陣,實際上就找到了數據的本質低維空間。那有了PCA,為什么還有這個Robust PCA呢?Robust在哪?因為PCA假設我們的數據的噪聲是高斯的,對于大的噪聲或者嚴重的離群點,PCA會被它影響,導致無法正常工作。而Robust PCA則不存在這個假設。它只是假設它的噪聲是稀疏的,而不管噪聲的強弱如何。

      由于rank和L0范數在優化上存在非凸和非光滑特性,所以我們一般將它轉換成求解以下一個松弛的凸優化問題:

      說個應用吧?紤]同一副人臉的多幅圖像,如果將每一副人臉圖像看成是一個行向量,并將這些向量組成一個矩陣的話,那么可以肯定,理論上,這個矩陣應當是低秩的。但是,由于在實際操作中,每幅圖像會受到一定程度的影響,例如遮擋,噪聲,光照變化,平移等。這些干擾因素的作用可以看做是一個噪聲矩陣的作用。所以我們可以把我們的同一個人臉的多個不同情況下的圖片各自拉長一列,然后擺成一個矩陣,對這個矩陣進行低秩和稀疏的分解,就可以得到干凈的人臉圖像(低秩矩陣)和噪聲的矩陣了(稀疏矩陣),例如光照,遮擋等等。至于這個的用途,你懂得。


This website provides MATLAB packages to solve the RPCA optimization problem by different methods. All of the codes are Copyright 2009 Perception and Decision Lab, University of Illinois at Urbana Champaign, and Microsoft Research Asia, Beijing. (For more information: http://perception.csl.illinois.edu/matrix-rank/sample_code.html)



http://www.ueservicedoffices.com/blog-918667-941588.html

上一篇:來美一年感受
下一篇:參加2016年JCDL會議有感

1 范圣潔

該博文允許注冊用戶評論 請點擊登錄 評論 (0 個評論)

數據加載中...
掃一掃,分享此博文

Archiver|手機版|科學網 ( 京ICP備14006957 )

GMT+8, 2019-7-18 13:11

Powered by ScienceNet.cn

Copyright © 2007- 中國科學報社

返回頂部
时时彩平台