探索性數據分析(EDA),你會使用嗎?
—— 探索性數據分析(EDA)及其應用
有人在發現這些特征后會迸出一些新的想法:通用電氣、埃克森美孚都是美國的企業,中國企業的表現又如何的呢?我們可以在使用“泡泡圖”的同時,在JMP中調用“數據篩選”功能就可以得到類似圖三的界面。
本文引用地址:http://www.104case.com/article/113459.htm從中可以清晰地觀察到,自2004年以來的7年間,共有392個次的中國企業登上了福布斯排行榜。雖然在數量上、市值、銷售額等經營指標上與世界頂級企業有一定差距,但以中石油Petro China、中石化Sinopec China Petroleum等位代表的一批國有大型企業發展速度很快,令世界矚目。
圖二 JMP軟件中動態泡泡圖與數據篩選的配合使用
實際上,探索性數據分析還遠遠不止這些。分析人士完全可以在數據分析的初期不受太多理論條件的束縛,充分展開想象的翅膀,多角度、多層面地對現有數據的規律進行可視化的探索,新的線索往往就會自然而然地出現了,為下一步的統計建模與預測等精細化分析奠定良好的基礎。
總之,探索性數據分析強調靈活地探求線索和證據,重在發現數據中可能隱藏著的有價值的信息,比如數據的分布模式、變化趨勢,可能的交互影響,異常變化等等,而傳統的統計方法則側重于評估已經發現的證據,通常要求分析人員具備一定的統計學基礎。根據不同的業務目的和數據資源選用不同的技術,或者綜合使用這兩類技術,將會使我們更快地獲得更多的發現。對于大都不具備統計學功底但數據分析任務卻越來越多的企業人員(如市場分析人員、質量管理人員等)來說,重視、學習并用好探索性數據分析往往能事半功倍。
評論