非結構化海量網絡數據處理技術研究
時間矩陣同步分析算法是一種高效的同步分析算法,是最快最逼近真實數據的一種的算法。將原始數據時間以1 s為單位,以實際需要的每秒采樣率PerCyc為等分值,即將時間軸分PerCyc等分,如圖3所示。本文引用地址:http://www.104case.com/article/194778.htm
假設PerCyc為6,則在1 s內,平均提取6個時間點。以第二個時間點10為例,從圖中可以看到,某個實際的網絡數據包時間在10附近有08 s,09 s,12 s三點,那么在提取該網絡數據包的時候,比較后選擇09 s點數值為同步分析的結果數值。以此類推,對需要提取的網絡數據包在10 s點的數值都可以比較逼近獲得。
2.3 分布式應用中間件網絡數據處理
以中間件形式(Active控件等)將網絡數據包接口軟件發布在分布式網絡數據處理系統中。該系統在數據管理、海量數據并發處理和數據分發等方面滿足海量飛行試驗數據處理需求,通過基于Web的飛行試驗數據處理子系統實現對所需數據信息的訪問。如圖4所示。
(1)客戶端ActiveX根據調度服務器列表中的IP及端口號循環嘗試建立Socket通信,發出計算請求;
(2)客戶端ActiveX與調度服務器建立連接后,調度服務器經過負載均衡計算,返回給客戶端ActiveX一個計算服務器的IP及端口號;
(3)客戶端ActiveX與計算服務器建立Socket連接;
(4)客戶端ActiveX發出執行計算命令;
(5)計算服務器接收到計算命令后,啟動確定的分布式中間件執行分布式計算任務,并將狀態信息輸出到控制臺,計算服務器中的狀態監控程序用管道技術將分布式中間件的輸出作為自己的輸入,并通過Socket方式返回給客戶端ActiveX;
(6)客戶端ActiveX接收任務執行的狀態信息,顯示給用戶;
(7)當分布式中間件執行完畢,計算服務器中的狀態監控程序將最后的結果文件通過Socket傳給客戶端ActiveX;
(8)客戶端ActiveX控件將文件保存至客戶端,分布式計算結束。
3 結語
本文由面及點地對網絡化測試系統中采集記錄的網絡數據進行了深層次的理解和多視角的剖析。同時為實現對非結構化海量網絡數據進行快速分析處理,對數據處理算法和數據處理軟件集成進行了研究,從接口軟件關鍵算法設計到數據系統集成提出了解決方法。并且這些方法已經在飛行試驗海量網絡數據處理軟件的設計過程中應用,通過對飛行試驗中采集的網絡數據進行分析處理,使用這些算法的飛行試驗海量網絡數據處理軟件的處理效率滿足飛行試驗海量網絡數據處理需求,解決了在飛行試驗中的非結構海量網絡數據快速分析處理問題,為新一代機載網絡化測試系統應用于飛行試驗提供了技術保障。國外許多航空公司已經在飛行試驗中應用網絡化測試系統,對非結構海量網絡數據分析處理技術也在進行研究。
評論