基于B/S模式的客流預測系統的設計與實現
1 引言
在信息飛速發展的今天,我國各行各業都不同程度地推行了辦公自動化,各種管理信息系統層出不窮。但是許多管理軟件仍然停留在面向當前工作數據流的控制、報表的自動生成和打印輸出以及簡單的統計分析方面。而隨著數據挖掘理念的提出,也給管理信息系統帶來了新的發展空間。如何更有效地提取有用的信息資源,發掘其內在的規律性,探索出有價值的發展趨勢,是適應市場需求、提高科學管理水平和領導決策能力的關鍵。
針對我國目前我國鐵路運輸中的客票預定體系的還相當不完善的現狀,特別是在節假日期間,出行人數相對平時有明顯增加,給客運工作帶來很多不可預知的困難。如果能深入這部分的研究,為鐵路局開發出一套方便有效的客流預測系統,對每年各個時期的旅客人數做出較為準確的預測,最大可能地滿足旅客的乘車需求,對于鐵路運輸的建設與發展具有重大意義。
客運量定量預測的方法較多,大體上可分為相關模型預測法和時間模型預測法。相關模型預測法是找出影響客流量的因素(即相關因素),以這些因素為自變量、客流量為因變量建立函數關系,得出模型進行預測。時間模型預測法是以時間為自變量建立模型進行客流量預測。
在相關模型預測法中,影響客流量的因素很多,有經濟發展水平、人口、旅游業等,這些因素之間有錯綜復雜的關系,難以確定單個因素對客流量的影響,導致預測存在某些誤差。
時間模型如季節模型,表現為客流因季節不同而有顯著變化。例如在節假日及寒暑假期間,旅行人數激增,等級較低席位需求遠遠多于平常。由于季節性的變化,使得訂票需求呈不穩定的變化,但每年的同一時間點,有相同的變動方向、甚至相同的變動幅度,時間序列呈周期性的波動。
然而,另一方面,由于任何現象從一個時期到另一個時期的運動,總是受到諸多因素的影響,其中有些因素的影響不是瞬間即逝的,而是持續相當長的時間。就鐵路客運自身來考慮,隨時間的不同,在其前后時間的數值之間也表現出一定的依賴關系。
2 建立模型
目前,南昌鐵路局在客流分析和統計上的工作尚未開展,他們所具有的數據以紙質材料的形式存放。為了實現客流分析的自動化和客流預測功能,該軟件系統選擇了客流的幾個重要的指標進行分析和預測,如各站上車人數、各站下車人數、各站到終點人數、車內人數。這種分析的意義在于為車廂的調配和旅客的分流提供了預報。該軟件系統的開發和研制將使南昌鐵路局在客流分析方面得到一個突破性的進展。
由于平時,即非常假日期間。連續幾天內的客流量相差不大,考慮采用指數平滑法進行相鄰幾天的客流預測。指數平滑法是一種加權移動平均的預測方法,這種方法適用于短近趨勢的預測。他的原理是任一期的指數平滑值都是上一期以及其以前各期實際數值的加權平均數,隨著時間的進展,所平均的項數就不斷地增加,同時遠期數值的權數迅速減小。既體現了重視近期數據的思想.也用到了老的平滑值,可以一定程度地抵掉新信息中包括的隨機干擾,起到了平滑數據、顯示規律的作用。
而在節假日期間及寒暑假期間,旅行人數激增,等級較低席位需求遠多于平常。與相鄰時段的客流量比較在曲線上有較大的起伏,但相對于歷年的同一時段,具有相似的波動幅度。針對這一特性,采用季節水平模型進行預測。
季節水平模型:
yt=y*ft (2)
式中,y可以是預測期前兩年的某個時間段的平均水平,也可以是已知年份所有數據日的平均水平。ft稱為季節指數或季節系數,他表示季節變動的數量狀態,ft=同日平均數/已知年份日總平均數。由于在一段時間內的不確定因素很多,模型(2)只考慮縱向歷年同一時間點客流量的變化,未考慮這段時間前內前幾天客流變化對后幾天的影響,還需根據前幾天的實際值對未來天數的預測值做出修正。
如果第i天的實際值比該天的預測值大,則修正后的預測曲線在第i天之前部分已為實際值,不發生變化;在第i天之后與第i天接近的部分受這一不確定因素影響較大,應向上做相應偏移。而與第i天相距較遠的部分受其影響較小,基本不發生變化。這種變動情況符合負指數曲線。

3 預測系統的體系結構
該系統設計為browser/server結構.用戶通過瀏覽器向分布在網絡上的服務器發出請求。他以tcp/ip協議為基礎,以web為核心應用,構成統一和方便的信息交換平臺,既可以與internet互聯,又可單獨使用,具有很大的靈活性。采用b/s結構簡化了客戶機的管理工作,客戶機上只需安裝配置少量的客戶端軟件。服務器將負擔較多的工作,對數據庫的訪問和預測程序的執行將在服務器上完成。
典型的基于b/s應用系統的3層結構模型包括表示層(presentation)、應用邏輯層(businesslogic)和數據服務層(data)。用java技術開發的鐵路預測系統的3層體系結構如圖1所示。第1層(表示層)包括javaapplet和瀏覽器;第2層(應用邏輯層)為預測服務器和web服務器;第3層(數據服務層)為數據庫服務器。第1層與第2層的通信采用http和socket技術,第2層與第3層的通信采用基于jdbc一odbc的數據庫連接池技術。

4 數據庫同步控制
由于該客流預測系統的服務對象只是鐵路局的領導和部分決策人員,他是整個鐵路營運信息系統的一部分。出于安全的考慮,采用內網和外網2個子系統,分別對應不同的web服務器和數據庫服務器。使用外網的為普通用戶,實現的服務內容為一般的數據錄入、資料查詢和三維統計等。為了提高存取速度,更重要的是保證數據的完整性.外網的數據庫服務器采用磁盤陣列技術。由于外網上的數據是實時更新的,比如各個車次的上車人數、下車人數、到終點人數和往返客票進款等,這些都是執行預測所需要的原始數據,于是很重要的一部分工作就是保持2個系統數據的完整性、一致性和安全性。
為此,設計了數據庫的實時更新功能,實現定期地將原始數據導入到預測系統所需的運行數據庫中,用戶可以自定義數據庫的更新周期,一般為l~2天。并且定在夜間執行。這樣既保證了預測系統對于數據的實時更新,又保證了內部資源的安全訪問。
5 結語
針對我國客流量變化的特點,選取適當的客流指標建立正確的預測模型是提高預測結果可靠性的關鍵。由于我國在各個時期的客流量有著不同的變化規律,提出了基于不同的影響因素建立不同的預測模型,使預測效果得到了顯著的提高,對于鐵路運輸的建設與發展具有重大意義。
評論