基于乘客需求的站務管理平臺系統設計研究
0 引言
站務管理平臺的設計與開發離不開對乘客需求的分析和挖掘,北京地鐵熱線是北京地鐵與乘客之間的重要溝通渠道,每年都會積累大量乘客留言信息,這些信息往往會暴露出運營過程中存在的不足,并可進一步發掘出乘客的潛在服務需求。因此,對于乘客需求的挖掘,將有助于精確地定位站務管理平臺系統的功能,使系統更加符合乘客的實際需要。
從現有文獻可知,對于乘客的需求挖掘方法,通常采取乘客調研的方式——請乘客填寫調研問卷或進行訪談,這種方法的優點是獲取的信息較為全面,缺點是需求挖掘不夠深入,并且由于調研問題的限制,一些需求點容易被忽略。通過乘客建議文本挖掘乘客需求是對乘客調研的補充和替代,乘客主動提出的建議能夠反映出乘客真實可靠的需求。
1 乘客需求挖掘關鍵技術
本文通過主題模型方法對乘客需求進行挖掘。首先,將乘客建議文本由非結構化數據通過文本預處理方法轉變為結構化的數據,并去除掉停用詞及干擾詞,生成分析語料;其次,將語料導入到主題模型當中,生成主題分類結果及主題關鍵詞;最后,通過領域經驗根據關鍵詞生成最終分類結果。
1.1 LDA模型
LDA(Latent Dirichlet Allocation)主題模型由David M Blei提出,屬于自然語言處理中主題挖掘的典型模型,是基于概率圖的三層貝葉斯概率生成模型。LDA主題模型的主要思想是假設文檔集中的每個文檔均由多個主題混合而成,每個主題是固定詞表上多個詞匯的多項式分布,目的在于采用高效的概率推斷算法處理大規模數據,從文本語料庫中抽取潛在的主題,提供一種量化研究主題的方法。該方法目前已經被廣泛應用到各類主題發現中,如熱點挖掘、主題演化、趨勢預測等。
LDA模型認為文檔是由權重相同的詞語可以用矩陣分解的形式表現出來,通過矩陣分解可以構造出LDA的概率模型。也就說LDA模型可以通過圖1左邊的矩陣進行訓練,學習得出右邊2個矩陣。
圖1 LDA模型的矩陣形式
在向量空間中,任何語料(文檔的集合)可以表示為文檔(Document - Term,DT)矩陣。表1的矩陣表達了1個語料庫的組成:
表1 語料矩陣
W1 | W2 | Wn | ||
D1 | 0 | 2 | 3 | |
D2 | 1 | 4 | 0 | |
Dn | 1 | 1 | 0 |
其中,N個文檔D1,D2,…Dn的組成語料庫,M個詞W1,W2,…Wm組成詞匯表。矩陣中的值表示了詞Wj在文檔Di中出現的頻率,同2時,LDA將這個矩陣轉換為2個低維度的矩陣:M1和M。
表2顯示了M1矩陣的情況,它是N×K大小的 document-topic 矩陣,N指文檔的數量,K指主題的數量,M1中,是一個長度為k的向量,用于描述當前文檔
在k個主題上的分布情況,Z表示具體的主題。
表2 語料矩陣
Z1 | Z2 | Zn | ||
0 | 2 | 3 | ||
1 | 4 | 0 | ||
1 | 1 | 0 |
表3顯示了M2矩陣的情況,它是K×V維的topic-term矩陣,K指主題的數量,V指詞匯表的大小。M2中每一行都是1個分布,也就是主題
在m個詞上的多項式分布情況,可以通過學習得到。
表3 語料矩陣
W1 | W2 | Wn | ||
0 | 2 | 3 | ||
1 | 4 | 0 | ||
1 | 1 | 0 |
1.2 LDA建模流程
基于LDA的文本主題建模包括文本數據導入、建立語料詞典、形成詞袋模型和詞頻數據類型、設置主題建模參數,主題建模流程見圖2。
圖2 LDA主題建模流程
1.3 乘客建議文本預處理
本文共收集了2018年北京地鐵乘客熱線留言5 000 條,在進行乘客需求挖掘之前,先對原始文本數據進行預處理,將文本的半結構化數據轉變為結構化數據。需要對原始文本數據進行去重、分詞和和過濾停用詞處理。
1)原始文本數據去重
由于乘客建議文本數據存在著重復記錄的問題,對于后續的文本分析會造成一定的干擾,所以需要對原始數據進行去重操作。
2)文本分詞
分詞階段就是對每個文本進行中文分詞,詞性標注,并且使其結果按照規定的格式輸出。本研究采用Jieba分詞算法,分詞精度高,其中基于角色標注的新詞識別的召回率高于90%,詞性標注、分詞處理速度達到543.5 kB/s。
(3)過濾停用詞
因為在分詞階段所得到的詞集中,有很多詞是無實際意義的,這些無實際意義的詞對分析工作的影響可以忽略不計,但如果將這些無實際意義的詞作為文本特征詞,往往會給文本分類結果帶來較大的誤差,通常本文將這些詞稱為停用詞。所以就需要在正式的文本分析前,對這些停用詞進行過濾。
1.4 語料主題建模結果
主題建模結果包含了多個主題,主題數量由參數設置決定。每個主題又包含了多個主題詞和主題詞的權重,權重代表主題詞屬于該主題的概率。根據關鍵詞參數的設置,結果按照權重的大小排序,篩選出該主題下可能的主題詞。總結出乘客需求挖掘的主題類型如表4所示。
表4 乘客需求主題類型及關鍵詞
主題類型 | 主題名稱 | 特征詞 |
Topic 1 | 標志標識 | 標識、線路圖、提示、附圖、信息 |
Topic 2 | 乘車安全 | 乞討、車門、摔倒、夾到、賣藝、治理 |
Topic 3 | 站車服務 | 態度、吸煙、嬉笑打鬧、手機 |
Topic 4 | 客運組織 | 進展、安檢、限流、高峰、盲道、刷卡、候車、圍欄、排隊、換乘、擁堵 |
Topic 5 | 溫控噪音 | 溫度、通風、空調、悶熱、冷氣、暖風 |
Topic 6 | 設施設備 | 漏水、電梯、扶梯、維修、檢修、閘機、故障 |
Topic 7 | 運營時間 | 間隔時間、發車、縮短、晚點、首班車 |
Topic 8 | 站車衛生 | 異味、保潔員、很臟、通風口、漏水、油污、衛生間 |
根據乘客熱線留言的主題模型挖掘,分析出乘客的乘車的需求包括:
1)具有方便乘車并快速準時到達目的地的需求,如導向標識清晰、列車時刻表準確等,包括Topic 1、Topic 4和Topic 7。
2)具有乘車全流程中保證人身安全的需求,如設備運行穩定、人員安全等,包括Topic 2、Topic 6
3)具有在乘車的全流程中保持舒適的需求,如地鐵工作的人員的服務態度良好、服務技能達標、環境適宜等,包括Topic 3、Topic 5和Topic 8。
2 基于乘客需求的站務管理平臺系統設計
根據乘客的上述需求,站務管理要從乘客的基本乘車需求、安全需求、服務需求三方面出發,進行相應工作安排。對于站務管理平臺系統設計也應從這三方面著手,配合站務管理工作。因此,對于站務工作人員提出了如下的工作需求:
1)始終保持對車站的整體態勢的持續感知功能,對車站運行狀態的全面掌握,對突發時間的及時響應,需要囊括的數據包括車站的環境信息、客流量信息、列車到站時間和站內設備運行狀態等;
2)對于站內的各個系統設備進行巡檢、管理維護,及時對設備故障進行維修,并完善設備維護和故障維修記錄;
3)對站務工作人員持續地進行業務培訓,保持工作人員良好的服務態度,不斷提升業務技能;
4)合理的進行工作計劃安排,保持車站業務運行順暢,提高站務人員的工作效率;
5)對乘客提出的問題要記錄和匯總,并及時做出改進和反饋;
6)對車站的物資的合理化管理、運用和分配。
針對上述站務工作人員的業務需求,提出了相應的站務管理平臺系統框架,如圖3所示。
圖3 站務管理平臺系統架構
1)感知層
基于對于地鐵站內的態勢感知需求,需要不同的傳感器獲取站內設備的數據,了解設備的運行狀態;不同的系統接口,獲取票務、電力、環控等系統的數據進行綜合分析;統一的通訊協議,在不同系統之間傳遞數據和指令,使地鐵站內不同的系統結合程有機的整體,協調發揮作用。
2)業務層
根據站務工作的需要,結合感知層獲得的數據,構建工作管理、巡檢管理、設備故障報修、員工培訓、數據管理和臺賬管理六大功能。通過這六個業務管理模塊,協助站務人員完成業務需求。
3)終端設備層
站務管理平臺系統實現了臺式機、平板電腦和手機的跨平臺建設,打破傳統管理信息系統桌面端的限制,實現桌面端和移動端數據的共享,賦予站務人員移動辦公能力,提高業務處理效率。
4)用戶層
站務管理平臺系統主要使用者包括站務領導、站務工作人員和系統管理員。系統管理員負責維護系統保持系統的正常運行;站務領導主要通過系統進行工作安排,并通過系統數據掌握站務工作進展;站務工作人員通過系統接收各種工作任務,并通過系統將工作中的產生的數據反饋到系統中來。三類用戶根據崗位職責不同,擁有不同的系統權限。
3 結語
區別與傳統的信息系統需求設計,本文并非單純挖掘系統使用者的業務需求,而是進一步分析系統使用者的服務對象,從服務對象需求的角度推演出系統使用者的需求,使系統設計更加符合實際需要。本文利用主題模型方法,對地鐵乘客熱線的留言文本進行分析,挖掘出8種乘客乘車常見的問題,匯總出乘客準時到達目的地、安全和舒適的3種需求,并推演出站務工作者對地鐵站態勢感知的需求,對自身業務技能和服務態度提升的需求,對于地鐵站設備故障及時維修的需求,對工作計劃科學合理安排的需求,對乘客問題及時改進和反饋的需求,和對車站物資合理管理的需求,并根據以上需求設計出適合地鐵站務工作的管理信息系統。
參考文獻:
[1] 鄭大威,馬琳,燕飛.地鐵設備智能維修管理研究及展望[J].都市快軌交通, 2018 (5): 32.
[2] 肖雄,陳朝暉,何華強.智慧地鐵車站移動站務管理系統的設計與研究[J].通訊世界,2020(1):25.
[3] 謝美麗,張欣環,吳金洪,等.基于模糊綜合評價法的杭州地鐵乘客滿意度評價[J].交通與運輸,2020,36(02):78-81.
[4] 劉建榮,周毅镕,祝旭乾.基于Rasch模型的地鐵服務質量研究[J].武漢理工大學學報(交通科學與工程版),2019,43(04):580-584.
[5] 黃體允,夏妞,李秋健,等.基于乘客出行滿意度的地鐵換乘方案優化[J].價值工程,2020,39(08):27-28.
[6] 吳剛勇,張千斌,吳恒超,等.基于自然語言處理技術的電力客戶投訴工單文本挖掘分析[J].電力大數據,2018,21(10):68-73.
[7] 劉興平,章曉明,沈然,等.電力企業投訴工單文本挖掘模型[J].電力需求側管理,2016,18(2):57-60.
[8] 廉素潔.基于文本分類和情感評分的電信投訴文本挖掘研究[D].杭州:浙江工商大學,2018.
(本文來源于《電子產品世界》雜志社2020年12月期)
評論