基于類別圖增強算法的融合異構數據會話推薦分析
基金項目:河南省重點研發與推廣專項,項目編號202102210177
本文引用地址:http://www.104case.com/article/202308/449928.htm0 引言
從會話層面分析,在未掌握全面的用戶身份信息并且不知道會話序列包含的物品個數條件下,如果只根據物品參數來建立ID 標簽序列模型時,并無法準確捕獲用戶實際意圖,某些情況下還會出現關于用戶意圖的錯誤理解結果。首先,當會話序列較短的情況下,無法通過有限交互行為準確反饋出用戶實際意圖。考慮到大部分時候都無法得到用戶的身份信息,而且只有短時間中的用戶交互記錄才是有效的,這對大量處理方法造成了制約。
對人們日常使用的各大購物平臺進行分析可知,拼多多、淘寶、京東等電子商務服務平臺為提升搜索效率,通常都會針對各物品設置相應的類別標簽。通過上述方式促使用戶更加快速準確找尋他們所需的商品,同時平臺還可通過推薦系統中顯示的用戶訪問信息推送同一類產品。綜合考慮物品與類別因素可以判斷出用戶的實際意圖。根據文獻[1]報道可以發現,以圖神經網絡構建會話序列模型的時候,如果只針對單一物品結構進行建模,即只根據物品ID 序號構建模型時,將會造成部分概念層數據丟失的結果。當會話序列處于匿名狀態下時,無法包含所有用戶行為,如果只根據單一層面構建模型時將會在用戶偏好方面產生較大偏差。本文對于上述分析結果,設計了一種通過類別圖來實現增強效果的推薦算法。可以利用此算法為物品建立類別序列,再通過圖神經網絡為上述序列構建仿真模型,從而實現2 個層面的物品屬性評價,對2 個層面的測試結果進行融合后確定會話用戶的偏好結果。
1 類別圖增強算法
在網絡中輸入各物品ID與類別序列再對其表征后,獲得每種序列下的各節點表征結果。由于類別屬于物品的特定屬性,可將其作為物品ID 標簽序列的補充數據。CaSe4SR-W 方法是利用加權融合的過程來判斷全局偏好:物品與類別序列都是按照相互獨立的方式完成輸入與表征過程,因此進行融合的時候先獨立處理2 個序列,之后測試融合所得的結果。上述融合模式是計算物品圖與類別圖的注意力加權數據,之后再對其實施融合,結果見圖1。
圖1 加權融合全局偏好方法
以下給出了具體處理步驟:
首先通過注意力機制加權計算物品表征向量,從而實現物品全局表征的效果,具體見式(1)(2):
(1)
(2)
之后利用注意力機制加權計算類別表征向量,由此完成類別全局表征,構建得到式(3)~(4):
(3)
(4)
最后一步是對以上獲得的物品與類別層面進行全局表征,融合物品與類別層面的信息后,可以更加全面描述物品特征,這使得各類ID 標簽的物品因為類別標簽一致,也表現出了一定程度的相似性。通過會話表示層拼接局部與全局表征,再利用線性轉換方法確定最終會話表征。
2 實驗
2.1 Cosmetics數據集及預處理
從Kaggle 平臺上采集測試參數,選擇中等化妝品在線商店在線用戶行為進行分析。為確保數據處理過程更好地滿足一般性,將長度不在2~50 范圍的會話內容去除,同時不考慮出現次數在5 次以內的物品。表1 是統計得到的數據集參數。
表1 數據集統計
2.2 對比方法介紹及實驗設置
為了對算法進行可靠性驗證,以SR-GNN[36] 模型作為基準對比條件。
將模型設定為以下所示的控制參數:采用TensorFlow框架對模型開展訓練。將數據集中的表征向量維度設置在100。同時將模型各參數矩陣均值都設置為0,標準差等于1,按照高斯分布形態實施初始化。通過minibatchAdam優化器調整上述參數,設定最初學習率等于0.001。控制訓練批次為100,L2 懲罰保持105 的恒定值。
2.3 實驗結果及分析
為驗證以類別圖增強方法構建的模型滿足有效性,本次利用2 個數據集分別測試了CaSe4SR、SR-GNN模型與CaSe4SR 變體模型,得到表2參數。
表2 不同方法的結果對比
根據表格參數可知,設計得到的CaSe4SR 模型對各類數據集都表現出了最優推薦性能。同時可以發現,其他3 類包含類別信息數據的模型都獲得了比SRGNN模型更優的性能,考慮到各模型具有自身獨特的建模過程,因此實際提升幅度也存在較大區別。Concat與CaSe4SR 雖然是以不同形式進行建模,但都在建模過程中融合了物品與類別信息,可以將物品類別與表征形成一一對應關系。CaSe4SR-W 則依次通過類別特征和物品實施建模,最后再對其實施融合。根據測試結果可知,CaSe4SR-W 模型表現出了比Concat 與CaSe4SR兩種模型更差的性能,由此可以推斷類別信息需結合物品信息共同建模,需根據物品參數才可以發揮信息補充功能。Concat 相對Case4SR 模型推薦性更弱,因此采用有向圖表示類別序列,同時引入門控圖神經網絡建立模型的過程滿足可靠性要求。
3 結束語
本文開展基于類別圖增強算法的融合異構數據會話推薦分析,得到如下有益結果:
1)設計了一種包含5 層結構的CaSe4SR 仿真模型,在融合層內融合物品與類別表征結果,確保物品表征中包含類別數據;根據注意力機制建立全局表征,再通過局部表征建立最終表示;通過預測層計算各候選對象推薦參數。
2)設計得到的CaSe4SR 模型對各類數據集都表現出了最優推薦性能,CaSe4SR-W 模型表現出了比Concat 與CaSe4SR 兩種模型更差的性能,推斷類別信息需結合物品信息共同建模,需根據物品參數才可以發揮信息補充功能。
參考文獻:
[1] 賈丹,孫靜宇.基于用戶會話的TF-Ranking推薦方法[J]. 應用科學學報,2021,39(3):495-507.
[2] 任俊偉,曾誠,肖絲雨,等.基于會話的多粒度圖神經網絡推薦模型[J].計算機應用,2021,41(11): 3164-3170.
[3] 方軍,管業鵬.基于雙編碼器的會話型推薦模型[J].西安交通大學學報,2021,55(8):166-174.
[4] WU S, TANG Y, ZHU Y, et al. Session-based recommendation with graph neural networks[C]. Proceedings of the AAAI Conference on Artificial Intelligence, Hawaii, United States,2019,33(1):346-353.
[5] 閆昭,項欣光.基于整體序列建模的會話推薦模型[J]. 南京理工大學學報,2021,45(1):27-36.
[6] 張海通,黃增峰.基于影響力擴散的會話推薦模型[J].計算機應用研究,2021,38(7):1956-1962.
[7] 南寧,楊程屹,武志昊.基于多圖神經網絡的會話感知推薦模型[J].計算機應用,2021,41(2):330-336.
[8] WANG M, REN P, MEI L,et al. A collaborative sessionbased recommendation approach with parallel memory modules[C]. Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval, Paris, France, 2019: 345-354.
[9] 曾義夫,牟其林,周樂,等.基于圖表示學習的會話感知推薦模型[J].計算機研究與發展,2020,57(3):590-603.
[10] 李晶皎,孫麗梅,王驕.提高會話推薦多樣性的SRL推薦系統模型[J].東北大學學報(自然科學版),2013,34(5): 650-653+662.
[11] 劉浩翰,呂鑫,李建伏.考慮用戶意圖和時間間隔的會話型深度學習推薦系統[J].計算機應用與軟件,2021,38(3): 190-195+223.
[12] 王鴻偉,過敏意.刻畫長短期用戶興趣的基于會話的推薦系統[J].中國科學:信息科學,2020,50(12):1867-1881.
(本文來源于《電子產品世界》雜志2023年8月期)
評論