博客專欄

        EEPW首頁 > 博客 > 因果推薦技術在營銷和可解釋性上的應用

        因果推薦技術在營銷和可解釋性上的應用

        發布人:數據派THU 時間:2023-05-22 來源:工程師 發布文章

        主要包括以下四大部分內容:


        1. Uplift 增益敏感性預測

        2. 增益敏感度的應用

        3. 貝葉斯因果網絡的介紹

        4. 畫像決策路徑構建及可解釋性應用


        01 Uplifit 增益敏感度預測


        關于 Uplift 增益,通用的業務問題可以總結為,在圈定的人群中,營銷人員會想知道,新的營銷動作 T=1 相比較原始的營銷動作 T=0,能帶來多少的平均收益(lift,ATE,Average Treatment Effect)。大家會關注新的營銷動作是否比原來的更有效。


        在保險場景下,營銷動作主要指的是保險的推薦,比如推薦模塊上透出的文案和產品,目標是在各種營銷動作和約束條件限制下,找到因營銷動作而增益最多的群體,去做定向投放(Audience Targeting)。


        圖片


        先做一個比較理想且完美的假設:對于每一個用戶 i ,都能知道他對營銷動作 t 是不是買賬。如果買賬,可以認為公式中的 Di 為正,且 value 比較大;如果不買賬,且對營銷動作很反感,Di 可能就會比較小,甚至是負向的。這樣就能夠得到每個用戶個體對于 treatment 的效果。


        關于人群劃分,可以看到上圖中的營銷四象限,我們最關注的肯定是左上角 Persuadables 的人群。結合公式,該人群的特點是當有一些營銷動作的時候,會很買賬,也就是 Yi > 0 ,且值比較大。如果對該人群不去做營銷動作則是負的,或者是比較小,等于 0,這樣的人群的 Di 就比較大。


        再看另外兩個象限的人,Sure things,指無論是否營銷,這些人都會買,那么營銷投到這一人群上的收益率是比較低的。Sleeping dogs,是指去做營銷反而會起到一些負面作用。這兩部分群體最好不要進行營銷投放。


        圖片


        但是這里也存在一個反事實的困境:Di 沒有那么完美。我們不可能同時知道一個用戶對 treatment 是否感興趣,即無法知道同一用戶在同一時間對不同 treatment 下的反應。


        最通俗的一個例子是:假設有一個藥物,給 A 吃了之后,會得到 A 對藥物的反應。但卻不知道,如果 A 不吃的結果,因為 A 已經將藥吃下去了,這其實就是一個反事實的存在。


        對于反事實,我們進行了近似的預估。ITE(Individual Treatment Effect )預估的方式,雖然找不到一個用戶,實驗其對兩個 treatment 的反應,但可以找到相同特征的用戶群來預估反應,比如具有相同 Xi 的兩個人,可以假設在同一特征空間下,近似等同為一個人。


        圖片


        這樣,Di 的預估分成了三塊:(1)Xi 在 T=1 的營銷動作下的轉化率;(2)Xi 在 T=0 的營銷動作下的轉化率;(3)lift 是一個差值,計算兩個條件概率下的差異。用戶群體的 lift 值越高,則說明該人群更買賬。如何讓 lift 更高呢?在公式中,是將 Xi 在 T=1 的營銷動作下的轉化率變大,Xi 在 T=0 的營銷動作下的轉化率越小即可。


        圖片


        在建模方式上,結合上文的公式,做一些歸納:


        (1)T 變量的數量,如果不只是一個營銷動作,而是有 n 個營銷動作,則為多變量 Uplift 建模,否則是單變量 Uplift 建模。

        (2)條件概率 P 以及 lift 的預估方式:① 通過差分建模,預估 P 值,然后找到 lift 值,這是間接的建模。② 通過直接建模,比如標簽轉化模型,或者是因果森林,比如 Tree base 、LR、 GBDT 或者一些深度模型。


        02 增益敏感度的應用


        圖片


        增益敏感度主要做了三方面的應用:保險產品的推薦,紅包推薦,以及文案的推薦。


        首先來介紹一下,旅游保險在飛豬上是什么樣的定位。旅游保險是旅行商品中的一個種類,但它更多的是出現在主營商品的搭售鏈路上。比如我們去訂機票、酒店的時候,主要購買意圖是:酒店、機票、火車票,這個時候 APP 會問你要不要買一個保險。所以保險是屬于一個輔營業務,但是其目前已經成為交通和住宿行業一個非常重要的商業性收入來源。


        本文講的主要作用域在彈窗頁:彈窗頁是飛豬 APP 下拉收銀臺的時候會彈出的一個頁面,這個頁面只會展示一種創意文案,只能展示一種保險商品,這一點與前面詳情頁可以展示多個類型的商品,以及保險的價格不同。所以這個頁面,會讓用戶的注意力足夠的聚焦在這里,并且可以做一些拉新促活,甚至是一些用戶教育培養的營銷動作。


        圖片


        目前遇到的業務問題為:在彈窗頁面,我們需要去推薦一個最佳的保險產品或者紅包,使得整體的轉化或者收益最大化。更具體的是去做一個拉新,或者是更高轉化的業務目標。而業務收益目標是在收益不降低的情況下,提高轉化率。


        在以上的約束條件下,有幾個營銷項:(1)給用戶推薦一個入門級低價保險;(2)另外一個 treatment,推薦一些紅包,主要是去做一些拉新的操作。而 Base 就是原價的保險。


        圖片


        建模的時候,有一些假設的條件:條件獨立的假設。指 treatment 營銷動作,在建模 uplift 采集的時候,樣本服從假設條件獨立,用戶的各個特征是相互獨立的。比如發紅包,不能在年齡上有不同的分布,例如,在年輕人上少一點,老年人上發的多一點。這個會導致樣本有偏。所以提出的解法是讓用戶隨機地去曝光商品。同樣的,也可以計算傾向性得分,得到同質的用戶群,去做對比。


        在實驗設計上,AB 實驗:A 是按原來的策略去投放,可能是 40 塊錢的保險,也可能是運營來進行保險的定價,或者原始模型的一個定價。B 桶,低價保險投放。 


        Label :用戶是否轉化成交。


        模型:T/S/X-learner 以及各類的這種 Meta 模型。


        樣本構造:訴求是要刻畫用戶到底對這種低價保險是否更感興趣,就需要有足夠多的特征去刻畫用戶對價格的敏感性。但實際上像輔營產品,沒有一個比較強的意圖性。所以我們很難從用戶的歷史瀏覽購買記錄當中,看到用戶到底喜歡多少塊錢的保險,或者是他會購買多少錢的保險。我們只能從主營或者用戶流瀏覽的一些其他的飛豬 APP 域內的數據上去看,也會看用戶紅包的使用頻率和紅包消費比例,比如用戶會不會只有在發紅包的前幾天,才在飛豬上進行轉化。


        圖片


        基于以上的特征樣本的構造,同樣進行特征重要性和可解釋性的分析。通過 Tree base 模型可以看到,在一些時間、價格變量、年齡變量特征上是比較敏感的。


        圖片


        評估指標的計算方式:Gini 和 Accumulated Gini。將 Uplift 分成 n 組,每一組去計算一個 Gini 分,如上圖第一個公式所示,在該分組下得到用戶映射到 test 桶和 base 桶之后的轉化率,再去算 Gini。同理類推到 Uplift Gini,通過計算不同的閾值下的收益分,輔助我們去做閾值的一個判定。


        圖片


        通過離線可得,表現最好的模型是 LR+T-Learner,其實不太符合原始的預期。后來思考了這個問題,也許問題出在用戶對保險相關的價格特征的構建上,并不太足夠去刻畫。因為我們也去做了一些用戶調研,比如用戶的性格,對保險的敏感程度,這種 APP 域內的一些用戶畫像數據,能看到用戶對一個無實物商品的感興趣程度。但最終,還是基于這樣的分數,去劃定人群做投放,線上的 base 桶相對提升 5.8%。


        圖片


        *博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。



        關鍵詞: AI

        相關推薦

        技術專區

        關閉
        主站蜘蛛池模板: 灌云县| 盐池县| 鄄城县| 霸州市| 嘉祥县| 攀枝花市| 盈江县| 永清县| 乐业县| 无棣县| 德安县| 白沙| 长沙县| 海林市| 县级市| 高密市| 葵青区| 云霄县| 长武县| 南安市| 贵港市| 买车| 固镇县| 常德市| 墨竹工卡县| 商城县| 通江县| 达尔| 兴和县| 卫辉市| 滕州市| 莱芜市| 泗水县| 荣成市| 徐州市| 朝阳县| 靖远县| 云安县| 建德市| 沧州市| 天柱县|