時間:2020年01月09日 分類:電子論文 次數:
摘要:推薦系統在電子商務系統得到了廣泛應用,但是其中物品推薦法假設中沒有考慮時間周期系數,容易造成無效推薦。本文針對具體問題場景,討論了在UserProfile和ItemProfile中引入時間參數,并給出了初步的工程解決方案,可以提高日用品和兒童商品推薦的針對性,有較好的實踐性。
關鍵詞:推薦系統;時間周期;UserProfile;ItmeProfile
一、引言
廣義上的推薦系統可以理解為是主動向用戶推薦物品(Item)的系統,所推薦的物品可以是音樂、書籍、餐廳、活動、股票、數碼產品、新聞條目等等,推薦系統所推薦的物品或者對用戶有幫助,或者用戶可能感興趣。隨著電子商務規模的不斷擴大,商品數量和種類不斷增長,用戶對于檢索和推薦出了更高的要求。
由于不同用戶在興趣愛好、關注領域、個人經歷等方面的不同,以滿足不同用戶的不同推薦需求為目的、不同人可以獲得不同推薦為重要特征的個性化推薦系統(PersonalizedRecommenderSystem)應運而生。從目前公布的數據看,Amazon發布的數據顯示,亞馬遜網絡書城的推薦算法為亞馬遜每年貢獻近三十個百分點的創收。實際上推薦已經有逐漸替代傳統搜索的趨勢,被主流電商如阿里、京東廣泛重視。
二、推薦系統
考慮如何發現數據的相關性:推薦系統大致上可以分為如下幾種:基于人口統計學的推薦;趦热莸耐扑]基于協同過濾的推薦推薦系統可能的輸入數據多種多樣,但是歸納起來可以分為用戶(User)、物品(Item)和評價(Review)三個層面,它們分別對應于一個矩陣中的行、列、值。
物品(Item)用來描述一個Item的性質,也經常被稱為ItemProfile。根據item的不同,ItemProfile也是不盡相同的。比如對于圖書推薦,ItemProfile有可能包括圖書所屬類別、作者、頁數、出版時間、出版商等;對于新聞推薦,ItemProfile則有可能是新聞的文本內容、關鍵詞、時間等;而對于電影,可以是片名、時長、上映時間、主演、劇情描述等。用戶(User)用來描述一個用戶的“個性”,也就是UserProfile。根據不同的應用場景以及不同的具體算法,UserProfile可能有不同的表示方式。
三、內容推薦法
基于內容推薦法所基于的基本假設是“一個用戶可能會喜歡和他曾經喜歡過的物品相似的物品”。這里“曾經喜歡過的物品”就是利用該用戶的歷史記錄計算出來的Profile,作為該用戶的UserProfile來使用。
四、問題的提出
在實際操作中,如果只是簡單采用內容推薦法,而不考慮具體產品的時間因素,可能會造成一定量的無效推薦。下面是幾個例子:
(1)使用壽命較長的產品。用戶如果買了電視機等有較長使用壽命的物品,正常情況下,在產品的正常使用壽命內,他或她不會再對此類產品感興趣。所以如果基于內容推薦法的基本假設,向一位剛購買過電視機并沒有退貨的用戶再推薦類似產品,用戶的再次購買的可能性很低,這就是無效推薦。這類產品以家用電器、家居用品為主。
(2)兒童產品。假設某用戶在八個月內一直買某品牌奶粉一段的產品,那么根據內容推薦法的假設,系統應該持續向該業務用戶推薦該品牌一段奶粉。然而根據嬰兒的生長規律,8個月的嬰兒逐步要從一段奶粉向二段奶粉過渡了,這時候比較合適推薦的產品其實是二段奶粉以及嬰兒輔食,所以此類推薦也是無效推薦。
五、時間系數的引入的解決
基于以問題為導向,我們嘗試在基于內容的推薦系統中引入時間參數來解決問題。
(1)針對產品固有的使用周期問題,在ItemProfile中引入使用壽命參數。初始的時間周期使用周期參數可以參照統計,比如枕頭的科學使用周期為2年。同時每個用戶的購買清單中記錄了此類商品的購買時間點,所以可以在UserProfile中添加該類商品的到期時間,即Date產品到期=Date上一次購買此類商品+Period默認通過定時器技術,推薦系統約在到期時間的2/3時間開始推薦此類商品進入推薦列表,離到期時間越近推薦越頻繁。
一旦用戶完成第二次此類商品的購買,系統可以自動更新該用戶對此類商品的使用周期Period該用戶,即:Period該用戶=Date上上次購買此類商品-Date上次購買此類商品Date產品到期=Date上次購買此類商品+Period該用戶顯然經過反復的數據訓練,系統可以更準確的預測用戶對該類商品該興趣的時間周期。需要注意的是一點是,由于雙十一,618存在用戶囤貨的情況,在電商大促期間發生的購買行為不應該用來調整此用戶對該類商品的使用周期。
對于使用壽命較長的商品,比如電視冰箱空調等使用壽命高達十年,用戶發生購買的頻率較低,同時時間長變數大,推薦系統的作用對此類商品的購買決策作用不大。可以將商品的使用周期設置為無限。對于使用周期比較敏感的產品主要有日用品,比如米面油奶餅干等食品類,筷子垃圾袋保鮮膜等廚房用品,牙膏毛巾紙巾等個人清潔商品等。
(2)針對兒童不同年齡段的需求不同的問題,對于處于為人父母的用戶,UserProfile中加入子女的基本年齡情況估計。用戶子女的年齡信息最好從用戶的購買行為中采集。需要在ItemProfile中設置產品敏感年齡,比如奶粉、尿布、輔食、玩具、教輔用書、童裝等就有明確針對年齡段,而其他產品可以設置為針對所有年齡。一旦用戶購買了兩次年齡敏感商品,系統就可以初步使用線性擬合估計該用戶孩子的年齡,購買的次數越多,數據也就越準確。而一旦出現較大的年齡偏差(大于等于1歲),可以預設該用戶有第二個孩子,以此類推。
六、結論
通過在內容系統的ItemProfile和UserProfile中引入時間系數,可以提高日用品和兒童商品推薦的針對性,幫助電商更好地完成創收。
參考文獻
[1]王東雨.音樂推薦系統性能調查探究[J].情報工程,2015,1(6):113-119.
[2]范家兵,王鵬,周渭博,etal.在推薦系統中利用時間因素的方法[J].計算機應用,2015,35(5):1324-1327.
計算機系統論文投稿刊物:計算機應用(月刊)創刊于1981年,由中國科學院成都計算機應用研究所主辦。該刊把介紹計算機應用技術作為重點,以推動經濟發展和科技進步為宗旨。