時(shí)間:2019年07月06日 分類:農(nóng)業(yè)論文 次數(shù):
摘要:近年來,隨著大數(shù)據(jù)、云計(jì)算、人工智能等技術(shù)的逐漸成熟與落地,互聯(lián)網(wǎng)電商蓬勃發(fā)展,企業(yè)在電商方向上的營(yíng)銷理念和方法已與傳統(tǒng)營(yíng)銷的理念和方法截然不同,其依托于現(xiàn)代技術(shù)發(fā)生了革命性的變化,基于大數(shù)據(jù)與人工智能的客戶精準(zhǔn)營(yíng)銷已成為主流,而基于互聯(lián)網(wǎng)電商的農(nóng)產(chǎn)品精準(zhǔn)營(yíng)銷由于其自身的特性目前還處于研究探索階段,本文主要研究基于某農(nóng)產(chǎn)品電商平臺(tái)提供的農(nóng)產(chǎn)品銷售數(shù)據(jù),針對(duì)購(gòu)買者的個(gè)人信息如所處地域、職業(yè)等,以及行為偏好采用改進(jìn)的K近鄰算法對(duì)用戶進(jìn)行分類,從而達(dá)到農(nóng)產(chǎn)品電商精準(zhǔn)營(yíng)銷的目的。
關(guān)鍵詞:K近鄰算法;機(jī)器學(xué)習(xí);大數(shù)據(jù);農(nóng)產(chǎn)品電商;精準(zhǔn)營(yíng)銷
消費(fèi)者在電商平臺(tái)的日常消費(fèi)中積累了海量數(shù)據(jù),包括了消費(fèi)者的地域、性別、年齡、行為習(xí)慣、個(gè)人偏好等,這些數(shù)據(jù)可以幫助我們?yōu)橄M(fèi)者進(jìn)行消費(fèi)預(yù)測(cè)行為分析,從而動(dòng)態(tài)的感知到消費(fèi)者將進(jìn)行的消費(fèi)活動(dòng),從而推動(dòng)消費(fèi)升級(jí)。這與傳統(tǒng)營(yíng)銷的方法相比,在降低社會(huì)成本的同時(shí),極大的提高了效率和準(zhǔn)確率,對(duì)農(nóng)產(chǎn)品電商的精準(zhǔn)營(yíng)銷具有重大意義。本文基于人工智能機(jī)器學(xué)習(xí)的KNN算法實(shí)現(xiàn)了對(duì)目標(biāo)用戶進(jìn)行購(gòu)買品類、購(gòu)買意向多維度分類,從而助力于農(nóng)產(chǎn)品電商的精準(zhǔn)營(yíng)銷,促進(jìn)農(nóng)產(chǎn)品電商產(chǎn)業(yè)的發(fā)展。
一、農(nóng)產(chǎn)品電商精準(zhǔn)營(yíng)銷及其研究現(xiàn)狀
現(xiàn)階段農(nóng)產(chǎn)品電商精準(zhǔn)營(yíng)銷是通過對(duì)消費(fèi)者在電商平臺(tái)進(jìn)行購(gòu)物留下的數(shù)據(jù)的全面分析,挖掘出海量數(shù)據(jù)中所包含的消費(fèi)者的性別、地域、收入水平、消費(fèi)習(xí)慣、個(gè)人偏好等信息,從而準(zhǔn)確預(yù)測(cè)出消費(fèi)者未來的消費(fèi)行為,并制定出一對(duì)一的動(dòng)態(tài)的營(yíng)銷策略以滿足消費(fèi)者需求。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,目前業(yè)界在解決精準(zhǔn)營(yíng)銷問題時(shí)是通過使用Hadoop、Spark等分布式數(shù)據(jù)處理框架對(duì)電商平臺(tái)上的海量用戶數(shù)據(jù)進(jìn)行挖掘、清洗,并使用機(jī)器學(xué)習(xí)算法對(duì)經(jīng)過處理后的有價(jià)值的數(shù)據(jù)進(jìn)行處理,找出數(shù)據(jù)中蘊(yùn)含的知識(shí)和規(guī)律,得到模型,并將其應(yīng)用到對(duì)未來獲取到的數(shù)據(jù)的分析及預(yù)測(cè)中。
二、KNN算法在電商農(nóng)產(chǎn)品精準(zhǔn)營(yíng)銷上的應(yīng)用
本文提出一種基于KNN算法的電商農(nóng)產(chǎn)品精準(zhǔn)營(yíng)銷預(yù)測(cè)解決方法,即對(duì)用戶行為進(jìn)行漢明編碼,然后計(jì)算用戶之間的距離,從而對(duì)用戶未來的農(nóng)產(chǎn)品消費(fèi)行為進(jìn)行預(yù)測(cè),實(shí)現(xiàn)了將KNN算法應(yīng)用在農(nóng)產(chǎn)品電商精準(zhǔn)營(yíng)銷這一特定的業(yè)務(wù)場(chǎng)景下,且較之于傳統(tǒng)的數(shù)據(jù)分析預(yù)測(cè)方法,具有更高的決策準(zhǔn)確率和決策效率,更加智能化。
(一)數(shù)據(jù)預(yù)處理
本文通過問卷調(diào)查形式獲取了1000組用戶性別、年齡、個(gè)人偏好、是否購(gòu)買過以及消費(fèi)意向、消費(fèi)者之間關(guān)系、地域等數(shù)據(jù),對(duì)用戶是否具有購(gòu)買魚的意向這一消費(fèi)行為進(jìn)行預(yù)測(cè)。本文結(jié)合具體營(yíng)銷場(chǎng)景篩選具有代表性的特征作為研究使用數(shù)據(jù)集,其中字符’Y’表示肯定,字符’N’表示否定,如此表示是為了降低在數(shù)據(jù)特征描述時(shí)的復(fù)雜度。
(二)數(shù)據(jù)特征描述
在KNN算法中,我們可以用漢明距離來度量各個(gè)樣本數(shù)據(jù)之間的距離。在本文的數(shù)據(jù)樣本中,我們將字符’Y’表示的特征項(xiàng)編碼為1,將字符’N’表示的特征項(xiàng)編碼為0。值得注意的是,結(jié)合實(shí)際的農(nóng)產(chǎn)品電商精準(zhǔn)營(yíng)銷,考慮到由于60歲以上的群體在食用魚時(shí)具有被魚刺傷到的危險(xiǎn)性,故將60歲以上數(shù)據(jù)樣本中性別這一特征編碼為0,另外,由于中國(guó)傳統(tǒng)文化的原因,女性在家庭食材消費(fèi)上的重要性,我們將數(shù)據(jù)樣本中性別女這一特征項(xiàng)編碼為1,相對(duì)的性別男這一特征項(xiàng)編碼為0。
因此,我們得到圖一中數(shù)據(jù)樣本的編碼分別為1111、0110、0111、1101、1010、1011。將用戶的各項(xiàng)特征進(jìn)行編碼后,便可以計(jì)算編碼之間的漢明距離,漢明距離的大小,便能表征各個(gè)用戶之間的差異性和相似性。
(三)KNN特征分類算法的應(yīng)用
本文在得到用戶各項(xiàng)特征編碼之后,然后計(jì)算各用戶特征項(xiàng)編碼之間的漢明距離。接下來,我們通過實(shí)驗(yàn)的方式,選取出一個(gè)合適的漢明距離閾值K來對(duì)用戶的購(gòu)買意向進(jìn)行預(yù)測(cè)。在閾值K之內(nèi)的同一組用戶,我們認(rèn)為其具有相同的購(gòu)買意向。
算法基本流程如下:Step1:計(jì)算用戶特征項(xiàng)編碼的距離。計(jì)算測(cè)試集中給定樣本編碼與訓(xùn)練集中每個(gè)樣本編碼的漢明距離;Step2:漢明距離的排序。將計(jì)算出的漢明距離進(jìn)行降序排序;Step3:選擇給定樣本的K個(gè)近鄰:根據(jù)排序結(jié)果,選擇距離最近的K個(gè)樣本作為待預(yù)測(cè)的樣本的類別,認(rèn)為他們具有相同的購(gòu)買意向。K即為上述閾值;Step4:分類的判別。查找出K個(gè)近鄰的類別,在此情景下,類別即為是否具有購(gòu)買意向。然后按照投票的方式?jīng)Q定待分類樣本的類別。
三、模型設(shè)計(jì)與測(cè)試結(jié)果
(一)農(nóng)產(chǎn)品電商精準(zhǔn)營(yíng)銷系統(tǒng)框圖本文我們實(shí)現(xiàn)了一個(gè)基于KNN算法的農(nóng)產(chǎn)品電商精準(zhǔn)營(yíng)銷系統(tǒng),研究了農(nóng)產(chǎn)品電商中特征項(xiàng)的提取及特征項(xiàng)在向量空間上的距離計(jì)算。
(二)實(shí)驗(yàn)測(cè)試我們隨機(jī)抽取80%的數(shù)據(jù)作為訓(xùn)練樣本,剩余20%作為驗(yàn)證樣本,對(duì)基于KNN算法實(shí)現(xiàn)電商農(nóng)產(chǎn)品的精準(zhǔn)營(yíng)銷進(jìn)行研究。在本文設(shè)計(jì)的模型中,閾值K的選取對(duì)預(yù)測(cè)精確度起有著明顯的影響。理論上來說,閾值K對(duì)預(yù)測(cè)分類的精確度起決定性的影響,當(dāng)K越小時(shí),分類邊界曲線越光滑,分類精度越高;K越大分類邊界曲線越平坦,分類精度越低。距離K的選取在本文中變現(xiàn)為閾值K的選取。從實(shí)驗(yàn)結(jié)果看來,當(dāng)選擇閾值K的值為10的時(shí)候,本模型具有較高的預(yù)測(cè)精度。
(三)實(shí)驗(yàn)結(jié)果分析在本文的預(yù)測(cè)模型中,閾值K的選擇對(duì)預(yù)測(cè)結(jié)果起著至關(guān)重要的作用。從多次實(shí)驗(yàn)結(jié)果來看,當(dāng)訓(xùn)練集為800驗(yàn)證集為200的情況下,閾值K=10時(shí)具有較高的預(yù)測(cè)精度。另外,在農(nóng)產(chǎn)品電商精準(zhǔn)營(yíng)銷領(lǐng)域的預(yù)測(cè)模型中,特征項(xiàng)的選取對(duì)預(yù)測(cè)結(jié)果的精度有密切的關(guān)系。例如,魚這種農(nóng)產(chǎn)品,消費(fèi)者的自身屬性以及購(gòu)買動(dòng)機(jī)是多維度的,非常復(fù)雜的。
在特征項(xiàng)的提取時(shí)要注意的是,特征項(xiàng)并不是越多越好,我們要結(jié)合社會(huì)實(shí)際情況對(duì)一些特征項(xiàng)進(jìn)行取舍。每個(gè)特征項(xiàng)的編碼也是需要深入研究的地方,要考慮進(jìn)各個(gè)特征項(xiàng)之間的相互影響,此時(shí)便需要多位編碼來表征一項(xiàng)特征項(xiàng)了。
四、結(jié)束語(yǔ)
實(shí)驗(yàn)結(jié)果表明,本文設(shè)計(jì)的電商農(nóng)產(chǎn)品精準(zhǔn)營(yíng)銷系統(tǒng)模型對(duì)消費(fèi)者的購(gòu)買意向預(yù)測(cè)具有較高的精度,可以為企業(yè)在其精準(zhǔn)營(yíng)銷中做為決策依據(jù)。然而,由于數(shù)據(jù)樣本的不足,本文的預(yù)測(cè)模型在特征項(xiàng)提取上還有較大的研究提升空間。
本文為電商農(nóng)產(chǎn)品的精準(zhǔn)營(yíng)銷提供了一個(gè)可靠的解決方案,同時(shí),也對(duì)今后的研究工作重心有所展望:(1)在能夠提供足夠多的數(shù)據(jù)樣本的前提下,在對(duì)特征項(xiàng)的提取上結(jié)合農(nóng)產(chǎn)品電商這一特定領(lǐng)域的實(shí)際情況進(jìn)行進(jìn)一步的研究。特征項(xiàng)之間的相互影響是存在的,所以本文中將某一特征項(xiàng)編碼為一位在表征特征項(xiàng)之間的相互作用時(shí)便顯得不足。特征項(xiàng)的編碼應(yīng)該是多位的,能充分體現(xiàn)出特征項(xiàng)之間的相互影響的。(2)在計(jì)算各特征項(xiàng)編碼的漢明距離之前,如果數(shù)據(jù)量比較大,我們需要對(duì)特征項(xiàng)的編碼進(jìn)行壓縮,以提升算法的性能。這是在大數(shù)據(jù)的場(chǎng)景下需要研究的重點(diǎn)問題。
電商方向評(píng)職知識(shí):哪些期刊征稿發(fā)表農(nóng)村電商脫貧論文
隨著農(nóng)村經(jīng)濟(jì)的快速發(fā)展,農(nóng)業(yè)從業(yè)人員也成為了評(píng)職的重點(diǎn)人群,而最近就有很多農(nóng)業(yè)人員咨詢哪些期刊能發(fā)表農(nóng)村電商脫貧的論文,小編解答:經(jīng)濟(jì)類,政治政策類,農(nóng)業(yè)發(fā)展類文章都是能接收這方面論文的,您可以具體咨詢我們的編輯老師,他們會(huì)評(píng)估您文章內(nèi)容是偏向哪個(gè)方向,研判適合投稿的期刊,這樣也不會(huì)耽誤您評(píng)職。