久久人人爽爽爽人久久久-免费高清a级毛片在线播放-国产高清自产拍av在线-中文字幕亚洲综合小综合-无码中文字幕色专区

學術咨詢

讓論文發表更省時、省事、省心

基于情感分析的圖書館讀者畫像研究

時間:2021年02月03日 分類:經濟論文 次數:

摘要:文章提出了基于情感分析的圖書館讀者畫像模型,即通過對圖書館讀者的評論文本進行情感分析,得出圖書館讀者情感極性從而采用本體的形式構建圖書館讀者情感畫像庫,為讀者的個性化推薦提供了新的研究思路,實現了讀者的情感知識語義檢索與共享。 關鍵詞

  摘要:文章提出了基于情感分析的圖書館讀者畫像模型,即通過對圖書館讀者的評論文本進行情感分析,得出圖書館讀者情感極性從而采用本體的形式構建圖書館讀者情感畫像庫,為讀者的個性化推薦提供了新的研究思路,實現了讀者的情感知識語義檢索與共享。

  關鍵詞:情感分析用戶畫像本體

圖書館

  一、情感分析與用戶畫像

  情感分析是在框架語義理論的基礎上對文本提取情感框架知識并對文本進行情感信息采集、數據統計的過程。框架語義理論是美國語言學家菲爾墨于1976年提出的解決詞語含義與句法結構意義的理論方法。該理論目前在國內外均有深入的應用,如美國構建了FrameNet語料庫,國內也有漢語框架語義知識庫CFN。截至目前,框架語義理論廣泛應用于各行各業,如圖書館領域和醫療情感分析等。框架語義的研究應用為本研究提供了豐富的可參考語料知識。

  圖書館論文范例:公共圖書館服務平等、開放、共享理念解析

  交互設計之父艾倫·庫珀最早提出了畫像(Persona)的概念,但隨著大數據的發展,目前畫像一般是指在真實用戶數據上構建的目標用戶虛擬模型。畫像技術通過對用戶文本的分析可對其更深一步地做數據挖掘甚至是構建智能推薦系統;畫像技術還可以對服務或者產品進行私人訂制或個性化服務。目前國內畫像技術在圖書館個性化推薦方面已有相關應用,充分說明用戶畫像技術與圖書館個性化服務的有效性與可行性。

  國內已有文本分析與用戶畫像技術的有機結合,兩項技術結合的應用也是非常廣泛的,單曉紅利用酒店文本評論數據對酒店用戶進行畫像,而任中杰等人利用微博數據構建了一種預測公眾情感傾向程度的用戶畫像模型。然而,國內圖書館個性化服務存在情感缺失、信息獲取不足等問題,不能有效滿足讀者興趣的個性化讀物推薦需求,對讀者的深層需求不能有效挖掘。此外,目前情感分析領域存在專業領域詞典缺乏、情感語料庫建設不充分等問題;畫像技術也較少地提及用戶情感,更多地用于普遍商業領域。因此,本文提出基于情感分析的圖書館讀者畫像研究方法,在讀者的畫像構建方法上提出相關模型,對圖書館讀者的情感畫像構建方法進行探討。

  二、圖書館讀者情感畫像構建方法

  (一)圖書館讀者情感畫像模型

  圖書館讀者情感畫像模型可分為四步:爬取在線評論文本、文本預處理、讀者語義資源建設和讀者情感畫像庫構建,其中前三步均是情感分析的內容,讀者畫像庫的構建是基于情感分析的。

  (二)圖書館讀者文本情感分析方法

  1.在線文本來源。微信公眾號、微博和官方網站三個平臺是國內圖書館相關服務獲取的三個主要社區網絡媒體平臺。其中,微博平臺具備用戶實名制、易追蹤和數據爬取容易等優勢。因此,以微博用戶評論數據為基礎數據,能夠保證畫像的全面性與準確性。在線文本可借助如八爪魚等專業的文本爬取工具直接爬取文本相關信息,如原始文本、用戶昵稱等。

  2.文本預處理。斷句、分詞和詞性標注以及句法分析是文本預處理的三項主要任務。國內目前已經有相對成熟的文本預處理平臺可供使用,如哈工大語言技術平臺LTP,借助該平臺API接口,可實現錄入文本直接輸出結果的快捷化批量完成結果的過程,從而提高文本預處理的效率。

  3.讀者情感語義資源建設。讀者情感語義資源建設包括情感詞典的建設與語料知識庫的建設。情感詞典由情感詞和該情感詞的極性值共同組成,語料知識庫則由情感詞典與其對應框架相關元素等共同組成。基于詞典的是情感分析的基礎,詞典的準確性與情感分析的質量密切相關。國內外詞典資源廣泛,如Hownet詞典、BosonNLP情感詞典等等,但領域內的情感詞典相對匱乏,因此有必要在現有詞典的基礎上進一步擴展領域內詞典。針對圖書館讀者的評論文本,對每一個情感詞選取20個及以上句子,參考FrameNet和CFN知識庫,對情感詞完成框架匹配以及情感極性分類。

  情感極性以數值表達,如為負數值則表示該情感詞為負面情緒詞,如為0則表示該情感詞為中性詞語,若為正數值則為正面情緒詞。情感極性值的范圍可定為[-1,1],數值的絕對值越大表示該情感詞所表達的情緒越強烈。此外,情感極性值還需考慮修飾詞的影響,如為程度詞則需要在原有情感極性值的基礎上進行計算,如果原有情感詞極性值為負數則減去這一程度值,反之則加;如為否定詞,則整體情感極性值變為其相反數。如下表所示為[難過]框架的基本內容:如對文本“最近心情失落,總不知道想干些什么,索性便開始讀書。”一句中可識別出情感詞為“失落”,句中無修飾詞,查找詞典得到該詞情感極性值為“-0.3”,隸屬于[難過]框架。

  (三)圖書館讀者畫像方法

  1.圖書館讀者畫像標簽體系。畫像結果一般以標簽體系的形式體現。標簽體系由畫像獨立的標簽共同組成,圖書館讀者的畫像標簽體系可以劃分為讀者基礎信息和情感分析結果兩個維度。

  2.讀者情感畫像庫構建方法。對情感分析之后的情感知識,按照讀者進行分類,以個體為基礎單元對圖書館進行情感畫像。基于本體的用戶畫像構建方法雖然相對復雜,但是本體的語義理解性高于其他方法,而且借助本體能夠對圖書館讀者的情感知識實現語義共享與檢索。圖書館的讀者標簽數據以本體的形式進行存儲。本體工具protégé是斯坦福大學醫學院生物信息研究中心研發的用來存儲RDF三元組的軟件,該工具具備用戶界面友好、支持中文等特點。

  Protégé作為一款本體編輯和知識獲取軟件,在對圖書館讀者進行畫像時,標簽維度以類的形式新建,標簽名稱可以作為子類添加,而讀者分析數據則可以作為實例。此外,protégé工具支持圖表化,讀者的畫像數據可以直接在該工具中實現。本體本身具備 規范性,因此,存儲在本體中的讀者畫像數據在上傳之后即可實現讀者的情感知識數據共享。

  (四)圖書館讀者情感畫像應用價值本文提出了圖書館讀者情感畫像模型,該模型將情感分析與畫像進行有機結合,應用價值有如下幾點:其一,圖書館可以根據讀者的畫像結果提高個性化推薦服務的質量。讀者的畫像結果中包含了大量情感信息,從情感信息中可以篩出患有心理疾病的讀者,通過對讀物的匹配可以幫助讀者度過情緒困境,提高個性化推薦服務的質量。其二,對圖書館讀者的在線文本進行情感分析可以積累完善情感詞典與知識庫。從微博評論中爬取的讀者評論包含很多情感信息,通過對這些情感信息的標注分析,可以進一步完善領域內情感詞典缺乏的劣勢。

  三、結語

  本文提出了基于情感分析的圖書館讀者畫像研究模型,為圖書館服務的發展提供了新的研究方向。圖書館可以根據讀者的情感畫像結果為讀者提供個性化圖書推薦服務,幫助讀者度過情緒低谷;另一方面,基于情感的圖書館讀者畫像豐富了圖書館個性化推薦的研究方法,為圖書館個性化推薦提供了新的思路。

  參考文獻:

  [1]FillmoreCJ.Framesemanticsandthenatureoflanguage[J].AnnalsoftheNYAcademyofSciences,1976

  [2]劉丹,張興剛,任淑敏.基于用戶畫像的高校圖書館閱讀療法模式[J].中華醫學圖書情報雜志,2018(7)

  [3]由麗萍,何玲玲.基于框架語義的在線醫療評論情感分析[J].現代情報,2020(3)

  [4]單曉紅,張曉月,劉曉燕.基于在線評論的用戶畫像研究——以攜程酒店為例.情報理論與實踐,2018(4)

  [5]柳益君,羅燁,蔡秋茹,吳智勤,何勝.基于機器學習的高校圖書館個性化智能推薦服務方案[J].圖書館研究與工作,2020(3)

  [6]劉開瑛,由麗萍.現代漢語框架語義網[M].科學出版社,2015

  作者:蘇菊芳