時間:2020年03月24日 分類:教育論文 次數:
摘要:[目的/意義]從數字圖書館資源利用與整理角度出發設計學者數據識別與學者數據庫的構建方式,幫助提升數字圖書館資源建設效率與特色服務。[方法/過程]從學者遴選與收錄來源、學者描述內容及其框架、學者庫構建與學者庫應用方式四個方面調研國內外學者庫研究及實踐情況。通過分析學者特征屬性,研究學者數據結構化表達方式,提出基于數字圖書館的學者庫構建流程和總體框架。[結果/結論]提出學者庫構建與應用齊頭并進的推進策略,強調學者庫要融入科研管理過程,發動學者參與建設,增加展示與宣傳效果,與人才識別相結合,服務于團隊和專題資源建設;與知識管理相結合,兼顧學者存檔與學者畫像功能,拓展精準服務功能。
關鍵詞:學者庫數字圖書館機構知識庫學者識別
圖書館方向論文范文:全球經濟放緩背景下圖書館的生存與發展
自2009年以來,世界經濟克服金融危機的影響正在緩慢復蘇中,但由希臘債務危機引發的歐盟主權債務危機、以美國為首的貿易保護主義、英國脫歐等遏制經濟發展的因素,給世界經濟復蘇蒙上陰影,全球經濟增速放緩,西方各國紛紛出臺財政緊縮政策,依靠政府撥款的圖書館發展無疑受到了影響:預算的減少導致大量圖書館關停、館員減少、服務時間縮水等情況。為應對危機,各國和國際圖書館組織紛紛呼吁政府重視圖書館在公民信息和技能獲取中的重要作用,支持圖書館發展。
學者庫以學者為資源組織對象開展學術特征信息描述,是存儲、檢索、利用和發現學者科研產出的數據系統。學者庫不僅對學者學術特征、屬性和學術成果進行著錄識別,而且對學者學術關系、學術生涯和學術軌跡進行描述、鏈接;其形成的學術資源集,不僅是構建機構知識庫的基礎單元,也是評價學者學術績效的基本元素,還是展示機構實力和學者風采的基本素材[1]。因此,學者庫構建不僅是數字圖書館與科研平臺特色資源建設的重要課題,還成為圖書館和科研組織精準服務于科研評價和科研人員的重要措施。近年來,數據庫商、高校和科研機構及部分科研項目資助機構都基于自建的數字圖書館資源和平臺開展了學者庫構建的實踐探索。
其中,高校和科研機構及科研項目資助常以滿足自身的需求為導向,構建中采用人工方式,或借助數字圖書館技術與平臺提升學者庫的自動化水平;數據庫商的學者庫構建則注重滿足各類用戶的應用需求,全面覆蓋各學科、機構的學者,推進構建流程的自動化,是當前研究與實踐的重點。然而以商業數據庫或知識機構庫資源為基礎數據,僅側重于學術產出的集成與計量,存在無法全面揭示學者特征和無法全面涵蓋學者學術成果的現象。為此,本文擬在完善學者庫元數據體系的基礎上,優化基于數字圖書館的學者庫總體框架和構建流程設計,采用多源數據整合的方式優化學者庫構建的基礎資源,并提出學者庫構建與應用推進策略。
1國內外學者庫建設現狀
學者庫的建設主要涉及學者科研活動、交流行為、學術關系、產出成果的揭示,以及學者評價與展示、學者識別與服務等方面。本文對國內外學者庫收錄范圍、學者遴選方式進行分析,對學者描述系統和體系進行調研,對學者庫構建方式及應用現狀進行梳理,分析學者庫構建的必要步驟。其中,學者遴選方式和收錄來源影響學者庫構建效果,學者特征描述是構建學者庫的關鍵環節和有效應用的前提。
1.1學者遴選與收錄來源
不同的構建目標使學者庫擁有不同的學者遴選范圍和資源獲取方式。商業數據庫和學術搜索引擎根據一定的篩選條件,選擇具有科研成果的學者為目標學者建立學者庫。AMiner以人工智能等領域專家為目標遴選范圍,將相關領域的論文進行集成整合,通過大規模的計算得出目標學者。百度學術為具有一定發文量與被引量的學者自動聚合學術成果,其他學者也能通過認領成果構建自己的主頁,目前共生成400多萬個學者主頁。通過自動聚合學者信息,商業數據庫和學術搜索引擎構建了大量的學者頁面,但學者認領學術成果和頁面數量較少,如中國知網學者庫匯集了1200萬學者,但僅有10萬人認領成果信息[2]。高校、科研機構所構建的學者庫則以本單位學者為學者遴選范圍,如西安交通大學XJTUAcademicHub規定提交者身份限定于本校教師、科研人員、在讀研究生、本科生及本校其他教工[3]。
學術成果的收錄范圍影響學者庫構建的效果。數據庫商常以其收錄的數據為基礎,如中國知網學者庫以CNKI中文期刊全文數據庫為基礎。這種方式受限于其收錄資源的范圍,無法全面揭示學者的學術成果,也難以涵蓋學術成果之外的學者信息,而集成整合多源數據能夠獲得更豐富、完整的學者成果。百度學術發揮數字圖書館分布式資源與運行技術優勢,通過與內容供應商合作獲取題錄數據,采用AIPMH協議等的元數據收割技術對開放資源進行收割,并通過搜索引擎爬取數據,集合學者中外學術成果。對于高校和科研機構來說,其常以購買和自建的數字學術資源為基礎進行構建,如清華大學、西安交通大學等高校以WOS、EI、Nature、Science等數據庫為收錄范圍,并與機構知識庫的科研成果資源相結合[3],同時輔以機構學者提交的個人信息,這種方式在初始建設環節常常可以收到不錯效果,但后續的維護更新難以保證信息的時效性和準確性。
1.2學者描述內容及其框架
學者庫的構建需要對學者特征、成果和關系進行組織和描述,以此實現學者庫的展示和應用。數據商、科研機構和學者唯一標識符系統通過對數據庫資源整合、網絡爬取、科研成果登記等不同方式對學者數據進行集成,描述內容和效果具有差異:ResearcherID、ORCID等唯一標識符面向全球學者,能夠最大范圍地展示學者引文、合著等學術合作關系[4]。
數據商、高校與科研機構構建的學者庫對學者發文、被引等描述項揭示較為充分、及時,主要集成了學術經歷、發文量分布、學科主題、合作者等特征信息等[5],基于數據庫和知識庫的資源優勢,提供全文或鏈接。高校與機構學者庫通過本單位獲取職務、職稱、榮譽等較為全面的學者基本信息。當前大部分的學者庫從數據庫抽取學者機構、合作者等信息,對數據庫中學者相關的文獻元數據進行動態計量,但各科研實體間的關系揭示不夠充分,沒有從語義層面對學者信息進行推理、補充。而一些知識發現服務搜索系統為提高學者語義信息的抽取與描述,構建可存儲、可運算的學者描述框架,實現學者及相關科研實體、關系的表達,可以成為優化數字圖書館學者描述與揭示方式的參考。
AMiner建立學者描述本體,通過拓展FOAF本體框架,定義包含研究者和出版物兩個類型實體和24個屬性、合作者和創作兩對關系,更好地推理與挖掘學術實體間的關系,得出社交能力、活躍度等更多元特征指標[6]。為了將微軟學術圖譜(MAG)和AMiner學術圖譜兩個億級異構數據進行融合,開放學術圖譜(OAG)建立venueschema、authorschema、paperschema實體和屬性框架,建立6500萬個匹配關系,對出版者、論文和作者進行結構化數據描述[7]。
1.3學者庫構建方式
目前,大部分學者庫結合自動化與眾包的思想,基于數字圖書館的數據庫文獻資源自動構建學者庫,之后采用多種方式鼓勵學者人工審核與完善學者信息。在資源組織與描述基礎上,數字圖書館自動化構建學者庫的關鍵是實現學者學術成果與學者的關聯。關聯過程中,不可避免地出現學者姓名歧義現象,需要區分同名學者不同的身份信息與學術資源,這也是當前研究與實踐的難點。為在海量學術資源中準確定位學者及其科研成果,AMiner采用網絡分析法,根據實體關系權值,分析重名學者自我中心網絡特點和屬于不同團塊的特性,通過集團劃分來區分不同實體,實現學者人名消歧[8];中國知網、萬方主要通過“姓名+單位”的組合方式進行學者消歧[9-10];清華大學學者庫挑選具有價值的學者為其設立學者標識符THUID,啟動發文自動追蹤項目,制定完整的分析和追蹤策略[11];還有一些研究與實踐則針對文獻作者姓名的消歧方法展開探索[12-13],或是試圖通過關聯ORCID、ResearcherID等唯一標識符和建立規范文檔進行學者識別[14]。
在促進學者人工審核與完善學者信息方面,當前學者庫主要通過科研管理的手段和設置資源權限獎勵的方法,促進學者參與科研成果注冊登記。廈門大學將學者庫作為科研信息管理平臺,與統一身份認證平臺進行數據共享,根據學者反映的信息補充、更正學者庫數據[15]。ResearchGate需要學者完成注冊才能使用庫內資源,通過學者自主注冊與庫中已有學術資源、學者信息進行匹配,提交學術成果的文檔、鏈接或相關證明,經過審核后完成學者注冊。在理論研究方面,也有研究者以機構庫、學者庫為基礎,在學者甄別的基礎上,設計學者標識、甄別匹配、推送認領、補充認領等學者學術成果認領流程[16-17]。
1.4學者庫應用方式
大多數的學者庫都設立學者檢索頁面和學者主頁,用于展示學者的基本信息、研究成果及動態。澳門大學學者庫設置ORCID、題名、作者等14個檢索字段,支持圖片檢索、高級檢索和專業檢索[18]。AMiner學者庫成為搜狗學術搜索數據提供者[19],增加學者數據使用頻次。清華大學、蘭州大學、澳門大學等高校的學者庫在首頁推送本機構學者在Cell、Nature和Science等頂尖學術期刊發表的論文;設置“推送高被引/熱點文章”和“本期推薦”欄目,定期推薦熱門文章和學者[20]。
廈門大學學者庫與科研產出相關聯,成為年度績效考核、職稱評定、項目申報和管理的基礎數據,設置獨立評價指標庫,利用可視化工具為學校管理層提供決策支持[15];清華大學學者庫于2017年成為職稱申報的學術論文數據來源和教師年終考核工作的學術論文數據源。除了服務學者和科研部門,學者庫在人才挖掘領域也得以利用。AMiner學者庫以智能服務為基礎,構建國家自然科學基金委員會專家Profile系統,并為科技部構建專家畫像庫;建立阿里巴巴人才地圖、CFF專家系統,服務于企業與科研機構。ResearchGate通過學者與機構的關聯,計算機構科研水平幫助學者快速查找具有合作潛力的項目、機構與學者并提供科研招聘服務,機構與個人能夠通過ResearchGate雇傭高質量研究人員[21]。
總之,近年來學者庫得到快速發展,人名消歧、學術成果自動追蹤、建立學者唯一標識符等成為學者信息及其資源采集和整合的常用技術手段和方法;人工智能、機器學習已開始運用于學者庫建設與應用之中,通過語義挖掘、深度學習,建立本體或結構化的描述體系對學者進行揭示。當然學者庫在建設過程中,依然存在構建方式與效果不理想的問題:①學者特征揭示不全面,重視對學術產出的集成和計量,學者學術關系的推理和學者實體特征的挖掘不深入;學者身份信息與學術資源的識別與匹配不夠精確,自動追蹤學者學術產出的程度不高。
②數據來源單一,主要基于數字圖書館資源建立學者資源庫,沒有融合海量的網絡資源;一些數字圖書館沒能發揮出資源分布式存儲與管理的優勢,沒有集成多方數據源全方位整合學者學術產出,無法為學者庫的構建提供完整支撐。③學者庫應用的推動力不足,局限于學者頁面的生成、學者檢索等基礎功能;沒有成為學者知識存檔、學者軌跡展示以及機構知識庫構建的有效手段;與科研管理、科研評價的結合還不夠緊密,在專家發現和人才評價、績效考核方面沒有發揮出最大成效。
2學者特征及其元數據模型
基于數字圖書館的學者庫既要反映學者各項基本信息,應用于文獻服務中的學者消歧,又要深刻揭示學者學術屬性,為更深層次的個性化服務提供數據基礎。學者庫應對反映學者屬性特征的元數據進行有效組織,結合應用目標和需求,從海量的學術資源中提取和識別元素,形成結構化的學者信息描述框架,需要通過對學者信息的有序組織,學術屬性的識別與揭示,準確把握學者特征,動態反映學者學術軌跡。
2.1學者特征屬性分析
學者是在科學、文化、教育領域專門從事研究工作的人員[22],具有相應特征實體和屬性,如接受的專業教育、擁有的高等教育學位、所在單位性質(科研院所、高校、企業研發部門等)、從事的科學研究和生產的專業領域、學科或專業特長;公開發表的論文、擁有的專利、獲得學術榮譽、擁有的學術關系網絡等。每個學者又因學術經歷、學科領域的不同而擁有不同的特征,如人文社科類學者較少擁有發明專利。這些學者屬性分散在數字圖書館學者注冊信息、文獻數據庫、學者個人頁面、學術新聞、社交網絡等來源之中,可以反映學者各式各樣的特征。
所以,學者特征的遴選應面向數字圖書館學者庫的應用需求,從學者識別、科研評價、人才挖掘、個性化服務等應用場景出發,同時注重學者學術特征的揭示的全面性,設計既能準確反映學者學術共性又能靈活反映學者個性特征的學者特征屬性框架。國內外許多研究與實證從不同角度、不同方法設計和論證學者模型或描述框架,對于學者庫元數據結構和學者元素的梳理具有重要參考價值。通過對文獻[23-25]和Aminer、中國知網、百度學術、清華大學、北京大學等學者庫調研,并以數據來源、學者特征和應用場景為考量因素,構建“學者維度-元素”學者特征屬性框架。
因為學者各屬性特征出現的頻次不同,構建的學者框架應該允許部分學者特征重復或缺失。使用正則表達式表達各元素出現次數規則:“”表示0次或多次;“?”表示0次或1次;“+”表示1次或多次;無符號表示必須出現且僅1次。本文設計的學者庫學者特征屬性框架包括6個方面共27個元素:基本信息反映學者自然屬性,通訊信息應用于學術交流、溝通和聯絡,二者是學者姓名規范、實現學者識別的基礎數據;學術傾向反映學者研究方向、學術特長等,集成的數據可應用于數字圖書館精準科研服務;學術關系包括正式與非正式學術交流中合作的學者和機構,反映學者學術關系網和活躍度;榮譽、論文、專利、專著、基金項目等元素反映學者的學術成就,教育經歷與工作經歷反映學者學術背景與學術經驗,是學者評價與人才挖掘的基礎。
2.2學者元數據模型
學者庫的構建不僅是學者與文獻數據的匹配和描述,還涉及學者、成果、機構等科研實體,不同實體與屬性之間存在著邏輯關系,因此數字圖書館可以借鑒實體關系網絡的方法,通過科研實體之間的鏈接,實現實體關系與屬性的推理和挖掘。通過實體-關系-屬性的表達方式,數字圖書館學者元數據模型,實現學者數據的結構化表達與動態關聯。將論文、榮譽等學者成果和學校、機構等單位轉換為實體,并拓展每個實體的屬性;學術傾向無法轉換為實體,由學科和研究方向屬性直接與“學者”實體進行關聯;學術關系中的合作學者和合作機構可以通過論文、專利等實體中作者與機構的屬性實現,一些學者屬性是由學者與科研實體相結合產生的,無法歸于學者或其他科研實體,應屬于實體的關系。
如學位、畢業時間、專業屬于學者的教育經歷,不是學校固有的屬性;而學者對應特定學校才有相應的學位、畢業時間等屬性,故這些屬性應歸于“學習”這個關系中。為了實現不同來源數據的關聯和存儲,需要對學者元數據進行邏輯結構設計,以便構建關系型數據庫。按照數據庫第三范式(3NF)將學者元數據ER模型轉換為關系模型,且滿足第一范式與第二范式,構建相關數據表。學者ID關聯學者成果信息表,可以集中快速展示學者所有成果;學者ID也是關聯學者相關屬性或特征的基礎,這樣在不同字段實現不同表間的關聯,當學者數據產生更新、變動時,相關的數據表和字段進行相應更新。
3基于數字圖書館的學者庫總體框架及構建流程
3.1基于數字圖書館的學者庫總體框架設計
基于數字圖書館構建學者庫,需要依托數字圖書館的技術體系結構和信息體系結構,借助數字圖書館資源加工采集系統、異構資源整合系統、數字資源的管理系統、資源調度系統、用戶管理系統等系統平臺,設計學者庫構建總體框架。同時匯集不同來源的學者數據,采集、加工、整合、存儲學者相關學術數據、學術資源等數字對象,并進行學術網絡建模分析,最終實現學者數據的應用。數字圖書館學者庫以互聯網資源和數字圖書館資源為數據來源,通過數字資源采集加工系統,基于OAIPMH協議收割學術資源元數據,收集數字化文檔、出版物等數字化信息。
基于數字對象系統將數字資源按照描述數字對象的條例和規則加以描述,生成元數據與調度碼,共同構成數字對象。在整合層進行資源的去重合并,進行數字資源的標準化加工;借助數字圖書館異構資源整合系統,實現數字圖書館內外部元數據、資源的整合。基于數字資源管理與存儲系統,根據數字圖書館分布式存儲和學者學術資源多來源、多渠道分布的特點,采取元數據集中存放、數字對象分布存放的存儲方式存儲數據。在學者數據整合與存儲的基礎上對學者進行建模分析,將依據學者元數據框架進行集成,形成學者標簽體系,為學者畫像提供基礎。以文獻數據和社交網絡為基礎,進行挖掘與分析,從不同學者、不同學術資源間的網狀關聯中,構成學術網絡模型,揭示合作關系網絡。根據學者特征,對學者聚類,挖掘相似學者,揭示學術團隊。以數字圖書館資源發布與用戶檢索系統為基礎構建服務平臺,將學者資源最終應用于學者評價、學者畫像、知識管理、科研管理、學者檢索和學者精準推薦等。
3.2基于數字圖書館的學者庫構建流程
基于數字圖書館的學者庫的構建,需依托數字圖書館自身資源與平臺,對不同數據來源進行采集,通過學者名稱規范文檔和唯一標識符實現學者識別,對數據源進行聚合、消歧、清洗,形成學者基本資源集;在此基礎上根據遴選策略選定目標學者,通過學者認領實現信息與成果的確認;通過特征挖掘和關系抽取完成對學者數據和資源的加工,最終實現學者庫的服務與應用。其中,學者庫構建的關鍵性步驟如下:
3.2.1多源數據采集
數字圖書館應該發揮分布式資源管理的特色,與不同國內外知名數據庫商合作,豐富學者庫構建的基礎學術文獻資源;運用機器學習原理和自動追蹤方式,從數字圖書館所擁有的學術文獻資源中挖掘學者學術成果及利用信息;同時,發現和收集網絡資源中學者主頁、人物百科、學術新聞等學者相關網頁,豐富和完善學者相關信息,獲取其最新的學術動態。學者庫建設不是一蹴而就的,需要建立信息采集的更新機制,持續進行資源的采集與更新;依據互聯網頁面的布局及對應的學者元數據變化,建立信息抓取監測機制,及時完善數據抓取中的問題。
3.2.2學者數據整合
對采集的多來源學術信息數據進行清洗、整合與基于學者的聚合,是學者庫資源建設環節的重要工作。數據清洗環節的主要任務是實現采集數據的規范化,剔除低質量的數據,補充缺失字段等。數據整合環節的主要任務則是將不同來源的數據匯聚,其重復數據對于存在部分字段不一致的數據進行沖突處理。在此基礎上,借助ORCID、ResearcherID等學者唯一標識符,學者名稱規范文檔以及機器學習技術進行學者姓名消歧、資源與學者的關聯,以實現學者庫資源的精準、全面聚合。
3.2.3學者遴選
以數字圖書館收錄文獻的作者作為遴選范圍,針對學者庫建設的不同應用目標,需要設置發文、被引閾值等定量指標或學者身份等定性指標,制定學者遴選標準。從學者身份、學術成就、專業技能等角度設計學者遴選策略,挑選出有收錄價值學者,如高產、高被引作者或院士、“千人計劃”、學科帶頭人等熱門學者作為重點收錄目標。使用標識符關聯目標學者,可以根據需求對在庫學者進行編碼,或者直接與ORCID、ResearcherID等常用唯一標識符進行鏈接,對遴選學者進行動態更新,更新遴選對象與范圍。對文獻元數據和學者元數據的提取與加工,突出了學者特征,形成可讀取、可儲存、可關聯、可展示的學者元數據。
3.2.4特征挖掘與關系抽取
以遴選學者為基礎,參照建立的學者數據邏輯結構框架,使用命名實體識別技術識別學者的相關學術實體、屬性及關系,并進行實體抽取與屬性抽取。根據學者元數據進行統計與推理,挖掘學者的學術屬性特征。對學者個人身份特征進行梳理,對學術情況進行計量,對學者間的特征信息進行關系計算,不僅形成如發文量、h指數等學術評價指標和工作經歷等學者學術線性的發展軌跡,還可形成合作、引用等網狀的學術關系。繼而進行學者間引文關系、合作關系、社交關系的挖掘與分析,抽取學者與各科研實體間的學術關系,建立學術關系網絡模型。
3.2.5成果認領與管理
在學者相關數據集成后,需要對整合后的學者信息進行確認。但圖書館無法強制學者使用學者庫,對整合后的成果進行確認、對個人信息進行維護,故該環節只針對使用學者庫的學者或聯合科研管理部門進行。需要通過政策激勵、服務升級,引導和吸引學者完成成果認領。引導學者通過學者庫知識管理平臺,完成學術成果的認領、個人信息編輯和修改以及學術成果的統計與導出。采取機器學習與人工審核相結合的方式對學者學術成果進行驗證。對于注冊加入學者庫的學者,將整合后的學者信息推送至學者賬號,學者對資源進行認領。若審核通過,則對學者信息進行特征提取;若不通過,則允許學者對進行編輯,并重新整合至學者信息集合中,實現循環的審核與更新機制。
4基于數字圖書館的學者庫構建與應用推進策略研究
學者庫的建設與應用是相輔相成、循環漸進的動態過程,應按照“邊建設、邊使用、邊完善”原則進行學者庫構建與應用的同步推進。為改善學者庫效果,需要激勵學者積極參與信息的完善與審核;對接科研管理平臺,提高學者庫構建基礎數據的質量。面向管理機構,可以推進其學者庫在科研過程管理、人才管理、資源建設中的應用;面向學者,可以推進學者庫在其學者知識管理、學術信息資源精準服務中的應用。
4.1增加展示與宣傳效果,增強學者參與動力
受入庫資源質量及技術限制,全面準確地采集學者信息、進行高精度的學者姓名消歧仍是難點,因此學者庫需要提升學者建設與使用學者庫的參與度,才能提升學者數據構建的全面性和準確性。學者頁面與個人的學術形象息息相關,能夠吸引學者豐富和維護個人的信息,從而提升數據準確性。將學者及其信息的展示作為增強學者參與學者庫構建與應用的動力,在學者頁面通過計量分析、可視化展示等手段,幫助學者提升學術影響力;推送熱門學者主頁,增加對學者庫個人展示功能的宣傳,激發學者成果認領、信息維護完善個人主頁的熱情;吸引學者使用學者庫資源而產生的訪問、瀏覽、下載等行為數據可以作為資源質量評價的參考。通過學者的認領、應用和互動,提升學者庫信息質量。
4.2搭建科研管理平臺,融入科研管理過程
與科研管理結合,既可以服務科研管理部門,也有助于豐富和完善學者庫信息,提升學者庫質量。將學者庫構建融入成果收集、成果考核、科研評價、項目申報等科研管理環節,作為學術成果提交和職稱評定和科研考核、項目申請的基礎數據,方便和優化機構內部科研績效管理,進行學者學術產出統計與管理。同時對學者填報信息逐一審查,確保學者信息和學術資源的完整性和準確性,形成科研信息申報審查機制,可以強化學術規范,避免科研失信。此外,科研管理平臺中的信息都是學者確認后的、時效性較強的信息,因此可以將其作為學者庫構建的數據來源,提升入庫信息質量。
4.3與人才識別相結合,服務于團隊和專題資源建設
學者庫對學者進行特征挖掘、關系抽取,按領域、學科、專業或單位對學者進行有效類分,可以識別和發現學者擅長、精通和潛在學術領域,應用于不同學科的人才識別與人才選擇,成為專家遴選、科研評審、項目支持的專家人才儲備庫。針對機構學者進行資源建設,集成某一機構或某一領域的專業學者,形成“專、精、深”的學科專題資源庫,拓展機構知識庫特色資源。
4.4與知識管理相結合,兼顧學者存檔功能
對學者而言,學者庫囊括了學者自身的相關學術信息和成果,是學者知識管理的工具和平臺,也是學者有效存儲個人知識的場所,可以作為開放獲取自存儲實現的綠色倉儲;實現學者學術成果的添加、編輯、刪除,將學者庫打造成學者個人知識庫;不僅將學者的學術資源進行集成,還對學者信息進行結構化梳理,幫助學者厘清學術發展路線。
4.5構建學者畫像與學者模型,拓展精準服務功能
將學者庫嵌入知識發現、科研管理、學術社區等科研創新平臺,能更好地為學者和科研機構提供信息服務。學者庫集成不同來源的學者資源,進行學者識別,實現學術資源的姓名消歧,能提供學者及其成果的搜索和發現服務;以學者為單位組織資源,從不同角度刻畫學者學術特征,能夠為科研管理平臺提供基礎數據,提供學者計量和評價服務;運用學者庫數據挖掘學者學科興趣、發展趨勢等,構建學者畫像和用戶信息模型,逼近學者客觀實際,為數字圖書館學者精準資源推送服務奠定基礎,推薦相關學者,促進學者交流與合作。
參考文獻:
[1]曾建勛.加強學者庫的建設與應用[J].數字圖書館論壇,2018,(9):1-1.
[2]CNKI.成果庫幫助[EB/OL].[2019-04-21].