Derwent Data Analyzer在情報分析服務中應用

Derwent Data Analyzer在情報分析服務中應用
科睿唯安
網站編輯
專利與研發情報

文章根據上海交通大學圖書館楊眉老師主講的《DDA在情報分析服務中的應用》網路研討會演講內容整理後編制而成

 

熱鬧的大學開學季匆匆過去,不少教師與學子又要重新回到圖書館裡安營紮寨,開啟緊張忙碌的學術生活。不同於公眾傳統的刻板印象,如今,無論在哪一所大學,圖書館都正經歷著重大變革;它們不再僅是圖書、期刊及各種學術資料的倉庫,而更是提供學術情報分析服務、引領學術科研前沿方向的重鎮。

由被動轉向主動、從幕後走向台前的職能轉變,讓大學圖書館開啟了全新的跨越發展模式,同時也不免面臨著來自校內外各種情報分析需求的巨大壓力。以上海交通大學圖書館為例,其收到的情報分析需求中,不僅有比較基礎的機構知識庫的論文專利資料整理,也有更多的針對科學研究與創新現狀的分析,如學科競爭力分析、創新實力分析、領域態勢分析等;此外,前沿熱點探測等一些前瞻性的需求,也正與日俱增。當前,學者研究發散多元,即使是同一類學術分析服務,也會因使用者身份的不同而各有側重。而基於早期成果、搶佔先機的現實需求,學者們對學術分析服務往往也有著更高的時效性要求。如何高效合理地解決上述需求,使科研管理決策更加科學合理的目標?借助 Derwent Data Analyzer(DDA)資料清理與分析工具,上海交通大學圖書館進行了一些有益的探索。

 

機構知識庫資料整理

截至2018年12月,上海交通大學共有在校師生超過5萬人,分屬30個學院/直屬系、31個研究院,以及其他附屬或直屬的醫院、醫學研究所、單位、企業等。要將這支數量驚人、歸屬關係複雜的「交大人」隊伍的學術研究成果分門別類、條分縷析,顯然絕非易事。不過,通過在DDA中構建學院與學者敘詞表,交大圖書館正在逐步攻克難關。

如圖1所示,通過在DDA中對位址欄位進行分組,交大圖書館構建了一份學院敘詞表。每次進行資料更新時,這一敘詞表便可用於進行資料自動清理,而未被清理的資料,則可以進行人工判定與分組操作,並補充更新至敘詞表中,如此循環往復。相比於完全依賴手工判定的傳統模式而言,敘詞表清理不僅大大提升了工作效率,更能夠保存資料清理規則,便於後續工作的開展。

圖1:學院敘詞表圖示 來源:科睿唯安Derwent Data Analyzer

 

同樣,通過以工號等校內身份認證標識設定唯一識別碼,DDA還可幫助構建學者敘詞表,並建立學者/作者與學院/組織機構之間的關聯關係。特別在對大批量學術文獻進行作者歸屬判定時,這一功能無疑將帶給用戶事半功倍的美好體驗。

圖2:作者—組織機構對應表圖示 來源:科睿唯安Derwent Data Analyzer

 

領域態勢分析

在學術領域愈分愈細的今天,DDA強大的資料處理與分析功能為研究者提供了一條便捷的領域態勢分析路徑。如圖3所示,通過在DDA中導入資料→以唯一識別碼進行清單比較→建立細分技術分組→轉分組為欄位的方式,使用者便可相對簡易地完成細分技術領域的設定。

圖3:細分技術領域設定圖示 來源:科睿唯安Derwent Data Analyzer

 

完成細分技術領域設定後,用戶便可在DDA中對細分技術欄位和已有的其他欄位進行共生或自相關矩陣分析。共生矩陣即抽取任意兩個欄位的矩陣資料,可用於分析機構發文的年度分佈、發明人專利的細分技術領域分佈等(如圖4);自相關矩陣即某一欄位與自身之矩陣資料的關聯,可用於展示作者、機構或國家之間的合作關係,並製作合作關係圖表(如圖5)。

圖4:共生矩陣—機構發文年度分佈分析圖示 來源:科睿唯安Derwent Data Analyzer

圖5:自相關矩陣—機構發文合作關係分析圖示 來源:科睿唯安Derwent Data Analyzer

 

論文研究熱點探索

科技發展日新月異,學術研究亦是一日千里。學者與科研工作者們如何才能在各領域眼花撩亂的研究成果中,找出當下最具熱度與前景的主題?DDA中的因數矩陣、因數圖譜功能,就是一個上乘的選擇。

在對相關論文的標題、作者關鍵字等文本欄位進行自然語言處理,並對主題詞進行規範後,使用者便可在DDA中生成因數矩陣或因數圖譜。圖6與圖7,便是交大圖書館利用DDA,針對三大頂級學術期刊Cell、Nature、Science進行的論文熱點因數圖譜與因數矩陣分析。

圖6:因數圖譜分析圖示
來源:科睿唯安Derwent Data Analyzer

 

圖7:因數矩陣分析圖示 來源:科睿唯安Derwent Data Analyzer

 

如圖6與圖7所示,領域內研究熱點的年度變化情況,以及不同主題聚類之間的相關性,都已清晰地呈現在用戶面前。此時再按圖索驥,便可一舉而中。

 

高被引學者入圍閾值分析

如何處理眾多學科龐大的資料總量及其之間的多樣化差異,一直是科研績效評價中的一個難點問題。而在針對高被引學者入圍閾值的分析中,上海交通大學圖書館將DDA與Excel的優勢功能相結合,提升了效能。

首先,利用DDA匯出某一學科中高被引論文的所有作者欄位,而後通過Excel將該欄位與其他高被引論文作者集合進行匹配,調整為統一格式,並與作者編號一一對應(如圖8)。

圖8:DDA欄位匯出與Excel格式調整圖示 來源:科睿唯安Derwent Data Analyzer

 

而後,將調整後的對應關係表導入DDA中構建敘詞表,並用該敘詞表進行作者清理、建立分組(如圖9):

圖9:敘詞表與分組建構圖示 來源:科睿唯安Derwent Data Analyzer

 

實踐證明,採用上述方法,一個熟練的圖書館館員,僅需1-2天時間便可處理一個學科的作者資料,實現了顯著的效率提升。

 

學海無涯,書山有路。科睿唯安推出的 Essential Science Indicators(ESI),至今仍是全球科學界評鑑大學、機構乃至國家與區域學術水準與影響力的重要工具之一;如今,通過DDA等強大工具在圖書館情報分析服務中的應用,科睿唯安將繼續為大學、科研機構與學者提供最高品質的解決方案與服務。

需要專人進一步解說?

聯絡台灣團隊

Clarivate

Accelerating innovation