查看原文
其他

R语言文献计量之TOP5发文国家时间序列变化

走天涯徐小洋 走天涯徐小洋地理数据科学 2022-05-17

R语言文献计量之TOP5发文国家时间序列变化

前面简介了使用bibliometrix包进行文献计量,由于R语言是一个开放的编程环境,借助bibliometrix包,再自己写一些代码,可以很方便的进行自定义的深入文献信息挖掘。

在看文献的过程中,看到了下面的一个图,TOP5国家论文发布趋势,那么怎么能借助bibliometrix包和R语言把这个图做出来呢?

TOP5国家论文发布趋势

制图思路

bibliometrix包试验过程中,我知道它可以统计各国的文献发文数量。

不同国家发文量比较

既然上面的图可以做出来,bibliometrix一定是可以获取文献作者的国家信息的。

我的思路

  • 获取发文作者国家
  • 国家和时间合并
  • 各国发文量排序,获取TOP5发文国家
  • TOP5发文国家分年份统计
  • ggplot2出图

实施过程

biblioshiny()是一个可视化界面,运行过程中Rstudio看不出数据处理过程,那么为了能够获取国家信息,必须使用bibliometrix分步处理数据。

为此我查看了bibliometrix的帮助,以及Github源代码,找到了国家信息提取有关的代码。

然后根据上面的思路进行了代码的编写,实现了TOP5发文国家时间变化的分析。

绘图代码

绘图结果如下,代码如下,欢迎规范转载,不要盗图

TOP5国家发文变化绘图
library(bibliometrix)
library(tidyverse)
biblioshiny()

SAdata <- load("Bibliometrix-Export-File-2021-03-21.RData")
SA_badata <- biblioAnalysis(M)
couplingMap(M)

# Countries
data("countries",envir=environment())
countries=as.character(countries[[1]])

sep=";"
### new code{
if (!("AU1_CO" %in% names(M))){
  M=metaTagExtraction(M,Field="AU1_CO",sep)}

CO=M$AU1_CO
PY=M$PY
#国家发文分年统计
CO_PY = as.data.frame(cbind(CO,PY)) %>%
  group_by(CO, PY)%>%
  summarise(n()) 
#国家发文统计
CO_PY2 = as.data.frame(cbind(CO,PY)) %>%
  group_by(CO)%>%
  summarise(n()) 
#获取TOP5发文国家
TOP_CO= CO_PY2[order(CO_PY2$`n()`, decreasing=T),]
TOP5_CO = TOP_CO[1:5, 1]
TOP5_CO_PY = inner_join(TOP5_CO, CO_PY, key="CO")
TOP5_CO_PY$PY = paste0(TOP5_CO_PY$PY,"-01-01")%>%
  as.Date(PY,format="%Y-%m-%d")   #生成一个时间序列,保证ggplot2时间轴正确
# ggplot2绘图
p1 <- ggplot(TOP5_CO_PY, aes(PY, `n()`, color=CO))+
  labs(x="年份", y="发文数量")+
  guides(color=guide_legend(title = "文献作者国籍"))+
  theme_bw()+
  theme(title = element_text(size = 22),
        axis.title = element_text(size = 20),    #调整标题大小
        axis.text.x = element_text(size = 18),    #x轴标签大小
        axis.text.y = element_text(size = 18), 
        legend.title = element_blank(),
        legend.position = "bottom")+     #y轴标签大小
  geom_line()+
  geom_point()
p1

拜托大家不要只收藏,好东西还请分享

点击阅读原文跳转bibliometrixGitHub,围观代码

参考文献

  1. R语言文献计量分析初探
  2. Aria M, Cuccurullo C. bibliometrix: An R-tool for comprehensive science mapping analysis[J]. Journal of Informetrics, 2017, 11(4): 959–975.
  3. http://www.bibliometrix.org/documents/Field_Tags_bibliometrix.pdf
  4. R语言安装部署基础
  5. https://www.bibliometrix.org/index.html
  6. https://github.com/massimoaria/bibliometrix
  7. GIMMS NDVI数据ENVI裁剪和R语言时间序列处理分析
  8. 0基础学习GIS和R语言


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存