bet体育网站,1978年至2020年政府工作报告关键字清单

2020年5月22日上午9:00,在第十三届全国人民代表大会第三次会议的人民大会堂举行了开幕式,国务院总理李克强发表了政府工作报告。,今年政府工作报告的全文包括大约9,500字,大约是去年的一半。1978年至2020年,《澎News新闻》(www.thepaper.cn)在中国政府网站上的“政府工作报告”中共有43个关键词。
在分析政府过去几年的工作报告时,《澎ging新闻》对价值越来越高的词语进行了排序,并且由于其发展趋势,这些词语被称为“喇叭形词语”。
在今年的“喇叭形”中,应特别提及“流行病”和“摆脱贫困”两个词。“流行”一词在今年的政府工作报告中出现了31次,而“脱贫”一词出现了16次。
在43份政府工作报告中经常使用“发展”,“建设”和“经济”一词。在政府报告中,这些词始终是高频的“常绿词汇”。
澎News新闻还比较了这43份政府工作报告中几个关键短语的趋势。自2000年以来,“制造”和“服务”几乎同时被频繁提及。近年来,政府报告更多地将重点放在“制造”上。
关于新词,政府的2020年工作报告中的“两个新的和一个沉重的”一词引起了人们的注意。“两个新”是指建设新的基础设施和新的城市化,“重”是指建设重大项目,如交通和水保护,包括5G,新能源汽车,交通,水保护,新城市化等领域
在前几年的报告中,这些词经常成为社会创新和企业家精神的关键。以2014年至2017年政府工作报告中新概念为例,我们可以看到相关领域公司的快速增长。“人工智能”一词最早出现在2017年政府工作报告中。从2017年到2019年将“人工智能”纳入其业务的公司数量呈指数级增长。
分析方法:
1.本文的所有原始材料均来自中国政府网络1978年至2020年的政府工作报告。
2.本文使用解霸词分割(https://github.com/fxsjy/jieba/)。使用精确的分词模式可以避免重复的分词和歧义。数字,单词和标点符号是从去除单词分割结果中得出的。
3.为了提高正确的分词率,增加了基于解霸分词的自定义词典。该自定义词典主要包含《人民日报》和新华网统计的前两个热门单词。
使用基于分词的TF-IDF加权技术。单词的含义随其在文本中出现的频率成正比增加,但随其在语料库中出现的频率而降低。本文所使用的语料库是1978年至2020年政府工作报告的文本。
5.与合并有关的用语:自由贸易包括自由贸易区和自由贸易试验区,城市包括城市和直辖市。

bet最新备用网址