软件开源主题识别及演化分析
Topic Mining and Evolution Analysis of Software Open Source Research
-
作者:
董平军
1
高翔菲
1
-
作者单位:
-
提交时间:2023-07-28 14:49:17
摘要: [目的/意义] 软件开源是社会化软件生产中一种重要的生产组织方式和协同创新运动。通过对国内外软件开源相关研究的主题识别及演化分析,探究软件开源研究领域的阶段性热点和趋势变化规律,为以促进中国软件开源创新进一步优化发展为主旨的学者开展研究梳理方向。[方法/过程] 以从Web of Science数据库检索到的2001年至2023年5月10日期间的软件开源领域文献作为语料库,采用困惑度指标确定主题数目,训练LDA主题识别模型得到主题-词分布和文档-主题分布,根据主题-词分布对主题进行标识,依据文档-主题分布计算主题强度,进而识别热点主题和归纳演化路径。[结果/结论] 主题识别结果表明,软件开源研究领域存在六个重要主题,分别是贡献动机、商业模式、开源治理、协作模式、开源协议、企业参与;从主题演化角度上看,软件开源在商业模式、开源治理和企业参与主题上近年来具有相对较高的研究热度,开源协议的研究趋势相对稳定,贡献动机和协作模式的研究热度虽然呈相对下降趋势,但自始至终一直保持较高的受关注度。软件开源研究呈现由关注开源动机自发、自治的个人维度到企业、政府参与的组织维度的发展规律。建议学者们关注中国情景下开源生态各类主题研究,为我国开源生态健康发展提供理论支持。
版本历史
[V1] |
2023-07-28 14:49:17 |
ChinaXiv:202308.00035V1
|
下载全文 |