摘要: [目的/意义]对档案馆公共文化服务领域进行热点主题提取,以期为档案馆公共文化服务的转型升级和建设提供参考借鉴。[方法/过程]以档案馆公共文化服务领域的研究文献为例,基于LDA模型对近十年档案馆公共文化服务领域的研究文献进行研究主题识别以及主题强度的计算并对此分析,探索各研究主题的演化趋势,从而揭示该领域的发展状况,并预测其未来的发展趋势。[结果/结论]LDA模型通过对热点主题的挖掘和识别有助于在档案馆优化公共文化服务中快速满足用户的多元需求,从而为档案馆的转型带来新的方向。未来可以从促进机构转型升级、深挖档案资源价值、传承档案文化遗产三方面着手,提升档案馆公共文化服务的水平。
分类: 图书馆学、情报学 提交时间: 2024-11-13 合作期刊: 《文献与数据学报》
摘要: [目的/意义]对王重民学术思想研究的发展脉络和研究热点的变化趋势进行文献计量学分析,以期全面挖掘王重民学术思想的内涵和价值。[方法/过程]检索中国知网数据库关于 1983—2023年间王重民学术思想研究的文献,通过 LDA、DTM模型与 CiteSpace可视化工具进行统计分析。[结果/结论]现有研究较好地揭示了王重民对图书馆学、目录学、敦煌学等学科的贡献。研究主题主要集中在王重民学术思想中的图书馆学研究与学科建设、目录学研究、敦煌学与文化遗产研究、古籍整理与文献学研究四个方面,反映出研究的跨学科特点。从主题时序演化的角度阐述了王重民学术思想研究不同阶段的变化。
分类: 图书馆学、情报学 提交时间: 2024-11-13 合作期刊: 《文献与数据学报》
摘要: [目的/意义]随着生成式人工智能的快速发展,算法治理问题成为社会各界关注的焦点。对国内外对算法治理研究主题进行分析与比较,能够更好地了解算法治理领域研究现状和国内外异同,进而为我国算法治理研究提供参考。[方法/过程]以中国知网和 Web of science数据库中的期刊文献为数据来源,采用 LDA主题模型对文献主题进行挖掘分析,得出国内外算法治理领域的主题热点及研究框架,并对国内外研究主题进行比较分析与趋势展望。[结果/结论]根据对算法治理研究主题的分析与比较,发现国内外研究既存在共性也存在差异。算法治理基础与法律规制是国内外共同关注的研究主题;在细化主题方面,国内侧重于市场监管和推荐算法的规制,而国外侧重于个人数据保护与算法技术层面研究。未来发展趋势主要聚焦于应用领域的算法治理政策法规研究、算法应用向善和服务从善研究、人工智能算法可解释性研究。
分类: 统计学 >> 社会统计学 提交时间: 2024-05-18 合作期刊: 《中国科学院院刊》
摘要: 在数字经济发展与总体国家安全观的双重时代背景下,数据主权已成为国家主权的重要组成部分。各 主要国家和地区积极开展数据主权战略部署,在数据资源、数据技术和数据规则方面展开激烈竞争与博弈。 文章采用政策文本分析方法研究我国数据主权政策,运用LDA(Latent Dirichlet Allocation) 主题模型和政策 工具量化分析中国数据主权政策的过程演化、主题特征,并综合考虑全球数据主权态势,提出4 条政策建议: 积极主导和参与国际规则制定;优化数据出境安全评估流程;完善个人信息出境标准合同模版;强化数据安 全法治保障。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2024-04-17
摘要: 目的/意义 医疗器械产品是临床科研成果转化和知识创新管理的产物。作为科技产业竞争的主要赛道之一,医疗科技实力是衡量国家总体科研能力和环境的重要方面。知识创新驱动产业发展,产品结构反映知识管理的层次水平,而涉及前沿科技的知识管理与国家战略规划息息相关。从产品主题挖掘与演化分享的角度,透视领域技术知识管理现状,对企业和国家来说具有重要战略意义。 方法/过程 本研究采用了一种综合的技术主题识别和分析方法。通过应用机器学习领域的 LDA 算法,从医疗器械产品数据中识别并聚类潜在的技术主题,进而分析各时期技术主题的分布特征和变化规律。结合隐马尔可夫模型定量预测未来的技术趋势。采用这种组合方法,对 2014-2023 年创新医疗器械的主题分布、演化规律及未来趋势进行了深入的研究。 结果/结论 采用国内获批的创新型医疗器械产品数据识别和整理出 38 个技术主题。结果显示,基因检测和植入电刺激器技术的深入开发。疾病诊断、手术导航和生物补片是未来技术创新和产品竞争的重点。但从数量特征上看,我国研发力量较为薄弱,创新能力处于弱势地位,需引起企业技术研发机构和政府重视。
分类: 其他 >> 综合 分类: 其他 >> 综合 提交时间: 2024-01-10 合作期刊: 《文献与数据学报》
摘要: [目的 / 意义]政策作为特殊因素对我国人工智能行业发展起到指导、规范和约束作用。探究政策出台现状并提出建议,以期促进我国人工智能健康发展。[方法 / 过程]选取我国最具代表性的国家级和省部级人工智能政策文本共 66 项作为研究对象,通过 BERT-Based 混合 LDA 模型建模和语义量化分析方法,从政策语义、主题特征及其演化对其内含语义和外部属性两方面进行全面探究。[结果 / 结论]目前我国人工智能政策工具以需求型为主,政策主题以促进领域融合为主,重视基础技术研究和实际成果转化;提出我国需建立人工智能政策统筹规划协调机制,在重视人工智能风险治理的同时,探索实际效益转化的新模式、新路径,并不断深化国际合作和竞争等政策建议。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》
摘要: [ 目的 / 意义 ] 定量描述图书情报与档案管理学科的研究图景,为各机构之间合作关系 的建立提供决策支持,从而推动跨机构合作的发展。[ 方法 / 过程 ] 采用 LDA 主题模型和网络 分析方法,以国内 67 所图书情报与档案管理教育机构为例,通过对教师自述研究兴趣文本进行 主题聚类构建机构相似性网络,并进行社群划分与潜在合作关系挖掘。[ 结果 / 结论 ] 当前国内 图书情报与档案管理教师的研究兴趣主要涉及信息资源管理、信息计量与竞争情报、信息服务 与用户等 11 个主题,样本机构可划分为 7 个社群,包含 457 对潜在合作关系。未来,图书情报 与档案管理学科除了向 5 种路径进行学科融合之外,还可在不同领域充分展开科研与教育实践 的跨机构合作。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》
摘要: [ 目的 / 意义 ] 对我国文献资源保障体系论文主题演化的路径进行分析,为重构我国文 献资源保障体系提供借鉴。[ 方法 / 过程 ] 主要使用 LDA 模型对所搜集到的文献进行聚类,首 先以时间段为划分依据,绘制主题词共现网络,探索各主题之间的交互关系,后通过相似度计 算判定各主题内部的演化路径并绘制桑基图以可视化形式展现演化结果。[ 结果 / 结论 ] 研究 发现我国文献资源保障体系的相关主题在 2000 年左右均已基本出现,主题主要包含资源角度和 机构角度两大类,且受计算机技术和国家政策影响较大,并针对该两大类主题,给出相应的对 策与建议。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》
摘要: [ 目的 / 意义 ] 梳理主题模型在公共政策文本中的国内外应用现状有助于学习已有研究成果, 为未来发展提供理论与实践支持。[ 方法 / 过程 ] 采用文献计量分析法从时间趋势、机构分布、期刊分布 等角度进行量化分析,详细归纳阐述应用现状;其次,通过关键词共现识别国内外主要研究方向并展 开对比分析,总结主题模型应用在公共政策文本中存在的问题并提出未来展望。[ 结果 / 结论 ] 公共政 策文本分析中主题模型的应用整体呈增长态势,前景广阔。国内外研究起步时间相当,但国内研究在研 究范围、研究深度、合作方式、研究方法等方面均需提升。此外,未来发展存在主题模型自身方法适用 性问题和研究内容粒度问题,需进一步结合公共政策文本特征改进主题模型并细化研究力度。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》
摘要: [ 目的 / 意义 ] 探究影响电影微博互动效果的隐藏主题能发掘用户关注的热点问题,为企业 提供有效的营销策略。[ 方法 / 过程 ] 从新浪微博上爬取 2017 年上映的 123 部电影的热门微博,采用主 题建模方法挖掘电影微博文本中的隐藏主题,利用回归方法分析隐藏主题对电影微博互动效果的影响。 [ 结果 / 结论 ] 结果发现 6 个可解释主题:电影人物、电影宣传、互动营销、电影内容、电影评价和线下 活动,其中电影宣传、互动营销、电影内容和电影评价 4 个主题正向影响电影微博的互动效果;同时发 现用户粉丝数和话题讨论热度正向影响电影微博的互动效果。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》
摘要: [ 目的 / 意义 ] 在产业链视角下,以虚拟现实技术为例,构建 VR 专利产业链语料库,挖掘中 国 VR 专利的技术主题、研发热点和未来发展趋势。[ 方法 / 过程 ] 首先,利用 Python 爬取 VR 领域的 专利文本,通过数据清洗得到有效语料库;然后,结合 IPC 分类号和 K-means 聚类算法,构建并验证 VR 专利产业链;最后,基于 TF-IDF 算法和 LDA 主题模型,识别出产业链视角下中国 VR 专利的核心 技术主题及其综合强度、技术研发热点和未来趋势。[ 结果 / 结论 ] 当前中国 VR 产业链各环节的专利 比例不均衡,上游研发最热门,其次是下游应用,最薄弱的是中游制作。主题挖掘方面,上游热点为软 件研发,中游热点为影视制作,下游热点为医疗、教育、娱乐应用。未来趋势方面,产业链上游将以电 数字数据处理、光学元件、图像通信等技术为主流,中游将以车辆部件、动力装置、减振装置等技术为 主流,下游将以室内游戏、医学诊断、鉴定等技术为主流。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]学术文献影响力评价指标不断推陈出新,但尚缺乏在研究主题层面对文献影响力的评价,为发现不同研究主题内具有高影响力和引用价值的文献,本研究给出一种基于研究主题的文献影响力评价方法。[方法/过程]以Web of Science数据库中2011年-2015年间情报学领域500篇高被引文献为样本,利用LDA模型对样本文献进行主题建模,将主题对文献的支持度与文献被引频次相结合,计算特定主题文献的被引频次(specific topic cited frequency,简称STCF),并根据每篇文献在相应主题内的STCF值对文献进行影响力排序。[结果/结论]结果表明,STCF值能反映文献的主题内容、细粒度体现文献的学术地位、呈现文献研究主题的多元性,能够有效弥补被引频次、Altmetrics指标的不足。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义] 探索微博舆情传播周期中不同传播者关注的舆情热点和传播内容的主要观点,进而发现舆情传播的特点和规律,为舆情分析与决策提供依据。[方法/过程] 以特定舆情事件的事实文本数据为来源,以生命周期理论和LDA方法为指导,设计研究流程与构建研究模型,对微博舆情事件中不同传播者的话题进行主题研究,其中包括主题抽取和结果语义标注、各阶段的不同传播者主题的语义分析、基于时间维度的舆情主题观点识别与刻画。[结果/结论] 研究发现,论文所提出的研究模型能够挖掘出舆情传播周期中不同传播者的主题结构、观点脉络以及特征,研判出分布在文字当中有关联性的、代表性的、重要的词语。同时,结论中还发现微博中的官媒、大众媒体发布信息中的话题和用户谈论的热点话题具有明显的差异性。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义] 改善现有LDA专利技术主题分析存在的辨识度低、可解释性弱和界限划分模糊问题,对于把握技术热点、追踪技术前沿具有重要意义。[方法/过程] 将国际分类号IPC引入LDA专利主题分析中,将其作为技术词的语境,以二元组的WI (Word IPC)结构进行训练,构建WI-LDA模型,实现对专利文献主题的识别和分析。[结果/结论] 通过中国石墨烯领域的实证研究及与传统LDA模型的对比研究证明,WI-LDA模型泛化能力较强,在专利技术主题分析上能有效降低主题的辨识难度,增加主题的可解释性,使文本主题划分更加清晰。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]提出一种新的层次化科学知识结构发现方法,为优化知识结构发现过程,改善知识组织形式提供借鉴。[方法/过程]利用LDA主题模型构建层次化的科学知识结构发现方法,依据主题间平均相似性自动确定知识结构层数,通过在文档-主题概率矩阵中自动筛选阈值截取各主题文献子集,最后采用树形图展示科学领域的知识结构,发掘知识间的关联性和继承性,并与层次主题模型HLDA方法进行比较。[结果/结论]通过实证研究与对比,证明本文提出的方法得到的知识结构更优,知识主题表征性更强且运行效率更高,并在单层主题区分度和层间主题继承性方面较HLDA方法有较大提升。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]针对目前使用标签推荐方法所得结果不理想的问题,改进传统相似度计算方式,并结合多种标签推荐方法,提高推荐准确性。[方法/过程]融合基于内容与协同过滤的推荐思想,利用LDA进行相似度计算得出资源与用户的近邻集合,并抽取资源内容关键词,以此构建标签混合推荐模型,最后以豆瓣读书为例对模型进行验证,同时与几种标签推荐方法进行比较。[结果/结论]在社会标注系统中,必须考虑用户-资源-标签3个维度,仅考虑单一角度势必会造成结果的不完整,同时在相似度计算时引入LDA能够挖掘潜在语义关系,提高推荐质量,且组合多种方法取长补短可以令推荐结果更为满意。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-28
摘要: [目的/意义] 软件开源是社会化软件生产中一种重要的生产组织方式和协同创新运动。通过对国内外软件开源相关研究的主题识别及演化分析,探究软件开源研究领域的阶段性热点和趋势变化规律,为以促进中国软件开源创新进一步优化发展为主旨的学者开展研究梳理方向。[方法/过程] 以从Web of Science数据库检索到的2001年至2023年5月10日期间的软件开源领域文献作为语料库,采用困惑度指标确定主题数目,训练LDA主题识别模型得到主题-词分布和文档-主题分布,根据主题-词分布对主题进行标识,依据文档-主题分布计算主题强度,进而识别热点主题和归纳演化路径。[结果/结论] 主题识别结果表明,软件开源研究领域存在六个重要主题,分别是贡献动机、商业模式、开源治理、协作模式、开源协议、企业参与;从主题演化角度上看,软件开源在商业模式、开源治理和企业参与主题上近年来具有相对较高的研究热度,开源协议的研究趋势相对稳定,贡献动机和协作模式的研究热度虽然呈相对下降趋势,但自始至终一直保持较高的受关注度。软件开源研究呈现由关注开源动机自发、自治的个人维度到企业、政府参与的组织维度的发展规律。建议学者们关注中国情景下开源生态各类主题研究,为我国开源生态健康发展提供理论支持。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-28
摘要: 地理标志农产品上行是打造农产品品牌效应的重要途径。为探究消费者购买地理标志农产品的行为路径机制,利用Python采集京东在线评论,通过Snownlp情感分析、TF-IDF算法和LDA主题聚类归纳出影响消费者购买意愿的外部线索:产品质量、物流配送、电商服务、产品性价比、原产地形象、品牌美誉度。基于消费者感知价值理论,构建外部线索作用于消费者购买意愿的理论模型,通过结构方程模型对外部线索、感知价值与消费者购买意愿之间的作用机制进行分析。结果表明,地理标志农产品外部线索正向影响消费者购买意愿。地理标志农产品外部线索通过影响感知价值的不同维度影响消费者购买意愿,功能感知价值大于情感感知价值对消费者购买意愿的影响。旨在解决地理标志农产品消费者购买意愿内在影响机理的黑箱问题,为地理标志农产品营销提供决策支持。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]移动健康信息服务的发展可以为医疗行业创造巨大的潜在价值,但整体应用滞后于金融服务等行业,其源于转移过程中存在诸多的影响因素。对用户健康信息行为研究成果进行文本挖掘能够有效揭示潜在的主要影响因素,进而总结这些因素对转移行为的影响。[方法/过程]利用LDA模型进行文本分析,结合社会认同理论,将相对感知价值、相对忠诚度作为关键影响因素,转移成本作为调节因素,构建用户转移行为影响因素的研究模型并进行实证分析。[结果/结论]研究结果显示,LDA模型分析结果可以获取较为具体的特征词,通过分析特征词能够获取有效的影响因素,同时,这些因素与实际理论具有较高契合度,基于社会认同理论与相关因素理论提出的模型对用户转移行为具有较好的解释效果。