qqqqqq
注册 登录
EN | RU | CN
  • 首页
  • 论文提交
  • 论文浏览
  • 论文检索
  • 个人中心
  • 帮助
按提交时间
  • 5
  • 9
按主题分类
  • 10
  • 4
按作者
  • 5
  • 4
  • 3
  • 3
  • 3
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
按机构
  • 13
  • 10
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
当前资源共 14条
隐藏摘要 点击量 时间 下载量
  • 1. ChinaXiv:202310.02985
    下载全文

    多任务环境下融合迁移学习的新冠疫情新 闻要素识别研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》

    赵梓博 王昊 刘友华 张卫 孟镇

    摘要: [ 目的 / 意义 ] 在新冠疫情背景下,提出多任务环境下融合迁移学习的疫情新闻要素识别方法, 向公众提供面向应急事件的知识服务。[ 方法 / 过程 ] 首先,通过多任务识别新闻要素:基于规则识别 时间要素;并融合模型迁移与深度学习方法,构建跨领域的要素识别模型。在此基础上,构建疫情新闻 要素的关联数据,以知识图谱的方式展示各要素之间的关联关系。[ 结果 / 结论 ] 实验结果表明,除药 物外的新闻要素的识别 F1 值均在 80% 以上,说明融合迁移学习的模型能够取得较优的识别效果;并且, 关联数据知识图谱能够直观显示新闻的重点要素及新闻的主要内容。综上所述,提出的方法能够有效识 别新冠疫情新闻要素,从而帮助新闻读者准确、高效地获取新闻中的重要信息。

    通过
     点击量 1340  下载量 661  评论 0
  • 2. ChinaXiv:202308.00601
    下载全文

    大数据时代哲学社会科学学术成果评价:问题、策略及指标体系

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》

    李品 杨建林

    摘要: [目的/意义]学术成果评价是推进哲学社会科学健康发展的重要因素,长期以来,传统同行评议和科学计量学方法在哲学社会科学学术成果评价中暴露出的问题越来越多,挑战固有方法的统治地位、开发有针对性的评价策略已刻不容缓。文章试图探索大数据环境下哲社学术成果评价的变革及其实现,特别是提出了大数据思维下的哲社学术成果的评价指标体系。[方法/过程]基于比较分析和综合分析,对传统哲学社会科学评价方法的弊端进行分析,然后对大数据给哲学社会科学评价带来的改变进行分析,最后提出基于大数据环境的哲学社会科学评价策略和指标体系。[结果/结论]提出大数据时代哲学社会科学学术成果评价的策略:由引文著录分析转向多维度的引用内容与行为分析,由面向成果的阶段性静态评价转向以学术活动为中心的全过程动态评价,由学术影响力评价转向学术价值和社会效益评价。在此基础上,构建由两个一级指标、5个二级指标和34个三级指标组成的大数据背景下哲学社会科学学术成果评价指标体系。

     点击量 1412  下载量 609  评论 0
  • 3. ChinaXiv:202308.00450
    下载全文

    城市应急管理情报平台构建研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》

    郭骅 屈芳 战培志

    摘要: [目的/意义]应急管理组织模式和城市风险环境的改变,促使情报体系组织关系和技术实现产生与之相适应的变革,情报平台提供了支持城市应急管理动态化网络运行的工具。[方法/过程]通过文献资料收集和案例分析,采用信息资源规划方法组织突发事件应急管理情报流,面向实时性、整合性的情报工作,推演构建城市应急管理情报平台。[结果/结论]城市应急管理情报平台为异构的管理信息系统和情报信息系统提供情报交换的渠道和情报生产的场所,并通过对城市系统的持续感知为应急管理提供不断更新的知识基础和实时动态的信息数据。

     点击量 1389  下载量 699  评论 0
  • 4. ChinaXiv:202307.00590
    下载全文

    人文社会科学外译图书评价指标体系研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》

    王伟 杨建林

    摘要: [目的/意义]人文社会科学精品图书外译是中华文化走出去的重要方式,建立外译图书评价指标体系能够展现图书影响力,为图书外译的内容类型选择提供指导。[方法/过程]从反映外译图书学术影响力和社会影响力的10个维度出发,细化评价指标。利用熵权法计算各项指标的权重,加权平均得到学术影响力和社会影响力的得分,对中华学术外译项目资助的外译图书进行实证分析。[结果/结论]40.48%的图书国内外影响力排名差值的绝对值大于10;部分国内学术影响力高的图书外译后未受到国外学者关注;外译图书的社会影响整体较低。选择外译图书的内容类型时需要同时考察该图书在国内和国外的学术影响和社会影响。

     点击量 1216  下载量 636  评论 0
  • 5. ChinaXiv:202304.00202
    下载全文

    学者学术影响力识别研究——基于引文全数据的视角

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    李铮 邓三鸿 孔嘉 张艺炜

    摘要: [目的/意义] 当前普遍应用的引文评价指标忽视了引文内容的差异性,本研究试图加入引用强度、引用位置、引用情感3个因素,并结合作者贡献度,提出一个基于引文的学术影响力评价指标。[方法/过程] 给出一个作者贡献度的计算公式,利用层次分析法确定引用强度、引用位置的权重,结合引用强度计算作者学术影响力AAI指标。[结果/结论] 通过实例效果显示,AAI指标综合考虑引用内容和作者贡献度,给简单的被引次数增加区分度,为学者学术评价提供新的思路。

     点击量 1407  下载量 670  评论 0
  • 6. ChinaXiv:201712.01359
    下载全文

    基于无标度网络模型和传染病模型的舆论 演化仿真研究*

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》

    韩 普 王 鹏

    摘要: 【目的】精确地呈现网络社交中信息传播状态和传播过程, 从而更深入理解网络信息的传播机制。【方法】 在无标度网络模型和传染病模型基础上, 加入可调整参数, 构建改进的网络信息传播模型, 并在 NetLogo 平台上 进行舆情传播演化仿真。【结果】仿真实验结果表明: 在信息传播过程中, 不断变化的传播速率能够更好地描述 网络信息传播; 在集群度大的网络中对信息传播进行引导和控制的最佳时机是在传播速率增大阶段。【局限】模 型对人群分类仍然不够精细。【结论】模型不仅能够在设定条件下模拟不同类型信息的传播过程, 还可以为网络 舆情监测、引导和控制提供支持。

    通过
     点击量 10183  下载量 2647  评论 0
  • 7. ChinaXiv:201712.01389
    下载全文

    基于 LSTM 模型的中文图书多标签分类 研究*

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》

    邓三鸿 傅余洋子 王 昊

    摘要: 【目的】利用 LSTM 模型和字嵌入的方法构建分类系统, 提出一种中文图书分类中多标签分类的解决方 案。【方法】引入深度学习算法, 利用字嵌入方法和 LSTM 模型构建分类系统, 对题名、主题词等字段组成的字 符串进行学习以训练模型, 并采用构建多个二元分类器的方法解决多标签分类问题, 选择 3 所高校 5 个类别的书 目数据进行实验。【结果】从整体准确率、各类别精度、召回率、F1 值多个指标进行分析, 本文提出的模型均有 良好表现, 有较强的实际应用价值。【局限】数据仅涉及中图分类法 5 个类别, 考虑的分类粒度较粗等。【结论】 基于 LSTM 模型的中文图书分类系统具有预处理简单、增量学习、可迁移性高等优点, 具备可行性和实用性。

    通过
     点击量 4782  下载量 3172  评论 0
  • 8. ChinaXiv:201712.01394
    下载全文

    中国农产品品牌评价研究的内容解析*

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》

    王雪颖 张紫玄 王 昊 邓三鸿

    摘要: 【目的】通过分析中国农产品品牌评价领域的文献题名总结该领域的研究现状。【方法】对该领域的文献 题名进行 K-means 聚类, 分析每簇研究的重点内容, 分别使用因子分析、多维尺度分析和层次聚类分析进一步解 析聚类得到的每簇文献的特点。【结果】文献数量总体呈现“M”型趋势, 文献多采用模糊综合法, 从多个评价角 度集中探讨评价指标体系、评价模型、影响因素等方面。【局限】仅针对题名进行分析, 未涉及关键词与摘要文 本。【结论】聚类结果较好地揭示了中国该领域的研究现状, 但没有反映出种类农产品、Interband 品牌评估法相 关内容。

    通过
     点击量 4182  下载量 2448  评论 0
  • 9. ChinaXiv:201711.01949
    下载全文

    中文文本聚类常用停用词表对比研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    官琴 邓三鸿 王昊

    摘要: 【目的】通过实验对比分析, 比较不同停用词表对于不同类型的文本数据的作用效果, 对停用词表的构建与使用提供参考意见。【方法】选取百度停用词表、哈尔滨工业大学停用词表以及四川大学机器智能实验室停用词表, 基于三个不同语料库运用汉语分词技术、TF-IDF 特征评估函数以及VSM 模型进行文本处理, 并且采用Java 编写的K-means 算法进行聚类实验, 通过准确率P、召回率R 和F1 三个评价指标对不同聚类结果进行效果评估。【结果】不同停用词表对于不同类型的文本数据作用效果差异明显, 词表的长度、内容结构是影响作用效果的直接因素, 其中两字停用词作用效果最为明显。【局限】实验文本类型及数量有限, 同时对于不同停用词表仅在词语数量及内容上做了简单的分析比较, 未对停用词按照类别分类进行实验分析。【结论】停用词表对于文本聚类准确度有很大的影响, 构建或选取适宜的中文停用词表极为重要。同时, 过度增加停用词的数量并不会一直改善聚类结果。

    通过
     点击量 11383  下载量 5959  评论 0
  • 10. ChinaXiv:201711.01975
    下载全文

    引文元数据的自动发现和标注方法研究——以外文引文为例

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    姜霖 王东波

    摘要: 【目的】在总结当前引文元数据抽取方法的基础上, 结合语义学知识和机器学习方法, 对引文元数据的自动抽取方法进行探索。【方法】实验中采用神经网络模型对人工分割过的语料进行词向量训练。利用相同类型的元数据会相对集中地出现在向量空间中某一位置的现象, 通过支持向量机分类算法实现对元数据的自动归类和标注。【结果】在以外文引文数据作为测试集的实验中, 本文方法取得了较高的准确率和召回率, 特别是针对引文中含有多种语言和缩写的现象, 具有较好的处理能力。【局限】在对于引文元数据时间内容的细粒度抽取中存在一定的局限性。【结论】实验结果表明, 此方法在引文元数据的自动发现和标注上具有良好的效果, 并能很大程度地提高方法的适用性和容错率。

    通过
     点击量 3354  下载量 1813  评论 0
  • 11. ChinaXiv:201711.01995
    下载全文

    引文元数据的自动发现和标注方法研究——以外文引文为例

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    姜霖 王东波

    摘要: 【目的】在总结当前引文元数据抽取方法的基础上, 结合语义学知识和机器学习方法, 对引文元数据的自动抽取方法进行探索。【方法】实验中采用神经网络模型对人工分割过的语料进行词向量训练。利用相同类型的元数据会相对集中地出现在向量空间中某一位置的现象, 通过支持向量机分类算法实现对元数据的自动归类和标注。【结果】在以外文引文数据作为测试集的实验中, 本文方法取得了较高的准确率和召回率, 特别是针对引文中含有多种语言和缩写的现象, 具有较好的处理能力。【局限】在对于引文元数据时间内容的细粒度抽取中存在一定的局限性。【结论】实验结果表明, 此方法在引文元数据的自动发现和标注上具有良好的效果, 并能很大程度地提高方法的适用性和容错率。

    通过
     点击量 3376  下载量 1895  评论 0
  • 12. ChinaXiv:201711.01257
    下载全文

    中文领域专业术语层次关系构建研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    朱惠 杨建林 王昊

    摘要: 【目的】对如何从中文非结构化文本获取术语的层次关系进行探讨。【方法】从CNKI 获取数字图书馆学科领域文献, 通过术语抽取、术语向量空间模型构建、BIRCH 算法聚类和聚类标签确定构建术语的语义层次结构。【结果】构建数字图书馆领域术语的层次结构, 并对构建结果进行验证, 聚类正确率达到80.88%, 类标签抽取正确率达到89.71%。【局限】对构建效果的验证是通过随机抽样进行的, 且仅与一种其他构建方法进行实证比较。【结论】应用BIRCH 算法聚类构建术语层次结构, 该方法与K-means 聚类方法相比具有明显优势, 具备较高的执行效率和聚类有效性。

    通过
     点击量 3204  下载量 1715  评论 0
  • 13. ChinaXiv:201711.01199
    下载全文

    基于CRFs 的冶金领域中文专利术语抽取研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    王密平 王昊 邓三鸿 吴志祥

    摘要: 【目的】探讨冶金领域中文专利术语抽取模型的最优条件, 用于有效地抽取冶金领域专利术语。【方法】使用尚不完善的核心语料库, 在无需人工标引的情况下, 采用条件随机场(CRFs)构建字角色标注的冶金领域中文专利术语识别模型。详细说明模型的构建过程, 同时重点对比CFRs 的各个因素(特征组合、字长窗口等)对识别效果的影响。【结果】实验结果表明字序列、级别特征、领域特征、温度特征的组合在字长窗口为3, c 等于1,f 等于1 时, 准确率达到94.26%, 召回率达到94.37%, F1 值达到94.5%。【局限】核心词典欠完善, 使得部分词语标注不够准确; 未与其他方法作详细比较, 未详细说明CRFs 的可靠性。【结论】CRFs 在适当的角色和特征以及特征模板的组合下能较好地识别出冶金领域的中文专利术语。

    通过
     点击量 6753  下载量 1851  评论 0
  • 14. ChinaXiv:201711.01252
    下载全文

    采用连续词袋模型(CBOW)的领域术语自动抽取研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    姜霖 王东波

    摘要: 【目的】更准确便捷地完成术语词汇的自动抽取。【方法】利用CBOW 模型计算构成术语的各个词部件的向量空间模型。通过词向量之间的余弦相似度衡量术语词汇内部各个词部件的关联度。利用PageRank 算法计算候选词汇的领域代表性并排序, 通过阈值的设定, 抽取出更为具有领域代表性的术语词汇。【结果】在以自然语言处理领域内的论文摘要作为数据集的实验中取得较高的准确率和召回率。【局限】测试的数据训练集偏小,而数据集的训练效果直接影响实验的效果。【结论】实验结果表明利用CBOW 模型完成术语的抽取工作是一个较为合理、可行的方法。

    通过
     点击量 3566  下载量 2230  评论 0
友情链接 : ChinaXiv PubScholar 哲学社会科学预印本
  • 运营单位: 中国科学院文献情报中心
  • 制作维护:中国科学院文献情报中心知识系统部
  • 邮箱: eprint@mail.las.ac.cn
  • 地址:北京中关村北四环西路33号
招募预印本评审专家 许可声明 法律声明

京ICP备05002861号-25 | 京公网安备110402500046号
版权所有© 2016 中国科学院文献情报中心