qqqqqq
注册 登录
EN | RU | CN
  • 首页
  • 论文提交
  • 论文浏览
  • 论文检索
  • 个人中心
  • 帮助
按提交时间
  • 1
  • 1
按主题分类
  • 1
  • 1
按作者
  • 1
  • 1
  • 1
  • 1
  • 1
按机构
  • 1
  • 1
  • 1
当前资源共 2条
隐藏摘要 点击量 时间 下载量
  • 1. ChinaXiv:201901.00190
    下载全文

    基于最近邻距离权重的ML-KNN算法

    分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-28 合作期刊: 《计算机应用研究》

    陆凯 徐华

    摘要: 在大数据环境下,K近邻多标签算法(ML-KNN)高时间复杂度的问题显的尤为突出;此外,ML-KNN也没有考虑k个近邻对最终分类结果的影响。针对上述问题进行研究,首先将训练集进行聚类,再为测试集找到一个距离其最近的训练数据簇作为新的训练数据集;然后计算最近邻样本的距离权重,并用该权重描述最近邻和其他近邻对预测结果的影响;最后使用新的目标函数为待测样本分类。通过在图片、Web页面文本数据等数据集上的实验表明,所提算法得到了更好的分类结果,并且大大降低了时间复杂度。

    通过
     点击量 2446  下载量 1398  评论 0
  • 2. ChinaXiv:201712.01389
    下载全文

    基于 LSTM 模型的中文图书多标签分类 研究*

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》

    邓三鸿 傅余洋子 王 昊

    摘要: 【目的】利用 LSTM 模型和字嵌入的方法构建分类系统, 提出一种中文图书分类中多标签分类的解决方 案。【方法】引入深度学习算法, 利用字嵌入方法和 LSTM 模型构建分类系统, 对题名、主题词等字段组成的字 符串进行学习以训练模型, 并采用构建多个二元分类器的方法解决多标签分类问题, 选择 3 所高校 5 个类别的书 目数据进行实验。【结果】从整体准确率、各类别精度、召回率、F1 值多个指标进行分析, 本文提出的模型均有 良好表现, 有较强的实际应用价值。【局限】数据仅涉及中图分类法 5 个类别, 考虑的分类粒度较粗等。【结论】 基于 LSTM 模型的中文图书分类系统具有预处理简单、增量学习、可迁移性高等优点, 具备可行性和实用性。

    通过
     点击量 4788  下载量 3174  评论 0
友情链接 : ChinaXiv PubScholar 哲学社会科学预印本
  • 运营单位: 中国科学院文献情报中心
  • 制作维护:中国科学院文献情报中心知识系统部
  • 邮箱: eprint@mail.las.ac.cn
  • 地址:北京中关村北四环西路33号
招募预印本评审专家 许可声明 法律声明

京ICP备05002861号-25 | 京公网安备110402500046号
版权所有© 2016 中国科学院文献情报中心