分类: 信息科学与系统科学 >> 信息科学与系统科学基础学科 提交时间: 2025-01-05
摘要: 本书是针对数据科学初学者的入门教程,通过R和Python两种编程语言,详细介绍了数据科学的基本概念、数据处理、数据分析、数据可视化、统计建模、机器学习以及深度学习等核心内容。书中通过丰富的实例和详细的步骤说明,帮助读者掌握数据科学的基本流程和方法,提升数据处理和分析能力。同时,本书还强调了实践的重要性,鼓励读者通过动手实践来加深对数据科学理论的理解和应用。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2024-09-04
摘要: [目的/意义]针对目前信息资源管理一级学科自主知识体系建设的需求,构建面向知识演化的概念流模型。[方法/过程]基于表征概念的学术论文集合,使用论文频次统计和文献计量方法,描述了概念的流动速度、密度等重要特征,引入流体力学中的雷诺数构建领域概念流模型,区分层流、过渡流、湍流3种不同的流动形态。最后以“数据管理与数据科学”为例,论证了领域概念流动的基本过程和特点。[结果/结论]实证研究表明,本文提出的领域概念流模型能够揭示领域内部概念流动特征和现象:领域内部概念在兴起阶段通常处于有序的层流状态,在发展阶段呈现层流和湍流的交替变化,符合事物发展过程中的螺旋式上升规律,直至抵达暂停或消亡阶段。[局限]本研究仅选取“数据管理与数据科学”二级学科中的部分核心概念进行实证分析,尚未延伸至信息资源管理一级学科中的各二级学科。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2024-04-21
摘要: 目的/意义 作为新型生产要素的数据要素与其他要素一起共同构成全要素,为全球经济社会发展提供重要动力。数据要素是我国首次提出的重大理论创新,系统收集、梳理、剖析我国数据要素研究的代表性成果,构建中国特色的数据要素知识框架体系,为全球数据要素的理论研究及实践探索提供借鉴和启示。 方法/过程 主要采用网络调查、文献调研、内容分析法归纳我国数据要素研究的56篇具有代表性的文献内容、14份政策报告以及专家观点等,从内涵阐释、价值释放、运行机理与治理体系4个方面进行梳理和分析。 结果/结论 我国数据要素研究成果丰硕,知识框架体系基本形成,在价值实现与市场培育方面取得了一定进展,但在数据要素的有效运行以及数据要素治理方面仍具有较大提升空间,未来研究需要注重统筹推进数据要素治理体系建设并促进与应用场景的结合进而发挥乘数效用。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-26
摘要: 本文研究了公共数据采集的标准规范选择、科研教育机构的科学数据汇交制度以及科研资助机构的课题项目数据汇交管理,为公共数据的开放利用提供基础。我们强调公共数据的开放利用价值和目标选择,并提出科研机构和人员应遵守相关规定以提高公共数据的开放利用价值和目标选择的效果。基于工作实践,本文提出社会资助课题的数据汇交方式,科研教育机构的公共数据保存制度和科学数据人才队伍建设的重要性。参考了欧洲开放科学云和欧洲11个国家的科研资助组织提出了促进知识经济和全球数据价值链发展的措施,要求所资助的科研项目的每篇论文发表后立即开放获取的要求。调查了国际科学数据中心正在积极开展人才培养工作,提高科研人员的数据管理能力,促进公共数据的开放共享和利用。指出欧盟投资建立欧洲数据科学研究院,正在培育具备技能和详尽知识的新一代数据科学家。为了实现公共数据的开放利用价值和目标选择需要借鉴国际经验,本文建议制定适合我国国情的数据开放共享政策,建立数据共享平台,提高数据利用效率,推动科学研究的进步和社会经济的发展。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》
摘要: [ 目的 / 意义 ] 数据驱动科研的战略意义已在多国发展规划中有所显现,图书馆届也持续发出探 讨管理科研数据的具体途径和实践方法的呼声。通过观测德国国家科技图书馆(German National Library of Science and Technology, TIB)依托产品线推行发展战略的实践,以期获得借鉴参考。[ 方法 / 过程 ] 利用文 献调研和案例分析,依照 “ 战略层-战术层-作业层 ” 的层次逻辑,调查并分析德国国家科技图书馆发展 实践,重点挖掘了其四大战术产品线特色,并与国内类似服务对比。[ 结果 / 结论 ] 战略响应当紧扣战术部 署,国内科研数据管理应注重非文本资源,项目实施应与人才培养相互促进。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]科技创新是现代化经济体系的重要战略支撑,改革开放后,为推动我国经济发展,出台并实施了一系列科技政策旨在促进科技发展,但是这些科技政策的资助效应如何,科技政策实施历史周期中资助效应的变化情况如何已经引起广泛关注。[方法/过程]以已经实施了20年的国家杰出青年科学基金地球科学项目为研究对象进行实证分析,为克服样本选择偏误所导致的内生性问题,采用DID模型评估杰青基金对科学家科研论文产出效率的影响,提出环境-动机-行为模型对研究结果进行解释。[结果/结论]实证结果表明,1994-2008年杰青基金资助效应显著的年份达到12年,显著比例达到80%;相比没有获得杰青基金资助的科学家,获得杰青基金资助的科学家可以多发表论文0.412-3.234篇/年;数据换算后,与每年获得杰青基金资助科学家的同时期其他科学家相比,获得杰青基金资助的科学家可以多发表论文0.426-3.277篇/年;资助效应最大的是2002年杰青基金,2007、2008年杰青基金资助效应不显著;科技政策资助效应评估时,可以通过该方法构建对照组,实现因果效应推断的研究目的。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》
摘要: 目的/意义 探寻新时代情报学与情报工作的内涵,重新认识情报学与情报工作当前和未来的新定位。 方法/过程 总结 情报学与情报工作发展论坛(2017) ,解读《情报学与情报工作发展南京共识》,提出情报学与情报工作未来发展的主要特点与总体趋向。 结果/结论 在变化的时代面前,情报学与情报工作需要转型与变革,突破以文献为基础的学科固有范式,拓展以情报交流为特征的学科边界,从而以智能情报分析为核心,以技术开发应用为手段,以大数据为核心能力,以数据科学为新的增长点,构建情报学与情报工作新的核心能力与竞争力。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》
摘要: [目的/意义] 科研论文产出时间序列的传统研究均基于科研人员整体的平均论文产出,此种方法研究所得规律能否代表全部科研人员个人的论文产出规律,既是科研人员成长规律研究的重要内容,也是科技政策评价的重要内容。[方法/过程] 实证分析以国家杰出青年科学基金地球科学项目为研究对象,通过构建分段线性回归模型对杰青基金资助前后杰青科学家个人论文产出规律进行研究,并与杰青科学家整体论文产出规律进行对比。[结果/结论] 研究结果显示,杰青基金资助前后,杰青科学家整体论文产出呈现持续增长的规律,杰青科学家个人论文产出呈现4种规律,其中31.7%的杰青科学家个人论文产出规律与杰青科学家整体论文产出规律不一致,科技政策定量评价时该方法可以将研究精确到每名科学家。
分类: 统计学 >> 社会统计学 提交时间: 2023-08-12 合作期刊: 《中国科学院院刊》
摘要: 文章从理论和实践层面对科研范式变革的主要内涵和重要影响进行综合性探讨。在理论层面上,从库 恩及其代表作《科学革命的结构》入手,探讨“范式”概念的逻辑本质。在实践层面上,通过问卷调查和访 谈等形式,调研、凝练出新时代科研范式变革的3个方面内涵:解决系统性复杂问题成为新时代科研范式变 革主要驱动力,仿真模拟和数据科学可能成为推动科研范式变革的有效突破口,科研活动组织创新成为推动 科研范式变革的基础。在此基础上,分析目前我国应对科研范式变革存在的问题,并提出相应的政策建议。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》
摘要: [目的/意义] 杰青基金实施25年来,资助者年龄呈大龄化趋势发展,深入分析该现象对完成杰青基金的影响,对未来杰青基金管理具有重要意义。[方法/过程] 研究以1994-2018年杰青基金地球科学项目为研究对象,构建科研论文产出效率、创新能力和学术影响力三个评价指标,提出科技人力资本投入-科研产出理论模型及假设,采用DID模型克服样本选择性偏误所导致的内生性问题,验证理论假设,实现对杰青基金资助年龄异质性的研究。[结果/结论] 实证结果表明:杰青科学家大龄化趋势日趋严重,存在明显的45岁现象;杰青基金实施20年中,支持资助年龄越大,资助效应越好假设的比例较低;三个评价指标维度,资助效应最大且资助年龄在39-42岁之间的年份在杰青基金实施20年中所占比例最大。因此,无论从杰青基金设立宗旨、还是从评估结果来看,都应该避免杰青科学家大龄化趋势,扩大对中低龄优秀青年人才的资助。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]情报学作为计算性较强的人文社科学科,具备数据科学的特点,大数据相关技术能为情报学提供有效手段,因此,设立情报学取向的数据科学与大数据技术专业,培养具有大数据思维和扎实的情报学专业基础、掌握大数据处理技术及分析理论、并能将其应用于情报学理论与实践的复合型人才,能够促进情报学学科发展。[方法/过程]对国内外大数据相关专业的培养目标和课程设置模式进行调研,总结学科教育发展特色,结合国内的教学资源情况,设计情报学取向的大数据专业人才培养计划。[结果/结论]情报学与大数据既有联系又有不同,情报学为大数据提供了基础研究方法,促进了多源数据融合,拓宽了大数据的应用领域;大数据为情报学研究提供了更多的可能性、丰富了研究方法,提升了研究效率、扩大了研究范围。情报学取向的大数据与数据科学专业人才的培养,既有其必要性,又有其不可替代性。学科体系需进一步改革创新,设立更多紧密结合大数据与情报学专业的新兴课程,如文献大数据分析、用户大数据研究等,系统地培养学生将情报学领域知识与计算机技术和大数据技术融合创新的能力。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]通过对《美国国家医学图书馆战略规划:2017-2027》的剖析和解读,为我国医学图书馆的管理、服务和长远发展提供参考和借鉴。[方法/过程]从制定过程和战略内容两个角度对美国国家医学图书馆新版规划进行梳理和分析,着重解读其未来10年的发展目标建设生物医学发现和数据驱动健康的平台,以及科研支撑、用户服务和教育培训3个层面的战略规划、行动建议。[结果/结论]在健康中国战略的新时代背景下,为了推动我国医学图书馆的转型与发展,应该关注以下几个方面:制定科学的战略规划、重视新技术的发展趋势及其应用、注重合作关系的建立与维护、推动健康信息服务的社会化。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 调查数据科学课程群建设现状,聚焦数据科学人才培养方案,为我国高校信息学院数据科学教学实践提供参考和借鉴。[方法/过程] 基于UIUC (美国伊利诺伊大学香槟分校)信息科学学院的数据科学课程实践,首先调研该院数据科学相关课程的名称、简介、学制学时、授课形式、授课教师及授课对象,然后从培养对象类型、授课形式、授课合作程度和课程内容4个方面对课程群进行系统分类和比较分析,最后对我国高校数据科学课程建设提出若干建议。[结果/结论] UIUC数据科学课程群可分为六大类别,面向本硕博各阶段学生,采用线上线下相结合的混合式教学方式,通过教师合作开展授课,教学内容紧密跟随数据科学岗位市场需求。因此,我国高校在数据科学领域应强化培育连续性、丰富教学创新性、加强教师授课合作性、增强研究方向完备性。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 智慧数据是"智慧地球"背景下数据科学领域的新概念,目前其理论探讨与实践应用均在迅速发展。梳理学界对其认知脉络,凝聚共识、辨析差异,对厘清智慧数据理论体系和促进智慧数据应用开发意义重大。[方法/过程] 在广泛深入阅读国内外领域相关文献的基础上,将智慧数据研究脉络梳理为概念内涵、价值取向、关键技术与应用框架四个分面,通过对比与分析,归纳出智慧数据的三种概念视角、五个特性特征、五类价值取向、三簇关键技术和五大应用领域。[结果/结论] 研究发现,智慧数据的本质在于通过数据演进或结构设计实现数据规范精准及价值增值,其价值取向呈现出多元化复合特征,其技术体系旨在提供"可计算-可理解-可会话"的逐级演进支撑,其应用框架核心在于精准实现"数据"与"用户"的智慧交互,未来智慧数据理论体系还需在大"数据科学"观下围绕理论体系构建、数据权利治理、技术均衡发展、服务层级深化、理论实践交融等不断完善。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 在大数据浪潮和“新文科”背景下,中国图情档学科的人才培养范式亟需改革。与此同时,大数据相关专业的建设方兴未艾,对于图情档学科的人才培养新范式建设具有借鉴意义。[方法/过程] 采用一种时序主题网络模型及计算方法;通过搜集、处理、统计、分析259所高等院校的大数据专业培养方案文本,在时间维度上进行主题挖掘,总结归纳数据科学课程的层次;分析图情档学科主干知识与大数据专业的联系,并给出适合图情档学科的数据科学课程建议。[结果/结论] 结果表明,所采用的时序主题网络模型方法能够较好地契合大数据专业的人才培养范式发展分析,可以成为研究学科主题的一种方法。此外,还给出面向图情档学科的数据科学类课程建议,可供图情档学科的人才培养参考。
分类: 其他 >> 综合 提交时间: 2023-03-31 合作期刊: 《农业图书情报学报》
摘要: [目的 / 意义]科学数据管理 FAIR 原则从 2016 年正式发布到目前为止引起了国内外学者的广泛关注和重视,围绕 FAIR 原则开展了诸多探索和研究,有力地推动了 FAIR 原则的实施和推广,本文旨在对相关学术成果进行系统梳理和深入总 结。[方法 / 过程]通过文献调研和内容分析,从 FAIR 原则组织保障、FAIR 的 4 个基本原则、FAIR 原则的实践探索、FAIR 原 则的学科应用及FAIR 原则的区域应用5 个角度梳理国内外对FAIR 原则的研究进展和实践,总结研究现状和已有成果。[结果/ 结论]国外对于 FAIR 原则的研究集中在理论、实施策略、评估方法等方面,并已在医学等学科领域展开了深入探索,相比之 下,国内的研究尚在起步状态,亟需国家的政策支持和相关组织的跟进。
分类: 其他 >> 综合 提交时间: 2023-03-28 合作期刊: 《中国科学院院刊》
摘要: 数据科学的发展,将为计算智能的持续发展提供新的可能与机遇;与此同时,计算智能的发展与新型智能范式的兴起,也将为大数据在各行业和各领域的应用提供新的契机。文章阐述了数据科学的内涵,探讨了计算智能的发展与新型智能范式,列举了引领数据科学与计算智能研究的应用方向;进而基于香山科学会议第667次学术讨论会与会专家的讨论,提炼形成数据科学与计算智能领域的七大关键问题,以期使该领域研究得到相关领域研究者与应用者的共同关注,从而把握时代的机遇,推动数据科学与计算智能持续发展。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-03-27
摘要: 目的/意义 数据故事化是一种更高效、更全面、更新颖地展示数据分析结果的方式,通过分析我国数据故事化研究的代表性文献,对现有研究成果进行系统梳理,并对研究势趋进一步展望,为后续研究提供借鉴和启示。 方法/过程 主要采用内容分析法归纳我国现有的有关数据故事化研究的21篇文献内容,从概念内涵、基本流程、相关模型以及应用实践4个方面对我国数据故事化的研究进展进行梳理和分析。 结果/结论 数据故事化研究在我国尚处于起步阶段,在内涵、流程、模型、方法、工具等理论研究以及实践应用领域存在较大提升空间,未来研究注重构建我国数据故事化研究的自主知识体系和应用实践体系。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】在调查分析全球数据科学课程建设现状的基础上, 提出数据科学课程的共性特点、主要挑战及解 决对策。【方法】采用实证研究方法和内容分析方法调查分析国内外数据科学课程的建设现状、成功经验与存在 问题。【结果】提炼出全球数据科学课程的共性以及数据科学与其他相关课程之间的差异性。【局限】对数据科 学人才培养的讨论主要聚焦于课程建设层面, 而对专业层面的讨论不多。【结论】本文提出数据科学课程建设中 的 10 个核心问题及其解决方案。