【摘 要】教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑,实现科技赋能教育是推进教育公平的重要途径。随着近年来信息化建设带来科教领域相关数据和资源积累,研讨体系化的科教资源管理中的关键问题并探求其发展趋势,兼具理论研究与实践应用价值。文章分析了面向新一代人工智能科教资源管理的发展现状和挑战,从软件定义范式和协同共建机制两个角度,系统地阐述了“软件定义—资源调配—知识体系—流通评估”多维度、多层次贯通的“人—机—物”融合的科教资源管理体系。最后,文章论述了科教资源管理的发展趋势,以期为国家级或区域性统筹的科教资源管理体系化建设提供借鉴和启示。
当今世界正处在新一轮科技革命和产业变革取得关键突破的重要时期,由科技创新、教育创新推动的产业创新如火如荼,迫切需要加快对优质科教资源的共建共享和体系化建设,充分贯彻落实“科教融合、协同育人”战略决策,促进协同科技创新和人才培养[1]。与此同时,经过数十年的信息化建设,高等院校、科研院所等科教机构已积累海量的科教数据和软硬件资源。因此,如何在全国或区域内统筹优化科教资源配置,减少科教资源的重复建设,节约科教建设资金,成为亟待解决的问题[2]。
随着科教资源的井喷式增长,实现跨部门、跨领域的科教资源共建共享和健全相应知识产权保障机制,对支持基于人工智能的科教技术(简称人工智能科教技术)发展、破解“认知过载”“学习迷航”等难题具有重要意义[3]。近年来,以全球学习、个性化学习、智能导学等为代表的人工智能科教技术已成为支撑科教发展的基础性技术[4]。为适应新一轮智能化革命浪潮,中央、国务院在2019年印发的《中国教育现代化2035》中提出教育现代化要“建立数字教育资源共建共享机制,完善利益分配机制、知识产权保护制度和新型教育服务监管制度”[5]。为实现科教资源的体系化建设,本文首先基于软件定义思想实现硬件资源虚拟化和管理应用可编程,在此基础上建立“软件定义—资源调配—知识体系—流通评估”多维度、多层次贯通的“人—机—物”融合的科教资源管理体系。
具体来说,针对现有科教资源管理体系无法对分散、重复、各自为战的资源进行统一管理的问题,提出了基于多层次混合推理的科教资源调配和科教资源协同共建方法,以整合物理分散的科教资源;针对传统以高校和科研院所等为建设主体的科教资源信息化方式难以应对海量新知识涌入的问题[3],提出了“学科体系(S)+异构资源(R)→知识图谱(G)”的科教资源组织形式,实现对快速迭代更新的科教资源的有效管理;针对科教资源流通中面临的知识产权保护难和利益分配不合理导致的资源共建动力弱的问题,借鉴区块链技术的智能合约机制,为不同粒度的科教资源提供数字化认证与知识产权保护服务,实现对科教资源的许可身份认证和追踪,促进科教资源共享。
近年来,西安交通大学贯彻落实教育部“分领域协同共建知识图谱、教学视频、电子课件、习题试题、教学案例、实验实训项目等,形成优质共享的教学资源库”[6]的要求,切实推进基于知识森林构建和组织[7]的人工智能科教资源管理体系,实现了跨模态、跨领域的优质科教资源融合和管理,促进了跨学科的知识共建共享和数字化认证工作。
本文结合科教资源管理的理论研究与实践经验,系统地阐述新一代人工智能科教资源管理体系,并论述科教资源管理的发展趋势,以期为国家级或区域性统筹的科教资源管理体系化建设提供借鉴和启示。
针对“科教”概念的界定,相关文献将其划分为三个层次[8]:第一种是科教管理部门,如科技部、教育部等,强调自上而下的行政管理;第二种是科教活动,如科学研究、课堂教学等,强调微观、具体、可操作;第三种是科教机构,如高等院校、科研院所等,强调承载科研活动的实体。
针对“科教资源”概念的界定,目前相关文献一般从宏观政策和方法论的角度进行论述。袁锁鸿从宏观角度给出了科教资源的定义,将国家的科学教育建设、人才储备和原创产出能力整体定义为科教资源[9]。梁玉栋认为科教资源是院所建设、创新平台建设及校企合作所能提供的创新优势的基础[10]。可见,已有研究针对“科教资源”的定义多是从宏观角度和方法论入手,缺乏可量化、可操作的严格定义。为此,本文将“科教资源”定义为科教相关的数据、知识、软硬件载体及其关系。以人工智能学科为例,科教资源主要包括三类要素,即教学资源(如教程、视频、试题等)、算法资源(如框架、算法、数据集等)和算力资源(如GPU、网络设备等)。
随着人工智能技术的普及,以个性化学习等为代表的人工智能科教技术已经逐渐成为科教发展的重要支撑[4]。《中国教育现代化2035》指出:“互联网、人工智能等新技术的发展正在不断重塑教育形态,知识获取方式和传授方式、教和学关系正在发生深刻变革。”[5]
然而,由于科教资源具有来源广泛、海量异构、需求动态多样的特点,现有的科教资源管理体系无法对分散、重复、孤立的资源进行统一管理,难以满足人工智能科教发展的资源调度需求。同时,人类社会正朝着有机演化和无机智慧化并存的方向发展,在2019年个体每天接收的信息量是1986年的8.5倍[3]。在科教领域同样如此,数据和软硬件资源的增长和迭代更新速度远超过去的任何时期,传统的以高校和科研院所等为主体的科教资源建设方式已经难以应对海量新知识的涌入。此外,由于缺少对科教资源质量控制和用户贡献计算等机制与技术的引入,当前科教资源的流通共建面临知识产权保护难和利益分配不合理等问题。因此,随着科教资源的井喷式增长,实现跨部门、跨领域的科教资源共建共享和健全知识产权保障机制,对支持科教领域发展、破解“认知过载”“学习迷航”等难题具有重要意义[3]。
2016年,人工智能技术诞生60周年。这一年,AlphaGo战胜世界围棋冠军李世石,开启了人工智能发展的新浪潮,人工智能技术迅速融入人类社会的方方面面。在这样的背景下,人工智能与教育的深度融合已成为未来教育的必然趋势,推动了教育知识生产主体、过程和形式的现代转型[11]。当前,各界对人工智能赋能教育持续关注,中央、国务院于2020年印发《深化新时代教育评价改革总体方案》,强调充分利用人工智能、大数据等信息技术提高教育评价的科学性、专业性、客观性[12],促进人工智能与教育测评的融合发展。夏立新等人[13]以华中师范大学人工智能教育学部作为案例研究对象,探索“人工智能+教育”人才培养的模式创新。徐晔[14]从现阶段人工智能与教育融合的实然状态入手,探究人工智能与教育深度融合的路径,多元协同构建智能网络学习空间。胡小勇等人[15]对人工智能热潮下学习者高阶思维研究的新发展开展了综述研究,梳理了“大数据技术支持的学习者思维特征建模”等10个重点研究方向。然而,对面向新一代人工智能的科教资源管理、科教资源共建共享和流通的技术路线和价值意义尚缺少深入研究。
本文将科教资源定义为科教相关的数据、知识、软硬件载体及其关系。为应对当前科教资源融合一体化及快速发展带来的挑战,基于软件定义理论将科教资源虚拟化为可编程实体。例如,在人工智能学科中,科教资源具有“算法数据一体、软件硬件一体、知识应用一体”等新特征,因此将算法、软件、硬件、知识、应用等统一虚拟化以实现可编程管理,是实现科教资源融合管理、贯通的“人—机—物”的重要基础。软件定义的科教资源本质上是把原先一体化的硬件设施打破,将科教资源虚拟化,并提供标准化、模块化的基本功能,进而实现科教资源的模块化管理和相关硬件资源的虚拟化调度。
科教资源的合理调配与协同共建是实现体系化科教资源管理的基础。其中,科教资源调配解决的是由科教资源库到获取科教资源的主体的资源流动问题,科教资源的协同共建解决的是拥有科教资源的主体到科教资源库的资源流动问题。
以往的科教资源调配方法大多针对同学科、同来源、同类型的资源,例如针对课程个性化推荐的调度模型[16]。由于所需处理的数据均为相同或相似类型,这些方法通常基于简单的局部推理展开;而当前科教资源调配面临新的要求,需实现跨学科、跨来源的个性化全局调配。因此,本文在局部推理的基础上引入全局推理策略,提出了基于多层次混合推理的科教资源调配方法,包括关系图构建、表征融合和推理规则构建。其中,实现全局推理至关重要的是对全局关系的学习,构建全局关系图是实现多层次混合推理的基础。将虚拟化后的科教资源及其抽象特征作为全局图中的节点,将依照软件定义思想虚拟化后的科教资源关系元组及关系特征融合并抽象化为语义依赖关系,将其作为全局图的边,从而构建起异构的科教资源关系图。
科教资源协同共建指多个拥有科教资源的主体之间共同完成科教资源设计与建设的过程,旨在实现资源创造、资源共享和资源创新。上文已提到,将科教资源定义为科教相关的数据、知识、软硬件载体及其关系,其中,知识图谱的作用主要是对科教资源进行组织和更新。
科教资源的知识图谱呈现多维度、多层次的特点,即图中节点包含多种异构要素,同时图中关系由多种异构关系组成。以人工智能学科为例,科教资源主要包括三类要素,即教学资源(如教程、视频、试题等)、算法资源(如框架、算法、数据集等)和算力资源(如GPU、网络设备等);包括四种关系集合,即教学—算法集合、教学—算力集合、算法—算力集合以及全集合。实现科教资源的协同共建,需要依靠知识图谱对科教资源要素间的关系和状态进行判断、组织。
科教资源的协同共建首先需要获取主体能够贡献的资源要素,将其语义化,同时获取该资源要素对应的映射关系集合;其次,根据该映射关系集合,在知识图谱上进行语义推理获取该要素资源的依赖关系、存续等要素状态;最后,主体依据其自有资源情况进行资源调配,对科教资源进行添加和补充,并判断该资源要素是否已经完善。
随着科学技术的进步,各学科知识井喷式涌现,呈现出高频更新等特点。新知识的出现往往引领着学科发展的新方向,但这类知识通常样本量少,具有小样本的特点,导致低频关键知识获取难题;同时,学科知识的来源涉及多种载体,如文本、视频、图片等,导致多源异构知识间融合难题;进一步地,由于学科知识不断涌现,学科知识本身具有时变特点,导致组织这类资源时面临时效性难题。
针对上述三个难题,本文开展了小样本知识获取、异构知识融合以及知识可演化的学科知识图谱构建,提出了“学科体系(S)+异构资源(R)→知识图谱(G)”的科教资源组织形式(如图2所示),研究了重点学科的知识图谱构建与自动演化机制,为软件定义的科教资源组织和管理提供支撑。
针对小样本场景下学科知识体系的知识获取,本文提出了面向小样本场景的“实体抽取—关系抽取—语义嵌入表征”三阶段学科知识体系构建方法。具体地,利用少量标注数据解析上下文中的复杂语义,基于大规模预训练语言模型(如GPT-3)实现小样本学科知识实体的自动获取与向量化表示;基于提示学习和上下文学习技术,结合大规模预训练语言模型的无梯度学习方法,利用语言模型参数中存在的知识,实现低频学科知识实体间关系的抽取;基于学科知识向量表示和实体间的关联拓扑特征,对不同学科间的知识实体进行关联性非独立嵌入,实现对学科知识的统一表示。
针对异构科教资源的自动获取与融合,提出“置信度评估—一致性表达—实体映射”三阶段的异构科教资源获取与融合方法。具体地,基于统计假设检验,对从开放知识源获取的知识进行置信度评估,仅将高置信度的纳入科教资源库,实现异构科教资源高质量构建;基于多模态实体对齐方法,进行不同模态间的实体统一对齐,对多源异构科教资源进行关联性非独立嵌入,实现科教资源的一致性表达;基于多标签多分类的实体间映射方法,建立异构科教资源间的围观映射,深入学科实体内部,弥补异构学科资源鸿沟,实现异构科教资源的协同。
针对学科知识不断涌现的特点,提出了“实体更新—关系补全—图谱演化”的学科知识图谱自动演化机制。具体地,基于归纳学习和转导学习理论,挖掘新旧学科知识实体间的原型表示和聚类关系,将新学科知识实体链接到现有科教资源中,完成学科知识实体级的演化更新;基于向量化原型表示方法,通过对已有关系的原型计算,将新出现的实体间关系链接到已有关系原型中,实现新关系的增量补全;基于持续学习理论,通过与已有学科知识进行对比,对新增学科知识进行消歧和剪枝,实现学科知识图谱的自动演化,保证科教资源的时效性。
科教资源的共建共享面临共建激励和知识产权等问题,需要建立完善的流通许可与管理机制。它包含两方面的内容:一方面,综合考虑科教资源的海量性与分散性,建立多方协同的知识产权管理体系,实现对科教资源流通许可的智能化、自动化分发、维护与撤销等;另一方面,为避免“使用但不建设”这类行为,促进科教资源的不断积累和完善,建立健全的科教资源公平激励机制。
科教资源的许可管理面临的挑战:如何在不同的资源平台之间建立可信、可追溯、统一、对等的许可体系。为此,本文基于联盟区块链及智能合约,构建多方协同、可信、可追溯的科教资源许可管理体系,构建“数据层—共识层—合约层—应用层”的层次化许可管理框架(如图3所示)。
数据层:科教资源许可管理的核心在于对科教资源数据的管理。基于区块链的科教资源管理平台包含三类数据:(1)科教资源数据摘要,用于保证科教资源的完整性与可信性;(2)科教资源许可数据,指科教资源拥有者分发的许可证数据;(3)资源操作数据,指资源的发布、许可的分发、修改与撤销等操作历史记录,能够为版权纠纷、资源滥用等提供证据。
共识层:区块链的核心,是保证许可可信与安全的重要机制。考虑到海量科教资源对区块链性能的高需求,使用区块链分片技术搭建底层同步机制,为构建高并发、去中心化、可信可追溯的科教资源交流、交易、开放、共享平台提供支撑。
合约层:智能合约是区块链的重要组成部分,是扩展区块链应用的关键技术。利用智能合约作为连接共识层与上层应用层的中间层。设计了两类智能合约,即共识节点管理合约与科教资源许可管理合约,前者用于对构建区块链共识节点的管理,后者则基于智能合约对资源许可进行管理。
应用层:基于区块链智能合约构建一系列许可管理任务,实现不同粒度的科教资源数字化认证与知识产权保护服务。具体包括以下功能:(1)建立科教资源的数字证书管理机制,实现对科教资源知识产权的数字化管理,提供科教资源证书的可信分发与认知服务;(2)建立科教资源的共享许可管理机制,发挥区块链智能合约自动执行的优势,实现共享许可的自动生效、验证与撤销;(3)结合区块链可追溯、不可篡改的特点,实现对科教资源知识产权的许可身份认证和流通过程的全流程追踪,基于智能合约完成对科教资源的自动确权与侵权举证,实现科教资源的开放和共享。
对科教资源许可管理的具体业务流程如图4所示。提供两种模式,即依靠资源管理者的手动许可分发管理(如图4中的步骤3、4、5、6所示)与基于智能合约的自适应智能化管理(如图4中步骤3’、4’、5’、6’所示)。
基于区块链智能合约,实现对科教资源的质量评估功能,建立科教资源质量与价值的可信、可验证的自动评价机制。综合考虑科教资源的质量及其对科教资源整体库带来的边际效益,评估其价值,避免低质或重复资源的提交;在此基础上,建立去中心化的科教资源交易平台,利用智能合约与链上交易途径完成科教资源的智能定价,保证交易过程的公平公正。
为激励用户提交高质量的科教资源,结合博弈理论建立用户激励机制尊龙凯时app。通过形式化定义科教资源的价值收益、用户提交资源后能够获取的货币/非货币收益,在保证用户收益的前提下,提高该用户提交的科教资源对科教资源整体库的价值增益,建立对科教资源拥有者的激励机制,从而促进科教资源开放社区的发展。
以人工智能为代表的科技创新正在引发新的教育革命,这为科教资源管理带来了新的挑战和机遇。本部分从科教资源生态、全体系人才培养和上下游产业链协同等角度,论述科教资源管理的发展趋势,为科教资源管理体系化发展提供参考和建议。
随着科教资源共建共享和知识产权保障的不断推进,以模型标准、技术攻关、平台研制、应用验证和规范制定为核心的科教资源生态将形成,生态的建立将进一步驱动科教资源的内涵发展。一方面,将预期形成科教资源领域的专利群、指标体系、行业标准,激发更多的群体(如高校教师、专业技术人员,智能教育相关产业从业人员等)参与人工智能科教资源的共建共享;另一方面,在科教资源共建共享的过程中,由智能算法自动建成的科教资源归属相关研究尚缺乏,这需要法律等相关领域持续发力,研究人工智能算法的产出物权问题,进一步保障科教资源共建共享。
第四次工业革命引发的教育革命为人才培养带来了新的挑战,这要求必须打破传统,积极探索产教融合、协同育人新模式。科教资源共建共享全链条、全流程的特点,对知识汲取、实践创新、价值养成等不同人才培养阶段都将产生积极影响,因此,关于科教资源共建共享如何促进与完善全体系人才培养将成为下一步关注的焦点。应当积极动员产、教、学、研四方融合,使之广泛参与到科教资源共建共享中,以项目为驱动,深化与领军企业、科研院所的合作,强化产教结合、产学结合、学研助产的联动效应,打造校企合作实践平台交叉、学科专业交叉、专业方向融合、校企师资融合、培养方法融合及学生素能融合的全方位、全体系人才培育新模式,将科教资源共建共享体系融入到人才培养,特别是复合型卓越人才的培养中去,实现科教资源共建共享与全方位、全体系人才培养的双向正循环。
随着科教资源共建共享的不断推进,预期将建立起国家级或区域性统筹的科教资源管理体系,进一步激发与此相关的资源、咨询、认证等上下游产业新需求。科教资源共建共享如何带动此类上下游产业链协同发展,将成为关注的重点之一。在未来一段时间,在已构建的科教资源管理体系的基础上,应当主动布局和培育面向新一代人工智能的科教资源生产、咨询、维护、交易、新兴物权保护与资质认证等一系列上下游相关的新型服务产业,构建完整、健壮的上下游产业链。在此过程中,推动政府、企业、院校、研究机构等协同创新,突出点链协同、长短结合、因类施策,注重强化整体布局,从政策、标准制定到技术研发、应用推广,统一谋划,上下联动,实现科教资源上下游产业链协同发展。
郑庆华,武乐飞,董博,等. 面向新一代人工智能的科教资源管理体系:软件定义范式和协同共建机制[J]. 科教发展研究,2022,2(4):29-45.
免责声明:本网站所提供的信息来源于科普中国、科普类微信公众号及互联网,转载目的在于传递更多信息及促进科学普及,并不代表本站赞同其观点 或对其真实性、准确性负责,也不构成任何其他建议。如果您发现网站上有侵犯您知识产权、肖像权、名誉权或其他权利的内容,请及时与我们取得联 系,我们会及时予以删除。
专注科技创新,Criticism(评论)、Consulting(咨询)、Construction(建设),做有情怀、有思想、有深度的内容。投稿或转载请联系