教育大模型成功应用——全国多省市高考阅卷实现AI监测与数据验证

2023年06月25日 15:11:39 | 来源:荔枝新闻

字号变大| 字号变小

  耕耘于四时、收获于仲夏,6月的高考牵动着千千万万考生和他们背后家庭的心。根据教育部网站公布信息,2023年全国高考报名人数1291万人,相比去年增加98万人,再创历史新高。一面是居高不下的考生数量,一面是时效与公平的要求,高考阅卷始终在压力下有条不紊地进行……

  严标准、保公平:高考阅卷事关每个考生的切身利益

  “选贤任能以匡社稷”,高考从来都是国之大事,关乎万千考生前途命运。长期以来,国家教育主管部门在实践中探索出一整套周密、严谨的阅卷机制,确保对每张试卷、每道题目科学精准评分,兼顾公平与效率。

  为确保阅卷安全,各省市在高考阅卷工作展开前抽调大量师资力量成立阅卷工作组实行全程封闭管理。在阅卷前,往往需要经过专家讨论、试评优化等程序制定评分标准。正式阅卷开始后,每道题目都需不同老师多轮评分来保证一致性,出现误差更需额外仲裁程序介入以决定最终得分。全国上千万考生多科目试卷需要在十余天内完成精准批阅、评分,需要国家、各省市投入大量人力、物力、财力,来保障高考阅卷工作顺利完成。

  提效率、双保险:人工智能助力高考阅卷转型升级

  本世纪初,中国教育信息化改革从高考开始,网上评卷系统取代了传统的线下人工评卷,成为中国教育信息化发展阶段的一个里程碑。在今天的人工智能(ai)和大模型、大数据时代,这些前沿科技正在为高考评卷转型升级、提高效率、保障质量提供强有力的技术保障。近年来,相关人工智能技术及系统已在部分省份有条件地参与到高考评卷监测工作中。在定标阶段,人工智能对全部考生作答内容进行统计、检索、聚类,从而为评分标准制定提供参考依据。在评卷阶段,具备逻辑推理、数理运算能力的人工智能能够自动穷举题目的全部正确解法,并判断考生考试作答的逻辑以及最终结果的正确性,从而辅助验证人工评卷结果。

  随着人工智能技术的逐步融入和深度参与,成为高考阅卷工作开展以来的又一里程碑式跨越,既为人工阅卷提供辅助参考,也对人工阅卷的准确性、可靠性提供了重要验证手段。随着技术的不断迭代,人工智能技术服务高考阅卷成为大势所趋,也是高考阅卷工作转型升级的必由之路。

  新探索、再突破:认知智能大模型推动实现新跨越

  人工智能技术可以为高考阅卷工作提速升级,但从实践过程来看,复杂手写识别准确率、主观题型阅评等课题始终是业界亟待解决的难点、堵点。伴随技术迭代,认知智能的出现再次成为新的“助推器”。可之科技推出自主研发的“强逻辑”“可解释”“终身学习”认知智能大模型,具备逻辑推理、自我解释能力。相较传统人工智能的文字识别匹配比对,该模型能够理解学生答题的语言语义及推导逻辑,独立解题并发现参考答题数据中未出现过的新解法,其数理计算、推理证明等题型解答能力均远超openAI推出的chat-GPT4。据了解,高考阅卷工作启动后,可之科技技术人员携带专用服务器及设备入驻各省市集中阅卷区域,与阅卷工作组实行同等管理要求,确保人工智能阅卷系统的安全性。在工作环境架设后,以单科数学为例,20个小时即可完成一个省份全部考生的阅卷工作。在甘肃、江苏、浙江等省份,根据专家组需要,技术人员调用阅卷数据对重点题目进行快速聚类分析,梳理典型错误或不常见解法,为专家组评分提供参考依据,进一步确保了评分的准确性与公平性。

  经过三年的实践检验,可之科技的认知智能大模型在“批改题型”“批改准确率”“人机一致率”等指标均创造和保持了最高纪录,成为目前唯一可实际应用于高考阅卷、具备主观题批改能力的人工智能技术。未来,随着技术的发展进步和AI的深度介入,将有望改进现有阅卷流程,实现公平与效率的“双赢”,真正推动高考阅卷工作提质增效。

下载荔枝新闻APP客户端,随时随地看新闻!

layer
快乐分享