荔枝新闻 编辑/胡逸乔 “算法”如今被广泛运用于人们生产生活中的多个领域,对社会发展发挥着重要作用。正在南京理工大学攻读计算机科学与技术专业博士学位的沈飞,多年来深耕人工智能算法领域。让计算机看懂世界,让AI造福社会是他的追求。
在2022年科大讯飞AI开发者大赛上,沈飞团队围绕乡村发展带来了系列农作物防护的新发现,通过人工智能技术对农作物进行识别诊断,帮助农民及时采取正确的方法,以减少病虫害带来的损失,提升农作物的品质和产量。
抓住有利时机,不断验证研究成果
沈飞认为,人工智能是大势所趋,在智能制造、智慧农业、航天航空等方面有新的增长点,可以助推国家经济和社会高质量发展。
沈飞成立的以竞赛为途径的科研成果转换小组依托于唐金辉教授主持的南京理工大学智能媒体分析实验室(IMAG),由杜晓宇副教授协调指导,小组成员为IMAG实验室的博士和硕士生。“成员们的主要研究方向为多媒体技术研究与应用(包括语音、文字、图像、视频等),涉及包含军工、安防、交通、医疗、农业、传媒等重要领域。” 沈飞介绍道。
现在的AI往往都是针对不同的场景设计算法,但在遇到实际场景的时候,AI算法的能力还是相对比较受限。沈飞说:“长期来看,只有提升AI算法通用性和泛化能力,才能更有效地在产业上游展现性能,等产品真正运用于下游不同场景的时候,就可以将AI算法直接运用于千行百业,解决不同问题。”为了达成这一目标,沈飞团队抓住一切有利时机,不断验证实验室研究成果。
勇担重任,聚焦攻克农业难题
农业是最基础的产业,加快推进农业现代化是现实与历史的重大任务。在国民经济进入新常态的背景下,农业发展需要主动适应这一转变。近年来,农作物病虫害给我国带来了严重的粮食减产问题,因此农作物病虫害识别检测和防治处理的研究对农业生产有着重要意义。
沈飞表示,农业是国家之本,作为计算机专业的学生,希望能通过人工智能技术助力国家智慧农业的发展,使得农户种植更加方便快捷,为国家现代化农业建设贡献自己的力量。
沈飞团队选择了图像赛道里面比较经典的农业任务,分别是基于可见光图像的柑橘花果梢识别挑战赛和辣椒病虫害图像识别挑战赛,并且都取得了第一名的成绩。
“其实辣椒病虫害图像识别难度较大,涉及病虫害种类较多,通过肉眼观察、主观认知是很难去划分标准的。此外,训练和测试时可能会存在场景跨域情况,在一定程度上也会增加图像识别难度。”沈飞坦言。成员都是先分别阅读大量的文献资料后,再一起商讨下一步的研究计划。
农业防治创新突破,辣椒病虫害图像识别率已超过70%
“据相关文献显示,人类对此次竞赛中的农业病虫害的主观判断正确率可能只有60%,而我们的模型算法已经超过了人类的水平,达到70%以上。从识别准确率上来看,我们的算法模型是可以减轻他们的工作量,甚至可以补足农业工作人员。”沈飞说道。这对于他的团队来说,是一个非常不错的成绩。
在图片识别速度方面,沈飞团队的模型算法也达到了一个新高度。沈飞表示,如果人类去识别一张图像,观察它的细节,可能需要2到3秒钟。对于他们的模型算法来说,能够做到1秒钟识别30张图片,接近60倍的速度,这也是非常大的突破。
“学术研究上的成功,最终还是要在实践中去检验它。科大讯飞提供的平台让我们有机会去分析数据,通过实验验证想法,检验过去一年的研究成果。同时,团队也可以借此机会优化算法模型,早日实现产品落地。”沈飞说。他们希望在推动国内AI发展方面做出贡献,让AI在通用场景下,更好服务于社会生活。
今年的第五届世界声博会暨2022年科大讯飞全球1024开发者节上,在工业互联网、元宇宙、未来社区、智慧养殖、互联网金融、智能汽车等多个领域中,还有更多像沈飞这样的年轻开发者。科大讯飞人工智能开放平台已开放513项AI产品及能力,聚集超过365万开发者团队,总应用数超过156.8万,推动中国创新创业发展,与开发者一同推动数字经济发展。