【编者按】
今年是改革开放40周年。这是中国大地沧桑巨变的40年,也是个人命运与国家命运同频共振的40年。伴随改革开放脚步成长起来的人们,被时代推动,亦推动时代。作为改革开放事业的担当者、亲历者、传承者,他们用自己的方式演绎出一个个“中国梦”的生动样本。荔枝新闻、我苏客户端联合江苏省广播电视总台纪录片创作中心重磅推出系列人物报道,为你捕捉新时代下鲜活多彩的中国面孔,带你一起感受中国发展的蓬勃动力和人们对美好未来的不懈追逐。
我叫魏思,今年35岁,来自科大讯飞研究院,从事智能语音研究已经有十几年了。智能语音就是让机器能够听得懂我们人类的话,同时,机器也能开口说话。
在许多人眼里,智能语音只是一个高大上的概念,其实,它正在渗透到我们工作生活的方方面面。例如,在车上运用语音进行各种各样的控制,非常方便,也极大地降低了操作的危险性。
除了人机交互方面的语音输入,我们的研究还涉及到医疗图像方面的识别,以及教育领域中的自动手写识别等。我们最近做的关于医疗领域的一些人工智能程序,能够自动读取X光或者CT影像,提高读片的精度,帮助医生快速作出诊断。而人工智能的个性化学习系统,则可以比较大幅地提升学生答题精度和他的考试成绩。
在研究院,我并没有独立的办公室,而是跟大家坐在一个开阔的办公区域共同工作,这样才能第一手地了解到同事的状态、项目的进展。我把自己定位成一个非典型的管理者,或者更准确地说是一个科技工作者。
我的阅读范围很广也很杂。我习惯把自己比喻为“一个知识的黑洞”,碰到任何一个我不掌握或者不了解的知识点,我都有极大的兴趣去弄明白它。因为我发现,即使跟我的专业不相关,它给我带来的启发和震撼也不亚于专门读研究领域内相关的书。
这种广读博览、开卷有益的思维习惯也体现在我们的实际工作中。不管进行哪方面的研究,我和团队都会深入讨论、集思广益。讨论的时候,不分上下级,也不分对一个问题认识的深浅,只分当前的观点是不是对的。正是这样的头脑风暴,使得我们在研究的过程中经常灵感迸发,从而取得很大的进展。
“讯飞听见”是我们2015年推出的一款语音转文字软件。2017年,在我们的努力下,“讯飞听见”在同屏转写和翻译过程中实现了新突破——中英文实时字幕,将演讲者的中文语音实时转写成中文字幕,同时翻译成英文字幕。整个流程中,用到了语音合成、机器翻译等众多技术,实际上它是一个非常复杂的体系。
不同人的说话的口音、不同人的音色、在说话的时候周围的噪音以及各种传输信道与录音信道的差别,这些因素导致语音识别做起来非常困难。
我们现在的研究,已经进入了一个跟全世界第一流的人在同一起跑线上的阶段,所以我们前面就是无人区。当你处在第一流、想做出更大的创新的时候,孤独的坚守是非常非常关键的事情。
不过,一路成长的经历,给了我坚守下去的定力和信心。
我是农村出生的小孩,成绩一直很好。高中第一个学期期中考试考了全班第八名,我觉得这简直是“奇耻大辱”,非常沮丧。当时,妈妈安慰我说不要紧,“你只要确定自己是用心的,并且付出努力的,将来一定会有回报的,不要在意这一两次的挫折”。她的话让我受益终生。
后来,在中国科技大学,我度过了九年的求学时光。这期间我学到了很多东西,最重要的就是葆有质疑精神。碰到事情,我总想跟别人辩一辩,搞明白后面的原理是什么。
今年恰巧是科大60周年校庆,我带着一个最近开发的翻译机,回学校看望了以前的导师王仁华教授。王教授是改革开放后首批公派赴美访问学者之一,1982年回国。看到我们这批年轻人为了一个共同的目标在努力,他很欣慰,也相信我们“能够改变世界”。
我很喜欢open这个词,它既是打开也是开放。我们的思路需要打开,我们的国门也需要开放。我出生于改革开放的第五个年头,我们这一代很幸运。没有打开的国门,没有畅通的交流,没有天马行空的思想遨游,就没有科技的发展,也不会有现在的我。
我读过一本书,名字叫《海鸥乔纳森》,对于大部分的海鸥来说,飞翔是为了活着,而对于乔纳森来说,活着是为了飞翔。我们的翻译机像海鸥一样飞向了全球各地,人们拿着它,可以无障碍地相互交流。
我和我们整个团队的理想,就是可以创作出一大批改变人类生活的产品,从而实现“在中国用人工智能建设美好世界”这个梦想。
【编者手记】
人工智能时代已然到来,魏思向我们揭示了人工智能带来的颠覆性变化,也向我们展现了一名科技工作者的优秀特质:辽阔的想象力、追根究底的探索欲、勇于担当千难不弃的责任心……
作为中国人工智能领域的翘楚,魏思所在的科大讯飞不仅在技术上呈现出一流水平,同时长期致力于构建开放、共享的行业生态。科大讯飞开放平台自2010年成立以来,共有88万个开发者团队利用开放平台进行开发,并依据平台开发出54万个应用产品,累计服务了21亿台智能终端,日服务量达47亿次。
“平台+生态”双轮驱动,相信魏思和他的团队还将不断为我们打开新世界的大门。
进入专题,了解更多>>
(编辑/刘静)
我要说两句