由宗乡总会主办的“新移民与新加坡社会”体验系列之“语音识别与人工智能”线上讲座,于2021年4月24日在Zoom视讯平台圆满举行,吸引了62人参与。这项活动也在宗乡总会面簿进行了线上直播。

参与者在活动开始前截图合影

本次线上讲座邀请了曾在新加坡科技研究局(A*STAR)旗下的资讯通信研究院(I²R)担任研究员,现于KLASS Engineering & Solutions从事前沿语音技术的研究以及指导语音识别系统开发的王磊博士主讲。

王博士在语音技术研究方面有着丰富的经验,他在讲座上作语音识别介绍时表示,这项技术已渐渐为大众所应用,能够将用户声音转录为文字,从中进行问答与对话。其中大家并不陌生的例子就是iOS系统中的Siri,一款人工智能的虚拟语音助手。除此之外,如今也有越来越多品牌推出的智能家具产品融入了这项技术,提升了人们的生活水平。

有趣的是,这项炙手可热的技术并不是在近年才开发出来的。早在1952年就已有一款“Audrey系统”面市,当时只能够识别10个数字,虽然技术有限,不过已开始协助各行业降低人力成本。在1980至1990年间,语音识别的技术基本成型,能够识别2万至6万字,随后在2002年至2006年期间有了快速的发展,各领域也开始应用这项技术。

王磊博士举例,他曾参与开发新加坡国家法院采用的“法庭智能转录系统”,能够把聆讯中的所有对话实时转录成文字,同时加入标点符号、大小写等,提高了可读性。在建模时混合了不同口音的英语,例如美式英语、英式英语、新式英语等,提升了语音的准确度。

民航局应用空中管理语音识别系统

此外,民航局(Civil Aviation Authority of Singapore, CAAS)的空中管理语音识别系统也是应用场景之一,有关当局利用这项技术来提升操作安全。王博士表示,这是一项具有挑战性的项目,因为语音识别系统在民航局很容易受到环境干扰,像是天气、信道噪音、引擎噪音,而各国机长不同的口音,还有相关的术语等,都必须经过严谨的检查和确认,才能确保系统顺利运作。

王磊博士也分享了近年来热门的语音课题——语音分离和提取目标讲者的语音技术,他在讲座上示范了如何从多人同时说话的情景里进行语音分离。王博士也强调,目前的盲源语音分离可处理两至三人的说话情景,若人数太多,分离效果便会下降。

语音分离技术是近年来热门的课题

除了讲解语音识别与人工智能,王磊博士也分享了从新移民的身份融入新加坡的经历。他透露,在2013年成为新加坡公民后,他便开始加入居委会(Residents’ Committees, RC),从委员开始做起,曾担任助理秘书和副主席,目前是居委会财政和新媒体负责人。王博士认为,他加入基层组织的目的是为了更了解本地文化,而这段经历也让他获益良多,由此认识了各族同胞和各阶层人士,让他更好地融入了新加坡。

王磊博士分享自身如何融入新加坡

另一方面,王博士也是集邮爱好者,通过本地的“醉邮学会”认识了一群志同道合的同伴,无论是本地人还是新移民,都因趣味相投而相互交流,增进了彼此的认识。

这项线上讲座不但让参与者更了解语音识别与人工智能的历史与发展,也从王磊博士的新移民经历分享中获得了不少启发。