语音识别软件将意味着口音的终结?

随着语音识别软件的标准化,这是否意味着我们的地区和全球口音也会标准化呢?约书亚·苏多克/祖玛出版社/Corbis"width=
随着语音识别软件的标准化,这是否意味着我们的地区和全球口音也会标准化呢?约书亚·苏多克/祖玛出版社/Corbis

2011年底,苹果(Apple) iOS系统的虚拟助手Siri首次出现在iphone上,该程序欢快的女性声音迅速引起轰动。这不仅仅是因为Siri可以理解主人的口头指令并回答问题,拨打电话号码,提供天气预报,查询目的地的路线,甚至可以找到附近最好的泰国餐厅并预订。正如演员约翰·马尔科维奇在一系列巧妙的苹果广告中所展示的那样这一个, Siri甚至可以和你闲聊,就好像她——哎呀,乐动体育网站5.0——是一个真实的人。

Siri的名字代表语音解释和识别界面,最终微软的小娜和安卓操作系统等竞争对手也加入了Siri的行列谷歌现在该应用程序缺乏个性,但仍然可以理解用户的自然语言问题,并以口头回答。还有亚马逊Echo家用电器附带的虚拟助手Alexa,它可以根据语音命令完成从播放音乐到开关灯的所有操作。现在打电话给公司的消费者通常会发现他们在与交互式语音应答(IVR)系统交谈语音识别,而不是真正的人类操作员。

广告

实话实说

但正如用户发现的那样,这类软件在一件事上有困难——理解那些说英语带有浓重地区或外国口音的人。例如,在Siri发布后不久,苏格兰的iPhone用户就开始抱怨这个虚拟助手看不懂他们的布洛克鞋。

例如,一位名叫詹姆斯·麦克唐纳的YouTube用户发布了这样一段视频视频Siri努力将他的指令翻译成“创建一个提醒”。使用英语的用户印度人和菲律宾人有口音的人还抱怨他们的手机听不懂他们说的话。

从那以后,公平地说,虚拟助理理解口音英语的能力似乎有了显著提高。根据苹果支持网站例如,该程序现在可以理解英语和其他15种语言的口音和方言。作为丹Moren乐动体育网站5.0他在去年秋天指出,Siri不再像以前那样严格地把语言和地点联系在一起,所以即使你把它设置成说英式英语,它也能听懂没有英式口音的人说的话。

但一些地方口音似乎仍然会让语音识别软件出错。美国南方人茱莉亚·里德在最近的一篇文章中指出文章在Garden & Gun,当她手臂骨折无法打字时,智能手机和电脑的听写应用程序仍然“坚决拒绝理解我要说的几乎所有内容”。

代码切换以解决问题

如果虚拟助手和语音识别软件最终能训练我们以几乎相同的方式说英语,那么这种困境可能最终会成为过去。德克萨斯大学奥斯汀分校(U乐动体育网站5.0niversity of Texas at Austin)英语语言和语言学副教授拉尔斯·欣里奇(Lars Hinrichs)举了一个例子,他的一个朋友不得不放弃她的牙买加口音,“假装成美国口音”,才能让Siri听懂她的指令。另一位在美国生活了15年的印乐动体育网站5.0度人也不得不改变她的语言来与该程序交流。

“有些(语言)功能比其他功能更让Siri困惑,”他解释道。“说牙买加英语和印度英语的人通常会把car或bird这样的单词发成不带r音的音。如果语言处理设备被训练成美式英语,那就很难了,因为在美式英语中,‘r’是要发出来的。”

我们中的许多人已经有了一种不同节奏、音调和发音的“机器声音”。卡内基梅隆大学语言技术研究乐动体育网站5.0所教授艾伦·布莱克在最近的一篇文章中解释道乐动-软件文章英国《卫报》说:“如果你在机场乐动体育网站5.0、公交车站或其他地方站在某人旁边,你通常能分辨出他们是在和机器说话,而不是在和人说话。”

研究英语演变的学者说,这种标准化,他们称之为方言水平化,在电视和其他大众媒体的影响下,已经持续了几十年。乐动体育网站5.0在美国国内,人们比过去更多地在全国各地流动,我们说话方式的地区差异开始消失。北卡罗莱纳州立大学语言学副教授罗宾Dodsworth他研究了北卡罗来纳州罗利市数百名居民的讲话录音,发现在罗利市,通常与南方讲话有关的独特元音现在更难找到了。

对着机器说话

辛里奇认为Siri和其他语音识别程序将推动这一趋势。他说:“我想说,Siri等人可能会迫使人们用标准口音说话。”

Hinrichs指出,其他类型的电子通信,如视频会议,也有助于标准化。乐动体育网站5.0他解释说:“人们生活在越来越复杂的社会网络中,因此,他们接触到越来越多不同的说话方式:他们听到更多不同的语言,更多不同的外国口音,以乐动体育网站5.0及更多不同的英语母语口音。”

他说:“当你在阿马里洛(Amarillo)的一间工程师办公室工作,通过Skype与一个在纽约的人、另一个在新德里的人开会时,你会面临类似的压力。”“你会倾向于用你最容易理解的方式说话,这通常意味着:用你最标准、听起来最不地道的口音。”乐动体育网站5.0

也就是说,Hinrichs认为,尽管有技术的标准化影响,口音不会完全消失。乐动-软件乐动体育网站5.0原因之一是语音识别在破译地区差异方面可能会变得越来越复杂。他说:“我还认识其他一些人,其中一个在谷歌工作,他们的职业生涯都在试图教计算机理解使用当地或非标准语言形式的语音和写作。”

此外,当语音识别应用程序迫使人们改变他们的语音时,它们也会提醒我们是什么让我们与众不同。他说:“个人和社区越来越意识到他们的地方身份是特殊的或与他人不同的,他们比以前产生了更强烈的愿望来保护和表现他们的地方身份。”乐动体育网站5.0因此,他认为当地方言不会很快消失。

广告

特色

广告

加载……