一位Māori科技创新者表示,人工智能工具和全球科技公司在语音发音方面仍然落后,这是不可接受的。
彼得-卢卡斯·琼斯是总部位于遥远北方的Te Hiku Media的首席执行官,本月早些时候,他被《时代》杂志评为2024年100位人工智能领袖。
该公司一直在开发人工智能(AI)工具,该工具可以转录语音Māori,提供发音反馈,并以92%的准确率将文本转换为语音,使其成为世界上最好的。
琼斯表示,谷歌等全球科技公司的语音质量基准要低得多,但更大的问题是,在人工智能工具的开发过程中,没有精通Māori语言的人参与。
“当我们看到开放人工智能工具和谷歌工具时,虽然他们取得了巨大的进步,但很明显没有精通Māori语言的人参与其中,因为如果有的话,他们就不会发布发音如此糟糕的工具。”
他表示,重要的是要认识到,大型科技公司不会拯救这个行业Māori。
“从我的角度来看,我认为解决方案是参照Māori标准,而不是那些没有Māori语言专业知识或不了解新西兰语言衰退背景的人为所有语言建立的全球基准。
“这意味着投资于本地数据科学解决方案,以支持准确性和精度。”
琼斯表示,解决方案的另一部分包括投资于精通该领域的Māori领导组织。
“当我们考虑发音时,我想我们必须做出决定,我们是追求卓越,还是满足于平庸。有时候故意破坏一门语言比什么都不做还要糟糕。”
他说,Māori语言模型——比如Te Hiku Media的模型——提供了一个将基准设定得更高的机会。
“提供高质量的地名等发音示例……这些都增加了语言学习者习得语言的机会,而错误的发音往往掩盖了我们希望通过言语传达的智力。我想说的是,接受50%的准确率作为测试Māori的基准是不可接受的。”
注册Ngā Pitopito Kōrero,这是一份由我们的编辑策划的每日通讯,每个工作日直接发送到您的收件箱。