来自谷歌澳大利亚的一种新的搜索工具可以让生态学家和环保主义者上传野生动物叫声的录音,并立即将它们与来自全国各地的数千种类似声音进行匹配,从而实现对生态系统的了解,否则可能需要数千小时才能实现。
这款人工智能工具是这家科技巨头与昆士兰科技大学和澳大利亚声学观测站(A20)合作的延伸,A20是一个全国性的录音机网络,今年早些时候,A20公布了一项计划,可以处理大量音频数据,并隔离特定野生动物的叫声。
通过使用被称为A20搜索的新工具,研究人员可以利用天文台数百万小时的索引录音,确定某个特定呼叫发生的其他位置,而无需手动筛选音频。昆士兰科技大学的保罗·罗伊教授是A20的首席研究员,他说这是保护动物的一个巨大飞跃。
“我们在这里建立的是一个搜索工具,可以释放在该领域收集的数据。人工智能不是试图手动筛选我们无法活到足够长的时间来浏览的数百年数据,而是为我们做这件事。”
“你必须先了解环境,然后才能保护它,像这样把生态学和计算机科学结合起来是关键。”
他说,这个系统支持的研究将帮助土地管理者在保护、管理和生物多样性保护方面做出明智的决定。
一旦研究人员上传了一段录音,他们就会突出显示一个五秒钟的片段,其中包含他们想要搜索的电话,该工具会在几秒钟内返回结果。然后可以根据地点、日期或一天中的时间对它们进行细化,绘制在地图上或用于进一步搜索。
研究人员还可以下载音频,或者导出包含所有匹配细节的电子表格,这对于制作他们自己的机器学习分类工具很有用。A20搜索主要是为鸟类的叫声设计的,但也适用于考拉和其他制造噪音的动物。
声学专家、谷歌软件工程师汤姆·丹顿(Tom Denton)说,许多研究人员正在寻找现有数据不多的东西,包括稀有濒危物种、特定的叫声类型,或由于环境变化而产生的变化。
“因此,为了帮助人们很容易地找到他们想要的例子,我们退一步说,嘿,与其让人们手工挑选和听数千小时的音频来建立一个分类器,我们可以从搜索开始,并试图更有效地显示人们想要的东西,”他说。
“如果碰巧效果很好,你就可以利用这些结果。如果你得到某种混合的结果,那么它实际上是开始构建分类器的一个非常好的地方。”
A20的数据大部分仍然没有注释,因为它是由全国各地的记录仪被动收集的。但丹顿说,搜索系统可以扩大专家的专业知识,例如相似物种叫声之间的细微差别。通过上传只有一个物种发出的声音,或者只有一个幼崽发出的声音,研究人员可以更快地回答特定的问题。
他说:“如果你想知道随着时间的推移鸟类数量发生了什么变化,能够识别幼鸟的叫声实际上是非常有用的,因为每年都有一批新的幼鸟进来。”
“然后你可以说,‘嘿,我们今年的幼崽收成好吗?或者是由于其他原因造成的人口问题?’”
该项目是谷歌澳大利亚10亿美元数字未来计划的一部分,该计划还资助了监测棘冠海星和追踪森林大火影响地区野生动物的研究。
不过,尽管这家搜索巨头帮助建立了A20搜索,但所有数据都托管在昆士兰科技大学,搜索工具也在该校的控制之下。它是开源的,任何人都可以在search.acousticobservatory.org/search上使用。