圣大毕业生创建用于识别鸟类声音的神经网络

4月1日是国际爱鸟日,是旨在呼吁人们关注对不同种鸟类的研究与保护的生态纪念日。圣彼得堡国立大学校友奥列格·肯努涅恩开发了一个神经网络,将可帮助业余鸟类爱好者们分辨是哪一种鸟在窗外啼叫,也可帮助鸟类研究专家确认栖息在某一片树林里的鸟类的数量和品种。
去年,为纪念这一生态节日,我校公开发布了收藏在圣彼得堡国立大学有声资料库里的八段稀有鸟类叫声录音,该有声资料库也是世界上拥有动物声音藏品最丰富的资料库之一。今天,任何人都可以将红喉歌鸲、燕雀、黑喉潜鸟、普通夜莺、红喉姬鹟、北蝗莺、大山雀及红尾歌鸲等鸟类的声音下载到自己的手机上,这些声音文件的制作者是圣彼得堡国立大学生物声学教学实验室负责人叶甫根尼·科列奇马尔。
如今,我校毕业生奥列格·肯努涅恩提出了自己的研究项目。他发明了一款基于神经网络、用于识别鸟类声音的移动应用程序。该项目也是其在圣彼得堡国立大学本科生再教育计划“数学软件与信息系统管理”框架下的毕业作品。该程序员对这一奇特主题的选择并非偶然:他本身就是鸟类学家,在圣彼得堡国立大学通过了关于雄性丘鹬(Scolopax rusticola)示威性啼叫的变异性的硕士学位论文答辩。
目前,世界上有一个叫做“鸟类观察”(源于英文“bird”-“鸟”和“watching”-“观察”)的研究方向。
“这一趋向在欧洲和北美得到普遍推广:甚至每五个美国人中间就有一个人的兴趣还好是鸟类观察。然而,现在并没有可以自动识别鸟类品种的系统。那些现有应用程序,或需借助图片分析进行识别,或进行极为粗糙的声音分析,或干脆提出让用户自行对听到的声音与音频样本进行比较”,奥列格·肯努涅恩说。
奥列格决定改变这种状况,并创建了一个有趣的系统。它由移动应用程序和后端组成,前者可以录制语音信号,后者则可借助于神经系统来分辨正在啼叫的是何种鸟类。虽然该程序目前只能识别20种鸟类(夜莺、燕雀、鸫等),但其分析准确性约为90%。研发人员指出,声音库将得以补充,神经网络仍可进一步完善,因为程序分析的录音案例越多,其准确性也会越高。
目前,奥列格·肯努涅恩已经完成这一应用程序模型,只需网络畅通便可正常使用。的确,正如程序员所说的那样,目前该程序只不过可对一些山雀进行全面测试,因为大多数鸟类还没有飞回来。但今天夏天,奥列格将进行一系列现场实验以发现神经网络的弱点并解决这些问题。如果一切顺利的话,程序员则计划在几个月后发布免费下载的测试版应用程序。
奥列格表示,“这一应用程序适用于业余鸟类爱好者和专业鸟类学家。因此,如果完成这一系统的研发,我们则能够用它来记录树林里多处地点的鸟类啼叫声,从而确定不同个体的位置并自动计算其数量。从理论上讲,这项技术可以覆盖整片树林并对其进行录音,比如,在一个昼夜之内。对于鸟类学专家来说,这项任务可能会特别耗时。
接下来,奥列格·肯努涅恩还将面临项目实施的几个重要阶段:算法的改进、神经网络的进一步完善、应用程序的设计等。此外,开发人员正在寻找可以帮助他们将创意付诸实施并为全世界鸟类爱好者创建一个独特功能应用程序的投资者和合作伙伴。