Міжнародна група вчених з університету Мічігану в США і Національного інституту астрофізики, оптики та електроніки в Мексиці розробила інструмент на основі штучного інтелекту (ШІ), здатний інтерпретувати значення звуків, які видають собаки. Дослідження опубліковано на порталі нерецензованих наукових матеріалів arXiv.
Результати проекту представили на конференції з комп’ютерної лінгвістики та мовних ресурсів.
Дослідники зібрали набір даних про гавкіт 74 собак. Тварини віком від п’яти до 84 місяців із середнім віком 35 місяців переважно були представлені породами чихуахуа, французькими пуделями та шнауцерами.
Вчені піддавали собак впливу різних стимулів, покликаних викликати різні типи вокалізації. Ці стимули включали такі ситуації, як присутність незнайомця, ігрове спілкування, лагідні розмови власника та навіть імітацію нападу на господаря. Потім аудіокліпи розділили на короткі фрагменти тривалістю від 0,3 до п’яти секунд і анотували вручну в залежності від контексту.
В основі аналізу лежало використання складної моделі штучного інтелекту, відомої як Wav2Vec2, спочатку розробленої для розпізнавання людської мови.
Дослідники доопрацювали цю модель за допомогою свого набору даних про вокалізації собак, досліджуючи кілька завдань. Ці завдання включали ідентифікацію окремих собак по їх гавкоту, визначення породи собаки на основі її вокалізації, передбачення статі собаки і зіставлення гавкання з конкретним контекстом.
Модель штучного інтелекту продемонструвала здатність розпізнавати окремих собак по їх гавканню, досягнувши точності 50%. Також ШІ навчився відрізняти агресивний гавкіт від звичайного.
“Наші результати показують, що звуки та моделі, отримані з людської мови, можуть бути основою для аналізу та розуміння акустичних моделей інших звуків, таких як вокалізація тварин”, – зазначили автори дослідження.