Метод генерации щелчков кашалотов с помощью нейросети разработали для исследования поведения этих животных ученые Санкт-Петербургского государственного электротехнического университета (СПбГЭТУ) «ЛЭТИ», 22 ноября сообщает пресс-служба вуза.
Разработанный учеными метод и полученные с его помощью данные о том, как кашалоты излучают звуковые волны и интерпретируют отраженные сигналы, могут стать основой акустических методов подводной связи и навигации, помогут в создании более эффективных гидролокаторов (средств звукового обнаружения подводных объектов с помощью акустического излучения).
Знания того, какое влияние на передачу звука в воде оказывают шумы, создаваемые этими морскими обитателями, поможет найти способы минимизации влияния помех на подводные коммуникации.
Также исследование голосовых сигналов кашалотов поможет морским биологам классифицировать отдельные типы этих животных по их «разговорам». Ученые считают, что издаваемые кашалотами щелчки, трески и стоны используются ими для общения, эхолокации и ориентации в пространстве.
В настоящее время некоторые базы данных являются закрытыми, а изучение кашалотов и издаваемых ими звуков требует большого количества записей их «голоса». Поэтому ученым нужны методы, позволяющие создавать похожие по характеристикам звуки морских млекопитающих, используя уже имеющиеся данные.
Доцент кафедры систем автоматизированного проектирования (САПР), старший научный сотрудник Молодежного научно-исследовательского института (МолНИИ) СПбГЭТУ «ЛЭТИ» Екатерина Копец рассказала о работе, проделанной в этом направлении:
«Нами разработан метод генерации синтетических звуков, а именно щелчков кашалотов с помощью нейросети. Для этого „песни“ этих млекопитающих животных мы преобразовали в картинки, представив их в виде спектрограммы, а затем с помощью специального алгоритма машинного обучения для генерации изображений сгенерировали новые наборы звуков. Полученные данные представляют интерес не только для морской биологии, но и поможет усовершенствовать, например, методы подводной связи на основе акустических сигналов».
Взяв из открытой базы данных звуков морских млекопитающих щелчки определенного кашалота, исследователи обрабатывали и изменяли эти сигналы без влияния на исходные материалы. Они меняли тембр, тон, добавляли случайный шум, а также ускоряли и замедляли звук.
Далее они преобразовали полученные голосовые данные в спектрограммы, которые вертикально и горизонтально «нарезали» на части и переставляли местами. Эти манипуляции позволили им создать новые наборы звуков без преобразования их структуры. После чего они усовершенствовали имеющуюся архитектуру так, чтобы с ее помощью генерировать ультразвук (звук с частотой более 20 кГц).
«Усовершенствованную модель мы обучили самостоятельно выполнять все нужные шаги для получения новых наборов данных и также их классифицировать, — продолжила Екатерина Копец. — Результатом стала нейросеть, которая может работать с высокочастотными сигналами и выдавать очень похожие щелчки определенного кашалота — с 10–12% отклонением от метрик».
Предполагается использовать данный метод для генерации звуков любого животного, в том числе птиц, настроив созданный алгоритм на обработку их голосов.
Результаты исследований ученые представили в статье «Генерация синтетических голосовых данных кашалота с использованием StyleGAN2-ADA» (Generating Synthetic Sperm Whale Voice Data Using StyleGAN2-ADA), опубликованной в журнале Big data and cognitive computing.
glavno.smi.today
22049