Muzikos garso šaltinių atskyrimo giliojo mokymosi modelio SCNet apmokymas skirtingais duomenų rinkiniais
Articles
Aidas Žygas
Vilnius University
Gražina Korvel
Vilnius University
Published 2025-05-12
https://doi.org/10.15388/MITT.2025.34
PDF

Keywords

Muzikos garso šaltinių atskyrimas
SDR metrika
spektrograma

How to Cite

Žygas, A. and Korvel, G. (2025) “Muzikos garso šaltinių atskyrimo giliojo mokymosi modelio SCNet apmokymas skirtingais duomenų rinkiniais”, Vilnius University Open Series, pp. 297–304. doi:10.15388/MITT.2025.34.

Abstract

Šiame straipsnyje nagrinėjama, kaip skirtingi duomenų rinkiniai (Musdb18-HQ, Moisesdb), naudojami muzikos garso šaltinių atskyrimo modelio apmokymui, lemia SCNet modelio išvesties rezultatus. Modelio efektyvumas vertinamas SDR kiekybine metrika, pagal skirtingus muzikos žanrus ir garso šaltinius. Modelis geriausiai atskiria būgnus ir vokalus, jį apmokius su Musdb18-HQ, o naudojant Moisesdb, geriausiai atskiria bosus ir būgnus. Kai modelio apmokymui ir įvertinimui naudojami skirtingi duomenų rinkiniai, SDR rodikliai tampa mažesni, nes modelis juos prasčiau apibendrina. Pastebėta, kad modeliui yra sudėtinga atskirti roko muzikos žanrą, o geriausi SDR pasiekti bliuzo ir kantri žanruose.

PDF
Creative Commons License

This work is licensed under a Creative Commons Attribution 4.0 International License.

Downloads

Download data is not yet available.

Most read articles by the same author(s)