Eine qualitative Untersuchung der Generalisierungsverhaltens von CNNs zur Instrumentenerkennung [article]

Roman B. Gebhardt, Athanasios Lykartsis, Stefan Weinzierl, Technische Universität Berlin, Technische Universität Berlin
2020
Künstliche neuronale Netze (ANNs) haben sich im Bereich des maschinellen Lernens für Audiodaten als erfolgreichstes Werkzeug mit hoher Klassifikationsrate etabliert [1]. Ein bedeutender Nachteil besteht aus wissenschaftlicher Sicht jedoch in der schweren Interpretierbarkeit des von ANNs tatsächlich gelernten Inhalts [2, 3]. Um dieses Problem anzugehen untersuchen wir in dieser Arbeit den Lern- und Generalisierungsprozess eines Convolutional Neural Networks (CNNs) für Multi-Label
more » ... nnung in den Hidden Layers des Netzwerks. Wir betrachten die unterschiedlichen Aktivierungen aller Layers durch unterschiedliche Instrumentenklassen um nachzuvollziehen, ab welcher Tiefe das Netzwerk in der Lage ist, zwei von der gleichen Klasse stammenden Stimuli als ähnlich zu erkennen. Wir wiederholen das Experiment mit den gleichen Stimuli für ein auf die Erkennung von vier Emotionen trainiertes CNNs. Dabei bestätigen sich einerseits viele unserer Betrachtungen zum Generalisierungsprozess, gleichzeitig lassen die Ergebnisse darauf schließen, dass das auf Emotionserkennung trainierte Netzwerk in der Lage ist, instrumententypische Patterns zu lernen.
doi:10.14279/depositonce-9994 fatcat:xmzi4jzmazfeleo7v3oozabn5i