Αυτόματη αναγνώριση ηχοτοπίων και ηχητικών γεγονότων σε περιβάλλον πόλης.
Automatic recognition of soundscapes and sound events in city environment.
View/ Open
Date
2019-03-13Author
Καμπιτάκης, Μιχαήλ
Kampitakis, Michail
Metadata
Show full item recordAbstract
Η εργασία αυτή, έχει σαν σκοπό την θεωρητική μελέτη συστημάτων αυτόματης αναγνώρισης ηχητικών γεγονότων μέσω μηχανικής μάθησης,
την ανάπτυξη δικού
μας συνόλου δεδομένων από ηχογραφήσεις σε σημεία της πόλης του Ρεθύμνου, καθώς και υλοποίηση ενός συστήματος για αναγνώριση
και κατηγοριοποίηση ηχοτοπίων και ηχητικών γεγονότων με την χρήση της βάσης που δημιουργήθηκε.
Στο πρώτο κεφάλαιο, γίνεται η περιγραφή του ορισμού της μηχανικής μάθησης, της ηχητικής αναγνώριση -
ταξινόμησης ως πρόβλημα, τον λόγο δημιουργίας και υλοποίησής του, καθώς και της λειτουργίας του.
Επιπλέον, γίνεται αναφορά του σκοπού συγγραφής της παρούσας πτυχιακής.
Στο δεύτερο κεφάλαιο, παρουσιάζονται βάσεις δεδομένων και σύνολα αρχείων \en{(data bases – data sets)} από αναπτυγμένες βάσεις
(είτε από μελέτες, είτε από διαγωνισμούς). Συγχρόνως, περιγράφεται το σύνολο επιλογής ως βάση σύγκρισης, καθώς και την διαδικασία ανάπτυξης της δικής μας βάσης.
Η θεματική ενότητα του τρίτου κεφαλαίου αφορά τον ορισμό και την ανάλυση της στατιστικής της μηχανικής μάθησης και τις συσχετιζόμενες μαθηματικές σχέσεις. Ταυτοχρόνως, εξετάζεται η λειτουργία των πιο
συνηθισμένων και σύγχρονων αλγορίθμων μηχανικής μάθησης (όπως ο \tl{SVM} και \tl{KNN}). Ταυτόχρονα, στο κεφάλαιο αυτό, αναλύονται διαδικασίες
για την εκτίμηση των μοντέλων μηχανικής μάθησης, και τρόποι για μείωση των διαστάσεων των χαρακτηριστικών
(\tl{clustering}, \tl{Feature Selection}).
Το τέταρτο κεφάλαιο, είναι αφιερωμένο στο κομμάτι επεξεργασίας σήματος, της συνολικής διαδικασίας
που χρειάζεται για την παραγωγή χρήσιμων ακουστικών χαρακτηριστικών από το σήμα του ήχου.
Ακολούθως, στο πέμπτο κεφάλαιο γίνεται εκτενής περιγραφή της υλοποίησης και ανάπτυξης του συστήματός μας, καθώς και της λογικής που σχετίζεται με αυτό.
Τα αποτελέσματα των πειραμάτων παρουσιάζονται
στο έκτο κεφάλαιο, ενώ στο έβδομο και τελευταίο, επισημαίνονται τα συμπεράσματα. This thesis performs a theoretical study of automatic recognition systems on audio events, due to machine learning,
developing of our own data set of recordings in locations on town Rethymno, and also implementation of our own system for
recognition and classification soundscapes and audio events using the created base
In the first chapter, is a description, on what machine learning is, the audio recognition and classification
as problem, the reason on creation and implementation, and how does it works. Also there is description of our own work
and mention of the purpose of writing this thesis.
In the second chapter, are presented data bases and data sets, from developed bases (either from studies or competitions),
At the same time, the selection set for reference choice is described and also the implementation process of our own data base.
The thematic section of the third chapter, is about analysis of statistics of machine learning and their related mathematics. At
the same time, is being considered the operation of the most ordinary and modern machine learning algorithms (like SVM and KNN). Also
in this chapter, analyzes the processes of the machine learning model evaluation, and dimensional reduction methods for features (clustering, feature selection).
The forth chapter, is dedicated to signal processing part, the whole process needed for useful acoustic features creation
from audio signal.
Subsequently, the fifth chapter is the extensive description of the implementation and development of our system, and also all
the logic behind it.
Experiment results are in the sixth chapter
and last but not least, in the seventh chapter are highlight the conclusions.
Collections
The following license files are associated with this item:
This website uses cookies to ensure you get the best browsing experience.
Continue
More info