ZBI-Header

IfKom Pressefoto 27 16 10 2017 thumbAn der Ostbayerischen Technischen Hochschule Regensburg (OTH Regensburg) erhielten M.Sc. Johannes Reschke und B.Eng. Daniel Dzibela am 13. Oktober 2017 den IfKom-Preis für ihre hervorragenden Abschlussarbeiten an der Fakultät Elektro- und Informationstechnik. Mit diesem Preis werden ausgezeichnete Leistungen von Studierenden auf dem Gebiet der Informations- und Kommunikationstechnik gewürdigt.

In jüngster Zeit hat die Sprachsteuerung die Mensch-Maschine-Kommunikation grundlegend verändert. Sprachassistenten, sprachbediente Fernsehgeräte und intelligente Lautsprecher erleben derzeit einen ungeahnten kommerziellen Erfolg. Die beiden ausgezeichneten Arbeiten, beide durchgeführt im Labor Elektroakustik der Fakultät Elektro- und Informationstechnik und betreut durch Prof. Dr. Armin Sehr, realisieren jeweils Teilsysteme für die Sprachsteuerung.

Johannes Reschke hat im Rahmen seiner Masterarbeit ein vollständiges System zur Lokalisierung und Identifizierung von Sprechern mittels optischer und akustischer Signale aufgebaut. Es besteht aus einer akustischen Kamera und Gesichtserkennungsalgorithmen. Aus den Aufnahmen von 16 Mikrofonen berechnet die akustische Kamera eine farbcodierte Visualisierung des Schallfeldes, aus der die Position der Schallquelle bestimmt wird. Mit Hilfe verschiedener Techniken des maschinellen Lernens detektieren Gesichtserkennungsalgorithmen, wo sich in einem Bild ein Gesicht befindet und um welche Person es sich handelt. Die Datenfusion wird mit Hilfe von Entscheidungsbäumen erreicht. Durch die Implementierung der ausgewählten Algorithmen in C/C++ wird ein System erreicht, welches die Position, Identität und Aktivität eines Sprechers zuverlässig und genau in Echtzeit ermitteln und mit 30 Bildern pro Sekunde darstellen kann. Bei sprachgesteuerten Geräten können diese Informationen dazu genutzt werden, um die Aufmerksamkeit des Systems auf den Sprecher zu lenken.

Daniel Dzibela hat in seiner Bachelorarbeit unterschiedliche Methoden der statistischen Signalverarbeitung eingesetzt, um lineare Systeme zu identifizieren und somit Störgeräusche aus Mikrofonsignalen entfernen zu können. Mit Hilfe von Leistungsdichtespektren bzw. adaptiven Filtern wird der akustische Pfad zwischen dem Lautsprecher und dem Mikrofon identifiziert. Mit dieser Information können die Lautsprechersignale aus dem Mikrofonsignal entfernt werden, ohne das Nutzsignal, das beispielsweise ein gesprochenes Kommando an ein Spracherkennungssystem sein kann, zu stören. Beispielsweise bei einem sprachgesteuerten Fernsehapparat wird dadurch erreicht, dass die Sprachbedienung auch während der Wiedergabe ohne Probleme funktioniert.

Der Preis wurde im Rahmen der Absolventenfeier der Fakultät Elektro- und Informationstechnik der OTH Regensburg durch den Hochschulbeauftragten der IfKom Ostbayern Wilhelm Völkl an die Preisträger überreicht.