Vurdering af støjreduktionsalgoritmer

Philip Juhl

AbstractJeg har i dette projekt opbygget en model til beregning af taleforståelighed for støjreduktionsalgoritmer (SRA). Den første del af modellen anvender Olofsson og Hagermans[11] metode til linear separering af tale og støjsignal. Til fitting af modellen har jeg brugt resultater fra tidligere lytteforsøg [14]. Modellen er blevet afprøvet på forskellige SRA, både SRA implementeret i Matlab® og høreapparater med indbygget SRA. På disse SRA har jeg beregnet en værdi for taleforståeligheden og ulineariteten af SRA. Disse beregninger viste at en SRA der brugte TSVD-algoritmen (Truncated singular value decomposition) var meget ulinear. Dette betød at min model til beregning af taleforståelighed ikke virkede ordentligt på denne SRA.

For at verificere om modellens beregning af taleforståelighed er korrekt har jeg udført en række nye lytteforsøg. Ved disse lytteforsøg har jeg testet 2 forskellige SRA fra HA. Forskellene på de 2 SRA stemte overens med resultaterne fra min model. Resultaterne fra lyttetesten er sammenlignet med STI (Speech Transmission Index) og PESQ (Perceptual Evaluation of Speech Quality). Beregningen af taleforståelighed med disse modeller var markant forskellig med resultaterne fra mit lytteforsøg.

In English:

In this project, an objective model to predict speech intelligibility (SI) for noise reduction (NR) is described. The first part of the model uses Olofsson and Hagermans[11] method for linear separation of speech and noise. To adjust the model previous result[14] from listening exercises were used. The model is tested with di erent NR implemented in hearing aid (HA) and Matlab® . Calculation of the signal-to-distortion-ratio (SDR) and SI was performed. These calculations showed that the Matlab® -implementation of a NR using TSVD (Truncated Singular Value Decomposition) was very nonlinear. The model could not separate the speech and noise for the NR using TSVD and the predicted SI was not correct.

To verify the models predictions of SI listening exercises was performed. These exercises used two different NR implemented in HA. Statistical test was used to compare the SI for the two NR. The models predictions of the speech intelligibility for the NR, match the result from the exercise. The models prediction was compared to STI (Speech Transmission Index) and PESQ (Perceptual Evaluation of Speech Quality). The predictions from these methods did not matched the result of the listening exercise.
KeywordsStøjreduktion, høreapparat, taleforståelighed, lytteforsøg
TypeMaster's thesis [Academic thesis]
Year2004
PublisherInformatics and Mathematical Modelling, Technical University of Denmark, DTU
AddressRichard Petersens Plads, Building 321, DK-2800 Kgs. Lyngby
SeriesIMM-Thesis-2004-69
NoteSupervised by Assoc. Prof. Jan Larsen
Electronic version(s)[pdf]
BibTeX data [bibtex]
IMM Group(s)Intelligent Signal Processing


Back  ::  IMM Publications