view in publisher's site

Text-Independent Speaker Verification for Real Fast-Varying Noisy Environments

Investigating Speaker Verification in real-world noisy environments, a novel feature extraction process suitable for suppression of time-varying noise is compared with a fine-tuned spectral subtraction method. The proposed feature extraction process is based on approximating the clean speech and the noise spectral magnitude with a mixture of Gaussian probability density functions (pdfs) by using the Expectation-Maximization algorithm (EM). Subsequently, the Bayesian inference framework is applied to the degraded spectral coefficients, and by employing Minimum Mean Square Error Estimation (MMSE), a closed form solution for the spectral magnitude estimation task is derived. The estimated spectral magnitude finally is incorporated into the Mel-Frequency Cepstral Coefficients (MFCCs) front-end of a baseline text-independent speaker verification system, based on Probabilistic Neural Networks, which participated successfully in the 2002 NIST (National Institute of Standards and Technology of USA) Speaker Recognition Evaluation. A comparative study of the proposed technique for real-world noise types demonstrates a significant performance gain compared to the baseline speech features and to the spectral subtraction enhancement method. Improvements of the absolute speaker verification performance with more than 27% for 0 dB signal-to-noise ratio (SNR), compared to the MFCCs, and with more than 13% for −5 dB SNR, compared to the spectral subtraction version, were obtained in the case of a passing-by aircraft scenario.

تایید سخنگوی مستقل متن برای تعویض Real پر سر و صدا

بررسی سخنگوی تحقیق در محیط‌های پر سر و صدا در دنیای واقعی، یک فرآیند استخراج ویژگی جدید مناسب برای سرکوب نویز متغیر زمان با یک روش تفریق طیفی خوب مقایسه شده‌است. فرآیند استخراج ویژگی پیشنهادی بر پایه تقریب زدن گفتار تمیز و بزرگی طیفی نویز با ترکیبی از توابع چگالی احتمال گاوسی (pdfs)با استفاده از الگوریتم Expectation - Maximization (EM)است. پس از آن، چارچوب استنتاج بیزی برای ضرایب طیفی تجزیه شده اعمال می‌شود و با بکارگیری حداقل میانگین خطای مربع خطا (mmse)، یک راه‌حل فرم بسته برای برآورد بزرگی خطای طیفی بدست می‌آید. سرانجام، بزرگی طیفی تخمین زده‌شده در پایان یک سیستم تایید کننده فرکانس Mel (MFCCs)با استفاده از شبکه‌های عصبی احتمالی، مبتنی بر شبکه‌های عصبی احتمالی، که با موفقیت در موسسه ملی NIST ۲۰۰۲ (موسسه استانداردها و تکنولوژی آمریکا)ارزیابی شد، ادغام می‌شود. بررسی مقایسه‌ای تکنیک پیشنهادی برای انواع نویز دنیای واقعی نشان می‌دهد که بهره عملکردی قابل‌توجهی در مقایسه با ویژگی‌های خط پایه و روش بهبود تفریق طیفی نشان می‌دهد. بهبود عملکرد تایید کننده مطلق با بیش از ۲۷ % برای نسبت سیگنال به نویز ۰ dB، در مقایسه با حالت تفریق طیفی، در حالت عبور از حالت عبور هواپیما بدست آمد.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Language and Linguistics
  • ترجمه مقاله Language and Linguistics
  • مقاله زبان و زبان‌شناسی
  • ترجمه مقاله زبان و زبان‌شناسی
  • مقاله Computer Vision and Pattern Recognition
  • ترجمه مقاله Computer Vision and Pattern Recognition
  • مقاله بینایی کامپیوتری و تشخیص الگو
  • ترجمه مقاله بینایی کامپیوتری و تشخیص الگو
  • مقاله Software
  • ترجمه مقاله Software
  • مقاله نرم‌افزار
  • ترجمه مقاله نرم‌افزار
  • مقاله Human-Computer Interaction
  • ترجمه مقاله Human-Computer Interaction
  • مقاله تعامل انسان - کامپیوتر
  • ترجمه مقاله تعامل انسان - کامپیوتر
  • مقاله Linguistics and Language
  • ترجمه مقاله Linguistics and Language
  • مقاله زبان‌شناسی و زبان
  • ترجمه مقاله زبان‌شناسی و زبان
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.