view in publisher's site

Enhancing the Performance of Gaussian Mixture Model-Based Text Independent Speaker Identification

In this paper, we seek to enhance the identification performance of Gaussian Mixture Model (GMM)-based speaker identification systems in the presence of a limited amount of training data and a relatively large number of speakers. The performance is characterized by the identification accuracy, the identification time, and the model complexity. A new model order selection technique based on the Goodness of Fit (GOF) statistical test is proposed in order to increase the identification accuracy. This technique has shown to outperform other well known model order selection techniques like the Minimum Description Length (MDL) and the Akaike Information Criterion (AIC) in terms of the identification accuracy and the robustness against telephone channel degradation effects. In addition, the identification time is decreased by adapting the Linear Discriminative Analysis (LDA) feature extraction technique to fit our basic assumption of asymmetric multimodal distribution of the training data of each speaker. This modification results in a large decrease in the identification time with a little effect on the identification accuracy.

بهبود عملکرد الگوریتم های مبتنی بر مدل Mixture Text - مبتنی بر مدل Text

در این مقاله، ما به دنبال افزایش عملکرد شناسایی سیستم‌های شناسایی speaker گاوسی (GMM)در حضور مقدار محدودی داده آموزشی و تعداد نسبتا زیادی گویشور هستند. عملکرد با دقت شناسایی، زمان شناسایی و پیچیدگی مدل مشخص می‌شود. یک تکنیک جدید انتخاب سفارش مبتنی بر "Goodness تناسب" (GOF)برای افزایش دقت شناسایی پیشنهاد شده‌است. این تکنیک نشان می‌دهد که بهتر از سایر تکنیک‌های انتخاب مرتبه مدل شناخته‌شده مانند Minimum Description (MDL)و معیار اطلاعات Akaike (AIC)از نظر دقت شناسایی و مقاومت در برابر تاثیرات تخریب کانال تلفن بهتر عمل می‌کند. علاوه بر این، زمان شناسایی با استفاده از تکنیک استخراج ویژگی خطی (LDA)کاهش می‌یابد تا با فرض اساسی توزیع چند وجهی نامتقارن داده‌های آموزشی هر گوینده متناسب شود. این تغییر منجر به کاهش زیادی در زمان شناسایی با تاثیر کمی بر دقت شناسایی می‌شود.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Language and Linguistics
  • ترجمه مقاله Language and Linguistics
  • مقاله زبان و زبان‌شناسی
  • ترجمه مقاله زبان و زبان‌شناسی
  • مقاله Computer Vision and Pattern Recognition
  • ترجمه مقاله Computer Vision and Pattern Recognition
  • مقاله بینایی کامپیوتری و تشخیص الگو
  • ترجمه مقاله بینایی کامپیوتری و تشخیص الگو
  • مقاله Software
  • ترجمه مقاله Software
  • مقاله نرم‌افزار
  • ترجمه مقاله نرم‌افزار
  • مقاله Human-Computer Interaction
  • ترجمه مقاله Human-Computer Interaction
  • مقاله تعامل انسان - کامپیوتر
  • ترجمه مقاله تعامل انسان - کامپیوتر
  • مقاله Linguistics and Language
  • ترجمه مقاله Linguistics and Language
  • مقاله زبان‌شناسی و زبان
  • ترجمه مقاله زبان‌شناسی و زبان
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.