view in publisher's site

Improved i-vector extraction technique for speaker verification with short utterances

A major challenge in ASV is to improve performance with short speech segments for end-user convenience in real-world applications. In this paper, we present a detailed analysis of ASV systems to observe the duration variability effects on state-of-the-art i-vector and classical Gaussian mixture model-universal background model (GMM-UBM) based ASV systems. We observe an increase in uncertainty of model parameter estimation for i-vector based ASV with speech of shorter duration. In order to compensate the effect of duration variability in short utterances, we have proposed adaptation technique for Baum-Welch statistics estimation used to i-vector extraction. Information from pre-estimated background model parameters are used for adaptation method. The ASV performance with the proposed approach is considerably superior to the conventional i-vector based system. Furthermore, the fusion of proposed i-vector based system and GMM-UBM further improves the ASV performance, especially for short speech segments. Experiments conducted on two speech corpora, NIST SRE 2008 and 2010, have shown relative improvement in equal error rate (EER) in the range of 12–20%.

بهبود تکنیک استخراج بردار I برای تایید گوینده با جملات کوتاه

چالش عمده در asv بهبود عملکرد با قطعات کوتاه صحبت برای راحتی کاربر نهایی در کاربردهای دنیای واقعی است. در این مقاله، ما یک تحلیل مفصل از سیستم‌های asv برای مشاهده تاثیرات تغییرپذیری دوره بر روی سیستم‌های state - i - vector و مخلوط گاوسی کلاسیک - مدل پس‌زمینه جهانی (GMM - ubm)مبتنی بر سیستم‌های asv ارایه می‌کنیم. ما افزایشی را در عدم قطعیت تخمین پارامتر مدل برای asv مبتنی بر بردار i با گفتار مدت کوتاه‌تر مشاهده می‌کنیم. به منظور جبران اثر تغییرپذیری مدت در گفته‌های کوتاه، ما تکنیک انطباق را برای تخمین آمار Baum - Welch مورد استفاده قرار دادیم. اطلاعات حاصل از پارامترهای مدل پس‌زمینه پیش از تخمین برای روش انطباق استفاده می‌شوند. عملکرد asv با روش پیشنهادی به طور قابل‌توجهی نسبت به سیستم مبتنی بر بردار معمولی برتری دارد. علاوه بر این، ادغام سیستم مبتنی بر بردار i و GMM - ubm عملکرد asv را به ویژه برای بخش‌های صحبت کوتاه بهبود می‌بخشد. آزمایش‌ها انجام‌شده بر روی دو پیکره زبانی، NIST sre ۲۰۰۸ و ۲۰۱۰، بهبود نسبی در نرخ خطای برابر (EER)را در محدوده ۱۲ تا ۲۰ % نشان داده‌اند.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Language and Linguistics
  • ترجمه مقاله Language and Linguistics
  • مقاله زبان و زبان‌شناسی
  • ترجمه مقاله زبان و زبان‌شناسی
  • مقاله Computer Vision and Pattern Recognition
  • ترجمه مقاله Computer Vision and Pattern Recognition
  • مقاله بینایی کامپیوتری و تشخیص الگو
  • ترجمه مقاله بینایی کامپیوتری و تشخیص الگو
  • مقاله Software
  • ترجمه مقاله Software
  • مقاله نرم‌افزار
  • ترجمه مقاله نرم‌افزار
  • مقاله Human-Computer Interaction
  • ترجمه مقاله Human-Computer Interaction
  • مقاله تعامل انسان - کامپیوتر
  • ترجمه مقاله تعامل انسان - کامپیوتر
  • مقاله Linguistics and Language
  • ترجمه مقاله Linguistics and Language
  • مقاله زبان‌شناسی و زبان
  • ترجمه مقاله زبان‌شناسی و زبان
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.