view in publisher's site

Supervector-based approaches in a discriminative framework for speaker verification in noisy environments

This paper explores the robustness of supervector-based speaker modeling approaches for speaker verification (SV) in noisy environments. In this paper speaker modeling is carried out in two different frameworks: (i) Gaussian mixture model-support vector machine (GMM-SVM) combined method and (ii) total variability modeling method. In the GMM-SVM combined method, supervectors obtained by concatenating the mean of an adapted speaker GMMs are used to train speaker-specific SVMs during the training/enrollment phase of SV. During the evaluation/testing phase, noisy test utterances transformed into supervectors are subjected to SVM-based pattern matching and classification. In the total variability modeling method, large size supervectors are reduced to a low dimensional channel robust vector (i-vector) prior to SVM training and subsequent evaluation. Special emphasis has been laid on the significance of a utterance partitioning technique for mitigating data-imbalance and utterance duration mismatches. An adaptive boosting algorithm is proposed in the total variability modeling framework for enhancing the accuracy of SVM classifiers. Experiments performed on the NIST-SRE-2003 database with training and test utterances corrupted with additive noises indicate that the aforementioned modeling methods outperform the standard GMM-universal background model (GMM-UBM) framework for SV. It is observed that the use of utterance partitioning and adaptive boosting in the speaker modeling frameworks result in substantial performance improvements under degraded conditions.

روش‌های مبتنی بر Supervector در یک چارچوب متمایز برای بررسی گویشور در محیط‌های پر سر و صدا

این مقاله به بررسی قدرت روش‌های مدل‌سازی گوینده مبتنی بر supervector برای تایید گوینده (SV)در محیط‌های پر سر و صدا می‌پردازد. در این مقاله، مدلسازی گویشور در دو قالب مختلف انجام می‌شود: (i)مدل مخلوط گاوسی - پشتیبان (GMM - SVM)ترکیبی و (ii)روش مدل‌سازی تغییرپذیری کلی. در روش ترکیبی GMM - SVM، supervectors به وسیله concatenating به منظور آموزش svms خاص گوینده در طول فاز آموزش / ثبت‌نام of به کار می‌رود. در طول مرحله ارزیابی / تست، گفته می‌شود که گفته تست پر سر و صدا تبدیل به supervectors می‌شود که در معرض تطابق و طبقه‌بندی الگوی مبتنی بر SVM هستند. در روش مدل‌سازی تغییرپذیری کلی، supervectors بزرگ به یک بردار قوی کانال قوی (i - بردار)قبل از آموزش SVM و ارزیابی بعدی کاهش‌یافته اند. تاکید ویژه بر اهمیت یک تکنیک افرازبندی بر مبنای کاهش عدم تعادل داده‌ها و عدم mismatches مدت گفته شده‌است. یک الگوریتم افزایش وفقی در چارچوب مدل‌سازی تغییرپذیری کلی برای افزایش دقت طبقه‌بندی کننده‌های SVM ارایه شده‌است. آزمایش‌ها بر روی پایگاه‌داده NIST - sre - ۲۰۰۳ با آموزش و آزمون جملات فاسد شده با نویزهای جمعی نشان می‌دهد که روش‌های مدل‌سازی فوق‌الذکر بهتر از چارچوب استاندارد (GMM - ubm)مدل پیش‌زمینه جهانی GMM (GMM - SV)عمل می‌کنند. مشاهده می‌شود که استفاده از پارتیشن بندی و تقویت تطبیقی در چارچوب‌های مدلسازی گویشور منجر به بهبود عملکرد اساسی تحت شرایط تخریب شده‌است.
ترجمه شده با

سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.