view in publisher's site

A noise robust speech features extraction approach in multidimensional cortical representation using multilinear principal component analysis

In this paper, we propose a new type of noise robust feature extraction method based on multidimensional perceptual representation of speech in the auditory cortex (AI). Different coded features in different dimensions cause an increase in discrimination power of the system. On the other hand, this representation causes a great increase in the volume of information that produces the curse of dimensionality phenomenon. In this study, we propose a second level feature extraction stage to make the features suitable and noise robust for classification training. In the second level of feature extraction, we target two main concerns: dimensionality reduction and noise robustness using singular value decomposition (SVD) approach. A multilinear principal component analysis framework based on higher-order SVD is proposed to extract the final features in high-dimensional AI output space. The phoneme classification results on different subsets of the phonemes of additive noise contaminated TIMIT database confirmed that the proposed method not only increased the classification rate considerably, but also enhanced the robustness significantly comparing to conventional Mel-frequency cepstral coefficient and cepstral mean normalization features, which were used to train in the same classifier.

یک روش استخراج ویژگی‌های گفتار استوار در نمایش چند بعدی با استفاده از تحلیل مولفه اصلی multilinear

در این مقاله، ما یک نوع جدید از روش استخراج ویژگی مبتنی بر نمایش ادراکی چند بعدی گفتار در قشر شنوایی را پیشنهاد می‌کنیم. ویژگی‌های مختلف کدگذاری شده در ابعاد مختلف باعث افزایش قدرت تفکیک سیستم می‌شوند. از طرف دیگر، این نمایش باعث افزایش بزرگی در حجم اطلاعاتی می‌شود که پدیده ابعاد بعدی را تولید می‌کند. در این مطالعه، ما مرحله استخراج ویژگی سطح دوم را پیشنهاد می‌کنیم تا ویژگی‌های مناسب و نویز را برای آموزش طبقه‌بندی فراهم کنیم. در سطح دوم استخراج ویژگی، دو نگرانی اصلی را هدف قرار می‌دهیم: کاهش بعد و استحکام صدا با استفاده از رویکرد تجزیه ارزش تکین (SVD). یک چارچوب تحلیل مولفه اصلی مبتنی بر SVD مرتبه بالاتر برای استخراج ویژگی‌های نهایی در فضای خروجی هوش مصنوعی با ابعاد بالا پیشنهاد شده‌است. نتایج طبقه‌بندی واج بر روی زیر مجموعه‌های مختلف واج‌های متناظر با پایگاه‌داده حاوی نویز افزوده تایید می‌کند که روش پیشنهادی نه تنها نرخ طبقه‌بندی را به طور قابل‌توجهی افزایش می‌دهد، بلکه مقاومت را به طور قابل‌توجهی نسبت به ضریب ویژگی نرمال سازی مرسوم با ویژگی نرمال سازی مقایسه می‌کند، که برای آموزش در طبقه‌بندی کننده یک‌سان استفاده شده‌است.
ترجمه شده با

سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.