view in publisher's site

Speaker recognition under stressed condition

This paper presents the feature analysis and design of compensators for speaker recognition under stressed speech conditions. Any condition that causes a speaker to vary his or her speech production from normal or neutral condition is called stressed speech condition. Stressed speech is induced by emotion, high workload, sleep deprivation, frustration and environmental noise. In stressed condition, the characteristics of speech signal are different from that of normal or neutral condition. Due to changes in speech signal characteristics, performance of the speaker recognition system may degrade under stressed speech conditions. Firstly, six speech features (mel-frequency cepstral coefficients (MFCC), linear prediction (LP) coefficients, linear prediction cepstral coefficients (LPCC), reflection coefficients (RC), arc-sin reflection coefficients (ARC) and log-area ratios (LAR)), which are widely used for speaker recognition, are analyzed for evaluation of their characteristics under stressed condition. Secondly, Vector Quantization (VQ) classifier and Gaussian Mixture Model (GMM) are used to evaluate speaker recognition results with different speech features. This analysis help select the best feature set for speaker recognition under stressed condition. Finally, four VQ based novel compensation techniques are proposed and evaluated for improvement of speaker recognition under stressed condition. The compensation techniques are speaker and stressed information based compensation (SSIC), compensation by removal of stressed vectors (CRSV), cepstral mean normalization (CMN) and combination of MFCC and sinusoidal amplitude (CMSA) features. Speech data from SUSAS database corresponding to four different stressed conditions, Angry, Lombard, Question and Neutral, are used for analysis of speaker recognition under stressed condition.

شناسایی سخنگو تحت شرایط استرس

این مقاله تحلیل ویژگی و طراحی of برای تشخیص گویشور تحت شرایط تنش گفتاری را نشان می‌دهد. هر شرطی که باعث شود گویشور از حالت عادی یا خنثی متفاوت باشد، شرایط گفتاری استرس زده نامیده می‌شود. سخنرانی Stressed با هیجان، بارکاری بالا، محرومیت از خواب، ناامیدی و نویز محیطی القا می‌شود. در شرایط استرس، ویژگی‌های سیگنال گفتار متفاوت از حالت عادی و یا حالت خنثی هستند. با توجه به تغییرات در ویژگی‌های سیگنال گفتار، عملکرد سیستم تشخیص گویشور ممکن است تحت شرایط کلامی استرس زا تخریب شود. ابتدا، شش ویژگی بیان (MFCC - فرکانس)، ضرایب انعکاس خطی (LP)، ضرایب انعکاس خطی (lpcc)، ضرایب بازتاب (ARC GIS)، ضرایب بازتاب (ARC GIS)، ضرایب بازتاب (ARC GIS)، ضرایب انعکاس (ARC GIS)و ضریب بازتاب (LAR)که به طور گسترده برای شناسایی گویشور مورد استفاده قرار می‌گیرند، برای ارزیابی ویژگی‌های آن‌ها تحت شرایط استرس مورد بررسی قرار می‌گیرند. دوم، برای ارزیابی نتایج بازشناسی گویشور با ویژگی‌های مختلف کلامی، از طبقه‌بندی کننده Vector (GMM)و مدل Mixture Gaussian (GMM)استفاده می‌شود. این تحلیل به انتخاب بهترین مجموعه ویژگی برای تشخیص گویشور تحت شرایط استرس زده کمک می‌کند. در نهایت، چهار روش کمپنزاسیون جدید مبتنی بر vq برای بهبود تشخیص گویشور تحت شرایط استرس زده پیشنهاد و ارزیابی می‌شوند. تکنیک‌های کمپنزاسیون گوینده و استرس مبتنی بر اطلاعات استرس (SSIC)، کمپنزاسیون با حذف بردارهای استرس (crsv)، normalization میانگین cepstral (cmn)و ترکیب ویژگی‌های MFCC و دامنه سینوسی (CMSA)هستند. داده‌های گفتار از پایگاه‌داده SUSAS مطابق با چهار شرایط استرس مختلف، عصبانی، Lombard، سوال و بی‌طرف برای تحلیل تشخیص گویشور تحت شرایط استرس مورد استفاده قرار می‌گیرند.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Language and Linguistics
  • ترجمه مقاله Language and Linguistics
  • مقاله زبان و زبان‌شناسی
  • ترجمه مقاله زبان و زبان‌شناسی
  • مقاله Computer Vision and Pattern Recognition
  • ترجمه مقاله Computer Vision and Pattern Recognition
  • مقاله بینایی کامپیوتری و تشخیص الگو
  • ترجمه مقاله بینایی کامپیوتری و تشخیص الگو
  • مقاله Software
  • ترجمه مقاله Software
  • مقاله نرم‌افزار
  • ترجمه مقاله نرم‌افزار
  • مقاله Human-Computer Interaction
  • ترجمه مقاله Human-Computer Interaction
  • مقاله تعامل انسان - کامپیوتر
  • ترجمه مقاله تعامل انسان - کامپیوتر
  • مقاله Linguistics and Language
  • ترجمه مقاله Linguistics and Language
  • مقاله زبان‌شناسی و زبان
  • ترجمه مقاله زبان‌شناسی و زبان
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.