view in publisher's site

Enhanced speech emotion detection using deep neural networks

This paper focusses on investigation of the effective performance of perceptual based speech features on emotion detection. Mel frequency cepstral coefficients (MFCC’s), perceptual linear predictive cepstrum (PLPC), Mel frequency perceptual linear prediction cepstrum (MFPLPC), bark frequency cepstral coefficients (BFCC), revised perceptual linear prediction coefficient’s (RPLP) and inverted Mel frequency cepstral coefficients (IMFCC) are the perception features considered. The algorithm using these auditory cues is evaluated with deep neural networks (DNN). The novelty of the work involves analysis of the perceptual features to identify predominant features that contain significant emotional information about the speaker. The validity of the algorithm is analysed on publicly available Berlin database with seven emotions in 1-dimensional space termed categorical and 2-dimensional continuous space consisting of emotions in valence and arousal dimensions. Comparative analysis reveals that considerable improvement in the performance of emotion recognition is obtained using DNN with the identified combination of perceptual features.

بهبود تشخیص احساسات گفتار با استفاده از شبکه‌های عصبی عمیق

این مقاله بر روی بررسی عملکرد موثر ویژگی‌های گفتار بر پایه تشخیص احساسات تمرکز دارد. ضرایب cepstral فرکانس مل (MFCC)، پیش‌بینی پیش‌بینی خطی perceptual cepstrum (PLPC)، ضرایب پیش‌بینی خطی perceptual Mel (MFPLPC)، ضریب پیش‌بینی خطی رگرسیون خطی (RPLP)و ضرایب cepstral فرکانس میکروویو معکوس (IMFCC)ویژگی‌های ادراکی در نظر گرفته می‌شوند. الگوریتم با استفاده از این نشانه‌های شنیداری، با شبکه‌های عصبی عمیق ارزیابی می‌شود. تازگی کار شامل تجزیه و تحلیل ویژگی‌های ادراکی برای شناسایی ویژگی‌های غالب است که حاوی اطلاعات عاطفی قابل‌توجهی در مورد سخنگو هستند. اعتبار این الگوریتم در پایگاه عمومی در دسترس برلین با هفت احساس در فضای ۱ بعدی به عنوان فضای پیوسته دو بعدی به عنوان فضای پیوسته دو بعدی شامل عواطف در ابعاد ظرفیت و برانگیختگی مورد تجزیه و تحلیل قرار می‌گیرد. آنالیز تطبیقی نشان می‌دهد که بهبود قابل‌توجهی در عملکرد تشخیص احساسات با استفاده از DNN با ترکیب شناسایی‌شده از ویژگی‌های ادراکی بدست می‌آید.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Language and Linguistics
  • ترجمه مقاله Language and Linguistics
  • مقاله زبان و زبان‌شناسی
  • ترجمه مقاله زبان و زبان‌شناسی
  • مقاله Computer Vision and Pattern Recognition
  • ترجمه مقاله Computer Vision and Pattern Recognition
  • مقاله بینایی کامپیوتری و تشخیص الگو
  • ترجمه مقاله بینایی کامپیوتری و تشخیص الگو
  • مقاله Software
  • ترجمه مقاله Software
  • مقاله نرم‌افزار
  • ترجمه مقاله نرم‌افزار
  • مقاله Human-Computer Interaction
  • ترجمه مقاله Human-Computer Interaction
  • مقاله تعامل انسان - کامپیوتر
  • ترجمه مقاله تعامل انسان - کامپیوتر
  • مقاله Linguistics and Language
  • ترجمه مقاله Linguistics and Language
  • مقاله زبان‌شناسی و زبان
  • ترجمه مقاله زبان‌شناسی و زبان
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.