view in publisher's site

Multistage classification scheme to enhance speech emotion recognition

During the past decades, emotion recognition from speech has become one of the most explored areas in affective computing. These systems lack universality due to multilingualism. Research in this direction is restrained due to unavailability of emotional speech databases in various spoken languages. Arabic is one such language, which faces this inadequacy. The proposed work aims at developing a speech emotion recognition system for Arabic speaking community. A speech database with elicited emotions—anger, happiness, sadness, disgust, surprise and neutrality are recorded from 14 subjects, who are non-native, but proficient speakers in the language. The prosodic, spectral and cepstral features are extracted after pre-processing. Subsequently the features were subjected to single stage classification using supervised learning methods viz. Support vector machine and Extreme learning machine. The performance of the speech emotion recognition systems implemented are compared in terms of accuracy, specificity, precision and recall. Further analysis is carried out by adopting three multistage classification schemes. The first scheme followed a two stage classification by initially identifying gender and then the emotions. The second used a divide and conquer approach, utilizing cascaded binary classifiers and the third, a parallel approach by classification with individual features, followed by a decision logic. The result of the study depicts that, these multistage classification schemes an bring improvement in the performance of speech emotion recognition system compared to the one with single stage classification. Comparable results were obtained for same experiments carried out using Emo-DB database.

طرح طبقه‌بندی multistage برای افزایش شناخت احساسات گفتار

در طول دهه‌های گذشته، تشخیص احساسات از سخنرانی به یکی از the حوزه‌های پردازش عاطفی تبدیل شده‌است. این سیستم‌ها به دلیل to فاقد عمومیت هستند. تحقیقات در این جهت به دلیل در دسترس نبودن پایگاه‌های داده گفتار احساسی در زبان‌های مختلف گفتاری، مهار شده‌است. عربی یکی از این زبان است که با این بی‌کفایتی مواجه است. هدف از این کار توسعه یک سیستم بازشناسی احساسات گفتار برای جامعه گفتاری عربی است. یک پایگاه‌داده گفتار با احساسات، عصبانیت، شادی، ناراحتی، انزجار، غافلگیری و بی‌طرفی از ۱۴ فرد که غیر بومی هستند، اما در زبان speakers مهارت دارند ثبت می‌شوند. ویژگی‌های prosodic، طیفی و cepstral پس از پیش‌پردازش استخراج می‌شوند. متعاقبا، ویژگی‌های طبقه‌بندی مرحله منفرد با استفاده از روش‌های یادگیری نظارت شده عبارتند از:. ماشین بردار پشتیبان و ماشین یادگیری افراطی. عملکرد سیستم‌های تشخیص احساسات گفتار اجرا شده در مقایسه با دقت، ویژگی، دقت و یادآوری است. تجزیه و تحلیل بیشتر با اتخاذ سه طرح طبقه‌بندی چند مرحله‌ای انجام می‌شود. اولین طرح، طبقه‌بندی دو مرحله‌ای را با شناسایی جنسیت و سپس احساسات دنبال کرد. دومین مورد استفاده از روش تقسیم و غلبه، استفاده از طبقه‌بندی کننده‌های باینری آبشاری و سومی، یک رویکرد موازی با طبقه‌بندی با ویژگی‌های فردی، و پس از آن یک منطق تصمیم‌گیری است. نتایج این مطالعه نشان می‌دهد که این طرح‌های طبقه‌بندی چند مرحله‌ای باعث بهبود عملکرد سیستم بازشناسی احساسات گفتار در مقایسه با فرد با طبقه‌بندی تک مرحله‌ای می‌شود. نتایج حاصله برای آزمایش‌ها مشابه با استفاده از پایگاه‌داده Emo - DB به دست آمد.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Language and Linguistics
  • ترجمه مقاله Language and Linguistics
  • مقاله زبان و زبان‌شناسی
  • ترجمه مقاله زبان و زبان‌شناسی
  • مقاله Computer Vision and Pattern Recognition
  • ترجمه مقاله Computer Vision and Pattern Recognition
  • مقاله بینایی کامپیوتری و تشخیص الگو
  • ترجمه مقاله بینایی کامپیوتری و تشخیص الگو
  • مقاله Software
  • ترجمه مقاله Software
  • مقاله نرم‌افزار
  • ترجمه مقاله نرم‌افزار
  • مقاله Human-Computer Interaction
  • ترجمه مقاله Human-Computer Interaction
  • مقاله تعامل انسان - کامپیوتر
  • ترجمه مقاله تعامل انسان - کامپیوتر
  • مقاله Linguistics and Language
  • ترجمه مقاله Linguistics and Language
  • مقاله زبان‌شناسی و زبان
  • ترجمه مقاله زبان‌شناسی و زبان
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.