view in publisher's site

Segment based emotion recognition using combined reduced features

The attitude of a human being involves with their emotions. Emotions can be observed in either verbally or visually or both. Verbal emotion recognition is a difficult task and an area of speech processing. It has a wide variety of applications in almost all fields. In this work, the authors have tried to recognize five types of emotion as anger, sadness, happiness, fear, and neutral. The work is focussed on the choice of spectral feature computation. For such purpose, Mel-frequency Cepstral coefficients (MFCC), spectral roll-off, spectral centroid and spectral flux are considered on frame-level extraction. Some of these features need to be reduced, combined, and balanced. The combined methods are verified and observed the effectiveness of results. The resulting features are used with neural network (NN) based models for recognition purpose. The models of multilayer perceptron (MLP), radial basis function network (RBFN), probabilistic neural network (PNN) and deep neural network (DNN) are considered and tested for the chosen features. It is observed that less amount of features provides reliable accuracy in case of PNN. The same utilizes less time for training and testing in case of MLP, RBFN, and PNN. However, DNN is not suitable for fewer amounts of features. It requires large data for better accuracy in the particular field. The results support the PNN with an average accuracy of 96.9% with low-dimensional feature sets, whereas the average accuracy of MLP, RBFN, DNN models found 90.1%, 92.7%, and 73.6% respectively.

بازشناسی هیجان مبتنی بر Segment با استفاده از ویژگی‌های ترکیبی کاهش‌یافته

نگرش یک انسان شامل احساسات آن‌ها است. احساسات را می توان هم به صورت شفاهی و هم به صورت بصری یا هر دو مشاهده کرد. تشخیص احساسات شفاهی کار دشواری است و یک حوزه پردازش گفتار است. کاربردهای فراوانی در تقریبا تمام زمینه‌ها دارد. در این کار، نویسندگان تلاش کرده‌اند تا پنج نوع احساس را به عنوان خشم، غم، شادی، شادی، ترس و خنثی شناسایی کنند. این اثر بر انتخاب محاسبات ویژگی طیفی متمرکز شده‌است. برای چنین هدفی، ضرایب Cepstral - فرکانس (MFCC)، roll طیفی، مرکز ثقل طیفی و شار طیفی در استخراج سطح قاب در نظر گرفته می‌شوند. برخی از این ویژگی‌ها باید کاهش، ترکیب‌شده و متعادل شوند. روش‌های ترکیبی صحت نتایج را تایید و مشاهده می‌شوند. ویژگی‌های حاصل از آن با مدل‌های شبکه عصبی (NN)برای هدف شناسایی استفاده می‌شوند. مدل‌های شبکه عصبی پرسپترون چند لایه (MLP)، شبکه توابع پایه شعاعی (rbfn)، شبکه عصبی احتمالی (pnn)و شبکه عصبی عمیق (DNN)در نظر گرفته می‌شوند. مشاهده می‌شود که مقدار کمتری از ویژگی‌ها دقت قابل اطمینانی را در مورد pnn فراهم می‌کند. همین کار از زمان کمتری برای آموزش و آزمایش در مورد of، rbfn و pnn بهره می‌گیرد. با این حال، DNN برای مقادیر کمتری از مشخصه‌ها مناسب نیست. برای دقت بیشتر در این زمینه، به داده‌های زیادی نیاز است. نتایج با دقت متوسط ۹۶.۹ درصد با مجموعه ویژگی‌های با ابعاد پایین حمایت می‌کند، در حالی که میانگین دقت مدل‌های MLP، rbfn، DNN به ترتیب ۹۰.۱ درصد، ۹۲.۷ درصد و ۷۳.۶ درصد بود.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Language and Linguistics
  • ترجمه مقاله Language and Linguistics
  • مقاله زبان و زبان‌شناسی
  • ترجمه مقاله زبان و زبان‌شناسی
  • مقاله Computer Vision and Pattern Recognition
  • ترجمه مقاله Computer Vision and Pattern Recognition
  • مقاله بینایی کامپیوتری و تشخیص الگو
  • ترجمه مقاله بینایی کامپیوتری و تشخیص الگو
  • مقاله Software
  • ترجمه مقاله Software
  • مقاله نرم‌افزار
  • ترجمه مقاله نرم‌افزار
  • مقاله Human-Computer Interaction
  • ترجمه مقاله Human-Computer Interaction
  • مقاله تعامل انسان - کامپیوتر
  • ترجمه مقاله تعامل انسان - کامپیوتر
  • مقاله Linguistics and Language
  • ترجمه مقاله Linguistics and Language
  • مقاله زبان‌شناسی و زبان
  • ترجمه مقاله زبان‌شناسی و زبان
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.