view in publisher's site

Transformer based Deep Intelligent Contextual Embedding for Twitter sentiment analysis

Highlights•Present transformer based word representation by encoding representations from Transformer and DICET.•DICET enhances the tweet quality by handling noises within contexts,•Integrate six embeddings to involve polysemy, semantics, syntax, OOV words and sentiment knowledge.•Present word representation which is then fed to BiLSTM with attention to determine the sentiment.•Experimental results show that our model outperforms several baselines methods.AbstractAlong with the emergence of the Internet, the rapid development of handheld devices has democratized content creation due to the extensive use of social media and has resulted in an explosion of short informal texts. Although a sentiment analysis of these texts is valuable for many reasons, this task is often perceived as a challenge given that these texts are often short, informal, noisy, and rich in language ambiguities, such as polysemy. Moreover, most of the existing sentiment analysis methods are based on clean data. In this paper, we present DICET, a transformer-based method for sentiment analysis that encodes representation from a transformer and applies deep intelligent contextual embedding to enhance the quality of tweets by removing noise while taking word sentiments, polysemy, syntax, and semantic knowledge into account. We also use the bidirectional long- and short-term memory network to determine the sentiment of a tweet. To validate the performance of the proposed framework, we perform extensive experiments on three benchmark datasets, and results show that DICET considerably outperforms the state of the art in sentiment classification.

تجزیه و تحلیل وضعیت هوشمند مبتنی بر ترانسفورماتور برای تحلیل احساسات تویی‌تر

نکات مهم: نمایش پیغام بر پایه ترانسفورمر با نمایش کد گذاری از ترانسفورماتور و ترانسفورماتور. * کیفیت tweet را با سرو صدا در متن‌ها بهبود می‌بخشد، * شش embeddings را ادغام می‌کند تا متضمن polysemy، معناشناسی، نحو، کلمات OOV و دانش احساسی باشد. ارایه کلامی که بعد از آن به BiLSTM با توجه به تعیین احساسات تغذیه می‌شود. نتایج تجربی نشان می‌دهد که مدل ما از چند خط baselines methods.Abst با ظهور اینترنت بهتر عمل می‌کند، توسعه سریع وسایل دستی به دلیل استفاده گسترده از رسانه‌های اجتماعی ایجاد شده‌است و منجر به انفجاری متن‌های غیر رسمی کوتاه شده‌است. اگرچه تحلیل احساسی این متون برای بسیاری از دلایل ارزشمند است، اما این وظیفه اغلب به عنوان یک چالش تلقی می‌شود که این متون اغلب کوتاه، غیر رسمی، پر سر و صدا و غنی از ابهامات زبانی مانند polysemy هستند. علاوه بر این، اغلب روش‌های آنالیز احساسی موجود مبتنی بر داده‌های تمیز هستند. در این مقاله، ما DICET را معرفی می‌کنیم که یک روش مبتنی بر ترانسفورماتور برای آنالیز احساسی است که بازنمایی از یک ترانسفورماتور را رمزگذاری می‌کند و به کار می‌برد تا کیفیت of ها را با حذف سر و صدا در حین استفاده از احساسات، polysemy، نحو و دانش معنایی در نظر بگیرد. ما همچنین از شبکه حافظه بلند مدت و کوتاه برای تعیین احساس یک tweet استفاده می‌کنیم. برای تایید عملکرد چارچوب پیشنهادی، آزمایش‌های گسترده‌ای را بر روی سه مجموعه داده معیار انجام می‌دهیم و نتایج نشان می‌دهند که DICET به طور قابل‌توجهی بهتر از وضعیت هنر در طبقه‌بندی احساسات عمل می‌کند.
ترجمه شده با

Download PDF سفارش ترجمه این مقاله این مقاله را خودتان با کمک ترجمه کنید
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.