view in publisher's site

Improving Arabic information retrieval using word embedding similarities

Term mismatch is a common limitation of traditional information retrieval (IR) models where relevance scores are estimated based on exact matching of documents and queries. Typically, good IR model should consider distinct but semantically similar words in the matching process. In this paper, we propose a method to incorporate word embedding (WE) semantic similarities into existing probabilistic IR models for Arabic in order to deal with term mismatch. Experiments are performed on the standard Arabic TREC collection using three neural word embedding models. The results show that extending the existing IR models improves significantly baseline bag-of-words models. Although the proposed extensions significantly outperform their baseline bag-of-words, the difference between the evaluated neural word embedding models is not statistically significant. Moreover, the overall comparison results show that our extensions significantly improve the Arabic WordNet based semantic indexing approach and three recent WE-based IR language models.

بهبود بازیابی اطلاعات عربی با استفاده از similarities word

عدم تطابق مدت یک محدودیت معمول از مدل‌های بازیابی اطلاعات سنتی (IR)است که در آن نمرات مربوط براساس تطابق دقیق اسناد و پرس و جوها (IR)تخمین زده می‌شوند. به طور معمول، یک مدل IR خوب باید کلمات متمایز اما معنایی مشابه در فرآیند تطبیق را در نظر بگیرد. در این مقاله، ما روشی را برای گنجاندن شباهت معنایی در مدل‌های پیشنهادی IR موجود برای عربی به منظور مقابله با عدم تطابق واژه پیشنهاد می‌کنیم. آزمایش‌ها بر روی مجموعه استاندارد TREC عربی با استفاده از سه مدل شبکه عصبی انجام شده‌است. نتایج نشان می‌دهد که گسترش مدل IR موجود به طور قابل‌توجهی مدل‌های مبتنی بر بسته را بهبود می‌بخشد. هر چند که extensions پیشنهادی به طور قابل‌توجهی عملکرد بهتری نسبت به کیسه اصلی خود دارند، اما تفاوت بین مدل‌های فرض شده عصبی مصنوعی به لحاظ آماری معنی‌دار نیست. علاوه بر این، نتایج مقایسه کلی نشان می‌دهد که extensions به طور قابل‌توجهی رویکرد نمایه‌سازی معنایی مبتنی بر سایت Arabic را بهبود می‌بخشد و سه مدل زبانی IR در این زمینه را در بر می‌گیرد.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Language and Linguistics
  • ترجمه مقاله Language and Linguistics
  • مقاله زبان و زبان‌شناسی
  • ترجمه مقاله زبان و زبان‌شناسی
  • مقاله Computer Vision and Pattern Recognition
  • ترجمه مقاله Computer Vision and Pattern Recognition
  • مقاله بینایی کامپیوتری و تشخیص الگو
  • ترجمه مقاله بینایی کامپیوتری و تشخیص الگو
  • مقاله Software
  • ترجمه مقاله Software
  • مقاله نرم‌افزار
  • ترجمه مقاله نرم‌افزار
  • مقاله Human-Computer Interaction
  • ترجمه مقاله Human-Computer Interaction
  • مقاله تعامل انسان - کامپیوتر
  • ترجمه مقاله تعامل انسان - کامپیوتر
  • مقاله Linguistics and Language
  • ترجمه مقاله Linguistics and Language
  • مقاله زبان‌شناسی و زبان
  • ترجمه مقاله زبان‌شناسی و زبان
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.