view in publisher's site

A month to topic detection and tracking in Hindi

We describe the one-month (June 2003) effort to create a topic detection and tracking (TDT) system to support news stories in Hindi. The University of Massachusetts submitted results for three different TDT tasks in the DARPA surprise language evaluation. The official task was topic tracking, but we also provided results for the new event detection and topic detection (clustering) tasks. Our approach to all three tasks was based on the vector-space model of information retrieval. We also describe the process we used to create the relevance judgments used to evaluate the system. Results suggest that topic tracking effectiveness is comparable to that of TDT tracking systems in other languages. Results for clustering and new event detection indicate that parameter settings for those tasks are sensitive to the language being used.

یک ماه برای کشف موضوع و ردیابی به زبان هندی

ما یک تلاش یک ماهه (ژوئن ۲۰۰۳)برای ایجاد یک سیستم تشخیص و ردیابی موضوعی برای پشتیبانی از داستان‌های خبری در زبان هندی را شرح می‌دهیم. دانشگاه ماساچوست، نتایج مربوط به سه وظیفه TDT مختلف در ارزیابی زبان غافلگیر کننده دارپا را ارائه کرد. وظیفه رسمی ردیابی موضوع بود، اما ما همچنین نتایج برای تشخیص رویداد جدید و شناسایی موضوع (خوشه‌بندی)فراهم کردیم. رویکرد ما به هر سه وظیفه بر مبنای مدل برداری از بازیابی اطلاعات بود. ما همچنین فرآیند مورد استفاده برای ایجاد قضاوت ارتباط استفاده‌شده برای ارزیابی سیستم را توصیف می‌کنیم. نتایج نشان می‌دهند که اثربخشی ردیابی موضوع قابل‌مقایسه با سیستم‌های ردیابی TDT در زبان‌های دیگر است. نتایج خوشه‌بندی و تشخیص رویداد جدید نشان می‌دهد که تنظیمات پارامتر برای این وظایف به زبانی که مورد استفاده قرار می‌گیرد، حساس هستند.

ترجمه شده با

Download PDF سفارش ترجمه این مقاله این مقاله را خودتان با کمک ترجمه کنید
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.