view in publisher's site

MODE: multiobjective differential evolution for feature selection and classifier ensemble

In this paper, we propose a multiobjective differential evolution (MODE)-based feature selection and ensemble learning approaches for entity extraction in biomedical texts. The first step of the algorithm concerns with the problem of automatic feature selection in a machine learning framework, namely conditional random field. The final Pareto optimal front which is obtained as an output of the feature selection module contains a set of solutions, each of which represents a particular feature representation. In the second step of our algorithm, we combine a subset of these classifiers using a MODE-based ensemble technique. Our experiments on three benchmark datasets namely GENIA, GENETAG and AIMed show the F -measure values of 76.75, 94.15 and 91.91 %, respectively. Comparisons with the existing systems show that our proposed algorithm achieves the performance levels which are at par with the state of the art. These results also exhibit that our method is general in nature and because of this it performs well across the several domain of datasets. The key contribution of this work is the development of MODE-based generalized feature selection and ensemble learning techniques with the aim of extracting entities from the biomedical texts of several domains.

MODE: تکامل افتراقی multiobjective برای انتخاب ویژگی و گروه طبقه‌بندی کننده

در این مقاله، ما یک تکامل تفاضلی multiobjective (MODE)- مبتنی بر انتخاب ویژگی و رویکردهای یادگیری جمعی برای استخراج ماهیت در متون پزشکی ارائه می‌کنیم. اولین مرحله الگوریتم، مربوط به مساله انتخاب ویژگی اتوماتیک در یک چارچوب یادگیری ماشین، یعنی زمین تصادفی شرطی است. جبهه بهینه پارتو که به عنوان خروجی ماژول انتخاب ویژگی به دست می‌آید شامل مجموعه‌ای از راه‌حل‌ها است که هر کدام یک نمایش ویژگی خاص را نشان می‌دهد. در گام دوم الگوریتم ما، یک زیرمجموعه از این طبقه‌بندی کننده‌ها را با استفاده از تکنیک گروهی مبتنی بر MODE ترکیب می‌کنیم. آزمایش‌ها ما بر روی سه مجموعه داده مبنا به نام‌های genia، GENETAG و aimed مقادیر اندازه‌گیری F - اندازه‌گیری of، ۹۴.۱۵ و ۹۱.۹۱ % را نشان می‌دهند. مقایسه با سیستم‌های موجود نشان می‌دهد که الگوریتم پیشنهادی ما به سطوح کارایی که با وضعیت هنر همتراز است، دست می‌یابد. این نتایج همچنین نشان می‌دهند که روش ما به طور کلی در طبیعت است و به دلیل این که این روش در سراسر حوزه مجموعه داده‌ها خوب عمل می‌کند. نقش کلیدی این کار، توسعه انتخاب ویژگی کلی مبتنی بر MODE و تکنیک‌های یادگیری جمعی با هدف استخراج entities از متون زیست پزشکی چندین حوزه است.

ترجمه شده با

Download PDF سفارش ترجمه این مقاله این مقاله را خودتان با کمک ترجمه کنید
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.