view in publisher's site

Diverse training dataset generation based on a multi-objective optimization for semi-Supervised classification

Highlights•A new method to avoid the lack of labeled data and increase the accuracy of semi-supervised classifications.•Synthetic labeled data generation approach with low density (high diversity) and high classification accuracy.•Optimization synthetic labeled instances with Non-dominated sorting genetic algorithm II (NSGA-II).•Extensive experiments on 63 challenging datasets demonstrate the effectiveness of our approach.AbstractThe self-labeled technique is a type of semi-supervised classification that can be used when labeled data are lacking. Although existing self-labeled techniques show promise in many areas of classification and pattern recognition, they commonly incorrectly label data. The reasons for this problem are the shortage of labeled data and the inappropriate distribution of data in problem space. To deal with this problem, we propose in this paper a synthetic, labeled data generation method based on accuracy and density. Positions of generated data are improved through a multi-objective evolutionary algorithm with two objectives – accuracy and density. The density function generates data with an appropriate distribution and diversity in feature space, whereas the accuracy function eliminates outlier data. The advantage of the proposed method over existing ones is that it simultaneously considers accuracy and distribution of generated data in feature space. We have applied the new proposed method on four self-labeled techniques with different features, i.e., Democratic-co, Tri-training, Co-forest, and Co-bagging. The results show that the proposed method is superior to existing methods in terms of classification accuracy. Also, the superiority of the proposed method is confirmed over other data generation methods such as SMOTE, Borderline SMOTE, Safe-level SMOTE and SMOTE-RSB.

مجموعه داده‌های آموزشی متنوع براساس بهینه‌سازی چند هدفه برای طبقه‌بندی نیمه -

نکات مهم: یک روش جدید برای اجتناب از فقدان داده‌های برچسب دار و افزایش دقت طبقه‌بندی نیمه نظارت شده. * روش تولید داده برچسب خورده با چگالی پایین (تنوع بالا)و دقت طبقه‌بندی بالا. * Optimization با استفاده از الگوریتم ژنتیک طبقه‌بندی dominated II (nsga - II). آزمایش‌ها گسترده بر روی ۶۳ مجموعه داده چالش برانگیز نشان می‌دهند که اثربخشی تکنیک برچسب خورده approach.Abst ما نوعی طبقه‌بندی نیمه نظارتی است که می‌تواند زمانی که داده‌های برچسب دار فاقد آن هستند مورد استفاده قرار گیرد. اگر چه تکنیک‌های برچسب دار موجود در بسیاری از مناطق طبقه‌بندی و تشخیص الگو قول می‌دهند، معمولا داده‌های برچسب گذاری شده را به اشتباه برچسب می‌زنند. دلایل این مشکل کمبود اطلاعات برچسب گذاری شده و توزیع نامناسب داده‌ها در فضای مشکل می‌باشد. برای مقابله با این مشکل، ما در این مقاله یک روش تولید داده با برچسب زده‌شده براساس دقت و چگالی پیشنهاد می‌کنیم. موقعیت داده‌های تولید شده از طریق یک الگوریتم تکاملی چند هدفی با دو هدف - دقت و چگالی، بهبود می‌یابد. تابع چگالی، داده‌ها را با توزیع مناسب و تنوع در فضای ویژگی تولید می‌کند، در حالی که تابع دقت داده‌های برون هشته را حذف می‌کند. مزیت روش پیشنهادی بر روی روش‌های موجود این است که به طور همزمان دقت و توزیع داده‌های تولید شده در فضای ویژگی را در نظر می‌گیرد. ما روش پیشنهادی جدید را بر روی چهار تکنیک برچسب دار با ویژگی‌های مختلف، یعنی، هم‌کاری دموکرات، تری - training، Co - forest و Co - کیسه‌های اعمال کرده‌ایم. نتایج نشان می‌دهد که روش پیشنهادی از لحاظ دقت طبقه‌بندی، نسبت به روش‌های موجود برتر است. همچنین، برتری روش پیشنهادی بر روش‌های تولید داده دیگر مانند smote، مرزی، smote، Safe و smote - RSB تایید شده‌است.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Software
  • ترجمه مقاله Software
  • مقاله نرم‌افزار
  • ترجمه مقاله نرم‌افزار
  • مقاله Artificial Intelligence
  • ترجمه مقاله Artificial Intelligence
  • مقاله هوش مصنوعی
  • ترجمه مقاله هوش مصنوعی
  • مقاله Signal Processing
  • ترجمه مقاله Signal Processing
  • مقاله پردازش سیگنال
  • ترجمه مقاله پردازش سیگنال
  • مقاله Computer Vision and Pattern Recognition
  • ترجمه مقاله Computer Vision and Pattern Recognition
  • مقاله بینایی کامپیوتری و تشخیص الگو
  • ترجمه مقاله بینایی کامپیوتری و تشخیص الگو
سفارش ترجمه مقاله و کتاب - شروع کنید

با استفاده از افزونه دانلود فایرفاکس چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.