view in publisher's site

Gene Extraction for Cancer Diagnosis by Support Vector Machines

A cancer diagnosis by using the DNA microarray data faces many challenges the most serious one being the presence of thousands of genes and only several dozens (at the best) of patient’s samples. Thus, making any kind of classification in high-dimensional spaces from a limited number of data is both an extremely difficult and a prone to an error procedure. The improved Recursive Feature Elimination with Support Vector Machines (RFE-SVMs) is introduced and used here for an elimination of less relevant genes and just for a reduction of the overall number of genes used in a medical diagnostic. The paper shows why and how the, usually neglected, penalty parameter C influence classification results and the gene selection of RFE-SVMs. With an appropriate parameter C chosen, the reduction in a diagnosis error is as high as 37% on the colon cancer data set. The results suggest that with a properly chosen parameter C, the extracted genes and the constructed classifier will ensure less over-fitting of the training data leading to an increase accuracy in selecting relevant genes.

استخراج ژن برای تشخیص سرطان توسط ماشین‌های بردار پشتیبان

تشخیص سرطان با استفاده از داده‌های ریزآرایه DNA با چالش‌های بسیاری رو به رو است که جدی‌ترین آن‌ها حضور هزاران ژن و تنها ده‌ها (در بهترین حالت)نمونه بیمار است. بنابراین، ایجاد هر نوع طبقه‌بندی در فضاهای با ابعاد بالا از تعداد محدودی از داده‌ها، هم بسیار دشوار است و هم مستعد یک روند خطا است. حذف ویژگی بازگشتی بهبود یافته با ماشین‌های بردار پشتیبان (رادیو آزادی)معرفی و در اینجا برای حذف ژن‌های کم‌تر مرتبط و فقط برای کاهش تعداد کل ژن‌های مورد استفاده در یک تشخیص پزشکی مورد استفاده قرار می‌گیرد. این مقاله نشان می‌دهد که چرا و چگونه پارامتر پنالتی C که معمولا نادیده گرفته می‌شود، بر نتایج طبقه‌بندی و انتخاب ژن VM های رادیو آزادی تاثیر می‌گذارد. با انتخاب پارامتر مناسب C، کاهش خطای تشخیص به اندازه ۳۷ % در مجموعه داده‌های سرطان روده بزرگ است. نتایج نشان می‌دهد که با یک پارامتر به درستی انتخاب‌شده C، ژن‌های استخراج‌شده و طبقه‌بندی کننده ساخته‌شده، برازش کم‌تر داده‌های آموزشی را تضمین می‌کنند که منجر به افزایش دقت در انتخاب ژن‌های مربوطه می‌شود.
ترجمه شده با

سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.