view in publisher's site

Distant Supervision for Large-Scale Extraction of Gene–Disease Associations from Literature Using DeepDive

Understanding the genetic mechanism of a disease can solve a variety of problems such as personalized precision medicine, new drug development or repurposing them. Technological advancement in biology leads to methods like next-generation sequencing (NGS) which produced large sets of genes associated with diseases in the form of variants and biomarkers. All these findings are reported as a huge collection of scientific literature, which is rapidly growing every day. In this study, we present a distant supervision methodology for finding the gene–disease associations from literature in large scale. We used DeepDive system, which is highly successful in relation extraction from a wide variety of sources such as image and text. In this study, we build a gene–disease relation extractor by feeding a highly sophisticated feature set to DeepDive and extracted associations from 879585 PubMed articles. Our system identified candidate gene–disease associations from abstracts and calculated a probability for each association. Overall, our system produced a set of 75595 associations using a domain-specific distinct feature set from over 879585 abstracts.

نظارت متمایز برای استخراج بزرگ از پیوندهای ژن - بیماری از ادبیات با استفاده از روش DeepDive

درک مکانیسم ژنتیکی یک بیماری می‌تواند مشکلات مختلفی را حل کند از جمله پزشکی دقیق شخصی، توسعه داروهای جدید و یا بازسازی آن‌ها. پیشرفت تکنولوژیکی در زیست‌شناسی منجر به روش‌هایی مانند توالی نسل آینده (NGS)می‌شود که مجموعه بزرگی از ژن‌های مرتبط با بیماری‌ها را به شکل انواع و بیومارکرها تولید می‌کند. تمام این یافته‌ها به عنوان مجموعه‌ای عظیم از ادبیات علمی گزارش شده‌اند که هر روز به سرعت در حال رشد است. در این مطالعه، ما یک روش نظارت از راه دور را برای یافتن انجمن‌های ژن - بیماری در مقیاس بزرگ ارائه می‌دهیم. ما از سیستم DeepDive استفاده کردیم که در استخراج رابطه از طیف گسترده‌ای از منابع مانند تصویر و متن بسیار موفق است. در این مطالعه، ما یک استخراج‌کننده رابطه ژن - بیماری را با تغذیه یک مجموعه ویژگی بسیار پیچیده برای DeepDive و ارتباطات استخراج‌شده از ۸۷۹۵۸۵ مقاله PubMed می‌سازیم. سیستم ما ارتباط ژن - بیماری کاندید را از خلاصه مقالات شناسایی کرد و احتمال هر ارتباط را محاسبه کرد. به طور کلی، سیستم ما مجموعه‌ای از ۷۵۵۹۵ ارتباط را با استفاده از یک مجموعه ویژگی متمایز خاص دامنه از بیش از ۸۷۹۵۸۵ چکیده ایجاد کرد.
ترجمه شده با

سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.