view in publisher's site

rMATS: Robust and flexible detection of differential alternative splicing from replicate RNA-Seq data

Ultra-deep RNA sequencing (RNA-Seq) has become a powerful approach for genome-wide analysis of pre-mRNA alternative splicing. We previously developed multivariate analysis of transcript splicing (MATS), a statistical method for detecting differential alternative splicing between two RNA-Seq samples. Here we describe a new statistical model and computer program, replicate MATS (rMATS), designed for detection of differential alternative splicing from replicate RNA-Seq data. rMATS uses a hierarchical model to simultaneously account for sampling uncertainty in individual replicates and variability among replicates. In addition to the analysis of unpaired replicates, rMATS also includes a model specifically designed for paired replicates between sample groups. The hypothesis-testing framework of rMATS is flexible and can assess the statistical significance over any user-defined magnitude of splicing change. The performance of rMATS is evaluated by the analysis of simulated and real RNA-Seq data. rMATS outperformed two existing methods for replicate RNA-Seq data in all simulation settings, and RT-PCR yielded a high validation rate (94%) in an RNA-Seq dataset of prostate cancer cell lines. Our data also provide guiding principles for designing RNA-Seq studies of alternative splicing. We demonstrate that it is essential to incorporate biological replicates in the study design. Of note, pooling RNAs or merging RNA-Seq data from multiple replicates is not an effective approach to account for variability, and the result is particularly sensitive to outliers. The rMATS source code is freely available at rnaseq-mats.sourceforge.net/. As the popularity of RNA-Seq continues to grow, we expect rMATS will be useful for studies of alternative splicing in diverse RNA-Seq projects.

rMATS: تشخیص قوی و انعطاف‌پذیر اسپلایسینگ جایگزین دیفرانسیلی از داده‌های تکراری RNA - Seq

تعیین توالی بسیار عمیق RNA (RNA - Seq)به یک رویکرد قدرتمند برای تجزیه و تحلیل ژنوم گسترده از برش جایگزین از قبل mRNA تبدیل شده‌است. ما قبلا آنالیز چند متغیره پیرایش رونوشت (MATS)را توسعه دادیم، یک روش آماری برای تشخیص پیرایش متفاوت بین دو نمونه RNA - Seq. در اینجا ما یک مدل آماری جدید و برنامه کامپیوتری تکرار MATS (rMATS)را توصیف می‌کنیم، که برای تشخیص جدا سازی متفاوت از داده‌های تکراری RNA - Seq طراحی شده‌است. rMATS از یک مدل سلسله مراتبی برای در نظر گرفتن همزمان عدم قطعیت نمونه‌گیری در تکرارهای فردی و تنوع بین تکرارها استفاده می‌کند. علاوه بر تجزیه و تحلیل تکرارهای جفت نشده، rMATS شامل مدلی است که به طور خاص برای تکرارهای جفت شده بین گروه‌های نمونه طراحی شده‌است. چارچوب آزمون فرضیه rMATS انعطاف‌پذیر است و می‌تواند اهمیت آماری هر مقدار تغییر اسپلایسینگ تعریف‌شده توسط کاربر را ارزیابی کند. عملکرد rMATS با تجزیه و تحلیل داده‌های شبیه‌سازی شده و واقعی RNA - Seq ارزیابی می‌شود. rMATS نسبت به دو روش موجود برای تکرار داده‌های RNA - Seq در تمام تنظیمات شبیه‌سازی بهتر عمل کرد و RT - PCR نرخ اعتبار بالایی (۹۴ %)در مجموعه داده RNA - Seq از رده‌های سلول سرطان پروستات به دست داد. داده‌های ما همچنین اصول راهنمایی را برای طراحی مطالعات RNA - Seq از اسپلایسینگ جایگزین فراهم می‌کند. ما نشان می‌دهیم که گنجاندن تکرارهای بیولوژیکی در طراحی مطالعه ضروری است. توجه داشته باشید که، ترکیب RNA ها یا ادغام داده‌های RNA - Seq از تکرارهای متعدد یک رویکرد موثر برای در نظر گرفتن تنوع نیست و نتیجه به طور خاص به داده‌های پرت حساس است. با رشد محبوبیت RNA - Seq، انتظار می‌رود rMATS برای مطالعات اسپلایسینگ جایگزین در پروژه‌های متنوع RNA - Seq مفید باشد.
ترجمه شده با

سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.