view in publisher's site

GPU-accelerated sparse matrices parallel inversion algorithm for large-scale power systems

Highlights•A novel GPU-accelerated parallel inversion algorithm for large-scale sparse matrices.•The batch forward substitution algorithm extracting the inter-subtask parallelism.•Four universal design and tuning criteria for a well-performing GPU-based algorithm.AbstractState-of-the-art Graphics Processing Unit (GPU) has superior performances on float-pointing calculation and memory bandwidth, and therefore has great potential in many computationally intensive power system applications, one of which is the inversion of large-scale sparse matrix. It is a fundamental component for many power system analyses which requires to solve massive number of forward and backward substitution (F&B) subtasks and seems to be a good GPU-accelerated candidate application. By means of solving multiple F&B subtasks concurrently and a serial of performance tunings in compliance with GPU’s architectures, we successfully develop a batch F&B algorithm on GPUs, which not only extracts the intra-level and intra-level parallelisms inside single F&B subtask but also explores a more regular parallelism among massive F&B subtasks, called inter-task parallelism. Case study on a 9241-dimension case shows that the proposed batch F&B solver consumes 2.92 μs per forward substitution (FS) subtask when the batch size is equal to 3072, achieving 65 times speedup relative to KLU library. And on the basis the complete design process of GPU-based inversion algorithm is proposed. By offloading the tremendous computational burden to GPU, the inversion of 9241-dimension case consumes only 97 ms, which can achieve 8.1 times speedup relative to the 12-core CPU inversion solver based on KLU library. The proposed batch F&B solver is practically very promising in many other power system applications requiring solving massive F&B subtasks, such as probabilistic power flow analysis.

الگوریتم وارون سازی موازی ماتریس‌ها با الگوریتم وارون سازی موازی برای سیستم‌های قدرت بزرگ مقیاس بزرگ

کاره‌ای مهم: یک الگوریتم وارونگی موازی GPU - شتاب برای ماتریس‌های پراکنده مقیاس بزرگ. الگوریتم جانشینی جلو به جلو، همسانی بین - را استخراج می‌کند. چهار معیار طراحی و تنظیم کلی برای یک واحد well مبتنی بر GPU مبتنی بر GPU مبتنی بر محاسبات و پهنای باند حافظه، و بنابراین پتانسیل بسیار زیادی در بسیاری از کاربردهای سیستم‌های قدرت متمرکز از نظر محاسباتی دارد، که یکی از آن‌ها معکوس کردن ماتریس پراکندگی مقیاس بزرگ است. این یک جز اساسی برای بسیاری از تحلیل‌های سیستم قدرت است که نیاز به حل تعداد زیادی از کاره‌ای جانشین و عقب دارد (F & B)زیر وظایف و به نظر می‌رسد که یک کاربرد کاندید تسریع شده خوب باشد. با استفاده از حل همزمان F B & B به صورت همزمان و سریالی از عملکرد tunings در انطباق با معماری‌های "، ما با موفقیت یک الگوریتم گروه F & B را بر روی gpus توسعه دادیم که نه تنها the درون سطح و درون سطح زیر & را استخراج می‌کند، که همسانی بین تکلیف نامیده می‌شود. مطالعه موردی روی یک مورد بعد ۹۲۴۱ نشان می‌دهد که حل‌کننده پیشنهادی F & B از ۲.۹۲ ۲.۹۲ به ازای هر جایگزینی به جلو (FS)استفاده می‌کند زمانی که اندازه گروه برابر با ۳۰۷۲ است و به ۶۵ برابر سرعت نسبت به کتابخانه KLU دست می‌یابد. و بر پایه این اساس، فرآیند طراحی کامل الگوریتم inversion مبتنی بر GPU پیشنهاد شده‌است. با تخلیه بار محاسباتی عظیم به GPU، معکوس کردن حالت سه‌بعدی تنها ۹۷ ms را مصرف می‌کند که می‌تواند به ۸.۱ بار سرعت نسبت به حل‌کننده معکوس هسته مرکزی ۱۲ مبتنی بر کتابخانه KLU دست یابد. حل‌کننده پیشنهاد شده F & B عملا در بسیاری از کاربردهای سیستم‌های قدرت دیگر بسیار امیدبخش است که نیازمند حل مسایل کوچک F & B، مانند تحلیل جریان توان احتمالی می‌باشد.

ترجمه شده با

Download PDF سفارش ترجمه این مقاله این مقاله را خودتان با کمک ترجمه کنید
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.