view in publisher's site

Fast modeling L2 cache reuse distance histograms using combined locality information from software traces

To mitigate the performance gap between CPU and the main memory, multi-level cache architectures are widely used in modern processors. Therefore, modeling the behaviors of the downstream caches becomes a critical part of the processor performance evaluation in the early stage of Design Space Exploration (DSE). In this paper, we propose a fast and accurate L2 cache reuse distance histogram model, which can be used to predict the behaviors of the multi-level cache architectures where the L1 cache uses the LRU replacement policy and the L2 cache uses LRU/Random replacement policies. We use the profiled L1 reuse distance histogram and two newly proposed metrics, namely the RST table and the Hit-RDH, that describing more detailed information of the software traces as the inputs. For a given L1 cache configuration, the profiling results can be reused for different configurations of the L2 cache. The output of our model is the L2 cache reuse distance histogram, based on which the L2 cache miss rates can be evaluated. We compare the L2 cache miss rates with the results from gem5 cycle-accurate simulations of 15 benchmarks chosen from SPEC CPU 2006 and 9 benchmarks from SPEC CPU 2017. The average absolute error is less than 5%, while the evaluation time for each L2 configuration can be sped up almost 30× for four L2 cache candidates.

مدل‌سازی سریع هیستوگرام های استفاده مجدد از راه دور L۲ با استفاده از اطلاعات ترکیبی محل از مسیرهای نرم‌افزاری

برای کاهش فاصله عملکرد بین CPU و حافظه اصلی، معماری‌های حافظه نهان چند سطحی به طور گسترده در پردازنده‌های مدرن استفاده می‌شوند. بنابراین، مدل‌سازی رفتارهای حافظه‌های نهان رو به پایین به بخش مهمی از ارزیابی عملکرد پردازنده در مراحل اولیه اکتشاف فضای طراحی (DSE تبدیل می‌شود. در این مقاله، ما یک مدل هیستوگرام فاصله استفاده مجدد سریع و دقیق L۲ را پیشنهاد می‌کنیم، که می‌تواند برای پیش‌بینی رفتارهای معماری‌های حافظه نهان چند سطحی استفاده شود که در آن حافظه نهان L۱ از سیاست جایگزینی LRU و حافظه نهان L۲ از سیاست‌های جایگزینی تصادفی / LRU استفاده می‌کند. ما از هیستوگرام فاصله استفاده مجدد از L۱ و دو معیار جدید پیشنهادی، به نام جدول RST و Hit - RDH استفاده می‌کنیم، که اطلاعات جزیی تری از مسیرهای نرم‌افزار را به عنوان ورودی توصیف می‌کند. برای یک پیکربندی حافظه نهان L۱ داده‌شده، نتایج پروفایل می‌تواند برای پیکربندی‌های مختلف حافظه نهان L۲ استفاده شود. خروجی مدل ما نمودار تاریخچه استفاده مجدد از حافظه نهان L۲ است، که براساس آن نرخ‌های خطای حافظه نهان L۲ را می توان ارزیابی کرد. ما نرخ‌های خطای حافظه نهان L۲ را با نتایج شبیه‌سازی‌های چرخه - درست ۱۵ بنچ‌مارک انتخاب‌شده از CPU ۲۰۰۶ SPEC و ۹ بنچ‌مارک از CPU ۲۰۱۷ SPEC مقایسه می‌کنیم. میانگین خطای مطلق کم‌تر از ۵ % است، در حالی که زمان ارزیابی برای هر پیکربندی L۲ را می توان برای چهار کاندید حافظه نهان L۲ تقریبا ۳۰ * افزایش داد.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Software
  • ترجمه مقاله Software
  • مقاله نرم‌افزار
  • ترجمه مقاله نرم‌افزار
  • مقاله Hardware and Architecture
  • ترجمه مقاله Hardware and Architecture
  • مقاله سخت‌افزار و معماری
  • ترجمه مقاله سخت‌افزار و معماری
سفارش ترجمه مقاله و کتاب - شروع کنید

با استفاده از افزونه دانلود فایرفاکس چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.