view in publisher's site

Real-Time Speech Recognition for IoT Purpose using a Delta Recurrent Neural Network Accelerator

This paper describes a continuous speech recognition hardware system that uses a delta recurrent neural network accelerator (DeltaRNN) implemented on a Xilinx Zynq-7100 FPGA to enable low latency recurrent neural network (RNN) computation. The implemented network consists of a single-layer RNN with 256 gated recurrent unit (GRU) neurons and is driven by input features generated either from the output of a filter bank running on the ARM core of the FPGA in a PmodMic3 microphone setup or from the asynchronous outputs of a spiking silicon cochlea circuit. The microphone setup achieves 7.1 ms minimum latency and 177 frames-per-second (FPS) maximum throughput while the cochlea setup achieves 2.9 ms minimum latency and 345 FPS maximum throughput. The low latency and 70 mW power consumption of the DeltaRNN makes it suitable as an IoT computing platform.

تشخیص گفتار واقعی برای هدف اینترنت از استفاده از یک شبکه عصبی شبکه‌ای Recurrent Recurrent شتاب‌ده

این مقاله یک سیستم سخت‌افزار شناسایی گفتار پیوسته را توصیف می‌کند که از یک شتاب‌دهنده حلقوی شبکه عصبی (DeltaRNN)استفاده می‌کند که بر روی Xilinx FPGA - ۷۱۰۰ FPGA پیاده شده‌است تا محاسبات شبکه عصبی انتقالی پایین (RNN)را فعال کند. شبکه پیاده‌سازی شده متشکل از یک RNN تک لایه با استفاده از نورون‌ها با ۲۵۶ پالس (GRU)است و با ویژگی‌های ورودی تولید شده از خروجی یک بانک فیلتر روی هسته ARM در FPGA در یک چیدمان میکروفون PmodMic۳ یا از خروجی‌های همزمان یک مدار حلزونی spiking ساخته شده‌است. تنظیمات میکروفن به شکل ۷.۱ ms حداقل و ۱۷۷ فریم در ثانیه (fps)حداکثر توان عملیاتی (fps)را به دست می‌آورد، در حالی که آماده‌سازی حلزون گوش با کم‌ترین تاخیر لاتنسی و ۳۴۵ fps حداکثر توان عملیاتی را به دست می‌آورد. تاخیر پایین و مصرف توان ۷۰ Mw از the آن را به عنوان پلت فرم محاسباتی IoT مناسب می‌سازد.
ترجمه شده با

سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.