view in publisher's site

EDS pooling layer

Convolutional neural networks (CNNs) have been the source of recent breakthroughs in many vision tasks. Feature pooling layers are being widely used in CNNs to reduce the spatial dimensions of the feature maps of the hidden layers. This gives CNNs the property of spatial invariance and also results in speed-up and reduces over-fitting. However, this also causes significant information loss. All existing feature pooling layers follow a one-step procedure for spatial pooling, which affects the overall performance due to significant information loss. Not much work has been done to do efficient feature pooling operation in CNNs. To reduce the loss of information at this critical operation of the CNNs, we propose a new EDS layer (Expansion Downsampling learnable-Scaling) to replace the existing pooling mechanism. We propose a two-step procedure to minimize the information loss by increasing the number of channels in pooling operation. We also use feature scaling in the proposed EDS layer to highlight the most relevant channels/feature-maps. Our results show a significant improvement over the generally used pooling methods such as MaxPool, AvgPool, and StridePool (strided convolutions with stride > 1). We have done the experiments on image classification and object detection task. ResNet-50 with our proposed EDS layer has performed comparably to ResNet-152 with stride pooling on the ImageNet dataset.

لایه ادغام EDS

شبکه‌های عصبی کانولوشنال (CNNs)منبع پیشرفت‌های اخیر در بسیاری از وظایف بینایی بوده‌اند. لایه‌های ادغام ویژگی به طور گسترده در CNNs برای کاهش ابعاد فضایی نقشه‌های ویژگی لایه‌های پنهان استفاده می‌شوند. این امر به CNNs خاصیت تغییر ناپذیری فضایی را می‌دهد و همچنین منجر به افزایش سرعت و کاهش بیش از حد تناسب می‌شود. با این حال، این امر همچنین باعث از دست رفتن اطلاعات قابل‌توجهی می‌شود. تمام لایه‌های ترکیب ویژگی موجود یک روند یک مرحله‌ای را برای ادغام فضایی دنبال می‌کنند، که بر عملکرد کلی به دلیل از دست دادن اطلاعات قابل‌توجه تاثیر می‌گذارد. کاره‌ای زیادی برای انجام عملیات ادغام کارآمد در سی ان ان انجام‌نشده است. برای کاهش از دست رفتن اطلاعات در این عملیات بحرانی CNNs، ما یک لایه EDS جدید (گسترش نمونه‌گیری نزولی قابل یادگیری - مقیاس گذاری)را برای جایگزینی مکانیسم موجود تجمع پیشنهاد می‌کنیم. ما یک روش دو مرحله‌ای برای به حداقل رساندن اتلاف اطلاعات با افزایش تعداد کانال‌ها در عملیات ادغام پیشنهاد می‌کنیم. همچنین از مقیاس ویژگی در لایه EDS پیشنهادی برای برجسته کردن مرتبط‌ترین کانال‌ها / نقشه‌های ویژگی استفاده می‌کنیم. نتایج ما بهبود قابل‌توجهی را نسبت به روش‌های ادغام مورد استفاده عمومی مانند MaxPwell، آواپول، و استریدپول نشان می‌دهد. ما آزمایش‌هایی را بر روی طبقه‌بندی تصویر و وظیفه تشخیص شی انجام داده‌ایم. مجددا شبکه ۵۰ با لایه EDS پیشنهادی ما، با ادغام گام بر روی مجموعه داده تصویر - شبکه، به میزان قابل قیاس با رزنت - ۱۵۲ عمل کرده‌است.
ترجمه شده با


پر ارجاع‌ترین مقالات مرتبط:

  • مقاله Computer Vision and Pattern Recognition
  • ترجمه مقاله Computer Vision and Pattern Recognition
  • مقاله بینایی کامپیوتری و تشخیص الگو
  • ترجمه مقاله بینایی کامپیوتری و تشخیص الگو
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.