view in publisher's site

Handwritten digit segmentation: Is it still necessary?

Highlights•Modular system without segmentation to recognize unconstrained numerical strings.•It uses representation learning for string length classification and digit classification.•It outperforms all segmentation algorithms available in the literature on the Touching Pairs Database.•It achieves state-of-the-art performance on NIST SD19 dataset.AbstractOver the last decades, a great deal of research has been devoted to handwritten digit segmentation. Algorithms based on different features extracted from the background, foreground, and contour of images have been proposed, with those achieving the best results usually relying on a heavy set of heuristics and over-segmentation. Here, the challenge lies in finding a good set of heuristics to reduce the number of segmentation hypotheses. Independently of the heuristic over-segmentation strategy adopted, all algorithms used show their limitations when faced with complex cases such as overlapping digits. In this work, we postulate that handwritten digit segmentation can be successfully replaced by a set of classifiers trained to predict the size of the string and classify them without any segmentation. To support our position, we trained four Convolutional Neural Networks (CNN) on data generated synthetically and validated the proposed method on two well-known databases, namely, the Touching Pairs Dataset and NIST SD19. Our experimental results show that the CNN classifiers can handle complex cases of touching digits more efficiently than all segmentation algorithms available in the literature.

تقسیم‌بندی بخش Handwritten: آیا هنوز لازم است؟

کاره‌ای مهم قالب‌بندی مدولار بدون تقسیم‌بندی به تشخیص strings نامحدود عددی. از یادگیری نمایشی برای طبقه‌بندی طول رشته و طبقه‌بندی ارقام استفاده می‌کند. این الگوریتم از تمامی الگوریتم‌های بخش‌بندی موجود در مقالات در پایگاه‌داده Touching Pairs بهتر عمل می‌کند. این برنامه به عملکرد هنری خود در NIST NIST dataset.Abst ractOver طی چند دهه گذشته دست یافته‌است، بسیاری از تحقیقات به بخش بخش‌بندی انگشت دست‌نوشته اختصاص‌یافته است. الگوریتم‌های مبتنی بر ویژگی‌های مختلف استخراج‌شده از پس‌زمینه، پیش‌زمینه، و کانتور تصاویر پیشنهاد شده‌اند، و آن‌هایی که بهترین نتایج را بدست می‌آورند معمولا با مجموعه سنگین از شیوه‌های اکتشافی و تقسیم‌بندی - تقسیم‌بندی می‌شوند. در اینجا، چالش در یافتن مجموعه‌ای خوب از شیوه‌های اکتشافی برای کاهش تعداد فرضیه‌های تقسیم‌بندی نهفته‌است. تمامی الگوریتم های مورد استفاده در هنگام مواجهه با موارد پیچیده از جمله همپوشانی ارقام، محدودیت‌های خود را نشان می‌دهند. در این کار، فرض می‌کنیم که بخش بندی انگشت دست‌نویس را می توان با موفقیت جایگزین مجموعه‌ای از طبقه‌بندی کننده‌های آموزش‌دیده برای پیش‌بینی اندازه رشته و طبقه‌بندی آن‌ها بدون تقسیم‌بندی بندی کرد. ما برای حمایت از موقعیت خود، چهار شبکه عصبی convolutional (سی ان ان)را بر روی داده‌هایی که به صورت مصنوعی تولید شده بودند، آموزش دادیم و روش پیشنهادی را بر روی دو پایگاه‌داده شناخته‌شده، یعنی لمس Pairs Dataset و SD۱۹ NIST تایید کردیم. نتایج تجربی ما نشان می‌دهد که طبقه‌بندی کننده‌های شبکه سی ان ان می‌توانند به طور موثرتر از همه الگوریتم‌های بخش‌بندی موجود در نوشته‌ها استفاده کنند.

ترجمه شده با

Download PDF سفارش ترجمه این مقاله این مقاله را خودتان با کمک ترجمه کنید
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.