مقاله نمایش پراکنده برای بینایی ماشین و شناسایی الگو

سوالات گرامر زبان انگلیسی کنکور دکتری مهندسی هوش مصنوعی
سپتامبر 23, 2021
تشخیص درختان در تصاویر هوایی
اکتبر 19, 2021

مقاله نمایش پراکنده برای بینایی ماشین و شناسایی الگو

چکیده – تکنیک هایی که از بازنمایی تنک سیگنال ها استفاده میکنند ، تأثیر قابل توجهی را در بینایی رایانه مشاهده می کنند ، اغلب در برنامه های غیر سنتی که هدف آنها فقط به دست آوردن یک نمایش فشرده با اطمینان بالا از سیگنال مشاهده شده نیست ، بلکه استخراج اطلاعات معنایی است. انتخاب فرهنگ لغت نقشی اساسی در از بین بردن این شکاف ایفا می کند: فرهنگ نامه های نامتعارف متشکل از نمونه های آموزشی که از آنها آموخته شدن یا از آنها آموخته شده ، کلید بدست آوردن نتایج بهتر از قبل و پیوستن محتوای معنایی به بازنمایی تنک سیگنال هستند. درک عملکرد خوب چنین فرهنگ لغت نامتعارف به نوبه خود تکنیکهای الگوریتمی و تحلیلی جدیدی را می طلبد. این مقاله مروری چند نمونه بازنمایی را نشان می دهد که چگونه تعامل بین بازنمایی تنک سیگنال و بینایی کامپیوتر می تواند هر دو زمینه را غنی کند ،و تعدادی سوالات باز را برای مطالعه بیشتر مطرح می کند.

I. INTRODUCTION
Sparse signal representation has proven to be an extremely powerful tool for acquiring, representing, and compressing high-dimensional signals. This success is mainly due to the fact that important classes of signals such as audio and images have naturally sparse representations with respect to fixed bases (i.e., Fourier, Wavelet), or concatenations of such bases. Moreover, efficient and provably effective algorithms based on convex optimization or greedy pursuit are available for computing such representations with high fidelity [10].

While these successes in classical signal processing applications are inspiring, in computer vision we are often more interested in the content or semantics of an image rather than a compact, high-fidelity representation. One might justifiably wonder, then, whether sparse representation can be useful at all for vision tasks. The answer has been largely positive: in the past few years, variations and extensions of `1 minimization have been applied to many vision tasks, including face recognition [71], image super-resolution [75], motion and data segmentation [33], [56], supervised denoising and inpainting [51] and background modeling [16], [21] and image classification [47], [48]. In almost all of these applications, using sparsity as a prior leads to state-of-the-art results.

مقدمه:
بازنمایی تنک سیگنال اثبات شده است که ابزاری بسیار قدرتمند برای دستیابی ، بازنمایی و فشرده سازی سیگنال های با ابعاد بالا است. این موفقیت عمدتا به این دلیل است که دسته های مهمی از سیگنال ها مانند صوت و تصویر به طور طبیعی دارای بازنمایی های تنک با پایه های ثابت (به عنوان مثال ، فوریه ، موجک) یا االحاقات این ثابتها هستند. علاوه بر این ، الگوریتم های کارآمد و اثبات پذیر مبتنی بر بهینه سازی محدب یا پیگیری حریصانه برای محاسبه چنین بازنمایی هایی با اعتماد بالا در دسترس هستند [10].

اگرچه این موفقیت ها در برنامه های پردازش سیگنال کلاسیک الهام بخش است ، اما در بینایی ماشین ما بیشتر به محتوای یا معناشناسی یک تصویر علاقه مند هستیم تا یک بازنمایی فشرده و با کیفیت بالا. بنابراین به طور موجهی می توان تعجب کرد که آیا بازنمایی تنک اصلاً می تواند برای کارهای بینایی مفید باشد؟ پاسخ تا حد زیادی مثبت بوده است: در چند سال گذشته ، تغییرات و توسعه ها به حداقل رساندن 1 برای بسیاری از کارهای بینایی اعمال شده است ، از جمله تشخیص چهره [71] ، وضوح فوق العاده تصویر [75] ، حرکت و تقسیم داده ها [33] ، [56] ، حذف نویز با نظارت [51] و مدل سازی پس زمینه [16] ، [21] و طبقه بندی تصویر [47] ، [48]. تقریباً در همه این برنامه ها ، استفاده از پراکندگی (تنک بودن ) به نتایج پیشین منجر می شود.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *