آموزش و یادگیری زبان انگلیسی از صفر تا صد- جلسه دوم
آگوست 27, 2023استتار در بینایی ماشین
اکتبر 15, 2023تشخیص و پیگیری اشیاء در حرکت در برخی از برنامهها و کاربردهای متنوع مانند نظارت، تشخیص ناهنجاری، مسیریابی وسایل نقلیه و غیره مورد استفاده قرار میگیرد. ادبیات مربوط به تشخیص و پیگیری اشیاء به میزان کافی گسترده است و تعدادی مقاله مروری مهم وجود دارد. با این حال، تحقیقات در زمینه تشخیص و پیگیری اشیاء در حالت استتار به دلیل پیچیدگی مسئله محدود است. کارهای موجود در این زمینه بر اساس ویژگیهای زیستی اشیاء مخفی شده یا تکنیکهای بینایی ماشین انجام شده است. در این مقاله، ما تکنیکهای موجود برای تشخیص و پیگیری اشیاء مخفی شده را با استفاده از الگوریتمهای بینایی ماشین از دید نظری بررسی میکنیم. این مقاله همچنین به چندین موضوع جذاب و جهتدهی تحقیقات آینده در این حوزه میپردازد. ما امیدواریم که این مقاله به خواننده کمک کند تا آخرین پیشرفتها در زمینه تشخیص و پیگیری اشیاء مخفی شده را بیاموزد.
تشخیص اشیاء یک تکنیک است که به تشخیص نمونههای اشیاء معنایی از یک کلاس خاص (مانند انسان، ساختمانها، خودروها و غیره) در تصاویر و ویدئوهای دیجیتال میپردازد. این تکنیک کاربردهای مختلفی در حوزههای مختلف بینایی ماشین دارد، از جمله بازیابی تصویر، نظارت تصویری و برخی از وظایف تجزیه و تحلیل تصویر و ویدئو. در محیطهای کنترل شده، تا حد زیادی موفقیتهای قابل توجهی در مسئله تشخیص اشیاء حاصل شده است، اما این مشکل در مکانهای بدون کنترل هنوز حل نشده است.
تشخیص و پیگیری اشیاء تصویری به یک مسئله چالشبرانگیز تبدیل شده است به دلیل چندین عامل نظیر:
- حسگرهای دوربین با کیفیت پایین (شامل رزولوشن پایین، عمق بیت کم، نرخ فریم پایین و اشکال در رنگ): این عوامل میتوانند کیفیت تصاویر را کاهش دهند و تشخیص و پیگیری اشیاء را دشوارتر کنند.
- عوامل چالشبرانگیز (مانند پیگیری اشیاء غیر رجیت، پیگیری اشیاء کوچک، پیگیری چندین شیء و پیگیری اشیاء با تغییر در موقعیت): این عوامل میتوانند تشخیص و پیگیری اشیاء را پیچیدهتر کنند.
- نیاز به پیگیری به صورت زمانواقعی: در برخی از موارد، نیاز به پیگیری به صورت زمانواقعی و در زمان واقعی وجود دارد.
- پیگیری اشیاء از چند نقطه دید (multi-view object tracking): این وضعیت ممکن است در مواردی که نیاز به پیگیری اشیاء از چند دوربین یا زاویه دید مختلف باشد پیش بیاید.
- تغییرات در ظاهر اشیاء ناشی از عوامل مختلف و پیچیده (از جمله تغییرات در نوردهی، تراکم پسزمینه، مخفی شدن جزئی یا کامل اشیاء، تغییرات زیاد در مقیاس و جهت اشیاء، استتار جزئی اشیاء، تغییر در موقعیت، تغییر در شکل، حرکت سریع دوربین و نویز): تغییرات متنوع در ظاهر اشیاء میتوانند به تخریب دقت تشخیص و (یا) پیگیری اشیاء منجر شوند.
در ادبیات، تعداد زیادی الگوریتم پیگیری اشیاء توسعه داده شدهاند تا این چالشها را مدیریت کنند. این الگوریتمها با ویژگیها و مشخصات متفاوت معمولاً مشکلات مختلف در تشخیص و پیگیری اشیاء تصویری را حل میکنند.
گاهی اوقات، اشیاء امضای خود را در محیط اطراف خود پنهان میکنند و ایجاد یک حالت استتار (camouflage) میکنند. وقوع استتار مشکل تشخیص اشیاء را پیچیدهتر میکند. به عبارت کوپلند و تریودی، “استتار تلاشی است برای مخفی کردن امضای هدف در پسزمینه”10. به عبارت دیگر، استتار توانایی طعامها به منظور مخفی شدن از شکارچیان است تا با تغییر الگوی بدن، بافت و رنگ بدن خود به تطابق با بافت محیط تغییر کنند. یک شیء در حالت استتار به طور مناسب توسط سیستمهای بینایی انسانی دیده نمیشود. در این زمینه، رویکردهای مبتنی بر دید کامپیوتری پیشنهاد شدهاند تا اشیاء در حالت استتار را تجزیه و تحلیل کنند. کارهای مرتبط با استتار به طور خلاصه به دو حوزه اصلی تقسیم میشوند: (i) ارزیابی و طراحی استتار و (ii) تشخیص یا برش استتار.10,12,49 سیستم تشخیص استتار یا خارج کردن اشیاء مقصد از پسزمینه استفاده میشود. این سیستم اشیاء پیشزمینه را از فریمهای تصویری با استتار تمییز میدهد.35,48 سیستم تشخیص یا شکست استتار دارای کاربردهای بسیاری است از جمله (i) حفظ حیات وحش، (ii) تشخیص دشمنان در میدان جنگ، (iii) تشخیص عیوب در فرآیند تولید، (iv) شناسایی محصولات تقلبی در لجستیک و غیره.35 برخی از حیوانات ویژگیهای زیستی منحصر به فردی دارند که آنها را در محیط استتار میدهند. بیشتر کار تحقیقی برای شکست استتار بر مبنای ویژگی زیستی این حیوانات انجام شده است. ویژگیهای بصری یک شیء در حالت استتار بسیار شبیه به پسزمینه است، رنگ شیء در همان بافت محیطی است و بافت وقتی با پسزمینه ادغام میشود از بین میرود. این ویژگیهای شیءهای استتار تشخیص و پیگیری را به چالش کشیده و پیچیدهتر میکنند. به علت پیچیدگی مسئله، کار کمتری با استفاده از تکنیکهای بینایی ماشینی انجام شده است. در این مقاله، ما رویکردهای موجود برای تشخیص و پیگیری اشیاء در حالت استتار مبتنی بر دید کامپیوتری را مرور میکنیم. همچنین مزایا و معایب هر یک از الگوریتمها را بررسی میکنیم. ما همچنین به مسائل مختلف مربوط به الگوریتمهای موجود و جهتدهی تحقیقات آینده در این زمینه میپردازیم. ما امیدواریم که این مقاله به خواننده کمک کند تا آخرین پیشرفتها در تشخیص و پیگیری اشیاء در حالت استتار را یاد بگیرد.
تشخیص و پیگیری اشیاء در حالت استتار
ویژگیهای بصری یک شیء در حالت استتار به طور بسیار شدید شبیه به پسزمینه هستند؛
- شدت یا رنگ شیء در حالت استتار نزدیک به محیط اطراف خود است.
- بافت شیء به منظور ادغام با پسزمینه تخریب میشود.
- مرز شیء در حالت استتار مبهم است.
چنین ویژگیهای بصری اشیاء در حالت استتار وظایف تشخیص و پیگیری را بسیار دشوارتر میکنند. به علت این پیچیدگی، در ادبیات تلاشهای کمتری برای شکست استتار بصری صورت گرفته است.
با این حال، محققان الگوریتمهای مختلفی را با استفاده از انواع مختلف ویژگیهای بصری (مانند شدت یا رنگ، بافت، حرکت، گرادیان، و غیره) برای تشخیص اشیای استتار شده از اطراف خود توسعه دادهاند. در اینجا سعی می کنیم روش های موجود را بر اساس ویژگی بصری با در نظر گرفتن تشخیص و ردیابی اجسام استتار شده گروه بندی کنیم. در زیر بخش زیر، تکنیک های موجود در در نظر گرفتن هر یک از ویژگی های بصری مورد بحث قرار می گیرد.
ویژگیهای شدت/رنگ
ویژگی شدت یا رنگ در تشخیص اشیاء در حالت استتار نقش حیاتی ایفا میکند. در اینجا، تکنیکهای توسعه یافته بر مبنای مقادیر شدت/رنگ فریمها به طور عمده مورد بحث قرار میگیرند. بولت و همکاران5 یک تکنیک کمکرد پسزمینه با دو آستانه توسعه دادند تا هدف مخفی شده را تشخیص دهند. در اینجا، مقدار آستانه بالاتر برای تشخیص پیکسلهایی استفاده میشود که قطعاً در پیشزمینه قرار دارند. مقدار پایینتر برای تشخیص پیکسلهای مشکوک بهکار میرود (یعنی پیکسلهایی که یا قسمتی از پسزمینه هستند یا قسمتی از شیء در حالت استتار). سپس، عنصر نزدیک به متصل بهعنوان هدف استتار در نظر گرفته میشود. در این مورد، دقت تشخیص نیز به طور زیادی به آستانهها وابسته است. انتخاب مقدار آستانه مناسب خود یک مسئله است. برای اشیاء با حرکت کند، این روش ناتوان در تشخیص اشیاء است.
در مقابل، هانگ و جیانگ15 یک روش برای ردیابی یک شیء در حالت استتار با استفاده از اجرای متوالی از تجمیع ناحیه با وزن و contoure فعال ابداع کردند. اپراتور تجمیع ناحیه با وزن تکراری برای پر کردن شکافهای وارد شده توسط استتار استفاده میشود. سپس، یک مدل تبیین فعال در طول پیگیری ساخته میشود تا شکل واقعی هدف را ضبط کند. عملکرد این روش بستگی به اختلاف میان فریمها دارد. اگر شیء حرکت کند باشد، استفاده از اپراتور تجمیع ناحیه با وزن تکراری برای محلیسازی شیء چالشبر است. بنابراین، در دنبالههای حاوی اشیاء با حرکت کند و رنگ یکنواخت، پیگیری ممکن است به مشکل بخورد.
در مرجع 4، بوت و همکاران تبحری را در مورد تشخیص هدف بحث کردهاند که به ما معمولاً در مورد تشخیص هدف اطلاعات عمومی میدهد، که به ما کمک میکند چشمهای خود را به هدف به صورت مؤثرتر هدایت کرده و آن را سریعتر و از فاصله دورتر از نقطه تمرکز تشخیص کنیم. آنها توصیف کردند که پسزمینه الگوهای منظمی دارد. انحرافها از این منظمیت نشاندهنده وجود یک هدف در حالت استتار است. با این حال، این اتفاق برای همه انواع اشیاء در حالت استتار رخ نمیدهد. اگر پسز