تخمین موقعیت

عدم قطعیت در ربات
ژانویه 1, 2024
بازی دنیای شبکه ای با یادگیری تقویتی
می 24, 2024

تخمین موقعیت


در اصل روباتیک احتمالاتی، ایده اصلی تخمین وضعیت از داده‌های حسگری است. تخمین وضعیت مسئله تخمین مقادیر از داده‌های حسگری را مورد بررسی قرار می‌دهد که به طور مستقیم مشاهده نمی‌شوند، اما می‌توان از آن‌ها استنباط کرد. در بیشتر برنامه‌های روباتیک، تعیین کردن چه کاری باید انجام شود، نسبتاً آسان است اگر فقط مقادیر خاصی را بدانیم. به عنوان مثال، جابجایی یک روبات متحرک به راحتی انجام می‌شود اگر مکان دقیق روبات و تمام موانع نزدیک آن شناخته شود. متأسفانه، این متغیرها به طور مستقیم قابل اندازه‌گیری نیستند. به جای آن، یک روبات باید بر روی حسگرهای خود تکیه کند تا این اطلاعات را جمع آوری کند. حسگرها فقط اطلاعات جزئی درباره این مقادیر را حمل می‌کنند و اندازه‌گیری‌های آن‌ها توسط نویز مخلوط می‌شوند. تخمین وضعیت به دنبال بازیابی متغیرهای وضعیت از داده‌ها است. الگوریتم‌های احتمالاتی برای تخمین وضعیت، توزیع باور بر روی حالت‌های ممکن جهان محاسبه می‌کنند. یک مثال از تخمین وضعیت احتمالاتی در مقدمه این کتاب مورد بررسی قرار گرفت: موقعیت‌یابی روبات متحرک.
هدف این فصل، معرفی واژگان اساسی و ابزارهای ریاضی برای تخمین وضعیت از داده‌های حسگری است.

بخش ۲.۲ واژه‌ها و نشانه‌های اصلی احتمالاتی را که در طول کتاب استفاده می‌شوند، معرفی می‌کند.
بخش ۲.۳ مدل رسمی ما از تعامل محیط روبات را توضیح می‌دهد و برخی از اصطلاحات کلیدی استفاده شده در طول کتاب را مطرح می‌کند.
بخش ۲.۴ فیلترهای بیز را معرفی می‌کند که الگوریتم بازگشتی برای تخمین وضعیت است که پایه تقریباً هر تکنیک معرفی شده در این کتاب است.

بخش ۲.۵ مسائل نمایشی و محاسباتی را بررسی می‌کند که پیش می‌آیند زمانی که فیلترهای بیز پیاده‌سازی می‌شوند.

۲.۲ مفاهیم اساسی در احتمالات
این بخش با نشانه‌گذاری اصلی و حقایق و نشانه‌های احتمالاتی که در طول کتاب استفاده می‌شوند، آشنا می‌کند. در روباتیک احتمالاتی، مقادیری مانند اندازه‌گیری‌های حسگر، کنترل‌ها و وضعیت‌هایی که یک روبات و محیط آن ممکن است به آنها دست یابد، همه به عنوان متغیرهای تصادفی مدل می‌شوند. متغیرهای تصادفی می‌توانند چندین مقدار داشته باشند و این کار را بر اساس قوانین احتمالی خاصی انجام می‌دهند. استنباط احتمالاتی، فرآیند محاسبه این قوانین برای متغیرهای تصادفی است که از متغیرهای تصادفی دیگر نتیجه می‌شوند، مانند آن‌هایی که داده‌های حسگر را مدل می‌کنند.
بگذارید X یک متغیر تصادفی و x یک رویداد خاص باشد که X ممکن است به آن دست یابد. یک مثال استاندارد از یک متغیر تصادفی، پرتاب سکه است، جایی که X می‌تواند مقادیر شیر یا خط داشته باشد. اگر فضای همه مقادیری که X می‌تواند داشته باشد گسسته باشد، همانطور که در صورتی که X نتیجه‌ی پرتاب سکه باشد این اتفاق می‌افتد، ما نوشته می‌کنیم:
p(X = x)

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *