عدم قطعیت در ربات
ژانویه 1, 2024بازی دنیای شبکه ای با یادگیری تقویتی
می 24, 2024تخمین موقعیت
در اصل روباتیک احتمالاتی، ایده اصلی تخمین وضعیت از دادههای حسگری است. تخمین وضعیت مسئله تخمین مقادیر از دادههای حسگری را مورد بررسی قرار میدهد که به طور مستقیم مشاهده نمیشوند، اما میتوان از آنها استنباط کرد. در بیشتر برنامههای روباتیک، تعیین کردن چه کاری باید انجام شود، نسبتاً آسان است اگر فقط مقادیر خاصی را بدانیم. به عنوان مثال، جابجایی یک روبات متحرک به راحتی انجام میشود اگر مکان دقیق روبات و تمام موانع نزدیک آن شناخته شود. متأسفانه، این متغیرها به طور مستقیم قابل اندازهگیری نیستند. به جای آن، یک روبات باید بر روی حسگرهای خود تکیه کند تا این اطلاعات را جمع آوری کند. حسگرها فقط اطلاعات جزئی درباره این مقادیر را حمل میکنند و اندازهگیریهای آنها توسط نویز مخلوط میشوند. تخمین وضعیت به دنبال بازیابی متغیرهای وضعیت از دادهها است. الگوریتمهای احتمالاتی برای تخمین وضعیت، توزیع باور بر روی حالتهای ممکن جهان محاسبه میکنند. یک مثال از تخمین وضعیت احتمالاتی در مقدمه این کتاب مورد بررسی قرار گرفت: موقعیتیابی روبات متحرک.
هدف این فصل، معرفی واژگان اساسی و ابزارهای ریاضی برای تخمین وضعیت از دادههای حسگری است.
بخش ۲.۲ واژهها و نشانههای اصلی احتمالاتی را که در طول کتاب استفاده میشوند، معرفی میکند.
بخش ۲.۳ مدل رسمی ما از تعامل محیط روبات را توضیح میدهد و برخی از اصطلاحات کلیدی استفاده شده در طول کتاب را مطرح میکند.
بخش ۲.۴ فیلترهای بیز را معرفی میکند که الگوریتم بازگشتی برای تخمین وضعیت است که پایه تقریباً هر تکنیک معرفی شده در این کتاب است.
بخش ۲.۵ مسائل نمایشی و محاسباتی را بررسی میکند که پیش میآیند زمانی که فیلترهای بیز پیادهسازی میشوند.
۲.۲ مفاهیم اساسی در احتمالات
این بخش با نشانهگذاری اصلی و حقایق و نشانههای احتمالاتی که در طول کتاب استفاده میشوند، آشنا میکند. در روباتیک احتمالاتی، مقادیری مانند اندازهگیریهای حسگر، کنترلها و وضعیتهایی که یک روبات و محیط آن ممکن است به آنها دست یابد، همه به عنوان متغیرهای تصادفی مدل میشوند. متغیرهای تصادفی میتوانند چندین مقدار داشته باشند و این کار را بر اساس قوانین احتمالی خاصی انجام میدهند. استنباط احتمالاتی، فرآیند محاسبه این قوانین برای متغیرهای تصادفی است که از متغیرهای تصادفی دیگر نتیجه میشوند، مانند آنهایی که دادههای حسگر را مدل میکنند.
بگذارید X یک متغیر تصادفی و x یک رویداد خاص باشد که X ممکن است به آن دست یابد. یک مثال استاندارد از یک متغیر تصادفی، پرتاب سکه است، جایی که X میتواند مقادیر شیر یا خط داشته باشد. اگر فضای همه مقادیری که X میتواند داشته باشد گسسته باشد، همانطور که در صورتی که X نتیجهی پرتاب سکه باشد این اتفاق میافتد، ما نوشته میکنیم:
p(X = x)