بررسی الگوهای تمرینی کارآمدتر برای ربات‌ها در میادین جنگی

0
37

پژوهشگران ارتش آمریکا سعی دارند با مجهز کردن “عوامل” خودکار به قدرت یادگیری و استدلال، از آنها در میادین جنگی کمک بگیرند.

عملیات چند دامنه‌ای که ارتش‌ آمریکا برای آینده در نظر دارد، عوامل خودکار با مولفه‌های یادگیری را می‌طلبد که در کنار سربازان فعالیت کنند.

پژوهش جدید ارتش آمریکا، غیرقابل پیش‌بینی بودن سیاست‌های یادگیری کنونی را کاهش می‌دهد تا کاربرد آنها در سیستم‌های فیزیکی، به ویژه ربات‌های زمینی بیشتر باشد.

دکتر “الک کوپل”(Alec Koppel)، پژوهشگر ارتش آمریکا گفت: این مولفه‌های یادگیری، به عوامل خودکار امکان خواهند داد تا با شرایط متغیر میادین جنگی سازگار شوند.

وی افزود: مکانیسم اساسی سازگاری و برنامه‌ریزی دوباره، تقویت سیاست‌های مبتنی بر یادگیری را شامل می‌شود. دستیابی بهینه به این سیاست‌ها برای تحقق مفهوم عملیات، مهم است.

به گفته کوپل، روش‌های یادگیری، اساس الگوریتم‌های مقیاس‌پذیر است اما روش‌های کنونی نمی‌توانند اهداف گسترده‌تر تصمیم‌گیری مانند حساسیت نسبت به خطر، محدودیت‌های ایمنی و اکتشاف را داشته باشند.

کوپل ادامه داد: شاید طراحی رفتارهای مستقل هنگامی که رابطه میان پویایی و هدف، پیچیده است، با یادگیری تقویت‌کننده مورد توجه قرار بگیرد. این ویژگی برای حل کردن وظایف تعامل‌پذیر از جمله بازی‌هایی مانند شطرنج که نیاز به راهبرد دارند، مورد استفاده قرار گرفته است.

وی افزود: برای سهولت بخشیدن به یادگیری، باید مکانیسم‌های آموزش، کارآیی و قابل اطمینان بودن نمونه را بهبود ببخشند. ما به واسطه تعمیم طرح‌های جستجوی سیاست‌های موجود، گامی در جهت از بین بردن موانع کارآیی برمی‌داریم که بر سر راه کارآیی نمونه موجود قرار دارند.

کوپل و گروهش، طرح‌های جست و جوی سیاست جدیدی را برای خدمات عمومی ارائه داده‌اند که پیچیدگی نمونه آنها نیز اثبات شده است. آنها دریافتند که طرح‌های جستجو، نوسانات انباشتگی پاداش را کاهش می‌دهند، اکتشاف کارآمد در حوزه‌های ناشناخته‌ و همچنین مکانیسمی برای ادغام تجربیات پیشین به همراه دارد.

کوپل گفت: این پژوهش، طرح‌های جستجوی جدیدی را برای استفاده عمومی ارائه می‌دهد که پیچیدگی نمونه آنها نیز ثابت شده است. این نوآوری‌ها به‌ واسطه امکان‌پذیر کردن اهداف یادگیری مانند حساسیت نسبت به خطر، محدودیت‌های ایمنی و اکتشاف، برای ارتش آمریکا تاثیرگذار هستند.

آینده این پژوهش، بسیار درخشان است و کویل تلاش خود را به استفاده از یافته‌های پژوهش در ارائه فناوری‌های نوآورانه برای سربازان در جبهه‌های جنگ اختصاص داده است.

کوپل گفت: من خوشبین هستم و باور دارم که ربات‌های خودمختار دارای قابلیت یادگیری می‌توانند به سربازان در اکتشاف، شناسایی و ارزیابی خطر در جبهه‌های جنگ کمک کنند. تبدیل شدن این چشم‌انداز به واقعیت، برای برطرف کردن آنچه که به مشکلات پژوهشی منجر می‌شود، ضروری است.

گام بعدی این پژوهش، گنجاندن اهداف گسترده‌تر تصمیم‌گیری در آن است تا امکان یادگیری در تنظیمات دارای چند عامل را فراهم کند و همچنین به بررسی این موضوع بپردازد که تنظیمات تعاملی چگونه میان عوامل یادگیری تقویت‌کننده، به ایجاد استدلال در میان گروه‌ها می‌انجامد.

به گزارش ایسنا و به نقل از آرمی‌میل، به گفته کوپل، فناوری حاصل از این پژوهش می‌تواند هنگام عدم اطمینان در موقعیت‌های گروهی، به استدلال بپردازد.