پژوهشگران ارتش آمریکا سعی دارند با مجهز کردن “عوامل” خودکار به قدرت یادگیری و استدلال، از آنها در میادین جنگی کمک بگیرند.
عملیات چند دامنهای که ارتش آمریکا برای آینده در نظر دارد، عوامل خودکار با مولفههای یادگیری را میطلبد که در کنار سربازان فعالیت کنند.
پژوهش جدید ارتش آمریکا، غیرقابل پیشبینی بودن سیاستهای یادگیری کنونی را کاهش میدهد تا کاربرد آنها در سیستمهای فیزیکی، به ویژه رباتهای زمینی بیشتر باشد.
دکتر “الک کوپل”(Alec Koppel)، پژوهشگر ارتش آمریکا گفت: این مولفههای یادگیری، به عوامل خودکار امکان خواهند داد تا با شرایط متغیر میادین جنگی سازگار شوند.
وی افزود: مکانیسم اساسی سازگاری و برنامهریزی دوباره، تقویت سیاستهای مبتنی بر یادگیری را شامل میشود. دستیابی بهینه به این سیاستها برای تحقق مفهوم عملیات، مهم است.
به گفته کوپل، روشهای یادگیری، اساس الگوریتمهای مقیاسپذیر است اما روشهای کنونی نمیتوانند اهداف گستردهتر تصمیمگیری مانند حساسیت نسبت به خطر، محدودیتهای ایمنی و اکتشاف را داشته باشند.
کوپل ادامه داد: شاید طراحی رفتارهای مستقل هنگامی که رابطه میان پویایی و هدف، پیچیده است، با یادگیری تقویتکننده مورد توجه قرار بگیرد. این ویژگی برای حل کردن وظایف تعاملپذیر از جمله بازیهایی مانند شطرنج که نیاز به راهبرد دارند، مورد استفاده قرار گرفته است.
وی افزود: برای سهولت بخشیدن به یادگیری، باید مکانیسمهای آموزش، کارآیی و قابل اطمینان بودن نمونه را بهبود ببخشند. ما به واسطه تعمیم طرحهای جستجوی سیاستهای موجود، گامی در جهت از بین بردن موانع کارآیی برمیداریم که بر سر راه کارآیی نمونه موجود قرار دارند.
کوپل و گروهش، طرحهای جست و جوی سیاست جدیدی را برای خدمات عمومی ارائه دادهاند که پیچیدگی نمونه آنها نیز اثبات شده است. آنها دریافتند که طرحهای جستجو، نوسانات انباشتگی پاداش را کاهش میدهند، اکتشاف کارآمد در حوزههای ناشناخته و همچنین مکانیسمی برای ادغام تجربیات پیشین به همراه دارد.
کوپل گفت: این پژوهش، طرحهای جستجوی جدیدی را برای استفاده عمومی ارائه میدهد که پیچیدگی نمونه آنها نیز ثابت شده است. این نوآوریها به واسطه امکانپذیر کردن اهداف یادگیری مانند حساسیت نسبت به خطر، محدودیتهای ایمنی و اکتشاف، برای ارتش آمریکا تاثیرگذار هستند.
آینده این پژوهش، بسیار درخشان است و کویل تلاش خود را به استفاده از یافتههای پژوهش در ارائه فناوریهای نوآورانه برای سربازان در جبهههای جنگ اختصاص داده است.
کوپل گفت: من خوشبین هستم و باور دارم که رباتهای خودمختار دارای قابلیت یادگیری میتوانند به سربازان در اکتشاف، شناسایی و ارزیابی خطر در جبهههای جنگ کمک کنند. تبدیل شدن این چشمانداز به واقعیت، برای برطرف کردن آنچه که به مشکلات پژوهشی منجر میشود، ضروری است.
گام بعدی این پژوهش، گنجاندن اهداف گستردهتر تصمیمگیری در آن است تا امکان یادگیری در تنظیمات دارای چند عامل را فراهم کند و همچنین به بررسی این موضوع بپردازد که تنظیمات تعاملی چگونه میان عوامل یادگیری تقویتکننده، به ایجاد استدلال در میان گروهها میانجامد.
به گزارش ایسنا و به نقل از آرمیمیل، به گفته کوپل، فناوری حاصل از این پژوهش میتواند هنگام عدم اطمینان در موقعیتهای گروهی، به استدلال بپردازد.