طراحی یک سامانه گفتگوگر وظیفه‌گرا مشترک مبتنی بر یادگیری تقویتی عمیق
Oral Presentation , Page 9-14 (6) XML Full Text (1.08 MB)
Authors
1Department of Computer Engineering, Faculty of Electrical and Computer Engineering, University of Kashan, Kashan, Iran
2استادیار، گروه مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، ایران
3Assistant Professor, University of Kashan
Abstract
ساخت سامانه‌های گفتگوگر در سال‌های اخیر توجه زیادی به خود جلب‌ کرده است. دسته‌ای از این سامانه‌ها، سامانه‌های گفتگوگر وظیفه‌گرا هستند که هدفشان رساندن انسان به مقصودش با انجام گفتگو در یک حوزه خاص می‌باشد؛ مثلاً رستوران. این سامانه‌ها از بخش‌های مختلفی تشکیل می‌شوند که اگر دو یا چند بخش، همزمان توسعه‌ داده شوند، سامانه‌ی مشترک (Joint) نامیده می‌شود. یکی از روش‌هایی که برای توسعه این سامانه‌ها استفاده می‌شود، روش یادگیری تقویتی عمیق است. در یادگیری تقویتی عمیق، عامل که شبکه عصبی است با تعامل با محیط (کنش) در حالت‌های مختلف و دریافت پاداش از آن، آموزش می‌بیند. همچنین، در شروع یادگیری، عامل تعدادی کنش بصورت تصادفی انجام می‌دهد و به مرور زمان از دانشی که بدست آورده، استفاده می‌کند. در این مقاله، برای اینکه حالت مناسبی از محیط گفتگو ایجاد شود، از چسباندن نمایش جمله آخرین پیام ربات و انسان، استفاده‌شده است. همچنین، تابعی جدید برای کاهش احتمال انجام کنش تصادفی، بکارگرفته ‌شده است. برای ارزیابی و مقایسه عملکرد روش ارائه‌شده با دو سامانه گفتگوگر دیگر، از شبیه‌ساز گفتگو در حوزه رستوران استفاده شده‌است. روش ارائه‌شده، بیشینه پاداش $0.29937$ را در 27900 گام گفتگو بدست می‌آورد که نسبت به دو روش دیگر، با تعداد گفتگوهای کمتر، پاداش بیشتری بدست آورده است.
Keywords
 
Proceeding Title [Persian]
طراحی یک سامانه گفتگوگر وظیفه‌گرا مشترک مبتنی بر یادگیری تقویتی عمیق
Authors [Persian]
محمدجواد نصر لوشانی، حسین ابراهیم‌پور کومله
Abstract [Persian]
ساخت سامانه‌های گفتگوگر در سال‌های اخیر توجه زیادی به خود جلب‌ کرده است. دسته‌ای از این سامانه‌ها، سامانه‌های گفتگوگر وظیفه‌گرا هستند که هدفشان رساندن انسان به مقصودش با انجام گفتگو در یک حوزه خاص می‌باشد؛ مثلاً رستوران. این سامانه‌ها از بخش‌های مختلفی تشکیل می‌شوند که اگر دو یا چند بخش، همزمان توسعه‌ داده شوند، سامانه‌ی مشترک (Joint) نامیده می‌شود. یکی از روش‌هایی که برای توسعه این سامانه‌ها استفاده می‌شود، روش یادگیری تقویتی عمیق است. در یادگیری تقویتی عمیق، عامل که شبکه عصبی است با تعامل با محیط (کنش) در حالت‌های مختلف و دریافت پاداش از آن، آموزش می‌بیند. همچنین، در شروع یادگیری، عامل تعدادی کنش بصورت تصادفی انجام می‌دهد و به مرور زمان از دانشی که بدست آورده، استفاده می‌کند. در این مقاله، برای اینکه حالت مناسبی از محیط گفتگو ایجاد شود، از چسباندن نمایش جمله آخرین پیام ربات و انسان، استفاده‌شده است. همچنین، تابعی جدید برای کاهش احتمال انجام کنش تصادفی، بکارگرفته ‌شده است. برای ارزیابی و مقایسه عملکرد روش ارائه‌شده با دو سامانه گفتگوگر دیگر، از شبیه‌ساز گفتگو در حوزه رستوران استفاده شده‌است. روش ارائه‌شده، بیشینه پاداش $0.29937$ را در 27900 گام گفتگو بدست می‌آورد که نسبت به دو روش دیگر، با تعداد گفتگوهای کمتر، پاداش بیشتری بدست آورده است.
Keywords [Persian]
نمایش جمله، حوزه رستوران، مدیریت گفتگو، DQL