طراحی یک سامانه گفتگوگر وظیفهگرا مشترک مبتنی بر یادگیری تقویتی عمیق
Oral Presentation , Page 9-14 (6) Full Text (1.08 MB)
Authors
1Department of Computer Engineering, Faculty of Electrical and Computer Engineering, University of Kashan, Kashan, Iran
2استادیار، گروه مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، ایران
3Assistant Professor, University of Kashan
Abstract
ساخت سامانههای گفتگوگر در سالهای اخیر توجه زیادی به خود جلب کرده است. دستهای از این سامانهها، سامانههای گفتگوگر وظیفهگرا هستند که هدفشان رساندن انسان به مقصودش با انجام گفتگو در یک حوزه خاص میباشد؛ مثلاً رستوران. این سامانهها از بخشهای مختلفی تشکیل میشوند که اگر دو یا چند بخش، همزمان توسعه داده شوند، سامانهی مشترک (Joint) نامیده میشود. یکی از روشهایی که برای توسعه این سامانهها استفاده میشود، روش یادگیری تقویتی عمیق است. در یادگیری تقویتی عمیق، عامل که شبکه عصبی است با تعامل با محیط (کنش) در حالتهای مختلف و دریافت پاداش از آن، آموزش میبیند. همچنین، در شروع یادگیری، عامل تعدادی کنش بصورت تصادفی انجام میدهد و به مرور زمان از دانشی که بدست آورده، استفاده میکند. در این مقاله، برای اینکه حالت مناسبی از محیط گفتگو ایجاد شود، از چسباندن نمایش جمله آخرین پیام ربات و انسان، استفادهشده است. همچنین، تابعی جدید برای کاهش احتمال انجام کنش تصادفی، بکارگرفته شده است. برای ارزیابی و مقایسه عملکرد روش ارائهشده با دو سامانه گفتگوگر دیگر، از شبیهساز گفتگو در حوزه رستوران استفاده شدهاست. روش ارائهشده، بیشینه پاداش $0.29937$ را در 27900 گام گفتگو بدست میآورد که نسبت به دو روش دیگر، با تعداد گفتگوهای کمتر، پاداش بیشتری بدست آورده است.
Keywords
Proceeding Title [Persian]
طراحی یک سامانه گفتگوگر وظیفهگرا مشترک مبتنی بر یادگیری تقویتی عمیق
Authors [Persian]
محمدجواد نصر لوشانی، حسین ابراهیمپور کومله
Abstract [Persian]
ساخت سامانههای گفتگوگر در سالهای اخیر توجه زیادی به خود جلب کرده است. دستهای از این سامانهها، سامانههای گفتگوگر وظیفهگرا هستند که هدفشان رساندن انسان به مقصودش با انجام گفتگو در یک حوزه خاص میباشد؛ مثلاً رستوران. این سامانهها از بخشهای مختلفی تشکیل میشوند که اگر دو یا چند بخش، همزمان توسعه داده شوند، سامانهی مشترک (Joint) نامیده میشود. یکی از روشهایی که برای توسعه این سامانهها استفاده میشود، روش یادگیری تقویتی عمیق است. در یادگیری تقویتی عمیق، عامل که شبکه عصبی است با تعامل با محیط (کنش) در حالتهای مختلف و دریافت پاداش از آن، آموزش میبیند. همچنین، در شروع یادگیری، عامل تعدادی کنش بصورت تصادفی انجام میدهد و به مرور زمان از دانشی که بدست آورده، استفاده میکند. در این مقاله، برای اینکه حالت مناسبی از محیط گفتگو ایجاد شود، از چسباندن نمایش جمله آخرین پیام ربات و انسان، استفادهشده است. همچنین، تابعی جدید برای کاهش احتمال انجام کنش تصادفی، بکارگرفته شده است. برای ارزیابی و مقایسه عملکرد روش ارائهشده با دو سامانه گفتگوگر دیگر، از شبیهساز گفتگو در حوزه رستوران استفاده شدهاست. روش ارائهشده، بیشینه پاداش $0.29937$ را در 27900 گام گفتگو بدست میآورد که نسبت به دو روش دیگر، با تعداد گفتگوهای کمتر، پاداش بیشتری بدست آورده است.
Keywords [Persian]
نمایش جمله، حوزه رستوران، مدیریت گفتگو، DQL