برچسب برنامه نویسی پویا - پروژه ها و تحقیقات دانشجویی

پروژه یادگیری تقویتی

فرمت فایل دانلودی: .docx
فرمت فایل اصلی: docx
تعداد صفحات: 25
حجم فایل: 718
قیمت: : 2000 تومان

بخشی از متن:
بخشی از مقدمه:
حیوانات، انسان ها، اتومات ها و .. از خود رفتار های مختلفی در محیطی که آن ها را احاطه کرده، در شرایط مختلف، از خود نشان می دهند. آن ها کارهای مختلفی را به عنوان باز خورد در جواب ورودی هایی که از محیط می گیرند انجام می دهند. بعضی از این عامل ها رفتار های خود را در طول زمان عوض می کنند. آن ها ممکن است با دادن ورودی های یکسان، عمل های متفاوتی نسبت به حرکت های قبلی خود انجام دهند. چنین عاملی یاد می گیرد. شاخه یادگیری ماشین به مطالعه الگوریتم های یادگیری که مشخص می کند تغییر در ورودی ها چگونه در رفتار عامل تغییر ایجاد می کند می پردازد. الگوریتم های یادگیری به 3 دسته تقسیم می شوند: ...

فهرست مطالب:
معرفی یادگیری تقویتی
برنامه نویسی پویا
اجزا یک سیستم یادگیری تقویتی
محیط
تابع پاداش
تابع مقدار
Q-Learning
معرفی
الگوریتم یادگیری
مثالی از یک عامل
مثالی از برج هانوی
اثبات همگرایی
یادگیری Q برای MDP غیرقطعی
روش های مونت کارلو در یادگیری تقویتی
ویژگیها
سیاست first visit MC
کنترل مونت کارلو
همگرایی مونت کارلو
on line policy و off linepolicy
منابع

پروژه یادگیری تقویتی معرفی یادگیری تقویتی برنامه نویسی پویا اجزا یک سیستم یادگیری تقویتی Q-Learning روش های مونت کارلو در یادگیری سیاست first visit MC کنترل مونت کارلو همگرایی مونت کارلو

سامان چهارشنبه 1 مهر 1394 ساعت 10:32

0 نظر

پاورپوینت درس طراحی الگوریتم ها(با شبه کد های ++c)

منبع : کتاب طراحی الگوریتمها

مترجم : جعفر نژاد قمی

عناوین فصل ها :

کارایی ، تحلیل و مرتبه الگوریتم ها

روش تقسیم و حل

برنامه نویسی پویا

روش حریصانه در طراحی الگوریتم

راهبرد عقبگرد

مقدمه ای بر پیچیدگی محاسباتی:مسئله مرتب سازی

تعداد صفحات : 249 اسلاید

پاورپوینت درس طراحی الگوریتم ها شبه کد های ++c دانلود مقاله جعفر نژاد قمی مرتبه الگوریتم ها برنامه نویسی پویا روش حریصانه راهبرد عقبگرد

سامان پنج‌شنبه 19 شهریور 1394 ساعت 11:52

0 نظر

پروژه ها و تحقیقات دانشجویی

پیوندها

دسته‌ها

ابر برجسب

جدیدترین یادداشت‌ها

بایگانی

جستجو

پروژه یادگیری تقویتی

پروژه یادگیری تقویتی

پاورپوینت درس طراحی الگوریتم ها(با شبه کد های ++c)

پاورپوینت درس طراحی الگوریتم ها(با شبه کد های ++c)