ka | en
TSU

გამოწრთობით დასწავლის მიმოხილვა

ავტორი: ირაკლი კობერიძე
საკვანძო სიტყვები: წაქეზებით სწავლება, გამოწრთობით დასწავლა, გაძლიერებული სწავლება
ანოტაცია:

ეს ნაშრომი მიმოიხილავს გამოწრთობით დასწავლის (Reinforcement Learning, RL) ევოლუციას. განხილვას ვიწყებთ ფუნდამენტური პრინციპებიდან როგორიცაა მარკოვის გადაწყვეტილების პროცესი და მისი ამოხსნა დინამიური პროგრამირების მეშვეობით. შემდეგ კი განვიხილავთ დროებითი სხვაობის პრინციპს რომელიც საშუალებას გვაძლევს გარემოს მოდელის გარეშე გავწვრთნათ აგენტი ასევე ქიუ-დასწავლას (Q-Learning) რომელიც ეფექტურად მოიხმარს გამოცდილებას ოპტიმალური გადაწყვეტილებების მისაღებად. ასევე გავარჩევთ თუ როგორ შეიძლება მდგომარეობებს შორის განზოგადოება ფუნქციის მიახლოების გზით, მაგალითად ხელოვნური ნეირონული ქსელით.


მიმაგრებული ფაილები:

გამოწრთობით დასწავლის მიმოხილვა [ka]

Web Development by WebDevelopmentQuote.com
Design downloaded from Free Templates - your source for free web templates
Supported by Hosting24.com