ka | en

ავტორიზაცია

გამოწრთობით დასწავლის მიმოხილვა

ავტორი: ირაკლი კობერიძე
საკვანძო სიტყვები: წაქეზებით სწავლება, გამოწრთობით დასწავლა, გაძლიერებული სწავლება
ანოტაცია:

ეს ნაშრომი მიმოიხილავს გამოწრთობით დასწავლის (Reinforcement Learning, RL) ევოლუციას. განხილვას ვიწყებთ ფუნდამენტური პრინციპებიდან როგორიცაა მარკოვის გადაწყვეტილების პროცესი და მისი ამოხსნა დინამიური პროგრამირების მეშვეობით. შემდეგ კი განვიხილავთ დროებითი სხვაობის პრინციპს რომელიც საშუალებას გვაძლევს გარემოს მოდელის გარეშე გავწვრთნათ აგენტი ასევე ქიუ-დასწავლას (Q-Learning) რომელიც ეფექტურად მოიხმარს გამოცდილებას ოპტიმალური გადაწყვეტილებების მისაღებად. ასევე გავარჩევთ თუ როგორ შეიძლება მდგომარეობებს შორის განზოგადოება ფუნქციის მიახლოების გზით, მაგალითად ხელოვნური ნეირონული ქსელით.

მიმაგრებული ფაილები:

გამოწრთობით დასწავლის მიმოხილვა [ka]