Резултати
eNauka >
Rezultati >
Distributed Gradient Temporal Difference Off-policy Learning With Eligibility Traces: Weak Convergence
| Naziv: | Distributed Gradient Temporal Difference Off-policy Learning With Eligibility Traces: Weak Convergence | Autori: | Stanković, Miloš S. |
Godina: | 2020 | Publikacija: | Proc. 21st IFAC World Congress | ISSN: | 2405-8963![]() Pretraži identifikator |
Izdavač: | IFAC | Tip rezultata: | Konferencijski rad | Kolacija: | vol. 53 br. 2 str. 1563-1568 | DOI: | 10.1016/j.ifacol.2020.12.2184 | WoS-ID: | 000652592500253 | Scopus-ID: | 2-s2.0-85104545219 | URI: | http://ezaposleni.singidunum.ac.rs/rest/sciNaucniRezultati/oai/record/1/8089 https://enauka.gov.rs/handle/123456789/330169 |
URL: | https://doi.org/10.1016%2Fj.ifacol.2020.12.2184 | Izvor metapodataka: | Migracija | M-kategorija: | Mp kategorija će biti prikazana naknadno. |
Резултати на еНаука су заштићени ауторским правима и сва права су задржана, осим ако није другачије назначено.
