Резултати
еНаука >
Резултати >
Distributed Gradient Temporal Difference Off-policy Learning With Eligibility Traces: Weak Convergence
| Назив: | Distributed Gradient Temporal Difference Off-policy Learning With Eligibility Traces: Weak Convergence | Аутори: | Stanković, Miloš S. |
Година: | 2020 | Публикација: | Proc. 21st IFAC World Congress | ISSN: | 2405-8963![]() Претражи идентификатор |
Издавач: | IFAC | Тип резултата: | Конференцијски рад | Колација: | vol. 53 br. 2 str. 1563-1568 | DOI: | 10.1016/j.ifacol.2020.12.2184 | WoS-ID: | 000652592500253 | Scopus-ID: | 2-s2.0-85104545219 | URI: | http://ezaposleni.singidunum.ac.rs/rest/sciNaucniRezultati/oai/record/1/8089 https://enauka.gov.rs/handle/123456789/330169 |
URL: | https://doi.org/10.1016%2Fj.ifacol.2020.12.2184 | Извор метаподатака: | Migracija | М-категорија: | Мп категорија ће бити приказана накнадно. |
Резултати на еНаука су заштићени ауторским правима и сва права су задржана, осим ако није другачије назначено.
