華為OA盧助力:強化學習預置算法
華為云計算技術有限公司 IT和互聯網 150-500人
應用案例 2022-04-15 08:15:51
該強化學習預置算法中,為用戶提供了常用的強化學習算法,目前包括五個常用算法(DQN、PPO、A2C、IMPALA以及APEX)。用戶訂閱之后,選擇算法只需設置對應參數,即可很方便地創建訓練作業,開始訓練相應的強化學習環境(內置環境或自定義環境)。訓練后生成的模型可直接在ModelArts平臺部署為在線服務,支持推理。