2020-02-01から1ヶ月間の記事一覧

【メモ】どうやって過学習を防ぐか、汎化性能を上げるか、勾配爆発・消失を防ぐか

・自分で検索する時のタグ的なもの 深層学習、ディープラーニング、機械学習 勾配爆発、勾配発散、勾配消失、汎化性能 個人的なリンク集のようなものです。 実装はKetasのSequencialモデルベースを基本的には想定・基本 TensorFlow公式の解説 "過学習と学習…

【成功!】深層強化学習でのFX自動トレード(のシミュレーション)がうまくいかないのでオレオレ手法を考えた

qiita.com

【Need Help!】深層強化学習(DQNもどき)のNNにLSTMを組み込むもうまくいかず

※記事最下部に追記ありDQNもどき*1でFXシステムトレードシミュレーションというのをやっているのですが(下の記事からはまた幾分変化しています)、 qiita.comこれに、LSTMを導入してみましたが、残念ながうまくいっていません。 以下はその問題についての記…

同じ処理をしているコード(DDQN)のはずなのにタスクが解けるコードと解けないコードがあって混乱

Open AI gym の 倒立振り子の課題を DQN(DDQN)で解けるか確認しているのですが、以前、解けることを確認したコードでは解けるのに、WinMergeで差分を確認するまでした、開発中のFXトレードシミュレーション用のコードをベースにその課題を解くように修正し…

深層強化学習でのFX自動トレード(のシミュレーション)がうまくいかないのでオレオレ手法を考えた

qiita.com