|
用时3个月,连续每天15小时工作强度,3台3060加一台4090,疯狂的测试模型参数,终于解决了端到端深度强化学习的交易系统,没有一个指标,没有一个人为因素在里面,完全由机器自己去学习K线规律。
现在是4个时间周期,TICK 1M 5M 15M,暂时把黄金解决了,刚开始模拟盘两天,一天大概100多个单,目测交易非常智能,入场后,机器自己设置最合适的止损位置,然后根据实时盘面出场,实盘等一周后开始。
只是讨论,不卖系统不出信号,我也不会贴图,信就信,不信就不信,假如由朋友正在研发这样的系统,一起讨论。
我发现机器学习有个很有趣的事,你给他惩罚马上坍缩,就和小孩子一样的,越打越骂越叛逆。所以我只设置奖励,各种奖励,他就非常好的学习交易。可能是我的算法适合这样(算法是我自己研究出来的,不是特定的那个算法),框架就是英伟达的PY框架。然后基本可以无视过拟合,因为是不断的迭代探索。
注:我一个代码都不会写,用时半年研究AI写代码,已经写了快十个交易系统了,现在这个强化深度学习量化交易系统,应该是最后一个了。
|