머숨 미러

The main issue with supervised learning models like LSTMs or XGBoost is that they focus on point-in-time predictions(at time t).

This often leads to a significant discrepancy between backtesting and live trading results, primarily due to overfitting and the non-stationary nature of the market.

This is why current research is shifting toward Reinforcement Learning (RL), which is better suited for non-linear market dynamics and optimizing for long-term cumulative returns rather than just immediate price direction.

However, keep in mind that RL isn't a silver bullet. Achieving consistent profitability requires immense effort in environment modeling and reward function design. Simply switching to an RL model won’t guarantee stable profits without a very robust strategy and rigorous validation.

레딧에 누가 질문올렸길래 이렇게 답변해줬다 ㅇㅅㅇ

겉만 번지르르하고 실속이 좆도없네 진짜

대갤러 1(211.234) 2026-03-19 12:23:00

답글

ㅋㅋㅋㅋㅋㅋㅋ 니가 생각하는 실속이뭔데? 난 핵심적인 내용은 정확히 전달한것같은데? ㅋㅋ

hiya(veteran4386) 2026-03-19 12:26:00

Rl을 쓰는 이유는 금융공학에서 sde와의 유사성 때문이다 석사좆밥나부랭이 새기야 매시점 행동을 바꾸는데 장기보상을 고려하는게 어떻게 메리트가 되겠니

대갤러 2(211.235) 2026-03-19 15:28:00

답글

삼류새기야 해줄설명이 많지만 알아서 찾아라. 니 설명은 존나 단편적인 부족한이해에서 나온 버러지같은 개소리임 좆밥 나부랭이 새기야 ㅋ

hiya(veteran4386) 2026-03-19 16:46:00

답글

ㅋㅋ 븅신 금융공학에서 유사한 시도를 80년대부터 했어요 강화학습 짜잔 장기보상 고려 이래서 강화학습을 쓰는게 아니라고 금융공학모델도 되는건데 왜 굳이 비싼 컴퓨팅비용 쓰면서 신경망을 훈련시키겠냐 전혀새로운 이점이 아닌데 개빡대가리 비전공자새갸

대갤러 2(211.235) 2026-03-19 17:02:00

답글

애초에 80년대 mdp 연구한게 경제학자들인건 앎?

대갤러 2(211.235) 2026-03-19 17:04:00

답글

@대갤러2(211.235) 논지 흐리지말고 그래서 내가 한말이 틀렸음? 난 아닌것같은데 좆밥아 ㅋ

hiya(veteran4386) 2026-03-19 17:05:00

답글

응틀렸어

대갤러 2(211.235) 2026-03-19 17:09:00

답글

@대갤러2(211.235) https://docs.google.com/document/d/1deG63M88lVGJKVoCqZ_Zf9OEnFbN3A6TR_7e6oyeLnY/edit?usp=sharing 병신 ㅋㅋㅋㅋ

hiya(veteran4386) 2026-03-19 17:12:00

답글

gemini pro 형님이 아주 정확하게 설명한다고 하신다 젖밥아 ㅋ

hiya(veteran4386) 2026-03-19 17:13:00

답글

지피티로 연구하는 석사생이면 겸손해야지 좃밥인걸 자랑스럽게 쳐올리네

대갤러 2(211.235) 2026-03-19 17:14:00

답글

지피티든 제미나이든 강화학습의 일반적인 이점을 포트폴리오 최적화에 갖다붙인거임 니모델을 생각해봐 매시간스텝 포지션을 바꾸도록 해놨지. 저 설명은 언제 맞는거냐면 시간스텝동안 포지션을 한동안 유지하게해야 저 설명이 맞는거임 지피티 쳐쓰지말고 하나하나 뜯어서 공부를 쳐해라 생각해봐 매시간스텝 포지션을 바꾸는데 누적보상을 고려한다? 금융시장에서?

대갤러 2(211.235) 2026-03-19 17:17:00

답글

강화학습에서 예를들어 게임에서는 상태 > 행동 > 보상 > 상태 이렇게 전이가되지 행동이 상태에 영향을 미치기 때문에 미래보상을 고려하는거라고 철학자체가. 금융시장에서는 행동이 상태를 바꾸지않음 행동따로 상태따로고 니가말한 누적보상을 고려하는 효과가 없다고 알겠냐. 공부를쳐해라 십새야 지피티돌리지말고

대갤러 2(211.235) 2026-03-19 17:19:00

답글

@대갤러2(211.235) 한심한놈아 편협한 지식으로 억지논리펴서 말싸움이나 이길생각하는놈이 누굴 걱정하는거냐 ㅋㅋ

hiya(veteran4386) 2026-03-19 17:22:00

답글

뭔 논문도 아니고 레딧에서 꺼드럭대는 놈이 같잖길래 패준것일뿐

대갤러 2(211.235) 2026-03-19 17:23:00

답글

내얘기가 무슨 얘긴지도 모를거다. 지피티돌려봐 ㅋㅋ

대갤러 2(211.235) 2026-03-19 17:24:00

답글

@대갤러2(211.235) 같잖은건 너같은데? 단편적인 지식으로 다 아는척하면서 남 까기만 하는놈이? ㅋ

hiya(veteran4386) 2026-03-19 17:24:00

답글

@대갤러2(211.235) https://photos.app.goo.gl/zNm2nFMMrCoK6baXA 난 트레이딩 전략 연구 시스템 직접 구축해서 돌리고 있는데 넌 뭐하길래 나보고 꺼드럭대는 놈이래? ㅋㅋ

hiya(veteran4386) 2026-03-19 17:26:00

내가 짠 스크립트가 하나 있는데 백데이터 슬리피지에 수수료넣고 자산75% 거래 최근 6년 수익팩터 2.12 나왔는데 이거 괜찮은거냐>

대갤러 3(112.223) 2026-03-19 16:56:00

답글

그정도 정보가지곤 판단하기 힘들지. 잘모르면 paper trade(dry run) 돌려봐

hiya(veteran4386) 2026-03-19 17:04:00

답글

@hiya 이게 트뷰 백테스터보다 현실성 이 있는거야?

대갤러 3(112.223) 2026-03-19 17:06:00

답글

트레이딩뷰는 잘안써서모르고 잘짜여진 라이브러리(nautilus trader)보단 신뢰성이 떨어지긴하겠지

hiya(veteran4386) 2026-03-19 17:08:00

AI자동매매에서 RL쓰는이유 정리해봤다

댓글 22

AI자동매매에서 RL쓰는이유 정리해봤다

댓글 22

다른 게시글

엿같네 인생씨발

문과 대학원 아무리 생각해도 이해안가서 물어보러왔다

94년생 KY석사면 취업 많이 늦은거냐...???

학계쪽으로는 얼씬도 하지마라

교수 아래에 나 혼자라 외롭다

실험 장비 지혼자 다 쓰는 폐급새끼 어쩌면 좋지

며칠전 생산직 경쟁률

계약학과 연구분야들은

시발 매너좆같은 리뷰어 개많네

지금 삼성에서 사람 존나 뽑는다는 소문이 들려오는듯