트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1272

 
막심 드미트리예프스키 :

나는 이미 명백한 것들에 대해 논쟁하는 것에 지쳤습니다. 모든 것이 그들의 기사에 기록되어 있습니다. 모두가 원하는 것을 이해하게하십시오.

조금 더 추상화하면 시장과의 경쟁이 왜 똑같은지 명확해질 것입니다.

그리고 나는 이것을 최소한 교묘하게 발명된 것이 아니라 그들이 사용하는 관점에서 논의할 것을 제안합니다. 그렇지 않으면 논쟁의 여지가 없습니다.

여기에서 거래와 도박에 대한 유추를 찾으려고 노력하십시오. 심지어 프로세스의 양쪽에 의해 영향을 받는 확률 균형의 동일한 역학을 고려합니다. 문제를 자세히 살펴보고 용어 뒤에 숨지 않을 것입니다.

 
알렉세이 비아즈미킨 :

여기에서 거래와 도박에 대한 유추를 찾으려고 노력하십시오. 심지어 프로세스의 양쪽에 의해 영향을 받는 확률 균형의 동일한 역학을 고려합니다. 문제를 자세히 살펴보고 용어 뒤에 숨지 않을 것입니다.

마지막으로 글을 쓰면 다시는 쓰지 않겠습니다.

RL 에이전트는 자신이 무엇을 상대로 플레이하는지 상관하지 않습니다. 영국의 시장이나 다른 상대는 프로그램이기 때문에 이것을 이해하지 못합니다. 나머지는 전적으로 귀하의 "노하우"입니다.

상대방이 정적인지 동적인지는 중요하지 않습니다. 어쨌든 에이전트는 최적의 정책을 학습합니다.

생각을 모으고 모든 것을 이해하십시오. 언젠가.

 
막심 드미트리예프스키 :

마지막으로 글을 쓰면 다시는 쓰지 않겠습니다.

RL 에이전트는 자신이 무엇을 상대로 플레이하는지 상관하지 않습니다. 영국의 시장이나 다른 상대는 프로그램이기 때문에 이것을 이해하지 못합니다. 나머지는 전적으로 귀하의 "노하우"입니다.

상대방이 정적인지 동적인지는 중요하지 않습니다. 어쨌든 에이전트는 최적의 정책을 학습합니다.

생각을 모으고 모든 것을 이해하십시오. 언젠가.

교육 방법의 이름은 보조입니다. 나는 오랫동안 예측 변수에 대해 이야기하려고 노력해 왔습니다.

그리고 당신이 이해하지 못하듯이 국회는 상황에 영향을 미치는 법을 배울 수 있으며, 영향력의 효과에 따라 사건의 결과 확률에 영향을 미칩니다. 그리고 이것은 그러한 네트워크의 이점, 즉 상황에 영향을 미치는 능력을 제공합니다. 각 프레임에서 목표(동일한 차트)의 지표를 개선하기 위해 무엇을 해야 하는지에 대한 결정이 내려지고, 활동 프로세스는 다단계이며, 승리 또는 패배의 최종 확률은 시작 시 결정되지 않습니다. 게임이지만 플레이어의 행동을 포함하여 끊임없이 변화하고 있으며, 여기에 트레이딩과의 가장 큰 차이점이 있습니다.

트레이딩을 가르칠 때 RL법을 제시하는 것이 불가능하다는 것이 아니라, 상대가 무엇을 할지(어디서) 수동적으로 추측만 하는 것이 아니라 목표를 달성하기 위한 상황에 영향을 미치는 네트워크의 효율성에 대해 이야기한 것입니다. 가격은 갈 것입니다).

 
막심 드미트리예프스키 :

감정을 표현해야 하는 이유는 내 주장에 대해 합리적으로 반대하는 글을 쓰는 것이 좋습니다.

 
알렉세이 비아즈미킨 :

이것은 적의 행동에 대한 가능한 모든 옵션을 고려하는 최적의 정책 또는 전략이라고 합니다.

책을 읽고 욕하지 마십시오. 나는 이미 100번이나 썼습니다, 당신이 표현하려는 것은 한 쌍의 단어에 맞습니다

nafig 그럼 비웃어

 
막심 드미트리예프스키 :

이것은 적의 행동에 대한 가능한 모든 옵션을 고려하는 최적의 정책 또는 전략이라고 합니다.

책을 읽고 욕하지 마십시오. 나는 이미 100번이나 썼습니다, 당신이 표현하려는 것은 한 쌍의 단어에 맞습니다

nafig 그럼 비웃어

나는이 용어에 익숙하지 않습니다. 인터넷도 뭔가를 말하고 싶어하지 않습니다. 링크를 제공하십시오. 실제로 그렇게 불리는지 알 수 있습니다.

그리고 내 설명이 특정 용어에 적합하다면 장점에 대한 귀하의 반대를 이해할 수 없습니다. 이것은 용어에 관한 것이 아니라 적의 행동에 따라 달라질 수 있는 일련의 행동을 통해 게임에서 승리하는 장기적인 목표를 달성하기 위해 상황에 영향을 미치는 것입니다.

우리는 결정이 내려지는 다른 환경에 대해 이야기하고 있습니다. 하나는 환경과 상호 작용할 수 있고 다른 하나는 할 수 없습니다. 유리를 통해서만 관찰할 수 있습니다.
 
알렉세이 비아즈미킨 :

http://incompleteideas.net/book/bookdraft2018jan1.pdf

행운을 빕니다

 
막심 드미트리예프스키 :

http://incompleteideas.net/book/bookdraft2018jan1.pdf

행운을 빕니다

그렇지 않으면 내가 외국 독서를 읽지 않는다는 것을 모르실 것입니다 ... 나는 살펴 보았습니다. 예, 러시아어 인터넷보다 더 발전된 것들이 있습니다.

 
막심 드미트리예프스키 :

추가 단어의 절반 이상을 버리고 확률적 전환이 있는 일련의 동작(마르코프 체인)을 남겨두면 이미 더 좋습니다.

나머지 넌센스는 쓸 수 없다

항상 에이전트/환경으로 구분되며 유리를 통한 관찰은 없습니다. 다시 말하지만, 모든 사람이 사용할 수 있는 추상 수준은 아닙니다. 그리고 여기서 다시 이마를 벽에 부딪치게 될 것입니다. 왜냐하면 당신은 공부하는 대신 발명하기 때문입니다.

마지막으로 이 bacchanalia를 작성하고 중지합니다. 영향 이 없고 정책의 전환 및 근사치가 있습니다.

나는 당신이 어떻게 생각하는지 모르지만, 우리가 오랫동안 확립되고 검증의 대상이 아닌 공리에 대해 이야기하지 않는다면, 용어는 생각의 본질을 왜곡시킬 뿐입니다.

비유할 수 없고 용어만 참조하면 비생산적입니다.

 
알렉세이 비아즈미킨 :

그렇지 않으면 내가 외국 독서를 읽지 않는다는 것을 모르실 것입니다 ... 나는 살펴 보았습니다. 예, 러시아어 인터넷보다 더 발전된 것들이 있습니다.

글쎄, 그것을 읽을 다른 곳이 없습니다. Sutton, Barto " 강화학습 " 인터넷에 번역, 고서만 있지만 유용


사유: