이것은 플레이어의 행별 비용 최소화를 고려하여 두 사람의 제로섬 게임에 대한 최적의 혼합 전략을 찾는 함수의 소스입니다(보수 행렬의 양수 값은 행별 플레이어의 이득입니다) 열에 의한 플레이어의 손실). 소스가 작동 중입니다. 확인됨, 최소 없음.
public double [ ] getData ( double [ ] [ ] a ) { int m = a . length ; int n = a [ 0 ] . length ; double [ ] p = new double [ m ] ; double [ ] q = new double [ n ] ; double [ ] x = new double [ m ] ; double [ ] y = new double [ n ] ; int r = rand . nextInt ( m ) ; int c = 0 ; for ( int t = 0 ; t < 100 ; t + + ) { System . out . print ( "Progress: " + t + "% \r " ) ; for ( int u = 0 ; u < 10000 ; u + + ) { for ( int j = 0 ; j < n ; j + + ) { y [ j ] = y [ j ] + a [ r ] [ j ] ; } c = 0 ; for ( int j = 1 ; j < n ; j + + ) { if ( ( y [ j ] = = y [ c ] ) & & rand . nextBoolean ( ) ) { c = j ; } if ( y [ j ] > y [ c ] ) { c = j ; } } q [ c ] = q [ c ] + 1 d ; for ( int i = 0 ; i < m ; i + + ) { x [ i ] = x [ i ] + a [ i ] [ c ] ; } r = 0 ; for ( int i = 1 ; i < m ; i + + ) { if ( ( x [ i ] = = x [ r ] ) & & rand . nextBoolean ( ) ) { r = i ; } if ( x [ i ] < x [ r ] ) { r = i ; } } p [ r ] = p [ r ] + 1 d ; } } System . out . println ( "Progress: 100%" ) ; for ( int i = 0 ; i < n ; i + + ) { q [ i ] = q [ i ] / 1000000 d ; } double ep = 0 d ; for ( int i = 0 ; i < m ; i + + ) { double result = 0 ; for ( int j = 0 ; j < n ; j + + ) { result = result + a [ i ] [ j ] * q [ j ] * p [ i ] / 1000000 d ; } ep = ep + result ; } System . out . println ( "Expected Payoff = " + ep ) ; return q ; }
결과적으로, 바로 이 시장의 가격 데이터 시계열의 일부 개별 부분에 대해 바로 이 모델의 최대 근사화 원칙에 따라 시장의 특정 모델을 구축하려고 하는 사람은 함정에 빠지게 됩니다.
동의하지 않기가 어렵습니다.
세션 시간이 수평으로 - 세션 시작부터 개별 막대, 수직으로 - 세션 자체가 되는 이러한 동일한 개시 가격 차이를 입력하겠습니다. 달력 날짜. 따라서 우리는 보수 매트릭스를 받았습니다. 플레이어에 대해 열을 기준으로 해결하면 문제에 대한 솔루션을 얻을 수 있습니다. 긴 위치에 들어가는 것이 필요한 시간과 양. 위에서 언급했듯이 이것은 게임의 가격인 수학적 기대 측면에서 상황에 대한 최악의 추정이 될 것입니다.
감독자! 그런 다음 다음 계산 및 조정으로 이동합니다.
그러나 매트릭스에 요약 된 "15 일 동안의 시세"가 최적의 시장 전략이며 다른 것이 아니라 시계열의 일부를 왜곡 된 방식으로 해부하는 것이라고 누가 말했습니까?
또한 자연은 시장에 사과드립니다.이 매트릭스를 준수해야 할 의무는 없습니다 ...
신부와 그의 사랑하는 개에 관한 시가 생각납니다...
강하게 짹짹 고기를 원했습니다. ;)
결과적으로 정원사는 새로운 "즉시 최적화"의 기능을 이해하지 못했습니다.
기존 피팅 방식과의 차이점을 설명해주세요.
인 것 같습니다. 시장에 이러한 최적의 전략이 있다고 가정하면. 저는 개인적으로 자연이 의미 있는 전략을 세우지 않는 게임을 자연과 비유하는 것을 선호합니다.
시험을 마친. 적합하지 않습니다. 왜냐하면 "자연"에는 어떤 전략도 전혀 없는 것으로 분명히 가정됩니다. 많은 기준 중 하나를 선택하는 것은 바로 이러한 특성에 따라 달라지며, 실제로는 시장에 근접하지도 않은 것으로 판명될 수 있습니다.
따라서 시장은 마음대로 작동하는 어리석은 '본성'이 아니라 생각하는 것보다 훨씬 효율적이라는 관점을 취하는 것이 좋습니다. 따라서 그가 상인을 속이려고 시도하고 가장 효과적으로 할 것이라는 사실을 고려하여 계산하는 것이 좋습니다.
내 지인(상인이기도 함) 중 한 명이 말했듯이: 우리 사업에서는 한 번 헛소리를 하는 것보다 안전하게 다시 한 번 플레이하는 것이 좋습니다.
그러나 매트릭스에 요약 된 "15 일 동안의 시세"가 최적의 시장 전략이며 다른 것이 아니라 시계열의 일부를 왜곡 된 방식으로 해부하는 것이라고 누가 말했습니까?
또한 자연은 시장에 사과드립니다.이 매트릭스를 준수해야 할 의무는 없습니다 ...
...
기존 피팅 방식과의 차이점을 설명해주세요.
이를 위해 이가 있는지 추가로 확인하는 방법이 있습니다. 예를 들어, 순방향 테스트에서.
내 임무는 적용 방법 중 하나만 보여 주는 것이며 이 자료를 어떻게 사용하고 모델링할지는 이미 개인 문제입니다. 내 일은 제안하는 것이고 당신의 일은 거절하는 것이다. 따라서 피팅을 피하는 방법에 대한 개인적인 의견이 있으면 아무도 사용을 금지하지 않습니다. 그리고 그렇지 않다면 재판이 없어야 합니다.
당신이 15일 동안 이야기를 하는 것을 좋아하지 않는다면 아무도 당신이 더 많거나 적게 가져가는 것을 금하지 않습니다.
따라서 시장은 마음대로 작동하는 어리석은 '본성'이 아니라 생각하는 것보다 훨씬 효율적이라는 관점을 취하는 것이 좋습니다. 따라서 그가 상인을 속이려고 시도하고 가장 효과적으로 할 것이라는 사실을 고려하여 계산하는 것이 좋습니다.
그런 다음 현재 데이터를 기반으로 거래자 집합에 대해 최적이라고 주장되는 전략을 식별하는 문제를 해결해야 할 수도 있습니다. 그런 다음 거래자와 관련하여 이 악명 높은 적대적 시장 전략을 찾으십시오.
그리고 여기에서 우리의 "최적의 관계"가 제 시간에 도착할 것입니다. ;)
정원사로서 나는 게임에 대해 잘 모릅니다. 특히 게임이 "나는 그가 내가 알고 있다는 것을 알고 있다는 것을 알고 있습니다."
그런 다음 현재 데이터를 기반으로 거래자 집합에 대해 최적이라고 주장되는 전략을 식별하는 문제를 해결해야 할 수도 있습니다. 그런 다음 거래자와 관련하여 이 악명 높은 적대적 시장 전략을 찾으십시오.
그리고 여기에서 우리의 "최적의 관계"가 제 시간에 도착할 것입니다. ;)
정원사로서 나는 게임에 대해 잘 모릅니다. 특히 게임이 "나는 그가 내가 알고 있다는 것을 알고 있다는 것을 알고 있습니다."
또한 개인적인 목적을 위해 원하는 모델을 사용할 수 있다고 들었습니다. 예외 없는 모든 거래자 + 긴급 개입 모델 + 중앙 은행가의 조치 + 정부의 조치 + .... + 지진 + 외계인 침공의 가능한 결과 등 심장이 멈출 때까지. 저것들. 모든 것과 모든 사람을 고려할 수 있는 무제한 컴퓨팅 리소스가 있는 경우 모든 거래자뿐만 아니라 모델링을 방해하는 것은 무엇입니까?
그러나 이 스레드에서는 온갖 망상 발생기의 다양한 아이디어가 아니라 topikstater가 제안한 모델에 대해 논의해야 합니다.
글쎄, Duc, 오렌지에있는 돼지처럼이 분야를 이해하는 일종의 좋은 조언자가 항상있을 것입니다.
개인적인 목적으로 원하는 모델을 사용할 수 있습니다. ... + 외계인 침공의 가능한 결과 등 심장이 멈출 때까지.
그러나 이 스레드에서는 온갖 망상 발생기의 다양한 아이디어가 아니라 topikstater가 제안한 모델에 대해 논의해야 합니다.
건설적인 과학과 숫자 게임에 감사드립니다.
질문이 제거되었습니다.
나에게는 명예가 있다.
다시 한 번 상기시켜 드리겠습니다.
두 명의 플레이어 T-raider:)와 V-time:)이 동전 던지기 게임을 합니다. 플레이어는 동시에 그리고 서로 독립적으로 문장(G - 판매 - 가격 인하) 또는 꼬리(P - 구매 - 가격 인상)를 선택합니다.
두 번의 동전 던지기 결과가 같으면(즉, GG 또는 RR) 플레이어 T는 플레이어 B로부터 1달러를 받습니다.
그렇지 않으면 플레이어 T는 플레이어 B에게 1달러를 지불합니다.
플레이어 T에 대한 다음 지불 행렬은 전략에 해당하는 행의 최소 요소와 열의 최대 요소 값을 보여줍니다.
두 선수.
| BR |
| ||||
---|---|---|---|---|---|---|
TG | 하나 | -하나 | -하나 | |||
TR | -하나 | 하나 | -하나 | |||
열 최대값 | 하나 | 하나 |
이 게임의 maxmin 및 minimax 값(가격)은 각각 -$1 및 $1입니다. 이 양은 서로 같지 않기 때문에 게임
순수 전략에는 솔루션이 없습니다.
특히, 플레이어 T가 TG 전략을 사용하는 경우 플레이어 B는 플레이어 T로부터 1달러를 얻기 위해 VR 전략을 선택합니다.
이런 일이 발생하면 플레이어 T는 TP 전략으로 전환하여 게임의 결과를 변경하고 플레이어 B로부터 1달러를 얻을 수 있습니다.
다른 전략으로 전환하려는 각 플레이어의 끊임없는 유혹은 순수한 전략 솔루션이 용납될 수 없음을 나타냅니다.
대신, 두 플레이어는 전략의 적절한 무작위 조합을 사용해야 합니다.
Moulin E. 수학적 경제학의 예가 있는 게임 이론 . 남: 미르,
혼합 전략의 결정은 시장이 한 전략 또는 다른 전략을 적용할 가능성이 있음을 의미한다는 점에 유의해야 합니다.
여러 가지 방법이 있으며 그 중 가장 일반적인 방법은 다음과 같습니다.
1. 선형 계획법, 즉 Simplex 방법을 통해. 방법이 그다지 좋지 않기 때문에 보수 매트릭스에 솔루션이 없는 경우 및 어떤 경우에는 보수 매트릭스에 안장점이 있거나 솔루션이 없는 경우(구현에 따라 다름) 정체될 수 있습니다(구현에 따라 다름).
2. 반복적인 방법. 반복 방법의 각 단계에서 잠재적인 보수 매트릭스 솔루션 중 하나로 수렴됩니다. 결론은 다음 단계가 모호하면 난수 생성기를 사용하여 선택한다는 것입니다. 따라서 이 방법은 동일한 보수 매트릭스를 다시 계산할 때 다른 솔루션을 제공할 수 있습니다. 솔루션이 없거나 게임 가격이 0이면 기대치의 수렴은 0이 되는 경향이 있습니다.
특정 조건에 맞는 트랜잭션의 일부만 고려하거나 일부 트랜잭션을 폐기하면 이 모든 것을 단순화할 수 없습니까?
많은 거래가 있는 일중 시스템이 있다고 가정해 보겠습니다. 우리는 각각 약세 일간 캔들과 짧은 거래에서 일어난 긴 거래를 남깁니다. 당신은 약세뿐만 아니라 거래 등의 역사에서 가장 약세를 보이는 50 개까지 할 수 있습니다. 등. 여러 필터링 기준을 생각할 수 있습니다. 사실, 이것은 트레이더에게 최악의 상황 중 하나의 선택일 뿐입니다 - 시장의 조건부 비대칭 반응(:))
그 반대의 경우도 가능합니다. 최적의 전략을 찾는 것이 전체 역사에서가 아니라 특정 기준에 따라 장수와 공매도 역사의 가장 불리한 부분에서만 찾는 것입니다.
특정 조건에 맞는 트랜잭션의 일부만 고려하거나 일부 트랜잭션을 폐기하면 이 모든 것을 단순화할 수 없습니까?
많은 거래가 있는 일중 시스템이 있다고 가정해 보겠습니다. 우리는 각각 약세 일간 캔들과 짧은 거래에서 일어난 긴 거래를 남깁니다. 당신은 약세뿐만 아니라 거래 등의 역사에서 가장 약세를 보이는 50 개까지 할 수 있습니다. 등. 여러 필터링 기준을 생각할 수 있습니다. 사실, 이것은 트레이더에게 최악의 상황 중 하나의 선택일 뿐입니다 - 시장의 조건부 비대칭 반응(:))
그 반대의 경우도 가능합니다. 최적의 전략을 찾는 것이 전체 역사에서가 아니라 특정 기준에 따라 장수와 공매도 역사의 가장 불리한 부분에서만 찾는 것입니다.
사실 게임의 결정은 주어진 기준에 따라 역사상 가장 불리한 부분이기 때문에 내가 이미 보고한 대로 시장을 위한 전략을 선택하면 거래자가 문제 없이 이익을 얻을 수 있는 선택에서 세션이 줄어들거나 완전히 제외됩니다.
그리고 공매도와 공매도의 혼합 전략의 경우, 롱 포지션과 숏 포지션에 가장 적합한 시간을 찾기 위해서도 매우 실현 가능합니다. 예를 들어, 롱 포지션에 대해서만 전략 검색을 실행하는 경우 트레이더를 위한 바로 이 전략은 특정 시간에 거래량이 0으로 시작하는 것을 권장합니다. 저것들. 사지 않는 것이 가장 좋은 때입니다. 이러한 시간에 해당하는 보수 매트릭스 열의 모든 숫자에 대한 부호를 변경할 수 있으며, 이는 본질적으로 짧은 포즈의 가능성을 고려하는 것을 의미합니다. 솔루션에 0이 아닌 값이 포함되어 있으면 단락이 가능합니다. 내가 말했듯이 가장 중요한 것은 거래자에게 게임의 긍정적인 가격을 달성하는 것입니다.
장단기 혼합 전략의 아이디어를 제안해주셔서 감사합니다!
아시다시피 시장은 고정적이지 않습니다. 이를 증명하는 것은 매우 쉽습니다. 일종의 금융 상품에 대한 특정 시장 모델을 취하고 별도의 과거 데이터 섹션으로 조정하여 가능한 한 가깝게(대략적인) 가져옵니다. 우리는 과거 데이터와 우리 모델 간의 차이의 특정 극값을 얻습니다. 즉, 잔차입니다. 동일한 시장 도구의 표본 외부에 있는 과거 데이터의 다른 섹션에서 이러한 방식으로 얻은 모델을 실행합니다. 우리는 잔차 측면에서 훨씬 더 나쁜 결과를 얻습니다.
시장은 끊임없이 변화하고 있습니다.
결과적으로, 바로 이 시장의 가격 데이터 시계열의 일부 개별 부분에 대해 바로 이 모델의 최대 근사화 원칙에 따라 시장의 특정 모델을 구축하려고 하는 사람은 함정에 빠지게 됩니다. 이러한 모든 근사화 모델은 시장이 변하지 않는다고 가정하기 때문에 통계적 및 확률적 특성은 동일하게 유지됩니다. 그러나 우리는 그렇지 않다는 것을 압니다. 따라서 개별 과거 데이터를 기반으로 시장의 가장 정확한 모델(공식)을 구축하려는 모든 시도는 실패할 수밖에 없습니다. 모델이 개선된 시장의 속성이 변경되면 적어도 정확하지 않습니다.
이 경우 어떻게 해야 합니까? 과거 데이터에 맞는 최적화를 포기할 수 있습니까?
답은 분명합니다. 최적의 시장 모델을 구축할 때 시장 모델이 정적이 아닌 동적이 되도록 바로 이 최적화를 수행해야 합니다. 저것들. 바로 이 모델에 어느 정도의 자유도를 부여합니다.
마지막 진술은 진부한 것처럼 보일 것입니다. 네. 그러나 시장 모델을 구축할 때 수행되는 작업을 살펴보면 그러한 진부한 진실이 실제로 사용되지 않는다는 것을 알 수 있습니다.
제로섬 및 혼합 전략(전략 선택의 자유)을 사용하여 두 사람의 게임(즉, 거래자와 시장의 거래 시스템)에 대한 최적의 솔루션을 찾기 위한 알고리즘을 사용하여 최적화를 수행해야 하는 것도 마찬가지로 명백합니다. 두 플레이어 모두) 페이오프 매트릭스를 사용합니다. 실제로 이 경우 다음이 있습니다.
1. 의도적으로 두 번째 플레이어의 동적 모델 - 시장, 전략 선택의 자유도 - 혼합 전략을 가정합니다.2. 즉시 시작할 수 있는 기성품 수학 및 알고리즘 장치. 혼합 전략과 제로섬을 가진 두 사람의 게임을 위한 수학적 장치가 완성되었습니다. 거기에는 "백색 반점"이 없으므로 해결책이 없거나 해결책이 없다는 의도적인 대답을 얻습니다.
그러나 가장 중요한 것은 2인 제로섬 게임에 대한 보수 매트릭스의 솔루션이 각 플레이어의 비용을 최소화하는 하나가 아니라 두 가지 최적의 솔루션을 제공한다는 것입니다. 하나는 잠재적 시장 전략, 다른 하나는 거래자의 거래 체계.
그리고 보수 매트릭스를 해결하기 위한 최적의 전략은 비용 최소화, 즉 플레이어가 자신의 전략을 엄격하게 준수함으로써 얻을 수 있는 보수에 대한 수학적 기대의 최악의 변형, 시장의 비정상성으로 인해 시장이 필연적으로 자체 최적의 전략을 준수하지 않을 확률, 그리고 따라서 거래 시스템의 지출 측면을 반드시 줄여야 하며, 이 거래 시스템이 최적의 전략을 엄격히 준수하는 경우 이를 늘리는 것이 수익성이 있습니다.
혼합 전략에 대한 2인 제로섬 게임의 개별적인 수학적 세부 사항과 그 기능은 더 이상 설명하지 않겠습니다. 모든 정보는 공개되어 있으며 인터넷을 통해 사용할 수 있습니다. 예를 들어 다음 링크에서: 2인용 제로섬 게임을 위한 혼합 전략
보수 매트릭스 구축
2인용 제로섬 게임의 보수 행렬은 2차원 숫자 공간입니다. 결론은 이 행렬 자체의 행이나 열에 대한 수학적 기대치가 두 플레이어의 최적 전략을 고려하여 계산된다는 것입니다. 전체 게임의 일반적인(최종) 기대치, 즉 두 플레이어의 최적의 전략을 고려하여 모든 행 또는 모든 열에 대해 게임의 가격이라고 합니다.
따라서 대부분의 경우 지불 매트릭스는 지불 값으로 채워집니다. 사실, 이 경우의 보수 매트릭스는 게임의 규칙입니다. 숫자가 양수이면 첫 번째 플레이어가 셀에 지정된 값만큼 두 번째 플레이어에게 금액을 지불합니다. 음수이면 두 번째 플레이어가 지정된 값의 절대 금액으로 첫 번째 플레이어를 지불합니다.
따라서 보수 매트릭스를 사용하면 게임 세트를 시뮬레이션할 수 있으며, 그 결과는 두 번째 플레이어의 선택을 미리 알지 못한다면 플레이어의 특정 게임 결과 선택에 따라 달라집니다. 거래와 관련하여 유추를 얻을 수 있습니다. 거래자는 가격이 어느 방향으로 갈지 미리 알지 못하며, 시장은 물론 바로 이 거래자가 내부자(상당한 지분의 소유자가 아닌 한) 개별 거래자가 어떤 방향으로 포지션을 오픈할지 모릅니다. 그가 시세에 큰 영향을 미칠 수 있는 이 시장의 자산) .
실제 예
시카고 증권 거래소에서 특정 증권의 주식을 거래하고 있다고 가정해 봅시다. 우리의 전략은 바로 이 종이를 얼마 동안 매수하여 보유하는 것입니다. 작업 설명은 다음과 같이 공식화됩니다. 세션의 몇 시간과 로트에서 롱 포지션을 취하는 것이 가장 수익성이 있습니까?
거래 시간은 7시간 30분입니다. 따라서 전체 세션을 각각 30분씩 15등분할 수 있습니다. 따라서 상황 분석은 M30 시간대에 수행됩니다.
지난 15일(전체 거래 3주)에 대한 견적을 살펴보겠습니다. 우리는 각 시간 간격의 결과가 특정 막대의 시작 가격과 그 앞에 있는 막대의 시작 가격 사이의 차이라고 가정합니다. 과거 데이터의 막대 번호 n에 대해 Open[n] - Open[n + 1]이 됩니다. 시간은 숫자 n + 1의 막대로 측정됩니다.
세션 시간이 수평으로 - 세션 시작부터 개별 막대, 수직으로 - 세션 자체가 되는 이러한 동일한 개시 가격 차이를 입력하겠습니다. 달력 날짜. 따라서 우리는 보수 매트릭스를 받았습니다. 플레이어에 대해 열로 해결하면 문제에 대한 솔루션을 얻을 수 있습니다. 어떤 시간에 어떤 양으로 긴 위치에 들어가는 것이 필요합니다. 위에서 언급했듯이 이것은 게임의 가격인 수학적 기대 측면에서 상황에 대한 최악의 추정이 될 것입니다.
우리는 거래자의 거래 시스템에 대한 결정이 무엇을 의미하는지 알고 있기 때문에 시장과 관련하여 결정이 정확히 무엇을 의미하는지, 즉 너무 특정 값이 밝혀진 후 라인의 플레이어를 위해? 이러한 동일한 값은 시장에서 가장 수익성이 높고 개별 거래 세션의 범위인 강세 전략을 고수하는 거래자에게는 불리합니다. 즉, 시장과 관련하여 보수 매트릭스 솔루션을 선택할 때 약세 추세가 있는 날에는 가장 큰 범위가 선택되고 강세 추세가 있는 막대에는 가장 큰 범위가 선택되었습니다. 결과적으로 시장과 거래자를 위한 절충안이 얻어졌으며, 이에 따라 거래자가 최적의 전략을 고수한다면 세션 범위의 변화가 그의 승리에 대한 기대를 악화시킬 수 없습니다.
참고: 결론은 시장에 대한 전략을 선택할 때 거래자의 전략이 강세라면 약세일의 범위가 증가하고 강세일의 경우 고려 대상에서 축소되거나 완전히 제거된다는 것입니다(제로 범위). 저것들. 궁극적으로, 연구된 과거 데이터에서 가격 움직임의 분명한 강세 특성이 관찰된 경우 시장 전략에 대한 개별 세션 범위의 감소 또는 증가를 고려하여 재계산할 때 약세 추세에 대한 예측이 수행됩니다 . 저것들. 이 경우 거래자의 전략 선택은 약세 세션 동안 가장 일반적인 강세 양초를 찾는 것으로 귀결됩니다. 그러나 그러한 양초가 충분한 확률로 발생하면 걱정하지 마십시오. 그러면 수용 가능한 해결책이 확실히 발견될 것입니다.
가장 확신을 가지려면 획득한 두 전략을 모두 고려하여 매우 수학적 기대치인 게임 가격을 계산해야 합니다. 양수이면 이것이 필요한 것이며 최악의 추정치는 보장 된 이익입니다.
그러나 상인과 시장의 획득 전략을 고려할 때 기대가 부정적인 것으로 판명되면 어떻게 될까요? 나쁜 책을 읽은 일부는 거래자의 전략을 볼륨면에서 동일하게 유지해야하지만 종이를 사고 보유하는 대신 반대로 판매해야한다고 말할 수 있습니다. 전략의 반전. 그러나 이것은 할 수 없습니다. 왜요? 강세 전략에 대한 최적의 솔루션을 계산하고 이를 약세 전략으로 변경한 후 결과로 나오는 최소 추정치가 최대값이 되기 때문입니다. 피팅을 사용하여 터미널 옵티마이저에서 얻은 것처럼 양수이지만 최대로 두십시오. 그리고 시장이 비정상적이기 때문에 그러한 반전 전략이 계산된 최대치에서 유지될 가능성은 거의 없습니다. 대부분 다시 음수가 될 것입니다. 결국, 쿠데타 이전의 전략에 따르면 가장 많은 양의 구매가 강세 추세가 지배적인 양초에 떨어졌습니다. 그리고 이제 강세 양초에서 약세 분위기에서 거래를 시작하면 상인의 지출 측면이 증가하고 그에 따라 부정적인 기대에 빠질 확률이 높아집니다.
네, 부정적인 기대의 경우 얻은 전략을 고려할 때 우리는 정말로 강세 전략을 약세 전략으로 변경해야 합니다. 그러나 동시에 더 이상 열의 플레이어가 아니라 행의 플레이어에 대해 전체 보수 매트릭스를 다시 계산하십시오. 또는 바로 이 행렬의 모든 셀에 있는 기호를 변경하면 열에서 플레이어에 대해 다시 계산할 수 있습니다. 알고리즘을 변경하지 마십시오. 이제 전략이 바뀌고 기대치도 기호뿐만 아니라 가치에서도 변할 것입니다.
기성 지불 매트릭스에 대한 솔루션을 얻는 방법은 무엇입니까?
여러 가지 방법이 있으며 그 중 가장 일반적인 방법은 다음과 같습니다.
1. 선형 계획법, 즉 Simplex 방법을 통해. 방법이 그다지 좋지 않기 때문에 보수 매트릭스에 솔루션이 없는 경우 및 어떤 경우에는 보수 매트릭스에 안장점이 있거나 솔루션이 없는 경우(구현에 따라 다름) 정체될 수 있습니다(구현에 따라 다름).
2. 반복적인 방법. 반복 방법의 각 단계에서 잠재적인 보수 매트릭스 솔루션 중 하나로 수렴됩니다. 결론은 다음 단계가 모호하면 난수 생성기를 사용하여 선택한다는 것입니다. 따라서 이 방법은 동일한 보수 매트릭스를 다시 계산할 때 다른 솔루션을 제공할 수 있습니다. 솔루션이 없거나 게임 가격이 0이면 기대치의 수렴은 0이 되는 경향이 있습니다.
나는 개인적으로 알고리즘이 아래에 나와 있는 반복적인 방법을 사용합니다. 목록은 Java로 되어 있으므로 특수 유틸리티를 사용하여 C로 쉽게 변환하거나 GCJ를 사용하여 기본 코드로 다시 컴파일할 수 있습니다. 이론적으로 모든 것이 MQL4 또는 MQL5로 즉시 작성될 수 있지만 현재 MQL4의 낮은 속도와 MQL5의 결함으로 인해 위의 프로그래밍 언어에서 아직 이 알고리즘을 사용할 수 없습니다.
함수의 입력 매개변수로 보수 행렬은 배열 - 행렬 형태로 주어집니다.
출력은 열에 의한 플레이어의 전략 형태의 숫자 배열입니다. 플레이어의 전략을 행별로 다시 계산해야 하는 경우 모든 셀의 모든 값에 대한 보수 행렬의 부호를 변경해야 합니다.함수는 행과 열에서 플레이어를 위한 최적의 전략을 고려하여 알고리즘(진행률)의 전달된 부분의 현재 값을 백분율 및 수학적 기대치로 콘솔에 출력합니다.