트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1486

 
막심 드미트리예프스키 :

나는 그것이 무엇인지 전혀 이해하지 못했습니다. Wikipedia는 암호학자 없이는 알아낼 수 없다고 말합니다. 다차원 분포, 그러나 파이썬 코드만 열리면 구축 방법이 명확하지 않습니다.

예, 그들과 함께 지옥에. 단지 공적분에 비해 백테스트 사진이 아름답다는 것이다

여기에 증거가 있습니다 https://www.quantconnect.com/tutorials/strategy-library/pairs-trading-copula-vs-cointegration

코퓰러는 여러 랜덤 변수의 결합 분포 밀도의 함수입니다. 개념적으로 이것은 상당히 간단한 수학적 구조입니다. 이해하기 위해 예를 들어 두 개의 임의 프로세스를 취하고 하나의 확률 의존도에 대한 2차원 차트를 작성하고 포인트 필드를 얻습니다. 프로세스가 독립적인 경우 거기에 있을 것입니다. 균일한 정사각형 필드가 되고 종속되는 경우 다른 패턴, 한 곳에서 포인트 압축 및 다른 곳에서 희박화가 있을 것입니다. 여기서 포인트의 로컬 밀도는 코풀라이며 선형 또는 비선형의 종속성을 나타냅니다.

 
이고르 마카누 :

IMHO, 예측과 실생활의 차이를 이해해야 합니다. 거래 시스템의 임무는 예측을 하는 것이고 위험과 자본 관리의 임무는 시스템의 생존 가능성을 보장하는 것입니다

그리고 copulas 또는 homunculi는 어떻습니까? MO의 도움이나 옵티마이저의 도움으로 TS를 얻은 방법 .... - 이것은 예측이지만 실제 상황을 제어 할 수 없습니다 - 가격

글쎄, 나는 copula에 반대하지 않습니다. 사실 Max 덕분에 위험 관리에서 MO의 도움으로 어떻게 든 적응하고 예측할 수 있습니다.

 

typedef struct

{

double dist;

double* vector;

} distvect;


int distvectcomp(distvect *v1, distvect *v2)

{

if (v1->dist == v2->dist) return 0;

double sub = v1->dist - v2->dist;

return sub / fabs(sub);

}


double* parsen(dataset inputs, dataset outputs, int k, double kernel(double), double vector[])

{

distvect* dvarr = malloc(inputs.length * sizeof(distvect));


for (int i = 0; i < inputs.length; ++i)

{

double dist = 0;

for (int j = 0; j < inputs.dimentions; ++j) dist += pow(vector[j] - inputs.data[i][j], 2);

distvect dv = { dist, outputs.data[i] };

dvarr[i] = dv;

}

qsort(dvarr, inputs.length, sizeof(distvect), distvectcomp);


double *res = calloc(outputs.dimentions, sizeof(double));

double W = 0;


for (int i = 0; i < k; ++i)

{

if (dvarr[i].dist == 0) continue;

double w = kernel(dvarr[i].dist);

W += w;

for (int d = 0; d < outputs.dimentions; ++d)

res[d] += dvarr[i].vector[d] * w;

}


for (int d = 0; d < outputs.dimentions; ++d) res[d] /= W;


free(dvarr);

return res;


}

"준최적" MO 알고리즘은
 
뭐라고요? 이 SVM 스텁은 무엇입니까
 
막심 드미트리예프스키 :
뭐라고요? 이 SVM 스텁은 무엇입니까

예, 아니요, 이 "Parzen 창", 핵 평활화, 그러나 거의 완벽하다는 의미에서 "준최적"(Mitchell이 어딘가에 있음)이라는 svm은 어떤 종류의 svm이지만 매우 느리지만 각 반복은 전체를 정렬합니다. 새로운 포인트에 대한 데이터 세트 및 코어가 있는 컨볼루션

 

트리를 구축할 때 전체 샘플에 대한 신호 분포의 균일성 을 고려하는 트리 구축 알고리즘이 왜 없는지 이해가 되지 않습니다.

거래에 있어 매우 중요하기 때문에 어떻게든 구현할 것입니다.

나는 이 분포를 고려하여 나뭇잎을 평가하지만, 이를 고려하여 나무를 만들었다면 훨씬 더 효과적인 나뭇잎/나무가 있을 것입니다.
 
알렉세이 비아즈미킨 :
나는 논쟁하지 않을 것이지만, 당신이 가지 치기로 나무를 고문하고 있다는 것을 헛되이 배제하지는 않습니다.
이것은 일반적인 고려 사항과 개인적인 경험에서 그렇습니다.
 
알렉세이 비아즈미킨 :

트리를 구축할 때 전체 샘플 에 대한 신호 분포의 균일성 을 고려하는 트리 구축 알고리즘이 왜 없는지 이해가 되지 않습니다.

거래에 있어 매우 중요하기 때문에 어떻게든 구현할 것입니다.

나는 이 분포를 고려하여 나뭇잎을 평가하지만, 이를 고려하여 나무를 만들었다면 훨씬 더 효과적인 나뭇잎/나무가 있을 것입니다.
거기에서 각 분할 전에 데이터가 기능별로 정렬되고( 시간별로 혼합 ), 분할(중간 또는 사분위수)되고, 오류 감소가 기억되고 모든 기능에 대해 반복됩니다. 최고의 이별은 매듭이 됩니다.

최고의 알고리즘을 제안합니다.

 
유리 아사울렌코 :
나는 논쟁하지 않을 것이지만, 당신이 가지 치기로 나무를 고문하고 있다는 것을 헛되이 배제하지는 않습니다.
이것은 일반적인 고려 사항과 개인적인 경험에서 그렇습니다.

어린 시절에는 분재를 자연의 조롱으로 여겼지만, 부모가 되자 그 생각의 깊이를 이해하게 되었습니다.

 
도서관 :
거기에서 각 분할 전에 데이터가 기능별로 정렬되고( 시간별로 혼합 ), 분할(중간 또는 사분위수)되고, 오류 감소가 기억되고 모든 기능에 대해 반복됩니다. 최고의 이별은 매듭이 됩니다.

최고의 알고리즘을 제안합니다.

따라서 예측 변수와 그 값을 정렬할 때 추정치를 제공해야 하며 매우 복잡한 값(범위)을 가진 예측 변수를 취하지 말고 표본 전체에 분포된 예측 변수를 우선적으로 선택해야 합니다.

저것들. 절대 빈도뿐만 아니라 샘플에 대한 분할의 반복 빈도를 평가할 필요가 있습니다.
사유: