트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3385

 
Maxim Dmitrievsky #:
규칙에 관한 글을 쓰고 싶지 않으셨나요, 아니면 마음이 바뀌었나요? 테스트 기능을 최소화하는 것보다 더 흥미로운 주제일 수도 있습니다. 아니면 OOS에서 유효성 검사에 문제가 있나요? 아니면 문제는 없지만 글쓰기가 게으른 것일 수도 있습니다.
글쎄요, 쓸 게 없네요.
나무 모델을 규칙으로 깨는 방법을 작성하겠습니다.
사실, 제 게시물에 이미 모든 것이 나와 있습니다.

아니면 제 이전 게시물을 언급하는 건가요? 그렇다면 분할에서 나는 슈퍼 치유 속성을 찾지 못했고 모델에 줄 수없는 장점이 있습니다.

1. 모델의 차원을 크게 줄일 수 있습니다.



2. 각 규칙의 통계를 알 수 있습니다 (이것은 정말 중요합니다).

예를 들어 100개의 규칙이 있는 나무 모델이 있는데 각 규칙이 100개의 규칙 내에서 한 번 작동했는지(패턴이 없음) 또는 10개의 규칙이 50번 작동했는지(패턴이 있음)를 알 수 없습니다.
모델을 깨뜨리지 않으면 알 수 없으며 두 모델 모두 우리에게 동일하게 적용될 것입니다.

 
mytarmailS #:
글쎄요, 쓸 내용이 없어요.
나무 모형을 규칙으로 분해하는 방법을 쓸 건데, 뭐 어때요?
기본적으로 제 게시물에 이미 모든 것이 나와 있습니다.

아니면 제 이전 게시물을 언급하는 건가요? 그렇다면 분할에서 나는 슈퍼 치유 속성을 찾지 못했고 모델에 줄 수없는 장점이 있습니다.

1. 모델의 차원을 크게 줄일 수 있습니다.



2. 각 규칙의 통계를 알 수 있습니다 (이것은 정말 중요합니다).

예를 들어 100개의 규칙이 있는 나무 모델이 있는데 각 규칙이 100개의 규칙 내에서 한 번 작동했는지(패턴이 없음) 또는 10개의 규칙이 50번 작동했는지(패턴이 있음)를 알 수 없습니다.
모델을 깨뜨리지 않으면 알 수 없으며 두 모델 모두 우리에게 동일하게 적용됩니다.

트리에서는 일반적으로 각 특징에 대한 각 관찰의 영향력, 모델에 대한 기여도(예: 모양 값)를 통해 계산할 수 있습니다. 유용한 것만 남겨두고 그것에 대해서만 무언가를 훈련하면 대략적인 규칙 검색의 아날로그를 얻을 수 있습니다. 그런데 뉴런을 사용하는 것도 가능합니다.

규칙만이 유일하게 유용한 규칙이 될 수 있는 경우는 이해하기 어렵습니다. 아마도 결과의 해석 가능성 때문일 것입니다. 도형 값도 좋은 해석 가능성을 제공하지만, 일종의.
 
Maxim Dmitrievsky #:
트리에서는 일반적으로 각 특성에 대한 각 관찰의 영향력, 예를 들어 모양 값을 통해 모델에 대한 기여도를 계산할 수 있습니다. 유용한 것만 남기고 그것에 대해서만 무언가를 훈련하면 대략적인 규칙 검색과 유사한 결과를 얻을 수 있습니다. 그런데 뉴런을 사용하는 것도 가능합니다.

규칙만이 유일한 유용한 규칙이 될 수 있는 경우는 이해하기 어렵습니다. 아마도 결과의 해석 가능성 때문일 것입니다. 모양 값도 좋은 해석 가능성을 제공하지만, 일종의.
각 특성의 영향력, 각 관찰의 영향력, 각 규칙의 영향력이 모두 다르기 때문입니다.
 
mytarmailS #:
각 기능의 영향, 각 관찰의 영향, 각 규칙의 영향은 모두 다릅니다.
규칙은 특징과 레이블을 연결하는 모델의 요소입니다. 신경망에는 불연속성이 없지만 인위적으로 불연속성을 만들 수 있다는 점이 유일한 차이점입니다.

제가 말씀드리고 싶은 것은 규칙(파이프를 의미 있게 피우는 것)에 큰 의미가 없다는 것입니다.
 
Maxim Dmitrievsky #:
규칙은 속성과 레이블을 연결하는 모델의 요소입니다. 신경망에는 불연속성이 없지만 인위적으로 만들 수 있다는 점만 다릅니다.

제가 말하고자 하는 것은 규칙에 큰 의미가 없다는 것입니다.

하바롭스크에서 시도해 보겠습니다...


모든 모델은 패턴의 특정 합계이며, 과장되게 말하면 패턴을 TS로 분류할 수 있습니다.


한 모델이 100개의 TC로 구성되어 있다고 가정해 봅시다.


모델 #1에서는 100개의 TC가 하나의 거래를 했을 수 있습니다.

패턴 2에서는 한 TS가 100건의 거래를 했고 나머지 99개는 단 한 건의 거래도 하지 않았을 수 있습니다.


각 TS에 대한 통계는 어떻게 계산 하나요?

모델이 규칙 모델인 경우 쉽고 명확합니다.

모델이신경 모델이라면?

 
mytarmailS #:

하바롭스크 근처에서 시도해 볼게요.

모델이 뉴런인 경우?

/\
!
!

당신과 산치는 같은 스튜디오에서 일하지 않나요?
NS가 잘 예측한 예제를 선택합니다. 그 예제들에 대해서만 다른 NS를 훈련시킵니다. 취향에 따라 여러 번 반복합니다. 몇 라운드가 끝나면 최고의 "규칙"을 가진 NS를 갖게됩니다.

또한 쉽고 이해할 수 없다고 말하지 않을 것입니다.
 
Maxim Dmitrievsky #:

NS가 잘 예측한 예시를 선택합니다. 이 예제들에 대해서만 다른 NS를 훈련시킵니다. 취향에 따라 여러 번 반복합니다. 여러 라운드가 끝나면 최고의 "규칙"을 가진 NS를 얻을 수 있습니다.
뉴런카가 잘 예측하는 하위 샘플을 얻었는데, 이 하위 샘플이 하나의 패턴인지, 두 개인지, 20개인지 어떻게 알 수 있나요? 정말 그 차이를 모르시나요?

 
mytarmailS #:
뉴로닉스가 잘 예측하는 하위 샘플이 있는데, 그 하위 샘플이 하나의 패턴인지, 두 개인지, 20개인지 어떻게 알 수 있나요? 정말 그 차이를 모르시나요?

남은 예제 수로 알 수 있습니다. 패턴의 수만큼 많은 예가 있습니다. 이것은 대략적인 규칙이지 엄격한 규칙과 같다고 말하는 것은 아닙니다. 하지만 샘플을 더 세분화하여 각 패턴에 대해 완전한 분할까지 할 수 있습니다.
 
Maxim Dmitrievsky #:
남은 예제 수로 계산합니다. 패턴의 수만큼 많은 예제가 있습니다.
예는 200개, 패턴은 5개만 있을 수 있습니다.
예는 패턴이 아니라 하나의 관찰입니다.
 
mytarmailS #:
예는 200개, 패턴은 5개만 있을 수 있습니다.
예는 패턴이 아니며, 예는 하나의 관찰입니다.
오차가 이미 감소를 멈추었거나 0과 같으면 나머지 예제를 근접성 척도에 따라 패턴으로 나눌 수 있습니다.) 예를 들어 클러스터링입니다. 그리고 몇 개가 남았는지 세어보세요. 그리고 각 패턴/클러스터에 대한 평균 조건을 작성하면(클러스터의 중심을 취하면) 출력 규칙을 얻을 수 있습니다.
사유: