트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3353

 
Maxim Dmitrievsky #:
일괄적 사고가 들어왔습니다. 이는 확률이 아니라 가능성을 추정하기 위해 황토를 사용했기 때문에 그렇게 불립니다.

실제 클래스 확률은 어떻게 구하나요?

다른 방법은 없습니다! 우리는 일련의 추가 기능과 함께 제공되는 기성 MO 알고리즘을 사용합니다. 이 모든 것을 "패키지"라고 합니다.

"실제 클래스 확률 "이란 무엇인가요?예를 들어, 함수

predict(object, newdata, type = c("vector", "probs", "both","F"))
함수는 "확률클래스 추정치" 를 반환합니다.알고리즘에는 "추정치" 이외의 다른 확률은 포함될 수 없습니다.



 

싸우지 마세요, 여러분, 다 읽고 있어요.

자물쇠를 열어요 ;)


 
СанСаныч Фоменко #:

다른 사고 방식은 없습니다! 저희는 추가 기능 세트와 함께 기성품 MO 알고리즘을 사용합니다. 모든 것을 함께 "패키지"라고 합니다.

"실제 클래스 확률 "이란 무엇인가요?예를 들어, 함수

함수는"확률 클래스 추정치" 를 반환합니다.알고리즘에 "추정치" 이외의 다른 확률은 포함할 수 없습니다.
문제는 알고리즘이 무엇을 할 수 있는지에 관한 것이 아닙니다. 신뢰할 수 있는 클래스 확률을 얻는 방법에 관한 것입니다. 따라서 클래스 확률이 0.8이면 80%의 사례가 올바르게 예측되었다고 확신할 수 있습니다. 예를 들어 임계값을 사용할 수 있습니다. 대부분의 경우 분류기 출력은 그렇게 하지 못합니다. "의도적으로" 과대평가하거나 과소평가합니다. 이것이 임계값이 작동하지 않는 이유입니다. 실제 확률은 과대평가도 과소평가도 하지 않을 때입니다.

여러분은 이미 모른다는 것을 보여주었습니다. 따라서 배워야 할 것이 더 많습니다. 따라서 "모든 MOE를 마스터"하고 일괄적인 사고를 버려야 합니다.
 

확률의 점 추정이 아니라 간격 추정에 관한 것 같습니다. matstat의 경우 이것은 확률의 특정 수치 추정치를 구하는 것뿐만 아니라 이 추정된 확률의 실제 값이 주어진 정확도(확률)로 떨어지는 구간을 구하는 일반적인 접근 방식입니다. 여기서 확률의 개념은 추정치 자체와 추정치의 정확도라는 두 가지 다른 가설에 관여하기 때문에 이해하기가 다소 어렵습니다. 그리고 이것들은 상당히 다른 확률입니다)

컨포멀 예측을 자세히 연구하지는 않았지만 제가 틀릴 수도 있습니다.

 
Maxim Dmitrievsky #:
문제는 그가 무엇을 할 수 있는지가 아닙니다. 문제는 신뢰할 수 있는 수업 확률을 얻는 방법에 관한 것입니다. 클래스 확률이 0.8이면 케이스의 80%가 정확하게 예측된다는 것을 확신할 수 있습니다. 예를 들어 임계값을 사용할 수 있습니다. 대부분의 경우 분류기의 출력은 사실이 아니므로 다시 반복합니다. "의도적으로" 과대 평가하거나 과소 평가합니다. 이것이 임계값이 작동하지 않는 이유입니다. 실제 확률은 과대평가도 과소평가도 하지 않는 경우입니다.

인용한 0.8이라는 수치는 클래스 확률 중 하나입니다. 다음은 클래스 확률의 히스토그램입니다.


그리고 저는 정확히 그렇게 가지고 있으며 다른 방법은 없습니다. 그렇지 않다면 그것은 과도한 훈련을 의미하기 때문입니다. 저에게는 고정 임계값에서 OOV와 OOS 및 VNE 파일의 예측 오류 불일치가 오버트레이닝의 주요 징후입니다. 임계값은 잘 작동합니다. 그리고 '실제 확률'은 이 사례에서 사용된 실제 코드 및 용어와는 무관한 일부 허구의 영역에서 나온 것입니다.

 
СанСаныч Фоменко #:

주어진 0.8이라는 수치는 클래스 확률 값 중 하나입니다. 다음은 클래스 확률의 히스토그램입니다.


이 수치가 다르면 과훈련을 의미하기 때문에 다른 방법이 아니라 정확히 이렇게 되어 있습니다. 저에게는 고정 임계값에서 OOV와 OOS 및 VNE 파일의 예측 오류 불일치가 오버트레이닝의 주요 징후입니다. 임계값은 잘 작동합니다. 그리고 '실제 확률'은 실제 코드 및 이에 사용되는 용어와는 전혀 관련이 없는 허구의 영역에서 나온 것입니다.

임계값이 완벽하게 작동한다는 것을 어떻게 알았나요?
여러분에게는 환상이지만 다른 사람에게는 평범한 일입니다.
 
Aleksey Nikolayev #:

확률의 점 추정이 아니라 간격 추정에 관한 것 같습니다. matstat의 경우 이것은 확률의 특정 수치 추정치를 구하는 것뿐만 아니라 이 추정된 확률의 실제 값이 주어진 정확도(확률)로 떨어지는 구간을 구하는 일반적인 접근 방식입니다. 여기서 확률의 개념은 추정치 자체와 추정치의 정확도라는 두 가지 다른 가설에 관여하기 때문에 이해하기가 다소 어렵습니다. 그리고 이들은 상당히 다른 확률입니다)

컨포멀 예측에 대해 자세히 살펴보지는 않았고 제가 틀릴 수도 있습니다.

누군가가 구글에 검색하기 전에 약간 다른 접근 방식에 대해 이야기하고 있습니다 :)
 
Maxim Dmitrievsky #:
임계값이 완벽하게 작동한다는 사실을 어떻게 알게 되었나요?
어떤 분들에게는 환상적이지만 어떤 분들에게는 평범한 일입니다.
OOV 및 OOS와 INE 파일에서 일치 예측 오류 발생
 
СанСаныч Фоменко #:
ALE 및 OOS와 SNE 파일의 매칭 예측 오류
분류기가 정확한 확률을 제공한다는 것을 어떻게 알았나요? 범위의 값뿐만 아니라 기록되는 내용을 읽고 있나요?

임계값을 0.8로 설정하면 거래의 80%가 수익성이 있을까요? 0.51이라면?

거의 확실하게 수익이 나지 않을 것입니다. 확인해 보세요.
 
Maxim Dmitrievsky #:
분류기가 정확한 확률을 제공한다는 사실을 어떻게 알았나요? 범위의 값만이 아닙니다. 여러분에게 쓰여진 내용을 읽고 계신가요?

모델의 확률은 훈련 샘플에 대한 통계에 의해 제공됩니다.

따라서 대표 샘플이 없으면 정확하지 않으니 그냥 넘어가세요 :)

모델이 무엇으로 구성되어 있는지 파악하고 고안한 알고리즘에 따라 잎의 가중치를 재조정하거나...

사유: