트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 3359

 
СанСаныч Фоменко #:

영국과 무슨 관련이 있을까요?

당신은 자격을 갖춘 사람처럼 보이지만 항상 자신을 쓰레기통으로 끌고 가고 있습니다.

실질적인 이의를 제기하는 경우는 거의 없지...

웨비나에서 들었어요 또 뭐가 실체적인가요?
또한 모든 메소드 이름은 거기에 있으며 구글에서 찾을 수 있습니다. 그는 자신이 가장 좋아하는 두 가지에 대해 이야기했습니다.
그는 많은 코스를 밟았고 아르바이트를 위해 영국에갔습니다. 구글인지 마약인지 기억이 안 나요. 저에게 쓰레기는 현지 대화 상대입니다 :)

저 자신과는 거리가 멀지만 IT 분야에서 좋은 위치에 있는 친구들이 있습니다. 그들 중 한 명은 전체 은행 인프라를 키 웠습니다. 때때로 그들은 말도 안되는 일로 나를 포위하고 때로는 내 지식에 놀랐습니다. 따라서 국방부에 대한 관심. 그래서 모든 것이 깨끗하고 깔끔합니다.

저는 이 분야와 아무 관련이 없습니다. 그냥 재미로요. 저는 수학 배경 지식이 전혀 없고 오로지 직관에 의존합니다. 고등학교 수학 프로그램도 통과하지 못했어요. 프로그래밍 패턴도 전혀 모르죠.

하드코어 모쉬닉을 데려오면 다 날려버릴 거예요. 그러니 저를 이해하지 못한다면 그는 당신에게 신이 될 것입니다. 하지만 그는 확실히이 동물원에 오지 않을 것입니다 :) 그리고 그는 높은 종탑에서 당신의 R에 대해 신경 쓰지 않습니다.

그리고 그가 가장 먼저 시작할 것은 당신이이 외환에 앉아 있기 때문에 당신이 모두 여기 절름발이라는 것입니다.)
 

서포트 벡터 방법 및 의사 결정 트리와 같은 분류기에는 내부 특징을 기반으로 클래스 확률 추정치를 제공할 수 있기 때문에predict_proba함수가 있습니다 . 그러나 이러한 확률 추정치는 완전히 정확하지 않거나 분류기의 실제 신뢰도를 반영하지 않을 수 있습니다.


예를 들어, 서포트 벡터 방식의 경우 predict_proba함수는 분리 쌍곡면까지의 거리를 기반으로 확률 추정치를 반환할 수 있지만, 이 값은 방식 자체의 특징으로 인해 왜곡될 수 있습니다.


의사 결정 트리의 경우 ,predict_proba 함수는 리프 노드에 있는 각 클래스의 개체 수를 기반으로 클래스 확률을 계산할 수 있지만 트리의 구조로 인해 이러한 확률이 완전히 정확하지 않을 수 있습니다.


따라서이러한 분류기에는 predict_proba함수가 있지만 , 이 함수가 제공하는 확률은 나이브 베이지안 분류기나 로지스틱 회귀와 같은 확률 모델을 기반으로 하는 방법에 비해 신뢰도가 떨어질 수 있습니다.

 

<운영자에 의해 삭제됨>에 대한 작은 실험을 소개합니다.

어떤 모델을 훈련 시켰는지는 중요하지 않으며 보정 없이는 임계 값이 증가해도 속성이 향상되지 않습니다. 거래가 줄어들고 이익 선물이 증가하지 않습니다.

사용 가능한 방식으로 보정하고 다른 임계값으로 실행했습니다. 보정은 2015년 이후에 이루어졌고, 그 이전은 모두 OOS입니다.

이 방법은 사용자 정의이며 제가 직접 생각해 냈습니다. 그런 다음 MT5로 내보내는 데 약간의 장애가 있기 때문에 잘 알려진 것과 비교 한 다음 결정할 것입니다.

임계값 0.5

0.6

0.7

처음에는 약한 모델도 보정하면 어느 정도 결과를 얻을 수 있다는 간단한 예입니다.

CHTD

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - Хорошие свойства у имеющегося классификатора должны соответствовать изучаемым данным.
Машинное обучение в трейдинге: теория, модели, практика и алготорговля - Хорошие свойства у имеющегося классификатора должны соответствовать изучаемым данным.
  • 2023.12.25
  • www.mql5.com
это просто способ привести аутпуты в вероятностый вид. потому что использование сырых вероятностей модели вообще бесполезно. переход к чисто вероятностной постановке задач в трейдинге давно созрел и даже слегка перезрел
 
다른 데이터로 학습된 모델을 라벨에 맞게 보정하는 요령도 있습니다. 설명하지 않겠지만 미묘한 상황에서는 좋은 효과가 있습니다.
 
mytarmailS #:
보정이란 무엇인가요?
h ttps://stats.st ackexchange.com/questions/552146/probability-calibration-of-statistical-models
캘리브레이션 방법
https://www.tidy models.org/learn/models/calibration/

h ttps://mlr.mlr- org.com/articles/tutorial/classifier_calibration.html

기사를 읽고 링크의 기사를 읽으십시오.

이상한 인상.

기사에 따르면 보정 지점은 어떤 식 으로든 평활화되고 있으며 평활화 된 확률과 평활화되지 않은 확률에 임계 값을 설정하는 것보다 더 나은 것은 무엇입니까? 나에게 추정치가 있지만 추정치는 분류 오류입니다.

 
'확률'을 생성하는 회귀뿐만 아니라 모든 회귀에 대해 보정하는 것이 가능한 것으로 보입니다. 이게 말이 되는지 궁금합니다.
 
Aleksey Nikolayev #:
말이 되는지 궁금합니다.
이것이 가장 중요한 질문입니다.
 

신규 비즈니스 - 예측 판매


 
Maxim Dmitrievsky #:

간단한 예로 초기에 약한 모델도 보정하면 어느 정도 결과를 얻을 수 있습니다.

보정은 특정 데이터에 맞게 조정된 모델의 성능을 해석하는 메커니즘입니다.

그 자체로는 모델의 출력 값을 변경하지 않습니다. 정량화 후 클래스 비율의 급등으로 인해 범위가 재배열되는 변형은 모델에서 본 적이 없는데, 모든 것이 항상 원활하게 흐릅니다. 아마도 100개의 세그먼트로 나누면 이런 일이 발생할 것입니다....

sim에 따르면 일반적으로 보정은 일반적으로 0,5 점의 이동으로 이어지며 더 자주 더 큰 쪽에서 이동합니다. 따라서 보정없이 이러한 지점을 찾을 수 있습니다. 특히 모든 포지션에 대해 동일한 이익 실현 및 손절매가있는 경우 실패한 이유는 매우 불분명합니다. 동일하지 않은 경우 완전히 다른 접근 방식이 필요합니다 - 기대 매트릭스에 의한 보정 :)

 
Aleksey Vyazmikin #:

보정은 특정 데이터에 맞게 조정된 모델 성능을 해석하는 메커니즘입니다.

그 자체로는 모델의 출력 값을 변경하지 않습니다. 정량화 후 클래스 비율의 급증으로 인해 범위의 재배열이 발생하는 변형은 모델에서 보지 못했지만 모든 것이 항상 원활하게 흐릅니다. 아마도 100 개의 세그먼트로 나누면 이런 일이 발생할 것입니다....

sim에 따르면 일반적으로 보정은 일반적으로 더 큰 쪽에서 더 자주 0,5 점의 이동으로 이어집니다. 따라서 보정을하지 않으면 이러한 지점을 찾을 수 있습니다. 특히 모든 포지션에 대해 동일한 이익 실현 및 손절매가있는 경우 실패한 이유는 매우 불분명합니다. 동일하지 않은 경우 완전히 다른 접근 방식이 필요합니다 - 기대 매트릭스에 의한 보정 :)

저는 누구도 동요시키지 않습니다. 많은 접근 방식이 있으며 질문은 MO에 대한 지식에 관한 것이 었습니다.

모든 문제에 대한 마법의 치료법은 항상 있습니다. 움직이는 모든 것을 최적화하는 것입니다.
사유: