기고글 토론 "랜덤 포레스트로 추세 예측하기"

freewalk 2017.10.19 10:24 #121

MetaQuotes Software Corp.:

이 모델은 예측이 매우 쉽지만 실제로는 많은 문제점이 있습니다.

1. 지그재그 신호가 목표로 선택되기 때문에 가장 간단한 변수 중 하나를 예측할 수 있습니다. 예를 들어 지난 20주기 동안의 가격 정렬, 분명히 목표 설계에서 mover_price_20 = 1 일 때 지그재그의 신호가 상승하고 mover_price_20> 1 일 때 지그재그의 신호가 위쪽으로 올라갑니다. 지그재그의 신호가 하향일 확률이 90% 이상이고, 이로부터 많은 변수를 구성할 수 있으므로 모델 예측에 성공하기 쉽지만, 여기서 한 가지 선험적 조건은 이 시점이 지그재그의 시점이라는 것을 알아야 한다는 것입니다. 지그재그 지점이 아닌 다른 시점이라면 위의 변수는 예측 능력에 존재하지 않습니다.

2. 따라서 지그재그의 시작점이 무엇인지 모르기 때문에 적용시 큰 문제가 발생하므로 모든 데이터를 계산해야하므로 이번에는 moverank_price_20 = 1 일 때, 그것이 지그재그의 시작점이라고 생각하지 않으므로 추세 뒤의 포인트가 올라간다는 변화를 예측할 수 없습니다.

3. 따라서 지그재그의 목표 설정 방법은 작동하기 어렵습니다.

새해 선물 - TestCommander 이동 평균에서 이동 평균 작업 섹션의 규칙

Aleksey Vyazmikin 2018.04.10 04:16 #122

Windows 아래에 무엇을 넣어야 하는지 알려주시겠어요? 러시아어로, 가능하다면 여기 뭔가 엉망이기 때문에 https://rattle.togaware.com/rattle-install-mswindows.html.

Aleksey Vyazmikin 2018.05.14 12:28 #123

이 문서에 표가 있습니다.

	0	1	평균 감소 정확도	평균감소지니
MA_eur.5.diff1	42.97	41.85	54.86	321.86
EUR.diff3	37.21	46.38	51.80	177.34
RSI_eur.14	37.70	40.11	50.75	254.61
EUR.diff2	24.66	31.64	38.24	110.83
MA_eur.10.diff1	22.94	25.39	31.48	193.08
CHF.dif3	22.91	23.42	30.15	73.36
MA_chf.5.diff1	21.81	23.24	29.56	135.34

그러나 수치가 그 자체로 무엇을 의미하는지, 다른 수치와의 관계는 이해할 수 있습니다-더 좋습니다-더 좋지만 값 자체, 무엇이어야하며 무엇에 의존해야하는지에 대해서는 아무 말도하지 않습니다. 이 기사에서 평균 감소 지니의 최대 값은 321.86이고 나는 1876을 가지고 있습니다 - 그것은 예측 자의 수에 달려 있습니까, 아니면 무엇에 달려 있습니까? 그리고 평균 감소 정확도는 140.22입니다 - 이것을 어떻게 해석해야 하나요? 모든 값을 가장 큰 값의 백분율로 변환해야 할까요?

Discussion of article "Random Off-topic MT4/mql4 questions. Pure maths, physics, logic

СанСаныч Фоменко 2018.05.14 13:22 #124

Aleksey Vyazmikin:

이 문서에 표가 있습니다.

	0	1	평균 감소 정확도	평균감소지니
MA_eur.5.diff1	42.97	41.85	54.86	321.86
EUR.diff3	37.21	46.38	51.80	177.34
RSI_eur.14	37.70	40.11	50.75	254.61
EUR.diff2	24.66	31.64	38.24	110.83
MA_eur.10.diff1	22.94	25.39	31.48	193.08
CHF.dif3	22.91	23.42	30.15	73.36
MA_chf.5.diff1	21.81	23.24	29.56	135.34

그러나 수치가 그 자체로 무엇을 의미하는지에 대해서는 아무 말도하지 않으며 다른 수치와의 관계는 이해할 수 있습니다. 더 나은 것이 더 좋지만 값 자체는 무엇에 의존해야하며 무엇에 의존해야합니까? 이 기사에서 MeanDecreaseGini의 최대 값은 321.86이고 1876이 있습니다-예측 변수의 수에 따라 달라 집니까, 아니면 무엇에 의존합니까? 그리고 평균 감소 정확도는 140.22입니다 - 이것을 어떻게 해석해야 하나요? 모든 값을 가장 높은 값의 백분율로 변환해야 할까요?

이것은 randoForest라고 하는 여러 개의 나무를 구축하는 동안 예측자를 사용하는 내부 통계입니다. 다른 모델을 비교하는 것은 전혀 의미가 없습니다. 같은 모델 내에서도 비교할 수 없습니다. 예측자를 선택하려면 다른 도구를 사용해야 합니다. 저는 머신 러닝 스레드에 여러 번 글을 썼고 저만 그런 것은 아닙니다.

Aleksey Vyazmikin 2018.05.14 13:26 #125

СанСаныч Фоменко:

이것은 여러 개의 나무를 구축할 때 예측자를 사용하는 내부 통계로, 모두 randoForest라고 합니다. 서로 다른 모델을 비교하는 것은 전혀 의미가 없습니다. 같은 모델 내에서도 비교할 수 없습니다. 예측자를 선택하려면 다른 도구를 사용해야 합니다. 저는 기계 학습 스레드에 여러 번 글을 썼고 저만 그런 것은 아닙니다.

즉, 모델 내의 추정자이지만 절대적인 것은 아닙니다....

물론 포럼에 글을 썼을 수도 있지만 그 양은.... - 나는 독자를 통해 포럼의 절반을 읽었습니다. 올바른 방향으로 저를 가리킬 수 있다면 감사하겠습니다.

СанСаныч Фоменко 2018.05.14 16:23 #126

Aleksey Vyazmikin:

즉, 모델 내에서 추정치이지만 절대적인 것은 아닙니다....

물론, 물론, 포럼에 썼을 수도 있지만 그 양은 대처할 수 있습니다 ... - 나는 독자를 통해 포럼의 절반을 읽었습니다. 코를 찌르면 감사하겠습니다.

1. 모델링과 비슷한 데이터 마이닝이라는 전체 산업이기 때문에 짧은 대답이 없습니다.

2. 데이터 마이닝 분류 모델의 표준 체계는 다음과 같습니다:

목표 변수를 정의합니다.
이 목표 변수에 대한 예측 변수를 찾습니다.
예측자의 예측력을 결정합니다. 즉, 예측자의 일부는 한 클래스를 예측하고 다른 일부는 다른 클래스를 예측해야 하며, 겹치는 부분이 작을수록 더 나은 예측자라는 것을 결정합니다.
우리는 예측자의 중요성을 결정하기 위해 패키지를 가져옵니다. 그 중 많은 것들이 있으며, 저는 파일을 개요와 함께 연결합니다.

3. 가급적 교차 검증을 통해 파일의 전반부에 모델을 맞추세요.

4. 파일의 후반부를 확인합니다. 결과가 일치해야 합니다.

이 모든 작업을 수행하려면 많은 완료 도구가 필요합니다. 가장 좋은 것은 캐럿입니다. 필요한 모든 것이 있습니다. 그러나 충분하지 않습니다.

추신.

이것은 R입니다. 그 밖에는 말 못하는 아기 옹알이보다 더 멀리 갈 수 없습니다.

파일:

h49wu_f1ikga_mk1wp57y1k9.zip 44 kb

트레이딩의 머신러닝: 이론, 모델, 마틴 씨와 그의 친구들 이론부터 실습까지

Aleksey Vyazmikin 2018.05.15 00:57 #127

СанСаныч Фоменко:

1. 모델링에 비유할 수 있는 데이터 마이닝이라는 산업 전체에 대한 것이기 때문에 짧은 대답은 없습니다.

2. 데이터 마이닝 분류 모델의 표준 체계는 다음과 같습니다:

목표 변수를 정의합니다.
이 목표 변수에 대한 예측자를 찾습니다.
예측자의 예측력을 결정합니다. 즉, 예측자의 일부는 한 클래스를 예측하고, 다른 일부는 다른 클래스를 예측해야 하며, 겹치는 부분이 작을수록 예측자가 더 우수합니다.
우리는 예측자의 중요성을 결정하기 위해 패키지를 가져옵니다. 그 중 많은 것들이 있으며 개요가있는 파일을 첨부하고 있습니다.

3. 파일의 전반부에 모델 맞추기, 가급적이면 교차 검증을 통해 맞추기

4. 파일의 후반부를 확인합니다. 결과가 일치해야 합니다.

이 모든 작업을 위해서는 많은 완료 도구가 필요합니다. 최고는 캐럿입니다. 필요한 모든 것이 있습니다. 하지만 충분하지 않습니다.

추신.

그건 R입니다. 그 외에는 말 못하는 아기 옹알이보다 더 멀리 갈 수 없습니다.

고마워요, 계속 찾아볼게요!

Aleksey Vyazmikin 2018.05.15 12:04 #128

RStudio를 설치하고 Boruta 패키지를 다운로드했지만 활성화하는 방법, 작업하는 방법은 무엇입니까?

СанСаныч Фоменко 2018.05.15 13:04 #129

Aleksey Vyazmikin:
RStudio를 설치하고 Boruta 패키지를 다운로드했지만 활성화하는 방법, 작업하는 방법은 무엇입니까?

항상 모든 패키지에 대한 설명서를 읽으십시오. RStudio에서 패키지 탭을 열고 검색에 패키지 이름을 입력한 다음 팝업되는 패키지 이름을 클릭하면 도움말이 열립니다. 또는 패키지 이름별로 관련 자료에 대한 링크가 있을 수 있습니다.

이데올로기에 관심이 있는 경우 패키지에 포함된 기능에서 이론 문서에 대한 링크를 찾을 수 있습니다.

CRAN Packages By Name

cran.r-project.org

The package will formally test two curves represented by discrete data sets to be statistically equal or not when the errors of the two curves were assumed either equal or not using the tube formula to calculate the tail probabilities

Aleksey Vyazmikin 2018.05.15 13:25 #130

СанСаныч Фоменко:

항상 모든 패키지에 대한 설명서를 읽으십시오. RStudio에서 패키지 탭을 열고 검색에 패키지 이름을 입력한 후 표시되는 패키지 이름을 클릭하면 도움말이 열립니다. 또는 패키지 이름에서 여기를 클릭하면 관련 자료에 대한 링크가 있을 수 있습니다.

이데올로기가 흥미로운 경우 패키지에 포함된 기능에 이론 문서 링크가 있을 것입니다.

고마워요!

그래서 설명이 포함 된 PDF를 열었고 여기에 설정이 멍청합니다. 너무 많은 것이 필요해서 절반이 무엇을 의미하는지 모릅니다.

덜 신뢰할 수 있지만 더 간단하고 가급적이면 GUI를 사용하는 것이 더 낫습니까?

일반적으로이 주제에 대한 기사를 어디서 어떻게 만드는지에 대한 자세한 내용과 함께 만드는 것이 매우 유용 할 것입니다!

기고글 토론 "랜덤 포레스트로 추세 예측하기" - 페이지 13