트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1264

 

마이클 마르쿠카이테스 :

막심은 숲에 갇혔지만 여전히 탈출구를 찾지 못하셨나요? 사무....

고백하건대 여기 안온지 오래됐는데 모든게 장사,걱정.... 그리고 바로 오기로 했어요. 말하자면 그렇게 기록될 것입니다 :-) 그건 그렇고 ....

거룩한 곳은 결코 비어 있지 않습니다. Maksimka Ukurok이 있었고 Maksimka Poludurok가있었습니다)))


 
마법사_ :

거룩한 곳은 결코 비어 있지 않습니다. Maksimka Ukurok이 있었고 Maksimka Poludurok가있었습니다)))


글쎄, 당신은 인생의 사슴 일뿐이며 상태를 바꾸지 않습니다.

여자 비서
 
막심 드미트리예프스키 :

글쎄, 당신은 인생의 사슴 일뿐이며 상태를 바꾸지 않습니다.

여자 비서

OO, 선생님))) "모델"도 마찬가지입니다. 사슴은 어디에 있고 소녀는 어디에 있습니까? 0은 어디에 있습니까?
1 ...이 어떤 식으로든 정의되지 않은 경우 모든 것이 하나의 힙에 있습니다.))) 나는 죽어가고 있습니다 ...

 
마법사_ :

OO 선생님))) 모델도 마찬가지입니다. 사슴은 어디에 있고 소녀는 어디에 있습니까? 0은 어디에 있습니까?
1 ...이 어떤 식으로든 정의되지 않은 경우 모든 것이 하나의 힙에 있습니다.))) 나는 죽어가고 있습니다 ...

답변을 어떻게 할까 한참 고민하다가 10분 넘게.. 특별히 준비한 또 다른 준비, 준비한 스크린샷, 고민

나는 멋진 모습을 위해 똥 더미에서 부활해야한다는 것을 이해합니다. 그러면 기분이 좋습니다))

잘, 잘 돌아와))))

 
막심 드미트리예프스키 :

학습률이 좋고, 사용 중 응답과 구조의 로딩 시간이 좋지 않기 때문에 포리스트 파일이 큽니다. 300mb까지 올라왔습니다.

직렬화에 문제가 있습니다. 포리스트는 나중에 파일에서 다시 로드되는 것보다 빠르게 훈련되고 저장됩니다.

포리스트가 이제 더 작은 파일을 생성한다고 말하면 이는 매우 큰 가속입니다.

반대로 NS는 학습 시간이 더 오래 걸리지만 반응은 즉각적입니다. 분류의 품질에는 차이가 없습니다. 무엇이든 사용할 수 있지만 기본적으로 작동하는 숲과 국회가 구성되어야 합니다.


업데이트 설명에서 숲에 대해 쓰여진 모든 것:
개선된 랜덤 포레스트 구성 알고리즘은 이전 버전보다 2배에서 10배 더 빠르고 훨씬 더 작은 포리스트를 생성합니다.

이전 버전 에서 데이터 구조 는 다음과 같습니다.

//--- 노드 정보:

//--- W[K+0] - 변수 번호(리프 모드의 경우 -1)
//--- W[K+1] - 임계값(리프 노드의 클래스/값)
//--- W[K+2] - ">=" 분기 인덱스(리프 노드 없음)

새 변수에는 노드에 대해 동일한 3개의 변수가 저장되고 리프에 대해 2개의 변수가 저장됩니다.
그리고 트리는 0번째 오류가 있는 마지막 예제까지 정확히 같은 방식으로 빌드됩니다. 나는 가지 치기를 보지 못했다.
가속에 대한 코드에 대한 주석에서 내가 본 유일한 것은
SplitStrength - 분할 유형:
* 0 = 무작위 위치에서 분할, 가장 빠른 위치
* 1 = 범위의 중간에서 분할(중간에서 분할)
* 2 = 범위의 가장 좋은 지점에서 강한 분할(기본값)(사분위수로 분할)

분명히 무작위 분할을 사용하면 2-10배 가속도가 얻어지고 분할에 가장 적합한 지점이 발견되어 결과적으로 더 컴팩트한 트리를 얻을 수 있습니다.

임의의 점을 선택하여 f번째 파티션에 간단히 추가할 수 있습니다. 2-3줄로 편집))))

 
도서관 :

저는 영어를 잘 모릅니다.
숲에 대해 쓰여진 모든 것 :
개선된 랜덤 포레스트 구성 알고리즘은 이전 버전보다 2배에서 10배 더 빠르고 훨씬 더 작은 포리스트를 생성합니다.

이전 버전 에서 데이터 구조 는 다음과 같습니다.

//--- 노드 정보:

//--- W[K+0] - 변수 번호(리프 모드의 경우 -1)
//--- W[K+1] - 임계값(리프 노드의 클래스/값)
//--- W[K+2] - ">=" 분기 인덱스(리프 노드 없음)

새 변수에는 노드에 대해 동일한 3개의 변수가 저장되고 리프에 대해 2개의 변수가 저장됩니다.
그리고 트리는 0번째 오류가 있는 마지막 예제까지 정확히 같은 방식으로 빌드됩니다. 나는 가지 치기를 보지 못했다.
가속에 대한 코드에 대한 주석에서 내가 본 유일한 것은
SplitStrength - 분할 유형:
* 0 = 무작위 위치에서 분할, 가장 빠른 위치
* 1 = 범위의 중간에서 분할(중간에서 분할)
* 2 = 범위의 가장 좋은 지점에서 강한 분할(기본값)(사분위수로 분할)

분명히 무작위 분할을 사용하면 2-10배 가속도가 얻어지고 분할에 가장 적합한 지점이 발견되어 결과적으로 더 컴팩트한 트리를 얻을 수 있습니다.

저것들. 이제 분할 방법을 구성할 수 있습니까? 그러나 기본값은 여전히 가장 느립니다.

오 글쎄, 당신은 그것을 스스로 다시 할 수 있습니다, 예 :)

 
막심 드미트리예프스키 :

저것들. 이제 분할 방법을 구성할 수 있습니까? 그러나 기본값은 여전히 가장 느립니다.

오, 그럼 스스로 다시 할 수 있습니다. 예 :)

터미널을 업데이트 할 때 모든 편집 내용을 덮어쓰게 될까봐 두렵습니다. 포리스트 클래스의 사본을 만들어 별도의 파일로 보관해야 합니다.
 
도서관 :
터미널을 업데이트 할 때 모든 편집 내용을 덮어쓰게 될까봐 두렵습니다. 포리스트 클래스의 사본을 만들어 별도의 파일로 보관해야 합니다.

예, 또는 아카이버 저장

그럼 실험을 해 봅시다. 선택해주셔서 감사합니다. 유용합니다.

아마도 같은 방식으로 베이지안 트리가 거기에서 망가질 수 있습니다.
 
도서관 :

그래서 나는 여기서 당신이 무언가를 바꾸려고 할 수 있다는 것을 깨달았습니다.

 //+------------------------------------------------------------------+
//| Makes split on attribute                                         |
//+------------------------------------------------------------------+
static void CDForest::DFSplitC( double &x[], int &c[], int &cntbuf[], const int n,
                               const int nc, const int flags, int &info,
                               double &threshold, double &e, double &sortrbuf[],
                               int &sortibuf[])
 
막심 드미트리예프스키 :

그래서 나는 여기서 당신이 무언가를 바꾸려고 할 수 있다는 것을 깨달았습니다.

네. 회귀 포리스트도 유사한 기능을 갖도록 DFSplitR에서 복제합니다.

사유: