트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1921

 
mytarmailS :

이해하지 못했습니까? 전송 규칙에서 결과 proebrazovaniya를 받고 싶습니까?

물론, 그렇지 않으면 나중에 모델을 어떻게 적용합니까? :)

 
알렉세이 비아즈미킨 :

물론, 그렇지 않으면 나중에 모델을 어떻게 적용합니까? :)

)))))) 모든 알고리즘을 μl 단위의 P로 다시 작성하면 규칙의 모든 변환을 μl) 단위로 얻을 수 있습니다.

 
mytarmailS :

)))))) 모든 알고리즘을 μl 단위의 P로 다시 작성하면 규칙의 모든 변환을 μl) 단위로 얻을 수 있습니다.

이러한 유형의 클러스터링은 클러스터링을 반복하지 않고 결과를 재현할 수 있는 규칙을 생성하지 않는다는 것을 깨달았습니다. 그리고 클러스터링이 너무 느립니다. 따라서 몇 가지 기준에 따라 클러스터링 결과를 해당 클래스로 나누는 트리를 구축하여 규칙을 만들어야 합니다.

질문이 있음을 의미합니다 - 각 클래스에 라인의 액세서리를 csv로 저장하는 방법은 무엇입니까?


이상하지만 이미 존재하는 데이터로 계속 클러스터링하고 클래스 중 하나에서 새 줄 을 정의할 수 없거나 가능한 이유는 무엇입니까?

 
혼란스러워요. 클러스터링 맵을 저장하고 어떻게든 계속 작업할 수 있다는 것을 이해하지만 어떻게 하는지 모르겠습니다. 하지만 R 에 관한 책을 찾았습니다.
Классификация, регрессия и другие алгоритмы Data Mining с использованием R
  • Шитиков В. К., Мастицкий С. Э.
  • ranalytics.github.io
Описана широкая совокупность методов построения статистических моделей классификации и регрессии для откликов, измеренных в альтернативной, категориальной и метрической шкалах. Подробно рассматриваются деревья решений, машины опорных векторов с различными разделяющими поверхностями, нелинейные формы дискриминантного анализа, искусственные...
 
여기 내가 찾은 것이 있습니다

1. kmeans 객체를 처리하는 방법이 즉시 명확하지 않습니다. 가장 간단한 방법은 데이터 프레임에 연결하는 것입니다.
 k = kmeans(data, centers = 7 )
 data = k$cluster
이제 data.frame의 열로 클러스터 번호가 있습니다. 그러나 저장하면 data.frame이 저장됩니다.

2. 의미 도움말(kmeans)을 보면 Centers는 평균의 중심이 어디에 있는지 알려줍니다. 들어오는 데이터의 경우 가장 가까운 중심을 계산합니다. 예시:

data(mtcars)
mt.k <- kmeans(mtcars, centers = 4 )
mt.k$centers

결과를 특정 열로 롤링하는 방법을 이해하지 못합니까?

k означает сохранение результатов кластеризации для последующего использования
k означает сохранение результатов кластеризации для последующего использования
  • 2015.03.13
  • Soumajit 13 мар '15 в 14:55 2015-03-13 14:55
  • stackru.com
Я изучаю r среду программирования для выполнения кластерного анализа моих тестовых данных. Для тестирования я использую набор данных из одного столбца со следующей диаграммой рассеяния и гистограммой, построенной по отношению к индексу значений. Из данных я чувствую, что значения могут быть разделены на 7 кластеров. И когда я использую Функция...
 

이 그림은 이전과 동일한 예측 변수이지만 샘플 크기가 다르며 가장 중요한 것은 새로운 예측 변수가 추가되었다는 점입니다.

그리고 여기 그것을 해석하는 방법이 있습니다 - 재훈련 경향?

 

클러스터링을 사용하여 모든 곡선에 적합합니다. 연락하다

도대체 왜 그런 조잡한 알고리즘이 거의 즉시 새로운 데이터에 쏟아지기 시작하는 걸까요?

나는 다시 배우는 나무를 비난한다. 부스트를 사용하고 싶지만 mql로 빠르게 전송할 수 없습니다.

 

Phah .. 여기에 답이 있습니다

한 기간 동안 모델을 훈련한 다음 데이터의 akuras를 차례로 살펴보면(다시 클러스터링됨) 트리의 경우 다음과 같습니다.

TRAIN DATA:   1.0    0.8541666666666666
NEW DATA:   0.1 8323586744639375 Fuuuuuuu

train은 훈련 데이터 세트 + 유효성 검사입니다.

새 날짜는 일반적으로 새 클러스터의 새 데이터입니다. 트리가 유효성 검사에서는 잘 작동했지만 새 작업에서는 실패했습니다.


동일한 데이터에 대한 catboost를 살펴봅니다.

TRAIN DATA:  0.9304589707927677   0.8916666666666667
NEW DATA:   0.8528265107212476

뭐야? 그런 차이?

모든 것을 단계별로 확인할 때까지 농담이 무엇인지 즉시 이해하지 못할 것입니다.

맞아, 나는 나무를 탓했다. 나는 그것이 그렇게 간단한 일을 할 수 있다고 생각했지만, 그렇지 않았다.

파심 컷버스트...

 
막심 드미트리예프스키 :

Phah .. 여기에 답이 있습니다

한 기간 동안 모델을 훈련한 다음 데이터의 akuras를 차례로(다시 클러스터링) 살펴보면 트리의 경우 다음과 같습니다.

train은 훈련 데이터 세트 + 유효성 검사입니다.

새 날짜는 일반적으로 새 클러스터의 새 데이터입니다. 트리가 유효성 검사에서는 잘 작동했지만 새 작업에서는 실패했습니다.


동일한 데이터에 대한 catboost를 살펴봅니다.

뭐야? 그런 차이? 파심 컷버스트...

모든 것을 단계별로 확인할 때까지 재미있는 것을 즉시 멈추지 않을 것입니다.

맞아, 난 나무를 탓했어
자, 이제 슬라이드 사진을 보겠습니다. 그건 그렇고, 산에서는 어때요? 어디였지?
 
일누르 카사노프 :
자, 이제 슬라이드 사진을 보겠습니다. 그건 그렇고, 산에서는 어때요? 어디였지?

알타이 ..하지만 나는 마지막으로 가지 않았습니다. 순간, 과잉)

그건 그렇고, 당신은 플러스에 있습니까?

사유: