트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2729

 
Aleksey Nikolayev #:

의미는 기준이 아니라 기준이 사용되는 방식에 있습니다. 무엇을 무엇과 어떤 목적으로 비교하는지 등 사용 방식이 전혀 명확하지 않습니다.)

영리한 분이시니 그런 방향으로 생각하지 않으시는군요. 귀찮게 하지 않겠습니다.

 
Aleksey Vyazmikin #:

좋아요, 영리하게 생각한다면 그런 방향으로 생각하고 싶지 않을 것입니다. 신경 쓰지 않겠습니다.

알렉세이, 정말로 이해받고 싶다면 생각을 공식화하는 법을 배워요...

 
mytarmailS #:

알렉세이, 이해받고 싶다면 생각을 정리하는 법을 배워야 해요.

제 생각은 어디로 사라졌나요?

내 생각은 공식화되어 있습니다-나는 내가 말하는 것을 이해하고 누군가가 이해하지 못하면 물어보십시오. 어쩌면 당신은 용어에 집착하지 않고 본질을 더 잘 이해하는 법을 배워야 할 수도 있습니다....

 
Aleksey Vyazmikin #:

좋아요, 영리하게 생각한다면 그런 방향으로 생각하고 싶지 않을 것입니다. 신경 쓰지 않겠습니다.

아이디어를 공식화할 수 없거나 공유하고 싶지 않은 것입니다. 두 경우 모두 더 이상 주제를 발전시킬 필요가 없으므로 사적인 이야기는 하지 않겠습니다.

 
Aleksey Vyazmikin #:

기준이 합리적이지 않다고 생각하시나요? 크기가 다른 10개의 샘플을 채취하여 비교하고, 샘플의 유사성/동일성/동질성을 나타내는 여러 지표에서 가장 높은 점수를 받은 샘플을 선택하세요.

샘플을 가져와서 섞으면 점수가 달라지고... 슬퍼집니다.

* 서로 섞습니다. 아무도 이를 금지하지 않기 때문에, 순차적으로 학습되는 모델이 아니기 때문에 샘플의 순서는 중요하지 않습니다. 분류 오류만 중요하며, 이는 항상 혼합을 통해 줄일 수 있습니다.

무언가를 검색하려면 찾고 있는 것이 무엇인지 매우 정확하게 이해해야 합니다. 그렇지 않으면 멍청해질 때까지 샘플을 가지고 놀게 될 것입니다. 무엇을 검색하고 있는지 아는 사람은 아무도 없으니 누구라도 알아내면 알려주세요.
 
또 다른 트릭이 있습니다. 특징의 정보가 많지 않을수록 훈련 샘플은 더 작아야 합니다.

속성의 정보가 많고 그 수가 적을수록 샘플을 더 크게 가져올 수 있고 가져와야 합니다. 그리고 거의 모든 사람들이 그 반대의 생각을 합니다.
 
Aleksey Nikolayev #:

아이디어를 구체화할 수 없거나 공유하고 싶지 않은 경우입니다. 두 경우 모두 주제를 더 발전시킬 필요가 없으므로 사적인 이야기는 하지 말자.

아이디어는 샘플 (훈련 및 적용)을 비교하는 것이며, 이론이 정확하다면 샘플이 증가함에 따라 샘플이 더 이상 유사하지 않으며이를 이해하려면 유사성을 평가하는 방법에서 파생 된 변화를 평가하기위한 기준이 필요하다고 썼지 않았나요?

또한 전체 샘플을 몇 가지 비교 가능한 경향 특징에 따라 섹션으로 표시하고 이러한 그룹 내에서 순위를 매기는 것에 대해 이야기했습니다. 그리고 이러한 순위는 다시 샘플의 '유사성'이라는 기준에 의해 이루어질 수 있습니다.

저는 개인적인 감정을 드러내는 것이 아니라 답변의 스타일을 보고 사람들이 여기서 무엇을 하고 있는지, 즉 자신의 독창성을 보여주고 싶어 하는 것인지 의아할 뿐입니다. 저는 문제를 해결하는 방법을 찾는 데 관심이 있고, 다른 사람의 지식을 활용하고 제 지식을 공유하는 데 관심이 있습니다.

 
Maxim Dmitrievsky #:
샘플을 채취하고 혼합하여 다른 견적을 받아보세요... 슬픈

* 서로 섞어서 사용합니다. 아무도 이를 금지하지 않기 때문에 순차적으로 훈련되는 모델이 아니기 때문에 샘플의 순서는 중요하지 않습니다. 분류 오차만 중요하며, 이는 항상 혼합을 통해 줄일 수 있습니다.

무언가를 검색하려면 찾고 있는 것이 무엇인지 매우 정확하게 이해해야 합니다. 그렇지 않으면 멍청해질 때까지 샘플을 가지고 놀게 될 것입니다. 무엇을 검색하고 있는지 아는 사람은 아무도 없으니 누구라도 알아내면 알려주세요.

샘플 내에서만 혼합 할 수 있으며 두 개의 샘플을 혼합하면 시장이 변화하고 있음을 부인하는 것을 의미합니다.

 
Maxim Dmitrievsky #:
샘플을 채취하고 혼합하여 다른 견적을 받아보세요... 슬픈

* 서로 섞어서 사용합니다. 아무도 이를 금지하지 않기 때문에 순차적으로 훈련되는 모델이 아니기 때문에 샘플의 순서는 중요하지 않습니다. 분류 오차만 중요하며, 이는 항상 혼합을 통해 줄일 수 있습니다.

무언가를 검색하려면 찾고 있는 것이 무엇인지 매우 정확하게 이해해야 합니다. 그렇지 않으면 멍청해질 때까지 샘플을 가지고 놀게 될 것입니다. 무엇을 검색하고 있는지 아무도 모르니 누군가 알아내면 알려주세요.

특정 모델의 맥락에서 훈련 샘플이 변경되었을 때 그 동작을 연구하는 추론에서 당신과 Alexey의 공통점이 마음에 들지 않습니다. 이상적으로는 훈련 샘플을 선택할 때 특정 모델과 무관하게 하고 싶기 때문에 지금은 지그재그 정점을 사용하기로 결정했습니다. 하지만 두 분의 의견이 모두 맞을 수 있으며 TC 유형으로부터 완전히 독립하는 것은 거의 불가능합니다.

 
Aleksey Vyazmikin #:

샘플 비교(훈련과 적용)의 아이디어는 이론이 맞다면 샘플이 증가함에 따라 더 이상 유사하지 않게 될 것이며, 이를 실현하기 위해서는 유사성을 평가하는 방법에서 파생되는 변화를 평가하는 기준이 필요하다고 쓰지 않았나요?

여기서는 다변량 샘플(각 요소는 표의 행, 벡터)에 대해 이야기하고 있는 것 같지만 세 링크의 동질성 기준은 숫자 샘플에 관한 것입니다. matstat의 다변량 동질성 기준은 별도의 노래이며 저에게는 명확하지 않습니다.

알렉세이 비야즈미킨 #:

게다가 저는 전체 샘플을 비교 가능한 경향 특징에 따라 섹션으로 나누 고 이러한 그룹 내에서 순위를 매기는 것에 대해 이야기하고있었습니다. 그리고 이러한 순위는 다시 샘플의 "유사성"기준에 따라 수행 할 수 있습니다.

이는 많은 변경점 탐지를 검색하는 작업과 유사합니다. 다시 한 번 다차원 (벡터) 케이스로 작업해야한다는 것이 밝혀 졌으므로 문제가 많이 복잡해집니다.

글쎄요, 일반적으로 저는 연구를 위해 어떤 속성을 선택하는지에 대한 의존성을 좋아하지 않습니다. 다른 세트를 사용하면 결과가 달라질 수 있습니다.

사유: