트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 2757

 
Aleksey Nikolayev #:

첫 번째 오버로드 아이디어는 이름은 같지만 인수가 다른 다른 함수를 작성하는 것입니다. Rcpp에서 이 작업을 수행해 본 적이 없어서 작동할지 모르겠습니다. 아마도 C 코드를 별도의 파일에 만들고 cppFunction() 대신 sourceCpp()를 사용해야 할 것입니다.

고마워요

 
Maxim Dmitrievsky #:
정답입니다. 선험적 가정이 없기 때문에 두 번째 유형이 사용됩니다.
알렉세이 니콜라예프 #:

제 생각에는 두 가지 유형의 연결이 있습니다.

첫 번째는 인과 관계로, 일부 계산이 아닌 주어진 주제 영역의 지식에서 연구 대상에 대한 선험적 정보에 의해 결정됩니다.

두 번째 유형은 확률적 의존성으로, 대상의 행동을 관찰하여 얻은 일부 데이터로부터 사후적으로 계산할 수 있습니다. 두 번째 유형에는 상관관계, 결정론적 의존성(극단적인 경우) 등이 포함되며, 코퓰라 및 기타 방법으로 설명할 수 있습니다. 이 유형을 연구하는 기초는 예측자와 대상에 대한 공동 분포가 있다는 가정입니다.

실험이 부족한 경우 두 번째 유형이 사용됩니다(예 미국 식품의약협회 - 결론을 위해 일반 대표 표본을 테스트하지 않으므로 베이지안 접근 방식에 의존함)... 선험적 정보가 없으면 모델링할 것이 전혀 없습니다.

 
JeeyCi #:

실험이 부족한 경우 두 번째 유형이 사용됩니다(예 미국 식품의약국 - 결론을 위해 일반 대표 표본을 테스트하지 않으므로 베이지안 접근 방식에 의존)... 선험적 정보가 없으면 모델링 할 것이 전혀 없습니다.

라이브러리 자체를 보셨나요? 거기에 놀만한 것이 있나요? 끝나면 살펴볼게요.

그런 리브가 많아서 수요가 많습니다.
 

누메라이 대회에 참가해 본 적이 있나요? 돈을 벌려면 어떻게 해야 하나요?

자신의 돈을 투자해야 하나요? 수익금 지급 모델이 뭔지 모르겠어요.

 
Evgeni Gavrilovi #:

누메라이 대회에 참가해 본 적이 있나요? 거기서 돈을 벌려면 어떻게 해야 하나요?

자신의 돈을 투자해야 하나요? 수익금 지급 모델이 무엇인지 모르겠어요.

이 글이 도움이 될지도 모르겠네요.
 

도서관을 보지 않았어요, 기사가 역겨워요 - 통계의 상식과 모순됩니다 ....

표준 영어 출처 - 시계열 분석의 의미는 치료 / 개입 순간의 정책 변화와 총 추세의 기울기 변화 분석으로 축소됩니다 (이는 행위자-정책의 영향을 경험하고 치료 순간에 의사 결정 과정을 수정하는 것으로 해석 할 수 있습니다- 할인, 판매 등 프로모션의 효과를 평가하기 위해 가격이 고객에게 적합하지 않은지 또는 원칙적으로 제품 또는 쇼핑 센터의 위치 등을 파악하기 위해 마케터의 연구가 목표로하는 것임) ....д.)...

그러나 모델링에서 항상 동일한 문제-사후 처리를 평가하려면 물론 "도움이되지 않음-무관심"(개입 측면에서) 결론을 근사화하기 위해 샘플 (!)이 필요합니다...

그리고 역설적인 측면에서 - 정책 변화 (또는 일부 개입)로 인한 변화의 역학을 평가하기 위해 올바른 질문을하는 것이 중요합니다 - 측정 항목, 목표 및 매개 변수 (조정을위한)를 선택하기 위해 - 다른 질문은 다른 결과 (및 다른 기울기 변화)를 제공 할 수 있으므로 다른 결론을 내릴 수 있기 때문입니다.

ML 실제 데이터의 불균형 문제(추정치에 편향을 주는)가 혼란스럽습니다. 오버샘플링/언더샘플링으로 이 문제를 해결한 사람이 있나요? -- 그런 식으로 실제 데이터를 왜곡하는 것이 무슨 의미가 있는지 모르겠습니다....

하지만 전처리 단계에서 대표 표본을 얻을 필요가 있고 (선험적 확률 분포), 사후 처리 (예 : 정책 변경)에서 사후 분포를 얻습니다.... 여기서 중지 규칙을 결정하는 것이 중요합니다. 즉, 결과를 개선하기 위해 표본을 늘릴 것인지 아니면 선택한 표본 제한으로 결론을 도출 할 것인지, 이는 아마도 표본을 늘리는 것보다 통계적으로 덜 유의미 할 것입니다..... 하지만 표본을 늘리면 평균이나 분산의 통계적 유의성이 높아지는지는 확실하지 않습니다.

= 이것은 크기 문제입니다... 일반적으로 개입의 효과가 크면 작은 샘플에서 볼 수 있습니다....

요인 (FS) 문제도 남아 있습니다. 고려되는 요인의 수를 늘림으로써 추정치의 편향을 줄이지 만 분산을 증가시킵니다 ... 작업 : 낮은 분산으로 편향되지 않은 추정치를 얻기 위해 중요한 요인 ( 탐색 적 데이터 분석에서 평소와 같이-어리석은 프로그래머의 무작위 근사치가 아닌Data_Science라고하는 이유)을 찾는 것입니다 (이 두 목표의 균형은 개발자의 재량에 따라 결정됨).

블라디미르는 이미 확률 높은 거래를 선택하기 위해 확률을 모델링하는 경우 요인 선택 문제에 대해 많이 언급했습니다.

추신

속도와 가속도 (있는 경우)는 시계열 분석에서 항상 중요하며, 처리 전 및 처리 후 기간에 대한 비교는 (방향 변경을 포함한) 결론을 제공합니다.

올바르게 선택된 목표의 발산 / 수렴 및 극한도 유효합니다... 모든 것이 평소와 같습니다 - 신경망의 설계 / 아키텍처에 관한 것입니다... 그리고 추세와 개발 확률 만 예측됩니다. 그리고 데이 트레이더 시장에서는 모든 것이 장기 추세보다 빠르게 변화합니다 (D1로 분석하는 경우) - 따라서 시간 요소도 데이 트레이딩을위한 로봇 모델에 입력해야합니다.... 일반적으로 거래 스타일을 공식화하여 항상 모니터 앞에 앉아있을 필요가 없습니다. 그리고 원한다면 진입 및 퇴장 또는 시장 이탈에 대한 통계적 이유를 찾으십시오 (시장이 명확하지 않은 경우 위험 관리의 이유라도).

추신

이 주제는 외생적 (외부로부터의 영향) 및 내생적 (예 : 상품 또는 금융 통화, 심지어 집권당의 변화) 요인에 대한 고려를 포함하여 구조적 인과 모델 (앞서 언급했듯이 무엇에 따라 달라짐) 연구 측면에서 끝없이 발전 할 수 있습니다.... 일반적으로 평소와 같이 모든 가설에 대한 데이터를 검사하고 특정 유의 수준에 대한 귀무가설의 수용 또는 거부 여부를 살펴볼 수 있습니다 ([유의 수준] 가능한 개선을 위해 표본 크기를 늘림).

p.p.p.s

어떤 사람들은 확률 적 분포라는 단어를 좋아하지 않지만 그 본질은 변하지 않습니다-분포는 조건부이더라도 여전히 확률 적입니다 (조건이 분류의 이유를 제공 함) ... 그리고 치료 전과 치료 후 (A/B 테스트에서)는 조건 (정책)의 변화로 간주 될 수 있지만 기울기가 동일하더라도 회귀를 추정하거나 분산 (변경 여부)을 비교할 수 있습니다.

Глубокие нейросети (Часть III). Выбор примеров и уменьшение размерности
Глубокие нейросети (Часть III). Выбор примеров и уменьшение размерности
  • www.mql5.com
Эта статья продолжает серию публикаций о глубоких нейросетях. Рассматривается выбор примеров (удаление шумовых), уменьшение размерности входных данных и разделение набора на train/val/test в процессе подготовки данных для обучения.
 
이 모든 것이 트레이딩과는 거리가 멀다는 인상을 받았습니다.
 
그래서 알고리즘을 먼저 결정하고 (불균형을 포함해서 - 뭘 하려고 했는지 모르겠지만 ???)... 필요한 엔티티 / 클래스로 코드를 충전 할 수있는 라이브러리를 찾아야한다고 말하는 것입니다... - 앞서 오버샘플링을 조언했을 때)... 그리고 필요한 엔티티/클래스를 코드에 추가할 수 있는 라이브러리를 찾거나... 필요한 클래스로 자체 라이브러리를 코딩하거나... 또는 필요한 클래스로 자체 라이브러리를 코딩하세요.
 
JeeyCi #:
그래서 알고리즘을 먼저 결정하고 (불균형을 포함해서 - 뭘 하려고 했는지 모르겠지만 ???)... 필요한 엔티티 / 클래스로 코드를 충전 할 수있는 라이브러리를 찾아야한다고 말하는 것입니다... - 앞서 오버샘플링을 조언했을 때)... 그리고 필요한 엔티티/클래스를 코드에 추가할 수 있는 라이브러리를 찾거나... 필요한 클래스로 자체 라이브러리를 코딩하거나... 또는 필요한 클래스로 자체 라이브러리를 코딩하세요.
이상값을 제거하고 샘플을 가우시안화하기 위해 리샘플링을 수행합니다.

저는 일반적으로 엔트로피 또는 상관관계에 의한 의미 있는 샘플링을 제안했습니다. 칩에 더 많은 정보를 제공하기 위해서입니다. 또한 증분을 취하고 모든 종류의 변환을 통해 원래 시리즈에서 최대한의 정보를 추가합니다. 또한 고정되지 않은 끊김 현상 창도 있습니다. 새로운 접근 방식이며 아무도 해본 적이 없습니다. 하지만 코로나 바이러스에 걸려서 쉬고 있습니다 ☺️

캐주얼 지옥은 유익한 소설을 옵션으로 선택하는 데 도움이되어야했지만 거기에 관한 것이 아닌 것으로 밝혀졌습니다.
 
JeeyCi #:
그래서 알고리즘을 먼저 결정하고 (불균형을 포함해서 - 뭘 하려고 했는지 모르겠지만 ???)... 필요한 엔티티 / 클래스로 코드를 충전 할 수있는 라이브러리를 찾아야한다고 말하는 것입니다... - 앞서 오버샘플링을 조언했을 때)... 그리고 필요한 엔티티/클래스를 코드에 추가할 수 있는 라이브러리를 찾거나... 필요한 클래스로 자체 라이브러리를 코딩하거나... 또는 필요한 클래스로 자신만의 라이브러리를 코딩하세요.

필요한 모든 것이 이미 코딩되어 있습니다.

R의 캐럿 셸에는 최대 200개(!)의 모델(라이브러리)과 데이터 마이닝 및 모델 선택에 필요한 모든 파이프라이닝이 포함되어 있습니다.

문제는 예측자의 선택과 그 선택에 있으며, 오랫동안 모델에 문제가 없습니다.

사유: