저는 "트렌드 예측"이라는 책을 썼는데, 여기에는 분류 문제가 기사보다 훨씬 더 자세히 설명되어 있습니다. 이 책에는 기술 문서의 문자 그대로 번역(약 30%), 외환 시장에서 분류 모델을 사용한 예(텍스트의 약 20%), 분류 모델 구축의 이념에 대한 설명이 포함되어 있습니다. 또한 분류 모델을 기반으로 전문가 어드바이저를 구축하는 일련의 단계를 설명합니다.
모델의 과잉 훈련은 잘못된 예측자 집합으로 인해 발생하며 전체 개가 그 안에 묻힙니다. 따라서 모든 노력은 예측 변수를 선택한 다음 모델에 집중되어야 합니다.
모델과 예측자 선택은 서로 연관되어 있습니다. 먼저 모델을 선택한 다음, 이 모델을 기반으로 예측에서 '유용성'이 가장 낮은 예측자를 동일한 모델로 선별하여 예측자를 선택해야 합니다. 많은 기사와 교과서에서는 다르게 가르치지만, 먼저 이러한 예측자와 목표 계열(출력) 간의 관계를 계산하는 몇 가지 방법을 사용하여 예측자를 선택합니다. 가장 일반적인 선별 방법은 예측자와 출력 간의 상관 계수 및 상호 정보입니다. 그런 다음 일반적으로 예측자가 선택된 방법과 무관한 모델이 선택됩니다. 생각해 보면( 계량경제학 교과서에서는 설명하지 않으므로 스스로 생각해야 합니다), 출력과의 상관 계수로 예측자를 선택하는 방법은 기본적으로 선형 회귀 모델(LRC)에서 가장 작은 오차를 갖는 예측자를 선택하는 것입니다. 출력과의 상호 정보로 예측자를 선택하는 방법은 기본적으로 나다라야-왓슨 회귀 기반 모델(난해한 이름 GRNN)에서 가장 낮은 오차를 보이는 예측자를 선택합니다.
Центральной проблемой прикладной статистики является проблема принятия статистических гипотез. Долгое время считалось, что эта задача не может быть решена. Ситуация изменилась с появлением метода собственных координат. Это очень красивый и мощный инструмент структурного исследования сигнала, позволяющий увидеть больше, чем доступно методами современной прикладной статистики. В статье рассмотрены вопросы практического использования данного метода и приведены программы на языке MQL5. Рассмотрена задача идентификации функций на примере распределения, полученного Хилхорстом и Шером.
현재 수익성이 있나요?
이 기사의 예는 시연용이며 매우 중복됩니다.
특히 랜덤 포레스트와 일반적으로 기계 학습 모델의 적용에 대해 이야기하면 (신경망이이 알고리즘 클래스에 속함) 거래에서 널리 사용됩니다.
추신. 포럼에는 많은 NS 지지자가 있습니다. 따라서 이들은 거래에 가장 효율적인 알고리즘이 아닙니다. 랜덤 포레스트가 훨씬 더 효율적입니다.
이 기사의 예시는 데모 성격의 것으로 매우 중복됩니다.
특히 랜덤 포레스트와 일반적으로 머신러닝 모델의 적용(신경망은 이 알고리즘 클래스에 속함)에 대해 이야기하면 트레이딩에서 널리 사용됩니다.
추신. 포럼에는 많은 NS 지지자가 있습니다. 따라서 이들은 거래에 가장 효율적인 알고리즘이 아닙니다. 랜덤 포레스트가 훨씬 더 효과적입니다.
어디 계셨나요?
한동안 연락이 없으셨나요?
어디 계셨나요?
한동안 소식 못 들었나요?
더 심층적인 자료로 연결되는 링크가 있나요?
더 자세한 자료로 연결되는 링크가 있나요?
이 주제에 대한 많은 문헌이 있으며, 대부분 영어로 되어 있습니다.
저는 "트렌드 예측"이라는 책을 썼는데, 여기에는 분류 문제가 기사보다 훨씬 더 자세히 설명되어 있습니다. 이 책에는 기술 문서의 문자 그대로 번역(약 30%), 외환 시장에서 분류 모델을 사용한 예(텍스트의 약 20%), 분류 모델 구축의 이념에 대한 설명이 포함되어 있습니다. 또한 분류 모델을 기반으로 전문가 어드바이저를 구축하는 일련의 단계를 설명합니다.
자세한 내용은 첨부파일을 참조하세요.
추신. 이 책에는 해당 주제에 대한 다소 광범위한 문헌 목록이 있습니다.
vlad19492014.11.23 15:
블라드에게!
머신러닝 알고리즘의 효율성에 대한 모든 주장은 모델이 재학습되지 않았다는 한 가지 조건 하에서 의미가 있습니다. 제 실무에서는 훈련되지 않은 모델을 얻는 것이 매우 어렵습니다. 특히이 논문에서는 과잉 훈련 된 모델입니다.
모델의 과잉 훈련은 잘못된 예측 변수 집합으로 인해 발생하며 전체 개가 그 안에 묻혀 있습니다. 따라서 모든 노력은 예측 변수를 선택한 다음 모델에 집중되어야합니다.
특정 목표 변수에 대한 예측자의 적합성에 대한 공식적인 징후를 찾은 것 같습니다. 이에 대해 관심이 있으시면 기꺼이 개인적으로 논의하겠습니다.
vlad19492014.11.23 15:
블라드에게!
머신러닝 알고리즘의 효율성에 대한 모든 주장은 모델이 재학습되지 않았다는 한 가지 조건 하에서 의미가 있습니다. 제 실무에서는 훈련되지 않은 모델을 얻는 것이 매우 어렵습니다. 특히이 논문에서는 과잉 훈련 된 모델입니다.
모델의 과잉 훈련은 잘못된 예측 변수 집합으로 인해 발생하며 전체 개가 그 안에 묻혀 있습니다. 따라서 모든 노력은 예측 변수를 선택한 다음 모델에 집중되어야합니다.
특정 목표 변수에 대한 예측자의 적합성에 대한 공식적인 징후를 찾은 것 같습니다. 이에 대해 관심이 있으시면 기꺼이 개인적으로 논의해 드리겠습니다.
감사합니다.
물론 관심 있습니다. 쓰기
vlad19492014.11.23 15:
http://a ppliedpredictivemodeling.com/blog/2014/11/11/some-thoughts-on-do-we-need-hundreds-of-classifiers-to-solve-real-world-classification-problems
이 링크를 제 블로그에 주석과 함께 게시했습니다. 아무도 관심이 없었습니다. 다음은 기사 자체입니다.
모델의 과잉 훈련은 잘못된 예측자 집합으로 인해 발생하며 전체 개가 그 안에 묻힙니다. 따라서 모든 노력은 예측 변수를 선택한 다음 모델에 집중되어야 합니다.
모델과 예측자 선택은 서로 연관되어 있습니다. 먼저 모델을 선택한 다음, 이 모델을 기반으로 예측에서 '유용성'이 가장 낮은 예측자를 동일한 모델로 선별하여 예측자를 선택해야 합니다. 많은 기사와 교과서에서는 다르게 가르치지만, 먼저 이러한 예측자와 목표 계열(출력) 간의 관계를 계산하는 몇 가지 방법을 사용하여 예측자를 선택합니다. 가장 일반적인 선별 방법은 예측자와 출력 간의 상관 계수 및 상호 정보입니다. 그런 다음 일반적으로 예측자가 선택된 방법과 무관한 모델이 선택됩니다. 생각해 보면( 계량경제학 교과서에서는 설명하지 않으므로 스스로 생각해야 합니다), 출력과의 상관 계수로 예측자를 선택하는 방법은 기본적으로 선형 회귀 모델(LRC)에서 가장 작은 오차를 갖는 예측자를 선택하는 것입니다. 출력과의 상호 정보로 예측자를 선택하는 방법은 기본적으로 나다라야-왓슨 회귀 기반 모델(난해한 이름 GRNN)에서 가장 낮은 오차를 보이는 예측자를 선택합니다.