저자에게. 분포 밀도가 아니라 분포 함수, 즉 밀도의 적분을 추정하면 더 나은 결과를 얻을 수 있습니다. 첫째, 데이터를 기반으로 구축하기가 더 쉽고, 항상 0과 1 사이에서 감소하지 않고 경계가 있기 때문에 커널, 스플라인, 회귀 등 평활화 알고리즘 선택에 대한 민감도가 훨씬 낮습니다. 사용 가능한 데이터의 양에 대한 요구 사항도 훨씬 줄어듭니다.
필요한 경우 수치 미분으로 밀도를 쉽게 얻을 수 있습니다.
필요한 경우 수치 미분으로 밀도를 쉽게 얻을 수 있습니다.
아마도요. 나는 그것에 대해 아무 말도 할 수 없습니다. cdf 을 통해 pdf 를 평가하려고 시도하지도 않았습니다. 아마도 미분을 사용하면 cdf 추정 정확도가 크게 높아질 것이라는 편견이 작용했을 것입니다. 또한 cdf->pdf 방법을 평가하거나 다른 방법과 비교하는 출판물을 보지 못했습니다. 링크를 공유해 주시면 감사하겠습니다.
아마도요. 저는 그것에 대해 아무 말도 할 수 없습니다. cdf 를 통해 pdf 를 추정해 본 적도 없습니다. 아마도 차별화를 사용하면 cdf 추정 정확도가 크게 높아질 것이라는 편견이 작용했을 것입니다. 또한 cdf->pdf 방법을 평가하거나 다른 방법과 비교하는 출판물을 보지 못했습니다. 링크를 공유해 주시면 감사하겠습니다.
참고 자료가 없어서 제공하지 못합니다. 대신 다음과 같은 고려 사항을 알려드리겠습니다.
PDF를 직접 평가할 때 정의의 영역을 미리 구간으로 나누어야 하는데, 두 가지 문제가 있습니다. 첫째, 도메인을 몇 개의 구간으로 나누는 것이 더 나은지, 둘째, 어떤 유형의 그리드(균일, ... ?)가 가장 좋을지 모른다는 것입니다. 그리고 두 번째 질문이 예를 들어 사 분위수 분할을 사용하여 사람들이 여전히 어떻게 든 해결하려고 시도했다면 첫 번째 질문의 경우 제 생각에는 보편적 인 방법이 전혀 없습니다. 저에게 알려진 모든 방법은 찌르는 방법을 감당할 수 없을 때 자동화 작업에서 거의 사용할 수없는 한계가 있습니다.
CDF 추정에는 이러한 단점이 없습니다. 이 경우 함수의 단계는 입력 데이터가 떨어지는 위치에 정확히 위치하므로 보간을 위한 그리드를 선택하는 문제가 저절로 사라집니다. 그리드가 생성되면 간격 수를 선택하는 것은 어렵지 않습니다. 최대 간격 수(그리고 그 위치!!!)를 이미 알고 있기 때문에 필요한 정확도를 설정하고 입력 데이터의 구조와 가장 일치하는 자연 그리드에서 매번 얇게 할 수 있습니다.
실제로 저는이 기술을 사용하여 데이터 샘플 수가 100 개를 초과하지 않을 때 경험적 분포의 국부적 모드를 검색했으며 매우 부드러운 결과를 얻었으며 시각적으로 검색의 정확도는 매우 정 성적으로 정의되며 편차없이 실제로 최소 2-4 개의 주요 모드가 발견됩니다. 그러나 저는 다른 평활화 알고리즘을 사용하며 여러 가지 이유로 커널 알고리즘을 좋아하지 않습니다.
모두 완벽하게 공정합니다. 그러나 당신이 분명히주의를 기울이지 않은 한 가지 점을 제외하고는 나에게 보입니다.
커널 부드러움에 대한 잘 알려진 표현은 "커널 부드러움"입니다.

이러한 평활화에 기반한 PDF 추정 방법 은 다음과 같이 보일 수 있습니다(단순화):
- 입력 시퀀스를 구간으로 분할(클러스터링, 비닝)합니다.
- 결과 히스토그램을 평활화합니다.
커널 평활화가 마음에 들지 않으면 예를 들어 p-스플라인을 사용할 수 있습니다. (바로 p-스플라인을 선택하는 것이 좋습니다).
이 접근 방식을 사용하면 추정 당신이 말한 모든 것이 절대적으로 공정한 것으로 밝혀졌습니다. 그러나 이 경우에도 길이가 큰 시퀀스(>1000000)에 대한 이 추정 방법은 우수한 결과를 제공합니다. 입력 시퀀스의 길이가 감소함에 따라 언급하신 모든 매력이 점점 더 강하게 나타나기 시작합니다.
이제 커널 밀도 추정 (KDE)의 표현식을 살펴봅시다.
![]()
이 표현식은 앞서 설명한 것과는 다릅니다. 보시다시피 이 표현식은 주어진 지점에서 확률 밀도 함수의 값을 직접 결정합니다. 이 경우 중요한 점은 구간으로 분할하지 않는다는 것입니다. 입력 시퀀스의 값이 직접 사용됩니다.
적어도 이것이 제가 KDE의 상황을 보는 방식입니다. 기사에 제시된 pdf 추정 알고리즘은 언뜻 보기에 20~30개 요소 길이의 시퀀스에 꽤 잘 대처합니다. 때로는 평활화 정도를 줄이고 싶을 수도 있습니다. 코드에서 다음을 대체하면 쉽게 할 수 있습니다.
h=0.9*a/MathPow(N,0.2); // 실버만의 경험 법칙으로
h=0.7*a/MathPow(N,0.2); // 실버만의 경험 법칙
원래 아이디어는 외부 도구를 사용하지 않는 것이었습니다. 즉, 모든 것이 MQL5 도구로만 구현되어야 한다고 가정했습니다.
이것은 예외없이 모든 자전거 발명가의 아이디어입니다.
이와 관련하여 해당 패키지가 무엇을 가지고 있는지 살펴보고 거래에 계량 통계 및 계량 경제학을 적용 할 때 필요한 것의 무한한 양을 제공 한 것과 비교하십시오.
알렉스에게,
비행기의 높이에서 추론하기는 쉽습니다. 하지만 다음에 대해 잠시 생각해 보세요:
"www.mql5.com - 자동 트레이딩 및 트레이딩 전략 테스트"라는 리소스입니다. 보시다시피 이 사이트의 이름은 EViews나 MQ 또는 MT5가 아닌 mql5입니다. 따라서 이 사이트는 주로 MQL5 프로그래밍 언어의 대중화, 디버깅 및 개발에 초점을 맞추고 있다고 가정하기 쉽습니다. 이는 서비스 데스크의 존재와 사이트에 MQL5 참조 정보를 배치함으로써 확인됩니다.
예를 들어 이 사이트의 이름이 "트레이딩 전략 모음"이고 MQ에 속하지 않는 경우입니다 . 이 경우 Exel, R, EVievs, Gauss, Stata 등의 솔루션을 설명하는 게시물이 이러한 사이트에 표시될 것으로 예상할 수 있습니다.
제가 이 글을 EViews 사이트에 게시했다면 여러분의 비난의 본질을 이해하려고 노력했을지도 모릅니다. 하지만 여러분과 저는 지금 EViews에 있지 않습니다.
이 사이트는 매우 다른 배경을 가진 사람들이 방문합니다. 다양한 교육 배경과 다양한 전문성을 가진 다양한 연령대의 사람들이 방문합니다. 이들 대부분은 계량경제학 패키지에 대한 경험이 거의 없거나 전혀 없다고 생각합니다. 이 모든 사람들을 이 사이트에서 추방해야 한다고 생각하시나요, 아니면 먼저 EViews를 배우게 해야 한다고 생각하시나요?
셀프 퍼블리싱을 하셨으니 이 사이트에 글을 게시하는 절차에 대해 잘 알고 계실 겁니다. 어떤 글도 자체 게시할 수 없습니다. 검토를 위해 기사를 제출할 수만 있습니다. 사이트 자체의 관리는 일반적인 개념에 적합한 기사를 선택합니다. 그리고 어떤 경우에는 행정부 자체가 관심있는 주제에 대한 기사를 주문합니다. 이미 말했듯이 행정부는이 출판물 또는 해당 출판물에 대한 요청 횟수에 대한 일반적인 개념과 통계를 가지고 있습니다. 이 상황에서 기사 주제에 대한 주장으로 저를 언급하는 것은 옳지 않다고 생각합니다. 이 문제에 대해 MQ 담당자와 논의해 보는 것이 어떨까요 ?
이 사이트에는 저에게 흥미롭지 않은 기사가 게시되어 있습니다. 나쁜 기사가 아니라 제게 흥미롭지 않다는 점을 강조하고 싶습니다. 저는 보통 그 기사를 읽거나 댓글을 달지 않습니다. 여러분도 비슷한 행동 방식을 선택해야 하지 않을까요? 감히 조언을 드리기는 어렵지만, 편한 대로 하세요.
알렉스에게,
비행기의 높이에서 추론하기는 쉽습니다. 하지만 다음 사항을 잠시 생각해 보세요:
이 리소스의 이름은"www.mql5.com - 자동 트레이딩 및 트레이딩 전략 테스트"입니다. 보시다시피 이 사이트의 이름은 EViews나 MQ 또는 MT5가 아닌 mql5입니다. 따라서 이 사이트는 주로 MQL5 프로그래밍 언어의 대중화, 디버깅 및 개발에 초점을 맞추고 있다고 가정하기 쉽습니다. 이는 서비스 데스크의 존재와 사이트에 MQL5 참조 정보를 배치함으로써 확인됩니다.
예를 들어 이 사이트의 이름이 "트레이딩 전략 모음"이고 MQ에 속하지 않는 경우입니다 . 이 경우 Exel, R, EVievs, Gauss, Stata 등의 솔루션을 설명하는 게시물이 이러한 사이트에 표시될 것으로 예상할 수 있습니다.
제가 이 글을 EViews 사이트에 게시했다면 여러분의 비난의 본질을 이해하려고 노력했을지도 모릅니다. 하지만 여러분과 저는 지금 EViews에 있지 않습니다.
이 사이트는 매우 다른 배경을 가진 사람들이 방문합니다. 다양한 교육 배경과 다양한 전문성을 가진 다양한 연령대의 사람들이 방문합니다. 이들 대부분은 계량경제학 패키지에 대한 경험이 거의 없거나 전혀 없다고 생각합니다. 이 모든 사람들을 이 사이트에서 추방해야 한다고 생각하시나요, 아니면 먼저 EViews를 배우게 해야 한다고 생각하시나요?
셀프 퍼블리싱을 하셨으니 이 사이트에 글을 게시하는 절차에 대해 잘 알고 계실 겁니다. 어떤 글도 자체 게시할 수 없습니다. 검토를 위해 기사를 제출할 수만 있습니다. 사이트 자체의 관리는 일반적인 개념에 적합한 기사를 선택합니다. 그리고 어떤 경우에는 행정부 자체가 관심있는 주제에 대한 기사를 주문합니다. 이미 말했듯이 행정부는이 출판물 또는 해당 출판물에 대한 요청 횟수에 대한 일반적인 개념과 통계를 가지고 있습니다. 이 상황에서 기사 주제에 대한 주장으로 저를 언급하는 것은 옳지 않다고 생각합니다. 이 문제에 대해 MQ 담당자와 논의해 보는 것이 어떨까요 ?
이 사이트에는 저에게 흥미롭지 않은 기사가 게시되어 있습니다. 나쁜 기사가 아니라 제게 흥미롭지 않다는 점을 강조하고 싶습니다. 저는 보통 그 기사를 읽거나 댓글을 달지 않습니다. 여러분도 비슷한 행동 방식을 선택해야 하지 않을까요? 감히 조언을 드리기는 어렵지만, 여러분이 더 편하다고 느끼는 대로 하세요.
제 게시물의 본질에 전혀 맞지 않는 답변이므로 수락할 수 없습니다. 제 관점을 설명해 보겠습니다.
1. Metaquotes는 그것과 전혀 관련이 없습니다. 그들은 매우 괜찮은 도구를 제공했으며 그것을하고 있습니다.
2. 나는 기사의 주제에 대한 제한을 알지 못합니다. 물론 거래 한도 내에서. 이 사이트에는 "통계"섹션이 있습니다. 즉, 그들은 거래의 내용과 문제에 따라 사이트의 주제를 당신보다 훨씬 더 넓게 이해합니다. 메타 따옴표를 언급하지 않고 본론으로 넘어가겠습니다.
3. 내 게시물은 무엇을 개발할 것인가가 아니라 어떻게 개발할 것인가에 관한 것입니다. 이것이 제 글과 관련하여 근본적인 내용입니다. 저는 데모 및 교육 목적으로는 좋지만 거래 할 수 없다고 생각하는 EViews에 대해 낮은 의견을 가지고있는 캠페인을하지 않았습니다. 내 링크는 문제의 폭을 보여주기 위해 패키지에 대한 링크입니다.
4. 저는 오랫동안 프로그래밍을 해왔습니다. 40년 전 최초의 프로그램 라이브러리가 등장하자마자 아마추어가 기존 패키지에서 일부 프로그램을 다시 작성하는 것을 비판했습니다. 여러분이 처음이 아닙니다. 하지만 이 사이트에는 자전거를 다시 만들고 싶어하는 아마추어들로 가득 차 있어서 제 반응이 과장된 것 같습니다.
5. 핵 평가 문제는 씹고 또 씹는 문제입니다. 논문에서 해결한 기술적 어려움을 뛰어넘어 실무자 알수가 제기한 문제에 대한 해결책을 제시하거나, 분포의 시각적 평가가 형식적 평가에서 매우 중요한 역할을 한다는 것을 기억하거나, 기능적으로 확장하는 등....... - 어느 쪽이든 한 단계 더 높이 올라갈 수 있습니다.
저는 여러분에게 불쾌한 감정을 표현하고 싶지 않았습니다. 귀하의 글과 개발은 존중하지만 귀하의 아이디어를 구현하는 기술의 방법론적 초점에는 동의할 수 없습니다.
귀하의 기사에 대한 저의 게시물은 누군가가 통계 및 계량경제학 수단을 통해 메타쿼츠 터미널을 체계적으로 보완해 주기를 바라는 마음에서 작성했습니다. 그런 분들을 추천합니다.
매우 흥미롭습니다. 매우 흥미롭습니다.
요청을 받나요?
오픈 소스 코드뿐만 아니라 통계 지향 코드가 바람직합니다. R에 주목해 주세요.
매우 흥미롭습니다. 매우 흥미롭습니다.
요청을 받나요?
오픈 소스 코드뿐만 아니라 통계 지향 코드가 바람직합니다. R에 주목해 주세요.
요청은 여기에서 접수합니다: https://www.mql5.com/ru/forum/6505. 원하는 대로 작성하세요. :)
- www.mql5.com
새로운 기고글 미지의 확률 밀도 함수에 대한 커널 밀도 추정 가 게재되었습니다:
이 글은 미지의 확률 밀도 함수에 대한 커널 밀도를 추정하는 프로그램 작성 방법을 다룹니다. 커널 밀도 추정 방법을 이용할 겁니다. 소프트웨어 구현 소스 코드 및 사용 예시와 설명이 포함되어 있습니다.
그림 1은 정규 분포를 따르며 다양한 h 범위 값을 갖는 시퀀스에 대한 밀도 추정 차트를 나타냅니다.
위에서 설명한 CDens 클래스가 추정에 이용됐습니다. 차트는 HTML 형식을 갖습니다. 차트 작성법에 대해서는 본문 하단에서 다루게 될 겁니다. HTML로 차트 및 다이어그램을 작성하는 방법은 참고 자료 [9]를 참고하세요.
그림 1. 다양한 h 범위 값에 대한 밀도 추정
그림 1은 정규 분포 밀도 곡선(가우스 분포)와 세 가지 밀도 추정을 보여줍니다. h=0.22인 경우에 가장 적절한 추정 결과가 획득됨을 알 수 있습니다. 나머지 두 경우는 '과대평활화'와 '과소평활화'에 해당하는데요.
작성자: Victor