Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 210

 

Alexey Burnakov :
Soruma R'de cevap almaya başladım.

Aynı kişiyle yazışmaların devamı...


Re:  [Rd] dgamma density values in extreme point
Duncan Murdoch murdoch.duncan@gmail.com
сегодня в 12:59
Вам
:
burnakov@yandex.ru
Язык письма —  английский . Перевести на  русский ?
Перевести
<span class="mail-Message-Widget-Inline_help ns-action nb-with-s-right-gap" data-click-action="common.show-hint" title="Узнать больше" data-params="pos=right&counter=71105:msg.click.quest&text=Вы можете переводить письма с иностранных языков нажатием одной кнопки. Кроме того, перевод писем доступен по ссылке «Перевести» за вкладкой «подробнее». Если вы считаете, что язык письма определён неправильно, пожалуйста, сообщите нам об этом." style="margin-right: 10px !important; display: inline-flex; cursor: pointer; color: rgb(187, 187, 187); flex-shrink: 0;">
Alexey Burnakov 14 ноя. в 1:54 AM
 Hi Duncan,

 "As to the "correctness", we all know that the value of a density at any
 particular point is irrelevant. Only the integrals of densities have
 any meaning. "

 Thank you for clarification. Yes, I agree that what matters practically
 is the cumulative density. One more point.

 There is an opinion expressed by sometimes that while integral from the
 left in point zero of the support == 0, density in this particular point
 cannot be anything than zero. You think that is sound?

No. The value of a density at any particular point is irrelevant.

Duncan Murdoch

Davalı hakkında: http://www.stats.uwo.ca/faculty/murdoch/other.shtml

Özellikle:

R çekirdek geliştirme grubunun bir üyesiyim; R projesiyle ilgili ayrıntılar için www.r-project.org adresine bakın . R'nin Windows sürümünü koruyorum ve R için DLL yazan kişiler için ipuçları içeren bir web sayfam var .

About Duncan Murdoch
  • www.stats.uwo.ca
My research interests are in applied statistics (especially orientation statistics) and statistical computing (especially the R project and perfect sampling). I write a fair...
 
San Sanych Fomenko :

M-evet, sen daha iyi biliyorsun

Evet, daha görünür ve daha dürüst.

Ayrıca, forumda dışarıdan bir katılımcı olarak taslak çizme fırsatım da yok.


Matlab, Wolfram ve Mathematics "Kim olduğunu bilmiyorum" demekten utanmadılar bile.

Matematik (Tungsten) paketini içerecek istatistiksel paketlerin derecelendirmelerine bir bağlantı verin. Matlab öyleydi ama Bose'da dinlenmişti. Sitenizdeki blogumda alıntı yaptım ve forumda birçok kez yayınladım

Şu konularda sessizsiniz:

  • ücretsiz R'nin ücretli paketlerle karşılaştırmasını göster
  • matematiksel paketlerin tarihsel (5-10 yıl önceki) konumlarını görmezden gelerek, bu temelde "onlar hiç kimse" olduğunu beyan eder.
  • popülerliğini ve tartışılan hesaplamaların doğruluğunu değiştirmek

Matlab, diğer paketler gibi hiçbir yerde dinlenmedi. Evet, ücretli, ancak yüksek kaliteli. Evet, popülerlik düşecek, ancak doğruluk ve kalite hiçbir yere gitmeyecek.

Wolfram Alpha hakkında bilgi edinin ve web sitesini keşfedin - bu, analitik için çok az kişinin yapabileceği temel bir yatırımdır. Ve Wolfram Alpha'nın doğruluğu, hesaplamaların kalitesine çılgınca dikkatlerini kanıtlayan 30 karakterdir.

Wolfram|Alpha: Computational Knowledge Engine
  • www.wolframalpha.com
Wolfram|Alpha is more than a search engine. It gives you access to the world's facts and data and calculates answers across a range of topics, including science, nutrition, history, geography, engineering, mathematics, linguistics, sports, finance, music...
 
Alexey Burnakov :

Re:  [Rd] dgamma density values in extreme point
Duncan Murdoch murdoch.duncan@gmail.com
сегодня в 12:59
Вам

Ne yazık ki, sorunuzu tam olarak formüle etmediniz ve bitmemiş ve kısa kibar bir yanıt aldınız "önemli değil".

Sorunun kendisinde formüle ederek "böyle kararlaştırıldı / konvansiyonel" cevabını almak istediniz. Ancak Duncan ilk seferinde "doğru olan" yanıtından kaçtı ve ikinci kez tekrarladı.

R'de doğruluk onayı almadınız ve sonucun diğer paketlerde neden farklı olduğuna dair bir cevap almadınız. "Diğer paketlerde cevap neden farklı" sorusunun ayrıştırılması daha önemlidir ve konuyu ortaya çıkarabilir.


Konumumuz:

выражение для dgamma

(x)= 1/(s^a Gamma(a)) x^(a-1) e^-(x/s)

for x ≥ 0 , a > 0 and s > 0


в точке 0 является неопределенным.

R, bu noktayı hesaplamaya dahil edebileceğinize inanır, ancak yine de dgamma(0,0.5,1) durumunda olduğu gibi sonsuzluğa eşit olsalar bile sınır değerleri alır.

Ancak olasılıklar sıfır noktasında sonsuzluk dikkate alınarak hesaplanırsa, dgamanın tüm integralleri resmen sonsuz hale gelir ve bu mantığa göre x'in tüm değerleri için pgamma sonsuza eşit olmalıdır.

Ancak bu, tüm değerlerin sonlu olduğu pgammanın sonuçlarıyla çelişir. Doğrudurlar, sanki x=0 noktasında yoğunluğun = 0 olduğu kabul edilir.
 

@SanSanych Fomenko için - MQL4/MQL5, TIOBE dünya programlama dilleri sıralamasında 41. sıraya yükseldi: http://www.tiobe.com/tiobe-index/

R 19. sırada, Mathlab 15. sırada.

Bu, "otorite değil" ve "dünya lideri değil" hakkındaki ifadelerinizi ortadan kaldırmak içindir.

TIOBE Index | TIOBE - The Software Quality Company
  • www.tiobe.com
TIOBE Index for November 2016 November Headline: Is Haskell finally going to hit the top 20? Some people say that Haskell is the most mature purely functional programming language available nowadays. It has quite a long history, dating back from 1990 and its community is growing, although slowly. This month Haskell is only 0.255% away from the...
 

Tartışmaları kaybetmemek için, burada R'yi test etme sürecinde bulunan merkezi olmayan t dağılımının niceliklerinin hesaplanmasında bir hata var.

Örneğin:

 > n <- 10
> k <- seq(0,1,by=1/n)
> nt_pdf<-dt(k, 10,8, log = FALSE)
> nt_cdf<-pt(k, 10,8, log = FALSE)
> nt_quantile<-qt(nt_cdf, 10,8, log = FALSE)
> nt_pdf
 [1] 4.927733e-15 1.130226e-14 2.641608e-14 6.281015e-14 1.516342e-13 3.708688e-13 9.166299e-13
 [8] 2.283319e-12 5.716198e-12 1.433893e-11 3.593699e-11
> nt_cdf
 [1] 6.220961e-16 1.388760e-15 3.166372e-15 7.362630e-15 1.742915e-14 4.191776e-14 1.021850e-13
 [8] 2.518433e-13 6.257956e-13 1.563360e-12 3.914610e-12
> k
 [1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
> nt_quantile
 [1]           -Inf -1.340781e+154 -1.340781e+154 -1.340781e+154 -1.340781e+154 -1.340781e+154
 [7] -1.340781e+154   7.000000e-01   8.000000e-01   9.000000e-01   1.000000e+00

Lenth [6] tarafından önerilen AS 243 algoritması, merkezi olmayan bir Öğrencinin R dilinde T dağılımının olasılığını hesaplamak için kullanılır. Bu yöntemin avantajı, tamamlanmamış beta fonksiyonlarına sahip sonsuz bir serinin terimlerinin hızlı özyinelemeli hesaplanmasıdır. Ancak [7]'de, serinin terimlerini toplarken doğruluğu tahmin etmedeki hata nedeniyle, bu algoritmanın özellikle merkezi olmayan büyük değerler için hatalara yol açtığı gösterilmiştir ([7]'deki Tablo 2) parametre deltası. Makalenin yazarları [7], merkezi olmayan bir T dağılımı olasılığının özyinelemeli hesaplanması için ayarlanmış bir algoritma önerdiler.

MQL5 istatistik kitaplığımızda, doğru sonuçlar veren makale [7]'den olasılıkları hesaplamak için doğru algoritmayı kullanıyoruz.


Ayrıca, R'de Gama, KiKare ve Merkezi Olmayan KiKare dağılımları için yoğunlukları x=0'da tanımlamanın yolu sonsuz ifadelere yol açar:

 > dgamma(0,0.5,1)
[1] Inf
> dchisq(0,df=0.5,ncp=1)
[1] Inf
> dchisq(0,df=0.5,ncp=0)
[1] Inf

Böylece, R'deki x=0 noktasının yoğunluk ifadesinin alanına dahil olduğu ve çözümün sınır değerler olduğu ortaya çıkıyor.

Bu durumda x=0 noktasındaki limit değer sonsuzdur. Bu yaklaşımla 0'dan x>0'a integrasyon sonucunda x=0 noktasındaki diverjans nedeniyle olasılıklar sonsuz olmalıdır.

Ancak, olasılıkları hesaplamanın sonucu (örneğin, x=0.1 için) son ifadelerdir:

 > pgamma(0.1,0.5,1)
[1] 0.3452792
> pchisq(0.1,df=0.5,ncp=0)
[1] 0.5165553
> pchisq(0.1,df=0.5,ncp=1)
[1] 0.3194965

x=0 noktasında yoğunluğun sonsuz olduğu varsayılsa da R'deki olasılık hesabının sonuçları sonsuz değildir, Wolfram Alpha ( Gamma , ChiSquare , NoncentralChiSquare ) değerleri ile örtüşmektedir.

Wolfram Alpha (Mathematica) ve Matlab'da x=0'da sonsuza giden fonksiyonların integrali alınmasıyla ilgili sorunları önlemek için, x=0'daki yoğunluk tanım gereği 0'dır:


Pirinç. 3. Wolfram Alpha'da Gama dağılımının olasılık yoğunluğunun belirlenmesi


Pirinç. 4. Wolfram Alpha'da ChiSquare dağılımının olasılık yoğunluğunun belirlenmesi



Pirinç. 5. Wolfram Alpha'da Merkezi Olmayan KiKare Dağılımının Olasılık Yoğunluğunun Belirlenmesi


Bu yaklaşımı doğru buluyoruz. Olasılık yoğunluğunu belirlemede belirsizlikleri önler ve olasılık yoğunluğunu entegre ederken ortaya çıkabilecek sonsuz değerlerle sorunu çözer.

Bu nedenle, x=0 noktasında, bu dağılımların yoğunlukları tanım gereği sıfır olarak kabul edilir ve R'deki gibi sonsuz değil.

Hesaplamaların doğruluğundan emin olmak ve üçüncü taraf geliştiricilerin kitaplığın kalitesini kontrol etmelerini sağlamak için dağıtıma birkaç birim test komut dosyası ekledik.

Edebiyat

  1. İstatistiksel Hesaplama için R Projesi .
  2. Balakrishnan N., Johnson N.L., Kotz S. "Tek boyutlu sürekli dağılımlar: 1. kısım." M.: BİNOM. Bilgi Laboratuvarı, 2014.
  3. Balakrishnan N., Johnson N.L., Kotz S. "Tek boyutlu sürekli dağılımlar: 2. kısım." M.: BİNOM. Bilgi Laboratuvarı, 2014.
  4. Johnson N.L., Kots S., Kemp A. "Tek Boyutlu Ayrık Dağılımlar" , M.: BINOM. Bilgi Laboratuvarı, 2014.
  5. Forbes C., Evans M., Hastings N., Peacock B., "İstatistiksel Dağılımlar" , 4. Baskı, John Wiley and Sons, 2011.
  6. Lenth, RV, "Merkezi olmayan dağılımın kümülatif dağılım fonksiyonu" , Appled İstatistikleri, cilt. 38 (1989), 185–189.
  7. D. Benton, K. Krishnamoorthy, "Sürekli dağılımların ayrık karışımlarının hesaplanması: merkezi olmayan kikare, merkezi olmayan t ve örneğin çoklu korelasyon katsayısının karesinin dağılımı" , Hesaplamalı İstatistikler ve Veri Analizi, 43, (2003), 249-267
Wolfram|Alpha: Computational Knowledge Engine
  • www.wolframalpha.com
Wolfram|Alpha is more than a search engine. It gives you access to the world's facts and data and calculates answers across a range of topics, including science, nutrition, history, geography, engineering, mathematics, linguistics, sports, finance, music...
 
Renat Fatkhullin'in fotoğrafı.

@SanSanych Fomenko için - MQL4/MQL5, TIOBE dünya programlama dilleri sıralamasında 41. sıraya yükseldi : http://www.tiobe.com/tiobe-index/

R 19. sırada , Mathlab 15. sırada.

Bu, "otorite değil" ve "dünya lideri değil" hakkındaki ifadelerinizi ortadan kaldırmak içindir.

İstatistikleri tartışıyorum. Ve istatistik paketleri için puanlarım.

Üstelik. Algoritmik dillerle ilgili bu istatistiklerde, alıntınızda R, MQL4/5'in üzerinde yer alıyor. Ancak benim için bu, örneğin MCL'den R'ye geçmek için bir neden DEĞİLDİR . R'nin algoritmik yeteneklerini hiç tartışmıyorum.

Benim için, R'nin ana gücü paketleridir, tüm bu sistemin desteğidir, onları geliştiren kişilerin otoritesidir, R üzerinde büyük bir mekân, sonuçta R'ye bağlı çok sayıda yayın.

Ayrıca 15 yılını akademik kurullarda geçirmiş bir kişi olarak. "Analog R" yazıyorlarsa, bu istisnasız bir analogdur. Ve başka türlü olmaz. Aksi takdirde, bu bir R analogu DEĞİLDİR, çok daha doğru olabilir, ancak bir analog değil

 
San Sanych Fomenko :

İstatistikleri tartışıyorum. Ve istatistik paketleri için puanlarım.

Üstelik. Algoritmik dillerle ilgili bu istatistiklerde, alıntınızda R, MQL4/5'in üzerinde yer alıyor. Ancak benim için bu, örneğin MCL'den R'ye geçmek için bir neden DEĞİLDİR . R'nin algoritmik yeteneklerini hiç tartışmıyorum .

Ve R'de belirli bir hatayı tartışıyoruz.

Bu nedenle, matematikten ve incelenen belirli vakadan haberdar olmadığınız için derecelendirmelerinizle uğraşmayın.

 

San Sanych Fomenko :

...

Benim için, R'nin ana gücü paketleridir, tüm bu sistemin desteğidir, onları geliştiren kişilerin otoritesidir, R üzerinde büyük bir mekân, sonuçta R'ye bağlı çok sayıda yayın.
...

Bir çeşit çürüme bu R, kare tekerlekli bir bisiklet. Bazı paketleri hakkında, temelin kendisi, yani. R eğrisinde YaP ve bir "piç dosyası" ile ciddi bir iyileştirme mi gerekiyor? Bunca yıldır R'deki temel fonksiyonların doğruluğunu kontrol etme zahmetine bile girmeyenler için ne gibi bir otorite olabilir ki? R'nin zayıf noktasında hangi "güç" olabilir - onun üzerinden yapılan hesaplamaların yanlışlığı?

MetaQuotes'un bazı kullanıcıların gözlerini gerçekler ve açık kaynak testleri üzerinde bu R'nin gerçekte neyi temsil ettiğine açması iyi oldu, böylece herkes iki kez kontrol edebilir ve kendi başına emin olabilir ve asılsız değil. Elbette herkes açılmadı çünkü. Yıkıcı tarikat R'den bireysel dini fanatikler, sunulan testlere atıfta bulunmak ve bunları kendi başlarına yeniden kontrol etmek ve fanatik bir kar fırtınası sürmek yerine, çarpık dil ve paketlerindeki hesaplamaların "yanılmazlığına" körü körüne inanmaya devam edecekler. "genel olarak kabul edilen standart" olarak R'nin eğriliği.

Sonuç daha doğru olacağından ve bunu eğri ve eğik R üzerinden yapmaya çalışacağından, ticaret stratejileri oluşturmak için MQL işlevini kullanmanın daha iyi olduğu artık oldukça açıktır.

Yapıcı bir yaklaşım, testler ve kaynakları ile " çıplak kral - R " yi ortaya çıkarmak için MetaQuotes geliştiricilerine özellikle teşekkür edilmelidir!

 
kuantum :
0 genişliğiyle ilgilenmiyoruz, böyle bir integralin nasıl davrandığını anlamamız gerekiyor, yani. cdf(x). Ne tür bir işlev elde edilir? pgamma(x) ile eşleşecek mi?

> dgamma_05_1 <- function(x)dgamma(x, 0.5 , 1 ) #всего 1 параметр, чтоб удобней работать

> pgamma_05_1 <- function(x)pgamma(x, 0.5 , 1#всего  1  параметр, чтоб удобней работать

> pgamma_05_1_integralform <- function(x)integrate(dgamma_05_1, 0 , x)$value #вычисление pgamma путём интегрирования dgamma
>
> pgamma_05_1( 0.00001 )
[ 1 ] 0.003568236
> pgamma_05_1_integralform( 0.00001 )
[ 1 ] 0.003568236
> pgamma_05_1( 0.00001 ) - pgamma_05_1_integralform( 0.00001 )
[ 1 ] - 6.938894 e- 18
>
> pgamma_05_1( 0.0001 )
[ 1 ] 0.01128342
> pgamma_05_1_integralform( 0.0001 )
[ 1 ] 0.01128342
> pgamma_05_1( 0.0001 ) - pgamma_05_1_integralform( 0.0001 )
[ 1 ] 3.295975 e- 17
>
> pgamma_05_1( 0.001 )
[ 1 ] 0.03567059
> pgamma_05_1_integralform( 0.001 )
[ 1 ] 0.03567059
> pgamma_05_1( 0.001 ) - pgamma_05_1_integralform( 0.001 )
[ 1 ] 1.595946 e- 16
>
> pgamma_05_1( 0.01 )
[ 1 ] 0.1124629
> pgamma_05_1_integralform( 0.01 )
[ 1 ] 0.1124629
> pgamma_05_1( 0.01 ) - pgamma_05_1_integralform( 0.01 )
[ 1 ] 1.096345 e- 15
>
> pgamma_05_1( 0.1 )
[ 1 ] 0.3452792
> pgamma_05_1_integralform( 0.1 )
[ 1 ] 0.3452792
> pgamma_05_1( 0.1 ) - pgamma_05_1_integralform( 0.1 )
[ 1 ] 1.126876 e- 13
>
> pgamma_05_1( 1 )
[ 1 ] 0.8427008
> pgamma_05_1_integralform( 1 )
[ 1 ] 0.8427008
> pgamma_05_1( 1 ) - pgamma_05_1_integralform( 1 )
[ 1 ] 3.460265 e- 11

pgamma() standart yolla bulunur ve integral(dgamma()) ile neredeyse çakışır, hatanın x=1'de sadece 3.460265e-11'e ulaştığı görülebilir. Ancak böyle bir hata oldukça olasıdır, buradaki entegrasyon, herhangi bir ön analiz ve basitleştirme olmadan küçük adımlarla toplamdan geçer. pgamma() işlevinin kendisi C++ ile yazılmıştır ve entegre() ile entegre etmekten daha doğru olmalıdır. Bu nedenle, tam olarak pgamma(x,0.5,1) kullanmaya ve integral(dgamma(x,0.5,1),0,x) kullanmaya değer.

 
Yuri Reshetov :

Bazı paketleri hakkında ne söyleyebiliriz, çok temel, yani. R eğrisinde YaP ve bir "piç dosyası" ile ciddi bir iyileştirme mi gerekiyor?

Yap R - çarpık ve yavaş.

Tartışmayı hem temel pakette hem de ek paketlerde bulunan tamamen klasik istatistiklere ayırırsak, burada bir sorun olmadığını düşünüyorum. Milyonlarca istatistiksel test yaparsanız, diğer dillerin (MQL dahil) performansı bir artı olacaktır.

R'nin genel olarak nasıl programlandığı hakkında konuşursak, o zaman sana söyleyeceğim Yuri, insanlar yine hızlı veri işleme için paketleri kullanıyorlar (dplyr, data.table ve grafikler için ggplot2). R'nin kendisi yine eski, büyük veriler için tasarlanmamış bir betik dilidir.

Ancak tüm bunlara rağmen, sizin tarafınızdaki kir akışı hala haksız yere yüksek. Burada istatistikleri tartıştık ve kod yeniden düzenleme ve diğer teknik şeyleri bile tartışmadık. Konuşma matematiksel kavramlar hakkındaydı.