Bayesian regresyon - Bu algoritmayı kullanarak Uzman Danışman yapan var mı? - sayfa 46

 
Yuri Evseenkov :

Bayes formülünü uygulama girişiminde. Tekrar.

Görev. Bayes teoremini kullanarak, henüz ulaşmamış bir kene değerinin en olası değerini belirleyin.

verildi. Zaman serisi x,y.

y=ax+b Son onay işaretinden geleceğe uzanan çizgi.

P(a,b|x,y)=P(x,y|a,b)*P(a)*P(b)/P(x,y); (1) Bayes formülü.

P(a,b|x,y) - a ve b katsayılarının gelecekteki işaretin x ve y koordinatlarına karşılık gelme olasılığı.

Böyle a ve b'yi bulmak gerekir, böylece bu olasılık (daha doğrusu bir olasılık ölçüsü) maksimum olur.

P(x,y|a,b) - olabilirlik fonksiyonu olarak fiyat seviyelerine göre tik dağılımının gerçek histogramını alalım. İşlev, iki boyutlu bir dizi (matris) ile belirtilir: fiyat aralığı - olasılık, bu aralığa düşen onayların toplam işaret sayısına yüzdesi.

P(b) - artışların normal dağılımı, a priori olasılık b olarak alınır. Normal olarak dağıtılmış bir değere sahip bir PRNG kullanılır.

P(a) katsayısı a, doğrunun eğimini ve tahmin edilen artışın işaretini belirler. Şimdilik, daha önce yayınladığım doğrusal regresyon kodunu kullanmayı düşünüyorum. Yani orada bulunan katsayının olasılığını kabul etmek. ama birim başına. Ve (1)'de, bu a ile belirli bir y için hesaplanan arasındaki farkı hesaba katarak hesaplanan P(a) olasılığını yerine koyun.

Belki de her bir onay işaretinin artış işaretinin nasıl davrandığı hakkında bir fikriniz var mı?


2 gösterge çizildi, keneler üzerinde çalışıyorlar. İlki, doğrusal regresyon için A ve B'yi belirler (sadece teklif ve talep için ayrı ayrı olması durumunda) ve bir çizgi çizer. İkincisi, kene değerlerinin bir histogramıdır (kırmızı - Sor, mavi - Bid). Her tik grafiği çubuğu yeni bir tik işaretidir, grafiğin kendi çubuklarıyla çakışmazlar.

Yazıdan anladığım bu kadar. Sıradaki ne? Mantığını anlarsam, bitireceğim.


Dosyalar:
 
Dr.Trader :

Tahmin için kenelerin kullanılması bence tehlikelidir ve modelin her aracı için ayrı ayrı yapılandırılması gerekir.

Gerçek kenelere gelince, komisyoncudan komisyoncuya çok farklı olabilirler.

Kabul ediyorum. yukarıda yazdım. Tekrarlıyorum.

Forex bir çok DC, forex ofisi, mutfak - Avrupa, Çin, Bahama, Bermuda ... Karanlıkları. Hiçbiri hakim değildir ve fiyatlandırmaya belirleyici bir katkı sağlamaz, ayrıca piyasada tek bir oyuncu yoktur. Varsayım, Olasılık Teorisinin Merkezi Limit Teoremine (CLT) dayanmaktadır:

"Yaklaşık olarak aynı ölçeklere sahip yeterince büyük sayıda zayıf bağımlı rastgele değişkenlerin toplamı (terimlerin hiçbiri baskın değildir, toplama belirleyici bir katkı sağlamaz) normale yakın bir dağılıma sahiptir." (Wikipedia)

Forex ile ilgili olarak anladığım kadarıyla. TÜM DC'lerin tüm tiklerini (milyonlarca tik) bir M5 çubuğunda toplarsak, tiklerin çubuk içindeki dağılımı normale yakın olacaktır. Ve zaman aralığı ne kadar eskiyse, o kadar yakın. Her belirli DC, bu DC'nin bozulma derecesine göre baskın küresel akıştan farklı olan kendi teklif akışına sahiptir. Grafikteki bu baskın akış, hiçbir DC'nin uzaklaşamayacağı bir tür eğri çizgidir (kesinlikle düz bir çizgi değil!).

Burada, başlıkta, CPT'nin Wikipedia ifadesi şüpheciydi. Bana da yanlış geliyor. O zamandan beri bu ifadeyle başka kaynaklarda tanıştım. MQL4 referansında bile bu formülasyonla bir gösterge örneği vardır.

IMHO, yeterince büyük sayıda artışla, temel faktörlerin zayıf etkisi döneminde, CLT kuralları.

 
Dr.Trader :

2 gösterge çizildi, keneler üzerinde çalışıyorlar. İlki, doğrusal regresyon için A ve B'yi belirler (sadece teklif ve talep için ayrı ayrı olması durumunda) ve bir çizgi çizer. İkincisi, kene değerlerinin bir histogramıdır (kırmızı - Sor, mavi - Bid). Her tik grafiği çubuğu yeni bir tik işaretidir, grafiğin kendi çubuklarıyla çakışmazlar.

Yazıdan anladığım bu kadar. Sıradaki ne? Mantığını anlarsam, bitireceğim.


Bayes formülünü kullanarak olasılıkları hesaplamak istiyorum. Doğrusal regresyon ve bulunan katsayı a yalnızca önceki olasılık P(a)'yı hesaplamak için kullanılır.
 

Diyelim ki likidite sağlayıcıları tarafından verilen belirli bir referans fiyat var ve komisyoncu fiyatları bunun etrafında atlıyor. Bu durumda, her bir komisyoncunun teklifleri "ana fiyat" etrafında bir aralıkta dans edecek ve histogramda bir tür kubbe oluşturacaktır. Kubbe histogramlarını toplarsanız, sonunda şekil olarak normal dağılıma benzeyen bir şey elde edersiniz, katılıyorum.

Ama yine de bize uymuyor, belirli bir komisyoncunun teklifleriyle çalışıyoruz ve normal bir dağılım olması pek mümkün değil. Histogramı biraz izledim, komisyoncu bana maksimum 4000 tik veriyor (bu 20 dakika), hepsini histogram için kullanıyorum. Şekil olarak, daha çok yan tarafında yatan bir yarı elips gibidir. Fiyat yükselmeye / düşmeye başlarsa, elipsin ince bir tarafı büyür, ancak zamanla tekrar şeklini alır. Ancak bazen iki zirve vardır. Bu ortalama rakamı başka bir dağılımla tanımlamayı deneyebilir ve hesaplamalarda kullanabilirsiniz (Gauss değil). Az sayıda kene üzerinde bir histogram yaparsanız, örneğin yüz, o zaman sadece şekilsiz bir sürekli atlama dağılımı vardır, bununla hiçbir şeyin işe yarayacağını sanmıyorum, bin veya daha fazla kene gerekli.

burada histogramın resminde, hızlı fiyat değişiminden sağ üçte biri ortaya çıktı, o zaman bir bütün olarak her şey sol üçte iki şeklini almalıdır.

 
Dr.Trader :

Diyelim ki likidite sağlayıcıları tarafından verilen belirli bir referans fiyat var ve komisyoncu fiyatları bunun etrafında atlıyor. Bu durumda, her bir komisyoncunun teklifleri "ana fiyat" etrafında bir aralıkta dans edecek ve histogramda bir tür kubbe oluşturacaktır. Kubbe histogramlarını toplarsanız, sonunda şekil olarak normal dağılıma benzeyen bir şey elde edersiniz, katılıyorum.

Ama yine de bize uymuyor, belirli bir komisyoncunun teklifleriyle çalışıyoruz ve normal bir dağılım olması pek mümkün değil.

Bu farklı bir konu. Pratik uygulama ile ilgilidir.

Formül (1)'de, olabilirlik işlevi Р(x, y|a, b) gerçek belirli bir aracının gerçek tiklerinin gerçek histogramıdır. Örneğin, penceredeki tüm işaretlerin %12'si y(fiyat)+-aralığı(küme) içindeyse, P(x,y|a,b)=0,12 olasılığı. Profildeki histogramı oluşturuyorum.



Daha sonra düzeltme faktörleri, P(a) ve P(b) önceki olasılıkları gelir. Böylece, P(b) olarak fiyat ARTIRMALARININ normal dağılımını seçtim. Neden, önceki mesajlarda yazılmıştır.

 

İlk gönderideki belgeyi okudum, gerçekten kötü bir şey var.

Pek çok formülde ustalaşmadım, bu yüzden işte sadece ücretsiz bir yeniden anlatım. Yazar, 10 saniye arayla altı ay boyunca bitcoin için teklif verdi ve fiyat istedi. Mevcut fiyatları alacak ve üç sinyal verecek bir program (sınıflandırıcı) yapar - satın al, sat ve basitçe açık pozisyonları tut. Tahmin 10 saniye ileride yapılır. Ve her 10 saniyede bir program yeni veriler almalı ve her şeyi tekrar okumalıdır. Girdi verileri birkaç vektöre bölünür ve fiyatı tahmin etmek için bu vektörleri kullanır. Sınıflandırıcı üç veri dizisini kabul eder - biri son 30 dakika için, ikincisi son 60 dakika için, üçüncüsü son 120 dakika için (her dizi hala 10 saniyelik aralıklarla fiyatlardır). Dahası anlamadım. Formüller bir nöronu çok andırır, yani her girdi değeri belirli bir ağırlığa karşılık gelir. Ancak bu ağırlıklar aynı anda üç diziye uygulanır. Ve sonra aniden ağırlığı bulmanın imkansız olduğu ortaya çıktı (ama bir nöronu var, neden bahsediyor?), Ve tüm seçenekleri denemek zorundasın. Ampirik olarak, yazar, açıkça uygun olmayanı reddederek, ağırlıkların optimizasyonuna yardımcı olması gereken bir formül türetmiştir ve orada bir yerde Bayesian regresyon kullanılır. Başka bir regresyon sonucu muhtemelen sınıflandırıcı için bir girdi değeri olarak kullanılır.

Bana göre, bir öğrencinin dönem ödevi son teslim tarihinden birkaç gece önce yapılmış gibi görünüyor. Kazanç kanıtı yok :)

Bayesian regresyon kullanılmasına rağmen, bazı karmaşık sistemlerin küçük bir parçası olarak var. Belki optimize edilmiş ağırlıklar sayesinde etkisi genellikle sıfıra indirilir. Bir rastgele sayı üretecini veya bir Maya takvimini nörona aynı başarıyla yerleştirebilirim, hepsi aynı, optimizasyon yaparken etkileri sıfıra inecek.

 
İngilizce ilk yazıya hakim değildim. Bayes teoremini başka alanlarda kullanmanın örneklerini bulmaya çalışıyorum. Bayes formülünü kullanarak şu veya bu fiyatın olasılıklarını hesaplamaya çalışıyorum. Ve normal dağılım zorunlu bir nitelik değildir. Şimdiye kadar bu, a priori olasılıklardan birinin hipotezlerinden biridir.
 

Branş konusuyla ilgili iki makaleye rastladım - meraklılarına faydalı olabilir

Madde 1

STAN ile Bayes regresyonu: Bölüm 1 normal regresyon

makale 2

STAN Bölüm 2 ile Bayes regresyonu: Normalliğin ötesinde

Makalelerin her biri aynı isimli iki kitap için reklam niteliğindedir.

Bayesian regression with STAN: Part 1 normal regression
Bayesian regression with STAN: Part 1 normal regression
  • Lionel Hertzog
  • datascienceplus.com
This post will introduce you to bayesian regression in R, see the reference list at the end of the post for further information concerning this very broad topic. Bayesian regression Bayesian statistics turn around the Bayes theorem, which in a regression context is the following: $$ P(\theta|Data) \propto P(Data|\theta) \times P(\theta) $$...
 

Siz - mühendisler, fizikçiler, radyo operatörleri - çok garipsiniz .....

Burada size birçok kez kotaların, algo tüccarlarının, piyasa yapıcıların salak olmadıkları, matematikte çok iyi oldukları, onlara yılda SADECE 100K+ yeşil + ikramiye ödenmediği söylendi, ama hepiniz öyle görünmüyorsunuz. anla.

Döviz piyasasındaki fiyat, bir KOMPLEKS sisteminin kendi kendini ifade etmesidir, bu nedenle herhangi bir yararlı (az ya da çok yeterli) fiyat modeli BASİT OLAMAZ. Evet, içeride Bayes regresyonu olabilir, ancak sadece yardımcı bir sayısal yöntem şeklinde. Ve burada sürüyü "hastalığınız, ama şimdi Bayes ile tek başımıza ezeceğiz!" için acele ediyorsunuz.

Pekala, tamam, belki bu size yardımcı olabilir: büyük piyasa yapıcılar, bankalar ve hedge fonları tarafından ticarette aktif olarak kullanılan matematiksel yöntemlerin bir listesi. Bu liste aynı zamanda dar özelliklere, yani işlem gören finansal araç türlerine ve bankalardaki tahmin türlerine göre de bölünmüştür. Bu liste ESKİ kıdemli bir Citi ve JPMorgan çalışanı tarafından yayınlanmıştır. Bu liste sır değildir, finansal matematik (İngilizce) üzerine 5-10 kitaptan hesaplanabilir. Ancak Rus forumunda ve hatta bu kadar eksiksiz bir biçimde - bu liste nadirdir.

Veri Bilimcisi, İstatistikçi
25000 UAH
Açık pozisyon açıklaması
MESLEKİ GEREKLİLİKLER (en çok hareket halindeyken öğrenme arzusuna değer veriyoruz)

İleri İstatistik ve zaman serileri bilgisi: Stokastik süreçler Araçlar: SSA/SVD, RSSA, FIMA/ARFIMA, Doğrusal Olmayan Otoregresif Dışsal Model (NARX), (N)GARCH ve türevleri, Hurst Üssü ve uygulamaları, Tekrarlama niceleme analizi (RQA)
Python'da programlama deneyimi (veya öğrenmeye hazır) (ve İstatistiksel her şey için kitaplık seti)
Python'daki veri analizi kitaplıkları (theano, keras, Torch, Pandas, NumPy, scikit-learn) veya R'deki eşdeğerleri
Makine Öğrenimi, işbirlikçi filtreleme, küme analizi, Grafik Teorisi ile ilgili biraz deneyim
diğer harmanlanmış yaklaşımlar: ANFIS (uyarlanabilir ağ tabanlı bulanık çıkarım sistemi)
Sinir Ağları: denetimsiz öğrenme: RNN (Tekrarlayan Sinir Ağları), FNN, RBF, vb.

GÖREVLER VE ORTAM:
finansal verilerin istatistiksel analizi, ekonometrik uygulamalar

Moderatörler: Lütfen orijinal kaynağa yanlışlıkla silinmeyen ve çabucak silinmeyen bağlantıyı silin, yapamam, hala bu yazının altbilgisinde forum veritabanınızda asılı duruyor. Ve bunun bir reklam olduğunu düşünüyorlar. Teşekkür ederim.

Все вакансии компании TenViz LLC
Все вакансии компании TenViz LLC
  • www.work.ua
New York, US, based product (services) company with growing sales on 3 continents and 25−35 employees and contractors. We have a growing team in Ukraine, and are hiring full- and part-time people with...
 
Makine Öğrenimi, Sinir Ağları analisti
28000 UAH

Açık pozisyon açıklaması

MESLEKİ GEREKLİLİKLER (en çok hareket halindeyken öğrenme arzusuna değer veriyoruz):

Aşağıdakiler dahil olmak üzere Yapay Sinir Ağları ve Makine Öğrenimi Bilgisi:

İleri Beslemeli Sinir Ağı (FNN)
Tekrarlayan Sinir Ağları (RNN) ailesi: Uzun-Kısa Süreli Bellek Modeli (LSTM) dahil
CNN - Evrişimli Sinir Ağları
Radyal Temel Fonksiyonu (RBF)
harmanlanmış yaklaşımlar ANFIS (Adaptive Network-based Fuzzy Inference System)
Python'da programlama deneyimi (veya öğrenmeye hazır) (ve İstatistiksel her şey için kitaplıklar seti)
Python'da Makine Öğrenimi ve veri analizi kitaplıkları (theano, keras, Torch, Pandas, NumPy, scikit-learn)
ek olarak, iyi R ve/veya Matlab bilgisi yardımcı olacaktır.

İLGİLİ BİLGİ ALANLARI:

Gelişmiş İstatistik ve zaman serileri bilgisi (Stokastik süreçler ve Araçlar): ARFIMA, Doğrusal Olmayan Otoregresif Dışsal Model (NARX), Dalgacık Dönüşümleri
spektrum tahmin modelleri — Tekil Spektrum Analizi (SSA) (SVD)
İşbirlikçi filtreleme, Küme analizi, Grafikler Teorisi

GÖREVLER (öncelikli sıra):

finansal verilerin istatistiksel analizi, ekonometrik uygulamalar
Büyük hacimli finansal piyasa verileri üzerinde etkileşimli dağıtılmış sorgu işleme için hizmetler ve çerçeveler oluşturmak
Neden: