Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 18

 

Fikir kategorisinden:

Aşağıdaki sistemi tamamen MQL4'te oluşturmaya çalıştım:

bir girdi vektörü oluşturdu (sadece gecikmeli fiyatlar arasındaki fark)

ideal girişler ve çıkışlar oluşturdu (birçok yöntem var, hoşuma gideni aldım)

Bütün bunlar 5 dakikalık, örneğin barlar.

Ardından, her yeni çubukta diziyi doldurdum ve buna ek olarak, geçmişten gelen benzer kalıpları bulmaya çalıştım ve çok boyutlu değişken yarıçaplı bir küredeki alım satım girişlerinin yüzdesini saydım. Bu şey çok uzun zamandır test edildi. Sonuçlar kararsızdı.

Böyle bir çalışmayı R'de bir şekilde tekrar denemek isterim. Yani Öklid mesafesine göre bir giriş ve çıkış arayışıdır.

 
mytarmailS :

Küme biraz farklı, diyelim ki şimdi pazar 5 numaralı kümeye tekabül ediyor, bir sonraki mum zaten 18 numaralı küme olacak, bu bize hiçbir şey vermeyecek çünkü 5 numaralı kümeyi ticarete ayıracak vaktimiz olmayacak ve SMM'de bir devlet kavramı vardır, devlet bir süre sürebilir

Ya da belki fikrini anlamadım?

Bir dizinin uzun dizileri kümelenir (en az 100 mum). Bu uzun dizilere dayalı olarak bir sürü giriş yapabilirsiniz. Ve bir noktada sistem, küme 5'ten küme 45'e hareket eder, ancak tabiri caizse sorunsuz gerçekleşir.
 
Alexey Burnakov :

Fikir kategorisinden:

Aşağıdaki sistemi tamamen MQL4'te oluşturmaya çalıştım:

bir girdi vektörü oluşturdu (sadece gecikmeli fiyatlar arasındaki fark)

ideal girişler ve çıkışlar oluşturdu (birçok yöntem var, hoşuma gideni aldım)

Bütün bunlar 5 dakikalık, örneğin barlar.

Ardından, her yeni çubukta diziyi doldurdum ve buna ek olarak, geçmişten gelen benzer kalıpları bulmaya çalıştım ve çok boyutlu değişken yarıçaplı bir küredeki alım satım girişlerinin yüzdesini saydım. Bu şey çok uzun zamandır test edildi. Sonuçlar kararsızdı.

Böyle bir çalışmayı R'de bir şekilde tekrar denemek isterim. Yani Öklid mesafesine göre bir giriş ve çıkış arayışıdır.

Ben de benzer bir şey yaptım, ben de Euclid ve Pearson korelasyonu üzerinden yakınlık aradım, Euclid 0.27'den küçük olmalıydı ve korelasyon 0.97'den fazlaydı yani örüntüler hemen hemen bire bir bulundu, benzerlikler bir dizide arandı. 4 fiyatın tümü için üç mum serisi OHLC + hacim + oynaklık , fiyatlar normal, fark yok, sadece ölçeklendi ve ortalandı (ölçek, merkez) sonuç, daha önce yazdığım gibi, fiyat kendi tahminlerine aykırıdır. -0.6 -0.9 ters korelasyon, korkarım çapraz doğrulama bile burada yardımcı olmayacak, en azından Öklid uzayında, belki de bu, %99'unun paralarını neden tükettiğinin cevabıdır.
 
Alexey Burnakov :
Bir dizinin uzun dizileri kümelenir (en az 100 mum). Bu uzun dizilere dayalı olarak bir sürü giriş yapabilirsiniz. Ve bir noktada sistem, küme 5'ten küme 45'e hareket eder, ancak tabiri caizse sorunsuz gerçekleşir.
Öyle bir şey var ki, 100 mumluk bir dizi üzerinde bir küme yaparsak, bunun 5 numaralı kümenin 101 mum üzerinde 5 numaralı küme olduğunu, yani 100 mum üflediğini öğreneceğiz) ve SMM'de, 45 numaralı kümede olmak, olasılığın ne olduğunu zaten biliyoruz, 5 numaralı kümeye geçeceğiz
 

Ve R uzmanları için başka bir soru

kitaplık (kza)

DAT <- norm(1000)

KZP <- kzp(DAT,m=100,k=3)

özet(KZP, basamak=2 , üst=3)


bu rakamlarla çalışabilmem için bunu "özet"ten nasıl çıkarabilirim http://prntscr.com/bhtlo9

Скриншот
Скриншот
  • prnt.sc
Снято с помощью Lightshot
 
Dr.Tüccar :


Bugün yordayıcı seçme işlevinizi test etmeye çalışıyorum, r-blogger'lar hakkında bir makale okumaya çalıştım ama İngilizce bilmediğim için. Gerçekten hiçbir şey anlamadım, bu seçim yönteminin özü nedir, nasıl çalışıyor, anlaşılır bir dille bana açıklar mısınız?

Tamamen sezgisel olarak ve ilk test sonuçlarına dayanarak, bu yöntemin ana bileşen yöntemine çok benzediğinden ve hatta belki de aynı olduğundan şüpheleniyorum...

ilk testte 30 tahmin ediciden oluşan bir örnek vardı, eğitilmiş RF hatası çıktı Doğruluk: 0.6511

sonra yönteminle bir seçim yaptın

14 tahminci çıktı hata çıktı Doğruluk : 0.6568

aslında, tahmin edicilerin yarısını ayıkladık ve tahmin sonucunu biraz geliştirdik, ki bu fena değil

Diğer veri kümelerini deneyeceğim ...

Ve başka bir soru, neden aynı veriler çıngıraklara yüklenirse, test verilerinde hata% 3-6'dır, bunu nasıl anlayabilirim?

 
mytarmailS :
Öyle bir şey var ki, 100 mumluk bir dizi üzerinde bir küme yaparsak, bunun 5 numaralı kümenin 101 mum üzerinde 5 numaralı küme olduğunu, yani 100 mum üflediğini öğreneceğiz) ve SMM'de, 45 numaralı kümede olmak, olasılığın ne olduğunu zaten biliyoruz, 5 numaralı kümeye geçeceğiz
Hiçbir şey israf edilmedi. İlk ölçümde kümeyi tanıyacağız. sonra bir dizi küme değişikliği olacaktır. Kümeden kümeye geçiş noktalarında, bir kare matris oluşturabilir ve ticaretin MO'sunu değiştirebilirsiniz: n kümesinde satın alma girin, m kümesinde anlaşmayı kapatın. Sonra hücreler için aynı matris. Tüm seçenekler sadece sıralanır. Ve kümeleme parametrelerini değiştirebilir ve sonuca bir döngü içinde bakabilirsiniz.
 
mytarmailS :

Bugün yordayıcı seçme işlevinizi test etmeye çalışıyorum, r-blogger'lar hakkında bir makale okumaya çalıştım ama İngilizce bilmediğim için. Gerçekten hiçbir şey anlamadım, bu seçim yönteminin özü nedir, nasıl çalışıyor, anlaşılır bir dille bana açıklar mısınız?

Tamamen sezgisel olarak ve ilk test sonuçlarına dayanarak, bu yöntemin ana bileşen yöntemine çok benzediğinden ve hatta belki de aynı olduğundan şüpheleniyorum...

ilk testte 30 tahmin ediciden oluşan bir örnek vardı, eğitilmiş RF hatası çıktı Doğruluk: 0.6511

sonra yönteminle bir seçim yaptın

14 tahminci çıktı hata çıktı Doğruluk : 0.6568

aslında, tahmin edicilerin yarısını ayıkladık ve tahmin sonucunu biraz geliştirdik, ki bu fena değil

Diğer veri kümelerini deneyeceğim ...

Ve başka bir soru, neden aynı veriler çıngıraklara yüklenirse, test verilerinde hata% 3-6'dır, bunu nasıl anlayabilirim?

1. Kullanılan, bazı modifikasyonlarla ana bileşenler yöntemidir.

2. Bu yöntemi uygulamanın ana fikri, tahminin doğruluğunu artırmak değildir. Ana fikir, elde edilen tahmin doğruluğunun gelecekte yaklaşık olarak aynı kalacağıdır. Pratikte ve bunu test edenlerden biliyoruz, optimizasyon yoluyla Uzman Danışmanlardan inanılmaz veriler elde etmek neredeyse her zaman mümkündür. Ancak gelecekte sıkıcı bir monotonlukla bu kâseler depoyu boşaltır. Bunun nedeni, eğitim sırasında danışmanın gelecekte tekrarlanmayacak bazı ayrıntıları yakalamasıdır. Bu tür ayrıntılar, hedef değişkenle ilgili olmayan öngörücüler olduğu için özellikle uygundur, yani. gürültü, ses. Bir modeli R'ye optimize ederken veya sığdırırken, bu gürültüden performansı önemli ölçüde artırabilecek bazı değerleri her zaman seçebilirsiniz. Ancak gelecekte bu olmayacak ve danışman birleşecek.

Bu nedenle, bir kez daha: eğitim setinde ve gelecekteki alıntılarda modelin performansındaki farklılıkları ortadan kaldırmanıza izin veren bir araç kullanıyorsunuz. Bana göre, ancak yeniden eğitim sorununu çözerek yolumuza devam edebiliriz.

3. %10'dan az ve hatta %5'ten fazla bir hata, modelin fazla uydurma olduğunun açık bir kanıtıdır. Ve modelin fazla uydurması, modelin kendisinden değil, bir dizi girdi öngörücüsünden kaynaklanmaktadır.

 
San Sanych Fomenko :


3. %10'dan az ve hatta %5'ten fazla bir hata, modelin fazla uydurma olduğunun açık bir kanıtıdır. Ve modelin fazla uydurması, modelin kendisinden değil, bir dizi girdi öngörücüsünden kaynaklanmaktadır.

Soru, aynı veri ve aynı model üzerinde R ve çıngırakta farklı sonuçların neden farklı olduğu değil.

İkinci soru: Eğer şeytanı gösteriyorsa, "örnek dışı" modeli çıngırak için kontrol etmenin anlamı nedir?

 
mytarmailS :

Soru, aynı veri ve aynı model üzerinde R ve çıngırakta farklı sonuçların neden farklı olduğu değil.

İkinci soru: Eğer şeytanı gösteriyorsa, "örnek dışı" modeli çıngırak için kontrol etmenin anlamı nedir?

Muhtemelen r ve çıngıraklı ormanlar oluşturmak için farklı parametreleriniz vardır, bu nedenle sonuçlar farklıdır. Çıngırakta, ağaç ve değişkenlerin sayısını da değiştirebilirsiniz.

Ve eğitim verilerindeki tıkırtıda %34 ve test verilerinde %3 hata mı var? Test verilerinde bir yanlışlık var, ya bir şekilde eğitim verilerinde zaten var ya da çok küçük bir veri kümeniz var ve bu böyle oldu.

Neden: