Ticarette makine öğrenimi: teori, pratik, ticaret ve daha fazlası - sayfa 50

 
mytarmailS :

Bu aptal olmayan adam bile 10. dakikadan itibaren izleyin diyor.

https://www.youtube.com/watch?v=KUdWTnyeBxo&list=PLDCR37g8W9nFO5bPnL91WF28V5L9F-lJL&index=3

Videoda mesele tam olarak Fourier serisini uygulamak değil, verileri başka bir uzaya aktarmak için (nükleer dönüşüm) bir işlevle işlemek. Resimler, HSL renk paletine, sese - bir frekans histogramına çevrilmek üzere sunulmaktadır. Bütün bunlar verileri değiştirecek, ancak gerekirse ters bir işlevle kolayca geri yüklenebilirler. Bu dönüşüm, sınıflandırmayı basitleştirmek için dönüşümden sonraki sınıfların çok boyutlu bir uzayda birbirine daha kolay gruplandırılması için bir şekilde mantıklı olmalıdır. Herhangi bir dönüşümden sonra, sınıflar uzayda öncekinden daha fazla karışırsa, bu eylemde iyi bir şey yok, sadece daha da kötüleşecek.

Fourier kullanılması tavsiye edilmediğinden gerekli değildir. Örneğin Alexei, ham değerler yerine çubuklar arasında delta almayı önerir. libVMR'deki Yuri, çeşitli matematiksel dönüşümler kullandı, ayrıca ilginç, Java'daki kaynak kodunu görün. Ana bileşenlerin yöntemine göre verileri ayrıştırabilir ve bileşenleri nörona besleyebilirsiniz, SanSanych ve ben bununla ilgili makaleler ve örnekler burada yayınladık. Yapmak istediğinin yüzlerce çözümü var, Fourier bunlardan sadece biri.

Veya düzinelerce katmana sahip bir nöron alabilirsiniz, herhangi bir nükleer dönüşüm olmadan ham veriler üzerinde çözecektir. Ancak düzenleme, çapraz doğrulama vb. ile ilgili birçok sorun olacaktır.

Ve bu yöntemlerin hiçbiri girişteki çöp probleminden kurtulmaz. Girişte çöp -> dönüşümden sonra çöp -> çıkışta çöp -> ön testte tahliye.

 
mytarmailS :

Tek bir soru vardı: Fonksiyonlar arasındaki benzerlikleri genlik, faz ve frekans üzerinden ölçmek mümkün müdür, varsa nasıl yapılıyor?

TÜMÜ!!! artık ilgilenmiyorum..

Fourier hakkında yazılan diğer her şey SS'nin cevabının bir sonucudur ve sorumla hiçbir ilgisi yoktur.

Fonksiyonlar periyodik ise, o zaman mümkündür. Periyodik değilse, iki fonksiyonun kenarları (başlangıç - 0 argüman değerinde ve periyodun sonunda - argüman değeri 2*PI) karşılaştırılırken hatalar olacaktır.
 
Dr.Tüccar :

Videoda mesele tam olarak Fourier serisini uygulamak değil, verileri başka bir uzaya aktarmak için (nükleer dönüşüm) bir işlevle işlemek.

Veya düzinelerce katmana sahip bir nöron alabilirsiniz, herhangi bir nükleer dönüşüm olmadan ham veriler üzerinde çözecektir.

Bu videodaki nükleer dönüşümler, tahmin edici çiftlerinin görselleştirilmesiyle manuel olarak seçilir. Onlar. uygun çiftleri görsel olarak bulacak ve onlar için uygun bir nükleer dönüşüm seçecek bir insan uzmanına ihtiyaç vardır.

Dr.Tüccar :


Veya düzinelerce katmana sahip bir nöron alabilirsiniz, herhangi bir nükleer dönüşüm olmadan ham veriler üzerinde çözecektir.

Sadece anlaşılmamakla kalmayıp, daha da kafa karıştıracak bir video. Ek olarak, hata geri yayılım yöntemleri pratik olarak çıkış katmanından uzaktaki katmanlardaki ağırlıkları düzenlemez - sinyal oraya ulaşmaz ve ulaşırsa çok zayıftır.


Dr.Tüccar :


libVMR'deki Yuri çeşitli matematiksel dönüşümler kullandı, bu da ilginç, kaynak kodunu java'da görün


Farklı değil, ancak argümanların grup muhasebesi (GMDH) A. G. Ivakhnenko yöntemine göre algoritmik olarak düzenlenmiştir. Rastgele alırsak, yani herhangi bir yapı olmadan çöp alırsınız.


 
Yuri Reshetov :
Fonksiyonlar periyodik ise, o zaman mümkündür. Periyodik değilse, iki fonksiyonun kenarları (başlangıç - 0 argüman değerinde ve periyodun sonunda - argüman değeri 2*PI) karşılaştırılırken hatalar olacaktır.

Uçlarda hala bozulmalar olacağını anladım ve kenara ne kadar yakınsa o kadar güçlü, üzgünüm, işe yaramayacak ....

Dr.Tüccar

sinir ağınız nasıl? eğitimli?

 

Bir sitede böyle bir not daha buldum, nedense zaten çalışmıyor

Belki biri ilgilenir:

“…. Tavsiyelerinize uyarak birkaç robot modeli yaptım, robotlar eğitiliyor, yeni verilerde bir şeyler tanıyorlar, ancak ne yazık ki sonuçlar hala gerekenden çok uzak.

….İlk olarak, ilk ikincil öznitelik setini elde etmek için alçak geçiren filtrelere bir polinom harmonik uyumu uyguladım, bir filtre kısa vadeli trend için, ikinci filtre uzun vadeli trend için. Frekansları, genlikleri cos ve sin, katsayıları P'yi ikincil işaretler olarak aldım... Ağ öğrendi, ancak genelleştirmeye sahip değildi.

…Bir sonraki adım yeni bir modeldi: kapanış fiyatına düşük geçişli bir filtre uygulayın (2. dereceden bir Butterworth filtresi kullandım), bir polinom-harmonik yaklaşım uygulayın, A*cos(wx)+B*sin(wx) dönüştürün M*sin (wx+f) formuna dönüştürün ve M ve f'yi ikincil öznitelikler olarak alın.

…. Ve bu modelle, çok iyi genelleme özelliklerine sahip bir ağ kurmayı başardım: yeni verilerle hemen hemen her şeyi doğru bir şekilde tanıdı.

Polinom-harmonik yaklaşım çok zaman alıyor, bu yüzden başka bir model yapmaya karar verdim: bantların frekans üzerinde düzgün dağılımına sahip bir dizi bant geçiren filtre, bunları kapanış fiyatlarından alçak geçiren filtreye uygulayın, ardından Hilbert'i uygulayın. onlara dönüştürün. Yapay pazar modeli için, yeni verileri başarıyla tanıyan bir ağ oluşturmak da mümkün oldu.

Ondan sonra bu modeli gerçek alıntılara uyguladım:

- Kapanış fiyatını uyarlanabilir bir alçak geçiren filtre ile filtreleyin.

— piyasa dalgalarını belirlemek için bir dizi bant geçiren filtre oluşturuyoruz.

- Hilbert dönüşümünü uygulayın.

— ikincil özelliklerin ilk seti: bant geçiren filtre değerleri, anlık genlik ve fazlar değerleri.

- kapanış fiyatından düşük geçişli bir filtre oluşturuyoruz.

- ikinci ikincil işaretler grubu - son mumun fiyatının yakın ve düşük değerlerinin, LF filtresinin değerinden destek ve direnç seviyelerinin nispi sapması, bir çubuktaki nispi hacim (göreceli olarak). ortalama değer).

- bir eğitim örneği oluşturun.

Sonuç şudur: ağ eğitilir, ancak yeni veriler üzerinde iyi çalışmaz. Bir yerde düşükleri doğru bir şekilde tahmin eder ve genel olarak bir yerde "ne yapması gerektiğini unutur". Daha önce yaptığımla karşılaştırıldığında, sonuç niteliksel olarak farklı bir düzeyde görünüyor, ancak bu benim öznel görüşüme göre. Evet. Açıklığa kavuşturmak için, her yerde temel kuralları takip ettim: ağ giriş özelliklerinin sayısı (bu durumda bunlar ikincil özelliklerdir) < eğitim örnek boyutu / 10, gizli katmandaki nöronların sayısı ağ sayısından fazla değil girdiler ... ”Umarım mektuptan bu alıntılar size özellik aramaya yönelik olası yaklaşımlar hakkında bir fikir verir.

 
mytarmailS :

Uçlarda hala bozulmalar olacağını anladım ve kenara ne kadar yakınsa o kadar güçlü, üzgünüm, işe yaramayacak ....

Uygun olup olmadığı sorusu çok önemsiz bir şekilde çözüldü. İlk önce, işlevi bir Fourier serisine genişletin, ardından ters dönüşümle elde edilen seriden geri yükleyin. Ve genişlemeden önceki ilk işlevi ve geri yüklenen işlevi karşılaştırın. Geri yüklenen işlev orijinalinden temel olarak farklıysa, bu yöntemin işe yaramayacağı oldukça açıktır.

Periyodik olmayan fonksiyonlar için dalgacık dönüşümlerinin kullanılması tavsiye edilir. Şahsen kendim denemedim. Ancak görüntünün önce dalgacıklar tarafından nasıl sıkıştırıldığına ve daha sonra bazı bozulmalarla birlikte, ancak Fourier dönüşümlerinden elde edilen bozulmalarla karşılaştırıldığında görsel olarak çok belirgin olmamasına rağmen geri yüklendiğine bakılırsa, dalgacıkların periyodik olmayan seriler için daha yeterli olduğu oldukça açıktır. Fourier dönüşümlerine. Teklif VR'lerine dalgacıkları uygulamada pratik deneyim eksikliğinden dolayı, burada hangi belirli dalgacıkların en uygun olduğu hakkında faydalı bilgiler paylaşamam. Ve bir vagon ve küçük bir araba var.

mytarmailS :

sinir ağınız nasıl? eğitimli?

Hangi görevleri ve verileri arıyorsunuz? Üzerine rastgele bir sayı örneği koyarsanız, yemin eder: "Çöp içeri, Çöp dışarı". Ve bir örnek anlamlı tahmin ediciler verirseniz, o zaman genelleme yeteneğinin değerlerini verir. En azından bir düzine tahmin edici ve birkaç bin örnekten oluşan bir örnek için o kadar uzun süre eğitim almaz.
 
Yuri Reshetov :

Uygun olup olmadığı sorusu çok önemsiz bir şekilde çözüldü. İlk önce, işlevi bir Fourier serisine genişletin, ardından ters dönüşümle elde edilen seriden geri yükleyin. Ve genişlemeden önceki ilk işlevi ve geri yüklenen işlevi karşılaştırın. Geri yüklenen işlev orijinalinden temel olarak farklıysa, bu yöntemin işe yaramayacağı oldukça açıktır.

Muhtemelen bunu yapacağım.... Önce genel olarak ne yaptığımı ve neye karar vermem gerektiğini anlatacağım sonra bu konudaki önerilerinizi söyleyeceksiniz çünkü kafam karıştı gibi geliyor hepiniz ...
 

Tarihten biraz önce....

Bu prensibe göre tarihteki kalıpları arayarak başladım:

1) mevcut fiyatımız var - son 20 mum olsun

2) tarih boyunca dolaşıyoruz ve geçmişte benzer bir durum arıyoruz (yakınlık Pearson korelasyonu ve Öklid ile ölçüldü)

3) Böyle bir durum bulduğumuzda nasıl bittiğine bakarız - büyüme mi düşüş mü

4) bu tür birçok analog bulunduğunda, bir tür avantajla bazı istatistikler toplayabilirsiniz, örneğin 10 analog bulundu

8'i büyümede, 2'si düşüşte sona erdi, işte fiyata ne olacağına dair bir tahmin :)

Yani, Ivakhnenko'nun "analogları karmaşıklaştırma yöntemi - modelsiz tahmin" "MGUA" sına benzer bir şey yaptım sadece çok daha ilkel var

Dolayısıyla bu yaklaşımın birkaç nedenden dolayı işe yaramadığı ortaya çıktı.

1) istenen vektörde ne kadar fazla mum olursa, tarihte o kadar az analog bulunabilir, pratikte, tüm OHLC fiyatlarını ve Pearson korelasyonunun doğruluğunu > 0.93 alırsak, 3 mum vektörü sınır olacaktır ve normal bir tahmin için önemli ölçüde daha büyük bir vektöre ihtiyacınız var

2) pratikte, piyasada hemen hemen aynı fiyat durumları yoktur....

3) Ve vektörü artıramayacağımız ortaya çıktı çünkü doğrulukta çok şey kaybedeceğiz ve hala yapabilirsek, aynı durumlar olmadığı için hala büyük bir vektör üzerinde bir analog bulamayacağız.

Çözüm bulundu...

 
Yuri Reshetov :

Hangi görevleri ve verileri arıyorsunuz? Üzerine rastgele bir sayı örneği koyarsanız, yemin eder: "Çöp içeri, Çöp dışarı". Ve bir örnek anlamlı tahmin ediciler verirseniz, o zaman genelleme yeteneğinin değerlerini verir. En azından bir düzine tahmin edici ve birkaç bin örnekten oluşan bir örnek için o kadar uzun süre eğitim almaz.

Selamlar!!!! LibVMR kullanıyorum Ama eski sürümü görüyorum çünkü "Kötü Veri" hatası çöküyor. Yeni bir sürüm olduğunu anlıyorum. nereden indirebilirim??? Eğer mümkünse??
 
mytarmailS :

Tarihten biraz önce....

Bu prensibe göre tarihteki kalıpları arayarak başladım:

1) mevcut fiyatımız var - son 20 mum olsun

2) tarih boyunca dolaşıyoruz ve geçmişte benzer bir durum arıyoruz (yakınlık Pearson korelasyonu ve Öklid ile ölçüldü)

Pek net değil mi? Kalıplar veya dönüşümleri için fiyatları OHLC biçiminde alıyor musunuz?

Gerçek şu ki, OHLC'yi olduğu gibi alırsak, o zaman benzer bir model, ancak karşılaştırılandan 1000 puan daha yüksek veya daha düşük, Öklid mesafesine göre tamamen farklı bir modelden daha fazla farklılık gösterecektir, ancak karşılaştırılandan 10 puan daha yüksek veya daha düşük olacaktır. . Ayrıca, fark iki büyüklük mertebesi olacak ve buna göre karşılaştırma hatası da iki mertebeden olacaktır.

Neden: