Başkalarının algoritmalarını kullanmıyorum.
Kulibin'in ruhunun kesinlikle iyi olduğu açıktır, ancak en ilginç ve gerekli olanı zaten icat edilmiştir ve tamamen görünür durumdadır. Yab, dünya çapında onlarca yıllık araştırmaların sonuçlarından vazgeçmedi.
Bende de var, kazananlar da var ama her zaman değil ama ben her zaman (veya neredeyse her zaman) istiyorum. Ve ancak o zaman tavsiye verebilirim.
Kumbaraya! Anlamadığınız yerleri tavsiye vermeye başladığınızda her zaman ekleyeceğim :)
rapor? beni burada boş ifadelerinle bitireceksin
Ölü bir attan anlaşılır bir şey sunmasını istemenin faydasız olduğunu çoktan anladım, inip tepki vermemek daha kolay
13x6400 matris ile 2 dakika çalıştıktan sonra (örneğe göre 10 kat daha fazla)
Bu olur
Hata: 3.2 Gb vektör yerleştirilemiyor
Ve 12-13 GB almaya çalışıyor ama toplamda 16 GB'ım var
R genellikle biraz bellek kaplar. Zaten 12-13 aldı, 3 tane daha istiyor ve daha sonra ne kadarına ihtiyaç duyulacağı bilinmiyor.
Matrisi küçülttüm - 13x500'ü bile hesaplayamadım... Görünüşe göre, kalıpsız piyasa verileri onu deli ediyor))). Şeker hastalığını glikoz ile belirlemek size göre değil.
Piyasa verileri olan biri denedi mi? Herhangi bir gelişme?
Sonunda ... 13x100 ile başardım: (ama elbette 100 satırlık bir şeyi filtrelemek aptalca). 2 numaralı girişin en önemli olduğu ortaya çıktı, önceki paketlere göre sonundaydı. Görünüşe göre bu, tahminin 6400 için değil, 100 satır için olması gerçeğinden kaynaklanmaktadır.
Sıralı değişkenler (azalanönem ):
2 5 10 12 6 4 7 8 9 1 11
Puanlar 0.24 0.025 0.019 -0.048 -0.05 -0.055 -0.057 -0.05 -0.063 -0.067 -0.072
3
Skorlar NA
---
Puan matrisi:
2 5 10 12 6 4 7 8 9 1 11
2 0.24
5 0.128 0.025
10 0.186 -0.002 0.019
12 0.015 -0.043 -0.051 -0.048
6 0.086 -0.053 -0.011 -0.068 -0.05
4 0.066 -0.029 -0.073 -0.054 -0.065 -0.055
7 0.134 -0.088 -0.101 -0.188 -0.121 -0.099 -0.057
8 0.12 -0.202 -0.069 -0.1 -0.068 -0.089 -0.061 -0.05
9 0.092 -0.004 -0.138 -0.097 -0.088 -0.069 -0.112 -0.088 -0.063
1 0.086 -0.06 -0.088 -0.107 -0.083 -0.084 -0.066 -0.081 -0.076 -0.067
11 0.095 -0.017 -0.183 -0.115 -0.083 -0.078 -0.066 -0.086 -0.066 -0.082 -0.072
3 0.059 -0.132 -0.102 -0.146 -0.114 -0.126 -0.109 -0.113 -0.131 -0.117 -0.135
Hey!
AI nöro robotu hazır mı?
Bir şans ver. )))
bu arada, bir kene botu yapmayı öğrendim - böylece test cihazındakiyle aynı şekilde çalışır)))
Greta'ya Giriş
Greta'ya şaşırdım. Tensorflow ve reticulate paketlerinin sonunda R geliştiricilerinin derin öğrenme uygulamalarının ötesine bakmasına ve her tür üretim düzeyinde istatistiksel uygulama oluşturmak için TensorFlow platformundan yararlanmasına olanak sağlayacağını varsaymıştım. Ama Bayesçi düşünmüyordum. Sonuçta Stan , muhtemelen bir Bayes modelcisinin isteyebileceği her şeydir. Stan, kaygan bir R arayüzü , derin belgeler ve özel bir geliştirme ekibi ile güçlü, üretim düzeyinde bir olasılık dağılımı modelleme motorudur.
Ancak greta, kullanıcıların TensorFlow tabanlı Bayes modellerini doğrudan R'de yazmasına izin verir ! Daha çekici ne olabilir? greta, bir ara modelleme dili öğrenmenin önündeki engeli kaldırırken, TensorFlow'un gidebileceği her yerde çalışan yüksek performanslı MCMC modelleri sunmaya devam etmeyi vaat ediyor.
Bu yazıda, sizi Richard McElreath tarafından ikonoklastik kitabının 8.3 bölümünde kullanılan basit bir modelle greta ile tanıştıracağım: İstatistiksel Yeniden Düşünme: R ve Stan'da Örneklerle Bayes Kursu . Bu model, bir ülkenin Afrika'da olup olmadığını kontrol ederken, bir ülkenin GSYİH'sının bir arazi sağlamlığı ölçüsüne dayalı olarak günlüğünü açıklamaya çalışır. Bunu sadece greta ile MCMC örneklemesini göstermek için kullanacağım. Bununla birlikte, McElreath'in kitabındaki genişletilmiş örnek, modelleme etkileşimlerinin incelikleri üzerine bir meditasyondur ve incelenmeye değerdir.
Öncelikle gerekli paketleri yüklüyoruz ve verileri alıyoruz. DiagrammeR, modelin TensorFlow akış diyagramını çizmek içindir ve bayesplot, Markov zincirlerinin iz diyagramlarını çizmek için kullanılır. 234 için 52 değişken sağlayan sağlam veri seti oldukça ilginçtir, ancak sadece 170 ilçe ve üç değişken içeren kısaltılmış bir veri seti kullanacağız.
Kullanım kodu aşağıdadır.
Merhaba bisiklet mucitleri!
)))
İlk arama için “peng” (daha hızlı) veya “esteves” kullanılması tavsiye edilir.
(büyük veri kümeleri için daha güvenilir ancak çok daha yavaş) ve
değişkenler büyükse (>100), "ileri" aramayı "n.var = 100" ile sınırlandırın. bu
ilerleme çubuğu size kalan çalışma süresi hakkında bir fikir verecektir.
kitaplık (varrank)
data(nassCDS, paket = "DAAG")
nassCDS.varrank <- varrank(data.df = nassCDS,
yöntem = "kalem" ,
değişkenler.önemli = "ölü",
ayrıklaştırma.method = "sturges",
algoritma = "ileri",
şema = "orta",
ayrıntılı = YANLIŞ)
özet(nassCDS.varrank)
arsa(nassCDS.varrank, notex = 0,5)
Bu özel algoritma, tahmin edicileri iyi mi yoksa kötü mü seçiyor?
Genel olarak, yordayıcıların seçiminde iyi olan ve kötü olan nedir?
Tahmin edicilerin seçimini herhangi bir modelin performansıyla ilişkilendirmek yüzeydedir.
Benim için bu ikinci adım.
İlk adımda, modelin gelecekteki davranışının geçmişteki davranışına karşılık gelmediği bir durum olan modelin aşırı uyum sorununu çözmek DAİMA gereklidir. Bu konuyla ilgili herhangi bir düşüncemiz yoksa, o zaman bunların hepsi bir sayı oyunudur.
Yazınıza dönersek.
Pencerenin hareketi sırasında tahmin edicilerin ÖNGÖRÜCÜ GÜCÜ çok az değişirse, modelin gelecekteki davranışının geçmiş verilerdeki davranıştan çok farklı olmayacağına inanıyorum.
İşte paketin hesapladığı sıralar, bazı tahmin edicilerde değişecek mi, değişmeyecek mi? Sonucun farklı tahmin edici kümeleri için farklı olabileceği açıktır, ancak (yukarıda yaptığım gibi) benzer gönderiler burada yayınlanırsa ...