Mat araştırma. paketler - sayfa 2

 
Alexey Burnakov :
Yarın bu konuyla ilgili birkaç faydalı kod yayınlayacağım.
 # hypothesis testing

# two-sample mean comparison

t.test(x, y = NULL ,
       alternative = c( "two.sided" , "less" , "greater" ),
       mu = 0 , paired = FALSE, var.equal = FALSE,
       conf.level = 0.95 , ...)

# two-sample median comparison

wilcox.test(x, y = NULL ,
            alternative = c( "two.sided" , "less" , "greater" ),
            mu = 0 , paired = FALSE, exact = NULL , correct = TRUE,
            conf. int = FALSE, conf.level = 0.95 , ...)

# two distribution comparison

ks.test(x, y, ...,
        alternative = c( "two.sided" , "less" , "greater" ),
        exact = NULL )

# normality test

shapiro.test(x)


# independence / goodness of fit / homogeneity tests for categorical variables
chisq.test(x, y = NULL, correct = TRUE,
           p = rep(1/length(x), length(x)), rescale.p = FALSE,
           simulate.p.value = FALSE, B = 2000)

 # covariance / correlation

var(x, y = NULL , na.rm = FALSE, use)

cov(x, y = NULL , use = "everything" ,
    method = c( "pearson" , "kendall" , "spearman" ))

cor(x, y = NULL , use = "everything" ,
    method = c( "pearson" , "kendall" , "spearman" ))

# ordinary linear regression
lm(formula, data, subset, weights, na.action,
   method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE,
   singular.ok = TRUE, contrasts = NULL, offset, ...)   =) that easy
 
Alexey Burnakov:

# selecting a random subset of rows from an array to perform Shapiro–Wilk test

shapiro.test(x = lateral_residuals$`lateral_linear_model$residuals`[sample(x = nrow(lateral_residuals), size = 4999, replace = F)])
 
Alexey Burnakov:

# generate pseudo random numbers (or probabilities) for normal

dnorm(x, mean = 0, sd = 1, log = FALSE)
pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
rnorm(n, mean = 0, sd = 1)


# for uniform

dunif(x, min = 0, max = 1, log = FALSE)
punif(q, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
qunif(p, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
runif(n, min = 0, max = 1)
 
Alexey Burnakov:
# perform ANOVA on one or more trained models

anova(object, ...)   that easy =)
 
Alexey Burnakov:
#create histograms with error bars (on first 10 000 rows)

for(i in 1:8){
        
        subdat <- head(pre_an_int_eff, 10000)
        
        dodge <- position_dodge(width = 0.9)
        p <- ggplot(subdat, aes(fill = subdat$'sample_description', y = subdat$'mean', x = subdat$'sample_description')) + 
                geom_bar(position = "dodge", stat = "identity") + 
                geom_bar(position = dodge) + geom_errorbar(aes(ymin = subdat[, 9], ymax = subdat[, 10]), position = dodge, width = 0.25) +
                theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust = 1)) + 
                theme(legend.position = 'none')
        
        print(p)
        
}
That is all, folks!
 
Alexey Volchanskiy :

Bu arada, R'de usta olan insanlar varsa, yeni başlayanlar için bir soru. Birkaç tane R, R-server dağıtımı olduğunu görüyorum, bazı "R için bir web uygulama çerçevesi" http://shiny.rstudio.com/ , Microsoft'tan devasa paketler... Ne seçmeliyim?

R-studio gözler için yeterlidir - bu sadece dil üzerinde geliştirilmiş bir arayüzdür (herhangi bir R paketi ve geliştiriciden gelen çörekler). Shiny, web üzerinde kontroller, giriş formları, her türlü demo oluşturmak için aynı R paketidir.
MS'den kullanmadım, diyemem.
 

Çocuklar!

En ufak önkoşullar varsa - herhangi bir dilde programlama deneyimi ve istatistik konusunda biraz bilgi, o zaman sadece R ve sadece R.

Matlab hiç karşılaştırılamaz - bu başka bir operadan bir paket ve hatta büyük para için ödendi.

R'nin rakipleri SAS ve SPSS, ancak bunlar ücretli paketler ve R onları geçmeye başlıyor. Yaklaşık 5 yıldır, Matlab hala R ile karşılaştırıldı, ancak artık en son incelemeleri görmüyorum - unutulmaya başladı.

Bugün, R istatistik için standarttır, çok sayıda yayın ve genel olarak güçlü bir hareket vardır.

Örneğin, her gün yayınlanan çok faydalı bir blog, haberlere abone olabilirsiniz: http://www.r-bloggers.com/

Burada çok makul bir fiyata bir sürü kitap var: http://www.twirpx.com/search/?query=R. Aramada puan aldı R. Anahtar kelimeleri iyi arar.

Algoritmik bir programlama dili olarak R'nin ilk on dile girdiğini ve C çeşitlerinin yanında durduğunu unutmayalım.

Kullanmak için RStudio ile normal R'yi almanız gerekir. Ayrıca R'nin ücretli sürümünün Microsoft tarafından satın alındığını ve bu sürümün kendi tanıtımını yapmaya başladığını da unutmayalım – olayların gelişimini takip ediyoruz.

R-bloggers
R-bloggers
  • xi'an
  • www.r-bloggers.com
In econometric modeling, I usually have a problem with correlated features. A few weeks ago, I was discussing feature selection when features are correlated. This week, I was wondering about... Clustering French Cities (based on Temperatures) In order to illustrate hierarchical clustering techniques and k-means, I did borrow François Husson‘s...
 
СанСаныч Фоменко :

Çocuklar!

En ufak önkoşullar varsa - herhangi bir dilde programlama deneyimi ve istatistik konusunda biraz bilgi, o zaman sadece R ve sadece R.

Matlab hiç karşılaştırılamaz - bu başka bir operadan bir paket ve hatta büyük para için ödendi.

R'nin rakipleri SAS ve SPSS, ancak bunlar ücretli paketler ve R onları geçmeye başlıyor. Yaklaşık 5 yıldır, Matlab hala R ile karşılaştırıldı, ancak artık en son incelemeleri görmüyorum - unutulmaya başladı.

Bugün, R istatistik için standarttır, çok sayıda yayın ve genel olarak güçlü bir hareket vardır.

Örneğin, her gün yayınlanan çok faydalı bir blog, haberlere abone olabilirsiniz: http://www.r-bloggers.com/

Burada çok makul bir fiyata bir sürü kitap var: http://www.twirpx.com/search/?query=R. Aramada puan aldı R. Anahtar kelimeleri iyi arar.

Algoritmik bir programlama dili olarak R'nin ilk on dile girdiğini ve C çeşitlerinin yanında durduğunu unutmayalım.

Kullanmak için RStudio ile normal R'yi almanız gerekir. Ayrıca R'nin ücretli sürümünün Microsoft tarafından satın alındığını ve bu sürümün kendi tanıtımını yapmaya başladığını da unutmayalım – olayların gelişimini takip ediyoruz.

Harika, ilk gün için yavaş yavaş R öğreniyorum, lütfen soruları cevaplayın, R ve Matlab'ın yeteneklerini karşılaştırmak istiyorum. Sadece holivarsız, dikkatli ve sakince :).

  1. R, OOP özelliklerine sahip bir dil midir?
  2. MQL4/5'ten doğrudan kullanım için R'de 32-bit ve 64-bit dll yapabilir miyim? Öyleyse, kullanıcının bilgisayarında bu tür dll'leri kullanmak için hangi boyutta paket kurulmalıdır?
  3. R'den doğrudan erişim için ortak DB'leri bağlayabilir miyim?
  4. R'de bir Simulink eşdeğeri var mı?
  5. Neden tüm incelemeler R'nin bir istatistik programı olduğunu vurguluyor? DSP ile ilgileniyorum, R'de DSP için paketler var mı?
  6. R, Matlab'daki .mat dosyalarına benzer, verileri depolamak için yerleşik bir kompakt biçime sahip mi?

 
Alexey Volchanskiy :

Harika, ilk gün için yavaş yavaş R öğreniyorum, lütfen soruları cevaplayın, R ve Matlab'ın yeteneklerini karşılaştırmak istiyorum. Sadece holivarsız, dikkatli ve sakince :).


  1. R'den doğrudan erişim için ortak DB'leri bağlayabilir miyim?

  2. Neden tüm incelemeler R'nin bir istatistik programı olduğunu vurguluyor? DSP ile ilgileniyorum, R'de DSP için paketler var mı?

Evet ve evet. Meslektaşım MS SQL'e yapışıyor.

Sinyaller: https://cran.r-project.org/web/packages/signal/index.html

Muhtemelen başka benzer paketler de vardır.

R, S'den büyüdü. Başlangıçta istatistiksel veri işleme için keskinleştirildi. Muhtemelen, tam teşekküllü dillerin bazı özellikleri içinde olmayabilir, ancak içinde istatistiksel araştırma yapmak uygundur. Ve veri işleme ve analiz için birçok (binlerce) açık kaynak paketi vardır.

Artık makine öğrenimindeki en son trendler bile uygulandı - derin öğrenme ve sansasyonel xGBoost .

 
Alexey Burnakov :

Evet ve evet. Meslektaşım MS SQL'e yapışıyor.

Sinyaller: https://cran.r-project.org/web/packages/signal/index.html

Muhtemelen başka benzer paketler de vardır.

R, S'den büyüdü. Başlangıçta istatistiksel veri işleme için keskinleştirildi. Muhtemelen, tam teşekküllü dillerin bazı özellikleri içinde olmayabilir, ancak içinde istatistiksel araştırma yapmak uygundur. Ve veri işleme ve analiz için birçok (binlerce) açık kaynak paketi vardır.

Artık makine öğrenimindeki en son trendler bile uygulandı - derin öğrenme ve sansasyonel xGBoost.

Matlab programlarımdan birini R'ye çevirmeye çalışmalıyım, hızı karşılaştırmalıyım. Hafta sonu çözebilirsem, yapacağım ve abonelikten çıkacağım. Matlab oldukça yavaş, C# veya C++ ile bir çok şey yapıyorum ve hız için DLL olarak bağlıyorum.
Neden: