매트 연구. 패키지 - 페이지 2

 
Alexey Burnakov :
내일 나는 이 주제에 대한 몇 가지 유용한 코드를 게시할 것입니다.
 # hypothesis testing

# two-sample mean comparison

t.test(x, y = NULL ,
       alternative = c( "two.sided" , "less" , "greater" ),
       mu = 0 , paired = FALSE, var.equal = FALSE,
       conf.level = 0.95 , ...)

# two-sample median comparison

wilcox.test(x, y = NULL ,
            alternative = c( "two.sided" , "less" , "greater" ),
            mu = 0 , paired = FALSE, exact = NULL , correct = TRUE,
            conf. int = FALSE, conf.level = 0.95 , ...)

# two distribution comparison

ks.test(x, y, ...,
        alternative = c( "two.sided" , "less" , "greater" ),
        exact = NULL )

# normality test

shapiro.test(x)


# independence / goodness of fit / homogeneity tests for categorical variables
chisq.test(x, y = NULL, correct = TRUE,
           p = rep(1/length(x), length(x)), rescale.p = FALSE,
           simulate.p.value = FALSE, B = 2000)

 # covariance / correlation

var(x, y = NULL , na.rm = FALSE, use)

cov(x, y = NULL , use = "everything" ,
    method = c( "pearson" , "kendall" , "spearman" ))

cor(x, y = NULL , use = "everything" ,
    method = c( "pearson" , "kendall" , "spearman" ))

# ordinary linear regression
lm(formula, data, subset, weights, na.action,
   method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE,
   singular.ok = TRUE, contrasts = NULL, offset, ...)   =) that easy
 
Alexey Burnakov:

# selecting a random subset of rows from an array to perform Shapiro–Wilk test

shapiro.test(x = lateral_residuals$`lateral_linear_model$residuals`[sample(x = nrow(lateral_residuals), size = 4999, replace = F)])
 
Alexey Burnakov:

# generate pseudo random numbers (or probabilities) for normal

dnorm(x, mean = 0, sd = 1, log = FALSE)
pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE)
rnorm(n, mean = 0, sd = 1)


# for uniform

dunif(x, min = 0, max = 1, log = FALSE)
punif(q, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
qunif(p, min = 0, max = 1, lower.tail = TRUE, log.p = FALSE)
runif(n, min = 0, max = 1)
 
Alexey Burnakov:
# perform ANOVA on one or more trained models

anova(object, ...)   that easy =)
 
Alexey Burnakov:
#create histograms with error bars (on first 10 000 rows)

for(i in 1:8){
        
        subdat <- head(pre_an_int_eff, 10000)
        
        dodge <- position_dodge(width = 0.9)
        p <- ggplot(subdat, aes(fill = subdat$'sample_description', y = subdat$'mean', x = subdat$'sample_description')) + 
                geom_bar(position = "dodge", stat = "identity") + 
                geom_bar(position = dodge) + geom_errorbar(aes(ymin = subdat[, 9], ymax = subdat[, 10]), position = dodge, width = 0.25) +
                theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust = 1)) + 
                theme(legend.position = 'none')
        
        print(p)
        
}
That is all, folks!
 
Alexey Volchanskiy :

덧붙여서 R에 정통한 사람이 있으면 초보자의 질문입니다. R, R-서버, 일부 "R용 웹 애플리케이션 프레임워크" http://shiny.rstudio.com/ , Microsoft의 무시무시한 패키지가 여러 개 배포되어 있다는 것을 알았습니다... 무엇을 선택해야 합니까?

R-studio는 눈으로 보기에 충분합니다. 언어(R 자체 패키지 및 개발자의 롤빵)보다 개선된 인터페이스일 뿐입니다. Shiny는 웹에서 컨트롤, 입력 양식, 모든 종류의 데모를 만들기 위한 동일한 R 패키지입니다.
MS에서 사용하지 않았다, 나는 말할 수 없습니다.
 

얘들아!

최소한의 전제 조건이 있다면 - 모든 언어에 대한 프로그래밍 경험과 통계에 대한 약간의 지식이 있으면 R만, R만 가능합니다.

Matlab은 전혀 비교할 수 없습니다. 이것은 다른 오페라의 패키지이며 큰 돈을 지불한 것입니다.

R의 경쟁자는 SAS와 SPSS이지만 이들은 유료 패키지이고 R이 이를 추월하기 시작했습니다. 약 5년 동안 Matlab은 여전히 R과 비교되었지만 최신 리뷰가 더 이상 표시되지 않습니다.

오늘날 R은 통계의 표준이며 엄청난 수의 출판물이 있으며 일반적으로 강력한 운동입니다.

예를 들어, 매일 게시되는 매우 유용한 블로그에서 다음 뉴스를 구독할 수 있습니다. http://www.r-bloggers.com/

여기에 매우 합리적인 비용으로 많은 책이 있습니다. http://www.twirpx.com/search/?query=R. 검색에서 점수를 얻었습니다. R. 키워드를 잘 검색합니다.

알고리즘 프로그래밍 언어인 R이 상위 10개 언어에 진입했으며 C의 다양성 옆에 있다는 사실을 잊지 말자.

그것을 사용하려면 RStudio와 함께 일반적인 R을 가져와야 합니다. 또한 유료 버전의 R은 Microsoft에서 구입했으며 자체적으로 이 버전을 홍보하기 시작했습니다. 우리는 이벤트 개발을 따르고 있습니다.

R-bloggers
R-bloggers
  • xi'an
  • www.r-bloggers.com
In econometric modeling, I usually have a problem with correlated features. A few weeks ago, I was discussing feature selection when features are correlated. This week, I was wondering about... Clustering French Cities (based on Temperatures) In order to illustrate hierarchical clustering techniques and k-means, I did borrow François Husson‘s...
 
СанСаныч Фоменко :

얘들아!

최소한의 전제 조건이 있다면 - 모든 언어에 대한 프로그래밍 경험과 통계에 대한 약간의 지식이 있으면 R만, R만 가능합니다.

Matlab은 전혀 비교할 수 없습니다. 이것은 다른 오페라의 패키지이며 큰 돈을 지불한 것입니다.

R의 경쟁자는 SAS와 SPSS이지만 이들은 유료 패키지이고 R이 이를 추월하기 시작했습니다. 약 5년 동안 Matlab은 여전히 R과 비교되었지만 최신 리뷰가 더 이상 표시되지 않습니다.

오늘날 R은 통계의 표준이며 엄청난 수의 출판물이 있으며 일반적으로 강력한 운동입니다.

예를 들어, 매일 게시되는 매우 유용한 블로그에서 다음 뉴스를 구독할 수 있습니다. http://www.r-bloggers.com/

여기에 매우 합리적인 비용으로 많은 책이 있습니다. http://www.twirpx.com/search/?query=R. 검색에서 점수를 얻었습니다. R. 키워드를 잘 검색합니다.

알고리즘 프로그래밍 언어인 R이 상위 10개 언어에 진입했으며 C의 다양성 옆에 있다는 사실을 잊지 말자.

그것을 사용하려면 RStudio와 함께 일반적인 R을 가져와야 합니다. 또한 유료 버전의 R은 Microsoft에서 구입했으며 자체적으로 이 버전을 홍보하기 시작했습니다. 우리는 이벤트 개발을 따르고 있습니다.

좋아요, 저는 처음으로 R을 천천히 배우고 있습니다. 질문에 답변해 주세요. R과 Matlab의 기능을 비교하고 싶습니다. holivars없이 신중하고 침착하게 :).

  1. R은 OOP 기능이 있는 언어입니까?
  2. MQL4/5에서 직접 사용하기 위해 R에서 32비트 및 64비트 dll을 만들 수 있습니까? 그렇다면 사용자 컴퓨터에서 이러한 dll을 사용하려면 어떤 크기의 패키지를 설치해야 합니까?
  3. R에서 직접 액세스하기 위해 공통 DB를 연결할 수 있습니까?
  4. R에 Simulink가 있습니까?
  5. 왜 모든 리뷰에서 R이 통계 프로그램이라고 강조합니까? DSP에 관심이 있습니다. R에 DSP용 패키지가 있습니까?
  6. R에는 Matlab의 .mat 파일과 유사한 데이터 저장을 위한 내장형 압축 형식이 있습니까?

 
Alexey Volchanskiy :

좋아요, 저는 처음으로 R을 천천히 배우고 있습니다. 질문에 답변해 주세요. R과 Matlab의 기능을 비교하고 싶습니다. holivars없이 신중하고 침착하게 :).


  1. R에서 직접 액세스하기 위해 공통 DB를 연결할 수 있습니까?

  2. 왜 모든 리뷰에서 R이 통계 프로그램이라고 강조합니까? DSP에 관심이 있습니다. R에 DSP용 패키지가 있습니까?

예, 그렇습니다. 내 동료는 MS SQL에 집착합니다.

신호: https://cran.r-project.org/web/packages/signal/index.html

다른 유사한 패키지가 있을 수 있습니다.

R은 S에서 파생되었습니다. 원래 통계 데이터 처리를 위해 날카롭게 만들어졌습니다. 아마도 본격적인 언어의 일부 기능이 없을 수 있지만 통계 조사를 수행하는 것이 편리합니다. 그리고 데이터 처리 및 분석을 위한 많은(천 개의) 오픈 소스 패키지가 있습니다.

이제 머신 러닝의 최신 트렌드인 딥 러닝과 놀라운 xGBoost 도 구현되었습니다.

 
Alexey Burnakov :

예, 그렇습니다. 내 동료는 MS SQL에 집착합니다.

신호: https://cran.r-project.org/web/packages/signal/index.html

다른 유사한 패키지가 있을 수 있습니다.

R은 S에서 파생되었습니다. 원래 통계 데이터 처리를 위해 날카롭게 만들어졌습니다. 아마도 본격적인 언어의 일부 기능이 없을 수 있지만 통계 조사를 수행하는 것이 편리합니다. 그리고 데이터 처리 및 분석을 위한 많은(천 개의) 오픈 소스 패키지가 있습니다.

이제 머신 러닝의 최신 트렌드인 딥 러닝과 놀라운 xGBoost도 구현되었습니다.

Matlab 프로그램 중 하나를 R로 번역하고 속도를 비교해야 합니다. 주말에 해결하면 구독을 취소하겠습니다. Matlab은 꽤 느리고 C # 또는 C ++로 많은 작업을 수행하고 속도를 위해 DLL로 연결합니다.