프로그래밍 자습서 - 페이지 9

 

R에서 NBA 데이터를 사용하는 SQL Select 문


R에서 NBA 데이터를 사용하는 SQL Select 문

얘들 아! R 프로그래밍 언어에 대한 이 비디오에 오신 것을 환영합니다. 이 자습서에서는 R을 사용하여 SQL에서 SELECT 문을 실행하고 NBA(National Basketball Association) 데이터로 작업하는 방법을 살펴보겠습니다. 자, 바로 들어가 봅시다!

가장 먼저 해야 할 일은 SQL 패키지를 로드하는 것입니다. 아직 설치하지 않은 경우 'install.packages("sqldf")' 명령을 실행하여 설치할 수 있습니다. 나는 이미 설치되어 있으므로 'library(sqldf)'를 사용하여 패키지를 로드하기만 하면 된다.

다음으로 Excel 파일을 읽을 수 있는 'xlsx' 패키지를 로드합니다. 아직 설치하지 않은 경우 'install.packages("xlsx")'를 사용하여 설치할 수 있습니다. 설치했으니 '라이브러리(xlsx)'를 이용해서 불러오겠습니다.

이제 두 패키지를 모두 로드했으므로 Cavaliers(Cavs) 데이터를 읽어 봅시다. Cavs는 NBA 팀이며 선수 데이터를 쿼리할 것입니다. Excel 파일에서 데이터를 읽으려면 'read.xlsx' 함수를 사용합니다. 이 경우 데이터는 내 C 드라이브에 저장되므로 그에 따라 파일 경로를 지정하겠습니다. 예: 'C:/Desktop/data.xlsx'. 또한 시트 이름을 'Sheet1'로 언급합니다.

데이터를 성공적으로 읽은 후 'Cavs' 데이터 프레임의 구조를 검사할 수 있습니다. 17개의 관측값(행)과 9개의 변수(열)로 구성됩니다. 변수에는 선수 이름, 직책, 키, 몸무게, 생년월일, 연령, 경험 및 다녔던 학교가 포함됩니다.

데이터를 정리하기 위해 관심 있는 특정 열을 선택하여 'Cavs_cleaned'라는 새 데이터 프레임에 저장합니다. 'height' 및 'exp' 열은 서식 문제가 포함되어 있고 분석과 관련이 없으므로 제외합니다.

이제 데이터가 정리되었으므로 'sqldf' 함수를 사용하여 SQL SELECT 문 실행을 시작할 수 있습니다. 'Cavs' 테이블에서 모든 열을 선택하여 시작하겠습니다. 'SELECT * FROM Cavs' 문을 사용하여 테이블에서 모든 행과 열을 검색합니다.

다음으로 'Cavs' 테이블에서 'player' 및 'school' 열만 선택합니다. 이는 SQL 문 'SELECT player, school FROM Cavs'를 사용하여 수행할 수 있습니다.

다음 쿼리에서는 이름이 'I'로 시작하는 모든 플레이어를 선택합니다. 이를 달성하기 위해 SQL 문 'SELECT * FROM Cavs WHERE player LIKE "I%"'를 사용합니다. '%' 기호는 와일드카드 역할을 하며 플레이어 이름에서 'I' 뒤에 오는 모든 문자와 일치합니다.

특정 정보를 검색하려면 LeBron James의 나이와 체중을 선택해 보겠습니다. SQL 문 'SELECT age, weight FROM Cavs WHERE player = "LeBron James"'를 사용하여 'Cavs' 테이블에서 나이와 체중을 얻습니다.

이제 팀 명단에서 각 고유 연령의 선수 수를 세어 보겠습니다. 이를 달성하기 위해 SQL 문 'SELECT age, COUNT(age) FROM Cavs GROUP BY age'를 사용할 것입니다. 결과에는 각 고유 연령과 해당 플레이어 수가 표시됩니다.

나이를 기준으로 선수를 정렬하기 위해 SQL 문 'SELECT player, age FROM Cavs ORDER BY age DESC'를 사용합니다. 이렇게 하면 나이에 따라 가장 나이가 많은 선수부터 막내까지 선수가 정렬됩니다.

마지막으로 28세 이상의 가드('G' 포지션을 가진 선수)만 선택하겠습니다. 'SELECT player, position, age FROM Cavs WHERE position = "G" AND age > 28 SQL 문을 실행하여 이를 달성할 수 있습니다. '.

비디오의 다음 부분에서는 Cavs 명단에 대한 일부 데이터 필터링 및 집계 작업을 수행할 것입니다. 그럼 자세히 살펴보겠습니다.

체중이 220파운드를 초과하는 모든 선수를 선택하여 시작하겠습니다. SQL WHERE 절을 사용하여 이를 달성할 수 있습니다. 코드는 다음과 같습니다.

heavy_players <- SQLDF("SELECT * FROM Cavs WHERE weight > 220")

이 쿼리를 실행하여 체중이 220파운드를 초과하는 선수의 정보가 포함된 heavy_players라는 새 데이터 프레임을 검색합니다. 이 데이터 프레임을 더 탐색하여 결과를 분석할 수 있습니다.

이제 데이터 집계로 이동하겠습니다. 우리는 Cavs 명단에 있는 선수들의 평균 연령을 계산할 것입니다. 방법은 다음과 같습니다.

average_age <- SQLDF("SELECT AVG(age) AS average_age FROM Cavs")

이 쿼리를 실행하면 average_age 변수에 있는 모든 플레이어의 평균 연령과 함께 결과가 제공됩니다. 인쇄하거나 추가 계산에 사용할 수 있습니다.

다음으로 선수들 사이에서 최대 몸무게를 찾아보자. 이 목적을 위해 SQL MAX() 함수를 사용할 수 있습니다.

max_weight <- SQLDF("SELECT MAX(weight) AS max_weight FROM Cavs")

이 쿼리는 Cavs 테이블에서 최대 가중치를 검색하여 max_weight 변수에 저장합니다.

이제 데이터를 필터링하여 연령이 25~30세인 플레이어를 선택해 보겠습니다. 코드는 다음과 같습니다.

young_players <- SQLDF("SELECT * FROM Cavs WHERE age BETWEEN 25 AND 30")

이 쿼리를 실행하면 지정된 연령대 내의 선수 정보를 포함하는 young_players라는 새 데이터 프레임이 생성됩니다.

마지막으로 키를 기준으로 오름차순으로 플레이어를 정렬해 보겠습니다.

sorted_players <- SQLDF("SELECT * FROM Cavs ORDER BY height ASC")

이 쿼리를 실행하여 키를 기준으로 오름차순으로 정렬된 플레이어가 포함된 sorted_players라는 데이터 프레임을 얻습니다.

이것으로 NBA Cavs 데이터에서 R 프로그래밍 언어를 사용하는 SQL 쿼리 시연을 마치겠습니다. 이 비디오가 유익하고 도움이 되었기를 바랍니다. 질문이나 제안 사항이 있으면 아래 의견란에 알려주십시오. 좋아요, 공유 및 구독을 잊지 말고 더 많은 R 프로그래밍 자습서를 업데이트하십시오. 시청해주셔서 감사하고 다음 영상에서 뵙겠습니다!

SQL Select Statements Using NBA Data In R
SQL Select Statements Using NBA Data In R
  • 2017.11.12
  • www.youtube.com
SQL Select statements using Rhttps://stats.nba.com/team/1610612739/?dir=1Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tut...
 

트위터 마이닝 R에서 트윗 추출하기


트위터 마이닝 R에서 트윗 추출하기

여러분, 저희 고유의 도구를 사용하여 Twitter 마이닝에 대한 이 비디오에 오신 것을 환영합니다. 여기에서 저는 Medium.com이라는 웹사이트에 있습니다. 여기서 저는 여러분이 자신의 Twitter 개발자 계정을 설정하고 RStudio를 사용하여 트윗 채굴을 시작하는 데 도움이 되는 기사를 작성했습니다. 이 비디오에서는 문서에 설명된 단계를 통해 Twitter 마이닝을 직접 시작할 수 있습니다. 아래 설명에 기사에 대한 링크를 포함하도록 하여 기사를 읽고 따라할 수 있도록 하겠습니다.

먼저 전제 조건에 대해 이야기하겠습니다. 시작하려면 RStudio와 Twitter 애플리케이션 계정이 필요합니다. 또한 Twitter 개발자 계정이 필요합니다. 이 기사는 Twitter 애플리케이션 설정 방법에 대한 자세한 지침을 제공하므로 반드시 확인하십시오. 이러한 계정을 설정하면 다음 단계로 넘어갈 수 있습니다.

다음으로 필요한 R 패키지를 설치하고 로드해야 합니다. 이 문서에는 이 프로세스에 필요한 특정 패키지가 나열되어 있습니다. 진행하기 전에 RStudio에서 설치하고 로드해야 합니다.

그런 다음 Twitter 인증을 설정합니다. 다시 말하지만 이 문서에서는 이를 수행하는 방법에 대한 단계별 지침을 제공합니다. Twitter API로 RStudio 환경을 인증하려면 지침을 따르십시오. 이 인증 프로세스는 Twitter의 데이터에 액세스하는 데 중요합니다.

마지막으로 Twitter 검색 기능을 사용하여 트윗을 추출합니다. 비디오에서는 미리 구성된 RStudio 환경을 사용하므로 전체 설정 프로세스를 거칠 필요가 없습니다. Twitter 검색 기능을 직접 실행할 수 있습니다.

Twitter 검색 기능은 몇 가지 매개변수를 사용합니다. 먼저 검색하려는 키워드나 주제를 나타내는 검색 문자열을 지정합니다. 또한 검색하려는 행 또는 트윗의 수와 트윗의 언어를 정의합니다. 비디오에서 예제는 NBA 트윗을 검색합니다.

Twitter 검색 기능을 실행하면 주어진 검색 기준과 관련된 지정된 수의 트윗을 검색합니다. 비디오에는 세 개의 검색된 트윗이 표시됩니다. 동계 올림픽이나 영화 "Black Panther"와 같은 다양한 주제를 탐색하도록 검색 기준을 수정할 수 있습니다. Twitter 검색 기능을 통해 트윗을 추출하고 추가로 분석할 수 있습니다.

추출된 트윗을 CSV 또는 텍스트 파일로 저장하여 감성 분석 등 다양한 분석이 가능합니다. 예를 들어 비트코인 또는 기타 관심 주제에 대한 사람들의 감정을 분석할 수 있습니다.

이상으로 Twitter 검색 기능과 RStudio를 사용한 Twitter 마이닝의 기본 데모를 마칩니다. 이 영상이 도움이 되셨다면 아래 댓글로 알려주세요. Twitter 마이닝에 대한 더 많은 비디오를 보려면 내 채널을 좋아하고 공유하고 구독하는 것을 잊지 마십시오. 시청해주셔서 감사하고 다음 영상에서 뵙겠습니다!

Twitter Mining Extracting Tweets In R
Twitter Mining Extracting Tweets In R
  • 2018.02.17
  • www.youtube.com
Twitter MiningA step by step guide to extracting tweets or twitter data from twitter !Article on How to set up Twitter Mining Yourself:https://medium.com/@ra...
 

감정 분석 R 프로그래밍


감정 분석 R 프로그래밍

여러분, Art 프로그래밍 언어에 대한 이 비디오에 오신 것을 환영합니다. 이 비디오에서는 감정 분석이라는 흥미로운 주제를 살펴보겠습니다. 감정 분석은 텍스트 조각에서 표현된 의견을 계산적으로 식별하고 분류하는 프로세스입니다. 주제에 대한 작가의 태도가 부정적인지, 중립적인지 또는 긍정적인지를 결정할 수 있습니다. 그럼 바로 들어가서 시작해 봅시다!

가장 먼저 해야 할 일은 감정 분석에 필요한 패키지를 설치하는 것입니다. install.packages("our感") 명령을 사용하여 필요한 패키지를 설치할 수 있습니다. 이미 설치되어 있으므로 이 명령 실행을 건너뛰겠습니다. 다음으로 우리는 라이브러리(우리의 감정) 함수를 사용하여 "우리의 감정" 패키지를 로드합니다.

"우리 감성" 패키지는 몇 가지 유용한 기능을 제공합니다. 그 중 하나는 calculate_total_presence_sentiment입니다. 이 함수를 사용하여 텍스트 문장의 벡터를 분석합니다. 이 예에서는 다음 문장을 사용합니다. "이것은 좋은 텍스트입니다." "이것은 나쁜 텍스트입니다." "이것은 정말 나쁜 텍스트입니다." 벡터를 입력하고 명령을 실행한 후 문장 중 3개가 부정적인 감정을 가지고 있는 반면 하나만 긍정적인 감정을 가지고 있음을 관찰할 수 있습니다.

이제 어떤 문장이 어떤 감정에 해당하는지 확인하기 위해 calculate_sentiment 함수를 사용할 수 있습니다. 이전 명령을 복사하고 다시 실행하면 텍스트와 감정 사이의 명확한 매핑을 얻을 수 있습니다. 이 경우 "이것은 좋은 텍스트입니다"는 긍정으로 분류됩니다.

감정 레이블 대신 숫자 값을 선호하는 경우 calculate_score 함수를 사용할 수 있습니다. 명령을 복사하고 실행하여 각 문장에 해당하는 점수를 얻습니다. 이 예에서 모든 문장의 점수는 -1입니다.

Art 프로그래밍 언어의 감정 분석에 대한 이 비디오가 흥미로웠기를 바랍니다. 질문이나 의견이 있으시면 아래에 남겨주세요. 도움이 되셨다면 이 영상을 좋아하고 구독하고 공유하는 것을 잊지 마세요. 시청해주셔서 감사하고 다음 영상에서 뵙겠습니다!

Sentiment Analysis R Programming
Sentiment Analysis R Programming
  • 2018.04.10
  • www.youtube.com
Sentiment Analysis with the R programming language !Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.ude...
 

R을 설치하고 R Studio를 설치하는 방법. R 스튜디오 사용법 | 초보자를 위한 R 프로그래밍


R을 설치하고 R Studio를 설치하는 방법. R 스튜디오 사용법 | 초보자를 위한 R 프로그래밍

이 비디오에서는 R을 다운로드하고 설치하는 과정에 대해 설명합니다. 또한 RStudio의 다운로드 및 설치 방법과 사용 방법에 대한 간략한 소개를 다룹니다. R 프로그래밍 학습에 관심이 있다면 잘 찾아오셨습니다. 이 YouTube 채널은 다양한 주제를 다루는 광범위한 R 프로그래밍 비디오를 제공합니다.

R의 다운로드 및 설치부터 시작하겠습니다. 비교적 간단한 프로세스이지만 찾을 위치를 아는 것이 중요합니다. R을 다운로드하려면 R 프로젝트 웹사이트(r-project.org)를 방문해야 합니다. 웹 사이트에 접속한 후 "Download R" 옵션을 클릭합니다. 그러면 다운로드 위치를 선택하라는 메시지가 표시됩니다. 예를 들어 아일랜드에 있는 경우 아일랜드 옵션을 선택할 수 있습니다. Apple Mac을 사용하고 있으므로 Mac용 R을 다운로드하는 옵션을 선택합니다. 최신 릴리스를 다운로드하십시오. 다운로드가 완료되면 다른 소프트웨어 응용 프로그램과 마찬가지로 R을 설치합니다.

R을 다운로드하여 설치한 후 RStudio를 다운로드하여 설치하는 것이 좋습니다. 제 생각에는 RStudio가 R 코드 작성을 위한 최고의 플랫폼입니다. RStudio를 다운로드하려면 RStudio 웹 사이트를 방문하여 "RStudio 다운로드" 옵션을 클릭하십시오. 유료 버전은 주로 기업용이므로 무료 버전의 RStudio를 다운로드하여 설치할 수 있습니다. 컴퓨터에 적합한 플랫폼을 선택합니다(이 경우 Mac). 다운로드가 완료되면 다른 소프트웨어 응용 프로그램과 마찬가지로 RStudio를 설치합니다.

RStudio를 시작하면 RStudio 인터페이스가 표시됩니다. 익숙해지는 데 도움이 되도록 인터페이스의 4사분면에 대해 간략하게 설명하겠습니다. 왼쪽 상단에는 R 코드를 작성하는 코드 편집기가 있습니다. 이 예제에서는 한 줄의 코드를 작성했습니다. 코드를 실행하면 콘솔이라고 하는 왼쪽 하단 사분면에 코드가 나타납니다. 코드가 출력을 생성하면 콘솔에도 표시됩니다.

코드를 실행하려면 Mac에서 라인을 선택하고 "Command + Enter"를 누르기만 하면 됩니다(단축키는 PC에 따라 다를 수 있음). 콘솔에서 코드가 실행되는 것을 볼 수 있습니다. 사분면을 확대하려면 "Shift + Control + 1"과 같은 키보드 단축키를 사용하여 코드에 초점을 맞추거나 "Shift + Control + 0"을 사용하여 사분면 4개를 모두 볼 수 있습니다.

오른쪽 상단 사분면으로 이동하면 환경을 찾을 수 있습니다. R 세션 중에 생성된 개체 및 기능이 표시되는 위치입니다. 변수에 데이터를 할당하여 개체를 만들 수 있습니다. 예를 들어 CSV 파일을 읽은 결과를 변수 "mydata"에 할당하여 객체를 생성합니다. 환경을 확대하려면 "Shift + Control + 8" 단축키를 사용하십시오.

마지막으로 오른쪽 아래 사분면에는 "파일", "플롯", "패키지" 및 "도움말"과 같은 다양한 탭이 있습니다. "파일" 탭에서는 하드 드라이브를 탐색하고 파일과 폴더에 액세스할 수 있습니다. "플롯" 탭에는 R 세션 중에 생성된 모든 플롯 또는 시각화가 표시됩니다. "패키지" 탭은 R의 기능을 확장하는 추가 패키지를 설치하고 관리하는 방법을 제공합니다. 다른 비디오에서 패키지에 대해 자세히 다룹니다. 마지막으로 "도움말" 탭은 특정 기능이나 명령에 대한 정보가 필요할 때 유용한 리소스입니다. "?t.test"와 같이 앞에 물음표가 붙은 함수 이름을 입력하면 자세한 정보와 예제에 액세스할 수 있습니다.

RStudio에 대한 간략한 소개를 통해 R과 RStudio를 모두 편안하게 다운로드하고 설치할 수 있습니다. 더 많은 것을 배울 수 있으며 다음 비디오에서는 데이터 가져오기, 패키지 설치, 기본 분석 수행 및 프로젝트 시작에 대해 다룹니다. 더 흥미로운 콘텐츠를 기대해 주세요. 이 채널을 구독하고 벨 알림을 클릭하여 향후 동영상에 대한 업데이트를 받는 것을 잊지 마세요.

How to install R and install R Studio. How to use R studio | R programming for beginners
How to install R and install R Studio. How to use R studio | R programming for beginners
  • 2019.01.28
  • www.youtube.com
This video will walk you through how to install R and how to install R studio. There is also a short introduction to R Studio. This is part of a series calle...
 

초보자를 위한 R 프로그래밍 - R을 사용해야 하는 이유


초보자를 위한 R 프로그래밍 - R을 사용해야 하는 이유

무료 및 오픈 소스 프로그래밍 언어인 R은 엄청난 인기를 얻었으며 데이터 분석 및 통계 분석에서 귀중한 도구가 되었습니다. 이 비디오에서는 SPSS, Stata, SAS와 같은 고가의 상용 대안보다 R이 점점 더 선호되는 이유를 살펴보겠습니다.

R이 인기 있는 주요 이유 중 하나는 비용 효율성입니다. 무료 오픈 소스인 R은 값비싼 라이선스 없이 강력한 기능 세트를 제공합니다. 이러한 접근성으로 인해 데이터 분석 커뮤니티의 지속적인 추세에서 알 수 있듯이 사용자가 다른 소프트웨어 패키지에서 R로 크게 마이그레이션되었습니다.

R이 일부 사람들에게는 위협적으로 보일 수 있는 프로그래밍 언어임에도 불구하고 실제로는 상당히 접근하기 쉽습니다. 영상은 R을 사용하는 것이 어렵지도 무섭지도 않다는 것을 시청자들에게 안심시킨다. 실제로 R 커뮤니티의 풍부한 지원 덕분에 상대적으로 직관적이고 쉽게 배울 수 있습니다.

데이터 분석에서 코드를 사용하는 주요 이점은 재현성입니다. 분석을 코드 형식으로 문서화하고 공유함으로써 다른 사람들이 결과를 정확하게 복제하고 이러한 결론에 도달하기 위해 취한 단계를 이해할 수 있습니다. 이것은 투명성을 촉진하고 협업을 촉진하여 다른 사람들이 분석에서 잠재적인 실수를 검토, 개선 제안 또는 식별할 수 있도록 합니다. 반대로 포인트 앤 클릭 시스템에는 이러한 수준의 투명성과 협업이 부족합니다.

또한 코드 기반 분석은 재현 가능할 뿐만 아니라 반복 가능성도 높습니다. 향후 추가 데이터를 획득할 경우 데이터 정리, 조작 및 분석을 포함한 코드를 실행하여 간단히 분석을 다시 실행할 수 있습니다. 이를 통해 전체 워크플로우를 쉽게 반복할 수 있으므로 일관성과 효율성이 제공됩니다.

오픈 소스 언어인 R의 가장 흥미로운 측면 중 하나는 특정 데이터 분석 작업에 사용할 수 있는 방대한 수의 패키지입니다. 전 세계 개발자들이 만든 이 패키지는 다양한 분석 문제를 해결하고 R에 자유롭게 설치 및 활용할 수 있습니다. 비디오는 이러한 패키지가 수천 개에 이르는 풍부함을 강조하며 다양한 용도로 R의 기능과 다양성을 더욱 확장합니다. 데이터 분석이 필요합니다.

R은 데이터 시각화 및 그래픽 기능도 뛰어납니다. 비디오는 이와 관련하여 R이 사용 가능한 다른 패키지를 능가한다고 강조합니다. R의 풍부한 시각화 도구를 사용하면 유익하고 시각적으로 매력적인 그래프와 플롯을 생성하여 데이터 탐색 및 프레젠테이션을 향상할 수 있습니다.

R과 같은 프로그래밍 언어를 사용하는 것이 어렵지 않다는 것을 설명하기 위해 비디오에서 짧은 데모를 제공합니다. 연령 및 키와 같은 변수를 표시하는 "친구"라는 간단한 데이터 프레임을 보여줍니다. 시연을 통해 시청자는 R의 개체에 함수를 적용하여 평균 계산, 히스토그램 플로팅, 상관 관계 검사와 같은 간단한 작업을 수행할 수 있는 방법을 목격합니다. 이것은 코드 작성에 대한 두려움이나 오해를 폭로하고 액세스 가능하고 관리 가능한 프로세스임을 보여줍니다.

결론적으로 데이터 분석 및 통계 분석 도구로서 R의 인기가 높아지는 것은 비용 효율성, 재현성, 반복 가능성, 광범위한 패키지 생태계, 강력한 시각화 기능 및 상대적인 사용 용이성에 기인할 수 있습니다. 비디오 시리즈는 설치 및 진행에서 시작하여 데이터 분석, 조작, 시각화 및 머신 러닝 및 AI와 같은 고급 주제에 이르기까지 시청자에게 R의 다양한 측면을 안내하는 것을 목표로 합니다. 시청자는 채널의 콘텐츠를 따라가며 데이터 분석 노력을 위해 R의 엄청난 잠재력을 배우고 활용하는 여정을 시작할 수 있습니다.

R programming for beginners - Why you should use R
R programming for beginners - Why you should use R
  • 2018.12.14
  • www.youtube.com
R programming is typically used to analyze data and do statistical analysis. In this video, I talk about why R is a better option than other statistical pack...
 

데이터를 가져오고 패키지를 설치하는 방법. 초보자를 위한 R 프로그래밍.


데이터를 가져오고 패키지를 설치하는 방법. 초보자를 위한 R 프로그래밍.

R 프로그래밍을 시작하는 방법을 안내하는 SPAR 프로그래밍 비디오 시리즈에 다시 오신 것을 환영합니다. 이 특정 비디오에서는 프로젝트 생성에 중점을 두고 프로젝트에 수반되는 사항에 대한 설명을 제공합니다. 또한 데이터 가져오기, 패키지 설치 및 데이터 조작을 다룹니다. 이 세션이 끝날 때까지 우리의 목표는 R 프로그래밍에서 작업을 수행할 권한이 있다고 느끼는 것입니다. 자, 시작하겠습니다.

R 프로그래밍에 관심이 있다면 잘 찾아오셨습니다. 이 YouTube 채널에서는 광범위한 주제를 다루는 포괄적인 R 프로그래밍 자습서를 제공합니다. 이때 R과 RStudio가 이미 설치되어 있다고 가정하고 RStudio 환경을 살펴보자.

RStudio를 열면 4개의 사분면이 표시됩니다. 이 환경에 익숙하지 않은 경우 이를 소개하는 전용 비디오가 있으므로 부담 없이 확인하십시오. 지금은 시작하는 데 집중하겠습니다. 왼쪽 상단에는 다양한 시작 옵션이 있는 드롭다운 메뉴가 있습니다. 향후 비디오에서 이러한 각 옵션에 대해 자세히 설명합니다. 그러나 지금은 프로젝트 생성부터 시작하는 것이 좋습니다.

프로젝트를 시작하려면 바로 왼쪽에 있는 "프로젝트 만들기" 버튼을 클릭하십시오. 프로젝트 생성은 스크립트, 데이터 및 출력을 한 곳에 정리하는 데 도움이 되므로 필수적입니다. R은 데이터를 찾을 위치를 알고 모든 프로젝트 관련 파일을 작업 디렉토리 내에 깔끔하게 저장합니다. 이것은 당신이 진행함에 따라 유리할 것입니다. 따라서 R에서 프로젝트를 시작할 때마다 "새 프로젝트" 버튼을 클릭하는 것이 좋습니다.

"새 프로젝트" 버튼을 클릭하면 새 디렉토리를 만들고 프로젝트 이름을 지정하는 옵션이 표시됩니다. 예를 들어 프로젝트 이름을 "Test One"으로 지정하고 "프로젝트 만들기"를 클릭합니다. 그러면 R이 프로젝트를 생성하고 RStudio 인터페이스의 오른쪽 하단에 나열된 것을 찾을 수 있습니다. 동시에 하드 드라이브에 "Test One"이라는 폴더가 생성됩니다. 해당 폴더로 이동하면 프로젝트를 나타내는 아이콘이 표시됩니다. 해당 폴더 내에서 RStudio를 열고 프로젝트 아이콘을 클릭하면 해당 프로젝트와 관련된 모든 스크립트, 데이터 및 출력이 한 곳에서 R이 열립니다. 의심할 여지없이 감사할 깔끔하고 조직적인 작업 환경을 만듭니다.

이제 데이터를 R로 가져오는 방법에 대해 설명하겠습니다. 프로젝트를 시작할 때 생성된 하드 드라이브의 폴더로 돌아갑니다. 해당 폴더로 가져오려는 데이터를 잘라내어 붙여넣습니다. 폴더에 데이터를 배치했으면 코드를 사용하여 데이터를 R로 자동으로 가져오고 가져옵니다. 이렇게 하면 코드를 실행할 때 데이터를 개체로 쉽게 사용할 수 있으며 반복적으로 수동으로 가져오는 것에 대해 걱정할 필요가 없습니다.

RStudio 내에서 "Import Dataset"과 같은 옵션은 효율적이지 않으므로 사용하지 마십시오. 대신 데이터 가져오기를 코드에 통합하는 방법을 보여줍니다. 다음은 데이터를 가져오는 예제 코드 스니펫입니다.

my_data <- read.csv("filename.csv")

이 코드에서는 read.csv 함수를 사용하여 CSV 파일에서 데이터를 가져옵니다. Excel 또는 SPSS와 같은 다양한 파일 형식에서 데이터를 가져올 수 있지만 간단하게 하기 위해 지금은 CSV 파일에 중점을 두겠습니다. 이 코드를 실행하면 데이터가 R 환경에서 my_data 객체로 저장됩니다.

가져온 데이터를 보려면 head, tail 또는 view와 같은 기능을 사용할 수 있습니다. 예를 들어:

head(my_data)  # displays the first six rows of the data
tail(my_data)  # displays the last six rows of the data

이러한 함수를 사용하면 데이터의 구조와 내용을 검사할 수 있습니다. head 함수는 데이터의 처음 몇 행을 표시하고 tail 함수는 마지막 몇 행을 표시합니다. 이는 데이터세트를 빠르게 살펴보고 올바르게 가져왔는지 확인하는 데 도움이 될 수 있습니다.

데이터를 가져온 후에는 일부 데이터 조작 작업을 수행할 수 있습니다. R은 데이터 조작을 위한 풍부한 함수 및 패키지 세트를 제공합니다. 일반적으로 사용되는 패키지 중 하나는 데이터 필터링, 열 선택, 정렬 및 집계와 같은 데이터 조작 작업을 위한 일련의 기능을 제공하는 dplyr입니다.

dplyr 패키지를 설치하려면 다음 코드를 사용할 수 있습니다.

install.packages("dplyr")

설치 후 라이브러리 기능을 사용하여 R 세션에 패키지를 로드해야 합니다.

library(dplyr)

이제 데이터 조작을 위해 dplyr 패키지에서 제공하는 기능을 사용할 수 있습니다. 다음은 조건에 따라 행을 필터링하는 예입니다.

filtered_data <- my_data %>%
  filter(column_name == "some_value")

이 코드에서 Filtered_data는 column_name이라는 열의 값이 "some_value"인 my_data의 행만 포함합니다. 이것은 하나의 예일 뿐이며 dplyr 패키지는 데이터 조작 및 변환을 위한 더 많은 기능을 제공합니다.

코드와 변경 사항을 추적하려면 R 스크립트를 자주 저장해야 합니다. RStudio 스크립트 편집기의 왼쪽 상단 모서리에 있는 디스크 아이콘을 클릭하거나 단축키 Ctrl+S(또는 macOS의 경우 Cmd+S)를 사용하여 스크립트를 저장할 수 있습니다.

결론적으로 이번 영상에서는 RStudio에서 프로젝트를 생성하고, 코드를 사용하여 R로 데이터를 가져오고, dplyr 패키지를 사용하여 데이터 조작을 수행하는 기본 사항을 다뤘습니다. 이는 R 프로그래밍 여정의 기초를 형성할 기본 개념입니다.

다음 비디오에서는 R의 데이터 시각화를 살펴보고 통찰력 있는 플롯과 차트를 만드는 방법을 배웁니다. 더 흥미로운 R 프로그래밍 튜토리얼을 기대해주세요!

How to import data and install packages. R programming for beginners.
How to import data and install packages. R programming for beginners.
  • 2019.02.14
  • www.youtube.com
In this video I look at how to start a project in R, how to import data and how to install a package. Packages like tidyverse or DPLYR or ggplot extend your ...
 

Excel에서 R 스튜디오로 데이터를 가져오는 방법. 초보자를 위한 R 프로그래밍


Excel에서 R 스튜디오로 데이터를 가져오는 방법. 초보자를 위한 R 프로그래밍

안녕하세요, 인터넷의 여러분! 프로그래밍 101에 다시 오신 것을 환영합니다. 여기에서 R이 강력하고 유용할 뿐만 아니라 재미있고 사용하기 쉽다는 것을 발견했습니다. 이번 영상에서는 엑셀에서 R로 데이터를 가져오는 방법에 대해 말씀드리겠습니다. 이전 영상에서는 파일을 CSV(comma-separated value) 파일로 저장하고 읽기를 이용하여 불러오는 방법에 대해 말씀드렸습니다. .csv 기능. 그러나 이 비디오에서는 데이터가 별도의 탭에 있거나 스프레드시트 내의 비표준 위치에 있는 복잡한 경우에도 데이터를 Excel에서 R로 직접 가져오는 데 중점을 둘 것입니다. 우리는 모든 것을 다룰 것이고 이 비디오는 약 3분 안에 끝낼 것이므로 R 프로그래밍에 대해 더 배우고 싶다면 저와 함께 하세요.

R 프로그래밍에 관심이 있다면 잘 찾아오셨습니다. 이 YouTube 채널에서는 R과 관련된 모든 것에 대한 프로그래밍 비디오를 제작합니다. 이제 Excel에서 R로 데이터를 가져오는 주제에 대해 자세히 알아보겠습니다.

먼저 우리가 성취하고자 하는 것이 무엇인지 생각해 봅시다. Excel 스프레드시트가 있는 경우 목표는 해당 데이터를 분석, 시각화 등에 사용할 수 있는 개체로 R로 가져오는 것입니다. 이 작업을 수행하는 방법은 여러 가지가 있습니다.

먼저 Excel 인터페이스의 오른쪽 상단을 보면 "Excel에서 가져오기" 옵션이 있습니다. 그것을 클릭하면 엑셀 파일의 위치를 탐색할 수 있는 화면이 열립니다. 마찬가지로 RStudio 인터페이스의 오른쪽 하단에 있는 Excel 아이콘을 클릭하여 파일 위치를 표시하는 동일한 화면에 액세스할 수도 있습니다.

이 도구는 R로 데이터를 가져오는 코드를 작성하는 데 익숙하지 않은 경우 유용할 수 있습니다. 이 도구는 Excel에서 데이터를 가져오는 데 도움이 되는 그래픽 인터페이스를 제공합니다. 그러나 도구에서 "가져오기" 버튼을 클릭하는 대신 코드 섹션 바로 위에 있는 오른쪽 상단의 작은 아이콘을 클릭하는 것이 좋습니다. 이렇게 하면 데이터를 R로 가져오는 데 필요한 코드가 복사됩니다. 그런 다음 추가 사용자 지정 및 제어를 위해 해당 코드를 R 스크립트에 붙여넣을 수 있습니다.

이 도구에서 사용할 수 있는 옵션을 자세히 살펴보겠습니다. 상단에서 Excel 파일의 위치를 지정합니다. 이 도구는 데이터의 미리 보기를 제공하므로 R로 가져올 때 어떻게 보이는지 확인할 수 있습니다. 드롭다운 메뉴를 사용하여 각 열의 변수 유형을 수정할 수 있습니다. 예를 들어 열을 문자 또는 숫자 데이터로 처리할지 여부를 지정할 수 있습니다.

왼쪽 하단에서 R에서 가져온 데이터 개체의 이름을 설정할 수 있습니다. 기본적으로 R은 Excel 파일 이름을 기반으로 이름을 할당합니다. Excel 파일에 여러 시트가 포함된 경우 가져올 시트를 선택할 수도 있습니다. 또한 스프레드시트 내의 범위와 가져올 최대 행 수를 지정할 수 있습니다. "건너뛰기" 옵션을 사용하면 가져오기 프로세스에서 특정 변수를 제외할 수 있습니다.

주목해야 할 한 가지 중요한 점은 R이 기본적으로 스프레드시트의 첫 번째 행을 열 이름으로 사용한다는 것입니다. 그러나 "이름으로 첫 번째 행" 옵션을 선택 취소하면 R이 변수에 자체 이름을 할당합니다.

가져온 데이터를 가져온 직후에 보려면 "데이터 보기" 옵션을 선택할 수 있습니다. 그러나 일반적으로 데이터를 R 스크립트로 직접 가져온 다음 R의 기능을 사용하여 보는 것이 더 편리합니다.

이제 도구에서 생성된 코드를 자세히 살펴보겠습니다. 코드를 R 스크립트에 붙여넣으면 일반적으로 라이브러리 또는 require 함수를 사용하여 readxl 패키지를 로드하는 줄이 포함됩니다. 이 패키지는 Excel 데이터를 R로 가져오는 데 사용되는 read_excel 함수를 제공합니다. 코드 조각은 다음과 같습니다.

library(readxl)
my_data <- read_excel(file = "path/to/your/file.xlsx", sheet = "sheet_name", range = "A1:E10", na = "NA")

코드에서 먼저 라이브러리 함수를 사용하여 readxl 패키지를 로드합니다. 이 패키지에는 Excel 파일을 읽을 수 있는 read_excel 함수가 포함되어 있습니다.

다음으로 가져온 데이터를 저장하기 위해 my_data라는 개체를 만듭니다. 이 개체의 이름을 선택할 수 있습니다.

read_excel 함수 내에서 몇 가지 인수를 제공합니다. file 인수는 Excel 파일의 경로를 지정합니다. 여기에 올바른 파일 경로를 제공해야 합니다.

시트 인수를 사용하면 가져오려는 시트의 이름을 지정할 수 있습니다. Excel 파일에 여러 시트가 있고 특정 시트를 가져오려는 경우 여기에 해당 이름을 제공하십시오. 또는 시트 색인 번호를 대신 사용할 수 있습니다.

범위 인수는 선택 사항이며 가져올 시트 내에서 범위를 지정할 수 있습니다. 예를 들어 "A1:E10"은 셀 A1에서 E10으로 데이터를 가져옵니다. 범위를 지정하지 않으면 전체 시트를 가져옵니다.

na 인수는 누락된 값의 표현을 지정하는 데 사용됩니다. 이 경우 R의 기본 결측값 표현인 "NA"로 설정합니다. 결측값이 Excel 파일에 표시되는 방식에 따라 사용자 정의할 수 있습니다.

코드를 R 스크립트에 붙여 넣으면 실행하여 데이터를 가져올 수 있습니다. 가져온 데이터는 my_data 개체에 저장되며 데이터 분석, 시각화 또는 수행해야 하는 기타 작업을 진행할 수 있습니다.

read_excel 함수에 대해 탐색할 수 있는 추가 인수 및 옵션이 있다는 점은 주목할 가치가 있습니다. R 콘솔에 ?read_excel을 입력하여 함수의 설명서를 참조할 수 있습니다. 그러면 사용 가능한 옵션에 대한 자세한 정보가 제공됩니다.

데이터 분석 학습에 관심이 있고 R 프로그래밍을 더 자세히 살펴보고 싶다면 이 채널을 구독하고 벨 알림을 클릭하여 향후 비디오에 대한 업데이트를 받을 것을 권장합니다.

이 설명이 readxl 패키지를 사용하여 Excel에서 R로 데이터를 가져오는 방법을 이해하는 데 도움이 되기를 바랍니다. 추가 질문이 있으시면 언제든지 문의해 주세요!

How to import data from excel into R studio. R programming for beginners
How to import data from excel into R studio. R programming for beginners
  • 2019.02.20
  • www.youtube.com
Importing data from excel into R is easy. Learn how to import data from excel by using both R code and by using the tools within R studio. This video is part...
 

초보자를 위한 R 프로그래밍. tidyverse를 사용하여 데이터 조작: 선택, 필터링 및 변경.


초보자를 위한 R 프로그래밍. tidyverse를 사용하여 데이터 조작: 선택, 필터링 및 변경.

프로그래밍 101에 다시 오신 것을 환영합니다! 이 과정에서 당신은 R이 강력하고 유용할 뿐만 아니라 재미있고 상대적으로 사용하기 쉽다는 것을 알게 될 것입니다. 그러니 저와 함께 R 프로그래밍의 세계로 뛰어드세요.

이 비디오는 기초에 중점을 둔 초보자를 위한 프로그래밍 시리즈의 일부입니다. 이 특정 비디오에서는 R 내의 기존 데이터 세트에 액세스하고 활용하는 방법을 알려드립니다. R에는 데이터 조작, 분석 및 통계 기술을 연습하는 데 사용할 수 있는 다양한 데이터 세트가 번들로 제공됩니다.

시작하려면 이 비디오에서 안내해 드릴 분석을 복제해 보시기 바랍니다. 데이터 세트에 액세스하고 집에서 따라할 수 있습니다. 직접 실습하는 것이 가장 좋은 학습 방법입니다.

시작하기 전에 필요한 패키지가 설치되어 있는지 확인하십시오. 이 경우 "tidyverse" 패키지를 사용합니다. 아직 설치하지 않았다면 한 번만 수행하면 됩니다. 그러나 각 새 세션에 대해 require 또는 라이브러리 함수를 사용하여 패키지를 로드해야 합니다. 라이브러리(tidyverse) 명령을 실행하여 패키지를 로드해 봅시다.

이제 패키지를 로드했으므로 계속 진행하겠습니다. 우리는 "tidyverse" 패키지와 함께 제공되는 추가 데이터 세트 중 하나인 Star Wars 데이터 세트로 작업할 것입니다. R에서 사용 가능한 모든 데이터 세트 목록을 보려면 data() 함수를 사용할 수 있습니다. data()를 입력하고 엔터를 누르기만 하면 됩니다.

이 분석에서 우리는 스타워즈 영화 속 캐릭터의 건강을 탐구하는 데 관심이 있습니다. 의사로서 건강을 평가하는 한 가지 방법은 체질량 지수(BMI)를 살펴보는 것입니다. 이 지수는 킬로그램 단위의 질량을 미터 단위의 키의 제곱으로 나누어 계산합니다. 남성과 여성 사이에 BMI에 차이가 있는지 조사하고 싶습니다. 또한 인간 캐릭터에 초점을 맞추고 분석에서 드로이드를 제외합니다.

분석을 시작하겠습니다. "tidyverse" 패키지의 %>% 파이프 연산자를 사용하여 여러 작업을 함께 연결할 수 있습니다. 각 코드 줄은 분석의 단계를 나타냅니다.

먼저 파이프 연산자를 사용하여 Star Wars 데이터 세트로 작업하고 있음을 지정합니다. 데이터 세트에는 많은 변수가 포함되어 있지만 그 중 일부만 사용하려고 합니다. 데이터 세트를 단순화하기 위해 select() 함수를 사용하여 특정 변수를 선택할 수 있습니다. 우리의 경우 "gender", "mass", "height" 및 "species" 변수에 관심이 있습니다. 코드는 select(성별, 질량, 키, 종)입니다.

다음으로 데이터 세트에서 사람이 아닌 문자를 필터링하려고 합니다. 이를 위해 filter() 함수를 사용할 수 있습니다. 우리는 종(種)이 "인간"과 동일한 관찰만 포함하도록 지정합니다. 코드는 filter(species == "human")입니다.

데이터 세트를 필터링한 후 제거하려는 누락된 값이 있을 수 있습니다. 이 비디오에서는 누락된 데이터 처리에 대해 자세히 다루지 않으므로 na.omit() 함수를 사용하여 누락된 값이 있는 행을 제거해 보겠습니다. 코드는 na.omit()입니다.

이제 높이 변수를 센티미터에서 미터로 변환해야 합니다. mutate() 함수를 사용하여 새 변수를 만들거나 기존 변수를 수정할 수 있습니다. 높이를 100으로 나누어 미터로 변환합니다. 코드는 mutate(높이 = 높이 / 100)입니다.

마지막으로 각 캐릭터의 BMI를 계산하려고 합니다. mutate() 함수를 다시 사용하여 "BMI"라는 새 변수를 만듭니다. BMI 계산 공식은 질량/신장^2입니다. 코드는

mutate(BMI = mass / height^2)`.

이 시점에서 데이터 세트를 준비하고 각 캐릭터의 BMI를 계산했습니다. 이제 스타워즈 세계에서 남성과 여성의 BMI를 비교하는 데 초점을 맞추겠습니다. 이를 위해 데이터를 성별로 그룹화한 다음 각 그룹의 평균 BMI를 요약해야 합니다.

파이프 연산자를 사용하여 다른 작업을 연결합니다. group_by() 함수를 사용하여 "성별" 변수별로 데이터를 그룹화합니다. 코드는 group_by(성별)입니다.

다음으로, resume() 함수를 사용하여 각 성별 그룹 내의 평균 BMI를 계산합니다. 요약(평균_BMI = 평균(BMI)) 코드를 사용하여 "평균 BMI"라는 새 변수를 만듭니다.

이제 전체 코드를 함께 실행하면 스타워즈 세계에서 남성과 여성의 평균 BMI를 표시하는 요약 테이블을 얻을 수 있습니다.

분석을 요약하면 다음과 같습니다.

  1. 성별, 질량, 키 및 종과 같은 관심 변수를 선택했습니다.
  2. 인간 캐릭터만 포함하도록 데이터 세트를 필터링했습니다.
  3. 누락된 값이 있는 모든 행을 제거했습니다.
  4. 높이 변수를 센티미터에서 미터로 변환했습니다.
  5. 각 캐릭터의 BMI를 계산했습니다.
  6. 데이터를 성별로 그룹화했습니다.
  7. 각 성별 그룹의 평균 BMI를 계산했습니다.

요약표에서 스타워즈 세계관에서 여성의 평균 BMI가 22인 반면 남성의 경우 26임을 관찰할 수 있습니다. 이는 평균적으로 남성의 BMI가 약간 더 높아 과체중 경향이 있음을 나타냅니다. .

Star Wars 데이터 세트를 사용하여 자신의 컴퓨터에서 단계별로 이 분석을 수행하는 것이 좋습니다. 실습을 통해 R 프로그래밍 개념에 대한 이해를 확고히 할 수 있습니다. 분석 경험을 공유하려면 아래 설명에 의견을 남겨주십시오.

R 프로그래밍을 배우는 것은 흥미진진한 여정이며 수행하는 각 분석은 기술을 향상시킬 것임을 기억하십시오. 프로그래밍 101 시리즈에서 더욱 매력적인 콘텐츠를 기대해 주세요.

R programming for beginners. Manipulate data using the tidyverse: select, filter and mutate.
R programming for beginners. Manipulate data using the tidyverse: select, filter and mutate.
  • 2019.03.12
  • www.youtube.com
Learn to manipulate data using the tidyverse package in R. This is part of the "R programming for beginners" series of videos. In this video, I use one of R'...
 

R 프로그래밍의 데이터 유형


R 프로그래밍의 데이터 유형

프로그래밍 101 튜토리얼에 다시 오신 것을 환영합니다! 오늘은 데이터 유형에 대해 알아보겠습니다. 효과적인 프로그래밍을 위해서는 다양한 유형의 데이터를 이해하는 것이 중요합니다. 많은 유형이 있지만 가장 중요한 다섯 가지 유형에 중점을 둘 것입니다. 다른 유형에 대해서도 간단히 다룰 것입니다. 또한 R에서 변수의 데이터 유형을 변경하는 방법과 요인에 수준을 추가하는 방법을 알아봅니다. 그러니 우리와 함께 있고 바로 뛰어들자!

R 프로그래밍에 대해 배우기 위해 여기에 오셨다면 잘 찾아오셨습니다. 이 YouTube 채널에서는 다양한 주제를 다루는 포괄적인 프로그래밍 동영상을 제공합니다. 이 자습서에서는 이름, 키, 나이 및 체중의 네 가지 주요 데이터 유형에 대해 설명합니다.

첫 번째 유형은 명목 데이터를 나타내는 "이름"입니다. R에서는 텍스트로 구성되어 있으므로 문자 데이터 유형으로 분류합니다. 다음 유형은 "높이"로 역시 범주형 데이터이지만 특정 순서가 있습니다. R에서는 이를 서수 데이터라고 하며 요인으로 나타냅니다. 요인을 사용하면 변수에 다른 수준을 할당할 수 있습니다.

계속해서 정수인 "나이"가 있습니다. R에서는 이를 정수 데이터 유형으로 분류합니다. 마지막으로 정수 사이의 숫자 값인 "가중치"가 있습니다. R에서는 이것을 숫자 변수로 간주합니다.

환경에서 "friends"라는 객체인 데이터 프레임의 구조를 검사하기 위해 str() 함수를 사용할 수 있습니다. str(friends)를 실행하면 콘솔에서 데이터 프레임의 구조를 볼 수 있습니다. R은 데이터 프레임에서 각 변수의 데이터 유형에 대한 정보를 제공합니다. "이름" 변수는 문자로 올바르게 식별되지만 "키", "나이" 및 "체중"은 각각 문자 및 숫자로 분류됩니다.

"높이" 변수의 데이터 유형을 문자에서 요소로 변경하려면 as.factor() 함수를 사용합니다. 코드 friends$height <- as.factor(friends$height) 는 "높이" 변수를 요인으로 변환하고 그에 따라 데이터 프레임을 업데이트합니다.

마찬가지로 "age" 변수의 데이터 유형을 정수로 변경하려면 as.integer() 함수를 사용할 수 있습니다. friends$age <- as.integer(friends$age) 코드는 "나이" 변수를 정수로 변환합니다.

이제 "높이" 변수에 수준을 추가하는 데 초점을 맞추겠습니다. 기본적으로 R은 사전순으로 요인 변수에 수준을 할당합니다. 그러나 순서를 변경하려면 levels() 함수를 사용할 수 있습니다. 예를 들어, "키"의 레벨을 "짧은", "중간", "키 큰"으로 설정하려면 코드 levels(friends$height) <- c("짧은", "중간", "키 큰"을 사용할 수 있습니다. ").

코드를 실행하면 str(friends) 명령을 다시 실행하여 변경 사항을 확인할 수 있습니다. 이제 "신장" 변수가 우리가 의도한 대로 "단신", "중간" 및 "신장" 수준의 요인임을 관찰할 수 있습니다.

논의된 네 가지 유형 외에도 "논리적"이라는 또 다른 중요한 유형의 데이터가 있습니다. 참/거짓 값을 저장하는 데 논리 변수를 사용할 수 있습니다. 논리 연산을 사용하여 변수를 비교하고 비교를 기반으로 새로운 논리 변수를 생성할 수 있습니다.

예를 들어 데이터 프레임의 개인이 23세 이상인지 확인하기 위해 "old"라는 새 논리 변수를 만들 수 있습니다. 코드 friends$old <- friends$age > 23을 사용하여 "age" 변수를 값 23을 지정하고 결과를 "이전" 변수에 할당합니다.

class(friends$old)를 사용하여 "old" 변수의 클래스를 검사하여 실제로 논리적 변수임을 확인할 수 있습니다.

이 튜토리얼 전체에서 가장 중요한 다섯 가지 유형의 데이터인 문자, 요소, 정수, 숫자 및 논리를 다루었습니다. 이러한 유형은 데이터 분석 여정의 기반이 됩니다. 그러나 시간 및 날짜 데이터와 같은 다른 유형의 데이터가 있으며 향후 비디오에서 살펴볼 것입니다.

데이터 분석 및 R 프로그래밍 마스터에 대해 진지하게 생각하고 있다면 구독 버튼을 누르고 알림 벨을 활성화하십시오. 이렇게 하면 업데이트된 상태를 유지하고 향후 동영상에 대한 알림을 받을 수 있습니다.

이 프로그래밍 101 자습서에 참여해 주셔서 감사합니다. 유익하고 도움이 되었기를 바랍니다. 계속 호기심을 갖고 매혹적인 프로그래밍 세계를 탐험하세요!

Data types in R programming
Data types in R programming
  • 2019.03.28
  • www.youtube.com
In this video I provide an overview of the five main types of data used in R programming. These are character, factor, integer, continuous and logical. I sho...
 

초보자를 위한 R 프로그래밍: 변수 이름 바꾸기 및 열 재정렬. 데이터 정리 및 조작.


초보자를 위한 R 프로그래밍: 변수 이름 바꾸기 및 열 재정렬. 데이터 정리 및 조작.

다시 오신 것을 환영합니다, 애호가 여러분! 오늘의 자습서에서는 R에서 열의 이름을 바꾸고 재정렬하는 흥미로운 주제에 대해 자세히 알아볼 것입니다. 매우 쉬우므로 R 프로그래밍 기술 수준을 높일 준비를 하십시오. R 프로그래밍 학습에 열정이 있다면 잘 찾아오셨습니다. YouTube 채널은 다양한 프로그래밍 주제를 다루며 귀중한 통찰력과 자습서를 제공합니다.

프로세스를 시연하기 위해 Star Wars 데이터 세트를 사용합니다. 이 데이터 세트는 오늘 보여드릴 단계를 따라 연습하고 따라하기에 완벽합니다. 단계별로 따라할 수 있도록 컴퓨터에서 Star Wars 데이터 세트를 가져오는 것부터 시작하겠습니다.

아직 설치하지 않았다면 tidyverse 패키지를 설치해야 합니다. 이 패키지는 데이터 조작 및 분석을 위해 설계된 강력한 R 패키지 모음입니다. 일단 설치되면 library() 또는 require() 함수를 사용하여 tidyverse 패키지를 로드하고 해당 기능에 액세스할 수 있습니다. tidyverse 패키지에는 우리가 사용할 Star Wars 데이터 세트가 포함되어 있습니다.

Star Wars 데이터 세트로 작업할 SW라는 새 개체를 만들어 보겠습니다. 할당 연산자(<-)를 사용하여 Star Wars 데이터 세트를 SW 개체에 할당합니다. 이를 통해 원본 데이터 세트를 수정하지 않고도 변경하고 실험할 수 있습니다. Enter 키를 눌러 코드를 실행하고 환경에서 SW 개체를 클릭하면 데이터 세트가 표시됩니다.

이제 tidyverse의 환상적인 기능 중 하나는 작업을 함께 연결할 수 있는 파이프 연산자 %>%입니다. 이를 사용하여 데이터 세트에서 특정 열을 선택합니다. 예를 들어 이름, 높이 및 질량에 대한 열만 필요하다고 가정해 보겠습니다. select() 함수를 사용하고 원하는 열 이름을 지정할 수 있습니다. Enter 키를 눌러 코드를 실행하고 SW 개체를 클릭하면 선택한 열만 포함되어 있음을 알 수 있습니다.

추가 열을 포함하려면 select() 함수 내에 추가할 수 있습니다. 예를 들어 성별 열을 추가하려면 코드를 선택(이름, 질량, 키, 성별)으로 수정하면 됩니다. 이렇게 하면 결과 데이터 세트에 제공된 순서대로 지정된 열이 포함됩니다.

이제 열에 다른 이름을 지정하고 싶다고 가정해 보겠습니다. 여기서 rename() 함수가 유용합니다. 파이프 연산자 %>%를 사용하여 작업을 함께 연결할 수 있습니다. 열에 할당할 새 이름, = 기호, 원래 열 이름 순으로 지정하는 것으로 시작하겠습니다. 예를 들어 "질량" 열의 이름을 "중량"으로 바꾸겠습니다. 코드를 실행하면 SW 데이터 세트에서 그에 따라 열 이름이 변경된 것을 볼 수 있습니다.

이러한 방식으로 select() 함수를 사용하여 열 이름을 쉽게 바꾸고 데이터 세트 내에서 순서를 변경할 수도 있습니다. 파이프 연산자 %>%를 사용하면 작업이 원활하게 진행되어 코드의 가독성과 효율성이 향상됩니다.

데이터 분석 마스터와 R 프로그래밍 학습에 대해 진지하게 생각하고 있다면 구독 버튼을 누르고 알림 벨을 활성화하십시오. 이렇게 하면 향후 동영상에 대한 정보를 계속 받아 볼 수 있으므로 소중한 콘텐츠를 절대 놓치지 않을 수 있습니다.

프로그래밍 커뮤니티의 일원이 되어 주셔서 감사합니다. 이 튜토리얼이 유익하고 흥미로웠기를 바랍니다. 계속 호기심을 갖고 매혹적인 R 프로그래밍 세계를 탐험하세요!

R programming for beginners: Rename variables and reorder columns. Data cleaning and manipulation.
R programming for beginners: Rename variables and reorder columns. Data cleaning and manipulation.
  • 2020.05.08
  • www.youtube.com
This is an R programming for beginners video. Learn how to rename variables and reorder columns in R. If you want to use the Tidyverse in R to manipulate dat...
사유: