Учебники по программированию - страница 8

 

Программа линейной регрессии R делает прогнозы


Программа линейной регрессии R делает прогнозы

Всем привет и добро пожаловать в этот видеоурок по языку программирования R.

В этом руководстве мы углубимся в анализ данных и сосредоточимся на прогнозировании с использованием модели линейной регрессии. Линейная регрессия — это мощный инструмент для моделирования связи между скалярной зависимой переменной (Y) и одной или несколькими независимыми переменными (X) в форме уравнения прямой линии.

Для начала давайте выберем подходящий набор данных для нашего прогноза. R предоставляет множество встроенных наборов данных, доступ к которым можно получить, набрав data() и изучив доступные параметры. В этом уроке мы будем использовать набор данных «женщины», который содержит средние значения роста и веса американских женщин. Мы можем изучить набор данных, набрав View(women) и увидеть его структуру с 15 строками и 2 столбцами: рост и вес.

Наша цель — предсказать вес женщины на основе ее роста. Для этого воспользуемся линейной моделью. Мы начинаем с создания переменной с именем «linear_model» и присвоения ей результата функции lm(). Эта функция требует указания зависимой переменной (Y) и независимой переменной (X). В этом случае вес будет зависимой переменной (Y), а рост будет независимой переменной (X), что обозначается синтаксисом вес ~ рост. Кроме того, нам нужно указать набор данных с помощью параметра данных, который мы установили как «женщины».

Определив нашу линейную модель, мы можем исследовать ее коэффициенты. Эти коэффициенты соответствуют наклону (M) и точке пересечения (B) в уравнении Y = MX + B. В нашем случае коэффициенты равны -87,52 и 3,45 соответственно. Таким образом, наш прогнозируемый вес (Y) можно рассчитать, умножив высоту (X) на наклон (3,45) и добавив точку пересечения (-87,52).

Чтобы проверить наш прогноз, возьмем значение высоты 59 дюймов. Умножая это на наклон (3,45) и добавляя точку пересечения (-87,52), мы получаем предсказанный вес 116,03, что близко к ожидаемому значению 117.

Теперь давайте визуализируем данные и линию линейной регрессии. Мы можем построить набор данных, используя функцию plot(), указав значения Y и X и набор данных в качестве параметра данных. Вызвав функцию abline() с нашей линейной моделью, мы можем наложить линию регрессии на график.

В заключение мы рассмотрели процесс прогнозирования с использованием модели линейной регрессии в R. Важно отметить, что набор данных, используемый в этом руководстве, относительно небольшой и состоит всего из 15 строк. В реальных сценариях для более точных прогнозов обычно используются большие наборы данных. Тем не менее, демонстрация дает представление о процессе линейной регрессии.

Спасибо за просмотр этого видеоурока. Если у вас есть какие-либо вопросы, не стесняйтесь оставлять их в разделе комментариев. Оставайтесь с нами для следующего видео!

Linear Regression R Program Make Predictions
Linear Regression R Program Make Predictions
  • 2017.05.11
  • www.youtube.com
Use Linear regression Model on R program data set to make predictions.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutori...
 

Как установить пакеты R


Как установить пакеты R

Всем привет и добро пожаловать в это видео. Сегодня я хочу обсудить процесс установки пакетов в R.

В частности, я покажу, как установить пакет ggplot2, который широко используется для визуализации данных. Для начала я заметил, что пакет ggplot2 в настоящее время недоступен в моей библиотеке. Когда я пытаюсь импортировать его с помощью библиотеки (ggplot2), появляется сообщение об ошибке, в котором говорится, что нет пакета с именем ggplot2.

Чтобы решить эту проблему, мне нужно установить пакет ggplot2. К счастью, установка пакетов в R проста. Мы можем использовать функцию install.packages(), за которой следует имя пакета, заключенное в кавычки. В этом случае я выполню команду install.packages("ggplot2") и нажму Enter.

Начнется процесс установки, и R начнет загрузку необходимых файлов и данных для пакета ggplot2 из комплексной сети архивов R (CRAN). На этом этапе важно иметь подключение к Интернету.

Пакет ggplot2 известен своей способностью создавать визуально привлекательную и настраиваемую графику. Он использует грамматику графики для построения многоуровневых графиков, обеспечивая большую гибкость в визуализации данных.

После завершения установки мы можем приступить к загрузке пакета ggplot2 в нашу среду. Для этого мы используем функцию library() и передаем «ggplot2» в качестве аргумента. При выполнении библиотеки (ggplot2) мы больше не сталкиваемся с предыдущим сообщением об ошибке, указывающим на то, что пакет был успешно установлен и загружен.

Благодарим вас за просмотр этого видеоурока по установке пакетов в R. Если у вас есть какие-либо вопросы, не стесняйтесь оставлять их в разделе комментариев. Не забудьте поставить лайк этому видео, подписаться на канал, чтобы получать больше контента, и следите за обновлениями для следующего видеоурока.

How To Install R Packages
How To Install R Packages
  • 2017.05.11
  • www.youtube.com
Install R packages using instal.packages("[package_name_here]") commandPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutor...
 

Гистограмма программы R


Гистограмма программы R

Всем привет и добро пожаловать на очередной видеоурок по языку программирования R. В сегодняшнем уроке мы узнаем, как создать простую гистограмму с помощью R.

Для начала давайте определим вектор под названием «автомобили» с шестью значениями. Мы можем добиться этого, создав переменную с именем «автомобили» и присвоив ей значения 2, 4, 7, 5, 10 и 12. Этот вектор представляет точки данных, которые мы хотим визуализировать на нашей гистограмме.

Теперь давайте перейдем к созданию фактической гистограммы. Мы будем использовать функцию «barplot()», которая специально разработана для создания гистограмм в R. В качестве входного параметра мы передаем в функцию вектор «cars».

Когда мы выполним код, в правой части экрана будет сгенерирована гистограмма, отображающая шесть значений из нашего вектора «cars» в виде отдельных столбцов.

Я надеюсь, что этот короткий видеоурок по созданию простой гистограммы на языке программирования R был для вас полезным и информативным. Если у вас есть какие-либо вопросы, пожалуйста, не стесняйтесь оставлять их в разделе комментариев. Оставайтесь с нами для следующего видео, где мы углубимся в более интересные темы.

R Program Bar Graph
R Program Bar Graph
  • 2017.05.13
  • www.youtube.com
Create a simple bar graph using the R programming languagePlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://w...
 

Цвет гистограммы программы R


Цвет гистограммы программы R

Привет всем, и добро пожаловать в этот видеоурок по языку программирования R. На этом занятии мы будем использовать RStudio для создания визуально привлекательной гистограммы с использованием языка программирования R.

Для начала давайте откроем RStudio и настроим нашу среду. У нас уже есть конкретная цель — создать гистограмму. Но на этот раз мы сосредоточимся на том, чтобы сделать его более эстетичным.

Теперь давайте определим вектор под названием «автомобили» с семью значениями. Мы можем добиться этого, создав переменную с именем «автомобили» и назначив ей вектор, содержащий семь элементов. Давайте использовать значения 3, 5, 8, 6, 11, 12 и 4.

Далее мы воспользуемся функцией «barplot()», как и раньше, для создания гистограммы. Однако на этот раз мы добавим несколько дополнительных параметров, чтобы улучшить внешний вид диаграммы.

Во-первых, давайте добавим заголовок к диаграмме. Мы будем использовать параметр «основной» и установим для него значение «Автомобили», чтобы дать нашей гистограмме описательный заголовок.

Кроме того, мы хотим пометить ось Y, указав, что значения представляют вес автомобилей. Мы можем добиться этого, указав параметр «ylab» и установив для него значение «Вес».

Кроме того, мы должны пометить ось X, чтобы указать, что каждая полоса представляет отдельный тип автомобиля. Мы будем использовать параметр «xlab» и установим для него значение «Тип».

Наконец, чтобы добавить немного визуальной привлекательности, давайте используем разные цвета для полос. Мы установим для параметра «col» значение «радуга (7)», чтобы создать радугу из семи различных цветов.

Как только мы выполним код, в правой части экрана появится гистограмма. Он будет называться «Автомобили» и будет отображать значения веса по оси Y и различные типы автомобилей по оси X. Сами полосы будут окрашены в яркую радужную палитру.

Я надеюсь, что вы нашли этот видео-урок полезным и интересным. Если у вас есть какие-либо вопросы, пожалуйста, не стесняйтесь спрашивать. Не забудьте оставить свои комментарии ниже, и я сделаю все возможное, чтобы ответить на них. Оставайтесь с нами, чтобы увидеть больше интересных уроков в следующем видео.

R Program Bar Chart Color
R Program Bar Chart Color
  • 2017.05.13
  • www.youtube.com
Create a Bar chart with color, title, and labels in the R programming language.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programmi...
 

Пример программирования гистограммы в R


Пример программирования гистограммы в R

Привет всем, и добро пожаловать в этот учебник по языку программирования R. В этом видео мы рассмотрим, как создать простую гистограмму с помощью R. Давайте приступим!

Для начала мы определим вектор под названием «внедорожник» с семью элементами. Мы можем добиться этого, создав переменную с именем «внедорожник» и назначив ей вектор, содержащий значения 5, 5, 5, 5, 8, 8, 19, 45 и 100.

Теперь, когда мы настроили вектор нашего внедорожника, мы можем приступить к созданию гистограммы. Это можно сделать с помощью функции «hist()». Мы передадим вектор «внедорожника» в качестве параметра функции.

После выполнения кода в правой части экрана отобразится гистограмма. Ось Y представляет частоту, а ось X представляет диапазон значений. В этом случае мы можем наблюдать, что диапазон от 0 до 20 имеет частоту 5, что указывает на пять вхождений значений в этом диапазоне. Точно так же диапазоны от 40 до 60 и от 80 до 100 имеют частоты 3 и 1 соответственно.

Я надеюсь, что вы нашли этот видеоурок информативным и простым. Создание гистограммы с помощью R — полезный способ визуализации распределения данных. Если у вас есть какие-либо вопросы или комментарии, пожалуйста, не стесняйтесь оставлять их ниже. Оставайтесь с нами, чтобы увидеть больше интересных уроков в следующем видео.

R Programming Histogram Example
R Programming Histogram Example
  • 2017.05.13
  • www.youtube.com
Simple Histogram program in RPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-programming-fo...
 

Программирование в R: работа с подмножествами


Программирование в R: работа с подмножествами

Привет, ребята, и добро пожаловать в это видео о языке программирования R. В этом руководстве мы собираемся изучить подмножество, которое включает в себя извлечение определенного подмножества данных. Давайте начнем!

Предположим, у нас есть вектор с именем «X», содержащий значения 12, 13, 56, 4, 5 и 89. Мы выведем этот вектор на консоль, чтобы проверить его содержимое.

Теперь предположим, что мы хотим извлечь подмножество данных, где значения больше 10. Мы можем добиться этого, используя выражение «X > 10». Это даст нам подмножество данных, где все значения больше 10.

Далее предположим, что мы хотим изменить эти выбранные значения на 4. Мы можем просто присвоить значение 4 подмножеству, которое мы получили ранее, используя выражение «X[X > 10] <- 4». Это заменит все значения больше 10 в «X» на 4.

Распечатав измененный «X», мы можем заметить, что значения больше 10 действительно были изменены на 4.

Теперь давайте поработаем с некоторыми внешними данными. У нас есть CSV-файл, расположенный на рабочем столе, и мы хотим прочитать его во фрейме данных под названием «набор данных». Используя функцию «read.csv()», мы указываем путь и имя файла для импорта данных CSV. Распечатав «набор данных», мы можем увидеть измерения (153 строки и 6 столбцов) и определить отсутствующие значения, помеченные как «NA».

Двигаясь дальше, давайте рассмотрим различные манипуляции с этими данными. Мы можем извлечь первые две строки набора данных, используя функцию «head()», указав «набор данных» и количество строк, которые нам нужны (2). В качестве альтернативы мы можем использовать индексацию по строкам и столбцам с «набором данных [1: 2,]» или «набором данных [c (1, 2),]». Все эти методы обеспечивают одинаковый результат получения первых двух строк.

Чтобы определить количество строк в наборе данных, мы можем использовать функцию «nrow()» и передать «набор данных» в качестве аргумента. Это дает нам количество строк, равное 153.

Предположим, мы хотим извлечь последние две строки набора данных. Мы можем сделать это, используя функцию «tail ()» с «набором данных» и указав количество строк (2). Возвращаются последние две строки.

Теперь найдем значение столбца «озон» в 47-й строке. Мы можем получить к нему прямой доступ с помощью индексирования, например, «набор данных[47, 'озон']» или «набор данных[47, 1]». Это возвращает значение 21.

В качестве альтернативы мы можем использовать имя столбца вместо индекса столбца. Например, "набор данных[47, 'озон']" также вернет 21.

Предположим, мы хотим найти пропущенные значения в столбце «озон». Мы можем создать подмножество набора данных, используя функцию «подмножество ()». Подмножество будет состоять из строк, в которых столбец «озон» имеет значения «NA». Распечатав подмножество, мы видим, что столбец «озон» содержит только значения «NA».

Чтобы определить количество пропущенных значений в столбце «озон», мы можем использовать функцию «nrow()» для подмножества, которая дает нам ответ как 37.

Если мы хотим удалить отсутствующие значения из набора данных, мы можем использовать функцию «na.omit()» и передать «набор данных» в качестве аргумента. Это возвращает набор данных с удаленными отсутствующими значениями.

Другой способ добиться этого — использовать функцию «complete.cases()» с «набором данных» в качестве аргумента. Это дает тот же результат удаления строк со значениями «NA».

Теперь перейдем к нахождению максимального значения столбца «озона» в мае месяце. Мы можем создать подмножество набора данных, используя функцию «подмножество ()». В функции подмножества мы указываем условия: месяц должен быть равен 5 (представляющий май) и столбец «озон» не должен содержать пропущенных значений. Распечатав подмножество, мы можем увидеть отфильтрованные данные.

Чтобы получить максимальное значение из этого подмножества без его визуального осмотра, мы можем использовать функцию «apply()». Применяя функцию «max()» к столбцам подмножества, мы получаем максимальное значение. В данном случае мы применяем его к колонке «озон». Максимальное содержание озона в мае составляет 115.

В заключение мы рассмотрели различные методы создания подмножеств в R, включая извлечение подмножеств на основе условий, доступ к определенным элементам с помощью индексации, обработку пропущенных значений и выполнение вычислений над подмножествами. Я надеюсь, что вы нашли этот урок полезным. Если у вас есть какие-либо вопросы или комментарии, не стесняйтесь оставлять их ниже. Не забудьте подписаться на дополнительные руководства по программированию на R. Спасибо за просмотр, и увидимся в следующем видео!

R Programming Subset
R Programming Subset
  • 2017.05.30
  • www.youtube.com
Get subsets of matrices and data framesPlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-prog...
 

Подмножество программ R2


Подмножество программ R2

Привет, ребята, добро пожаловать в это видео о языке программирования R. В этом уроке мы найдем среднее значение длины чашелистиков для вида virginica в наборе данных радужной оболочки. Давайте начнем с изучения предопределенных наборов данных в R. Чтобы просмотреть доступные наборы данных, мы используем функцию «data()» без каких-либо аргументов. Это отображает список наборов данных, предоставленных в R. Для нашего анализа мы будем работать с набором данных «радужная оболочка».

Давайте загрузим набор данных «радужная оболочка», набрав «данные (радужная оболочка)». При этом загружается весь набор данных, состоящий из 150 строк и пяти столбцов: длина чашелистика, ширина чашелистика, длина лепестка, ширина лепестка и виды. Чтобы извлечь подмножество, содержащее только виды «virginica», мы создаем новую переменную с именем «iris_subset». Используя операцию подмножества, мы указываем, что нам нужны все строки, в которых вид равен 'virginica'. Поскольку нам также нужны все столбцы, мы опускаем спецификацию столбца.

Распечатав «iris_subset», мы можем заметить, что теперь у нас есть подмножество набора данных «iris», содержащее только виды «virginica». Далее нас интересует вычисление среднего значения длины чашелистиков для этого подмножества. Чтобы сосредоточиться на столбце длины чашелистика, мы модифицируем «iris_subset», чтобы включить только столбец длины чашелистика.

Теперь давайте преобразуем «iris_subset» в матрицу. Мы присваиваем преобразованную матрицу новой переменной с именем «iris_subset_matrix», используя функцию «as.matrix()». Преобразовав его в матрицу, мы можем применять математические операции к определенным столбцам. «iris_subset_matrix» похож на исходное подмножество, но теперь является матричным объектом.

Чтобы вычислить среднее значение длины чашелистика, мы используем функцию «mean()» в столбце длины чашелистика матрицы «iris_subset_matrix». Это дает нам среднее значение 6,588 для длины чашелистиков вида 'virginica'.

Стоит отметить, что существуют альтернативные способы выполнения подмножества с помощью функции 'subset()'. Однако в этом руководстве мы продемонстрировали альтернативный подход к управлению данными в R путем извлечения подмножеств, преобразования их в матрицы и выполнения вычислений. Эти методы обеспечивают гибкость анализа данных.

Спасибо за просмотр! Если у вас есть какие-либо вопросы или комментарии, пожалуйста, оставьте их ниже. Не забудьте поставить лайк этому видео и подписаться на наш канал, чтобы получать больше руководств по программированию на R. Оставайтесь с нами для следующего видео!

R Program Subset2
R Program Subset2
  • 2017.06.07
  • www.youtube.com
Get the mean of Sepal.Length for species virginica in the iris dataset.Please Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutor...
 

Чтение программирования JSON R


Чтение программирования JSON R

Привет, ребята, добро пожаловать в этот туториал по языку программирования R. В этом видео мы обсудим, как извлекать информацию из JSON (нотация объектов JavaScript). Чтобы продемонстрировать это, у меня есть GitHub API в фоновом режиме, который отображает информацию обо всех моих репозиториях. Вы можете увидеть выделенное мое имя пользователя GitHub вместе со списком репозиториев, включая «awesome-tensorflow», который я разветвил из другого репозитория.

Чтобы извлечь эти данные и работать с ними, мы будем использовать библиотеку jsonlite в R. Начнем с извлечения данных из JSON. Мы создадим переменную с именем «json_data» и используем функцию «fromJSON()» для получения данных с определенного URL-адреса. Я скопирую URL-адрес GitHub API и передам его в качестве аргумента функции fromJSON().

После выполнения этого кода мы получаем фрейм данных. Чтобы подтвердить класс json_data, мы используем функцию class(), которая показывает, что это действительно фрейм данных.

Теперь давайте изучим содержимое переменной json_data. Мы можем использовать функцию «names()» для получения имен атрибутов во фрейме данных. Набрав «names(json_data)», мы получим список атрибутов, включая «name», который представляет имя каждого репозитория.

Чтобы извлечь имена всех моих репозиториев, мы можем получить доступ к атрибуту «имя» напрямую, используя синтаксис «json_data$name». Это показывает имена всех моих репозиториев, всего около 30.

Далее давайте рассмотрим сценарий преобразования фрейма данных, такого как набор данных «радужная оболочка», в формат нотации объектов JavaScript (JSON). Для этого мы можем использовать функцию toJSON(). Например, давайте создадим переменную с именем my_json и применим функцию toJSON() к набору данных iris. Кроме того, мы можем включить параметр «красиво», чтобы итоговый JSON был отформатирован визуально приятным образом.

Распечатав «my_json», мы можем заметить, что JSON аккуратно отформатирован с правильным отступом. Он отображает атрибуты «длина чашелистика», «ширина чашелистика», «длина лепестка», «ширина лепестка» и «вид» вместе с их соответствующими значениями, такими как «6,3», «4,8», «1,8» и « виргиния».

Если мы удалим параметр «красивый» и снова создадим JSON, он станет менее читаемым и усекается из-за своей длины. Таким образом, для лучшей визуализации рекомендуется использовать параметр «красиво».

Теперь давайте рассмотрим, как преобразовать JSON обратно во фрейм данных. Для этого мы можем использовать функцию fromJSON() и указать переменную my_json в качестве параметра. Выполнение этого кода возвращает исходный фрейм данных, эффективно обращая процесс преобразования.

Спасибо за просмотр! Если у вас есть какие-либо комментарии или вопросы, пожалуйста, не стесняйтесь оставлять их ниже. Ваше мнение очень ценится. Не забудьте подписаться на наш канал, чтобы получать больше руководств по программированию на R. Оставайтесь с нами для следующего видео!

Reading JSON R Programming
Reading JSON R Programming
  • 2017.06.20
  • www.youtube.com
Read in Javascript Object Notation (JSON) from git API using the R Programming Language.Git API: https://api.github.com/users/randerson112358/reposGet the co...
 

Чтение файла CSV в R


Чтение файла CSV в R

Привет, ребята, добро пожаловать в этот видеоурок по языку программирования R. В этом руководстве я покажу вам, как открыть файл CSV с помощью R. Для начала я уже открыл справочную документацию R в правой части экрана. Мы видим, что есть функция read.csv(), которую мы можем использовать для этой задачи. По умолчанию эта функция предполагает, что файл имеет заголовки, а значения разделены запятыми.

Давайте создадим переменную с именем my_data для хранения данных из CSV-файла. Мы будем использовать функцию read.csv() для чтения файла. Мы можем указать путь к файлу в качестве аргумента функции. Чтобы получить путь к файлу, у меня есть CSV-файл, содержащий данные о доме, которые я получил с веб-сайта Kaggle. Я щелкну файл правой кнопкой мыши, перейду в «Свойства» и скопирую расположение файла. Вернувшись в RStudio, я вставлю путь к файлу в кавычках.

Теперь нам нужно включить имя файла в путь к файлу. Я добавлю косую черту после пути к файлу и вставлю имя файла. Важно отметить, что, поскольку я использую компьютер с Windows, путь к файлу содержит обратную косую черту. Однако для R требуется косая черта или экранированная обратная косая черта. Если мы выполним код сейчас, мы столкнемся с ошибкой из-за обратной косой черты. Чтобы решить эту проблему, мы вручную изменим косую черту.

Давайте нажмем ENTER, чтобы выполнить код. В результате мы получаем фрейм данных с именем «my_data» с 1460 наблюдениями или строками и 81 функцией или столбцом. Мы можем подтвердить это, используя функции «nrow()» и «ncol()» с «my_data».

Чтобы изучить данные, мы можем либо дважды щелкнуть переменную «my_data» на панели «Среда», либо использовать команду «my_data» в консоли. Однако просмотр всего фрейма данных в консоли может быть не очень удобочитаемым. Поэтому я рекомендую дважды щелкнуть «my_data», чтобы отобразить красиво отформатированную таблицу.

Это все для этого урока, ребята! Спасибо за просмотр. Я надеюсь, что вы нашли это полезным. Если у вас есть какие-либо вопросы или комментарии, не стесняйтесь оставлять их ниже. Не забудьте подписаться на наш канал, чтобы получать больше руководств по программированию на R. Оставайтесь с нами для следующего видео!

Read CSV File In R
Read CSV File In R
  • 2017.07.08
  • www.youtube.com
Read a .CSV file in R programming languagePlease Subscribe !►Websites: http://everythingcomputerscience.com/►C-Programming Tutorial:https://www.udemy.com/c-p...
 

Множественная линейная регрессия в R


Множественная линейная регрессия в R

Привет, ребята, добро пожаловать в это видео о языке программирования R. Сегодня я хочу обсудить множественную линейную регрессию и продемонстрировать, как ее реализовать в RStudio. Для начала нам нужен набор данных для анализа. У меня уже есть CSV-файл под названием «real_estate.csv», который я получил в Интернете. Вы можете найти ссылку для загрузки этого набора данных в описании ниже.

Начнем с создания переменной my_data и использования функции read.csv() для чтения CSV-файла в RStudio. Нам нужно указать расположение и имя файла. Чтобы получить местоположение, я щелкну файл правой кнопкой мыши и выберу «Свойства», чтобы скопировать местоположение файла. После вставки местоположения я заключу его в кавычки. Кроме того, я включу имя файла после косой черты и позабочусь о том, чтобы изменить косую черту на противоположную, чтобы она соответствовала требуемому формату для компьютеров Windows. Выполнение этого кода создает фрейм данных my_data, который содержит 781 строку и 8 столбцов.

Теперь давайте подробнее рассмотрим фрейм данных. У нас есть несколько столбцов, в том числе «MLS» (множественный номер службы листинга), «Местоположение», «Цена», «Спальни», «Ванные комнаты», «Площадь» (площадь дома в квадратных футах), «Цена/кв. и «Статус» (тип продажи). В целях демонстрации множественной линейной регрессии мы будем работать только с числовыми столбцами и исключим «Местоположение» и «Статус».

Чтобы создать новый набор данных, я назначу «my_data» новой переменной с именем «my_data2» и выберу столбцы 1, 3, 4, 5, 6 и 7. Этот новый набор данных содержит 781 строку и 6 столбцов.

Теперь давайте перейдем к созданию нашей линейной модели. Я создам переменную с именем «lin_mod» и установлю ее равной функции «lm()», что означает «линейная модель». Мы хотим спрогнозировать «Цену» на основе таких характеристик, как «MLS», «Спальни», «Ванные комнаты», «Размер» и «Цена/кв. фут». Указав «Цена» в качестве зависимой переменной и включив другие функции, мы можем построить нашу линейную модель, используя набор данных «my_data2».

Чтобы получить сводку по нашей линейной модели, я буду использовать функцию «summary()» для «lin_mod». Сводка предоставляет информацию об остатках, коэффициентах и p-значениях. Значимость переменных можно визуально определить с помощью звездочек, где три звездочки указывают на высокую значимость.

Теперь, когда у нас есть линейная модель, давайте попробуем сделать прогноз. Я создам переменную с именем «цена» и установлю ее равной коэффициенту пересечения минус 7,34 плюс коэффициенты переменных, умноженные на их соответствующие значения из последней строки таблицы. Например, мы умножим значение «MLS» на его коэффициент и добавим его в уравнение. Точно так же мы включим в уравнение прогноза «Спальни», «Ванные комнаты», «Площадь» и «Цена/кв. фут».

Давайте напечатаем прогнозируемую цену и сравним ее с фактической ценой последней строки в наборе данных. Прогнозируемая цена должна быть около 1 100 000 долларов. После выполнения кода мы получаем прогнозируемую цену в 1 023 000 долларов, что примерно на 77 000 долларов ниже фактической цены. Хотя разница значительна, она может не быть серьезной проблемой для покупателей, рассматривающих дом за миллион долларов.

Я надеюсь, что вы нашли это видео информативным и интересным. Если у вас есть какие-либо вопросы или комментарии, пожалуйста, оставьте их ниже. Не забудьте поставить лайк этому видео и следите за новыми уроками. Спасибо за просмотр, увидимся в следующем.

Multiple Linear Regression In R
Multiple Linear Regression In R
  • 2017.07.10
  • www.youtube.com
Multiple Linear Regression In R prediction.Get the Code: https://github.com/randerson112358/R-Programs/blob/master/MultLinReg.RGet the Dataset:https://wiki.c...
Причина обращения: