Учебники по программированию - страница 16

 

Проверка гипотез: односторонние и двусторонние альтернативы


Проверка гипотез: односторонние и двусторонние альтернативы

В сегодняшнем обсуждении мы углубимся в концепцию проверки гипотез, уделив особое внимание односторонним и двусторонним альтернативным гипотезам. Начнем с пересмотра фундаментальной структуры проверки гипотезы о среднем значении.

Первым шагом является определение нулевой гипотезы, обозначенной как H₀. Это утверждение относится к среднему значению населения и представляет собой утверждение, против которого мы стремимся собрать доказательства. После этого мы устанавливаем альтернативную гипотезу, обозначенную как Hₐ, которая противоречит нулевой гипотезе и обычно представляет гипотезу, которую мы пытаемся установить. Идея, стоящая за этим процессом, состоит в том, что, накапливая доказательства против нулевой гипотезы, мы косвенно накапливаем доказательства в пользу альтернативной гипотезы.

Впоследствии мы собираем данные и вычисляем выборочное среднее, обозначаемое как x̄. Оттуда мы определяем вероятность (p-значение) получения выборочного среднего, столь же экстремального, как и наблюдаемое нами, при условии, что нулевая гипотеза верна. Значение p означает силу доказательств против нулевой гипотезы, а более низкие значения указывают на более сильные доказательства в пользу альтернативной гипотезы. Часто мы завершаем проверку гипотезы, сравнивая p-значение с заранее определенным порогом, называемым альфа, который обозначает уровень значимости теста. Если p-значение меньше альфа, мы отклоняем нулевую гипотезу. Важно отметить, что уровень значимости альфа должен быть выбран до сбора данных.

Теперь давайте рассмотрим альтернативные гипотезы более подробно. В предыдущем обсуждении мы заявили, что альтернативная гипотеза выбирается так, чтобы противоречить нулевой гипотезе. Даже для простой нулевой гипотезы мю равно мю₀, где мю₀ представляет гипотетическое значение, есть три потенциальных альтернативных гипотезы:

  1. mu < mu₀: эта альтернативная гипотеза утверждает, что среднее значение популяции mu меньше гипотетического значения mu₀.
  2. mu > mu₀: Эта альтернативная гипотеза предполагает, что среднее значение популяции, mu, больше, чем гипотетическое значение, mu₀.
  3. мю ≠ мю₀: эта альтернативная гипотеза не делает никаких предположений относительно конкретного значения мю.

Первые две альтернативные гипотезы называются односторонними альтернативами из-за их сосредоточенности на определенном направлении, а третья альтернатива известна как двусторонняя альтернативная гипотеза. Каждая из этих альтернатив несколько по-разному противоречит нулевой гипотезе.

При проведении проверки гипотезы для среднего значения выбор между этими вариантами зависит от реальных соображений. В качестве общего руководства рекомендуется выбирать двустороннюю альтернативную гипотезу, если только нет конкретной причины, основанной на реальных факторах, предполагающей, что среднее значение генеральной совокупности не может или не должно быть больше или меньше значения, обеспечиваемого нулевая гипотеза, мю₀.

Чтобы улучшить наше понимание, давайте продолжим с некоторыми примерами. В первом примере компания по производству конфет утверждает, что средний вес ее шоколадных батончиков составляет 350 граммов. Если мы подозреваем, что средний вес на самом деле меньше, нулевой гипотезой будет утверждение компании, а альтернативной гипотезой будет mu < 350 граммов. В данном случае нас интересует только возможность того, что средний вес шоколадных батончиков меньше 350 граммов.

Во втором примере в учебном пособии утверждается, что конкретное упражнение занимает в среднем 30 минут. Нулевой гипотезой будет утверждение руководства, mu = 30, а альтернативной гипотезой будет mu ≠ 30. Здесь у нас нет веских причин исключать или игнорировать возможность того, что mu меньше или больше 30.

В третьем примере предприятие по замене масла утверждает, что в среднем замена масла выполняется за 15 минут. Предположим, мы подозреваем, что фактическое время больше.

Если p-значение меньше или равно уровню значимости (альфа), мы отклоняем нулевую гипотезу. Это означает, что данные дают убедительные доказательства против нулевой гипотезы и поддерживают альтернативную гипотезу. С другой стороны, если p-значение больше уровня значимости, мы не можем отвергнуть нулевую гипотезу. В этом случае данные не дают достаточных доказательств, чтобы отвергнуть нулевую гипотезу, и у нас недостаточно доказательств для альтернативной гипотезы.

Важно отметить, что невозможность отвергнуть нулевую гипотезу не обязательно означает, что нулевая гипотеза верна. Это просто означает, что данные не предоставляют существенных доказательств в поддержку альтернативной гипотезы. Отсутствие доказательств против нулевой гипотезы не доказывает ее истинность.

Выбор между односторонней или двусторонней альтернативной гипотезой зависит от конкретного исследовательского вопроса и гипотез, которые вы хотите рассмотреть. Если вас интересует определение того, значительно ли среднее значение генеральной совокупности отличается от определенного значения, вы должны выбрать двустороннюю альтернативную гипотезу. Это позволяет вам рассмотреть обе возможности того, что среднее значение больше или меньше гипотетического значения.

Однако если у вас есть конкретная причина полагать, что среднее значение может быть только больше или меньше гипотетического значения, вы можете выбрать одностороннюю альтернативную гипотезу. Это сужает фокус проверки только до одного направления отклонения от нулевой гипотезы.

Таким образом, проверка гипотезы включает в себя формулировку нулевой гипотезы, которая представляет утверждение, против которого вы хотите собрать доказательства, и альтернативной гипотезы, которая противоречит нулевой гипотезе. Собираются данные и вычисляется тестовая статистика, например среднее значение выборки. Затем вычисляется p-значение, представляющее вероятность получения тестовой статистики столь же экстремальной, как и наблюдаемая, при условии, что нулевая гипотеза верна. Выбор односторонней или двусторонней альтернативной гипотезы зависит от вопроса исследования и конкретных предположений о параметре совокупности. Наконец, p-значение сравнивается с уровнем значимости, и принимается решение, отклонить или не отклонить нулевую гипотезу на основе доказательств, предоставленных данными.

Hypothesis Testing: One- and Two-Sided Alternatives
Hypothesis Testing: One- and Two-Sided Alternatives
  • 2020.10.31
  • www.youtube.com
How do we determine the an alternative hypothesis when setting up a hypothesis test? How does our choice affect the way we calculate a p-value?
 

Проверка гипотез: пример


Проверка гипотез: пример

Сегодня мы рассмотрим пример проверки гипотезы для среднего значения. Прежде чем погрузиться в конкретный пример, давайте рассмотрим общую процедуру. Он всегда начинается с выдвижения гипотез, включая нулевую гипотезу, которая представляет идею, против которой мы хотим собрать доказательства, и альтернативную гипотезу, которую мы стремимся поддержать. Предполагая, что нулевая гипотеза верна, мы проверяем, куда попадает наше выборочное среднее (X столбик) среди всех возможных выборочных средних при этом предположении.

Для этого мы вычисляем z-оценку, которая измеряет отклонение нашего результата в контексте нулевой гипотезы. Для односторонней альтернативной гипотезы, проверяющей, является ли среднее значение генеральной совокупности (μ) меньше или больше определенного значения, мы вычисляем вероятность получения z-показателя, меньшего или равного полученному нами. Для двусторонней альтернативной гипотезы мы вычисляем любую вероятность, а затем соответствующим образом удваиваем ее.

В наиболее формальном представлении мы находим вероятность получения z-показателя, меньшего или равного отрицательному абсолютному значению полученного нами z-показателя. Используя кумулятивную функцию распределения, мы учитываем как левый, так и правый хвосты. Получив p-значение, мы сравниваем его с выбранным уровнем значимости (альфа). Если p-значение меньше альфа, мы отклоняем нулевую гипотезу и делаем вывод, что альтернативная гипотеза поддерживается.

Теперь давайте применим это к реальному примеру. Группа защиты прав потребителей проверяет содержание витамина С в органической добавке, которая утверждает, что в таблетке содержится в среднем 1000 миллиграммов витамина С. При размере выборки 32 они находят среднее значение выборки 1008,9 миллиграмма. Стандартное отклонение популяции (σ) составляет 21 миллиграмм. Наша задача — определить, достаточно ли доказательств, чтобы отклонить заявление о продукте. Уровень значимости (альфа) установлен на уровне 0,05.

Следуя общей процедуре, начнем с выдвижения гипотез. Нулевая гипотеза состоит в том, что заявление продукта о среднем содержании витамина С в 1000 миллиграммов верно, в то время как альтернативная гипотеза состоит в том, что истинное среднее значение отличается от 1000 миллиграммов. Поскольку нет конкретных указаний рассматривать только значения меньше или больше 1000, мы выбираем двустороннюю альтернативную гипотезу.

Затем мы вычисляем z-показатель, используя формулу (среднее значение выборки - ожидаемое значение) / (стандартное отклонение среднего значения выборки). Принимая нулевую гипотезу, мы используем среднее значение 1000 миллиграммов и вычисляем стандартное отклонение среднего значения выборки как σ / √n, где n — размер выборки. Следовательно, z-показатель оказывается равным 2,39, что указывает на то, что среднее значение нашей выборки в 1008,9 миллиграммов отклоняется на 2,39 стандартных отклонения от ожидаемого среднего значения при нулевой гипотезе.

Чтобы определить p-значение, нам нужно найти вероятность получения z-показателя, столь же экстремального, как тот, который у нас есть (либо положительный, либо отрицательный). В этом случае мы вычисляем P(Z ≤ -2,39), что дает 0,0084. Так как это двусторонний тест, мы удваиваем вероятность получить 0,0168.

Сравнивая p-значение с уровнем значимости, мы обнаруживаем, что 0,0168 действительно меньше 0,05. Таким образом, у нас есть достаточно доказательств, чтобы отвергнуть нулевую гипотезу и сделать вывод, что добавка не содержит в среднем 1000 миллиграммов витамина С.

Hypothesis Testing: Example
Hypothesis Testing: Example
  • 2020.03.25
  • www.youtube.com
Another example of a two-sided hypothesis test for the mean when the population standard deviation is known. If this vid helps you, please help me a tiny bit...
 

Ошибки типа I и типа II в тестах значимости


Ошибки типа I и типа II в тестах значимости

Сегодня мы обсудим ситуации, когда тестирование значимости идет не по плану. Давайте рассмотрим все это всего за три минуты. Давай начнем.

При проверке гипотезы мы сталкиваемся с двумя возможными состояниями для H — ноль (нулевая гипотеза): оно может быть истинным или ложным. В конце теста у нас есть два возможных решения: либо отвергнуть H, либо не отвергнуть его. Это дает нам в общей сложности четыре возможных исхода. Мы можем исследовать комбинации этих двух решений. У меня есть таблица, обобщающая эти результаты, и два из них приносят нам удовлетворение: отказ от H-ничего, когда оно ложно, и не отказ от H-ничего, когда оно верно. Однако есть две нежелательные ситуации.

По мере того, как мы углубляемся в эту тему, важно отметить, что у нас обычно нет априорной информации о том, является ли H naught истинным или ложным в начале. Если мы и получаем такую информацию, то, как правило, гораздо позже. Теперь давайте обсудим два неблагоприятных исхода. Первый называется ошибкой 1-го типа или ложным срабатыванием. Это происходит, когда мы отвергаем нулевую гипотезу, несмотря на то, что она верна. Это происходит, когда происходит случайное событие, и мы ошибочно интерпретируем его как значимое. Вторая ситуация — это ошибка 2-го типа или ложноотрицательный результат. Это происходит, когда мы не можем отвергнуть нулевую гипотезу, хотя на самом деле она ложна. В этом случае происходит что-то важное, но наш тест не может этого обнаружить.

Термины «ложноположительный» и «ложноотрицательный» происходят из медицинского тестирования, где логическая структура аналогична тестированию значимости. В медицинских тестах у вас может быть тест на заболевание, и тест может указать на его наличие или отсутствие. Общие ошибки Типа 1 и Типа 2 сведены в представленную таблицу, в которой желаемые результаты отмечены флажками.

Давайте быстро рассмотрим пару примеров. Предположим, производитель шоколадных батончиков утверждает, что их плитки в среднем весят 350 граммов. Я подозреваю, что они могут переоценивать, поэтому я собираю выборку и отклоняю их заявление с p-значением 0,0089. Однако, если бы заявление производителя было на самом деле правдой, а их слитки действительно имели средний вес 350 граммов, я бы совершил ошибку типа 1 или ложное срабатывание.

Вот еще один пример: ресторан утверждает, что среднее содержание натрия в одном из его бутербродов составляет 920 миллиграммов. Я анализирую образец, но не нахожу достаточных доказательств, чтобы отклонить утверждение с уровнем альфа 0,01. Если бы заявление ресторана было ложным, скажем, среднее содержание натрия на самом деле составляло 950 миллиграммов, я бы совершил ошибку 2-го типа, не отклонив заявление.

Type I and Type II Errors in Significance Tests
Type I and Type II Errors in Significance Tests
  • 2020.03.28
  • www.youtube.com
When hypothesis testing goes wrong, explained in under three minutes.
 

Проверка гипотез с использованием критических областей


Проверка гипотез с использованием критических областей

Всем привет, сегодня мы обсудим проверку гипотез с использованием критических областей. Хотя этот подход можно считать устаревшим, он по-прежнему актуален в теории, которую мы рассмотрим. Поэтому полезно иметь базовое представление об этом.

В прошлом вычисление p-значений было более сложной задачей, чем сегодня. Это включало использование таблиц для расчетов, таких как таблицы для нормального распределения, которые имели ограниченную точность и ограниченные записи. Чтобы свести к минимуму потребность в этих расчетах, обычно использовалась концепция критических областей или областей отбраковки.

Типичный процесс проверки гипотез сегодня включает вычисление p-значения на основе выборочных данных и сравнение его с выбранным уровнем значимости (альфа). Однако с критическими областями мы обращаем этот процесс вспять. Мы начинаем с выбора уровня значимости (альфа), который затем определяет пороговое значение для тестовой статистики, обозначаемое как Z-звезда или Т-звезда. Если выборочные данные дают более экстремальную статистику выборки, чем это пороговое значение, это приводит к тому, что мы отклоняем нулевую гипотезу.

Давайте рассмотрим пример, чтобы проиллюстрировать это. Предположим, у нас есть двусторонняя альтернативная гипотеза и мы проводим тест с нормальным распределением и уровнем значимости альфа, равным 0,05. В этом случае альфа, равная 0,05, соответствует заштрихованной области 0,05 в распределении (по 0,025 с каждой стороны). Выполняя обратный нормальный расчет (используя норму команды Q в R), мы находим критическое значение Z-star равным 1,96. Следовательно, если выборочная статистика (Z-звезда) больше 1,96 (абсолютное значение), это указывает на то, что мы должны отклонить нулевую гипотезу.

В качестве другого примера рассмотрим t-распределение с 8 степенями свободы и односторонней альтернативой (правосторонней альтернативой). Предположим, мы выбираем альфа, равную 0,01, в качестве уровня значимости. В этом случае имеется площадь 0,01 справа от Т-звезды, соответствующая площади 0,99 слева. Используя обратный t CDF (используя команду QT) со значениями 0,99 и 8 в R, мы находим T-star равным примерно 2,9. Если t-статистика выборки больше 2,9, она попадает в заштрихованную область, что приводит к отклонению нулевой гипотезы.

В случае нормального распределения мы можем перевести критическое значение Z в утверждение о критическом среднем значении выборки. Рассмотрим следующий пример. Содержимое банок колы определенной марки обычно распределяется со стандартным отклонением 0,2 унции. Мы хотим использовать выборку размером 15 для проверки нулевой гипотезы о том, что среднее содержимое банок составляет 12 унций, в сравнении с альтернативной гипотезой о том, что на самом деле они меньше 12 унций. При односторонней альтернативе и альфа, равной 0,05, критическое значение Z составляет -1,645. Таким образом, если среднее значение выборки (X-столбик) более чем на 1,645 стандартных отклонения ниже среднего значения, мы должны отклонить нулевую гипотезу. В частности, если среднее значение выборки меньше 11,92 унции, мы отклоним нулевую гипотезу.

Hypothesis testing using critical regions
Hypothesis testing using critical regions
  • 2020.03.29
  • www.youtube.com
A formerly very practical idea, now mostly of theoretical interest. If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more ...
 

Проверка гипотез с помощью t-распределения


Проверка гипотез с помощью t-распределения

Всем привет, сегодня мы обсудим проверку гипотез с использованием t-распределения. В этом сценарии мы имеем дело с ситуациями, когда стандартное отклонение совокупности неизвестно. Ранее мы проводили проверку гипотез с использованием Z-статистики, предполагая, что нам известно стандартное отклонение популяции (сигма). Однако в статистическом выводе цель состоит в том, чтобы использовать выборочную информацию, чтобы получить представление о населении, поэтому обычно не знают Sigma. В таких случаях мы оцениваем стандартное отклонение генеральной совокупности, используя стандартное отклонение (s) выборки, и проводим аналогичные расчеты.

Проблема возникает из-за того, что когда Sigma заменяется на s, выражение (X-bar - mu)/(s/sqrt(n)) больше не соответствует нормальному распределению. И X-полоса, и s меняются с каждым новым образцом, в результате чего распределение соответствует t-распределению с (n-1) степенями свободы. К счастью, если мы учтем эту корректировку, расчеты в основном останутся прежними.

Чтобы выполнить проверку гипотезы, когда Sigma неизвестна, мы начинаем с нулевой и альтернативной гипотез. Предполагая, что нулевая гипотеза верна, мы вычисляем t-статистику для фактических выборочных данных: (X-bar - mu_naught)/(s/sqrt(n)). Затем мы вычисляем p-значения на основе альтернативной гипотезы.

Для левосторонней альтернативной гипотезы, когда мы подозреваем, что mu меньше заданного значения, мы находим вероятность получения t-значения, меньшего или равного тому, которое мы получили, когда нулевая гипотеза верна. Это соответствует заштрихованной области на первом изображении.

Точно так же для правосторонней альтернативной гипотезы, где mu больше заданного значения, мы определяем вероятность получения t-значения, большего, чем то, которое мы получили. Это соответствует области справа от t-значения.

В случае двустороннего теста мы рассматриваем обе области. Мы вычисляем вероятность получения значения t большего (по абсолютной величине), чем полученное нами, а затем удваиваем его.

Получив p-значение, мы сравниваем его с выбранным уровнем значимости (альфа), чтобы принять решение. Если p-значение меньше альфа, мы отклоняем нулевую гипотезу. Однако при выполнении расчетов вручную получение t-значения из выборочных данных может быть затруднено. Рекомендуется использовать такие технологии, как статистическое программное обеспечение или калькуляторы. Например, в R команда PT(t, n-1) вычисляет площадь слева от заданного значения t в t-распределении с (n-1) степенями свободы.

Рассмотрим пример, демонстрирующий этот процесс. Предположим, у нас есть потеря веса семи мышей во время эксперимента. Мы хотим определить, есть ли достаточные доказательства, чтобы заключить, что мыши теряют вес во время эксперимента, с уровнем значимости альфа, равным 0,05. Поскольку нам не дано стандартное отклонение населения, мы имеем дело с ситуацией t-теста.

Чтобы начать проверку, мы задаем нулевую гипотезу, предполагающую, что данные обусловлены случайностью, и альтернативную гипотезу, утверждающую, что мыши в среднем теряют вес в ходе эксперимента. В этом случае мы выбираем одностороннюю альтернативную гипотезу, ориентируясь на потерю веса, а не на увеличение веса.

Затем мы вычисляем t-статистику, используя выборочное среднее и выборочное стандартное отклонение. С полученным t-значением мы вычисляем p-значение, которое представляет вероятность получения t-значения, большего или равного наблюдаемому значению, только случайно.

Чтобы оценить эту вероятность, мы обращаемся к t-распределению с (n-1) степенями свободы. Мы вычисляем площадь справа от значения t, вычитая площадь слева от 1. В R это можно сделать с помощью функции PT. Если p-значение больше выбранного уровня значимости (альфа), мы не можем отклонить нулевую гипотезу.

В нашем примере расчетное значение p равно 0,059. Поскольку 0,059 выше уровня значимости 0,05, у нас нет достаточных доказательств, чтобы отклонить нулевую гипотезу. Следовательно, мы не можем сделать вывод, что эксперимент заставляет мышей в среднем терять вес.

Важно отметить, что отказ от отклонения нулевой гипотезы не означает, что нулевая гипотеза верна. Это просто означает, что доказательств недостаточно, чтобы поддержать альтернативную гипотезу.

Таким образом, при проверке гипотез и неизвестном стандартном отклонении популяции мы можем использовать t-распределение и оценить стандартное отклонение, используя стандартное отклонение выборки. Затем мы вычисляем t-статистику, вычисляем p-значение на основе альтернативной гипотезы и сравниваем его с уровнем значимости для принятия решения. Использование статистического программного обеспечения или таблиц может упростить расчеты и обеспечить более точные результаты.

Hypothesis Testing with the t-Distribution
Hypothesis Testing with the t-Distribution
  • 2020.04.04
  • www.youtube.com
How can we run a significance test when the population standard deviation is unknown? Simple: use the sample standard deviation as an estimate. If this vid h...
 

Тестирование значимости с помощью t-распределения: пример


Тестирование значимости с помощью t-распределения: пример

Всем привет, сегодня я хочу показать вам еще один пример проверки гипотезы с использованием t-распределения. В этом примере основное внимание уделяется скорости поглощения углерода в конкретных видах травы. Принято считать, что средняя скорость поглощения составляет 34,0 микромоль на квадратный метр в секунду. Однако у группы исследователей есть сомнения. Они провели исследование и получили выборочное среднее значение 30,6 при стандартном отклонении выборки 9,7. Теперь, при уровне значимости 0,05, они хотят определить, предоставляют ли эти данные веские доказательства против общепринятого мнения.

Как и в случае любого теста значимости, давайте начнем с явного формулирования наших гипотез. Нулевая гипотеза, которую мы стремимся оспорить, предполагает, что данные нашей выборки являются просто результатом случайного случая, и общепринятое мнение остается верным. С другой стороны, альтернативная гипотеза стремится установить возможность того, что истинная средняя скорость поглощения больше или меньше 34,0. В этом случае мы рассмотрим двустороннюю альтернативную гипотезу, охватывающую оба сценария.

Затем мы хотим оценить, насколько экстремально среднее значение нашей выборки (x-bar) по сравнению с тем, что мы ожидаем при нулевой гипотезе. Мы рассчитываем статистику теста (T), вычитая ожидаемое среднее значение при нулевой гипотезе (mu-ноль) из среднего значения выборки и разделив его на стандартное отклонение выборки (s), деленное на квадратный корень из размера выборки (n). Этот расчет дает T = -2,27.

Чтобы определить вероятность получения такой экстремальной статистики теста, как -2,27, только из-за случайного случая, нам нужно рассмотреть обе стороны распределения. Мы вычисляем объединенную заштрихованную область слева и справа от -2,27, что дает нам p-значение теста. В R мы можем использовать команду PT для вычисления крайней левой области, которая представляет вероятность того, что T будет меньше -2,27. Затем мы удваиваем эту площадь, чтобы учесть обе стороны распределения.

После применения команды PT в R с -2,27 и степенями свободы (df), равными размеру выборки минус один (41), мы обнаруживаем, что левая заштрихованная область равна 0,029. Удвоение этого значения дает нам общую заштрихованную площадь, которая соответствует p-значению теста.

Вычисленное p-значение равно 0,029, что меньше нашего уровня значимости (альфа) 0,05. Таким образом, мы отвергаем нулевую гипотезу и заключаем, что средняя скорость поглощения углекислого газа этим видом трав на самом деле не составляет 34,0 микромоль на квадратный метр в секунду.

В заключение, проверка гипотез с использованием t-распределения позволяет нам оценить силу доказательств против нулевой гипотезы, когда стандартное отклонение населения неизвестно. Вычисляя тестовую статистику, сравнивая ее с критическим значением (уровнем значимости) и вычисляя p-значение, мы можем принимать обоснованные решения относительно достоверности нулевой гипотезы.

Significance Testing with the t-Distribution: Example
Significance Testing with the t-Distribution: Example
  • 2020.04.07
  • www.youtube.com
A two-sided test with unknown population standard deviation. If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more stats j...
 

Проверка гипотез в R


Проверка гипотез в R

Всем привет! Сегодня мы будем проводить проверку гипотез в R с помощью команды t.test. Мы поработаем над парой задач, связанных со встроенным набором данных о качестве воздуха, который будем рассматривать как простую случайную выборку измерений качества воздуха в Нью-Йорке.

Давайте переключимся на R, где я уже загрузил пакет tidyverse, что я обычно и делаю в начале сеансов R. Я также открыл файл справки для набора данных о качестве воздуха. Этот набор данных был собран в 1973 году, так что это не самые свежие данные. Мы можем использовать команду просмотра, чтобы взглянуть на набор данных. Он состоит из 153 наблюдений за шестью переменными, включая ветер и солнечную радиацию, две переменные, которые нас интересуют.

Перед проведением каких-либо статистических тестов рекомендуется визуализировать данные. Итак, давайте создадим гистограмму с помощью команды qplot. Мы сосредоточимся на переменной ветра и укажем, что нам нужна гистограмма.

Теперь давайте перейдем к проблеме номер один. Чиновник утверждает, что средняя скорость ветра в городе составляет девять миль в час. Мы хотим определить, правдоподобно ли это утверждение на основе данных. Мы будем использовать t-критерий с нулевой гипотезой о том, что средняя скорость ветра составляет девять миль в час. Глядя на гистограмму, она кажется правдоподобной, хотя и немного смещена вправо от этого значения. Мы проведем t-тест с помощью команды t.test. Мы передаем ему переменную ветра и указываем нулевую гипотезу как mu = 9. По умолчанию R предполагает двустороннюю альтернативную гипотезу. Команда t.test предоставляет нам выборочное среднее, t-статистику и p-значение. Среднее значение выборки равно 9,96, а вычисленная t-статистика равна 3,36, что соответствует p-значению менее 0,1. При таком малом p-значении маловероятно, что эти данные значительно отклоняются от нулевой гипотезы только из-за случайности. Поэтому мы отвергаем нулевую гипотезу и заключаем, что средняя скорость ветра в Нью-Йорке не равна девяти милям в час.

Переходя ко второй проблеме, мы хотим оценить, будет ли определенная солнечная батарея рентабельной, если среднее солнечное излучение превышает 175 лэнгли. Мы будем использовать одностороннюю альтернативную гипотезу, где нулевая гипотеза состоит в том, что среднее солнечное излучение составляет 175 лэнгли, а альтернативная гипотеза состоит в том, что оно больше. Мы визуализируем данные, создав гистограмму переменной солнечного излучения. Опять же, нулевая гипотеза кажется правдоподобной на основе гистограммы. Мы выполним t-тест с помощью команды t.test, передав переменную солнечного излучения и указав нулевую гипотезу как mu = 175. Кроме того, нам нужно указать одностороннюю альтернативную гипотезу, используя альтернативный аргумент = «больше». . Команда t.test предоставляет нам выборочное среднее, t-статистику и p-значение. Среднее значение выборки равно 185,9, а вычисленная t-статистика равна 1,47, в результате чего p-значение равно 0,07. При p-значении 0,07 у нас нет убедительных доказательств в поддержку утверждения о том, что среднее солнечное излучение в Нью-Йорке превышает 175 лэнгли, что является порогом для оправдания покупки солнечной батареи. Поэтому следует воздержаться от выводов и необходимы дальнейшие исследования для точной оценки средней солнечной радиации.

Таким образом, проверка гипотез с использованием t-критерия позволяет нам оценить правдоподобие утверждений или гипотез на основе выборочных данных. Указав нулевую и альтернативную гипотезы, выполнив тест и изучив полученное значение p, мы можем принимать обоснованные решения о принятии или отклонении гипотез. Визуализация данных в виде гистограмм или других графиков может дать дополнительную информацию во время анализа.

Hypothesis testing in R
Hypothesis testing in R
  • 2022.03.30
  • www.youtube.com
Hypothesis testing in R is easy with the t.test command!If this vid helps you, please help me a tiny bit by mashing that 'like' button. For more #rstats joy,...
 

Проверка гипотез относительно пропорций


Проверка гипотез относительно пропорций

Всем привет! Сегодня мы продолжим наше исследование проверки гипотез, на этот раз сосредоточившись на пропорциях. Мы подойдем к этой теме, рассмотрев пример, чтобы понять ключевые концепции.

Давайте начнем. Комментатор утверждает, что 30% шестилетних детей в Соединенных Штатах испытывают дефицит цинка. Мы хотим оценить это утверждение, собрав выборку и проведя проверку гипотезы на уровне значимости α = 0,05. Для дальнейшего исследования мы собираем данные путем опроса 36 шестилетних детей и обнаруживаем, что у 5 из них дефицит цинка составляет менее 30%. Однако нам необходимо определить, может ли эта разница быть приписана только случайному стечению обстоятельств. Наш главный вопрос: насколько маловероятно получение такого образца?

Чтобы ответить на этот вопрос, мы сравниваем полученную нами долю выборки (P-hat) (5 из 36) с долей, заявленной в соответствии с нулевой гипотезой. Обозначим долю населения как P₀ или P-ноль. Наша нулевая гипотеза предполагает, что доля населения составляет 0,30 (30%). Альтернативная гипотеза в данном случае состоит просто в том, что доля населения не равна 0,30. У нас нет особых причин предполагать, что это больше или меньше 30%, поэтому мы рассматриваем обе возможности. По умолчанию мы выбираем двустороннюю альтернативу, если нет веских причин для односторонней альтернативы.

Рассчитанная нами доля выборки (P-hat) составляет 0,139, что значительно ниже 30%. Но является ли эта разница статистически значимой? Чтобы оценить это, мы анализируем выборочное распределение P-шляпы. Мы представляем себе многократное получение образцов одного и того же размера и каждый раз рассчитываем долю дефицита цинка. Предполагая, что размер выборки (n) велик (что имеет место здесь с n = 36), распределение выборки будет иметь колоколообразную кривую. Мы можем определить его центр и распространение. Среднее значение доли выборки (P-hat) будет таким же, как доля совокупности (P), а стандартное отклонение P-hat будет квадратным корнем из P(1-P)/n. Если вам нужно более подробное объяснение, рекомендую посмотреть мое видео о доверительных интервалах для пропорций.

Теперь, когда мы знаем, что распределение выборки следует колоколообразной кривой с известным средним значением и стандартным отклонением, мы можем вычислить z-показатель. Мы вычисляем разницу между наблюдаемым значением (P-шляпа) и ожидаемым значением (P-ноль) и делим ее на стандартное отклонение. Подстановка значений (P-шляпа = 0,139, P-ноль = 0,30, n = 36) дает z-показатель -2,11.

Чтобы оценить вероятность получения такой же экстремальной P-шляпы, как та, которую мы наблюдали (или даже более экстремальной), мы изучаем соответствующие z-показатели. В данном случае нас интересует вероятность получения z-показателя меньше -2,11 или больше 2,11. Мы можем рассчитать это, оценив кумулятивную функцию распределения (CDF) стандартного нормального распределения. Используя статистическое программное обеспечение или веб-приложения, мы обнаруживаем, что вероятность получения z-показателя меньше -2,11 составляет примерно 0,017. Однако, поскольку мы рассматриваем оба хвоста распределения, нам нужно удвоить это значение, в результате чего значение p будет приблизительно равно 0,035.

Сравнивая p-значение с выбранным нами уровнем значимости (α = 0,05), мы обнаруживаем, что p-значение меньше α. Поэтому мы отвергаем нулевую гипотезу и делаем вывод, что утверждение комментатора, вероятно, ложно. Доля шестилетних детей в Соединенных Штатах с дефицитом цинка не составляет 30%.

Когда дело доходит до размера выборки и нормального приближения, следует помнить о нескольких практических правилах. Нормальное приближение имеет тенденцию работать хорошо, когда выборка имеет по крайней мере пять успешных и пять неудачных попыток. С математической точки зрения это означает, что произведение размера выборки (n) и доли выборки (P) должно быть больше или равно пяти, а также произведение размера выборки (n) и дополнения доли выборки. (1-P) также должно быть больше или равно пяти.

В нашем случае у нас был размер выборки 36 и доля выборки (P-hat) 0,139, что удовлетворяет условиям нормального приближения. Поэтому мы можем с уверенностью полагаться на нормальное распределение для нашего статистического вывода.

Также стоит отметить, что, как правило, большие размеры выборки дают лучшие результаты при нормальном приближении. По мере увеличения размера выборки нормальное распределение становится более точным представлением выборочного распределения P-шляпы.

Таким образом, мы можем заключить, что размер выборки 36 в нашем примере достаточно велик, чтобы мы могли использовать нормальное приближение при проверке нашей гипотезы.

Я надеюсь, что это проясняет роль размера выборки в нормальном приближении и обеспечивает всестороннее объяснение процесса проверки гипотез относительно пропорций.

Hypothesis Testing for Proportions
Hypothesis Testing for Proportions
  • 2020.05.09
  • www.youtube.com
How should we run a hypothesis test when we have data involving percentages, proportions, or fractions? Using a normal approximation. of course, at least whe...
 

Проверка гипотез относительно пропорций: пример


Проверка гипотез относительно пропорций: пример

Всем привет! Сегодня мы поработаем над примером проверки гипотезы о пропорциях. Давайте углубимся в проблему. Университет утверждает, что 65% его студентов заканчивают обучение за четыре года или раньше. Однако есть сомнения в правильности этого утверждения. Для дальнейшего исследования берется простая случайная выборка из 120 студентов, и выясняется, что только 68 из 120 студентов закончили обучение в указанные сроки. Поскольку эта доля меньше заявленных 65%, это свидетельствует против утверждения университета. Теперь вопрос заключается в том, достаточно ли убедительны эти доказательства, чтобы предположить, что утверждение маловероятно, или его можно отнести к случайному стечению обстоятельств. Чтобы определить это, мы рассчитаем значение p и примем решение, используя уровень значимости (α) 0,05.

Во-первых, нам нужно сформулировать нулевую и альтернативную гипотезы. Нулевая гипотеза утверждает, что результаты обусловлены исключительно случайностью и что истинная доля студентов, окончивших школу за четыре года или меньше, действительно составляет 0,65. С другой стороны, альтернативная гипотеза предполагает, что университет завышает количество выпускников, а доля населения составляет менее 0,65. В этом случае уместна односторонняя альтернативная гипотеза, поскольку нас интересует только вероятность того, что процент выпускников будет ниже 65%.

Предполагая, что нулевая гипотеза верна, мы можем применить центральную предельную теорему, которая утверждает, что, когда размер выборки (n) достаточно велик, выборочное распределение пропорции (P-hat) будет приблизительно нормальным. Среднее значение этого распределения равно среднему значению генеральной совокупности (P), а стандартное отклонение равно квадратному корню из P, умноженному на 1, минус P, деленному на n. В нашем случае, поскольку мы предположили, что нулевая гипотеза верна, доля населения (P) составляет 0,65.

Теперь давайте рассчитаем z-показатель, чтобы определить вероятность получения результата, столь же экстремального, как наблюдаемая пропорция, или еще более экстремального, только благодаря случайному стечению обстоятельств. Подставляя значения, мы находим z-значение -1,91. Чтобы найти вероятность, связанную с этим z-показателем, который представляет вероятность получения пропорции, меньшей или равной наблюдаемой, мы используем нормальную кумулятивную функцию распределения (CDF). Это можно сделать с помощью различных инструментов, таких как таблицы, веб-приложения или статистическое программное обеспечение. Например, в R команда «Pnorm(-1,91)» дает значение 0,028.

Сравнивая это p-значение с уровнем значимости (α) 0,05, мы видим, что p-значение меньше α. Таким образом, мы отклоняем нулевую гипотезу, указывая на то, что разумно сделать вывод о том, что университет переоценил количество выпускников за четыре года.

Hypothesis Testing for Proportions: Example
Hypothesis Testing for Proportions: Example
  • 2020.05.10
  • www.youtube.com
A complete example of a hypothesis test for a proportion using the normal approximation.
 

Введение в диаграммы рассеяния


Введение в диаграммы рассеяния

Всем привет! Сегодня мы углубимся в точечные диаграммы, которые представляют собой визуальное отображение данных, включающих несколько переменных, собранных одновременно. Диаграммы рассеяния имеют решающее значение, поскольку они часто возникают в реальных сценариях сбора данных. Часто мы собираем более одной части информации. Например, у нас могут быть результаты SAT по математике и словесные оценки для группы студентов, рост и вес участников медицинского исследования или данные о объеме двигателя и расходе топлива для различных автомобилей. В каждом случае данные являются парными, что означает, что каждое значение одной переменной соответствует определенному значению другой переменной, создавая отношение один к одному. Когда такие парные данные существуют, мы можем построить графики рассеяния.

Рассмотрим пример с использованием таблицы. Каждый столбец в таблице представляет научную или инженерную область, где число вверху указывает количество докторских степеней, присужденных женщинам в этой области в 2005 г., а число внизу указывает количество докторских степеней, присужденных мужчинам в том же году. Нанеся эти данные на график, где доктора наук женщин представлены значениями x, а доктора наук мужчин значениями y, мы получаем набор точек. Некоторые точки помечены, например (2168, 2227), что соответствует второму столбцу данных в таблице. Он представляет собой научную область, в которой в 2005 году было присуждено 2168 докторских степеней женщинам и 2227 — мужчинам.

При изучении точечных диаграмм полезно дать их качественное описание. В этом примере мы наблюдаем общую тенденцию к снижению данных, хотя есть случаи, когда значения увеличиваются при движении слева направо. В целом форма данных имеет тенденцию к снижению, что указывает на отрицательную связь между двумя переменными. Однако важно отметить, что мы должны воздерживаться от использования термина «отрицательная корреляция», если связь не является линейной, то есть график следует прямой линии. В этом случае данные не демонстрируют линейной зависимости.

Еще одним примечательным аспектом этого графика является выброс в правом верхнем углу. Выбросы могут относиться к различным категориям, таким как ошибки ввода данных, необычные случаи, влияющие на анализ, или интересные явления, требующие дальнейшего изучения. Наконец, очень важно решить, какую переменную поместить на горизонтальную ось, а какую на вертикальную. Если одна переменная естественным образом объясняет или влияет на другую в исследовании, ее следует поместить на горизонтальной оси как объясняющую переменную. И наоборот, переменная, которую объясняют или на которую воздействуют, должна располагаться на вертикальной оси как переменная отклика. Например, в примере с расходом бензина имеет смысл рассматривать пробег как связанный с объемом двигателя (объемом двигателя), поэтому мы размещаем пробег по вертикальной оси. Однако этот выбор может включать некоторую субъективность, и могут быть сценарии, в которых роли меняются местами, в зависимости от контекста исследования.

Introduction to Scatterplots
Introduction to Scatterplots
  • 2020.04.11
  • www.youtube.com
What is a scatterplot? How do we construct them? How do we describe them? If this vid helps you, please help me a tiny bit by mashing that 'like' button. For...
Причина обращения: