프로그래밍 자습서 - 페이지 14

 

정규분포


정규분포

오늘은 정규확률분포와 경험법칙에 대해 알아보겠습니다. 연속 확률 변수를 다룰 때 밀도 곡선은 종종 종형 곡선의 형태를 취합니다. 이 종 모양의 곡선은 대부분의 확률이 분포의 중심 또는 평균 근처에 집중되어 있음을 나타냅니다. 그러나 이론적으로는 상상할 수 있는 만큼 크거나 작은 결과가 가능합니다.

정규 분포는 일반적으로 실제 시나리오에서 발생합니다. 예를 들어 무작위로 선택된 신생아의 길이를 측정하거나, 개방된 고속도로에서 차량 속도를 관찰하거나, 무작위로 선택된 학생의 표준화된 테스트 점수를 조사하는 경우 이러한 모든 무작위 변수는 거의 정규 분포를 따를 가능성이 있습니다. 정규 분포는 평균 주위에서 대칭을 나타냅니다. 즉, 평균보다 작은 결과를 얻을 확률은 평균보다 큰 결과를 얻을 확률과 같습니다. 따라서 신생아의 길이를 고려할 때 평균 이상 또는 이하의 영아를 만날 가능성은 동일합니다.

정규 분포의 특성은 평균과 분산(또는 표준 편차)으로 완전히 설명됩니다. 평균은 분포의 중심을 나타내고 표준 편차는 평균에서 곡선의 변곡점까지의 거리를 나타냅니다. 이러한 변곡점은 곡선의 언덕 모양에서 계곡 모양으로의 전환을 표시합니다.

2017년 SAT 점수와 관련된 예를 들어 보겠습니다. SAT 점수는 평균 1060, 표준 편차 195로 대략적으로 정규 분포를 따릅니다. 이 분포의 그래프를 그리면 평균을 1060에 놓고 변곡점을 1로 표시합니다. 양방향으로 평균에서 멀어지는 표준 편차. 평균 위와 아래에 하나의 표준 편차에 해당하는 추가 포인트를 표시할 수도 있습니다.

밀도 곡선을 해석할 때 그 아래 영역은 확률을 나타냅니다. 그래프에서 865~1060 사이의 점수를 임의로 선택할 확률이 670~865 사이의 점수를 선택할 확률보다 상당히 높다는 것을 알 수 있습니다. 이러한 확률을 정량화하기 위해 경험적 규칙을 정규 확률.

경험적 규칙에 따르면 모든 정규 분포에서 확률의 약 68%는 평균의 1 표준 편차 내에 있고 95%는 2 표준 편차 내에 있으며 99.7%는 3 표준 편차 내에 있습니다. 이러한 비율은 각 영역 내의 곡선 아래 영역에 해당합니다.

평균 1060, 표준편차 195인 SAT 점수 분포에 경험적 규칙을 적용하면 865에서 1255 사이의 점수를 무작위로 선택할 확률이 68%, 670 사이의 점수를 선택할 확률이 95%라는 것을 알 수 있습니다. 1450, 475에서 1645 사이의 점수를 선택할 확률이 99.7%입니다.

기하학과 경험적 규칙을 사용하여 다른 시나리오에 대한 확률도 계산할 수 있습니다. 예를 들어, 평균에서 1 표준 편차 이상의 결과를 얻을 확률은 1에서 평균의 1 표준 편차 내에서 결과를 얻을 확률을 뺀 것과 같습니다. 유사하게, 우리는 평균의 2 표준편차 내에서 영역의 보수를 찾아 평균보다 2 표준편차보다 더 큰 값을 얻을 확률을 계산할 수 있습니다.

요약하면 정규 확률 분포는 종 모양의 곡선을 따르며 경험적 규칙은 정규 분포의 특정 영역 내 확률을 추정하는 데 유용한 근사치를 제공합니다.

The Normal Distribution
The Normal Distribution
  • 2020.05.18
  • www.youtube.com
Introducing normally-distributed random variables! We learn what they look like and how they behave, then begin computing probabilities using the empirical r...
 

표준 정규 분포


표준 정규 분포

안녕하세요 여러분, 오늘 우리는 표준 정규 분포에 대해 알아볼 것입니다. 이것은 기본적으로 여기에 표시된 것처럼 평균이 0이고 표준 편차가 1인 정규 분포 또는 종 모양 곡선입니다.

우리는 음의 무한대와 양의 무한대 사이의 값을 가질 수 있는 연속 랜덤 변수를 다루고 있습니다. 그러나 대부분의 확률은 0 근처에 집중되어 있습니다. 곡선의 정점은 0인 평균을 중심으로 하고 변곡점은 그래프가 언덕 모양에서 계곡 모양으로 전환되는 플러스 및 마이너스 1에서 발생합니다.

표준 정규 분포를 따르는 랜덤 변수를 나타내기 위해 문자 "z"를 자주 사용합니다. 표준 정규 분포는 정규 분포(평균 mu 및 표준 편차 시그마 포함)가 있는 임의의 변수를 표준 정규 분포로 변환할 수 있기 때문에 특히 유용합니다. 이 변환은 평균을 빼고 표준 편차로 나누어 달성됩니다: z = (x - mu) / 시그마.

이제 z-점수에 대해 이야기해 봅시다. z-점수는 값 x가 평균보다 높거나 낮은 표준 편차의 수를 나타냅니다. 경우에 따라 z 점수는 표준 점수라고도 합니다. 표준 정규 분포에서는 무한히 많기 때문에 개별 값의 확률에 초점을 맞추지 않습니다. 대신 특정 범위에 속하는 z의 확률을 고려합니다.

표준 정규 분포의 확률을 고려할 때 원하는 범위에 대한 그래프 아래 영역을 검사합니다. 예를 들어 z가 -1에서 0.5 사이일 확률을 살펴보겠습니다. 그래프 아래에서 이 두 값 사이의 음영 영역을 찾고자 합니다. 그래프 아래의 총 면적은 총 확률을 나타내므로 항상 1임을 기억하십시오.

표준 정규와 같은 연속 확률 변수에 대한 확률을 설명하기 위해 일반적으로 누적 분포 함수(CDF)를 사용합니다. CDF는 확률 변수가 특정 값보다 작거나 같을 확률을 제공합니다. 표준 정규 분포에서는 CDF에 Phi(z)라는 표기법을 사용합니다.

확률을 계산하려면 계산기나 소프트웨어와 같은 기술을 사용하는 것이 좋습니다. 예를 들어 TI 계산기에는 "normalcdf" 함수가 있고 Excel에서 계산을 수행할 수 있으며 R에서는 "pnorm" 명령을 사용하여 표준 정규 분포에 대한 CDF를 계산합니다.

예를 들어 보겠습니다. z-점수가 0.5 이하일 확률을 찾으려면 CDF를 사용하고 Phi(0.5)를 계산하면 약 0.691이 됩니다. 따라서 0.5 이하의 z-점수를 얻을 확률은 약 69.1%입니다.

일반적으로 특정 범위(a에서 b)에 속하는 z-점수의 확률을 계산하려면 z가 a보다 작거나 같을 확률에서 z가 a보다 작거나 같을 확률을 뺍니다. 비. 상징적으로 이것은 Phi(b) - Phi(a)로 쓸 수 있습니다.

마지막으로, 개별 z-점수의 확률은 극히 미미하다는 점을 기억하는 것이 중요합니다. z가 특정 값(c)보다 작거나 같을 확률은 z가 해당 값(c)보다 작을 확률과 같습니다. 게다가 z가 c보다 클 확률은 1에서 z가 c보다 작거나 같을 확률을 뺀 값과 같습니다.

설명을 위해 -1.5보다 큰 z 점수를 얻을 확률을 결정해 보겠습니다. 위의 두 가지 사실을 사용하여 1에서 z가 -1.5보다 작거나 같을 확률을 뺀 값을 계산할 수 있으며, 이는 약 93.3%입니다. 예상대로 이 확률은 50%보다 상당히 큽니다. 음수 z-점수가 우리를 벨 곡선의 맨 왼쪽에 배치하여 해당 영역의 상당 부분이 해당 z-점수의 오른쪽에 있음을 나타냅니다.

요약하면, 평균이 0이고 표준 편차가 1인 표준 정규 분포는 통계의 기본 개념입니다. 값이 평균에서 얼마나 떨어져 있는지를 측정하는 z-점수를 활용하여 분포의 특정 범위와 관련된 확률을 결정할 수 있습니다. 종종 Phi(z)로 표시되는 누적 분포 함수(CDF)는 이러한 확률을 계산하는 데 사용됩니다. 계산기 또는 통계 소프트웨어와 같은 기술은 일반적으로 CDF 값을 계산하는 데 사용됩니다. 표준 정규 분포를 사용하면 정규 분포의 값을 z 점수로 변환하여 표준화하고 비교할 수 있습니다.

The Standard Normal Distribution
The Standard Normal Distribution
  • 2020.07.27
  • www.youtube.com
The standard normal distribution: what it is, why it matters, and how to use it. Your life is about to get better! If this vid helps you, please help me a ti...
 

R을 사용하여 정규 확률 계산하기


R을 사용하여 정규 확률 계산하기

여러분, 안녕하세요! 오늘 우리는 RStudio를 사용하여 정규 분포에서 확률을 계산하는 세계로 뛰어들고 있습니다. 연속적인 정규 분포 확률 변수를 다룰 때 특정 개별 값을 얻을 확률을 논의하는 것은 의미가 없습니다. 대신 누적 분포 함수(CDF)에 의존합니다. 이 함수는 x값을 사용하여 정규 분포에서 임의의 확률로 해당 x값보다 작거나 같은 숫자를 얻을 확률을 반환합니다.

이 개념을 더 잘 이해하기 위해 시각적 표현을 살펴보겠습니다. 그래프에서 나는 x-값을 표시했고 음영 부분은 일반 CDF를 사용하여 해당 x-값까지의 누적 확률을 나타냅니다. 평균이 0이고 표준 편차가 1인 표준 정규 분포를 참조할 때 확률 변수를 Z로 표시하고 대문자 파이(Φ)를 사용하여 CDF를 나타냅니다.

이제 정규 분포 내의 변수가 단일 숫자보다 작은 것이 아니라 특정 범위에 속할 확률을 계산하려는 경우가 있습니다. 상위 숫자보다 작거나 같을 확률을 계산하고 하위 숫자보다 작거나 같을 확률을 뺌으로써 이를 달성할 수 있습니다. 이는 왼쪽 하단의 음영 영역에서 오른쪽 하단의 음영 영역을 빼서 시각화할 수 있습니다.

다양한 정규 분포와 확률을 사용하여 몇 가지 계산을 수행하여 지식을 테스트해 봅시다. 이를 위해 RStudio로 전환합니다. R에서는 정규 분포에 대한 누적 분포 함수인 "Pnorm" 함수를 활용할 수 있습니다.

먼저 N(5, 9) 분포를 살펴보겠습니다. 우리는 X가 10보다 작거나 같을 확률을 찾고자 합니다. x-값 10, 평균 5, 표준편차 3과 함께 "Pnorm"을 사용하면 약 0.9522의 결과를 얻습니다.

다음으로 10보다 큰 x-값을 얻을 확률을 결정해 보겠습니다. 10보다 큰 x-값을 얻는 것은 10보다 작거나 같은 x-값을 얻는 것의 보수이므로 다음 확률을 빼서 계산할 수 있습니다. 1에서 후자. 1에서 "Pnorm(10, 5, 3)"을 빼면 대략 0.048이 될 확률을 알 수 있습니다.

이제 평균이 100이고 분산이 20인 정규 분포로 초점을 옮겨 보겠습니다. X가 92와 95 사이에 있을 확률에 관심이 있습니다. X가 95보다 작거나 같을 확률을 계산하는 것으로 시작합니다. "Pnorm(95, 100, sqrt(20))"을 사용합니다. 그런 다음 "Pnorm(92, 100, sqrt(20))"을 사용하여 X가 92보다 작거나 같을 확률을 뺍니다. 결과는 약 0.095입니다.

마지막으로 표준 정규 분포를 사용하여 Z가 -1.2와 0.1 사이에 있을 확률을 찾아보겠습니다. 약 0.428의 결과를 얻기 위해 "Pnorm(0.1)"에서 "Pnorm(-1.2)"를 직접 뺄 수 있습니다.

결론적으로 정규 분포의 힘과 누적 분포 함수를 활용하여 다양한 값 범위와 관련된 확률을 계산할 수 있습니다. RStudio는 이러한 계산을 효율적으로 수행하기 위해 "Pnorm" 기능과 같은 필요한 도구를 제공합니다.

Computing Normal Probabilities Using R
Computing Normal Probabilities Using R
  • 2020.05.28
  • www.youtube.com
A quick introduction to the normal cdf function and its implementation in R, complete with several complete examples. Easy! If this vid helps you, please hel...
 

역 정규 계산


역 정규 계산

여러분, 안녕하세요! 오늘, 우리는 역법칙 계산의 매혹적인 세계를 탐구할 것입니다. Φ(z)로 표시되는 누적 분포 함수(CDF)를 사용하여 표준 정규 분포에서 확률을 계산하는 방법에 대한 이해를 새롭게 하는 것으로 시작하겠습니다. CDF는 z-score를 입력으로 사용하고 임의로 선택한 z-score가 해당 값보다 작거나 같을 확률을 반환합니다.

이 개념을 설명하기 위해 Φ(0.5)가 스케치된 그래프를 고려하십시오. Φ(0.5)를 계산하기 위해 표준 종형 곡선을 그리고 평균의 약간 오른쪽에 z = 0.5를 배치합니다. 그런 다음 해당 z-점수의 왼쪽에 있는 전체 영역을 음영 처리합니다. Φ(0.5)는 음영 영역의 면적을 나타냅니다. 종형 곡선 아래의 총 확률은 항상 1이므로 음영 영역을 전체 영역의 백분율로 해석할 수 있습니다.

이제 Φ^(-1) 또는 "phi inverse"로 표시되는 일반 CDF의 역을 살펴보겠습니다. 이 프로세스는 이전 계산을 뒤집습니다. z-score를 제공하고 확률을 얻는 대신 확률을 입력하고 해당 z-score를 반환합니다. 예를 들어 Φ^(-1)(0.5)는 0입니다. Φ(0)이 0.5이기 때문입니다. 확률의 절반은 표준 정규 분포에서 z = 0의 왼쪽에 있습니다. 마찬가지로 Φ^(-1)(0.6915)는 Φ(0.5)가 0.6915이므로 0.5이고 Φ^(-1)(0.1587)은 Φ(-1)이 0.1587이므로 -1입니다. 우리는 기본적으로 이 두 함수의 입력과 출력을 반대로 하고 있습니다.

이 개념을 더 자세히 설명하기 위해 예를 들어 보겠습니다. 표준 정규 분포에서 90번째 백분위수를 캡처하는 z-점수를 찾고 싶다고 가정합니다. 이 z-점수는 이 분포에서 반복적으로 추출하는 경우 결과의 90%보다 큰 결과를 나타냅니다. 이를 결정하기 위해 Φ^(-1)을 사용하고 Φ^(-1)(0.90)을 계산하여 약 1.28을 산출합니다. 따라서 1.28은 표준 정규 분포에서 90번째 백분위수에 해당하는 z-점수입니다.

이제 주어진 확률 또는 백분위수에 대한 z 점수로 무장하여 모든 정규 분포에서 해당 값을 쉽게 결정할 수 있습니다. 표준화된 테스트의 점수가 평균 1060이고 표준 편차가 195인 정규 분포를 따르는 예를 고려하십시오. 점수의 95%를 초과하는 데 필요한 점수를 결정하기 위해 먼저 95번째 백분위수를 찾습니다. R에서 Φ^(-1)(0.95) 또는 qnorm(0.95)를 사용하여 z-점수로 약 1.64를 얻습니다. 이 결과를 해석하면 학생은 무작위로 선택한 점수를 능가할 확률이 95%가 되려면 평균보다 1.64 표준 편차가 높아야 합니다.

실제 점수를 계산하려면 공식 x = μ + zσ를 사용합니다. 여기서 x는 필요한 점수, μ는 평균(1060), z는 z 점수(1.64), σ는 표준 편차(195)입니다. . 이 값을 연결하면 학생이 약 1379.8점을 받아야 한다는 것을 알 수 있습니다. 따라서 약 1380점을 받으면 학생은 95번째 백분위수에 배치되고 시험에서 임의로 선택한 점수를 능가할 95%의 기회를 제공합니다.

정규 및 역 정규 분포에서 얻은 값은 비합리적일 수 있으므로 종종 근사치라는 점에 유의해야 합니다. 테이블을 사용하여 역 정규 계산을 수행할 수 있지만 이러한 계산을 위해 기술을 사용하는 것이 더 일반적이고 편리합니다. 예를 들어 R에서 역법선에 대한 명령은 qnorm입니다. 확률의 역수를 찾으려면 qnorm 뒤에 원하는 확률을 입력합니다. 예를 들어 0.6915의 역수를 계산하기 위해 qnorm(0.6915)을 사용하고 약 0.5를 얻습니다. 마찬가지로 0.1587의 역수에 대해 qnorm(0.1587)을 사용하고 대략 -1을 얻습니다.

이러한 계산에 기술을 사용하는 것은 수동 표를 사용하는 것보다 정확한 결과를 제공하고 시간을 절약하므로 21세기에 바람직합니다. R과 같은 도구를 활용하면 확률을 제공하고 해당 z-점수를 받아 역정규 계산을 쉽게 수행할 수 있습니다.

요약하면, 역 정규 계산을 통해 정규 분포에서 주어진 확률 또는 백분위수에 해당하는 z-점수를 결정할 수 있습니다. R의 Φ^(-1) 또는 qnorm과 같은 역 정규 함수를 사용하여 이러한 값을 얻을 수 있습니다. 이 정보는 정보에 입각한 결정을 내리고 다양한 통계 분석을 수행하는 데 도움이 됩니다.

Inverse Normal Calculations
Inverse Normal Calculations
  • 2020.07.30
  • www.youtube.com
Let's learn about the inverse normal cdf! Lots of examples and pictures, as usual.
 

R을 사용한 역 정규 계산


R을 사용한 역 정규 계산

오늘은 R을 사용하여 역법칙 계산을 수행할 것입니다. 해결해야 할 세 가지 문제가 있습니다.

문제 1: 표준 정규 분포의 98번째 백분위수를 찾습니다. 즉, 표준 정규 분포에서 확률의 98% 이상에 있는 z-점수를 결정하려고 합니다. R에서는 qnorm 명령을 사용할 수 있습니다. 표준정규분포(평균=0, 표준편차=1)를 다루고 있기 때문에 백분위수를 인수로 직접 입력할 수 있다. 따라서 qnorm(0.98)을 계산하고 약 2.05의 z-점수를 얻습니다.

문제 2: 평균이 12이고 분산이 3인 정규 분포에서 면적의 40%를 차지하는 x 값을 찾으십시오. 주어진 매개변수로 벨 곡선을 시각화하는 것으로 시작할 수 있습니다. 왼쪽으로 40% 영역에 해당하는 x 값을 찾고 싶습니다. qnorm을 사용하여 원하는 영역을 0.40인 소수점으로 입력합니다. 그러나 이는 비표준 정규분포이므로 평균과 표준편차도 함께 명시해야 합니다. 따라서 qnorm(0.40, 평균 = 12, sd = sqrt(3))을 계산하고 대략 11.56과 같은 x 값을 얻습니다.

문제 3: 평균이 9.1파운드이고 표준 편차가 2.7파운드인 대략적인 정규 분포를 따르는 미국의 1인당 연간 오렌지 소비량을 고려하십시오. 미국인이 동료의 85% 미만을 먹는다면 그들이 소비하는 양을 확인하려고 합니다. 여기서는 주어진 백분위수(85%)의 오른쪽 영역에 관심이 있습니다. qnorm은 왼쪽에 영역이 있는 값을 제공하므로 오른쪽 영역을 얻으려면 1에서 백분위수를 빼야 합니다(0.15). qnorm(0.15, 평균 = 9.1, sd = 2.7)을 계산하여 해당 소비 값을 찾습니다. 그 결과 연간 약 6.30파운드의 오렌지가 생산됩니다.

R의 qnorm 함수를 사용하면 이러한 역 정규 계산을 효율적으로 수행하고 다양한 통계 문제에 대해 원하는 결과를 얻을 수 있습니다.

R에서 qnorm 함수를 사용하면 역정규 계산을 효율적으로 수행할 수 있으므로 정규 분포 아래 특정 백분위수 또는 영역에 해당하는 필수 z-점수 또는 값을 제공합니다.

문제 1에서 표준 정규 분포의 98번째 백분위수를 찾고 싶었습니다. qnorm(0.98)을 사용하여 약 2.05의 z-점수를 얻었습니다. 이는 표준 정규 분포의 98번째 백분위수에 해당하는 값이 평균보다 2.05 표준편차 높다는 것을 의미합니다.

문제 2에서는 평균이 12, 분산이 3인 정규분포에서 면적의 40%를 차지하는 x의 값을 찾는 것을 목표로 했습니다. qnorm 함수에 평균과 표준편차를 qnorm(0.40, mean = 12, sd = sqrt(3)) 약 11.56의 x 값을 얻었습니다. 이는 주어진 정규 분포에서 왼쪽 영역의 40%를 캡처하는 것에 해당하는 x 값이 약 11.56임을 나타냅니다.

문제 3에서 우리는 평균 9.1파운드, 표준 편차 2.7파운드의 정규 분포를 따르는 미국의 연간 1인당 오렌지 소비량을 고려했습니다. 동료의 85% 미만을 먹는 개인의 소비량을 결정하고 싶었습니다. qnorm(0.15, 평균 = 9.1, sd = 2.7)을 계산하여 개인이 동료의 85% 미만을 소비하려면 소비 수준이 연간 약 6.30파운드여야 한다는 것을 발견했습니다.

전반적으로 R의 qnorm 함수는 필요한 z-점수 또는 특정 백분위수 또는 영역을 기반으로 하는 값을 제공하여 역 정규 계산을 수행하는 프로세스를 단순화합니다. 이를 통해 정규 분포의 특성을 기반으로 분석하고 정보에 입각한 결정을 내릴 수 있습니다.

Inverse Normal Calculations Using R
Inverse Normal Calculations Using R
  • 2020.08.02
  • www.youtube.com
It's easy to compute inverse normal values using R. Let's learn the qnorm() command! If this vid helps you, please help me a tiny bit by mashing that 'like' ...
 

샘플링 분포


샘플링 분포

안녕하세요 여러분, 오늘은 통계의 샘플링 분포 개념에 대해 논의하겠습니다. 통계적 추론에서 우리의 목표는 표본 통계를 사용하여 모집단 매개변수를 추정하는 것입니다. 그러나 샘플 통계는 샘플마다 다른 경향이 있습니다. 즉, 샘플을 반복적으로 추출하면 동일한 통계에 대해 다른 값을 얻게 됩니다.

예를 들어 설명하겠습니다. 번호가 매겨진 칩이 들어 있는 가방이 있고 보드 스테이션 통계학자가 무작위로 5개의 칩을 뽑아 숫자 24, 11, 10, 14, 16을 얻는다고 가정해 보겠습니다. x-bar로 표시된 샘플 평균은 15로 계산됩니다. 이제 , 이 프로세스를 여러 번 반복하면 매번 다른 x-bar 값을 얻을 수 있습니다. 예를 들어 후속 샘플에서 샘플 평균으로 17.8, 18.8 또는 21.6을 얻을 수 있습니다. 따라서 샘플 통계량 x-bar는 임의 프로세스의 결과이며 임의 변수로 간주될 수 있습니다. 통계의 샘플링 분포라고 하는 자체 확률 분포가 있습니다.

이제 구체적인 예를 살펴보겠습니다. 3개의 빨간 칩과 6개의 파란 칩이 있는 가방이 있다고 가정합니다. 무작위로 3개의 칩을 교체하여 뽑는 경우 뽑힌 빨간색 칩의 수를 나타내는 x의 샘플링 분포를 찾고 싶습니다. x에는 0, 1, 2 또는 3의 네 가지 가능한 값이 있습니다. 각 값과 관련된 확률을 결정하기 위해 각 개별 무승부를 Bernoulli 시행으로 취급합니다. 여기서 빨간색은 성공으로 간주되고 파란색은 실패로 간주됩니다. 각각 1/3의 확률로 3개의 동일한 추첨을 수행하고 있으므로 n = 3 및 p = 1/3인 이항 분포가 있습니다. 이항 분포 공식을 사용하여 확률을 계산하면 x = 0, 1, 2 및 3에 대한 확률이 각각 0.296, 0.444, 0.296 및 0.064임을 알 수 있습니다. 이러한 확률은 x의 샘플링 분포를 정의합니다.

평균은 통계적 추론을 위해 가장 일반적으로 사용되는 통계이므로 '표본 평균의 표본 분포'라는 문구를 자주 접하게 됩니다. 동일한 모집단에서 동일한 크기의 표본을 추출할 때 표본 평균이 취할 수 있는 모든 가능한 값의 확률 분포를 나타냅니다. 예를 들어 가방의 예를 다시 생각해 봅시다. 하지만 이번에는 칩에 1부터 35까지 번호가 매겨져 있습니다. n = 5 크기의 샘플을 채취할 때 x-bar로 표시되는 샘플 평균의 샘플링 분포를 설명하려고 합니다. 교체없이. 샘플링 프로세스를 천 번 반복하고 매번 샘플 평균을 계산하여 15에서 165까지의 범위에 있는 천 개의 숫자 목록을 얻습니다. 이러한 샘플 평균의 대부분은 중간 범위에 속하며 히스토그램을 구성하여 다음을 관찰합니다. 샘플링 분포는 대략 종형 곡선 모양을 따릅니다. 이 벨 커브 패턴은 우연의 일치가 아닙니다. 향후 논의에서 살펴보겠습니다.

표본 평균의 표본 분포는 예측 가능한 중심과 산포를 가지고 있어 다양한 통계적 추론이 가능합니다. 특히, 평균이 mu이고 표준편차가 시그마인 대규모 모집단에서 크기 n의 샘플을 추출하면 샘플 평균(x-bar)의 평균은 모집단 평균(mu)과 같습니다. 또한 표본 평균의 표준 편차는 모집단 표준 편차(시그마)를 n의 제곱근으로 나눈 값과 같습니다. 이러한 관계는 표본 평균이 모집단 평균의 추정치를 제공하고 모집단 내의 개별 관측치보다 덜 가변적임을 시사합니다.

이를 설명하기 위해 표준화 시험의 평균 점수가 1060이고 표준 편차가 195인 예를 고려해 보겠습니다. 모집단에서 100명의 학생을 무작위로 선택한다고 가정합니다. 이 경우 모집단이 충분히 커서 보충 없이 표본 추출을 허용할 수 있다고 가정합니다. x-bar로 표시된 샘플 평균의 샘플링 분포는 중심이 1060이고 표준 편차가 19.5입니다.

명확히 하기 위해, 100명의 학생 샘플을 수집하고 평균 시험 점수를 계산하고 이 프로세스를 여러 번 반복하면 평균적으로 샘플 평균은 1060이 됩니다. 샘플 평균의 분포는 표시된 대로 19.5의 표준편차만큼 모집단 내 개별 점수의 표준편차보다 상당히 작을 것입니다.

중심 및 확산과 같은 샘플링 분포의 속성을 이해하면 의미 있는 통계적 추론을 할 수 있습니다. 표본 평균의 표본 분포를 활용하여 모집단 매개변수를 추정하고 관찰된 표본 통계를 기반으로 모집단에 대한 결론을 도출할 수 있습니다.

전반적으로 통계의 샘플링 분포는 샘플 통계의 가변성과 모집단 매개변수와의 관계에 대한 통찰력을 제공함으로써 통계적 추론에서 중요한 역할을 합니다.

Sampling Distributions
Sampling Distributions
  • 2020.08.01
  • www.youtube.com
All statistical inference is based on the idea of the sampling distribution of a statistic, the distribution of all possible values of that statistic in all ...
 

중심 극한 정리란 무엇입니까?


중심 극한 정리란 무엇입니까?

오늘은 통계학에서 가장 중요한 정리 중 하나로 널리 알려진 CLT(Central Limit Theorem)에 대해 살펴보겠습니다. CLT는 표본 평균(x-bar)의 표본 분포 모양을 설명하며 표본 분포에 대한 확실한 이해가 필요합니다.

CLT를 파악하려면 샘플링 분포에 익숙해지는 것이 좋습니다. 귀하의 편의를 위해 위에 링크한 샘플링 배포에 대한 비디오를 볼 수 있습니다.

이제 CLT에 대해 자세히 살펴보겠습니다. 평균(μ)과 표준편차(σ)가 있는 모집단에서 크기 'n'의 단순 임의 표본을 추출한다고 가정합니다. 모집단의 모양에 대해 많이 알지 못할 수도 있지만 'n'이 충분히 크면(보통 약 30) 표본 평균의 표본 분포는 정규 분포에 가까워집니다. 모집단 자체가 정규 분포라면 x-bar의 샘플링 분포는 'n'에 관계없이 정확히 정규 분포가 됩니다. 또한 x-bar의 평균은 항상 μ이고 x-bar의 표준 편차는 σ를 'n'의 제곱근으로 나눈 값입니다.

본질적으로 중심 극한 정리는 샘플링되는 모집단에 관계없이 샘플 크기가 충분히 크면 x-bar의 분포는 평균이 μ이고 표준 편차가 σ를 제곱근으로 나눈 정규 분포에 가깝다는 것입니다. 'n'의. 정신적으로 모집단에서 동일한 크기의 수많은 표본을 추출하여 각 표본의 표본 평균을 계산하는 것을 상상해 보십시오. 개별 표본 평균은 약간 다를 수 있지만 평균은 모집단 평균과 같으며 평균 주변의 이러한 표본 평균의 확산은 표준 편차가 모집단의 표준 편차보다 작지만 관련이 있는 종 모양에 가깝습니다.

이 개념을 설명하기 위해 예를 들어 보겠습니다. 통화 시간이 평균(μ)이 2분이고 표준 편차(σ)가 3분인 정규 분포를 따르는 기술 헬프라인이 있습니다. 임의로 선택한 40개의 통화 샘플의 평균 길이가 2.5분 미만일 확률을 찾고 싶다고 가정합니다. 개별 호출 길이의 정확한 분포를 알지 못하지만 40개 호출의 표본 평균을 조사하고 있으므로 중앙 극한 정리를 활용할 수 있습니다. 표본 평균(x-bar)은 평균 2와 표준 편차 3을 제곱근 40(σ/sqrt(n))으로 나눈 정규 분포에 가깝습니다.

확률을 계산하기 위해 평균이 2이고 표준편차가 3/sqrt(40)인 분포에서 x-bar = 2.5에 대한 z-점수를 결정합니다. z-점수를 (2.5 - 2) / (3 / sqrt(40))로 계산하면 값 1.05를 찾습니다. 그런 다음 정규 누적 분포 함수(CDF)를 사용하여 z-점수가 1.05 미만이고 약 85.3%를 산출할 확률을 찾을 수 있습니다. 이는 40건의 통화를 샘플링할 때 2.5분 미만의 샘플 평균을 얻을 확률이 85.3%라는 것을 의미합니다.

또 다른 데모에서는 동일한 확률로 1에서 12 사이의 임의의 정수를 생성하는 난수 생성기를 상상해 봅시다. 이 시나리오는 임의로 누군가를 선택하고 태어난 달을 결정하는 것과 유사합니다. 이 생성기에서 크기 2의 간단한 임의 샘플을 가져와 여러 번 실행하고 샘플 평균을 계산하면 대략 피라미드 모양의 히스토그램이 관찰됩니다. 결과는 6.5 부근에 군집하는 경향이 있으며, 이는 1 또는 12에 가까운 값에 비해 6.5 부근에서 표본 평균을 얻을 확률이 더 높다는 것을 나타냅니다.

샘플 크기를 10으로 늘리면 종 모양의 분포와 유사해지기 시작하는 히스토그램이 관찰되고 샘플 평균의 산포가 감소합니다. 표본 평균의 대부분은 이제 4와 9 사이에 있습니다.

샘플 크기를 100으로 더 늘리고 프로세스를 반복하면 히스토그램은 대부분의 샘플 평균이 6과 7 사이에 집중된 종 모양이 됩니다. 샘플 평균의 표준 편차는 계속 감소합니다.

마지막으로 샘플 크기가 1000인 경우 히스토그램은 거의 완벽한 정규 분포 곡선을 따릅니다. 표본 평균은 모집단 평균 주위에 밀집되어 있으며 대부분은 6.25와 6.75 사이에 있습니다. 표본 평균의 표준 편차는 표본 크기가 증가함에 따라 계속 줄어듭니다.

요약하면, 샘플 크기(n)가 증가함에 따라 샘플 평균(x-bar)은 모집단 평균(μ)의 보다 신뢰할 수 있는 추정치가 됩니다. 표본 평균의 변동성이 감소하여 더 좁고 종 모양의 표본 분포로 이어집니다.

이제 증류수 디스펜서와 관련된 예를 살펴보겠습니다. 디스펜서는 갤런의 물을 채우고 디스펜서의 양은 평균 1.03갤런과 표준 편차 0.02갤런의 정규 분포를 따릅니다. 분배된 단일 "갤런"이 실제로 1갤런 미만일 확률을 확인하려고 합니다.

이 확률을 찾기 위해 평균이 1.03이고 표준 편차가 0.02인 정규 분포에서 x = 1에 대한 z-점수를 계산합니다. z-점수는 (1 - 1.03) / 0.02로 계산되어 -1.5가 됩니다. 정규 누적 분포 함수(CDF)를 사용하면 1갤런 미만의 값을 얻을 확률이 약 6.68%라는 것을 알 수 있습니다.

이제 평균 10갤런이 1갤런당 1갤런 미만일 확률을 고려해 봅시다. 중심 극한 정리에 따르면 표본 크기(n)가 충분히 크면 모집단 분포와 상관없이 표본 평균의 표본 분포가 정규 분포가 됩니다. 이 경우 x-bar의 샘플링 분포는 평균이 1.03(모집단 평균과 같음)이고 표준편차가 0.02/sqrt(10)입니다.

1갤런 미만의 샘플 평균을 얻을 확률을 찾기 위해 z-점수를 (1 - 1.03) / (0.02/sqrt(10))로 계산하며 이는 -4.74와 같습니다. 정규 누적 분포 함수(CDF)를 사용하면 1갤런 미만의 표본 평균을 얻을 확률이 약 0.0001%라는 것을 알 수 있습니다.

결론적으로, 1갤런이 덜 채워질 가능성은 다소 낮지만(약 7%) 10갤런의 평균이 갤런당 1갤런 미만인 경우는 극히 이례적입니다.

마지막으로 샘플 크기와 관련하여 중앙 극한 정리는 x-bar의 샘플링 분포가 큰 샘플 크기에 대한 정규 분포에 가깝다고 제안합니다. 그러나 "대형" 표본 크기를 구성하는 것은 주관적이며 모집단 분포의 왜도와 특이치의 존재 여부에 따라 달라집니다. 일반적으로 극단적인 이상값이 없는 상당히 대칭적인 분포에서 표본을 추출하는 경우 표본 크기가 더 작아도 중심 극한 정리를 적용하기에 충분할 수 있습니다.

What is the central limit theorem?
What is the central limit theorem?
  • 2020.08.04
  • www.youtube.com
This is it! The most important theorem is the whole wide universe! A large proportion of statistical inference made possible by this one result. If this vid ...
 

중심 극한 정리를 사용한 확률 계산: 예


중심 극한 정리를 사용한 확률 계산: 예

안녕하세요 여러분, 오늘 세션에서는 중심 극한 정리를 사용하여 확률 계산과 관련된 몇 가지 문제를 다룰 것입니다. 해결해야 할 두 가지 문제가 있습니다. 시작하자!

문제 1: 특정 브랜드의 사탕 봉지 무게는 평균이 45g이고 표준 편차가 1.5g인 정규 분포를 따릅니다. 무작위로 선택한 가방에 44g 미만의 사탕이 들어 있을 확률을 찾아야 합니다.

이를 해결하기 위해 정규 분포를 사용하고 z-점수를 계산합니다. z-점수는 값(44)에서 평균(45)을 빼고 이를 표준 편차(1.5)로 나누어 구합니다. 이것은 -0.67의 z 점수를 제공합니다.

다음으로 정규 누적 분포 함수(CDF)를 사용하여 표준 정규 분포에서 -0.67보다 작은 값을 얻을 확률을 찾습니다. 확률은 약 0.252로 밝혀졌습니다. 즉, 임의로 선택한 가방에 44g 미만의 사탕이 들어 있을 확률이 25.2%입니다.

문제 2: 무작위로 선택된 5개의 가방의 평균 무게가 44g 미만인 사탕의 확률을 고려할 것입니다. 이 문제에 대해서는 중심극한정리(Central Limit Theorem)를 적용해야 합니다.

중심 극한 정리에 따르면 표본 크기가 충분히 크면(보통 30 이상) 표본 평균의 표본 분포는 모집단 분포에 관계없이 거의 정규 분포가 됩니다. 이 경우 샘플링 분포의 평균(x-bar)은 모집단 평균(45)과 같을 것이며 표준 편차는 모집단 표준 편차(1.5)를 샘플 크기의 제곱근으로 나눈 값( √5).

확률을 찾기 위해 원하는 값(44)에서 평균(45)을 빼고 이를 표준 편차(√(1.5^2/5))로 나누어 z-점수를 계산합니다. 이것은 우리에게 -1.49의 z 점수를 줍니다.

일반 CDF를 사용하면 44g 미만의 표본 평균을 얻을 확률이 약 0.068 또는 6.8%임을 알 수 있습니다. 따라서 무작위로 선택된 5개의 사탕 봉지의 평균 무게가 44g 미만일 확률은 약 6.8%입니다.

마지막으로 무작위로 선택된 25개의 가방의 평균 무게가 44g 미만인 사탕의 확률을 고려합니다. 표본 크기가 더 크기 때문에(25) 여전히 중앙 극한 정리를 적용할 수 있습니다.

이전과 동일한 절차를 사용하여 표준 편차가 1.5/√25인 표본 평균 44g에 대한 z-점수를 계산합니다. 이것은 -3.33의 z 점수를 제공합니다.

일반 CDF를 적용하면 44g 미만의 표본 평균을 얻을 확률이 약 0.004 또는 0.4%임을 알 수 있습니다. 따라서 무작위로 선택된 25개의 사탕 봉지의 평균 무게가 44g 미만일 확률은 0.4%에 불과합니다.

결론적으로 중앙 극한 정리는 비교적 작은 샘플 크기인 7에서도 이러한 확률에 대한 신뢰할 수 있는 근사치를 제공합니다. 계산된 확률은 원래 확률 분포에서 얻은 정확한 값에 매우 가깝습니다.

Calculating Probabilities Using the Central Limit Theorem: Examples
Calculating Probabilities Using the Central Limit Theorem: Examples
  • 2020.10.02
  • www.youtube.com
Let's compute! The Central Limit Theorem is incredibly useful when computing probabilities for sample means and sums. We do an example of each. If this vid h...
 

신뢰 구간 소개


신뢰 구간 소개

안녕하세요 여러분, 오늘 우리는 신뢰구간이라는 주제로 뛰어들고 있습니다. 이에 대해 논의할 때 매개변수와 통계 간의 차이를 염두에 두는 것이 중요합니다. 이 개념을 빠르게 검토해 보겠습니다.

매개변수는 미국의 모든 데이터 과학자의 평균 초봉과 같이 모집단을 설명하는 숫자입니다. 반면에 통계는 미국에서 무작위로 선택된 10명의 데이터 과학자의 평균 초봉과 같이 샘플을 설명하는 숫자입니다.

일반적으로 관찰 매개변수에 직접 액세스할 수 없습니다. 전체 모집단에서 정보를 수집하는 것은 종종 비실용적이므로 통계를 제공하는 샘플 데이터에 의존합니다. 통계적 추론은 통계에서 매개변수로 추론하는 프로세스입니다.

통계적 추론의 가장 기본적이고 중요한 형태 중 하나는 신뢰 구간입니다. 이 모든 것을 보다 구체적으로 설명하기 위해 예를 들어 보겠습니다. 미국에서 10명의 데이터 과학자를 무작위로 샘플링하여 그들의 평균 초봉이 $97,000임을 알아냈다고 가정합니다. 이 값은 샘플의 데이터 과학자만 참조하므로 통계를 나타냅니다. 그러나 우리는 미국에 있는 모든 데이터 과학자의 평균 초봉에 대해 추론하려고 합니다. 이는 우리가 추정하려는 매개변수입니다.

통계 x-bar(표본 평균)로 매개변수 μ를 추정하기 위해 가장 좋은 추측은 미국의 모든 데이터 과학자의 평균 초봉이 $97,000라는 것입니다. 그러나 이 추정치가 정확하지 않을 가능성이 매우 높다는 점을 인정하는 것이 중요합니다. 매개변수 μ는 정확히 $97,000가 될 가능성이 없습니다. 약간 더 높거나 낮을 수도 있고 훨씬 더 높을 수도 있습니다.

우리의 추정치가 정확하지 않다는 점을 감안할 때 일반적으로 x-bar에 약간의 오차를 더하거나 뺀 형태의 구간 추정치를 제공하는 것이 적절합니다. 중요한 질문은 이 오차 범위를 결정하는 방법입니다. 오차 범위가 크더라도 항상 틀릴 가능성이 있다는 점을 명심해야 합니다.

예를 들어 실제 매개변수(미국 데이터 과학자의 실제 초봉)가 $150,000인 동안 10명의 저임금 데이터 과학자로 샘플을 선택하는 시나리오를 고려하십시오. 우리의 표본 평균은 여전히 $97,000입니다. 따라서 우리가 기대할 수 있는 최선은 높은 확률로 실제 매개변수를 포착할 수 있는 신뢰 구간을 구성하는 것입니다. 즉, 간격에는 상당한 시간 비율의 실제 매개변수가 포함되어야 합니다.

일반적으로 95%의 신뢰 수준이 표준으로 사용되지만 응용 프로그램에 따라 90% 또는 99%와 같은 다른 수준을 선택할 수 있습니다. 어쨌든 신뢰 수준에 사용되는 표기법은 대문자 C입니다. 이를 공식적으로 확률 진술로 표현하기 위해 우리는 x-bar와 μ가 다음의 e 내에 있을 확률과 같은 오차 범위(e)를 찾는 것을 목표로 합니다. 서로가 C다.

우리의 예를 좀 더 구체적으로 만들어 봅시다. 데이터 과학자의 초봉이 모집단 표준 편차가 $8,000인 정규 분포를 따르는 것으로 알려져 있다고 가정합니다. 우리는 미국의 모든 데이터 과학자의 평균 초봉인 μ를 95% 신뢰도로 추정할 수 있는 오차 한계(e)를 찾고자 합니다.

이를 달성하기 위해 표준 정규 분포의 속성을 사용합니다. 정규 분포를 따르는 무작위 변수 x를 취하면 샘플링 평균(x-bar)도 정규 분포를 따릅니다. 표본 평균 분포의 평균은 모집단 분포의 평균(μ)과 동일하지만 표준 편차가 감소합니다. 이 예에서 표본 평균의 표준 편차는 σ/√n입니다. 여기서 σ는 모집단 표준 편차이고 n은 표본 크기입니다.

이 정보를 사용하여 확률을 다음과 같이 다시 작성할 수 있습니다. x-bar가 μ - e와 μ + e 사이에 있을 확률은 C와 같습니다. 이제 이를 숫자를 측정하는 z-점수로 나타낼 수 있습니다. 평균에서 벗어난 표준편차. 구간을 표준화하면 표준 정규 분포(Z-분포)를 활용하여 적절한 값을 결정할 수 있습니다.

주어진 신뢰 수준 C에 대해 표준 정규 곡선 아래에서 -z-star와 z-star 사이의 영역이 C와 같도록 z-점수(z-star)를 찾아야 합니다. C에 대한 공통 값은 0.95, 이는 1.960의 z-star에 해당합니다. z-star가 있으면 σ/√n을 곱하여 오차 한계를 계산할 수 있습니다.

n = 10의 샘플 크기, $97,000의 샘플 평균, $8,000의 모집단 표준 편차가 있는 예제로 돌아가서 μ에 대한 95% 신뢰 구간을 구성할 수 있습니다. 이 값을 일반적인 형태의 신뢰 구간으로 대체하면 μ에 대한 구간 추정치가 $97,000 ± $1,958임을 알 수 있습니다.

요약하면 미국의 모든 데이터 과학자의 평균 초봉은 95%의 추정 신뢰도로 $92,042에서 $101,958 사이가 될 것으로 예상합니다. 즉, 이 샘플링 프로세스를 반복하고 샘플 데이터를 사용하여 신뢰 구간을 구성하는 경우 약 95%의 시간 동안 해당 구간이 실제 매개변수(μ)를 캡처할 것으로 예상합니다.

Introducing Confidence Intervals
Introducing Confidence Intervals
  • 2020.07.30
  • www.youtube.com
Let's talk about confidence intervals. Here we're attempting to estimate a population mean when the population standard deviation is known. Cool stuff! If th...
 

평균에 대한 신뢰 구간 - 예


평균에 대한 신뢰 구간 - 예

안녕하세요 여러분, 오늘은 모집단 표준 편차를 알고 있을 때 모집단 평균에 대한 신뢰 구간 구성에 대해 논의할 것입니다. 또한 가정용 욕실 저울과 관련된 예를 통해 오차 범위의 크기에 영향을 줄 수 있는 요인을 탐색합니다.

욕실 저울을 사용할 때 판독값이 일반적으로 체중을 측정하는 사람의 실제 체중 주위에 분포한다고 가정하는 것이 합리적입니다. 그러나 이러한 판독값은 완벽하게 정확할 것으로 예상되지 않으며 약간 더 높거나 낮을 수 있습니다. 이 예에서는 저울의 모집단 표준 편차(1.2파운드)에 대한 정보에 액세스할 수 있다고 가정합니다.

우리의 주요 관심사는 체중을 측정하는 사람의 실제 체중에 대한 신뢰 구간을 구성하는 것입니다. 이를 μ로 표시합니다. 이를 달성하기 위해 저울에서 사람의 무게를 반복적으로 측정하고 이러한 무게의 표본 평균을 계산하고 공식 μ = x-bar ± z-star * σ / √n을 사용합니다. 여기서 x-bar는 표본 평균을 나타내고 n은 표본 크기, σ는 모집단 표준 편차, z-star는 원하는 신뢰 수준(C)에 해당하는 임계 z 값입니다.

예를 좀 더 구체적으로 설명하기 위해 저울에서 통계학자의 체중을 다섯 번 측정하고 평균 체중이 153.2파운드라고 가정해 보겠습니다. 이것은 우리의 표본 평균으로 사용됩니다. 이제 저울의 표준 편차를 1.2파운드로 가정하고 통계학자의 실제 체중에 대한 90% 신뢰 구간을 구성하려고 합니다. 이 값을 공식에 대입하면 간격 추정치가 153.2 ± 0.88파운드임을 알 수 있습니다.

90% 신뢰 수준을 선택했으므로 이 구간이 사례의 약 90%에서 통계학자의 실제 가중치를 포착할 것이라고 기대할 수 있습니다.

이제 오차범위의 구조에 대해 알아보자. 오차 한계는 공식 z-star * σ / √n을 따르며 여기서 세 가지 주요 구성 요소가 있습니다. , 샘플 크기 n.

이 세 가지 구성 요소 중 하나를 수정하면 오차 범위의 크기에 예측 가능한 영향을 미칠 수 있습니다. 신뢰 수준을 높이면 해당 z-star 값이 커지므로 오차 범위도 증가합니다. 마찬가지로 모집단 표준 편차 σ를 높이면 데이터의 변동성이 더 커져 표본 평균의 신뢰성이 떨어지기 때문에 오차 범위가 더 커집니다. 반면에 표본 크기 n을 늘리면 표본 평균이 모집단 평균의 더 정확한 예측 변수가 되므로 오차 범위가 줄어듭니다.

이러한 효과를 설명하기 위해 표준 편차가 1.2파운드이고 표본 크기가 5인 90% 신뢰 구간의 예를 다시 살펴보겠습니다. 신뢰 수준을 95%로 높이면 z-star 값이 1.960이 되어 마진이 더 커집니다. 1.05파운드 오차. 90% 신뢰 수준으로 되돌리지만 표준 편차를 1.5파운드로 늘리면 오차 한계는 1.1파운드로 확장됩니다. 마지막으로, 표준 편차를 1.2파운드로 유지하지만 표본 크기를 10으로 두 배로 늘리면 오차 한계는 0.62파운드로 감소하여 신뢰 구간이 더 좁아짐을 나타냅니다.

신뢰 수준과 샘플 크기를 변경하는 것은 실질적인 조정이지만 표준 편차를 수정하는 것은 일반적으로 모집단의 고유한 가변성을 반영하므로 우리가 통제할 수 없다는 점에 유의해야 합니다.

결론적으로 신뢰 구간은 관심 있는 모집단 매개변수에 대한 그럴듯한 값의 범위를 제공합니다. 신뢰 수준, 모집단 표준 편차 및 표본 크기의 영향을 받는 오차 한계는 추정치의 정확성과 신뢰성을 이해하는 데 도움이 됩니다. 신뢰 수준을 높이면 간격이 넓어져 실제 매개변수를 캡처하는 데 더 높은 수준의 신뢰를 제공합니다. 모집단 표준 편차가 클수록 데이터의 변동성이 증가하여 간격이 넓어집니다. 반대로 샘플 크기를 늘리면 더 많은 정보를 제공하고 추정 정확도가 향상되므로 간격이 좁아집니다.

우리가 논의한 예에서 수행할 수 있는 두 가지 현실적인 변경 사항이 있습니다. 신뢰 수준 조정 및 샘플 크기 변경입니다. 이러한 변경을 통해 확실성 수준과 추정에 사용되는 데이터의 양을 제어할 수 있습니다. 그러나 척도의 표준 편차는 우리가 통제할 수 없으므로 수정하기가 현실적이지 않습니다.

오차 한계 및 신뢰 구간에 영향을 미치는 요인을 이해하는 것은 통계 결과를 해석하는 데 중요합니다. 이를 통해 정보에 입각한 결정을 내리고 추정치의 정확성과 신뢰성을 기반으로 의미 있는 결론을 도출할 수 있습니다.

Confidence Intervals for the Mean - Example
Confidence Intervals for the Mean - Example
  • 2020.07.31
  • www.youtube.com
Let's construct a confidence interval for a population mean! We'll also talk about the structure of the margin of error, and what goes into making it large o...
사유: