[ad_1]
Khám phá lý do tại sao t-Take a look at của Welch là phương pháp phù hợp để so sánh thống kê chính xác, ngay cả khi phương sai khác nhau.
Phần 1: Bối cảnh
Trong học kỳ đầu tiên của chương trình sau đại học, tôi có cơ hội tham gia khóa học STAT7055: Thống kê cơ bản về Kinh doanh và Tài chính. Trong suốt khóa học, đôi lúc tôi chắc chắn cảm thấy hơi kiệt sức, nhưng lượng kiến thức tôi thu được về việc áp dụng các phương pháp thống kê khác nhau trong các tình huống khác nhau thực sự là vô giá. Trong tuần thứ 8 của bài giảng, một điều thực sự thú vị đã thu hút sự chú ý của tôi, cụ thể là khái niệm Kiểm định giả thuyết khi so sánh hai quần thể. Tôi thấy thật thú vị khi tìm hiểu về sự khác biệt của cách tiếp cận dựa trên việc các mẫu là độc lập hay ghép đôi, cũng như những việc cần làm khi chúng ta biết hoặc không biết phương sai tổng thể của hai quần thể, cùng với cách tiến hành kiểm tra giả thuyết cho hai tỷ lệ. Tuy nhiên, có một khía cạnh chưa được đề cập trong tài liệu và nó khiến tôi băn khoăn không biết làm thế nào để giải quyết tình huống cụ thể này, đó là thực hiện Kiểm tra giả thuyết từ hai phương tiện tổng thể khi phương sai không bằng nhau, được gọi là Welch t-Take a look at.
Để nắm bắt khái niệm về cách áp dụng Welch t-Take a look at, chúng ta có thể khám phá tập dữ liệu cho trường hợp ví dụ. Mỗi giai đoạn của quá trình này liên quan đến việc sử dụng tập dữ liệu từ dữ liệu trong thế giới thực.
Phần 2: Bộ dữ liệu
Tập dữ liệu tôi đang sử dụng chứa dữ liệu thực tế về Ước tính Cung và Cầu Nông nghiệp Thế giới (WASDE) được cập nhật thường xuyên. Bộ dữ liệu WASDE được Hội đồng Triển vọng Nông nghiệp Thế giới (WAOB) tổng hợp lại. Đây là báo cáo hàng tháng cung cấp dự đoán hàng năm cho các khu vực khác nhau trên toàn cầu và Hoa Kỳ về lúa mì, gạo, ngũ cốc thô, hạt có dầu và bông. Hơn nữa, bộ dữ liệu cũng bao gồm các dự báo về đường, thịt, thịt gia cầm, trứng và sữa ở Hoa Kỳ. Nó có nguồn gốc từ trang net Nasdaq và bạn có thể truy cập miễn phí tại đây: Tập dữ liệu WASDE. Có 3 bộ dữ liệu nhưng tôi chỉ sử dụng bộ dữ liệu đầu tiên là Dữ liệu cung cầu. Định nghĩa cột có thể được nhìn thấy ở đây:
Tôi sẽ sử dụng hai mẫu khác nhau từ các khu vực, hàng hóa và mặt hàng cụ thể để đơn giản hóa quy trình thử nghiệm. Ngoài ra, chúng tôi sẽ sử dụng Ngôn ngữ lập trình R cho quy trình từ đầu đến cuối.
Bây giờ chúng ta hãy chuẩn bị dữ liệu thích hợp:
library(dplyr)# Learn and preprocess the dataframe
wasde_data <- learn.csv("wasde_data.csv") %>%
choose(-min_value, -max_value, -year, -period) %>%
filter(merchandise == "Manufacturing", commodity == "Wheat")
# Filter knowledge for Argentina and Australia
wasde_argentina <- wasde_data %>%
filter(area == "Argentina") %>%
prepare(desc(report_month))
wasde_oz <- wasde_data %>%
filter(area == "Australia") %>%
prepare(desc(report_month))
Tôi chia hai mẫu thành hai khu vực khác nhau là Argentina và Úc. Và trọng tâm là sản xuất các mặt hàng lúa mì.
Bây giờ chúng ta đã sẵn sàng. Nhưng chờ đã..
Trước khi đi sâu hơn vào ứng dụng của Welch t-Take a look at, tôi không thể không tự hỏi tại sao cần phải kiểm tra xem hai phương sai tổng thể có bằng nhau hay không.
Phần 3: Kiểm tra sự bằng nhau của phương sai
Khi tiến hành kiểm định giả thuyết để so sánh hai trung bình tổng thể mà không có kiến thức về phương sai tổng thể, điều quan trọng là phải xác nhận sự bằng nhau của các phương sai để chọn phép kiểm định thống kê thích hợp. Nếu các phương sai giống nhau, chúng tôi chọn kiểm định t phương sai gộp; nếu không, chúng ta có thể sử dụng t-test của Welch. Bước quan trọng này đảm bảo độ chính xác của kết quả, vì việc sử dụng xét nghiệm không chính xác có thể dẫn đến kết luận sai do nguy cơ mắc lỗi Loại I và Loại II cao hơn. Bằng cách kiểm tra sự bằng nhau trong các phương sai, chúng tôi đảm bảo rằng quá trình kiểm tra giả thuyết dựa trên các giả định chính xác, cuối cùng dẫn đến kết luận đáng tin cậy và có giá trị hơn.
Vậy thì làm thế nào để chúng ta kiểm tra hai phương sai tổng thể?
Chúng ta phải đặt ra hai giả thuyết như sau:
Nguyên tắc chung rất đơn giản:
- Nếu thống kê kiểm tra rơi vào vùng bị bác bỏ thì bác bỏ giả thuyết H0 hoặc Null.
- Ngược lại, chúng ta không thể bác bỏ giả thuyết H0 hoặc Null.
Chúng ta có thể đặt giả thuyết như thế này:
# Hypotheses: Variance Comparability
h0_variance <- "Inhabitants variance of Wheat manufacturing in Argentina equals that in Australia"
h1_variance <- "Inhabitants variance of Wheat manufacturing in Argentina differs from that in Australia"
Bây giờ chúng ta nên làm thống kê kiểm tra. Nhưng làm thế nào để chúng ta có được số liệu thống kê kiểm tra này? chúng tôi sử dụng Kiểm tra F.
Thử nghiệm F là bất kỳ thử nghiệm thống kê nào được sử dụng để so sánh phương sai của hai mẫu hoặc tỷ lệ phương sai giữa nhiều mẫu. Thống kê kiểm tra, biến ngẫu nhiên F, được sử dụng để xác định xem dữ liệu được kiểm tra có phân phối F theo giả thuyết không thực và các giả định thông thường thực về số hạng sai số hay không.
chúng ta có thể tạo ra giá trị thống kê kiểm tra bằng cách chia hai phương sai mẫu như thế này:
và vùng bác bỏ là:
trong đó n là cỡ mẫu và alpha là mức ý nghĩa. vì vậy khi giá trị F rơi vào một trong hai vùng bác bỏ này, chúng tôi bác bỏ giả thuyết khống.
Nhưng..
Bí quyết là: Việc ghi nhãn mẫu 1 và mẫu 2 thực ra là ngẫu nhiên, vì vậy hãy đảm bảo luôn đặt phương sai mẫu lớn hơn lên trên cùng. Bằng cách này, thống kê F của chúng tôi sẽ luôn lớn hơn 1 và chúng ta chỉ cần tham khảo điểm giới hạn trên để bác bỏ H0 ở mức ý nghĩa α bất cứ khi nào.
chúng ta có thể làm điều này bằng cách:
# Calculate pattern variances
sample_var_argentina <- var(wasde_argentina$worth)
sample_var_oz <- var(wasde_oz$worth)# Calculate F calculated worth
f_calculated <- sample_var_argentina / sample_var_oz
chúng tôi sẽ sử dụng mức ý nghĩa 5% (0,05), vì vậy quy tắc quyết định là:
# Outline significance degree and levels of freedom
alpha <- 0.05
alpha_half <- alpha / 2
n1 <- nrow(wasde_argentina)
n2 <- nrow(wasde_oz)
df1 <- n1 - 1
df2 <- n2 - 1# Calculate essential F values
f_value_lower <- qf(alpha_half, df1, df2)
f_value_upper <- qf(1 - alpha_half, df1, df2)
# Variance comparability end result
if (f_calculated > f_value_lower & f_calculated < f_value_upper) {
cat("Fail to Reject H0: ", h0_variance, "n")
equal_variances <- TRUE
} else {
cat("Reject H0: ", h1_variance, "n")
equal_variances <- FALSE
}
kết quả là chúng tôi bác bỏ giả thuyết Null ở mức ý nghĩa 5%, nói cách khác, từ thử nghiệm này, chúng tôi tin rằng phương sai của tổng thể từ hai quần thể là không bằng nhau. Bây giờ chúng ta đã biết tại sao nên sử dụng Welch t-Take a look at thay vì Pooled Variance t-Take a look at.
Phần 4: Khóa học chính, Welch t-Take a look at
Phép thử t Welch, còn được gọi là phép thử t phương sai không bằng nhau của Welch, là một phương pháp thống kê được sử dụng để so sánh giá trị trung bình của hai mẫu riêng biệt. Thay vì giả định các phương sai bằng nhau như t-test phương sai gộp tiêu chuẩn, t-test Welch mạnh mẽ hơn vì nó không đưa ra giả định này. Sự điều chỉnh mức độ tự do này dẫn đến việc đánh giá chính xác hơn về sự khác biệt giữa hai phương tiện mẫu. Bằng cách không giả định các phương sai bằng nhau, phép thử t Welch mang lại kết quả đáng tin cậy hơn khi làm việc với dữ liệu trong thế giới thực trong đó giả định này có thể không đúng. Nó được ưa thích vì khả năng thích ứng và độ tin cậy của nó, đảm bảo rằng các kết luận rút ra từ các phân tích thống kê vẫn có hiệu lực ngay cả khi không đáp ứng được giả định về phương sai bằng nhau.
Công thức thống kê kiểm tra là:
Ở đâu:
và Mức độ Tự do có thể được định nghĩa như thế này:
Vùng bác bỏ đối với kiểm định t Welch phụ thuộc vào mức ý nghĩa được chọn và kiểm định là một phía hay hai phía.
Kiểm tra hai đuôi: Giả thuyết không bị bác bỏ nếu giá trị tuyệt đối của thống kê kiểm định |t| lớn hơn giá trị tới hạn từ phân phối t với ν bậc tự do tại α/2.
Kiểm tra một đuôi: Giả thuyết không bị bác bỏ nếu thống kê kiểm định t lớn hơn giá trị tới hạn từ phân phối t với ν bậc tự do tại α đối với kiểm định đuôi trên, hoặc nếu t nhỏ hơn giá trị tới hạn âm đối với kiểm định đuôi dưới bài kiểm tra đuôi.
- Kiểm tra đuôi trên: t > tα,ν
- Kiểm tra đuôi dưới: t < −tα,ν
Vì vậy, hãy làm một ví dụ với Bài kiểm tra t Welch một đuôi.
hãy tạo ra các giả thuyết:
h0_mean <- "Inhabitants imply of Wheat manufacturing in Argentina equals that in Australia"
h1_mean <- "Inhabitants imply of Wheat manufacturing in Argentina is larger than that in Australia"
đây là một Kiểm tra đuôi trên, nên vùng bác bỏ là: t > tα,ν
và bằng cách sử dụng công thức nêu trên và bằng cách sử dụng cùng mức ý nghĩa (0,05):
# Calculate pattern means
sample_mean_argentina <- imply(wasde_argentina$worth)
sample_mean_oz <- imply(wasde_oz$worth)# Welch's t-test (unequal variances)
s1 <- sample_var_argentina
s2 <- sample_var_oz
t_calculated <- (sample_mean_argentina - sample_mean_oz) / sqrt(s1/n1 + s2/n2)
df <- (s1/n1 + s2/n2)^2 / ((s1^2/(n1^2 * (n1-1))) + (s2^2/(n2^2 * (n2-1))))
t_value <- qt(1 - alpha, df)
# Imply comparability end result
if (t_calculated > t_value) {
cat("Reject H0: ", h1_mean, "n")
} else {
cat("Fail to Reject H0: ", h0_mean, "n")
}
kết quả là chúng ta không thể bác bỏ H0 ở mức ý nghĩa 5%, thì trung bình dân số của sản xuất lúa mì ở Argentina bằng trung bình dân số ở Úc.
Đó là cách tiến hành Welch t-Take a look at. Giờ tới lượt bạn. Chúc bạn thử nghiệm vui vẻ!
Phần 5: Kết luận
Khi so sánh hai giá trị trung bình tổng thể trong quá trình kiểm tra giả thuyết, điều thực sự quan trọng là bắt đầu bằng cách kiểm tra xem phương sai có bằng nhau hay không. Bước đầu tiên này rất quan trọng vì nó giúp quyết định nên sử dụng thử nghiệm thống kê nào, đảm bảo kết quả chính xác và đáng tin cậy. Nếu các phương sai thực sự bằng nhau, bạn có thể tiếp tục và áp dụng phép thử t tiêu chuẩn với các phương sai gộp. Tuy nhiên, trong trường hợp phương sai không bằng nhau thì nên sử dụng phép thử t của Welch.
Kiểm định t của Welch cung cấp một giải pháp mạnh mẽ để so sánh các giá trị trung bình khi giả định về phương sai bằng nhau không đúng. Bằng cách điều chỉnh mức độ tự do để phù hợp với các phương sai không đồng đều, phép thử t của Welch đưa ra đánh giá chính xác và đáng tin cậy hơn về tầm quan trọng thống kê của sự khác biệt giữa hai giá trị trung bình mẫu. Khả năng thích ứng này làm cho nó trở thành một lựa chọn phổ biến trong các tình huống thực tế khác nhau trong đó kích thước và phương sai mẫu có thể thay đổi đáng kể.
Tóm lại, việc kiểm tra sự bằng nhau của các phương sai và sử dụng phép thử t của Welch khi cần thiết sẽ đảm bảo tính chính xác của việc kiểm tra giả thuyết. Cách tiếp cận này làm giảm khả năng xảy ra lỗi Loại I và Loại II, dẫn đến kết luận đáng tin cậy hơn. Bằng cách chọn thử nghiệm thích hợp dựa trên sự bằng nhau của các phương sai, chúng ta có thể tự tin phân tích các phát hiện và đưa ra quyết định sáng suốt dựa trên bằng chứng thực nghiệm.
Tài nguyên
[ad_2]
Source link