Chương 8: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
CÁC KHÁI NIỆM
KIỂM ĐỊNH THAM SỐ
KIỂM ĐỊNH PHI THAM SỐ
CÁC KHÁI NIỆM
Giả thuyết thống kê
Tiêu chuẩn kiểm định
Miền bác bỏ giả thuyết
Quy tắc kiểm định giả thuyết
Các sai lầm mắc phải
Thủ tục kiểm định giả thuyết
CÁC KHÁI NIỆM
Giả thuyết thống kê
Tiêu chuẩn kiểm định
Miền bác bỏ giả thuyết
Quy tắc kiểm định giả thuyết
Các sai lầm mắc phải
Thủ tục kiểm định giả thuyết
Giả thuyết thống kê
Định nghĩa
Giả thuyết thống kê là giả thuyết về dạng
115 trang |
Chia sẻ: huongnhu95 | Lượt xem: 449 | Lượt tải: 0
Tóm tắt tài liệu Bài giảng Lý thuyết xác suất và thống kê Toán - Chương 8: Kiểm định giả thuyết thống kê - Phạm Thị Hồng Thắm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
phân phối xác suất của
biến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiên
hoặc về tính độc lập của các biến ngẫu nhiên.
Giả thuyết thống kê được ký hiệu là H0.
Ví dụ
Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó,
ta có thể có các giả thuyết:
H0: X phân phối chuẩn
H0: Nhu cầu trung bình µ = 50 tấn/tháng.
H0: Nhu cầu X và giá Y là độc lập.
Giả thuyết thống kê
Định nghĩa
Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của
biến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiên
hoặc về tính độc lập của các biến ngẫu nhiên.
Giả thuyết thống kê được ký hiệu là H0.
Ví dụ
Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó,
ta có thể có các giả thuyết:
H0: X phân phối chuẩn
H0: Nhu cầu trung bình µ = 50 tấn/tháng.
H0: Nhu cầu X và giá Y là độc lập.
Giả thuyết thống kê
Định nghĩa
Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của
biến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiên
hoặc về tính độc lập của các biến ngẫu nhiên.
Giả thuyết thống kê được ký hiệu là H0.
Ví dụ
Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó,
ta có thể có các giả thuyết:
H0: X phân phối chuẩn
H0: Nhu cầu trung bình µ = 50 tấn/tháng.
H0: Nhu cầu X và giá Y là độc lập.
Giả thuyết thống kê
Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập,
gọi là giả thuyết đối, ký hiệu H1. H0 và H1 tạo nên một cặp giả
thuyết thống kê.
Ví dụ
Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng:
H1: X không phân phối chuẩn.
H1: µ > 50; H1: µ < 50; H1: µ 6= 50.
H1: X và Y phụ thuộc.
Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm
định, tức là tìm ra kết luận về tính thừa nhận được hay không
thừa nhận được của giả thuyết đó.
Giả thuyết thống kê
Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập,
gọi là giả thuyết đối, ký hiệu H1. H0 và H1 tạo nên một cặp giả
thuyết thống kê.
Ví dụ
Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng:
H1: X không phân phối chuẩn.
H1: µ > 50; H1: µ < 50; H1: µ 6= 50.
H1: X và Y phụ thuộc.
Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm
định, tức là tìm ra kết luận về tính thừa nhận được hay không
thừa nhận được của giả thuyết đó.
Giả thuyết thống kê
Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập,
gọi là giả thuyết đối, ký hiệu H1. H0 và H1 tạo nên một cặp giả
thuyết thống kê.
Ví dụ
Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng:
H1: X không phân phối chuẩn.
H1: µ > 50; H1: µ < 50; H1: µ 6= 50.
H1: X và Y phụ thuộc.
Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm
định, tức là tìm ra kết luận về tính thừa nhận được hay không
thừa nhận được của giả thuyết đó.
Tiêu chuẩn kiểm định
Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu
ngẫu nhiên: W = (X1, X2,. . . , Xn) và chọn lập thống kê:
G = f (X1,X2, . . . ,Xn, θ0)
trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G
có quy luật phân phối xác suất xác định nếu H0 đúng.
G được gọi là tiêu chuẩn kiểm định giả thuyết.
Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể
được gọi là giá trị quan sát của tiêu chuẩn kiểm định.
Gqs = f (x1, x2, . . . , xn, θ0)
Tiêu chuẩn kiểm định
Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu
ngẫu nhiên: W = (X1, X2,. . . , Xn) và chọn lập thống kê:
G = f (X1,X2, . . . ,Xn, θ0)
trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G
có quy luật phân phối xác suất xác định nếu H0 đúng.
G được gọi là tiêu chuẩn kiểm định giả thuyết.
Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể
được gọi là giá trị quan sát của tiêu chuẩn kiểm định.
Gqs = f (x1, x2, . . . , xn, θ0)
Tiêu chuẩn kiểm định
Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu
ngẫu nhiên: W = (X1, X2,. . . , Xn) và chọn lập thống kê:
G = f (X1,X2, . . . ,Xn, θ0)
trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G
có quy luật phân phối xác suất xác định nếu H0 đúng.
G được gọi là tiêu chuẩn kiểm định giả thuyết.
Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể
được gọi là giá trị quan sát của tiêu chuẩn kiểm định.
Gqs = f (x1, x2, . . . , xn, θ0)
Tiêu chuẩn kiểm định
Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu
ngẫu nhiên: W = (X1, X2,. . . , Xn) và chọn lập thống kê:
G = f (X1,X2, . . . ,Xn, θ0)
trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G
có quy luật phân phối xác suất xác định nếu H0 đúng.
G được gọi là tiêu chuẩn kiểm định giả thuyết.
Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể
được gọi là giá trị quan sát của tiêu chuẩn kiểm định.
Gqs = f (x1, x2, . . . , xn, θ0)
Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó
giả thuyết H0 bị bác bỏ.
Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G
tại đó giả thuyết H0 không bị bác bỏ.
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được
miền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα
bằng α.
α được gọi là mức ý nghĩa của kiểm định.
Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó
giả thuyết H0 bị bác bỏ.
Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G
tại đó giả thuyết H0 không bị bác bỏ.
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được
miền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα
bằng α.
α được gọi là mức ý nghĩa của kiểm định.
Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó
giả thuyết H0 bị bác bỏ.
Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G
tại đó giả thuyết H0 không bị bác bỏ.
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được
miền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα
bằng α.
α được gọi là mức ý nghĩa của kiểm định.
Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó
giả thuyết H0 bị bác bỏ.
Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G
tại đó giả thuyết H0 không bị bác bỏ.
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được
miền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα
bằng α.
α được gọi là mức ý nghĩa của kiểm định.
Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó
giả thuyết H0 bị bác bỏ.
Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G
tại đó giả thuyết H0 không bị bác bỏ.
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được
miền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα
bằng α.
α được gọi là mức ý nghĩa của kiểm định.
Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó
giả thuyết H0 bị bác bỏ.
Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G
tại đó giả thuyết H0 không bị bác bỏ.
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được
miền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα
bằng α.
α được gọi là mức ý nghĩa của kiểm định.
Miền bác bỏ giả thuyết
Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được
chia thành 2 tập hợp không giao nhau:
Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó
giả thuyết H0 bị bác bỏ.
Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G
tại đó giả thuyết H0 không bị bác bỏ.
Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát
từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được
miền Wα sao cho: P(G ∈ Wα/H0) = α
Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα
bằng α.
α được gọi là mức ý nghĩa của kiểm định.
Quy tắc kiểm định giả thuyết
Từ P(G∈Wα/H0) = α, với α khá nhỏ, biến cố (G ∈Wα) có thể
coi như không xảy ra trong một phép thử (theo nguyên lý xác suất
nhỏ).
Với giá trị Gqs cụ thể, ta kết luận theo quy tắc sau:
Nếu Gqs ∈Wα: Bác bỏ H0, thừa nhận H1.
Nếu Gqs /∈Wα: Chưa có cơ sở bác bỏ H0, trên thực tế là
thừa nhận H0 và bác bỏ H1.
Quy tắc kiểm định giả thuyết
Từ P(G∈Wα/H0) = α, với α khá nhỏ, biến cố (G ∈Wα) có thể
coi như không xảy ra trong một phép thử (theo nguyên lý xác suất
nhỏ).
Với giá trị Gqs cụ thể, ta kết luận theo quy tắc sau:
Nếu Gqs ∈Wα: Bác bỏ H0, thừa nhận H1.
Nếu Gqs /∈Wα: Chưa có cơ sở bác bỏ H0, trên thực tế là
thừa nhận H0 và bác bỏ H1.
Quy tắc kiểm định giả thuyết
Từ P(G∈Wα/H0) = α, với α khá nhỏ, biến cố (G ∈Wα) có thể
coi như không xảy ra trong một phép thử (theo nguyên lý xác suất
nhỏ).
Với giá trị Gqs cụ thể, ta kết luận theo quy tắc sau:
Nếu Gqs ∈Wα: Bác bỏ H0, thừa nhận H1.
Nếu Gqs /∈Wα: Chưa có cơ sở bác bỏ H0, trên thực tế là
thừa nhận H0 và bác bỏ H1.
Các sai lầm mắc phải
Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm
thuộc hai loại sau:
Sai lầm loại I: Bác bỏ giả thuyết đúng
Mức ý nghĩa α chính là xác suất mắc sai lầm loại I.
Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn
bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất
mắc sai lầm loại I đúng bằng α.
Sai lầm loại II: Thừa nhận giả thuyết sai
Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1
đúng.
Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β
Các sai lầm mắc phải
Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm
thuộc hai loại sau:
Sai lầm loại I: Bác bỏ giả thuyết đúng
Mức ý nghĩa α chính là xác suất mắc sai lầm loại I.
Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn
bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất
mắc sai lầm loại I đúng bằng α.
Sai lầm loại II: Thừa nhận giả thuyết sai
Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1
đúng.
Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β
Các sai lầm mắc phải
Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm
thuộc hai loại sau:
Sai lầm loại I: Bác bỏ giả thuyết đúng
Mức ý nghĩa α chính là xác suất mắc sai lầm loại I.
Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn
bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất
mắc sai lầm loại I đúng bằng α.
Sai lầm loại II: Thừa nhận giả thuyết sai
Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1
đúng.
Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β
Các sai lầm mắc phải
Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm
thuộc hai loại sau:
Sai lầm loại I: Bác bỏ giả thuyết đúng
Mức ý nghĩa α chính là xác suất mắc sai lầm loại I.
Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn
bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất
mắc sai lầm loại I đúng bằng α.
Sai lầm loại II: Thừa nhận giả thuyết sai
Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1
đúng.
Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β
Các sai lầm mắc phải
Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm
thuộc hai loại sau:
Sai lầm loại I: Bác bỏ giả thuyết đúng
Mức ý nghĩa α chính là xác suất mắc sai lầm loại I.
Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn
bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất
mắc sai lầm loại I đúng bằng α.
Sai lầm loại II: Thừa nhận giả thuyết sai
Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1
đúng.
Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β
Các sai lầm mắc phải
Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm
thuộc hai loại sau:
Sai lầm loại I: Bác bỏ giả thuyết đúng
Mức ý nghĩa α chính là xác suất mắc sai lầm loại I.
Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn
bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất
mắc sai lầm loại I đúng bằng α.
Sai lầm loại II: Thừa nhận giả thuyết sai
Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1
đúng.
Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β
Các sai lầm mắc phải
Trên thực tế sai lầm loại I và loại II luôn mâu thuẫn nhau, tức nếu
giảm α sẽ làm tăng β và ngược lại.
Để dung hòa mâu thuẫn trên, người ta thường cho trước α, và
trong số các miền Wα có thể lựa chọn miền nào có β nhỏ nhất, đó
là miền bác bỏ tốt nhất.
Vậy miền bác bỏ tốt nhất Wα phải thỏa mãn:
P(G ∈ Wα/H0) = α
P(G ∈ Wα/H1) = 1 - β max
Việc chọn α tùy thuộc vào hậu quả mà sai lầm loại I và loại II
mang lại.
Các sai lầm mắc phải
Ví dụ
Sau khi xây dựng xong một tòa nhà thì cơ quan chức năng phát
hiện 1/2 số sắt đã bị "rút ruột". Gọi H0: Chất lượng công trình
đảm bảo, H1: Chất lượng công trình không đảm bảo. Vậy sai lầm
loại I hay loại II nghiêm trọng hơn.
Giải
Giả sử chất lượng công trình đảm bảo nhưng ta loại bỏ H0 =⇒
đập nhà đi =⇒ gây tốn kém tiền của.
Giả sử chất lượng công trình không đảm bảo nhưng ta vẫn thừa
nhận H0 loại bỏ H1 =⇒ vẫn đưa vào sử dụng =⇒ nhà sập =⇒
vừa tốn kèm tiền của vừa nguy hiểm đến tính mạng.
Vậy sai lầm loại II nghiêm trọng hơn =⇒ chọn α lớn để β nhỏ.
Các sai lầm mắc phải
Ví dụ
Sau khi xây dựng xong một tòa nhà thì cơ quan chức năng phát
hiện 1/2 số sắt đã bị "rút ruột". Gọi H0: Chất lượng công trình
đảm bảo, H1: Chất lượng công trình không đảm bảo. Vậy sai lầm
loại I hay loại II nghiêm trọng hơn.
Giải
Giả sử chất lượng công trình đảm bảo nhưng ta loại bỏ H0 =⇒
đập nhà đi =⇒ gây tốn kém tiền của.
Giả sử chất lượng công trình không đảm bảo nhưng ta vẫn thừa
nhận H0 loại bỏ H1 =⇒ vẫn đưa vào sử dụng =⇒ nhà sập =⇒
vừa tốn kèm tiền của vừa nguy hiểm đến tính mạng.
Vậy sai lầm loại II nghiêm trọng hơn =⇒ chọn α lớn để β nhỏ.
Thủ tục kiểm định giả thuyết
Xây dựng giả thuyết gốc H0 cần kiểm định.
Từ tổng thể lập mẫu ngẫu nhiên kích thước n.
Chọn tiêu chuẩn kiểm định G và tìm quy luật phân phối xác
suất của nó với điều kiện H0 đúng; tìm Gqs trên mẫu cụ thể.
Với mức ý nghĩa α cho trước, tìm miền bác bỏ tốt nhất Wα.
So sánh Gqs với Wα và kết luận.
Nếu Gqs ∈Wα: Bác bỏ H0, thừa nhận H1.
Nếu Gqs /∈Wα: Thừa nhận H0 và bác bỏ H1.
Thủ tục kiểm định giả thuyết
Xây dựng giả thuyết gốc H0 cần kiểm định.
Từ tổng thể lập mẫu ngẫu nhiên kích thước n.
Chọn tiêu chuẩn kiểm định G và tìm quy luật phân phối xác
suất của nó với điều kiện H0 đúng; tìm Gqs trên mẫu cụ thể.
Với mức ý nghĩa α cho trước, tìm miền bác bỏ tốt nhất Wα.
So sánh Gqs với Wα và kết luận.
Nếu Gqs ∈Wα: Bác bỏ H0, thừa nhận H1.
Nếu Gqs /∈Wα: Thừa nhận H0 và bác bỏ H1.
KIỂM ĐỊNH THAM SỐ
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối chuẩn
Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân
phối chuẩn
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối A(p)
Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán
của hai biến ngẫu nhiên phân phối chuẩn
Kiểm định giả thuyết về sự bằng nhau của hai phương sai của
hai biến ngẫu nhiên phân phối chuẩn
Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán
của hai biến ngẫu nhiên phân phối A(p)
KIỂM ĐỊNH THAM SỐ
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối chuẩn
Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân
phối chuẩn
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối A(p)
Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán
của hai biến ngẫu nhiên phân phối chuẩn
Kiểm định giả thuyết về sự bằng nhau của hai phương sai của
hai biến ngẫu nhiên phân phối chuẩn
Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán
của hai biến ngẫu nhiên phân phối A(p)
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối chuẩn
Giả sử X ∼ N(µ, σ2). Nếu chưa biết µ, song có thể cho rằng giá trị
của nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0. Để
kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích
thước n: W = (X1, X2,. . . , Xn).
Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau:
Trường hợp đã biết phương sai σ2
Trường hợp chưa biết phương sai σ2
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối chuẩn
Giả sử X ∼ N(µ, σ2). Nếu chưa biết µ, song có thể cho rằng giá trị
của nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0. Để
kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích
thước n: W = (X1, X2,. . . , Xn).
Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau:
Trường hợp đã biết phương sai σ2
Trường hợp chưa biết phương sai σ2
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối chuẩn
Giả sử X ∼ N(µ, σ2). Nếu chưa biết µ, song có thể cho rằng giá trị
của nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0. Để
kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích
thước n: W = (X1, X2,. . . , Xn).
Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau:
Trường hợp đã biết phương sai σ2
Trường hợp chưa biết phương sai σ2
Trường hợp đã biết phương sai σ2
Chọn tiêu chuẩn kiểm định
G = U =
(X¯ − µ0)
√
n
σ
Nếu H0 đúng thì U ∼ N(0; 1). Các miền bác bỏ tốt nhất Wα được
xác định như sau:
a. H0: µ = µ0; H1: µ > µ0: Với mức ý nghĩa α cho trước tìm được
giá trị tới hạn uα sao cho P(U>uα) = α, ta thu được miền bác bỏ
bên phải.
Wα =
{
U =
(
X¯ − µ0
)√
n
σ
; U > uα
}
Trường hợp đã biết phương sai σ2
Chọn tiêu chuẩn kiểm định
G = U =
(X¯ − µ0)
√
n
σ
Nếu H0 đúng thì U ∼ N(0; 1). Các miền bác bỏ tốt nhất Wα được
xác định như sau:
a. H0: µ = µ0; H1: µ > µ0: Với mức ý nghĩa α cho trước tìm được
giá trị tới hạn uα sao cho P(U>uα) = α, ta thu được miền bác bỏ
bên phải.
Wα =
{
U =
(
X¯ − µ0
)√
n
σ
; U > uα
}
Trường hợp đã biết phương sai σ2
b. H0: µ = µ0 ; H1: µ < µ0: Với α, tìm được u1−α sao cho
P(U<u1−α) = P(U < -uα) = α ta thu được miền bác bỏ bên trái:
Wα =
{
U =
(
X¯ − µ0
)√
n
σ
; U < −uα
}
c. H0: µ = µ0; H1: µ 6= µ0: Với α, tìm được u1−α/2 và uα/2 sao
cho:
P(U uα/2) = P(U
uα/2) = P(|U| > uα/2) = α
Ta thu được miền bác bỏ hai phía:
Wα =
{
U =
(
X¯ − µ0
)√
n
σ
; |U| > uα/2
}
Trường hợp đã biết phương sai σ2
b. H0: µ = µ0 ; H1: µ < µ0: Với α, tìm được u1−α sao cho
P(U<u1−α) = P(U < -uα) = α ta thu được miền bác bỏ bên trái:
Wα =
{
U =
(
X¯ − µ0
)√
n
σ
; U < −uα
}
c. H0: µ = µ0; H1: µ 6= µ0: Với α, tìm được u1−α/2 và uα/2 sao
cho:
P(U uα/2) = P(U
uα/2) = P(|U| > uα/2) = α
Ta thu được miền bác bỏ hai phía:
Wα =
{
U =
(
X¯ − µ0
)√
n
σ
; |U| > uα/2
}
Trường hợp đã biết phương sai σ2
Với mẫu cụ thể w = (x1, x2,. . . , xn) ta tính giá trị quan sát tiêu
chuẩn kiểm định.
Uqs =
(x¯ − µ0)
√
n
σ
và so sánh với Wα để kết luận:
- Nếu Uqs ∈Wα: Bác bỏ H0, thừa nhận H1
- Nếu Uqs /∈Wα: Chưa có cơ sở để bác bỏ H0.
Trường hợp đã biết phương sai σ2
Ví dụ
Trọng lượng mỗi gói sản phẩm do một nhà máy sản xuất là biến
ngẫu nhiên phân phối chuẩn với độ lệch chuẩn 36g và trọng lượng
trung bình 453g. Kiểm tra ngẫu nhiên 81 gói sản phẩm đó thấy
trọng lượng trung bình là 448g. Với mức ý nghĩa 0,05 có thể kết
luận các gói sản phẩm bị đóng thiếu hay không.
Giải
X: Trọng lượng đóng gói sản phẩm X ∼ N (µ, σ2 = 362)
Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu
nhiên phân phối chuẩn khi đã biết phương sai tổng thể.
Trường hợp đã biết phương sai σ2
Ví dụ
Trọng lượng mỗi gói sản phẩm do một nhà máy sản xuất là biến
ngẫu nhiên phân phối chuẩn với độ lệch chuẩn 36g và trọng lượng
trung bình 453g. Kiểm tra ngẫu nhiên 81 gói sản phẩm đó thấy
trọng lượng trung bình là 448g. Với mức ý nghĩa 0,05 có thể kết
luận các gói sản phẩm bị đóng thiếu hay không.
Giải
X: Trọng lượng đóng gói sản phẩm X ∼ N (µ, σ2 = 362)
Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu
nhiên phân phối chuẩn khi đã biết phương sai tổng thể.
Trường hợp đã biết phương sai σ2
Ví dụ
Cặp giả thuyết kiểm định là: H0: µ = 453; H1: µ < 453
Miền bác bỏ là:
Wα =
{
U =
(
X¯ − µ0
)√
n
σ
; U < −uα
}
Tính toán: α = 0,05 ⇒ uα = u0,05 = 1,65 ⇒ Wα = (-∞; -1,65)
Trường hợp đã biết phương sai σ2
Ví dụ
Cặp giả thuyết kiểm định là: H0: µ = 453; H1: µ < 453
Miền bác bỏ là:
Wα =
{
U =
(
X¯ − µ0
)√
n
σ
; U < −uα
}
Tính toán: α = 0,05 ⇒ uα = u0,05 = 1,65 ⇒ Wα = (-∞; -1,65)
Trường hợp đã biết phương sai σ2
Ví dụ
Từ mẫu cụ thể: x¯ = 448
⇒ Uqs = (448− 453)
√
81
36
= −1, 25 /∈Wα
Kết luận: Với mức ý nghĩa 0,05, từ mẫu cụ thể đã cho chưa có cơ
sở để bác bỏ H0, tức là chưa thể nói sản phẩm bị đóng thiếu.
Trường hợp chưa biết phương sai σ2
Chọn
G = T =
(
X¯ − µ0
)√
n
S
Nếu H0 đúng thì T ∼ T(n-1). Các miền bác bỏ mức α có dạng:
a. H0: µ = µ0; H1: µ > µ0
Wα =
{
T =
(
X¯ − µ0
)√
n
S
; T > t(n−1)α
}
Trường hợp chưa biết phương sai σ2
Chọn
G = T =
(
X¯ − µ0
)√
n
S
Nếu H0 đúng thì T ∼ T(n-1). Các miền bác bỏ mức α có dạng:
a. H0: µ = µ0; H1: µ > µ0
Wα =
{
T =
(
X¯ − µ0
)√
n
S
; T > t(n−1)α
}
Trường hợp chưa biết phương sai σ2
b. H0: µ = µ0; H1: µ < µ0
Wα =
{
T =
(
X¯ − µ0
)√
n
S
; T < −t(n−1)α
}
c. H0: µ = µ0; H1: µ 6= µ0
Wα =
{
T =
(
X¯ − µ0
)√
n
S
; |T | > t(n−1)α/2
}
Trường hợp chưa biết phương sai σ2
Ví dụ
Thu hoạch thử 41 ruộng lúa tính được năng suất trung bình 39,5
tạ/ha và độ lệch chuẩn mẫu 1,2 tạ/ha. Trước đây giống lúa này
cho năng suất 39 tạ/ha. Với mức ý nghĩa 0,05 có thể cho rằng
năng suất lúa đã tăng lên biết rằng năng suất lúa tuân theo quy
luật chuẩn.
Giải
Gọi X là năng suất lúa. X ∼ N(µ, σ2).
Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu
nhiên phân phối chuẩn khi chưa biết phương sai tổng thể.
Cặp giả thuyết kiểm định là: H0: µ = µ0 = 39; H1: µ > µ0
Trường hợp chưa biết phương sai σ2
Ví dụ
Thu hoạch thử 41 ruộng lúa tính được năng suất trung bình 39,5
tạ/ha và độ lệch chuẩn mẫu 1,2 tạ/ha. Trước đây giống lúa này
cho năng suất 39 tạ/ha. Với mức ý nghĩa 0,05 có thể cho rằng
năng suất lúa đã tăng lên biết rằng năng suất lúa tuân theo quy
luật chuẩn.
Giải
Gọi X là năng suất lúa. X ∼ N(µ, σ2).
Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu
nhiên phân phối chuẩn khi chưa biết phương sai tổng thể.
Cặp giả thuyết kiểm định là: H0: µ = µ0 = 39; H1: µ > µ0
Trường hợp chưa biết phương sai σ2
Ví dụ
Miền bác bỏ
Wα =
{
T =
(
X¯ − µ0
)√
n
S
;T > t(n−1)α
}
α = 0,05; n = 41 ⇒ t(40)0,05 = 1, 684 ⇒ Wα = (1, 684; +∞)
Từ mẫu cụ thể có x¯ = 39, 5; s = 1, 2
Tqs =
(39, 5− 39)√41
1, 2
= 2, 667 ∈ Wα
Kết luận: Với mức ý nghĩa 0,05, từ mẫu cụ thể đã cho, bác bỏ H0,
thừa nhận H1, tức năng suất lúa trung bình đã tăng lên.
Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân
phối chuẩn
Giả sử trong tổng thể, biến ngẫu nhiên gốc X phân phối N(µ, σ2)
với σ2 chưa biết song có cơ sở để giả thiết rằng giá trị của nó bằng
σ20. Người ta đưa ra giả thuyết: H0: σ
2 = σ20
Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích
thước n: W = (X1, X2,. . . , Xn) và chọn tiêu chuẩn kiểm định:
G = χ2 =
(n − 1)S2
σ20
Nếu H0 đúng thì χ
2 ∼χ2(n-1). Do đó với mức ý nghĩa α cho
trước, tùy thuộc vào giả thuyết H1, miền bác bỏ Wα được xây
dựng như sau:
Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân
phối chuẩn
Giả sử trong tổng thể, biến ngẫu nhiên gốc X phân phối N(µ, σ2)
với σ2 chưa biết song có cơ sở để giả thiết rằng giá trị của nó bằng
σ20. Người ta đưa ra giả thuyết: H0: σ
2 = σ20
Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích
thước n: W = (X1, X2,. . . , Xn) và chọn tiêu chuẩn kiểm định:
G = χ2 =
(n − 1)S2
σ20
Nếu H0 đúng thì χ
2 ∼χ2(n-1). Do đó với mức ý nghĩa α cho
trước, tùy thuộc vào giả thuyết H1, miền bác bỏ Wα được xây
dựng như sau:
Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân
phối chuẩn
a. H0 : σ
2= σ20; H1: σ
2 > σ20.
Wα =
{
χ2 =
(n − 1)S2
σ20
; χ2 > χ2(n−1)α
}
b. H0 : σ
2 = σ20; H1: σ
2 < σ20.
Wα =
{
χ2 =
(n − 1)S2
σ20
;χ2 < χ
2(n−1)
1−α
}
c. H0 : σ
2 = σ20; H1: σ
2 6= σ20.
Wα =
{
χ2 =
(n − 1)S2
σ20
;χ2 < χ
2(n−1)
1−α/2 ; χ
2 > χ
2(n−1)
α/2
}
Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân
phối chuẩn
Ví dụ
Để kiểm tra độ chính xác của một máy người ta đo ngẫu nhiên
kích thước của 15 chi tiết do máy đó sản xuất và tính được s2 =
14,6. Với mức ý nghĩa α= 0,01 hãy kết luận máy đó có hoạt động
bình thường không, biết rằng kích thước chi tiết là biến ngẫu nhiên
phân phối chuẩn có dung sai theo thiết kế là σ2 = 12.
Giải
X: kích thước chi tiết. X ∼ N(µ; σ2).
Đây là bài toán kiểm định giả thuyết thống kê về tham số σ2 của
biến ngẫu nhiên phân phối chuẩn.
Cặp giả thuyết cần kiểm định là: H0 : σ
2 = σ20 = 12; H1 : σ
2 > 12
Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân
phối chuẩn
Ví dụ
Để kiểm tra độ chính xác của một máy người ta đo ngẫu nhiên
kích thước của 15 chi tiết do máy đó sản xuất và tính được s2 =
14,6. Với mức ý nghĩa α= 0,01 hãy kết luận máy đó có hoạt động
bình thường không, biết rằng kích thước chi tiết là biến ngẫu nhiên
phân phối chuẩn có dung sai theo thiết kế là σ2 = 12.
Giải
X: kích thước chi tiết. X ∼ N(µ; σ2).
Đây là bài toán kiểm định giả thuyết thống kê về tham số σ2 của
biến ngẫu nhiên phân phối chuẩn.
Cặp giả thuyết cần kiểm định là: H0 : σ
2 = σ20 = 12; H1 : σ
2 > 12
Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân
phối chuẩn
Ví dụ
α = 0,01 ⇒ χ2(14)0,01 = 29, 14. Miền bác bỏ có dạng
Wα =
{
χ2 =
(n − 1)S2
σ20
; χ2 > χ2(n−1)α
}
= (29, 14; +∞).
Với mẫu cụ thể đã cho, ta có giá trị quan sát tiêu chuẩn kiểm định
là:
χ2qs =
14.14, 6
12
= 17, 033 /∈ (29, 14; +∞) .
Vậy chưa có cơ sở để bác bỏ H0, hay có thể nói máy móc vẫn làm
việc bình thường.
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối A(p)
Giả sử trong tổng thể biến ngẫu nhiên X phân phối A(p). Nếu
chưa biết p, song có thể cho rằng giá trị của nó bằng p0 thì đưa ra
giả thuyết thống kê: H0 : p = p0
Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích
thước n: W = (X1, X2, . . . , Xn) Chọn tiêu chuẩn kiểm định:
G = U =
(f − p0)
√
n√
p0(1− p0)
Nếu H0 đúng thì U ∼ N(0; 1). Do đó với mức ý nghĩa α cho trước,
các miền bác bỏ Wα có dạng:
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối A(p)
Giả sử trong tổng thể biến ngẫu nhiên X phân phối A(p). Nếu
chưa biết p, song có thể cho rằng giá trị của nó bằng p0 thì đưa ra
giả thuyết thống kê: H0 : p = p0
Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích
thước n: W = (X1, X2, . . . , Xn) Chọn tiêu chuẩn kiểm định:
G = U =
(f − p0)
√
n√
p0(1− p0)
Nếu H0 đúng thì U ∼ N(0; 1). Do đó với mức ý nghĩa α cho trước,
các miền bác bỏ Wα có dạng:
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối A(p)
a. H0: p = p0; H1: p < p0
Wα =
{
U =
(f − p0)
√
n√
p0(1− p0)
; U < −uα
}
b. H0: p = p0; H1: p > p0
Wα =
{
U =
(f − p0)
√
n√
p0(1− p0)
; U > uα
}
c. H0: p = p0; H1: p 6= p0
Wα =
{
U =
(f − p0)
√
n√
p0(1− p0)
; |U| > uα/2
}
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối A(p)
Ví dụ
Thống kê 10000 trẻ sơ sinh ở một địa phương, người ta thấy 5080
bé trai. Hỏi tỷ lệ sinh con trai có thực sự cao hơn tỷ lệ sinh con gái
không? Cho kết luận với mức ý nghĩa 0,01.
Giải
X: Số con trai. X ∼ A(p)
Cặp giả thuyết cần kiểm định: H0: p = p0 = 0,5; H1: p > p0
Miền bác bỏ tiêu chuẩn kiểm định có dạng:
Wα =
{
(f − p0)
√
n√
p0(1− p0)
;U > uα
}
= (2, 23; +∞)
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối A(p)
Ví dụ
Thống kê 10000 trẻ sơ sinh ở một địa phương, người ta thấy 5080
bé trai. Hỏi tỷ lệ sinh con trai có thực sự cao hơn tỷ lệ sinh con gái
không? Cho kết luận với mức ý nghĩa 0,01.
Giải
X: Số con trai. X ∼ A(p)
Cặp giả thuyết cần kiểm định: H0: p = p0 = 0,5; H1: p > p0
Miền bác bỏ tiêu chuẩn kiểm định có dạng:
Wα =
{
(f − p0)
√
n√
p0(1− p0)
;U > uα
}
= (2, 23; +∞)
Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên
phân phối A(p)
Ví dụ
Từ mẫu cụ thể, ta có:
f =
5080
10000
= 0, 508 ; n = 10000
Uqs =
(0, 508− 0, 5)√10000√
0, 5.0, 5
≈ 1, 6 /∈ (2, 33; +∞)
Vậy chưa có cơ sở để bác bỏ H0, tức là chưa có cơ sở cho rằng tỷ
lệ sinh con trai thực sự cao hơn tỷ lệ sinh con gái.
Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán
của hai biến ngẫu nhiên phân phối chuẩn
Giả sử có hai tổng thể nghiên cứu, trong đó các biến ngẫu nhiễn
X1 và X2 phân phối chuẩn: X1 ∼ N(µ1 , σ21);X2 ∼ N(µ2, σ22).
Nếu chưa biết µ1 và µ2 song có thể cho rằng chúng bằng nhau thì
đưa ra giả thuyết thống kê: H0: µ1 = µ2.
Để kiểm định giả thuyết trên, từ hai tổng thể, lập hai mẫu độc lập
kích thước n1, n2
W1 = (X11,X12, ...X1n1)W2 = (X21,X22, ...X2n2)
Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau :
Trường hợp đã biết các phương sai tổng thể σ21, σ
2
2
Trường hợp chưa biết các phương sai tổng thể σ21, σ
2
2
Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán
của hai biến ngẫu nhiên phân phối chuẩn
Các file đính kèm theo tài liệu này:
- bai_giang_ly_thuyet_xac_suat_va_thong_ke_toan_chuong_8_kiem.pdf