Bài giảng Lý thuyết xác suất và thống kê Toán - Chương 8: Kiểm định giả thuyết thống kê - Phạm Thị Hồng Thắm

Chương 8: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ CÁC KHÁI NIỆM KIỂM ĐỊNH THAM SỐ KIỂM ĐỊNH PHI THAM SỐ CÁC KHÁI NIỆM Giả thuyết thống kê Tiêu chuẩn kiểm định Miền bác bỏ giả thuyết Quy tắc kiểm định giả thuyết Các sai lầm mắc phải Thủ tục kiểm định giả thuyết CÁC KHÁI NIỆM Giả thuyết thống kê Tiêu chuẩn kiểm định Miền bác bỏ giả thuyết Quy tắc kiểm định giả thuyết Các sai lầm mắc phải Thủ tục kiểm định giả thuyết Giả thuyết thống kê Định nghĩa Giả thuyết thống kê là giả thuyết về dạng

pdf115 trang | Chia sẻ: huongnhu95 | Lượt xem: 469 | Lượt tải: 0download
Tóm tắt tài liệu Bài giảng Lý thuyết xác suất và thống kê Toán - Chương 8: Kiểm định giả thuyết thống kê - Phạm Thị Hồng Thắm, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
phân phối xác suất của biến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập của các biến ngẫu nhiên. Giả thuyết thống kê được ký hiệu là H0. Ví dụ Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó, ta có thể có các giả thuyết: H0: X phân phối chuẩn H0: Nhu cầu trung bình µ = 50 tấn/tháng. H0: Nhu cầu X và giá Y là độc lập. Giả thuyết thống kê Định nghĩa Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của biến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập của các biến ngẫu nhiên. Giả thuyết thống kê được ký hiệu là H0. Ví dụ Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó, ta có thể có các giả thuyết: H0: X phân phối chuẩn H0: Nhu cầu trung bình µ = 50 tấn/tháng. H0: Nhu cầu X và giá Y là độc lập. Giả thuyết thống kê Định nghĩa Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của biến ngẫu nhiên về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập của các biến ngẫu nhiên. Giả thuyết thống kê được ký hiệu là H0. Ví dụ Khi nghiên cứu nhu cầu thị trường X về một loại hàng hóa nào đó, ta có thể có các giả thuyết: H0: X phân phối chuẩn H0: Nhu cầu trung bình µ = 50 tấn/tháng. H0: Nhu cầu X và giá Y là độc lập. Giả thuyết thống kê Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập, gọi là giả thuyết đối, ký hiệu H1. H0 và H1 tạo nên một cặp giả thuyết thống kê. Ví dụ Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng: H1: X không phân phối chuẩn. H1: µ > 50; H1: µ < 50; H1: µ 6= 50. H1: X và Y phụ thuộc. Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm định, tức là tìm ra kết luận về tính thừa nhận được hay không thừa nhận được của giả thuyết đó. Giả thuyết thống kê Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập, gọi là giả thuyết đối, ký hiệu H1. H0 và H1 tạo nên một cặp giả thuyết thống kê. Ví dụ Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng: H1: X không phân phối chuẩn. H1: µ > 50; H1: µ < 50; H1: µ 6= 50. H1: X và Y phụ thuộc. Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm định, tức là tìm ra kết luận về tính thừa nhận được hay không thừa nhận được của giả thuyết đó. Giả thuyết thống kê Ứng với mỗi giả thuyết gốc H0, luôn tồn tại một mệnh đề đối lập, gọi là giả thuyết đối, ký hiệu H1. H0 và H1 tạo nên một cặp giả thuyết thống kê. Ví dụ Tiếp ví dụ 1 ta có giả thuyết đối của từng H0 tương ứng: H1: X không phân phối chuẩn. H1: µ > 50; H1: µ < 50; H1: µ 6= 50. H1: X và Y phụ thuộc. Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm định, tức là tìm ra kết luận về tính thừa nhận được hay không thừa nhận được của giả thuyết đó. Tiêu chuẩn kiểm định Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu ngẫu nhiên: W = (X1, X2,. . . , Xn) và chọn lập thống kê: G = f (X1,X2, . . . ,Xn, θ0) trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G có quy luật phân phối xác suất xác định nếu H0 đúng. G được gọi là tiêu chuẩn kiểm định giả thuyết. Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể được gọi là giá trị quan sát của tiêu chuẩn kiểm định. Gqs = f (x1, x2, . . . , xn, θ0) Tiêu chuẩn kiểm định Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu ngẫu nhiên: W = (X1, X2,. . . , Xn) và chọn lập thống kê: G = f (X1,X2, . . . ,Xn, θ0) trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G có quy luật phân phối xác suất xác định nếu H0 đúng. G được gọi là tiêu chuẩn kiểm định giả thuyết. Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể được gọi là giá trị quan sát của tiêu chuẩn kiểm định. Gqs = f (x1, x2, . . . , xn, θ0) Tiêu chuẩn kiểm định Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu ngẫu nhiên: W = (X1, X2,. . . , Xn) và chọn lập thống kê: G = f (X1,X2, . . . ,Xn, θ0) trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G có quy luật phân phối xác suất xác định nếu H0 đúng. G được gọi là tiêu chuẩn kiểm định giả thuyết. Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể được gọi là giá trị quan sát của tiêu chuẩn kiểm định. Gqs = f (x1, x2, . . . , xn, θ0) Tiêu chuẩn kiểm định Để kiểm định một giả thuyết thống kê H0, từ tổng thể lập mẫu ngẫu nhiên: W = (X1, X2,. . . , Xn) và chọn lập thống kê: G = f (X1,X2, . . . ,Xn, θ0) trong đó θ0 liên quan đến giả thuyết cần kiểm định, và thống kê G có quy luật phân phối xác suất xác định nếu H0 đúng. G được gọi là tiêu chuẩn kiểm định giả thuyết. Giá trị của tiêu chuẩn kiểm định G được tính trên một mẫu cụ thể được gọi là giá trị quan sát của tiêu chuẩn kiểm định. Gqs = f (x1, x2, . . . , xn, θ0) Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Miền bác bỏ giả thuyết Khi đã chọn được tiêu chuẩn kiểm định G, các giá trị của nó được chia thành 2 tập hợp không giao nhau: Miền bác bỏ giả thuyết, Wα, bao gồm các giá trị của G tại đó giả thuyết H0 bị bác bỏ. Miền không bác bỏ giả thuyết, W¯α, bao gồm các giá trị của G tại đó giả thuyết H0 không bị bác bỏ. Miền bác bỏ Wα được xây dựng theo nguyên tắc sau: Xuất phát từ một xác suất α khá bé cho trước (≤ 0,05), có thể tìm được miền Wα sao cho: P(G ∈ Wα/H0) = α Với điều kiện H0 đúng, xác suất để G nhận giá trị thuộc miền Wα bằng α. α được gọi là mức ý nghĩa của kiểm định. Quy tắc kiểm định giả thuyết Từ P(G∈Wα/H0) = α, với α khá nhỏ, biến cố (G ∈Wα) có thể coi như không xảy ra trong một phép thử (theo nguyên lý xác suất nhỏ). Với giá trị Gqs cụ thể, ta kết luận theo quy tắc sau: Nếu Gqs ∈Wα: Bác bỏ H0, thừa nhận H1. Nếu Gqs /∈Wα: Chưa có cơ sở bác bỏ H0, trên thực tế là thừa nhận H0 và bác bỏ H1. Quy tắc kiểm định giả thuyết Từ P(G∈Wα/H0) = α, với α khá nhỏ, biến cố (G ∈Wα) có thể coi như không xảy ra trong một phép thử (theo nguyên lý xác suất nhỏ). Với giá trị Gqs cụ thể, ta kết luận theo quy tắc sau: Nếu Gqs ∈Wα: Bác bỏ H0, thừa nhận H1. Nếu Gqs /∈Wα: Chưa có cơ sở bác bỏ H0, trên thực tế là thừa nhận H0 và bác bỏ H1. Quy tắc kiểm định giả thuyết Từ P(G∈Wα/H0) = α, với α khá nhỏ, biến cố (G ∈Wα) có thể coi như không xảy ra trong một phép thử (theo nguyên lý xác suất nhỏ). Với giá trị Gqs cụ thể, ta kết luận theo quy tắc sau: Nếu Gqs ∈Wα: Bác bỏ H0, thừa nhận H1. Nếu Gqs /∈Wα: Chưa có cơ sở bác bỏ H0, trên thực tế là thừa nhận H0 và bác bỏ H1. Các sai lầm mắc phải Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau: Sai lầm loại I: Bác bỏ giả thuyết đúng Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α. Sai lầm loại II: Thừa nhận giả thuyết sai Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β Các sai lầm mắc phải Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau: Sai lầm loại I: Bác bỏ giả thuyết đúng Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α. Sai lầm loại II: Thừa nhận giả thuyết sai Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β Các sai lầm mắc phải Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau: Sai lầm loại I: Bác bỏ giả thuyết đúng Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α. Sai lầm loại II: Thừa nhận giả thuyết sai Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β Các sai lầm mắc phải Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau: Sai lầm loại I: Bác bỏ giả thuyết đúng Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α. Sai lầm loại II: Thừa nhận giả thuyết sai Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β Các sai lầm mắc phải Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau: Sai lầm loại I: Bác bỏ giả thuyết đúng Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α. Sai lầm loại II: Thừa nhận giả thuyết sai Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β Các sai lầm mắc phải Khi kiểm định một giả thuyết thống kê, có thể mắc các sai lầm thuộc hai loại sau: Sai lầm loại I: Bác bỏ giả thuyết đúng Mức ý nghĩa α chính là xác suất mắc sai lầm loại I. Thật vậy, mặc dù H0 đúng nhưng xác suất để (G ∈Wα) vẫn bằng α. Nhưng khi G ∈Wα, ta lại bác bỏ H0. Do đó xác suất mắc sai lầm loại I đúng bằng α. Sai lầm loại II: Thừa nhận giả thuyết sai Thừa nhận H0 trong khi H0 sai, hay Gqs ∈Wα trong khi H1 đúng. Giả sử xác suất mắc sai lầm loại II là β: P(G /∈ Wα/H1) = β Các sai lầm mắc phải Trên thực tế sai lầm loại I và loại II luôn mâu thuẫn nhau, tức nếu giảm α sẽ làm tăng β và ngược lại. Để dung hòa mâu thuẫn trên, người ta thường cho trước α, và trong số các miền Wα có thể lựa chọn miền nào có β nhỏ nhất, đó là miền bác bỏ tốt nhất. Vậy miền bác bỏ tốt nhất Wα phải thỏa mãn: P(G ∈ Wα/H0) = α P(G ∈ Wα/H1) = 1 - β max Việc chọn α tùy thuộc vào hậu quả mà sai lầm loại I và loại II mang lại. Các sai lầm mắc phải Ví dụ Sau khi xây dựng xong một tòa nhà thì cơ quan chức năng phát hiện 1/2 số sắt đã bị "rút ruột". Gọi H0: Chất lượng công trình đảm bảo, H1: Chất lượng công trình không đảm bảo. Vậy sai lầm loại I hay loại II nghiêm trọng hơn. Giải Giả sử chất lượng công trình đảm bảo nhưng ta loại bỏ H0 =⇒ đập nhà đi =⇒ gây tốn kém tiền của. Giả sử chất lượng công trình không đảm bảo nhưng ta vẫn thừa nhận H0 loại bỏ H1 =⇒ vẫn đưa vào sử dụng =⇒ nhà sập =⇒ vừa tốn kèm tiền của vừa nguy hiểm đến tính mạng. Vậy sai lầm loại II nghiêm trọng hơn =⇒ chọn α lớn để β nhỏ. Các sai lầm mắc phải Ví dụ Sau khi xây dựng xong một tòa nhà thì cơ quan chức năng phát hiện 1/2 số sắt đã bị "rút ruột". Gọi H0: Chất lượng công trình đảm bảo, H1: Chất lượng công trình không đảm bảo. Vậy sai lầm loại I hay loại II nghiêm trọng hơn. Giải Giả sử chất lượng công trình đảm bảo nhưng ta loại bỏ H0 =⇒ đập nhà đi =⇒ gây tốn kém tiền của. Giả sử chất lượng công trình không đảm bảo nhưng ta vẫn thừa nhận H0 loại bỏ H1 =⇒ vẫn đưa vào sử dụng =⇒ nhà sập =⇒ vừa tốn kèm tiền của vừa nguy hiểm đến tính mạng. Vậy sai lầm loại II nghiêm trọng hơn =⇒ chọn α lớn để β nhỏ. Thủ tục kiểm định giả thuyết Xây dựng giả thuyết gốc H0 cần kiểm định. Từ tổng thể lập mẫu ngẫu nhiên kích thước n. Chọn tiêu chuẩn kiểm định G và tìm quy luật phân phối xác suất của nó với điều kiện H0 đúng; tìm Gqs trên mẫu cụ thể. Với mức ý nghĩa α cho trước, tìm miền bác bỏ tốt nhất Wα. So sánh Gqs với Wα và kết luận. Nếu Gqs ∈Wα: Bác bỏ H0, thừa nhận H1. Nếu Gqs /∈Wα: Thừa nhận H0 và bác bỏ H1. Thủ tục kiểm định giả thuyết Xây dựng giả thuyết gốc H0 cần kiểm định. Từ tổng thể lập mẫu ngẫu nhiên kích thước n. Chọn tiêu chuẩn kiểm định G và tìm quy luật phân phối xác suất của nó với điều kiện H0 đúng; tìm Gqs trên mẫu cụ thể. Với mức ý nghĩa α cho trước, tìm miền bác bỏ tốt nhất Wα. So sánh Gqs với Wα và kết luận. Nếu Gqs ∈Wα: Bác bỏ H0, thừa nhận H1. Nếu Gqs /∈Wα: Thừa nhận H0 và bác bỏ H1. KIỂM ĐỊNH THAM SỐ Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán của hai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về sự bằng nhau của hai phương sai của hai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p) KIỂM ĐỊNH THAM SỐ Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán của hai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về sự bằng nhau của hai phương sai của hai biến ngẫu nhiên phân phối chuẩn Kiểm định giả thuyết về sự bằng nhau của hai kỳ vọng toán của hai biến ngẫu nhiên phân phối A(p) Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Giả sử X ∼ N(µ, σ2). Nếu chưa biết µ, song có thể cho rằng giá trị của nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0. Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1, X2,. . . , Xn). Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau: Trường hợp đã biết phương sai σ2 Trường hợp chưa biết phương sai σ2 Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Giả sử X ∼ N(µ, σ2). Nếu chưa biết µ, song có thể cho rằng giá trị của nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0. Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1, X2,. . . , Xn). Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau: Trường hợp đã biết phương sai σ2 Trường hợp chưa biết phương sai σ2 Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối chuẩn Giả sử X ∼ N(µ, σ2). Nếu chưa biết µ, song có thể cho rằng giá trị của nó bằng µ0 thì đưa ra giả thuyết thống kê H0: µ = µ0. Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1, X2,. . . , Xn). Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau: Trường hợp đã biết phương sai σ2 Trường hợp chưa biết phương sai σ2 Trường hợp đã biết phương sai σ2 Chọn tiêu chuẩn kiểm định G = U = (X¯ − µ0) √ n σ Nếu H0 đúng thì U ∼ N(0; 1). Các miền bác bỏ tốt nhất Wα được xác định như sau: a. H0: µ = µ0; H1: µ > µ0: Với mức ý nghĩa α cho trước tìm được giá trị tới hạn uα sao cho P(U>uα) = α, ta thu được miền bác bỏ bên phải. Wα = { U = ( X¯ − µ0 )√ n σ ; U > uα } Trường hợp đã biết phương sai σ2 Chọn tiêu chuẩn kiểm định G = U = (X¯ − µ0) √ n σ Nếu H0 đúng thì U ∼ N(0; 1). Các miền bác bỏ tốt nhất Wα được xác định như sau: a. H0: µ = µ0; H1: µ > µ0: Với mức ý nghĩa α cho trước tìm được giá trị tới hạn uα sao cho P(U>uα) = α, ta thu được miền bác bỏ bên phải. Wα = { U = ( X¯ − µ0 )√ n σ ; U > uα } Trường hợp đã biết phương sai σ2 b. H0: µ = µ0 ; H1: µ < µ0: Với α, tìm được u1−α sao cho P(U<u1−α) = P(U < -uα) = α ta thu được miền bác bỏ bên trái: Wα = { U = ( X¯ − µ0 )√ n σ ; U < −uα } c. H0: µ = µ0; H1: µ 6= µ0: Với α, tìm được u1−α/2 và uα/2 sao cho: P(U uα/2) = P(U uα/2) = P(|U| > uα/2) = α Ta thu được miền bác bỏ hai phía: Wα = { U = ( X¯ − µ0 )√ n σ ; |U| > uα/2 } Trường hợp đã biết phương sai σ2 b. H0: µ = µ0 ; H1: µ < µ0: Với α, tìm được u1−α sao cho P(U<u1−α) = P(U < -uα) = α ta thu được miền bác bỏ bên trái: Wα = { U = ( X¯ − µ0 )√ n σ ; U < −uα } c. H0: µ = µ0; H1: µ 6= µ0: Với α, tìm được u1−α/2 và uα/2 sao cho: P(U uα/2) = P(U uα/2) = P(|U| > uα/2) = α Ta thu được miền bác bỏ hai phía: Wα = { U = ( X¯ − µ0 )√ n σ ; |U| > uα/2 } Trường hợp đã biết phương sai σ2 Với mẫu cụ thể w = (x1, x2,. . . , xn) ta tính giá trị quan sát tiêu chuẩn kiểm định. Uqs = (x¯ − µ0) √ n σ và so sánh với Wα để kết luận: - Nếu Uqs ∈Wα: Bác bỏ H0, thừa nhận H1 - Nếu Uqs /∈Wα: Chưa có cơ sở để bác bỏ H0. Trường hợp đã biết phương sai σ2 Ví dụ Trọng lượng mỗi gói sản phẩm do một nhà máy sản xuất là biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn 36g và trọng lượng trung bình 453g. Kiểm tra ngẫu nhiên 81 gói sản phẩm đó thấy trọng lượng trung bình là 448g. Với mức ý nghĩa 0,05 có thể kết luận các gói sản phẩm bị đóng thiếu hay không. Giải X: Trọng lượng đóng gói sản phẩm X ∼ N (µ, σ2 = 362) Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu nhiên phân phối chuẩn khi đã biết phương sai tổng thể. Trường hợp đã biết phương sai σ2 Ví dụ Trọng lượng mỗi gói sản phẩm do một nhà máy sản xuất là biến ngẫu nhiên phân phối chuẩn với độ lệch chuẩn 36g và trọng lượng trung bình 453g. Kiểm tra ngẫu nhiên 81 gói sản phẩm đó thấy trọng lượng trung bình là 448g. Với mức ý nghĩa 0,05 có thể kết luận các gói sản phẩm bị đóng thiếu hay không. Giải X: Trọng lượng đóng gói sản phẩm X ∼ N (µ, σ2 = 362) Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu nhiên phân phối chuẩn khi đã biết phương sai tổng thể. Trường hợp đã biết phương sai σ2 Ví dụ Cặp giả thuyết kiểm định là: H0: µ = 453; H1: µ < 453 Miền bác bỏ là: Wα = { U = ( X¯ − µ0 )√ n σ ; U < −uα } Tính toán: α = 0,05 ⇒ uα = u0,05 = 1,65 ⇒ Wα = (-∞; -1,65) Trường hợp đã biết phương sai σ2 Ví dụ Cặp giả thuyết kiểm định là: H0: µ = 453; H1: µ < 453 Miền bác bỏ là: Wα = { U = ( X¯ − µ0 )√ n σ ; U < −uα } Tính toán: α = 0,05 ⇒ uα = u0,05 = 1,65 ⇒ Wα = (-∞; -1,65) Trường hợp đã biết phương sai σ2 Ví dụ Từ mẫu cụ thể: x¯ = 448 ⇒ Uqs = (448− 453) √ 81 36 = −1, 25 /∈Wα Kết luận: Với mức ý nghĩa 0,05, từ mẫu cụ thể đã cho chưa có cơ sở để bác bỏ H0, tức là chưa thể nói sản phẩm bị đóng thiếu. Trường hợp chưa biết phương sai σ2 Chọn G = T = ( X¯ − µ0 )√ n S Nếu H0 đúng thì T ∼ T(n-1). Các miền bác bỏ mức α có dạng: a. H0: µ = µ0; H1: µ > µ0 Wα = { T = ( X¯ − µ0 )√ n S ; T > t(n−1)α } Trường hợp chưa biết phương sai σ2 Chọn G = T = ( X¯ − µ0 )√ n S Nếu H0 đúng thì T ∼ T(n-1). Các miền bác bỏ mức α có dạng: a. H0: µ = µ0; H1: µ > µ0 Wα = { T = ( X¯ − µ0 )√ n S ; T > t(n−1)α } Trường hợp chưa biết phương sai σ2 b. H0: µ = µ0; H1: µ < µ0 Wα = { T = ( X¯ − µ0 )√ n S ; T < −t(n−1)α } c. H0: µ = µ0; H1: µ 6= µ0 Wα = { T = ( X¯ − µ0 )√ n S ; |T | > t(n−1)α/2 } Trường hợp chưa biết phương sai σ2 Ví dụ Thu hoạch thử 41 ruộng lúa tính được năng suất trung bình 39,5 tạ/ha và độ lệch chuẩn mẫu 1,2 tạ/ha. Trước đây giống lúa này cho năng suất 39 tạ/ha. Với mức ý nghĩa 0,05 có thể cho rằng năng suất lúa đã tăng lên biết rằng năng suất lúa tuân theo quy luật chuẩn. Giải Gọi X là năng suất lúa. X ∼ N(µ, σ2). Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu nhiên phân phối chuẩn khi chưa biết phương sai tổng thể. Cặp giả thuyết kiểm định là: H0: µ = µ0 = 39; H1: µ > µ0 Trường hợp chưa biết phương sai σ2 Ví dụ Thu hoạch thử 41 ruộng lúa tính được năng suất trung bình 39,5 tạ/ha và độ lệch chuẩn mẫu 1,2 tạ/ha. Trước đây giống lúa này cho năng suất 39 tạ/ha. Với mức ý nghĩa 0,05 có thể cho rằng năng suất lúa đã tăng lên biết rằng năng suất lúa tuân theo quy luật chuẩn. Giải Gọi X là năng suất lúa. X ∼ N(µ, σ2). Đây là bài toán kiểm định giả thuyết về tham số µ của biến ngẫu nhiên phân phối chuẩn khi chưa biết phương sai tổng thể. Cặp giả thuyết kiểm định là: H0: µ = µ0 = 39; H1: µ > µ0 Trường hợp chưa biết phương sai σ2 Ví dụ Miền bác bỏ Wα = { T = ( X¯ − µ0 )√ n S ;T > t(n−1)α } α = 0,05; n = 41 ⇒ t(40)0,05 = 1, 684 ⇒ Wα = (1, 684; +∞) Từ mẫu cụ thể có x¯ = 39, 5; s = 1, 2 Tqs = (39, 5− 39)√41 1, 2 = 2, 667 ∈ Wα Kết luận: Với mức ý nghĩa 0,05, từ mẫu cụ thể đã cho, bác bỏ H0, thừa nhận H1, tức năng suất lúa trung bình đã tăng lên. Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Giả sử trong tổng thể, biến ngẫu nhiên gốc X phân phối N(µ, σ2) với σ2 chưa biết song có cơ sở để giả thiết rằng giá trị của nó bằng σ20. Người ta đưa ra giả thuyết: H0: σ 2 = σ20 Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1, X2,. . . , Xn) và chọn tiêu chuẩn kiểm định: G = χ2 = (n − 1)S2 σ20 Nếu H0 đúng thì χ 2 ∼χ2(n-1). Do đó với mức ý nghĩa α cho trước, tùy thuộc vào giả thuyết H1, miền bác bỏ Wα được xây dựng như sau: Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Giả sử trong tổng thể, biến ngẫu nhiên gốc X phân phối N(µ, σ2) với σ2 chưa biết song có cơ sở để giả thiết rằng giá trị của nó bằng σ20. Người ta đưa ra giả thuyết: H0: σ 2 = σ20 Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1, X2,. . . , Xn) và chọn tiêu chuẩn kiểm định: G = χ2 = (n − 1)S2 σ20 Nếu H0 đúng thì χ 2 ∼χ2(n-1). Do đó với mức ý nghĩa α cho trước, tùy thuộc vào giả thuyết H1, miền bác bỏ Wα được xây dựng như sau: Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn a. H0 : σ 2= σ20; H1: σ 2 > σ20. Wα = { χ2 = (n − 1)S2 σ20 ; χ2 > χ2(n−1)α } b. H0 : σ 2 = σ20; H1: σ 2 < σ20. Wα = { χ2 = (n − 1)S2 σ20 ;χ2 < χ 2(n−1) 1−α } c. H0 : σ 2 = σ20; H1: σ 2 6= σ20. Wα = { χ2 = (n − 1)S2 σ20 ;χ2 < χ 2(n−1) 1−α/2 ; χ 2 > χ 2(n−1) α/2 } Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Ví dụ Để kiểm tra độ chính xác của một máy người ta đo ngẫu nhiên kích thước của 15 chi tiết do máy đó sản xuất và tính được s2 = 14,6. Với mức ý nghĩa α= 0,01 hãy kết luận máy đó có hoạt động bình thường không, biết rằng kích thước chi tiết là biến ngẫu nhiên phân phối chuẩn có dung sai theo thiết kế là σ2 = 12. Giải X: kích thước chi tiết. X ∼ N(µ; σ2). Đây là bài toán kiểm định giả thuyết thống kê về tham số σ2 của biến ngẫu nhiên phân phối chuẩn. Cặp giả thuyết cần kiểm định là: H0 : σ 2 = σ20 = 12; H1 : σ 2 > 12 Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Ví dụ Để kiểm tra độ chính xác của một máy người ta đo ngẫu nhiên kích thước của 15 chi tiết do máy đó sản xuất và tính được s2 = 14,6. Với mức ý nghĩa α= 0,01 hãy kết luận máy đó có hoạt động bình thường không, biết rằng kích thước chi tiết là biến ngẫu nhiên phân phối chuẩn có dung sai theo thiết kế là σ2 = 12. Giải X: kích thước chi tiết. X ∼ N(µ; σ2). Đây là bài toán kiểm định giả thuyết thống kê về tham số σ2 của biến ngẫu nhiên phân phối chuẩn. Cặp giả thuyết cần kiểm định là: H0 : σ 2 = σ20 = 12; H1 : σ 2 > 12 Kiểm định giả thuyết về phương sai biến ngẫu nhiên phân phối chuẩn Ví dụ α = 0,01 ⇒ χ2(14)0,01 = 29, 14. Miền bác bỏ có dạng Wα = { χ2 = (n − 1)S2 σ20 ; χ2 > χ2(n−1)α } = (29, 14; +∞). Với mẫu cụ thể đã cho, ta có giá trị quan sát tiêu chuẩn kiểm định là: χ2qs = 14.14, 6 12 = 17, 033 /∈ (29, 14; +∞) . Vậy chưa có cơ sở để bác bỏ H0, hay có thể nói máy móc vẫn làm việc bình thường. Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Giả sử trong tổng thể biến ngẫu nhiên X phân phối A(p). Nếu chưa biết p, song có thể cho rằng giá trị của nó bằng p0 thì đưa ra giả thuyết thống kê: H0 : p = p0 Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1, X2, . . . , Xn) Chọn tiêu chuẩn kiểm định: G = U = (f − p0) √ n√ p0(1− p0) Nếu H0 đúng thì U ∼ N(0; 1). Do đó với mức ý nghĩa α cho trước, các miền bác bỏ Wα có dạng: Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Giả sử trong tổng thể biến ngẫu nhiên X phân phối A(p). Nếu chưa biết p, song có thể cho rằng giá trị của nó bằng p0 thì đưa ra giả thuyết thống kê: H0 : p = p0 Để kiểm định giả thuyết trên, từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1, X2, . . . , Xn) Chọn tiêu chuẩn kiểm định: G = U = (f − p0) √ n√ p0(1− p0) Nếu H0 đúng thì U ∼ N(0; 1). Do đó với mức ý nghĩa α cho trước, các miền bác bỏ Wα có dạng: Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) a. H0: p = p0; H1: p < p0 Wα = { U = (f − p0) √ n√ p0(1− p0) ; U < −uα } b. H0: p = p0; H1: p > p0 Wα = { U = (f − p0) √ n√ p0(1− p0) ; U > uα } c. H0: p = p0; H1: p 6= p0 Wα = { U = (f − p0) √ n√ p0(1− p0) ; |U| > uα/2 } Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Ví dụ Thống kê 10000 trẻ sơ sinh ở một địa phương, người ta thấy 5080 bé trai. Hỏi tỷ lệ sinh con trai có thực sự cao hơn tỷ lệ sinh con gái không? Cho kết luận với mức ý nghĩa 0,01. Giải X: Số con trai. X ∼ A(p) Cặp giả thuyết cần kiểm định: H0: p = p0 = 0,5; H1: p > p0 Miền bác bỏ tiêu chuẩn kiểm định có dạng: Wα = { (f − p0) √ n√ p0(1− p0) ;U > uα } = (2, 23; +∞) Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Ví dụ Thống kê 10000 trẻ sơ sinh ở một địa phương, người ta thấy 5080 bé trai. Hỏi tỷ lệ sinh con trai có thực sự cao hơn tỷ lệ sinh con gái không? Cho kết luận với mức ý nghĩa 0,01. Giải X: Số con trai. X ∼ A(p) Cặp giả thuyết cần kiểm định: H0: p = p0 = 0,5; H1: p > p0 Miền bác bỏ tiêu chuẩn kiểm định có dạng: Wα = { (f − p0) √ n√ p0(1− p0) ;U > uα } = (2, 23; +∞) Kiểm định giả thuyết về kỳ vọng toán của biến ngẫu nhiên phân phối A(p) Ví dụ Từ mẫu cụ thể, ta có: f = 5080 10000 = 0, 508 ; n = 10000 Uqs = (0, 508− 0, 5)√10000√ 0, 5.0, 5 ≈ 1, 6 /∈ (2, 33; +∞) Vậy chưa có cơ sở để bác bỏ H0, tức là chưa có cơ sở cho rằng tỷ lệ sinh con trai thực sự cao hơn tỷ lệ sinh con gái. Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán của hai biến ngẫu nhiên phân phối chuẩn Giả sử có hai tổng thể nghiên cứu, trong đó các biến ngẫu nhiễn X1 và X2 phân phối chuẩn: X1 ∼ N(µ1 , σ21);X2 ∼ N(µ2, σ22). Nếu chưa biết µ1 và µ2 song có thể cho rằng chúng bằng nhau thì đưa ra giả thuyết thống kê: H0: µ1 = µ2. Để kiểm định giả thuyết trên, từ hai tổng thể, lập hai mẫu độc lập kích thước n1, n2 W1 = (X11,X12, ...X1n1)W2 = (X21,X22, ...X2n2) Để chọn tiêu chuẩn kiểm định thích hợp, xét các trường hợp sau : Trường hợp đã biết các phương sai tổng thể σ21, σ 2 2 Trường hợp chưa biết các phương sai tổng thể σ21, σ 2 2 Kiểm định giả thuyết về sự bằng nhau của hai kì vọng toán của hai biến ngẫu nhiên phân phối chuẩn

Các file đính kèm theo tài liệu này:

  • pdfbai_giang_ly_thuyet_xac_suat_va_thong_ke_toan_chuong_8_kiem.pdf