Bài giảng Lý thuyết sác xuất và thống kê - Chương 8: Kiểm định giả thiết thống kê

1- Giả thiết thống kờ:Chương 8 KIỂM ĐỊNH GIẢ THIẾT THỐNG Kấ I- CÁC KHÁI NIỆMViệc tỡm ra kết luận bỏc bỏ hay chấp nhận một giả thiết gọi làứ kiểm định giả thiết thống kờ. Giả thiết thống kờ là những giả thiết núi về cỏc tham số, phõn phối xỏc suất, tớnh đục lập. . . của cỏc đại lượng ngẫu nhiờn. Thớ dụ: Trong một bỏo cỏo núi rằng: năng suất lỳa trung bỡnh của tỉnh Y năm 2013 là 6,8 tấn/ha thỡ cú thể coi đú là một giả thiết thống kờ, giả thiết này núi về một tham số (kỳ vọng toỏn) của đ.l.n.n biểu

ppt97 trang | Chia sẻ: huongnhu95 | Lượt xem: 535 | Lượt tải: 0download
Tóm tắt tài liệu Bài giảng Lý thuyết sác xuất và thống kê - Chương 8: Kiểm định giả thiết thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
thị năng suất lúa của tỉnh này. Dựa vào số liệu của một mẫu điều tra về năng suất lúa của tỉnh này và qui tắc kiểm định để đưa ra một kết luận là bác bỏ hay chấp nhận giả thiết trên.Khi đặt giả thiết thống kê cần lưu ý: Giả thiết đặt ra sao cho khi chấp nhận hoặc bác bỏ nó sẽ có tác dụng trả lời được câu hỏi mà bài toán thực tế đặt ra. Giả thiết đặt ra thường mang nghĩa :”không khác nhau”, hoặc “khác mà không có ý nghĩa” hoặc “bằng nhau”.Giả thiết đặt ra như vậy gọi là giả thiết cần kiểm định. (Hay giả thiết không - null hypothesis). ký hiệu là H0 . Một mệnh đề đối lập với H0 gọi là giả thiết đối và được ký hiệu là H1 Chẳng hạn: H0:  = 0; H1:   0( là tham số của đ.l.n.n; 0 là giá trị đã biết). Nếu kiểm định giả thiết với giả thiết đối có dạng như trên được gọi là kiểm định giả thiết hai phía. (Vì miền bác bỏ nằm về hai phía của miền chấp nhận)Giả thiết đối dạng:   0 thường được áp dụng khi ta chưa biết rõ trong thực tế  > 0 hay  0 thì ta có thể đặt giả thiết đối dạng:  > 0. Hoặc ta biết được chiều hướng là  0; hoặc H1:  0 thì được gọi là kiểm định giả thiết về phía bên phải (vì miền bác bỏ nằm về phía bên phải của miền chấp nhận). Nếu giả thiết đối có dạng H1:  z/2 Trong đó z/2 là giá trị của Z. Z  N(0, 1) thoả mãn: z/2 > 0 P( Z > z/2 ) =  Trên đồ thị, miền bác bỏ W được minh họa như sau:Để xác định z/2 ta tra bảng hàm Laplace ở phần phụ lục hoặc dùng hàm NORMSINV trong Excel Như vậy xác suất để giá trị của Z rơi vào miền bác bỏ là , tức xác suất để Z rơi vào miền chấp nhận sẽ là 1. Vì  nhỏ, nên xác suất để Z rơi vào miền chấp nhận sẽ lớn. Nghĩa là: nếu giả thiết H0 đúng thì có thể coi rằng hầu hết các giá trị của Z sẽ rơi vào miền chấp nhận. Còn nếu giá trị của Z rơi vào miền bác bỏ có nghĩa là ta đã tìm được “bằng chứng” để chứng tỏ giả thiết H0 là không đúng và vì thế ta bác bỏ giả thiết đó.Từ đó ta có qui tắc quyết định khi tiến hành kiểm định giả thiết H0 trong trường hợp này như sau: Lấy mẫu kích thước n, từ mẫu cụ thể này tính: z =  Với mức ý nghĩa  cho trước , xác định z/2 Nếu z > z/2 thì bác bỏ giả thiết H0, chấp nhận H1. Nếu z  z/2 thì có thể chấp nhận giả thiết H0. Từ việc chấp nhận (hay bác bỏ) H0 ta suy ra kết luận cuối cùng theo yêu cầu của bài toán thực tế.2- Trường hợp n  30 ; 2 chưa biết Chọn: Z = làm tiêu chuẩn kiểm định.Nếu H0 đúng thì Z  N(0, 1), do đó miền bác bỏ giả thiết H0 và qui tắc quyết định trong trường hợp này giốngï như trường hợp 1. Chỉ khác là giá trị z được tính theo công thức: 3- Trường hợp n t/2 Trong đó t/2 là giá trị của T. T  T(n-1) thoả mãn: t/2 > 0 và P(T > t/2 ) =  t/2 được xác định bằng cách tra bảng phân phối Student với bậc tự do n1 hoặc dùng hàm TINV trong Excel. Từ đó ta có qui tắc quyết định khi tiến hành kiểm định giả thiết H0 trong trường hợp này như sau: Lấy mẫu kích thước n, từ mẫu cụ thể này tính: t =  Với mức ý nghĩa  cho trước , xác định t/2 Nếu t > t/2 , thì bác bỏ giả thiết H0, chấp nhận H1. Nếu t  t/2 , thì có thể chấp nhận giả thiết H0. Từ việc chấp nhận (hay bác bỏ) H0 ta suy ra kết luận cuối cùng theo yêu cầu của bài toán thực tế.Chú ý: Trường hợp bác bỏ giả thiết H0.* Nếu x m0 thì có thể kết luận  > m0Nếu kiểm định giả thiết: H0:  = m0; H1:  > m0Thì qui tắc kiểm định ở bước 2 và 3 thay đổi như sau: Dùng z thay cho z/2 Nếu z > z thì bác bỏ H0 Nếu z  z thì có thể chấp nhận H0Nếu kiểm định giả thiết: H0:  = m0; H1:  -z thì có thể chấp nhận H0Thí dụ: Trọng lượng của các bao gạo do một máy đóng bao sản xuất là đại lượng ngẫu nhiên có phân phối chuẩn với trọng lượng trung bình theo qui định là 50 kg. Để xem máy đóng bao làm việc có bình thường không người ta cân thử 50 bao và tính được:x = 49,72 kg; s = 0,5 kg. Với mức ý nghĩa  = 1%, hãy cho kết luận về tình hình làm việc của máy đóng bao đó?Giải: Gọi  là trọng lượng trung bình thực tế của những bao gạo do máy sản xuất ( chưa biết). Đặt giả thiết: H0:  = 50 ; H1:  30 ; 2 chưa biết. z = =  3,96Với mức ý nghĩa  = 1%, thì: z = z0,01 = 2,326Vì z = -3,96 z/2 thì ta bác bỏ H0. Nếu  z   z/2 thì ta có thể chấp nhận H0. Từ việc chấp nhận (hay bác bỏ) H0 ta suy ra kết luận cuối cùng theo yêu cầu của bài toán thực tế.Chú ý: Trường hợp bác bỏ giả thiết H0.Nếu f p0 thì có thể kết luận p > p0Nếu kiểm định giả thiết: H0: p = p0; H1: p > p0Thì qui tắc kiểm định ở bước 2 và 3 thay đổi như sau: Dùng z thay cho z/2 Nếu z > z thì bác bỏ H0 Nếu z  z thì có thể chấp nhận H0Nếu kiểm định giả thiết: H0: p = p0; H1: p -z thì có thể chấp nhận H0Thí dụ: Tỷ lệ phế phẩm của một nhà máy trước đây là 5%. Sau khi tiến hành một cải tiến kỹ thuật, người ta kiểm tra 400 sản phẩm thì thấy có 16 phế phẩm. Với mức ý nghĩa  = 2%, hãy kết luận xem việc cải tiến kỹ thuật có làm giảm tỷ lệ phế phẩm hay không ?Giải: Gọi p là tỷ lệ phế phẩm của nhà máy sau khi cải tiến kỹ thuật. Ta cần kiểm định giả thiết H0: p = 0,05 ; H1: p -2,054, tức z  W nên ta có thể chấp nhận giả thiết H0. Tức biện pháp kỹ thuật chưa có tác dụng làm giảm tỷ lệ phế phẩm của nhà máy.IV- KIỂM ĐỊNH GIẢ THIẾT VỀ PHÂN PHỐI XÁC SUẤT CỦA ĐẠI LƯỢNG NGẪU NHIÊNGiả sử chưa biết phân phối xác suất của đại lượng ngẫu nhiên X, ta cần kiểm định giả thiết:H0: X có phân phối xác suất nào đó.H1: X không có phân phối xác suất nói trên.Ký hiệu: Pi = P(X = xi) hoặc Pi = P(xi  X  xi+1) Thực hiện n phép thử độc lập đối với đ.l.n.n X. Tần số lý thuyết của biến cố (X = xi) sẽ là nPi. Tần số thực tế là ni. Hiệu (ni  nPi)2 có thể dùng làm cơ sở để xét xem phân phối xác suất của X có phải như giả thiết H0 đã nêu ra hay không.K. Pearson đã chọn thống kê: 2 = làm tiêu chuẩn kiểm định.Với n khá lớn có thể coi 2 có phân phối “Chi bình phương” với (k r 1) bậc tự do. Trong đó r là số các tham số chưa biết đối với phân phối xác suất của X theo H0. Miền bác bỏ giả thiết H0 với mức ý nghĩa  là: W = Trong đó 2 là giá trị của đại lượng ngẫu nhiên 2 với (k r 1) bậc tự do thoả mãn điều kiện: P =  Ta có thể minh họa miền bác bỏ W như sau:2 miền bác bỏ miền chấp nhận + 0 Qui tắc quyết định:+ Lấy mẫu kích thước n, từ mẫu này ta có được các giá trị quan sát xi (i = 1, 2, . . . , k) hoặc các khoảng (xi; xi+1).Theo giả thiết H0, ta tính Pi = P(X = xi) hoặc Pi = P( xi thì bác bỏ H0+ Nếu 2  thì có thể chấp nhận H0 Từ việc chấp nhận (hay bác bỏ H0) ta suy ra kết luận cuối cùng mà bài toán thực tế yêu cầu.Thí dụ: Sản phẩm được sản xuất ra trên một dây chuyền tự động được đóng gói một cách ngẫu nhiên theo qui cách: 3 sản phẩm/hộp. Tiến hành kiểm tra 200 hộp ta được kết quả:Với mức ý nghĩa 5%, có thể xem số sản phẩm loại I có trong một hộp là đại lượng ngẫu nhiên có phân phối nhị thức hay không?p chưa biết. p được ước lượng là: (50 + 201 + 1252 + 50 3)/600 = 0,7Giải: Gọi X là số sản phẩm loại I có trong một hộp. Ta cần KĐ giả thiết: H0: X  B(3, p) Để tính 2 ta lập bảng tính như sau:2 = 28,81 > 20,05 (2) = 5,99. Bác bỏ giả thiết H0. X không có phân phối nhị thức.Đọc bài tập: 8.14Giả sử quan sát đồng thời hai dấu hiệu A và B trên cùng một phần tử. V- KIỂM ĐỊNH GIẢ THIẾT VỀ TÍNH ĐỘC LẬP CỦA HAI DẤU HIỆUDấu hiệu A có các dấu hiệu thành phần là: A1, A2, . . . , AhDấu hiệu B có các dấu hiệu thành phần là: B1, B2, . . . , BkCần kiểm định giả thiết:H0: A và B độc lập. H1: A và B không độc lập. Lấy mẫu kích thước n và trình bày kết quả quan sát dưới dạng bảng sau: B AB1B2. . . BkToångA1n11n12. . . n1kn1A2n21n22. . . n2kn2. . . . . . . . . . . . . . . . . . Ahnh1nh2. . . n1knhToångm1m2. . . mknTrong đó:ni (i =1, 2, . . . ,h) là tổng số phần tử mang dấu hiệu thành phần Ai.mj (j = 1, 2, . . . , k) là tổng số phần tử mang dấu hiệu thành phần Bjnij (i = 1,...,h; j =1,,k) là tổng số phần tử mang dấu hiệu thành phần Ai và Bj.Gọi Ci là biến cố chọn được phần tử mang dấu hiệu AiDj là biến cố chọn được phần tử mang dấu hiệu BjKhi n khá lớn, theo định nghĩa thống kê về xác suất ta có:Nếu H0 đúng, tức A, B độc lập thì các dấu hiệu Ai, Bj cũng độc lập. Do đó: P(CiDj) = P(Ci)P(Dj) Tức là: Qui tắc quyết định:+ Lấy mẫu kích thước n, từ mẫu này tính:2+ Với mức ý nghĩa  đã cho, tra bảng 2 với bậc tự do (k-1)(h-1) để tìm(hoặc dùng hàm CHIINV trong Excel). + Nếu 2 > thì bác bỏ H0, thừa nhận H1+ Nếu 2  thì có thể chấp nhận H0Thí dụ: Một công ty đã tiến hành khảo sát về sở thích của khách hàng về 3 loại mẫu khác nhau của cùng một loại hàng. Kết quả khảo sát cho ở bảng sau:Với mức ý nghĩa  = 0,05, hãy kết luận mẫu hàng có ảnh hưởng đến ý thích của khách hàng hay không.Giải: H0: Mẫu hàng (dấu hiệu A) độc lập (không ảnh hưởng) đến ý thích của khách hàng (dấu hiệu B).H1: Mẫu hàng không độc lập (có ảnh hưởng) đến ý thích của khách hàng.Toång 115 127 58 Toång100100100 300= 300(1,025353-1) = 7,6059Với  = 5%, tra bảng 2 với bậc tự do: (3  1)(3  1) = 4 = 9,488 Vì 2 = 7,6059 < 9,488 nên ta chấp nhận giả thiết H0 tức mẫu hàng không ảnh hưởng đến ý thích của khách hàng. Tổng kết chương 8 GT thống kêKĐGT về KĐGT về p . . . KĐGT về PPXSKĐGT về sự đ.lập của 2 dấu hiệuK/niệmCách đặt GTTKKiểm địnhtham sốKiểm định phith.sốCơ sở LTCơ sở LTQui tắc q/địnhQui tắc q/địnhKết luận Bài tập: 8.4; 8.5; 8.21; 8.23; 8.25; 8.26; 8.27; 8.28.Hết chương 8

Các file đính kèm theo tài liệu này:

  • pptbai_giang_ly_thuyet_sac_xuat_va_thong_ke_chuong_8_kiem_dinh.ppt