Chương 2
Ước lượng và kiểm ủịnh giả thiết
Kiểm ủịnh giả thiết là một bài toỏn hay gặp trong thống kờ. Phạm vi nghiờn cứu khỏ rộng và
về mặt lý thuyết cú những vấn ủề khỏ phức tạp nếu muốn giải quyết thật tỷ mỷ, chớnh xỏc.
Trong chương này chỉ trỡnh bầy một vài bài toỏn kiểm ủịnh giả thiết cụ thể liờn quan ủến cỏc
biến ủịnh lượng. Chương sau sẽ tiếp tục kiểm ủịnh giả thiết với biến ủịnh tớnh. Nhưng trước
hết cần giới thiệu chung về giả thiết và ủối thiết và hai loại sai lầm mắc phải k
15 trang |
Chia sẻ: huongnhu95 | Lượt xem: 430 | Lượt tải: 0
Tóm tắt tài liệu Bài giảng Thiết kế thí nghiệm - Chương 2: Ước lượng và kiểm định giả thiết, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hi kiểm định.
2.1. Giả thiết và đối thiết
Khi khảo sát một tổng thể (hoặc nhiều tổng thể) và xem xét một (hoặc nhiều) biến ngẫu nhiên
cĩ thể đưa ra một giả thiết nào đĩ liên quan đến phân phối của biến ngẫu nhiên hoặc nếu biết
phân phối rồi thì đưa ra giả thiết về tham số của tổng thể. ðể cĩ thể đưa ra một kết luận thống
kê nào đĩ đối với giả thiết thì phải chọn mẫu ngẫu nhiên, tính tham số mẫu, chọn mức ý nghĩa
α sau đĩ đưa ra kết luận.
Bài tốn kiểm định tham số Θ của phân phối cĩ dạng H0 : Θ = Θo với Θo là một số đã cho nào
đĩ. Kết luận thống kê cĩ dạng: “chấp nhận H0” hay “bác bỏ H0”. Nhưng nếu đặt vấn đề như
vậy thì cách giải quyết hết sức khĩ, vì nếu khơng chấp nhận H0 : Θ = Θo thì điều đĩ cĩ nghĩa
là cĩ thể chấp nhận một trong vơ số Θ khác Θo, do đĩ thường đưa ra bài tốn dưới dạng cụ
thể hơn nữa: cho giả thiết H0 và đối thiết H1, khi kết luận thì hoặc chấp nhận H0 hoặc bác bỏ
H0, và trong trường hợp này, tuy khơng hồn tồn tương đương, nhưng coi như chấp nhận đối
thiết H1.
Nếu chấp nhận H0 trong lúc giả thiết đúng là H1 thì mắc sai lầm loại II và xác suất mắc sai
lầm này được gọi là rủi ro loại hai β. Ngược lại nếu bác bỏ H0 trong lúc giả thiết đúng chính
là H0 thì mắc sai lầm loại I và xác suất mắc sai lầm đĩ gọi là rủi ro loại một α.
Quyết định
Giả thiết Bác bỏ H0 Chấp nhận H0
H0 đúng Sai lầm loại I (α) Quyết định đúng
H0 sai Quyết định đúng Sai lầm loại II (β)
Như vậy trong bài tốn kiểm định giả thiết luơn luơn cĩ hai loại rủi ro, loại I và loại II, tuỳ
vấn đề mà nhấn mạnh loại rủi ro nào. Thơng thường người ta hay tập trung chú ý vào sai lầm
loại I và khi kiểm định phải khống chế sao cho rủi ro loại I khơng vượt quá một mức α gọi là
mức ý nghĩa.
Chương 2 Ước lượng và kiểm định giả thiết
19
Trước hết xem xét cụ thể bài tốn kiểm định giả thiết H0: Θ = Θo, đối thiết H1: Θ = Θ1 với Θ1
là một giá trị khác Θo. ðây là bài tốn kiểm định giả thiết đơn. Quy tắc kiểm định căn cứ vào
hai giá trị cụ thể Θ1 và Θo, vào mức ý nghĩa α và cịn căn cứ vào cả sai lầm loại hai. Việc này
về lý thuyết thống kê khơng gặp khĩ khăn gì.
Sau đĩ mở rộng quy tắc sang cho bài tốn kiểm định giả thiết kép. H1: Θ≠Θo; Θ > Θo hoặc
Θ < Θo, việc mở rộng này cĩ khĩ khăn nhưng các nhà nghiên cứu lý thuyết xác suất thống kê
đã giải quyết được, do đĩ về sau khi kiểm định giả thiết H0 : Θ = Θo cĩ thể chọn một trong 3
đối thiết H1 sau:
H1 : Θ ≠ Θo gọi là đối thiết hai phía
H1 : Θ > Θo gọi là đối thiết phải
H1 : Θ < Θo gọi là đối thiết trái
Hai đối thiết sau gọi là đối thiết một phía. Việc chọn đối thiết nào tuỳ thuộc vấn đề khảo sát
cụ thể. Trong phạm vi tài liệu này đề cập chủ yếu đến đối thiết hai phía hay cịn gọi là hai
đuơi.
2.2. Ước lượng giá trị trung bình µ của biến phân phối chuẩn N(µ, σ2).
2.2.1. Ước lượng µ khi biết phương sai σ2
Dựa vào lý thuyết xác suất cĩ thể đưa ra ước lượng giá trị trung bình quần thể (µ) theo các
bước sau đây:
+ Chọn mẫu dung lượng n, tính trung bình cộng x
+ Ở mức tin cậy P đã cho lấy α = 1- P, sau đĩ tìm giá trị tới hạn z(α/2) trong bảng 1 (hàm Φ(z)
tìm z sao cho Φ(z) = 1 - α/2 )
+ Khoảng tin cậy đối xứng ở mức tin cậy P:
n
zx
n
zx
σ
αµσα )2/()2/( +≤≤−
Ví dụ 2.1: Khối lượng bao thức ăn gia súc phân phối chuẩn N(µ,σ2) với σ = 1,5kg. Cân thử
25 bao được khối lượng trung bình x = 49kg. Hãy ước lượng kỳ vọng µ với mức tin cậy P =
0,95; z (0,025) = 1,96
25
5,196,149
25
5,196,149 +≤≤− µ
49 - 0,588 ≤ µ ≤ 49 + 0,588
48,41kg ≤ µ ≤ 49,59kg
Thiết kế thí nghiệm 20
2.2.2. Ước lượng µ khi khơng biết phương sai σ2
Dựa vào phân phối Student cĩ thể đưa ra ước lượng µ theo các bước sau đây:
+ Chọn mẫu dung lượng n, tính trung bình cộng
_
x và độ lệch chuẩn s.
+ Ở mức tin cậy P lấy α = 1- P, tìm giá trị tới hạn t(α/2, n-1) trong bảng 2, cột α/2, dịng n-1
+ Khoảng tin cậy đối xứng ở mức tin cậy P:
n
s
ntx
n
s
ntx )1,2/()1,2/( −+≤≤−− αµα
Ví dụ 2.2: Cân 22 con gà được khối lượng trung bình x = 3,03kg; s = 0,0279 kg. Hãy ước
lượng µ với mức tin cậy P = 0,98; α = 1- P = 0,02; α/2 = 0,01 t(0,01;21) = 2,518
22
0279,0518,203,3
22
0279,0518,203,3 +≤≤− µ
3,03 - 0,089 ≤ µ ≤ 3,03 + 0,089
2,94kg ≤ µ ≤ 3,12 kg
2.3. Kiểm định giá trị trung bình µ của biến phân phối chuẩn N(µ, σ2).
2.3.1. Kiểm định giả thiết H0: µ = µ0 khi biết σ2
Tiến hành kiểm định theo các các bước sau:
+ Chọn mẫu dung lượng n, tính trung bình cộng
_
x
+ Chọn mức ý nghĩa α
+ Tìm giá trị tới hạn z(α/2) nếu kiểm định 2 phía hoặc z(α) nếu kiểm định một phía
+ Tính giá trị thực nghiệm ZTN =
σ
µ
σ
µ nx
n
x )()( 00 −
=
−
So sánh ZTN và z tới hạn để rút ra kết luận theo nguyên tắc sau:
Kết luận:
Với H1 : µ ≠ µ0 (Kiểm định hai phía)
Nếu ZTN (giá trị tuyệt đối của ZTN) nhỏ hơn hay bằng z(α/2) thì chấp nhận H0 nếu ngược
lại thì bác bỏ H0, tức là chấp nhận H1.
Với H1 : µ > µ0 (Kiểm định một phía)
Nếu ZTN nhỏ hơn hay bằng giá trị tới hạn z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1.
Với H1: µ < µ0 (Kiểm định một phía)
Nếu ZTN lớn hơn hay bằng giá trị tới hạn - z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1.
Chương 2 Ước lượng và kiểm định giả thiết
21
Ví dụ 2.3: Nuơi 100 con cừu theo một chế độ riêng. Mục đích của thí nghiệm là xem chế độ
này cĩ làm tăng khối lượng của cừu một năm tuổi hay khơng. Biết rằng 100 cừu này được lấy
mẫu từ một quần thể cĩ khối lượng trung bình một năm tuổi là 30 kg và phương sai là 25 kg².
Giả thiết tăng trọng phân phối chuẩn N(µ,25), hãy kiểm định giả thiết H0: µ = 30 đối thiết H1:
µ > 30 ở mức α= 0,05. Biết rằng khối lượng trung bình của 100 cừu thí nghiệm là 32 kg.
ZTN 45
100)3032(
=
−
= ; z(0,05) = 1,64
Kết luận: Vì ZTN > ZLT nên giả thiết H0 bị bác bỏ, như vậy tăng trọng trung bình khơng phải là
30 kg. Chế độ nuơi mới đã làm tăng khối lượng cừu một năm tuổi.
Ví dụ 2.4: Một mẫu cho trước gồm 100 bị sữa cĩ sản lượng sữa một chu kỳ tiết sữa trung bình
là 3850kg. Số bị này cĩ xuất phát từ quần thể cĩ giá trị trung bình là 4000kg và độ lệch chuẩn
là 1000 hay khơng? Giả sử sản lượng sữa của quần thể tuân theo phân phối chuẩn N((µ,1000²).
Hãy kiểm định giả thiết H0: µ = 4000 đối thiết H1: µ ≠ 4000 ở mức α= 0,05
ZTN 5,11000
100)40003850(
−=
−
= ZTN = 1,5; z(0,025) = 1,96
Kết luận: Chấp nhận H0, số bị sữa nêu trên xuất phát từ một quần thể ban đầu cĩ sản lượng
sữa chu kỳ là 4000kg.
2.3.2. Kiểm định giả thiết H0: µ = µ0 khi khơng biết σ2
ðây là trường hợp phổ biến khi kiểm định giá trị trung bình của phân phối chuẩn. Tiến hành
các bước sau:
+ Lấy mẫu dung lượng n, tính
_
x và s2
+ Tính giá trị T thực nghiệm TTN =
s
nx )( 0
__
µ−
+ Tìm giá trị tới hạn t(α/2, n-1) với kiểm định 2 phía hoặc tìm t(α, n-1) nếu kiểm định 1 phía
trong bảng 2.
Kết luận:
Với H1 : µ ≠ µ0 (Kiểm định hai phía)
Nếu TTN (giá trị tuyệt đối của Ttn) nhỏ hơn hay bằng t(α/2,n-1) thì chấp nhận H0 nếu
ngược lại thì bác bỏ H0, tức là chấp nhận H1
Với H1 : µ > µ0 (Kiểm định một phía)
Nếu TTN ≤ t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1
Với H1: µ < µ0 (Kiểm định một phía)
Nếu TTN ≥ - t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1.
Thiết kế thí nghiệm 22
Ví dụ 2.5: Thời gian mang thai của bị phân phối chuẩn N(285,σ2). Theo dõi thời gian mang
thai (ngày) của 6 bị được các số liệu
307 293 293 283 294 297
Kiểm định giả thiết H0: µ = 285 ngày đối thiết H1: µ ≠ 285 ngày
Tính 5,294
6
1767
6
)297294283293293307(
==
+++++
=x
9,59
5
6
1767)297294....293307
2
2222
2
=
−++++
=s ; 74,77395,79,59 ≈==s
TTN 007,316,3
5,96
74,7
)2855,294(
==×
−
= ; t(0,025;5) =2,571
Kết luận: Vì TTN = 3,007 > t(0,025;5) nên bác bỏ H0 như vậy thời gian mang thai khơng
phải 285 ngày
Ví dụ 2.6: Trong điều kiện chăn nuơi bình thường, lượng sữa trung bình của một con bị là 19
kg / ngày. Trong một đợt hạn, người ta theo dõi 25 con bị và được lượng sữa trung bình 17,5
kg/ ngày, độ lệch chuẩn s = 2,5 kg. Giả thiết lượng sữa phân phối chuẩn, hãy kiểm định giả
thiết H0: µ = 19 với đối thiết µ < 19 ở mức α = 0,05.
TTN = = 5,2
25)195,17( −
- 3 ; t(0,05;24) = 1,711
Kết luận: TTN < - 1,711 nên giả thiết H0 bị bác bỏ, như vậy sản lượng sữa trung bình khơng
cịn là 19 kg / ngày nữa mà thấp hơn.
2.4. Kiểm định hai giá trị trung bình của hai biến phân phối chuẩn
Giả sử chúng ta cĩ hai tổng thể và theo dõi một biến định lượng X nào đĩ, ví dụ khối lượng
sau 6 tháng nuơi của hai đàn gà, năng suất của hai giống lúa, năng suất của một giống ngơ khi
bĩn theo hai cơng thức phân bĩn khác nhau, sản lượng một loại quả khi trồng theo hai khoảng
cách hàng . . .
Chúng ta gọi biến X trên tổng thể thứ nhất là X1 (phân phối chuẩn N(µ1,σ12)) và biến X trên
tổng thể thứ hai là X2 (phân phối chuẩn N(µ2,σ22)). ðể so sánh µ1 và µ2 chúng ta phải chọn
mẫu. Cĩ hai cách chọn mẫu: Chọn mẫu theo cặp và chọn mẫu độc lập.
2.4.1. Chọn mẫu theo cặp
Từ tổng thể thứ nhất ta chọn một mẫu n cá thể được các giá trị x1, x2, . . . ,xn , từ tổng thể thứ
hai chọn một mẫu cũng gồm n cá thể được y1, y2, . . ., yn.
Giữa hai mẫu này cĩ mối quan hệ cặp, tức là cĩ n cặp (xi, yi) (i = 1, n). Các cặp này hình
thành do khi chọn mẫu ta đã dùng những quan hệ cặp như quan hệ gia đình (vợ chồng, anh
em, thí dụ chọn n tổ chim sau đĩ bắt chim đực vào mẫu đại diện cho tổng thể chim đực, bắt
chim cái vào mẫu đại diện cho tổng thể chim cái), quan hệ trước sau (thí dụ cá thể được đo
một chỉ số trước khi dùng thuốc và số liệu này đại diện cho tổng thể trước khi dùng thuốc,
Chương 2 Ước lượng và kiểm định giả thiết
23
một thời gian sau khi dùng thuốc lại đo lại chỉ số và số liệu này đại diện cho tổng thể sau khi
dùng thuốc), cũng cĩ khi các cặp này là các cặp số liệu do chúng ta bố trí thí nghiệm theo cặp:
chọn 2 ơ ruộng, một ơ ruộng(hay một chuồng) bố trí giống thử nghiệm, một ơ ruộng (một
chuồng) bố trí giống đối chứng.
Viết lại số liệu dưới dạng hai cột hay hai hàng rồi tính hiệu số di = yi - xi
X1 x1 x2 . . . xn
X2 y1 y2 . . . yn
d d1 d2 . . . dn
Tiếp theo tính giá trị trung bình
_
d và độ lệch chuẩn sd
Giả thiết H0: µ2 = µ1 đối thiết H1: µ2 ≠ µ1 được chuyển thành H0: µd = 0 đối thiết H1: µd ≠ 0
(tương tự H1: µ2 > µ1 chuyển thành H1: µd > 0 và H1: µ2 < µ1 chuyển thành H1: µd < 0).
Ở mức ý nghĩa α việc kiểm định gồm các bước sau:
+ Tính giá trị thực nghiệm TTN =
ds
nd
+ Tìm giá trị tới hạn t(α/2, n-1) nếu kiểm định 2 phía hoặc t(α, n-1) nếu kiểm định một phía
bảng 2
Kết luận:
+ Kiểm định hai phía H1: µ2 ≠ µ1
Nếu TTN ≤ t(α/2, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1
+ Kiểm định một phía H1: µ2 > µ1
Nếu TTN ≤ t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1
+ Kiểm định một phía H1: µ2 < µ1
Nếu TTN ≥ - t(α, n-1) thì chấp nhận H0, ngược lại thì chấp nhận H1
Ví dụ 2.7: Tăng trọng (pound) của 10 cặp bê sinh đơi giống hệt nhau dưới hai chế độ chăm
sĩc khác nhau (A và B). Bê trong từng cặp được bắt thăm ngẫu nhiên về một trong hai cách
chăm sĩc. Giả thiết tăng trọng cĩ phân phối chuẩn. Hãy kiểm định giả thiết H0: Tăng trọng
trung bình ở hai cách chăm sĩc như nhau, đối thiết H1: Tăng trọng trung bình khác nhau ở hai
cách chăm sĩc với mức ý nghĩa α = 0,05. Số liệu thu được như sau:
Cặp sinh đơi 1 2 3 4 5 6 7 8 9 10
Tăng trọng ở cách A 43 39 39 42 46 43 38 44 51 43
Tăng trọng ở cách B 37 35 34 41 39 37 35 40 48 36
Chênh lệch (d) 6 4 5 1 7 6 3 4 3 7
n = 10;
−
d = 4,6; sd = 1,955; TTN = 955,1
106,4
= 7,44; t(0,025;9) = 2,262
Kết luận: Bác bỏ giả thiết H0, chấp nhận H1: “Tăng trọng trung bình ở hai cách chăm sĩc là
khác nhau”.
Thiết kế thí nghiệm 24
Ví dụ 2.8: Cĩ 15 trại phối hợp tham gia thử nghiệm khẩu phần ăn bình thường (A) và khẩu
phần ăn cĩ bổ sung đồng (B). Mỗi trại lấy 2 khu nuơi lợn tương tự về mọi mặt sau đĩ chỉ định
ngẫu nhiên một khu ăn khẩu phần A, một khu ăn khẩu phần B. Tăng trọng trung bình
(kg/ngày) của một con lợn được trình bày ở bảng dưới. Kiểm định giả thiết H0: “Hai khẩu
phần A và B cho kết quả tăng trọng trung bình như nhau” với đối thiết H1: “Khẩu phần cĩ bổ
sung đồng cho tăng trọng trung bình cao hơn”
Khẩu phần Khẩu phần Khẩu phần
Trại A (xi) B (yi) Trại A (xi) B (yi) Trại A (xi) B (yi)
1 0,42 0,53 6 0,50 0,52 11 0,50 0,51
2 0,53 0,47 7 0,44 0,44 12 0,54 0,54
3 0,48 0,56 8 0,45 0,46 13 0,46 0,50
4 0,50 0,59 9 0,30 0,43 14 0,48 0,50
5 0,42 0,47 10 0,52 0,57 15 0,53 0,59
Giá trị trung bình
−
d = 0,0407; độ lệch chuẩn sd = 0,0489
TTN 22,3150489,0
0407,0
=×= ; t(0,05;14) = 1,761
Kết luận: Vì TTN > t nên bác bỏ H0, chấp nhận H1. Như vậy khẩu phần bổ sung đồng cho
tăng trọng trung bình cao hơn khẩu phần ăn thường.
2.4.2. Chọn mẫu độc lập
Từ hai tổng thể chọn ra hai mẫu độc lập, dung lượng cĩ thể bằng nhau hoặc khác nhau. Tính
các tham số thống kê 1
−
x ; s12 của mẫu thứ nhất; 2
−
x ; s22 của mẫu thứ hai. ðể kiểm định giả
thiết H0: µ2 = µ1 với các đối thiết H1 ở mức ý nghĩa α ta chia ra 3 trường hợp:
2.4.2.1. Biết phương sai σ12 và σ22
+ Tính Z thực nghiệm ZTN
2
2
2
1
2
1
1
_
2
_
)(
nn
xx
σσ
+
−
=
+ Tìm giá trị tới hạn z(α/2) nếu kiểm định 2 phía hoặc z(α) nếu kiểm định một phía trong
bảng 1
Kết luận:
+ Kiểm định hai phía H1: µ2 ≠ µ1
Nếu ZTN ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1
+ Kiểm định một phía H1: µ2 > µ1
Nếu ZTN ≤ z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1
+ Kiểm định một phía H1: µ2 < µ1
Nếu ZTN ≥ - z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1
Chương 2 Ước lượng và kiểm định giả thiết
25
Ví dụ 2.9: Chiều dài cá trong 2 ao phân phối chuẩn với độ lệch chuẩn σ1 = 2cm và σ2 =
2,2cm. Lấy mẫu 100 con của ao thứ nhất được giá trị trung bình 1
_
x = 8 cm; lấy mẫu 120 con
của ao thứ hai được giá trị trung bình 2
_
x
= 8,5 cm. Hãy kiểm định giả thiết H0: µ1 = µ2 với
đối thiết H1: µ1 ≠ µ2 ở mức ý nghĩa α=0,05
Z
TN
764,1
120
2,2
100
2
)85,8(
22
=
+
−
= ; z(0,025) = 1,96
Vì ZTN = 1,764 < 1,96 nên chấp nhận H0: “Chiều dài cá trung bình trong 2 ao như nhau”.
2.4.2.2. Khơng biết phương sai σ12 và σ22 mẫu lớn( n1 ≥ 30, n2 ≥ 30).
+ Tính giá trị thực nghiệm ZTN
2
2
2
1
2
1
1
_
2
_
)(
n
s
n
s
xx
+
−
=
+ Tìm giá trị tới hạn z(α/2) nếu kiểm định 2 phía hoặc z(α) nếu kiểm định một phía trong
bảng 1
Kết luận:
+ Kiểm định hai phía H1: µ2 ≠ µ1
Nếu ZTN ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1
+ Kiểm định một phía H1: µ2 > µ1
Nếu ZTN ≤ z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1
+ Kiểm định một phía H1: µ2 < µ1
Nếu ZTN ≥ - z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1
Ví dụ 2.10: ðể đánh giá tăng trọng của lợn ở hai chế độ ăn khác nhau. Khối lượng sau 4
tháng ở hai chế độ nuơi cĩ các số liệu sau. Ở chế độ thứ nhất, tiến hành thí nghiệm 64 con (n1
= 64) được giá trị trung bình 1
_
x = 73,2 kg biết σ1 = 10,9 kg; tương tự với chế độ thứ 2 ta cĩ n2
= 68; 2
_
x = 76,6; σ2 = 11,4 kg. Giả thiết khối lượng phân phối chuẩn N(µ1,σ12) và N(µ2,σ22)).
Kiểm định giả thiết H0: µ2 = µ1 với đối thiết H1: µ2 > µ1
ZTN 75,1
68
4,11
64
9,10
2,736,76
22
=
+
−
= ; z(0,05) = 1,645
Kết luận:
ZTN > z(0,05) vì vậy chấp nhận H1: “chế độ ăn thứ hai cho kết quả trung bình cao hơn chế độ
ăn thứ nhất”.
Thiết kế thí nghiệm 26
2.4.2.3. Khơng biết phương sai σ12 và σ22, mẫu bé ( ít nhất một trong 2 số n1, n2 <30)
ðây là một bài tốn cịn rất nhiều vướng mắc về mặt lý thuyết do đĩ chúng ta chỉ trình bầy
trường hợp cĩ thêm giả thiết phụ : σ12 = σ22
+ Tính phương sai chung: s2c = 2
)1()1(
21
2
22
2
11
−+
−+−
nn
snsn
+ Tính TTN =
)11(
)(
21
2
12
nn
s
xx
c +
−
+ Tìm giá trị tới hạn t(α/2, n1 + n2 - 2) với kiểm định 2 phía hoặc t(α, n1 + n2 - 2) nếu kiểm
định một phía
Kết luận:
+ Kiểm định hai phía H1: µ2 ≠ µ1
Nếu TTN≤ t(α/2,n1+n2 -2) thì chấp nhận H0, ngược lại thì chấp nhận H1
+ Kiểm định một phía H1: µ2 > µ1
Nếu TTN ≤ t(α ,n1+n2 -2) thì chấp nhận H0, ngược lại thì chấp nhận H1
+ Kiểm định một phía H1: µ2 < µ1
Nếu TTN ≥ - t(α,n1+n2 -2) thì chấp nhận H0, ngược lại thì chấp nhận H1
Ví dụ 2.11: ðể so sánh khối lượng của 2 giống bị, chọn ngẫu nhiên 12 bị của giống thứ nhất
và 15 bị của giống thứ 2. Khối lượng (kg) của từng bị được xác định và thu được các tham số
thống kê sau: n1 = 12; 1
_
x = 196,2kg; s1 = 10,62 kg; n2 = 15; 2
_
x
= 153,70kg; s2 = 12,30kg.
Kiểm định giả thiết H0: Hai giống bị cĩ khối lượng trung bình như nhau với đối thiết H1:
Giống bị thứ nhất cĩ khối lượng trung bình lớn hơn giống bị thứ hai. Giả sử khối lượng của 2
giống bị cĩ phân phối chuẩn và hai phương sai bằng nhau với mức ý nghĩa α = 0,05.
33,134
1411
)30,121462,1011( 222
=
+
×+×
=cs
TTN 46,9489,4
5,42
15
1
12
133,134
)7,1532,196(
==
+×
−
= ; t(0,05,25) = 1,708
Kết luận: Ở mức ý nghĩa α = 0,05 vì TTN > t nên bác bỏ H0. Như vậy giống thứ nhất cĩ khối
lượng trung bình cao hơn giống thứ hai.
Ví dụ 2.12 : Hai giống gà cĩ khối lượng phân phối chuẩn, lấy mẫu 10 gà đối với giống thứ
nhất và 16 gà của giống thứ 2. Các tham số về khối lượng 45 ngày tuổi của 2 mẫu nêu trên
như sau:
Với mẫu thứ nhất n1 = 10; 1
_
x = 2,8kg; s12 = 0,1111 kg² với mẫu thứ hai n2 = 16; 2
_
x = 2,35kg;
s2
2
= 0,0667kg². Kiểm định giả thiết H0: Hai giống gà cĩ khối lượng trung bình như nhau với
đối thiết H1: Hai giống gà cĩ khối lượng trung bình khác nhau. Mức ý nghĩa α = 0,05.
Chương 2 Ước lượng và kiểm định giả thiết
27
83331,0
24
99995,1
159
0667,0151111,092
==
+
×+×
=cs
TTN = = -3,866 TTN= 3,866; t(0,025;24) = 2,064
Kết luận: Bác bỏ H0, như vậy hai giống gà cĩ khối lượng trung bình khác nhau.
2.5. Ước lượng và kiểm định xác suất
Trường hợp tổng thể cĩ 2 loại cá thể A và A’, loại A chiếm tỷ lệ p và A’ chiếm tỷ lệ q = 1-p.
Sau khi chọn mẫu cĩ thể dùng phân phối chuẩn để tính gần đúng phân phối nhị thức, từ đĩ suy
ra cơng thức ước lượng p.
2.5.1. Ước lượng xác suất p
Khi dung lượng mẫu lớn (n ≥ 30 nhưng thực tế tốt nhất là trên 100) và p khơng bé quá, cũng
khơng lớn quá ( np > 5, nq > 5). Từ mẫu cĩ dung lượng n, tính số cá thể loại A được tần số m
và tần suất f = m/ n với mức tin cậy P cĩ khoảng tin cậy đối xứng sau:
n
ff
zfp
n
ff
zf )1()2/()1()2/( −+≤≤−− αα
Ví dụ 2.13: ðể biết tỷ lệ trứng nở p của một loại trứng; cho vào máy ấp 100 quả, kết quả cĩ
80 quả nở.
f = 80 / 100 = 0,8 ở mức tin cậy P = 0,95 thì α = 0,05 và z(0,025) = 1,96. Ta cĩ thể tính
được khoảng tin cậy như sau:
100
2,08,096,18,0
100
2,08,096,18,0 ×+≤≤×− p
0,8 - 0,0784 ≤ p ≤ 0,8 + 0,0784 ⇔ 0,72 ≤ p ≤ 0,88
2.5.2. Kiểm định giả thiết H0: p = p0
Khi dung lượng mẫu lớn (n ≥ 30 nhưng thực tế thấy tốt nhất là trên 100) và p khơng bé quá,
cũng khơng lớn quá ( np > 5, nq > 5). Từ mẫu cĩ dung lượng n, tính số cá thể loại A được tần
số m và tần suất f = m / n. Ở mức ý nghĩa α tính z(α/2) với kiểm định 2 phía hoặc z(α) nếu
kiểm định một phía.
Tính ZTN =
n
pp
pf
o )1( 0
0
−
−
Kết luận:
Với đối thiết hai phía H1: p ≠ p0
Nếu ZTN ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1
Với đối thiết một phía H1: p > p0
Nếu ZTN ≤ z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1
Với đối thiết một phía H1: p < p0
Nếu ZTN ≥ - z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1
Thiết kế thí nghiệm 28
Ví dụ 2.14: Ấp 100 quả trứng cĩ 82 quả nở. Kiểm định giả thiết H0: tỷ lệ nở p = 0,80, đối
thiết H1: p ≠0,8 với α = 0,05.
n = 100; m = 82; f = 82/100 = 0,82;
ZTN =
100
2,0.8,0
80,082,0 −
= 0,5 ; z(0,025) = 1,96
Kết luận: Chấp nhận H0: “Tỷ lệ ấp nở là 0,80”.
2.5.3. Kiểm định giả thiết H0: p2 = p1
Khi dung lượng cả 2 mẫu đều lớn ( n1 > 100, n2 > 100) và các pi khơng bé quá (hoặc lớn quá)
cĩ thể kiểm định như sau (ở mức ý nghĩa α)
Tính các tần suất:
1
1
1
n
mf = ;
2
2
2
n
mf =
Tính tần suất chung:
21
21
nn
mmf
+
+
=
Tìm giá trị tới hạn z(α/2) nếu kiểm định 2 phía hoặc z(α) nếu kiểm định một phía
Tính giá trị thực nghiệm: ZTN
)11)(1(
21
12
nn
ff
ff
+−
−
=
Kết luận:
Với đối thiết hai phía H1: p2 ≠ p1
Nếu ZTN ≤ z(α/2) thì chấp nhận H0, ngược lại thì chấp nhận H1
Với đối thiết một phía H1: p2 > p1
Nếu ZTN ≤ z(α) thì chấp nhận H0, ngược lại thì chấp nhận H1
Với đối thiết một phía H1: p2 < p1
Nếu ZTN ≥ - z(α) thì chấp nhận H0, ngược lại thì thì chấp nhận H1
Ví dụ 2.15: Dùng thuốc A điều trị cho 200 bệnh nhân thấy 150 người khỏi bệnh. Tương tự
với thuốc B đối với 100 bệnh nhân thì 72 người khỏi bệnh. Hãy kiểm định giả thiết H0: Tỷ lệ
khỏi bệnh của hai thuốc như nhau với đối thiết H1: tỷ lệ khỏi bệnh của hai thuốc khác nhau
với mức ý nghĩa α = 0,05.
n1 = 200; m1 = 150; f1 = 150/ 200 = 0,75; n2 = 100; m2 = 72; f2 = 72 /100 = 0,72 ;
74,0
100200
72150
=
+
+
=f
ZTN 5584,0
)
100
1
200
1(26,074,0
75,072,0
−=
+××
−
= |ZTN| = 0,5584; z(0,025) = 1,96.
Kết luận: Chấp nhận H0; tức là tỷ lệ khỏi bệnh ở 2 loại thuốc là như nhau.
Chương 2 Ước lượng và kiểm định giả thiết
29
2.6. Phân tích phương sai
Mở rộng bài tốn so sánh hai trung bình của hai tổng thể ở mục trên khi cĩ nhiều hơn 2 trung
bình chúng ta cĩ bài tốn phân tích phương sai một nhân tố. Thí dụ cĩ a tổng thể, để khảo sát
các biến X1, X2, . . . , Xa trên các tổng thể đĩ chúng ta lấy ở mỗi tổng thể một mẫu các quan
sát độc lập:
Mẫu 1 x11, x12, . , x1r1
Mẫu 2 x21, x22, . , x2r2
. .
Mẫu a xa1, xa2, ., x2ra
Tất cả cĩ n = Σri quan sát. Viết lại các quan sát xi j dưới dạng
xi j = µi + ei j ei j gọi là sai số hay phần dư (2.1)
Giả thiết các biến Xi độc lập, phân phối chuẩn N(µi, σ2), các quan sát trong mẫu độc lập.Từ
giả thiết trên cĩ thể nêu cụ thể 3 giả thiết sau đối với các sai số ei j
a- Các biến ei j độc lập với nhau
b- Các biến ei j phân phối chuẩn với kỳ vọng bằng 0
c- Các biến ei j cĩ phương sai bằng nhau (σ2)
Bài tốn phân tích phương sai một nhân tố chính là bài tốn kiểm định giả thiết H0: “Các
trung bình µi bằng nhau” với đối thiết H1: “Cĩ ít nhất một cặp trung bình khác nhau”.
Nếu gọi µ
là trung bình của các µi thì cĩ thể viết (2.1) lại như sau:
xi j = µ + ai + ei j (2.2)
với ai = µi - µ; Σai = 0
Giả thiết H0 bây giờ là : “Các ai đều bằng 0” cịn H1 là “Khơng phải tất cả các ai đều bằng 0”.
ðể phân tích phương sai chúng ta gọi các trung bình cộng của các mẫu quan sát là ix
_
. Nếu
giả thiết H0 đúng thì các Xi cĩ cùng phân phối N(µ,σ2) và cĩ thể coi các mẫu quan sát nĩi trên
được lấy ra từ cùng một tổng thể.
Gọi
_
x là trung bình chung của tất cả các mẫu.
Tính tổng bình phương tất cả các sai số (gọi là tổng bình phương tồn bộ SSTO)
SSTO 2
1 1
2
1 1
2)( xnxxx
a
i
n
j
ij
a
i
n
j
ij
ii
−=−= ∑∑∑∑
= == =
ðem tổng bình phương này chia cho (n - 1) được một ước lượng của σ2.
SSTO/ σ2 phân phối χ2 với dfTO = (n - 1) bậc tự do.
ðối với mỗi mẫu quan sát chúng ta tính tổng bình phương sai số trong mẫu (mà nếu đem chia
cho bậc tự do tương ứng (ni - 1) thì được một ước lượng của σ2) sau đĩ gộp lại thành tổng
bình phương do sai số SSE (Giống như cách đã làm khi đi tìm phương sai chung s2c trong
trường hợp mẫu bé và hai phương sai bằng nhau ở mục 2.4.2.3 )
SSE ∑∑
= =
−=
a
i
n
j
iij
i
xx
1 1
2)(
Thiết kế thí nghiệm 30
ðem SSE chia cho n - a được một ước lượng của σ2
SSE /σ2 phân phối χ2 với dfE = (n - a) bậc tự do.
Cĩ thể chứng minh hệ thức sau:
∑∑∑∑∑∑
= == == =
−+−=−
a
i
n
j
i
a
i
n
j
iij
a
i
n
j
ij
iii
xxxxxx
1 1
2
1 1
2
1 1
2 )()()(
Tổng thứ ba gọi là tổng bình phương do nhân tố SSA.
Nếu xi j phân phối chuẩn N(µi, σ2) thì các trung bình cộng .
_
ix phân phối chuẩn N(µi, σ2/ni).
Từ đĩ suy ra nếu đem SSA chia cho (a - 1) thì được ước lượng của σ2.
Tổng SSA/σ2 phân phối χ2 với dfA = (a-1) bậc tự do.
Như vậy chúng ta đã tách tổng bình phương tồn bộ ra hai tổng:
SSTO = SSA + SSE
ðồng thời bậc tự do tồn bộ cũng tách thành 2 bậc tự do:
dfTO = dfA + dfE
Mỗi tổng bình phương chia cho bậc tự do tương ứng sẽ cho một ước lượng của phương sai σ2
và mỗi tổng sau khi chia cho σ2 sẽ phân phối χ2
với số bậc tự do tương ứng.
Bây giờ xét tỷ số MSA / MSE với MSA = SSA / dfA và MSE = SSE / dfE
Dựa trên lý thuyết về phân phối Khi bình phương (χ2) và phân phối F cĩ kết luận sau: MSA /
MSE phân phối Fisher- Snederco (F). Từ đĩ cĩ cách kiểm định sau đây đối với giả thiết H0
(đối thiết H1):
+ Tính giá trị thực nghiệm FTN = MSA / MSE
+ Tìm giá trị tới hạn F(α,dfA,dfE)
+ Nếu FTN ≤ F(α,dfA,dfE) thì chấp nhận H0, ngược lại thì chấp nhận H1
Tồn bộ quy trình phân tích phương sai được tĩm tắt trong bảng phân tích phương sai sau:
Nguồn biến động Bậc tự do Tổng bình phương
Trung bình
bình phương FTN F tới hạn
Nhân tố dfA = a-1 SSA MSA = SSA/dfA MSA/MSE F(α,dfA,dfE)
Sai số ngẫu nhiên dfE = n-a SSE MSE = SSE/dfE
Tổng biến động dfTO = n-1 SSTO
ðể thuận tiện thường kẻ bảng chứa dữ liệu và tính theo thứ tự sau:
+ Tính dung lượng ni, tổng hàng THi, trung bình .
_
ix , TH2i / ni
+ Tổng các dung lượng n = Σni , tổng tất cả các xi j ST =ΣΣ xi j
+ Số điều chỉnh G = ST2 / n
+ SSTO = ΣΣ x2i j - G bậc tự do dfTO = n - 1
+ SSA = ΣTH2i / ni - G bậc tự do dfA = a - 1
+ SSE = SSTO - SSA bậc tự do dfE = dfTO - dfA = n - a
+ Tính các trung bình MSA = SSA / dfA và MSE = SSE / dfE
+ Tính FTN = MSA / MSE
+ Tìm giá trị F(α,dfA,dfE)
+ So sánh FTN với F(α,dfA,dfE).
Chương 2 Ước lượng và kiểm định giả thiết
31
Ví dụ 2.16: Khối lượng (kg) của 20 lợn 90 ngày tuổi được nuơi ở 5 chế độ khác nhau từ lúc
cai sữa 21 ngày tuổi. Biết rằng 20 lợn được chọn đồng đều nhau vào thời điểm cai sữa và bố
trí ngẫu nhiên về một trong 5 cơng thức thí nghiệm. Số liệu được trình bày trong bảng dưới.
Giả thiết khối lượng tuân theo phân phối chuẩn. Kiểm định giả thiết H0: Khối lượng trung
bình của lợn 90 ngày tuổi ở 5 chế độ chăm sĩc bằng nhau với đối thiết H1: Khối lượng trung
bình của lợn 90 ngày tuổi ở 5 chế độ chăm sĩc khơng bằng nhau. Mức ý nghĩa α = 0,05.
Cơng thức Khối lượng (kg) ni THi THi2/ni
.
_
ix
A 32,2 34,9 29,7 3 96,8 3123,413 32,27
B 28,4 28,0 22,8 28,5 29,4 5 137,1 3759,282 27,42
C 28,8 29,5 23,1 20,1 4 101,5 2575,563 25,38
D 41,5 36,3 31,7 31,0 38,2 5 178,7 6386,738 35,74
E 33,0 26,0 30,6 3 89,6 2676,053 29,87
Tổng 20 603,7 18521,0492
n = 20 ST = 603,7 ΣTH2i / ni = 18521,0492
Số điều chỉnh G = 603,72 / 20 = 18222,6845
Tổng các bình phương ΣΣ x2i j = 18727,6900
SSTO = 18727,69 - 18222,68 = 505,0055; bậc tự do dfTO = 20 -1 = 19
SSA = 18521,0492 - 18222,6845 = 298,3647; bậc tự do dfA = 5 - 1 = 4
SSE = 505,0055 - 298,3647 = 206,6408; bậc tự do dfE = 19 - 4 = 15
MSA = 298,3647 / 4 = 74,5912; MSE = 206,6408 / 15 = 13,7761
FTN = 74,5912/ 13,7761 = 5,4145 F(0,05;4;15) = 3,056
Cĩ thể tổng hợp các kết quả thu được theo bảng phân tích phương sai (ANOVA) sau:
Nguồn biến động Bậc tự do Tổng bình phương
Trung bình
bình phương FTN F tới hạn
Cơng thức 4 298,3647 74,5912 3,056 F(0,05;4;15) = 3,056
Sai số ngẫu nhiên 15 206,6408 13,7761
Tổng biến động 19 505,0055
Kết luận: Bác bỏ H0, như vậy là bác bỏ giả thiết “Khối lượng trung bình của lợn 90 ngày tuổi
ở 5 chế độ chăm sĩc bằng nhau”.
Sau khi cĩ kết luận như trên thì vấn đề đặt ra là phải so sánh 5 trung bình của 5 lơ để tìm ra
các trung bình nào bằng nhau, các trung bình nào khác nhau. Vấn đề này sẽ được trình bầy kỹ
ở phần sau.
Qua cách làm như trên chúng ta thấy để kiểm định giả thiết H0: “Các trung bình bằng nhau”
với đối thiết H1: “Cĩ ít nhất một cặp trung bình khác nhau” phải tìm cách tách tổng bình
phương tồn bộ SSTO thành các tổng bình phương SSA và SSE căn cứ vào 2 nguồn biến động
của số liệu: biến động do sự khác nhau giữa các mẫu và biến động do sự khác nhau giữa các
số liệu trong cùng một mẫu. ðồng thời phải tách bậc tự do tồn bộ dfTO thành các bậc tự do
dfA và dfE tương ứng với các tổng SSA, SSE. Từ đĩ cĩ tên phân tích phương sai.
Trong phần sau khi cĩ nhiều nguồn biến động thì phải tách SSTO thành nhiều tổng ứng với các
nguồn biến động và tách bậc tự do dfTO thành nhiều bậc tự do, sau đĩ kiểm định các giả thiết
tương ứng với các nguồn biến động nhờ phân phối Fisher- Snederco.
Thiết kế thí nghiệm 32
2.7. Bài tập
2.7.1
Tăng trọng trung bình (gram/ngày) của 36 lợn nuơi vỗ béo giống Landrace được rút ngẫu
nhiên từ một trại chăn nuơi. Số liệu thu được như sau:
577 596 594 612 600 584 618 627 588 601 606 559 615 607 608 591 565 586
621 623 598 602 581 631 570 595 603 605 616 574 578 600 596 619 636 589
Cán bộ kỹ thuật trại cho rằng tăng trọng trung bình của tồn đàn lợn trong trại là 607
gram/ngày. Theo anh chị kết luận đĩ đúng hay sai, vì sao?
2.7.2
Anh chị hãy kiểm tra kết luận với bài tập tương tự như 2.7.1, biết rằng độ lệch chuẩn của tính
trạng này ở Landrace là 24 gram/ngày.
2.7.3
Tỷ lệ thụ thai bằng thụ tinh nhân tạo từ tinh trùng của 2 bị đực giống được xác định trên
nhĩm bị cái gồm 50 con; 18 nhĩm bị cái sử dụng tinh trùng của bị đực A và 16 đối với bị
đực B. Tỷ lệ thụ thai (%) thu được như sau:
Bị đực A 74,2 62,1 57,7 71,7 62,0 76,1 70,6 68,3 68,4 79,8
71,1 70,9 65,5 61,2 60,8 73,9 51,9 63,7
Bị đực B 49,6 49,2 53,2 56,5 69,1 54,2 80,7 62,7 71,5 67,5
64,6 75,4 79,6 59,8 68,8 60,2
Hãy cho biết tỷ lệ thụ thai của 2 bị đực nêu trên.
2.7.4
Nồng độ fructoza (mg%) trong tinh dịch bị trước và sau khi ủ được xác định trên 12 mẫu tinh
bị đực; các giá trị thu được như sau:
Mẫu số 1 2 3 4 5 6 7 8 9 10 11 12
Trước khi ủ 116 190 570 375 236 505 120 322 429 102 167 299
Sau khi ủ 30 58 100 48 58 153 54 66 67 34 69 82
Kết luận về nồng độ fructoza trong tinh dịch bị trước và sau khi ủ.
2.7.5
Một thí nghiệm được tiến hành nhằm nghiên cứu ảnh hưởng của progesterone lên chu kỳ
động dục của cừu Merino. Sử dụng 4 liều khác nhau (0, 10,
Các file đính kèm theo tài liệu này:
- bai_giang_thiet_ke_thi_nghiem_chuong_2_uoc_luong_va_kiem_din.pdf