Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 1
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 1
TỔNG QUAN VỀ THỐNG KÊ
Hoàng Trọng
Thống kê là gì?
• Tại sao phải “thống kê”
• Thống kê để làm gì?
• Thống kê là số liệu?
• Thống kê là phương pháp?
• Thống kê là hệ thống các phương pháp dùng để thu thập,
xử lý và phân tích các con số (mặt lượng) của những hiện
tượng số lớn để tìm hiểu bản chất và tính quy
86 trang |
Chia sẻ: huongnhu95 | Lượt xem: 669 | Lượt tải: 0
Tóm tắt tài liệu Bài giảng Thống kê ứng dụng trong kinh doanh và Kinh tế - Chương 1: Tổng quan về thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
luật vốn có
của chúng (mặt chất) trong điều kiện thời gian và không
gian cụ thể.
2
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 2
Hai lĩnh vực thống kê
• Thống kê mô tả:
– Thu thập số liệu
– Tính toán các đặc trưng đo lường
– Mô tả, trình bày dữ liệu
• Thống kê suy diễn
– Ước lượng, kiểm định thống kê
– Phân tích mối liên hệ
– Dự đoán
3
Ứng dụng của thống kê
4
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 3
Ứng dụng của thống kê
5
Ứng dụng thống kê trong KT & KD
• Kinh tế:
– Dân số, lao động, tài nguyên
– Giá cả, lạm phát
– Sản xuất, thương mại, tiêu dùng
– Xuất nhập khẩu, cán cân thương mại
• Kinh doanh
– Quy mô thị trường, phân khúc
– Nhu cầu, giá cả, phân phối,
– Đo lường cạnh tranh
– Đo lường kết quả kinh doanh, tiếp thị
– Dự báo kinh doanh
6
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 4
Một số KN thường dùng trong thống kê
• Tổng thể (population): tập hợp các đơn vị/phần tử cần phân
tích/nghiên cứu
• Đơn vị tổng thể (unit): phần tử nhỏ nhất tạo thành tổng thể
• Mẫu: một phần của tổng thể được chọn ra để thu thập thông tin
• Tiêu thức, tiêu chí, biến: đặc điểm của đơn vị tổng thể dùng để
quan sát hay thu thập dữ liệu
– Tiêu thức/tiêu chí định tính: đặc điểm biểu hiện không phải là số
– Tiêu thức/tiêu chí định lượng: đặc điểm biểu hiện là các trị số, có
thể rời rạc hay liên tục
• Chỉ tiêu: trị số phản ảnh đặc điểm/tính chất trong điều kiện thời
gian và không gián xác định
– Chỉ tiêu khối lượng: biểu hiện quy mô khối lượng
– Chỉ tiêu chất lượng: biểu hiện tính chất, mức độ phổ biến
7
Quy trình nghiên cứu thống kê
Xác định vấn đề nghiên cứu, mục đích,
nội dung, đối tượng nghiên cứu.
Xây dựng hệ thống các khái niệm,
chỉ tiêu thống kê
Điều tra thống kê
Xử lý số liệu:
Tập hợp, sắp xếp số liệu.
Chọn các phần mềm xử lý số liệu.
Phân tích thống kê sơ bộ.
Lựa chọn các phương phápphân tích thống kê
thích hợp.
Phân tích và giải thích kết quả.
Dự đoán xu hướng phát triển.
Báo cáo và truyền đạt kết quả nghiên cứu
8
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 5
Các loại thang đo
thang đo
danh nghĩa
thang đo
tỉ lệ
thang đo
thứ bậc
thang đo
khoảng cách
• Thang danh nghĩa: dùng để phân loại
• Thang thứ bậc phản ảnh sự hơn kém
• Thang khoảng cách phản ảnh mức độ hơn kém
• Thang tỉ lệ phản ánh mức độ hơn kém + so sánh tỉ lệ
9
Giới thiệu phần mềm SPSS
• Phần mềm xử lý phân tích thống kê phổ biến trong lĩnh vực
khoa học xã hội
• Được sử dụng nhiều trong quản trị, kinh doanh, tiếp thị
• Tương thích với nhiều cơ sở dữ liệu có sẵn
• Trang web tham khảo: www.spss.com hay
•
• Tài liệu tiếng Việt:
Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008) Phân tích dữ liệu nghiên cứu với SPSS,
NXB Hồng Đức
10
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 6
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 2
THU THẬP DỮ LIỆU THỐNG KÊ
Hoàng Trọng
Xác định dữ liệu cần thu thập
• Tập trung vào dữ liệu cần thiết và hữu ích
• Tiết kiệm thời gian, công sức và chi phí
• Phải xuất phát từ vấn đề nghiên cứu và mục tiêu nghiên cứu TK
Hiểu ngành học Kết quả học tập
Sức khỏe
Điểm đầu vào
Thích ngành học
Đi làm thêm
12
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 7
Dữ liệu định tính và dữ liệu định lượng
Dö õ lie äu
Dö õ lie äu
ñ òn h lö ô ïn g
Dö õ lie äu
ñ òn h tín h
th an g ñ o
d an h n g h óa
th an g ñ o
tæ le ä
th an g ñ o
th ö ù b aäc
th an g ñ o
k h oaûn g c aùc h
• Dữ liệu định tính: thu thập từ thang đo danh nghĩa và thứ bậc
-> không tính được trị trung bình
• Dữ liệu định lượng: thu thập từ thang đo khoảng cách và tỉ lệ
-> tính được trị trung bình
Dữ liệu định tính và dữ liệu định lượng
T h ô øi g ian laøm th e âm Ke át q u aû h oïc taäp L oaïi k ie åm ñ òn h
Ñòn h tín h
Dö ô ùi 6 g iô ø/tu aàn
6 -1 2 g iô ø/tu aàn
tre ân 1 2 g iô ø/tu aàn
Ñòn h tín h
T ru n g b ìn h
Kh aù
Gioûi
Ph i th am s oá
Ñòn h tín h
Dö ô ùi 6 g iô ø/tu aàn
6 -1 2 g iô ø/tu aàn
tre ân 1 2 g iô ø/tu aàn
Ñòn h lö ô ïn g
Ñie åm tru n g b ìn h
h oïc taäp
Ph aân tíc h p h ö ô n g s ai
1 y e áu toá
Ñòn h lö ô ïn g
Soá g iô ø laøm th e âm:
_ _ _ _ _ g iô ø/tu aàn
Ñòn h lö ô ïn g
Ñie åm tru n g b ìn h
h oïc taäp
Hoài q u y v aø k ie åm ñ òn h
F
14
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 8
Dữ liệu thứ cấp và dữ liệu sơ cấp
• Dữ liệu thứ cấp: nguồn có
sẵn, đã được tổng hợp, xử
lý
• Điểm mạnh: có sẵn, nhanh,
ít tốn kém
• Điểm yếu: ít chi tiết, ít đáp
ứng đúng nhu cầu nghiên
cứu thống kê
• Dữ liệu sơ cấp: thu thập
trực tiếp, ban đầu, từ đối
tượng nghiên cứu
• Điểm mạnh: phong phú, đáp
ứng đúng nhu cầu nghiên
cứu
• Điểm yếu: cần thời gian, tốn
kém
15
Nguồn dữ liệu thứ cấp
• Nội bộ: từ các phòng ban, bộ phận; các số liệu báo cáo từ các
cuộc điều tra khảo sát trước đây.
• Cơ quan thống kê nhà nước: Tổng cục thống kê, Cục thống kê
Tỉnh/ Thành phố
• Cơ quan chính phủ: các cơ quan trực thuộc chính phủ (Bộ, cơ
quan ngang bộ, Ủy ban nhân dân các cấp
• Báo, tạp chí
• Các tổ chức, hiệp hội, viện nghiên cứu
• Các công ty nghiên cứu và cung cấp thông tin
16
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 9
Nguồn dữ liệu thứ cấp
• Nhiều dữ liệu thứ cấp đã được nhiều cơ quan chính phủ, các tổ
chức, các đơn vị nghiên cứu, các doanh nghiệp, trường học
đưa lên mạng internet và người nghiên cứu có thể tìm thấy tại
các trang web của các đơn vị này hay tại các cơ sở dữ liệu trên
mạng internet.
• Dùng các máy tìm kiếm (search engine) như google, yahoo
và các từ khóa (keywords) phù hợp dò tìm và chọn lọc các
nguồn tài liệu trên mạng internet.
• Để định vị nguồn dữ liệu thứ cấp hiệu quả, cần xác định rõ vấn
đề và mục tiêu của cuộc nghiên cứu để quyết định từ khóa phù
hợp. Từ khóa cần chi tiết và phản ảnh chính xác điều người
nghiên cứu cần tìm kiếm.
17
Nguồn dữ liệu thứ cấp
Thực hành nhóm:
1. mỗi nhóm chọn 1 vấn đề cần nghiên cứu thống kê
2. Xác định nội dung cần thống kê
3. Xác định từ khóa tìm kiếm
4. Thực hiện việc tìm kiếm dữ liệu thứ cấp
5. Báo cáo kết quả thực hiện tìm kiếm dữ liệu thứ cấp
18
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 10
Nguồn dữ liệu thứ cấp
Chính Phủ
Bộ Công Thương
Bộ Giáo Dục và Đào Tạo
Bộ Lao động - Thương binh – Xã hội
Bộ Tư Pháp
Bộ Xây Dựng
Tổng Cục Thống Kê
Tổng Cục Thuế
Ngân Hàng Nhà Nước
TP Hà Nội
TP Hải Phòng
TP Đà Nẵng
Tỉnh Đồng Nai
Tỉnh Bình Dương
Tỉnh Bà Rịa-Vũng Tàu
TP Cần Thơ
TP Hồ Chí Minh 19
Nguồn dữ liệu thứ cấp
Cục Thống Kê TPHCM
Cục Thuế TPHCM
Sở Kế Hoạch Đầu Tư TPHCM
Sở Công Thương TPHCM
Cục Hải Quan TPHCM
Sở giao dịch chứng khoán TPHCM
Đại hội Bất Động Sản Du Lịch
Hiệp hội Bất Động Sản TPHCM
Liên đoàn Lao Động TPHCM
uc/
Tập đoàn Điện Lực VN
Tập đoàn Than – Khoáng Sản VN
Tập đoàn Bưu Chính Viễn Thông
Tập đoàn Dệt May Việt Nam
20
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 11
Nguồn dữ liệu thứ cấp
Trang web về thống kê của Ủy Ban Kinh Tế Xã Hội
Châu Á-Thái Bình Dương thuộc Liên Hiệp Quốc
Trang web của ủy ban Thống Kê của Liên Hợp Quốc
Trang web data của Liên Hợp Quốc
Trang web của IMF
Trang web của World Bank
Trang web của Ngân hàng phát triển Châu Á
Trang web của Hiệp hội Bất Động Sản Canada
Trang web hội các nhà phát triển BDS Singapore
Trang web Trung tâm thương mại quốc tế ITC
(www.intracen.org) là trang web chứa một cơ sở dữ
liệu chuyên sâu phục vụ cho công tác nghiên cứu thị
trường, đặc biệt là công tác XTTM, thông tin thu thập
từ trên 180 quốc gia và vùng lãnh thổ.
Trang web của Business Monitor International
Trang web của EuroMonitor International
Trang web của RNCOS Industry Rerearch
Solutions
21
Dữ liệu sơ cấp
• Dữ liệu sơ cấp được thu thập qua các cuộc điều tra khảo sát
• Điều tra thường xuyên, điều tra không thường xuyên
• Điều tra toàn bộ, điều tra không toàn bộ
22
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 12
Dữ liệu sơ cấp
23
Dữ liệu sơ cấp
24
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 13
Dữ liệu sơ cấp
25
Dữ liệu sơ cấp
26
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 14
Dữ liệu sơ cấp
27
Thu thập dữ liệu ban đầu
• Trực tiếp
• Gián tiếp
28
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 15
Kế hoạch điều tra thống kê
• Mục đích điều tra thống kê
• Xác định đối tượng điều tra và đơn vị điều tra
• Nội dung điều tra
• Thời điểm, thời kỳ, thời hạn điều tra
• Biểu điều tra, bản giải thích cách ghi biểu
• Đọc thêm:
– VHLSS 2010 (Điều tra mức sống hộ gia đình VN 2010)
– Viet Pay (Khảo sát thanh toán điện tử)
29
Sai số trong điều tra thống kê
Sai số trong điều tra thống kê là chênh lệch giữa trị số thu
thập được trong điều tra với trị số thực tế của đơn vị điều tra.
• Sai số do đăng ký (sai số thô, không do chọn mẫu)
• Sai số do tính chất đại biểu (sai số do chọn mẫu)
Hạn chế sai số:
• Sai số do đăng ký: làm tốt công tác chuẩn bị, giám sát kiểm tra
kỹ lưỡng
• Sai số do tính chất đại biểu: thiết kế chọn mẫu và kiểm tra thực
hiện việc chọn mẫu
30
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 16
Thực hành điều tra thống kê
Bài tập nhóm:
Tiếp theo bài tập tìm dữ liệu thứ cấp, mỗi nhóm dựa trên các dữ
liệu thứ cấp đã thu thập, xác định rõ hơn vấn đề cần nghiên cứu
thống kê của nhóm, cụ thể
– Mục đích nghiên cứu điều tra thống kê
– Xác định đối tượng điều tra và đơn vị điều tra
– Nội dung điều tra
– Thời điểm, thời kỳ, thời hạn điều tra
– Biểu điều tra, bản giải thích cách ghi biểu
– Tiến hành thu thập dữ liệu
31
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 3
TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU
BẰNG BẢNG & BIỂU ĐỒ
Hoàng Trọng
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 17
Lý thuyết phân tổ
Khái niệm
Các bước tiến hành phân tổ:
– Lựa chọn tiêu thức/biến
– Xác định số tổ
• Tiêu thức/biến định tính: không ghép & ghép
• Tiêu thức/biến định lượng: không ghép & ghép
– Kết quả là bảng phân tổ
33
Lý thuyết phân tổ
Số người có thu nhập trong hộ gia đình
Số người Tần số
Tần suất
%
Tần suất
tích lũy %
0 5 0,5 0,5
1 282 27,2 27,7
2 373 36,0 63,7
3 145 14,0 77,7
4 105 10,1 87,8
5 72 6,9 94,7
6 30 2,9 97,6
7 16 1,5 99,1
8 4 0,4 99,5
9 3 0,3 99,8
10 1 0,1 99,9
11 1 0,1 100,0
Tổng 1037 100,0
Số người Tần số %
Tần suất
tích lũy %
0 5 0,5 0,5
1 282 27,2 27,7
2 373 36,0 63,6
3 145 14,0 77,6
4 105 10,1 87,8
5-6 102 9,8 97,6
7 trở lên 25 2,4 100,0
Tổng 1037 100,0
34
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 18
Lý thuyết phân tổ
Phương pháp nhánh và lá
Các dữ liệu thu thập được sẽ được tách thành hai phần: phần
nhánh và phần lá. Việc phân chia này có thể linh hoạt
Tuổi của 30 sinh viên ngành KTKT
28 23 30 24 19 21 39 22 22
31 37 33 20 30 35 21 26 27
25 29 27 21 25 28 26 29 29
22 32 27
Tuổi của 30 sinh viên ngành QTKD
31 23 36 24 20 21 42 33 30
31 37 33 19 40 45 35 26 34
29 38 27 39 25 28 26 33 31
22 32 37
35
Lý thuyết phân tổ
1 |
2 |
3 |
1 | 9
2 | 8 3 4 1 2 2 0 1 6 7 5 9 7 1 5 8 6 9 9 2 7
3 | 0 9 1 7 3 0 5 2
1 | 9
2 | 0 1 1 1 2 2 2 3 4 5 5 6 6 7 7 7 8 8 9 9 9
3 | 0 0 1 2 3 5 7 9
Xác định
3 nhánh
Biểu đồ nhánh lá
ban đầu
Biểu đồ nhánh lá
hoàn chỉnh
36
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 19
Bảng kết hợp
Công việc của chủ hộ
QTân Bình Q6 Q11
Tần
số
%
cột
Tần
số
Tần
số
Tần
số
Tần
số
Có hoạt động
kinh tế Làm việc trong nhà máy 18 14,3 91 10,5 5 11,6
Làm nghề tự do 39 31,0 187 21,5 11 25,6
Làm việc trong các CQNN 2 1,6 30 3,5 2 4,7
làm việc trong các CH 3 2,4 22 2,5 1 2,3
Làm việc trong VP 2 0,2
Buôn bán nhỏ 4 3,2 39 4,5 1 2,3
Bán hàng rong 5 4,0 45 5,2 1 2,3
Làm việc tại nhà 10 7,9 88 10,1 7 16,3
Tự kinh doanh 8 6,3 37 4,3
Tổng 89 70,6 541 62,3 28 65,1
Không hoạt
động kinh tế Thu nhập từ nguồn khác 6 4,8 41 4,7
Không việc làm 31 24,6 286 32,9 15 34,9
Tổng 37 29,4 327 37,7
Tổng 126 100,0 868 100,0 43 100,0
37
Biểu đồ thống kê
Dùng số kết hợp với hình vẽ, đường nét và màu sắc để trình bày
Theo nội dung phản ánh của đồ thị thống kê, có các loại:
• Đồ thị kết cấu.
• Đồ thị phát triển
• Đồ thị hoàn thành kế hoạch hoặc định mức
• Đồ thị liên hệ
• Đồ thị so sánh
• Đồ thị phân phối
Theo hình thức biểu hiện, có các loại:
• Biểu đồ hình cột
• Biểu đồ tượng hình
• Biểu đồ diện tích (hình tròn, hình vuông, hình chữ nhật)
• Đồ thị đường gấp khúc (đường động thái)
• Bản đồ thống kê
38
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 20
Biểu đồ thống kê
39
Bản đồ thống kê
Dùng màu sắc thể hiện
phân loại và độ đậm nhạt
để thể hiện mức độ
Chuù giaûi
32.683 ñeán 98.717
98.718 ñeán 206.741
206.742 ñeán 337.631
337.632 ñeán 678.006
678.007 ñeán 2,907.789
Bản đồ mật độ dân số
của các tỉnh/thành phố
40
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 21
Thực hành
• Tiến hành thu thập dữ liệu của đề tài nhóm
• Dùng phần mềm thống kê, nhập liệu vào
• Chạy ra bảng và vẽ biểu đồ thống kê
• Trình bày kết quả (mỗi nhóm tối đa 10 phút)
41
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 4
MÔ TẢ DỮ LIỆU BẰNG
CÁC ĐẶC TRƯNG ĐO LƯỜNG
Hoàng Trọng
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 22
Số tuyệt đối
• Số tuyệt đối là chỉ tiêu biểu hiện qui mô, khối lượng của
hiện tượng kinh tế - xã hội trong điều kiện thời gian và địa
điểm cụ thể.
• Ví dụ: Theo kết quả sơ bộ của cuộc Tổng điều tra dân số thì
Tổng số dân của nước ta có lúc 0 giờ 1/4/2009 là 85.789.573,
tăng 9,47 triệu người so với năm 1999 là 76.324.753 người.
43
Số tuyệt đối
• Số tuyệt đối thời điểm: phản ánh qui mô, khối lượng của
hiện tượng tại một thời điểm nhất định.
• Số tuyệt đối thời kỳ: phản ánh qui mô, khối lượng của hiện
tượng trong một khoảng thời gian nhất định.
• Đơn vị tính số tuyệt đối:
– Đơn vị hiện vật: cái, chiếc, con, trái, củ, người, căn
– Đơn vị hiện vật quy đổi: lương thực quy ra lúa
– Đơn vị hiện vật quy ước: mét, mét vuông, mét khối, lít , kg,
– Đơn vị tiền tệ: đồng, USD
– Đo vị thời gian lao động: giờ công, ngày công,
44
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 23
Số tương đối
• chỉ tiêu biểu hiện quan hệ so sánh (tỷ số) giữa hai mức độ
của hiện tượng nghiên cứu.
• Các loại số tương đối:
– Động thái: phản ảnh thay đổi qua thời gian
– Kế hoạch:
• Nhiệm vụ kế hoạch: so mức kế hoạch (nhiệm vụ) với mức đạt
ở lần trước
• Thực hiện kế hoạch: so mức thực hiện được với mức kế hoạch
đề ra
– Kết cấu: mức độ bộ phận so với toàn bộ, phản ảnh tỷ trọng
– Cường độ: so giữa hai mức độ của 2 hiện tượng (chỉ tiêu) khác
nhau
– Không gian: so sánh giữa các không gian khác nhau
45
Đo lường khuynh hướng tập trung
Tìm ra mức độ đại diện theo một tiêu thức/biến.
Chap 3-46
Center and Location
Mean
Median
Mode
Other Measures of
Location
Geometric mean
Describing Data Numerically
Variation
Variance
Standard Deviation
Coefficient of
Variation
Range
Percentiles
Interquartile Range
Quartiles
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 24
Đo lường khuynh hướng tập trung
Tìm ra mức độ đại diện theo một tiêu thức/biến.
Khuynh höôùng taäp trung
Trung bình Trung vò Mode
Trung bình hình hoïc
1
1
n
i
i
N
i
i
X
X
n
X
N
µ
=
=
=
=
∑
∑
n
n321 x...xxxGM =
47
Đo lường khuynh hướng tập trung
1. Trung bình cộng
• Trung bình mẫu
∑
∑
=
=
= k
1i
i
k
1i
ii
f
fx
x
∑
∑
=
=
= k
1i
i
k
1i
ii
f
fm
x
Tính từ dữ liệu gốc
Tính từ dữ liệu đã phân tổ
Tính từ dữ liệu đã phân tổ
có khoảng cách tổ
n
x
x
n
1i
i∑
=
=
48
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 25
Đo lường khuynh hướng tập trung
1. Trung bình cộng
• Trung bình tổng thể
N
fx
k
1i
ii∑
=
=µ
N
fm
k
1i
ii∑
=
=µ
Tính từ dữ liệu gốc
Tính từ dữ liệu đã phân tổ
Tính từ dữ liệu đã phân tổ
có khoảng cách tổ
N
x
N
1i
i∑
=
=µ
49
Đo lường khuynh hướng tập trung
1. Trung bình cộng
• Trung bình cộng chịu ảnh hưởng của các trị số bất thường
0 1 2 3 4 5 6 7 8 9 10 12 14
Trung bình = 5 Trung bình = 6
0 1 2 3 4 5 6 7 8 9 10
50
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 26
Đo lường khuynh hướng tập trung
2. Trung vị (median)
• Tính trung vị
Số quan sát lẻ
Số quan sát chẵn
Tính từ tài liệu phân tổ
2
xx
M
1
2
n
2
n
e
+
+
=
Me = X(n+1)/2
Me
1Me
Me(min)Mee f
S
2
n
hxM
−
−
+=
51
Đo lường khuynh hướng tập trung
2. Trung vị (median)
• Số trung vị không chịu ảnh hưởng bởi các trị số bất
thường (outliers)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Me = 5 Me = 5
52
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 27
Đo lường khuynh hướng tập trung
3. Mốt (mode)
• Đo lường khuynh hướng tập trung
• Mode là giá trị có tần số lớn nhất
• Mode không chịu ảnh hưởng bởi các giá trị đột biến
• Một dãy số có thể có nhiều Mode
• Một dãy số có thể không có Mode
• Mode có thể xác định cho dữ liệu định tính
53
Đo lường khuynh hướng tập trung
3. Mốt (mode)
Tính Mode từ dữ liệu đã phân tổ:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Mode có hai trị số: 9 và 12
0 1 2 3 4 5 6
Không có Mode
)ff()ff(
ff
hxMode
1MM1MM
1MM
M(min)Mo
0000
00
0
+−
−
−+−
−
+=
54
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 28
Đo lường khuynh hướng tập trung
4. Trung bình nhân/ trung bình hình học (geometric mean)
• Áp dụng cho các trị số có quan hệ tích số
• Dùng để tính tốc độ phát triển trung bình từ các số tương
đối động thái
n
n321 x...x.x.xx =
55
Các thước đo vị trí khác
Other Measures of
Location
Percentiles
Phân vị
Quartiles
Tứ phân vị
1st quartile = 25th percentile
2nd quartile = 50th percentile
= median
3rd quartile = 75th percentile
The pth percentile in a data array:
• p% are less than or equal to this
value
• (100 – p)% are greater than or
equal to this value
(where 0 ≤ p ≤ 100)
56
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 29
Các thước đo vị trí khác
• Phân vị thứ p trong một tập dữ liệu có n trị số là trị số ở vị trí
thứ I được định nghĩa như sau:
Ví dụ: Phân vị thứ 60 trong một tập dữ liệu có 19 trị số quan
sát là trị số ở vị trí thứ 12:
1)(n
100
pi +=
121)(19
100
601)(n
100
pi =+=+=
Phân vị (percentile)
57
Các thước đo vị trí khác
Tứ phân vị (quartile)
• Tứ phân vị chia tập dữ liệu đã xếp thứ tự thành 4 nhóm có số
lượng trị số bằng nhau.
25% 25% 25% 25%
Tập dữ liệu đã xếp thứ tự: 11 12 13 16 16 17 18 21 22
Ví dụ: tìm tứ phân vị thứ nhất
(n = 9)
Q1 = phân vị thứ 25, do đó (9+1) = 2.5 position
Vì vậy sử dụng trị số ở giữa vị trí 2 và vị trí 3: Q1 = 12.5
25
100
Q1 Q2 Q3
58
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 30
Minimum 1st Median 3rd Maximum
Quartile Quartile
Các thước đo vị trí khác
Biểu đồ hộp và râu (Box and whisker plot)
Là công cụ đồ học thể hiện 5 số trị số tóm tắt :
Minimum -- Q1 -- Median -- Q3 -- Maximum
Hình hộp và đường trung tâm ở ngay vị trí chính giữa cho thấy
dữ liệu đối xứng quanh trung vị
Minimum 1st Median 3rd Maximum
Quartile Quartile
25% 25% 25% 25%
59
Đo lường độ phân tán/biến thiên
Same center,
different variation
60
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 31
Đo lường độ phân tán/biến thiên
Variation
Variance Standard Deviation Coefficient of
Variation
Population
Variance
Sample
Variance
Population
Standard
Deviation
Sample
Standard
Deviation
Range
Interquartile
Range
61
Đo lường độ phân tán/biến thiên
Biến thiên
Phương sai Độ lệch chuẩn Hệ số biến thiên
Phương sai
tổng thể
Phương sai
mẫu
Độ lệch chuẫn
tổng thể
Độ lệch chuẩn
mẫu
Khoảng
biến thiên
Độ trải giữa
62
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 32
Đo lường độ phân tán/biến thiên
1. Khoảng biến thiên:
2. Độ trải giữa:
3. Phương sai:
4. Độ lệch chuẩn:
5. Hệ số biến thiên:
Sử dụng CV khi so sánh 2 tập dữ liệu có đơn vị tính khác nhau hay trung bình
chênh lệch nhau nhiều
minmax xxR −=
RI = Q3 - Q1
( )
N
x
N
i
i
2
12
∑
=
−
=
µ
σ
1
)(
1
2
2
−
−
=
∑
=
n
xx
s
n
i
i
2σσ =
1
)(
1
2
−
−
=
∑
=
n
xx
s
n
i
i
%100.µ
σ
=CV %100
x
sCV =
63
Đo lường độ phân tán/biến thiên
Mean = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Data B
Data A
Mean = 15.5
s = .9258
11 12 13 14 15 16 17 18 19 20 21
Mean = 15.5
s = 4.57
Data C
64
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 33
Đo lường độ phân tán/biến thiên
Quy tắc thực nghiệm
• Đối với những tổng thể lớn, phân phối của các giá trị có dạng gần
giống hình chuông cân đối (có thể dùng đồ thị Histogram để xem
xét), phân phối chuẩn được sử dụng để mô tả hình dáng của phân
phối.
65
Đo lường độ phân tán/biến thiên
Quy tắc Tchebychev
• Bất kỳ một tổng thể nào với trung bình là µ và độ lệch tiêu chuẩn là
σ, thì có ít nhất 100(1-1/m2)% giá trị rơi vào khoảng µ ± mσ, với m >
1.
m 1,5 2 2,5 3
100(1-1/m2)% 55,6% 75% 84% 88,9%
66
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 34
Hình dáng phân phối của tập dữ liệu
Chap 3-67
Mean = Median = ModeMean < Median < Mode Mode < Median < Mean
Right-SkewedLeft-Skewed Symmetric
(Longer tail extends to left) (Longer tail extends to right)
Diễn tả dữ liệu được phân phối như thế nào
Đối xứng hay lệch
Lệch phảiLệch trái Đối xứng
Hình dáng phân phối của tập dữ liệu
Diễn tả dữ liệu được phân phối như thế nào
Đối xứng hay lệch
Right-SkewedLeft-Skewed Symmetric
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
68
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 35
Chuẩn hóa dữ liệu
Chuyển các dữ liệu với đo vị đo lường thực tế về đơn vị đo lường
là độ lệch chuẩn.
Khi có nhiều biến số có đơn vị tính khác nhau, chuẩn hóa dữ liệu
giúp so sánh được biến thiên của chúng
Với dữ liệu của tổng thể:
Với dữ liệu của mẫu quan sát:
σ
µx
z
−
=
s
xx
z
−
=
69
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 5
ƯỚC LƯỢNG THỐNG KÊ
Hoàng Trọng
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 36
Ước lượng điểm & ước lượng khoảng
71
• Ước lượng điểm: ước lượng bằng 1 trị số
• Ước lượng khoảng: ước lượng bằng 1 khoảng trị số, gọi là
khoảng tin cậy, có thêm thông tin về khả năng biến thiên
Point Estimate
Lower
Confidence
Limit
Upper
Confidence
Limit
Width of
confidence interval
Ước lượng điểm
Chúng ta có thể ước lượng tham số tổng thể với 1 trị số của mẫu (UL điểm)
Trung bình
Tỷ lệ pp
xμ
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 37
Ước lượng khoảng
• Ước lượng khoảng có tính tới biến thiên của tham số mẫu từ
mẫu này so với mẫu khác.
• Chỉ dựa vào một mẫu quan sát
• Cho biết thông tin về tham số tổng thể có thể có trị số trong
khoảng ước lượng, và không bao giờ chắc chắn được 100%
Ước lượng khoảng
• Công thức chung của ước lượng khoảng
• Hệ số tin cậy suy từ độ tin cậy mong muốn
• Ví dụ với độ tin cậy 95% (1 – α) =0,95, từ bảng phân phối
chuẩn hệ số tin cậy là 1,96
Point Estimate ± (Critical Value) x (Standard Error)
UL điểm ± (hệ số tin cậy) x (Sai số chuẩn)
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 38
Ước lượng khoảng
• Ước lượng khoảng tham số của 1 tổng thể
Population
Mean
σ Unknown
Confidence
Intervals
Population
Proportion
σ Known
n
stx /2α±
n
σ
zx
α/2±
n
)p(p
zp /2
−
± α
1
Ước lượng khoảng
• Ước lượng khoảng khác biệt tham số giữa 2 tổng thể
Mean
difference
paired
samples
Difference
Proportion
difference
independent
samples
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 39
Ước lượng khoảng
• Ước lượng khoảng khác biệt tham số giữa 2 tổng thể
y
2
y
x
2
x
2/yx
y
2
y
x
2
x
2/
nn
z)yx(
nn
z)yx( σ+σ+−≤µ−µ≤σ+σ−− αα
n
s
td -
n
s
t-d d2/,1-nyxd2/,1-n αα +≤µµ≤
Mean
difference
paired
samples
Difference
Proportion
difference
independent
samples
Ước lượng khoảng
• Ước lượng khoảng khác biệt tham số giữa 2 tổng thể
Mean
difference
paired
samples
Difference
Proportion
difference
independent
samples
yn
ypyp
xn
xpxpzypxpyPxP
yn
ypyp
xn
xpxpzypxp
)ˆ1(ˆ)ˆ1(ˆ
2/)ˆˆ(
)ˆ1(ˆ)ˆ1(ˆ
2/)ˆˆ(
−
+
−
+−≤−≤
−
+
−
−− αα
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 40
Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế
(Applied Statistics for Business & Economics)
Chương 6
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Hoàng Trọng
Giả thuyết không và giả thuyết đối
H0: ϴ ≥ ϴo
H1: ϴ < ϴo 0
H0: ϴ ≤ ϴo
H1: ϴ > ϴo
H0: ϴ = ϴo
H1: ϴ ≠ ϴo
α
α
/2
Represents
critical value
Lower tail test
Level of significance = α
α
0
0
α/2α
Upper tail test
Two tailed test
Rejection
region is
shaded
Điều chúng ta muốn chứng minh là đúng được đặt làm giả thuyết đối
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 41
Hai loại sai lầm
State of Nature
Decision
Do Not
Reject
H 0
No error
(1 - )α
Type II Error
( β )
Reject
H 0
Type I Error
( )α
Possible Hypothesis Test Outcomes
H0 FalseH0 True
Key:
Outcome
(Probability) No Error
( 1 - β )
Sai lầm loại I và sai lầm loại II không thể xảy ra cùng 1 lúc
Sai lầm loại I chỉ xảy ra nếu H0 đúng
Sai lầm loại II chỉ xảy ra nếu H0 sai
Nếu xác suất phạm sai lầm loại I error probability ( α ) tăng lên thì
xác suất phạm sai lầm loại II ( β ) giảm
Các bước thực hiện kiểm định
1. Xác định tổng thể muốn nghiên cứu
2. Xây dựng giả thuyết không và giả thuyết đối
3. Xác định mức ý nghĩa
4. Xác định miền bác bỏ
5. Thu thập dữ liệu và tính toán đại lượng kiểm định
6. Quyết định bác bỏ hay chấp nhận giả thuyết, kết luận
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 42
Kiểm định GT về trung bình tổng thể
σ Known
Large
Samples
σ Unknown
Hypothesis
Tests for µ
Small
Samples
σ Known
Large
Samples
σ Unknown
Hypothesis
Tests for µ
Small
Samples
The test statistic is:
n
σ
µx
z
−
=
Kiểm định GT về trung bình tổng thể
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 43
σ Known
Large
Samples
σ Unknown
Hypothesis
Tests for µ
Small
Samples
The test statistic is:
n
s
µxt 1n
−
=
−
But is sometimes
approximated
using a z:
n
σ
µx
z
−
=
Kiểm định GT về trung bình tổng thể
Large
Samples
σ Unknown
Hypothesis
Tests for µ
Small
Samples
The test statistic is:
n
s
µxt 1n
−
=
−
(The population must be
approximately normal)
σ Known
Kiểm định GT về trung bình tổng thể
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 44
Quy tắc quyết định:
Kiểm định GT về trung bình tổng thể
Giả thuyết Bác bỏ Ho khi:
Ho : µ = µo
H1 : µ ≠ µo
t > tn-1,α/2 hoặc t < -tn-1, α/2
hay > tn-1,α/2
Ho : µ = µo hoặc Ho: µ ≥ µo
H1 : µ < µo
t < -tn-1, α
Ho : µ = µo hoặc Ho: µ ≤ µo
H1 : µ > µo
t > tn-1, α
t
Kiểm định trung bình dùng giá trị p (P value):
• Sau khi tính được đại lượng thống kê dùng để kiểm định (thường là z
hay t), dùng bảng tra hay hàm trên chương trình máy tính tính tra
ngược ra giá trị p
• Giá trị p là xác suất tính ra được trị số của đại lượng kiểm định vượt
quá ( ≤ hay ≥ ) trị số của mẫu quan sát nếu như Ho đúng.
• Giá trị p là mức ý nghĩa nhỏ nhất mà ở đó giả thuyết Ho bị bác bỏ, hay
nói một cách đơn giản, giá trị P là xác suất phạm sai lầm khi bác bỏ
Ho
• Kết quả xử lý số liệu bằng máy tính thường luôn thể hiện giá trị p
• Nếu qui định trước mức ý nghĩa α thì có thể dùng p-value để kết luận
theo α. Khi đó nguyên tắc kiểm định như sau:
– Nếu p-value < α thì bác bỏ Ho, thừa nhận H1.
– Nếu p-value ≥ α thì chưa có cơ sở để bác bỏ Ho.
Kiểm định GT về trung bình tổng thể
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 45
Kiểm định GT về tỷ lệ tổng thể
• Dùng cho các dữ liệu phân loại, có 2 khả năng:
– “thành công” nếu có đặc điểm
– “thất bại” nếu không có đặc điểm
• Tỷ lệ thành công trong tổng thể được ký hiệu là p
• Tỷ lệ thành công trong mẫu được ký hiệu là ̂ hay ̅
Khi cở mẫu đủ lớn n ̅ và n(1- ̅) ít nhất là 5, ̅ có thể được xấp xỉ
bởi phân phối bình thường với trung bình và độ lệch chuẩn là
Phân phối của ̅ là bình thường nên
đại lượng kiểm định là đại lượng z
mau co
mau trongcong thanhso
n
xp ==
pµP =
n
p)p(1
σp
−
=
n
)p(p
pp
z
−
−
=
1
Kiểm định GT về tỷ lệ tổng thể
Quy tắc quyết định:
Giả thuyết Bác bỏ Ho khi:
Ho : p = po
H1 : p ≠ po
z > zα/2 hoặc z < -zα/2
hay
Ho : p = po hoặc Ho: p ≥ p0
H1 : p < po
z < -zα
Ho : p = po hoặc Ho: p ≤ p0
H1 : p > po
z > zα
2/zz α>
Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 46
Kiểm định GT về khác biệt hai TB
Mean
difference
paired
samples
Difference
Proportion
difference
independent
samples
nyn
Dyx
z
2
y
x
2
x
0
σ
+
σ
−−
=
)
n
1
n
1(s
Dyx
t
yx
2
0
+
−−
=
Đại lượng quyết định:
Kiểm định GT về khác biệt hai TB
Quy tắc quyết định:
Giả thuyết Bác bỏ Ho khi:
Ho : µx - µy = D0
H1 : µx - µy ≠ D0
t >
Hoặc t < -
Hay >
Ho :
Các file đính kèm theo tài liệu này:
- bai_giang_thong_ke_ung_dung_trong_kinh_doanh_va_kinh_te_chuo.pdf