Bài giảng Thống kê ứng dụng trong kinh doanh và Kinh tế - Chương 1: Tổng quan về thống kê

Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 1 Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế (Applied Statistics for Business & Economics) Chương 1 TỔNG QUAN VỀ THỐNG KÊ Hoàng Trọng Thống kê là gì? • Tại sao phải “thống kê” • Thống kê để làm gì? • Thống kê là số liệu? • Thống kê là phương pháp? • Thống kê là hệ thống các phương pháp dùng để thu thập, xử lý và phân tích các con số (mặt lượng) của những hiện tượng số lớn để tìm hiểu bản chất và tính quy

pdf86 trang | Chia sẻ: huongnhu95 | Lượt xem: 669 | Lượt tải: 0download
Tóm tắt tài liệu Bài giảng Thống kê ứng dụng trong kinh doanh và Kinh tế - Chương 1: Tổng quan về thống kê, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
luật vốn có của chúng (mặt chất) trong điều kiện thời gian và không gian cụ thể. 2 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 2 Hai lĩnh vực thống kê • Thống kê mô tả: – Thu thập số liệu – Tính toán các đặc trưng đo lường – Mô tả, trình bày dữ liệu • Thống kê suy diễn – Ước lượng, kiểm định thống kê – Phân tích mối liên hệ – Dự đoán 3 Ứng dụng của thống kê 4 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 3 Ứng dụng của thống kê 5 Ứng dụng thống kê trong KT & KD • Kinh tế: – Dân số, lao động, tài nguyên – Giá cả, lạm phát – Sản xuất, thương mại, tiêu dùng – Xuất nhập khẩu, cán cân thương mại • Kinh doanh – Quy mô thị trường, phân khúc – Nhu cầu, giá cả, phân phối, – Đo lường cạnh tranh – Đo lường kết quả kinh doanh, tiếp thị – Dự báo kinh doanh 6 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 4 Một số KN thường dùng trong thống kê • Tổng thể (population): tập hợp các đơn vị/phần tử cần phân tích/nghiên cứu • Đơn vị tổng thể (unit): phần tử nhỏ nhất tạo thành tổng thể • Mẫu: một phần của tổng thể được chọn ra để thu thập thông tin • Tiêu thức, tiêu chí, biến: đặc điểm của đơn vị tổng thể dùng để quan sát hay thu thập dữ liệu – Tiêu thức/tiêu chí định tính: đặc điểm biểu hiện không phải là số – Tiêu thức/tiêu chí định lượng: đặc điểm biểu hiện là các trị số, có thể rời rạc hay liên tục • Chỉ tiêu: trị số phản ảnh đặc điểm/tính chất trong điều kiện thời gian và không gián xác định – Chỉ tiêu khối lượng: biểu hiện quy mô khối lượng – Chỉ tiêu chất lượng: biểu hiện tính chất, mức độ phổ biến 7 Quy trình nghiên cứu thống kê Xác định vấn đề nghiên cứu, mục đích, nội dung, đối tượng nghiên cứu. Xây dựng hệ thống các khái niệm, chỉ tiêu thống kê Điều tra thống kê Xử lý số liệu: Tập hợp, sắp xếp số liệu. Chọn các phần mềm xử lý số liệu. Phân tích thống kê sơ bộ. Lựa chọn các phương phápphân tích thống kê thích hợp. Phân tích và giải thích kết quả. Dự đoán xu hướng phát triển. Báo cáo và truyền đạt kết quả nghiên cứu 8 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 5 Các loại thang đo thang đo danh nghĩa thang đo tỉ lệ thang đo thứ bậc thang đo khoảng cách • Thang danh nghĩa: dùng để phân loại • Thang thứ bậc phản ảnh sự hơn kém • Thang khoảng cách phản ảnh mức độ hơn kém • Thang tỉ lệ phản ánh mức độ hơn kém + so sánh tỉ lệ 9 Giới thiệu phần mềm SPSS • Phần mềm xử lý phân tích thống kê phổ biến trong lĩnh vực khoa học xã hội • Được sử dụng nhiều trong quản trị, kinh doanh, tiếp thị • Tương thích với nhiều cơ sở dữ liệu có sẵn • Trang web tham khảo: www.spss.com hay • • Tài liệu tiếng Việt: Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008) Phân tích dữ liệu nghiên cứu với SPSS, NXB Hồng Đức 10 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 6 Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế (Applied Statistics for Business & Economics) Chương 2 THU THẬP DỮ LIỆU THỐNG KÊ Hoàng Trọng Xác định dữ liệu cần thu thập • Tập trung vào dữ liệu cần thiết và hữu ích • Tiết kiệm thời gian, công sức và chi phí • Phải xuất phát từ vấn đề nghiên cứu và mục tiêu nghiên cứu TK Hiểu ngành học Kết quả học tập Sức khỏe Điểm đầu vào Thích ngành học Đi làm thêm 12 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 7 Dữ liệu định tính và dữ liệu định lượng Dö õ lie äu Dö õ lie äu ñ òn h lö ô ïn g Dö õ lie äu ñ òn h tín h th an g ñ o d an h n g h óa th an g ñ o tæ le ä th an g ñ o th ö ù b aäc th an g ñ o k h oaûn g c aùc h • Dữ liệu định tính: thu thập từ thang đo danh nghĩa và thứ bậc -> không tính được trị trung bình • Dữ liệu định lượng: thu thập từ thang đo khoảng cách và tỉ lệ -> tính được trị trung bình Dữ liệu định tính và dữ liệu định lượng T h ô øi g ian laøm th e âm Ke át q u aû h oïc taäp L oaïi k ie åm ñ òn h Ñòn h tín h  Dö ô ùi 6 g iô ø/tu aàn  6 -1 2 g iô ø/tu aàn  tre ân 1 2 g iô ø/tu aàn Ñòn h tín h  T ru n g b ìn h  Kh aù  Gioûi Ph i th am s oá Ñòn h tín h  Dö ô ùi 6 g iô ø/tu aàn  6 -1 2 g iô ø/tu aàn  tre ân 1 2 g iô ø/tu aàn Ñòn h lö ô ïn g  Ñie åm tru n g b ìn h h oïc taäp Ph aân tíc h p h ö ô n g s ai 1 y e áu toá Ñòn h lö ô ïn g Soá g iô ø laøm th e âm: _ _ _ _ _ g iô ø/tu aàn Ñòn h lö ô ïn g  Ñie åm tru n g b ìn h h oïc taäp Hoài q u y v aø k ie åm ñ òn h F 14 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 8 Dữ liệu thứ cấp và dữ liệu sơ cấp • Dữ liệu thứ cấp: nguồn có sẵn, đã được tổng hợp, xử lý • Điểm mạnh: có sẵn, nhanh, ít tốn kém • Điểm yếu: ít chi tiết, ít đáp ứng đúng nhu cầu nghiên cứu thống kê • Dữ liệu sơ cấp: thu thập trực tiếp, ban đầu, từ đối tượng nghiên cứu • Điểm mạnh: phong phú, đáp ứng đúng nhu cầu nghiên cứu • Điểm yếu: cần thời gian, tốn kém 15 Nguồn dữ liệu thứ cấp • Nội bộ: từ các phòng ban, bộ phận; các số liệu báo cáo từ các cuộc điều tra khảo sát trước đây. • Cơ quan thống kê nhà nước: Tổng cục thống kê, Cục thống kê Tỉnh/ Thành phố • Cơ quan chính phủ: các cơ quan trực thuộc chính phủ (Bộ, cơ quan ngang bộ, Ủy ban nhân dân các cấp • Báo, tạp chí • Các tổ chức, hiệp hội, viện nghiên cứu • Các công ty nghiên cứu và cung cấp thông tin 16 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 9 Nguồn dữ liệu thứ cấp • Nhiều dữ liệu thứ cấp đã được nhiều cơ quan chính phủ, các tổ chức, các đơn vị nghiên cứu, các doanh nghiệp, trường học đưa lên mạng internet và người nghiên cứu có thể tìm thấy tại các trang web của các đơn vị này hay tại các cơ sở dữ liệu trên mạng internet. • Dùng các máy tìm kiếm (search engine) như google, yahoo và các từ khóa (keywords) phù hợp dò tìm và chọn lọc các nguồn tài liệu trên mạng internet. • Để định vị nguồn dữ liệu thứ cấp hiệu quả, cần xác định rõ vấn đề và mục tiêu của cuộc nghiên cứu để quyết định từ khóa phù hợp. Từ khóa cần chi tiết và phản ảnh chính xác điều người nghiên cứu cần tìm kiếm. 17 Nguồn dữ liệu thứ cấp Thực hành nhóm: 1. mỗi nhóm chọn 1 vấn đề cần nghiên cứu thống kê 2. Xác định nội dung cần thống kê 3. Xác định từ khóa tìm kiếm 4. Thực hiện việc tìm kiếm dữ liệu thứ cấp 5. Báo cáo kết quả thực hiện tìm kiếm dữ liệu thứ cấp 18 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 10 Nguồn dữ liệu thứ cấp Chính Phủ Bộ Công Thương Bộ Giáo Dục và Đào Tạo Bộ Lao động - Thương binh – Xã hội Bộ Tư Pháp Bộ Xây Dựng Tổng Cục Thống Kê Tổng Cục Thuế Ngân Hàng Nhà Nước TP Hà Nội TP Hải Phòng TP Đà Nẵng Tỉnh Đồng Nai Tỉnh Bình Dương Tỉnh Bà Rịa-Vũng Tàu TP Cần Thơ TP Hồ Chí Minh 19 Nguồn dữ liệu thứ cấp Cục Thống Kê TPHCM Cục Thuế TPHCM Sở Kế Hoạch Đầu Tư TPHCM Sở Công Thương TPHCM Cục Hải Quan TPHCM Sở giao dịch chứng khoán TPHCM Đại hội Bất Động Sản Du Lịch Hiệp hội Bất Động Sản TPHCM Liên đoàn Lao Động TPHCM uc/ Tập đoàn Điện Lực VN Tập đoàn Than – Khoáng Sản VN Tập đoàn Bưu Chính Viễn Thông Tập đoàn Dệt May Việt Nam 20 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 11 Nguồn dữ liệu thứ cấp Trang web về thống kê của Ủy Ban Kinh Tế Xã Hội Châu Á-Thái Bình Dương thuộc Liên Hiệp Quốc Trang web của ủy ban Thống Kê của Liên Hợp Quốc Trang web data của Liên Hợp Quốc Trang web của IMF Trang web của World Bank Trang web của Ngân hàng phát triển Châu Á Trang web của Hiệp hội Bất Động Sản Canada Trang web hội các nhà phát triển BDS Singapore Trang web Trung tâm thương mại quốc tế ITC (www.intracen.org) là trang web chứa một cơ sở dữ liệu chuyên sâu phục vụ cho công tác nghiên cứu thị trường, đặc biệt là công tác XTTM, thông tin thu thập từ trên 180 quốc gia và vùng lãnh thổ. Trang web của Business Monitor International Trang web của EuroMonitor International Trang web của RNCOS Industry Rerearch Solutions 21 Dữ liệu sơ cấp • Dữ liệu sơ cấp được thu thập qua các cuộc điều tra khảo sát • Điều tra thường xuyên, điều tra không thường xuyên • Điều tra toàn bộ, điều tra không toàn bộ 22 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 12 Dữ liệu sơ cấp 23 Dữ liệu sơ cấp 24 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 13 Dữ liệu sơ cấp 25 Dữ liệu sơ cấp 26 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 14 Dữ liệu sơ cấp 27 Thu thập dữ liệu ban đầu • Trực tiếp • Gián tiếp 28 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 15 Kế hoạch điều tra thống kê • Mục đích điều tra thống kê • Xác định đối tượng điều tra và đơn vị điều tra • Nội dung điều tra • Thời điểm, thời kỳ, thời hạn điều tra • Biểu điều tra, bản giải thích cách ghi biểu • Đọc thêm: – VHLSS 2010 (Điều tra mức sống hộ gia đình VN 2010) – Viet Pay (Khảo sát thanh toán điện tử) 29 Sai số trong điều tra thống kê Sai số trong điều tra thống kê là chênh lệch giữa trị số thu thập được trong điều tra với trị số thực tế của đơn vị điều tra. • Sai số do đăng ký (sai số thô, không do chọn mẫu) • Sai số do tính chất đại biểu (sai số do chọn mẫu) Hạn chế sai số: • Sai số do đăng ký: làm tốt công tác chuẩn bị, giám sát kiểm tra kỹ lưỡng • Sai số do tính chất đại biểu: thiết kế chọn mẫu và kiểm tra thực hiện việc chọn mẫu 30 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 16 Thực hành điều tra thống kê Bài tập nhóm: Tiếp theo bài tập tìm dữ liệu thứ cấp, mỗi nhóm dựa trên các dữ liệu thứ cấp đã thu thập, xác định rõ hơn vấn đề cần nghiên cứu thống kê của nhóm, cụ thể – Mục đích nghiên cứu điều tra thống kê – Xác định đối tượng điều tra và đơn vị điều tra – Nội dung điều tra – Thời điểm, thời kỳ, thời hạn điều tra – Biểu điều tra, bản giải thích cách ghi biểu – Tiến hành thu thập dữ liệu 31 Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế (Applied Statistics for Business & Economics) Chương 3 TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU BẰNG BẢNG & BIỂU ĐỒ Hoàng Trọng Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 17 Lý thuyết phân tổ Khái niệm Các bước tiến hành phân tổ: – Lựa chọn tiêu thức/biến – Xác định số tổ • Tiêu thức/biến định tính: không ghép & ghép • Tiêu thức/biến định lượng: không ghép & ghép – Kết quả là bảng phân tổ 33 Lý thuyết phân tổ Số người có thu nhập trong hộ gia đình Số người Tần số Tần suất % Tần suất tích lũy % 0 5 0,5 0,5 1 282 27,2 27,7 2 373 36,0 63,7 3 145 14,0 77,7 4 105 10,1 87,8 5 72 6,9 94,7 6 30 2,9 97,6 7 16 1,5 99,1 8 4 0,4 99,5 9 3 0,3 99,8 10 1 0,1 99,9 11 1 0,1 100,0 Tổng 1037 100,0 Số người Tần số % Tần suất tích lũy % 0 5 0,5 0,5 1 282 27,2 27,7 2 373 36,0 63,6 3 145 14,0 77,6 4 105 10,1 87,8 5-6 102 9,8 97,6 7 trở lên 25 2,4 100,0 Tổng 1037 100,0 34 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 18 Lý thuyết phân tổ Phương pháp nhánh và lá Các dữ liệu thu thập được sẽ được tách thành hai phần: phần nhánh và phần lá. Việc phân chia này có thể linh hoạt Tuổi của 30 sinh viên ngành KTKT 28 23 30 24 19 21 39 22 22 31 37 33 20 30 35 21 26 27 25 29 27 21 25 28 26 29 29 22 32 27 Tuổi của 30 sinh viên ngành QTKD 31 23 36 24 20 21 42 33 30 31 37 33 19 40 45 35 26 34 29 38 27 39 25 28 26 33 31 22 32 37 35 Lý thuyết phân tổ 1 | 2 | 3 | 1 | 9 2 | 8 3 4 1 2 2 0 1 6 7 5 9 7 1 5 8 6 9 9 2 7 3 | 0 9 1 7 3 0 5 2 1 | 9 2 | 0 1 1 1 2 2 2 3 4 5 5 6 6 7 7 7 8 8 9 9 9 3 | 0 0 1 2 3 5 7 9 Xác định 3 nhánh Biểu đồ nhánh lá ban đầu Biểu đồ nhánh lá hoàn chỉnh 36 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 19 Bảng kết hợp Công việc của chủ hộ QTân Bình Q6 Q11 Tần số % cột Tần số Tần số Tần số Tần số Có hoạt động kinh tế Làm việc trong nhà máy 18 14,3 91 10,5 5 11,6 Làm nghề tự do 39 31,0 187 21,5 11 25,6 Làm việc trong các CQNN 2 1,6 30 3,5 2 4,7 làm việc trong các CH 3 2,4 22 2,5 1 2,3 Làm việc trong VP 2 0,2 Buôn bán nhỏ 4 3,2 39 4,5 1 2,3 Bán hàng rong 5 4,0 45 5,2 1 2,3 Làm việc tại nhà 10 7,9 88 10,1 7 16,3 Tự kinh doanh 8 6,3 37 4,3 Tổng 89 70,6 541 62,3 28 65,1 Không hoạt động kinh tế Thu nhập từ nguồn khác 6 4,8 41 4,7 Không việc làm 31 24,6 286 32,9 15 34,9 Tổng 37 29,4 327 37,7 Tổng 126 100,0 868 100,0 43 100,0 37 Biểu đồ thống kê Dùng số kết hợp với hình vẽ, đường nét và màu sắc để trình bày Theo nội dung phản ánh của đồ thị thống kê, có các loại: • Đồ thị kết cấu. • Đồ thị phát triển • Đồ thị hoàn thành kế hoạch hoặc định mức • Đồ thị liên hệ • Đồ thị so sánh • Đồ thị phân phối Theo hình thức biểu hiện, có các loại: • Biểu đồ hình cột • Biểu đồ tượng hình • Biểu đồ diện tích (hình tròn, hình vuông, hình chữ nhật) • Đồ thị đường gấp khúc (đường động thái) • Bản đồ thống kê 38 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 20 Biểu đồ thống kê 39 Bản đồ thống kê Dùng màu sắc thể hiện phân loại và độ đậm nhạt để thể hiện mức độ Chuù giaûi 32.683 ñeán 98.717 98.718 ñeán 206.741 206.742 ñeán 337.631 337.632 ñeán 678.006 678.007 ñeán 2,907.789 Bản đồ mật độ dân số của các tỉnh/thành phố 40 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 21 Thực hành • Tiến hành thu thập dữ liệu của đề tài nhóm • Dùng phần mềm thống kê, nhập liệu vào • Chạy ra bảng và vẽ biểu đồ thống kê • Trình bày kết quả (mỗi nhóm tối đa 10 phút) 41 Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế (Applied Statistics for Business & Economics) Chương 4 MÔ TẢ DỮ LIỆU BẰNG CÁC ĐẶC TRƯNG ĐO LƯỜNG Hoàng Trọng Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 22 Số tuyệt đối • Số tuyệt đối là chỉ tiêu biểu hiện qui mô, khối lượng của hiện tượng kinh tế - xã hội trong điều kiện thời gian và địa điểm cụ thể. • Ví dụ: Theo kết quả sơ bộ của cuộc Tổng điều tra dân số thì Tổng số dân của nước ta có lúc 0 giờ 1/4/2009 là 85.789.573, tăng 9,47 triệu người so với năm 1999 là 76.324.753 người. 43 Số tuyệt đối • Số tuyệt đối thời điểm: phản ánh qui mô, khối lượng của hiện tượng tại một thời điểm nhất định. • Số tuyệt đối thời kỳ: phản ánh qui mô, khối lượng của hiện tượng trong một khoảng thời gian nhất định. • Đơn vị tính số tuyệt đối: – Đơn vị hiện vật: cái, chiếc, con, trái, củ, người, căn – Đơn vị hiện vật quy đổi: lương thực quy ra lúa – Đơn vị hiện vật quy ước: mét, mét vuông, mét khối, lít , kg, – Đơn vị tiền tệ: đồng, USD – Đo vị thời gian lao động: giờ công, ngày công, 44 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 23 Số tương đối • chỉ tiêu biểu hiện quan hệ so sánh (tỷ số) giữa hai mức độ của hiện tượng nghiên cứu. • Các loại số tương đối: – Động thái: phản ảnh thay đổi qua thời gian – Kế hoạch: • Nhiệm vụ kế hoạch: so mức kế hoạch (nhiệm vụ) với mức đạt ở lần trước • Thực hiện kế hoạch: so mức thực hiện được với mức kế hoạch đề ra – Kết cấu: mức độ bộ phận so với toàn bộ, phản ảnh tỷ trọng – Cường độ: so giữa hai mức độ của 2 hiện tượng (chỉ tiêu) khác nhau – Không gian: so sánh giữa các không gian khác nhau 45 Đo lường khuynh hướng tập trung Tìm ra mức độ đại diện theo một tiêu thức/biến. Chap 3-46 Center and Location Mean Median Mode Other Measures of Location Geometric mean Describing Data Numerically Variation Variance Standard Deviation Coefficient of Variation Range Percentiles Interquartile Range Quartiles Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 24 Đo lường khuynh hướng tập trung Tìm ra mức độ đại diện theo một tiêu thức/biến. Khuynh höôùng taäp trung Trung bình Trung vò Mode Trung bình hình hoïc 1 1 n i i N i i X X n X N µ = = = = ∑ ∑ n n321 x...xxxGM = 47 Đo lường khuynh hướng tập trung 1. Trung bình cộng • Trung bình mẫu ∑ ∑ = = = k 1i i k 1i ii f fx x ∑ ∑ = = = k 1i i k 1i ii f fm x Tính từ dữ liệu gốc Tính từ dữ liệu đã phân tổ Tính từ dữ liệu đã phân tổ có khoảng cách tổ n x x n 1i i∑ = = 48 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 25 Đo lường khuynh hướng tập trung 1. Trung bình cộng • Trung bình tổng thể N fx k 1i ii∑ = =µ N fm k 1i ii∑ = =µ Tính từ dữ liệu gốc Tính từ dữ liệu đã phân tổ Tính từ dữ liệu đã phân tổ có khoảng cách tổ N x N 1i i∑ = =µ 49 Đo lường khuynh hướng tập trung 1. Trung bình cộng • Trung bình cộng chịu ảnh hưởng của các trị số bất thường 0 1 2 3 4 5 6 7 8 9 10 12 14 Trung bình = 5 Trung bình = 6 0 1 2 3 4 5 6 7 8 9 10 50 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 26 Đo lường khuynh hướng tập trung 2. Trung vị (median) • Tính trung vị Số quan sát lẻ Số quan sát chẵn Tính từ tài liệu phân tổ 2 xx M 1 2 n 2 n e + + = Me = X(n+1)/2 Me 1Me Me(min)Mee f S 2 n hxM − − += 51 Đo lường khuynh hướng tập trung 2. Trung vị (median) • Số trung vị không chịu ảnh hưởng bởi các trị số bất thường (outliers) 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Me = 5 Me = 5 52 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 27 Đo lường khuynh hướng tập trung 3. Mốt (mode) • Đo lường khuynh hướng tập trung • Mode là giá trị có tần số lớn nhất • Mode không chịu ảnh hưởng bởi các giá trị đột biến • Một dãy số có thể có nhiều Mode • Một dãy số có thể không có Mode • Mode có thể xác định cho dữ liệu định tính 53 Đo lường khuynh hướng tập trung 3. Mốt (mode) Tính Mode từ dữ liệu đã phân tổ: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Mode có hai trị số: 9 và 12 0 1 2 3 4 5 6 Không có Mode )ff()ff( ff hxMode 1MM1MM 1MM M(min)Mo 0000 00 0 +− − −+− − += 54 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 28 Đo lường khuynh hướng tập trung 4. Trung bình nhân/ trung bình hình học (geometric mean) • Áp dụng cho các trị số có quan hệ tích số • Dùng để tính tốc độ phát triển trung bình từ các số tương đối động thái n n321 x...x.x.xx = 55 Các thước đo vị trí khác Other Measures of Location Percentiles Phân vị Quartiles Tứ phân vị  1st quartile = 25th percentile  2nd quartile = 50th percentile = median  3rd quartile = 75th percentile The pth percentile in a data array: • p% are less than or equal to this value • (100 – p)% are greater than or equal to this value (where 0 ≤ p ≤ 100) 56 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 29 Các thước đo vị trí khác • Phân vị thứ p trong một tập dữ liệu có n trị số là trị số ở vị trí thứ I được định nghĩa như sau:  Ví dụ: Phân vị thứ 60 trong một tập dữ liệu có 19 trị số quan sát là trị số ở vị trí thứ 12: 1)(n 100 pi += 121)(19 100 601)(n 100 pi =+=+= Phân vị (percentile) 57 Các thước đo vị trí khác Tứ phân vị (quartile) • Tứ phân vị chia tập dữ liệu đã xếp thứ tự thành 4 nhóm có số lượng trị số bằng nhau. 25% 25% 25% 25% Tập dữ liệu đã xếp thứ tự: 11 12 13 16 16 17 18 21 22  Ví dụ: tìm tứ phân vị thứ nhất (n = 9) Q1 = phân vị thứ 25, do đó (9+1) = 2.5 position Vì vậy sử dụng trị số ở giữa vị trí 2 và vị trí 3: Q1 = 12.5 25 100 Q1 Q2 Q3 58 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 30 Minimum 1st Median 3rd Maximum Quartile Quartile Các thước đo vị trí khác Biểu đồ hộp và râu (Box and whisker plot) Là công cụ đồ học thể hiện 5 số trị số tóm tắt : Minimum -- Q1 -- Median -- Q3 -- Maximum Hình hộp và đường trung tâm ở ngay vị trí chính giữa cho thấy dữ liệu đối xứng quanh trung vị Minimum 1st Median 3rd Maximum Quartile Quartile 25% 25% 25% 25% 59 Đo lường độ phân tán/biến thiên Same center, different variation 60 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 31 Đo lường độ phân tán/biến thiên Variation Variance Standard Deviation Coefficient of Variation Population Variance Sample Variance Population Standard Deviation Sample Standard Deviation Range Interquartile Range 61 Đo lường độ phân tán/biến thiên Biến thiên Phương sai Độ lệch chuẩn Hệ số biến thiên Phương sai tổng thể Phương sai mẫu Độ lệch chuẫn tổng thể Độ lệch chuẩn mẫu Khoảng biến thiên Độ trải giữa 62 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 32 Đo lường độ phân tán/biến thiên 1. Khoảng biến thiên: 2. Độ trải giữa: 3. Phương sai: 4. Độ lệch chuẩn: 5. Hệ số biến thiên: Sử dụng CV khi so sánh 2 tập dữ liệu có đơn vị tính khác nhau hay trung bình chênh lệch nhau nhiều minmax xxR −= RI = Q3 - Q1 ( ) N x N i i 2 12 ∑ = − = µ σ 1 )( 1 2 2 − − = ∑ = n xx s n i i 2σσ = 1 )( 1 2 − − = ∑ = n xx s n i i %100.µ σ =CV %100 x sCV = 63 Đo lường độ phân tán/biến thiên Mean = 15.5 s = 3.338 11 12 13 14 15 16 17 18 19 20 21 11 12 13 14 15 16 17 18 19 20 21 Data B Data A Mean = 15.5 s = .9258 11 12 13 14 15 16 17 18 19 20 21 Mean = 15.5 s = 4.57 Data C 64 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 33 Đo lường độ phân tán/biến thiên Quy tắc thực nghiệm • Đối với những tổng thể lớn, phân phối của các giá trị có dạng gần giống hình chuông cân đối (có thể dùng đồ thị Histogram để xem xét), phân phối chuẩn được sử dụng để mô tả hình dáng của phân phối. 65 Đo lường độ phân tán/biến thiên Quy tắc Tchebychev • Bất kỳ một tổng thể nào với trung bình là µ và độ lệch tiêu chuẩn là σ, thì có ít nhất 100(1-1/m2)% giá trị rơi vào khoảng µ ± mσ, với m > 1. m 1,5 2 2,5 3 100(1-1/m2)% 55,6% 75% 84% 88,9% 66 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 34 Hình dáng phân phối của tập dữ liệu Chap 3-67 Mean = Median = ModeMean < Median < Mode Mode < Median < Mean Right-SkewedLeft-Skewed Symmetric (Longer tail extends to left) (Longer tail extends to right) Diễn tả dữ liệu được phân phối như thế nào Đối xứng hay lệch Lệch phảiLệch trái Đối xứng Hình dáng phân phối của tập dữ liệu Diễn tả dữ liệu được phân phối như thế nào Đối xứng hay lệch Right-SkewedLeft-Skewed Symmetric Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3 68 Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 35 Chuẩn hóa dữ liệu Chuyển các dữ liệu với đo vị đo lường thực tế về đơn vị đo lường là độ lệch chuẩn. Khi có nhiều biến số có đơn vị tính khác nhau, chuẩn hóa dữ liệu giúp so sánh được biến thiên của chúng Với dữ liệu của tổng thể: Với dữ liệu của mẫu quan sát: σ µx z − = s xx z − = 69 Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế (Applied Statistics for Business & Economics) Chương 5 ƯỚC LƯỢNG THỐNG KÊ Hoàng Trọng Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 36 Ước lượng điểm & ước lượng khoảng 71 • Ước lượng điểm: ước lượng bằng 1 trị số • Ước lượng khoảng: ước lượng bằng 1 khoảng trị số, gọi là khoảng tin cậy, có thêm thông tin về khả năng biến thiên Point Estimate Lower Confidence Limit Upper Confidence Limit Width of confidence interval Ước lượng điểm Chúng ta có thể ước lượng tham số tổng thể với 1 trị số của mẫu (UL điểm) Trung bình Tỷ lệ pp xμ Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 37 Ước lượng khoảng • Ước lượng khoảng có tính tới biến thiên của tham số mẫu từ mẫu này so với mẫu khác. • Chỉ dựa vào một mẫu quan sát • Cho biết thông tin về tham số tổng thể có thể có trị số trong khoảng ước lượng, và không bao giờ chắc chắn được 100% Ước lượng khoảng • Công thức chung của ước lượng khoảng • Hệ số tin cậy suy từ độ tin cậy mong muốn • Ví dụ với độ tin cậy 95% (1 – α) =0,95, từ bảng phân phối chuẩn hệ số tin cậy là 1,96 Point Estimate ± (Critical Value) x (Standard Error) UL điểm ± (hệ số tin cậy) x (Sai số chuẩn) Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 38 Ước lượng khoảng • Ước lượng khoảng tham số của 1 tổng thể Population Mean σ Unknown Confidence Intervals Population Proportion σ Known n stx /2α± n σ zx α/2± n )p(p zp /2 − ± α 1 Ước lượng khoảng • Ước lượng khoảng khác biệt tham số giữa 2 tổng thể Mean difference paired samples Difference Proportion difference independent samples Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 39 Ước lượng khoảng • Ước lượng khoảng khác biệt tham số giữa 2 tổng thể y 2 y x 2 x 2/yx y 2 y x 2 x 2/ nn z)yx( nn z)yx( σ+σ+−≤µ−µ≤σ+σ−− αα n s td - n s t-d d2/,1-nyxd2/,1-n αα +≤µµ≤ Mean difference paired samples Difference Proportion difference independent samples Ước lượng khoảng • Ước lượng khoảng khác biệt tham số giữa 2 tổng thể Mean difference paired samples Difference Proportion difference independent samples yn ypyp xn xpxpzypxpyPxP yn ypyp xn xpxpzypxp )ˆ1(ˆ)ˆ1(ˆ 2/)ˆˆ( )ˆ1(ˆ)ˆ1(ˆ 2/)ˆˆ( − + − +−≤−≤ − + − −− αα Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 40 Thống kê Ứng Dụng trong Kinh Doanh & Kinh Tế (Applied Statistics for Business & Economics) Chương 6 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Hoàng Trọng Giả thuyết không và giả thuyết đối H0: ϴ ≥ ϴo H1: ϴ < ϴo 0 H0: ϴ ≤ ϴo H1: ϴ > ϴo H0: ϴ = ϴo H1: ϴ ≠ ϴo α α /2 Represents critical value Lower tail test Level of significance = α α 0 0 α/2α Upper tail test Two tailed test Rejection region is shaded Điều chúng ta muốn chứng minh là đúng được đặt làm giả thuyết đối Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 41 Hai loại sai lầm State of Nature Decision Do Not Reject H 0 No error (1 - )α Type II Error ( β ) Reject H 0 Type I Error ( )α Possible Hypothesis Test Outcomes H0 FalseH0 True Key: Outcome (Probability) No Error ( 1 - β )  Sai lầm loại I và sai lầm loại II không thể xảy ra cùng 1 lúc  Sai lầm loại I chỉ xảy ra nếu H0 đúng  Sai lầm loại II chỉ xảy ra nếu H0 sai Nếu xác suất phạm sai lầm loại I error probability ( α ) tăng lên thì xác suất phạm sai lầm loại II ( β ) giảm Các bước thực hiện kiểm định 1. Xác định tổng thể muốn nghiên cứu 2. Xây dựng giả thuyết không và giả thuyết đối 3. Xác định mức ý nghĩa 4. Xác định miền bác bỏ 5. Thu thập dữ liệu và tính toán đại lượng kiểm định 6. Quyết định bác bỏ hay chấp nhận giả thuyết, kết luận Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 42 Kiểm định GT về trung bình tổng thể σ Known Large Samples σ Unknown Hypothesis Tests for µ Small Samples σ Known Large Samples σ Unknown Hypothesis Tests for µ Small Samples The test statistic is: n σ µx z − = Kiểm định GT về trung bình tổng thể Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 43 σ Known Large Samples σ Unknown Hypothesis Tests for µ Small Samples The test statistic is: n s µxt 1n − = − But is sometimes approximated using a z: n σ µx z − = Kiểm định GT về trung bình tổng thể Large Samples σ Unknown Hypothesis Tests for µ Small Samples The test statistic is: n s µxt 1n − = − (The population must be approximately normal) σ Known Kiểm định GT về trung bình tổng thể Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 44 Quy tắc quyết định: Kiểm định GT về trung bình tổng thể Giả thuyết Bác bỏ Ho khi: Ho : µ = µo H1 : µ ≠ µo t > tn-1,α/2 hoặc t < -tn-1, α/2 hay > tn-1,α/2 Ho : µ = µo hoặc Ho: µ ≥ µo H1 : µ < µo t < -tn-1, α Ho : µ = µo hoặc Ho: µ ≤ µo H1 : µ > µo t > tn-1, α t Kiểm định trung bình dùng giá trị p (P value): • Sau khi tính được đại lượng thống kê dùng để kiểm định (thường là z hay t), dùng bảng tra hay hàm trên chương trình máy tính tính tra ngược ra giá trị p • Giá trị p là xác suất tính ra được trị số của đại lượng kiểm định vượt quá ( ≤ hay ≥ ) trị số của mẫu quan sát nếu như Ho đúng. • Giá trị p là mức ý nghĩa nhỏ nhất mà ở đó giả thuyết Ho bị bác bỏ, hay nói một cách đơn giản, giá trị P là xác suất phạm sai lầm khi bác bỏ Ho • Kết quả xử lý số liệu bằng máy tính thường luôn thể hiện giá trị p • Nếu qui định trước mức ý nghĩa α thì có thể dùng p-value để kết luận theo α. Khi đó nguyên tắc kiểm định như sau: – Nếu p-value < α thì bác bỏ Ho, thừa nhận H1. – Nếu p-value ≥ α thì chưa có cơ sở để bác bỏ Ho. Kiểm định GT về trung bình tổng thể Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 45 Kiểm định GT về tỷ lệ tổng thể • Dùng cho các dữ liệu phân loại, có 2 khả năng: – “thành công” nếu có đặc điểm – “thất bại” nếu không có đặc điểm • Tỷ lệ thành công trong tổng thể được ký hiệu là p • Tỷ lệ thành công trong mẫu được ký hiệu là ̂ hay ̅ Khi cở mẫu đủ lớn n ̅ và n(1- ̅) ít nhất là 5, ̅ có thể được xấp xỉ bởi phân phối bình thường với trung bình và độ lệch chuẩn là Phân phối của ̅ là bình thường nên đại lượng kiểm định là đại lượng z mau co mau trongcong thanhso n xp == pµP = n p)p(1 σp − = n )p(p pp z − − = 1 Kiểm định GT về tỷ lệ tổng thể Quy tắc quyết định: Giả thuyết Bác bỏ Ho khi: Ho : p = po H1 : p ≠ po z > zα/2 hoặc z < -zα/2 hay Ho : p = po hoặc Ho: p ≥ p0 H1 : p < po z < -zα Ho : p = po hoặc Ho: p ≤ p0 H1 : p > po z > zα 2/zz α> Thống Kê Ứng Dụng trong Kinh Tế & Kinh Doanh, Hoàng Trọng, ĐH Kinh Tế TPHCM 46 Kiểm định GT về khác biệt hai TB Mean difference paired samples Difference Proportion difference independent samples nyn Dyx z 2 y x 2 x 0 σ + σ −− = ) n 1 n 1(s Dyx t yx 2 0 + −− = Đại lượng quyết định: Kiểm định GT về khác biệt hai TB Quy tắc quyết định: Giả thuyết Bác bỏ Ho khi: Ho : µx - µy = D0 H1 : µx - µy ≠ D0 t > Hoặc t < - Hay > Ho :

Các file đính kèm theo tài liệu này:

  • pdfbai_giang_thong_ke_ung_dung_trong_kinh_doanh_va_kinh_te_chuo.pdf