Bài 5: Phân tích dãy số thời gian
v1.0 89
0
Nội dung Mục tiêu
Một số vấn đề chung về dãy số thời gian.
Các chỉ tiêu phân tích dãy số thời gian.
Một số phương pháp biểu diễn xu
hướng biến động của hiện tượng qua
thời gian.
Dự đoán thống kê ngắn hạn.
Trang bị những kiến thức cơ bản về dãy số
thời gian, bao gồm những khái niệm, các
chỉ tiêu phân tích dãy số thời gian, các
phương pháp biểu diễn xu hướng phát
triển của hiện tượng và dự báo thống kê
ngắn hạn.
T
24 trang |
Chia sẻ: huongnhu95 | Lượt xem: 520 | Lượt tải: 0
Tóm tắt tài liệu Giáo trình Thống kê học - Bài 5: Phân tích dãy số thời gian, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Thời lượng học Hướng dẫn học
9 tiết Nghe bài giảng, thảo luận với giảng viên
và học viên khác.
Trả lời câu hỏi ôn tập và làm các bài tập ở
cuối bài học.
BÀI 5: PHÂN TÍCH DÃY SỐ THỜI GIAN
Bài 5: Phân tích dãy số thời gian
90 v1.0
TÌNH HUỐNG DẪN NHẬP
Tên tình huống: Lập kế hoạch tình hình sản xuất kinh doanh của doanh nghiệp
Bạn được sếp giao cho nhiệm vụ lập kế hoạch về tình hình
sản xuất kinh doanh của doanh nghiệp trong vài năm tới. Để
đảm bảo kế hoạch là khả thi, bạn tiến hành thu thập và tổng
hợp tài liệu về tình hình sản xuất kinh doanh của doanh
nghiệp trong những năm gần đây. Bạn định dựa trên cơ sở
những số liệu thu thập đó để có thể phân tích sự biến động và
tìm ra xu hướng phát triển của các hiện tượng, từ đó xác định
được các mức độ kế hoạch trong tương lai.
Câu hỏi
Bạn sẽ phân tích dãy số liệu thu thập được như thế nào? Tìm ra tính quy luật của chúng ra sao?
Làm thế nào để xác định được các mức độ của hiện tượng trong tương lai?
Đó chính là nội dung của bài học này, phân tích mối liên hệ của hiện tượng theo thời gian.
Bài 5: Phân tích dãy số thời gian
v1.0 91
Mặt lượng của hiện tượng thường xuyên biến động qua thời gian. Để nghiên cứu sự biến động
này, người ta thường sử dụng các dãy số thời gian. Vậy dãy số thời gian là gì?
5.1. Một số khái niệm chung về dãy số thời gian
5.1.1. Khái niệm và ý nghĩa của dãy số thời gian
5.1.1.1. Khái niệm
Dãy số thời gian là một dãy các trị số của chỉ tiêu thống kê được sắp xếp theo thứ tự
thời gian.
Ví dụ 1: Có tài liệu về doanh thu của doanh nghiệp A qua các năm như sau:
Năm 2004 2005 2006 2007 2008
Doanh thu (tỷ đồng) 25 29 36 50 60
Ví dụ 2: Có tài liệu về lao động của doanh nghiệp A như sau:
Ngày 1/1/09 1/2/09 1/3/09 1/4/09
Số lao động (người) 350 370 370 380
Qua quan sát hai ví dụ trên ta thấy, một dãy số thời gian có kết cấu gồm 2 thành phần sau:
Thời gian: có thể là ngày, tuần, tháng, quý, năm tuỳ thuộc vào đặc điểm, tính chất
của hiện tượng nghiên cứu. Độ dài giữa 2 thời gian liền nhau gọi là khoảng cách
thời gian.
Chỉ tiêu về hiện tượng nghiên cứu: tên, đơn vị tính phù hợp và trị số của chỉ tiêu.
Các trị số này được gọi là các mức độ của dãy số thời gian yi ( i 1,n ). Các mức
độ của dãy số thời gian có thể là số tuyệt đối, số tương đối hoặc số bình quân.
5.1.1.2. Ý nghĩa
Dãy số thời gian cho phép thống kê nghiên cứu xu
hướng biến động của hiện tượng qua thời gian. Từ
đó, tìm ra tính quy luật của sự phát triển đồng thời
dự đoán được các mức độ của hiện tượng trong
tương lai.
5.1.2. Các loại dãy số thời gian
Một dãy số thời gian luôn bao gồm hai thành phần: thời gian và trị số của chỉ tiêu. Thời
gian thì có thời kỳ và thời điểm. Trị số của chỉ tiêu có thể là số tuyệt đối, số tương đối
hoặc số bình quân. Khi đó, ta có các loại dãy số thời gian tương ứng dưới đây.
Căn cứ vào các loại chỉ tiêu, dãy số thời gian được chia thành:
o Dãy số số tuyệt đối: dãy số có các trị số của chỉ tiêu là số tuyệt đối.
Ví dụ: Quy mô vốn của doanh nghiệp qua các năm.
o Dãy số số tương đối: dãy số mà các trị số là các số tương đối.
Ví dụ: Tốc độ tăng trưởng kinh tế hàng năm.
o Dãy số số bình quân: dãy số mà các trị số là các số bình quân.
Ví dụ: Năng suất lao động trung bình của doanh nghiệp qua các năm.
Trong đó, dãy số tương đối và dãy số bình quân luôn là dãy số thời kỳ.
Bài 5: Phân tích dãy số thời gian
92 v1.0
Chú ý
Nội dung bài giảng sẽ chỉ tập trung đi vào phân tích dãy số số tuyệt đối. Vì thế, các khái niệm
liên quan dưới đây có thể không phù hợp với hai dãy số số tương đối và dãy số số bình quân.
Căn cứ vào đặc điểm biến động về quy mô của hiện tượng qua thời gian, dãy số
được chia thành:
o Dãy số thời kỳ: biểu hiện quy mô, khối lượng của hiện tượng trong từng
khoảng thời gian nhất định. Các trị số của chỉ tiêu có thể cộng dồn với nhau tạo
thành số có ý nghĩa trong thời gian dài hơn.
Ví dụ 1 (phần 5.1.1.1) là dãy số thời kỳ, phản ánh quy mô doanh thu của doanh
nghiệp qua từng năm.
o Dãy số thời điểm: biểu hiện quy mô, khối lượng của hiện tượng tại những thời
điểm nhất định. Các trị số của chỉ tiêu không thể cộng dồn với nhau vì không
có ý nghĩa.
Ví dụ 2 (phần 5.1.1.1) là dãy số thời điểm, phản ánh số lao động của doanh
nghiệp tại từng thời điểm nhất định trong tháng.
Để có thể nghiên cứu biến động của hiện tượng qua thời gian thì các mức độ trong
dãy số phải đảm bảo tính chất có thể so sánh được, tức là dãy số thời gian đó phải
đáp ứng một số yêu cầu nhất định.
5.1.3. Yêu cầu khi xây dựng dãy số thời gian
Phải thống nhất về nội dung và phương pháp tính chỉ tiêu qua thời gian.
Ví dụ: Chỉ tiêu GDP ở nước ta hiện nay tính theo Hệ thống tài khoản quốc gia của
Liên hợp quốc (SNA 1993), trước đó là chỉ tiêu Thu nhập quốc dân tính theo
Hệ thống sản xuất vật chất của Liên Xô cũ (MPS).
Phải thống nhất về phạm vi tổng thể nghiên cứu.
Ví dụ: Từ 1/8/2008, Hà Nội bao gồm Hà Tây và một số địa phương thuộc
Vĩnh Phúc, Hoà Bình. Như vậy, không thể đem các số liệu của Hà Nội trước khi
nhập tỉnh để so sánh với số liệu của Hà Nội hiện nay được.
Các khoảng cách thời gian trong dãy số nên bằng nhau, nhất là với các dãy số thời
kỳ phải bằng nhau.
5.2. Các chỉ tiêu phân tích dãy số thời gian
Chúng ta đã biết, mặt lượng của hiện tượng thường
xuyên biến động. Để tìm ra tính quy luật của sự
biến động đó, trong thống kê, người ta sử dụng
5 chỉ tiêu sau để phân tích dãy số thời gian:
5.2.1. Mức độ bình quân theo thời gian
Khái niệm
Mức độ bình quân theo thời gian là chỉ tiêu tổng hợp phản ánh mức độ đại biểu
của hiện tượng trong toàn bộ thời gian nghiên cứu hoặc từng giai đoạn nghiên cứu.
Công thức tính
o Đối với dãy số thời kỳ:
n
i
i 1
y
y
n
Bài 5: Phân tích dãy số thời gian
v1.0 93
o Đối với dãy số thời điểm: Dãy số thời điểm phản ánh quy mô, khối lượng của
hiện tượng trong từng thời điểm. Để tính được mức độ bình quân một cách
chính xác, người ta phải xác định trị số chỉ tiêu ở từng ngày. Nhưng trên thực
tế, chúng ta chỉ có được trị số chỉ tiêu vào một ngày trong tháng nên phải giả
thiết rằng khoảng giữa hai thời điểm điều tra, mật độ của hiện tượng tăng giảm
đều đặn. Khi đó công thức tính mức độ bình quân qua thời gian như sau:
Trường hợp dãy số thời điểm có khoảng cách thời gian bằng nhau:
2 31 2 n 1 n 1 n
2 n 1
y yy y y y y y... y ... y
2 2 2 2 2y
n 1 n 1
Bản chất của cách tính này là chuyển từ dãy số thời điểm sang dãy số thời
kỳ để thực hiện phép tính.
Ví dụ: Số lao động của doanh nghiệp A tại các thời điểm:
Ngày 1/1/09 1/2/09 1/3/09 1/4/09
Số lao động (người) 350 370 370 380
Yêu cầu: Tính số lao động bình quân trong qúy I/2009 của doanh nghiệp A.
Hướng dẫn:
Số lao động là số tuyệt đối vì vậy khi tính bình quân, ta phải sử dụng công
thức bình quân cộng. Nhưng do đây là số tuyệt đối thời điểm, không thực
hiện được phép cộng nên phải chuyển về nó về dạng cộng được, tức phải
tính bình quân cho từng thời kỳ. Trước hết, ta phải tính số lao động bình
quân từng tháng.
Số lao động bình quân tháng 1 là số lao động bình quân của tất cả các ngày
trong tháng 1. Giả thiết biến động số lao động các ngày trong tháng là
tương đối đều đặn. Vậy, ta sẽ tính số lao động bình quân tháng 1 dựa vào số
lao động ngày đầu tháng và cuối tháng (ở đây, có số liệu vào ngày 1/2,
được coi là số liệu của ngày 31/1).
1 2
1
y y 350 370y 360
2 2
(người)
Tương tự với tháng 2 và tháng 3:
2 3
2
y y 370 370y 370
2 2
(người)
3 4
3
y y 370 380y 375
2 2
(người)
Khi đó, số lao động bình quân quý I/2009 là:
3 31 2 2 4 1 4
2 3
1 2 3
y yy y y y y yy yy y y 2 2 2 2 2 2 2 2y
3 3 4 1
350 380370 370
2 2
4 1
368,33 hay 369 (người)
Vậy số lao động bình quân của doanh nghiệp trong quý I/2009 là 369 người.
Bài 5: Phân tích dãy số thời gian
94 v1.0
Trường hợp dãy số thời điểm có khoảng cách thời gian không bằng nhau.
i i
i
y t
y
t
Trong đó: yi: Các mức độ của dãy số thời gian.
ti: Khoảng cách thời gian có các mức độ yi tương ứng.
Ví dụ: Có tài liệu về số lao động của doanh nghiệp A trong tháng 4/2009:
Ngày 1/4 doanh nghiệp có 380 lao động. Đến ngày 10/4, doanh nghiệp
tuyển dụng thêm 5 lao động. Ngày 15/4, tuyển dụng tiếp 3 lao động.
Đến ngày 21/4, cho 4 lao động thôi việc.
Yêu cầu: Tính số lao động bình quân trong tháng 4/2009 của doanh nghiệp.
Hướng dẫn:
Ta có dãy số thời gian thể hiện sự biến động số lao động của doanh nghiệp
trong tháng 4/2009 như sau:
Ngày
Số lao động
(người) yi
Khoảng cách thời gian
(ngày) ti
yiti
1 380 9 3.420
10 385 5 1.925
15 388 6 2.328
21 384 10 3.840
∑ 30 11.513
n
i i
i 1
n
i
i 1
y t
11.513y 383,77
30t
hay 384 (người)
Vậy số lao động bình quân trong tháng 4/2009 của doanh nghiệp là 384 người.
5.2.2. Lượng tăng (giảm) tuyệt đối
Khái niệm: Là chỉ tiêu phản ánh sự biến động về
trị số tuyệt đối của chỉ tiêu giữa hai thời gian
nghiên cứu hay nói cách khác, nó cho biết mức độ
của hiện tượng nghiên cứu qua hai thời gian đã
tăng/giảm một lượng tuyệt đối là bao nhiêu.
Hai thời gian nghiên cứu ở đây có thể:
o Liền nhau: liên hoàn.
o Trong một khoảng thời gian có 1 năm gốc cố
định: định gốc.
o Trong một khoảng thời gian: bình quân.
Công thức tính: Tương ứng với 3 loại thời gian nghiên cứu ở trên, có 3 chỉ tiêu
tính lượng tăng (giảm) tuyệt đối như sau:
o Lượng tăng (giảm) tuyệt đối liên hoàn: phản ánh sự thay đổi trị số tuyệt đối
giữa hai thời gian liền nhau.
Công thức: i = yi – yi – 1 (i = 2,n )
Bài 5: Phân tích dãy số thời gian
v1.0 95
o Lượng tăng (giảm) tuyệt đối định gốc: phản ánh sự thay đổi trị số tuyệt đối
giữa các khoảng thời gian dài và thường lấy mức độ đầu tiên làm gốc cố định.
Thực tế thì có thể chọn bất kỳ thời gian nào để làm gốc nhưng về mặt lý thuyết
thì thường chọn mốc thời gian đầu tiên để làm gốc.
Công thức: i = yi – y1 (i = 2,n )
Ví dụ: Tiếp ví dụ 1 phần 5.1.1.1:
Năm 2004 2005 2006 2007 2008
Doanh thu (tỷ đồng) 25 29 36 50 60
i (tỷ đồng) 2 = 4 3 = 7 4 = 14 5 = 10
i (tỷ đồng) 2 = 4 3 = 11 4 = 25 5 = 35
Từ hai công thức trên, ta thấy mối liên hệ giữa lượng tăng (giảm) tuyệt đối liên
hoàn và lượng tăng (giảm) tuyệt đối định gốc: lượng tăng (giảm) tuyệt đối định
gốc trong một thời gian bằng tổng các lượng tăng (giảm) tuyệt đối liên hoàn
trong thời gian đó.
ii nn i n 1
i 2
y y
Như ở ví dụ trên, 35101474
5
2
5
i
i (tỷ đồng) là lượng tăng tuyệt
đối về chỉ tiêu doanh thu của doanh nghiệp năm 2008 so với năm 2004.
o Lượng tăng (giảm) tuyệt đối bình quân: Là bình quân cộng của các lượng tăng
(giảm) tuyệt đối liên hoàn, phản ánh mức độ của hiện tượng nghiên cứu đã tăng
hay giảm bình quân là bao nhiêu.
Công thức:
n
i
i 2 n n 1y y
n 1 n 1 n 1
Áp dụng số liệu ở ví dụ trên, ta có:
5 35 8,75
5 1 4
(tỷ đồng)
Như vậy, trong giai đoạn 2004 – 2008, bình quân mỗi năm doanh thu của
doanh nghiệp tăng thêm 8,75 tỷ đồng.
Chú ý
chỉ phụ thuộc vào mức độ đầu tiên và mức độ cuối cùng. Do vậy, chỉ nên tính khi
các mức độ của dãy số có cùng xu hướng và nên kết hợp với các lượng tăng giảm
tuyệt đối liên hoàn i để phân tích thì mới chặt chẽ.
5.2.3. Tốc độ phát triển
Khái niệm: Là chỉ tiêu phản ánh xu hướng phát triển của hiện tượng qua thời gian.
Về bản chất, tốc độ phát triển giống như số tương đối động thái.
Công thức tính: Tương tự như lượng tăng (giảm) tuyệt đối, tốc độ phát triển cũng
được chia thành 3 loại và có cách tính như sau:
o Tốc độ phát triển liên hoàn: Phản ánh sự phát triển của hiện tượng giữa hai thời
gian liền nhau.
Bài 5: Phân tích dãy số thời gian
96 v1.0
i
i
i 1
yt
y
(lần, %) i = 2,n
o Tốc độ phát triển định gốc: Phản ánh sự phát
triển của hiện tượng trong các khoảng thời gian
dài và lấy mức độ đầu tiên làm gốc cố định.
i
i
1
yT
y
(lần, %) i = 2,n
Ví dụ: Với ví dụ 1 trong phần 5.1.1.1, ta có:
Năm 2004 2005 2006 2007 2008
Doanh thu (tỷ đồng) 25 29 36 50 60
ti (lần) t2 = 1,16 t3 = 1,24 t4 = 1,39 t5 = 1,20
Ti (lần) T2 = 1,16 T3 = 1,44 T4 = 2,00 T5 = 2,40
Mối liên hệ giữa tốc độ phát triển liên hoàn và tốc độ phát triển định gốc:
Tốc độ phát triển định gốc trong 1 độ dài thời gian bằng tích các tốc độ phát
triển liên hoàn trong thời gian đó.
Ti = Πti Tn =
n
ii 2
t
Tốc độ phát triển liên hoàn bằng thương của 2 tốc độ phát triển định gốc
liền nhau.
i
i
i 1
Tt
T
o Tốc độ phát triển bình quân: Là bình quân nhân của các tốc độ phát liên hoàn,
phản ánh tốc độ phát triển đại diện trong cả 1 thời kỳ dài.
n
nn 1n 1 n 1i n
i 2 1
yt t T
y
Với ví dụ trên, ta có: 44 5t T 2,40 1,245 (lần) hay 124,5%
Như vậy, trong giai đoạn 2004 – 2008, tốc độ phát triển trung bình của chỉ tiêu
doanh thu của doanh nghiệp A là 1,245 (lần) hay 124,5%.
Chú ý
t bản chất là trung bình nhân của ti nhưng thực chất chỉ phụ thuộc vào hai mức độ
đầu và cuối của dãy số. Do đó, chỉ nên tính khi các mức độ của dãy số có cùng xu
hướng. Nếu không cùng xu hướng thì nên dùng tốc độ phát triển liên hoàn.
5.2.4. Tốc độ tăng (giảm)
Khái niệm: Tốc độ tăng (giảm) là chỉ tiêu phản ánh mức độ của hiện tượng trong
hai thời gian nghiên cứu tăng lên hay giảm đi bao nhiêu lần hay bao nhiêu %.
Công thức tính:
o Tốc độ tăng (giảm) liên hoàn: phản ánh tốc độ tăng, giảm của hai thời gian
liền nhau.
i i 1i
i i
i 1 i 1
y y
a t 1
y y
(lần) i = 2,n
Bài 5: Phân tích dãy số thời gian
v1.0 97
o Tốc độ tăng (giảm) định gốc: phản ánh sự biến động tương đối giữa những
khoảng thời gian dài, thường lấy mức độ đầu tiên làm gốc cố định.
i i 1 i
i i
1 1 1
y y yA 1 T 1
y y y
(lần) i = 2,n
Ví dụ: Với ví dụ 1 trong phần 5.1.1.1, ta có:
a Năm 2004 2005 2006 2007 2008
Doanh thu (tỷ đồng) 25 29 36 50 60
ai (lần) a2 = 0,16 a3 = 0,24 a4 = 0,39 a5 = 0,20
Ai (lần) A2 = 0,16 A3 = 0,44 A4 = 1,00 A5 = 1,40
Lưu ý: Không có mối quan hệ giữa tốc độ tăng (giảm) liên hoàn và định gốc.
o Tốc độ tăng (giảm) bình quân: phản ánh tốc độ tăng (giảm) đại diện của hiện
tượng trong một thời gian nghiên cứu.
a t 1 (lần) hay a t 100 (%)
a t 1 = 1,245 – 1 = 0,245 lần (hay 24,5%)
Vậy, trong giai đoạn 2004 – 2008, doanh thu của doanh nghiệp A tăng trung
bình 0,245 (lần/năm) hay 24,5%/năm.
Chú ý
a cũng chỉ nên sử dụng khi dãy số có cùng xu hướng.
Trong thống kê luôn luôn phải sử dụng kết hợp số tuyệt đối và số tương đối, bởi
nhiều hiện tượng mặc dù có cùng tốc độ tăng (giảm) nhưng giá trị tuyệt đối của nó
lại hoàn toàn khác nhau. Sự khác nhau đó được quyết định bởi gốc so sánh, có
nghĩa là cùng một tốc độ như nhau nhưng chỉ tiêu nào có gốc so sánh lớn hơn thì
lượng tăng (giảm) tuyệt đối của nó cũng lớn hơn. Trong thống kê, người ta thường
sử dụng chỉ tiêu sau để phản ánh mức độ tăng (giảm) của hiện tượng.
5.2.5. Giá trị tuyệt đối của 1% tốc độ tăng (giảm) liên hoàn
Là sự kết hợp giữa chỉ tiêu lượng tăng (giảm) tuyệt đối và
chỉ tiêu tốc độ tăng (giảm).
Khái niệm: Giá trị tuyệt đối của 1% tốc độ tăng
(giảm) liên hoàn phản ánh sự kết hợp giữa số tương
đối và số tuyệt đối. Cụ thể, nó biểu hiện cứ 1% tăng
hay giảm liên hoàn thì tương ứng với 1 trị số tuyệt đối
là bao nhiêu.
Công thức tính:
i i i 1
i
ii
i 1
yg
a (%) 100100
y
gi: là số tuyệt đối, nên đơn vị tính tương ứng với đơn vị tính của chỉ tiêu nghiên cứu.
Ví dụ: Với ví dụ 1 trong phần 5.1.1.1, ta có:
Bài 5: Phân tích dãy số thời gian
98 v1.0
Năm 2004 2005 2006 2007 2008
Doanh thu (tỷ đồng) 25 29 36 50 60
gi (tỷ đồng) g2 = 0,25 g3 = 0,29 g4 = 0,36 g5 = 0,50
Lưu ý: Trên thực tế, người ta không dùng chỉ tiêu giá trị tuyệt đối của 1% tốc độ
tăng (giảm) định gốc vì nó luôn là 1 hằng số.
i i 1
i
ii
1
yG const
A (%) 100100
y
Không có Gi nên không có mối liên hệ giữa Gi và gi, do đó cũng không có g .
Bên cạnh việc phân tích sự biến động của dãy số thời gian, một vấn đề rất quan trọng
là phải thấy được xu hướng biến động của hiện tượng.
5.3. Một số phương pháp biểu diễn xu hướng biến động cơ bản của hiện tượng
5.3.1. Sự cần thiết phải nghiên cứu các phương pháp biểu diễn xu hướng biến
động cơ bản của hiện tượng
Hiện tượng biến động qua thời gian, chịu ảnh hưởng bởi nhiều nhóm nhân tố, trong đó:
Các nhân tố chủ yếu, tác động đến hiện tượng và quyết định xu hướng phát triển
cơ bản của hiện tượng.
Các nhân tố ngẫu nhiên tác động một cách ngẫu nhiên làm cho hiện tượng sai lệch
so với xu hướng chung.
Vấn đề đặt ra là phải loại trừ những nhân tố ngẫu
nhiên và làm bộc lộ ra những nhân tố cơ bản. Mục
đích chung của các phương pháp này là loại bỏ
những nhân tố ngẫu nhiên. Nhưng để thực hiện
được các phương pháp này, điều kiện đầu tiên là
phải đảm bảo tính chất có thể so sánh được giữa các
mức độ của hiện tượng trong dãy số.
5.3.2. Các phương pháp biểu diễn xu hướng biến
động cơ bản của hiện tượng
Thống kê sử dụng 4 phương pháp cơ bản dưới đây:
5.3.2.1. Phương pháp mở rộng khoảng cách thời gian
Nội dung: Mở rộng thêm khoảng cách thời gian bằng cách ghép một số thời gian
liền nhau vào thành một khoảng thời gian dài hơn.
Ví dụ: Mở rộng khoảng cách thời gian từ tháng thành quý, từ quý thành năm...
Mục đích là để từ dãy số không có hoặc chưa thể hiện rõ tính quy luật thành dãy số
xuất hiện tính quy luật (triệt tiêu ngẫu nhiên để biểu hiện xu hướng).
Vận dụng: Mở rộng khoảng cách thời gian được vận dụng với dãy số thời kỳ có
khoảng cách thời gian tương đối ngắn, nhiều mức độ và chưa thấy rõ được xu
hướng phát triển cơ bản của hiện tượng.
Thời gian dài – ngắn mang ý nghĩa tương đối, phụ thuộc vào đặc điểm của hiện
tượng và từng loại chỉ tiêu khác nhau.
Bài 5: Phân tích dãy số thời gian
v1.0 99
Ví dụ: Sản phẩm của ngành chế biến thủy sản có thể xét theo ngày, tuần. Nhưng
sản phẩm của ngành đóng tàu phải xét theo tháng, năm
Hạn chế:
o Do ghép nhiều khoảng thời gian vào thành một nên số lượng các mức độ trong
dãy số mất đi quá nhiều, đôi khi làm mất ảnh hưởng của các nhân tố cơ bản.
Ví dụ: Số liệu từ tháng chuyển thành qúy, từ 12 mức độ còn 4 mức độ, tức là
mất đi 2/3 số mức độ ban đầu.
o Trường hợp sử dụng với những hiện tượng có tính chất thời vụ sẽ làm mất đi
tính chất thời vụ của hiện tượng.
5.3.2.2. Phương pháp bình quân trượt
Từ đặc điểm của số bình quân là san bằng các
chênh lệch vì thế nó san bằng các nhân tố ngẫu
nhiên làm bộc lộ nhân tố cơ bản của hiện tượng,
người ta đưa ra khái niệm số bình quân trượt.
Khái niệm: Số bình quân trượt là số bình quân
của một nhóm nhất định các mức độ trong dãy
số được tính bằng cách lần lượt loại trừ dần
mức độ đầu, đồng thời thêm vào các mức độ
tiếp theo sao cho số lượng các mức độ tham gia tính số bình quân là không đổi.
Dãy số bình quân trượt là dãy số được hình thành từ các số bình quân trượt.
Ví dụ: Có dãy số thời gian n mức độ y1, y2, , yn
Giả sử nhóm 3 mức độ để tính số bình quân trượt, ta có:
1 2 3
2
y y yy
3
;
2 3 4
3
y y yy
3
;
n 2 n 1 n
n 1
y y yy
3
2 3 ny , y ,..., y được gọi là dãy số bình quân trượt lần thứ nhất (MA1).
Nếu dãy số vẫn chưa bộc lộ rõ xu hướng, nghĩa là chưa loại bỏ hết các yếu tố ngẫu
nhiên thì có thể tính bình quân trượt lần thứ hai.
2 3 4
3
y y yy
3
;
3 4 5
4
y y yy
3
;
n 3 n 2 n 1
n 2
y y yy
3
Bài 5: Phân tích dãy số thời gian
100 v1.0
Khi đó ta có dãy số bình quân trượt lần thứ 2 (MA2).
Ngoài phương pháp trượt như trên còn có thể tính số bình quân trượt có trọng số.
Vận dụng: Với dãy số thời kỳ theo tháng, quý, năm nhưng không có yếu tố thời vụ.
Ưu điểm: So với mở rộng khoảng cách thời gian thì số lượng các mức độ trong
dãy số mất đi ít hơn, khi biểu diễn trên đồ thị sẽ thấy xu hướng rõ ràng hơn.
Hạn chế: Trong trường hợp sử dụng với những hiện tượng có tính chất thời vụ sẽ
làm mất đi tính chất thời vụ của hiện tượng.
Để khắc phục nhược điểm của hai phương pháp trên, người ta sử dụng phương
pháp dưới đây.
5.3.2.3. Phương pháp hồi quy theo thời gian
Nội dung: Phương pháp hồi quy trong dãy số thời gian được vận dụng để biểu
diễn xu hướng phát triển cơ bản của những hiện tượng có nhiều dao động ngẫu
nhiên. Khi đó, người ta xây dựng một hàm số (gọi là phương trình hồi quy) nhằm
phản ánh biến động của hiện tượng theo thời gian.
Hàm số này có dạng tổng quát: tyˆ = f(t) và thường được gọi là hàm xu thế.
Trong đó:
o t: là biến thời gian, là thứ tự thời gian theo quy ước, đóng vai trò là biến số độc
lập trong phương trình hồi quy.
– < t < +
o tyˆ : Mức độ của hiện tượng ở thời gian t tính từ hàm xu thế.
Các dạng hàm xu thế thường sử dụng
o Hàm xu thế tuyến tính: Sử dụng khi dãy số thời gian có các lượng tăng (giảm)
tuyệt đối liên hoàn xấp xỉ nhau.
Hàm có dạng: tyˆ = a0 + a1t
Các tham số a0, a1 được xác định bằng phương pháp bình phương nhỏ nhất.
Theo đó, a0 và a1 phải thỏa mãn phương trình:
0 1
2
0 1
y na a t
ty a t a t
hoặc: 1 2
t
ty tya và a0 = y – a1 t
Chú ý
Để dễ tính nên chọn t sao cho t = 0. Kết quả ở hàm hồi quy sẽ khác nhau nhưng
dùng để dự báo thì đều có giá trị như nhau.
o Hàm xu thế parabol: Được sử dụng trong trường hợp các mức độ của dãy số
tăng dần theo thời gian đạt cực đại, sau đó lại giảm dần theo thời gian hoặc
giảm dần theo thời gian đạt cực tiểu, sau đó lại tăng dần theo thời gian.
Hàm có dạng: tyˆ = a0 + a1t + a2t2
Các tham số được xác định bằng phương pháp bình phương nhỏ nhất và phải
thỏa mãn hệ phương trình:
Bài 5: Phân tích dãy số thời gian
v1.0 101
2
0 1 2
2 3
0 1 2
2 2 3 4
0 1 2
y a n a t a t
ty a t a t a t
t y a t a t a t
o Hàm xu thế hypebol: Được sử dụng khi các mức độ của hiện tượng giảm dần
theo thời gian.
Hàm có dạng: 1t 0 ayˆ a t
Các tham số a0, a1 được xác định bằng phương pháp bình phương nhỏ nhất và
phải thỏa mãn hệ phương trình:
0 1
0 1 2
1y a n a
t
1 1 1y a a
t t t
o Hàm xu thế mũ: Được sử dụng khi các tốc độ phát triển liên hoàn xấp xỉ nhau.
Hàm có dạng: tt 0 1yˆ a a
hay: lny = lna0 + t lna1
Các tham số a0, a1 được xác định bằng phương pháp bình phương nhỏ nhất và
lna, lnb phải thỏa mãn hệ phương trình:
0 1
2
0 1
ln y ln a n ln a t
t ln y ln a t ln a t
Ví dụ: Có số liệu về sản lượng sản xuất của doanh nghiệp A qua các năm như sau:
Năm 2003 2004 2005 2006 2007 2008
Sản lượng (triệu sản phẩm) 10,0 12,5 15,4 17,6 20,2 22,9
Yêu cầu: Xây dựng hàm xu thế tuyến tính biểu diễn biến động của sản lượng
sản xuất của doanh nghiệp qua thời gian.
Hướng dẫn:
Hàm xu thế tuyến tính có dạng: tyˆ = a0 + a1t
Trong đó: y: Sản lượng sản xuất của doanh nghiệp.
t: Biến thứ tự thời gian.
Nếu quy ước năm 2003, t = 1; năm 2004, t = 2, ta có các giá trị khác của t như
ở bảng dưới đây:
Năm Sản lượng (y) Thứ tự thời gian (t) t y t2
2003 10,0 1 10,0 1
2004 12,5 2 25,0 4
2005 15,4 3 46,2 9
2006 17,6 4 70,4 16
2007 20,2 5 101,0 25
2008 22,9 6 137,4 36
Cộng 98,6 21 390,0 91
Trung bình 16,43 3,50 65,0 15,17
Bài 5: Phân tích dãy số thời gian
102 v1.0
Khi đó, các giá trị a0, a1 ở trên được xác định bằng phương pháp bình phương
nhỏ nhất và được tính theo công thức:
1 22t
ty ty 65 3,5 16,43a
15,17 3,5
= 2,567
a0 = y – a1 t = 16,43 2,567 3,5 = 7,446
Vậy hàm xu thế tuyến tính biểu diễn biến động sản lượng sản xuất của doanh
nghiệp qua thời gian là:
tyˆ = 7,446 + 2,567t
o Lựa chọn hàm xu thế nào thì tốt?
Với một dãy số liệu, người ta có thể xây dựng nhiều hàm xu thế khác nhau.
Liệu hàm xu thế nào là tốt?
Khi đó, từ các hàm xu thế, người ta tính sai số chuẩn của mỗi hàm xu thế và
chọn dạng hàm cho sai số chuẩn nhỏ nhất.
2
t t
e
ˆ(y y )
S
n p
Trong đó:
ty : Mức độ thực tế của hiện tượng ở thời gian t.
tyˆ : Mức độ của hiện tượng ở thời gian t được tính từ hàm xu thế.
n: Số lượng các mức độ của dãy số thời gian.
p: Số lượng các tham số của hàm xu thế (hàm tuyến tính: p = 2; parabol: p = 3;
hypebol: p = 2; hàm mũ: p = 2).
5.3.2.4. Phương pháp biểu hiện biến động thời vụ
Khái niệm: Biến động thời vụ là sự biến động
của hiện tượng có tính chất lặp đi lặp lại trong
từng thời gian nhất định.
Nguyên nhân của biến động thời vụ là do ảnh
hưởng của điều kiện tự nhiên và tập quán sinh
hoạt của dân cư. Ảnh hưởng nhiều nhất là
trong các ngành nông nghiệp, du lịch và các
ngành công nghiệp chế biến sản phẩm từ nông
nghiệp, các ngành khai thác... Biến động thời
vụ làm cho hiện tượng lúc thì mở rộng, khẩn trương, khi thì thu hẹp, nhàn rỗi.
Biến động thời vụ thường gây ra tình trạng làm ảnh hưởng đến hoạt động sản xuất
kinh doanh của ngành đó và các ngành có liên quan. Vì vậy, việc nghiên cứu biến
động thời vụ cho phép chủ động trong công tác quản lý kinh tế - xã hội, lập kế
hoạch sản xuất hay hoạt động nghiệp vụ thích hợp, hạn chế ảnh hưởng đến sản
xuất và sinh hoạt xã hội.
Bài 5: Phân tích dãy số thời gian
v1.0 103
Phương pháp nghiên cứu: Nghiên cứu biến động thời vụ thường dựa vào nguồn số
liệu trong nhiều năm, ít nhất là 3 năm và sử dụng phương pháp tính chỉ số thời vụ.
Công thức tính
o Đối với dãy số không có xu thế: Dãy số không có xu thế là dãy số mà các mức
độ theo thời gian tương đối ổn định: cùng kỳ từ năm này qua năm khác không
có biểu hiện tăng giảm rõ rệt (biến động thời vụ không có xu thế).
Công thức: ii
0
yI = × 100
y
Trong đó: Ii: Chỉ số thời vụ của thời gian thứ i (có thể là tháng, quý,...).
iy : Mức độ bình quân của thời gian i qua các năm.
0y : Mức độ bình quân chung của dãy số.
Ii > 100% cho biết: Sự biến động của hiện tượng ở thời gian i tăng, tức đây là
thời kỳ bận rộn và ngược lại.
Ví dụ: Mức tiêu thụ hàng hóa trong 3 năm của doanh nghiệp A như sau:
Mức tiêu thụ hàng hóa (triệu đồng) Năm
Quý 2006 2007 2008
iy Ii (%)
I 4.489 4.589 4.574 4.551 63.86
II 7.957 8.296 8.000 8.084 113.46
III 9.450 9.524 9.514 9.496 133.27
IV 6.376 6.294 6.444 6.371 89.41
∑ 28.272 28.703 28.532 400.00
Tính các mức độ bình quân của từng quý qua 3 năm iy .
1
4.489 4.589 4.574y 4.551
3
(triệu đồng)
Tương tự với các qúy khác (kết quả như trên bảng).
Tính mức độ bình quân chung:
0
28.272 28.703 28.532y 7.126
12
(triệu đồng)
Tính các chỉ số thời vụ cho từng quý Ii:
1
1
0
y 4.551I 100 100
7.126y
63,87%
Ii của các quý khác tính tương tự (kết quả cho ở bảng trên).
Thời gian
y
y
0
Bài 5: Phân tích dãy số thời gian
104 v1.0
Nhận xét: Mặt hàng này tiêu thụ mạnh (trên mức bình quân chung) trong quý
II và quý III và tiêu thụ ít (dưới mức bình quân chung) vào các quý I, quý IV.
o Đối với dãy số có xu thế: Nếu các mức độ cùng kỳ của hiện tượng từ năm này
qua năm khác có biểu hiện tăng hay giảm rõ rệt (có yếu tố thời vụ và xu thế),
muốn tính chỉ số thời vụ, trước hết phải điều chỉnh dãy số bằng phương trình
hồi quy để tính các mức độ lý thuyết rồi sau đó dùng các mức độ này làm căn
cứ so sánh.
Công thức:
n
ij
j 1 ij
i
y
yˆ
I 100
m
(%)
Trong đó:
yij: Mức độ thực tế của thời kỳ thứ i (i = 1,n ) thuộc năm j (j = 1,m ).
ijyˆ : Mức độ lý thuyết của thời kỳ thứ i (i = 1,n ) thuộc năm j (j = 1,m ) được
tính từ hàm xu thế.
m: Số năm nghiên cứu.
Ví dụ: Mức tiêu thụ hàng hóa trong 3 năm của 1 doanh nghiệp như sau:
Mức độ thực tế
(triệu đồng)
yij
Mức độ lý thuyết
(triệu đồng)
ˆijy
ˆ
ij
ij
y
×100(%)
y
Quý
2006 2007 2008 2006 2007 2008 2006 2007 2008
Ii (%)
I 1.639 2.336 3.030 866 1.808 2.750 189,28 129,21 110,18 142,89
II 864 1.091 2.177 1.101 2.043 2.986 78,44 53,39 72,92 68,25
III 671 1.407 2.603 1.337 2.279 3.221 50,19 61,74 80,81 64,25
IV 2.410 2.749 4.958 1.572 2.515 3.457 153,26 109,32 143,44 135,34
∑ 5.584 7.583 12.768 4.877 8.645 12.413
Bước 1: Xác định hàm xu thế tuyến tính dạng tyˆ = a0 + a1t
Sau khi sắp xếp lại số liệu theo thứ tự thời gian, ta có bảng số liệu:
Thời gian
y tyˆ
0
Bài 5: Phân tích dãy số thời gian
v1.0 105
Thời gian Mức tiêu thụ
hàng hóa (y)
Thứ tự thời
gian (t)
ty t2
I/2006 1.639 1 1.639 1
II/2006 864 2 1.728 4
III/2006 671 3 2.013 9
IV/2006 2.410 4 9.640 16
I/2007 2.336 5 11.680 25
II/2007 1.091 6 6.546 36
III/2007 1.407 7 9.849 49
IV/2007 2.749 8 21.992 64
I/2008 3.030 9 27.270 81
II/2008 2.177 10 21.770 100
III/2008 2.603 11 28.633 121
IV/2008 4.958 12 59.496 144
Cộng 25.935 78 202.256 650
Từ đó, các tham số của hàm xu thế được xác định như sau:
1 22
t
202256 78 25935
ty ty 12 12 12a
650 78
12 12
= 235.514
a0 = y – a1 t =
25935 78235.514
12 12
= 630.409
Hàm xu thế tuyến tính có dạng:
tyˆ = 630.409 + 235.514t
Bước 2: Thay t từ 1 – 12 có kết quả ijyˆ tương ứng (bảng trên).
Bước 3: Tính ij
ij
y
100 (%)
yˆ
và Ii theo công thức.
Nhận xét: Mặt hàng này tiêu thụ mạnh (trên mức bình quân chung) trong quý I
và quý IV và tiêu thụ ít (dưới mức bình quân chung) vào các quý II, quý III.
5.4. Một số phương pháp dự đoán thống kê ngắn hạn
5.4.1. Khái niệm dự đoán thống kê ngắn hạn
Dự đoán thống kê là việc xác định các mức độ của hiện tượng nghiên cứu trong tương
lai. Dự đoán chia ra làm 3 loại: dài hạn (> 10 năm), trung hạn (3 – 10 năm) và ngắn
hạn (< 3 năm), thời gian quá khứ ít nhất là 5 mức độ.
Xuất phát từ đối tượng và nhiệm vụ nghiên cứu, từ nguồn tài liệu thích hợp, thống kê
thường thực hiện dự đoán ngắn hạn hay
Các file đính kèm theo tài liệu này:
- giao_trinh_thong_ke_hoc_bai_5_phan_tich_day_so_thoi_gian.pdf