LỜI MỞ ĐẦU
Sau hơn hai mươi năm đổi mới, chuyển từ nền kinh tế kế hoạch hóa tập trung sang nền kinh tế thị trường, Việt Nam đã đạt được những thành tựu to lớn về kinh tế- xã hội. Trong những năm gần đây tăng trưởng kinh tế của đất nước được xếp vào một trong những nước có tốc độ tăng lớn nhất Đông Á. Đời sống của nhân dân không ngừng được cải thiện. Việt Nam từ một nước nông nghiệp kém phát triển, đang từng bước xây dựng một nền kinh tế công nghiệp theo hướng hiện đại. Để đạt được những thành
47 trang |
Chia sẻ: huyen82 | Lượt xem: 2258 | Lượt tải: 5
Tóm tắt tài liệu Dự đoán GDP của Việt Nam đến năm 2010, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
quả đó, một mặt do Nhà nước đã có những chính sách kinh tế đúng đắn, mặt khác phải không ngừng phân tích, đánh giá kết quả đạt được từ đó rút ra bài học kinh nghiệm và có điều chỉnh đúng đắn, từ đó có cái nhìn chiến lược cho tương lai . Với ý nghĩa đó, vai trò của thông tin thống kê ngày càng trở nên quan trọng, nhất là trong xu thế hội nhập và thị trường toàn cầu. Việc áp dụng các phương pháp thống kê vào phân tích tăng trưởng kinh tế của Việt Nam sẽ cho ta cái nhìn sâu sắc hơn, sát thực hơn về những gì đã đạt được và xu hướng phát triển trong tương lai. Do đó, em đã chọn đề tài: “Dự đoán GDP của Việt Nam đến năm 2010”
Đề án gồm 3 chương:
- Chương I : Lý luận chung dự đoán thống kê.
- Chương II : Vận dụng một số phương pháp dự đoán để dự đoán GDP Việt Nam đến năm 2010.
- Chương III : Kiến nghị việc sử dụng các phương pháp dự đoán GDP.
Với sự hiểu biết nhất định về lý thuyết cũng như thực tế nên đề án của em không tránh khỏi những sai sót. Em rất mong nhận được sự góp ý của các thầy cô để đề án được hoàn thành tốt nhất.
Em xin chân thành cảm ơn PGS.TS Bùi Huy Thảo đã giúp đỡ em hoàn thành đề án!
Chương 1: Lý luận chung dự đoán thống kê.
I- Dự đoán thống kê và ý nghĩa của dự đoán thống kê:
1. Dự đoán thống kê:
1.1. Dự đoán và phương pháp dự đoán:
Dự đoán được sử dụng rộng rãi trong nhiều lĩnh vực như khoa học- kỹ thuật, kinh tế chính trị, văn hóa- thể thao, và các lĩnh vực khác của xã hội. Dự đoán được hiểu là việc xác định mức độ, trạng thái của hiện tượng trong tương lai. Tham gia vào nhiều lĩnh vực, dự đoán có nhiều loại và phương pháp khác nhau.
Dựa vào độ dài thời gian dự đoán( tầm dự đoán) có thể phân loại dự đoán thành 3 loại:
Dự đoán ngắn hạn là dự đoán có tầm dự đoán dưới 3 năm. Người ta co thể dự đoán về hàng ngày, hàng tháng, hàng quý. Mục đích chủ yếu của loại dự đoán này là phục vụ kịp thời cho công tác quản lý.Ví dụ: nghiên cứu về nhu cầu thị trường, ….
Dự đoán trung hạn: là đoán có tầm dự đoán từ 3 đến 5 năm , dùng phục vụ các kế hoạch 3-5 năm.
Dự đoán dài hạn: là dự đoán có tầm dự đoán từ 5 năm trở lên, dùng trong việc dự đoán mục tiêu có tính chất chiến lược.
Tuỳ thuộc vào đối tượng và nhiệm vụ của dự đoán mà trong thực tế có nhiều phương pháp dự đoán được sử dụng. Có thể phân loại dự đoán thành 3 nhóm phương pháp
Phương pháp chuyên gia: được tiến hành trên cơ sở tổng hợp, xử lý những ý kiến của các chuyên gia. Phương pháp này có ưu thế trong trường hợp dự đoán những hiện tượng hay quá trình có tầm bao quát rộng lớn, phức tạp chịu sự chi phối của nhiều yếu tố. Ví dụ như dự đoán về sự phát triển của khoa học- kỹ thuật, sự thay đổi của môi trường trong 20 năm tới.
Dự đoán bằng mô hình hồi quy được thực hiện trên cơ sở xây dựng mô hình hồi quy phù hợp. Để xây dựng mô hình hồi quy, đòi hỏi phải có tài liệu về hiện tượng cần được dự đoán và các hiện tượng có liên quan. Dự đoán bằng mô hình hồi quy thường được sử dụng đối với dự đoán trung và dài hạn ở tầm dự đoán vĩ mô.
Dự đoán dựa vào dãy số thời gian là dựa vào dãy số thời gian phản ánh sự biến động của hiện tượng ở những thời gian đã qua để xác định mức độ của hiện tượng trong tương lai. Ưu điểm dãy số thời gian là khối lượng tài liệu không lớn, việc xác định mô hình dự đoán trên dãy số thời gian thuận tiện, dùng phần mềm cho kết quả tốt.
1.2. Dự đoán thống kê:
Dự đoán thống kê là dựa vào tài liệu thống kê và sử dụng những phương pháp phù hợp để xác định mức độ của hiện tượng trong tương lai.
Tài liệu thống kê thường được sử dụng trong dự đoán thống kê là dãy số thời gian. Việc sử dụng dãy số thời gian để tiến hành dự đoán thống kê có những ưu điểm cơ bản như sau:
Thứ nhất, chỉ cần có dãy số thời gian gồm một số lượng nhất định các mức độ của hiện tượng ở thời gian hiện tại trở về trước, đòi hỏi một khối lượng tài liệu lớn như dự đoán dựa vào mô hình hồi quy.
Thứ hai, việc xây dựng mô hình dự đoán dựa vào dãy số thời gian được tiến hành tương đối đơn giản, ít bị ràng buộc bởi các giả thiết như trong việc xây dựng mô hình hồi quy.
Thứ ba, dự đoán dựa vào dãy số thời gian rất thuận lợi trong việc ứng dụng tin học. Điều đó làm cho việc tính toán trở nên thuận tiện, đồng thời cho phép lựa chọn mô hình dự đoán phù hợp nhất.
Để kết quả dự đoán có độ tin cậy cao, đòi hỏi phải có các mức độ của dãy số thời gian phải chính xác, có thể so sánh được với nhau. Đảm bảo tính chất có thể so sánh được với nhau giữa các mức độ trong dãy số nhằm phản ánh một cách đúng đắn, khách quan sự biến động của hiện tượng qua thời gian. Cụ thể là:
Nội dung và phương pháp tính chỉ tiêu qua thời gian phải thống nhất.
Phạm vi hiện tượng nghiên cứu qua thời gian phải nhất trí.
Các khoảng cách thời gian trong dãy số nên bằng nhau, nhất là đối với dãy số thời kỳ.
Trong việc xác định số lượng các mức độ của dãy số thời gian để tiến hành dự đoán thì không thể đưa ra một nguyên tắc cứng nhắc mà phải dựa vào sự phân tích đặc tính biến động của hiện tượng qua thời gian để xác định nên sử dụng bao nhiêu mức độ để xây dựng mô hình dự đoán. Giả sự sự biến động của hiện tượng qua các năm có tính chất tương đối ổn định thì có thể sử dụng tài liệu của 7 hoặc 10 năm.
Nếu ở những thời gian cuối có những nhân tố mới xuất hiện làm thay đổi xu hướng phát triển của hiện tượng thì có thể sử dụng một số mức độ cuối của dãy số thời gian để xây dựng mô hình dự đoán.
Có nhiều phương pháp được sử dụng trong dự đoán thống kê. Có những phương pháp dựa trên sự mở rộng từ những công thức tính toán thống kê như dự đoán dựa vào phát triển trung bình, dự đoán dựa vào hàm xu thế, .v.v.. Có những phương pháp dự đoán thống kê được vận dụng trên cơ sở các kết quả của toán học như dự đoán bằng phương pháp san bằng mũ, dự đoán mô hình tuyến tính ngẫu nhiên, .v.v..
2. Ý nghĩa thực tiễn:
Dự đoán thống kê là dựa vào tài liệu thống kê và sử dụng những phương pháp phù hợp để xác định các mức độ của hiện tượng trong tương lai.
Nếu như trước đây thống kê thống kê chỉ dừng lại nghiên cứu những hiện tượng đã xảy ra thì ngày nay với phương pháp dự đoán thống kê giúp ta thấy rõ bản chất, quy luật phát triển của hiện tượng trong quá khứ, hiện tại , giúp ta dự đoán được các mức độ của hiện tượng trong tương lai. Trên cơ sở đó giúp ta có nhận thức đúng đắn về hiện tượng, tìm ra các biện pháp thích hợp thúc đẩy hiện tượng phát triển theo hướng tốt nhất, phù hợp với điều kiện, hoàn cảnh kinh tế- xã hội hiện tại.
II- Các phương pháp dự đoán thống kê:
1. Dự đoán dựa vào lượng tăng (hoặc giảm) tuyệt đối bình quân:
Lượng tăng giảm tuyệt đối được tính theo công thức
Trong đó:
: Là lượng tăng(hoặc giảm) liên hoàn ở thời gian i so với thời gian đứng liền trước là i-1. Phản ánh sự biến động về mức độ tuyệt đối giữa hai thời gian liền nhau.
( với i= 2,3….n)
Mức độ ở thời gian i
: Mức độ ở thời gian i-1
: Mức độ đầu tiên của dãy số.
: Mức độ cuối cùng của dãy số.
Lượng tăng giảm tuyệt đối phản ánh sự thay đổi về quy mô của hiện tượng qua thời gian.
Lượng tăng giảm tuyệt đối bình quân đại diện cho các lượng tăng (hoặc giảm) tuyệt đối từng kỳ.
Từ đó có mô hình dự đoán:
với l = 1,2,3…
Mô hình dự đoán này cho kết quả dự đoán tốt khi các lượng tăng (hoặc giảm) tuyệt đối liên hoàn xấp xỉ nhau.
2.Dự đoán dựa vào tốc độ phát triển bình quân:
Tốc độ phát triển bình quân được tính theo công thức:
Trong đó:
tốc độ phát triển liên hoàn ở thời gian i so với thời gian i-1 và có thể biểu hiện bằng lần hoặc %.
(với i= 2,3,….n)
Mức độ ở thời gian thứ i.
Mức độ ở thời gian thứ i-1
: Mức độ đầu tiên của dãy số.
: Mức độ cuối cùng của dãy số.
Tốc độ phát triển phản ánh qua thời gian hiện tượng nghiên cứu phát triển với tốc độ cụ thể là bao nhiêu ( nhanh hay chậm và có xu hướng như thế nào).
Tốc độ phát triển bình quân đại diện cho các tốc độ phát triển liên hoàn, phản ánh nhịp điệ phát triển điển hình của hiện tượng trong suốt thời gian nghiên cứu.
Từ công thức tính tốc độ phát triểm bình quân cho thấy chỉ nên tính chỉ tiêu này đối với những hiện tượng biến động qua thời gian theo những xu hướng nhất định.
Từ đó có mô hình dự đoán:
với l = 1, 2, 3…
Mô hình dự đoán cho kết quả tốt nhất khi các tốc độ phát triển liên hoàn xấp xỉ nhau.
3. Dự đoán dựa vào ngoại suy hàm xu thế:
Biểu hiện các mức độ của dãy số thời gian bằng một hàm số được gọi là hàm xu thế
Dạng tổng quát:
với t = 1, 2, 3…
: Mức độ dự đoán của hiện tượng ở thời gian t được tính từ hàm xu thế .
f(t): Là hàm xu thế.
t : Thứ tự thời gian của dãy số. t= 1,2,3……
-Từ đó có mô hình dự đoán là :
với l= 1,2,3….
-Tiêu chuẩn để chọn mô hình dự đoán tốt nhất :
+ Tổng bình phương sai số dự đoán:SSE = = min
+ Sai số chuẩn của mô hình dự đoán: SE = = min
n : số lượng các mức độ của dãy số
k : số lượng các hệ số (tham số của mô hình)
Dựa vào một trong hai tiêu chuẩn trên ta sẽ xác định được mô hình dự đoán tốt nhất ,tức là mức độ dự đoán sát với mức độ thực tế hơn.
Bước 1: Căn cứ để chọn hàm xu thế:
+Thăm dò dạng hàm xu thế bằng đồ thị
Trục hoành : thứ tự thời gian.
Trục tung : mức độ thực tế.
+Một vài căn cứ khác
- Dùng sai phân : - Sai phân bậc 1: ( i= 2,3,4,….n)
Với điều kiện là các xấp xỉ nhau. Dựa vào sai phân bậc 1 cho ta hàm xu thế tuyến tính: .
- Sai phân bậc 2:
Với điều kiện là các xấp xỉ nhau. Dựa vào sai phân bậc 2 cho ta hàm parabol :
- Sai phân bậc 3 :
Với điều kiện là các xấp xỉ nhau . Dựa vào sai phân bậc 3 cho ta hàm xu thế bậc 3 : +
Nói tóm lại sai phân bậc k cho tà hàm xu thế bậc k
Dùng tốc độ phát triển liên hoàn : (với i= 2,3,….n)
Với điều kiện các giá trị xấp xỉ nhau. Dựa vào tốc độ phát triển liên hoàn ta có hàm xu thế là hàm mũ : .
+ Thường sử dụng tiêu chuẩn: tính sai số chuẩn của hàm xu thế trùng với SE
SE= min
Trong đó: Mức độ thự tế của hiện tượng ở thời gian t.
: Mức độ của hiện tượng ở thời gian t được tính từ hàm xu thế.
n : số lượng mức độ của dãy số.
k: hệ số của hàm xu thế.
Bước 2: Đi tìm giá trị cụ thể của các hệ số hàm xu thế( , i= 0,1,2,….). Dùng phương pháp bình phương nhỏ nhất : SSE = = min
Một số dạng hàm xu thế thường sử dụng:
Hàm xu thế tuyến tính:
Hàm xu thế tuyến tính được sử dụng khi các lượng tăng(hoặc giảm) tuyệt đối liên hoàn xấp xỉ nhau.
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây để tìm giá trị của các hệ số và :
Hoặc có thể tính và theo các công thức sau đây:
Đồ thị biểu diễn phương trình đường thẳng ( ) có dạng:
y
t
0
b1 > 0
y
0
b1 < 0
t
Hàm xu thế parabol :
Hàm xu thế parabol được sử dụng trong trường hợp của dãy số tăng dần theo thời gian, đạt cực đại, sau đó lại giảm dần theo thời gian; hoặc giảm dần theo thời gian, đạt cực tiểu, sau đó lại tăng dần theo thời gian. Dạng tổng quát của hàm xu thế parabol như sau:
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây để tìm giá trị của các hệ số , và :
+
+
Đồ thị biểu diễn phương trình đường bậc 2 () có dạng:
0
t
y
y
0
t
Hàm bậc 3:
= b0 + b1t + b2t2 + b3t3
Các tham số b0, b1, b2 và b3 của phương trình bậc ba được xác định theo hệ phương trình chuẩn tắc sau:
Đồ thị biểu diễn phương trình đường bậc ba có dạng:
y
0
t
0
t
y
Hàm xu thế hàm mũ:
Hàm xu thế hàm mũ được sử dụng khi các tốc độ phát triển liên hoàn xấp xỉ nhau
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hẹ phương trình sau đây để tìm giá trị của các hệ số , :
Giải hệ phương trình trên sẽ được ln, ; tra đối ln sẽ được , .
Để xác định đúng đắn dạng cụ thể của hàm xu thế, đòi hỏi phải phân tích đặc điểm biến động của hiện tượng qua thời gian, dựa vào đồ thị và một số tiêu chuẩn khác như sai số chuẩn của mô hình- ký hiệu SE:
SE=
Đồ thị biểu diễn phương trình hàm số mũ có dạng:
y
0
t
Hàm xu thế hyperbol:
Hàm xu thế hyperbol được sử dụng khi các mức độ của hiện tượng giảm dần theo thời gian. Dạng tổng quát của hàm xu thế hyperbol như sau:
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây để tìm giá trị của các hệ số , :
Nếu trên đồ thị biểu hiện các mức độ thực tế của hiện tượng qua thời gian có thể xây dựng một số hàm xu thế thì chọn hàm xu thế nào có sai số chuẩn của mô hình nhỏ nhất.
4. Dự đoán dựa vào hàm xu thế và biến động thời vụ :
Biến động thời vụ là sự biến động của hiện tượng có tính chất lặp đi lặp lại trong từng thời gian nhất định của năm. Ví dụ: Sản xuất nông nghiệp phụ thuộc vào thời xụ. Trong các nghành khác như công nghiệp, giao thông vận tải, xây dựng, du lịch, dịch vụ .v.v...ít nhiều có biến động thời vụ.
Nguyên nhân gây ra biến động thời vụ là do ảnh hưởng của điều kiện tự nhiên và phong tục, tập quán sinh hoạt.
Biến động thời vụ làm cho hiện tượng lúc thì mở rộng, khẩn trương, khi thì thu hẹp, nhàn rỗi.
Nghiên cứu biến động thời vụ nhằm đề ra những biện pháp phù hợp, kịp thời hạn chế ảnh hưởng của biến động thời vụ đối với sản xuất và sinh hoạt của xã hội.
Phương pháp thường được sử dụng để biểu hiện biến động thời vụ là tính các chỉ số thời vụ. Tài liệu được sử dụng để tính các chỉ số thời vụ thường là tài liệu hàng tháng hoặc hàng quý của ít nhất ba năm.
Các mức độ của dãy số thời gian có thể được phân chia ra ba thành phần sau:
Xu thế, ký hiệu , phản ánh xu hướng phát triển cơ bản của hiện tượng kéo dài theo thời gian.
Thời vụ, ký hiệu , sự biến động có tính chất lặp đi lặp lại trong những khoảng thời gian nhất định của năm.
Ngẫu nhiên, ký hiệu , sự biến động do các yếu tố ngẫu nhiên xảy ra ở những thời gian khác nhau.
Ba thành phần trên có thể kết hợp được với nhau theo một trong hai dạng sau đây:
Kết hợp cộng:
Kết hợp nhân:
4.1 Dự đoán dựa vào hàm xu thế kết hợp cộng với biến động thời vụ :
Trường hợp đơn giản được giả thiết rằng xu thế là hàm tuyến tính:
( với t= 1,2,3,…. Là thứ tự thời gian trong dãy số)
Khi đó việc xác định xu thế và biến động thời vụ được dựa vào bảng Buys_Ballot.
Quý (j)
Năm (i)
1
2
….
j
…
m
Tổng năm Ti
i
1
2
3
…
i
…
n
T1
T2
T3
…
Ti
Tn
T1
2T2
3T3
…
iTi…
nTn
Tổng chung
T=
S=
Trong đó: Ti =
Chú ý: kết hợp cộng đơn vị tính là của yt
- Tìm b0, b1:
st với j=1,2,3,4.
Từ đó có thể dự đoán được các mức độ dựa vào hàm xu thế kết hợp cộng với biến động thời vụ.
Mô hình dự đoán:
4.2 Dự đoán dựa vào hàm xu thế kết hợp nhân với biến động thời vụ :
Để phân tích các thành phàn của dãy số thời gian yt theo kết hợp nhân, trước hết cần loại trừ thành phần thời vụ và thành phần ngẫu nhiên bằng cách xây dựng dãy số bình quân trượt , tính .
Từ đó, xác định thành phần thời vụ bằng cách tính số bình quân . Sau đó, tính hệ số hiệu chỉnh H: H=
- Với m= 4 đối với tài liệu quý, m= 12 đối với tài liệu tháng.
Từ đó tính:
- Sau khi đã xác định được st thì xác định dãy số y’t là dãy số đã loại bỏ thành phần thời vụ như sau: y’t=. Từ dãy số y’t đi xây dựng hàm xu thế.
-Từ đó có mô hình dự đoán là:
Trên đây đã trình bày các thành phần dãy số theo kết hợp cộng và kết hợp nhân. Vấn đề đặt ra là : Đối với dãy số thời gian như thế nào thì phân tích theo kết hợp cộng hoặc kết hợp nhân? Nhiều sự nghiên cứu cho thấy : nếu đồ thị biểu hiện sự biến động của hiện tượng qua thời gian có biên độ giao động thay đổi ít thì có thể phân tích theo kết hợp cộng, nếu có biên độ dao động thay đổi nhiều thì có thể phân tích theo kết hợp nhân.
5. Dự đoán theo phương pháp san bằng mũ:
Ở phần trên đã đề cập tới một số phương pháp dự đoán thống kê mà khi xây dựng các mô hình dự đoán thì các mức độ của dãy số thời gian được xem là như nhau, nghĩa là có cùng quyền số trong khi xây dựng mô hình.
Nhưng ở những thời gian khác nhau thì hiện tượng nghiên cứu chịu sự tác động của những nhân tố khác nhau và cường độ không giống nhau. Có những nhân tố mất đi và có những nhân tố mới xuất hiện; có những nhân tố yếu đi và cũng có nhân tố mạnh lên.
Vì vậy, để phản ánh sự biến động này, đòi hỏi khi xây dựng mô hình dự đoán các mức độ của dãy số thời gian phải được chú ý một cách khác nhau. Các mức độ càng mới( ở cuối dãy số thời gian) càng cần phải được chú ý nhiều hơn so với các mức độ càng cũ ( ở đầu dãy số). Như vậy mô hình dự đoán có khả năng thích nghi với sự biến động của hiện tượng qua thời gian. Một trong những phương pháp để xây dựng mô hình dự đoán như vậy là phương pháp san bằng mũ. Sau đây sẽ đề cập đến một số mô hình san bằng mũ.
5.1 Mô hình đơn giản:
Mô hình giản đơn được sử dụng đối với dãy số thời gian không có xu thế và không có biến động thời vụ rõ rệt. Giả sử ở thời gian t, có mức độ thực tế là yt và mức độ dự đoán là . Mức độ dự đoán của hiện tượng ở thời gian t+1 có thể viết
(1)
Đặt (1-= ta có:
(2)
được gọi là các tham số san bằng với và nhận giá trị trong khoảng [0;1]. Như vậy, mức độ dự đoán là trung bình cộng gia quyền của yt và .
Mức độ dự đoán của hiện tượng ở thời gian t là:
, thay vào (2) ta có:
Bằng cách này tiếp tục thay các mức độ dự đoán … vào công thức trên, sẽ có:
(3)
Vì <1 nên khi i thì và 1
Khi đó:
Như vậy: Mức độ dự đoán là tổng tất cả các mức độ của dãy số thời gian được tính theo quyền số mà trong đó các quyền số giảm dần theo dạng mũ tùy thuộc vào mức độ cũ của dãy số. Cũng chính vì vậy mà phương pháp này được gọi là phương pháp san bằng mũ.
Công thức (1) có thể viết:
Nếu đặt là sai số dự đoán ở thời gian t thì:
Từ các công thức trên cho ta thấy có hai vấn đề quan trọng trong phương pháp sang bằng mũ.
Thứ nhất, là việc lựa chọn , được ràng buộc với điều kiện 0và . Nếu được chọn càng lớn thì các mức độ càng mới sẽ càng được chú ý, ngược lại nếu được chọn càng nhỏ thì các mức độ cũ được chú ý một cáh thỏa đáng. Do đó, để lựa chọn đòi hỏi phải dựa vào đặc điểm biến động của hiện tượng qua thời gian và kinh nghiệm nghiên cứu. Nói chung giá trị tốt nhất là giá trị làm cho tổng bình phương sai số dự đoán nhỏ nhất.
Thứ hai, là san bằng mũ được thực hiện theo phép đệ quy, tức là để tính thù phải có , để có thì phải có …Do đó để tính toán cần phải xác định giá trị ban đầu ( điều kiện ban đầu)- ký hiệu yo. Có nhiều phương pháp khác nhau để xác định giá trị ban đầu như có thể lấy mức độ đầu tiên của dãy số, hoặc số trung bình của một số các mức độ đầu tiên của dãy số, …
Trên đây đã trình bày nội dung của phương pháp dự đoán bằng san bằng mũ với mô hình đơn giản. Mô hình này có thể viết:
Với a0(t)=
5.2 Mô hình xu thế tuyến tính và không có biến động thời vụ:
Trong trường hợp biến động của hiện tượng qua thời gian cso xu thế là tuyến tính và không có biến động thời vụ để dự đoán, ta sử dụng mô hình sau:
Trong đó:
là các tham số san bằng và nhận giá trị trong khoảng [0; 1]. Giá trị được chọn tốt nhất là các giá trị làm cho tổng bình phương của sai số dự đoán là bé nhất. Việc lựa chọn các giá trị ban đầu có thể được tiến hành như sau:
(0) có thể là mức độ đầu tiên trong dãy số.
(0) có thể là lượng tăng ( giảm) tuyệt đối trung bình.
(0) =
5.3 Mô hình xu thế tuyến tính và biến động thời vụ :
Mô hình này được sử dụng đối với dãy số thời gian mà các mức độ của nó là tài liệu tháng hoặc quý của một số năm- tức là sau một khoảng thời gian k( với k=4, đối với tài liệu quý, k=12 đối với tài liệu năm). Việc dự đoán có thể được thực hiện theo một trong hai mô hình sau đây:
+ Mô hình cộng:
Trong đó:
+ Mô hình nhân:
Trong đó:
Với là các tham số nhận giá trị trong khoảng [0;1]
Dự đoán bằng phương pháp san bằng mũ sẽ trở nên thuận tiện hơn khi sử dụng chương trình SPSS. Trong chương trình này sẽ cho phép lựa chọn các tham số san bằng, các giá trị ban đầu một cách tốt nhất và việc thực hiện dự đoán một cách thuận tiện.
6. Dự đoán bằng mô hình tuyến tính ngẫu nhiên(phương pháp Box-Jenkins):
Trong phương pháp này, dãy số thời gian xem như được sinh ra từ một quá trình ngẫu nhiên. Trên cơ sở đó, một số mô hình quan trọng được xây dựng tiến hành dự đoán.
6.1. Một số mô hình tuyến tính ngẫu nhiên :
6.1.1 Một số khái niệm khái quát về quá trình ngẫu nhiên:
+ Quá trình ngẫu nhiên : là một tập hợp các giá trị của biến ngẫu nhiên xuất hiện qua thời gian và tuân theo một quy luật phân phối xác suất nào đó.
+Quá trình ngẫu nhiên dừng: một quá trình ngẫu nghiên zt được gọi là dừng nếu như quy luật phân phối xác suất của cũng đồng thời là quy luật phân phối xác suất .
Trong quá trình ngẫu nhiên dừng không có xu thế và không có biến động thời vụ (k: độ trễ)
Kỳ vọng của quá trình dừng : E(Yt)=
Tự hiệp phương sai giữa zt và zt-k
Tự tương quan giữa zt , zt-k
với k=0,1,2…; và -1
là hàm số đối với các giá trị của k.
Gọi là : - Hàm tự hiệp phương sai
- Hàm tự tương quan.
- Trong thực tế có dãy số thời gian Yt, do đó sẽ được ước lượng qua ck và rk
Với
b với
Với
+ Các toán tử được dùng để xác định mô hình:
Toán tử lùi: kí hiệu: B
BYt= Yt-1
Toán tử sai phân: kí hiệu :
Sai phân bậc 1 của Yt :
Sai phân bậc d của Yt:
Quá trình tự hồi qui:
Dãy {Yt} được gọi là tuân theo quá trình tự hồi qui bậc p. Ký hiệu AR(p) nếu:
Trong đó:
là các tham số.
at là một quá trình đặc biệt đơn giản và được gọi là quá trình thuần khiết hay tạp âm trắng với:
E[at]= 0
Var[at]=
Cov[at,at-k] = 0
Biểu diễn qua toán tử B:
Hay:
Hàm tự tương quan:
Với k
Một vài quá trình AR đơn giản:
Quá trình bậc 1: AR(1)
Hàm tương tự quan:
Quá trình bậc 1: AR(2)
Hàm tự tương quan:
Với :
Quá trình bình quân trượt :
Dãy {Yt} được gọi là tuân theo quá trình bình quân trượt bậc q. Ký hiệu MA(q) nếu:
Trong đó: là các tham số.
Biểu diễn qua toán tử B:
Hay
Hàm tự tương quan :
Với
Một vài quá trình MA đơn giản :
Quá trình bậc 1: MA (1)
Hàm tự tương quan :
Với
Quá trình bậc 2: MA(2)
Hàm tự tương quan:
=0 với k
Quá trình tự hồi qui trung bình trượt bậc p,q. Ký hiệu ARMA(p,q)
Đó là sự kết hợp giữa AR(p) và MA(q) :
Hay
Hàm tự tương quan:
với k q+1
Trong thực tế, quá trình ARMA(1,1) thường được sử dụng:
6.1.2. Một số mô hình tuyến tính không dừng:
Mô hình tổng hợp tự hồi quy- bình quân trượt :
Trong thực tế, phần lớn các quá trình ngẫu nhiên là không dừng, để thích ứng với các quá trình ngẫu dừng thì cần phải chuyển quá trình không dừng thành quá trình dừng bằng cách sử dụng toán tử sai phân .
Từ quá trình ARMA(p,q) nếu thay Yt bằng ta sẽ có :
=
Quá trình bình quân trên được gọi là quá trình tổng hợp tự hồi qui- bình quân trượt. Ký hiệu ARIMA(p,d,q) trong đó:
p là bậc của tóan tử tự hồi qui;
d là bậc của toán tử sai phân;
q là bậc của toán tử bình quân trượt;
Một số mô hình ARIMA thường được sử dụng:
ARIMA(0,1,1):
ARIMA(0,2,2):
ARIMA(1,1,1):
Mô hình biến động thời vụ:
Trong thự tế, nhiều dãy số thời gian mà các mức độ của nó được lặp lại sau khoảng thời gian k (ví dụ : k= 12 đối với tài liệu tháng, k=4 đối với tài liệu quý). Khi đó phải khử biến động thời vụ bằng toán tử ( 1- rồi mới áp dụng các mô hình đã trình bày ở trên.
Mô hình biến động thời vụ ký hiệu là SARIMA(p,d,q)
Để đưa Yt về dãy dừng cần:
- Khử biến động thời vụ : dùng toán tử tử ( 1-
- Khử xu thế mà sử dụng toán tử sai phân. (Với d=1 xu thế tuyến tính; d=2 xu thế bậc 2; d=3 xu thế bậc 3)
Ví dụ : Xây dựng mô hình SARIMA(1,1,1) cho Yt trên cơ sở ARIMA(1,1,1) và ARMA(1,1)
6.2. Phương pháp Box-Jenkins:
E.R.Box và G.M.Jenkín đã đề ra phương pháp dự đoán dựa vào mô hình ngẫu nhiên mà nội dung gồm bốn bước chính sau đây:
Bước 1: Đi tìm mô hình ARIMA nó phù hợp với dãy số thời gian được nghiên cứu.
Bước này cho phép nhận biết trong họ tất cả các mô hình ARIMA thì mô hình nào có khả năng thích hợp nhất với dãy số thời gian được nghiên cứu.
Trong thực tế, nhiều dãy số thời gian có biến động thời vụ và xu thế . Do đó, phải khử biến động thời cụ và bậc của xu thế. Toán tử ( 1- được sử dụng để khử biến động thời vụ , toán tử ( d=1 đối với xu thế tuyến tính, d=2 đối với xu thế parabol…) được sử dụng để khử xu thế.
Sau khi đã khử biến động thời vụ và xu thế , dãy số thời gian trở thành dãy số dừng. Từ đó, đi xác định bậc p,q của mô hình ARMA có thể dựa vào đồ thị của hàm tự tương quan và hàm tự tương quan riêng phần:
Nếu đồ thị của hàm tự tương quan giảm từ từ và đồ thị của hàm tự tương quan riêng phần có p giá trị đầu tiên khác 0(p=3 là lớn nhất) thì có thể có một AR(p)
Nếu đồ thị của hàm tự tương quan chỉ có q giá trị đầu tiên khác 0( q=3 là lớn nhất ) và đồ thị của hàm tự tương quan riêng phần giảm từ từ thì có thể có một MA(q)
Nếu đồ thị của hàm tự tương quan và hàm tự tương quan riêng phần không có sự cắt ngắn như hai trường hợp trên thì sẽ có một ARMA.
Về phương diện thực hành, nếu áp dụng phần mềm thống kê, ví dụ SPSS, ta có thể cho p,q những giá trị khác nhau . Mô hình ARMA được lựa chọn để dự đoán là mô hình có sai số nhỏ nhất.
Bước 2: Ước lượng các tham số của mô hình:
Việc ước lượng các tham số của mô hình có thể được tiến hành bằng những phương pháp khác nhau. Phương pháp tương đối đơn giản là dựa vào hàm tự tương quan bằng cách thay bằng rk. Ví dụ:
Đối với AR: Nếu gọi là ước lượng của ta sẽ có :
Với AR(1) : vùng cho phép
Với AR(2):
Vùng cho phép:
Đối với MA: Nếu gọi là ước lượng của ,sẽ có :
Với MA(1) : vùng cho phép -1<
Với MA(2):
Vùng cho phép : :
Đối với ARMA(1,1):
Vùng cho phép :
Việc ước lượng các tham số như trên là ước lượng sơ bộ. Trên cơ sở đó, bằng phương pháp lặp- tức là cho hoặc những giá trị lhác nhau trong vùng cho phép, từ đó đi đến ước lượng tốt nhất, đó là giá trị của các tham số của mô hình làm cho sai số của mô hình đạt cực tiểu.
6.2.3. Bước 3: Kiểm tra xem mô hình có thích hợp không:
Sau khi các tham số của mô hình đã được xác định, cần kiểm tra xem mô hình có được chấp nhận hay không?
+ Các tham số của mô hình phải khác 0 . Nếu có tham số nào khổng thỏa mãn thì loại khỏi mô hình.
+ Phân tích phần dư là ước lượng của at.
Trung bình cộng triệt tiêu, trong trường hợp ngược lại thì nên thêm mọt hằng số vào mô hình. Việc thêm hằng số không ảnh hưởng đến tính chất ngẫu nhiên của quá trình.
Các phần dư là một tạp âm trắng. Có thể dùng tiêu chuẩn sau đây để kiểm định :
Q=n
Với là tự tương quan bậc k của các phần dư.
Q tuân theo gần như một phân phối với bậc tự do (k-p-q). Với mức ý nghĩa kiểm định , tra bảng . Nếu Q thì giả thiết H0 bị bác bỏ và như vậy mô hình được lựa chọn là không thích hợp, khi đó phải trở lại bước một.
Bước 4 : Dự đoán và nghiên cứu:
Nếu mô hình được chọn là thích hợp thì dựa vào nó để tiến hành dự đoán.
Gọi
Tức là dự đoán là kỳ vọng các mức độ đã biết.
Ví dụ : Có dãy số thời gian Yt(với t=1,2,…., T) là số liệu của T năm. Giả sử tồn tại xu thế tuyến tính và mô hình thích hợp là ARIMA(1,1,1):
Hay :
Ở thời gian t= T+1 thì mô hình ARIMA(1,1,1) sẽ là:
Lấy kỳ vọng hai vế, sẽ được :
Hay:
Các kỳ vọng ở hai vế phải được tính theo nguyên tắc sau đây:
[YT-j]=YT-j với j=0,1,2,…., (T-1)
Các mức độ của YT-j đến thời gian T đã biết. Đó chính là các mức độ của dãy số thời gian Yt
[YT+j]=với j=1.2.3…
Tức là các mức độ YT+j chưa biết sẽ được thay bằng các giá trị dự đoán
[aT-j]=aT-j= YT-j với j=1,2,3…., (T-1)
[aT+j]=0 với j =1,2….
Theo nguyên tắc trên,sẽ có:
Với l=1:
Với l=2:
v.v…
Nhiều sự nghiên cứ đã khẳng định rằng phương pháp dự đoán dựa vòa mô hình tuyến tính ngẫu nhiên cho kết quả với mức chính xác cao. Đây là phương pháp rất tổng quát. Để vận dụng phương pháp này có hiệu quả, đòi hỏi phải sử dụng các chương trình tính toán, ví dụ chương trình SPSS.
Trên đây đã trình bày một số phương pháp chủ yếu thường được sử dụng trong dự đoán thống kê. Tùy thuộc vào trình độ của cán bộ mà sử dụng các phương pháp đó. Nói chung, phương pháp nào đòi hỏi khối lượng tính toán càng lớn( và cần thiết phải sử dụng máy tính) thì thường cho kết quả dự đoán tốt hơn.
Chương 2: Vận dụng một số phương pháp dự đoán để dự đoán GDP Việt Nam đến năm 2010.
I. Nguồn số liệu:
Năm
1990
1991
1992
1993
1994
1995
1996
1997
1998
GDP(tỉ đồng)
131968
139634
151782
164043
178534
195567
213833
231264
244596
Năm
1999
2000
2001
2002
2003
2004
2005
2006
GDP(tỉ đồng)
256272
273666
292535
313247
336242
362435
393031
425135
Nguồn số liệu lấy từ trang web của tổng cục thống kê ( trong mục số liệu thống kê của phần tài khoản quốc gia. Hoặc là lấy từ niên giám thống kê năm 2006 của tổng cục thống kê Việt Nam.
Nguồn số liệu theo năm vì vậy có những đặc điểm như sau:
Không có biến động thời vụ.
Có biến động thành phần ngẫu nhiên
Có xu thế.
II- Vận dụng một số phương pháp dự đoán GDP Việt Nam đến năm 2010:
Lựa chọn phương pháp dự đoán:
Không thể sử dụng các phương pháp dự đoán có biến động thời vụ như:
Dự đoán dựa vào hàm xu thế có biến động thời vụ.
Mô hình san bằng mũ giản đơn( simple). Vì áp dụng cho những dãy số không có xu thế, không có biến động thời vụ.
Mô hình tuyến tính ngẫu nhiên có biến động thời vụ.
Các mô hình được lựa chọn:
Mô hình dự đoán dựa vào lượng tăng giảm tuyệt đối bình quân.
Mô hình dự đoán dựa vào tốc độ phát triển bình quân.
- Mô hình dự đoán dựa vào hàm xu thế.
Mô hình san bằng mũ có xu thế và không có biến động thời vụ (phương pháp Holt)
Mô hình tuyến tính không dừng.
Tiêu chuẩn để lựa chọn mô hình là SE min hoặc SSE min
Kết hợp với hệ số xác định R gần 1 nhất sẽ được lựa chọn.
1. Dự đoán dựa vào tốc độ tăng ( hoặc giảm) tuyệt đối bình quân:
Dựa vào nguồn số liệu ta có:
==17245.118 tỷ đồng.
Dự đoán GDP của các năm 2007,2008,2009,2010:
Năm
GDP (tỷ đồng)
2007
442380.118
2008
459625.236
2009
476870.354
2010
494115.472
Tiêu chuẩn lựa chọn mô hình:
Năm
yt
l
1990
131968
-16
2276228867
297393887.9
1991
139634
-15
2408429942
719539315.1
1992
151782
-14
2617923635
1018972458
1993
164043
-13
2829366027
1362013421
1994
178534
-12
3079265032
1572882603
1995
195567
-11
3373001127
1589752620
1996
213833
-10
3688000452
1509386215
1997
231264
-9
3988600104
1494977431
1998
244596
-8
4218512017
1812890853
1999
256272
-7
4419866015
2318150364
2000
273666
-6
4719827598
2303836035
2001
292535
-5
5045225729
2150585903
2002
313247
-4
5402406613
1841055959
2003
336242
-3
5798958102
1380690656
2004
362435
-2
6250659477
795790784.9
2005
393031
-1
6778291108
220786374.3
2006
425135
0
7331928376
0
SSE
1
22388704880
SE
38633.93
SE==38633.93
2. Dự đoán._.
Các file đính kèm theo tài liệu này:
- 36091.doc