LỜI MỞ ĐẦU
Kết quả hoạt động kinh tế của một người bất kỳ được phản ánh trước hết ở thu nhập của người ấy. Thông thường một người có thu nhập cao dễ cho phép người ta chi mua những hàng hóa và dịch vụ chất lượng tốt để thỏa mãn nhu cầu vật chất và tinh thần đa dạng của họ. Trong khi đó, những người có thu nhập thấp không có khả năng chi trả cho những hàng hóa và dịch vụ đắt tiền và do đó chỉ được hưởng một mức sống khiêm tốn hơn nhiếu với những người có thu nhậo cao. Điều tương tự cũng đúng v
45 trang |
Chia sẻ: huyen82 | Lượt xem: 4315 | Lượt tải: 3
Tóm tắt tài liệu Phương pháp hồi quy ứng dụng trong phân tích các nhân tố tác động đến tổng sản phẩm trong nước của Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ới các nền kinh tế quốc gia. Nền kinh tế hoạt động có hiệu quả khi mà mọi người trong nền kinh tế tạo ra và hưởng thụ thu nhập cao. Kết quả là tổng thu nhập do mọi thành viên trong nền kinh tế tạo ra sẽ lớn và mọi người đựơc hưởng mức sống cao hơn so với các nền kinh tế có mức thu nhập bình quân đầu người thấp hơn.
GDP là thước đo sản lượng và thu nhập của một nền kinh tế, đó là một trong những biến số quan trọng nhất của nền kinh tế quốc dân. Do vậy tăng GDP là mục tiêu hàng đầu của bất cứ một quốc gia nào.Ở Việt Nam GDP qua các năm đều tăng nhưng so với các nước trong khu vực Đông Nam Á như Thái Lan, Singapor, Brunay…. thì GDP của nước ta còn kém rất nhiều, thuộc loại thấp trong khu vực. Do vậy mục tiêu tăng GDP lại càng bức thiết hơn.
Ở Việt Nam liên tục 20 năm qua đã thực hiện những đường lối đổi mới trong n ền kinh tế, và đã đạt được một số thành tựu đáng kể như:tăng trưởng kinh tế khá cao, GDP tăng bình quân 7%/năm, riêng năm 2005, 2006 tăng trưởng GDP của Việt Nam là trên 8%/năm, kết cấu hạ tầng kinh tế-xã hội được đầu tư ngày càng tốt hơn. Trở thành thành viên trong Tổ chức thương mại quốc tế từ cuối năm 2006 đã mở ra cho Việt Nam nhiều triển vọng phát triển kinh tế hơn. Dự kiến trong 5 năm tới 2006-2010 GDP tăng bình quân 8%/năm và bình quân GDP đầu người năm 2010 sẽ đạt 1.100-1.200 USD.
Để đạt được mục tiêu đó trước hết cần phải xem xét các nhân tố tác động làm cho GDP tăng lên hay giảm xuống để có biện pháp làm cho GDP tăng trưởng.
Làm cho đời sống nhân người dân càng ngày càng được cải thiện.
Xuất phát từ ý nghĩa trên em quyết định chọn đề tài : “Phương pháp hồi quy ứng dụng trong phân tích các nhân tố tác động đến Tổng sản phẩm trong nước của Việt Nam thời kỳ 1995- 2006” với mong muốn có thể nhìn nhận rõ hơn về sự tác động của các nhân tố đến GDP nhằm đưa ra được những biện pháp thích hợp làm cho tốc độ tăng trưởng GDP ngày càng cao.
Đề án còn rất nhiều thiếu sót do hạn chế về lý luận và thời gian nên em rất mong nhận được dự góp ý của thầy cô cùng các bạn để đề tài được hoàn thiện hơn và có ý nghĩa trong thực tế.
Em xin chân thành cảm ơn các thầy cô trong khoa Thống Kê, đặc biệt là thầy Nguyễn Hữu Chí đã tận tình hướng dẫn để em hoàn thành đề án này.
Chương 1: Những vấn đề lý luận chung về phân tích hồi quy
I- KHÁI NIỆM , NHIỆM VỤ , Ý NGHĨA CỦA PHÂN TÍCH HỒI QUY TƯƠNG QUAN
1.Khái niệm :
Chủ nghĩa duy vật biện chứng khẳng định : Các hiện tượng đều tồn tại trong mối liên hệ phụ thuộc với nhau. Phương pháp phân tích hồi quy và tương quan là một trong những phương pháp thường được sử dụng trong thống kê để nghiên cứu mối liên hệ phụ thuộc đó.
Khi nghiên cứu mối liên hệ phụ thuộc, nếu xét theo mức độ chặt chẽ của mối liên hệ, có thể phân thành hai loại: Liên hệ hàm số và liên hệ tương quan.
1.1-Liên hệ hàm số:
- Liên hệ hàm số là mối liên hệ hoàn toàn chặt chẽ giữa tiêu thức nguyên nhân - ký hiệu là x và tiêu thức kết quả - ký hiệu là y.
- Dạng tổng quát của liên hệ hàm số : y = f(x), tức là : Cứ mỗi giá trị của tiêu thức nguyên nhân sẽ có một giá trị tương ứng của tiêu thức kết quả. Mối liên hệ này có thể thấy được không những ở toàn bộ tổng thể, mà cả trên từng đơn vị cá biệt.
- Lĩnh vực áp dụng : Liên hệ hàm số thường gặp khi nghiên cứu các hiện tượng tự nhiên như trong vật lý , hóa học, v v…như lực tác động tương hỗ giữa hai vật thể bất kỳ được tính theo công thức F = g(mAmB/r2) với g là hằng số hấp dẫn, mA và m B là khối lượng của vật thể B, r là khoảng cách giữa hai vật thể A, B
1.2- Liên hệ tương quan:
- Liên hệ tương quan là mối liên hệ ràng buộc lẫn nhau giữa các tiêu thức của hiện tượng, trong đó sự biến động của một tiêu thức này (tiêu thức kết quả) là do tác động của nhiều tiêu thức khác (các chỉ tiêu nguyên nhân) gọi là liên hệ tương quan - một hình thức liên hệ không chặt chẽ: Cứ mỗi giá trị của tiêu thức nguyên nhân sẽ có nhiều giá trị tương ứng của tiêu thức kết quả. Đây là đặc điểm để phân biệt với liên hệ hàm số (Cứ mỗi giá trị của tiêu thức nguyên nhân sẽ có một giá trị tương ứng của tiêu thức kết quả)
- Lĩnh vực áp dụng: liên hệ tương quan thường gặp khi nghiên cứu các hiện tượng kinh tế - xã hội.
Ví dụ:
+ Mối liên hệ giữa số lượng sản phẩm và giá thành đơn vị. Không phải khi khối lượng sản phẩm tăng lên thì giá thành đơn vị sản phẩm sẽ giảm theo một tỷ lệ tương ứng.
+ Mối liên hệ giữa phân bón với năng suất cây trồng .
+ Mối liên hệ giữa vốn đầu tư và kết quả sản xuất.
+Năng suất lúa tăng lên là do tác động của nhiều nhân tố: Phân bón, giống lúa, làm đất, chăm bón,... thì liên hệ giữa năng suất lúa và các nhân tố nêu trên là quan hệ tương quan; trong đó năng suất lúa là chỉ tiêu kết quả, còn phân bón, giống lúa, chi phí chăm bón, làm đất là các chỉ tiêu nguyên nhân
+ Vị dụ 1: cụ thể về tuổi nghề và năng suất lao động của 10 công nhân ở bộ phận sản xuất của công ty A như sau
Bảng 1:
STT công nhân
Tuổi nghề - x (năm)
Năng suất lao động - y (triệu đồng)
A
1
3
B
3
12
C
4
9
D
5
16
E
7
12
F
8
21
G
9
21
H
10
24
I
11
19
K
12
27
Tổng
70
164
Xét về mối liên hệ giữa tuổi nghề(TN) và năng xuất lao động( NSLĐ) thường thường thì khi tuổi nghề càng nhiều thì công nhân càng có trình độ cao do đó năng xuất lao động sẽ tăng. Nhưng không phải cứ khi tuổi nghề tăng thì năng xuất lao động cũng tăng lên.Cụ thể 2 công nhân F và G, công nhân F có tuổi nghề là 8 và năng xuất lao động là 21triệu đồng , công nhân G có tuổi nghề là 9 ( hơn 1 năm so với CN F) nhưng mức NSLĐ cũng là 21 triệu đồng .
Hoặc khi nghiên cứu nhiều công nhân có cùng tuổi nghề kết quả sẽ cho ta thấy NSLĐ không phải luôn bằng nhau.
-Chú ý: Vì các mối liên hệ này là các mối liên hệ không hoàn toàn chặt chẽ , không biểu hiện được một cách rõ ràng trên từng đơn vị cá biệt. do đó để phản ánh mối liên hệ tương quan thì phải nghiên cứu hiện tượng số lớn- tức là thu thập tiêu thức kết quả và tiêu thức nguyên nhân của nhiều đơn vị.
Và trong quan hệ tương quan, tác động của các chỉ tiêu nguyên nhân đối với chỉ tiêu kết quả có các mức độ khác nhau: Có chỉ tiêu nguyên nhân gây ảnh hưởng nhiều (tương quan mạnh), có chỉ tiêu nguyên nhân gây ảnh hưởng không đáng kể (tương quan yếu). Điều này phụ thuộc vào tính chất quan hệ của các chỉ tiêu và điều kiện cụ thể của từng trường hợp.
Mục đích cuối cùng của phân tích thống kê là nghiên cứu mối quan hệ giữa các chỉ tiêu khác nhau và xác định mức độ ảnh hưởng của từng chỉ tiêu cũng như mức độ ảnh hưởng của nhiều chỉ tiêu nguyên nhân đến chỉ tiêu kết quả cụ thể như thế nào?
Một phương pháp toán học áp dụng vào việc phân tích thống kê nhằm biểu hiện và nghiên cứu mối liên hệ tương quan giữa các chỉ tiêu của hiện tượng kinh tế - xã hội là phương pháp phân tích tương quan.
Khi phân tích tương quan không thể xác định quan hệ và mức độ ảnh hưởng lẫn nhau của tất cả các chỉ tiêu của hiện tượng mà chỉ thể hiện trên hai hay một số chỉ tiêu nào đó được xem là chủ yếu (có tương quan mạnh hơn) với giả thiết các chỉ tiêu khác còn lại coi như không thay đổi.
2. Nhiệm vụ của phân tích hồi quy và tương quan
2.1- Phân tích định tính về bản chất của mối quan hệ, đồng thời dùng phương pháp phân tổ hoặc đồ thị để xác định tính chất và xu thế của mối quan hệ đó.
- Là xác định đâu là tiêu thức nguyên nhân , đâu là tiêu thức kết quả: Để giải quyết được vấn đề này đòi hỏi phải có sự phân tích một cách sâu sắc bản chất của mối liên hệ trong điều kiện lịch sử cụ thể. Đây là vấn đề trước tiên quyết định sự thành công của nghiên cứu hồi quy:
+ Tiêu thức nguyên nhân: là những yếu tố quan trọng nhất, chủ yếu nhất, có ảnh hưởng lớn đến tiêu htức kết quả. Căn cứ vào nhiệm vụ nghiên cứu cụ thể để chọn ra một, hai, ba …..tiêu thức nguyên nhân và một tiêu thức kết qủa.
+ Tiêu thức kết quả :chỉ có 1.
- Dùng phương pháp phân tổ hoặc thăm dò bằng đồ thị để xác định tính chất và xu thế của mối quan hệ đó
2.2- Biểu hiện cụ thể mối liên hệ tương quan bằng phương trình hồi quy tuyến tính hoặc phi tuyến tính và tính các tham số của các phương trình.
Từ đó xây dựng mô hình hồi quy có thể là:
- Mô hình hồi quy đơn:
+ Mô hình tuyến tính ( mô hình đường thẳng)
+ Mô hình phi tuyến ( mô hình đường cong)
- Mô hình hồi quy bội : Mô hình hồi quy giũa 2, 3,….tiêu thức nguyên nhân và một tiêu thức kết quả. Mô hình này thường được xây dựng dưới dạng tuyến tính và được gọi là mô hình hồi quy tuyến tính bội.
2.3- Đánh giá mức độ chặt chẽ của mối liên hệ tương quan
Việc đánh giá mức độ chặt chẽ của mối liên hệ tương quan được thực hiện thông qua việc tính toán hệ số tương quan , tỉ số tương quan, hệ sốtương quan bội, hệ số tương quan riêng phần . Dựa vào kết quả tính toán có thể kết luận về mức độ chặt chẽ của mối liên hệ, giúp cho việc nhận thức hiện tượng được sâu sắc, từ đó đề ra những giải pháp cụ thể .
3. Ý nghĩa của phân tích hồi quy và tương quan
- Đây là phương pháp thường sử dụng trong thống kê để nghiên cứu mối liên hệ giữa các hiện tượng, như mối liên hệ giữa các yếu tố đầu vào của quá trình sản xuất với kết quả xản xuất , mối liên hệ giữa thu nhập và tiêu dùng, mối quan hệ giữa phát triển kinh tế với phát triển xã hội…từ đó biết được bản chất của mối liên hệ và đề ra biện pháp có lợi……
- Phương pháp hồi quy tương quan còn được sử dụng trong nhiều phương pháp thống kê khác như : phân tích dãy số thời gian, dự đoán thống kê, phân tích nhân tố….
II- QUY TRÌNH VẬN DỤNG PHÂN TÍCH HỒI QUY:
1. Bước 1: Chọn biến
Là xác định trong mối liên hệ thì tiêu thức nào là tiêu thức nguyên nhân( x), tiêu thức nào là tiêu thức kết quả (y)
Được xác định dựa vào căn cứ sau:
- Tiêu thức nguyên nhân là những yếu tố quan trọng nhất, chủ yếu nhất, có thể có 1 hoặc nhiều tiêu thức nguyên nhân. Và khi các yếu tố này thay đổi thường làm cho tiêu thức kết quả thay đổi theo.
Tiêu thức kết quả: là yếu tố bị ảnh hưởng bởi các yếu tố khác,nó là kết quả của sự thay đổi của những tiêu thức nguyên nhân , tức là khi một số yếu tố khác thay đổi thì sẽ làm cho tiêu thức kết quả thay đổi theo, nhưng ngược lai khi tiêu thức kết quả thay đổi chưa chắc làm cho tiêu thức nguyên nhân thay đổi.
Ví dụ:
+ Ở bảng 1: trong mối liên hệ giữa tuổi nghề và năng xuất lao động thì
Tuổi nghề: là tiêu thức nguyên nhân vì khi tuổi nghề càng nhiều thì tay nghề càng cao, do đó làm cho năng xuất lao động càng tăng.Tuổi nghề thay đổi có thể làm cho năng xuất lao động thay đổi.
Năng xuất lao động : là tiêu thức kết quả vì năng xuất lao động tăng không thể làm cho tuổi nghề tăng lên được. Và khi tuổi nghề thay đổi sẽ làm cho NSLĐ thay đổi
+ Trong mối liên hệ giữa số lượng sản phẩm và giá thành đơn vị sản phẩm thì:
Khối lượng sản phẩm: là tiêu thức nguyên nhân vì thường thì khi khối lượng sản phẩm giảm thì giá thành trên một đơn vị sản phẩm sẽ giảm.
Giá thành đơn vị sản phẩm: là tiêu thức kết quả vì khi giá thành đơn vị thay đổi không thể làm cho khối lượng sản phẩm thay đổi theo.
2. Bước 2: Thăm dò bằng đồ thị để xác định tính chất và xu thế của mối quan hệ đó.
2.1. Hồi quy đơn
Là hồi quy giữa hai tiêu thức số lượng : một tiêu thức nguyên nhân và một tiêu thức kết quả
Nhiệm vụ của bước này là dùng đồ thị để biểu hiện mối liên hệ với trục hoành là tiêu thức nguyên nhân( x) và trục tung là tiêu thức kết quả (y) .Từ đó tìm ra mối liên hệ giữa hai tiêu thức
Có các dạng đồ thị sau:
a- Đồ thị dạng tuyến tính:
Thăm dò băng đồ thị với trục hoành là tiêu thức nguyên nhân( x) ,trục tung là tiêu thức kết quả (y). Nếu các điểm trên đồ thị được phân bố theo một trong hai dang sau đây thì có thể xây dựng mô hình hồi quy tuyến tính đơn
Đồ thị biểu diễn phương trình đường thẳng (y = a0 + a1t) có dạng:
y
t
0
a1 > 0
y
0
a1 < 0
t
Trở lại ví dụ ở bảng 1 ,từ số liệu cho thấy : Nhìn chung, cùng với sự tăng lên của tuổi nghề thì NSLĐ cũng tăng lên , nhưng cũng có trường hợp không hẳn như vậy như NSLĐ của công nhân I so với công nhân H: tuổi nghề tăng nhưng NSLĐ lại thấp hơn. Điều này chứng tỏ giữa tuổi nghề và NSLĐ có mối quan hệ không hoàn toàn chặt chẽ- tức là liên hệ tương quan .
Thăm dò bằng đồ thị ta được kết quả sau:
NSLĐ (tr đ)
Tuổi nghề(năm)
Trên đồ thị có các chấm biểu hiện tuổi nghề và NSLĐ của từng công nhân. Các chấm trên đồ thị tạo thành một băng đường thẳng, từ đó có thể xây dựng mô hình hồi quy tuyến tính như sau:
x = b0 + b1x (2.1.a)
Trong đó:
x là giá trị của tiêu thức kết quả được tính từ mô hình hồi quy
b0 là hệ số tự do, nói lên sự ảnh hưởng của các tiêu thức khác ngoài tuổi nghề đối với NSLĐ
b1 là hệ số góc ( số hồi quy theo x)
Ý nghĩa :cho biết khi tiêu thức nguyên nhân (x) tăng 1 đơn vị thì tiêu thức kết quả (y) tăng nếu b1 >0 (hoặc giảm nếu b1 <0) là b1 đơn vị.
b- Đồ thị dạng Parabôn:
Thăm dò băng đồ thị với trục hoành là tiêu thức nguyên nhân( x) ,trục tung là tiêu thức kết quả (y). Nếu các điểm trên đồ thị được phân bố theo một trong hai dang sau đây thì có thể xây dựng mô hình hồi quy Parabôn:
0
x
y
y
0
x
Phương trình parabol bậc 2 thường được sử dụng khi các trị số của chỉ tiêu nguyên nhân tăng lên thì trị số của chỉ tiêu kết quả tăng (hoặc giảm), việc tăng (hoặc giảm) đạt đến trị số cực đại (hoặc cực tiểu) rồi sau đó lại giảm (hoặc tăng). Ví dụ, nghiên cứu mối liên hệ giữa lượng tiêu hao than và chất lượng gạch máy. Khi lượng tiêu hao than cho 1000 viên gạch còn thấp thì nếu tăng lượng tiêu hao than sẽ làm cho gạch nung ra già hơn, chất lượng cao hơn. Nhưng tăng lượng tiêu hao than đạt đến một mức nào đó (vừa đủ), nếu tiếp tục tăng nữa thì sẽ làm cho gạch nung ra bị khê phồng tức là làm cho chất lượng gạch lại giảm đi. Khi lượng tiêu hao than đạt đến mức vừa đủ thì gạch máy sẽ đạt chất lượng cao nhất (đạt giá trị cực đại).
* Phương trình parabol bậc 2 có dạng:
= bo + b1x + b2x2 (2.1.b)
Ví dụ 2: Trong tác phẩm về sự phát triển của CNTB ở Nga ( Lê Nin toàn tập) nghiên cứu mối quan hệ giàu nghèo và tỷ lệ phần trăm thu bằng tiền của các nông hộ có mối quan hệ với nhau hay không ( sự giàu nghèo thể hiện bằng số ngựa)
Bảng 2
Số ngựa (x)
Tỷ lệ % thu bằng tiền(y)
0
57.1
1
46.47
2
43.57
3
41.47
4
46.95
>=5
60.18
Thăm dò bằng đồ thị ta được dạng đồ thị như sau:
Từ đồ thị trên trên ta có thể xây dựng mô hình hồi quy dạng hàm Parabôn
c- Đồ thị dạng Hyperbôn:
Thăm dò băng đồ thị với trục hoành là tiêu thức nguyên nhân( x) ,trục tung là tiêu thức kết quả (y). Nếu các điểm trên đồ thị được phân bố theo dạng như trong ví dụ dưới đây thì có thể xây dựng mô hình hồi quy Hyperbôn
Phương trình hyperbôn được áp dụng trong trường hợp khi các trị số của chỉ tiêu nguyên nhân tăng lên thì trị số của chỉ tiêu kết quả giảm nhưng mức độ giảm nhỏ dần và đến một giới hạn nào đó () thì hầu như không giảm. Ví dụ, quan hệ giữa giá thành đơn vị sản phẩm và khối lượng sản phẩm sản xuất là quan hệ theo phương trình hybecbol như đã nói ở trên.
* Phương trình Hyperbôn có dạng:
(2.1.c)
Ví dụ 3: Có tài liệu về số lượng sản phẩm (nghìn sản phẩm) và giá thành đơn vị sản phẩm( nghìn đồng/ sản phẩm) của 10 xí nghiệp cùng sản xuất một loại sản phẩm như sau:
Bảng 3
Số lượng SP (Ng.sp)
Giá thành (Ng.đ/sp)
Số lượng SP (Ng.sp)
Giá thành (Ng.đ/sp)
10
15.60
35
15.15
15
15.40
40
15.14
20
15.27
50
15.12
25
15.24
60
15.10
30
15.20
80
15.05
Với tài liệu trên : Tiêu thức nguyên nhân là số lượng sản phẩm (x) , tiêu thức kết quả là giá thành đơn vị sản phẩm (y) và có đồ thị sau đây:
Từ đồ thị trên ta có thể xây dựng mô hình hồi quy dạng hàm Hyperbôn.
d- Đồ thị dạng hàm mũ:
Thăm dò băng đồ thị với trục hoành là tiêu thức nguyên nhân( x) ,trục tung là tiêu thức kết quả (y). Nếu các điểm trên đồ thị được phân bố theo dang sau đây thì có thể xây dựng mô hình hồi quy dạng hàm mũ.
Đồ thị biểu diễn phương trình hàm số mũ có dạng:
y
0
x
x
* Phương trình hàm mũ
(2.1.d)
Phương trình hàm số mũ được áp dụng trong trường hợp cùng với sự tăng lên của chỉ tiêu nguyên nhân thì trị số của các chỉ tiêu kết quả thay đổi theo cấp số nhân, nghĩa là có tốc độ tăng xấp xỉ nhau.
2.2. Hồi quy bội
Là hồi quy giữa nhiều tiêu thức nguyên nhân với một tiêu thức kết quả . Mô hình này thường đựợc xây dựng dưới dạng tuyến tính và được gọi là mô hình hồi quy tương quan tuyến tính bội.
Trong thực tế các hiện tượng kinh tế - xã hội, một chỉ tiêu kết quả thường do tác động của nhiều chỉ tiêu nguyên nhân. Ví dụ, năng suất lao động của công nhân tăng lên do ảnh hưởng của các yếu tố nguyên nhân: Tuổi nghề, trình độ trang bị kỹ thuật, trình độ quản lý, v.v... Do đó vấn đề đặt ra là cần phải nghiên cứu mối liên hệ giữa một chỉ tiêu kết quả với một số chỉ tiêu nguyên nhân.
*Phương trình hồi quy tuyến tính bội:
Giả sử có p tiêu thức nguyên nhân : x1, x2, …, xp và tiêu thức kết quả y, mô hình hồi quy tuyến tính bội sẽ có dạng:
+ …+ bpxp (2.2)
Trong đó : + b0 là hệ số tự do
+ b1, b2, …, bp là các hệ số hồi quy riêng
3. Bước 3: Xây dựng mô hình hồi quy và kiểm định sự phù hợp của hàm hồi quy
Sau khi thăm dò bằng đồ thị ta đã biết được mối quan hệ giữa các tiêu thức và xác định được dạng hàm hồi quy. Từ đó xây dựng các bước tính toán tìm ra mô hình hồi quy chính xác.
3.1- Mô hình hồi quy đơn:
a. Mô hình hồi quy tuyến tính đơn.
* Mô hình hồi quy tuyến tính đơn có dạng:
x = b0 + b1x
Các hệ số b0 và b1 được xác định bằng phương pháp bình phương nhỏ nhất:
Tức là tìm b0 và b1 sao cho tổng bình phương các độ lệch giữa các giá trị thực tế của tiêu thức kết quả được tính từ mô hình hồi quy là nhỏ nhất ( cực tiểu ).
Q == min
Lấy đạo hàm riêng theo các hệ số rồi cho nó bằng 0 và được một hệ phương trình :
(3.1.a)
Để tính được b0 và b1 cần tính , , bằng cách lập bảng sau:
x
y
xy
x2
…
…
…
…
…
…
…
…
=
=
=
=
* Trở lại ví dụ ở bảng 1 với về tuổi nghề và năng suất lao động của các công nhân.
Ta có bảng sau:
Bảng 4
STT công nhân
Tuổi nghề x (Năm)
Năng suất lao động - y (Triệu đồng)
xy
x2
y2
A
1
2
3=1x2
4=(1)2
5=(2)2
A
1
3
3
1
9
B
3
12
36
9
144
C
4
9
36
16
81
D
5
16
80
25
256
E
7
12
84
49
144
F
8
21
168
64
441
G
9
21
189
81
441
H
10
24
240
100
576
I
11
19
209
121
361
K
12
27
324
144
729
Tổng
70
164
1369
610
3182
Từ số liệu đã cho của x và y ở bảng 1, ta tính toán các đại lượng xy, x2 và y2 như cột 3, 4 và 5 của bảng.
Thay số liệu tính được ở bảng 4 vào hệ phương trình 3.1.a ta có:
Giải hệ phương trình tính được: b0 = 3.52 và b1 = 1.84.
Mô hình hồi quy tuyến tính phản ánh mối liên hệ giữa tuổi nghề và năng suất lao động là:
+ b0= 3.52, nói lên ảnh hưởng các nguyên nhân khác ngoài tuổi nghề ảnh hưởng đến năng xuất lao động.
+ b1= 1.84, nói lên khi thêm tăng môt tuổi nghề thì năng suất lao động tăng bình quân 1.84 triệu đồng.
*Bằng cách biến đổi hệ phương trình trên, ta có thể tính b0 và b1 như sau:
b0 =
Với =()/n = 1369/10 = 136.9
=()/n = 70/10 = 7
=()/n = 164/10 = 16.4
=- ()2 = (610/10) – 72= 12
b1= (136.9-7*16.4)/12= 1.84
b0= 16.4- 1.84*7=3.51
b. Mô hình hồi quy phi tuyến Parabôn:
* Phương trình parabol bậc 2 có dạng:
= bo + b1x + b2x2
Áp dụng phương pháp bình phương nhỏ nhất ta có hệ phương trình:
(3.1.b)
Giải hệ phương trình trên ta tìm được các hệ số b0 ,b1 , b2 ,rồi thay vào phương trình = bo + b1x + b2x2 sẽ có mô hình hồi quy giữa hai tiêu thức.
* Trở lại ví dụ 2 ở Bảng 2 về hồi quy mối quan hệ giữa tỷ lệ giàu nghèo( số ngựa) và tỷ lệ phần trăm thu bằng tiền.
Để tính được các hệ số ta lập bảng sau:
Bảng 5
số ngựa (x)
Tỷ lệ % thu bằng tiền(y)
x2
y2
x3
X4
xy
x2y
0
57.1
0
3260.41
0
0
0
0
1
46.47
1
2159.461
1
1
46.47
46.47
2
43.57
4
1898.345
8
16
87.14
174.28
3
41.47
9
1719.761
27
81
124.41
373.23
4
46.95
16
2204.303
64
256
187.8
751.2
>=5
60.18
25
3621.632
125
625
300.9
1504.5
15
295.74
55
14863.91
225
979
746.72
2849.68
Từ bảng trên thay vào hệ (3.1.b) ta có hệ phương trình:
Giải hệ phương trình trên ta được : b0 = 57.33, b1 = -13.22, b2 = 2.792.
Vậy phương trình hồi quy Parabôn là:
= 57.33 + -13.22x + 2.792x2
c. Mô hình hồi quy phi tuyến Hyperbôn:
* Phương trình Hyperbôn có dạng:
Áp dụng phương pháp bình phương nhỏ nhất ta xây dựng được hệ phương trình chuẩn tắc xác định hệ số b và của phương trình trên như sau:
(3.1.c)
Giải hệ phương trình trên ta tìm được các hệ số b0, b1
*Quay trở lại ví dụ 3 bảng về mối liên hệ giữa số lượng sản phẩm và giá thành đơn vị sản phẩm.Từ đồ thị ta có thể xây dựng mô hình Hyperbôn. Căn cứ vào hệ phương trình của mô hình Hyperbôn ta xây dựng bảng sau đây:
Bảng 6
Số lượng SP (Ng.đ)- x
Giá thành (Ng.đ/SP) -y
1/x
1/x2
y.1/x
10
15.6
0.100
0.010
1.560
15
15.4
0.067
0.004
1.027
20
15.27
0.050
0.003
0.764
25
15.24
0.040
0.002
0.610
30
15.2
0.033
0.001
0.507
35
15.15
0.029
0.001
0.433
40
15.14
0.025
0.001
0.379
50
15.12
0.020
0.001
0.302
60
15.1
0.017
0.001
0.252
80
15.05
0.013
0.001
0.188
365
152.27
0.393
0.025
6.020
Thay số liệu vào hệ phương trình (3.1.c) ta được:
Giải hệ phương trình trên ta tìm được các hệ số: b0 = 15.08 và b1= 3.74
Vậy mô hình hồi quy là:
.
d. Mô hình hàm mũ.
* Phương trình hàm mũ
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây để tìm giá trị các hệ số b0, b1:
Giải hệ phương trình trên sẽ được lnb0 , lnb1.Tra đối ln, sẽ được giá trị của b0, b1.
3.2- Mô hình hồi quy tương quan tuyến tính bội:
*Phương trình hồi quy tuyến tính bội với p tiêu thức nguyên nhân và một tiêu thức kết quả y
+ …+ bpxp (3.2)
Ta xét trường hợp đơn giản với phương trình hồi quy tuyến tính giữa ba chỉ tiêu. Nếu gọi y là chỉ tiêu kết quả và x1, x2 là các chỉ tiêu nguyên nhân, ta có phương trình hồi quy tuyến tính giữa 3 chỉ tiêu như sau:
Áp dụng phương pháp bình phương nhỏ nhất sẽ có hệ phương trình sau đây để tính các hệ số b0, b1, b2:
Đồng thời để đánh giá được mức độ ảnh hưởng của từng tiêu thức nguyên nhân xi đối với tiêu thức kết quả y ta dùng Hệ số hồi quy chuẩn hóa – ký hiệu là beta, được tính theo công thức sau:
betai= bi
Dấu của betai là dấu của bi , phản ánh chiều hướng mối liên hệ là thuận hay nghịch giữa tiêu thức nguyên nhân xi với tiêu thức kết quả y.
phản ánh mức độ ảnh hưởng của từng tiêu htức nguyên nhân xi đối với tiêu thức kết quả y
Ví dụ: Có tài liệu về năng suất lao động, phần trăm chi phí nguyên vật liệu nhập ngoại trong giá thành sản phẩm và giá thành đơn vị sản phẩm của 5 doanh nghiệp cùng sản xuất ra 1 loại sản phẩm như bảng 3.2.1
Bảng 7: Một số chỉ tiêu của 5 doanh nghiệp
Thứ tựDoanh nghiệp
Năng suất lao động
(x1 - Triệu đồng)
% nguyên vật liệu nhập ngoại - x2 (%)
Giá thành đơn vị (y - Nghìn đồng)
1
20
52
44
2
21
51
43
3
23
51
42
4
25
50
40
5
26
51
41
Tổng số
115
255
210
Số bình quân
23
51
42
Độ lệch chuẩn
2,28
0,63
1,41
Từ số liệu đã cho ở bảng 7 ta lập bảng tính toán 8:
Bảng 8: Bảng tính các đại lượng cho hệ phương trình
TTDoanh nghiệp
x1y
x2y
x1x2
y2
1
880
2288
1040
400
2704
1936
2
903
2193
1071
441
2601
1849
3
966
2142
1173
529
2601
1764
4
1000
2000
1250
625
2500
1600
5
1066
2091
1326
676
2601
1681
Tổng số
4815
10714
5860
2671
13007
8830
Số BQ
963
2142,8
1172
534,2
2691,4
1766
Thay số liệu vào hệ phương trình chuẩn tắc ta có:
Giải hệ phương trình ta được: b0 = - 4,26; b1 = - 0,37;b2 = 1,07.
Do đó:
Phương trình hồi quy:
Hệ số hồi quy chuẩn hóa- beta
beta1= b1= -0.37*= -0.5983
beta2= b2= 1.07* = 0.4781
Nhận xét : +beta1= -0.5983<0 nên năng suất lao động có mối quan hệ nghịch với giá thành đơn vị
+beta2= 0.4781>0 nên % nguyên vật liệu nhập ngoại có mối quan hệ thuận với giá thành đơn vị.
+> nên ảnh hưởng của năng xuất lao động tới giá thành đơn vị mạnh hơn ảnh hưởng của % nguyên vật liệu nhập ngoại tới giá thành đơn vị.
4. Bước 4: Đánh giá mức độ chặt chẽ của mối liên hệ tương quan
4.1- Đánh giá mức độ chặt chẽ của mối liên hệ tương quan của mô hình hồi quy tuyến tính đơn:
Mức độ chặt chẽ của mối liên hệ tương quan tuyến tính giữa hai tiêu thức số lượng được thể hiên bằng hệ số tương quan( ký hiệu là r)
Công thức tính hệ số tương quan:
; (4.1.a)
Trong đó: và
Bằng cách biến đổi ta có hệ số tương quan như sau:
hoặc ; (4.1.b)
Trong đó: ;
;
.
Hệ số tương quan có giá trị trong khoảng từ -1 đến 1 ():
- Khi r mang dấu dương, giữa x và y có tương quan thuận, khi r mang dấu âm là có tương quan nghịch;
- Khi r =1( hoặc r =-1): Giữa x và y có mối liên hệ hàm số.
- Khi r càng gần 0 thì quan hệ càng lỏng lẻo, ngược lại khi r càng gần 1 hoặc -1 thì quan hệ càng chặt chẽ.
- Trường hợp r = 0 thì giữa x và y không có quan hệ.
Trở lại ví dụ bảng 1 và bảng 4 , ta tính được:
; ; ;
và
Từ số liệu tính toán tiếp tục tính hệ số tương quan (theo công thức 4.1.b):
Theo kết quả tính toán có r = 0,909, chứng tỏ giữa tuổi nghề và năng suất lao động của công nhân có mối liên hệ thuận khá chặt chẽ.
4.2- Đánh giá mức độ chặt chẽ của mối liên hệ tương quan phi tuyến của hai tiêu thức số lượng :
Đối với liên hệ tương quan phi tuyến tính giữa 2 chỉ tiêu sẽ dùng tỉ số tương quan (ký hiệu ) để đánh giá trình độ chặt chẽ của mối liên hệ. Công thức tính tỉ số tương quan như sau:
; (4.2.a)
Hoặc :
Trong đó:
- : Phương sai đo độ biến thiên của chỉ tiêu y do ảnh hưởng riêng của chỉ tiêu x; với là giá trị lý thuyết của đường hồi quy phi tuyến tính giữa y và x được xác định;
- : Phương sai đo độ biến thiên của chỉ tiêu y do ảnh hưởng của tất cả các chỉ tiêu nguyên nhân.
Tỉ số tương quan có một số tính chất sau:
+ Tỉ số tương quan lấy giá trị trong khoảng , tức là .
- Nếu thì giữa x và y không có liên hệ tương quan;
- Nếu thì giữa x và y có liên hệ hàm số;
- Nếu càng gần 1 thì giữa x và y có liên hệ tương quan càng chặt chẽ và càng gần 0 thì liên hệ tương quan càng lỏng lẻo.
+ Tỉ số tương quan lớn hơn hoặc bằng giá trị tuyệt đối của hệ số tương quan, tức là . Nếu thì giữa x và y có mối liên hệ tương quan tuyến tính.
Trở lại ví dụ ở bảng 6 về mồi liên hệ giữa số lượng sản phẩm và giá thành đơn vị sản phẩm. Ta có bảng sau để tính tỷ số tương quan:
Bảng 9
x
y
(y-)2
(y-)2
10
15.60
15.43
0.0289
0.1369
15
15.40
15.32
0.0064
0.0289
20
15.27
15.26
0.0001
0.0016
25
15.24
15.22
0.0004
0.0001
30
15.20
15.20
0.0000
0.0009
35
15.15
15.18
0.0009
0.0064
40
15.14
15.17
0.0009
0.0081
50
15.12
15.15
0.0009
0.0121
60
15.10
15.14
0.0016
0.0169
80
15.05
15.12
0.0049
0.0324
Tổng
0.0450
0.2443
=0.903
Như vậy mối liên hệ giữa số lượng sản phẩm và giá thành đơn vị sản phẩm là khá chặt chẽ.
4.3- Đánh giá mức độ chặt chẽ của mối liên hệ tương quan tuyến tính giữa nhiều tiêu thức nguyên nhân với một tiêu thức kết quả :
Để đánh giá trình độ chặt chẽ của mối liên hệ tương quan tuyến tính nhiều chỉ tiêu, người ta thường tính toán các hệ số tương quan gồm: Hệ số tương quan bội và hệ số tương quan riêng.
* Hệ số tương quan bội (Ký hiệu là R) được dùng để đánh giá trình độ chặt chẽ giữa chỉ tiêu kết quả với tất cả các chỉ tiêu nguyên nhân được nghiên cứu. Công thức tính như sau:
; (4.3.a)
Trong đó: , và là các hệ số tương quan tuyến tính giữa các cặp tiêu thức y với x1, y với x2 và x1 với x2 (tính như các công thức 4.1.a, 4.1.b)
Hệ số tương quan bội nhận giá trị trong khoảng [0;1], tức là 0 £ R £ 1.
Như vậy, R càng gần 0 thì quan hệ tương quan càng lỏng lẻo và R càng gần 1 thì quan hệ càng chặt chẽ.
Nếu R =0 thì không có quan hệ tương quan và nếu R =1 thì quan hệ tương quan trở thành quan hệ hàm số.
* Hệ số tương quan riêng được dùng để đánh giá trình độ chặt chẽ của mối liên hệ giữa tiêu thức kết quả với từng tiêu thức nguyên nhân trong điều kiện đã loại trừ ảnh hưởng của các tiêu thức nguyên nhân khác. Trong trường hợp mối liên hệ giữa y với x1 và x2 ở trên có
thể tính:
- Hệ số tương quan riêng giữa y và x1 (loại trừ ảnh hưởng của x2):
; (4.3.b)
- Hệ số tương quan riêng giữa y và x2 (loại trừ ảnh hưởng của x1):
; (4.3.c)
Trở lại ví dụ ở bảng 7 về mối liên hệ tương quan giữa năng suất lao động và % nguyên vật liệu nhập ngoại với giá thành đơn vị :
Các hệ số tương quan:
- Các hệ số tương quan tuyến tính giữa hai tiêu thức:
- Hệ số tương quan bội:
- Các hệ số tương quan riêng:
Các kết quả tính toán ở trên cho thấy mối liên hệ giữa giá thành đơn vị sản phẩm với năng suất lao động và % nguyên vật liệu nhập ngoại trong giá thành rất chặt chẽ (). Trong mối liên hệ này thì năng suất lao động tỷ lệ nghịch với giá thành đơn vị sản phẩm, còn % nguyên vật liệu nhập ngoại tỷ lệ thuận với giá thành đơn vị sản phẩm.
5. Bước 5: Phát hiện và biện pháp khắc phục đa cộng tuyến nếu có
Khi xây dựng mô hình hồi qui bội việc chọn nhân tố đưa vào mô hình là rất quan trọng. Yêu cầu của phương pháp là các nhân tố phải độc lập với nhau nhưng điều đó rất khó thực hiện trong kinh tế và chúng ta phải chọn các nhân tố mà có thể coi như độc lập. Đưa nhiều nhân tố quá vào mô hình sẽ không tránh khỏi hiện tượng đa công tuyến, nó sẽ làm sai lệch kết quả thu được. Hiện tượng cộng tuyến hay đa cộng tuyến xuất hiện khi một cặp nhân tố hay nhiều cặp nhân tố có mối quan hệ hàm số. Để giải quyết vấn đề này trong thực tế khi lựa chọn nhân tố người ta có thể tính trước các hệ số tương quan cặp giữa các tiêu thức nhân tố.
Nếu hệ số nào lớn hơn hoặc bằng 0,8 thì hai nhân tố đó coi như là cộng tuyến và phải loại bỏ một trong hai nhân tố đó ra khỏi mô hình hồi qui bội.
Muốn biết loại bỏ xi hay xj thì phải tính thêm ryxi và ryxj
Nếu ryxi > ryxj thì loại bỏ xj
Nếu ryxi < ryxj thì loại bỏ xi
Cách tính rxixj như sau:
Trong đó: σxi, σxj gọi là độ lệch quân phương xi và xj
*Hậu quả của đa cộng tuyến là làm cho việc ước lượng các hệ số của mô hình hồi quy sẽ không chính xác, ảnh hưởng đến việc suy rộng các kết quả tính toán.
* Để khắc phục hiện tượng đa cộng tuyến , trong một số chương trình về thống kê, ví dụ như chương trình SPSS, có một số phương pháp xây dựng mô hình hối quy sau đây:
- Phương pháp đưa vào dần (forward selection): Tiêu thức nguyên nhân đầu tiên được xem xét để đưa vào mô hình hồi quy là tiêu thức nguyên nhân có hệ số tương quan lớn nhất ( về trị tuyệt đối) với tiêu thức kết quả. Để xem xét tiêu thức nguyên nhân này( và những tiêu thức nguyên._.
Các file đính kèm theo tài liệu này:
- 36036.doc