ĐẠI HỌC THÁI NGUYấN
TRƯờNG ĐạI HọC CÔNG NGHệ THÔNG TIN Và TRUYềN THÔNG
NGUYỄN THỊ THƠ
NGHIấN CỨU MẠNG NƠ RON VÀ ỨNG DỤNG
TRONG BÀI TOÁN DỰ BÁO TUYỂN SINH
TRƯỜNG THPT Lấ QUí ĐễN
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYấN - 2020
ĐẠI HỌC THÁI NGUYấN
TRƯờNG ĐạI HọC CÔNG NGHệ THÔNG TIN Và TRUYềN THÔNG
NGUYỄN THỊ THƠ
NGHIấN CỨU MẠNG NƠ RON VÀ ỨNG DỤNG
TRONG BÀI TOÁN DỰ BÁO TUYỂN SINH
TRƯỜNG THPT Lấ QUí ĐễN
Chuyờn ngành: Khoa học mỏy tớnh
Mó số: 8.48.01.01
62 trang |
Chia sẻ: huong20 | Ngày: 13/01/2022 | Lượt xem: 532 | Lượt tải: 1
Tóm tắt tài liệu Luận văn Nghiên cứu mạng nơ ron và ứng dụng trong bài toán dự báo tuyển sinh trường THPT Lê Quý Đôn, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
1
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Giáo viên hướng dẫn: TS.Nguyễn Đình Dũng
THÁI NGUYÊN - 2020
i
LỜI CẢM ƠN
Luận văn này được hoàn thành tại Trường Đại học Công nghệ Thông tin
và Truyền thông dưới sự hướng dẫn của TS. Nguyễn Đình Dũng. Tác giả xin
bày tỏ lòng biết ơn tới các thầy cô giáo thuộc Trường Đại học Công nghệ
Thông tin và Truyền thông, các thầy cô giáo thuộc Viện Công nghệ Thông tin
– Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã tạo điều kiện, giúp đỡ
tác giả trong quá trình học tập và làm luận văn tại Trường, đặc biệt tác giả xin
bày tỏ lòng biết ơn tới TS. Nguyễn Đình Dũng đã tận tình hướng dẫn và cung
cấp nhiều tài liệu cần thiết để tác giả có thể hoàn thành luận văn đúng thời
hạn.
Xin chân thành cảm ơn anh chị em học viên cao học và bạn bè đồng nghiệp
đã trao đổi, khích lệ tác giả trong quá trình học tập và làm luận văn tại Trường Đại
học Công nghệ Thông tin và Truyền thông – Đại học Thái Nguyên.
Cuối cùng tác giả xin gửi lời cảm ơn đến gia đình, những người đã luôn
bên cạnh, động viên và khuyến khích tôi trong quá trình thực hiện đề tài.
Thái Nguyên, ngày 10 tháng 04 năm 2020
Học viên cao học
Nguyễn Thị Thơ
ii
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này do chính tôi thực hiện, dưới sự hướng
dẫn khoa học của TS. Nguyễn Đình Dũng, các kết quả lý thuyết được trình
bày trong luận văn là sự tổng hợp từ các kết quả đã được công bố và có trích
dẫn đầy đủ, kết quả của chương trình thực nghiệm trong luận văn này được
tác giả thực hiện là hoàn toàn trung thực, nếu sai tôi hoàn toàn chịu trách
nhiệm.
Thái Nguyên, ngày 10 tháng 04 năm 2020
Học viên
Nguyễn Thị Thơ
iii
MỤC LỤC
LỜI CẢM ƠN ............................................................................................................ i
LỜI CAM ĐOAN ..................................................................................................... ii
MỤC LỤC ................................................................................................................ iii
DANH MỤC CÁC TỪ VIẾT TẮT .......................................................................... v
DANH MỤC CÁC HÌNH ẢNH ............................................................................. vi
DANH MỤC BẢNG BIỂU .................................................................................... vii
MỞ ĐẦU .................................................................................................................... 1
1. Tính khoa học và cấp thiết của đề tài ...................................................................... 1
2. Đối tượng và phạm vi nghiên cứu của đề tài .......................................................... 1
3. Phương pháp luận nghiên cứu ................................................................................. 2
4. Nội dung và bố cục của luận văn ............................................................................ 2
CHƯƠNG 1. TỔNG QUAN BÀI TOÁN DỰ BÁO TUYỂN SINH...................... 4
1.1 Tổng quan về dự báo ............................................................................................. 4
1.1.1 Khái niệm về dự báo .......................................................................................... 4
1.1.2 Mục đích của dự báo .......................................................................................... 5
1.1.3 Những thách thức trong phân tích dự báo .......................................................... 5
1.1.4 Phân loại các dự báo........................................................................................... 6
1.1.5 Đánh giá mô hình dự báo ................................................................................... 9
1.2 Dự báo dữ liệu chuỗi thời gian .............................................................................. 9
1.2.1 Giới thiệu ............................................................................................................ 9
1.2.2 Một số phương pháp dự báo chuỗi thời gian ................................................... 10
1.3 Bài toán dự báo tuyển sinh .................................................................................. 17
1.4 Kết luận chương ................................................................................................. 18
CHƯƠNG 2. MẠNG NƠ RON NHÂN TẠO VÀ BÀI TOÁN DỰ BÁO ........... 19
2.1 Các khái niệm chung về mạng nơron .................................................................. 19
2.1.1 Mạng nơron sinh học ........................................................................................ 19
2.1.2 Mạng nơron nhân tạo ....................................................................................... 20
2.1.3 Mô hình toán học và kiến trúc mạng nơron ..................................................... 22
iv
2.1.4 Phân loại mạng nơ ron ..................................................................................... 25
2.1.5 Huấn luyện mạng nơron ................................................................................... 26
2.2 Mạng nơron MLP và ứng dụng trong bài toán dự báo ....................................... 28
2.2.1 Kiến trúc mạng ................................................................................................. 28
2.2.2 Huấn luyện mạng ............................................................................................. 29
2.2.3 Các yếu tố ảnh hưởng đến hoạt động của mạng MLP ..................................... 32
2.2.4 Ưu nhược điểm và một số vấn đề của mạng nơron nhiều lớp ......................... 34
2.3 Một số hướng nghiên cứu về bài toán dự báo tuyển sinh sử dụng mạng nơ ron 34
2.3.1 Các nghiên cứu trên thế giới ............................................................................ 35
2.3.2 Các nghiên cứu trong nước .............................................................................. 36
2.4 Xây dựng mô hình dự báo tuyển sinh sử dụng mạng nơ ron MLP ..................... 37
2.4.1 Mô tả bài toán ................................................................................................... 37
2.4.2 Các bước thực hiện ........................................................................................... 37
2.5 Kết luận chương .................................................................................................. 38
CHƯƠNG 3. XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG DỰ BÁO
TUYỂN SINH ỨNG DỤNG MẠNG NƠ RON MLP .................................. 39
3.1 Giới thiệu về Trường THPT Lê Quý Đôn ........................................................... 39
3.2 Phát biểu bài toán ................................................................................................ 40
3.3 Xây dựng phần mềm mô phỏng .......................................................................... 43
3.3.1 Môi trường cài đặt ............................................................................................ 43
3.3.2 Cài đặt các chức năng con ................................................................................ 43
3.3.3 Kết quả hoạt động ............................................................................................ 44
3.4 Một số kết quả kiểm thử ...................................................................................... 46
3.5 Đánh giá hoạt động của mô hình dự báo sử dụng mạng MLP với một số mô
hình khác .......................................................................................................... 48
3.6 Kết luận chương .................................................................................................. 50
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ............................................................. 51
TÀI LIỆU THAM KHẢO ...................................................................................... 52
v
DANH MỤC CÁC TỪ VIẾT TẮT
Từ hoặc
Từ tiếng Anh Từ tiếng Việt
cụm từ
ANN Artificial Neural Network Mạng nơron nhân tạo
AR Autoregressive Tự hồi quy
BP Back Propagation Lan truyền ngược
MA Moving Average Đường trung bình di động
MAE Mean Absolute Error Sai số tuyệt đối
MSE Mean Square Error Sai số trung bình
MLP Multilayer Neural Network Mạng nơron nhiều lớp
NƠRON Neural Tế bào thần kinh
OUTPUTNODE Output Node Số nơron lớp ra
GA Genetic Algorithm Giải thuật di truyền
EP Evolutionary Programming Lập trình tiến hóa
vi
DANH MỤC CÁC HÌNH ẢNH
Hình 1.1. Dự báo định tính và định lượng .................................................................. 7
Hình 1.2. Phân loại các phương pháp dự báo chuỗi thời gian .................................. 10
Hình 2.1. Cấu trúc cơ bản của nơron sinh học .......................................................... 19
Hình 2.2. Nơron nhân tạo .......................................................................................... 21
Hình 2.3. Mô hình toán học mạng nơron nhân tạo ................................................... 22
Hình 2.4. Nơron 1 đầu vào với hàm hoạt hoá là hàm hardlimit ............................... 24
Hình 2.5. Phân loại mạng nơ ron [18] ....................................................................... 26
Hình 2.6. Học có giám sát ......................................................................................... 26
Hình 2.7. Học không có giám sát .............................................................................. 27
Hình 2.8. Học tăng cường ......................................................................................... 27
Hình 2.9. Mạng Perceptron đa lớp (MLP) ................................................................ 28
Hình 2.10. Cực trị địa phương và toàn cục ............................................................... 33
Hình 3.1. Giao diện chương trình chính.................................................................... 44
Hình 3.2. Nhập dữ liệu dự báo .................................................................................. 44
Hình 3.3. Nhập tham số dự báo ................................................................................. 45
Hình 3.4. Luyện mạng nơ ron ................................................................................... 45
Hình 3.5. Chạy kết quả dự báo .................................................................................. 46
Hình 3.6. Một số kết quả dự báo với các phương pháp dự báo khác nhau ............... 48
vii
DANH MỤC BẢNG BIỂU
Bảng 2.1. Một số dạng hàm hoạt hóa trong mạng nơron nhân tạo ........................... 25
Bảng 3.1. Cơ sở vật chất của Trường THPT Lê Quý Đôn ........................................ 39
Bảng 3.2. Dữ liệu tuyển sinh của Trường THPT Lê Quý Đôn ................................. 40
Bảng 3.3. Bảng dữ liệu học (với n=6, s=3) ............................................................... 42
Bảng 3.4. Các module chính của chương trình ......................................................... 43
Bảng 3.5. Kết quả thử nghiệm khi số nơ ron lớp ẩn thay đổi ................................... 47
Bảng 3.6. Kết quả thử nghiệm khi thời gian quan sát trước thay đổi ....................... 47
Bảng 3.7. Kết quả thử nghiệm một số phương pháp dự báo ..................................... 49
1
MỞ ĐẦU
1. Tính khoa học và cấp thiết của đề tài
Trong bối cảnh ứng dụng công nghệ thông tin ngày càng tăng, dữ liệu phát
sinh từ hoạt động quản lý, kinh doanh, sản xuất của các công ty, tổ chức ngày càng
nhiều. Các công ty, tổ chức cần phải nhanh chóng đưa ra các quyết định bằng cách
xử lý nhiều yếu tố với quy mô và tính phức tạp ngày càng tăng. Để có quyết định
chính xác nhất, người quản lý thường thực hiện việc dự đoán hay phân loại vấn đề
cần giải quyết trước khi ra quyết định. Ngoài việc dựa trên các yếu tố liên quan trực
tiếp đến vấn đề, người ra quyết định còn dựa trên kinh nghiệm bản thân và thông tin
có được từ các hoạt động trước đó. Dẫn đến một nhu cầu thực tế là cần có các phương
pháp khai phá dữ liệu thu thập được để làm căn cứ ra quyết định [4] .
Trong thực tế cuộc sống, công tác dự báo được ứng dụng rộng rãi ở hầu hết
các lĩnh vực như: Dự báo giá xăng dầu, dự báo chứng khoán, dự báo thời tiết Công
tác dự báo nhằm mục đích dự báo trước sự thay đổi của đối tượng được dự báo dựa
trên cơ sở nghiên cứu các quy luật của đối tượng dự báo [9] .
Những năm gần đây ngành giáo dục cũng bắt đầu chú trọng đến công tác dự
báo nhằm đưa ra được những chính sách đúng đắn nhất. Có rất nhiều tác giả đã đi
vào nghiên cứu dự báo các lĩnh vực khác nhau của giáo dục như: Dự báo nhu cầu
giáo viên, dự báo tỉ lệ học sinh đỗ tốt nghiệp, dự báo tỉ lệ học sinh đỗ Đại học
Chính vì thấy được lợi ích của việc dự báo trong giáo dục nên em chọn đề tài:
“Nghiên cứu mạng nơ ron và ứng dụng trong bài toán dự báo tuyển sinh Trường
THPT Lê Quý Đôn” để giúp đưa ra được những chính sách đúng đắn nhất trong thời
gian tới cho trường của mình.
2. Mục tiêu, đối tượng và phạm vi nghiên cứu của đề tài
Mục tiêu của đề tài là ứng dụng thử nghiệm phương pháp dự báo dùng mạng
nơ ron trong bài toán tuyển sinh tại trường THPT Lê Quý Đôn.
2
Đối tượng nghiên cứu là mạng nơ ron nhân tạo, mạng nơ ron lan truyền thẳng
và thuật toán lan truyền ngược. Phạm vi nghiên cứu là ứng dụng mạng nơ ron nhân
tạo cho bài toán dự báo nói chung và dự báo tuyển sinh trường THPT Lê Quý Đôn
nói riêng.
3. Phương pháp luận nghiên cứu
- Phương pháp nghiên cứu lý thuyết: Tổng hợp, nghiên cứu các tài liệu về bài
toán dự báo, mạng nơ ron nhân tạo; Tìm hiểu các kiến thức liên quan. Ứng dụng mạng
nơ ron nhân tạo, mạng nơ ron lan truyền thẳng và thuật toán lan truyền ngược vào bài
toán dự báo tuyển sinh trường THPT Lê Quý Đôn
- Phương pháp nghiên cứu thực nghiệm: Sau khi nghiên cứu lý thuyết, luận
văn sẽ tập trung vào xây dựng phần mềm mô phỏng mạng nơ ron: phân tích, thiết
kế phần mềm hướng đối tượng với các tính năng cho phép người sử dụng thực hiện
giải bài toán tuyển sinh bằng mạng nơ ron nhân tạo; Đánh giá kết quả sau khi thử
nghiệm
- Phương pháp trao đổi khoa học: Thảo luận, seminar, lấy ý kiến chuyên gia.
4. Nội dung và bố cục của luận văn
Ngoài phần mở đầu, kết luận và hướng phát triển, luận văn được bố cục thành
ba chương chính như sau:
Chương 1: Tổng quan về bài toán dự báo tuyển sinh
- Nghiên cứu về bài toán dự báo, các phương pháp dự báo. Đi sâu vào các
phương pháp dự báo chuỗi thời gian và khả năng áp dụng cho bài toán dự báo tuyển
sinh
Chương 2. Mạng nơ ron nhân tạo và bài toán dự báo
- Nghiên cứu về mạng nơron nhân tạo, tập trung vào mạng nơron truyền thẳng
nhiều lớp (MLP), chương này cung cấp chi tiết các vấn đề về quá trình huấn luyện và
thuật toán học của mạng MLP với trọng tâm là thuật toán lan truyền ngược sai số.
Nghiên cứu về việc ứng dụng mạng MLP trong dự báo chuỗi thời gian, xây dựng mô
hình mạng nơ ron MLP cho bài toán dự báo tuyển sinh
3
Chương 3. Xây dựng chương trình mô phỏng dự báo tuyển sinh ứng dụng
mạng nơ ron MLP
- Chương này giới thiệu về số liệu thu thập được, xây dựng chương trình thử
nghiệm dự báo số học sinh tuyển sinh vào trường THPT Lê Quý Đôn. Đối sánh kết
quả đạt được với một số phương pháp truyền thống. Từ đó chứng minh khả năng ứng
dụng phương pháp sử dụng mạng nơ ron MLP vào dự báo chuỗi thời gian.
4
-
CHƯƠNG 1
TỔNG QUAN BÀI TOÁN DỰ BÁO TUYỂN SINH
1.1 Tổng quan về dự báo
1.1.1 Khái niệm về dự báo
Trong thực tế, nhiều khi chúng ta thường phải đưa ra các quyết định liên quan
đến những sự việc sẽ xảy ra trong tương lai. Để cho các quyết định này có độ tin cậy
và đạt hiệu quả cao, cần thiết phải tiến hành công tác dự báo. Điều này sẽ càng quan
trọng hơn đối với một nền kinh tế thị trường, mang tính chất cạnh tranh cao. Dự báo
là khoa học và là nghệ thuật tiên đoán những sự việc sẽ xảy ra trong tương lai [4]
Tính khoa học của dự báo thể hiện ở chỗ khi tiến hành dự báo ta căn cứ trên
các số liệu phản ảnh tình hình thực tế ở hiện tại, quá khứ, căn cứ vào xu thế phát triển
của tình hình, dựa vào các mô hình toán học để dự đoán tình hình cơ bản sẽ xảy ra
trong tương lai. Nhưng các dự đoán này thường sai lệch hoặc thay đổi nếu xuất hiện
các tình huống kinh tế, tình huống quản trị không hoàn toàn phù hợp với mô hình dự
báo.
Tính nghệ thuật của dự báo là dựa trên những kinh nghiệm thực tế và khả năng
phán đoán của các chuyên gia để đưa ra được những dự đoán với độ chính xác cao
nhất.
Vì vậy, cần kết hợp chặt chẽ giữa các kết quả dự báo với kinh nghiệm và tài
nghệ phán đoán của các chuyên gia, các nhà quản trị mới có thể đạt được các quyết
định có độ tin cậy cao hơn. Mặt khác các kỹ thuật dự báo khác nhau thường cho ta
các kết quả dự báo có khi khác xa nhau. Chưa có một kỹ thuật nào tổng quát có thể
dùng cho mọi trường hợp cần dự báo. Vì vậy đối với một số vấn đề quan trọng và
phức tạp, nhất là khi dự báo dài hạn người ta thường dùng một số kỹ thuật dự báo rồi
căn cứ vào độ lệch chuẩn để chọn lấy kết quả thích hợp.
5
1.1.2 Mục đích của dự báo
Đưa ra được quyết định chính xác, nhất quán: Phân tích dự báo sẽ cung cấp
thông tin chi tiết về đối tượng dự báo từ đó sẽ đưa ra được các hành động chiến lược.
Phân tích dự báo được thực hiện liên tục và cho kết quả đáng tin cậy nhờ có sự hỗ trợ
của kỹ thuật. Các quyết định sẽ được đưa ra một cách nhất quán, công bằng chứ không
phải dựa trên tính chủ quan của con người [11] .
Giải quyết công việc nhanh hơn: Dự báo sẽ trả lời các câu hỏi phức tạp và xử
lý chúng với độ chính xác cao trong khoảng thời gian ngắn. Có những quyết định
trước đây phải mất hàng giờ hoặc vài ngày thì nhờ có sự hỗ trợ của khoa học chỉ còn
vài phút hoặc vài giây.
Giảm chi phí do giảm rủi ro: Với sự hiểu biết về đối tượng giúp các nhà lãnh
đạo đánh giá được chính xác những rủi ro và giảm tổn thất.
1.1.3 Những thách thức trong phân tích dự báo
Mục đích của dự báo là để giúp cải tiến về hiệu quả, hỗ trợ ra quyết định của
các nhà lãnh đạo. Tuy nhiên, không phải lúc nào dự báo cũng chính xác, một số yếu
tố ảnh hưởng đế độ chính xác của dự báo là: Trở ngại trong quản lý, dữ liệu, xây dựng
mô hình và quá trình triển khai [9] .
Những trở ngại trong quản lý: Thông thường để triển khai mô hình dự báo đòi
hỏi có sự chuyển đổi về các nguồn lực cho tổ chức nên cần có sự hỗ trợ từ các nhà
lãnh đạo để chuyển các mô hình từ nghiên cứu sang vận hành.
Những trở ngại về dữ liệu: Các mô hình thường yêu cầu dữ liệu dưới dạng một
bảng hoặc bảng có chứa hàng và cột (dữ liệu hai chiều). Nếu dữ liệu được lưu trữ
trong các cơ sở dữ liệu thì cần phải kết nối các cơ sở dữ liệu để tạo ra một bảng.
Trở ngại trong việc xây dựng mô hình: Trở ngại lớn nhất là quá tải, tức là mô
hình quá phức tạp và yêu cầu phải ghi nhớ dữ liệu huấn luyện. Hai trở ngại với mô
hình là: Thứ nhất mô hình thực hiện kém với dữ liệu mới và việc giải thích mô hình
không đáng tin cậy. Thứ hai, các nhà xây dựng mô hình quá tham vọng vào mô hình
6
được xây dựng trên dữ liệu có sẵn trong khoảng thời gian nhất định. Cách tốt nhất để
khắc phục là xây dựng một mô hình đơn giản sau đó có thể được cải tiến sau khi chạy
thử nghiệm.
Trở ngại trong triển khai mô hình:Thông thường các mô hình không quá phức
tạp về mặt tính toán. Tuy nhiên, các mô hình phải được kiểm tra bởi hệ thống hoạt
động và đưa ra dự đoán phù hợp với hệ thống đó.
1.1.4 Phân loại các dự báo
1.1.4.1 Căn cứ vào thời đoạn dự báo
- Dự báo ngắn hạn thời đoạn dự báo thường không quá 3 tháng, ít khi đến 1
năm. Loại dự báo này cần cho việc mua sắm, điều độ công việc, phân giao nhiệm vụ,
cân đối các mặt trong quản trị tác nghiệp.
- Dự báo trung hạn thời đoạn dự báo thường từ 3 tháng đến 3 năm, loại dự báo
này cần thiết cho việc lập kế hoạch bán hàng, kế hoạch sản xuất, dự trù tài chính tiền
mặt và làm căn cứ cho các loại kế hoạch khác.
- Dự báo dài hạn thời đoạn dự báo từ 3 năm trở lên. Loại dự báo này cần cho
việc lập các dự án sản xuất sản phẩm mới, các định điểm cho các cơ sở mới, lựa chọn
các dây chuyền công nghệ, thiết bị mới, mở rộng doanh nghiệp hiện có hoặc thành
lập doanh nghiệp mới.
1.1.4.2 Căn cứ vào nội dung công việc cần dự báo
- Dự báo kinh tế: Dự báo kinh tế cho các cơ quan nghiên cứu, cơ quan dịch vụ
thông tin, các bộ phận tư vấn kinh tế nhà nước thực hiện. Những chỉ tiêu này có giá
trị lớn trong việc hỗ trợ, tạo tiền đề cho công tác dự báo trung hạn, dài hạn của các
doanh nghiệp.
- Dự báo kỹ thuật công nghệ: Dự báo này đề cập đến mức độ phát triển khoa
học kỹ thuật công nghệ trong tương lai. Loại này rất quan trọng đối với các ngành có
hàm lượng kỹ thuật cao như năng lượng nguyên tử, tàu vũ trụ, dầu lửa, máy tính,
7
nghiên cứu không gian, điện tử Dự báo kỹ thuật, công nghệ thường do các chuyên
gia trong các lĩnh vực đặc biệt thực hiện.
- Dự báo nhu cầu sản phẩm: Thực chất của dự báo nhu cầu là dự kiến, tiên
đoán về doanh số bán ra của doanh nghiệp. Loại dự báo này rất được các nhà quản trị
sản xuất quan tâm. Dự báo nhu cầu giúp cho các doanh nghiệp xác định được chủng
loại và số lượng sản phẩm, dich vụ mà họ cần tạo ra trong tương lai. Thông qua dự
báo nhu cầu các doanh nghiệp sẽ quyết định được quy mô sản xuất, hoạt động của
công ty, là cơ sở để dự kiến về tài chính, tiếp thị, nhân sự.
1.1.4.3 Căn cứ theo các phương pháp dự báo
Hình 1.1.Dự báo định tính và định lượng
Các phương pháp dự báo được chia thành 2 phương pháp là phương pháp định
tính và phương pháp định lượng [6] .
Phương pháp định tính: Hay còn gọi là phương pháp dự báo chuyên gia
(phương pháp Delphi) là phương pháp thu thập và xử lý những đánh giá dự báo bằng
cách tập hợp và hỏi ý kiến các chuyên gia giỏi thuộc một lĩnh vực hẹp của khoa học
- kỹ thuật hoặc sản xuất.
Phương pháp chuyên gia dựa trên cơ sở đánh giá tổng kết kinh nghiệm, khả
năng phản ánh tương lai một cách tự nhiên của các chuyên gia giỏi và xử lý thống kê
các câu trả lời một cách khoa học. Nhiệm vụ của phương pháp là đưa ra những dự
báo khách quan về tương lai phát triển của khoa học kỹ thuật hoặc sản xuất dựa trên
việc xử lý có hệ thống các đánh giá dự báo của các chuyên gia.
8
Phương pháp chuyên gia được áp dụng đặc biệt có hiệu quả trong các trường
hợp sau đây:
- Khi đối tượng dự báo có tầm bao quát lớn phụ thuộc nhiều yếu tố mà hiện tại
còn chưa có hoặc thiếu những cơ sở lý luận chắc chắn để xác định.
- Trong điều kiện còn thiếu thông tin và những thống kê đầy đủ, đáng tin cậy
về đặc tính của đối tượng dự báo.
- Trong điều kiện có độ bất định lớn của đối tượng dự báo, độ tin cậy thấp về
hình thức thể hiện, về chiều hướng biến thiên về phạm vi cũng như quy mô và cơ
cấu.
- Khi dự báo trung hạn và dài hạn đối tượng dự báo chịu ảnh hưởng của nhiều
nhân tố, phần lớn là các nhân tố rất khó lượng hoá đặc biệt là các nhân tố thuộc về
tâm lý xã hội (thị hiếu, thói quen, lối sống, đặc điểm dân cư...) hoặc tiến bộ khoa học
kỹ thuật. Vì vậy trong quá trình phát triển của mình đối tượng dự báo có nhiều đột
biến về quy mô và cơ cấu mà nếu không nhờ đến tài nghệ của chuyên gia thì mọi sự
trở nên vô nghĩa.
Trong điều kiện thiếu thời gian, hoàn cảnh cấp bách phương pháp chuyên gia
cũng được áp dụng để đưa ra các dự báo kịp thời.Quá trình áp dụng phương pháp
chuyên gia có thể chia làm ba giai đoạn lớn:
- Lựa chọn chuyên gia
- Trưng cầu ý kiến chuyên gia;
- Thu thập và xử lý các đánh giá dự báo.
Chuyên gia giỏi là người thấy rõ nhất những mâu thuẫn và những vấn đề tồn
tại trong lĩnh vực hoạt động của mình, đồng thời về mặt tâm lý họ luôn luôn hướng
về tương lai để giải quyết những vấn đề đó dựa trên những hiểu biết sâu sắc, kinh
nghiệm sản xuất phong phú và linh cảm nghề nghiệp nhạy bén.
Phương pháp định lượng: Các phương pháp dự báo định lượng đều dựa trên
cơ sở Toán học, Thống kê. Hình 1.1 mô tả việc phân loại các phương pháp dự báo
định lượng theo các tiêu chí sau:
9
- Để dự báo nhu cầu tương lai, không xét đến các nhân tố ảnh hưởng khác ta
có thể dùng các phương pháp dự báo theo dãy số thời gian.
- Khi cần xét đến các nhân tố khác ảnh hưởng đến nhu cầu (ngoài thời gian) ta
có thể dùng các phương pháp dự báo dựa trên mối liên hệ tương quan.
1.1.5 Đánh giá mô hình dự báo
Để đánh giá độ chính xác của mô hình dự báo luận văn sử dụng hai đánh giá
sau: Sai số bình phương trung bình (Mean Square Error):
1 n 2
MSE Q Q (1.1)
n i1 ii
Sai số phần trăm tuyệt đối trung bình (Mean Absolute Error)
1 n QQii
MAPE .100% (1.2)
i1
nQi
Trong đó:
Qi Giá trị dự báo sinh ra bởi mô hình tại mẫu dữ liệu thứ i
Qi : Giá trị quan sát tại mẫu dữ liệu thứ i
n: chiều dài chuỗi dự đoán
1.2 Dự báo dữ liệu chuỗi thời gian
1.2.1 Giới thiệu
Để thực hiện bài toán dự báo tuyển sinh, việc lựa chọn các mô hình dự báo
dựa trên dự báo số liệu chuỗi thời gian được cho là phù hợp hơn cả. Vì vậy, phần này
của chương sẽ tập trung phân tích một số phương pháp dự báo chuỗi thời gian cơ bản
để làm căn cứ lựa chọn thiết kế hệ thống dự báo tuyển sinh.
Phương pháp dự báo theo dãy số thời gian được xây dựng trên một giả thiết
về sự tồn tại và lưu lại các nhân tố quyết định đại lượng dự báo từ quá khứ đến tương
lai. Trong phương pháp này đại lượng cần dự báo được xác định trên cơ sở phân tích
chuỗi các số liệu thống kê được trong quá khứ.
10
Như vậy thực chất của phương pháp dự báo theo dãy số thời gian là kéo dài
quy luật phát triển của đối tượng dự báo đã có trong quá khứ và hiện tại sang tương
lai với giả thiết quy luật đó vẫn còn phát huy tác dụng.
Các yếu tố đặc trưng của dãy số theo thời gian gồm:
- Tính xu hướng: Tính xu hướng của dòng nhu cầu thể hiện sự thay đổi của
các dữ liệu theo thời gian (tăng, giảm...)
- Tính mùa vụ: Thể hiện sự dao động hay biến đổi dữ liệu theo thời gian được
lặp đi lặp lại theo những chu kỳ đều đặn do sự tác động của một hay nhiều nhân tố môi
trường xung quanh như tập quán sinh hoạt, hoạt động kinh tế xã hội... Ví dụ: Nhu cầu
dịch vụ bưu chính viễn thông không đồng đều theo các tháng trong năm.
- Biến đổi có chu kỳ: Chu kỳ là yếu tố lặp đi lặp lại sau một giai đoạn thời
gian. Ví dụ: Chu kỳ sinh học, chu kỳ phục hồi kinh tế...
- Biến đổi ngẫu nhiên: Biến đổi ngẫu nhiên là sự dao động của dòng nhu cầu
do các yếu tố ngẫu nhiên gây ra, không có quy luật.
Hình 1.2.Phân loại các phương pháp dự báo chuỗi thời gian
1.2.2 Một số phương pháp dự báo chuỗi thời gian
Các mô hình dựa báo chuỗi thời gian được mô tả trong Hình 1.2. Trong thời
điểm ban đầu, việc giải bài toán dự báo chuỗi thời gian, dự báo được thực hiện bằng
phương pháp làm trơn và ngoại suy chuỗi dữ liệu thời gian thông qua việc làm khớp
11
toàn cục (global fit) trên miền thời gian. Sau này, phương pháp nói trên được thay thế
bởi sự xuất hiện các mô hình chuỗi thời gian tuyến tính (linear) với các đặc điểm tích
cực dễ hiểu để phân tích dữ liệu và rất dễ để thực hiện. Điểm chưa tốt là chúng làm
việc không hiệu quả với các chuỗi thời gian phi tuyến (non-linear). Do vậy, nhờ có
những tiến bộ trong học máy, các mô hình phi tuyến dần được nghiên cứu và áp dụng
đối với các chuỗi thời gian phi tuyến tính, với mức độ phức tạp cao
1.2.2.1 Một số phương pháp dự báo chuỗi thời gian đơn giản
. Phương pháp trung bình giản đơn (Simple Average)
Phương pháp trung bình giản đơn là phương pháp dự báo trên cơ sở lấy trung
bình của các dữ liệu đã qua, trong đó các nhu cầu của các giai đoạn trước đều có trọng
số như nhau, nó được thể hiện bằng công thức:
1 n
FX (1.3)
tn i1 t i
Trong đó: Ft - Nhu cầu dự báo cho thời điểm t
Xti - Giá trị thực ở thời điểm t-i
n- Số thời điểm quan sát
Phương pháp này san bằng được tất cả mọi sự biến động ngẫu nhiên của đại
lượng dự báo, vì vậy nó là mô hình dự báo rất kém nhạy bén với sự biến động của đại
lượng dự báo. Phương pháp này phù hợp với đại lượng dự báo đều, ổn định, sai số sẽ
rất lớn nếu ta gặp đại lượng dự báo có tính chất thời vụ hoặc đại lượng dự báo có tính
xu hướng.
. Phương pháp trung bình động
Trong trường hợp khi nhu cầu có sự biến động, trong đó thời gian gần nhất có
ảnh hưởng nhiều nhất đến kết quả dự báo, thời gian càng xa thì ảnh hưởng càng nhỏ
ta dùng phương pháp trung bình động sẽ thích hợp hơn.
Phương pháp trung bình động dùng kết quả trên cơ sở thay đổi liên tục khoảng
thời gian trước đây cho dự báo giai đoạn tiếp theo:
12
Khi sử dụng phương pháp trung bình động đòi hỏi phải xác định n sao cho sai
số dự báo là nhỏ nhất, đó chính là công việc của người dự báo, n phải điều chỉnh
thường xuyên tuỳ theo sự thay đổi tính chất của đại lượng dự báo. Để chọn n hợp lý
cũng như để đánh giá mức độ chính xác của dự báo người ta căn cứ vào sai lệch tuyệt
đối trung bình (MAE).
. Phương pháp trung bình động có trọng số
Đây là phương pháp bình quân nhưng có tính đến ảnh hưởng của từng giai
đoạn khác nhau đến nhu cầu, thông qua việc sử dụng các trọng số.
n
FX
ti1 t i t i (1.4)
Trong đó: Ft - Nhu cầu dự báo cho thời điểm t
Xti - Mức nhu cầu thực ở thời điểm t-i
n- Số thời điểm quan sát
ti - Trọng số ở thời điểm t-i
ti được lựa chọn bởi người dự báo dựa trên cơ sở phân tích tính chất của dòng
nhu cầu, thoả mãn điều kiện:
n
1 và 01
i1 ti ti (1.5)
Trong phương pháp trung bình động có trọng số, độ chính xác của dự báo phụ
thuộc vào khả năng xác định được các trọng số phù hợp. Thực tế chỉ ra rằng, nhờ điều
chỉnh thường xuyên hệ số ti của mô hình dự báo, phương pháp trung bình động có
trọng số mang lại kết quả dự báo chính xác hơn phương pháp trung bình động.
Các phương pháp trung bình giản đơn, trung bình động, trung bình động có
trọng số đều có các đặc điểm sau:
- Khi số quan sát ...n lan truyền ngược hội tụ,
ta chưa thể khẳng định được nó đã hội tụ đến phương án tối ưu. Ta cần phải thử với
một số điều kiện ban đầu để đảm bảo thu được phương án tối ưu.
2.2.3 Các yếu tố ảnh hưởng đến hoạt động của mạng MLP
. Số lớp ẩn
Với mạng có một lớp ẩn có thể biểu diễn cho bất kỳ một tín hiệu đầu vào nào
đó của lớp vào. Với mạng có hai lớp ẩn có thể thể hiện các hàm với các dáng điệu bất
kỳ [17].
Phần lớn các thuật toán huấn luyện mạng cho các nơron truyền thẳng đều dựa
trên phương pháp Gradient. Các lớp thêm vào sẽ tăng thêm việc lan truyền các lỗi
làm cho vector Gradient không ổn định.
Với thuật toán tối ưu dựa trên Gradient chỉ có thể tìm ra tối thiểu cục bộ và rất
khó để tìm ra tối thiểu toàn cục vì xác suất bị tắc tại tối thiểu cục bộ là khá lớn [17].
. Số nơron trong mỗi lớp ẩn
Nếu số nơron trong lớp ẩn quá ít có thể dẫn đến việc không thể nhận dạng
được đầy đủ các tín hiệu trong một tập dữ liệu phức tạp, hay thiếu ăn khớp
(Underfitting). Nhưng nếu có quá nhiều lại làm tăng thời gian huấn luyện mạng và
có thể dẫn đến tình trạng thừa ăn khớp (Overfitting). Tức là mạng có quá nhiều thông
tin, hoặc lượng thông tin trong tập dữ liệu mẫu (Training Set) không đủ các dữ liệu
đặc trưng để huấn luyện mạng. Số lượng các đơn vị trong lớp ẩn phụ thuộc vào rất
33
nhiều yếu tố như số đầu vào, đầu ra của mạng, số trường hợp trong tập mẫu, độ nhiễu
của dữ liệu đích, độ phức tạp của hàm lỗi, kiến trúc mạng và thuật toán huấn luyện
mạng.
Thông thường để xác định được số đơn vị tối ưu trong lớp ẩn cần phải thông
qua huấn luyện mạng với một bộ số các đơn vị trong lớp ẩn và dự báo lỗi tổng quát
hóa của từng lựa chọn. Cách tốt nhất để tìm ra số đơn vị tối ưu là sử dụng phương
pháp thử sai (Trial – and – Error).
. Các trọng số khởi tạo ban đầu
Hình 2.10. Cực trị địa phương và toàn cục
Các trọng số khởi tạo ban đầu có thể làm cho quá trình cập nhật trọng số rơi
vào vùng cự trị địa phương thay vì cực trị toàn cục. Như mô tả trong Hình 2.10, nếu
trọng số được khởi tạo bắt đầu từ bên trái, quá trình luyện mạng sẽ hội tụ tại điểm W1
mà không phải là Wg. Điểm W1 được gọi là điểm tối thiểu cục bộ (Local Minimum).
Điểm Wg được gọi là điểm tối thiểu toàn cục. Mô hình chỉ có thể đạt đến điểm tối
thiểu toàn cục là điểm Wg khi và chỉ khi mô hình thoát khỏi điểm W1. Giải thuật BP
có nhược điểm lớn là mô hình mạng có thể rơi vào điểm tối thiểu cục bộ mà không
phải là tối thiểu toàn cục. Để khắc phục nhược điểm này, người ta đưa thêm vào một
khái niệm là Momentum. Momentum là hệ số góp phần giúp cho quá trình chỉnh sửa
trọng số giảm khả năng rơi vào các điểm tối thiểu cục bộ, đồng thời làm giảm thời
gian huấn luyện.
. Hằng số học
34
Hằng số học có mối quan hệ mật thiết với độ chính xác và tốc độ học của mạng
MLP. Với hằng số học càng lớn thì tốc độ học càng nhanh nhưng độ chính xác lại
thấp. Ngược lại hằng số học càng nhỏ thì tốc độ học càng lâu nhưng độ chính xác
cao.
2.2.4 Ưu nhược điểm và một số vấn đề của mạng nơron nhiều lớp
Ưu điểm:
- Hỗ trợ tính toán song song ở mức rất cao.
- Có khả năng chịu nhiều lỗi, nhờ các tính toán song song.
- Có thể được thiết kế để tự thích nghi (Các trọng số, cấu trúc mạng).
Nhược điểm:
- Không có quy tắc tổng quát để xác định cấu trúc mạng và các tham số học
tối ưu cho một lớp, một bài toán xác định.
- Không có phương pháp tổng quát để đánh giá hoạt động bên trong của ANN
(vì vậy hệ thống ANN được xem như là một “hộp đen”).
Mạng nơron nhiều lớp có một số vấn đề cần được quan tâm như sau:
- Thời gian huấn luyện lâu và không phải luôn hội tụ.
- Không biết trước được sự ràng buộc giữa lỗi huấn luyện và cấu trúc mạng.
- Không biết trước hiệu suất huấn luyện (thời gian huấn luyện, độ lỗi).
- Khó xác định độ lỗi của mạng từ tập huấn luyện.
- Khó xác định độ lớn của tập huấn luyện.
2.3 Một số hướng nghiên cứu về bài toán dự báo tuyển sinh sử dụng mạng nơ
ron
Bài toán dự báo có nhiệm vụ phân tích và sử dụng số liệu đã có trong quá khứ
để dự đoán giá trị tương lai. Hiện nay, có rất nhiều phương pháp dự báo đã được sử
dụng trên mô hình vật lý và mô hình toán học. Trong nhiều trường hợp, kết quả nghiên
35
cứu dự báo theo các mô hình trên đã đạt được những thành công nhất định. Tuy nhiên,
phương pháp nào cũng có những hạn chế, do vậy bài toán dự báo vẫn là nội dung
được nghiên cứu hiện nay. Trên thế giới, cũng như trong nước, các phương pháp khai
phá dữ liệu (đặc biệt là các phương pháp học máy mạng nơron) cũng được áp dụng
nhiều vào dự báo
2.3.1 Các nghiên cứu trên thế giới
Trên thế giới, các nghiên cứu về việc xây dựng mô hình dự báo tuyển sinh sử
dụng kỹ thuật học máy đã bắt đầu từ cách đây rất lâu (1993) và hiện tại vẫn còn đang
được nghiên cứu phát triển để giảm thiểu sai số dự báo. Riêng trong lĩnh vực sâu là
ứng dụng mạng nơ ron cho dự báo tuyển sinh có thể kể đến một số công trình dưới
đây [15]
Trong nghiên cứu về dự báo tuyển sinh tại Đại học Sebha ở Libya năm 2009,
các tác giải so sánh một loạt các kỹ thuật của học máy như phân cụm, hồi quy, cây
quyết định và mạng nơ ron trong việc dự báo. Kết quả của nghiên cứu này cho thấy
mạng lưới thần kinh đã cho độ chính xác dự đoán tốt về dự báo tuyển sinh [15] .
Borah và các cộng sự (2011) đã đề xuất một hàm đo lường lựa chọn thuộc tính
mới (heuristic) trên thuật toán cây quyết định C4.5 hiện có. C4.5 đưa ra giải pháp đầy
hứa hẹn về thông tin phân tách của quá trình tuyển sinh tại trường cao đẳng kỹ thuật
ở Ấn Độ. Cách tiếp cận khác trong các nghiên cứu này là so sánh độ chính xác giữa
thuật toán Cây quyết định C5.0 và thuật toán lan truyền ngược của mạng nơ ron MPL.
Kết quả cho thấy mạng MPL đã đưa ra độ chính xác dự báo cao nhất [15] .
Gần đây, năm 2018, Desmond Chekwube Bartholomew [10] cũng công bố
công trình nghiên cứu về dự báo sinh viên nhập học tại Đại học Công nghệ Liên bang,
Owerri (FUTO), bang Imo, Nigeria. Mục tiêu xây dựng một mạng MLP dự báo sinh
viên đăng ký vào FUTO và so sánh độ chính xác dự đoán mô hình. Kết quả cũng
được khẳng định là tốt hơn khi mô hình mạng MLP này được so sánh với các phương
pháp truyền thống.
36
2.3.2 Các nghiên cứu trong nước
Trong những năm gần đây, đã có rất nhiều công trình một số công trình công
bố về các phương pháp dự báo áp dụng trong giáo dục sử dụng mạng nơron như: Dự
báo tỉ lệ nghỉ học của sinh viên, dự báo tỉ lệ đỗ tốt nghiệp, tỉ lệ đỗ đại học, số học sinh
tuyển sinh vào của những năm tiếp theoTiêu biểu có thể liệt kê một số công trình
nghiên cứu sau đây:
Luận văn “Dự báo kết quả đậu đại học” của tác giả Thái Trung Hải đã sử dụng
mạng MLP với thuật toán lan truyền ngược. Trong luận văn sử dụng mạng 3 lớp (1
lớp vào, 1 lớp ẩn, 1 lớp ra) với số nơron đầu vào là 13, lớp ẩn là 13 và đầu ra là 3.
Đầu vào của luận văn là 13 yếu tố ảnh hưởng đến dự báo đó là kết quả học tập của
13 môn học. 3 đầu ra là điểm thi đại học, điểm thi tốt nghiệp và nhóm trường đậu đại
học [2] .
Trong đồ án tốt nghiệp [5] của tác giả Nguyễn Văn Trịnh về “Ứng dụng mạng
nơron trong dự báo tỷ lệ nghỉ học” lại xây dựng mô hình mạng nơron khác với luận
văn trên. Đồ án xây dựng ba mô hình là: Mô hình dự báo tình trạng nghỉ học của học
viên với đầu vào của mạng là hồ sơ của những học viên đã tốt nghiệp và những học
viên nghỉ học và đầu ra là trạng thái học viên đó là: Nghỉ học và tốt nghiệp. Mô hình
thứ hai là: Dự báo tình trạng học tập của học viên qua 1 kỳ xác định (ký hiệu là kỳ
x=2, 3, 4) có đầu vào là hồ sơ của những học viên đã học qua kỳ x và những học viên
đã nghỉ học trước kỳ x và đầu ra là trạng thái học viên là nghỉ học và học vượt qua
kỳ x. Mô hình thứ 3 là: Dự báo tiềm năng nghỉ học của học viên trong quá trình học
có đầu vào là kỳ x, hồ sơ học viên, quy mô lớp, điểm tích lũy trung bình, số lần đăng
nhập diễn đàn, tỉ lệ nghỉ học kỳ trước và đầu ra là trạng thái học viên với màu xanh
là học thêm được ít nhất 2 kỳ nữa, màu vàng là kỳ tới sẽ nghỉ học và màu đỏ là kỳ
này nghỉ học. Đồ án luyện mạng sử dụng các quy tắc học là Delta, momen và delta-
bar-delta.
Trong [4] , tác giả Dương Thu Trang cũng xây dựng mô hình dự báo kết quả
tuyển sinh sử dụng một mạng MLP gồm 3 lớp. Đầu vào gồm 10 nơ ron ứng với kết
37
quả tuyển sinh của 10 năm trước đó. Lớp ẩn gồm 10 nơ ron được chọn dựa trên quy
tắc “thử và sai”. Lớp ra chỉ có 1 đầu ra là kết quả dự báo tuyển sinh ở thời điểm
tương lai.
Trong thực tế còn rất nhiều nghiên cứu khác nữa về vấn đề dự báo tuyển sinh
sử dụng mô hình mạng MLP. Tuy nhiên, qua các công trình khảo sát ở trong và
ngoài nước trên cho thấy việc áp dụng mạng MLP cho việc xây dựng mô hình dự
báo tuyển sinh tại trường THPT Lê Quý Đôn là khả thi và sẽ cho kết quả tốt hơn các
phương pháp truyền thống.
2.4 Xây dựng mô hình dự báo tuyển sinh sử dụng mạng nơ ron MLP
2.4.1 Mô tả bài toán
Giả sử ta có chuỗi thời gian {x[t]), x[t-1],, x[t-n-1],} tính đến thời điểm t ,
nhiệm vụ của chúng ta là dự báo giá trị của x tại một thời điểm trong tương lai.
xdb[t+s] =f(x[t], x[t−1],···)
Trong đó n là khoảng thời gian quan sát trước, s là cửa sổ dự báo (horizon of
prediction).
Trong trường hợp n=1, s = 1, nghĩa là ta chỉ dự báo 01 giá trị tại tương lai dựa
theo kết quả của 01 năm trước đó. Khi đó, bài toán rơi vào trường hợp tìm ra một
hàm xấp xỉ (function approximation) biểu diễn chuỗi thời gian, nói cách khác là dự
đoán giá trị tương lai từ các giá trị đã thu thập trước đó trong chuỗi thời gian.
Để giải quyết bài toán dự báo chuỗi thời gian nói chung và sử dụng mạng
nơron MLP nói riêng, cần thực hiện các bước tổng quát sau:
1) Chọn mô hình tổng quát, chọn khoảng thời gian quan sát trước n, cửa sổ dự
báo s
2) Với mỗi x[ti] trong quá khứ, huấn luyện mô hình với đầu vào là n giá trị trước
đó và s đầu ra mong muốn, là chính ti.
3) Sau khi huấn luyện mô hình, chạy mô hình với chuỗi {x[t], x[t−1],···
,x[t−n−1]} để thu được giá trị dự đoán { xdb [t+1], xdb [t+2],··· , xdb[t+s] }
38
2.4.2 Các bước thực hiện
Các bước xây dựng mô hình dự báo tuyển sinh bằng phương pháp sử dụng
mạng nơ ron MLP như sau:
- Chuẩn hóa dữ liệu, Xác định khoảng thời gian quan sát trước n, cửa sổ dự báo s
- Chia tập dữ liệu ban đầu thành các tập: huấn luyện (training) (> 50% số mẫu),
kiểm tra (test) (100% -> 30% số mẫu) và tập kiểm định (validation).
- Xây dựng tập dữ liệu với mẫu đầu tiên có đầu ra là y[s], y[s-1], y[s-2],, y[1]
các đầu vào là các x[1], x[2],, x[n].
- Xây dựng mô hình mạng nơ ron MLP áp dụng cho dự báo (số lớp ẩn, số nơ ron
trong mỗi lớp ẩn, trọng số ban đầu, hệ số học). Việc xác định cấu trúc tối ưu cần
quá trình thử-sai.
- Huấn luyện mạng với các thông số khởi tạo trên các tập dữ liệu training, xác định
lỗi với tập dữ liệu test để xác định khả năng tổng quát hóa.
- Sau khi huấn luyện, thực hiện kiểm định độ chính xác của mô hình với tập
validation.
2.5 Kết luận chương
Có thể thấy rằng, mạng nơ ron là một công cụ hữu hiệu trong việc xử lý các
lớp bài toán phi tuyến phức tạp. Đặc biệt là trong bài toán dự báo. Chính vì vậy, nội
dung chương 2 đã trình bày các kiến thức tổng quan cho việc xây dựng các loại mạng
nơ ron và thực hiện các thuật toán học nhằm điều chỉnh trọng số của các node mạng
sao cho sai số đầu ra là nhỏ nhất. Bên cạnh đó, để đưa ra quyết định hợp lý cho ứng
dụng mạng nơ ron giải quyết bài toán dự báo thí sinh, nội dung chương cũng đã cập
nhật các công trình công bố gần đây nhất trong và ngoài nước, đề xuất mô hình mạng
nơ ron lan truyền ngược sai số. Hiệu quả của mô hình này sẽ được kiểm chứng thông
qua phần mềm ứng dụng được xây dựng trên nền Matlab R2019a sẽ được trình bày
chi tiết trong chương 3 kế tiếp.
39
CHƯƠNG 3
XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG DỰ BÁO TUYỂN SINH
ỨNG DỤNG MẠNG NƠ RON MLP
3.1 Giới thiệu về Trường THPT Lê Quý Đôn
Trường THPT Lê Quý Đôn nguyên là trường THPT cấp II-III Lê Quý Đôn
được thành lập năm 1991. Năm học 1994-1995, nhà trường tách riêng khối cấp III và
lấy tên Trường THPT Lê Quý Đôn. Trường được xây dựng trên địa bàn phường
Quang Hanh – Thành phố Cẩm Phả - một phường miền núi ven thị xã công nghiệp
của tỉnh Quảng Ninh. Từ khi thành lập đến nay, trường THPT Lê Quý Đôn trải qua
29 năm xây dựng và phát triển, khẳng định vị trí của một cơ sở giáo dục có uy tín
chất lượng, là một trong những địa chỉ góp phần đào tạo nhân lực của thành phố Cẩm
Phả và tỉnh Quảng Ninh. Cơ sở vật chất của trường được mô tả trong Bảng 3.1
Bảng 3.1. Cơ sở vật chất của Trường THPT Lê Quý Đôn
STT Nội dung Đơn vị tính Số lượng
1 Tổng diện tích m2 5.200 m2
2 Số phòng học phòng 20
3 Số phòng thí nghiệm, đa năng phòng 03
4 Phòng làm việc phòng 12
5 Phòng Tin hoc phòng 02
Trong 29 năm xây dựng và phát triển, trường THPT Lê Quý Đôn không ngừng
lớn mạnh về số lượng và chất lượng. Bằng những nỗ lực liên tục, toàn diện và sự tích
cực vận động của chính mình, với sự chỉ đạo, hướng dẫn và hỗ trợ của UBND tỉnh,
Thành Phố Cẩm Phả, của Sở GD-ĐT, nhất là trong việc triển khai các dự án xây dựng
cơ sở vật chất, thực hiện nhiệm vụ các năm học, bằng tinh thần kiên trì vượt khó,
bằng thái độ tích cực và sáng tạo trong tìm tòi học hỏi bạn bè, nhà trường đã hoàn
thiện về mọi mặt trong lộ trình phấn đấu thực hiện kế hoạch đạt chuẩn đã đề ra và
40
được UBND tỉnh Quảng Ninh ra quyết định công nhận trường THPT đạt Chuẩn Quốc
gia vào tháng 8 năm 2010.
Hiện tại, đội ngũ cán bộ, giáo viên, nhân viên gồm 44 đồng chí với 4 tổ: Xã
hội, Tự nhiên I, Tự nhiên II, Hành chính – Tổng hợp; 100% đạt chuẩn, 20 đồng chí
trên chuẩn (thạc sỹ).
Tỷ lệ học sinh lên lớp và thi đỗ tốt nghiệp luôn đạt kết quả cao. Hàng năm tỷ
lệ tốt nghiệp THPT là trên 98% . Học sinh giỏi cấp tỉnh hàng năm có từ 25 ->40 em
đạt giải. Mặc dù trường đóng trên địa bàn nông thôn, miền núi, xa trung tâm thị xã,
thành phố nhưng hàng năm trường thường có tỷ lệ học sinh thi đỗ vào các trường Đại
học và Cao đẳng rất cao: từ 50% đến trên 60 % mỗi năm. Trường được xếp Top 10
về học sinh đỗ đại học trong các trường THPT trên địa bàn tỉnh Quảng Ninh. Chính
vì vậy, hằng năm trường thu hút rất nhiều học sinh nhập học trên địa bàn thành phố
Cẩm Phả
3.2 Phát biểu bài toán
Qua phân tích trong chương 1 và chương 2, để xây dựng mô hình dự báo tuyển
sinh cho Trường THPT Lê Quý Đôn, luận văn sẽ lựa chọn dựa trên số học sinh tuyển
vào trường trong một số năm của cơ sở đào tạo.
Dữ liệu tuyển sinh của trường từ năm 2000 đến năm 2019 được thống kê trong
Bảng 3.2 như sau:
Bảng 3.2. Dữ liệu tuyển sinh của Trường PTTH Lê Quý Đôn
TT Năm Số HS tuyển sinh
1 2000 307
2 2001 248
3 2002 247
4 2003 310
5 2004 421
6 2005 342
7 2006 242
41
8 2007 354
9 2008 277
10 2009 465
11 2010 387
12 2011 387
13 2012 354
14 2013 287
15 2014 250
16 2015 348
17 2016 308
18 2017 300
19 2018 368
20 2019 349
Dựa trên số liệu thống kê này, ta cần thiết kế phần mềm để xây dựng mô hình
dự báo tuyển sinh ứng dụng mạng nơ ron MLP.
Như đã phân tích trong các phần trước, sẽ là rất khó để xác định các tham số
nhằm xây dựng mô hình dự báo chính xác nhất. Phương pháp thông thường nhất là
dựa trên “thử và sai”. Chính vì vậy, phần mềm thiết kế phải linh hoạt để cho người
dùng chọn lựa một số các tham số sau:
. Về tham số của dự báo:
- Lựa chọn khoảng thời gian quan sát trước (n), là số mẫu cần thiết thu thập
trước khi đưa ra kết quả dự báo hiện tại. Ví dụ, nếu n=10 thì để cho kết quả dự báo
tuyển sinh của năm 2020 cần 10 mẫu của các năm trước từ 2010 đến 2019
- Lựa chọn cửa số dự báo (s). Đây chính là số thời điểm dự báo trong tương
lai. Ví dụ, nếu s=3 thì tại thời điểm có số liệu thực về tuyển sinh cập nhật đến năm
2020 cho phép ta dự báo kết quả của ba năm 2021, 2022 và 2023.
. Về tham số của mạng nơ ron:
- Bao gồm các tham số được trình bày trong phần 2.2.3 như: số nơ ron lớp ẩn,
hệ số học, hệ số mô men, số chu kỳ luyện mạng tối đa.
- Bài toán dựa báo sẽ gồm 2 pha như sau:
42
Pha 1: Pha học
Dữ liệu dùng để học sẽ lấy từ năm 2000 đến năm 2015. Tùy theo việc lựa chọn
khoảng thời gian quan sát trước (n) và cửa số dự báo (s), ta sẽ chuẩn bị một tập các
mẫu cho việc luyện mạng. Giả sử với n=6, s=3, từ cơ sở dữ liệu ta sẽ tạo ra 14 mẫu
mỗi mẫu gồm 6 đầu vào là số học sinh của 6 năm và 3 đầu ra là số học sinh của 3
năm dự báo. Mẫu 1 là số học sinh từ năm 2000 đến năm 2005 và đầu ra là số học sinh
năm 2006, 2007, 2008. Mẫu 2 lấy tiến lên 1 năm là số học sinh từ năm 2001 đến năm
2006 và đầu ra là số học sinh của ba năm 2007, 2008, 2009. Cứ như vậy ta sẽ có đến
mẫu dữ liệu 14 là số học sinh từ năm 2001 đến năm 2011. Dữ liệu từ năm 2012 đến
năm 2017 sẽ được sử dụng để làm dữ liệu kiểm tra độ chính xác của dự báo. Ta có
bảng dữ liệu học như sau:
Bảng 3.3. Bảng dữ liệu học (với n=6, s=3)
Đầu vào Đầu ra
x1 x2 x3 x4 x5 x6 y1 y2 y3
k=1 307 248 247 310 421 342 242 354 277
k=2 248 247 310 421 342 242 354 277 465
k=3 247 310 421 342 242 354 277 465 387
k=4 310 421 342 242 354 277 465 387 387
k=5 421 342 242 354 277 465 387 387 354
k=6 342 242 354 277 465 387 387 354 287
k=7 242 354 277 465 387 387 354 287 250
k=8 354 277 465 387 387 354 287 250 348
Pha 2: Pha chạy đánh giá
Từ kết quả của pha 1, sau khi luyện mạng ta tìm được cấu trúc mạng với các
trong số W = [wij] phù hợp.
Cho tập dữ liệu năm [2000 2019].
Cho tập dữ liệu số học sinh [307349].
43
Bài toán xác định y1, y2, y3 là số học sinh dự kiến của các từ năm 2016 đến
2019. Kiểm tra sai số so với số liệu thực tế. Nếu sai số là chấp nhận được thì đưa ra
dự báo cho các năm 2020, 2021, 2022 dựa trên các số liệu từ 2014 đến 2019.
3.3 Xây dựng phần mềm mô phỏng
3.3.1 Môi trường cài đặt
Chương trình ứng dụng được xây dựng trên giao diện GUI của phần mềm
Matlab 2019a. Sở dĩ học viên lựa chọn xây dựng phần mềm mô phỏng trên Matlab vì
đây là phần mềm chuyên dụng cho tính toán số liệu dưới dạng ma trận. Ngoài ra,
Matlab cũng tích hợp công cụ hỗ trợ cho tạo và luyện mạng nơ ron. Các công bố về
các phương pháp dự báo đa phần sử dụng Matlab nên rất tiện cho việc so sánh và
đánh giá hiệu quả của các phương pháp.
3.3.2 Cài đặt các chức năng con
Mã nguồn của chương trình bao gồm một số module chính như mô tả trong
Bảng 3.4.
Bảng 3.4. Các module chính của chương trình
Module Giải thích
Predict.m Cài đặt giao diện chính của chương trình mô
Predict.fig phỏng dự báo tuyển sinh sử dụng mạng MLP
Database.m Tạo mẫu dữ liệu chuẩn cho luyện và kiểm thử
Database.fig mô hình
Neural.m Khai báo các tham số luyện mạng nơ ron, tiến
Neural.fig hành luyện mạng (pha 1)
Predict_para.m Khai báo các tham số của mô hình dự báo (s
Predict_para.fig và n)
MPL_Predict.m
Chạy chạy các kết quả dự báo
MPL_Predict.m
44
3.3.3 Kết quả hoạt động
Hình 3.1. Giao diện chương trình chính
Hình 3.1 minh họa giao diện của chương trình chính với các chức năng con
tương ứng được mô tả trong Bảng 3.4. Để thực hiện chương trình, trước tiên, người
dùng chọn chức năng Tạo mẫu dữ liệu để nhập các dữ liệu tuyển sinh trong Bảng 3.2
theo file hoặc nhập từng năm (Hình 3.2).
Hình 3.2. Nhập dữ liệu dự báo
Các mẫu dữ liệu dựa báo sẽ được lưu lại trong file data.mat. Trong quá trình luyện
mạng nơ ron, 80% dự liệu sẽ được dành cho huấn luyện, còn lại 20% dữ liệu được sử dụng
cho kiểm tra.
45
Sau khi tạo xong mẫu dữ liệu, chương trình tự động quay về giao diện chương trình
chính và cho phép người dùng nhập các tham số dự báo bằng cách chọn chức năng Nhập
tham số dự báo. Kết quả được thể hiện trên Hình 3.3 (bao gồm khoảng thời gian quan sát
trước và cửa sổ dự báo). Các tham số này sẽ quyết định tới đầu vào và ra trong cấu trúc
của mạng nơ ron sau này. Ví dụ với số liệu được mô tả ở Hình 3.3, mạng MLP sẽ phải có
3 đầu vào và một đầu ra.
Hình 3.3.Nhập tham số dự báo
Sau khi nhập tham số dự báo, giao diện chương trình chính xuất hiện cho phép
người dùng có thể cấu hình các tham số cho việc luyện mạng nơ ron.
Hình 3.4.Luyện mạng nơ ron
46
Hình 3.4 minh họa quá trình luyện và đánh giá hoạt động của mạng nơ ron cho
bài toán dự báo tuyển sinh với tham số dự báo như Hình 3.3. Ở đây, người dùng tùy
chọn số nơ ron cho lớp ẩn và dựa vào kết quả đánh giá (các tham số MSE và MAPE)
để từ đó xác định cấu trúc mạng nơ ron phù hợp.
Hình 3.5.Chạy kết quả dự báo
Sau khi luyện mạng nơ ron để xác định cấu trúc mạng cũng như các tham số của
mạng, người dùng có thể sử dụng chức năng. Chạy kết quả dự báo trên giao diện chương
trình chính để kiểm thử. Kết quả dữ báo cũng như đồ thị dự báo sẽ cho người dùng đánh
giá được tính chính xác của việc dự báo.
3.4 Một số kết quả kiểm thử
Trong quá trình xây dựng cấu trúc mạng nơ ron cho bài toán dự báo,việc xác
định số nơ ron lớp ẩn là rất quan trọng. Số nơ ron lớp ẩn nhỏ sẽ dần đến sai số dự
báo lớn. ngược lại, nếu số nơ ron lớp ẩn mà lớn sẽ làm cho thời gian tính toán lâu
hơn. Sau khi xây dựng phần mềm mô phỏng, học viên đã thử nghiệm thay đổi một
số giá trị số nơ ron lớp ẩn. Các kết quả được thể hiện trong Bảng 3.5. Từ kết quả
này, học viên lựa chọn được mạng nơ ron có cấu trúc phù hợp với số nơ ron lớp ẩn
là 20.
47
Bảng 3.5. Kết quả thử nghiệm khi số nơ ron lớp ẩn thay đổi
Số nơron Tổng thời gian Tổng số vòng
Stt Lỗi MSE
lớp ẩn huấn luyện huấn luyện
1 5 12.752 giây 1000 3.83
2 10 12.875 giây 1000 3.79
3 15 12.818 giây 1000 3.43
4 20 12.825 giây 1000 2.32
5 25 12.986 giây 1000 2.41
6 30 12.953 giây 1000 2.52
Khi chạy thử nghiệm trên cùng một cấu trúc mạng nơ ron và thay đổi tham số
dự báo, học viên nhận thấy tham số dự báo cũng có ảnh hưởng lớn đến kết quả dự
báo, đặc biệt là tham số thời gian quan sát trước. Bảng 3.6 cho thấy khi thời gian quan
sát trước nhỏ, sai số dự báo MSE và MAPE là lớn hơn nhiều so với khi thời gian quan
sát lớn. Về mặt bản chất, nếu thời gian quan sát bằng trước bằng 1, việc xây dựng
một đường tuyến tính minh họa cho số lượng thí sinh là không thể, vì đây là đại lượng
phi tuyến. Do vậy, kết quả sẽ cho sai số lớn (MSE=19.04, MAPE=1.05%). Với N=3
ta có thể xem như bài toán cần tìm một đường cong bậc 3 để xấp xỉ các mẫu dự báo.
Vì vậy, sai số dự báo sẽ thấp hơn rất nhiều. Đường cong dự báo trong Hình 3.5 minh
chứng cho phân tích trên.
Bảng 3.6. Kết quả thử nghiệm khi thời gian quan sát trước thay đổi
Năm Số thí sinh thực Thời gian quan sát trước (N)
N=1 N=2 N=3
2000 307 Không dự báo Không dự báo Không dự báo
2001 248 248 Không dự báo Không dự báo
2002 247 248 249 Không dự báo
2003 310 307 312 309
2004 421 420 421 421
2005 342 342 341 342
2006 242 247 248 241
2007 354 343 355 352
48
2008 277 275 277 276
2009 465 463 465 465
2010 387 386 386 387
2011 387 387 387 388
2012 354 363 355 351
2013 287 283 287 287
2014 250 248 248 250
2015 348 342 348 352
2016 308 306 310 308
2017 300 294 299 300
2018 368 371 367 368
2019 349 346 347 351
2020 N/A 349 363 350
MSE 19.04 3.45 2.12
MAPE 1.05% 0.43% 0.32%
3.5 Đánh giá hoạt động của mô hình dự báo sử dụng mạng MLP với một số mô
hình khác
Hình 3.6.Một số kết quả dự báo với các phương pháp dự báo khác nhau
49
Để kiểm thử khả năng hoạt động của phương pháp dự báo dùng mạng nơ ron,
học viên đã tiến hành so sánh kết quả dự báo của phương pháp này với phương pháp
trung bình dài hạn và phương pháp trung bình động. Ở phương pháp trung bình động,
thời gian quan sát trước vẫn được lấy là n=3 như khi dùng mạng nơ ron. Kết quả kiểm
chứng trên Bảng 3.7 và Hình 3.6 cho thấy phương pháp dự báo sử dụng mạng nơ ron
cho kết quả chính xác hơn rất nhiều lần so với các phương pháp truyền thống.
Bảng 3.7. Kết quả thử nghiệm một số phương pháp dự báo
Phương pháp dự báo
Năm Số thí sinh thực Trung bình dài Trung bình
Mạng nơ ron
hạn động
2000 307 Không dự báo Không dự báo Không dự báo
2001 248 Không dự báo 307 Không dự báo
2002 247 Không dự báo 278 Không dự báo
2003 310 309 267 267
2004 421 421 278 268
2005 342 342 307 326
2006 242 241 313 358
2007 354 352 302 335
2008 277 276 309 313
2009 465 465 305 291
2010 387 387 321 365
2011 387 388 327 376
2012 354 351 332 413
2013 287 287 334 376
2014 250 250 331 343
2015 348 352 325 297
2016 308 308 327 295
2017 300 300 326 302
2018 368 368 324 319
2019 349 351 326 325
2020 N/A 350 328 339
MSE 2.12 4373 5707
MAPE 0.32% 16.33% 17.12%
50
3.6 Kết luận chương
Trong chương 3, trên cơ sở các kiến thức lý thuyết về dự báo chuỗi thời gian
và mạng nơ ron MLP đã trình bày trong các chương trước, học viên đã tiến hành xây
dựng thử nghiệm chương trình mô phỏng minh họa dự báo tuyển sinh cho trường
THPT Lê Quý Đôn sử dụng mạng nơ ron MLP. Từ đó, học viên đã thử nghiệm để
tìm ra các tham số về cấu trúc mạng nơ ron cũng như tham số thời gian quan sát trước
phù hợp (cho sai số dự báo nhỏ nhất). Kết quả của dự báo tuyển sinh dùng mạng nơ
ron cũng được so sánh với một số phương pháp thông thường như trung bình dài hạn,
trung bình động để thấy được dự báo sử dụng mạng nơ ron là phương pháp ưu việt
hơn cả và cần được sử dụng nhiều hơn, thay thế cho các phương pháp dự báo cũ trong
các lớp bài toán dự báo tương tự.
51
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Qua nghiên cứu cho thấy rằng dự báo dữ liệu chuỗi thời gian sử dụng mạng
nơ ron là một bài toán gặp rất nhiều trong thực tế. Làm chủ các kỹ thuật phân tích và
giải quyết các bài toán dự báo chuỗi thời gian sử dụng mạng MLP là một phương
pháp tốt để triển khai bài toán dự báo tuyển sinh.
Sau một thời gian tìm hiểu nghiên cứu, luận văn đã trình bày được các
vấn đề sau:
- Nghiên cứu lý thuyết chung, cập nhật các nghiên cứu mới nhất về bài toán
dự báo, kỹ thuật dự báo theo chuỗi thời gian. Đặc biệt tập trung vào phương pháp dự
báo tuyển sinh sử dụng mô hình mạng nơ ron MLP.
- Phát biểu bài toán dự báo tuyển sinh cho trường THPT Lê Quý Đôn – TP
Cẩm Phả - Tỉnh Quảng Ninh; Xây dựng chương trình minh họa dự báo tuyển sinh sử
dụng mô hình mạng nơ ron MLP. Xác định các tham số phù hợp. So sánh đánh giá
kết quả đạt được với một số thuật toán dự báo khác
Trong quá trình thử nghiệm chương trình, các kết quả dựa báo là tương đối
tốt. Tuy nhiên, bài toán dự báo vẫn còn nhiều điểm cần khắc phục, đề tài còn có một
số hướng phát triển sau:
- Nghiên cứu các phương pháp dò tìm thông số tốt nhất cho quá trình luyện
mạng MLP
- Nghiên cứu các kiến trúc mạng DeepLearning hiệu quả hơn cho bài toán dự
báo tuyển sinh theo tiếp cận dự báo chuỗi thời gian
- Lựa chọn thêm một số các tiêu chí ảnh hưởng đến kết quả dự báo. Xây dựng
mạng nơ ron phù hợp cho bài toán dự báo với nhiều đầu vào
Do giới hạn về thời gian nghiên cứu và kiến thức của bản thân, luận văn khó
có thể tránh khỏi một số sai sót nhất định. Học viên rất mong nhận được sự đóng góp
ý kiến của các thầy cô, các bạn đọc quan tâm để luận văn được hoàn thiện hơn.
Một lần nữa học viên xin được cảm ơn Thầy giáo TS. Nguyễn Đình Dũng đã
tận tình giúp đỡ, hướng dẫn trong thời gian thực hiện đề tài, cảm ơn sự giúp đỡ của
gia đình, bạn bè và các đồng nghiệp trong thời gian qua.
52
TÀI LIỆU THAM KHẢO
I. Tài liệu tiếng Việt
[1] Trần Hoài Linh (2015), Giáo trình mạng neuron và ứng dụng xử lý tín hiệu số,
Nhà XB Bách Khoa.
[2] Thái Trung Hải (2014), Sử dụng mạng nơron trong việc dự đoán kết quả đậu
đại học, Luận văn Thạc sỹ, Đại học Lạc Hồng.
[3] Trần Đức Minh, Trần Huy Dương, Vũ Đức Thi (2015), Một số vấn đề về dự
báo dữ liệu chuỗi thời gian, Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên
cứu cơ bản và ứng dụng Công nghệ thông tin, DOI:
10.15625/vap.2015.000182, pp. 467-470
[4] Dương Thu Trang (2017), Ứng dụng mạng nơron nhân tạo dự báo số học sinh
tuyển vào Trung tâm GDNNGDTX quận Đống Đa, Luận văn thạc sỹ,khoa
Công nghệ thông tin – Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội
[5] Nguyễn Văn Trịnh (2012), Ứng dụng mạng nơron trong dự báo tỷ lệ nghỉ học,
Luận văn thạc sỹ ,Viện Toán Ứng dụng và Tin học – Đại học Bách khoa Hà
Nội
II. Tài liệu tiếng Anh
[6] Chen, Yu & Li, Ran & Hagedorn, Linda. (2019). Undergraduate International
Student Enrollment Forecasting Model: An Application of Time Series
Analysis.
[7] C. T. S. E. M. Jyh Shing Roger Jang, Neuro fuzzy and Soft Computing, Prientice
Hall International, Inc, 2002.
[8] Datilo, Philemon & Ismail, Zuhaimy & Jayeola, Dare. (2019). A Review of
Epidemic Forecasting Using Artificial Neural Networks. International Journal
of Epidemiologic Research. 6. 132-143. 10.15171/ijer.2019.24.
[9] Dean Abbott (2014), Applied Predictive Analytics: Principles and Techniques
for the Professional Data Analyst, Wiley
53
[10] Egbo, M.N &Bartholomew, Desmond. (2018). Forecasting Students’
Enrollment Using Neural Networks and Ordinary Least Squares Regression
Models. Journal of Advanced Statistics. 3. 10.22606/jas.2018.34001.
[11] Fico Corporation (2009), Understanding Predictive Analytics
[12] Hewamalage, Hansika & Bergmeir, Christoph & Bandara, Kasun. (2019).
Recurrent Neural Networks for Time Series Forecasting: Current Status and
Future Directions.
[13] Hill, Tim & O'Connor, Marcus & Remus, William. (1996). Neural Network
Models for Time Series Forecasts. Management Science. 42. 1082-1092.
10.1287/mnsc.42.7.1082.
[14] Lavilles, Rabby. (2012). Enrollment Forecasting for School Management
System. International Journal of Modeling and Optimization. 2. 563-566.
10.7763/IJMO.2012.V2.183.
[15] Norhaidah Abu Haris,Munaisyah Abdullah, Abu Talib Othman, Fauziah Abdul
Rahman (2015), Application of Forecasting Technique for Students
Enro
Các file đính kèm theo tài liệu này:
- luan_van_nghien_cuu_mang_no_ron_va_ung_dung_trong_bai_toan_d.pdf