Ứng dụng mạng nơron SVM trong mô hình lai dự báo độ ẩm lớn nhất và nhỏ nhất trong ngày

18 NGHIÊN CỨU KHOA HỌC Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 ỨNG DỤNG MẠNG NƠRON SVM TRONG MÔ HÌNH LAI DỰ BÁO ĐỘ ẨM LỚN NHẤT VÀ NHỎ NHẤT TRONG NGÀY APPLICATIONS OF SVM NETWORKS IN HYBRID MODEL FOR PREDICT THE MAXIMUM AND MINIMUM HUMIDITY OF THE DAY Đỗ Văn Đỉnh, Vũ Quang Ngọc Email: dodinh75@gmail.com Trường Đại học Sao Đỏ Ngày nhận bài: 17/11/2018 Ngày nhận bài sửa sau phản biện: 20/3/2018 Ngày chấp nhận đăng: 28/3/2018 Tóm tắt Dự báo đ

pdf7 trang | Chia sẻ: huongnhu95 | Lượt xem: 429 | Lượt tải: 0download
Tóm tắt tài liệu Ứng dụng mạng nơron SVM trong mô hình lai dự báo độ ẩm lớn nhất và nhỏ nhất trong ngày, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ộ ẩm môi trường trong ngày là một trong những bài toán không chỉ ở Việt Nam mà các quốc gia trên thế giới đang rất quan tâm tới. Bài toán dự báo trên có tính chất phụ thuộc nhiều vào điều kiện địa lý và mang tính khu vực. Do đó, tại từng khu vực và vùng miền khác nhau cần xác lập bộ thông số dữ liệu phù hợp cho quá trình dự báo. Trong bài báo này, đề xuất sử dụng mô hình lai, phối hợp máy học vectơ hỗ trợ SVM (Support Vector Machine) và mô hình khai triển theo phương pháp tuyến tính SVD (Singular Value Decomposition) để dự báo và ước lượng giá trị độ ẩm lớn nhất và nhỏ nhất trong ngày tại thành phố Hải Dương, Việt Nam. Bộ số liệu đầu vào là giá trị lớn nhất, nhỏ nhất của nhiệt độ, độ ẩm, tốc độ gió và giá trị trung bình của lượng mưa, số giờ nắng của các ngày trước đó. Chất lượng của giải pháp đề xuất được kiểm nghiệm trên bộ số liệu quan trắc thực tế (2191 ngày, từ ngày 01/01/2010 đến ngày 31/12/2015) ở thành phố Hải Dương, Việt Nam. Kết quả thực nghiệm cho sai số tuyệt đối trung bình MAE = 4,23%. Từ khóa: Dự báo; mô hình lai; máy học vectơ hỗ trợ; độ ẩm lớn nhất, nhỏ nhất trong ngày. Abstract Forecasting the humidity of the day is one of the problems not only in Vietnam but also in other countries in the world. The prediction problem is highly dependent on geographic and regional conditions. Therefore, in different regions and regions, it is necessary to establish appropriate data sets for the forecasting process. In this paper, we propose to use a hybrid model, support vector machine (SVM) and a Singular Value Decomposition (SVD) model to predict and estimate maximum and minimum daily humidity values in Hai Duong city, Vietnam. The input data is the maximum, minimum value of temperature, humidity, wind speed and mean value of precipitation, the number of hours of sunshine of the previous day. The quality of the proposed solution was tested on the actual observation data (2191 days, 01/01/2010 to 31/12/2015) in Hai Duong city, Vietnam. Experimental results showed an average error of MAE = 4.23%. Keywords: Predict; hybrid model; support vector machines; maximum and minimum daily humidity. 1. ĐẶT VẤN ĐỀ Việt Nam là một quốc gia nằm trong khu vực nhiệt đới gió mùa, có lượng mưa và độ ẩm phức tạp trên từng vùng miền có sự khác nhau rõ rệt. Dự báo độ ẩm không khí là một trong những nội dung chính của bản tin dự báo thời tiết, nó có ý nghĩa quan trọng đối với ngành nông nghiệp, công nghiệp và dịch vụ, nhằm phòng chống và hạn chế thiên tai, thiết lập kế hoạch sản xuất, khai thác tiềm năng khí hậu. Diễn biến của độ ẩm không khí rất phức tạp, nó chịu ảnh hưởng của rất nhiều các yếu tố khác như độ ẩm, áp suất khí quyển, lượng mưa, tốc độ gió, bức xạ nhiệt, tốc độ phát triển các thành phần kinh tế, Hiện nay, các mô hình dự báo thông số thời tiết sử dụng phổ biến nhất được chia thành hai dạng là mô hình dự báo tất định (Deterministic Model) và mô hình dự báo thống kê (Statistical Model) [2]. Trong đó, mô hình dự báo tất định được xây dựng dựa trên quá trình diễn biến thời tiết, nó đòi hỏi một hệ thống cơ sở hạ tầng đủ LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 19 mạnh và người vận hành, khai thác mô hình phải có trình độ về công nghệ thông tin. Ngược lại, các mô hình dự báo thống kê đơn giản hơn, nó không đòi hỏi quá cao về mặt cơ sở hạ tầng hay quá chi tiết về các thông số ảnh hưởng đến thông số thời tiết cần dự báo vì mô hình này có khả năng tự động xây dựng mối quan hệ tuyến tính cũng như phi tuyến giữa các thông số cần dự báo và các thông số khác. Đã có nhiều mô hình dự báo thống kê được nghiên cứu và ứng dụng thành công trên thế giới như phương pháp hồi quy phi tuyến tính, phi tuyến; phương pháp giá trị cực trị (Extreme Value) và mạng nơron nhân tạo (ANN - Artificial Neural Network) [5-9], trong số đó, các mô hình ứng dụng mạng nơron nhân tạo đã đạt được những tiến bộ đáng kể và nghiên cứu ứng dụng rộng rãi trong thời gian qua [1, 5, 6, 8]. Thuật toán máy học vectơ hỗ trợ SVM được Vapnik giới thiệu năm 1995 [4], đã được nghiên cứu thử nghiệm trong lĩnh vực dự báo thời tiết và thu được những kết quả khả quan, trong hầu hết các nghiên cứu đã được công bố, mô hình dự báo nhiệt độ không khí dùng mạng SVM đều cho kết quả tốt hơn so với các mô hình ANN kiểm chứng [7-10,13]. Mặt khác, trong bài báo này đề xuất ứng dụng mạng nơron SVM trong mô hình lai [2] để dự báo độ ẩm không khí, kết quả nghiên cứu thực nghiệm cho thấy ứng dụng mạng SVM trong mô hình lai dự báo độ ẩm không khí cho kết quả khả quan hơn so với các mô hình mạng nơron khác (như mạng RBF, MLP, MLR, Elman, BRtree,). 2. ỨNG DỤNG MẠNG SVM TRONG MÔ HÌNH LAI DỰ BÁO ĐỘ ẨM MÔI TRƯỜNG Bài toán dự báo là một trường hợp đặc biệt của bài toán ước lượng và xây dựng mô hình ánh xạ giữa đầu vào và đầu ra [1, 2]. Theo [2, 13], mô hình lai đã được đề xuất để dự báo ngắn hạn phụ tải điện, dự báo nhiệt độ lớn nhất, nhỏ nhất trong ngày và cho kết quả khả quan; để ước lượng thành phần tuyến tính, tác giả sử dụng thuật toán khai triển theo các giá trị kỳ dị SVD, phần ước lượng phi tuyến sử dụng mạng MLP [2] và SVM [13]. Trong bài báo này, tác giả đề xuất ứng dụng phối hợp SVD và SVM trong mô hình lai để dự báo và ước lượng độ ẩm lớn nhất (RHmax) và độ ẩm cao nhất (RHmin) trong ngày. Như đã trình bày ở [1, 2, 13], bằng thực nghiệm mô hình lai có nhiều ưu việt hơn các mô hình mạng nơron khác. Khi sử dụng mô hình lai sẽ giảm bớt mức độ phức tạp của mô hình phi tuyến, trước hết cần ước lượng thành phần tuyến tính, sau đó ta loại thành phần tuyến tính khỏi các số liệu đầu vào để nhằm chỉ giữ lại thành phần phi tuyến trong tín hiệu của đối tượng. Tín hiệu còn lại này sẽ được dùng để huấn luyện khối phi tuyến hay nói cách khác: sai số còn lại từ khối tuyến tính trở thành đầu vào của khối phi tuyến. Để kiểm nghiệm chất lượng các mô hình mạng nơron ước lượng thành phần phi tuyến, trong bài báo tác giả sử dụng các mô hình mạng MLP, MLR, Elman, BRtree, SVM và các mạng Hybrid của các mạng nơron trên như Hybrid-MLP, Hybrid-MLR, Hybrid-Elman, Hybrid-BRTree. Từ đó, đánh giá chất lượng các mô hình mạng nơron cho bài toán dự báo thông số thời tiết. Các mô hình dự báo và ước lượng thông số thời tiết sẽ được đánh giá chất lượng thông qua các chỉ số Mean Absolute Error (MAE); Mean Relative Error (MRE); Maximum Absolute Error (MaxAE); Standard Deviation (SD). 2.1. Cấu trúc của mô hình dự báo Giả thiết rằng ta có bộ số liệu đo quan trắc môi trường tại điểm A. Ta xây dựng hàm quan hệ giữa thông số cần dự báo với các thông số môi khác thông qua phương trình: ( ) ( )( ), ( , ), , , , ( , )T A d f T A d T A d T A d Ki i i i+ = - -1 1  (1) Hoặc ( ) ( ) ( ) ( ) ( ) , , , , , , ( , ), , , , ( , T A d T A d T A d Ki i i T A d fi T A d T A d T A d Kj j j é ù- -ê ú ê ú+ = ê ú ê ú- -ê úë û 1 1 1    (2) trong đó: ( ),iT A d : thông số môi trường thứ i tại vị trí A ở ngày d. Cấu trúc mô hình dự báo độ ẩm lớn nhất, nhỏ nhất trong ngày dựa vào các số liệu đo trong quá khứ như hình 1. Hình 1. Sơ đồ cấu trúc mô hình dự báo thông số khí tượng 2.2. Các thuật toán xây dựng mô hình dự báo 2.2.1. Mô hình ước lượng tuyến tính Từ phương trình (5), hàm quan hệ tuyến tính giữa RHmax của ngày d với RHmax của các ngày quá khứ và được xác định từ hệ phương trình ước lượng xấp xỉ như trong công thức (3) và (4). Từ (4) ta cần xác định vectơ [ ]1 2, , , T Ka a a=a  để đạt cực tiểu của hàm sai số ước lượng. Trong thực tế áp dụng, ta còn cần trả lời hai câu hỏi: 1. Cần sử dụng bao nhiêu số liệu trong quá khứ?; 2. Đó là những số liệu nào? 20 NGHIÊN CỨU KHOA HỌC Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 1 max 2 max max max 1 max 2 max max max 1 max max 2 max max max max max max ( ) ( 1) ... ( ) ( 1) ( 1) ( 2) ... ( 1) ( 2) ... ... ... ( 1) ( 2) ... ( ) ( ) K K K a K a K a d K RH K a K a K a d K RH K a N a N a N K RH N RH RH RH RH RH RH RH RH RH + − + + − ≈ + − + − + + − + ≈ + − + − + + − ≈ ⋅ ⋅ ⋅  ⋅ ⋅ ⋅    ⋅ ⋅ ⋅ (3) max max max max1 max max max max2 max max max max max max max max ( ) ( 1) .... (1) ( 1) ( 1) ( 2) ... (2) ( 2) . ( 1) ( 2) ... ( ) ( )K K K Ka K K Ka N N N K Na RH RH RH RH RH RH RH RH RH RH RH RH ⇔ − + − − + ≈ − − −                                   (4) Phương pháp xác định thích nghi được thực hiện như sau: - Trước tiên ta sử dụng một số lượng lớn số liệu quá khứ (trong nghiên cứu ta sử dụng 60K = - tương đương 2 tháng số liệu trước đó - là đủ lớn để dự báo ngày tiếp theo). - Với K số liệu quá khứ, ta xác định vectơ [ ]1 2, , , T Ka a a=a  của hàm ước lượng tuyến tính ( )max max 1 ( ) K i i RH d a RH d i = ≈ ⋅ −  ∑ bằng phương pháp SVD. - Xác định thành phần có giá trị tuyệt đối nhỏ nhất trong vectơ a. Thành phần này sẽ tương ứng với ngày trong quá khứ ít ảnh hưởng tới ngày dự báo. Ta loại bỏ khỏi bộ số liệu trong quá khứ, giảm K = K–1, và quay lại bước 2 nếu K > Kmin chọn trước. Quá trình lặp các bước 2-3 cho đến khi K giảm xuống một giá trị đủ nhỏ có thể chấp nhận được để mô hình không quá phức tạp. Cụ thể trong bài báo ta chọn Kmin< 5. Tương tự như vậy, ta xây dựng hàm quan hệ tuyến tính giữa RHmax của ngày d với RHmax,RHmin’ Tmax, Tmin, Winmax, Winmin, RainAll và RhAll của các quá khứ ta được phương trình (5). Khi xác định được mối quan hệ tuyến tính giữa RHmax của ngày d với các ngày trong quá khứ, ta tính sai số chênh lệch giữa số liệu thực tế và số liệu ước lượng như phương trình (6): ( ) ( ) ( )max max1 2 3min ( ) ( ) ( ) ( )max max54 6min min1 ( ) ( )7 8 RH a RH d i a RH d i a T d ii i iK d a T d i a Win d i a Win d iii ii a RainAll d i a RhAll d ii i ⋅ − + ⋅ − + ⋅ − + ≈ + ⋅ − + ⋅ − + ⋅ − +∑ = + ⋅ − + ⋅ −           (5) 1 max 2 min 3 max max 4 min 5 max 6 min 1 7 8 ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) i i iK i i i i i i a d i a RH d i a d i NL d RH d a d i RH T T a Win d i a Win d i a RainAll d i a RhAll d i= − + ⋅ − + − + = − + − + ⋅   ⋅ ⋅ − + ⋅ − +   + ⋅ − + ⋅ −  ∑ (6) Phương trình (6): đây sẽ là phần phụ thuộc phi tuyến còn lại giữa RHmax với các ngày trong quá khứ. Hoàn toàn tương tự khi xây dựng các mô hình ước lượng cho RHmin. 2.2.2. Mô hình ước lượng phi tuyến Khi xác định được các thông số mô hình tuyến tính, ta tiến hành xây dựng mạng nơron nhân tạo để ước lượng thành phần phi tuyến. Giá trị chênh lệnh (phương trình (6)) được sử dụng là đầu vào cho mô hình ước lượng thành phần phi tuyến. 3. KẾT QUẢ VÀ THẢO LUẬN Mô hình nghiên cứu được xây dựng trên nền phần mềm Matlab®2010b, với SVM sử dụng LS-SVMlabv1.8_R2009b_R2011a và được thiết kế theo các bước sau: chuẩn bị dữ liệu, lựa chọn đặc tính cho mô hình dự báo và mô hình ước lượng, xây dựng kiến trúc mạng, lựa chọn phương pháp và đào tạo mạng, đánh giá độ tin cậy. 3.1. Kết quả ước lượng thành phần tuyến tính 3.1.1. Ước lượng tuyến tính RHmax Bằng phương pháp phân tích SVD kết hợp với kinh nghiệm thực tế, ta xác định các yếu tố ảnh hưởng lớn nhất đến giá trị độ ẩm lớn nhất (RHmax) cần dự báo: - Ảnh hưởng của RHmax trong quá khứ đến RHmax dự báo, ta xác định được 4 ngày có hệ số phụ thuộc lớn là: d-1, d-3, d-8 và d-11 loại ngày d-52 vì ở xa ngày dự báo. Tiếp tục khảo sát sự phụ thuộc LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 21 của RHmax vào các số liệu RHmin, Tmax, Tmin, Winmax, Winmin, RainAll và ShAll trong quá khứ bằng cách làm hoàn toàn tương tự ta được: - Ảnh hưởng của RHmin trong quá khứ đến RHmax dự báo bao gồm các ngày là d-1, d-7 và d-19. Ngày d-46 và d-56 xa ngày dự báo nên bỏ qua. - Giá trị Tmax trong quá khứ ảnh hưởng đến RHmax dự báo gồm d-1, d-4 và d-6, ngày d-55 và d-60 bỏ qua vì ở xa ngày dự báo. - Các giá trị Tmin trong quá khứ ảnh hưởng đến RHmax dự báo d-1, d-6, d-9, d-58 và d-60. Ngày d-58 và d-60 ở xa ngày dự báo nên bỏ qua. - Ảnh hưởng của tốc độ gió max (Winmax) đến RHmax là d-1, d-6, d-32, d-42 và d-48. Loại ngày d-32, d-42 và d-48 do xa ngày dự báo. - Ảnh hưởng của tốc độ gió min (Winmin) đến RHmax là d-6, d-17, d-39, d-50 và d-60. Loại ngày d-39, d-50 và d-60 do ở xa ngày dự báo. - Lượng mưa trung bình ngày (RainAll) đến độ ẩm lớn nhất (RHmax) là các ngày d-1, d-7, d-10, d-51 và d-60. Loại ngày d-51 và d-60 do ở xa ngày dự báo. - Số giờ nắng trong ngày (ShAll) ảnh hưởng đến RHmax là d-1, d-5, d-40, d-56 và d-60. Loại các ngày d-40, d-56 và d-60 do ở xa ngày dự báo. Tổng hợp lại ta có mô hình được lựa chọn để dự báo giá trị RHmax của ngày thứ d sẽ gồm 22 số liệu quá khứ như công thức (7). Kiểm tra chất lượng của mô hình sử dụng 710 ngày số liệu cuối trong tập số liệu 2191 ngày. Bảng 1 là kết quả sai số khi khai triển thành phần tuyến tính ước lượng RHmax, kết quả tính toán sai số trung bình tuyệt đối khi ước lượng RHmax tương đối nhỏ, sai số trung bình tuyệt đối kiểm tra MAE(Etest) = 3,47% max max max max max min max max max max max min ( ) 0,484 ( 1) 0,121 ( 3) 0,133 ( 8) 0,121 ( 11) 0,378 ( 1) 0,199 ( 7) 0,219 ( 19) 0,925 ( 1) 0,389 ( 4) 0,472 ( 6) 1,132 ( 1) 0,5 RH d RH d RH d RH d RH d RH d RH d RH d T d T d T d T d = ⋅ − + ⋅ − + ⋅ − + + ⋅ − + ⋅ − + ⋅ − + + ⋅ − + ⋅ − + ⋅ − + + ⋅ − + ⋅ − + min min max min min 61 ( 6) 0,454 ( 9) 5,550 ( 16) 14,869 ( 6) 14,482 ( 17) 1,346 ( 1) 1,350 ( 7) 1,316 ( 10) 3,964 ( 1) 3,810 ( 5) T d T d Win d Win d Win d RainAll d RainAll d RainAll d ShAll d ShAll d ⋅ − + + ⋅ − + ⋅ − + ⋅ − + + ⋅ − + ⋅ − + ⋅ − + + ⋅ − + ⋅ − + ⋅ − (7) Hình 2. Đồ thị sai số học và sai số kiểm tra khi khai triển thành phần tuyến tính để ước lượng RHmax Hình 2 biểu diễn đáp ứng của bộ số liệu gốc, kết quả ước lượng RHmax bằng phương pháp khai triển thành phần tuyến tính. Bảng 1. Kết quả sai số khi khai triển thành phần tuyến tính ước lượng RHmax Quá trình Sai số Học Kiểm tra MAE 3,69 3,47 MRE 4,30 3,93 MaxAE 10,60 19,79 SD 3,89 3,58 3.1.2. Ước lượng tuyến tính RHmin Thực hiện ước lượng độ ẩm lớn nhất (RHmin) tương tự Tmax, Tmin và RHmax, ta xác định các yếu tố ảnh hưởng lớn nhất đến giá trị độ ẩm nhỏ nhất (RHmin) cần dự báo: - Ảnh hưởng của RHmin trong quá khứ đến RHmin dự báo, ta xác định được 4 ngày có hệ số phụ thuộc lớn là: d-1, d-4, d-6 và d-13, loại ngày d-56 vì ở xa ngày dự báo. Tiếp tục khảo sát sự phụ thuộc của RHmin vào các số liệu RHmax, Tmax, Tmin, Winmax, Winmin, RainAll và ShAll trong quá khứ bằng cách làm hoàn toàn tương tự ta được: - Ảnh hưởng của RHmax trong quá khứ đến RHmin dự báo bao gồm các ngày là d-1, d-3 và d-8. Ngày d-43 và d-56 xa ngày dự báo nên bỏ qua. - Giá trị Tmax trong quá khứ ảnh hưởng đến RHmin dự báo gồm d-3, d-5 và d-9, ngày d-28 và d-60 bỏ qua vì ở xa ngày dự báo. - Các giá trị Tmin trong quá khứ ảnh hưởng đến RHmin dự báo d-1, d-4, d-10, d-24 và d-60. Ngày d-24 và d-60 ở xa ngày dự báo nên bỏ qua. - Ảnh hưởng của tốc độ gió max (Winmax) đến RHmin là d-5, d-21, d-44, d-53 và d-60. Loại ngày d-21, d-44, d-53 và d-60 do xa ngày dự báo. 22 NGHIÊN CỨU KHOA HỌC Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 - Ảnh hưởng của tốc độ gió min (Winmin) đến RHmin là d-1, d-11, d-22, d-42 và d-60. Loại ngày d-22, d-42 và d-60 do ở xa ngày dự báo. - Lượng mưa trung bình ngày (RainAll) đến RHmin là các ngày d-1, d-3, d-31, d-46 và d-56. Loại ngày d-31, d-46 và d-60 do ở xa ngày dự báo. - Số giờ nắng trong ngày (ShAll) ảnh hưởng đến RHmin là d-4, d-20, d-40, d-55 và d-60. Loại các ngày d-20, d-40, d-55 và d-60 do ở xa ngày dự báo. - Tổng hợp lại ta có mô hình được lựa chọn để dự báo giá trị RHmin của ngày thứ d sẽ gồm 19 số liệu quá khứ: min min min min min max max max max max max min ( ) 0,640 ( 1) 0, 087 ( 4) 0, 093 ( 6) 0, 088 ( 13) 0,705 ( 1) 0,204 ( 3) 0,195 ( 8) 0,740 ( 3) 0,520 ( 5) 0,629 ( 9) 1,643 ( 1) 0,70 RH d RH d RH d RH d RH d RH d RH d RH d T d T d T d T d = × - + × - + × - + + × - + × - + × - + + × - + × - + × - + + × - + × - + min min max min min 0 ( 4) 0, 403 ( 10) 4,121 ( 5) 11, 315 ( 1) 10,680 ( 11) 1,159 ( 1) 1, 001 ( 3) 2,772 ( 4) T d T d Win d Win d Win d RainAll d RainAll d RainAll d × - + + × - + × - + × - + + × - + × - + + × - + × - (8) Kiểm tra chất lượng của mô hình sử dụng 710 ngày số liệu cuối trong tập số liệu 2191 ngày. Bảng 2 là kết quả sai số khi khai triển thành phần tuyến tính ước lượng RHmax, kết quả tính toán sai số trung bình tuyệt đối khi ước lượng RHmin nhỏ, sai số trung bình tuyệt đối kiểm tra MAE(Etest) = 8,23%, so với mô hình ước lượng thông số môi trường RHmax thì mô hình ước lượng RHmin sai số lớn hơn. Hình 3 biểu diễn đáp ứng của bộ số liệu gốc, kết quả ước lượng RHmin bằng phương pháp khai triển thành phần tuyến tính. Bảng 2. Kết quả sai số khi khai triển thành phần tuyến tính ước lượng RHmin Quá trình Sai số Học Kiểm tra MAE 8,15 8,23 MRE 12,63 12,39 MaxAE 18,17 17,07 STD 6,07 6,08 Hình 3. Đồ thị sai số học và sai số kiểm tra khi khai triển thành phần tuyến tính để ước lượng RHmin 3.2. Kết quả ước lượng thành phần phi tuyến 3.2.1. Ước lượng phi tuyến RHmax Khi thực hiện khai triển thành phần tuyến tính, khi ước lượng RHmax ở phần 3.1.1a cho kết quả có 22 thông số môi trường trong quá khứ ảnh hưởng tới ngày dự báo. Phần chênh lệch được xác định theo công thức 6, hình 4 là sai số còn lại sau khi ước lượng thành phần tuyến tính và cũng là bộ số liệu đầu vào cho mô hình ước lượng thành phần phi tuyến. Hình 4. Các sai số còn lại RHmax của mô hình tuyến tính trở thành đầu vào của mô hình phi tuyến Bảng 3 là kết quả sai số ước lượng thành phần phi tuyến RHmax cho kết quả sai số trung bình tuyệt đối khá tốt ( )( )_ 3, 35% .- =test Hybrid SVMMAE E Hình 5 là đồ thị biểu diễn sai số học và sai số kiểm tra kết quả ước lượng thành phần phi tuyến với RHmax trong mô hình lai. LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 23 Bảng 3. Kết quả sai số khi ước lượng thành phần phi tuyến của RHmax Mạng ước lượng Sai số học Sai số kiểm tra MAE MRE (%) MaxAE SD MAE MRE (%) MaxAE SD MLP 3,05 3,53 30,47 3,03 3,88 4,35 28,93 3,86 MLR 3,70 4,30 40,59 3,89 3,47 3,92 29,79 3,58 RBF 3,36 3,91 35,53 3,39 3,56 4,00 23,03 3,47 BRTree 1,88 2,13 21,62 2,04 5,00 5,60 36,79 5,18 Elman 3,06 3,54 33,10 3,00 3,62 4,09 32,14 3,83 SVM 3,26 3,81 37,83 3,47 3,35 3,79 25,40 3,41 Hybrid-MLP 2,97 3,44 25,80 3,02 3,48 3,91 27,13 3,61 Hybrid-MLR 3,70 4,30 40,59 3,89 3,47 3,92 29,79 3,58 Hybrid-RBF 3,10 3,58 31,84 3,04 3,82 4,28 22,45 3,71 Hybrid-BRTree 1,84 2,12 30,59 2,17 4,02 4,51 33,07 4,69 Hybrid-Elman 2,99 3,44 25,39 2,94 3,62 4,06 24,63 3,47 Hybrid-SVM 3,23 3,77 37,48 3,42 3,35 3,79 25,54 3,43 Hình 5. Sai số học và sai số kiểm tra kết quả ước lượng thành phần phi tuyến với RHmax trong mô hình lai 3.2.2. Ước lượng phi tuyến RHmin Tương tự như khi ước lượng thành phần phi tuyến với RHmax, ta có 19 thông số môi trường trong quá khứ ảnh hưởng tới giá trị RHmin của ngày dự báo. Phần chênh lệch còn lại sau khi ước lượng thành phần tuyến tính và cũng là bộ số liệu đầu vào cho mô hình ước lượng thành phần phi tuyến được xác định theo công thức (6) và được biểu diễn trên hình 6. Hình 6. Các sai số còn lại RHmin của mô hình tuyến tính trở thành đầu vào của mô hình phi tuyến Bảng 4 là kết quả sai số khi ước lượng thành phần phi tuyến RHmin sử dụng mạng SVM trong mô hình lai. Kết quả sai số cho thấy sai số trung bình tuyệt đối tốt (MAE(Etest)=4,23%). Hình 7 là đồ thị biểu diễn sai số học và sai số kiểm tra kết quả ước lượng thành phần phi tuyến với RHmin trong mô hình lai. Bảng 4. Kết quả sai số khi ước lượng thành phần phi tuyến của RHmin Mạng ước lượng Sai số học Sai số kiểm tra MAE MRE (%) MaxAE SD MAE MRE (%) MaxAE SD MLP 7,62 11,75 31,154 5,73 8,46 12,74 34,61 6,30 MLR 8,15 12,89 38,85 6,08 8,56 13,01 37,67 6,28 RBF 8,02 12,41 35,57 5,97 8,33 12,49 37,74 6,11 BRTree 5,93 7,73 26,07 3,87 11,18 17,90 48,05 8,75 Elman 7,37 11,35 38,55 5,61 8,64 12,93 35,37 6,47 SVM 7,79 12,05 37,17 5,84 8,37 12,57 39,63 6,06 Hybrid-MLP 7,85 12,15 33,48 5,83 8,38 12,68 35,90 6,06 Hybrid-MLR 8,14 12,63 38,17 6,08 8,24 12,40 37,07 6,08 Hybrid-RBF 8,14 12,63 38,07 6,07 8,23 12,38 36,52 6,06 Hybrid-BRTree 4,39 6,70 24,56 3,41 11,03 16,65 47,40 8,46 Hybrid-Elman 5,30 8,11 27,13 4,32 10,31 15,51 42,02 7,66 Hybrid-SVM 3,43 8,42 15,45 5,92 4,23 9,40 17,06 6,05 24 NGHIÊN CỨU KHOA HỌC Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 1(60).2018 Hình 7. Sai số học và sai số kiểm tra kết quả ước lượng thành phần phi tuyến với RHmin trong mô hình lai 4. KẾT LUẬN Khi ước lượng các bài toán phi tuyến, để giảm bớt mức độ phức tạp của giải pháp, mô hình hỗn hợp tách riêng thành phần tuyến tính và thành phần phi tuyến để xử lý. Thành phần tuyến tính được xác định thông qua việc sử dụng khai triển theo các giá trị kỳ dị (SVD). Thuật toán này cho phép xác định được hàm quan hệ tuyến tính giữa độ ẩm lớn nhất (hoặc thấp nhất) của một ngày và các ngày trước đó từ hệ các phương trình ước lượng xấp xỉ được viết dưới dạng ma trận có số hàng nhiều hơn số cột. Thành phần phi tuyến được xác định thông qua việc sử dụng mô hình mạng nơron khác nhau; Qua thực nghiệm cho thấy sai số học và sai số kiểm tra khi dự báo độ ẩm lớn nhất (RHmax) và thấp nhất (RHmin), kết quả thu được tốt nhất khi sử dụng mạng SVM. Vì vậy, ta thấy rằng ứng dụng mạng SVM trong mô hình hỗn hợp cho bài toán dự báo một số thông số thời tiết là phù hợp, sai số học và sai số kiểm tra ở mức trung bình, đặc biệt là sai số kiểm tra sẽ có giá trị tương đối ổn định; Kết quả sai số trung bình tuyệt đối khi dự báo là 3,35% (độ ẩm lớn nhất), 4,23% (độ ẩm nhỏ nhất). TÀI LIỆU THAM KHẢO [1]. Trần Hoài Linh (2009). Mạng nơron và ứng dụng trong xử lý tín hiệu. NXB Bách khoa. [2]. Nguyễn Quân Nhu (2009). Nghiên cứu và ứng dụng mạng nơron và logic mờ cho bài toán dự báo phụ tải điện ngăn hạn. Luận án tiến sĩ. [3]. Đỗ Văn Đỉnh, Đinh Văn Nhượng và Trần Hoài Linh (2015). Ứng dụng mô hình hỗn hợp trong ước lượng giá trị lớn nhất và nhỏ nhất của nhiệt độ môi trường ngày, Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng, số 11(96), quyển 2, trang 35-39. [4]. V. Vapnil (1995). Support-Vector Networks. Machine Learning, 20, 273-297. [5]. Parag P Kadu et al. Temperature Prediction System Using Back propagation Neural Network an Approch. International Journal of Computer Science & Communication Networks, Vol 2(1), pp. 61-64. [6]. Mohsen Hayati and Zahra Mohebi (2007). Temperature forecating based on neural network approach. World Applied Sciences Journal 2(6), pp. 613-620. [7]. H. Wang and D. Hu (2005). Comparison of SVM and ls-SVM for regression, in Neural Networks and Brain. ICNN&B’05. International Conference on, vol. 1. IEEE, pp. 279-283. [8]. Y.Radhika and M.Shashi (2009). Atmospheric Temperature Prediction using Support Vector Machines. International Journal of Computer Theory and Engineering, Vol. 1, No. 1, April 2009, pp. 55-58. [9]. Ani Shabri. Least Square Support Vector Machines as an Alternative Method in Seasonal Time Series Forecasting, Applied Mathematical Sciences, Vol. 9, 2015, no. 124, pp. 6207 - 6216. [10]. T. Joachims (1998). Making large-Scale Support Vector Machine Learning Practical, in Advances in Kernel Methods - Support Vector Learning. B. Schölkopf and C. Burges and A. Smola (ed.), MIT- Press, Cambridge, MA. [11]. D.E. Rumelhart; G.E. Hinton and R.J. Williams (1986). Learning internal representations by error propagation, Rumelhart, D.E. et al. (eds.). Parallel distributed processing: Explorations in the microstructure of cognition (Cambridge MA.: MIT Press), 318-362. [12]. R.A. Fisher (1936). The Use of Multiple Measurements in Taxonomic Problems. Annals of Eugenics, No 7, pp. 179-188. [13]. Dinh Do Van, Nhuong Dinh Van, Hoai Linh Tran (2016). Applications of SVM networks in hybrid model for environment parameters estimation. The 4th IEEE International Conference on Sustainable Energy Technologies (ICSET). November 14-16, Hanoi, Viet Nam, pp. 190-195.

Các file đính kèm theo tài liệu này:

  • pdfung_dung_mang_noron_svm_trong_mo_hinh_lai_du_bao_do_am_lon_n.pdf
Tài liệu liên quan