Ứng dụng mạng nơron nhân tạo dự báo phụ tải ngắn hạn hệ thống điện miền Bắc

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI ----------------------------------------- LUẬN VĂN THẠC SĨ KHOA HỌC ỨNG DỤNG MẠNG NƠRON NHÂN TẠO DỰ BÁO PHỤ TẢI NGẮN HẠN HỆ THỐNG ĐIỆN MIỀN BẮC NGÀNH: CễNG NGHỆ THễNG TIN MÃ SỐ: CHU NGHĨA Người hướng dẫn khoa học: PGS.TS. NGUYỄN ĐỨC NGHĨA HÀ NỘI 2007 1 Mục lục Danh mục các từ viết tắt ............................................................................. 3 Mở đầu.............................................

pdf125 trang | Chia sẻ: huyen82 | Lượt xem: 2322 | Lượt tải: 5download
Tóm tắt tài liệu Ứng dụng mạng nơron nhân tạo dự báo phụ tải ngắn hạn hệ thống điện miền Bắc, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
........................................................................ 4 CHƯƠNG I.................................................................................................................. 7 PHụ TảI Hệ THốNG ĐIệN MIềN BắC và bài toán dự báo...................... 7 1.1. Phụ tải Hệ thống điện miền Bắc .......................................................................7 1.1.1. Giới thiệu chung về HTĐ miền Bắc...........................................................7 1.1.2 Tầm quan trọng của dự báo phụ tải...........................................................10 1.1.3. Những yếu tố ảnh h−ởng đến phụ tải ngắn hạn .......................................11 1.1.4. Mục tiêu và phạm vi nghiên cứu dự báo phụ tải ......................................15 1.2. Bài toán dự báo phụ tải ...................................................................................16 1.2.1. Đặc điểm đồ thị phụ tải HTĐ miền Bắc...................................................16 1.2.2. Dự báo phụ tải ngắn hạn cho 24h tiếp theo..............................................19 CHƯƠNG II .............................................................................................................. 23 Tổng quan Về MạNG NƠRON NHÂN TạO .................................................. 23 2.1. Lịch sử phát triển của mạng nơron nhân tạo...................................................23 2.2. Cơ sở lý thuyết mạng nơron............................................................................26 2.3. Bộ não và nơron sinh học ...............................................................................27 2.4 Mô hình mạng nơron nhân tạo.........................................................................30 2.4.1 Mô hình một nơron nhân tạo ....................................................................30 3.4.2. Mô hình mạng nơron nhân tạo.................................................................33 Ch−ơng III ............................................................................................................. 40 ứng dụng mạng nơron ánh xạ đặc tr−ng tự tổ chức Kohonen trong bài toán phân loại ngày.............................................................. 40 3.1. Sự cần thiết phân loại đồ thị phụ tải................................................................40 3.1.1. Tập hợp các kiểu đồ thị phụ tải đặc tr−ng ................................................40 3.1.2. Sự cần thiết phân loại ngày bằng ph−ơng pháp mạng nơron....................42 3.2. Mạng nơron ánh xạ đặc tr−ng tự tổ chức Kohonen ........................................43 3.2.1. Cấu trúc mạng ..........................................................................................44 3.2.2. Huấn luyện mạng .....................................................................................45 3.2.3. Sử dụng mạng...........................................................................................47 3.3. Xây dựng mạng Kohonen để phân loại ngày..................................................48 3.3.1. Thiết kế cấu trúc mạng.............................................................................48 3.3.2. Huấn luyện mạng .....................................................................................49 3.3.3. Xây dựng cấu trúc phần mềm mô phỏng mạng Kohonen phân loại ngày. ...........................................................................................................................52 3.3.4. Kết quả sử dụng mạng Kohonen phân loại ngày .....................................52 3.3.5. Phân tích kết quả phân loại ngày trong tháng 2/2006, tháng 5/2006.......54 CHƯƠNG iV............................................................................................................. 58 2 ứNG DụNG MạNG NƠRON NHIềU LớP LAN TRUYềN NGƯợC SAI Số Dự BáO PHụ TảI Ngắn hạn THEO NHIệT Độ MÔI TRƯờNG.......................... 58 4.1 Các khái niệm cơ bản về mạng nơron nhiều lớp lan truyền ng−ợc sai số (Back propagation neural network). .................................................................................58 4.1.1 Kiến trúc mạng truyền thẳng. ...................................................................59 4.1.2. Huấn luyện mạng .....................................................................................60 4.1.3. Sử dụng mạng...........................................................................................64 4.1.4. Nghiên cứu sự hội tụ và độ phức tạp của quá trình huấn luyện mạng. ....64 4.1.5. Một số vấn đề về mạng nơron nhiều lớp. .................................................67 4.2. ứng dụng mạng nơron nhiều lớp lan truyền ng−ợc sai số xây dựng bài toán dự báo phụ tải hệ thống điện.......................................................................................68 4.2.1. Các b−ớc xây dựng bài toán dự báo phụ tải. ............................................68 4.2.2. Xây dựng cấu trúc phần mềm mô phỏng mạng nơron lan truyền ng−ợc sai số ứng dụng trong bài toán dự báo đỉnh và đáy đồ thị phụ tải. ..........................72 4.2.3 Dự báo phụ tải cho 24 giờ trong ngày.......................................................85 CHƯƠNG V .............................................................................................................. 99 Hệ thống phần mềm dự báo phụ tải ngắn hạn cho hệ thống điện miền bắc..................................................................................................... 99 5.1. Giới thiệu về cơ sở dữ liệu. .............................................................................99 5.2. Đặc tả các chức năng ....................................................................................100 5.2.1. Truy vấn dữ liệu.....................................................................................100 5.2.2. Phân loại dữ liệu ....................................................................................101 5.2.3 Chuẩn hoá dữ liệu...................................................................................101 5.2.4 Huấn luyện mạng....................................................................................101 5.2.5 Dự báo phụ tải.........................................................................................101 5.3 H−ớng dẫn sử dụng........................................................................................102 5.3.1 Truy vấn dữ liệu......................................................................................102 5.3.2 Phân loại dữ liệu .....................................................................................103 5.3.3 Chuẩn hoá dữ liệu...................................................................................103 5.3.4 Huấn luyện mạng....................................................................................104 5.3.5 Dự báo ....................................................................................................104 CHƯƠNG vI........................................................................................................... 106 so sánh với một số kết quả đ∙ có và Đánh giá kết quả.......... 106 6.1. So sánh với một số ph−ơng pháp đã có.........................................................106 6.2. Đánh giá kết quả..........................................................................................111 KếT LUậN ............................................................................................................. 114 Tài liệu tham khảo....................................................................................... 116 Phụ lục i ............................................................................................................. 118 Phụ lục II ............................................................................................................ 120 Tóm tắt luận văn.......................................................................................... 123 Summary ............................................................................................................ 124 3 Danh mục các từ viết tắt ANN Mạng nơron nhân tạo DBPT Dự báo phụ tải HTĐ Hệ thống điện HTĐ1 Trung tâm Điều độ Hệ thống điện miền Bắc MSE Trung bình tổng bình ph−ơng sai số SSE Tổng bình ph−ơng sai số CNTT Công nghệ thông tin ĐTPT Đồ thị phụ tải 4 Mở đầu Trong những năm gần đây, do nhu cầu năng l−ợng không ngừng biến đổi và tăng lên rõ rệt theo thời gian nên ngành Điện lực đã và đang xây dựng rất nhiều các nhà máy điện để đáp ứng nhu cầu tiêu thụ điện năng trong cả n−ớc. Vì vậy, một trong những vấn đề quan trọng mà ngành Điện lực cần phải giải quyết tốt là bài toán dự báo phụ tải ngắn hạn và dài hạn. Cho đến nay tuy đã có nhiều ph−ơng pháp luận trong việc giải quyết bài toán dự báo, song bài toán này luôn là một bài toán khó. Hiện nay, trong ngành Điện lực Việt Nam bài toán dự báo phụ tải đ−ợc giải quyết chủ yếu nhờ sử dụng các ph−ơng pháp dự báo truyền thống mang tính kinh nghiệm thuần tuý. Trong số các h−ớng nghiên cứu nhằm triển khai các hệ thống thông minh ở giai đoạn tới, mạng nơron giữ một vai trò quan trọng trong việc phát triển các giải pháp nhận dạng, dự báo…Mạng nơron nhân tạo là kỹ thuật xử lý thông tin có triển vọng ứng dụng trong việc giải quyết bài toán dự báo. Kết hợp chặt chẽ với logic mờ, mạng nơron nhân tạo có thể giúp giải quyết hiệu quả hơn các bài toán phức tạp. Nhờ các −u điểm nh− có cấu trúc xử lý song song, khả năng học và ghi nhớ, khả năng tự tổ chức và tổng quát hoá, mạng nơron nhân tạo ANN (Artificial Newal Networks) đã đ−ợc nghiên cứu và ứng dụng thành công trong rất nhiều lĩnh vực nh− xấp xỉ hàm nhận dạng mẫu, dự báo… Luận văn này chủ yếu tập trung tìm hiểu về mạng nơron nhân tạo và nghiên cứu ứng dụng giải quyết bài toán dự báo phụ tải ngắn hạn cho hệ thống điện miền Bắc. Mục đích của luận văn là phát triển các ph−ơng pháp để giải bài toán dự báo phụ tải ngắn hạn. Đối t−ợng cụ thể của nghiên cứu là dự báo phụ tải cho 24 giờ sau nhằm đ−a ra các thông số cần thiết cho công tác vận hành và lập ph−ơng thức điều hành hệ thống điện. Luận văn bao gồm sáu ch−ơng và hai phụ lục. 5 Ch−ơng I – Phụ tải hệ thống điện miền Bắc và bài toán dự báo: Trình bày tổng quan về HTĐ miền Bắc. Phát biểu bài toán dự báo phụ tải, nêu phạm vi, tầm quan trọng của bài toán, các yếu tố ảnh h−ởng đến phụ tải ngắn hạn. Ch−ơng II – Tổng quan về mạng nơron nhân tạo: Trình bày các khái niệm cơ bản về mạng nơron nhân tạo: cơ sở lý thuyết và mô hình mạng. Ch−ơng III – ứng dụng mạng nơron ánh xạ đặc tr−ng tự tổ chức Kohonen trong bài toán phân loại ngày: Trình bày các khái niệm cơ bản về mạng nơron ánh xạ đặc tr−ng tự tổ chức Kohonen, đề xuất cấu trúc mạng để giải quyết bài toán, xây dựng cấu trúc phần mềm và phân tích đánh giá kết quả đạt đ−ợc. Ch−ơng IV – ứng dụng mạng nơron nhiều lớp lan truyền ng−ợc sai số trong bài toán dự báo phụ tải theo nhiệt độ môi tr−ờng: Trình bày các khái niệm cơ bản về mạng nơron nhiều lớp lan truyền ng−ợc sai số, đ−a ra các b−ớc xây dựng bài toán, đề xuất cấu trúc mạng, xây dựng cấu trúc phần mềm, đánh giá kết quả và so sánh với một số ph−ơng pháp đã có. Ch−ơng V - Hệ thống phần mềm dự báo phụ tải ngắn hạn cho Hệ thống điện miền Bắc: Giới thiệu về cơ sở dữ liêụ, đặc tả các chức năng của hệ thống và h−ớng dẫn sử dụng phần mềm. Ch−ơng VI - So sánh với một số kết quả đã có và đánh giá kết quả: So sánh ph−ơng pháp dự báo phụ tải ngắn hạn của Hệ thống điện miền Bắc sử dụng mạng nơron nhân tạo với một số ph−ơng pháp dự báo truyền thống. Đánh giá kết quả đạt đ−ợc và khả năng ứng dụng của phần mềm. Phụ lục I – Phần mềm mô phỏng mạng Kohonen trong bài toán phân loại kiểu ngày. 6 Phụ lục II – Phần mềm mô phỏng mạng nơron lan truyền ng−ợc sai số ứng dụng trong bài toán dự báo đỉnh và đáy đồ thị phụ tải. Em xin chân thành cảm ơn PGS.TS Nguyễn Đức Nghĩa đã h−ớng dẫn và cho em những ý kiến quý báu, em xin chân thành cảm ơn các thầy cô giáo khoa Công nghệ Thông tin – Tr−ờng Đại học Bách khoa Hà Nội đã trang bị kiến thức giúp em hoàn thành luận văn này. 7 CHƯƠNG I PHụ TảI Hệ THốNG ĐIệN MIềN BắC và bài toán dự báo Ch−ơng này đề cập đến các vấn đề sau: • Giới thiệu chung về HTĐ miền Bắc • Tầm quan trọng của dự báo phụ tải • Những yếu tố ảnh h−ởng đến phụ tải ngắn hạn • Mục tiêu và phạm vi nghiên cứu dự báo phụ tải • Đặc điểm đồ thị phụ tải HTĐ miền Bắc • Dự báo phụ tải ngắn hạn cho 24h tiếp theo 1.1. Phụ tải Hệ thống điện miền Bắc 1.1.1. Giới thiệu chung về HTĐ miền Bắc Ranh giới của Hệ thống điện miền Bắc đ−ợc tính từ Hà tĩnh trở ra, là một vùng có vị trí địa lý t−ơng đối phức tạp, trải dài và nằm sát bờ biển, có nhiều đồi núi, có nhiều vùng khí hậu khác nhau, kinh tế các khu vực trên toàn miền Bắc phát triển không đồng đều dẫn đến công suất phụ tải ở các khu vực có sự chênh lệch lớn. Phụ tải chủ yếu tập trung ở vùng đồng bằng, các thành phố lớn có công nghiệp phát triển. Tại những vùng này phụ tải cao điểm và thấp điểm chênh lệch nhau không lớn lắm Pmin/Pmax khoảng 0.7 do phụ tải công nghiệp tại các khu vực này phát triển. Đối với những vùng miền núi hoặc sản xuất nông nghiệp, công nghiệp không phát triển thì Pmin/Pmax khoảng 0.3 do phụ tải vào cao điểm chủ yếu là phụ tải sinh hoạt, điều nay gây khó khăn rất lớn trong vận hành kinh tế hệ thống điện. Vào thấp điểm của hệ thống ta không khai thác cao đ−ợc các nguồn điện rẻ tiền còn vào cao điểm của hệ thống ta phải chạy các nguồn điện đắt tiền để phủ đỉnh, có khi còn phải hạn chế phụ tải vào cao điểm do nguồn điện không đáp ứng đ−ợc nhu cầu của phụ tải. Các thành phần cấu thành phụ tải đ−ợc thể hiện ở biều đồ sau: 8 Trên biểu đồ ta thấy phụ tải Quản lý & Tiêu dùng dân c−, Công nghiệp & xây dựng chiếm tỷ trọng lớn, đến 90% tổng công suất phụ tải. Theo thống kê, mức độ tăng tr−ởng phụ tải hệ thống điện từ năm 2001 – 2005 là rất cao. Bảng 1.1 và bảng 1.2 d−ới đây thể hiện tốc độ tăng tr−ởng phụ tải về sản l−ợng của các năm trên. Bảng 1.1: Sản l−ợng điện tiêu thụ của HTĐ miền Bắc từ năm 2001-2005 2001 2002 2003 2004 2005 HTĐ miền Bắc 10.765.767,2 12.251.947,5 14.215.228,6 16.008.894,1 18.057.297,9 Cty I 7.042.600,7 8.125.911,1 9.573.472,8 10.857.462,9 12.292.387,7 Hà Nội 2.777.100,4 3.079.711 3.486.549 3.879.340,1 4,329.367,2 Hải Phòng 946.066,1 1.046.325,4 1.155.206,9 1.272.091,1 1.415.610,8 Hình 1.1. Biểu đồ các thành phần cấu thành nên phụ tải Công nghiệp và xây dựng 45.20% Th−ơng nghiệp & KSNH 4.49% Quản lý & Tiêu dùng dân c− 44.59% Nông nghiệp và thuỷ sản 1.40% Các hoạt động khác 4.32% 9 Bảng 1.2: Tốc độ tăng tr−ởng phụ tải 2002 2003 2004 2005 HTĐ Bắc 13,84% 16,02% 12,62% 12,8% Cty I 15,38% 17,81% 13,41% 13,22% Hà Nội 10,89% 13,21% 11,27% 11,6% Hải Phòng 10,6% 10,41% 10,12% 11,28% Do điện năng của Quản lý & Tiêu dùng dân c− là rất lớn nên chênh lệch công suất giữa giờ cao điểm và thấp điểm rất lớn (khoảng 2-3 lần) và phụ thuộc rất nhiều vào thời tiết, gây ảnh h−ởng lớn đến việc khai thác tối −u các nguồn điện. Phụ tải cao điểm là nhân tố quyết định việc huy động nguồn điện trong khi đó phụ tải thấp điểm lại giữ vai trò quan trọng trong việc quyết định phối hợp và điều chỉnh các nguồn điện nhằm đảm bảo vận hành kinh tế. Do đó việc dự báo chính xác phụ tải có ý nghĩa hết sức quan trọng trong bài toán vận hành kinh tế hệ thống điện cũng nh− cải tạo, thiết kế hệ thống cung cấp điện, giảm thiểu đ−ợc tổn thất công suất và điện năng. Đặc biệt việc dự báo phụ tải cao điểm chính xác mang lại lợi ích và hiệu suất sử dụng năng l−ợng cho khách hàng, tránh trình trạng thiếu công suất giờ cao điểm. Do đó phụ tải cao điểm và thấp điểm chính là hai giá trị đặc biệt trên đồ thị phụ tải ngày và là mối quan tâm hàng đầu của ng−ời lập quy hoạch và thiết kế hệ thống điện. Khi phụ tải thấp thì tỉ lệ tổn thất tăng do tổn hao không tải. 10 1.1.2 Tầm quan trọng của dự báo phụ tải Nh− chúng ta biết tháng 5/2005 sản l−ợng điện tiêu thụ đột biến trong khi đó nguồn tài nguyên n−ớc tại thời điểm đó bị thiếu hụt dẫn đến ảnh h−ởng lớn đến nền kinh tế Việt Nam. Vì vậy dự báo phụ tải điện đóng vai trò hết sức quan trọng đối với việc quy hoạch, đầu t−, phát triển nguồn điện và vận hành hệ thống điện. Nhu cầu tiêu thụ điện năng phụ thuộc vào khả năng phát triển của nền kinh tế quốc dân. nếu dự báo phụ tải quá thấp so với nhu cầu thực tế thì dẫn đến kết quả nguồn dự phòng thấp, không đáp ứng đầy đủ nhu cầu điện cho sản xuất công nghiệp và tiêu dùng, còn nếu dự báo phụ tải quá cao sẽ phải huy động các nguồn đắt tiền gây lãng phí cho nền kinh tế n−ớc nhà. Dự báo phụ tải dài hạn (khoảng 10-20 năm) nhằm mục đích cung cấp dữ liệu cho công tác quy hoạch và đầu t− phát triển HTĐ. Còn dự báo phụ tải ngắn hạn (trong vòng 30 ngày) có nhiệm vụ đảm bảo vận hành hệ thống điện an toàn và kinh tế. Đối với dự báo dài hạn có tính chất chiến l−ợc thì chỉ nêu lên những ph−ơng h−ớng phát triển chủ yếu mà không yêu cầu xác định chỉ tiêu cụ thể. Các chức năng quan trọng trong kế hoạch vận hành HTĐ nh− phân phối nguồn một cách kinh tế, hiệu quả, lên kế hoạch bảo d−ỡng và sửa chữa, th−ờng đ−ợc thực hiện nhờ việc dự báo phụ tải, vì vậy dự báo phụ tải đóng vai trò đặc biệt quan trọng đối với điều độ viên, những ng−ời hoạch định kế hoạch, lên ph−ơng thức vận hành HTĐ. Trong công tác vận hành, việc lập ph−ơng thức ngày, ph−ơng thức tuần của Trung tâm Điều độ, hay dự báo phụ tải báo tr−ớc một giờ, một ngày, một tuần là những công việc tối cần thiết. Những ph−ơng thức vận hành cơ bản trong ngày nh− huy động nguồn, phối hợp nguồn, truyền tải công suất giữa các miền, giải quyết các công tác sửa chữa trên l−ới điện và đánh giá mức độ an toàn HTĐ đều đòi hỏi phải có dự báo phụ tải t−ơng đối chính xác. 11 Trong thực tế vận hành HTĐ Việt Nam nói chung và HTĐ miền Bắc nói riêng, phụ tải cao điểm (phụ tải cao nhất trong ngày Pmax) và thấp điểm (phụ tải thấp nhất trong ngày Pmin) là hai điểm đặc biệt trong đồ thị phụ tải ngày và đ−ợc quan tâm nhiều nhất trong vận hành. Phụ tải cao điểm quyết định việc huy động các nguồn nhiệt điện, tua-bin khí, diesel dự phòng nhằm đảm bảo đủ nguồn phủ đỉnh và dự phòng nóng, tăng độ an toàn cung cấp điện. Phụ tải thấp điểm quyết định việc phối hợp và điều chỉnh các nguồn tua-bin khí, nhiệt điện, thủy điện nhằm đảm bảo vận hành kinh tế, tránh nhà máy thuỷ điện Hoà Bình vận hành trong vùng công suất không cho phép về kỹ thuật, trong đó dự báo phụ tải lúc cao điểm Pmax là quan trọng nhất trong ngày. Dự báo chính xác phụ tải cao điểm có hiệu quả lớn về kinh tế vào mùa lũ khi cần khai thác tối đa nguồn thủy điện, trong khi n−ớc các hồ chứa đang xả thì các nguồn điện khác huy động chỉ nhằm mục đích an toàn, bù điện áp và phủ đỉnh. Nếu sai số dự báo phụ tải lúc cao điểm giảm 2%, Điều độ Quốc Gia (ĐĐQG) có thể tiết kiệm đ−ợc khoảng 80 MW nguồn tuabin khí chạy dầu đắt tiền chạy phủ đỉnh lúc cao điểm, góp phần đáng kể vào việc tăng hiệu quả vận hành HTĐ và tiết kiệm đ−ợc hàng trăm triệu đồng trên mỗi giờ cho ngành điện nói riêng và cho cả nền kinh tế Quốc dân nói chung. Hạn chế phụ tải lúc cao điểm cũng th−ờng xảy ra trong mùa lũ khi thiếu nguồn phủ đỉnh. Tính chính xác đ−ợc l−ợng công suất thiếu để chủ động cắt phụ tải những khu vực không quan trọng, tránh cắt thừa hoặc cắt thiếu, tránh sa thải phụ tải do bảo vệ tần số thấp tác động cũng có ý nghĩa lớn trong vận hành, giảm thiệt hại do cắt điện. 1.1.3. Những yếu tố ảnh h−ởng đến phụ tải ngắn hạn Để tìm ra đ−ợc ph−ơng pháp dự báo tối −u đối với bài toán dự báo phụ tải ngày của HTĐ miền Bắc với sai số nhỏ, ta cần xác định đ−ợc các yếu tố ảnh h−ởng đến phụ tải ngày, ví dụ: thứ của các ngày trong tuần, ngày lễ, các 12 Hình 1.2. Đồ thị phụ tải các ngày đặc tr−ng trong tuần Đồ thị phụ tải 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Giờ C ô n g s u ất Thứ 5 Thứ 2 CN đặc điểm của ngày cần dự báo, nh− nhiệt độ trong ngày… Chính vì vậy để nâng cao độ chính xác của quá trình dự báo phụ tải ta cần phải xét đến các yếu tố chủ yếu ảnh h−ởng đến phụ tải. Qua thực tế vận hành cho thấy phụ tải của l−ới điện Việt Nam nói chung và miền Bắc nói riêng phụ thuộc chủ yếu vào các yếu tố chính sau: 1. Thứ của ngày trong tuần Có quy luật giữa phụ tải và ngày trong tuần - Phụ tải thấp nhất trong đêm thứ 2 - Đồ thị phụ tải các ngày làm việc th−ờng có dạng giống nhau - Phụ tải ngày nghỉ cuối tuần giảm. 2. Các ngày đặc biệt trong năm 13 Ngày đặc biệt trong năm nh− các ngày lễ tết, 30/4, 1/5, 2/9... phụ tải các ngày này giảm đáng kể so với ngày th−ờng. Phụ tải các ngày sát với các ngày này cũng bị ảnh h−ởng, ta có thể thấy rõ điều đó trên đồ thị phụ tải HTĐ miền Bắc ngày lễ 1/5/2006 và ngày làm việc bình th−ờng 3/5/2006. Dự báo phụ tải trong các ngày đặc biệt không đ−ợc áp dụng nh− ngày thông th−ờng mà phải tách biệt bằng ph−ơng pháp riêng dựa vào sự thay đổi phụ tải của các ngày này so với các ngày dạng này của các năm tr−ớc đó. 3. Thời tiết trong ngày. Bao gồm các thông số tự nhiên: nhiệt độ, độ ẩm, tốc độ gió, c−ờng độ sáng, trong đó nhiệt độ có ảnh h−ởng lớn nhất, nhiệt độ tăng thì phụ tải tăng và ng−ợc lại vì n−ớc ta là n−ớc nhiệt đới. Chỉ có tr−ờng hợp đặc biệt ở miền Bắc khi nhiệt độ quá lạnh, phụ tải tăng do sử dụng các thiết bị s−ởi ấm. Đồ thị phụ tải 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Giờ C ô n g s u ất Ngày 3/5 Ngày 1/5 Hình 1.3. Đồ thị phụ tải HTĐ miền Bắc hai ngày 1/5, 3/5 14 4. Truyền hình trực tiếp các sự kiện thể thao văn hoá Công suất tiêu thụ vào các giờ tuyền hình trực tiếp bóng đá quốc tế, giải bóng đá có đội tuyển Việt Nam tham gia tăng đột ngột từ 150 - 200 MW. Các điều độ viên th−ờng dự báo phụ tải những ngày này theo kinh nghiệm những ngày t−ơng tự tr−ớc đó. Ví dụ: khi dự báo đồ thị phụ tải ngày có truyền hình trực tiếp Worldcup 2006, ta dựa vào đồ thị phụ tải trong ngày cũng có truyền hình trực tiếp Worldcup 2006 tr−ớc đó để dự báo. Đồ thị phụ tải 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Giờ C ôn g su ất Đờm khụng cú WC Đờm cú WC Hình 1.5. Đồ thị phụ tải HTĐ miền Bắc có truyền hình trực tiếp Worldcup 2006 và ngày bình th−ờng. Đồ thị phụ tải 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Giờ C ôn g su ất 26-33 độ 18 –26 độ Hình 1.4. Đồ thị phụ tải ngày hai ngày có nhiệt độ khác 15 5. Kế hoạch sửa chữa lớn trong ngày có cắt điện. Trong quá trình thực hiện kế hoạch sửa chữa lớn, nh− cắt điện đ−ờng dây đang vận hành để kéo đ−ờng dây mới, sửa chữa trạm 220Kv, 500Kv phải cắt tải diện rộng dẫn đến điện năng tiêu thụ vào các ngày này giảm một cách đáng kể. Dự báo phụ tải những ngày này phải tính toán khấu trừ phụ tải giảm do ngừng cung cấp điện. Dạng của đồ thị phụ tải trong ngày có cắt điện diện rộng cũng mang đặc thù riêng, thay đổi tuỳ thuộc vào thời gian, vùng , miền cắt điện. Qua quá trình vận hành thực tế và dữ liệu thống kê, các điều độ viên, các chuyên viên chuyên phân tích về phụ tải hệ thống điện đi đến kết luận: Nhiệt độ môi tr−ờng, đặc thù của các ngày trong tuần, ngày lễ, ngày tết là các yếu tố ảnh h−ởng lớn nhất đến giá trị phụ tải ngày. 1.1.4. Mục tiêu và phạm vi nghiên cứu dự báo phụ tải • Mục tiêu của luận văn Nghiên cứu áp dụng kỹ thuật mạng nơron để dự báo phụ tải cao điểm (Pmax), thấp điểm đêm (Pmin) và phụ tải ngày (24 giờ) của HTĐ miền Bắc theo dữ liệu phụ tải quá khứ, nhiệt độ môi tr−ờng và một số các yếu tố ảnh h−ởng khác. • Phạm vi nghiên cứu. Dự báo luôn giữ vai trò quan trọng trong nhiều lĩnh vực, quyết định kế hoạch sản xuất, h−ớng đầu t− phát triển trong t−ơng lai do đó có rất nhiều các mô hình toán học áp dụng cho dự báo. Cũng nh− các dự báo khác, dự báo phụ tải ngày cũng phải dựa vào dữ liệu thống kê, phân tích và áp dụng thuật toán để xác định mối quan hệ giữa phụ tải và các yếu tố ảnh h−ởng, từ đó dự báo phụ tải dựa trên các yếu tố ảnh h−ởng đó. 16 Tr−ớc đây, các mô hình toán học truyền thống hay đ−ợc áp dụng cho dự báo nh−: hồi qui tuyến tính (linear regression), san bằng hàm mũ (exponential smoothing), san trung bình (moving averages), hệ số ngẫu nhiên (stochatic) .... Gần đây, với sự phát triển của việc nghiên cứu một số thuật toán dựa trên trí tuệ của con ng−ời (artificial intelligence), mạng nơron nhân tạo (artificial neural networks) đã đ−ợc áp dụng trong dự báo và đ−ợc đánh giá cao. Đây là mô hình phi tuyến với nhiều −u điểm và đang đ−ợc áp dụng rộng rãi. Mạng nơron nhân tạo đ−ợc xây dựng trên cơ sở mô phỏng hoạt động của hệ thống nơron thần kinh sinh học do đó mạng nơron nhân tạo có một số đặc điểm nh− bộ não con ng−ời, đó là khả năng học đ−ợc những gì đã đ−ợc dạy. Quá trình học này đ−ợc gọi là quá trình huấn luyện. Trong quá trình này các mẫu thể hiện quan hệ giữa các biến ngẫu nhiên đ−ợc đ−a vào trong mạng nơron, mạng nơron sẽ nhận biết đ−ợc quan hệ giữa các biến ngẫu nhiên đó sau khi kết thúc quá trình huấn luyện. Chính do đặc điểm này mà mạng nơron đ−ợc ứng dụng rất nhiều trong lĩnh vực dự báo. Đặc biệt đối với bài toán dự báo phụ tải ngắn hạn thì đây là mô hình đ−ợc đánh giá cao hơn hẳn các mô hình tr−ớc đó và hiện nay mô hình này đang đ−ợc áp dụng phổ biến ở một số n−ớc phát triển trong dự báo phụ tải . Nghiên cứu ph−ơng pháp dự báo phụ tải ngày là nghiên cứu và áp dụng các ph−ơng pháp toán học để tìm quan hệ giữa phụ tải ngày và các yếu tố chủ yếu ảnh h−ởng đến phụ tải ngày. Thuật toán áp dụng cho dự báo phụ tải theo nhiệt độ phải dựa trên dự báo thời tiết ngày hôm sau gồm các thông tin nh−: nhiệt độ cao nhất và thấp nhất trong ngày, nắng hay m−a, giông bão ... 1.2. Bài toán dự báo phụ tải 1.2.1. Đặc điểm đồ thị phụ tải HTĐ miền Bắc Phụ tải của HTĐ miền Bắc có các thành phần điện Quản lý & Tiêu dùng dân c− và Công nghiệp & xây dựng chiếm tỷ trọng lớn. Bảng 1.3 thống kê sản 17 l−ợng tiêu thụ của từng ngành trong ba năm 2003 đến 2005. Có thể nhận thấy rằng, tỉ trọng điện tiêu thụ trong quản lý & tiêu dùng dân c− rất lớn làm chế độ tiêu thụ điện năng xấu đi, hệ số phụ tải giảm, gây nhiều khó khăn cho việc đảm bảo an toàn cung cấp điện. Bảng 1.3 Tỉ trọng sản l−ợng điện tiêu thụ của các thành phần kinh tế Năm Tiêu dùng dân c− Công nghiệp & xây dựng Nông lâm nghiệp Th−ơng nghiệp Khác 2003 45,32% 44,2% 1,41% 4,52% 4,55% 2005 44,59% 45,2% 1,4% 4,49% 4,32% 2006 44,31% 45,91 1,42 4,38 3,98 Đồ thị phụ tải ngày của HTĐ miền Bắc đ−ợc xây dựng theo giá trị phụ tải 24h trong ngày. Trên hình 1.6 là đồ thị hai ngày làm việc bình th−ờng vào mùa đông và mùa hè. Đồ thị phụ tải biến đổi theo từng giờ, phụ tải cao nhất trong ngày (Pmax) lớn hơn rất nhiều so với phụ tải thấp nhất trong ngày (Pmin). Cao điểm tr−a th−ờng xảy ra 10h-11h, cao điểm chiều th−ờng xảy ra 18h-19h. Thấp điểm th−ờng xảy ra vào ban đêm trong khoảng 3h-4h vào mùa hè, 2h-3h vào mùa đông. Đồ thị của những ngày mùa hè th−ờng đồng đều hơn mùa đông, chứng tỏ sản l−ợng điện sinh hoạt tiêu thụ rất lớn so với các ngành khác. 18 Trong quá trình vận hành của điều độ, phụ tải cao điểm (Pmax) và phụ tải thấp điểm (Pmin) là hai điểm quan trọng nhất trong ngày. Phụ tải cao điểm và thấp điểm quyết định huy động nguồn và điều chỉnh phối hợp nguồn thuỷ điện, nhiệt điện, diesel… • Vào thời điểm cao điểm Điều độ Quốc Gia phải huy động các nguồn điện đắt tiền nh− các nhà máy diesel, tua bin khí cho việc khởi động và nâng công suất, trong tr−ờng hợp sự cố thiếu nguồn, điều độ viên cần phải dự báo công suất thiếu để chuẩn bị tr−ớc ph−ơng án cắt tải sau đó phối hợp với các điều độ miền phân bổ các công suất cần phải cắt cho các Điều độ l−ới điện phân phối. Cắt tải có chuẩn bị tr−ớc sẽ ít gây thiệt hại về kinh tế hơn cắt tải do rơ le tần số thấp tác động. Đặc biệt rất đảm bảo an toàn đối với các nhà máy sản xuất công nghiệp nặng. • Vào giờ thấp điểm. (phụ tải th−ờng thấp hơn giờ cao điểm 2-3 lần) Cần điều chỉnh cắt giảm các nguồn điện đắt tiền nh− nguồn tua bin khí chạy dầu, nhiệt điện sao cho thoả mãn chỉ tiêu kinh tế. Nếu dự báo càng chính xác Pmin, Pmax, thì có thể huy động và điều chỉnh nguồn hợp lý, dẫn đến vận hành hệ thống an toàn, hiệu quả và kinh tế hơn. Đ ồ th ị phụ tải 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 G iờ C ô n g s u ất 14/12/2005 11/07/2006 Hình 1.6. ĐTPT hai ngày làm việc vào mùa đông và mùa hè 19 1.2.2. Dự báo phụ tải ngắn hạn cho 24h tiếp theo Dự báo phụ tải l−ới điện cho 24h tiếp theo nhằm đ−a ra các giá trị phụ tải dự báo theo từng giờ của ngày tiếp theo sát với thực tế vận hành, trong đó giảm sai số là vấn đề mang tính chiến l−ợc trong quá trình dự báo. Trong quá trình phân tích, so sánh đồ thị phụ tải của miền Bắc và các miền khác trong một thời gian dài cho thấy kiểu đồ thị phụ tải ngày chủ yếu bị ảnh h−ởng bởi thói quen tổ chức sinh hoạt, cách phân công sắp xếp công việc của khách hàng, từ đó ta thấy ĐTPT có mối liên quan chặt chẽ với môi tr−ờng hoạt động, ngày làm việc, ngày nghỉ, lễ, tết,… của cả cộng đồng dân c−. Còn đáy và đỉnh phụ tải là hàm của biến thời tiết nh− nhiệt độ, l−ợng m−a, độ ẩm… Bài toán dự báo phụ tải HTĐ có thể chia thành hai bài toán nhỏ: • Bài toán dự báo đỉnh và đáy ĐTPT ngày cần dự báo • Bài toán xác định dạng ĐTPT ngày cần dự báo 1.2.2.1. Các dạng của đồ thị phụ tải Xét đồ thị phụ tải HTĐ trên hình 1.7, đây là đồ thị phụ tải của Công ty điện lự._.c I các ngày 14/5/2006 (chủ nhật) và ngày 15/5/2006 (Thứ hai) đ−ợc xây dựng theo giá trị phụ tải 24h trong ngày. ĐTPT hai ngày điễn hình này có dạng t−ơng tự nh− ĐTPT ngày của HTĐ miền Bắc, ta thấy các giá trị phụ tải phân bố trên ĐTPT không đồng đều. Đặc biệt độ chênh lệch giữa hai giá trị Pmax và Pmin là rất lớn. 20 CN 14/05/2006 T2 15/05/2006 - Gọi giá trị phụ tải đỉnh là Pmax - Gọi giá trị phụ tải đáy là Pmin - Gọi giá trị phụ tải giờ thứ i là P(i) với i=1ữ24 ứng với 24h trong ngày Ta cần đ−a ĐTPT trên về dạng ĐTPT ngày chuẩn, muốn vậy ta phải quy chuẩn hoá phụ tải của từng giờ theo công thức sau: Pn(i)= minmax min)( PP PiP − − (1.1) Pn(i): là phụ tải quy chuẩn hoá của giờ thứ i. Dựa vào công thức trên ta tính đ−ợc giá trị phụ tải quy chuẩn hoá của 24h trong ngày, đồ thị này còn đ−ợc gọi là véctơ ĐTPT. Đặt véctơ ĐTPT là P, ta có: P = [p1 , p2, … , pi , … , p24] T (1.2) Pn(i) =[Pn(1), Pn(2), … ,Pn(i), … , Pn(24)] T (1.3) Với Pn(i) là phụ tải đ−ợc quy chuẩn hoá của giờ thứ i. Đ ồ th ị p h ụ tả i 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 G iờ C ô n g s u ất Hình 1.7. ĐTPT hai ngày điển hình (CN,T2) của Cty điện lực I 21 Đ ồ th ị p h ụ tả i 0 .0 0 .1 0 .2 0 .3 0 .4 0 .5 0 .6 0 .7 0 .8 0 .9 1 .0 0 1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 2 1 2 2 2 3 2 4 G iờ C ô n g s u ất CN 14/05/2006 T2 15/05/2006 Hình 1.8. ĐTPT hai ngày (CN,T2) của Cty điện lực I đã chuẩn hoá. Hình 1.8 là ĐTPT ngày đ−ợc chuẩn hoá theo biến i và Pn(i). ĐTPT đã đ−ợc quy chuẩn vẫn giữ nguyên dạng biến thiên ban đầu, các giá trị đ−ợc quy chuẩn nằm trong khoảng từ 0 ữ1, với Pnmax=1, Pnmin= 0. 1.2.2.2 Đỉnh và đáy của đồ thị phụ tải. Hai giá trị phụ tải đặc biệt trong ngày mà đ−ợc các kỹ s− vận hành cũng nh− ng−ời làm ph−ơng thức ngày quan tâm nhiều nhất đó là, phụ tải cao điểm và phụ tải thấp điểm. Đây cũng chính là mục tiêu quan trọng hàng đầu trong bài toán dự báo phụ tải điện. Tính kinh tế, hiệu quả, ph−ơng thức vận hành, cũng nh− h−ớng đầu t− phát triển trong t−ơng lai của HTĐ phụ thuộc rất lớn vào việc dự báo và độ chính xác của việc dự báo hai giá trị này. Có nhiều ph−ơng pháp có thể áp dụng để dự báo Pmax và Pmin. nh− dự báo theo ph−ơng pháp ngoại suy theo thời gian, ph−ơng pháp hồi quy tuyến tính… Trong luận văn này chúng ta chỉ nghiên cứu ph−ơng pháp DBPT sử dụng mạng nơron nhân tạo. Sau khi đã xác định đ−ợc hai giá trị quan trọng nhất Pmax và Pmin trên ĐTPT thì các giá trị phụ tải khác trong ngày sẽ đ−ợc xác định theo mối quan hệ của chúng. Vậy nếu biết đ−ợc dạng đồ thị phụ tải quy chuẩn, tức là các giá 22 trị Pn(i), xác định đ−ợc Pmax và Pmin trong ngày ta sẽ tính đ−ợc phụ tải của từng giờ theo công thức 1.1. 1.2.2.3 Dự báo phụ tải cho 24h Khi ta đã dự báo đ−ợc Pmax và Pmin trong ngày nếu ta xác định đ−ợc đồ thị phụ tải quy chuẩn tức là xác định đ−ợc các giá trị Pn(i) với i=1ữ24 ta sẽ xác định đ−ợc phụ tải của từng giờ trong ngày. Từ công thức (1.1) ta xác định đ−ợc công thức 1.4 sau: P(i) = Pmin + (Pmax – Pmin ) Pn(i) (1.4) Qua các phân tích nêu trên có thể đi đến kết luận: Để dự báo đ−ợc phụ tải từng giờ cho một ngày cụ thể, ta cần dự báo đ−ợc giá trị phụ tải đỉnh Pmax và phụ tải đáy Pmin của ngày đó và tìm ra véctơ ĐTPT Pn(i) của ngày cần dự báo. Tóm lại cũng nh− các dự báo khác, dự báo phụ tải ngày phải dựa vào số liệu thống kê, phân tích và áp dụng các thuật toán để xác định mối quan hệ giữa phụ tải và các yếu tố ảnh h−ởng, từ đó xây dựng ph−ơng pháp dự báo phụ tải ngày dựa trên các yếu tố ảnh h−ởng đã đ−ợc nêu. Phần tiếp theo, ta sẽ nghiên cứu ph−ơng pháp giải quyết bài toán dự báo phụ tải thông qua việc sử dụng các loại mạng nơron nhân tạo. Việc phân tích đặc điểm riêng, yêu cầu và mục đích từng bài toán sẽ là cơ sở để chọn loại mạng nơron nhân tạo thích hợp vào việc giải quyết từng bài toán. 23 CHƯƠNG II Tổng quan Về MạNG NƠRON NHÂN TạO Mạng nơron nhân tạo là một lĩnh vực đ−ợc đề xuất và nghiên cứu vào cuối thập kỷ 1800 khi ng−ời ta cố gắng mô tả hoạt động của trí tuệ con ng−ời. ý t−ởng này bắt đầu đ−ợc áp dụng cho các mô hình tính toán từ mạng Perceptron và đến nay đã có nhiều ứng dụng trong thực tế, đặc biệt là trong lĩnh vực dự báo, nhận dạng, điều khiển… Ví dụ, mạng nơron nhân tạo có thể sử dụng để nhận dạng ký tự thông qua khả năng học từ kinh nghiệm hoặc từ tập mẫu, trong khi các ph−ơng pháp truyền thống phải tiêu tốn nhiều thời gian cho việc làm mảnh ký tự, khả năng nhận dạng sẽ không cao khi chất l−ợng quét của scanner tồi hoặc bản thân ký tự đ−ợc lấy từ văn bản mờ hoặc có nhiều nét đứt. Cách tiếp cận mạng nơron nhân tạo có ý nghĩa thực tiễn rất lớn cho phép tạo ra các thiết bị có thể kết hợp khả năng song song cao của bộ não với tốc độ tính toán cao của máy tính. 2.1. Lịch sử phát triển của mạng nơron nhân tạo Trí tuệ nhân tạo (Artificial Intelligence) hay tạo cho máy móc khả năng suy luận, phán đoán và cảm nhận nh− con ng−ời là một trong những tham vọng to lớn của loài ng−ời. Tham vọng này đã có từ lâu và cùng với sự ra đời của máy tính, con ng−ời từng b−ớc đ−a kiến thức của mình vào máy, biến chúng trở thành những công cụ thực sự có trí tuệ. Mạng nơron nhân tạo là một bộ phận của ngành khoa học trí tuệ nhân tạo, là lĩnh vực tin học nghiên cứu ứng dụng máy tính điện tử thông minh hoạt động theo cơ chế mô phỏng t− duy của con ng−ời. Mạng nơron nhân tạo có cấu trúc t−ơng tự nh− bộ não tuy nhiên số nơron trong mạng nơron nhân tạo là hữu hạn tuỳ thuộc vào nhu cầu thực tế của bài toán, còn đối với bộ não con ng−ời số nơron lên tới xấp xỉ 15 tỉ nơron. Mạng nơron có khả năng học và tái tạo lại những gì đã đ−ợc dạy, chính 24 vì đặc điểm này mà mạng nơron đang đ−ợc phát triển rất mạnh mẽ và đang đ−ợc ứng dụng rất nhiều trong thực tế, đặc biệt là trong lĩnh vực dự báo, nhận dạng, điều khiển… Con ng−ời bắt đầu nghiên cứu mạng nơron vào cuối thập kỷ 1800 khi ng−ời ta cố gắng mô tả hoạt động của trí tuệ con ng−ời, ý t−ởng này bắt đầu đ−ợc áp dụng cho các mô hình tính toán từ mạng Perceptron. Đầu thập kỷ 1950 Friedrich Hayek là ng−ời đầu tiên khẳng định ý t−ởng về trật tự tự phát trong não xuất phát từ các mạng phân tán gồm các đơn vị đơn giản (nơron). Cuối thập kỷ 1940, Donnald Hebb đ−a ra giả thuyết đầu tiên về một cơ chế thần kinh mềm dẻo (neural plasticity). Hebbian learning đ−ợc coi là một quy tắc 'điển hình' của học không có giám sát. Nó (và các biến thể) là mô hình thời kỳ đầu của long term potentiation. (tạo tiềm lực dài hạn). Perceptron là một bộ phân loại tuyến tính dành cho việc phân loại dữ liệu xác định bằng các tham số và một hàm đầu ra g = w'x + b. Các tham số của nó đ−ợc thích nghi với một quy tắc tùy biến (ad- hoc) t−ơng tự với xuống dốc ngẫu nhiên (stochastic steepest gradient descent). Perceptron chỉ có thể phân loại hoàn hảo một tập dữ liệu mà các lớp khác nhau là (linearly separable) trong không gian đầu vào. Nó th−ờng thất bại hoàn toàn đối với dữ liệu không chia tách đ−ợc. Sự phát triển của thuật toán này ban đầu đã tạo ra một số hứng khởi, phần vì mối quan hệ của nó đối với các cơ chế sinh học. Sau này, phát hiện về điểm yếu này đã làm cho các mô hình Perceptron bị bỏ mặc cho đến khi các mô hình phi tuyến đ−ợc đ−a ra. Cognitron (1975) là một mạng nơron đa tầng thời kỳ đầu với một thuật toán huấn luyện. Các chiến l−ợc thần kinh khác nhau sẽ khác nhau về cấu trúc thực sự của mạng và các ph−ơng pháp thiết lập trọng số cho các kết nối. Mỗi dạng có các −u điểm và nh−ợc điểm riêng. Mạng có thể lan truyền thông tin chỉ theo một h−ớng, hoặc thông tin có thể đ−ợc đẩy đi đẩy lại cho đến khi tại một nút xuất hiện sự tự kích hoạt và mạng sẽ dừng tại một trạng thái kết thúc. 25 Mạng nơron nhiều lớp lan truyền ng−ợc sai số đã đ−ợc Rosenblatt và một số tác giả khác mô tả từ những năm 50, nh−ng họ chủ yếu chỉ nghiên cứu sâu về mạng Perceptron một lớp. Sở dĩ nh− vậy là do không tìm đ−ợc cách thay đổi trọng số liên kết tại các lớp ẩn. Ngay cả khi đã biết đ−ợc sai số tại các đầu ra, nh−ng ng−ời ta vẫn ch−a hình dung đ−ợc các sai số đó đ−ợc phân bố nh− thế nào tại các nơron ẩn. Minsky và Papert đã chỉ ra rằng khó có thể tổng quát hoá luật học đối với mạng một lớp sang mạng nhiều lớp, có hai lý giải chính cho vấn đề này. Thứ nhất, thuật giải học của mạng nhiều lớp có thể không hiệu quả, hoặc không hội tụ về điểm cực trị tổng thể trong không gian véctơ trọng số. Mặt khác, các nghiên cứu trong lý thuyết tính toán đã chỉ ra rằng trong tr−ờng hợp tồi nhất quá trình học các hàm tổng quát từ mẫu học không phải lúc nào cũng giải quyết đ−ợc. Các nguyên tắc cơ bản trong luật học đối với mạng nhiều lớp đã đ−ợc Bryson và Ho đề xuất từ năm 1969, nh−ng phải tới giữa năm 1980 vấn đề này mới đ−ợc quan tâm trở lại bởi công trình nghiên cứu của Rumelhart năm 1986. Mạng truyền ng−ợc (backpropagation) có lẽ đã là nguyên nhân chính của sự tái xuất của mạng nơron từ khi công trình "Learning Internal Representations by Error Propagation" (học các biểu diễn bên trong bằng cách lan truyền lỗi) đ−ợc xuất bản năm 1986. Mạng truyền ng−ợc ban đầu sử dụng nhiều tầng, mỗi tầng gồm các đơn vị tổng trọng số có dạng g = f(w'x + b), trong đó f là một hàm sigmoid. Huấn luyện đ−ợc thực hiện theo kiểu xuống dốc ngẫu nhiên. Việc sử dụng quy tắc tính nguyên hàm cho hàm hợp (chain rule) khi tính toán các thay đổi thích hợp cho các tham số dẫn đến một thuật toán có vẻ truyền ng−ợc lỗi, đó là nguồn gốc của thuật ngữ truyền ng−ợc. Tuy nhiên, về bản chất đây chỉ là một dạng xuống dốc, việc xác định các tham số tối −u cho một mô hình thuộc dạng này không đơn giản, không thể dựa vào các ph−ơng pháp xuống dốc để có đ−ợc lời giải tốt mà không cần một xuất phát điểm tốt. Ngày nay, các mạng có cùng kiến trúc với mạng 26 truyền ng−ợc đ−ợc gọi là các mạng Perceptron đa tầng. Thuật ngữ này không hàm ý bất cứ giới hạn nào đối với loại thuật toán dùng cho việc học. Mạng truyền ng−ợc đã tạo ra nhiều hứng khởi và đã có nhiều tranh cãi về quy trình học đó có thể đ−ợc thực hiện trong bộ não hay không. Một phần vì khi đó ch−a tìm ra cơ chế truyền tín hiệu ng−ợc. Nh−ng lý do quan trọng nhất là ch−a có một nguồn tín hiệu 'dạy' hay tín hiệu 'đích' đáng tin cậy. 2.2. Cơ sở lý thuyết mạng nơron Mạng nơron nhân tạo là một lĩnh vực nghiên cứu rộng lớn và chỉ mới phát triển mạnh khoảng 20 năm gần đây. Nó đ−ợc nghiên cứu và phát triển dựa trên nhiều lĩnh vực khoa học khác nhau bao gồm: Sinh học, sinh lý học, toán học, tin học. - Nơron sinh lý học: Các nơron nhân tạo đều có cấu trúc dựa các mô hình nơron sinh vật. Các nhà nghiên cứu đã chọn ph−ơng pháp nghiên cứu đặc tính đáp ứng nơron với các xung kích thích từ thấp đến cao, từ một đơn thể đến một mạng nhiều lớp, từ các khu thần kinh trung −ơng đến các cơ cấu thần kinh chấp hành. - Sinh lý học nơron: Các nhà sinh lý học nơron nghiên cứu cách nhận thức, các hành vi, cách tổ chức của não ng−ời để giải quyết những bài toán phức tạp, đòi hỏi sáng tạo. Rất nhiều các thuật học đ−ợc bắt nguồn từ những nghiên cứu về sinh lý học. - Cơ sở toán học: Toán học là một công cụ không thể thiếu trong quá trình nghiên cứu khoa học nói chung và mạng nơron nói riêng. - Công nghệ thông tin: Biễu diễn và xử lý nhanh các vấn đề đã đ−ợc nghiên cứu, là yếu tố thúc đẩy các ứng dụng và kỹ thuật mạng nơron nhân tạo phát triển nhanh chóng. 27 2.3. Bộ não và nơron sinh học Các nhà nghiên cứu sinh học cho ta thấy rằng các nơron (tế bào thần kinh) là đơn vị cơ sở đảm nhiệm những chức năng xử lý nhất định trong hệ thần kinh, bao gồm não, tuỷ sống và các dây thần kinh. Mỗi nơron có một phần thân với nhân bên trong (gọi là soma), một đầu thần kinh ra (gọi là sợi trục axon) và một hệ thống dạng cây các dây thần kinh vào (gọi là dendrite). Các dây thần kinh vào tạo thành một l−ới dày xung quanh thân tế bào, chiếm diện tích khoảng 0.25 mm2, còn dây thần kinh tạo thành trục dài có thể từ 1 cm đến hàng mét. Đ−ờng kính của thân tế bào th−ờng chỉ là 10-4m. Trục dây thần kinh ra cũng có thể phân nhánh các dây thần kinh theo dạng cây để nối với các dây thần kinh vào hoặc trực tiếp với nhân tế bào các nơron khác thông qua các khớp nối (gọi là synapse). Thông th−ờng, mỗi nơron có thể gồm vài chục cho tới vài trăm ngàn khớp nối để nối với các nơron khác. Ng−ời ta −ớc l−ợng rằng l−ới các dây thần kinh ra cùng với các khớp nối bao phủ diện tích khoảng 90% bề mặt nơron (hình 2.1) Hình 2.1. Cấu tạo nơron sinh học 28 Các tín hiệu truyền trong các dây thần kinh vào và dây thần kinh ra của các nơron là tín hiệu điện và đ−ợc thực hiện thông qua các quá trình phản ứng và giải phóng các chất hữu cơ. Các chất này đ−ợc phát ra từ các khớp nối dẫn tới các dây thần kinh vào sẽ làm tăng hay giảm điện thế của nhân tế bào. Khi điện thế này đạt tới một ng−ỡng nào đó, sẽ tạo ra một xung điện dẫn tới trục dây thần kinh ra. Xung này đ−ợc truyền theo trục, tới các nhánh rẽ khi chạm tới các khớp nối có các nơron khác sẽ giải phóng các chất truyền điện, có hai loại khớp nối: khớp nối kích thích (excitatory) hoặc khớp nối ức chế (inhibitory). Phát hiện quan trọng nhất trong ngành nghiên cứu về bộ não là các liên kết khớp thần kinh khá mềm dẻo, có thể biến động và chỉnh đổi theo thời gian tuỳ thuộc vào dạng kích thích. Hơn nữa, các nơron có thể sản sinh các liên kết mới với các nơron khác và đôi khi l−ới các nơron có thể di chuyển từ vùng này sang vùng khác trong bộ não. Các nhà khoa học cho rằng đây chính là cơ sở quan trọng để giải thích cơ chế học của bộ não con ng−ời. Phần lớn các quá trình xử lý thông tin đều xảy ra trên vỏ não. Toàn bộ vỏ não đ−ợc bao phủ bởi mạng các tổ chức cơ sở có dạng hình thùng tròn với đ−ờng kính khoảng 0.5mm, độ cao 4mm. Mỗi đơn vị cơ sở này chứa khoảng 2000 nơron. Ng−ời ta chỉ ra rằng mỗi vùng não có những chức năng nhất định. Điều rất đáng ngạc nhiên là các nơron rất đơn giản trong cơ chế làm việc, nh−ng mạng nơron liên kết với nhau lại có khả năng tính toán, suy nghĩ, tính toán nghi nhớ, và điều khiển. Có thể điểm qua những chức năng cơ bản của bộ não nh− sau: - Bộ nhớ đ−ợc tổ chức theo các bó thông tin và truy nhập theo nội dung (có thể truy xuất thông tin dựa theo giá trị các thuộc tính của đối t−ợng); 29 - Bộ não có khả năng tổng quát hoá, có thể truy xuất các tri thức hay các mối liên kết chung của các đối t−ợng t−ơng ứng với một khái niệm chung nào đó; - Bộ não có khả năng dung thứ lỗi theo nghĩa có thể điều chỉnh hoặc tiếp tục thực hiện ngay khi có những sai lệch do thông tin bị thiếu hoặc không chính xác. Ngoài ra, bộ não còn có thể phát hiện và phục hồi các thông tin mất dựa trên sự t−ơng tự giữa các đối t−ợng; - Bộ não có khả năng xuống cấp và thay thế dần, khi có trục trặc tại các vùng não (do bệnh, chấn th−ơng) hoặc bắt gặp những thông tin hoàn toàn mới lạ, bộ não vẫn có thể tiếp tục làm việc; - Bộ não có khả năng học. Dễ dàng thấy rằng bộ não con ng−ời có thể l−u giữ nhiều thông tin hơn các máy tính hiện đại; Tuy rằng điều này không phải đúng mãi mãi, vì bộ não tiến hoá chậm, trong khi đó nhờ những tiến bộ trong công nghệ vi điện tử, bộ nhớ máy tính đ−ợc nâng cấp rất nhanh. Hơn nữa, sự hơn kém về bộ nhớ trở nên hoàn toàn thứ yếu so với sự khác biệt về tốc độ tính toán và khả năng tính toán song song. Các bộ vi xử lý có thể tính 108 lệnh trong một giây, trong khi đó mạng nơron xử lý chậm hơn, cần khoảng vài miligây để kích hoạt. Tuy nhiên, bộ não có thể kích hoạt hầu nh− cùng một lúc tại rất nhiều nơron khớp nối, trong khi đó ngay cả máy tính hiện đại cũng chỉ có một số hạn chế các bộ vi xử lý song song. Nếu chạy một mạng nơron nhân tạo trên máy tính, phải tốn hàng trăm lệnh máy để kiểm tra một nơron có đ−ợc kích hoạt hay không (tiêu phí khoảng10-8 x 10 giây trên nột nơron). Do đó, cho dù bộ vi xử lý có thể tính toán nhanh hơn hàng triệu lần so với các nơron bộ não, nh−ng xét tổng thể bộ não lại tính toán nhanh hơn hàng tỷ lần. Cách tiếp cận mạng nơron nhân tạo có ý nghĩa thực tiễn rất lớn cho phép tạo ra các thiết bị có thể kết hợp khả năng song song cao của bộ não và tốc độ 30 tính toán cao của máy tính. Tuy vậy, cần phải có một khoảng thời gian dài nữa để các mạng nơron nhân tạo có thể mô phỏng các hành vi sáng tạo của bộ não con ng−ời. Chẳng hạn, bộ não có thể thực hiện một nhiệm vụ khá phức tạp nh− nhận ra khuôn mặt ng−ời quen sau không quá một giây, trong khi đó một máy tính tuần tự phải thực hiện hàng tỷ phép tính (khoảng10 giây) để thực hiện cùng một thao tác đó, nh−ng với chất l−ợng kém hơn nhiều, đặc biệt trong tr−ờng hợp thông tin không chính xác, đầy đủ. 2.4 Mô hình mạng nơron nhân tạo Mạng nơron nhân tạo (Artificial Neural Network) bao gồm các nút (đơn vị xử lý, nơron) đ−ợc nối với nhau bởi liên kết nơron. Mỗi liên kết kèm theo một trọng số nào đó, đặc tr−ng cho đặc tính kích hoạt/ ức chế giữa các nơron. Có thể xem các trọng số là ph−ơng tiện để l−u thông tin dài hạn trong mạng nơron và nhiệm vụ của quá trình huấn luyện (học) mạng là cập nhật các trọng số khi có thêm các thông tin về các mẫu học, hay nói một cách khác, các trọng số đ−ợc điều chỉnh sao cho dáng điệu vào ra của nó mô phỏng hoàn toàn phù hợp môi tr−ờng đang xem xét. Trong mạng, một số nơron đ−ợc nối với môi tr−ờng bên ngoài nh− các đầu ra, đầu vào. 2.4.1 Mô hình một nơron nhân tạo a=∑ Z f xi wi Các liên kết vào Cỏc liờn kết ra Hàm vào Đầu raHàm kớch hoạt Hình 2.2. Mạng nơron nhân tạo 31 Mỗi nơron nhân tạo (nút) đ−ợc nối với các nơron khác và nhận các tín hiệu xi từ chúng với các trọng số wi, tổng các thông tin vào có trọng số là a =∑ = n i ii xw 1 a là thành phần tuyến tính của nơron. Hàm kích hoạt f (hàm chuyển) đóng vai trò biến đổi từ a sang tín hiệu đầu ra z. z =f(a) Trong đó: xi: Các tín hiệu đầu vào. wi: Các trọng số t−ơng ứng với các đầu vào n: số đầu vào của nơron. a: Tổng trọng số của mỗi nơron. f: hàm kích hoạt z: là đầu ra của nơron, đây là thành phần phi tuyến của nơron. Hàm kích hoạt f th−ờng có 3 dạng hay dùng trong thực tế. • Hàm dạng b−ớc: 1 nếu x ≥ 0 f(x)= 0 nếu x < 0 hoặc 1 nếu x ≥ θ f(x)= 0 nếu x < θ 1 0 32 • Hàm dấu 1 nếu x ≥ 0 f(x)= -1 nếu x < 0 hoặc 1 nếu x ≥ θ f(x)= 0 nếu x < θ • Hàm singmoid f(x) = xe α−+1 1 ở đây ng−ỡng đóng vai trò làm tăng tính thích nghi và khả năng tính toán của mạng nơron. Sử dụng ký pháp véctơ, X = (x1, x2, …,xn) véctơ tín hiệu vào, W = (w1,w2, …,wn) véctơ trọng số, khi đó ta có. Z = f(a), a =WS Tr−ờng hợp xét ng−ỡng, ta biểu diễn véctơ mới X’ = (x1,x2, …,xn, θ ), W = (w1,w2, …,wn, -1) 1 -1 33 3.4.2. Mô hình mạng nơron nhân tạo Mạng nơron là hệ thống bao gồm nhiều phần tử xử lý đơn giản (nơron) hoạt động song song. Tính năng của hệ thống này tuỳ thuộc vào cấu trúc của hệ các trọng số liên kết nơron và quá trình tính toán các nơron đơn lẻ. Mạng nơron có thể học từ dữ liệu mẫu và tổng quát hoá dựa trên các dữ liệu mẫu học. Trong mạng nơron, các nơron đón nhận tín hiệu vào gọi là nơron vào và các nơron đ−a thông tin ra gọi là nơron ra. 3.4.2.1. Phân loại các mạng nơron Theo kiểu liên kết nơron: Ta có mạng nơron truyền thẳng (feel- forward Neural Network) và mạng nơron qui hồi (recurrent NN). Trong mạng nơron truyền thẳng, các liên kết nơron đi theo một h−ớng nhất định, không tạo thành đồ thị có chu trình (Directed Acyclic Graph) với các đỉnh là các nơron, các cung là các liên kết giữa chúng. Ng−ợc lại, các mạng qui hồi cho phép các liên kết nơron tạo thành chu trình. Vì các thông tin ra của các nơron đ−ợc truyền lại cho các nơron đã góp phần kích hoạt chúng, nên mạng qui hồi còn có khả năng l−u giữ trạng thái trong của nó d−ới dạng ng−ỡng kích hoạt ngoài các trọng số liên kết nơron. Lớp vào Nơron vào Lớp ẩn Lớp ra Nơron ra a) Mạng nơron nhiều lớp b) Mạng nơron truyền thẳng Hình 2.3. Mạng truyền thẳng và nhiều lớp 34 Theo số lớp: Các nơron có thể tổ chức lại thành các lớp sao cho mỗi nơron của lớp này chỉ đ−ợc nối với các nơron ở lớp tiếp theo, không cho phép các liên kết giữa các nơron trong cùng một lớp, hoặc từ nơron lớp d−ới lên nơron lớp trên. ở đây cũng không cho phép các liên kết nơron nhảy qua một lớp. Dễ dàng nhận thấy rằng các nơron trong cùng một lớp nhận đ−ợc tín hiệu từ lớp trên cùng một lúc, do vậy về nguyên tắc chúng có thể xử lý song song. Thông th−ờng lớp nơron vào chỉ chịu trách nhiệm truyền đ−a tín hiệu vào, không thực hiện một tính toán nào nên khi tính số lớp của mạng, ng−ời ta không tính lớp vào. Ví dụ, mạng nơron ở hình 2.6 có hai lớp: một lớp ẩn và một lớp ra. Đầu vào Lớp nơron a1 a2 an Y2 Y1 Yn s1 s2 s3 sm w1,1 wm,n Hình 2.5. Mạng nơron một lớp Hình 2.4. Mạng nơron hồi qui. 35 Đầu vào Lớp 1 Lớp 2 2.4.2.2. Cách nhìn về mạng nơron • Mạng nơron nh− một công cụ tính toán: Giả sử mạng nơron NN có n nơron vào và m nơron ra, khi đó với mỗi véctơ các tín hiệu vào X = (x1,…,xn ), sau quá trình tính toán tại các nơron ẩn, ta nhận đ−ợc kết quả ra Z =( z1, z2,...,zm). Theo nghĩa nào đó mạng nơron làm việc với t− cách một bảng tra, mà không cần biết dạng phụ thuộc hàm t−ờng minh giữa Z và X. khi đó có thể viết: Z=Tinh(X, NN ) Các nơron trên cùng một lớp có thể tính toán đồng thời, do vậy độ phức tạp tính toán nói chung sẽ phụ thuộc vào số lớp mạng. Các thông số cấu trúc mạng nơron bao gồm. + Số tín hiệu vào, số tín hiệu ra. + Số lớp nơron. + Số nơron trên mỗi lớp ẩn. + Số l−ợng liên kết của mỗi nơron (liên kết đầy đủ, liên kết bộ phận và liên kết ngẫu nhiên). a11 a12 a1n X2 X1 Xn s1 s2 s3 sm w1,1 wm,n a21 a22 a2k Y2 Y1 Yk Hình 2.6. Mạng nơron nhiều lớp 36 + Các trọng số liên kết nơron. • Mạng nơron nh− một hệ thống thích nghi có khả năng học (huấn luyện) để tinh chỉnh các trọng số liên kết cũng nh− cấu trúc của mạng sao cho phù hợp với các mẫu học (samples). Có ba loại kỹ thuật học (i) Học có giám sát (supervised learning) hay còn gọi học có thầy; (ii) Học không có giám sát (unsupervised leraning) hay còn gọi học không có thầy (iii) Học tăng c−ờng. Trong học có giám sát, mạng đ−ợc cung cấp một tập mẫu học {(XS,DS)} theo nghĩa XS là tín hiệu vào, thì kết quả ra đúng của hệ phải là DS. ở mỗi lần học, véctơ tín hiệu vào XS đ−ợc đ−a vào mạng, sau đó so sánh sự sai khác giữa các kết quả ra đúng DS với kết quả tính toán ZS. Sai số này sẽ đ−ợc dùng để hiệu chỉnh lại các trọng số liên kết trong mạng. Quá trình cứ tiếp tục cho đến khi thỏa mãn một tiêu chuẩn nào đó. Có hai cách sử dụng tập mẫu học: Hoặc dùng các mẫu lần l−ợt, hết mẫu này đến mẫu khác, hoặc sử dụng đồng thời tất cả các mẫu một lúc. Các mạng với cơ chế học không giám sát đ−ợc gọi là các mạng tự tổ chức. Các kỹ thuật học trong mạng nơron có thể nhằm vào hiệu chỉnh các trọng số liên kết (gọi là tham số) hoặc điều chỉnh, sửa đổi cấu trúc của mạng bao gồm số lớp, số nơron, kiểu và trọng số các liên kết (gọi là học cấu trúc). Cả hai mục đích học này có thể thực hiện đồng thời hoặc tách biệt. Học tham số: Giả sử có k nơron trong mạng và mỗi nơron có đúng l liên kết vào với các nơron khác. Khi đó, ma trận trọng số liên kết W sẽ có kích th−ớc kxl. Các thủ tục học tham số nhằm mục đích tìm kiếm ma trận W sao cho ZS = Tinh ( XS, W ) đối với mọi mẫu học S = (XS, DS) (2.1) 37 Học cấu trúc: Với học tham số ta giả định rằng mạng có một cấu trúc cố định. Việc học cấu trúc của mạng truyền thẳng gắn với yêu cầu tìm ra số lớp của mạng L và số nơron trên mỗi lớp nj. Đối với các mạng hồi qui còn phải xác định thêm các tham số ng−ỡng θ của các nơron trong mạng. Một cách tổng quát phải xác định bộ tham số P = ( L,n1…..,n1, θ1,….,θk), ở đây k = ∑ nj sao cho: YS = Tinh ( XS,P) đối với mọi mẫu học s = (XS, DS) (2.2) Về thực chất, việc điều chỉnh các véctơ tham số W trong (2.1) hay P trong (2.2) đều qui về bài toán tìm kiếm tối −u trong không gian tham số. Do vậy, có thể áp dụng các cơ chế tìm kiếm kinh điển theo gradient hay các giải thuật di truyền, lập trình tiến hoá. 3.4.2.3. Khả năng tính toán và biểu diễn phụ thuộc dữ liệu của mạng nơron Mạng nơron truyền thẳng chỉ đơn thuần tính toán các tín hiệu ra dựa trên các tín hiệu vào và các trọng số liên kết nơron đã xác định rõ trong mạng. Do đó chúng không có trạng thái bên trong nào khác ngoài véctơ trọng số W. Đối với mạng qui hồi, trạng thái trong của mạng đ−ợc l−u giữ tại các ng−ỡng của các nơron, các mạng qui hồi có thể không ổn định, thậm chí rối loạn theo nghĩa, khi cho véctơ giá trị đầu vào X nào đó, mạng cần phải tính toán rất lâu, Mạng nơron N Hiệu chỉnh W Sai số Hình 2.7. Học tham số có giám sát Xs Ds Zs 38 thậm chí có thể lặp vô hạn tr−ớc khi đ−a ra đ−ợc kết quả mong muốn. Quá trình học của mạng qui hồi cũng phức tạp hơn nhiều. Tuy vậy, các mạng qui hồi có thể cho phép mô phỏng các hệ thống t−ơng đối phức tạp trong thực tế. 3.4.2.4. Xác định cấu trúc mạng tối −u. Nh− ta đã đề cập phần trên, lựa chọn sai cấu trúc mạng có thể dẫn tới hoạt động mạng trở nên kém hiệu quả. Nếu chọn mạng quá nhỏ có thể chúng không biểu diễn đ−ợc sự phụ thuộc dữ liệu mong muốn. Nếu chọn mạng quá lớn để có thể nhớ đ−ợc tất cả các mẫu học d−ới dạng bảng tra, nh−ng hoàn toàn không thể tổng quát đ−ợc cho những tín hiệu vào ch−a biết tr−ớc. Nói cách khác, cũng giống nh− trong các mô hìng thống kê, các mạng nơron có thể đ−a tới tình trạng quá thừa tham số. Bài toán xác định cấu trúc mạng tốt có thể xem nh− bài toán tìm kiếm trong không gian tham số. Một cách làm là sử dụng giải thuật di truyền, tuy vậy, không gian tham số có thể rất lớn và để xác định một trạng thái W ( hoặc P) trong không gian đòi hỏi phải huấn luyện mạng, do vậy rất tốn thời gian. Có thể áp dụng t− t−ởng tìm kiếm leo đồi (hill-climbing) nhằm sửa đổi một cách có lựa chọn, mang tính địa ph−ơng cấu trúc mạng hiện có. Có hai cách làm: + Hoặc bắt đầu với một mạng lớn, sau đó giảm nhỏ xuống; + Hoặc bắt đầu với một mạng nhỏ, sau đó tăng dần lên. Một kỹ thuật khác có thể áp dụng gọi là “tổn th−ơng tối −u“ nhằm loại bỏ một số liên kết trọng số trong mạng dựa trên các tiếp cận lý thuyết thông tin, đơn giản nhất là các liên kết có trọng số bằng 0. Quá trình cứ tiếp tục nh− vậy. Kỹ thuật này có thể loại trừ 3/4 các liên kết, do đó nâng cao đáng kể hiệu quả của mạng. 39 Ngoài việc loại trừ các liên kết nơron thừa, có thể bỏ qua những nơron không đóng góp nhiều vào quá trình thực hiện của mạng. Giải thuật “Lợp ngói” là một biến thể của kỹ thuật tăng tr−ởng mạng xuất phát từ cấu hình ban đầu t−ơng đối nhỏ. ý t−ởng ở đây là xác định một cấu hình mạng cho phép tính đúng các mẫu học đã biết. Sau đó, mỗi khi thêm dần mẫu học mới, mạng đ−ợc phép thêm một số nơron cho phép đoán đúng kết quả học hiện tại và quá trình cứ tiếp tục nh− vậy. 40 Ch−ơng III ứng dụng mạng nơron ánh xạ đặc tr−ng tự tổ chức Kohonen trong bài toán phân loại ngày Bài toán phân loại ngày trong dự báo phụ tải ngắn hạn cho hệ thống điện là một bài toán rất quan trọng để phân loại các dữ liệu đầu vào và dự báo các kiểu ngày tiếp theo. Trong một số phần mềm dự báo phụ tải ngắn hạn tr−ớc đây, ch−a có phần mềm nào thực hiện vấn đề phân loại dữ liệu, mà việc phân loại dữ liệu đầu vào đều đ−ợc thực hiện thủ công bằng kinh nghiệm. Trong ch−ơng này tôi trình bày các khái niệm cơ bản về mạng nơron ánh xạ đặc tr−ng tự tổ chức Kohonen, sau đó phát biểu bài toán, đề xuất cấu trúc mạng, cách ứng dụng kỹ thuật “mạng nơron ánh xạ đặc tr−ng tự tổ chức Kohonen” để giải quyết bài toán. Xây dựng phần mềm và phân tích đánh giá kết quả đạt đ−ợc. Ch−ơng trình đ−ợc viết bằng phần mềm Matlab. 3.1. Sự cần thiết phân loại đồ thị phụ tải 3.1.1. Tập hợp các kiểu đồ thị phụ tải đặc tr−ng Trong các bài toán dự báo nói chung và dự báo phụ tải hệ thống điện nói riêng, để đạt đ−ợc kết quả dự báo chính xác cao và thời gian huấn luyện ngắn, ta cần phải phân loại đ−ợc các loại dữ liệu đầu vào. Đặc biệt đối với bài toán dự báo phụ tải ta cần phân dạng kiểu ngày dự báo vì qua số liệu thống kê và thực tế vận hành cho thấy tồn tại một vài dạng đồ thị phụ tải đặc tr−ng phụ thuộc vào các tính chất của ngày nghiên cứu. Đồ thị phụ tải trong ngày làm việc của các tháng giống nhau trong các năm giống nhau th−ờng có dạng giống nhau. D−ới đây là đồ thị phụ tải của ngày làm việc trong tháng 2 năm 2005, 2006 và các ngày làm việc trong tháng 41 Đồ thị phụ tải 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Giờ C ôn g su ất Đồ thị phụ tải 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Giờ C ôn g su ất Đồ thị phụ tải 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Giờ C ôn g su ất 6 năm 2005, 2006 của hệ thống điện Miền Bắc (Hình 3.1). Qua đồ thị phụ tải ta thấy các ngày làm việc trong cùng một tháng của hai năm có dạng giống nhau. Đồ thị phụ tải của tháng 2 có dạng hoàn toàn khác với tháng 6 và ta cũng thấy rằng giá trị phụ tải của ngày nghỉ bao giờ cũng nhỏ hơn ngày làm việc bình th−ờng, dạng đồ thị của các ngày này cũng có sự thay đổi. Đối với các ngày truyền hình trực tiếp các sự kiện thể thao văn hoá đồ thị phụ tải cũng có dạng t−ơng tự nh− các ngày có cùng sự kiện tr−ớc đó. Dạng của đồ thị phụ tải trong ngày có cắt điện diện rộng cũng mang đặc thù riêng tuỳ thuộc vào thời gian, vùng cắt điện. Những ngày này nếu áp dụng các ph−ơng pháp dự báo th−ờng cho kết quả chính xác không cao. Từ 22 đến 24/02/2005 Từ 9 đến 11/05/200._.9.5 -29.70 1.33 17 2557.4 2693.7 -136.30 5.33 95 18 2853.3 2896.9 -43.60 1.53 19 2893.2 2992.4 -99.20 3.43 20 2597.5 2744.1 -146.60 5.64 21 2325.8 2398.7 -72.90 3.13 22 2062.8 2076.9 -14.10 0.68 23 1901.4 1955.8 -54.39 2.86 24 1792.2 1876.3 -94.10 5.25 Bảng 4.16 Kết quả dự báo phụ tải ngày 14/05/2006 Giờ P thực tế (MW) P dự báo (MW) Sai số tuyệt đối (MW) Sai số % 1 1577.0 1572.6 4.40 0.28 Đồ thị phụ tải 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Giờ C ôn g su ất Hình 4.6 Đồ thị phụ tải dự báo và phụ tải thực tế ngày 13/5/2006 Thực tế Dự bỏo 96 2 1578.3 1573.4 4.86 0.31 3 1533.5 1534.4 -0.91 0.06 4 1552.5 1519.7 32.80 2.11 5 1617.7 1627.5 -9.76 0.60 6 1796.3 1862.3 -66.05 3.68 7 1800.1 1905.8 -105.71 5.87 8 1925.2 2021.5 -96.30 5.01 9 2059.1 2100.4 -91.28 4.43 10 2351.8 2427.7 -75.86 3.23 11 2402.8 2455.9 -53.10 2.21 12 1877.5 1986.6 -109.10 5.81 13 1722.1 1808.8 -86.67 5.03 14 1818.7 1898.6 -79.86 4.40 15 1919.4 2010.2 -90.82 4.73 16 2072.7 2130.6 -57.95 2.80 17 2454.4 2597.9 -143.50 5.85 18 2766.9 2832.7 -65.83 2.38 19 2923.6 2914.6 9.00 0.31 20 2674.4 2665.5 8.94 0.33 97 21 2348.8 2382.1 -33.33 1.42 22 2012.4 2088.3 -75.91 3.77 23 1853.0 1926.0 -73.00 3.94 24 1661.2 1683.8 -22.62 1.36 Qua các ĐTPT báo và phụ tải thực tế từ ngày 9/5 đến ngày 14/5 năm 2006 ta thấy các ĐTPT dự báo rất gần với ĐTPT thực tế. Sai số dự báo do các nguyên nhân sau: • Mạng bị ảnh h−ởng rất nhiều từ trạng thái khởi đầu của các tham số học: - Lựa chọn cấu trúc mạng: bao gồm số nơron lớp vào, lớp ẩn, lớp ra và các hàm truyền f(.) - Chọn các giá trị của hệ số học và hệ số quán tính . Đồ thị phụ tải 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Giờ C ôn g su ất Hình 4.7 Đồ thị phụ tải dự báo và phụ tải thực tế ngày 14/5/2006 Thực tế Dự bỏo 98 - Hệ số trọng l−ợng ban đầu cho mạng, số vòng lặp trong quá trình huấn luyện. • Sai số do dữ liệu đầu vào. - Sai số do phụ tải đầu vào: Hiện nay thông số phụ tải HTĐ miền Bắc vẫn lấy bằng tay do vậy việc ghi thông số không chính xác, sai lệch thời gian hoặc lấy thông số trong thời điểm xảy ra sự cố. Mặc dù hiện nay hệ thống SCADA/EMS đã đ−a vào vận hành cho HTĐ miền Bắc, nh−ng do hệ thống này chỉ thu thập dữ liệu một số trạm điện quan trọng vì vậy các yếu tố trên sẽ đ−ợc cải thiện khi hệt thống SCADA/EMS đ−ợc áp dụng cho toàn bộ các trạm điện trên toàn miền Bắc. - Sai số do nhiệt độ: Do hệ thống đo l−ờng nhiệt độ môi tr−ờng không chính xác. • Sai số do thuật toán: - Quá trình huấn luyện mạng dừng lại sau khi kiểm tra E < E0 hoặc kết thúc khi giá trị vòng lặp đạt tới giá trị giới hạn đã định tr−ớc, do quá trình huấn luyện rất lâu, số l−ợng phép toán lớn dẫn đến sai số trong quá trình tính toán. - Phụ tải Pmax, Pmin không chỉ phụ thuộc vào nhiệt độ Tmax, Tmin trong ngày mà còn chịu ảnh h−ởng của các yếu tố khác về thời tiết nh− m−a, gió, độ ẩm… Các mẫu phụ tải Pmax, Pmin và nhiệt độ Tmax, Tmin trong quá khứ có thể không đúng với quan hệ giữa phụ tải và nhiệt độ hiện tại. Để tránh sai số cần phải cập nhật phụ tải và nhiệt độ các ngày gần nhất để huấn luyện mạng, trong quá trình dự báo phụ tải cần quan sát các dữ liệu đầu vào và đầu ra để huấn luyện lại mạng. 99 CHƯƠNG V Hệ thống phần mềm dự báo phụ tải ngắn hạn cho hệ thống điện miền bắc Căn cứ vào sơ đồ trình tự các b−ớc của thuật toán tạo lập mạng nơron nhiều lớp lan truyền ng−ợc sai số đ−ợc giới thiệu phần tr−ớc, ta xây dựng phần mềm dự báo phụ tải đỉnh và đáy của hệ thống điện Miền Bắc. Phần cơ sở dữ liệu đ−ợc thiết kế trên hệ quản trị CSDL SQL Server và dữ liệu do ng−ời dùng nhập vào bằng một phần mềm đã có sẵn (Phần mềm phục vụ báo cáo sản xuất, do phòng tin học của Trung tâm tâm Điều độ HTĐ miền Bắc thiết kế và xây dựng). Hệ thống ch−ơng trình bao gồm hai phần. Phần thứ nhất đ−ợc viết trên ngôn ngữ lập trình VBA đ−ợc tích hợp trong phần mềm Excel dùng để truy vấn cơ sở dữ liệu từ SQL Server và chuẩn hoá dữ liệu. Phần thứ hai đ−ợc viết trên Matlab để huấn luyện mạng và đ−a ra kết quả dự báo. 5.1. Giới thiệu về cơ sở dữ liệu. Xuất phát từ sơ đồ thực thể liên kết, thông qua một số tool của SQL Server, ta có thể kiểm tra đ−ợc tất cả các bảng dữ liệu bắt nguồn từ các thực thể, mỗi cột bắt nguồn từ các thuộc tính, primary key từ UIK, foreign key từ quan hệ liên kết (Relationship). Tất cả các định nghĩa của thuộc tính nh− độ dài, kiểu dữ liệu…đều đã đ−ợc định nghĩa từ tr−ớc. Tuy nhiên do xuất phát Truy vấn số liệu Phân loại số liệu SQL S Chuẩn hoá Huấn luyện mạng Dự báo *.txt *.xls *.xls *.xls Hình 5.1. Sơ đồ quan hệ giữa các module 100 của bài toán dự báo phụ tải ngắn hạn nên ta chỉ quan tâm đến một số bảng dữ liệu trong toàn bộ hệ thống cơ sở dữ liệu đã đ−ợc thiết kế từ tr−ớc với cấu trúc bảng nh− sau: Bảng thông tin về phụ tải và nhiệt độ của các điện lực. Tên cột Kiểu Len PK FK Null Mô tả Ngay Date 8 x Ngày Gio 2 x Giờ ND 2 X Nhệt độ B1 Float 4 X Hà Nội B2 Float 4 X Hải phòng … … … … … … … B29 Float 4 X Lai Châu Trong đó: PK : primary key (Khoá chính) FK : foreign key (khoá liên kết) Len: Độ dài dữ liệu 5.2. Đặc tả các chức năng 5.2.1. Truy vấn dữ liệu Module truy vấn dữ liệu dùng để truy vấn số liệu từ cơ sở dữ liệu SQL Server, số liệu đầu ra bao gồm phụ tải và nhiệt độ của tập mẫu, số liệu này chính là số liệu đầu vào để huấn luyện mạng. Số liệu sau khi truy vấn đ−ợc l−u vào một file có đuôi mở rộng .xls. 101 5.2.2. Phân loại dữ liệu Module này thực hiện phân loại số liệu đã thu thập đ−ợc từ module truy vấn dữ liệu theo từng nhóm dữ liệu khác nhau. Dữ liệu đã phân loại sẽ đ−ợc l−u vào một file excel. 5.2.3 Chuẩn hoá dữ liệu Module chuẩn hoá dữ liệu thực hiện việc chuẩn hoá số liệu đã đ−ợc phân loại ở module phân loại dữ liệu theo công thức đã định nghĩa ở ch−ơng 2, theo nguyên tắc các giá trị đầu vào cho mạng nơ ron phải nằm trong khoảng [- 1,1] và đ−ợc l−u vào file excel. Số liệu sau khi đ−ợc chuẩn hoá sẽ là số liệu đầu vào cho module huấn luyện mạng 5.2.4 Huấn luyện mạng Module này thực hiện việc huấn luyện mạng với bộ trọng số lấy ngẫu nhiên trong khoảng [-1,1]. Trong quá trình học, mạng sẽ điều chỉnh các tham số sao cho tổng bình ph−ơng lỗi là nhỏ nhất (Quá trình huấn luyện mạng dừng nếu SSE = ε rất nhỏ hoặc khi số vòng lặp qua lớn). Kết thúc quá trình huấn luyện mạng ta thu đ−ợc bộ trọng số mới, gọi là bộ trọng số sau khi huấn luyện, bộ trọng số này đ−ợc l−u trữ d−ới dạng file text. Bộ trọng số sau khi huấn luyện sẽ đ−ợc dùng làm ph−ơng tiện cho việc dự báo phụ tải. 5.2.5 Dự báo phụ tải Module dự báo phụ tải thực hiện khi mạng đã đ−ợc huấn luyện xong. Quá trình làm việc của mạng nơron là quá trình tự tái diễn lại, vì vậy khi đ−a các giá trị đầu vào của mẫu vào với bộ trọng số sau khi huấn luyện sẽ cho đáp ứng đầu ra t−ơng ứng với đầu vào theo sự nhận thức của mạng đ−ợc hình thành trong quá trình huấn luyện. Đáp ứng đầu ra chính là kết quả dự báo của mạng. 102 5.3 H−ớng dẫn sử dụng Trên màn hình Desktop chọn file dubaophutai.xls, ch−ơng trình sẽ chạy lên màn hình (hình 5.2) mà tại đây ng−ời sử dụng có thể thực hiện và theo dõi các chức năng của ch−ơng trình. 5.3.1 Truy vấn dữ liệu Trên hình 5.2 ta bấm chuột vào chức năng truy vấn dữ liệu, khi đó ch−ơng trình xuất hiện hình 5.3, lựa chọn thời gian bắt đầu và thời gian kết thúc để thực hiện truy vấn dữ liệu . Khi truy vấn xong dữ liệu ng−ời sử dụng phải l−u dữ liệu d−ới dạng file excel, tên file do ng−ời dùng đặt. Hình 5.2. Giao diện chính của ch−ơng trình Hình 5.3. Giao diện truy vấn dữ liệu 103 5.3.2 Phân loại dữ liệu Trên màn hình Desktop nháy đúp vào biểu t−ợng MATLAB R12 chạy lên màn hình (hình 5.4). Trên cửa sổ lệnh của hình 5.4 nhập lệnh dubaophutai, ch−ơng trình sẽ chạy ra menu các chức năng (hình 5.5). Trên hình 5.5 ta chọn chức năng “phan loai so lieu”, sau đó phần mềm sẽ yêu cầu ng−ời sử dụng nhập tên file dữ liệu, ta nhập tên file số liệu cần phân loại, phần mềm sẽ tự động phân loại dữ liệu và l−u vào file. 5.3.3 Chuẩn hoá dữ liệu Trên hình 5.2 ta bấm chuột vào chức năng chuẩn hoá dữ liệu, sau đó chọn file excel chứa dữ liệu đã đ−ợc phân loại, phần mềm sẽ tự động chuẩn Hình 5.4. Giao diện phần mềm matlab Hình 5.5. Giao diện menu ch−ơng trình 104 hoá dữ liệu và l−u số liệu vào file excel trong th− mục mặc định C:\matlabR12\work. 5.3.4 Huấn luyện mạng Trên menu hình 5.5 chọn chức năng “huan luyen mang”,sau đó chọn file dữ liệu đã đ−ợc phân loại. Thời gian huấn luyện mạng tuỳ thuộc vào dữ liệu đầu vào lớn hay bé, nếu chạy bộ số liệu của hệ thống điện miền Bắc thì thời gian huấn luyện khoảng 7 phút. 5.3.5 Dự báo Trên menu hình 5.5 chọn chức năng “Du bao”. sau đó chọn file text đã l−u lại bộ trọng số sau khi huấn luyện, chọn file l−u mẫu số liệu đầu vào của ngày cần dự báo. Phần mềm sẽ đ−a ra kết quả dự báo, so sánh và vẽ đồ thị dữ liệu dự báo đ−ợc và dữ liệu đầu vào. Hình 5.6 và hình 5.7 là kết quả và đồ thị phụ tải đỉnh đã đ−ợc dự báo (từ ngày 08/05/2006 đến ngày 21/05/2006). Trên đồ thị hình 5.7 điểm 1 đến điểm 14 t−ơng ứng với ngày 08/05/2006 đến ngày 21/05/2006. Hình 5.5. Kết quả dự báo phụ tải đỉnh 105 Hình 5.5. Đồ thị phụ tải thực tế và dự báo 106 CHƯƠNG vI so sánh với một số kết quả đ∙ có và Đánh giá kết quả 6.1. So sánh với một số ph−ơng pháp đã có. - Ph−ơng pháp hồi quy tuyến tính (linear regression), ph−ơng pháp san bằng hàm số mũ (exponential smoothing), ph−ơng pháp san trung bình (moving averages), ph−ơng pháp hệ số ngẫu nhiên (stochatic) là những ph−ơng pháp đ−ợc đề xuất sớm nhất. Tuy nhiên các ph−ơng pháp này đều có một yêu cầu chung là phải xây dựng đ−ợc hàm hồi quy trên tập dữ liệu thống kê quá khứ. Các dữ liệu này có thể có các mối t−ơng quan nhiều chiều và có tác động tới kết quả dự báo khác nhau tuỳ thuộc vào mối t−ơng quan của chúng. Vậy nên việc giải các bài toán dự báo là rất khó khăn. Trong nhiều h−ớng nghiên cứu trong giai đoạn tới nhằm triển khai các hệ thống thông minh, mạng nơron là lựa chọn khá phổ biến, là cơ sở cho các giải pháp nhận dạng, dự báo…Mạng nơron nhân tạo là kỹ thuật xử lý thông tin mới mẽ đầy hứa hẹn trong việc ứng dụng vào bài toán dự báo. Kết hợp chặt chẽ với logic mờ, mạng nơron nhân tạo có thể giải quyết các bài toán phức tạp hiệu quả hơn. - So với các ph−ơng pháp dự báo truyền thống tr−ớc đây chủ yếu tập trung vào các bài toán tuyến tính, ph−ơng pháp sử dụng mạng nơron có thể học để xấp xỉ các bài toán mà quan hệ vào – ra là phi tuyến nhiều đầu vào và nhiều đầu ra với độ chính xác dự báo cao, phù hợp với dữ liệu đầu vào của phụ tải hệ thống điện. - Trong ph−ơng pháp mạng nơron, ta có thể thử nghiệm nhiều lần để điều chỉnh cấu trúc mạng, điều chỉnh các tham số học sao cho phù hợp để có đ−ợc kết quả dự báo tốt nhất. Trong khi các ph−ơng pháp cũ các công thức và tham 107 số đã đ−ợc xác định từ tr−ớc, không thể thay đổi đ−ợc, các kết quả dự báo trên các ph−ơng pháp cũ cũng là duy nhất. - Sử dụng ph−ơng pháp mạng nơron, ta có thể dự báo nhu cầu phụ tải ngày của hệ thống điện miền Bắc dựa trên tập dữ liệu vào mà không phải phụ thuộc vào kinh nghiệm chủ quan của các chuyên gia. Mạng nơron đã tự động xác định nó dựa trên tập trọng số sau huấn luyện của mạng. Việc dự báo dựa trên cơ sở mạng nơron tự động xác định mối quan hệ liên quan giữa các tập dữ liệu vào ra, cho ta thấy kết quả dự báo này đáng tin cậy hơn so với những ph−ơng pháp bị hạn chế về việc phụ thuộc phiến diện vào kinh nghiệm tr−ớc đây. - Trong quá trình học, mạng sẽ điều chỉnh các tham số sao cho tổng bình ph−ơng lỗi là nhỏ nhất, khả năng hội tụ của mạng phụ thuộc vào các tham số khởi đầu, vì vậy ta cần phải chạy thử nghiệm phần mềm nhiều lần để chọn đ−ợc bộ tham số ban đầu tốt nhất. Một vấn đề nữa th−ờng xảy ra đối với mạng nơron dự báo phụ tải là quá trình học không phải lúc nào cũng hội tụ và có khả năng rơi vào cực tiểu địa ph−ơng. Nếu mạng rơi vào tr−ờng hợp này ta sẽ phải bắt đầu huấn luyện lại hoặc thay đổi số nơron của lớp ẩn, điều này sẽ khiến cho mạng nơron không áp dụng đ−ợc trong các bài toán yêu cầu độ chính xác cao trong thời gian tối thiểu. - Sau đây là kết quả thực nghiệm nhằm đánh giá hiệu suất của hai cấu trúc mô hình mạng, mô hình thứ nhất đã đ−ợc đề xuất ở trên, mô hình thứ hai hiện đang đ−ợc sử dụng để dự báo phụ tải HTĐ Quốc gia với cấu trúc mạng nh− sau: + Lớp vào: 6 nơron đầu vào. + Lớp ẩn: 15 nơron + Lớp ra: Một nơron ra chính là phụ tải đầu ra của 1 giờ. 108 Ch−ơng trình đ−ợc viết bằng ngôn ngữ VBA tích hợp trong phần mềm ứng dụng Excel. Qua quá trình huấn luyện trên bộ dữ liệu đầu vào của Trung tâm Điều độ HTĐ miền Bắc với 30 mẫu đầu vào, sau 150000 vòng lặp. Mô hình thứ nhất chỉ mất khoảng 6 phút, còn mô hình thứ hai phải mất tới khoảng 3 giờ 25 phút: Bảng 5.2 và hình 5.1 đ−a ra kết quả dự báo của ngày 10/5/2006. Bảng 5.2. Bảng đánh giá kết quả dự báo của hai mô hình (ngày 10/5/2006.) P dự báo (MW) Sai số % Giờ P thực tế (MW) Mô hình 1 Mô hình 2 Mô hình 1 Mô hình 2 1 2003.0 1983.5 1937.4 0.97 3.28 2 1920.9 1962.1 1985.8 2.14 3.38 3 1941.6 1912.6 1920.4 1.49 1.09 4 1914.3 1915.9 1935.0 0.09 1.08 5 2020.2 2024.8 1980.7 0.23 1.96 6 2096.9 2159.2 2185.4 2.97 4.22 7 2166.4 2217.4 2254.6 2.36 4.07 8 2458.0 2449.1 2430.9 0.36 1.10 9 2670.1 2650.0 2638.9 0.75 1.17 10 3105.4 2975.4 2926.5 4.19 5.76 11 3211.6 3100.2 3084.5 3.47 3.96 109 12 2739.0 2641.5 2700.1 3.56 1.42 13 2646.1 2518.6 2612.3 4.82 1.28 14 2737.5 2612.9 2601.4 4.55 4.97 15 2669.6 2639.4 2633.4 1.13 1.36 16 2681.4 2671.0 2638.7 0.39 1.59 17 2968.0 2852.2 2805.4 3.90 5.48 18 3032.4 2967.6 2966.7 2.14 2.17 19 3226.7 3085.2 3052.3 4.39 5.40 20 3061.1 2910.8 2901.7 4.91 5.21 21 2847.6 2708.5 2745.2 4.88 3.60 22 2625.7 2520.0 2498.5 4.03 4.84 23 2471.2 2393.7 2387.4 3.14 3.39 24 2132.3 2138.8 2115.2 -0.31 0.80 110 Đồ thị đánh giá sai số 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Giờ % S ai s ố Mụ hỡnh 1 Mụ hỡnh 2 Nhận xét: Qua kết quả thực nghiệm nhằm đánh giá hiệu suất của hai cấu trúc mô hình mạng ta thấy. - Mô hình thứ nhất có thời gian huấn luyện mạng nhỏ hơn mô hình thứ 2 rất nhiều lần. Nguyên nhân chính là do mô hình 1 đ−ợc lập trình trên phần mềm Matlab đã đ−ợc hỗ trợ toolbox để xử lý các mô hình về mạng nơron, Hình 5.1. Kết quả dự báo của hai mô hình (ngày 10/05/2006) Thực tế Mụ hỡnh 2 Mụ hỡnh 1 Đồ thị phụ tải 0 500 1000 1500 2000 2500 3000 3500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Giờ C ô n g s u ất Hình 5.2. Sai số dự báo % của hai mô hình (ngày 10/05/2006) 111 còn mô hình hai đ−ợc lập trình bằng ngôn ngữ VBA tích hợp trong phần mềm ứng dụng Excel vì vậy ta phải viết lại toàn bộ thuật toán. - Qua một số kết quả chạy thử nghiệm trên hai mô hình với nhiều bộ số liệu khác nhau và căn cứ vào hai đồ thị trên hình 5.1 và 5.2 ta thấy mô hình thứ nhất có kết quả dự báo chính xác tốt hơn mô hình thứ hai. Điều đó chứng tỏ mô hình thứ nhất có cấu trúc mạng dự báo tốt và phù hợp với tập bài toán dự báo hơn so với cấu trúc mạng dự báo của mô hình thứ hai. 6.2. Đánh giá kết quả Độ chính xác và tốc độ xử lý: Phần mềm đ−ợc chạy thử nghiệm trên 31 bộ dữ liệu trong vòng 5 năm (5/2001-5/2006) của 29 Điện Lực trên toàn bộ HTĐ miền Bắc, hai bộ còn lại của Công ty điện lực I và của Trung tâm Điều độ HTĐ miền Bắc. Sau quá trình huấn luyện với 150000 vòng lặp, thời gian huấn luyện của mỗi bộ dữ liệu hết khoảng 5 phút 25 giây đến 8 phút 27 giây và mạng đạt đ−ợc kết quả dự báo của tháng 5 năm 2006 (từ 1/5/2006- 31/5/2006) với sai số % lớn nhất của từng điện lực đ−ợc đ−a ra trên bảng 5.1. Trong đó: - Pmin: Giá trị phụ tải nhỏ nhất trong tháng 5/2006 (Giá trị phụ tải đ−ợc lấy theo từng giờ trong ngày). - Pmax: Giá trị phụ tải lớn nhất trong tháng 5/2006. - Sai số %(Max): Sai số % lớn nhất, đây là kết quả dự báo tồi nhất mà phần mềm đ−a ra. Sai số % =(Pthực tế - Pdự báo)/ Pthực tế*100% Bảng 5.1. Bảng đánh giá kết quả sai số dự báo tháng 5/2006 trên 31 bộ số liệu của 31 Điện lực 112 Điện Lực Pmin Pmax Sai số %(Max) Điện Lực Pmin Pmax Sai số %(Max) HTĐ1 1412.7 3317.7 6.01 Nghệ An 62.5 196.8 6.02 Cty 1 890.3 2134.4 5.84 Cao Bằng 3.7 19.8 7.16 Hà Nội 245.0 818.0 7.12 Sơn La 6.2 35.4 6.92 Hải Phòng 92.5 259.7 4.81 Hà Tĩnh 10.9 60.9 6.10 Nam Định 30.2 143.1 6.74 Hoà Bình 10.0 41.7 5.92 Phú Thọ 45.8 119.6 4.61 Lào Cai 16.0 52.0 5.64 Quảng Ninh 65.2 188.3 4.89 Điện Biên 2.2 14.2 7.82 Thái Nguyên 43.0 168.0 5.41 Hà Giang 3.8 22.5 7.32 Bắc Giang 21.8 115.8 4.31 Ninh Bình 27.0 77.6 4.36 Hải D−ơng 87.8 198.3 3.75 Hà Nam 19.2 75.3 4.91 Thanh Hoá 68.0 220.0 4.24 Vĩnh Phúc 35.0 112.8 5.25 Hà Tây 64.3 237.9 5.61 Bắc Cạn 3.2 14.2 6.34 Thái Bình 30.6 115.1 5.78 Bắc Ninh 57.5 196.0 5.47 Yên Bái 8.3 34.1 7.02 H−ng Yên 35.4 156.6 6.24 Lạng Sơn 10.0 39.2 6.91 Lai Châu 1.5 6.7 5.97 Tuyên Quang 7.1 39.1 6.89 Trên bảng 5.1 ta thấy với 31 bộ dữ liệu đ−ợc dùng để thử nghiệm, trong đó các bộ dữ liệu có giá trị rất đa dạng, nh−ng sai số dự báo chỉ nằm trong khoảng 3,75% đến 7,85%. Nguyên nhân có những bộ dữ liệu khi dự báo có sai số lớn là do tỉ lệ chênh lệch giữa Pmax và Pmin lớn, giá trị phụ tải của các giờ trong ngày không đồng đều. Trên thực tế, đối với dự báo phụ tải sai số cho phép khoảng từ 5 – 10%. Vậy kết quả dự báo đã đạt đ−ợc các yêu cầu đề ra và phù hợp với tình hình vận hành hệ thống điện hiện nay. - Khẳ năng ứng dụng: Qua khai thác thử nghiệm ch−ơng trình dự báo phụ tải ngắn hạn sử dụng kỹ thuật mạng nơron tại Trung tâm Điều độ HTĐ 113 miền Bắc đã đạt đ−ợc những kết quả đáng kể nh− đã nên trên. Điều đó cho phép ta hy vọng vào triển vọng và tính khả thi của việc ứng dụng mô hình này thay thế cho mô hình cũ hiện đang đ−ợc áp dụng tại Trung tâm Điều độ HTĐ miền Bắc. Đặc biệt ch−ơng trình sẽ áp dụng dự báo rất hiệu quả đối với những Công ty Điện lực có tỉ lệ chênh lệch giữa Pmax và Pmin nhỏ và giá trị phụ tải của các giờ trong ngày khá đồng đều. 114 KếT LUậN Với mục đích nghiên cứu và áp dụng mạng nơron vào dự báo phụ tải hệ thống điện Miền Bắc, luận văn b−ớc đầu tìm hiểu về bài toán dự báo phụ tải ngắn hạn, tìm hiểu một số vấn đề mà các chuyên gia vận hành hệ thống điện quan tâm để từ đó có thể đ−a vào áp dụng trong thực tế. So với các ph−ơng pháp dự báo tr−ớc, ph−ơng pháp sử dụng mạng nơron có thể học để xấp xỉ các bài toán mà quan hệ vào – ra là phi tuyến với nhiều đầu vào và nhiều đầu ra đ−ợc các chuyên gia trên thế giới đánh giá là có độ chính xác cao, đ−ợc ứng dụng trong rất nhiều loại bài toán dự báo. Luận văn đã xem xét và nghiên cứu đ−ợc các thuật tính nh− xác định các tham số đầu vào, các kiến trúc mạng, quá trình huấn luyện… của mạng ánh xạ đặc tr−ng tự tổ chức kohonen và mạng nơron nhiều lớp lan truyền ng−ợc sai số từ đó mô phỏng xác định các đầu vào, đ−a ra kiến trúc của mạng và thực hiện huấn luyện mạng trên bộ dữ liệu thu thập đ−ợc tại trung tâm điều độ HTĐ Miền Bắc. Đối với ánh xạ tự tổ chức kohonen đ−ợc dùng để phân dạng kiểu ngày, đây là yếu tố quan trọng nhất cho quá trình dự báo phụ tải tiếp theo. Đầu vào của mạng là các dữ liệu phụ tải 24 giờ trong ngày. Qua quá trình huấn luyện mạng đã nhận ra đ−ợc các kiểu ngày đặc tr−ng trong hệ thống, −u điểm của ph−ơng pháp này là nó có thể nhận ra đ−ợc một số dạng kiểu ngày mới hoặc loại bỏ một số dạng kiểu ngày không bao giờ xuất hiện nữa mà các kỹ s− điều hành bằng kinh nghiệm của mình có thể không nhận ra hoặc nhận ra muộn. Vì thế phân dạng kiểu ngày sẽ là một ph−ơng tiện hỗ trợ cho các kỹ s− điều hành trong quá trình dự báo phụ tải và vận hành hệ thống. Mạng nơron nhiều lớp lan truyền ng−ợc sai số qua quá trình huấn luyện với tập mẫu vào là các giá trị phụ tải đỉnh hoặc phụ tải đáy và nhiệt độ cao nhất hoặc thấp nhất của các ngày có cùng kiểu và gần nhất với ngày dự báo, 115 đ−ợc sử dụng để dự báo phụ tải đỉnh và phụ tải đáy theo nhiệt độ môi tr−ờng, từ đó xác định đ−ợc các giá trị phụ tải 24 giờ trong ngày. Các thí nghiệm cho thấy nếu nh− mạng đ−ợc huấn luyện tốt, các tham số đầu vào đ−ợc lựa chọn cẩn thận, dữ liệu huận luyện đầy đủ và sát ngày cần dự báo thì khả năng dự báo đạt độ chính xác t−ơng đối cao với sai số nhỏ hơn 8%. Ngoài những −u điểm đặc biệt mạng nơron cũng có những nh−ợc điểm nhất định. Khả năng hội tụ của mạng phụ thuộc vào các tham số khởi đầu, vì vậy ta cần phải chạy thử nghiệm phần mềm nhiều lần để chọn đ−ợc bộ tham số ban đầu tốt nhất. Còn khả năng tổng quát hoá lại phụ thuộc rất nhiều vào dữ liệu đầu vào. Nếu dữ liệu đầu vào quá nhiều thì có thể dẫn đến trình trạng luyện mạng mất nhiều thời gian và khả năng tổng quát hoá kém, nếu ít dữ liệu thì sai số sẽ tăng. Một vấn đề nữa th−ờng xảy ra đối với mạng nơron trong dự báo phụ tải là quá trình học không phải lúc nào cũng hội tụ và có khả năng rơi vào cực tiểu địa ph−ơng . Nếu mạng rơi vào tr−ờng hợp này ta sẽ phải bắt đầu huấn luyện lại, điều này sẽ khiến cho mạng nơron không áp dụng đ−ợc trong các bài toán yêu cầu độ chính xác cao trong thời gian tối thiểu. Luận văn đ−ợc thực hiện trong thời gian ngắn chắc chắn không tránh khỏi những thiếu sót. Rất mong nhận đ−ợc những ý kiến đóng góp của quý thầy cô và những ng−ời quan tâm để luận văn đ−ợc hoàn thiện tốt hơn. Kiến nghị về nhứng nghiên cứu tiếp theo. 1. Phát triển mở rộng bài toán dự báo ngắn hạn theo nhiều loại thông số khác nhau có ảnh h−ởng trực tiếp đến phụ tải nh− nhiệt độ, độ ẩm, tốc độ gió… 2. Nghiên cứu ứng dụng mạng nơron nhân tạo để dự báo phụ tải dài hạn (khoảng từ 1 – 20 năm) dựa vào mức tăng tr−ởng GDP, tốc độ phát triển công nghiệp… 116 Tài liệu tham khảo Tài liệu tiếng việt [1] Tổng sơ đồ phát triển Điện lực Việt Nam giai đoạn 2001-2020 có xét đến triển vọng đến năm 2020 (6/2000), Viện năng l−ợng. [2] Tài liệu báo cáo tổng kết hàng năm của Trung tâm Điều độ HTĐ miền Bắc. [3] Nguyễn Đình Thúc (2000), Mạng nơron ph−ơng pháp và ứng dụng, Nhà xuất bản giáo dục. [4] L−ơng Mạnh Bá, Nguyễn Thanh Thuỷ (2003), nhập môn xử lý ảnh số, Nhà xuất bản khoa học và kỹ thuật. [5] Nguyễn Phùng Quang, Matlab & Simulink, Nhà xuất bản khoa học và kỹ thuật. [6] Quách Tiến Dũng (2000), Dự báo phụ tải hệ thống điện Việt Nam theo nhiệt độ môi tr−ờng, Báo cáo khoa học Tổng công ty điện lực Việt Nam. [7] Trịnh Khánh Ly (2004), Luận văn cao học, Tr−ờng ĐHBK-HN. [8] Lê Quốc Định, Nguyễn Trọng Đức (2005), áp dụng kỹ thuật mạng nơron trong tự động điều khiển hệ thống lái tàu. Tài liệu tiếng anh [9] Robert L. Harvey (1996), Neural Network Principles, Prentice –hall 117 international, inc [10] David M. Skapura, Building Neural Networks, Addison-Wesley Publishing Company [11] Howard Demuth, Mark Beale, Martin Hagan (March 2006), Neural Network Toolbox [12] Vanaja Iyer, Chun Che Fung and Tamas Gedeon (1998), A Fuzzy- Neural Approach to Electricity Load and Spotprice Forecasting in a Deregulated Electricity Market [13] Antti Laukkanen (2004), The use of special day information in a demand forecasting model for Nordic power market, [14] P.K. Dash, G. Ramakrishna, A.C. Liew, S. Rahman (1995), Fuzzy neural networks for time-series forecasting of electric load. [15] D.C.Sansom and T. K .Saha, Neural networks for forecasting electricity pool price in a deregulated electricity supply industry. 118 Phụ lục i Phần mềm mô phỏng mạng Kohonen trong bài toán phân loại ngày. w=rands (100,24); X = fopen(phanloaingay.xls, ‘w’) M1=19; pt=X'; delta =0.01; Q=size(w,1); for q=1:Q nq =w(q,:) ; a=sumsqr(nq); m=nq/sqrt(a); w(q,:) = m; k=sqrt(sumsqr(m)); end w1=w; %n=negdist (w,X); n=w*X; %n=0 Q1=size(X,2); for q=1:Q1 nk=n(:,q); k1=find(nk==max(nk)); k1=k1(1) 119 nk(k1)=-inf; % k6=find(nk==max(nk)) % k6=k6(1) ptq=pt(q,:); for i=-2:2 for j=-2:2 xi=mod(k1+i+M1-1,M1)+1; yj=mod(k1+j+M1-1,M1)+1; jj=M1*(yj-1)+xi; %kk=w(jj,:) w(jj,:)=w(jj,:)+ delta*(ptq - w(jj,:)); end end fclose(X) end 120 Phụ lục II Phần mềm mô phỏng mạng nơron lan truyền ng−ợc sai số ứng dụng trong bài toán dự báo đỉnh và đáy đồ thị phụ tải và kết quả huấn luyện 1. Ch−ơng trình chính % menu display(' CHUONG TRINH DU BAO PHU TAI'); display(' ====================='); chon=menu('Hay chon chuc nang','1. Phan loai so lieu','2. Huan luyen mang', '3. Du Bao ','4. Thoat ') switch chon case chon == 1 fn=input('Nhap ten file du lieu:' ,'s'); P1=fopen(fn,'w'); phanloaingay case chon==2 fn=input('Nhap ten file du lieu:' ,'s'); huanluyenmang case chon==3 fn1=input('Nhap ten file trong so W1:' ,'s'); fn2=input('Nhap ten file trong so W2' ,'s'); Dubao OTHERWISE exit end 121 2. Module dự báo phụ tải w1=rands (30,8); P= fopen(dubaophutai.xls, ‘w’) alpha=0.4; %He so hoc beta =0.6 ;%He so quan tinh ep=15000; w2=rands(1,30);%Trong so lop an w11=w1; w22=w2; for i=1:ep aj=w1*P';% Tong thong tin dau vao lop an Y yj=logsig(aj);% Output lop an bk=w2*yj; % Tong thong tin dau vao lop ra Z zk=logsig(bk);%Gia tri output Errk=dk-zk; ee=sumsqr(Errk); tetak=(1-zk).*Errk.*zk; %Sai so lop ra tetaj=yj.*(1-yj).*(w2'*tetak);% Sai so lop an dw1=alpha*tetaj*P + beta*(w1-w11); w11=w1; w1=w1+dw1; % Cap nhat trong so lop vao dw2=alpha*tetak*yj' + beta*(w2-w22); w22=w2; w2=w2+dw2; end 122 Z=zk ; q=size(Z,2); D=dk; SSTD=abs(dk-zk); Errk=(dk-zk)./D*100; w1=w1; w2=w2; display= input([' Ket qua du bao: \n']); disp (display) display= input([' STT Pchtt Pchdb Ptt Pdb SSTD SS% \n']); disp (display) for i=1:q display= sprintf(' %2d %2.4f %2.4f %4.1f %4.1f %5.2f %1.2f',... i,D(i),Z(i), D(i)*5000,Z(i)*5000,SSTD(i)*5000,SSTD(i)/D(i)*100 ); disp(display); end Err=ee/2 display= input(['Trong do: \n\n Pchtt: Phu tai chuan hoa thuc te \n',... ' Pchdb: Phu tai chuan hoa du bao \n',... ' Ptt : Phu tai thuc te \n',... ' Pdb : Phu tai du bao \n',... ' SSTD : Sai so tuyet doi \n',... ' SS% : Sai so % \n'... ' Err : Binh phuong sai so']); disp (display) fclose(P) 123 Tóm tắt luận văn Trong những năm gần đây, cùng với sự phát triển lớn mạnh của nền kinh tế quốc gia, nhu cầu tiêu thụ điện năng hàng năm đã tăng lên rất nhiều, đặc biệt đối với HTĐ miền Bắc bình quân hàng năm tăng trên 12,6%. Vì vậy chúng ta phải huy động vốn rất lớn để đầu t− xây dựng nhiều nguồn phát điện và mua điện của các n−ớc trong khu vực, nh−ng thực tế nếu không dùng hết công suất đ−ợc huy động, chúng sẽ gây nhiều lãng phí. Vì vậy việc dự báo phụ tải chính xác sẽ trợ giúp cho nhiều chức năng quan trọng đối với kế hoạch phát triển điện năng trong t−ơng lai, lập kế hoạch hoá vận hành HTĐ nh− phân phối phụ tải một cách kinh tế, hiệu quả, lên kế hoạch bảo d−ỡng và sửa chữa, lập ph−ơng thức vận hành…Luận văn chủ yếu tập trung nghiên cứu và giải quyết các vấn đề sau. 1. Tìm hiểu các yếu tố ảnh h−ởng đến phụ tải HTĐ miền Bắc, tầm quan trọng của bài toán dự báo phụ tải trong công tác vận hành hệ thống điện 2. Tìm hiểu các đặc điểm, các dạng của ĐTPT, giá trị phụ tải đặc biệt trong ngày mà đ−ợc các kỹ s− vận hành cũng nh− ng−ời làm ph−ơng thức ngày quan tâm nhiều nhất (Pmax, Pmin) 3. Tìm hiểu các kiến thức cơ bản của mạng nơron nhân tạo, cơ sở lý thuyết, mô hình mạng nơron nhân tạo. 4. Nghiên cứu, thiết kế cấu trúc mạng nơron, ph−ơng pháp huấn luyện mạng; xây dựng phần mềm mô phỏng mạng Kohonen phân loại ngày; đ−a ra một số kết quả và phân tích đánh giá kết quả đạt đ−ợc. 5. Nghiên cứu, thiết kế cấu trúc mạng nơron nhiều lớp lan truyền ng−ợc sai số, từ đó áp dụng và xây dựng phần mềm dự báo phụ tải đỉnh và đáy đồ thị phụ tải, dự báo phụ tải cho 24 giờ trong ngày, đ−a ra một số kết quả và phân tích đánh giá kết quả đạt đ−ợc. 124 Summary In recent years, with strong development of national economy, annual power consuming demand has been rapidly increased, especially for the Northern Power System, annual average demand has an increase of over 12.6%. Therefore, it is necessary to mobilize a huge amount of capital to invest and construct more Power Supply Sources and purchase power from other nations in the region. In reality, however, if mobilized capacity is not used up, it is wasteful. Therefore, correct load forecast plays an important role in making plan of electricity development in the future, power system operation such as economically load distribution, repairmen, maintenance and operation method as well. The thesis mainly focuses on researching and solving the following problems: 1. Study factors affecting to load of the Northern Power System, the importance of load forecast in power system operation. 2. Study characteristics, types of additional charge diagrams, daily special load value that operators as well as method-makers are increasingly concerning as the most important thing (Pmax, Pmin). 3. Study basic knowledge of artificial neural network, theory basis, and artificial neural network model. 4. Study, design neural network structure, network training method; construct a software imitating Kohonen that distinguish types of days; give out some results, analyze and evaluate the result obtained. 5. Study, design back-propagation Neural Network and then apply and set up a load forecast software at top and bottom of load diagram, forecast load for 24 hours in one day, give out some results, analyze and evaluate the result obtained. ._.

Các file đính kèm theo tài liệu này:

  • pdfLA3275.pdf
Tài liệu liên quan