Tài liệu Nghiên cứu ứng dụng mạng Nơron Elman nhận dạng vị trí Rôbốt hai khâu: ... Ebook Nghiên cứu ứng dụng mạng Nơron Elman nhận dạng vị trí Rôbốt hai khâu
103 trang |
Chia sẻ: huyen82 | Lượt xem: 1888 | Lượt tải: 0
Tóm tắt tài liệu Nghiên cứu ứng dụng mạng Nơron Elman nhận dạng vị trí Rôbốt hai khâu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là công trình do tôi tổng hợp và nghiên cứu.
Trong luận văn có sử dụng một số tài liệu tham khảo như đã nêu trong phần tài
liệu tham khảo.
Tác giả luận văn
Nguyễn Việt Hùng
LỜI NÓI ĐẦU
Trong hệ thống điều khiển hiện đại, có rất nhiều phương pháp điều khiển
đảm bảo được tốt chất lượng điều khiển. Trong điều khiển tự động, để điều khiển
chính xác đối tượng khi chưa biết rõ được thông số, trước tiên ta phải hiểu rõ đối
tượng đó. Đặc biệt đối với các đối tượng phi tuyến ta cần nhận dạng được đặc tính
vào-ra của nó để đảm bảo tạo ra tín hiệu điều khiển thích nghi được lựa chọn chính
xác hơn. Ngày nay trên thế giới người ta dựa vào cấu trúc mạng nơron sinh vật để
làm mạng nơron nhân tạo áp dụng vào các ngành khoa học kỹ thuật. Mạng nơron
được ứng dụng ở nhiều lĩnh vực. Mong muốn của chúng ta là nhân tạo hóa các thiết
bị, đặc biệt trong lĩnh vực máy tính, điều khiển và rôbôt vận dụng những đặc tính
trội của nơron thần kinh.
Trong thời gian của khoá học cao học, chuyên ngành Tự động hoá tại trường
Đại học Kỹ thuật Công nghiệp Thái Nguyên, được sự tạo điều kiện giúp đỡ của nhà
trường và Tiến sĩ Phạm Hữu Đức Dục em đã lựa chọn đề tài của mình là:
“Nghiên cứu ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu”.
Trong quá trình thực hiện đề tài, được sự hướng dẫn nhiệt tình của Tiến sĩ
Phạm Hữu Đức Dục, sự giúp đỡ của bạn bè cùng với sự nỗ lực, cố gắng của bản
thân đến nay bản luận văn của em đã hoàn thành.
Dù đã có nhiều cố gắng, xong bản luận văn vẫn không tránh khỏi những thiếu
sót và hạn chế, em rất mong nhận được sự góp ý của các thầy để bản luận văn của
em được hoàn thiện hơn.
Em xin trân trọng cảm ơn!
Học viên
Nguyễn Việt Hùng
yi
MỤC LỤC
Trang
Lời cam đoan.
Mục lục
Danh mục các ký hiệu, các chữ viết tắt.
Danh mục các hình vẽ, đồ thị
PHẦN MỞ ĐẦU. 1
Chương I- TÔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO. 6
1.1. Lịch sử phát triển của mạng nơ ron nhân tạo. 6
1.1.1 Mô hình nơron sinh học 6
1.1.1.1 Chức năng, tổ chức và hoạt động của bộ não con người. 6
1.1.1.2 Mạng nơron sinh học 9
1.1.2. Mạng nơ ron nhân tạo. 10
1.1.3. Lịch sử phát triển của mạng nơron nhân tạo 11
1.1.4. Các tính chất của mạng nơron nhân tạo 12
1.2. Cấu tạo mạng noron. 12
1.3. Cấu trúc mạng noron. 14
1.4. Phương thức làm việc của mạng nơron. 16
1.5. Các luật học 18
1.6. Mạng nơron truyền thẳng và mạng nơron hồi quy. 23
1.6.1. Mạng nơron truyền thẳng. 23
1.6.1.1. Mạng một lớp nơron. 23
1.6.1.2. Mạng nhiều lớp nơron. 23
1.6.2. Mạng nơron hồi quy. 24
1.6.2.1. Mạng hồi quy không hoàn toàn 25
1.6.2.2. Mạng các dãy của Jordan 25
1.6.2.3. Mạng hồi quy đơn giản 27
1.7. Các ứng dụng của mạng nơron 28
1.8. Công nghệ phần cứng sử dụng mạng nơron. 31
1.9. So sánh khả năng của mạng nơron với mạch lôgic: 32
1.10. KẾT LUÂN CHƯƠNG I 33
Chương II: CÁC PHƯƠNG PHÁP ỨNG DỤNG MẠNG NƠRON TRONG
NHẬN DẠNG
34
2.1 Khái quát chung 34
2.1.1 Đặt vấn đề 34
2.1.2. Định nghĩa 35
2.1.3. Sơ lược về sự phát triển của các phương pháp nhận dạng 36
2.2. Các phương pháp nhận dạng 37
2.2.1. Nhận dạng On-line. 38
2.2.1.1.Phương pháp lặp bình phương cực tiểu 38
2.2.1.2.Phương pháp xấp xỉ ngẫu nhiên 39
2.2.1.3. Phương pháp lọc Kalman mở rộng 40
2.2.2. Nhận dạng off-line 42
2.2.2.1. Phương pháp xấp xỉ vi phân 43
2.2.2.2 Phương pháp gradient 44
2.2.2.3. Phương pháp tìm kiếm trực tiếp 45
2.2.2.4. Phương pháp tựa tuyến tính 46
2.2.2.5. Phương pháp sử dụng hàm nhạy 47
2.2.3. Nhận dạng theo thời gian thực 47
2.3. Mô tả toán học của đối tượng ở rời rạc 48
2.4. Nhận dang hệ thống sử dụng mạng nơron 52
2.4.1. Mô hình nhận dạng kiểu truyền thẳng 53
2.4.2 Mô hình song song 54
2.4.3 Mô hình nối tiếp - song song 55
2.4.4. Mô hình ngược trực tiếp 57
2.5. Tính gần đúng hàm số dùng mạng nơron. 57
2.6. Mô hình mạng nơron trong nhận dạng. 59
2.7. KẾT LUÂN CHƯƠNG II 61
Chương III: ỨNG DỤNG MẠNG NƠRON ELMAN NHẬN DẠNG VỊ TRÍ
RÔBÔT HAI KHÂU
62
3.1. Mạng nơron Elman: 62
3.1.1. Cấu trúc mạng Elman 62
3.1.2. Giá trị đầu vào của các tham số. 64
3.1.3. Huấn luyện 64
3.2. Động học rôbốt hai khâu 64
3.2.1. Phân tích chọn mạng nơron Elman nhận dạng vị trí rôbôt hai khâu 64
3.2.2. Động học rôbốt hai khâu 66
3.3. Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu 67
3.3.1. Thiết lập sơ đồ nhận dạng 67
3.3.2. Quá trình nhận dạng 69
3.4. KẾT LUÂN CHƯƠNG III 89
3.5. KẾT LUẬN CHUNG VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 90
Phần mở đầu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1
PHẦN MỞ ĐẦU
1. Tính cấp thiết của đề tài:
Nước ta đang bước vào thời kỳ Công nghiệp hóa- hiện đại hóa đất nước.
Tự động hóa là một nhu cầu cấp bách để tăng năng suất lao động, nâng cao chất
lượng sản phẩm, cải thiện điều kiện làm việc của người lao động thúc đẩy sự
phát triển của nền kinh tế.
Trong các ngành công nghiệp tự động hoá giữ một vai trò quan trọng nó cho
phép tự động hoá các quá trình sản xuất. Nhận dạng hệ thống là một trong những
công việc đầu tiên phải thực hiện khi giải quyết một bài toán điều khiển tự động,
nó quyết định chất lượng và hiệu quả của công việc điều khiển hệ thống về sau.
Tuy ra đời muộn nhưng nhận dạng đã phát triển rất nhanh và đã có những thành
tựu vượt bậc. Nguyên nhân của sự phát triển vượt bậc đó một phần từ yêu cầu
thực tế, song có lẽ phần chính là nhờ có những hỗ trợ tích cực của các ngành
khoa học có liên quan như tin học, lý thuyết điều khiển mờ và mạng nơron.
Để điều khiển chính xác đối tượng khi chưa biết rõ được thông số, trước tiên ta
phải hiểu rõ đối tượng đó. Đối với đối tượng là phi tuyến như rô bôt hai khâu, ta
cần nhận dạng đặc tính vào - ra của nó để đảm bảo tạo tín hiệu điều khiển thích
nghi được lựa chọn chính xác hơn. Hiện nay thường sử dụng logic mờ ( Fuzzy
Logic ), mạng nơron ( Neural Network) và mạng nơron mờ ( Fuzzy Neural
Network) để nhận dạng và điều khiển thích nghi đối tượng có thông số thay đổi.
Trong chương trình khoá học Cao học chuyên ngành Tự động hoá tại trường Đại
học Kỹ thuật Công nghiệp Thái Nguyên, được sự tạo điều khiện giúp đỡ của nhà
trường và Tiến sĩ Phạm Hữu Đức Dục, em đã lựa chọn đề tài tốt nghiệp của
mình là :“ Nghiên cứu ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu”.
Phần mở đầu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2
2. Ý nghĩa khoa học và thực tiễn của đề tài.
a. Ý nghĩa khoa học: Với đề tài ứng dụng mạng nơron Elman nhận dạng vị trí
rô bôt hai khâu. Sau khi đã nhận dạng được đối tượng ta có thể thay thế gần đúng
mô hình vị trí rô bôt hai khâu bằng một mạng nơron Elman.
b.Ý nghĩa thực tiễn: Từ các thông số mô phỏng của mạng nơron, ta có thể
tính toán được tín hiệu điều khiển nhằm điều khiển thích nghi rôbôt hai khâu.
3. Mục đích của đề tài
Để điều chỉnh được chính xác một đối tượng, trước tiên ta phải hiểu rõ tất
cả các thông số của đối tượng đó. Đối với đối tượng có thông số tải thay đổi như
vị trí rô bôt 2 khâu, ta cần nhận dạng đặc tính vào - ra của nó để bảo đảm tạo ra
được tín hiệu điều khiển thích nghi được chính xác hơn.
Đề tài này nghiên cứu một ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt 2
khâu. Sơ đồ hình 1 mô tả một mô hình điều chỉnh thích nghi rôbôt hai khâu theo
mô hình mẫu.
Hình 1. Sơ đồ khối điều khiển thích nghi rôbôt hai khâu
Bộ điều
khiển
Rôbôt hai khâu
Mô hình mẫu
Mạng nơron
nhận dạng
xd
ym
-ymh
e2
u
Khoá K
Khoá K
e1
y
ymh
e2
2e
•
2e
••
…
Phần mở đầu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
3
Sơ đồ điều khiển thực hiện theo 2 giai đoạn sau đây:
- Giai đoạn 1:
Sử dụng mạng nơron nhận dạng vị trí rôbôt hai khâu. Khi đó các khóa K
mở. Căn cứ vào sai lệch e1 giữa tín hiệu ra của rôbôt là y và tín hiệu ra của
mạng nơron nhận dạng là ymh, mạng nơron tiến hành “HỌC” để nhận dạng đặc
tính đầu ra y của rô bôt hai khâu, sao cho tín hiệu ra của mạng nơron nhận dạng
ymh bám theo được tín hiệu ra y của rôbôt hai khâu. Với mh1 yye −= .
- Giai đoạn 2: Căn cứ vào kết quả nhận dạng ta có được một mạng nơron
có thể thay thế gần đúng rôbôt hai khâu, từ đó tiến hành điều khiển thích nghi rô
bôt hai khâu theo mô hình mẫu. Các khoá K đóng. Dựa vào bộ thông số sai lệch
(e2, ,...e,e 22
•••
) giữa tín hiệu đầu ra của mô hình mẫu ym và tín hiệu đầu ra của
mạng nơron nhận dạng ymh, bộ điều khiển thực hiện các luật học thích nghi tạo ra
tín hiệu điều khiển u với mục đích làm cho tín hiệu đầu ra y mh của mạng nơron
nhận dạng bám theo được tín hiệu đầu ra của mô hình mẫu ym. Với
mhm2 yye −= và ,...e,e 22
•••
là đạo hàm các cấp của sai lệch e2.
Phần này sử dụng các luật học điều khiển thích nghi vị trí rôbôt hai khâu
sẽ được thực hiện ở các công trình khoa học cấp cao hơn.
4. Đối tượng và phạm vi nghiên cứu của đề tài:
Trong khuôn khổ của luận văn Thạc sĩ Kỹ thuật, với thời gian nghiên cứu có
hạn, luận văn này chỉ đi sâu nghiên cứu ứng dụng mạng nơron nhận dạng vị trí
rô bôt hai khâu (đã trình bày ở giai đoạn 1 tại sơ đồ hình 1). Luận văn này cũng
giới hạn phạm vi nghiên cứu: sử dụng mạng nơron Elman đóng vai trò là mạng
nơron nhận dạng và đối tượng cần nhận dạng là vị trí rôbôt hai khâu.
Phần mở đầu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
4
Phần mở đầu
Chương 1. Tổng quan về mạng nơron nhân tạo.
Phân tích tổng quan về mạng nơron bao gồm: phần lịch sử phát triển, kết
cấu của mạng các nơron, ứng dụng của chúng...
Chương 2. Các phương pháp ứng dụng mạng nơron trong nhận dạng.
Chương 2 tập trung trình bày các phươn g pháp ứng dụng mô hình
mạng nơron trong nhận dạng .
Chương 3. Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu.
+ Tổng quan về mạng Elman
+ Phân tích chọn mạng nơron Elman tiến hành nhận dạng vị trí rôbôt hai
khâu
Hình 2. Mô hình nhận dạng vị trí rôbôt hai khâu
Mạng nơron
Elman
Rôbôt hai khâu
( Mô hình tính toán vị trí)
x(h) y(k)
e(k)
-
^
y (k)
+
Luật học của
mạng nơron
Elman
Phần mở đầu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
5
+ Động học rôbôt hai khâu
+ Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
+ Để thấy rõ hơn ưu điểm của việc sử dụng mạng nơron Elman trong nhận
dạng vị trí rôbôt hai khâu tiến hành so sánh cấu trúc và khả năng nhận dạng
của mạng nơron Elman với mạng nơron truyền thẳng khi chúng cùng được
sử dụng nhận dạng vị trí rôbôt hai khâu.
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
6
CHƯƠNG I
TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO
1.1. Cở sở về mạng nơron
1.1.1 Mô hình nơron sinh học
1.1.1.1 Chức năng, tổ chức và hoạt động của bộ não con người.
Bộ não con người có chức năng hết sức quan trọng trong đời sống của con
người. Nó gần như kiểm soát mọi hành vi của con người từ hoạt động cơ bắp đơn
giản đến những hoạt động phức tạp như học tập, nhớ, suy luận, tư duy, sáng tạo….
Bộ não người được hình thành từ sự liên kết của khoảng 1011 phần tử (tế
bào), trong đó có khoảng 1010 phần tử là nơron, số còn lại khoảng 9x1010 phần tử là
các tế bào thần kinh đệm và chúng có nhiệm vụ phục vụ cũng như hỗ trợ cho các
nơron. Thông thường một bộ não trung bình cân nặng khoảng 1,5 Kg và có thể tích
là 235 cm3. Cho đến nay người ta vẫn chưa thực sự biết rõ c ấu tạo chi tiết của bộ
não. Tuy vậy về đại thể thì cấu tạo bộ não được chia ra thành nhiều vùng khác nhau.
Mỗi vùng có thể kiểm soát một hay nhiều hoạt động của con người.
* Các đặc tính của não người:
- Tính phân lớp: Các vùng của bộ não được phân thành các lớp, thông tin được
xử lý theo các tầng.
- Tính mô đun: Các vùng của bộ nhớ được phân thành các mô đun được mã
hoá bằng các định nghĩa mối quan hệ tích hợp giữa các tín hiệu vào qua các giác
quan và các tín hiệu ra.
- Mối liên kết: Liên kết giữa các lớp dẫn đến các dữ liệu dùng chung xem như
các liên hệ phản hồi khi truyền tín hiệu.
- Sử lý phân tán các tín hiệu vào: Các tín hiệu vào được truyền qua nhiều kênh
thông tin khác nhau, được xử lý bằng các phương pháp đặc biệt.
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
7
Bộ não có cấu trúc nhiều lớp: Lớp bên ngoài thường thấy là các nếp nhăn, là
lớp có cấu tạo phức tạp nhất. Đây là nơi kiểm soát và phát sinh các hành động phức
tạp như nghe, nhìn, tư duy…
Tín hiệu thu, nhận ở các dạng xung điện – màng membrane: mỗi tế bào thần
kinh có một màng, có nhiệm v ụ giữ cho các chất nuôi tế bào không tràn ra ngoài.
Do đó các phần tử nội bào và ngoại bào không bằng nhau, giữa chúng có dung dịch
muối lỏng làm cho chúng bị phân rã ra thành các nguyên tử âm và dương ra khỏi tế
bào bằng với lực hút chúng vào trong tế bào.
Điện thế màng là phần tử quan trọng trong quá trình truyền tin của hệ thần
kinh. Khi thay đổi khả năng thẩm thấu ion của màng thì điện thế màng của tế bào bị
thay đổi và tiến tới một ngưỡng nào đó, đồng thời sinh ra dòng điện. Dòng điện này
gây ra phản ứ ng kích thích làm thay đổi khả năng thẩm thấu ion của tế bào tiếp
theo.
* Xử lý thông tin trong não bộ:
Thông tin được tiếp nhận từ các giác quan và chuyển vào các tế bào thần kinh
vận động vào các tế bào cơ. Mỗi tế bào thần kinh tiếp nhận thông tin, điện thế sẽ
tăng trong thần kinh cảm giác, ý nghĩa dòng điện đó được giải mã và lưu ở thần
kinh trung ương, kết quả xử lý thông tin được gửi đến các tế bào cơ.
Các tế bào thần kinh đưa các tín hiệu giống nhau, do đó không thể phân biệt
được đó là của loài động vật nguyên thuỷ hay của một giáo sư. Các khớp thần kinh
chỉ cho các tín hiệu phù hợp qua chúng, còn lại các tín hiệu khác bị cản lại. Lượng
tín hiệu được biến đổi gọi là cường độ khớp thần kinh đó chính là trọng số của
nơron trong mạng nơron nhân tạo.
Tại sao việc nghiên cứu về mạng thần kinh lại có tầm quan trọng lớn lao. Có
thể trả lời ngắn gọn là sự giống nhau của các tín hiệu của các tế bào thần kinh đơn
lẻ. Do dó chức năng thực sự của bộ não không phụ thuộc vào vai trò của một tế bào
thần kinh đơn, mà phụ thuộc vào toàn bộ các tế bào thần kinh hay các tế bào thần
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
8
kinh liên kết với nhau thành một mạng thần kinh hay một mạng nơron ( Neural
Networks)
Hoạt động của bộ não nói riêng và của hệ thần kinh nói chung đã được con
người quan tâm nghiên cứu từ lâu nhưng cho đến nay người t a vẫn chưa hiểu rõ
thực sự về hoạt động của bộ não và hệ thần kinh. Đặc biệt là trong các hoạt động
liên quan đến trí óc như suy nghĩ, nhớ, sáng tạo…Tuy thế cho đến nay người ta
cũng có những hiểu biết căn bản về hoạt động cấp thấp của não.
Mỗi nơron liên kết với khoảng 104 nơron khác cho đến khi hoạt động thì bộ
não hoạt động một cách tổng lực và đạt hiệu quả cao. Nói một cách khác là các
phần tử của não bộ hoạt động một cách song song và tương tác hết sức tinh vi phức
tạp và hiệu quả hoạt động thường rất cao, nhất là trong các vấn để phức tạp. Về tốc
độ xử lý của bộ não người rất nhanh mặc dù tốc độ xử lý của mỗi nơron (có thể xem
như phần tử xử lý hay phần tử tính) là rất chậm so với xử lý của các cổng logic
silicon trong các chip vi xử lý ( 103 giây so với 1010 giây)
* Hoạt động của cả hệ thống thần kinh bao gồm não bộ và các giác quan như
sau:
- Trước hết con người bị kích thích bởi giác quan từ bên ngoài hoặc trong cơ
thể. Sự kích thích đó được biến thành các xung điện bởi chính giác quan tiếp nhận
kích thích. Những tín hiệu này được chuyển về trung ương thần kinh là não bộ để
xử lý. Trong thực tế não bộ liên tục nhận thông tin xử lý, đánh giá và so sánh với
thông tin lưu trữ để đưa ra quyết định thích đáng.
- Những mệnh lệnh cần thiết được phát sinh và gửi đến bộ phận thi hành thích hợp
như các cơ tay, chân… Những bộ phận thi hành biến những xung điện thành dữ liệu
xuất của hệ thống.
* Tóm lại : Bộ não người có chức năng hết sức quan trọng đối với đời sống của con
người. Cấu tạo của nó rất phức tạp, tinh vi bởi được tạo thành từ mạng nơron có
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
9
hàng chục tỉ tế bào với mức độ liên kết giữa các nơron là rất cao. Hơn nữa nó còn
được phân chia thành các vùng và các lớp khác nhau. Bộ não hoạt động dựa trên cơ
chế hoạt động song song của các nơron tạo nên nó
1.1.1.2 Mạng nơron sinh học
Mạng nơron bao gồm vô số các nơron được liên kết truyền thông với nhau
trong mạng. Hình 1.1 là một phần của mạng nơron bao gồm hai nơron.
Một nơron bao gồm các thành phần cơ bản:
Thân nơron được giới hạn trong một màng membran và trong cùng là nhân, từ
thân nơron còn có rất nhiều đường rẽ nhánh gọi là rễ.
Đường liên lạc liên kết nơron này với nơron khác được gọi là axôn, trên axôn
có các đường rẽ nhánh. Nơron có thể liên kết với các nơron khác qua các rễ. Chính
vì sự liên kết đa dạng như vậy nên mạng nơron có độ liên kết cao.
Hình 1.1. Mạng nơron đơn giản gồm 2 nơron
Axôn được nối với rễ đầu vào của
nơron 2
Rễ đầu ra
Rễ đầu ra của nơron 1 được nối với axôn
Nhân
Axôn
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
10
Các rễ của nơron được chia thành hai loại: loại nhận thông tin từ nơron khác
qua axôn, mà ta sẽ gọi là rễ đầu vào và loại đưa thông tin qua axôn tới các nơron
khác gọi là rễ đầu ra.
Một nơron có thể có nhiều rễ đầu vào, nhưng chỉ có một rễ đầu ra. Như thế,
nếu xem nơron như một khâu điều khiển thì đó chính là khâu có nhiều đầu vào, một
đầu ra.
Quá trình hoạt động của một nơron là một quá trình điện hoá tự nhiên. Ở trạng
thái cân bằng (trạng thái tĩnh) điện áp của màng membran khoảng -75mV. Khi có
tác động bên ngoài vào nơron (mức điện áp khoảng 35mV), trong tế bào nơron xảy
ra hàng loạt các phản ứng hoá học tạo thành lực tác động làm nơron bị kích hoạt.
Thế năng sinh ra khi nơron ở trạng thái bị kích thích hoàn toàn này chỉ tồn tại
khoảng vài mili giây sau đó nơron lại trở về trạng thái cân bằng cũ, thế năng này
được truyền vào mạng qua axôn và có khả năng kích thích hoặc kìm hãm tự nhiên
các nơron khác trong mạn g. Một nơron sẽ ở trạng thái kích thích khi tại đầu vào
xuất hiện một tín hiệu tác động vượt qua ngưỡng cân bằng của nơron.
Một tính chất cơ bản của mạng nơron sinh học là các đáp ứng theo kích thích có khả
năng thay đổi theo thời gian. Các đáp ứng có thể tăng lên, giảm đi hoặc hoàn toàn
biến mất. Qua các nhánh axôn liên kết tế bào nơron này với tế bào nơron khác, sự
thay đổi trạng thái của một nơron cũng kéo theo sự thay đổi trạng thái của những
nơron khác dẫn đến sự thay đổi của toàn bộ mạng nơron. Việc t hay đổi trạng thái
của mạng nơron có thể thực hiện qua một quá trình dạy hoặc do khả năng học tự
nhiên
1.1.2 Mạng nơron nhân tạo
Sự thay thế những tính chất này bằng một mô hình toán học tương đương được gọi
là mạng nơron nhân tạo. Mạng nơron nhân tạo có thể được chế tạo bằng nhiều cách
khác nhau vì vậy trong thực tế tồn tại rất nhiều kiểu mạng nơron nhân tạo.
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
11
p2
pm
Hình 1.2. Biểu diễn một nơron nhân tạo đơn giản bao gồm m đầu vào và một đầu
ra.
Đứng về mặt hệ thống một nơron là một hệ thống MISO quen thuộc với nhiều
đầu vào và một đầu ra. Cấu trúc của một nơron gồm một bộ tổng và một hàm truyền
f(n).
Quan hệ giữa các đầu vào và ra của một nơron được biểu diễn bằng phương
trình toán học như sau:
a = f(n), trong đó f là hàm chuyển đổi, w là trọng số và b là tham số bù.
1.1.3. Lịch sử phát triển của mạng nơron nhân tạo
Mạng nơron nhân tạo đã có một lịch sử lâu dài. Năm 1943, McCulloch và Pitts
đã đưa ra khả năng liên kết và một số liên kết cơ bản, của mạng nơron. Năm 1949,
Hình 1.2. Nơron nhiều đầu vào
f
w1
w2
wm
b
:
:
:
1
P1
a
n
[ ] bWpbppp
w
w
w
bwpn m
m
m
k
kk +=+
=+= ∑
=
...*
:
. 21
2
1
1
(1.1)
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
12
Hebb đã đưa ra các luật thích nghi trong mạng nơron. Năm 1958, Rosenblatt đưa ra
cấu trúc Perception. Năm 1969, Minsky và Papert phân tích sự đúng đắn của
Perception, họ đã chứng minh các tính chất và chỉ rõ các giới hạn của một số mô
hình. Năm 1976, Grossberg dựa vào tính chất sinh học đã đưa ra một số cấu trúc
của hệ động học phi tuyến với các tính chất mới. Năm 1982, Hoppfield đã đưa ra
mạng học phi tuyến với các tính chất mới. Năm 1982, Rumelhart đưa ra mô hình
song song (Parallel Distributer Processing-PDS) và một số kết quả và thuật toán.
Thuật toán học lan truyền ngược (Back Propagation learning rule) được Rumelhart,
Hinton, Williams (1986) đề xuất luyện mạng nơron nhiều lớp. Những năm gần đây,
nhiều tác giả đã đề xuất nhiều loại cấu trúc mạng nơron mới. Mạng nơron được ứng
dụng trong nhiều lĩnh vực kinh tế, kỹ thuật, khoa học vũ trụ (Hecht - Nielsen,
1988).
1.1.4. Các tính chất của mạng nơron nhân tạo
- Là hệ phi tuyến: Mạng nơron có khả năng to lớn trong lĩnh vực nhận dạng và
điều khiển các đối tượng phi tuyến.
- Là hệ xử lý song song: Mạng nơron có cấu trúc song song, do đó có tốc độ
tính toán rất cao, rất phù hợp với lĩnh vực nhận dạng và điều khiển.
- Là hệ học và thích nghi: Mạng được luyện từ các số liệu quá khứ, có khả
năng tự chỉnh khi số liệu đầu vào bị mất, có thể điều khiển on-line.
- Là hệ nhiều biến, là hệ nhiều đầu vào, nhiều đầu ra (Many Input Many
Output - MIMO), rất tiện dùng khi điều khiển đối tượng có nhiều biến số.
1.2. Cấu tạo mạng noron.
Dựa trên những phương pháp xây dựng mạng noron ta có thể coi mạng nơron như
một hệ MISO truyền đạt và xử lý tín hiệu. Đặc tính truyền đạt của noron phần lớn là
đặc tính truyền đạt tĩnh, chỉ khi có khâu đáp ứng chức năng kiểu BSB thì lúc đó
noron có đặc tính động. Trong mọi trường hợp do đặc tính phi tuyến của khâu tạo
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
13
chức năng ra kết hợp và/hoặc với đặc tính phi tuyến của khâu tạo chức năng đáp
ứng mà noron là một hệ có tính phi tuyến mạnh.
Liên kết đầu vào và đầu ra của nhiều nơron với nhau ta được một mạng nơron. Việc
ghép nối các nơron có thể theo một nguyên tắc bất kỳ nào đó, vì về nguyên tắc một
nơron là một hệ MISO. Từ đó có thể phân biệt các loại nơron khác nhau như các
loại nơron mà các đầu vào nhận thông tin từ môi trường bên ngoài với các loại
nơron mà các đầu vào được nối với các nơron khác trong mạng. Các nơron mà đầu
vào giữ chức năng nhận thông tin từ môi trường bên ngoài đóng chức năng “đầu
vào” của mạng. Cũng tương tự như vậy một nơron có một đầu ra, đầu ra của nơron
này có thể là đầu vào của nhiều nơron khác hoặc có thể đưa ra m ôi trường bên
ngoài. Những nơron có đầu ra đưa tín hiệu vào môi trường bên ngoài được gọi là
“đầu ra” của mạng. Như vậy một mạng nơron cũng có chức năng của một hệ truyền
đạt và xử lý tín hiệu từ đầu vào đến đầu ra của mạng. Các nơron trong một mạng
thường được chọn cùng một loại, chúng được phân biệt với nhau qua các vectơ hàm
trong lượng ở đầu vào wi j.
Nguyên lý cấu tạo của một mạng nơron bao gồm nhiều lớp, mỗi lớp bao gồm nhiều
nơron có cùng một chức năng trong mạng. Trên hình 1.3 là mô hình của một mạng
nơron ba lớp với 9 nơron. Mạng có 3 đầu vào x 1, x2, x3 và 2 đầu ra y 1, y2. Các tín
hiệu đầu vào được đưa đến 3 nơron đầu vào, 3 nơron này làm thành lớp đầu vào của
mạng (input layer). Các nơron trong lớp này gọi là nơron đầu vào. Đầu ra của các
nơron này được đưa đến đầu vào của bốn nơron tiếp theo, bốn nơron này không trực
tiếp tiếp xúc với môi trường xung quanh và làm thành lớp trung gian trong mạng
(hidden layer). Các nơron trong lớp này có tên là nơron nội hay nơron bị tre. Đầu ra
của các nơron này được đưa đến hai nơron đưa tín hiệu ra môi trường bên ngoài.
Các nơron trong lớp đầu ra này có tên là nơron đầu ra (output layer).
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
14
Hình 1.3
Mạng noron 3 lớp
1.3. Cấu trúc mạng noron.
Nelson và Illingworth (1991) đã đưa ra một số loại cấu trúc của mạng nơron
như hình 1.4. Nơron được vẽ là các vòng tròn xem như một tế bào thần kinh, chúng
có các mối liên hệ đến các nơron khác nhờ các trọng số, lập thành các ma trận trọng
số tương ứng.
Mỗi một nơron có thể phối hợp với các nơron khác tạo thành một lớp qua các
trọng số. Mạng một lớp truyền thẳng (Single - Layer Feedforward Network) như
hình 1.5a.
Có thể nối vài lớp nơron với nhau tạo thành mạng nhiều lớp truyền thẳng
(Multi layer - Layer Feedforward Network) như h ình 1.5d.
Lớp nơron thực hiện tiếp nhận các tín hiệu vào gọi là lớp vào (Input Layer).
y1
y2
y3
x1
w1
x2
x3
b)
W11
a)
y1
y2
ym
x1
x2
xm Wm,m
Wm,m
x1
w1
x2
x3
y1
y2
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
15
x1
x2
xm
Hình 1.4
Sơ đồ cấu trúc các loại mạng nơron.
Lớp nơron thực hiện đưa tín hiệu ra gọi là lớp ra (Output Layer).
Giữa hai lớp nơron vào và ra có một hoặc nhiều lớp nơron không liên hệ trực
tiếp với môi trường bên ngoài được gọi là các lớp ẩn (Hidden Layer). Mạng nơron
truyền thẳng nhiều lớp có thể có một hoặc nhiều lớp nơron ẩn.
Mạng nơron được gọi là liên kết đầy đủ nếu từng đầu ra của mỗi lớp được liên
kết với đủ các nơron ở các lớp tiếp theo.
Hai loại mạng nơron một lớp và nhiều lớp được gọi là truyền thẳng
(Feedforward Network) nếu đầu ra của mỗi nơron được nối với các đầu vào của các
nơron cùng lớp đó hoặc đầu vào của các nơron của các lớp trước đó. Trong mạng
không tồn tại bất kỳ một mạch hồi tiếp nào kể cả hồi tiếp nội lẫn hồi tiếp từ đầu ra
trở về đầu vào.
y1
wm
y2
ym
x1
w1
x2
xm
e)
c)
y1
y2
y3
x1
wm1
x2
x3
Wm,m
Wm,m
f)
y1
y2
ym
y1
wm
1y2
ym
x1
wm
x2
xm
d)
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
16
Mạng nơron bao gồm một hay nhiều lớp trung gian gọi là mạng MLP
(Multilayer perceptrons Networks).
Mạng nơron phản hồi mà đầu ra của mỗi nơron được quay trở lại nối với đầu
vào của các nơron cùng lớp đó được gọi là mạng Lateral (hình 1.5f).
Mạng nơron phản hồi có thể thực hiện đóng vòng được gọi là mạng nơron hồi
quy (Recurrent Networks).
Hình 1.5b chỉ ra một mạng nơron hồi quy đơn giản nhất chỉ có một nơron liên
hệ phản hồi với chính nó.
Hình 1.5c mạng nơron một lớp hồi quy với chính nó và các nơron khác.
Hình 1.5e là mạng nơron nhiều lớp hồi quy.
1.4. Phương thức làm việc của mạng nơron.
Phương thức làm việc của một mạng nơron nhân tạo có thể chia làm 2 giai đoạn:
- Tự tái tạo ( reproduction )
- Giai đoạn học ( learning phase )
Ở một mạng nơron có cấu trúc bền vững có nghĩa là vectơ hàm trọng lượng đầu
vào, khâu tạo đáp ứng và khâu tạo tín hiệu đầu ra đều cố định không bị thay đổi về
mặt cấu trúc cũng như tham số thì mạng có một quá trình truyền đạt xác định chắc
chắn, tĩnh hoặc động phụ thuộc vào cấu tạo của các nơron trong mạng. Ở đầu vào
của mạng xuất hiện thông tin thì đầu ra cũng xuất hiện một đáp ứng tương ứng. Đối
với mạng nơron có quá trình truyền đạt tĩnh, đáp ứng đầu ra xuất hiện ngay sau khi
đầu vào nhận được thông tin, còn đối với mạng nơron có quá trình truyền đạt động
thì phải sau một thời gian quá độ ở đầu ra của mạng nơron mới xuất hiện đáp ứng.
Xuất phát từ quan điểm mọi đáp ứng của các nơron đều tiền định tự nhiên, có nghĩa
là khi xuất hiện các kích thích ở đầu vào của mạng ở các thời điểm khác nhau các
giá trị như nhau thì đáp ứng ở đầu ra ở các thời điểm tương ứng cũng hoàn toàn
giống nhau. Quá trình làm việc như vậy của một mạng nơron được gọi là quá trình
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
17
tái diễn ( reproduction phase ). Khi đó thông tin ở đầu vào mạng lưu giữ thông tin
đó và dựa trên các tri thức của mình đưa ra các đáp ứng ở đầu ra phù hợp với lượng
thông tin thu được từ đầu vào.
Mạng nơron khi mới hình thành còn chưa có tri thức, tri thức của mạng hình thành
dần sau một quá trìmh học. Mạng nơron được dạy bằng cách đưa vào đầu vào
những kích thích và hình thành những đáp ứng tương ứng, những đáp ứng phù hợp
với từng loại kích thích sẽ được lưu giữ, giai đoạn này được gọi là giai đoạn học của
mạng. Khi đã hình thành tri thức mạng có thể giải quyết các vấn đề cụ thể một cách
đúng đắn. Đó có thể là những vấn đề ứng dụng rất khác nhau, được giải quyết chủ
yếu dựa trên sự tổ chức hợp nhất giữa các thông tin đầu vào của mạng và các đáp
ứng đầu ra:
- Nhiêm vụ của một mạng liên kết là hoàn chỉnh hoặc hiệu chỉnh các thông tin thu
thập được không đầy đủ hoặc bị tác động nhiễu. Mạng nơron kiểu này được ứng
dụng trong lĩnh vực hoàn thiện mẫu, mà một trong lĩnh vực cụ thể đó là nhận dạng
chữ viết.
- Nhiệm vụ tổng quát của mạng nơron là lưu giữ tác động thông tin. Dạng thông tin
lưu giữ đó chính là quan hệ giữa các thông tin đầu vào của mạng và các đáp ứng
đầu ra tương ứng, để khi có một kích thích bất kỳ tác động vào mạng, mạng có khả
năng suy diễn và đưa ra một đáp ứng phù hợp. Đó chính là chức năng nhận dạng
theo mẫu của mạng nơron. Để thực hiện chức năng này mạng nơron đóng vai trò
như một bộ phận tổ chức các nhóm thông tin đầu vào và tương ứng với mỗi nhóm là
một đáp ứng đầu ra phù hợp. Như vậy một nhóm bao gồm một loại thông tin đầu
vào và một đáp ứng ra. Các nhóm có thể hình thành trong quá trình học và cũng có
thể hình thành không trong quá trình học.
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
18
Trong lĩnh vực ứng dụng, mạng nơron có khả năng tạo ra các đáp ứng đầu ra dựa
trên thông tin thu thập vào của mạng, điều đó có nghĩa là ứng với một thông tin xác
định ở đầu vào của mạng cung cấp một đáp ứng tương ứng xác định ở đầu ra. Nhìn
trên quan điểm lý thuyết hệ thống, mạng nơron được coi như một bộ xấp xỉ thông
tin, thiết bị này có khả năng cung cấp một quá trình xử lý mong muốn một cách
chính xác. Mục đích của quá trình học là tạo ra một tri thức cho mạng thông qua rèn
luyện. Nguyên tắ._.c học được thực hiện cho mạng mà cấu trúc của mạng cũng như
các phần tử nơron cố định, chính là thay đổi giá trị của các phần tử trong vectơ hàm
trọng lượng, vectơ ghép nối giữa các phần tử nơron trong mạng. Các phần tử này
được chọn sao cho quá trình truyền đạt mong muốn được xấp xỉ một cách đủ chính
xác như bài toán yêu cầu. Như vậy, học chính là quá trình giả bài toán tối ưu tham số.
1.5. Các luật học
Thông thường mạng nơron được điều chỉnh hoặc được huấn luyện để hướng
các đầu vào riêng biệt đến đích ở đầu ra. Cấu trúc huấn luyện mạng được chỉ ra trên
cơ sở so sánh giữa đầu ra với đầu vào cho tới khi đầu ra phù hợp với đích. Những
cặp vào/đích (input/ taget) được dùng để giám sát cho sự huấn luyện mạng.
Hàm trọng
(weights) giữa các
nơron
So
sánh
Vào
Đích
Điều chỉnh
Hình 1.5. Cấu trúc huấn luyện mạng
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
19
Để có được một cặp số vào/ra ở đó mỗi giá trị vào được gửi đến mạng và giá
trị ra tương ứng được thực hiện bằng mạng là sự xem xét và so sánh với giá trị
mong muốn. Bình thường tồn tại một sai số bởi lẽ giá trị mong muốn không hoàn
toàn phù hợp với giá trị thực. Sau mỗi lần chạy ta có tổng bình phương của tất cả
các sai số. Sai số này được sử dụng để xác định các hàm trọng mới.
Sau mỗi lần chạy hàm trọng của mạng được sửa đổi với đặc tính tốt hơn tương
ứng với đặc tính mong muốn. Từng cặp giá trị vào / ra phải được kiểm tra và trọng
lượng được điều chỉnh một vài lần. Sự thay đổi các hàm trọng của mạng được dừng
lại nếu tổng các bình phương sai số nhỏ hơn một giá trị đặt trước hoặc đã đặt đủ
một số lần chạy xác định ( trong trường hợp mạng có thể không thoả mãn yêu cầu
đặt ra do sai lệch còn cao). Có hai kiểu học:
- Học thông số (Paramater Learning): Tìm ra biểu thức cập nhật các thông số
về trọng số cập nhật kết nối giữa các nơron.
- Học cấu trúc (Structure Learning): Trọng tâm là sự biến đổi cấu trúc của
mạng nơron gồm số lượng nút (node) và các mẫu liên kết.
Có hai loại học: Thực hiện đồng thời và không đồng thời.
Chúng ta tập trung vào phần học thông số.
Giả sử ma trận trọng số bao gồm tất cả các phần tử thích ứng của mạng nơron.
Nhiệm vụ của việc học thông số là bằng cách nào đó, tìm được ma trận chính xác
mong muốn từ ma trận giả thiết ban đầu với cấu trúc của mạng nơron có sẵn. Để
làm được việc đó, mạng nơron sử dụng các trọng số điều chỉnh, với nhiều phương
pháp học khác nhau có thể tính toán gần đúng ma trận W cần tìm đặc trưng cho
mạng. Có ba phương pháp học:
* Học có giám sát (Supervised Learning)
Là quá trình học có giám sát (Hình 1.6), ở mỗi thời điểm thứ i khi đưa tín hiệu
vào xi mạng nơron, tương ứng sẽ có các đáp ứng mong muốn di của đầu ra cho
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
20
trước ở thời điểm đó. Hay nói cách khác, trong quá trình học có giám sát, mạng
nơron được cung cấp liên tục các cặp số liệu mong muốn vào - ra ở từng thời điểm
(x1, d1), (x2, d2), ... , (xk, dk) , ... khi cho đầu vào thực của mạng là x k tương ứng sẽ
có tín hiệu đầu ra cũng được lặp lại là d k giống như mong muốn. Kết quả của quá
trình học có giám sát là tạo được một hộp đen có đầu vào là véctơ tín hiệu vào x sẽ
đưa ra được câu trả lời đúng d.
Hình 1.6 Hình 1.7
Mô hình học có giám sát
và học củng cố
Mô hình học không có giám sát
Để đạt được kết quả mong muốn trên, khi đưa vào tín hiệu xk, thông thường sẽ
có sai lệch ek giữa tín hiệu đầu ra thực yk và tín hiệu đầu ra mong muốn dk. Sai lệch
đó sẽ được truyền ngược tới đầu vào để điều chỉnh thông số mạng nơron là ma trận
trọng số W ... Quá trình cứ thế tiếp diễn sao cho sai lệch giữa tín hiệu ra mong
muốn và tín hiệu ra thực tế trong phạm vi cho phép, kết quả ta nhận được ma trận
trọng số W với các phần tử wịj đã được điều chỉnh phù hợp với đặc điểm của đối
tượng hay hàm số mạng nơron cần học.
* Học củng cố (Reinforcement Learning)
Tín hiệu có thể được đưa tín hiệu d từ bên ngoài môi trường (Hình 1.6), nhưng
tín hiệu này có thể không được đưa đầy đủ, mà có thể chỉ đưa đại diện một bit để có
tính chất kiểm tra quá trình đúng hay sai. Tín hiệu đó được gọi là tín hiệu củng cố
Mạng
nơron
y
x
Máy
phát
tín
hiệ
e
d
Mạng
nơron
y x
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
21
(Reinforcement Signal). Phương pháp học củng cố chỉ là một trường hợp của
phương pháp học có giám sát, bởi vì nó cũng có nhận tín hiệu chỉ đạo (giáo viên)
phản hồi từ môi trường. Chỉ khác là tín hiệu củng cố chỉ có tính ước lượng hơn là để
dạy. Có nghĩa là chỉ có thể nói là tốt hay xấu cho một số tín hiệu đầu ra cá biệt. Tín
hiệu giám sát bên ngoài d thường được tiến hành bởi các tín hiệu ước lượng để tạo
thông tin tín hiệu ước lượng cho mạng nơron điều chỉnh trọng số với hy vọng sự
ước lượng đó mang lại sự tốt đẹp cho quá trình tính toán. Học củng cố còn được gọi
là học với sự ước lượng (Learning With a Critic).
* Học không có giám sát (Unsupervised Learning)
Trong trường hợp này, hoàn toàn không có tín hiệu ở bên ngoài (Hình 1.7).
Giá trị mục tiêu điều khiển không được cung cấp và không được tăng cường. Mạng
phải khám phá các mẫu, các nét đặc trưng, tính cân đối, tính tương quan. Trong khi
khám phá các đặc trưng khác, mạng nơron đã trải qua việc tự thay đổi thông số, vấn
đề đó còn gọi là tự tổ chức (Self - Organizing).
Hình 1.8 mô tả cấu trúc chung của quá trình học của ba phương pháp học đã
được nêu trên. Trong đó tín hiệu vào x j, j = 1, 2, 3 ..., m, có thể được lấy từ đầu ra
của các nơron khác hoặc có thể được lấy từ bên ngoài. Chú ý rằng thông số ngưỡng
θi có thể được bao trong việc học như là một trọng số thứ m: wi,m của tín hiệu vào
có giá trị xm= -1. Tín hiệu mong muốn di có sẵn chỉ trong phương pháp học có giám
sát hoặc củng cố (với d i là tín hiệu học củng cố). Từ hai phương pháp học trên.
Trọng số của nơron thứ i được thay đổi tuỳ theo tín hiệu ở đầu vào mà nó thu nhận,
giá trị đầu ra của nó. Trong phương pháp học không giám sát sự thay đổi trọng số
chỉ dựa trên cơ sở các giá trị đầu vào và đầu ra. Dạng tổng quát của luật học trọng
số của mạng nơron cho biết là gia số của véc tơ wi là ∆wi tỷ lệ với tín hiệu học r và
tín hiệu đầu vào x(t):
∆wi(t) = η.r.x(t) (1.2)
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
22
X
Wi1
Wij
xm-1
xm= -1
Wi2
Wi,m-1
Wi,m-1 = θ
x1
x2
xj
Wi2
r
,m = θ
wi
Hình 1.8. Sơ đồ cấu trúc chung của quá trình học
η là một số dương còn gọi là hằng số học, xác định tốc độ học.
r là tín hiệu học: r = fr (wi , x , di). (1.3)
Từ (1.2) là biểu thức chung để tính số gia của trọng số, ta thấy véc tơ trọng số
wi = (wi1, wi2, ... , wim)T có gia số với tỷ lệ của tín hiệu vào x và tín hiệu học r. Từ
các biểu thức trên ta có véc tơ trọng số ở thời điểm (t+1) được tính là:
wi (t+1) = wi(t) + η fr (wi(t), x(t), di(t) x (t) (1.4)
Với chỉ số trên là thời điểm tính toán. Phương trình liên quan đến sự thay đổi
trọng số trong mạng nơron rời rạc (Discrete - Time) và tương ứng với sự thay đổi
trọng số trong mạng nơron liên tục theo biểu thức:
)t(rx
dt
)t(dwi η= (1.5)
Vấn đề quan trọng trong việc phân biệt luật học cập nhật trọng số có giám sát
hay không có giám sát là tín hiệu học r như thế nào để thay đổi hoặc cập nhật trọng
số có trọng mạng nơron.
Máy phát tín
hiệu học
d
Nơron thứ i
∆wi
y
η
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
23
1.6. Mạng nơron truyền thẳng và mạng nơron hồi quy.
1.6.1. Mạng nơron truyền thẳng.
1.6.1.1. Mạng một lớp nơron.
Hình 1.9
Mạng nơron truyền thẳng một lớp.
Một lớp nơron là một nhóm các nơron mà chúng cùng nhận một số tín hiệu
vào đồng thời (Hình 1.9).
Trong ma trận trọng số w, các dòng thể hiện trọng số của mỗi nơron, mỗi dòng
thứ j có thể đặt nhãn như một véc tơ wj của nơron thứ j gồm m trọng số wji
wj = (wj1 ; wj2, ..., wjm) (1.6)
Các trọng số trong cùng một cột thứ j ( j = 1, 2, ... , n) đồng thời nhận cùng
một tín hiệu vào xj.
Tại cùng một thời điểm, véc tơ đầu vào x = (x1, x2...xj…, xm) có thể là một
nguồn bên ngoài là cảm biến hoặc thiết bị đo lường đưa tới mạng. Tới khi toàn bộ
ma trận trọng số w ji được các định tương ứng với véc tơ đầu vào X thì các tích số
wjixi cũng được tính toán.
1.6.1.2. Mạng nhiều lớp nơron.
Hình 1.10. Mạng nơron truyền thẳng nhiều lớp.
W11
y1
y2
ym
x1
x2
xm Wm,m
Wm,m
y1
wm
y2
ym
x1
wm1
x2
xm
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
24
Trong mạng nơron truyền thẳng nhiều lớp (Hình 1.10) trong đó các lớp được
phân chia thành 3 loại sau đây:
- Lớp vào: Là lớp nơron đầu tiên nhận các tín hiệu vào xi của véc tơ tín hiệu
vào x. Mỗi tín hiệu x i của tín hiệu vào sẽ được đưa đến tất cả các nơron của lớp
nơron đầu tiên, chúng được phân phối trên các trọng số có số lượng đúng bằng số
nơron của lớp này. Thông thường, các nơron đầu vào không làm biến đổi các tín
hiệu vào xi, tức là chúng không có các trọng số hoặc không có các loại hàm chuyển
đổi nào, chúng chỉ đóng vai trò phân phối các tín hiệu và không đóng vai trò sửa đổi
chúng.
- Lớp ẩn: Là lớp nơron dưới lớp vào, chúng không trực tiếp liên hệ với thế
giới bên ngoài như các lớp nơron vào và ra.
- Lớp ra: Là lớp nơron tạo các tín hiệu ra cuối cùng.
1.6.2. Mạng nơron hồi quy.
Mạng nơron hồi quy (Recurrent Neural Networks) còn được gọi là mạng phản
hồi (Feedback Networks) là loại mạng tự liên kết thành các vòng và liên kết hồi quy
giữa các nơron. Mạng nơron hồi quy có trọng số liên kết đối xứng như mạng
Hopfield luôn hội tụ về trạng thái ổn định (Hopfild, 1982). Mạng liên kết 2 chiều
(Bidirectional Associative Memory - BAM) là mạng thuộc nhóm mạng nơron hồi
quy gồm hai lớp nơron liên kết tay đôi, trong đó đảm bảo nơron của cùng một lớp
không liên kết với nhau, cũng hội tụ về trạng thái ổn định (Kosko, 1986). Nghiên
cứu mạng nơron hồi quy có trọng số liên kết không đối xứng sẽ gặp nhiều phức tạp
hơn so với mạng truyền thẳng (Feedforward Networks) và mạng hồi quy đối xứng
(Symmetrich Recurrent Neural Networks). Mạng nơron hồi quy có khả năng về
nhận mẫu, nhận dạng các hàm phi tuyến, dự báo ... Một ưu điểm khác của mạng
nơron hồi quy là chỉ cần mạng nhỏ hơn về cấu trúc cũng có khả năng như mạng
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
25
truyền thẳng có cấu trúc lớn hơn. Nó khắc phục được giả thiết truyền thống của
mạng nơron là coi mạng có số nơron đủ lớn. Gồm 2 loại:
1.6.2.1. Mạng hồi quy không hoàn toàn (Partially Recurrent Networks).
Là mạng đó dựa trên cơ sở mạng lan truyền ngược (Back - Propagation) với
cấu trúc hồi quy. Cấu trúc của mạng hồi quy không hoàn toàn phần lớn là cấu trúc
truyền thẳng nhưng có cả sự chọn lựa cho một bộ phận có cấu trúc hồi quy. Trong
nhiều trường hợp , trọng số của cấu trúc hồi quy được duy trì không đổi, như vậy
luật học lan truyền ngược BP có thể được dễ dàng sử dụng. Các mạng đó đươc gọi
là mạng dãy (Sequential Networks) và các nút nhận tín hiệu hồi quy được gọi là
các phần tử Context (Context Units). Trong c ác mạng loại này, sự truyền thẳng
được xảy ra rất nhanh hoặc không phụ thuộc vào thời gian, trong khi đó tín hiệu hồi
quy được thực hiện có tính thời gian. Từ đó, tại thời điểm t phần tử năm trong phạm
vi Context Units có tín hiệu vào từ một phần mạng ở th ời điểm (t-1). Vì vậy, bộ
phận nằm trong phạm vi nhớ được một số dữ liệu của quá khứ từ kết quả biến đổi ở
thời điểm t. Do vậy, trạng thái của mạng nguyên thuỷ của các mẫu phụ thuộc vào
các trạng thái đó cũng như dòng thông tin đầu vào. Mạng có thể nhận m ẫu
(Recognice) dãy dựa vào tình trạng cuối cùng của dãy và có thể dự báo tiếp theo
cho tín hiệu của dãy theo thời gian. Từ đó, mạng hồi quy không hoàn toàn về cơ bản
là mạng truyền thẳng, liên kết hồi quy có thể đi từ các nút ở các lớp ra hoặc lớp ẩn.
1.6.2.2. Mạng các dãy của Jordan (Jordan Sequential Netwoks)
Hình 1.11a là cấu trúc chung của mạng Jordan, hình 1.11b là một dạng của
mạng Jordan. Mạng đầu vào của mạng gồm tín hiệu phản hồi đầu ra vào lớp
Context kết hợp với tín hiệu vào ở trạng thái sau đó. Nói cách khác, lớp Context sao
chụp tín hiệu ra của thời điểm trước đó qua con đường phản hồi với trọng số đơn vị.
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
26
xi
Hình 1.11 a Hình 1.11b
Hình 1.11
Sơ đồ cấu trúc của mạng Jordan
Mối tự liên kết (Selt - Connection) trong lớp Context Ci hàm hoạt hoá của phần tử
thuộc lớp Context có dạng:
ci (t) = - α ci (t) + yi (t)
yi là tín hiệu ra; α là cường độ của mối tự liên kết 0 < α < 1.
Nghiệm của phương trình vi phân trên có dạng:
ci (t) = ci (0)e - αt + ∫ −−
t
ste
0
)(α yi(s)ds
Nếu yi cố định, ci sẽ giảm theo luật hàm mũ. Viết ở dạng rời rạc, thay đổi của
phần tử lớp Context được viết:
ci (t+1) = (1- α)ci (t) + yi(t)
Nếu coi các phân tử lớp Context là các tín hiệu vào, ta có thể dùng luật Back-
Propagation để luyện mạng.
Lớp ra
Lớp ẩn
Lớp ra Lớp Context Ci
yi
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
27
yi
xi
1.6.2.3. Mạng hồi quy đơn giản (Simple Recurrent Networks)
Elman (1990) đã đề xuất cấu trúc mạng
hồi quy đơn giản (SRN). Liên kết phản hồi
được lấy từ lớp ẩn đi tới lớp Context
(hình 1.12). Mạng đầu v ào được coi có 2
phần: đầu vào thực và của lớp Context.
Hình 1.12
Sơ đồ cấu trúc mạng nơron
hồi quy đơn giản
1.6.2.4.Mạng hồi quy hoàn toàn (Fully Recurrent Netwoks)
Một trong những loại mạng nơron hồi quy đầu tiên được Gossberg (1969c,
1982a) xây dựng để học và biểu diễn các mẫu bất kỳ. Loại mạng này đã được xây
dựng theo mẫu Instar - Outstar. Loại mạng hồi quy hoàn toàn (Fully Recurrent
Networks), hay còn gọi là Sequential Competivive Avalanche Field (SCAF), có tác
dụng nhận số lượng mẫu nhiều hơn, đã được Hecht - Nielsen (1986); Freeman và
Skapura (1991) xây dựng. North (1988) đã áp dụng mạng một lớp avalanche trong
việc nhận dạng chữ ký của 7 thuyền nhân.
Mạng RBP được áp dụng trong một số lĩnh vực như: hoàn thiện mẫu
(Almeldam 1987), nhận dạng ảnh (Krishnapuram và Chen, 1993) và điều khiển
rôbôt (Barhen, 1989). Elman (1991) đã luyện mạng SPN để nhận dạng chữ viết ở
dạng câu đơn giản gồm 2 đến 3 từ. Jodouin (1993) cũng đã trình bày một số
phương pháp và thành quả ứng dụng SPN. Mozer (1989) đã đề xuất một số mạng
Lớp ra
Lớp ra
Lớp ra Lớp Context
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
28
hồi quy khác, được gọi là mạng lan truyền ngược hội tụ (Focused Back - Propgation
Networks). Trong loại mạng này, các lớp và bản thân mỗi phần từ của lớp đều có
liên hệ ngược với bản thân chúng. Watrous và Shastri (1987), Morgan và Scofield
(1991) cũng đã đề xuất một vài dạng mạng hồi quy.
Với mạng hồi quy hoàn toàn (Fully Recurent Networks, hình thành quan điểm
thực hiện và luyện mạng hồi quy là hình thành mạng hồi quy từ mạng truyền thẳng
nhiều lớp được xây dựng từ một lớp cho mỗi bước tính. Khái niệm này gọi là lan
truyền ngược theo thời gian (Back Propagation Through Time-BPTT) (Rumelhart,
1986a,b) phù hợp khi quan tâm đến các dãy với độ lớn T là nhỏ. Nó đã được sử
dụng học cho máy ghi cho nhiệm vụ thực hiện cho các dãy (Rumelhart, 1986b). Nó
có khả năng áp dụng cho điều khiển thích nghi (Miller, 1990).
1.7. Các ứng dụng của mạng nơron
Các ứng dụng cụ thể của mạng nơron có thể tóm tắt như sau:
* Lĩnh vực vũ trụ hàng không
- Ứng dụng nhiều trong kỹ thuật bay không người lái
- Mô phỏng đường bay
- Hệ thống điều khiển máy bay, nâng cao khả năng bay tự động.
- Mô hình hoá các bộ phận của máy bay…
* Điều khiển tự động
- Hệ thống hướng dẫn ô tô điều khiển tự động.
- Cho phép phân tích phạm vi hoạt động…
* Ngân hàng:
- Kiểm tra đọc văn kiện
- Định giá thẻ tín dụng…
* Trong hình sự:
- Phát hiện và so sánh dấu vân tay.
- Nhận biết tiếng nói.
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
29
* Quốc phòng:
- Điều khiển tên lửa, các thiết bị bay.
- Hệ thống định vị như sonar, radar.
* Trong y học:
- Phân tích và phát hiện tế bào ung thư.
- Lưu giữ thời gian nằm và ra viện của bệnh nhân,…
* Trong đầu tư:
- Đánh giá mức độ mạo hiểm của việc đầu tư.
* Trong sản xuất:
- Kiểm tra theo dõi quá trình sản xuất.
- Thử nghiệm phân tích, phân loại sản phẩm.
- Dự báo, lên kế hoạch và điều khiển qúa trình sản xuất,…
* Trong địa chất: Phát hiện khoáng sản,dầu khí, kim loại, vàng,…
* Rôbôt: Hệ thống nghe nhìn, điều khiển,….
* Lĩnh vực điện:
- Dự báo phụ tải.
- Chế tạo chip trong các mạch tích hợp, chip phân tích.
- Phương pháp điều khiển, điều khiển động cơ…
Ngoài ra còn có ứng dụng trong lĩnh vực : Công nghệ giải trí, công nghiệp, bảo
hiểm,…
Ngày nay cùng với sự phát triển mạnh mẽ của khoa học và kỹ thuật, là khả
năng tính toán và xử lý ngày càng mạnh của máy tính, nhờ đó các phương pháp lý
thuyết đã nghiên cứu được ứng dụng rộng rãi như lôgíc mờ, đặc biệt là mạng nơron.
Trong lĩnh vực điều khiển tự động, mạng nơron được ứng dụng để giải quyết hai bài
toán cơ bản sau:
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
30
+ Nhận dạng đối tượng. Các đối tượng ở đây với đặc tính có thể là động học
tuyến tính, phi tuyến tĩnh hoặc động học và phi tuyến.
+ Thiết kế bộ điều khiển nơron.
Theo lý thuyết đã chứng minh mạng nơron là một bộ xấp xỉ đa năng, có thể
dùng làm một mô hình toán học thay thế đối tượng với sai lệch cho trước nào đó.
Đây là cơ sở để ta có thể ứng dụng mạng nơron để nhận dạng các đối tượng. Ta sẽ
tiến hành nhận dạng lần lượt các đối tượng động học tuyến tính, đối tượng phi tuyến
tĩnh và đối tượng động học và phi tuyến.
Khả năng xấp xỉ đa năng của mạng nhiều lớp tạo ra một sự lựa chọn ưa thích
cho việc mô hình hoá các đối tượng phi tuyến và thực hiện các bộ điều khiển phi
tuyến đa năng. Mạng nơron được ứng dụng trong điều khiển tự động với ba bài
toán sau:
+ Điều khiển tiên đoán mô hình: Model Predictive Control (MPC).
+ Điều khiển tuyến tính hoá phản hồi: NARMA-L2(Feedback Linearization)
Control.
+ Điều khiển theo mô hình mẫu: Model Reference Control.
Dùng mạng nơron để thiết kế bộ điều khiển phải thực hiện theo trình tự hai
bước cơ bản sau: bước 1 là nhận dạng đối tượng và bước 2 là thiết kế bộ điều khiển
nơron.
Trong bước nhận dạng đối tượng, phải xây dựng một mô hình mạng nơron
thay thế cho đối tượng cần được điều khiển. Ở bước thiết kế bộ điều khiển nơron,
sử dụng mô hình mạng nơron của đối tượng để huấn luyện bộ điều khiển. Cả ba bài
toán trên đều giống nhau ở bước nhận dạng, tuy nhiên ở bước thiết kế điều khiển thì
khác nhau đối với mỗi bài toán.
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
31
Đối với bài toán điều khiển tiên đoán, mô hình đối tượng được dùng để tiên
đoán đầu ra tương lai của đối tượng và sử dụng một thuật toán tối ưu chọn tín hiệu
đầu vào làm tối ưu chỉ tiêu tương lai.
Với bài toán tuyến tính hoá phản hồi, bộ điều khiển đơn giản là sự sắp xếp lại
mô hình đối tượng.
Với bài toán điều khiển theo mô hình mẫu, bộ điều khiển là một mạng nơron
được huấn luyện để điều khiển một đối tượng bám theo một mô hình mẫu. Một mô
hình mạng nơron của đối tượng được sử dụng để hỗ trợ trong việc huấn luyện bộ
điều khiển.
1.8. Công nghệ phần cứng sử dụng mạng nơron.
Mạng nơron nhân tạo được dùng để xây dựng các chip mang lại nhiều lợi ích với
bản chất cấu trúc phân bố song song của sự gia công thông tin như các nơron sinh
học (Ramacher and Ruckert 1991; Shanchz - Sinencio and Lau 1992), chip nơron
có thể được sử dụng làm các bộ đồng xử lý (Coprocessor) trong các máy tính thông
thường và trong việc tính toán.
Trong phần cứng, mạng nơron có thể sử dụng vào nhiều lĩnh vực. Mạng nơron
có thể sử dụng với các chức năng như các phần tử analog hoặc digital thay thế cho
các phần tử điện tử thông thường. Các loại chip analog có một tiềm năng to lớn về
sử lý tốc độ cao và kinh tế hơn với chip digital cùng loại, các chip digital cũng có
các ưu điểm là có độ chính xác cao hơn và dễ chế tạo.
Ở phần tử analog, các trọng số liên kết mã hoá được với các phần tử điện trở,
điện cảm và điện dung. Các mức của các nút hoạt hoá (cường độ của tín hiệu) được
đặc trưng bằng các đại lượng dòng và áp. Ví dụ như lưới silic (Silicon Retina)
(Mead 1989) là một dạng chip analog có thể cạnh tranh được với lưới sinh học
(Biological Retina).
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
32
Công nghệ digital có thể áp dụng để thiết kế các chip nơron. Vấn đề này được
Hammerstrom và Means (1990) đề cập đến. Khả năng khác là xung học (Pulse -
Trains) là đặc trưng cho trọng số và cường độ tín hiệu (Caudill 1991). Xung học
phản ánh tương xứng với tần suất hoặc khả năng của nơron hoạt hoá, tái tạo điều
biến tần xuất quan sát được như của mạng nơron sinh học. Phép nhân của 2 xung
học là tương đương với phép AND trong mạch logic, phép cộng của 2 xung học là
tương đương với phép OR trong mạch lôgic.
Trong hướng của thuật học, có được một vài chọn lọc. Các trọng số trong một
chip nơron cần cố định trước như ở chip ROM (Read - Only Memory), bộ nhó có
thể chương trình hoá PROM (Programmable ROM), bộ nhớ có thể xoá và lập trình
được (Erasable PROM), hoặc bộ nhớ đọc/ ghi RAM (Random Access Memory).
Mạng nơron mở ra một hướng cải tiến quan trọng về công nghệ. Với ưu điểm
nổi bật của mạng nơron là khả năng truyền tín hiệu ở các chip nơron ở dạng song
song do đó tốc độ truyền tín hiệu rất cao, đặc trưng này không có ở các chip điện tử
truyền thống.
1.9. So sánh khả năng của mạng nơron với mạch lôgic:
- Mạng nơron dùng ở cả các dạng mức (0, 1), (-1, +1) ở dạng liên tục như hàm
chuyển đổi sigmoid và dạng phi tuyến. Do đó, phần tử lôgic chỉ là một trường hợp
riêng của mạng nơron.
- Khả năng lập trình được của mạng nơron rất tốt, thay vì phương pháp lắp ráp
phần cứng không lập trình được của mạng lôgic.
- Đặc trưng ưu điểm cơ bản của mạng nơron là tính truyền song song làm tăng
tốc độ tính toán
- Ngay ở một phần tử nơron, cũng có thể được coi là một hệ điều khiển trong
mạch vì nó có đầy đủ các thành phần: ngưỡng, tín hiệu vào - ra, phản hồi, bộ tổng.
Trong khi đó mạch lôgic chỉ là một phần tử, hoặc một mạch điện, một mạch điện tử.
Chương I: Tổng quan về mạng nơron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
33
1.10. Kết luận chương I
* Qua phân tích của mô hình mạng nơron ta thấy chúng có các tính chất sau đây:
- Là hệ phi tuyến
- Là hệ xử lý song song.
- Là hệ học và thích nghi: Mạng được luyện từ các số liệu quá khứ, có khả
năng tự chỉnh khi số liệu đầu vào bị mất.
- Là hệ nhiều biến, nhiều đầu vào, nhiều đầu ra (MIMO) rất tiện dùng khi điều
khiển đối tượng có nhiều biến số.
* So sánh mạng nơron truyền thẳng nhiều lớp và mạng nơron hồi quy nhiều lớp
ta thấy về cấu trúc mạng nơron truyền thẳng nhiều lớp đơn giản hơn so với mạng
nơron hồi quy nhiều lớp vì mạng nơron hồi quy nhiều lớp có thêm các liên kết
phản hồi.
Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
34
CHƯƠNG II
CÁC PHƯƠNG PHÁP ỨNG DỤNG MẠNG NƠRON TRONG
NHẬN DẠNG
2.1 Khái quát chung.
2.1.1 Đặt vấn đề.
Xét một bài toán điều khiển theo nguyên tắc phản hồi như trên Hình 2.1.
Muốn tổng hợp được bộ điều khiển cho đối tượng hệ kín có được chất lượng
như mong muốn thì trước tiên phải hiểu biết về đối tượng, tức là cần phải có một
mô hình toán học mô tả đối tượng. Không thể điều khiển đối tượng khi không hiểu
biết hoặc hiểu sai lệch về nó. Kết quả tổng hợp bộ điều khiển phụ thuộc rất nhiều
vào mô hình mô tả đối tượng. Mô hình càng chính xác, hiệu suất công việc càng
cao.
Việc xây dựng mô hình cho đối tượng được gọi là mô hình hóa. Người ta
thường phân chia các phương pháp mô hình hóa ra làm hai loại:
- Phương pháp lý thuyết.
- Phương pháp thực nghiệm.
Phương pháp lý thuyết là phương pháp thiết lập mô hình dựa trên các định luật
có sẵn về quan hệ vật lý bên trong và quan hệ giao tiếp với môi trường bên
Bộ điều
khiển
Đối tượng
điều khiển
w(t) e(t) u(t) y(t)
-
Hình 2.1. Điều khiển theo nguyên tắc phản hồi đầu ra
Đo lường
Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
35
ngoài của đối tượng. Các quan hệ này được mô tả theo quy luật lý – hóa, quy luật
cân bằng,... dưới dạng những phương trình toán học.
Trong các trường hợp mà ở đó sự hiểu biết về những quy luật giao tiếp bên
trong đối tượng cũng về mối quan hệ giữa đối tượng với môi trường bên ngoài
không được đầy đủ để có thể xây dựng được một mô hình hoàn chỉnh, nhưng ít nhất
từ đó có thể cho biết các thông tin ban đầu về dạng mô hình thì tiếp theo người ta
phải áp dụng phương pháp thực nghiệm để hoàn thiện nốt việc xây dựng mô hình
đối tượng trên cơ sở quan sát tín hiệu vào u(t) và ra y(t) của đối tượng sao cho mô
hình thu được bằng phương pháp thực nghiệm thỏa mãn các yêu cầu của phương
pháp lý thuyết đề ra. Phương pháp thực nghiệm đó được gọi là nhận dạng hệ thống
điều khiển.
Như vậy khái niệm nhận dạng hệ thống điều khiển được hiểu là sự bổ xung
cho việc mô hình hóa đối tượng mà ở đó lượng thông tin ban đầu về đối tượng điều
khiển không đầy đủ.
2.1.2. Định nghĩa.
Nhận dạng hệ thống là xây dựng mô hình toán học của hệ (cấu trúc – tham số)
dựa trên các dữ liệu thực nghiệm đo được. Quá trình nhận dạng là quá trình hiệu
chỉnh các tham số của mô hình sao cho tín hiệu ra của mô hình tiến tới tín hiệu đo
được của hệ thống.
Khái niệm về bài toán nhận dạng được Zadeh định nghĩa vào năm 1962 với hai
điểm cơ bản sau:
- Nhận dạng là phương pháp thực nghiệm nhằm xác định một mô hình cụ thể
trong lớp các mô hình thích hợp trên cơ sở quan sát các tín hiệu vào ra.
- Mô hình tìm được phải có sai số với đối tượng là nhỏ nhất.
Theo định nghĩa này thì những bài toán nhận dạng sẽ phải được phân biệt với
nhau ở ba điểm chính, đó là:
Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
36
- Lớp mô hình thích hợp. Chẳng hạn lớp các mô hình tuyến tính không có cấu
trúc (không biết bậc của mô hình) hoặc có cấu trúc, lớp các loại mô hình lưỡng
tuyến tính.
- Loại tín hiệu quan sát được (tiền định/ngẫu nhiên).
- Phương thức mô tả sai lệch giữa mô hình thực và đối tượng.
2.1.3. Sơ lược về sự phát triển của các phương pháp nhận dạng.
Sự phát triển của nhận dạng trong lĩnh vực điều khiển tự động từ những năm
1960 trở lại đây có thể có thể chia thành ba giai đoạn phát triển như sau:
- Giai đoạn 1:
(Khoảng 1960-1975) được đánh dấu bằng nhận dạng các mô hình không tham
số cho đối tượng điều khiển tuyến tính mà trọng tâm là thiết lập hàm trọng hay đặc
tính tần biên – pha dưới dạng một dãy giá trị (phức). Kiến thức lý thuyết cần thiết
cho giai đoạn này phần lớn được xây dựng trên cơ sở lý thuyết hàm phức và phân
tích phổ tín hiệu.
- Giai đoạn 2:
Được đặc trưng bởi sự ra đời của lớp mô hình liên tục hoặc rời rạc có tham số
và được gọi là giai đoạn nhận dạng tham số mô hình. Thông tin lý thuyết ở đây đủ
để người ta có thể lựa chọn được bậc (hay cấu trúc) cho mô hình liên tục hay rời
rạc. Nhiệm vụ của nhận dạng trong giai đoạn này là xác định giá trị các tham số của
mô hình đó với hướng nghiên cứu tập trung là xét tính hội tụ các phương pháp và
ảnh hưởng của nhiễu vào kết quả.
- Giai đoạn 3:
Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
37
(Khoảng 1990 đến nay) được đánh dấu bằng nhận dạng mô hình động học liên
tục phi tuyến và nhận dạng mô hình tham số cho hệ nhiều chiều. Dần dần trong giai
đoạn này người ta cũng chuyển hướng đi vào nhận dạng các hệ thống suy biến.
2.2. Các phương pháp nhận dạng
Các phương pháp nhận dạng được phân loại theo các phương pháp như sau:
* Phân loại dựa trên cơ sở các phần tử hệ thống:
+ Phân loại theo hệ thống nhận dạng S.
+ Phân loại theo tín hiệu vào u
+ Phân loại theo tiêu chuẩn nhận dạng
* Phân loại theo phương pháp cập nhật dữ liệu của hệ thống:
+ Phương pháp nhận dạng đệ quy
Thông số nhận dạng được tính toán trực tiếp theo mỗi thời điểm. Nghĩa là
nếu có giá trị θ
∧
(t) được cập nhật tại thời điểm t, thì giá trị của θ
∧
(t+1) được xác
định từ θ
∧
(t). Phương pháp nhận dạng đệ quy có đặc trưng sau:
- Là bộ phận chính của hệ thống thích nghi.
- Đòi hỏi cần có bộ nhớ.
- Thuật toán có thể được thay đổi dễ dàng.
- Tại bước tính toán đầu tiên có thể tìm được ra lỗi của thuật toán khi hệ
thống có sự thay đổi thông số đủ lớn.
Có 2 loại nhận dạng đệ quy:
- Nhận dạng On-line
- Nhận dạng theo thời gian thực
+ Nhận dạng off-line
*Phương pháp nhận dạng không tham số và nhận dạng tham số
Chương II: Các phương pháp ứng dụng mạng nơron trong nhận dạng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
38
- Nhận dạng không tham số: là phương pháp nhận dạng mà mô hình để nhận
dạng là các đường cong quá độ hoặc các hàm và véc tơ tham số không nhất thiết
phải có kích thước hữu hạn. Nhận dạng không tham số thường dùng các phương
pháp như: phân tích hàm quá độ h(t), phân tích tần số, phân tích hàm tương quan,
._.
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4292
0.9992
1.1348
1.2626
1.3946
1.4503
1.4581
1.4620
1.4613
1.4578
1.4510
1.4353
1.3913
1.2618
0.9455
0.4649
-0.0567
-0.6516
-0.9301
-1.2411
-1.3737
-1.4131
-1.4364
-1.4480
-1.4604
-1.4619
-1.4635
-1.4641
-1.4641
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.9138
-1.9139
-1.9114
-1.9062
-1.8956
-1.8857
-1.8824
-1.8785
-1.8717
-1.8642
-1.8526
-1.8289
-1.7682
-1.6038
-1.2344
-0.7393
-0.3062
0.0517
0.1717
0.2669
0.2914
0.2958
0.2974
0.2977
0.2975
0.2974
0.2973
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
-0.0232
0.5172
0.6470
0.7684
0.8942
0.9481
0.9557
0.9593
0.9582
0.9541
0.9463
0.9286
0.8801
0.7400
0.3930
-0.1431
-0.7095
-1.3318
-1.6202
-1.9412
-2.0775
-2.1179
-2.1417
-2.1537
-2.1665
-2.1681
-2.1697
-2.1703
-2.1704
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
77
-1.0215
0.3177
1.5161
0.7494
-0.5077
0.8853
-0.2481
-0.7262
-0.4450
-0.6129
-0.2091
0.5621
-1.0639
0.3516
1.1330
0.1500
0.7031
-0.0524
2.0185
0.9242
-1.8141
0.0350
-1.8079
1.0282
0.3946
0.6394
0.8742
1.7524
-0.3201
-0.1374
0.6158
0.9779
-1.1153
-0.5500
0.0399
-2.4828
1.1587
-1.0263
-0.2284
0.0710
0.3390
0.1676
-0.1135
0.1980
-0.0555
-0.1624
-0.0995
-0.1371
-0.0468
0.1257
-0.2379
0.0786
0.2533
0.0335
0.1572
-0.0117
0.4513
0.2066
-0.4056
0.0078
-0.4043
0.2299
0.0882
0.1430
0.1955
0.3918
-0.0716
-0.0307
0.1377
0.2187
-0.2494
-0.1230
0.0089
-0.5552
0.2591
-0.2295
-0.0000
0.0000
0.0010
0.0018
-0.0050
0.0352
-0.0277
-0.2378
-0.3938
-1.3199
-2.1292
-9.1987
4.9504
-0.7590
-1.0984
-0.0584
-0.1277
0.0037
-0.0647
-0.0119
0.0116
-0.0001
0.0025
-0.0006
-0.0001
-0.0001
-0.0000
-0.0000
0.0000
0.0000
-0.0000
-0.0000
0.0000
0.0000
-0.0000
0.0000
-0.0000
0.0000
-0.0000
0.0000
0.0001
0.0003
-0.0007
0.0052
-0.0040
-0.0348
-0.0577
-0.1933
-0.3118
-1.3469
0.7248
-0.1111
-0.1608
-0.0085
-0.0187
0.0005
-0.0095
-0.0017
0.0017
-0.0000
0.0004
-0.0001
-0.0000
-0.0000
-0.0000
-0.0000
0.0000
0.0000
-0.0000
-0.0000
0.0000
0.0000
-0.0000
0.0000
-0.0000
0.0000
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
0.4428
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4642
-1.4643
-1.4643
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2972
0.2971
0.2971
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1705
-2.1706
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
78
1.1535
-0.7865
0.6348
0.8204
-0.1760
0.5625
-0.1274
0.5542
-1.0973
-0.7313
1.4047
-0.6202
0.2371
-1.5868
-0.4015
-0.7707
-0.2627
0.9765
0.9778
1.1700
0.1593
0.4995
-1.0554
-0.4507
1.2704
0.8987
0.4387
-1.2473
0.3247
0.3901
-0.4051
0.2923
2.5659
-0.4578
-1.6108
-2.6695
-0.7597
-0.6747
0.2579
-0.1759
0.1419
0.1834
-0.0394
0.1258
-0.0285
0.1239
-0.2454
-0.1635
0.3141
-0.1387
0.0530
-0.3548
-0.0898
-0.1723
-0.0587
0.2183
0.2186
0.2616
0.0356
0.1117
-0.2360
-0.1008
0.2841
0.2010
0.0981
-0.2789
0.0726
0.0872
-0.0906
0.0654
0.5738
-0.1024
-0.3602
-0.5969
-0.1699
-0.1509
-0.0000
0.0000
-0.0000
-0.0000
0.0000
-0.0000
0.0000
-0.0000
0.0000
0.0000
-0.0000
0.0000
-0.0000
0.0000
0.0000
0.0000
0.0000
-0.0000
-0.0000
-0.0000
-0.0000
-0.0000
0.0000
0.0000
-0.0000
-0.0000
-0.0000
0.0000
-0.0000
-0.0000
0.0000
-0.0000
-0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
-0.0000
0.0000
-0.0000
-0.0000
0.0000
-0.0000
0.0000
-0.0000
0.0000
0.0000
-0.0000
0.0000
-0.0000
0.0000
0.0000
0.0000
0.0000
-0.0000
-0.0000
-0.0000
-0.0000
-0.0000
0.0000
0.0000
-0.0000
-0.0000
-0.0000
0.0000
-0.0000
-0.0000
0.0000
-0.0000
-0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.4428
0.4428
0.4427
0.4427
0.4426
0.4427
0.4432
0.4450
0.4517
0.4700
0.5130
0.6242
0.8510
1.2003
1.5571
1.9092
2.2478
2.5679
2.8659
3.1412
3.3965
3.6375
3.8710
4.1029
4.3375
4.5758
4.8179
5.0631
5.3108
5.5601
5.8090
6.0560
6.2996
6.5388
6.7746
7.0099
7.2482
7.4918
-1.4644
-1.4646
-1.4651
-1.4660
-1.4680
-1.4718
-1.4812
-1.4989
-1.5392
-1.6135
-1.7403
-1.9906
-2.3917
-2.9104
-3.4025
-3.8951
-4.4105
-4.9625
-5.5621
-6.2158
-6.9244
-7.6800
-8.4672
-9.2705
-10.0810
-10.8986
-11.7223
-12.5468
-13.3630
-14.1608
-14.9345
-15.6869
-16.4309
-17.1831
-17.9510
-18.7274
-19.4948
-20.2338
0.2971
0.2971
0.2971
0.2970
0.2970
0.2971
0.2978
0.3000
0.3076
0.3276
0.3729
0.4905
0.7301
1.0965
1.4668
1.8274
2.1720
2.4961
2.7993
3.0826
3.3489
3.6024
3.8490
4.0936
4.3397
4.5901
4.8457
5.1052
5.3669
5.6295
5.8921
6.1529
6.4102
6.6643
6.9158
7.1661
7.4177
7.6734
-2.1707
-2.1709
-2.1713
-2.1723
-2.1743
-2.1782
-2.1876
-2.2054
-2.2458
-2.3207
-2.4496
-2.7032
-3.1085
-3.6344
-4.1360
-4.6415
-5.1718
-5.7403
-6.3552
-7.0209
-7.7382
-8.5008
-9.2944
-10.1044
-10.9224
-11.7471
-12.5767
-13.4065
-14.2282
-15.0321
-15.8116
-16.5697
-17.3196
-18.0767
-18.8488
-19.6302
-20.4039
-21.1503
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
79
-1.1717
2.0329
0.9685
0.6703
0.4201
-2.8728
-0.2620
0.4546
0.2166
0.1499
0.0939
-0.6424
0.0000
-0.0000
-0.0000
-0.0000
-0.0000
0.0000
0.0000
-0.0000
-0.0000
-0.0000
-0.0000
0.0000
7.7416
7.9964
8.2537
8.5103
8.7637
8.8391
-20.9342
-21.6007
-22.2538
-22.9203
-23.6231
-23.8435
7.9348
8.2007
8.4692
8.7381
9.0042
9.0834
-21.8584
-22.5332
-23.1943
-23.8682
-24.5780
-24.8004
Bảng 3.1. Kết quả các đầu vào- ra
• Giai đoạn học
Hình 3.13. Sơ đồ cấu trúc của mạng nơron Elman
Các nút cấu trúc truyền thẳng tín hiệu lan truyền từ lớp vào đến lớp ra không phụ
thuộc thời gian. Các nút ở lớp context (bôi đen) có tín hiệu hồi quy phụ thuộc
thời gian. Tại thời điểm thứ k nút ở lớp context có tín hiệu vào là tín hiệu phản
hồi của các nút thuộc lớp ẩn ở thời điểm thứ (k-1), tức là nhớ được dữ liệu quá
khứ từ kết quả biến đổi ở thời điểm thứ k, nên tín hiệu đầu ra không những phụ
Mạng nơron Elman thuộc loại mạng hồi quy không hoàn toàn. Phần lớn các nút
trong mạng có cấu trúc truyền thẳng, nhưng có một số nút có cấu trúc hồi quy
gọi là các nút context [10]. Mạng có 4 lớp: lớp vào, lớp ẩn, lớp context và lớp ra
(hình 3.13).
)k(2q
∧
)k(q1
∧
. . .
z-1
z-1
. . .
. . .
-1
-1
-1
-1 w1
w2
w3
b2
b3
x1(k) xM(k)
Lớp
context
Lớp vào
Lớp ra
o_c
o_h
Lớp ẩn
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
80
thuộc vào các tín hiệu đầu vào mà còn phụ thuộc trạng thái mạng ở các thời điểm
trước đó. Giả thiết lớp vào có M nút, lớp ẩn và lớp context đều có R nút, lớp ra
có N nút. Do đó tín hiệu vào có dạng
)k(2τ [ ]TM21 x,...,x,xx = ; tín hiệu r a của lớp ẩn [ ]TR21 h_o,...,h_o,h_oh_o = ;tín
hiệu ra của lớp context [ ]TR21 c_o,...,c_o,c_oc_o = ; tín hiệu ra của mạng là
T
N21 q,...,q,qq
=
∧∧∧∧
; các ma trận trọng số w1, w2, w3 tương ứng có kích thước
là: RxR, RxM, NxR.
))k(x.2w)k(c_o.1w(f)k(h_o += ; )1k(h_o)k(c_o −= ; ))k(h_o.3w(g)k(q =
∧
;
f(.) và g(.) là các hàm chuyển đổi tương ứng ở các dạng tanghypecbolic, tuyến
tính; [ ]TN1 )k(q),...,k(q)k(q 2q(k),= là đầu ra mong muốn của mạng tại bước tính thứ k.
Sai lệch có dạng: ∑
=
∑
=
∧
−=
T
1k
N
1i
2
ii ))k(q)k(q(2
1E
Theo phương pháp hạ gradient, từ E xác định được các ma trận trọng số w1,
w2, w3
qua các biểu thức cập nhật sự thay đổi của các ma trận trọng số tương ứng như
sau.
)k(h_o.3w joi3ij δλ=∆ (i=1, 2, ..., N; j=1, 2, ..., R)
)1k(x.2w q
h
j2jq −δλ=∆ (j=1, 2, ..., R; q=1, 2, ..., M)
jL
ij
N
1i
o
i1jL 1w
)k(h_o)3w.(1w
∂
∂
δλ=∆ ∑
=
(j=1, 2, ..., R; L=1, 2, ..., R)
(.)'g)k(q)k(q iii
o
i
−=δ
∧
; (.)'f)3w( j
N
1i
ij
o
i
h
j ∑
=
δ=δ ; )1k(h_o(.)'f1w
)k(h_o
Lj
jL
−=
∂
∂
.
g(.) là hàm chuyển đổi dạng tuyến tính nên 1(.)'g i = ; 321 ,, λλλ là các hệ số
học.
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
81
Thực hiện giai đoạn học cần chọn các giá trị M, R, N là số nút ở các lớp của
mạng nơron Elman sao cho giá trị sai lệch E trong phạm vi cho phép. Kết quả
mô phỏng trên Matlab chọn được mạng nơron Elman có cấu trúc (6x10x(10)x2)
với số nút lớp vào là M=6, tức là khi đó lớp vào chỉ cần có 6 nút tương ứng đưa
6 tín hiệu vào lớp đầu vào là T212211 )]k()k()2k(q)1k(q)2k(q)1k(q[)k(x ττ−−−−= ,,,,,
thay vì 10 tín hiệu (tại (3.8), (3.9)); số nút lớp ẩn và lớp context là R=10; vì tín
hiệu ra cần nhận dạng là [ ]T21 qqq = nên số nút lớp ra là N = 2. Thực hiện học
trong 7.000 chu kỳ đạt được E=1.52736.10 -6. đồ thị kết quả giai đoạn học được
biểu diễn từ đồ thị hình 3.15 đến hình 3.21 gồm: sai lệch E (hình 3.15), mômen
τ1 (hình 3.16), đồ thị mômen τ2 (hình 3.17), đồ thị q1(nét đứt) và đồ thị 1q
∧
(nét
liền) (hình 3.18), đồ thị q2(nét đứt) và 2q
∧
(nét liền) (hình 3.19), đồ thị không gian
3 chiều mô tả quan hệ của 3 đại lượng (τ1, m3, 1q
∧
) (hình 3.20), (τ2, m3, 2q
∧
)
(hình 3.21).
0 10 20 30 40 50 60 70 80 90 100
0.5
1
1.5
2
2.5
3
Hình 3.14. Đồ thị khối lượng của tải m3
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
82
0 2000 4000 6000 8000 10000 12000
10
-6
10
-5
10
-4
10
-3
10
-2
10
-1
10
0
10
1
12000 Epochs
Tr
ai
ni
ng
-B
lu
e
Performance is 1.52736e-006, Goal is 0
Hình 3.15. Đồ thị sai lệch E giai đoạn học
0 10 20 30 40 50 60 70 80 90 100
-100
-80
-60
-40
-20
0
20
40
60
80
100
Hình 3.16. Đồ thị mômen τ1 giai đoạn học
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
83
0 10 20 30 40 50 60 70 80 90 100
-100
-80
-60
-40
-20
0
20
40
60
80
100
Hình 3.17. Đồ thị mômen τ2 giai đoạn học
0 10 20 30 40 50 60 70 80 90 100
-0.1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
Hình 3.18. Đồ thị q1(nét đứt) và đồ thị 1q
∧
(nét liền)
giai đoạn học
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
84
0 10 20 30 40 50 60 70 80 90 100
-3.5
-3
-2.5
-2
-1.5
-1
-0.5
0
Hình 3.19. Đồ thị q2(nét đứt) và đồ thị 2q
∧
(nét liền)
giai đoạn học
-100
-50
0
50
100
0
1
2
3
-0.2
0
0.2
0.4
0.6
0.8
Hình 3.20. Đồ thị 3 chiều mô tả quan hệ(τ1,m3, 1q
∧
)
giai đoạn học
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
85
-100
-50
0
50
100
0
1
2
3
-4
-3
-2
-1
0
Hình 3.21. Đồ thị 3 chiều mô tả quan hệ(τ2,m3, 2q
∧
)
giai đoạn học
Kết quả các ma trận bias và trọng số trong giai đoạn học như sau:
T
1w
=
0.5996-0.14910.60800.42130.5026-0.15100.0346-0.3182-0.14780.6656
0.0330-0.1419-0.3049-0.5256-0.6539-0.05720.20040.4222-0.4592-0.2767
0.40070.45420.33930.50920.5740-0.18120.09920.1220-0.0026-0.2333-
0.5681-0.28120.2190-0.45770.3088-0.08300.6794-0.85840.1194-0.3786
0.01700.58270.3285-0.13040.61740.69200.6607-0.56380.20610.1109-
0.30530.39090.61630.25680.10550.7002-0.15460.4433-0.07450.2273-
0.5612-0.72030.66580.22240.47950.10370.5715-0.2505-0.25310.6272-
0.0191-0.31760.40880.61720.29780.4879-0.0169-0.51430.01740.3524
0.08360.14770.0996-0.1642-0.50110.24110.1371-0.1913-0.30560.2072
0.1375-0.24270.2197-0.55190.07240.4126-0.20920.12880.62150.4982-
T
2w
=
0.0451 0.01760.0296-0.0044-0.00190.00380.00680.00740.0068-0.0249-
0.03020.03390.0211-0.0010-0.0062-0.00390.0021-0.02630.0086-0.0424-
0.0731-0.10010.0121-0.23110.2115-0.04420.30100.0188-0.0102-0.0297
0.0496-0.0157-0.0454-0.21760.1713-0.08890.30760.0299-0.0147-0.0167-
0.6202-0.04990.02200.0090 0.06690.0510-0.00440.0595-0.0220-0.0617
0.04920.0145-0.0615-0.0994-0.05750.0274-0.0751-0.0309-0.0107-0.0189-
T
3
5684.08094.0w
= 0.0815-0.07720.06430.49370.7812-0.0367-0.91440.0789-0.6057-0.4379
0.3224-0.73370.2549-0.67500.89740.71340.5170-0.0096-
[ ]T2 1.59071.1911-0.8867-0.2980-0.17470.28390.48530.86011.23991.6466b =
[ ]T3 2181.0 0.4233-b =
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
86
* Giai đoạn kiểm tra
Với cấu trúc và bộ thông số của mạng nơron Elman (6x10x(10)x2) đã tìm
được trong giai đoạn học, thực hiện giai đoạn kiểm tra với mômen )k(),k( 21 ττ ở
dạng:
)k02.0cos(99)k(1 π=τ ; )k1.0sin(99)k(2 π=τ .
Mô phỏng trên Matlab, đồ thị kết quả trong giai đoạn kiểm tra biểu diễn từ
hình 3.22 đến hình 3.27 gồm: đồ thị mômen τ1 (hình 3.22), mômen τ2 (hình
3.23), đồ thị q1(nét đứt) và 1q
∧
(nét liền) (hình 3.24), đồ thị q2(nét đứt) và 2q
∧
(nét
liền) (hình 3.25), đồ thị không gian 3 chiều mô tả quan hệ của 3 đại lượng(τ1,
m3, 1q
∧
) (hình 3.26) và (τ2, m3, 2q
∧
) (hình 3.27).
0 10 20 30 40 50 60 70 80 90 100
-100
-80
-60
-40
-20
0
20
40
60
80
100
Hình 3.22. Đồ thị mômen τ1 giai đoạn kiểm tra
0 10 20 30 40 50 60 70 80 90 100
-100
-80
-60
-40
-20
0
20
40
60
80
100
Hình 3.23. Đồ thị mômen τ2 giai đoạn kiểm tra
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
87
0 10 20 30 40 50 60 70 80 90 100
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
Hình 3.24. Đồ thị q1(nét đứt) và đồ thị 1q
∧
(nét liền)
giai đoạn kiểm tra
0 10 20 30 40 50 60 70 80 90 100
-0.2
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
Hình 3.25. Đồ thị q2(nét đứt) và đồ thị 2q
∧
(nét liền)
giai đoạn kiểm tra
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
88
-100
-50
0
50
100
0
1
2
3
-2
0
2
4
6
8
Hình 3.26. Đồ thị 3 chiều mô tả quan hệ(τ1,m3, 1q
∧
)
giai đoạn kiểm tra
-100
-50
0
50
100
0
1
2
3
-4
-3
-2
-1
0
1
Hình 3.27. Đồ thị 3 chiều mô tả quan hệ(τ2,m3, 2q
∧
)
giai đoạn kiểm tra
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
89
Từ kết quả mô phỏng nhận thấy với cấu trúc và bộ thông số học của mạng
nơron Elman (6x10x(10)x2) trong giai đo ạn học, các tín hiệu đầu ra tính toán của
mạng 1q
∧
, 2q
∧
đã bám theo được vị trí thực của rôbôt hai khâu là q1, q2 trong cả hai
giai đoạn học và kiểm tra với sai lệch E rất nhỏ, nên mạng nơron Elman nói trên
đã nhận dạng được vị trí rôbôt hai khâu. Để thấy rõ được ưu điểm của giải pháp
này, thực hiện so sánh với giải pháp sử dụng mạng nơron truyền thẳng
(4x5x10x2) [3] theo bảng số liệu sau đây.
Bảng số liệu so sánh
Loại mạng Cấu trúc Số chu kỳ
học
Sai lệch E Số lượng
mạng
Mạng nơron
Elman
(6x10x(10)x2) 7.000 1.52736.10-6 1
Mạng nơron
truyền thẳng
nhiều lớp [3]
4x5x10x2
5584 2.99983.10-6 Cần ít nhất 2
mạng nơron
3.4. KẾT LUẬN CHƯƠNG III
Mạng nơron Elman (6x10x(10)x2) với bộ thông số tìm được trong giai đoạn
học đã nhận dạng được đối tượng MIMO phi tuyến phức tạp là vị trí rôbôt hai
khâu với sai lệch học rất nhỏ, với số lượng chu kỳ học không nhiều và cấu trúc
của mạng nơron Elman không quá phức tạp. Ứng dụng mạng nơron Elman nhận
dạng vị trí rôbôt hai khâu là giải pháp mới có ưu điểm so với mạng nơron truyền
thẳng nhiều lớp là chỉ cần sử dụng một mạng nơron Elman (6x10x(10)x2) đã
nhận dạng được vị trí rôbôt hai khâu với sai lệch học nhỏ hơn. Giải pháp này
cũng góp phần khẳng định được rằng nên sử dụng mạng nơron Elman trong bài
toán nhận dạng đối tượng phi tuyến vì khi đó sẽ có được nhiều ưu điểm hơn so
với trường hợp sử dụng mạng nơron truyền thẳng nhiều lớp. Giải pháp này cũng
có thể được áp dụng khi rôbôt hai khâu ở dạng “hộp đen” không biết trước thông
số với chú ý thực hiện xác định bộ dữ liệu vào-ra bằng phương pháp đo lường
trực tiếp trên cơ cấu rôbôt hai khâu thực.
Chương III: Ứng dụng mạng nơron Elman nhận dạng vị trí rôbôt hai khâu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
90
3.5. KẾT LUẬN CHUNG VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI
3.5.1. Kết luận
- Luận văn đã hoàn thành những yêu cầu đặt ra là khảo sát về phương pháp
ứng dụng mạng nơron Elman nhận dạng đối tượng phi tuyến có thông số thay
đổi là vị trí rôbôt hai khâu.
3.5.2. Các đóng góp chính và hướng phát triển của đề tài nghiên cứu:
- Luận văn đã tổng hợp được các tài liệu về mạng nơron và các ứng dụng
của nó để có cái nhìn tổng quan về kết cấu, các luật học và các phương pháp ứng
dụng mạng nơron trong nhận dạng.
- Bằng phương pháp phân tích, so sánh về cấu trúc, các luật học và khả
năng ứng dụng thực tiễn của các loại mạng nơron, luận văn này đã chọn mạng
nơron Elman là mạng có nhiều ưu điểm về cấu trúc và luật học để tập trung
nghiên cứu ứng dụng nó trong bài toán nhận dạng vị trí rôbôt hai khâu.
- Do thời gian nghiên cứu có hạn trong khuôn khổ luận văn này mới chỉ tìm
hiểu được giai đoạn 1 bài toán là: ứng dụng mạng nơron Elman để nhận dạng đối
tượng, giai đoạn thứ 2 của bài toán là:
+ Giải quyết bài toán vừa nhận dạng vừa điều khiển (on – line).
+ Nghiên cứu các thuật toán tăng tốc độ học của mạng nơron.
Vì vậy luận văn này là một hướng nghiên cứu mở, có thể phát triển tiếp
tục hướng nghiên cứu này ở các công trình khoa học cấp cao hơn.
Gi¶i thÝch ký hiÖu, c«ng thøc
______________________________________________________________
______________________________________________________________
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Gi¶i thÝch ký hiÖu, c«ng thøc
STT Ký hiÖu DiÔn gi¶i
1 neti (t) Tæng träng lượng
2 yj C¸c ®Çu ra cña c¸c n¬ron
3 ui (t)
C¸c ®Çu vµo tõ bªn ngoµi t¬ng øng víi träng
sè Wij vµW
*
ik
4 θi Ngìng cña n¬ron thø i.
5 a(.) Hµm chuyÓn ®æi
6 Wij Ma trËn träng sè
7 r TÝn hiÖu häc
8 xi(t) C¸c biÕn tr¹ng th¸i
9 yi(t) C¸c ®Çu ra cña hÖ
10 u(.), x(.), y(.) C¸c biÕn ë d¹ng rêi r¹c
11 αi, βj C¸c h»ng sè cha biÕt
12
)k(i
∧
α (i=0,1,...,n-1);
)k(j
∧
β (j=0,1,...,m1);
∧
py (k+1)
C¸c th«ng sè nhËn d¹ng
13 ∆wi Gia sè cña vÐc t¬ wi
14 x(t) TÝn hiÖu ®Çu vµo:
15 η H»ng sè häc
16 A, B, C C¸c ma trËn t¬ng øng cÊp (n×n), (n×p), (m×n)
17 x(k) Vect¬ mÉu ®Çu vµo
18 y(k) Vect¬ mÉu ®Çu ra
19 e(k)
TÝn hiÖu sai lÖch gi÷a bé mÉu ®Çu ra d(k) vµ tÝn
hiÖu ra thùc tÕ y(k)
20 qbij Bias cña mçi n¬ron
Gi¶i thÝch ký hiÖu, c«ng thøc
______________________________________________________________
______________________________________________________________
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
STT Ký hiÖu DiÔn gi¶i
21 IW1,1
Kích thước ma trận thông số vào của lớp phản
hồi
22 X Kích thước ma trận của các đầu vào
23 LW1,1 Kích thước ma trận thông số hiện tại
24 a1(k -1)
Đầu ra của lớp hồi qui tại bước nhảy thứ
( k – 1)
25 b2 Bias của lớp ra
26 f2 Sự chuyển chức năng của lớp ra
27 a2 Đầu ra của lớp ra
28 yttmau Đầu ra hiện tại của những mẫu N
29 gmau Đầu vào hiện tại của những mẫu N
30 b1 Bias của lớp hồi qui
31 f1 Chức năng chuyển đổi của lớp hồi qui
32 a1(k) Đầu ra của lớp hồi qui ở bước nhảy k
33 LW2,1
Kích thước ma trận thông số từ lớp hồi qui tới
lớp ra.
34 qi Vị trí khâu thứ i
35 τi Mômen điều khiển khâu thứ i rôbôt hai khâu
36 li Độ dài của khâu thứ i rôbôt hai khâu
37 lci
Độ dài từ điểm nối khâu thứ i đến trọng tâm
của khâu đó
38 Ii Mômen quán tính khâu thứ i
39 m3 Khối lượng phụ tải
40 g Gia tốc trọng trường
Danh môc c¸c h×nh vÏ, ®å thÞ
______________________________________________________________
______________________________________________________________
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Danh môc c¸c h×nh vÏ, ®å thÞ
STT Ký hiÖu DiÔn gi¶i tªn h×nh vÏ
1 Hình 1 Sơ đồ khối điều khiển thích nghi rôbôt hai khâu
2 Hình 2. Mô hình nhận dạng vị trí rôbôt hai khâu
3 Hình 1.1 Mạng nơron đơn giản gồm 2 nơron
4 Hình 1.2 Nơron nhiều đầu vào
5 Hình 1.3 Mạng noron 3 lớp
6 Hình 1.4 Sơ đồ cấu trúc các loại mạng nơron.
7 Hình 1.5. Cấu trúc huấn luyện mạng
8 Hình 1.6 Mô hình học có giám sát và học củng cố
9 Hình 1.7 Mô hình học không có giám sát
10 Hình 1.8 Sơ đồ cấu trúc chung của quá trình học
11 Hình 1.9 Mạng nơron truyền thẳng một lớp.
12 Hình 1.10 Mạng nơron truyền thẳng nhiều lớp
13 Hình 1.11 Sơ đồ cấu trúc của mạng Jordan
14 Hình 1.12 Sơ đồ cấu trúc mạng nơron hồi quy đơn giản
15 Hình 2.1 Điều khiển theo nguyên tắc phản hồi đầu ra
16 Hình 2.2 Sơ đồ tổng quát nhận dạng thông số mô hình
17 Hình 2.3 Nhận dạng theo phương pháp gradient
18 Hình 2.4 Mô hình dạng 1
19 Hình2.5 Mô hình dạng 2
20 Hình 2.6 Mô hình dạng 3
21 Hình 2.7 Mô hình dạng 4
22 Hình 2.8 Mô hình nhận dạng kiểu truyền thẳng
23 Hình 2.9 Mô hình nhận dạng kiểu song song
24 Hình 2.10 Mô hình nhận dạng kiểu nối tiếp - song song
25 Hình 2.11 Mô hình nhận dạng ngược trực tiếp.
Danh môc c¸c h×nh vÏ, ®å thÞ
______________________________________________________________
______________________________________________________________
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
STT Ký hiÖu DiÔn gi¶i tªn h×nh vÏ
26 Hình 2.12 Mô hình 1
27 Hình 2.13 Mô hình 2
28 Hình 2.14 Mô hình 3
29 Hình 2.15 Mô hình 4
30 Hình 3.1 Sơ đồ cấu trúc mạng Elman
31 Hình 3.2 Lược đồ mạng Elman
32 Hình 3.3 Sơ đồ động học rôbôt hai khâu
33 Hình 3.4 Sơ đồ ứng dụng mạng nơron Elman nhận dạng rôbôt hai khâu
34 Hình 3.5 Sơ đồ mô phỏng g1 trên matlab/ simulink
35 Hình 3.6 Sơ đồ mô phỏng g2 trên matlab/ simulink
36 Hình 3.7 Sơ đồ mô phỏng h trên matlab/ simulink
37 Hình 3.8 Sơ đồ mô phỏng H11 trên matlab/simulink
38 Hình 3.9 Sơ đồ mô phỏng H22 trên matlab/ simulink
39 Hình 3.10 Sơ đồ mô phỏng H12 trên matlab/simulink
40 Hình 3.11
Mô hình tính toán dữ liệu vào-ra của vị trí rôbôt hai khâu
trên matlab/simulink
41 Hình 3.12
Mô hình tính toán dữ liệu vào-ra của vị trí rôbôt hai khâu
sau khi sử dụng Subsystem
42 Hình 3.13 Sơ đồ cấu trúc của mạng nơron Elman
43 Hình 3.14 Đồ thị khối lượng của tải m3
44 Hình 3.15 Đồ thị sai lệch E giai đoạn học
45 Hình 3.16 Đồ thị mômen τ1 giai đoạn học
46 Hình 3.17 Đồ thị mômen τ2 giai đoạn học
47 Hình 3.18 Đồ thị q1(nét đứt) và đồ thị 1q
∧
(nét liền) giai đoạn học
Danh môc c¸c h×nh vÏ, ®å thÞ
______________________________________________________________
______________________________________________________________
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
STT Ký hiÖu DiÔn gi¶i tªn h×nh vÏ
48 Hình 3.19 Đồ thị q2(nét đứt) và đồ thị 2q
∧
(nét liền) giai đoạn học
49 Hình 3.20 Đồ thị 3 chiều mô tả quan hệ(τ1,m3, 1q
∧
) giai đoạn học
50 Hình 3.21 Đồ thị 3 chiều mô tả quan hệ(τ2,m3, 2q
∧
) giai đoạn học
51 Hình 3.22 Đồ thị mômen τ1 giai đoạn kiểm tra
52 Hình 3.23 Đồ thị mômen τ2 giai đoạn kiểm tra
53 Hình 3.24 Đồ thị q1(nét đứt) và đồ thị 1q
∧
(nét liền) giai đoạn kiểm tra
54 Hình 3.25 Đồ thị q2(nét đứt) và đồ thị 2q
∧
(nét liền) giai đoạn kiểm tra
55 Hình 3.26 Đồ thị 3 chiều mô tả quan hệ(τ1,m3, 1q
∧
) giai đoạn kiểm tra
56 Hình 3.27 Đồ thị 3 chiều mô tả quan hệ(τ2,m3, 2q
∧
) giai đoạn kiểm tra
Danh môc c¸c ch÷ viÕt t¾t, tiÕng níc ngoµi
______________________________________________________________
______________________________________________________________
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
DANH MỤC CÁC CHỮ VIẾT TẮT, TIẾNG NƯỚC NGOÀI
STT Ký hiệu Diễn giải
1 Neural Nơron
2 Artificial Neural Nơron nhân tạo
3 Artificial Neural Networks Mạng nơron nhân tạo
4 Back Propagation Learaning Rule Luật học lan truyền ngược
5 Fuzzy logic Lôgic mờ
6 Fuzzy Neural Networks Mạng nơron mờ
7 Recall Gọi lại
8 Input Layer Lớp vào
9 Output Layer Lớp ra
10 Hidden layer Lớp ẩn
11 Learing Học
12 Reinforcement Learning Học củng cố
13 Paramater Learning Học thông số
14 Structure Learning Học cấu trúc
15 Supervised Learning Học có giám sát
16 Unsupervised Learning Học không có giám sát
17 Focused Back - Propgation Networks Mạng lan truyền ngược hội tụ
18 Recurrent Neural Networks Mạng nơron hồi quy
19 Single Node Neural NetWorks Mạng chỉ có một nơron
20 Single Layer Feedforward NetWork Mạng một lớp truyền thẳng
21 Multilayer Feedforward NetWork Mạng nhiều lớp truyền thẳng
22 Model Predictive Control (MPC). Điều khiển tiên đoán mô hình
23 Model Reference Control Điều khiển theo mô hình mẫu:
24 Back Propagation Through Time-BPTT Lan truyền ngược theo thời gian
Danh môc c¸c ch÷ viÕt t¾t, tiÕng níc ngoµi
______________________________________________________________
______________________________________________________________
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Tài liệu tham khảo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
TÀI LIỆU THAM KHẢO
1. Nguyễn Hữu Công. Giáo trình nhận dạng hệ thống điều khiển.
2. Phạm Hữu Đức Dục , Nguyễn Công Hiền, (2005), Nghiên cứu ứng dụng mạng
nơron mờ điều khiển thích nghi rôbôt hai khâu, Tuyển tập các báo cáo Khoa
học tại Hội nghị Toàn quốc lần thứ VI về Tự động hoá, 107 - 112.
3. Phạm Hữu Đức Dục, Ứng dụng mạng nơron truyền thẳng nhiều lớp nhận dạng vị
trí rôbôt hai khâu, Tạp chí KH&CN các trường ĐH Kỹ thuật, số 63, 2008, 1-5.
4. Phạm Hữu Đức Dục (2008), Ứng dụng mạng nơron Elman nhận dạng vị trí
rôbôt hai khâu. Bài báo đăng trên tạp chí nghiên cứu khoa học kỹ thuật và
công nghệ quân sự số 24 tháng 09 năm 2008 ( trang 84- 91). Trung tâm khoa
học kỹ thuật và công nghệ quân sự phát hành
5. Nguyễn Như Hiển, Lại Khắc Lãi (2007), Hệ mờ và nơron trong kỹ thuật điều
khiển. Nhà xuất bản khoa học tự nhiên và côngnghệ. Hà Nôị
6. Nguyễn Doãn Phước, Phan Xuân Minh (2001), Nhận dạng hệ thống điều khiển.
Nhà xuất bản Khoa học và kỹ thuật. Hà Nội.
7. Lê Minh Trung (1999), Giáo trình mạng nơron nhân tạo.
Nhà xuất bản thống kê.
8. Astrom A. A, Eykhoft P. - "System Identification - A Survey" - Automatica, Vol.
7, 123-162, 1971.
9. CHIN TENG LIN, C.S. GEORGE LEE, (1996), Neural fuzzy systems,
Prentice Hall Internatinal, Inc.
10. H.W. Ge, Y.C. Liang, H.P. Lee, C. Lu, "Chapter 7, An improved particle swarm
otimization-based dynamic recurrent neural network for identifying and
controlling ultrasonic motors", Nova Science Publishers, 2007, 263-283.
11. Narendra, Parthasarathy, "Identification and control of dynamical systems using
Neural Networks ", IEEE. Trans. on Neural Networks, No.1, 1990, 4-27.
12. SOMLO J., LANTOS B., PHAM THUONG CAT, (1997), Advance Robot
Control, Akademiai Kiado - Budapest.
._.
Các file đính kèm theo tài liệu này:
- LA9270.pdf