ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG
THIẾT LẬP GIAO THỨC NHẬN DẠNG VÀ PHÂN LOẠI LỖI
TRONG HỆ THỐNG PHỨC TẠP
Mã số: T2019-06-131
Chủ nhiệm đề tài: TS. Trần Ngọc Hoàng
Đà Nẵng, Tháng 6/2020
ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG
THIẾT LẬP GIAO THỨC NHẬN DẠNG VÀ PHÂN LOẠI LỖI
TRONG HỆ THỐNG PHỨC TẠP
Mã số: T2019-06-131
Xá
79 trang |
Chia sẻ: huong20 | Ngày: 04/01/2022 | Lượt xem: 380 | Lượt tải: 0
Tóm tắt tài liệu Báo cáo tổng kết đề tài - Thiết lập giao thức nhận dạng và phân loại lỗi trong hệ thống phức tạp, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ác nhận của cơ quan chủ trì đề tài Chủ nhiệm đề tài
DANH SÁCH THÀNH VIÊN THAM GIA NGHIÊN CỨU ĐỀ TÀI
1. Trần Ngọc Hồng
DANH SÁCH ĐƠN VỊ PHỐI HỢP CHÍNH
1. Trường Đại học Sư phạm Kỹ thuật - Đại học Đà Nẵng
BÁO CÁO TỔNG KẾT ĐỀ TÀI CẤP CƠ SỞ
DANH MỤC CÁC BẢNG
Số hiệu Tên bảng Trang
Bảng 4.1 Biến đo lường liên tục 42
Bảng 4.2 Biến đo lấy mẫu 42
Bảng 4.3 Biến điều khiển 43
Bảng 4.4 Bảng tên lỗi 43
Bảng 4.5 Các biến sử dụng trong mơ hình chuẩn đốn 45
Bảng 4.6 Các giá trị rời rạc hố của các biến 48
THỰC HIỆN: TS. TRẦN NGỌC HỒNG
BÁO CÁO TỔNG KẾT ĐỀ TÀI CẤP CƠ SỞ
DANH MỤC CÁC HÌNH VÀ BIỂU ĐỒ
Số hiệu Tên bảng Trang
Hình I.1 Sơ đồ AMS tổng quát 3
Hình I.2 Sơ đồ cấu trúc tháp điều khiển CIM 5
Hình I.3 Sơ đồ cấu trúc các thành phần điều khiển 7
Hình I.4 Ví dụ về DataBase EDA 9
Mơ hình mơ tả các bước của quá trình quan sát và
Hình I.5 11
theo dõi sức khoẻ thiết bị sản xuất
Hình II.1 Phân loại các phương pháp phân loại biến. 20
Hình III.1 Ví dụ mạng Bayes 27
Hình III.2 Ví dụ về cấu trúc mạng Bayes tăng lên. 29
Hình III.3 Cấu trúc mạng bayes phân cấp 30
Hình III.4 Sơ đồ khối của mơ hình chuẩn đốn 35
Hình IV.1 Sơ đồ qui trình sản xuất hơi cơng nghiệp TEP 40
Quy trình phương pháp chuẩn đốn lỗi bằng mạng
Hình IV.2 44
Bayesian
Mơ hình được xây dừng và các mối quan hệ của các
Hình IV.3 47
biến được xác nhận
Hình IV.4 Mơ hình chuẩn đốn mạng Bayesian trên Matlab 47
Dữ liệu của các biến và lỗi F6 biến thiên theo thời
Hình IV.5 49
gian.
Hình IV.6 Xác suất cĩ điều kiện của các biến điều khiển. 50
THỰC HIỆN: TS. TRẦN NGỌC HỒNG
BÁO CÁO TỔNG KẾT ĐỀ TÀI CẤP CƠ SỞ
DANH MỤC CÁC CHỮ VIẾT TẮT
AMS Automated Manufacturing System
BN Bayes Network
CIM Computer Integrated Manufacturing
DB Data Base
DM Data mining
ERP Enterprise Resource Planning
EM Expectation-Maximization
FDC Fault Detection Classification
FMEA Failure Mode and Effects Analysis
ML Machine Learning
R2R Run to run
SPC Statistical Process Control
TEP Tennessee Eastman Process
VM Virtual Metrology
THỰC HIỆN: TS. TRẦN NGỌC HỒNG
Báo cáo tổng kết đề tài khoa học
Table of Contents
PHẦN MỞ ĐẦU ...........................................................................................................2
CHƯƠNG I. TỔNG QUAN NGHIÊN CỨU ........................................................................3
1.1. Hệ thống sản xuất tự động (Automated Manufacturing System – AMS) .................. 3
1.1.1. Cấu trúc vật lý ............................................................................................................................3
1.1.2. Hệ thống điều khiển ..................................................................................................................4
1.2. Giám sát sản xuất .................................................................................................. 6
1.2.1. Bảo trì cơng nghiệp ...................................................................................................................6
1.2.2. Quá trình điều khiển .................................................................................................................7
1.3. Hệ thống thơng tin ................................................................................................. 9
1.4. Vấn đề của đề tài ................................................................................................. 11
CHƯƠNG II. CƠ SỞ LÝ THUYẾT PHƯƠNG PHÁP NGHIÊN CỨU .................................... 14
2.1. Các phương pháp xử lý biến dữ liệu ..................................................................... 15
2.1.1. Phương pháp Lọc dữ liệu - Filter ............................................................................................ 15
2.1.2. Phương pháp Tương quan dữ liệu - Correlation.................................................................... 15
2.1.3. Phương pháp Phân loại - Classification .................................................................................. 17
2.1.4. Phương pháp Hồi qui - Regression ......................................................................................... 17
2.1.5. Phương pháp Xếp hạng và lựa chọn biến .............................................................................. 18
2.1.6. Phương pháp Rừng ngẫu nhiên ............................................................................................. 19
2.2. Các phương pháp phân loại dữ liệu ...................................................................... 19
2.2.1. Phương pháp phân loại giám sát ........................................................................................... 20
2.2.2. Phương pháp phân loại khơng giám sát................................................................................. 20
2.3. Các phương pháp mơ hình hố ............................................................................ 21
2.3.1. Xác định các tiêu chuẩn .......................................................................................................... 22
2.3.2. Phương pháp K hàng xĩm gần nhất ....................................................................................... 23
2.3.3. Phương pháp Mạng Nơron .................................................................................................... 23
2.3.4. Phương pháp Cây quyết định ................................................................................................. 24
2.3.5. Phương pháp Mạng Bayes ..................................................................................................... 25
CHƯƠNG III. QUÁ TRÌNH THIẾT LẬP BAYESIAN ĐỂ CHUẨN ĐỐN LỖI ......................... 26
3.1. Tổng quan về mạng Bayes (hoặc Bayesian) ........................................................... 26
3.1.1. Định nghĩa và tính chất .......................................................................................................... 26
3.1.2. Học hỏi và Suy luận ................................................................................................................ 30
3.2. Mơ hình hố ........................................................................................................ 33
3.3. Phần mềm ứng dụng ............................................................................................ 36
CHƯƠNG IV. ỨNG DỤNG VÀ KẾT QUẢ ....................................................................... 38
4.1. Giới thiệu trường hợp ứng dụng .......................................................................... 38
4.1.1. Quy trình TEP .......................................................................................................................... 38
4.1.2. Đề xuất mơ hình chuẩn đốn trên TEP theo Mạng Bayesian phân cấp ................................. 44
4.2. Kết quả chuẩn đốn lỗi ........................................................................................ 48
KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................................ 52
0
Báo cáo tổng kết đề tài khoa học
1
Báo cáo tổng kết đề tài khoa học
PHẦN MỞ ĐẦU
Ngày nay, quá trình cơng nghiệp hố đẩy các doanh nghiệp vào một sự cạnh
tranh khốc liệt. Trong bối cảnh đĩ, sự thành cơng phụ thuộc vào chất lượng sản xuất
lẫn chất lượng sản phẩm. Do đĩ, các nhà sản xuất phải tối đa hố hiệu suất và chất
lượng sản xuất thơng qua ba tiêu chí: vịng đời sản phẩm, giá và hiệu quả. Để đạt
được những điều đĩ, họ thường tập trung vào việc tăng khả năng sẵn sàng của thiết
bị sản xuất thơng qua một kế hoạch bảo trì bảo dưỡng chặt chẽ và hiệu quả.
Nghiên cứu này nhằm phát triển một mơ hình chuẩn đốn và phân loại lỗi để
hỗ trợ con người trong quá trình thiết lập một quá trình bảo dưỡng thiết bị và cơng
cụ sản xuất. Phương pháp mơ hình hố được chọn lựa dựa trên cơ sở phân tích và
học thuật các phương pháp phân loại và học dữ liệu từ cổ điển đến hiện đại. Theo
đĩ các phương pháp học mạng Bayes được giới thiệu và thực hiện theo các bước mơ
hình hố với các thuật tốn chính của nĩ. Trên nền dữ liệu mơ phỏng từ một quy
trình sản xuất dược phẩm, mơ hình chuẩn đốn lỗi thể hiện kết quả chuẩn đốn cĩ
giá trị và được so sánh với kết quả thực nghiệm. Cuối cùng, một số bàn luận và định
hướng phát triển sẽ được đưa ra để phát triển đề tài.
2
Báo cáo tổng kết đề tài khoa học
CHƯƠNG I. TỔNG QUAN NGHIÊN CỨU
1.1. Hệ thống sản xuất tự động (Automated Manufacturing System – AMS)
1.1.1. Cấu trúc vật lý
Hệ thống sản xuất tập hợp tất cả các yếu tố (vật liệu, con người, phần cứng
và phần mềm) tham gia vào quá trình sản xuất. Một quy trình điều chỉnh các đặc
tính vật lý của sản phẩm thơng qua các hoạt động đúc, gia cơng, rèn và lắp ráp trong
lĩnh vực sản xuất hoặc như quá trình khử, tách, tinh chế trong lĩnh vực hĩa học hoặc
xử lý nước. Hệ thống sản xuất được tạo thành từ hệ thống điều khiển và trạm sản
xuất (xem hình I.1).
Figure I.1. Sơ đồ AMS tổng quát [1].
Theo đĩ, các thành phần của một hệ thống sản xuất được mơ tả như dưới đây:
Phần vận hành : bộ thiết bị biến đổi sản phẩm. Cũng được gọi là trạm sản
xuất (hoặc trạm làm việc), chúng tạo thành yếu tố cơ bản để thực hiện các hoạt động
sản xuất. Theo tiêu chuẩn [35], các yếu tố này là máy mĩc (robot, máy tiện, máy
phay, ...), đơn vị vận chuyển, v.v ... hoặc thậm chí là người vận hành. Trong thực tế,
các trạm sản xuất này cĩ thể hồn tồn tự động, hồn tồn thủ cơng hoặc thậm chí
là kết hợp. Hiệu suất của trạm phụ thuộc vào những yếu tố đĩ.
Dịng sản phẩm đại diện cho tất cả các thực thể trải qua quá trình chuyển đổi
trong hệ thống sản xuất (nguyên liệu thơ, chế biến, lắp ráp, sản phẩm hồn thiện).
3
Báo cáo tổng kết đề tài khoa học
Trong quá trình này, một sản phẩm rời khỏi một trạm sản xuất cuối cùng trở thành
một sản phẩm bước vào trạm làm việc tiếp theo. Trong suốt các giai đoạn sản xuất,
sản phẩm cĩ thể được chuyển đến các trạm đo lường để kiểm tra, (với độ trễ) xác
định rằng tất cả hoặc một phần của các biến đổi đã được thực hiện thành cơng hay
khơng. Do đĩ, trạm này giúp kiểm sốt tốt hơn năng suất tổng thể của hệ thống sản
xuất bằng cách chẩn đốn sự phù hợp của chúng và do đĩ chất lượng của chúng
trong suốt chu kỳ chuyển đổi sản phẩm.
Hệ thống điều khiển của một thiết bị : vai trị của nĩ là làm cho bộ phận hoạt
động tuân theo các quy luật vận hành được định trước (luật kiểm sốt) để đáp ứng
các yêu cầu của cấp cao hơn thường được gọi là Lệnh kiểm sốt tương ứng với sản
xuất (OF). Chúng đi kèm với các thơng số cụ thể như loại chuyển đổi sẽ được thực
hiện, cơng thức, thời gian xử lý, số lượng cần chuyển đổi, v.v ... [34]. Ngồi hoạt
động chính của biến đổi, hệ thống điều khiển của một thiết bị cĩ thể tích hợp các
chức năng khác như theo dõi quá trình biến đổi theo mức độ tiến trình (khả năng
quan sát) theo ý của mình để cho phép, một “posteriori”, chẩn đốn nguyên nhân,
điều chỉnh cài đặt máy hoặc thậm chí đối thoại với người vận hành hoặc với hệ thống
giám sát. Khi một số phần của thiết bị (máy mĩc) gĩp phần chuyển đổi cùng một
sản phẩm, cần phải mở rộng khái niệm về hệ thống điều khiển thiết bị để tối thiểu
hĩa đồng bộ hĩa tất cả các trạm sản xuất để đáp ứng mục tiêu sản xuất chung.
1.1.2. Hệ thống điều khiển
Một số kiến trúc thí điểm đã được đề xuất trong [36] theo các tiêu chí khác
nhau (độ phức tạp, tính biến đổi, kết nối, v.v.). Những kiến trúc quản lý này được
phân biệt theo tính chất tập trung, phân cấp, phân tán, v.v.
Tuy nhiên, điểm chuẩn trong lĩnh vực của chúng tơi vẫn là cấu trúc lái phân
cấp được chia thành sáu cấp độ. Nĩ được gọi tên là “Computer Integrated
Manufacturing” (CIM) hoặc "Sản xuất tích hợp máy tính" (xem hình I.2).
4
Báo cáo tổng kết đề tài khoa học
Figure I.2. Sơ đồ cấu trúc tháp điều khiển CIM.
Mơ hình CIM hình kim tự tháp này xác định phân tích mơ đun và phân cấp
của Hệ thống sản xuất tự động thành năm cấp độ:
Cấp 5: Chiến lược (Quản lý chung của cơng ty), Cơng ty sản xuất, lập kế
hoạch (Phân bổ tải cho nhà máy);
Cấp độ 4: Sản xuất nhà máy, lập kế hoạch (Quản lý vận hành nhà máy), Lập
kế hoạch tạm thời;
Cấp độ 3: Phối hợp liên đơn vị (Giám sát tồn cầu), Lập thời gian thực;
Cấp độ 2: Kiểm sốt đơn vị (kiểm sốt và giám sát);
Cấp 1: Lệnh điều khiển thiết bị (Bộ điều khiển logic lập trình cơng nghiệp,
Điều khiển số, v.v.);
Cấp độ 0: Phần vận hành (trạm sản xuất cho phép chuyển đổi vật lý các sản
phẩm).
Cấu trúc thành các mơ-đun điều khiển bao gồm một lượng lớn thơng tin lưu
thơng qua kiến trúc này, thơng tin cung cấp cho cơ sở dữ liệu của hệ thống sản xuất.
5
Báo cáo tổng kết đề tài khoa học
Trong những năm gần đây, các cấp độ thí điểm một quy trình cơng nghiệp
này đã được tổng hợp theo 3 cấp độ, đặc biệt từ quan điểm của các hệ thống thơng
tin hỗ trợ các hoạt động thí điểm. Họ giới thiệu các khái niệm về ERP (Lập kế hoạch
nguồn lực doanh nghiệp, bao gồm các cấp độ CIM 4 và 5), MES (Hệ thống thực thi
sản xuất bao gồm cấp độ 3) và cuối cùng là kiểm sốt cơng nghiệp (cấp độ 2, 1 và
0); ERP và MES dựa vào các mức thời gian khác nhau, dựa trên cơ sở dữ liệu được
định hướng tương ứng với dữ liệu của cơng ty để hỗ trợ tồn bộ quá trình quản lý
đơn đặt hàng của khách hàng và dữ liệu cần thiết để thí điểm và giám sát của sản
xuất, đại diện cho cuộc sống của quá trình sản xuất.
Cơng việc nghiên cứu của chúng tơi được định vị ở cấp 2. Phần sau đây chi
tiết đặc điểm của nĩ.
1.2. Giám sát sản xuất
Trong bối cảnh cạnh tranh của nền cơng nghiệp hiện đại hố hiên tại, các khái
niệm chính về giám sát sản xuất đã nhanh chĩng được đề xuất để tối đa hĩa sự sẵn
cĩ của thiết bị và liên tục cải thiện chất lượng sản phẩm và quy trình sản xuất. Đây
là chức năng "bảo trì cơng nghiệp" và chức năng "điều khiển quá trình" trong số đĩ.
1.2.1. Bảo trì cơng nghiệp
Bảo trì được định nghĩa là "tập hợp tất cả các hành động kỹ thuật, quản trị và
quản lý trong vịng đời của một tài sản, nhằm duy trì hoặc khơi phục nĩ trong trạng
thái cĩ thể thực hiện chức năng được yêu cầu [2]. Theo định nghĩa này, bảo trì cĩ
tác động trên ba phương diện của sản xuất: năng suất, về tính sẵn cĩ của thiết bị sản
xuất và chất lượng sản phẩm. Đối với hầu hết các lĩnh vực cơng nghiệp, chúng tơi
phân biệt hai loại bảo trì cơng nghiệp trong chất bán dẫn [3]:
- Bảo trì khắc phục (Chạy chương trình bảo trì khi phát hiện thất bại/ sự cố):
áp dụng sau khi phát hiện lỗi hoặc khi xảy ra lỗi và nĩ nhằm mục đích sửa chữa,
khơi phục hoặc thay thế một yếu tố bị lỗi. Các thiết bị bị ảnh hưởng cĩ một tình
trạng thời gian chết đột xuất. Nhược điểm chính của bảo trì sửa chữa là sự xuống
cấp của tuyến tính của hoạt động sản xuất. Sự sẵn cĩ của thiết bị trở nên khĩ lường
và do đĩ rất khác nhau, điều đĩ cĩ nghĩa là tổn thất về mặt cơng suất.
6
Báo cáo tổng kết đề tài khoa học
- Bảo trì phịng ngừa cĩ hệ thống: được thực hiện theo chu kỳ đều đặn và
trước khi xảy ra lỗi. Nĩ dựa trên việc thay thế hoặc sửa chữa một vật phẩm để ngăn
chặn sự khơng cĩ sẵn ngồi dự kiến. Các thiết bị liên quan cĩ một tình trạng thời
gian chết theo lịch trình. Ưu điểm chính của bảo trì phịng ngừa so với phương pháp
khắc phục là thời gian ngừng hoạt động của thiết bị về mặt lý thuyết được kiểm sốt,
do đĩ khả năng giảm độ biến thiên. Điều này địi hỏi sự đồng bộ hĩa mạnh mẽ các
nguồn lực sẵn cĩ (máy mĩc, kỹ thuật viên, phụ tùng, v.v.). Và một trong những
nhược điểm chính của phương pháp phịng ngừa là chi phí tương đối cao (ví dụ, thay
thế một bộ phận vẫn cịn hoạt động).
1.2.2. Quá trình điều khiển
Để cung cấp các mơ hình hỗ trợ quyết định cho bảo trì và kiểm tra, các
phương pháp thống kê (phân tích và định lượng) hoặc / và phương pháp (miền chất
lượng) được phát triển [4]. Trong ngành cơng nghiệp sản xuất phức tạp, các thành
phần chính của quá trình giám sát điều khiển là:
Figure I.3. Sơ đồ các thành phần chính của giám sát điều khiển [1].
7
Báo cáo tổng kết đề tài khoa học
a) Kiểm sốt quá trình thống kê (SPC): hệ thống này cho phép các dây chuyền
sản xuất được kiểm sốt bằng các chỉ số hiệu suất như độ dày, chiều cao,
chiều dài, định tâm ... [5]. SPC được áp dụng cho ba loại biện pháp:
• Các phép đo vật lý: trên một mẫu vật, chẳng hạn chiều cao kích thước các
tấm silicon như một thiết bị đo lường cĩ thể kiểm tra, với độ trễ, rằng những
gì đã được thực hiện đã được thực hiện tốt / hoặc khơng tốt với một tiêu chuẩn
rõ ràng nhất định.
• Các phép đo tham số: trên tất cả các tấm của lơ và các cấu trúc thử nghiệm
nằm xung quanh mạch (Kiểm tra tham số PT),
• Các phép đo điện: trên mỗi mạch tích hợp ở cuối dây chuyền sản xuất (Sắp
xếp wafer điện EWS).
Các phép đo này được liên kết với hai loại giới hạn:
Giới hạn đặc điểm kỹ thuật: khơng được vượt qua cho tốt hoạt động mạch.
Giới hạn kiểm sốt: rào cản để đủ điều kiện tốt hoạt động của hoạt động sản xuất.
b) Phát hiện lỗi và phân loại (FDC): hệ thống này cho phép theo dõi các thay
đổi về thơng số thiết bị (nhiệt độ, áp suất, v.v.) trong thời gian thực [6]. Trong
suốt các giai đoạn sản xuất, các thơng số thiết bị được thu thập cho mỗi sản
phẩm đang được sản xuất. Mục tiêu là để kiểm sốt tốt hơn các thiết bị vận
hành dị thường hay khơng.
c) Run-to-Run (R2R): các vịng điều khiển nhằm đảm bảo sự ổn định của các
quy trình sản xuất trong suốt vịng đời của thiết bị [37]. Các vịng điều khiển
được sử dụng để liên kết hai thành phần SPC và FDC.
Ngành cơng nghiệp sản xuất phức tạp được đặc trưng bởi một chủ đề bối cảnh cho
hoạt động khơng chắc chắn. Các chính sách bảo trì khác nhau, hệ thống điều khiển
trực tuyến, phương pháp phát hiện và phân loại, thử nghiệm tham số, đo điện, vịng
phản ứng ... giúp giảm một phần biến thiên, để kiểm sốt tốt hơn các vết trơi thiết bị
và nâng cao chất lượng sản phẩm. Nhưng nhiều vấn đề gặp phải trong các xưởng
sản xuất (giảm sản lượng) là để nhắc nhở chúng ta rằng khơng phải mọi thứ đều
được quan sát và quan sát được và do đĩ khơng cĩ rủi ro bằng khơng.
8
Báo cáo tổng kết đề tài khoa học
1.3. Hệ thống thơng tin
Như chúng ta đã thấy, những hạn chế về cơng nghệ liên quan đến việc đặt cảm biến
trong thiết bị sản xuất chắc chắn gây ra sự chậm trễ trong việc phát hiện lỗi sản
phẩm. Để tham gia xử lý vấn đề như vậy, vẫn cần cĩ thể truy cập thơng tin từ hội
thảo để xem xét, ví dụ, suy luận thống kê, xác định hoặc xác suất. Do đĩ, cĩ vẻ như
đây là cơ hội để chúng tơi trình bày ở đây tổ chức chung của cơ sở dữ liệu mà từ đĩ
chúng ta cĩ thể rút ra thơng tin cần thiết cho mơ hình hĩa. Dữ liệu được thu thập
bằng các thiết bị đo và / hoặc máy đo lường.
a) Dữ liệu – Database (DB) được liên kết với thiết bị: Phân tích dữ liệu kỹ thuật
trên máy tính của DB-EDA (Data Base- Engineering Data Analyse) là kho
lưu trữ dữ liệu quá trình. Phát hiện và phân loại lỗi của FTC cho phép theo
dõi thời gian thực sự phát triển của các thơng số thiết bị, DB -TGV Cơng cụ
trực quan Tồn cầu Hiển thị trực tiếp dữ liệu bảo trì, do đĩ tạo điều kiện cho
việc trích xuất của họ.
Figure I.4. Ví dụ về DataBase EDA
b) BD được liên kết với sản phẩm: BD-Inline chứa tất cả các phép đo vật lý được
thực hiện trên các bĩng bán dẫn trong các hoạt động sản xuất (trên một mẫu các tấm
wafer), Bộ phân phối wafer điện BD-EWS, nhĩm các phép đo điện được thực hiện
trên mỗi các mạch tích hợp ở cuối dây chuyền sản xuất, "Thử nghiệm tham số" của
BD-PT tập hợp các phép đo điện được thực hiện trên các cấu trúc thử nghiệm nằm
xung quanh mạch (đối với tất cả các tấm wafer), "Defectivity" của BD-DEF tập
trung vào thơng tin tương đối sự hiện diện của các hạt trên bề mặt của wafer để kiểm
tra xem nĩ cĩ bị nhiễm bẩn hay khơng.
9
Báo cáo tổng kết đề tài khoa học
Trong một nhà máy sản xuất mạch tích hợp, một số loại sản phẩm được xử lý (sản
xuất hàng loạt), các cơng nghệ rất tiên tiến và với mức độ tích hợp ngày càng tăng.
Khiếm khuyết nhỏ nhất trên sản phẩm (hoặc phế liệu) là tương đối cao. Vấn đề về
khả năng quan sát của một lỗi vào đúng thời điểm chiếm một vị trí quan trọng trong
việc tìm kiếm cải thiện hiệu suất. Để khắc phục vấn đề này, hai phương pháp thường
được đề xuất trong mơi trường cơng nghiệp: đo lường thực và đo lường ảo.
Hệ thống đo lường: một giải pháp đầu tiên bao gồm việc cài đặt thiết bị đo lường
thực trong chuỗi sản xuất để đảm bảo các bước kiểm sốt cần thiết để giám sát chất
lượng sản phẩm. Trong thực tế, điều này thường kèm theo chi phí bổ sung đáng kể,
cả về mặt đầu tư, bảo trì và tăng thời gian chu kỳ. Ngồi ra, và với các dịng sản
phẩm quan trọng đặc trưng cho các vị trí sản xuất này, điều quan trọng cần lưu ý là
các bước đo lường khơng thể được thực hiện một cách cĩ hệ thống trên tất cả các
sản phẩm, chỉ cĩ một vài mẫu được kiểm tra; điều này cũng đặt ra vấn đề về sự liên
quan của việc lựa chọn mẫu cần kiểm tra và thời gian thích hợp để kiểm tra.
Những hạn chế liên quan đến sự tích hợp của các máy đo lường (từ quan điểm sản
phẩm) đã dẫn đến sự phát triển tự nhiên của đo lường ảo (Virtual Metrology VM)
với mục tiêu giảm thiểu số lượng tấm sản phẩm được kiểm tra trong khi cải thiện cả
thơng thạo các thơng số cơng nghệ, sản lượng và thời gian chu kỳ. Do đĩ, VM được
định nghĩa là một kỹ thuật mới để dự đốn các giá trị đo lường trên các sản phẩm
khơng được đo lường vật lý (Chen et al., 2005). Nguyên tắc cơ bản của nĩ dựa trên
khả năng dự đốn các giá trị tham số trong thời gian thực từ thơng tin được thu thập
về sản xuất và đo lường thực tế.
Tuy nhiên, chúng tơi sẽ lưu ý rằng đo lường ảo tập trung vào hiệu suất và chất lượng
sản xuất của các tấm silicon. Tuy nhiên, nguồn phát hành sản phẩm chính được cho
là do trơi dạt thiết bị (ước tính từ 50% đến 70%). Do đĩ, cần phải phát triển các giải
pháp bổ sung để tối ưu hĩa hơn nữa việc sử dụng thiết bị về số lượng, chất lượng
của kết quả và năng suất tổng thể. Đĩ là cốt lõi của quan sát này mà vấn đề nghiên
cứu của chúng tơi được định vị. Chúng tơi đề xuất đĩng gĩp của chúng tơi trong
khuơn khổ chính xác là cải thiện tính khả dụng của thiết bị sản xuất, đặc biệt là thơng
10
Báo cáo tổng kết đề tài khoa học
qua dự đốn về sự trơi dạt của chúng và do đĩ giảm thiểu, hoặc thậm chí hủy bỏ, trì
hỗn phát hiện lỗi sản phẩm.
1.4. Vấn đề của đề tài
Ngày nay, tất cả các khâu trên thiết bị sản xuất đều được trang bị cảm biến
để đo và phản hồi kết quả vì lý do kỹ thuật lẫn lý do đầu tư sản xuất. Do vậy, quá
trình sản xuất luơn luơn tồn tại rất nhiều rủi ro của việc khơng thể quan sát được các
nhiễu loạn hoặc trơi dạt mà ở đĩ máy mĩc khơng hoạt động đúng như chúng ta yêu
cầu, tạo nên những ảnh hưởng tới chất lượng sản phẩm. Trong khi đĩ thiết bị sản
xuất gần như khơng cĩ một cơ chế nội tại nào để xác định vấn đề đến từ đâu nếu sản
phẩm đưa ra khơng chất lượng. Do đĩ, trên thực tế rất nhiều sự trơi dạt hoạt động
(sự sai lệch hoạt động khiến cho thiết bị sản xuất khơng thể đem lại được kết quả
chất lượng sản phẩm như dự kiến) khơng thể tránh khỏi trong quá trình sản xuất.
Trong bối cảnh đĩ, vấn đề này lại trở nên nghiêm trọng hơn khi mà thời đại cơng
nghiệp 4.0 tạo nên một khối lượng đồ sộ dữ liệu sản xuất (con người, cảm biến, cơng
thức, vật liệu). Quy trình phân tích khối dữ liệu đĩ để trích xuất những thơng tin
cần thiết cho quá trình giám sát và theo dõi thiết bị được mơ tả tổng quát như hình
1.
Hình I.5. Mơ hình mơ tả các bước của quá trình quan sát và theo dõi sức khoẻ thiết bị
sản xuất
11
Báo cáo tổng kết đề tài khoa học
Trong bối cảnh đĩ, kỹ thuật học máy (ML) là một lĩnh vực của trí tuệ nhân tạo, theo
đĩ thuật ngữ này đề cập đến khả năng các hệ thống cơng nghệ thơng tin cĩ thể độc
lập tìm giải pháp cho các vấn đề bằng cách nhận ra các mẫu trong cơ sở dữ liệu. Nĩi
cách khác, ML cho phép các hệ thống máy tính nhận dạng các mẫu trên cơ sở các
thuật tốn và bộ dữ liệu hiện cĩ và để phát triển các khái niệm giải pháp phù hợp.
ML là kiến thức nhân tạo được tạo ra trên cơ sở kinh nghiệm.
Sự phát triển của các chương trình máy tính cĩ thể truy cập dữ liệu và sử
dụng nĩ để tự học là những tính năng chính của kỹ thuật học máy. Quy trình học bắt
đầu bằng các quan sát hoặc thống kê, chẳng hạn như các ví dụ, hướng dẫn hoặc kinh
nghiệm trực tiếp, để tìm kiếm các mẫu trong dữ liệu và đưa ra quyết định nâng cao.
Mục đích quan trọng nhất là cho phép máy tính học robot mà khơng cần sự trợ giúp
hay can thiệp của con người và điều chỉnh hành động cho phù hợp [38, 39, 40].
Kỹ thuật học máy giải thuật các bài tốn theo năm bước cơ bản:
- Tìm kiếm, trích xuất và tĩm tắt dữ liệu liên quan
- Đưa ra dự đốn dựa trên dữ liệu phân tích
- Tính xác suất cho kết quả cụ thể
- Thích ứng với sự phát triển nhất định một cách tự chủ
- Tối ưu hĩa các quy trình dựa trên các mẫu được cơng nhận
Các thuật tốn học máy được giám sát được áp dụng để dự đốn các sự kiện
trong tương lai dựa trên những gì đã được học trong quá khứ với dữ liệu mới bằng
cách sử dụng các ví dụ được gắn nhãn. Bắt đầu từ nghiên cứu của một tập dữ liệu
đào tạo đã biết, một hàm được suy ra để đưa ra dự đốn về m giá trị đầu ra được
phát triển với thuật tốn học tập. Chương trình này cĩ thể cung cấp các mục tiêu sau
khi đào tạo đủ cho bất kỳ đầu vào nào. Thuật tốn học máy cũng cĩ thể đánh giá đầu
ra của nĩ một cách chính xác, dự định để điều chỉnh mơ hình cho phù hợp và hỗ trợ
trong việc tìm kiếm lỗi. Cơng việc trong bài viết này của tác giả tập trung vào quá
trình trích xuất dữ liệu và đưa ra mơ hình chuẩn đốn lỗi cho thiết bị máy mĩc sản
xuất.
Để làm rõ được điều đĩ, báo cáo này sẽ được tổ chức như sau: trong chương 2, tác
giả trình bày một cơ sở phân tích lý thuyết xung quanh các kỹ thuật xủ lý biến dữ
12
Báo cáo tổng kết đề tài khoa học
liệu, học máy (machine learning), từ đĩ chọn ra và áp dụng kỹ thuật học mạng
Bayesian. Mục 3 trên cơ sở đĩ trình bày một chu trình ứng dụng mạng Bayesian vào
quá trình học dữ liệu từ hệ thống sản xuất. Tiếp đĩ, mục 4 trình bày trường hợp ứng
dụng của phương pháp này và đưa ra kết quả chuẩn đốn nguyên nhân lỗi áp dụng
trong một ví dụ mơ phỏng quá trình sản xuất lị hơi Tenessse Eastman. Cuối cùng,
kết luận và thảo luận của đề tài sẽ đĩng lại cáo cáo này.
13
Báo cáo tổng kết đề tài khoa học
CHƯƠNG II. CƠ SỞ LÝ THUYẾT PHƯƠNG PHÁP NGHIÊN CỨU
Sau khi trình bày bối cảnh cơng việc của chúng tơi và đặt ra vấn đề mà cơng
việc của chúng tơi đĩng gĩp, chúng tơi đề xuất trong chương II này xem xét lý thuyết
về các phương pháp được sử dụng nhiều nhất trong các lĩnh vực phân tích rủi ro và
an tồn: phương pháp định tính và định lượng.
Các hoạt động cơng nghiệp, như các mối rủi ro sản xuất tự nhiên, cĩ thể gây
ra rủi ro dưới nhiều hình thức, hoặc thậm chí dẫn đến các sự kiện thất bại lớn. Để
giảm những rủi ro này xuống mức chấp nhận được, để hạn chế chi phí nhân lực, vật
chất và tài chính của họ, cần phải đánh giá chúng, ngăn chặn sự xuất hiện của chúng
(phịng ngừa) và hạn chế tác động (bảo vệ) của chúng. Chính trong bối cảnh này,
các ngành cơng nghiệp vũ khí, hàng khơng và hạt nhân đã phát triển các phương
pháp phân tích rủi ro dự báo [41]. Ngành cơng nghiệp bán dẫn hoặc dược phẩm được
coi là đặc biệt nhạy cảm với các tình huống bất ngờ và hạn chế hoạt động, và tính
đến rủi ro là một yếu tố quan trọng. Vì lý do này, sự quan tâm đặc biệt đã được dành
cho các phương pháp phân tích rủi ro bằng cách điều chỉnh chúng phù hợp với hoạt
động của chúng.
Rủi ro là xác suất xảy ra lỗi, nĩ được đặc trưng bởi mức độ nghiêm trọng, sự
xuất hiện và phát hiện của nĩ (SOD). Một rủi ro cơng nghiệp đại diện cho những
thất bại tiềm tàng cĩ thể cĩ tác động đến sản phẩm, thiết bị hoặc quy trình sản xuất.
Các thiệt hại gây ra cĩ thể là mất năng suất, thời gian chu kỳ hoặc chi phí.
Về phần mình, an tồn vận hành là một mơn khoa học kỹ thuật nhằm đảm
bảo hoạt động đúng đắn của một hệ thống. SdF tích hợp các khía cạnh về độ tin cậy,
khả năng bảo trì, tính sẵn sàng và bảo mật (Villemeur, 1988). Trong lĩnh vực cơng
nghiệp, yêu cầu của khách hàng về chất lượng rất mạnh. Sự phát triển khơng ngừng
của các cơng nghệ và sự phức tạp của các quy trình sản xuất là nguồn gốc của những
thay đổi trong phân tích rủi ro và phương pháp an tồn vận hành. Tùy thuộc vào bản
chất của hệ thống, loại vấn đề được nghiên cứu và các mục tiêu tìm kiếm, các phương
pháp khác nhau được áp dụng.
14
Báo cáo tổng kết đề tài khoa học
2.1. Các phương pháp xử lý biến dữ liệu
2.1.1. Phương pháp Lọc dữ liệu - Filter
Lọc là một phương pháp xử lý để làm sạch tín hiệu bằng cách loại bỏ càng
nhiều nhiễu càng tốt trong khi bảo tồn càng nhiều thơng tin càng tốt. Ngồi ra, thơng
tin chứa trong tín hiệu khơng nhất thiết phải hồn tồn phù hợp: cần phải chọn thơng
tin hữu ích theo cách sử dụng mà người ta muốn tạo ra nĩ [15]. Phương pháp này
được áp dụng trong lĩnh vực điện tử. Trong điện tử, bộ lọc kỹ thuật số là một yếu tố
thực hiện lọc bằng cách sử dụng một chuỗi các phép tốn trên tín hiệu rời rạc. Đĩ
là, nĩ sửa đổi nội dung phổ của tín hiệu đầu vào bằng cách làm giảm hoặc loại bỏ
một số thành phần phổ khơng mong muốn. Về mặt lý thuyết, các bộ lọc kỹ thuật số
cĩ thể đạt được tất cả các hiệu ứng lọc cĩ thể được xác định bởi các hàm hoặc thuật
tốn tốn học. Tuy nhiên, hai hạn chế chính của bộ lọc kỹ thuật số là tốc độ và chi
phí.
Ngồi ra, cịn cĩ Lọc tuyến tính đặc trưng cho việc lọc tín hiệu bằng một hệ
thống tuyến tính bất biến theo thời gian. Do đĩ, bất kỳ tín hiệu nào đi qua bộ lọc sẽ
thấy độ phân giải của nĩ (hoặc chất lượng của nĩ giảm). Trong một bộ lọc điện tử,
nguyên tắc là giống hệt nhau. Luơn cĩ sự mất thơng tin trong hoạt động tích ch...{��,�,�} là các tham số của mạng Bayes tại lần lặp t [24].
∗
Với �(�: � ) = ��∗[����(�0, ��|�)] [14]
Do đĩ, �(�: �∗) là kỳ vọng về khả năng của bất kỳ tập hợp tham số nào θ
∗
được tính bằng cách sử dụng phân phối dữ liệu bị thiếu �(��|� ).
• Kỳ vọng: ước tính N * từ các tham số tham chiếu.
∗ � �� �� ∗
�(�: � ) = ∑�=1 ∑�=1 ∑�=1 ��,�,� �����,�,� [15]
Tối đa hĩa: chọn giá trị tốt nhất của các tham số �(�+1) bằng cách tối đa hĩa
Q.
• Lặp lại hai bước này miễn là chúng ta cĩ thể tăng giá trị của Q. (hội tụ nos
cho giá trị tối ưu).
Học cấu trúc:
Thơng thường cấu trúc được xác định bởi các chuyên gia. Khi đây khơng phải
là trường hợp, cĩ thể sử dụng các thuật tốn để xây dựng mạng. Trong số các thuật
tốn này, cĩ những thuật tốn bao gồm tìm kiếm các mối quan hệ nhân quả khác
nhau tồn tại giữa các biến và các thuật tốn khác cố gắng định lượng mức độ đầy đủ
31
Báo cáo tổng kết đề tài khoa học
của mạng Bayes cho vấn đề cần giải quyết, đĩ là: liên kết một số điểm với mỗi mạng
Bayes.
Sau đĩ, họ tìm kiếm cấu trúc sẽ cho điểm cao nhất. Một cách tiếp cận tồn
diện là khơng thể trong thực tế, thực tế, số lượng cấu trúc cĩ thể cĩ cho n nút là siêu
cấp số nhân. Cơng thức sau đây được thể hiện bởi [11] đưa ra số lượng cấu trúc cĩ
thể cĩ từ n nút:
1, � = 0 �� 1
( ) [14]
� � = {∑� ( )�+1 � �(�−1) ( ) � > 1
�=1 −1 (� ) 2 �� � − 1 ,
Để giải quyết vấn đề này, một số phương pháp phỏng đốn đã được đề xuất.
Một số phương pháp này là:
• Thuật tốn PC và IC, tìm kiếm quan hệ nhân quả
• Phương pháp lai
B: Suy luận
Suy luận Bayes dựa trên việc sử dụng các báo cáo xác suất, trong trường hợp
chung được tìm thấy bởi các chuyên gia nghiên cứu một hệ thống được biết đến với
họ. Những tuyên bố này phải rõ ràng và chính xác để tránh bất kỳ sự nhầm lẫn nào
trong các mối quan hệ phụ thuộc sẽ dẫn đến chúng. Suy luận Bayes đặc biệt hữu ích
trong các vấn đề cảm ứng, bởi vì nĩ dựa trên các trường hợp cụ thể và chỉ cĩ giá trị
trong các điều khoản xác suất. Các phương pháp Bayes được phân biệt với các
phương pháp được gọi là phương pháp tiêu chuẩn bằng cách áp dụng cĩ hệ thống
các quy tắc chính thức để chuyển đổi xác suất. Chúng tơi tìm cách gây ra một hệ
thống Bayes cả từ bên trên và bên dưới, cả hậu quả và nguyên nhân, của biểu đồ phụ
thuộc.
Định lý Bayes cĩ thể được suy ra đơn giản bằng cách tận dụng tính đối xứng
p(B|A)p(A)
của quy tắc nhân: �(�|�) =
p(B)
Định lý Bayes cho phép bạn đảo ngược xác suất. Đĩ là nĩi từ nguyên nhân
suy ra hậu quả. Hay nĩi cách khác, bắt đầu từ một hậu quả để quay trở lại nguyên
nhân, xem điều gì là đúng và bác bỏ những hậu quả tiềm ẩn của những nguyên nhân
khác [25]. Suy luận mạng Bayes nổi tiếng nhất là chẩn đốn. Để biết lỗi, một hệ
32
Báo cáo tổng kết đề tài khoa học
thống dựa trên các mạng Bayes sẽ cĩ thể xác định các nguyên nhân cĩ thể xảy ra
nhất đã gây ra sự cố. Tuy nhiên, mạng Bayes cũng được sử dụng để phân loại. Sau
đĩ, họ sẽ dựa trên một số đặc điểm nhất định của các tài liệu để cĩ thể phân loại
chúng theo các danh mục [11].
3.2. Mơ hình hố
Đối với bước này, một kỹ thuật mơ hình phải được áp dụng theo nhu cầu của
các nhà sản xuất. Do đĩ, nghiên cứu của chúng tơi đang hướng tới các phương pháp
xác suất giúp dự đốn tình trạng sức khỏe của thiết bị. Các kỹ thuật mạng Bayes, mà
chúng tơi trình bày chi tiết trong phần đầu của Chương 3, được trình bày dưới dạng
các giải pháp thú vị cho vấn đề khơng chắc chắn và tính đến chuyên mơn. Do đĩ,
bước thứ hai này mơ tả và đánh giá mơ hình cần được tính tốn dựa trên các chế độ
thất bại ưu tiên được xác định trước trong bước những bước phụ:
1. Phân loại nguyên nhân thất bại RC từ bảng FMEA: cho phép bạn xác minh
nguyên nhân do các chuyên gia giả định (kiểm tra) hoặc tìm ra nguyên nhân
mới (nếu cĩ). Do đĩ, đây là một nhận dạng các biến để tham gia chúng vào
mơ hình dự đốn. Giai đoạn này được thực hiện bằng cách sử dụng các kỹ
thuật từ thống kê hoặc / và lĩnh vực xác suất (phân loại, lọc, hồi quy, tìm kiếm
các mối tương quan, v.v.).
2. Cấu trúc đồ họa của mơ hình: một khi nguyên nhân và chế độ thất bại đã được
xác định, chúng tơi kết hợp chúng để xây dựng cấu trúc của mơ hình đồ họa.
Cấu trúc, được biểu thị bằng mối quan hệ nguyên nhân và kết quả, cĩ thể
được phê duyệt bằng cách học cấu trúc từ dữ liệu hoặc trực tiếp trên cơ sở
các bảng FMEA được thiết lập sẵn.
3. Học thơng số của mơ hình: từ cơ sở dữ liệu lịch sử dành riêng cho việc học
và các thuật tốn thích hợp, giai đoạn này cho phép tính tốn các phân phối
xác suất khác nhau liên quan đến từng biến của mơ hình đồ họa.
4. Kiểm tra và xác nhận mơ hình: giai đoạn cuối này bao gồm việc thẩm vấn mơ
hình để dự đốn các chế độ thất bại hoặc chẩn đốn nguồn gốc của chúng.
Với sự hỗ trợ của các thuật tốn suy luận (thử nghiệm) và dữ liệu dành riêng
cho thử nghiệm, mơ hình sẽ được xác nhận hoặc làm mới bằng các bộ dữ liệu
33
Báo cáo tổng kết đề tài khoa học
mới. Do đĩ, mơ hình này sẽ được xác nhận thơng qua POC (Proof Of
Concept) trước giai đoạn cơng nghiệp hĩa. Một ví dụ của bước này là của mơ
hình cần chẩn đốn và tiên lượng được đề xuất nhưng cần phải được tinh
chỉnh. Do đĩ, đây là chủ đề của bước này "tham số hĩa mơ hình".
Một số lưu ý trong thiết lập mơ hình:
- Quản lý thuật tốn: Việc chuẩn đốn từ mơ hình cĩ thể coi như là một loại
chỉ báo. Chỉ báo này khơng hoạt động một mình, nĩ tương tác liên tục với
các mơ hình và cơng cụ khác đã cĩ. Mức độ quan trọng của quá trình bán dẫn
là quan trọng và tính biến thiên phải được kiểm sốt. Vì thế cần đánh giá và
quản lý tác động của các thuật tốn tính tốn trên hệ thống trực tuyến (thời
gian tính tốn, chi phí tích hợp, CNTT ...).
- Quản lý mơ hình: với cùng lý do được đề cập cho giai đoạn trước, quản lý
mơ hình được giới thiệu. Nĩ nhằm mục đích so sánh hiệu suất của các mơ
hình được phát triển. Kết quả so sánh, người dùng quản lý hộp cơng cụ của
mình (mơ hình hồn chỉnh, mơ hình đơn giản hĩa, v.v.) theo tiêu chí hiệu suất
được xác định trước (độ chính xác, chi phí, thời gian chu kỳ, v.v.).
- Quản lý quyết định: giai đoạn này thu thập thơng tin liên quan đến các can
thiệp bảo trì (tài nguyên, loại hành động, chi phí, v.v.) và đo lường (tính sẵn
cĩ của máy, thời gian kiểm tra, hiệu suất, v.v.), điều này để quản lý tốt hơn
các can thiệp trực tuyến dựa trên tính tốn của mơ hình.
- Lập kế hoạch bảo trì dựa trên chẩn đốn: kết quả của mơ hình chẩn đốn được
sử dụng để cung cấp cho người dùng (các) can thiệp cần thiết. Quá trình này
tất nhiên phải tích hợp một mơ hình mở rộng để cĩ thể mơ tả các hành động
bảo trì cĩ thể theo ước tính nguyên nhân của các lỗi.
34
cáot Báo
ổ
ng k
ế
Dữ liệu để học FMEA do hệ t đ
Dữ liệu đầu vào Dữ liệu đánh giá + + ề
Hình
mạng thống chuyên tài khoah
gia cung cấp
III.4
Sơ đồkhối của chuẩn mơ hình đốn
ọ
c
Dữ liệu để test Dữ liệu đào tạo
và xác nhận
Bảng kế hoạch bảo trì
Update
So sánh
dữ liệu N
kết quả
Y
Dữ liệu Mơ hình
Real-time chuẩn đốn lơĩ Bảng xác suất hỗ trợ xác định
nguyên nhân lỗi
35
Báo cáo tổng kết đề tài khoa học
3.3. Phần mềm ứng dụng
Mơ hình chuẩn đốn lỗi của đề tài được phát triển trong mơi trường
MATLAB, một phần mềm tốn học nổi tiếng được phát triển bởi MathWorks.
MATLAB cho phép người dùng xây dựng ma trận, vẽ các hàm tốn học, thực hiện
các phép tính, liên kết các chương trình máy tính được viết bằng nhiều ngơn ngữ lập
trình khác nhau, phân tích dữ liệu, phát triển thuật tốn và tạo mơ hình và ứng dụng.
MATLAB là ngơn ngữ bậc cao, tích hợp khả năng tính tốn, hình ảnh hĩa,
lập trình trong một mơi trường dễ sử dụng, ở đĩ vấn đề và giải pháp được trình bày
trong cùng một lời chú thích tốn học. Thường MATLAB được dùng cho:
- Tốn và điện tốn
- Phát triển thuật tốn
- Dựng mơ hình, giả lập, tạo nguyên mẫu
- Phân tích, khám phám hình ảnh hĩa dữ liệu
- Đồ họa khoa học và kỹ thuật
- Phát triển ứng dụng, cĩ cả xây dựng giao diện đồ họa người dùng
Graphic User Interface
MATLAB là hệ thống tương tác, trong đĩ các phần tử dữ liệu xếp dưới dạng
mảng, khơng cần chiều hướng, cho phép giải quyết nhiều vấn đề tính tốn, đặc biệt
là với ma trận và véc-tơ, trong thời gian nhanh chĩng, chỉ bằng một phần so với viết
phần mềm bằng các ngơn ngữ khơng tương tác vơ hướng như C hay Fortran [4].
MATLAB là viết tắt của Matrix Laboratory (phịng thí nghiệm ma trận). Ban
đầu MATLAB được viết để dễ dàng truy cập phần mềm ma trận do các dự án của
LINPACK và EISPACK phát triển. Họ cũng đã mang tới những tính năng mới nhất
cho phần mềm trong thế giới điện tốn ma trận.
Trong mơi trường đào tạo, nĩ là cơng cụ hướng dẫn chuẩn mực cho cả các
khĩa học dẫn nhập và chuyên sâu trong tốn học, kỹ thuật và khoa học. Trong ngành,
MATLAB cũng là cơng cụ được nhiều nghiên cứu, phân tích, phát triển lựa chọn.
MATLAB cịn cĩ một bộ các giải pháp hướng tới ứng dụng cĩ tên toolbox.
Toolbox rất quan trọng với hầu hết người dùng MATLAB bởi nĩ cho phép học và
áp dụng cơng nghệ chuyên mơn hĩa. Toolbox là bộ sưu tập các hàm MATLAB (M-
36
Báo cáo tổng kết đề tài khoa học
file) mở rộng mơi trường MATLAB để giải quyết từng lớp vấn đề. Các lĩnh vực mà
toolbox cĩ thể làm việc gồm xử lý tín hiệu, hệ thống kiểm sốt, mạng thần kinh,
logic mờ, phép biến đổi wavelet, mơ phỏng.
Chính vì vậy việc áp dung phần mềm MATLAB trong nghiên cứu về kỹ thuật
máy học là việc cần thiết. Nghiên cứu này thiết lập mơ hình dự báo dựa trên các
thuật tốn thơng minh trong mơi trường MATLAB, nhằm hỗ trợ giải quyết các vấn
đề về phân tích các siêu dữ liệu và thiết lập mơ hình dự báo thơng minh [4].
37
Báo cáo tổng kết đề tài khoa học
CHƯƠNG IV. ỨNG DỤNG VÀ KẾT QUẢ
4.1. Giới thiệu trường hợp ứng dụng
4.1.1. Quy trình TEP
Quy trình Tennessee Eastman (TEP) là quy trình được phát triển bởi Cơng ty
hĩa chất Eastman để cung cấp mơ phỏng của một quy trình cơng nghiệp thực để thử
nghiệm các phương pháp kiểm sốt và / hoặc giám sát quá trình [2]. Thật vậy, quy
trình Tennessee Eastman lần đầu tiên được đề xuất bởi Downs và Vogel để cung cấp
một mơ hình mơ phỏng của quy trình cơng nghiệp phức tạp như thực tế để nghiên
cứu các phương pháp giám sát và kiểm sốt quy trình quy mơ lớn. Như thể hiện
trong Hình IV.1, quy trình bao gồm năm phần tử chính: một lị phản ứng, một bình
ngưng tụ, một máy nén, một bộ phân tách rỉ kim loại và một bộ tách trong. Các chất
phản ứng khí trơ A, C, D, E và B được đưa vào lị phản ứng. Thành phần G và H là
hai sản phẩm của TEP dưới dạng chất lỏng, trong khi F là một sản phẩm phụ khơng
mong muốn (thải). Các phản ứng hĩa học của quá trình được cho bởi hệ phương
trình (7.1)
�(�) + �(�) + �(�) → �(���)
�(�) + �(�) + �(�) → �(���)
�(�) + �(�) → �(���)
3�(�) → 2�(���) (7.1)
Tất cả các phản ứng này là khơng thể đảo ngược, tỏa nhiệt, và theo 1 trật tự
liên quan đến nồng độ chất phản ứng khác nhau. Tốc độ phản ứng theo một luật
Arrhenius, và các phản ứng sản xuất G cĩ năng lượng hoạt hĩa cao, phản ứng hoạt
hĩa sinh ra H, dẫn đến độ nhạy cao hơn với nhiệt độ. Các chất phản ứng khí (A, C,
D và E) là nguồn cấp dữ liệu cho lị phản ứng mà họ phản ứng và hình thành, với sự
trợ giúp của một chất xúc tác, G và H sản phẩm ở dạng khí. Một chất lỏng làm mát
(nước) của lị phản ứng cho phép loại bỏ một phần lớn nhiệt được sản xuất.
Các sản phẩm rời khỏi lị phản ứng, trong khi chất xúc tác vẫn cịn trong đĩ.
Khí sản phẩm được làm mát thơng qua bình ngưng ( condenseur) và sau đĩ được
tách lỏng hơi (separateur). Hơi khơng ngưng tụ trong tách lỏng hơi (separateur) được
trả lại cho lị phản ứng bằng một máy nén ( compresseur ). Khí trơ B và F phát sinh
38
Báo cáo tổng kết đề tài khoa học
được thanh lọc từ quá trình tách trong ( separateur). Các dịng đặc trong tách lỏng
hơi được gửi đến các decapeur ( tách rỉ kim loai) nhằm mục đích loại bỏ các dấu vết
cuối cùng của thuốc thử. Sau đĩ, các sản phẩm G và H được rút ra bên ngồi của
quá trình bởi một thiết bị khơng được hiển thị trong hình 4.1.
39
Báo cáo tổng kết đề tài khoa học
Hình IV.1 Sơ đồ qui trình sản xuất hơi cơng nghiệp TEP
40
Báo cáo tổng kết đề tài khoa học
Quá trình này bao gồm 53 biến: 12 biến phu thuoc và 41 biến kiểm sốt
đo.Trong số 41 biến đo lường, 22 biến được đo liên tục (đây là những giá trị của các
bộ cảm biến của quá trình), trong khi những cái khác là những đo lường của các
thành phần như nồng độ, và do đĩ khơng cĩ liên tục, nhưng lấy mẫu. 22 biến đo liên
tục được liệt kê trong Bảng 4.1 trong khi các biến đo lường khác cĩ thể nhìn thấy
trong bảng 4.2. 12 biến phu thuoc được đưa ra trong bảng 4.3.
( Biến số độc lập : các biến số này gây ra sự thay đổi cho 1 hiện tượng, 1 tình
huống
Biến số phụ thuộc là những kết quả của sự biến đổi gây bởi biến số độc lập
Biến số ngoại lai là những biến số khác, nhân tố khác diễn ra trong quá trình
thực tiễn cĩ thể tạo ra những thay đổi lên biến số độc lập
Biến số đan xenhay là biến số xáo trộn, là những biến số cho biết mối quan
hệ liên kết giữa các biến số độc lập và biến số phụ thuộc )
Về quá trình giám sát của TEP, người ta ghi lại cĩ thể được đến 20 lỗi khác
nhau. Những lỗi này là cĩ tính chất khác nhau: sự nhảy của một số cấp biến nội bộ,
sự tăng tính biến thiên của những biến khác, hoặc lỗi của thiết bị truyền động như
van bị chặn. Mơ tả những 20 lỗi được thực hiện trong Bảng 4.4. Trong đĩ người ta
quan sát các lỗi F16 đến F20 là lỗi chưa biết do chưa trải qua quá trình xác nhận.
Để hiểu rõ hơn những gì đại diện cho một lỗi, chúng tơi lấy trường hợp của
lỗi F6. Lỗi này gây ra hiện tượng bão hịa của quá trình (xem [3]). Lỗi F6 là lỗi trong
việc cung cấp khí A. Ngay khi khơng cịn khí A trong bình phản ứng thì các phản
ứng hố học khơng cịn diễn ra nữa, mặc dù bình phản ứng vẫn cung cấp khí D và
E. Việc cung cấp D và E này làm tăng áp suất lị phản ứng đến điểm cận trên an tồn
là 2950kPa. Sự bão hịa này gây ra sự chặn đứng của nhiều biến (luơn ở cùng một
giá trị trong nhiều giờ), làm giảm sự thay đổi của chúng. Tuy nhiên, việc chặn các
biến khơng phải lúc nào cũng nằm chính xác tại cùng một điểm, tạo ra giá trị trung
bình khác nhau từ lỗi F6 này sang lỗi F6 khác. Tuy nhiên vì độ biến thiên thấp của
giá trị trung bình nên lỗi F6 bị loại bỏ về khoảng cách này.
41
Báo cáo tổng kết đề tài khoa học
Trong ví dụ này, chúng ta thấy rằng rằng F6 lỗi tạo ra hậu quả rất rõ ràng về
các biến của quá trình. Đây là loại lỗi dễ dàng phát hiện. Tuy nhiên, một số lỗi khơng
gây ra thay đổi đột ngột nếu các biến của quá trình, phát hiện ít rõ ràng hơn (ví dụ
như lỗi F9).
Bảng 4.1 biến đo lường liên tục
Variable Description Đơn vị
XMES 1 Lưu lượng tiếp liệu ở A( stream 1) Kscmh
XMES 2 Lưu lượng tiếp liệu ở D (stream 2) Kg/hr
XMES 3 Lưu lượng tiếp liệu ở E (stream 3) Kg/hr
XMES 4 Lưu lượng tiếp liệu tổng (steam 4) Kscmh
XMES 5 Lưu lượng tuần hồn lại(stream 8) Kscmh
XMES 6 Lưu lượng tiếp liệu cho lị phản ứng (stream 6) Kscmh
XMES 7 Áp suất của lị phản ứng kPa
XMES 8 Mức của lị phản ứng %
XMES 9 Nhiệt độ của lị phản ứng °C
XMES 10 Lưu lượng làm sạch, gột rửa (stream 9) kscmh
XMES 11 Nhiệt độ của separateur °C
XMES 12 Mức của separateur %
XMES 13 Áp suất của separateur kPa
XMES 14 Lưu lượng của separateur ( stream 10) m3/hr
XMES 15 Mức của decapeur %
XMES 16 Áp suất của decapeur kPa
XMES 17 Lưu lượng của decapeur (stream 11) m3/hr
XMES 18 Nhiệt độ của decapeur °C
XMES 19 Lưu lượng khí ga của decapeur Kg/hr
XMES 20 cơng suất của máy nén kW
XMES 21 Nhiet do làm mát chất lỏng tại đầu ra của lị phản ứng °C
XMES 22 Nhiet do làm mát chất lỏng tại đầu ra của lị separateur °C
Bảng 4.2: biến đo lấy mẫu
Variable Description Stream Sampling(min) Units
XMESA 23 Component A 6 6 Mol%
XMESA 24 Component B 6 6
XMESA 25 Component C 6 6
XMESA 26 Component D 6 6
XMESA 27 Component E 6 6
XMESA 28 Component F 6 6
XMESA 29 Component A 9 6
XMESA 30 Component B 9 6
XMESA 31 Component C 9 6
XMESA 32 Component D 9 6
XMESA 33 Component E 9 6
XMESA 34 Component F 9 6
XMESA 35 Component G 9 6
XMESA 36 Component H 9 6
42
Báo cáo tổng kết đề tài khoa học
XMESA 37 Component D 11 15
XMESA 38 Component E 11 15
XMESA 39 Component F 11 15
XMESA 40 Component G 11 15
XMESA 41 Component H 11 15
Bảng 4.3 biến điều khiển TEP
Variable Description Unity
XC1(42) Lưu lượng cấp liệu ở D ( stream 2) Kg/hr
XC2(43) Lưu lượng cấp liệu ở E ( stream 3) Kg/hr
XC3(44) Lưu lượng cấp liệu ở A (stream 1) Kscmh
XC4(45) Lưu lượng cấp liệu tổng ( stream 4) Kscmh
XC5(46) Van tuần hồn lại của máy nén %
XC6(47) Van trị tuần hồn lại phần gột rửa ( stream 9) %
XC7(48) Lưu lượng cấp liệu của séparateur ( stream 10) m3/hr
XC8(49) Lưu lượng san pham cua décapeur ( stream 11) m3/hr
XC9(50) Giá trị của décapteur ( hiệu suất) %
XC10(51) Lưu lượng của dung dịch là mát của lị phản ứng m3/hr
XC11(52) Lưu lượng của dung dịch là mát của bình ( condenseur) m3/hr
XC12(53) Vận tốc của máy trộn tr/min
Bảng 4.4: lỗi
Faute Description Loại biến
F1 Tỉ số cấp liệu của A/C Nhảy(saut)
F2 Thành phan của B khí trơ ( thành phần sai dẫn đến cấu tạo lỗi) Nhảy(saut)
F3 Nhiệt độ tiếp liệu của D Nhảy(saut)
F4 Nhiệt độ đầu vào của dung dịch làm mát lị phản ứng Nhảy(saut)
F5 Nhiệt độ đầu vào của dung dịch làm mát bình condenser Nhảy(saut)
F6 Sự giảm đi cấp liệu của A Nhảy(saut)
F7 Sự giảm áp lực của cấp liệu của C Nhảy(saut)
F8 Cấu tạo thành phần cấp liệu của A, B và C Nhiễu loạn
F9 Nhiệt độ tiếp liệu của D Nhiễu loạn
F10 Nhiệt độ tiếp liệu của C Nhiễu loạn
F11 Nhiệt độ đầu vào của dung dịch làm mát lị phản ứng Nhiễu loạn
F12 Nhiệt độ đầu vào của dung dịch làm mát bình condenser Nhiễu loạn
F13 Phản ứng động học Lệch từ từ
F14 Van dung dịch làm mát lị p/ứng Bị chặn
F15 Van dung dịch làm mát bình condender Bị chặn
F16 Unknown Unknown
F17 Unknown Unknown
F18 Unknown Unknown
F19 Unknown Unknown
F20 Unknown Unknown
43
Báo cáo tổng kết đề tài khoa học
Với mục đích minh hoạ quy trình chuẩn đốn lỗi đề xuất, trong nghiên cứu
này, chúng tơi minh hoạ nĩ với chỉ duy nhất lỗi F6 và qui trình xây dựng quá trình
chuẩn đốn được mơ tả rõ hơn ở phần tiếp theo.
4.1.2. Đề xuất mơ hình chuẩn đốn trên TEP theo Mạng Bayesian phân cấp
Từ sơ đồ khối của mơ hình, tác giả thực hiện hố quá trình thiết lập mạng
Bayesian cho vấn đề chuẩn đốn bao gồm hai bước chính được mơ tả như hình.
Hình IV.2 Quy trình phương pháp chuẩn đốn lỗi bằng mạng Bayesian
Phân tích quan hệ nhân quả
Phân tích chế độ lỗi và hệ quả (Failure mode and effects analysis – FMEA)
là phương pháp thường được sử dụng để xác định một danh sách các loại lỗi và
nguyên nhân lỗi bởi các chuyên gia. Trên thực tế, bảng phân tích chế độ lỗi và hệ
quả này được thể hiện thơng qua một bảng dẫn báo cáo tổng hợp từ nhiều kỹ sư vận
hành trực tiếp đến giám sát hệ thống sản xuất. Nĩ được xác định bởi sự phân loại
định tính các chế độ lỗi và các kết quả bảo trì thực hiện bởi các chuyên gia dựa trên
kinh nghiệm và sự hiểu biết của họ [3]. Ứng dụng phương pháp này vào mạng
Bayesian, bảng phân tích lỗi và hệ quả của nĩ được chuyển hố thành các núi mạng
(node) và các đường biểu thị nguyên nhân kết quả (arc) trong mơ hình mạng dưới
dạng như mơ tả trong hình trước đĩ.
Trong bài viết này, tác giả sử dụng phân tích chế độ lỗi và hệ quả FMEA
được sử dụng tối ưu bởi kinh nghiệm từ người vận hành và giám sát hệ thống sản
44
Báo cáo tổng kết đề tài khoa học
xuất đã được thiết lập ở hầu hết các hệ thống sản xuất thực tế, trong khi đĩ cơ sở dữ
liệu thể hiện các phân tích nguyên nhân - hệ quả chưa thực sự được quan tâm ở nhiều
cơ sở sản xuất. Trong thực tế, [2] thực hiện một phép đo PCA quan sát sự biến thiên
của lỗi F6 đối với tất cả các biến trong mơ hình, chúng tơi cân nhắc nĩ cùng với ý
kiến của chuyên gia về quá trình để thiết lạp danh sách các biến ảnh hưởng tới lỗi
này được mơ hình hố trong bảng 4.5, đồng thời qua quá trình học tập dữ liệu với
tính tốn chỉ số Person thể hiện độ tương quan của các biến qua dữ liệu để mơ hình
hố các mối quan hệ trong hình.
Bảng 4.5 Các biến sử dụng trong mơ hình chuẩn đốn
Nút Mơ tả Đơn vị
F6 Lỗi sự giảm đi cấp liệu của A --
XMES1 Lưu lượng tiếp liệu ở A (stream 1) Kscmh
XMES2 Lưu lượng tiếp liệu ở D (stream 2) Kg/hr
XMES3 Lưu lượng tiếp liệu ở E (stream 3) Kg/hr
XMES10 Lưu lượng làm sạch, gột rửa (stream 9) Kg/hr
XMES14 Lưu lượng của separateur (stream 10) Kg/hr
XC2 Lưu lượng cấp liệu ở E (stream 3) Kg/hr
XC4 Lưu lượng cấp liệu tổng (stream 4) Kg/hr
XC5 Van tuần hồn lại của máy nén %
XC3 Lưu lượng cấp liệu ở A (stream 1) Kg/hr
XC11 Lưu lượng của dung dịch là mát của bình Kg/hr
( condenseur)
Mơ hình hố
Trong mục này, tác giả đề xuất một cơ chế học dữ liệu để kiểm tra lại mối
quan hệ nhân quả đề xuất bởi các chuyên gia (và cĩ thể tìm ra mối quan hệ mới) như
trong hình IV.2. Cơ chế tự học tự động được thực hiện bởi việc trích xuất từ dữ liệu
lịch sử sản xuất. Mục tiêu của giai đoạn học tập là tìm ra cấu trúc của mạng Bayes
(học cấu trúc) và ước tính xác suất cĩ điều kiện (học các tham số). Cĩ thể chia ra hai
loại dữ liệu học tập: (i) với dữ liệu đầy đủ, tất cả các biến được quan sát, khơng cĩ
biến tiềm ẩn. Phương pháp đơn giản và được sử dụng rộng rãi nhất là ước tính thống
kê, bao gồm ước tính xác suất của một sự kiện theo tần suất xuất hiện của sự kiện
45
Báo cáo tổng kết đề tài khoa học
trong cơ sở dữ liệu. Cách tiếp cận này, được gọi là khả năng tối đa (Maximum
Likelihood Estimation) [4]:
��,�,�
�(�� = ��|��(��) = ��) = ��,�,� = (2)
∑� ��,�,�
Trong đĩ Ni, j, k là số lượng sự kiện trong cơ sở dữ liệu mà biến Xi ở trạng thái xk và
cha mẹ của nĩ nằm trong cấu hình xj.
(ii) với dữ liệu khơng đầy đủ: Trong các ứng dụng thực tế, cơ sở dữ liệu rất
thường khơng đầy đủ. Sau khi nhận thấy sự tồn tại của các loại dữ liệu khơng đầy
đủ khác nhau, chúng tơi sẽ tiếp cận hai trường hợp cĩ thể được xử lý tự động và sau
đĩ tập trung vào một trong các thuật tốn được sử dụng nhiều nhất là thuật tốn cực
đại hĩa kỳ vọng (Expectation–maximization algorithm) [5].
Về cơ bản, phương pháp Bayesian là một phương pháp suy luận dựa trên báo
cáo xác suất. Nghĩa là kết quả của quá trình học tập từ dữ liệu của mơ hình mạng
này là một bảng xác suất bao gồm hai loại xác suất [6]: xác suất biên (Marginal
probability) là xác suất của một sự kiện (biến) mà khơng quan tâm đến các sự kiện
(biến) khác và xác suất cĩ điều kiện (Conditional probability) là xác suất của một sự
kiện (biến) A nào đĩ, biết rằng một sự kiện (biến) B khác xảy ra.
p (A│B) = (p (B│A) p (A)) / p (B)
Định lý của Bayes cho phép đảo ngược xác suất. Đĩ là nĩi từ nguyên nhân
để suy ra hậu quả. Hay nĩi cách khác, bắt đầu từ một hậu quả để quay trở lại nguyên
nhân, tức là chuẩn đốn. Do đĩ từ một sự thất bại (hoặc lỗi), một hệ thống dựa trên
các mạng Bayes sẽ cĩ thể xác định các nguyên nhân cĩ thể xảy ra nhất dẫn đến sự
cố.
Mối quan hệ để thiết lập nên mạng Bayesian của các điểm nút trong bảng 1
thực tế đã được đề xuất bởi chuyên gia của cơng ty Eastman. Tác giả đề xuất tham
khảo thêm các mối quan hệ giữa các biến lỗi và thơng số cảm biến tại [2]. Hơn thế
nữa, trên quy trình được đề xuất ở hình 2- mục 2 trong bài báo, các mối quan hệ giữa
các biến trong bảng 1 được xác nhận bởi một quá trình học dữ liệu, mà tương ứng
độ chính xác của mối quan hệ đĩ được đánh giá bởi điểm số học từ dữ liệu (score
by learning) thực hiện dựa trên thuật tốn kiểm tra mối tương quan [42].
46
Báo cáo tổng kết đề tài khoa học
Cơng việc mơ phỏng trong bài báo được thực hiện trên mơi trường Matlab,
thư viện BNT [43]. Hình IV.3 thể hiện mơ hình Bayesian các mối quan hệ nguyên
nhân- hệ quả của các biến trong ví dụ lỗi F6 đã nêu ở trên (các đường mũi tên bình
thường thể hiện mối quan hệ được xác nhận, các đường nét đứt mờ thể hiện mối
quan hệ khơng được xác nhận do điểm số Person thấp). Theo đĩ, ta thấy một số mối
quan hệ đã bị lược bỏ (đồng thời lược bỏ đi một vài biến khơng cĩ tác dụng nào
trong mơ hình) bằng việc kiểm nghiệm với dữ liệu học tập để tinh giản mơ hình
chuẩn đốn trong trường hợp này.
Hình IV.3 Mơ hình được xây dừng và các mối quan hệ của các biến được xác nhận
Trên cơ sở đĩ, hình thể hiện mơ hình chuẩn đốn chúng tơi đã mơ hình hố
trên mơi trường Matlab.
Hình IV.4 Mơ hình chuẩn đốn mạng Bayesian trên Matlab
47
Báo cáo tổng kết đề tài khoa học
Quá trình học dữ liệu đào tạo cũng được thực hiện thơng qua mơi trường này.
Dữ liệu đào tạo là dữ liệu đã được quy chuẩn hố. Chúng trải qua một quá trình từ
tinh chỉnh, lọc nhiễu đến rời rạc hố cẩn thận để thể hiện từ dữ liệu liên tục thành dữ
liệu rời rạc hố để mơ hình học tập. Dữ liệu được dùng để đào tạo mơ hình được
chúng tơi khai thác từ các cơng việc đã được chuẩn hố trước đây, chẳng hạn như
trong [2, 42] với các dữ liệu đầy đủ từ hoạt động bình thường của hệ thống và hoạt
động bất bình thường (cĩ xuất hiện lỗi) trên hệ thống với các bảng giá trị được rời
rạc hố như trong bảng 4.6.
Bảng 4.6 Các giá trị rời rạc hố của các biến
Rời
F6 XMEAS1 XMEAS2 XMEAS3 XC3 XC4 XC5 XC11
rạc
True
[-0.0043 [3 [4 [-0.0935 [-0.0032
1 (cĩ [2 1270.8] [3 1563.2]
0.3276] 35.3] 36] 33.23] 33.32]
lỗi)
False
[0.3276 [1270.8 [1563.2 [35.3 [36 [33.23 [33.23
2 (ko
0.6596] 2539.6] 3123.5] 67.7] 68] 66.55] 66.66]
lỗi)
[0.6596 [2539.6 [3123.5 [67.7 [68 [66.55 [66.66
3 --
1.0000] 3808.4] 4683.7] 100.1] 100] 100] 100]
4.2. Kết quả chuẩn đốn lỗi
Dựa trên dữ liệu đã được chuẩn hố trước đĩ trong [2, 42], chúng tơi thực
hiện việc test và chuẩn đốn lỗi của mơ hình vưà thiết lập được trên một một ví dụ
mà dữ liệu đĩ đã chứng thực:
Mơ tả: Tình huống được thể hiện qua sơ đồ dữ liệu của hình IV.5. Quan sát
dữ liệu xảy ra lỗi F6 (lỗi xảy ra sự rối loạn cấp nguyên liệu ở Steam A), cĩ thể thấy
rằng điều đĩ cĩ sự liên quan đến các biến điều khiển mà ta theo dõi ở mơ hình gồm:
XC3, XC4, XC5 và XC11. Tuy nhiên rõ nét nhất cĩ thể thấy đến sự thay đổi của
biến XC4 bởi sự tăng đột ngột của biến này. Biến XC3 và XC11 cũng cho thấy sự
ảnh hướng của việc tăng liệu cấp các nguyên liệu đầu vào nhưng việc điều khiển của
48
Báo cáo tổng kết đề tài khoa học
chúng mang độ biến thiên quá lớn lúc hoạt động bình thường và khơng cĩ được sự
ổn định trong dữ liệu ghi nhận được. Ngược lại, cĩ thể thấy rằng biến XC5 cũng đã
ảnh hưởng khơng nhỏ đến hệ thống và dẫn đến tình trạng xảy ra lỗi F6 bởi biến XC5
khi được điều khiển một cách ổn định hệ thống đã khơnh cho ra lỗi đến khi xuất hiện
sự rối loạn trong điều khiển. Nhận định trước mắt nguyên nhân của lỗi F6 trong tìh
huống này đã được ghi nhận sẵn trên hệ thơngs dữ liệu ở [42]. Tuy nhiên thực tế do
việc cĩ ảnh hưởng tương tác nhân quả phức tạp của các biến lên nhau mà khĩ nhận
được định thực sự lỗi ở một biến nào. Mức độ quyết định luơn cần một cơng cụ cĩ
thể nhận định nĩ ra thành một dạng điểm số so sánh.
Hình IV.5 Dữ liệu của các biến và lỗi F6 biến thiên theo thời gian.
Kết quả cĩ được từ Mơ hình Bayes:
Để mơ phỏng được tình huống đĩ, chúng tơi đối chiếu giá trị đo của thời điểm
trước khi xảy ra lỗi và sau khi xuất hiện lỗi của mỗi biến với bảng dữ liệu đã được
rời rạc hố. Từ đĩ thiết lập các thơng số ban đầu cho mỗi một quan sát để nhìn nhận
sự thay đổi của xác suất cĩ điều kiện của mỗi một biến điều khiển. Chúng tơi tiến
hành hai thời điểm quan sát như sau:
49
Báo cáo tổng kết đề tài khoa học
- Thời điểm 1(bình thường): Thời điểm trước khi lỗi, thể hiện khi F6
đang ở vị trí mức 2 (False), lúc này cĩ thể thấy các giá trị của các biến
điều khiển ở các mức lần lượt như sau: xmeas1 ở mức 2, xmeas 2,3 ở
mức 3 (so sánh giá trị ở sơ đồ với giá trị chuẩn quy định trong bảng
4.6). Ta qui định chúng ở các mức giá trị đĩ bằng câu lệnh sau ở mơi
trường Matlab:
%observation 1:
evidence{F6}=2;
evidence{xmeas1}=2;
evidence{xmeas2}=3;
evidence{xmeas3}=3;
Hình IV.6 Xác suất cĩ điều kiện của các biến điều khiển.
- Thời điểm 2 (cĩ lỗi): Thời điểm cĩ lỗi là khi xuất hiện F6 (từ 2 nhảy xuống
1) trong sơ đồ hình IV.5, tương ứng với nĩ là giá trị đo xmeas1 bị thay đổi
tuy nhiên các giá trị xmeas2 và 3 vẫn giữ nguyên mức giá trị. Câu lệnh cho
thời điểm này là:
evidence{F6}=1;
evidence{xmeas1}=1;
evidence{xmeas2}=3;
evidence{xmeas3}=2;
Sau đĩ, ta thực hiện tính tốn các xác suất cĩ điều kiện ở mỗi một thời điểm:
P(XCi/{F6, xmeas1, xmeas2, xmeas3}). Xác suất này biểu thị xác xuất của các biến
50
Báo cáo tổng kết đề tài khoa học
điều khiển khi ta đã biết giá trị của các biến F6, xmeas1, xmeas2 và xmeas3 trong
mơ hình. Từ đĩ thể hiện kết quả các xác suất đĩ trên hình IV.6.
Giải thích kết quả: Quá kết quả sự thay đổi về xác suất của các biến điều
khiển XCi ta thấy sự thay đổi lớn nhất là ở biến XC4 khi mà xác suất của biến này
đã thay đổi từ phần lớn đang tập trung ở mức 3 về mức 1 và mức 2. Bên cạnh đĩ là
sự thay đổi khơng nhỏ ở biến XC5 cũng thể hiện được phần nào nguyên nhân lỗi
đến từ sự biến thiên của giá trị biến này. Mức quan sát được ở biến XC3 qua mơ
hình là khơng thực sự rõ nét. Tuy nhiên điều đĩ cũng đã thể hiện được phần nào mơ
tả ban đầu của ví dụ. Và trên thực tế, tuỳ vào biến điều khiển cĩ mức tác động ra sao
đến kết quả lỗi của chu trình thể hiện trên dữ liệu mà cân nhắc đến việc bảo trì.
Hiệu suất cao của mơ hình chuẩn đốn này cho thấy hiệu suất của mơ hình
dự báo đã đạt được mức ý nghĩa mong muốn. Do đĩ, mơ hình là các cơng cụ dự bá...for
Para4 Drying pressure learning consist of production time, machine‟s name,
Para5 Drying temperature machine ID, function, recipe, human factor. Moreover, the
Para6 Drying volume dataset of maintenance consists of Time, Machine‟s name,
Machine state evaluation. The dataset is collected in six
• Third class: The Parameter descriptions Paran months from the CMMS, the metrology detects the product
(n=1→50): they are determined by the real Danapha‟s quality where final products are detected as good or bad
process. There are totally 50 parameters that identified in this product.Also, the metrology data composes of time, product
process by Danapha‟s operators. In this paper, we propose type, Lot number and Product quality in real time. Our
table I in which present only six collected parameter which learning data is built by collecting from FDC, SPC, RMS,
are considered. In order to model, these variables have either metrology data, production data as shown in Fig. 5.
a binary mode (true/ false) which is resulting from
discretization process.
A graph structure model with these three variables classes
is proposed based on Bayes „s rules. That classify the
diagnosis failure causes with two hierarchical classes RCj and
Paran. In which the RCj is represented by knowing the
parameter Paran nodes who is considered also as the causes.
This model offers at the final the probability distributions Fig. 5. Collected production data for Bayes learning
associated with each of variable in Fig. 4. In follow section,
our result would be presented in next section.
Published By:
Retrieval Number: F9796038620/2020©BEIESP Blue Eyes Intelligence Engineering
DOI:10.35940/ijrte.F9796.059120 7 & Sciences Publication
Diagnosis Failure Cause of complex Pharmaceutical System by Bayes Learning for Decision Support
Fig. 6. Diagnosis results by probabilites of variables
Then, Fig. 6 present results illustrative a scenario inference This research is funded by University of Technology and
whereas have only the probability distributions of a part of Education – The University of Danang under project number
variables on table I after learning from database. The T2019-06-131.
probabilities of these variables from two case without and
appear of failure mode FM1 in system. By comparing it‟s REFERENCES
probabilities in two case, operator can make a correct 1. Zio, Enrico. (2013). "System Reliability and Risk Analysis." The
decision. P(RCi|FM) and P(Paran|RCi) of each variable show Monte Carlo Simulation Method for System Reliability and Risk
us how‟s our model work since the observation a failure Analysis. Springer, London, 7-17.
2. Bouaziz. M.-F, Zamạ. E, Duvivier. F. (2013). “Towards Bayesian
mode. In fact, probabilistic inference is obviously based on Network Methodology for Predicting the equipment Health Factor of
learning results. The result show in Fig. 6 that the proposed Complex Semiconductor Systems”. International Journal of
method performs good detection capability by showing the Production Research, Volume 51, Issue 15, 4597-4617.
root cause RC and Para who cause the high speed of roller 3. Tran, N. H., Bouaziz, M. F., & Zamạ, E. (2014). “Identification and
3 3 classification protocol for complex systems”. In 2nd European
of drying. Conference of the Prognostics and Health Management Society,
A real problem drift of Air Heater Pressure of PHME 2014 (pp. 58-65).
manufacturing process is happened in reality on April 2016 in 4. Pearl J., (1988). Probabilistic reasoning in intelligent systems:
Networks of plausible inference. Morgan – Kaufmann, San Diego.
this Danapha‟s atelier. Base on learning and inference results, 5. Pearl, Judea. (2014). Probabilistic reasoning in intelligent systems:
a similar inference is founded as comparing with happens networks of plausible inference. Elsevier.
reality. This show how our model works for supporting to 6. M. Sampath, S. Lafortune and D. Teneketzis, (1998). Active diagnosis
of discrete-event systems, Auto- matic Control, IEEE Transactions on,
make a correct decision. 43(7), pp 908–929.
However, it must be note that the structure of classifier is 7. E. Deschamps and E. Zamai, (2007). Diagnosis for control system
not easily established even either by learning from data or reconfiguration, In IFAC Manage- ment and Control of Production and
Logistics, volume 4, no.1, pp. 377–382.
expert's opinion if it's existant too many variables 8. Jensen F.V., (1996). Introduction to Bayesian networks, UCL Press,
representing production process. Therefore, it should be London.
necessary to propose weights primarily for each variable 9. Bishop, C. M. and Tipping M. E., (1998). “A hierarchical latent
variable model for data visualization”. IEEE Transactions on Pattern
depend on their differences properties in order to make Analysis and Machine Intelligence 20(3), 281–293.
optimal distribution. These indicators can be proposed by 10. Murphy K.,. The Bayes Net Toolbox for Matlab. (2011). Computing
operator‟s experience or by learning from historical Science and Statistics: Proceedings of Inference, vol. 33.
production data in some case. 11. Tran, N. H., Henry Sébastien, and Eric Zamạ. (2016). "Generic and
configurable diagnosis function based on production data stored in
Manufacturing Execution System." Third European Conference of the
IV. CONCLUSION Prognostics and Health Management Society 2016. Vol. 7. No. 057.
12. Gibson, Mark, ed. Pharmaceutical preformulation and formulation: a
This paper deal with diagnosis problem of industrial practical guide from candidate drug selection to commercial dosage
pharmaceutical production. Our methodology is presented form. CRC Press, 2016.
with detailed steps from definition of characteristics of
pharmaceutical context to particular Bayes approaches for AUTHORS PROFILE
modelling diagnosis process. In simulation result, this Mr Ngoc-Hoang Tran was born in Danang, Vietnam in
method is effectiveness for diagnosis failure cause on 1986. He completed his Master‟s degree on engineering of
complex system in 2013 and PhD degree in automation
complex data in Danapha‟s case study. and civil production from Grenoble-INP, France in 2018.
He is currently working on Mechatronics department-
ACKNOWLEDGMENT Faculty of Mechanical engineering, University of
Technology and Education – The University of Danang.
The author wishes to thank Danapha Pharmaceutical His main research interests include equipment diagnosis, IoT supervision
Company. This work was supported in part by their and AI recognition with Bayes network technology.
description documents of manufacturing process, learning
production data and real scenarios.
Published By:
Retrieval Number: F9796038620/2020©BEIESP Blue Eyes Intelligence Engineering
DOI:10.35940/ijrte.F9796.059120 8 & Sciences Publication
PHÂN TÍCH VÀ ỨNG DỤNG PHƯƠNG PHÁP HỌC MÁY ĐỂ CHUẨN
ĐỐN LỖI CHO CHU TRÌNH SẢN XUẤT CƠNG NGHIỆP
ANALYZE AND APPLICATION MACHINE LEARNING TECHNIQUE FOR
DIAGNOSIS INDUSTRIAL PRODUCTION PROCESS
Trần Ngọc Hồng1
1 Trường Đại học Sư phạm Kỹ thuật – Đại học Đà Nẵng, 48 Cao Thắng, Đà Nẵng, Việt Nam
TĨM TẮT
Bài viết này đề xuất một giao thức ứng dụng của quá trình chuẩn đốn trong một máy phản ứng
của một quy trình phức tạp. Bằng cách sử dụng Kỹ thuật học tập Bayes, giao thức này được đào
tạo bằng cách học cơ sở dữ liệu sản xuất lịch sử để chuẩn đốn nguyên nhân thất bại của lị phản
ứng này trong quá trình sản xuất. Ứng dụng trong lĩnh vực tự động hĩa, mơ hình đề xuất được cấu
trúc tự động từ trích xuất dữ liệu được thu thập trực tiếp từ các cảm biến. Dựa trên thuật tốn Tối
đa hĩa kỳ vọng trong học máy, chúng tơi cho thấy kết quả của mơ hình này là phân loại và cũng
để xác định nguyên nhân gốc rễ của vấn đề trơi dạt trong một mơ phỏng kịch bản cụ thể. Do đĩ,
đĩng gĩp chính của chúng tơi để hỗ trợ máy cơng cụ bảo trì để tăng kỹ thuật vịng đời.
Từ khĩa: Điều khiển hệ thống sản xuất; Học mạng Bayes; Hệ thống sản xuất phức tạp; Chu trình
chuẩn đốn; Bảo trì sữa chữa.
ABSTRACT
This paper proposes an application protocol of diagnosis process in a reactor machine of a
complex process. By using Bayes Learning Technique, this protocol is trained by learning
historical production database in order to diagnosis the failure cause of this reactor in production
process. Application in automation field, the model propose is structured automatically from
collected data extract directly from sensors. Based on Expectation Maximization algorithm in
machine learning, we show that the result of this model is to classify and also to identify the root
causes of drift problem in a specific scenario simulation. Therefore, our key contribution to support
maintenance tool machine for increasing life-cycle engineering.
Keywords: Control production; Bayes learning; Complex system; Diagnostics process; Corrective
Maintenance.
1. GIỚI THIỆU trình sản xuất luơn luơn tồn tại rất nhiều rủi ro
Ngày nay, quá trình cơng nghiệp hố của việc khơng thể quan sát được các nhiễu
đẩy các doanh nghiệp vào một sự cạnh tranh loạn hoặc trơi dạt mà ở đĩ máy mĩc khơng
khốc liệt. Trong bối cảnh đĩ, sự thành cơng hoạt động đúng như chúng ta yêu cầu, tạo nên
phụ thuộc vào chất lượng sản xuất lẫn chất những ảnh hưởng tới chất lượng sản phẩm.
lượng sản phẩm. Do đĩ, các nhà sản xuất phải Trong khi đĩ thiết bị sản xuất gần như khơng
tối đa hố hiệu suất và chất lượng sản xuất cĩ một cơ chế nội tại nào để xác định vấn đề
thơng qua ba tiêu chí: vịng đời sản phẩm, giá đến từ đâu nếu sản phẩm đưa ra khơng chất
và hiệu quả [1]. Để đạt được những điều đĩ, lượng. Do đĩ, trên thực tế rất nhiều sự trơi dạt
họ thường tập trung vào việc tăng khả năng hoạt động (sự sai lệch hoạt động khiến cho
sẵn sàng của thiết bị sản xuất thơng qua một thiết bị sản xuất khơng thể đem lại được kết
kế hoạch bảo trì bảo dưỡng chặt chẽ và hiệu quả chất lượng sản phẩm như dự kiến) khơng
quả. thể tránh khỏi trong quá trình sản xuất.
Tuy nhiên, thực tế là khơng phải tất cả Trong bối cảnh đĩ, vấn đề này lại trở
các khâu trên thiết bị sản xuất đều được trang nên nghiêm trọng hơn khi mà thời đại cơng
bị cảm biến để đo và phản hồi kết quả vì lý do nghiệp 4.0 tạo nên một khối lượng đồ sộ dữ
kỹ thuật lẫn lý do đầu tư sản xuất. Do vậy, quá liệu sản xuất (con người, cảm biến, cơng thức,
vật liệu). Quy trình phân tích khối dữ liệu phẩm) và thời gian sản xuất cũng kéo dài (cĩ
đĩ để trích xuất những thơng tin cần thiết cho khi lên đến 8 đến 10 tuần sản xuất). Do đĩ,
quá trình giám sát và theo dõi thiết bị được mơ mơi trường sản xuất trong cơng nghiệp hàm
tả tổng quát như hình 1. chứa nhiều yếu tố khơng chắc chắn nhất định
(sự sai lệch hoạt động của thiết bị sản xuất, sai
sĩt của người vận hành...) cĩ thể ảnh hưởng
đến quá trình điều khiển và bối cảnh bảo trì.
Do đĩ, tác giả phân tích những phương
pháp học máy phổ biến dựa trên các tiêu
chuẩn được định ra để phù hợp với bối cảnh
sản xuất cơng nghiệp 4.0:
• Thích hợp sử dụng với đa dạng
đặc tính của tập hợp tham số (rời
rạc, liên tục, định tính và định
lượng). Ví dụ: thời gian, số đo
Hình 1. Mơ hình mơ tả các bước của quá kỹ thuật số, số lượng...).
trình quan sát và theo dõi sức khoẻ thiết bị • Thích hợp sử dụng với nhiều lớp
sản xuất tham số, dữ liệu từ thiết bị sản
Cơng việc trong bài viết này của tác giả xuất (cảm biến, động cơ...) và
tập trung vào quá trình trích xuất dữ liệu và sản phẩm.
đưa ra mơ hình chuẩn đốn lỗi cho thiết bị • Thích hợp sử dụng với đa dạng
máy mĩc sản xuất. nhiều loại biến (biến quan sát
Để làm rõ được điều đĩ, bài viết này sẽ được và khơng quan sát được).
được tổ chức như sau: trong mục 2, tác giả • Thể hiện được mối tương quan
trình bày một cơ sở phân tích lý thuyết xung (mối quan hệ nguyên nhân – hệ
quanh các kỹ thuật học máy (machine quả) giữa các biến và các sự
learning), từ đĩ chọn ra và áp dụng kỹ thuật kiện.
học mạng Bayesian. Mục 3 trên cơ sở đĩ trình • Xử lý được các vấn đề thiếu/mất
bày một chu trình ứng dụng mạng Bayesian một phần dữ liệu và hoặc dữ liệu
vào quá trình học dữ liệu từ hệ thống sản xuất. khơng chắc chắn (trong các
Tiếp đĩ, mục 4 trình bày trường hợp ứng dụng trường hợp dữ liệu học đầy đủ
của phương pháp này và đưa ra kết quả chuẩn và dữ liệu học khơng đầy đủ).
đốn nguyên nhân lỗi áp dụng trong một ví dụ • Khả năng thích ứng: được định
mơ phỏng quá trình sản xuất lị hơi Tenessse nghĩa như là khả năng sử dụng
Eastman. Cuối cùng, kết luận và thảo luận của đa mục đích của phương pháp
đề tài sẽ đĩng lại bài viết này. mơ hình hố từ dữ liệu, chẳng
hạn: cĩ thể sử dụng để chuẩn
2. CƠ SỞ LÝ THUYẾT đốn, dự đốn, tiên lượng lỗi,
Trong bối cảnh mà hệ thống sản xuất truy xuất nguyên nhẫn lỗi...
được đặc trưng bởi sự phức tạp cao và sự
khơng chắc chắn bởi nhiều yếu tố rủi ro. Sản Dựa trên các tiêu chi này, tác giả tiến hành
xuất cơng nghiệp thậm chí cịn phức tạp hơn phân tích ba loại phương pháp học máy phổ
với nhiều chu trình sản xuất cùng chạy trên biến nhất: Cây quyết định (Decision tree),
một dây chuyền sản xuất với khối lượng các mạng Nơ ron và mạng Bayesian.
bước thực hiện sản xuất rất lớn (đặc biệt trong 2.1 Cây quyết định
mơi trường bán dẫn và cơng nghiệp dược
Cây quyết định là một cơng cụ phổ biến
nhất để phân biệt các lớp (biến, tham số hoặc Ưu điểm chính của việc xác định bởi một
sự kiện). Ưu điểm chính của cây quyết định là mạng thần kinh là cho phép mơ hình hĩa các
chúng cĩ thể dễ dàng được chuyển đổi thành quá trình đa biến phi tuyến tính. Thật vậy, sức
các quy tắc dễ hiểu. Do đĩ, đường dẫn (logic) mạnh của mạng nằm ở cấu trúc của nĩ và trên
dẫn cây đến một quyết định rất rõ ràng đối với các trọng số được áp dụng cho các kết nối của
người dùng. Nếu thuộc tính là nhị phân, chúng nĩ, nhưng điều này do đĩ khơng cho phép
ta cĩ hai quyết định cĩ thể, trong khi nếu thuộc "tính thích ứng" được tính đến.
tính cĩ phương thức k, chúng ta cĩ k quyết 2.3 Mạng Bayesian
định cĩ thể. Do đĩ, mặc dù việc quyết định
được thực hiện nhanh chĩng, việc xây dựng Mạng Bayes là một hệ thống đại diện cho
mơ hình cây tốn nhiều thời gian hơn. Do đĩ, kiến thức và giúp tính tốn xác suất cĩ điều
khả năng quản lý các lớp tham số, Cây quyết kiện cung cấp giải pháp cho các loại vấn đề
định là khơng lớn và khĩ khả thi. khác nhau. Cấu trúc của loại mạng này rất đơn
giản: một biểu đồ trong đĩ các nút biểu thị các
Cây quyết định vẫn cịn một số hạn chế: biến ngẫu nhiên và các cung (do đĩ là đồ thị
Đầu tiên trong số đĩ là chúng khơng thực sự được định hướng) kết nối mạng sau cĩ liên
hỗ trợ các giá trị liên tục. Luơn luơn cĩ thể quan đến xác suất cĩ điều kiện [2]. Biểu diễn
phân biệt chúng nhưng điều này sau đĩ đặt ra đồ họa trực quan nhất về ảnh hưởng của một
vấn đề phân biệt tối ưu (mất thơng tin so với sự kiện độc lập hoặc một sự kiện với một biến
biến ban đầu). Ngồi ra, cây quyết định rất số khác, liên kết nguyên nhân với hiệu ứng
nhạy cảm với ồn nhiễu trong dữ liệu. Điều này bằng một mũi tên. Các biến này cĩ thể rời rạc
cĩ nghĩa là luơn cần một bộ lọc dữ liệu cho hoặc liên tục (phân phối bình thường), cĩ thể
phương pháp này.
quan sát hoặc khơng quan sát được, phát hiện
2.2 Mạng Nơ ron hoặc khơng phát hiện ...
Mạng nơ-ron nhân tạo, cịn được gọi là Trong trường hợp chung, tập hợp biến
mạng nơ-ron thần kinh, là một kỹ thuật phi X = {X1, X2, ... Xn}, hàm phân phối chung P
tuyến tính để dự đốn dữ liệu và thực hiện kết (X) được viết như sau:
nối một số tế bào thần kinh làm phát sinh một n
(1)
mạng lưới thần kinh. Mạng cĩ các đầu vào từ P (X ) = P(X i / Parents(X i ))
bên ngồi được kết nối với một số nơ-ron nhất i=1
định và sau đĩ mạng cung cấp một hoặc nhiều Cĩ thể nĩi, chỉ cĩ một cơng cụ cĩ thể xử
đầu ra ra bên ngồi (đầu ra của một hoặc nhiều lý cả trường hợp các biến rời rạc và biến liên
nơ-ron trong mạng). Do đĩ, một tế bào thần tục: mạng Bayesian. Bởi vì, chúng ta cĩ thể
kinh làm cho nĩ cĩ thể mơ hình hĩa một số xây dựng mạng Bayesian với biểu đồ của mơ
lượng đáng kể các hành vi theo các trọng số. hình trên dữ liệu của các biến rời rạc hoặc các
Tuy nhiên, mạng lưới thần kinh hầu như chỉ bảng xác suất của từng biến liên tục.
xử lý các biến liên tục.
Mạng Bayesian cĩ thể đại diện cho nhiều
Mặc dù số lượng tế bào thần kinh trong biến số (theo nút) và các lớp phân cấp. Việc
lớp đầu vào và đầu ra được áp đặt bởi số lượng tính tốn xác suất được thực hiện từ thuật tốn
đầu vào cho hệ thống cũng như mã hĩa của ước tính tối ưu (Tối đa hĩa khả năng và tối đa
các lớp khác nhau (đối với lớp đầu ra), khơng hĩa kỳ vọng) cĩ thể biểu thị mối tương quan
cĩ quy tắc tốn học nào để xác định số lượng giữa các nút (sẽ được trình bày ở mục sau).
các lớp ẩn và số lượng tế bào thần kinh trong Do đĩ, lợi thế lớn của mạng Bayesian là khả
mỗi lớp này. Tuy nhiên, một thực tế phổ biến năng thích ứng. Bên cạnh đĩ các mạng Bayes
là người ta sử dụng một lớp ẩn duy nhất được cho phép tính đến khía cạnh thời gian nhờ vào
tạo thành từ khoảng một nửa số nơ-ron trong các mạng Bayes động [22]. Thật vậy, cấu trúc
hệ thống cộng với một. Vì vậy, để xử lý dữ và tham số của nĩ khơng thay đổi theo thời
liệu bị thiếu là cần thiết nhất định cĩ điều kiện. gian, nhưng cĩ thể biểu diễn mạng Bayesian
[8] với các mối tương quan thời gian.
Trong bài báo, tác giảthực hiện một phần Bayesian, bảng phân tích lỗi và hệ quả của nĩ
phân tích theo các yếu tố tiêu chí đã được trình được chuyển hố thành các núi mạng (node)
bày để làm rõ hơn về sự chọn lựa mạng và các đường biểu thị nguyên nhân kết quả
Bayesian trong cách xây dựng mơ hình chuẩn (arc) trong mơ hình mạng dưới dạng như mơ
đốn dựa trên học dữ liệu, chi tiết về phương tả trong hình 4.
pháp tiếp tục được giới thiệu trong mục 3. Trong bài viết này, tác giả sử dụng phân
tích chế độ lỗi và hệ quả FMEA được sử dụng
3. QUÁ TRÌNH THIẾT LẬP MẠNG tối ưu bởi kinh nghiệm từ người vận hành và
BAYESIAN CHO VẤN ĐỀ CHUẨN giám sát hệ thống sản xuất đã được thiết lập ở
ĐỐN LỖI hầu hết các hệ thống sản xuất thực tế, trong
khi đĩ cơ sở dữ liệu thể hiện các phân tích
Trong phần này, tác giả mơ tả quá trình nguyên nhân - hệ quả chưa thực sự được quan
thiết lập mạng Bayesian cho vấn đề chuẩn tâm ở nhiều cơ sở sản xuất.
đốn bao gồm hai bước chính được mơ tả như
hình 2. 3.2 Mơ hình hố
Trong mục này, tác giả đề xuất một cơ
chế học dữ liệu để kiểm tra lại mối quan hệ
nhân quả đề xuất bởi các chuyên gia (và cĩ thể
tìm ra mối quan hệ mới). Cơ chế tự học tự
động được thực hiện bởi việc trích xuất từ dữ
liệu lịch sử sản xuất. Mục tiêu của giai đoạn
học tập là tìm ra cấu trúc của mạng Bayes (học
cấu trúc) và ước tính xác suất cĩ điều kiện
(học các tham số). Cĩ thể chia ra hai loại dữ
liệu học tập: (i) với dữ liệu đầy đủ, tất cả các
biến được quan sát, khơng cĩ biến tiềm ẩn.
Phương pháp đơn giản và được sử dụng rộng
rãi nhất là ước tính thống kê, bao gồm ước tính
xác suất của một sự kiện theo tần suất xuất
hiện của sự kiện trong cơ sở dữ liệu. Cách tiếp
cận này, được gọi là khả năng tối đa
(Maximum Likelihood Estimation) [4]:
��,�,�
�(�� = ��|��(��) = ��) = ��,�,� = (2)
Hình 2. Quy trình phương pháp chuẩn ∑� ��,�,�
đốn lỗi bằng mạng Bayesian
Trong đĩ Ni, j, k là số lượng sự kiện trong
3.1 Phân tích quan hệ nhân quả
cơ sở dữ liệu mà biến Xi ở trạng thái xk và cha
Phân tích chế độ lỗi và hệ quả (Failure mẹ của nĩ nằm trong cấu hình xj.
mode and effects analysis – FMEA) là (ii) với dữ liệu khơng đầy đủ: Trong các ứng
phương pháp thường được sử dụng để xác dụng thực tế, cơ sở dữ liệu rất thường khơng
định một danh sách các loại lỗi và nguyên đầy đủ. Sau khi nhận thấy sự tồn tại của các
nhân lỗi bởi các chuyên gia. Trên thực tế, bảng loại dữ liệu khơng đầy đủ khác nhau, chúng
phân tích chế độ lỗi và hệ quả này được thể tơi sẽ tiếp cận hai trường hợp cĩ thể được xử
hiện thơng qua một bảng dẫn báo cáo tổng hợp lý tự động và sau đĩ tập trung vào một trong
từ nhiều kỹ sư vận hành trực tiếp đến giám sát các thuật tốn được sử dụng nhiều nhất là
hệ thống sản xuất. Nĩ được xác định bởi sự thuật tốn cực đại hĩa kỳ vọng (Expectation–
phân loại định tính các chế độ lỗi và các kết maximization algorithm) [5].
quả bảo trì thực hiện bởi các chuyên gia dựa
trên kinh nghiệm và sự hiểu biết của họ [3]. Về cơ bản, phương pháp Bayesian là một
Ứng dụng phương pháp này vào mạng phương pháp suy luận dựa trên báo cáo xác
suất. Nghĩa là kết quả của quá trình học tập từ chất Eastman nhằm cung cấp một mơ phỏng
dữ liệu của mơ hình mạng này là một bảng xác của một quy trình cơng nghiệp thực sự để thử
suất bao gồm hai loại xác suất [6]: xác suất nghiệm các phương pháp kiểm sốt và / hoặc
biên (Marginal probability) là xác suất của giám sát quá trình [7]. Quy trình này bao gồm
một sự kiện (biến) mà khơng quan tâm đến các năm thành phần chính: lị phản ứng, thiết bị
sự kiện (biến) khác và xác suất cĩ điều kiện ngưng tụ, máy nén tái chế, thiết bị phân tách
(Conditional probability) là xác suất của một và bộ tháo gỡ. Thuốc thử khí (gas) A, C, D, E
sự kiện (biến) A nào đĩ, biết rằng một sự kiện và khí trơ B được đưa vào lị phản ứng. Thành
(biến) B khác xảy ra. phần G và H là hai sản phẩm khí mong muốn
tạo ra (product), trong khi F là sản phẩm phụ
p (A│B) = (p (B│A) p (A)) / p (B) (3)
khơng mong muốn. Các phản ứng hĩa học của
Định lý của Bayes cho phép đảo ngược quá trình được đưa ra bởi hệ phương trình (4).
xác suất. Đĩ là nĩi từ nguyên nhân để suy ra
A(g)+C(g)+D(g) →G(lig)
hậu quả. Hay nĩi cách khác, bắt đầu từ một
hậu quả để quay trở lại nguyên nhân, tức là A(g)+C(g)+E(g) →H(lig)
chuẩn đốn. Do đĩ từ một sự thất bại (hoặc
→
lỗi), một hệ thống dựa trên các mạng Bayes sẽ A(g)+E(g) F(lig)
cĩ thể xác định các nguyên nhân cĩ thể xảy ra 3D(g) →2F(lig) (4)
nhất dẫn đến sự cố.
(g) được ký hiệu chỉ khí gas
4. ỨNG DỤNG CHUẨN ĐỐN TRÊN
QUY TRÌNH SẢN XUẤT (lig) được ký hiệu chỉ chất lỏng
TENNESSEE EASTMAN Trong khuơn khổ của bài báo, chúng tơi
4.1 Quy trình Tennessee Eastman chỉ ứng dụng mơ hình Bayesian chuẩn đốn
lỗi cho lị phản ứng trong chu trình sản xuất
Quy trình Tennessee Eastman là một quy
Hình 3. Mơ hình mơ phỏng quy trình cơng nghiệp Tennessee Eastman [9]
trình được phát triển bởi Cơng ty Hĩa Tennesse Eastman. Tại lị phản ứng, các thuốc
thử và các loại khí được đưa vào để bắt đầu Kết quả mơ phỏng được tác giả thể hiện
quá trình sản xuất, được mơ tả phần khoanh trên hai nội dung:
trịn như hình 3. a) Mối quan hệ để thiết lập nên mạng
Tất cả các phản ứng là khơng thể đảo Bayesian của các điểm nút trong bảng
ngược, tỏa nhiệt và thứ tự được quy định bởi 1 thực tế đã được đề xuất bởi chuyên
hệ phương trình (4). Tốc độ phản ứng được gia của cơng ty Eastman. Tác giả đề
biểu thị như là một hàm của nhiệt độ xuất tham khảo thêm các mối quan hệ
Arrhenius. Phản ứng tạo năng lượng G lớn giữa các biến lỗi và thơng số cảm biến
hơn kích hoạt tạo ra H, dẫn đến độ nhạy nhiệt tại [7]. Hơn thế nữa, trên quy trình
độ cao hơn. được đề xuất ở hình 2- mục 2 trong bài
Quy trình Tennessee Eastman bao gồm báo, các mối quan hệ giữa các biến
hơn 20 lỗi khác nhau. Những lỗi này cĩ nhiều trong bảng 1 được xác nhận bởi một
tính chất khác nhau: chẳng hạn như thiếu thiết quá trình học dữ liệu, mà tương ứng độ
bị truyền động hay như van bị chặn... Bên chính xác của mối quan hệ đĩ được
cạnh đĩ, quy trình bao gồm 53 tham số (cảm đánh giá bởi điểm số học từ dữ liệu
biến, thơng số thiết lập, tuỳ chỉnh van...). Mơ (score by learning) thực hiện dựa trên
tả về 20 lỗi này và 53 tham số được đưa ra thuật tốn kiểm tra mối tương quan
trong cơng việc [7]. Tuy nhiên, tác giả thực [11].
hiện phần ứng dụng của mình để mơ hình hố Cơng việc mơ phỏng trong bài báo
khả năng áp dụng mơ hình chuẩn đốn này với được thực hiện trên mơi trường
chỉ một số biến nhất định, được mơ tả như Matlab, thư viện BNT [12]. Hình 4 thể
hiện mơ hình Bayesian các mối quan
bảng 1.
hệ nguyên nhân- hệ quả của các biến
trong ví dụ (các đường mũi tên bình
thường thể hiện mối quan hệ được xác
Bảng 1. Các biến sử dụng trong mơ hình
nhận, các đường nét đứt mờ thể hiện
chuẩn đốn mối quan hệ khơng được xác nhận do
Nút Mơ tả Đơn vị điểm số thấp).
F4 Lỗi báo nhiệt độ °C
của bình ngưng tụ
làm mát của lị
phản ứng
XMES9 Thơng số nhiệt độ °C
của lị phản ứng
XMES16 Thơng số áp lực Kpa
Hình 4. Mơ hình chuẩn đốn mạng
cuả bộ tháo dỡ Bayesian
XMES21 Nhiệt độ của chất °C b) Sau khi mơ hình Bayesian được xác
làm mát ở đầu ra lập, bước cịn lại chỉ cịn là vấn đề của
lị phản ứng sự tính tốn. Bảng xác suất của mỗi
XC3 Lưu lượng nạp Kg/hr biến trong mạng Bayesian được xác
khí A (Luồng 1) lập sau quá trình học dữ liệu trên một
cơ sở lịch sử dữ liệu sản xuất mơ
XC1 Lưu lượng nạp Kg/hr phỏng, được cung cấp trong [11].
khí D (Luồng 2) Xác xuất cĩ điều kiện P(XMES21 | F4)
XC2 Lưu lượng nạp Kg/hr thể hiện xác suất của việc nhiệt độ quá
khí E (Luồng 3) cao của chất làm mát ở đầu vào của lị
phản ứng gây nên lỗi báo quá nhiệt của
4.2 Kết quả mơ phỏng bình ngưng tụ làm mát của lị phản
ứng trong chu trình Tennessee của mơ hình. Do đĩ, việc xác nhận lại mối
Eastman. Tương ứng với dữ liệu lịch quan hệ nguyên nhân – hệ quả bằng một
sử học tập và giả định do tác giả tạo phương pháp tính điểm score các mối quan hệ
nên trong dữ liệu học tập đĩ. Hình 5 như trong cơng việc của tác giả là rất cần thiết.
thể hiện rất rõ xác suất của sự thay đổi Kết quả của việc chuẩn đốn cũng phụ thuộc
này khi phát hiện lỗi F4 trong hệ thống. rất lớn vào chất lượng của dữ liệu sử dụng để
Kết quả này cho thấy sự tương đồng học tập. Vì thế, kết quả chuẩn đốn dựa trên
của về mặt chuẩn đốn cĩ từ mơ hình xác suất chỉ là để hỗ trợ cho quyết định can
và dữ liệu giả định của tác giả. thiệp của con người.
5. KẾT LUẬN
Cơng việc của bài báo này đưa ra một
phương pháp xây dựng mơ hình chuẩn đốn
lỗi dựa trên mạng Bayesian căn cứ trên những
phân tích đặc tính của các phương pháp máy
học hữu dụng nhất. Tác giả cũng đã thực hiện
một mơ phỏng ví dụ ngắn gọn trên một hệ
thống sản xuất mơ phỏng thực, mơ hình
Tennessee Eastman được áp dụng rộng rãi
trong học thuật quốc tế. Kết quả từ mơ hình
mơ phỏng của bài báo cho thấy hiệu quả của
mơ hình trong bước đầu hỗ trợ quyết định bảo
trì bảo dưỡng của người vận hành chu trình
sản xuất.
Bên cạnh đĩ, mơ hình Bayesian bài báo
xây dựng vẫn cịn một số hạn chế: (i) phụ
Hình 5. So sánh sự thay đổi của bảng thuộc vào chất lượng của cơ sở dữ liệu cĩ thể
xác suất điều kiện của các nút mạng khi dẫn đến những kết quả sai lệch trong trường
phát hiện lỗi trong hệ thống sản xuất. hợp dữ liệu học tập khơng đầy đủ; (ii) chưa
thể hiện được những mối quan hệ nguyên
Bên cạnh đĩ, kết quả của bài báo này cũng thể nhân – hệ quả theo thời gian bởi thực tế cĩ các
hiện sự sàng lọc lại các mối quan hệ khơng những rủi ro tác động gây ra lỗi theo những
chắc chắn (được thể hiện bằng mũi tên nét đứt thời gian khác nhau. Hạn chế này sẽ được
ở hình 4) so với một số kết quả thực nghiệm khắc phục bởi một mạng Bayesian thời gian
phân loại lỗi và chuẩn đốn ở những nghiên sẽ được tác giả tiếp tục nghiên cứu của mình
cứu tương tự như [3,7]. Điều đĩ tạo nên sự trong thời gian tới.
tinh giảm hữu ích kích thước của mơ hình
mạng Bayesian. LỜI CẢM ƠN
Tuy nhiên, cần phải lưu ý rằng việc phân loại Nghiên cứu này được tài trợ kinh phí bởi
các biến lỗi cũng như thơng số của nĩ sẽ quyết Trường Đại học Sư phạm Kỹ Thuật – Đại học
định kết quả học tập và kết quả chuẩn đốn Đà Nẵng trong đề tài cĩ mã số T2019-06-131.
TÀI LIỆU THAM KHẢO
[1] Kunio S., Mitsugu K., Yoshifumi K., An Advanced step in TPM Implementation. (pages 64-65).
Paris, France, 1995.
[2] Jensen F.V,. Introduction to Bayesian networks, UCL Press, London, 1996.
[3] Tran et al., Identification and classification protocol for complex systems. In: 2nd European
Conference of the Prognostics and Health Management Society, PHME 2014. 2014. p. 58-65.
[4] Philippe Leray. Réseaux bayésiens « apprentissage et modélisation de systèmes complexes ».
2006.
[5] Sayad Mahmoud et Abbaris Amara. Modèle discriminant pour la classification de documents
XML à l’aide des réseaux bayésiens et le noyau de Fisher. Ecole nationale Supérieure
d’Informatique (ESI). Mémoire de fin d’études. 2010.
[6] Feller, William. An introduction to probability theory and its applications. Vol. 1. John Wiley &
Sons,, 1968.
[7] Par Sylvain VERRON. Diagnostic et surveillance des processus complexes par réseaux
Bayésiens. Thèse doctorale d’Angers. 2007.
[8] Dreyfus, Gérard. Réseaux de neurones: méthodologie et applications. Eyrolles, 2004.
[9] Lau, C. K., et al. Fault diagnosis of Tennessee Eastman process with multi-scale PCA and ANFIS.
Chemometrics and Intelligent Laboratory Systems 120 (2013): 1-14.
[10] Basha, Nour, et al. Multiclass Data Classification using Fault-Detection-based Techniques.
Computers & Chemical Engineering (2020): 106786.
[11] Wetzels, Ruud, and Eric-Jan Wagenmakers. A default Bayesian hypothesis test for correlations
and partial correlations. Psychonomic bulletin & review 19.6 (2012): 1057-1064.
[12] Murphy, K. The BayesNet Toolbox for Matlab. Computing Science and Statistics.
Proceedings of Infence, vol.33.
Tác giả chịu trách nhiệm bài viết:
Họ tên: Trần Ngọc Hồng
Học vị: Tiến Sĩ
Chuyên ngành: Cơ điện tử
Đơn vị: Khoa Cơ Khí, trường Đại học Sư Phạm Kỹ Thuật – Đại học Đà Nẵng, Đà Nẵng
Điện thoại: +(84) 979728986
Email: tnhoang@ute.udn.vn
Các file đính kèm theo tài liệu này:
- bao_cao_tong_ket_de_tai_thiet_lap_giao_thuc_nhan_dang_va_pha.pdf