Báo cáo tổng kết đề tài - Thiết lập giao thức nhận dạng và phân loại lỗi trong hệ thống phức tạp

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG THIẾT LẬP GIAO THỨC NHẬN DẠNG VÀ PHÂN LOẠI LỖI TRONG HỆ THỐNG PHỨC TẠP Mã số: T2019-06-131 Chủ nhiệm đề tài: TS. Trần Ngọc Hoàng Đà Nẵng, Tháng 6/2020 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP TRƯỜNG THIẾT LẬP GIAO THỨC NHẬN DẠNG VÀ PHÂN LOẠI LỖI TRONG HỆ THỐNG PHỨC TẠP Mã số: T2019-06-131 Xá

79 trang | Chia sẻ: huong20 | Lượt xem: 428 | Lượt tải: 0

Tóm tắt tài liệu Báo cáo tổng kết đề tài - Thiết lập giao thức nhận dạng và phân loại lỗi trong hệ thống phức tạp, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ác nhận của cơ quan chủ trì đề tài Chủ nhiệm đề tài DANH SÁCH THÀNH VIÊN THAM GIA NGHIÊN CỨU ĐỀ TÀI 1. Trần Ngọc Hồng DANH SÁCH ĐƠN VỊ PHỐI HỢP CHÍNH 1. Trường Đại học Sư phạm Kỹ thuật - Đại học Đà Nẵng BÁO CÁO TỔNG KẾT ĐỀ TÀI CẤP CƠ SỞ DANH MỤC CÁC BẢNG Số hiệu Tên bảng Trang Bảng 4.1 Biến đo lường liên tục 42 Bảng 4.2 Biến đo lấy mẫu 42 Bảng 4.3 Biến điều khiển 43 Bảng 4.4 Bảng tên lỗi 43 Bảng 4.5 Các biến sử dụng trong mơ hình chuẩn đốn 45 Bảng 4.6 Các giá trị rời rạc hố của các biến 48 THỰC HIỆN: TS. TRẦN NGỌC HỒNG BÁO CÁO TỔNG KẾT ĐỀ TÀI CẤP CƠ SỞ DANH MỤC CÁC HÌNH VÀ BIỂU ĐỒ Số hiệu Tên bảng Trang Hình I.1 Sơ đồ AMS tổng quát 3 Hình I.2 Sơ đồ cấu trúc tháp điều khiển CIM 5 Hình I.3 Sơ đồ cấu trúc các thành phần điều khiển 7 Hình I.4 Ví dụ về DataBase EDA 9 Mơ hình mơ tả các bước của quá trình quan sát và Hình I.5 11 theo dõi sức khoẻ thiết bị sản xuất Hình II.1 Phân loại các phương pháp phân loại biến. 20 Hình III.1 Ví dụ mạng Bayes 27 Hình III.2 Ví dụ về cấu trúc mạng Bayes tăng lên. 29 Hình III.3 Cấu trúc mạng bayes phân cấp 30 Hình III.4 Sơ đồ khối của mơ hình chuẩn đốn 35 Hình IV.1 Sơ đồ qui trình sản xuất hơi cơng nghiệp TEP 40 Quy trình phương pháp chuẩn đốn lỗi bằng mạng Hình IV.2 44 Bayesian Mơ hình được xây dừng và các mối quan hệ của các Hình IV.3 47 biến được xác nhận Hình IV.4 Mơ hình chuẩn đốn mạng Bayesian trên Matlab 47 Dữ liệu của các biến và lỗi F6 biến thiên theo thời Hình IV.5 49 gian. Hình IV.6 Xác suất cĩ điều kiện của các biến điều khiển. 50 THỰC HIỆN: TS. TRẦN NGỌC HỒNG BÁO CÁO TỔNG KẾT ĐỀ TÀI CẤP CƠ SỞ DANH MỤC CÁC CHỮ VIẾT TẮT AMS Automated Manufacturing System BN Bayes Network CIM Computer Integrated Manufacturing DB Data Base DM Data mining ERP Enterprise Resource Planning EM Expectation-Maximization FDC Fault Detection Classification FMEA Failure Mode and Effects Analysis ML Machine Learning R2R Run to run SPC Statistical Process Control TEP Tennessee Eastman Process VM Virtual Metrology THỰC HIỆN: TS. TRẦN NGỌC HỒNG Báo cáo tổng kết đề tài khoa học Table of Contents PHẦN MỞ ĐẦU ...........................................................................................................2 CHƯƠNG I. TỔNG QUAN NGHIÊN CỨU ........................................................................3 1.1. Hệ thống sản xuất tự động (Automated Manufacturing System – AMS) .................. 3 1.1.1. Cấu trúc vật lý ............................................................................................................................3 1.1.2. Hệ thống điều khiển ..................................................................................................................4 1.2. Giám sát sản xuất .................................................................................................. 6 1.2.1. Bảo trì cơng nghiệp ...................................................................................................................6 1.2.2. Quá trình điều khiển .................................................................................................................7 1.3. Hệ thống thơng tin ................................................................................................. 9 1.4. Vấn đề của đề tài ................................................................................................. 11 CHƯƠNG II. CƠ SỞ LÝ THUYẾT PHƯƠNG PHÁP NGHIÊN CỨU .................................... 14 2.1. Các phương pháp xử lý biến dữ liệu ..................................................................... 15 2.1.1. Phương pháp Lọc dữ liệu - Filter ............................................................................................ 15 2.1.2. Phương pháp Tương quan dữ liệu - Correlation.................................................................... 15 2.1.3. Phương pháp Phân loại - Classification .................................................................................. 17 2.1.4. Phương pháp Hồi qui - Regression ......................................................................................... 17 2.1.5. Phương pháp Xếp hạng và lựa chọn biến .............................................................................. 18 2.1.6. Phương pháp Rừng ngẫu nhiên ............................................................................................. 19 2.2. Các phương pháp phân loại dữ liệu ...................................................................... 19 2.2.1. Phương pháp phân loại giám sát ........................................................................................... 20 2.2.2. Phương pháp phân loại khơng giám sát................................................................................. 20 2.3. Các phương pháp mơ hình hố ............................................................................ 21 2.3.1. Xác định các tiêu chuẩn .......................................................................................................... 22 2.3.2. Phương pháp K hàng xĩm gần nhất ....................................................................................... 23 2.3.3. Phương pháp Mạng Nơron .................................................................................................... 23 2.3.4. Phương pháp Cây quyết định ................................................................................................. 24 2.3.5. Phương pháp Mạng Bayes ..................................................................................................... 25 CHƯƠNG III. QUÁ TRÌNH THIẾT LẬP BAYESIAN ĐỂ CHUẨN ĐỐN LỖI ......................... 26 3.1. Tổng quan về mạng Bayes (hoặc Bayesian) ........................................................... 26 3.1.1. Định nghĩa và tính chất .......................................................................................................... 26 3.1.2. Học hỏi và Suy luận ................................................................................................................ 30 3.2. Mơ hình hố ........................................................................................................ 33 3.3. Phần mềm ứng dụng ............................................................................................ 36 CHƯƠNG IV. ỨNG DỤNG VÀ KẾT QUẢ ....................................................................... 38 4.1. Giới thiệu trường hợp ứng dụng .......................................................................... 38 4.1.1. Quy trình TEP .......................................................................................................................... 38 4.1.2. Đề xuất mơ hình chuẩn đốn trên TEP theo Mạng Bayesian phân cấp ................................. 44 4.2. Kết quả chuẩn đốn lỗi ........................................................................................ 48 KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................................ 52 0 Báo cáo tổng kết đề tài khoa học 1 Báo cáo tổng kết đề tài khoa học PHẦN MỞ ĐẦU Ngày nay, quá trình cơng nghiệp hố đẩy các doanh nghiệp vào một sự cạnh tranh khốc liệt. Trong bối cảnh đĩ, sự thành cơng phụ thuộc vào chất lượng sản xuất lẫn chất lượng sản phẩm. Do đĩ, các nhà sản xuất phải tối đa hố hiệu suất và chất lượng sản xuất thơng qua ba tiêu chí: vịng đời sản phẩm, giá và hiệu quả. Để đạt được những điều đĩ, họ thường tập trung vào việc tăng khả năng sẵn sàng của thiết bị sản xuất thơng qua một kế hoạch bảo trì bảo dưỡng chặt chẽ và hiệu quả. Nghiên cứu này nhằm phát triển một mơ hình chuẩn đốn và phân loại lỗi để hỗ trợ con người trong quá trình thiết lập một quá trình bảo dưỡng thiết bị và cơng cụ sản xuất. Phương pháp mơ hình hố được chọn lựa dựa trên cơ sở phân tích và học thuật các phương pháp phân loại và học dữ liệu từ cổ điển đến hiện đại. Theo đĩ các phương pháp học mạng Bayes được giới thiệu và thực hiện theo các bước mơ hình hố với các thuật tốn chính của nĩ. Trên nền dữ liệu mơ phỏng từ một quy trình sản xuất dược phẩm, mơ hình chuẩn đốn lỗi thể hiện kết quả chuẩn đốn cĩ giá trị và được so sánh với kết quả thực nghiệm. Cuối cùng, một số bàn luận và định hướng phát triển sẽ được đưa ra để phát triển đề tài. 2 Báo cáo tổng kết đề tài khoa học CHƯƠNG I. TỔNG QUAN NGHIÊN CỨU 1.1. Hệ thống sản xuất tự động (Automated Manufacturing System – AMS) 1.1.1. Cấu trúc vật lý Hệ thống sản xuất tập hợp tất cả các yếu tố (vật liệu, con người, phần cứng và phần mềm) tham gia vào quá trình sản xuất. Một quy trình điều chỉnh các đặc tính vật lý của sản phẩm thơng qua các hoạt động đúc, gia cơng, rèn và lắp ráp trong lĩnh vực sản xuất hoặc như quá trình khử, tách, tinh chế trong lĩnh vực hĩa học hoặc xử lý nước. Hệ thống sản xuất được tạo thành từ hệ thống điều khiển và trạm sản xuất (xem hình I.1). Figure I.1. Sơ đồ AMS tổng quát [1]. Theo đĩ, các thành phần của một hệ thống sản xuất được mơ tả như dưới đây: Phần vận hành : bộ thiết bị biến đổi sản phẩm. Cũng được gọi là trạm sản xuất (hoặc trạm làm việc), chúng tạo thành yếu tố cơ bản để thực hiện các hoạt động sản xuất. Theo tiêu chuẩn [35], các yếu tố này là máy mĩc (robot, máy tiện, máy phay, ...), đơn vị vận chuyển, v.v ... hoặc thậm chí là người vận hành. Trong thực tế, các trạm sản xuất này cĩ thể hồn tồn tự động, hồn tồn thủ cơng hoặc thậm chí là kết hợp. Hiệu suất của trạm phụ thuộc vào những yếu tố đĩ. Dịng sản phẩm đại diện cho tất cả các thực thể trải qua quá trình chuyển đổi trong hệ thống sản xuất (nguyên liệu thơ, chế biến, lắp ráp, sản phẩm hồn thiện). 3 Báo cáo tổng kết đề tài khoa học Trong quá trình này, một sản phẩm rời khỏi một trạm sản xuất cuối cùng trở thành một sản phẩm bước vào trạm làm việc tiếp theo. Trong suốt các giai đoạn sản xuất, sản phẩm cĩ thể được chuyển đến các trạm đo lường để kiểm tra, (với độ trễ) xác định rằng tất cả hoặc một phần của các biến đổi đã được thực hiện thành cơng hay khơng. Do đĩ, trạm này giúp kiểm sốt tốt hơn năng suất tổng thể của hệ thống sản xuất bằng cách chẩn đốn sự phù hợp của chúng và do đĩ chất lượng của chúng trong suốt chu kỳ chuyển đổi sản phẩm. Hệ thống điều khiển của một thiết bị : vai trị của nĩ là làm cho bộ phận hoạt động tuân theo các quy luật vận hành được định trước (luật kiểm sốt) để đáp ứng các yêu cầu của cấp cao hơn thường được gọi là Lệnh kiểm sốt tương ứng với sản xuất (OF). Chúng đi kèm với các thơng số cụ thể như loại chuyển đổi sẽ được thực hiện, cơng thức, thời gian xử lý, số lượng cần chuyển đổi, v.v ... [34]. Ngồi hoạt động chính của biến đổi, hệ thống điều khiển của một thiết bị cĩ thể tích hợp các chức năng khác như theo dõi quá trình biến đổi theo mức độ tiến trình (khả năng quan sát) theo ý của mình để cho phép, một “posteriori”, chẩn đốn nguyên nhân, điều chỉnh cài đặt máy hoặc thậm chí đối thoại với người vận hành hoặc với hệ thống giám sát. Khi một số phần của thiết bị (máy mĩc) gĩp phần chuyển đổi cùng một sản phẩm, cần phải mở rộng khái niệm về hệ thống điều khiển thiết bị để tối thiểu hĩa đồng bộ hĩa tất cả các trạm sản xuất để đáp ứng mục tiêu sản xuất chung. 1.1.2. Hệ thống điều khiển Một số kiến trúc thí điểm đã được đề xuất trong [36] theo các tiêu chí khác nhau (độ phức tạp, tính biến đổi, kết nối, v.v.). Những kiến trúc quản lý này được phân biệt theo tính chất tập trung, phân cấp, phân tán, v.v. Tuy nhiên, điểm chuẩn trong lĩnh vực của chúng tơi vẫn là cấu trúc lái phân cấp được chia thành sáu cấp độ. Nĩ được gọi tên là “Computer Integrated Manufacturing” (CIM) hoặc "Sản xuất tích hợp máy tính" (xem hình I.2). 4 Báo cáo tổng kết đề tài khoa học Figure I.2. Sơ đồ cấu trúc tháp điều khiển CIM. Mơ hình CIM hình kim tự tháp này xác định phân tích mơ đun và phân cấp của Hệ thống sản xuất tự động thành năm cấp độ: Cấp 5: Chiến lược (Quản lý chung của cơng ty), Cơng ty sản xuất, lập kế hoạch (Phân bổ tải cho nhà máy); Cấp độ 4: Sản xuất nhà máy, lập kế hoạch (Quản lý vận hành nhà máy), Lập kế hoạch tạm thời; Cấp độ 3: Phối hợp liên đơn vị (Giám sát tồn cầu), Lập thời gian thực; Cấp độ 2: Kiểm sốt đơn vị (kiểm sốt và giám sát); Cấp 1: Lệnh điều khiển thiết bị (Bộ điều khiển logic lập trình cơng nghiệp, Điều khiển số, v.v.); Cấp độ 0: Phần vận hành (trạm sản xuất cho phép chuyển đổi vật lý các sản phẩm). Cấu trúc thành các mơ-đun điều khiển bao gồm một lượng lớn thơng tin lưu thơng qua kiến trúc này, thơng tin cung cấp cho cơ sở dữ liệu của hệ thống sản xuất. 5 Báo cáo tổng kết đề tài khoa học Trong những năm gần đây, các cấp độ thí điểm một quy trình cơng nghiệp này đã được tổng hợp theo 3 cấp độ, đặc biệt từ quan điểm của các hệ thống thơng tin hỗ trợ các hoạt động thí điểm. Họ giới thiệu các khái niệm về ERP (Lập kế hoạch nguồn lực doanh nghiệp, bao gồm các cấp độ CIM 4 và 5), MES (Hệ thống thực thi sản xuất bao gồm cấp độ 3) và cuối cùng là kiểm sốt cơng nghiệp (cấp độ 2, 1 và 0); ERP và MES dựa vào các mức thời gian khác nhau, dựa trên cơ sở dữ liệu được định hướng tương ứng với dữ liệu của cơng ty để hỗ trợ tồn bộ quá trình quản lý đơn đặt hàng của khách hàng và dữ liệu cần thiết để thí điểm và giám sát của sản xuất, đại diện cho cuộc sống của quá trình sản xuất. Cơng việc nghiên cứu của chúng tơi được định vị ở cấp 2. Phần sau đây chi tiết đặc điểm của nĩ. 1.2. Giám sát sản xuất Trong bối cảnh cạnh tranh của nền cơng nghiệp hiện đại hố hiên tại, các khái niệm chính về giám sát sản xuất đã nhanh chĩng được đề xuất để tối đa hĩa sự sẵn cĩ của thiết bị và liên tục cải thiện chất lượng sản phẩm và quy trình sản xuất. Đây là chức năng "bảo trì cơng nghiệp" và chức năng "điều khiển quá trình" trong số đĩ. 1.2.1. Bảo trì cơng nghiệp Bảo trì được định nghĩa là "tập hợp tất cả các hành động kỹ thuật, quản trị và quản lý trong vịng đời của một tài sản, nhằm duy trì hoặc khơi phục nĩ trong trạng thái cĩ thể thực hiện chức năng được yêu cầu [2]. Theo định nghĩa này, bảo trì cĩ tác động trên ba phương diện của sản xuất: năng suất, về tính sẵn cĩ của thiết bị sản xuất và chất lượng sản phẩm. Đối với hầu hết các lĩnh vực cơng nghiệp, chúng tơi phân biệt hai loại bảo trì cơng nghiệp trong chất bán dẫn [3]: - Bảo trì khắc phục (Chạy chương trình bảo trì khi phát hiện thất bại/ sự cố): áp dụng sau khi phát hiện lỗi hoặc khi xảy ra lỗi và nĩ nhằm mục đích sửa chữa, khơi phục hoặc thay thế một yếu tố bị lỗi. Các thiết bị bị ảnh hưởng cĩ một tình trạng thời gian chết đột xuất. Nhược điểm chính của bảo trì sửa chữa là sự xuống cấp của tuyến tính của hoạt động sản xuất. Sự sẵn cĩ của thiết bị trở nên khĩ lường và do đĩ rất khác nhau, điều đĩ cĩ nghĩa là tổn thất về mặt cơng suất. 6 Báo cáo tổng kết đề tài khoa học - Bảo trì phịng ngừa cĩ hệ thống: được thực hiện theo chu kỳ đều đặn và trước khi xảy ra lỗi. Nĩ dựa trên việc thay thế hoặc sửa chữa một vật phẩm để ngăn chặn sự khơng cĩ sẵn ngồi dự kiến. Các thiết bị liên quan cĩ một tình trạng thời gian chết theo lịch trình. Ưu điểm chính của bảo trì phịng ngừa so với phương pháp khắc phục là thời gian ngừng hoạt động của thiết bị về mặt lý thuyết được kiểm sốt, do đĩ khả năng giảm độ biến thiên. Điều này địi hỏi sự đồng bộ hĩa mạnh mẽ các nguồn lực sẵn cĩ (máy mĩc, kỹ thuật viên, phụ tùng, v.v.). Và một trong những nhược điểm chính của phương pháp phịng ngừa là chi phí tương đối cao (ví dụ, thay thế một bộ phận vẫn cịn hoạt động). 1.2.2. Quá trình điều khiển Để cung cấp các mơ hình hỗ trợ quyết định cho bảo trì và kiểm tra, các phương pháp thống kê (phân tích và định lượng) hoặc / và phương pháp (miền chất lượng) được phát triển [4]. Trong ngành cơng nghiệp sản xuất phức tạp, các thành phần chính của quá trình giám sát điều khiển là: Figure I.3. Sơ đồ các thành phần chính của giám sát điều khiển [1]. 7 Báo cáo tổng kết đề tài khoa học a) Kiểm sốt quá trình thống kê (SPC): hệ thống này cho phép các dây chuyền sản xuất được kiểm sốt bằng các chỉ số hiệu suất như độ dày, chiều cao, chiều dài, định tâm ... [5]. SPC được áp dụng cho ba loại biện pháp: • Các phép đo vật lý: trên một mẫu vật, chẳng hạn chiều cao kích thước các tấm silicon như một thiết bị đo lường cĩ thể kiểm tra, với độ trễ, rằng những gì đã được thực hiện đã được thực hiện tốt / hoặc khơng tốt với một tiêu chuẩn rõ ràng nhất định. • Các phép đo tham số: trên tất cả các tấm của lơ và các cấu trúc thử nghiệm nằm xung quanh mạch (Kiểm tra tham số PT), • Các phép đo điện: trên mỗi mạch tích hợp ở cuối dây chuyền sản xuất (Sắp xếp wafer điện EWS). Các phép đo này được liên kết với hai loại giới hạn: Giới hạn đặc điểm kỹ thuật: khơng được vượt qua cho tốt hoạt động mạch. Giới hạn kiểm sốt: rào cản để đủ điều kiện tốt hoạt động của hoạt động sản xuất. b) Phát hiện lỗi và phân loại (FDC): hệ thống này cho phép theo dõi các thay đổi về thơng số thiết bị (nhiệt độ, áp suất, v.v.) trong thời gian thực [6]. Trong suốt các giai đoạn sản xuất, các thơng số thiết bị được thu thập cho mỗi sản phẩm đang được sản xuất. Mục tiêu là để kiểm sốt tốt hơn các thiết bị vận hành dị thường hay khơng. c) Run-to-Run (R2R): các vịng điều khiển nhằm đảm bảo sự ổn định của các quy trình sản xuất trong suốt vịng đời của thiết bị [37]. Các vịng điều khiển được sử dụng để liên kết hai thành phần SPC và FDC. Ngành cơng nghiệp sản xuất phức tạp được đặc trưng bởi một chủ đề bối cảnh cho hoạt động khơng chắc chắn. Các chính sách bảo trì khác nhau, hệ thống điều khiển trực tuyến, phương pháp phát hiện và phân loại, thử nghiệm tham số, đo điện, vịng phản ứng ... giúp giảm một phần biến thiên, để kiểm sốt tốt hơn các vết trơi thiết bị và nâng cao chất lượng sản phẩm. Nhưng nhiều vấn đề gặp phải trong các xưởng sản xuất (giảm sản lượng) là để nhắc nhở chúng ta rằng khơng phải mọi thứ đều được quan sát và quan sát được và do đĩ khơng cĩ rủi ro bằng khơng. 8 Báo cáo tổng kết đề tài khoa học 1.3. Hệ thống thơng tin Như chúng ta đã thấy, những hạn chế về cơng nghệ liên quan đến việc đặt cảm biến trong thiết bị sản xuất chắc chắn gây ra sự chậm trễ trong việc phát hiện lỗi sản phẩm. Để tham gia xử lý vấn đề như vậy, vẫn cần cĩ thể truy cập thơng tin từ hội thảo để xem xét, ví dụ, suy luận thống kê, xác định hoặc xác suất. Do đĩ, cĩ vẻ như đây là cơ hội để chúng tơi trình bày ở đây tổ chức chung của cơ sở dữ liệu mà từ đĩ chúng ta cĩ thể rút ra thơng tin cần thiết cho mơ hình hĩa. Dữ liệu được thu thập bằng các thiết bị đo và / hoặc máy đo lường. a) Dữ liệu – Database (DB) được liên kết với thiết bị: Phân tích dữ liệu kỹ thuật trên máy tính của DB-EDA (Data Base- Engineering Data Analyse) là kho lưu trữ dữ liệu quá trình. Phát hiện và phân loại lỗi của FTC cho phép theo dõi thời gian thực sự phát triển của các thơng số thiết bị, DB -TGV Cơng cụ trực quan Tồn cầu Hiển thị trực tiếp dữ liệu bảo trì, do đĩ tạo điều kiện cho việc trích xuất của họ. Figure I.4. Ví dụ về DataBase EDA b) BD được liên kết với sản phẩm: BD-Inline chứa tất cả các phép đo vật lý được thực hiện trên các bĩng bán dẫn trong các hoạt động sản xuất (trên một mẫu các tấm wafer), Bộ phân phối wafer điện BD-EWS, nhĩm các phép đo điện được thực hiện trên mỗi các mạch tích hợp ở cuối dây chuyền sản xuất, "Thử nghiệm tham số" của BD-PT tập hợp các phép đo điện được thực hiện trên các cấu trúc thử nghiệm nằm xung quanh mạch (đối với tất cả các tấm wafer), "Defectivity" của BD-DEF tập trung vào thơng tin tương đối sự hiện diện của các hạt trên bề mặt của wafer để kiểm tra xem nĩ cĩ bị nhiễm bẩn hay khơng. 9 Báo cáo tổng kết đề tài khoa học Trong một nhà máy sản xuất mạch tích hợp, một số loại sản phẩm được xử lý (sản xuất hàng loạt), các cơng nghệ rất tiên tiến và với mức độ tích hợp ngày càng tăng. Khiếm khuyết nhỏ nhất trên sản phẩm (hoặc phế liệu) là tương đối cao. Vấn đề về khả năng quan sát của một lỗi vào đúng thời điểm chiếm một vị trí quan trọng trong việc tìm kiếm cải thiện hiệu suất. Để khắc phục vấn đề này, hai phương pháp thường được đề xuất trong mơi trường cơng nghiệp: đo lường thực và đo lường ảo. Hệ thống đo lường: một giải pháp đầu tiên bao gồm việc cài đặt thiết bị đo lường thực trong chuỗi sản xuất để đảm bảo các bước kiểm sốt cần thiết để giám sát chất lượng sản phẩm. Trong thực tế, điều này thường kèm theo chi phí bổ sung đáng kể, cả về mặt đầu tư, bảo trì và tăng thời gian chu kỳ. Ngồi ra, và với các dịng sản phẩm quan trọng đặc trưng cho các vị trí sản xuất này, điều quan trọng cần lưu ý là các bước đo lường khơng thể được thực hiện một cách cĩ hệ thống trên tất cả các sản phẩm, chỉ cĩ một vài mẫu được kiểm tra; điều này cũng đặt ra vấn đề về sự liên quan của việc lựa chọn mẫu cần kiểm tra và thời gian thích hợp để kiểm tra. Những hạn chế liên quan đến sự tích hợp của các máy đo lường (từ quan điểm sản phẩm) đã dẫn đến sự phát triển tự nhiên của đo lường ảo (Virtual Metrology VM) với mục tiêu giảm thiểu số lượng tấm sản phẩm được kiểm tra trong khi cải thiện cả thơng thạo các thơng số cơng nghệ, sản lượng và thời gian chu kỳ. Do đĩ, VM được định nghĩa là một kỹ thuật mới để dự đốn các giá trị đo lường trên các sản phẩm khơng được đo lường vật lý (Chen et al., 2005). Nguyên tắc cơ bản của nĩ dựa trên khả năng dự đốn các giá trị tham số trong thời gian thực từ thơng tin được thu thập về sản xuất và đo lường thực tế. Tuy nhiên, chúng tơi sẽ lưu ý rằng đo lường ảo tập trung vào hiệu suất và chất lượng sản xuất của các tấm silicon. Tuy nhiên, nguồn phát hành sản phẩm chính được cho là do trơi dạt thiết bị (ước tính từ 50% đến 70%). Do đĩ, cần phải phát triển các giải pháp bổ sung để tối ưu hĩa hơn nữa việc sử dụng thiết bị về số lượng, chất lượng của kết quả và năng suất tổng thể. Đĩ là cốt lõi của quan sát này mà vấn đề nghiên cứu của chúng tơi được định vị. Chúng tơi đề xuất đĩng gĩp của chúng tơi trong khuơn khổ chính xác là cải thiện tính khả dụng của thiết bị sản xuất, đặc biệt là thơng 10 Báo cáo tổng kết đề tài khoa học qua dự đốn về sự trơi dạt của chúng và do đĩ giảm thiểu, hoặc thậm chí hủy bỏ, trì hỗn phát hiện lỗi sản phẩm. 1.4. Vấn đề của đề tài Ngày nay, tất cả các khâu trên thiết bị sản xuất đều được trang bị cảm biến để đo và phản hồi kết quả vì lý do kỹ thuật lẫn lý do đầu tư sản xuất. Do vậy, quá trình sản xuất luơn luơn tồn tại rất nhiều rủi ro của việc khơng thể quan sát được các nhiễu loạn hoặc trơi dạt mà ở đĩ máy mĩc khơng hoạt động đúng như chúng ta yêu cầu, tạo nên những ảnh hưởng tới chất lượng sản phẩm. Trong khi đĩ thiết bị sản xuất gần như khơng cĩ một cơ chế nội tại nào để xác định vấn đề đến từ đâu nếu sản phẩm đưa ra khơng chất lượng. Do đĩ, trên thực tế rất nhiều sự trơi dạt hoạt động (sự sai lệch hoạt động khiến cho thiết bị sản xuất khơng thể đem lại được kết quả chất lượng sản phẩm như dự kiến) khơng thể tránh khỏi trong quá trình sản xuất. Trong bối cảnh đĩ, vấn đề này lại trở nên nghiêm trọng hơn khi mà thời đại cơng nghiệp 4.0 tạo nên một khối lượng đồ sộ dữ liệu sản xuất (con người, cảm biến, cơng thức, vật liệu). Quy trình phân tích khối dữ liệu đĩ để trích xuất những thơng tin cần thiết cho quá trình giám sát và theo dõi thiết bị được mơ tả tổng quát như hình 1. Hình I.5. Mơ hình mơ tả các bước của quá trình quan sát và theo dõi sức khoẻ thiết bị sản xuất 11 Báo cáo tổng kết đề tài khoa học Trong bối cảnh đĩ, kỹ thuật học máy (ML) là một lĩnh vực của trí tuệ nhân tạo, theo đĩ thuật ngữ này đề cập đến khả năng các hệ thống cơng nghệ thơng tin cĩ thể độc lập tìm giải pháp cho các vấn đề bằng cách nhận ra các mẫu trong cơ sở dữ liệu. Nĩi cách khác, ML cho phép các hệ thống máy tính nhận dạng các mẫu trên cơ sở các thuật tốn và bộ dữ liệu hiện cĩ và để phát triển các khái niệm giải pháp phù hợp. ML là kiến thức nhân tạo được tạo ra trên cơ sở kinh nghiệm. Sự phát triển của các chương trình máy tính cĩ thể truy cập dữ liệu và sử dụng nĩ để tự học là những tính năng chính của kỹ thuật học máy. Quy trình học bắt đầu bằng các quan sát hoặc thống kê, chẳng hạn như các ví dụ, hướng dẫn hoặc kinh nghiệm trực tiếp, để tìm kiếm các mẫu trong dữ liệu và đưa ra quyết định nâng cao. Mục đích quan trọng nhất là cho phép máy tính học robot mà khơng cần sự trợ giúp hay can thiệp của con người và điều chỉnh hành động cho phù hợp [38, 39, 40]. Kỹ thuật học máy giải thuật các bài tốn theo năm bước cơ bản: - Tìm kiếm, trích xuất và tĩm tắt dữ liệu liên quan - Đưa ra dự đốn dựa trên dữ liệu phân tích - Tính xác suất cho kết quả cụ thể - Thích ứng với sự phát triển nhất định một cách tự chủ - Tối ưu hĩa các quy trình dựa trên các mẫu được cơng nhận Các thuật tốn học máy được giám sát được áp dụng để dự đốn các sự kiện trong tương lai dựa trên những gì đã được học trong quá khứ với dữ liệu mới bằng cách sử dụng các ví dụ được gắn nhãn. Bắt đầu từ nghiên cứu của một tập dữ liệu đào tạo đã biết, một hàm được suy ra để đưa ra dự đốn về m giá trị đầu ra được phát triển với thuật tốn học tập. Chương trình này cĩ thể cung cấp các mục tiêu sau khi đào tạo đủ cho bất kỳ đầu vào nào. Thuật tốn học máy cũng cĩ thể đánh giá đầu ra của nĩ một cách chính xác, dự định để điều chỉnh mơ hình cho phù hợp và hỗ trợ trong việc tìm kiếm lỗi. Cơng việc trong bài viết này của tác giả tập trung vào quá trình trích xuất dữ liệu và đưa ra mơ hình chuẩn đốn lỗi cho thiết bị máy mĩc sản xuất. Để làm rõ được điều đĩ, báo cáo này sẽ được tổ chức như sau: trong chương 2, tác giả trình bày một cơ sở phân tích lý thuyết xung quanh các kỹ thuật xủ lý biến dữ 12 Báo cáo tổng kết đề tài khoa học liệu, học máy (machine learning), từ đĩ chọn ra và áp dụng kỹ thuật học mạng Bayesian. Mục 3 trên cơ sở đĩ trình bày một chu trình ứng dụng mạng Bayesian vào quá trình học dữ liệu từ hệ thống sản xuất. Tiếp đĩ, mục 4 trình bày trường hợp ứng dụng của phương pháp này và đưa ra kết quả chuẩn đốn nguyên nhân lỗi áp dụng trong một ví dụ mơ phỏng quá trình sản xuất lị hơi Tenessse Eastman. Cuối cùng, kết luận và thảo luận của đề tài sẽ đĩng lại cáo cáo này. 13 Báo cáo tổng kết đề tài khoa học CHƯƠNG II. CƠ SỞ LÝ THUYẾT PHƯƠNG PHÁP NGHIÊN CỨU Sau khi trình bày bối cảnh cơng việc của chúng tơi và đặt ra vấn đề mà cơng việc của chúng tơi đĩng gĩp, chúng tơi đề xuất trong chương II này xem xét lý thuyết về các phương pháp được sử dụng nhiều nhất trong các lĩnh vực phân tích rủi ro và an tồn: phương pháp định tính và định lượng. Các hoạt động cơng nghiệp, như các mối rủi ro sản xuất tự nhiên, cĩ thể gây ra rủi ro dưới nhiều hình thức, hoặc thậm chí dẫn đến các sự kiện thất bại lớn. Để giảm những rủi ro này xuống mức chấp nhận được, để hạn chế chi phí nhân lực, vật chất và tài chính của họ, cần phải đánh giá chúng, ngăn chặn sự xuất hiện của chúng (phịng ngừa) và hạn chế tác động (bảo vệ) của chúng. Chính trong bối cảnh này, các ngành cơng nghiệp vũ khí, hàng khơng và hạt nhân đã phát triển các phương pháp phân tích rủi ro dự báo [41]. Ngành cơng nghiệp bán dẫn hoặc dược phẩm được coi là đặc biệt nhạy cảm với các tình huống bất ngờ và hạn chế hoạt động, và tính đến rủi ro là một yếu tố quan trọng. Vì lý do này, sự quan tâm đặc biệt đã được dành cho các phương pháp phân tích rủi ro bằng cách điều chỉnh chúng phù hợp với hoạt động của chúng. Rủi ro là xác suất xảy ra lỗi, nĩ được đặc trưng bởi mức độ nghiêm trọng, sự xuất hiện và phát hiện của nĩ (SOD). Một rủi ro cơng nghiệp đại diện cho những thất bại tiềm tàng cĩ thể cĩ tác động đến sản phẩm, thiết bị hoặc quy trình sản xuất. Các thiệt hại gây ra cĩ thể là mất năng suất, thời gian chu kỳ hoặc chi phí. Về phần mình, an tồn vận hành là một mơn khoa học kỹ thuật nhằm đảm bảo hoạt động đúng đắn của một hệ thống. SdF tích hợp các khía cạnh về độ tin cậy, khả năng bảo trì, tính sẵn sàng và bảo mật (Villemeur, 1988). Trong lĩnh vực cơng nghiệp, yêu cầu của khách hàng về chất lượng rất mạnh. Sự phát triển khơng ngừng của các cơng nghệ và sự phức tạp của các quy trình sản xuất là nguồn gốc của những thay đổi trong phân tích rủi ro và phương pháp an tồn vận hành. Tùy thuộc vào bản chất của hệ thống, loại vấn đề được nghiên cứu và các mục tiêu tìm kiếm, các phương pháp khác nhau được áp dụng. 14 Báo cáo tổng kết đề tài khoa học 2.1. Các phương pháp xử lý biến dữ liệu 2.1.1. Phương pháp Lọc dữ liệu - Filter Lọc là một phương pháp xử lý để làm sạch tín hiệu bằng cách loại bỏ càng nhiều nhiễu càng tốt trong khi bảo tồn càng nhiều thơng tin càng tốt. Ngồi ra, thơng tin chứa trong tín hiệu khơng nhất thiết phải hồn tồn phù hợp: cần phải chọn thơng tin hữu ích theo cách sử dụng mà người ta muốn tạo ra nĩ [15]. Phương pháp này được áp dụng trong lĩnh vực điện tử. Trong điện tử, bộ lọc kỹ thuật số là một yếu tố thực hiện lọc bằng cách sử dụng một chuỗi các phép tốn trên tín hiệu rời rạc. Đĩ là, nĩ sửa đổi nội dung phổ của tín hiệu đầu vào bằng cách làm giảm hoặc loại bỏ một số thành phần phổ khơng mong muốn. Về mặt lý thuyết, các bộ lọc kỹ thuật số cĩ thể đạt được tất cả các hiệu ứng lọc cĩ thể được xác định bởi các hàm hoặc thuật tốn tốn học. Tuy nhiên, hai hạn chế chính của bộ lọc kỹ thuật số là tốc độ và chi phí. Ngồi ra, cịn cĩ Lọc tuyến tính đặc trưng cho việc lọc tín hiệu bằng một hệ thống tuyến tính bất biến theo thời gian. Do đĩ, bất kỳ tín hiệu nào đi qua bộ lọc sẽ thấy độ phân giải của nĩ (hoặc chất lượng của nĩ giảm). Trong một bộ lọc điện tử, nguyên tắc là giống hệt nhau. Luơn cĩ sự mất thơng tin trong hoạt động tích ch...{��,�,�} là các tham số của mạng Bayes tại lần lặp t [24]. ∗ Với �(�: � ) = ��∗[��(�0, ��|�)] [14] Do đĩ, �(�: �∗) là kỳ vọng về khả năng của bất kỳ tập hợp tham số nào θ ∗ được tính bằng cách sử dụng phân phối dữ liệu bị thiếu �(��|� ). • Kỳ vọng: ước tính N * từ các tham số tham chiếu. ∗ � �� ∗ �(�: � ) = ∑�=1 ∑�=1 ∑�=1 ��,�,� ��,�,� [15] Tối đa hĩa: chọn giá trị tốt nhất của các tham số �(�+1) bằng cách tối đa hĩa Q. • Lặp lại hai bước này miễn là chúng ta cĩ thể tăng giá trị của Q. (hội tụ nos cho giá trị tối ưu). Học cấu trúc: Thơng thường cấu trúc được xác định bởi các chuyên gia. Khi đây khơng phải là trường hợp, cĩ thể sử dụng các thuật tốn để xây dựng mạng. Trong số các thuật tốn này, cĩ những thuật tốn bao gồm tìm kiếm các mối quan hệ nhân quả khác nhau tồn tại giữa các biến và các thuật tốn khác cố gắng định lượng mức độ đầy đủ 31 Báo cáo tổng kết đề tài khoa học của mạng Bayes cho vấn đề cần giải quyết, đĩ là: liên kết một số điểm với mỗi mạng Bayes. Sau đĩ, họ tìm kiếm cấu trúc sẽ cho điểm cao nhất. Một cách tiếp cận tồn diện là khơng thể trong thực tế, thực tế, số lượng cấu trúc cĩ thể cĩ cho n nút là siêu cấp số nhân. Cơng thức sau đây được thể hiện bởi [11] đưa ra số lượng cấu trúc cĩ thể cĩ từ n nút: 1, � = 0 �� 1 ( ) [14] � � = {∑� ( )�+1 � �(�−1) ( ) � > 1 �=1 −1 (� ) 2 �� − 1 , Để giải quyết vấn đề này, một số phương pháp phỏng đốn đã được đề xuất. Một số phương pháp này là: • Thuật tốn PC và IC, tìm kiếm quan hệ nhân quả • Phương pháp lai B: Suy luận Suy luận Bayes dựa trên việc sử dụng các báo cáo xác suất, trong trường hợp chung được tìm thấy bởi các chuyên gia nghiên cứu một hệ thống được biết đến với họ. Những tuyên bố này phải rõ ràng và chính xác để tránh bất kỳ sự nhầm lẫn nào trong các mối quan hệ phụ thuộc sẽ dẫn đến chúng. Suy luận Bayes đặc biệt hữu ích trong các vấn đề cảm ứng, bởi vì nĩ dựa trên các trường hợp cụ thể và chỉ cĩ giá trị trong các điều khoản xác suất. Các phương pháp Bayes được phân biệt với các phương pháp được gọi là phương pháp tiêu chuẩn bằng cách áp dụng cĩ hệ thống các quy tắc chính thức để chuyển đổi xác suất. Chúng tơi tìm cách gây ra một hệ thống Bayes cả từ bên trên và bên dưới, cả hậu quả và nguyên nhân, của biểu đồ phụ thuộc. Định lý Bayes cĩ thể được suy ra đơn giản bằng cách tận dụng tính đối xứng p(B|A)p(A) của quy tắc nhân: �(�|�) = p(B) Định lý Bayes cho phép bạn đảo ngược xác suất. Đĩ là nĩi từ nguyên nhân suy ra hậu quả. Hay nĩi cách khác, bắt đầu từ một hậu quả để quay trở lại nguyên nhân, xem điều gì là đúng và bác bỏ những hậu quả tiềm ẩn của những nguyên nhân khác [25]. Suy luận mạng Bayes nổi tiếng nhất là chẩn đốn. Để biết lỗi, một hệ 32 Báo cáo tổng kết đề tài khoa học thống dựa trên các mạng Bayes sẽ cĩ thể xác định các nguyên nhân cĩ thể xảy ra nhất đã gây ra sự cố. Tuy nhiên, mạng Bayes cũng được sử dụng để phân loại. Sau đĩ, họ sẽ dựa trên một số đặc điểm nhất định của các tài liệu để cĩ thể phân loại chúng theo các danh mục [11]. 3.2. Mơ hình hố Đối với bước này, một kỹ thuật mơ hình phải được áp dụng theo nhu cầu của các nhà sản xuất. Do đĩ, nghiên cứu của chúng tơi đang hướng tới các phương pháp xác suất giúp dự đốn tình trạng sức khỏe của thiết bị. Các kỹ thuật mạng Bayes, mà chúng tơi trình bày chi tiết trong phần đầu của Chương 3, được trình bày dưới dạng các giải pháp thú vị cho vấn đề khơng chắc chắn và tính đến chuyên mơn. Do đĩ, bước thứ hai này mơ tả và đánh giá mơ hình cần được tính tốn dựa trên các chế độ thất bại ưu tiên được xác định trước trong bước những bước phụ: 1. Phân loại nguyên nhân thất bại RC từ bảng FMEA: cho phép bạn xác minh nguyên nhân do các chuyên gia giả định (kiểm tra) hoặc tìm ra nguyên nhân mới (nếu cĩ). Do đĩ, đây là một nhận dạng các biến để tham gia chúng vào mơ hình dự đốn. Giai đoạn này được thực hiện bằng cách sử dụng các kỹ thuật từ thống kê hoặc / và lĩnh vực xác suất (phân loại, lọc, hồi quy, tìm kiếm các mối tương quan, v.v.). 2. Cấu trúc đồ họa của mơ hình: một khi nguyên nhân và chế độ thất bại đã được xác định, chúng tơi kết hợp chúng để xây dựng cấu trúc của mơ hình đồ họa. Cấu trúc, được biểu thị bằng mối quan hệ nguyên nhân và kết quả, cĩ thể được phê duyệt bằng cách học cấu trúc từ dữ liệu hoặc trực tiếp trên cơ sở các bảng FMEA được thiết lập sẵn. 3. Học thơng số của mơ hình: từ cơ sở dữ liệu lịch sử dành riêng cho việc học và các thuật tốn thích hợp, giai đoạn này cho phép tính tốn các phân phối xác suất khác nhau liên quan đến từng biến của mơ hình đồ họa. 4. Kiểm tra và xác nhận mơ hình: giai đoạn cuối này bao gồm việc thẩm vấn mơ hình để dự đốn các chế độ thất bại hoặc chẩn đốn nguồn gốc của chúng. Với sự hỗ trợ của các thuật tốn suy luận (thử nghiệm) và dữ liệu dành riêng cho thử nghiệm, mơ hình sẽ được xác nhận hoặc làm mới bằng các bộ dữ liệu 33 Báo cáo tổng kết đề tài khoa học mới. Do đĩ, mơ hình này sẽ được xác nhận thơng qua POC (Proof Of Concept) trước giai đoạn cơng nghiệp hĩa. Một ví dụ của bước này là của mơ hình cần chẩn đốn và tiên lượng được đề xuất nhưng cần phải được tinh chỉnh. Do đĩ, đây là chủ đề của bước này "tham số hĩa mơ hình". Một số lưu ý trong thiết lập mơ hình: - Quản lý thuật tốn: Việc chuẩn đốn từ mơ hình cĩ thể coi như là một loại chỉ báo. Chỉ báo này khơng hoạt động một mình, nĩ tương tác liên tục với các mơ hình và cơng cụ khác đã cĩ. Mức độ quan trọng của quá trình bán dẫn là quan trọng và tính biến thiên phải được kiểm sốt. Vì thế cần đánh giá và quản lý tác động của các thuật tốn tính tốn trên hệ thống trực tuyến (thời gian tính tốn, chi phí tích hợp, CNTT ...). - Quản lý mơ hình: với cùng lý do được đề cập cho giai đoạn trước, quản lý mơ hình được giới thiệu. Nĩ nhằm mục đích so sánh hiệu suất của các mơ hình được phát triển. Kết quả so sánh, người dùng quản lý hộp cơng cụ của mình (mơ hình hồn chỉnh, mơ hình đơn giản hĩa, v.v.) theo tiêu chí hiệu suất được xác định trước (độ chính xác, chi phí, thời gian chu kỳ, v.v.). - Quản lý quyết định: giai đoạn này thu thập thơng tin liên quan đến các can thiệp bảo trì (tài nguyên, loại hành động, chi phí, v.v.) và đo lường (tính sẵn cĩ của máy, thời gian kiểm tra, hiệu suất, v.v.), điều này để quản lý tốt hơn các can thiệp trực tuyến dựa trên tính tốn của mơ hình. - Lập kế hoạch bảo trì dựa trên chẩn đốn: kết quả của mơ hình chẩn đốn được sử dụng để cung cấp cho người dùng (các) can thiệp cần thiết. Quá trình này tất nhiên phải tích hợp một mơ hình mở rộng để cĩ thể mơ tả các hành động bảo trì cĩ thể theo ước tính nguyên nhân của các lỗi. 34 cáot Báo ổ ng k ế Dữ liệu để học FMEA do hệ t đ Dữ liệu đầu vào Dữ liệu đánh giá + + ề Hình mạng thống chuyên tài khoah gia cung cấp III.4 Sơ đồkhối của chuẩn mơ hình đốn ọ c Dữ liệu để test Dữ liệu đào tạo và xác nhận Bảng kế hoạch bảo trì Update So sánh dữ liệu N kết quả Y Dữ liệu Mơ hình Real-time chuẩn đốn lơĩ Bảng xác suất hỗ trợ xác định nguyên nhân lỗi 35 Báo cáo tổng kết đề tài khoa học 3.3. Phần mềm ứng dụng Mơ hình chuẩn đốn lỗi của đề tài được phát triển trong mơi trường MATLAB, một phần mềm tốn học nổi tiếng được phát triển bởi MathWorks. MATLAB cho phép người dùng xây dựng ma trận, vẽ các hàm tốn học, thực hiện các phép tính, liên kết các chương trình máy tính được viết bằng nhiều ngơn ngữ lập trình khác nhau, phân tích dữ liệu, phát triển thuật tốn và tạo mơ hình và ứng dụng. MATLAB là ngơn ngữ bậc cao, tích hợp khả năng tính tốn, hình ảnh hĩa, lập trình trong một mơi trường dễ sử dụng, ở đĩ vấn đề và giải pháp được trình bày trong cùng một lời chú thích tốn học. Thường MATLAB được dùng cho: - Tốn và điện tốn - Phát triển thuật tốn - Dựng mơ hình, giả lập, tạo nguyên mẫu - Phân tích, khám phám hình ảnh hĩa dữ liệu - Đồ họa khoa học và kỹ thuật - Phát triển ứng dụng, cĩ cả xây dựng giao diện đồ họa người dùng Graphic User Interface MATLAB là hệ thống tương tác, trong đĩ các phần tử dữ liệu xếp dưới dạng mảng, khơng cần chiều hướng, cho phép giải quyết nhiều vấn đề tính tốn, đặc biệt là với ma trận và véc-tơ, trong thời gian nhanh chĩng, chỉ bằng một phần so với viết phần mềm bằng các ngơn ngữ khơng tương tác vơ hướng như C hay Fortran [4]. MATLAB là viết tắt của Matrix Laboratory (phịng thí nghiệm ma trận). Ban đầu MATLAB được viết để dễ dàng truy cập phần mềm ma trận do các dự án của LINPACK và EISPACK phát triển. Họ cũng đã mang tới những tính năng mới nhất cho phần mềm trong thế giới điện tốn ma trận. Trong mơi trường đào tạo, nĩ là cơng cụ hướng dẫn chuẩn mực cho cả các khĩa học dẫn nhập và chuyên sâu trong tốn học, kỹ thuật và khoa học. Trong ngành, MATLAB cũng là cơng cụ được nhiều nghiên cứu, phân tích, phát triển lựa chọn. MATLAB cịn cĩ một bộ các giải pháp hướng tới ứng dụng cĩ tên toolbox. Toolbox rất quan trọng với hầu hết người dùng MATLAB bởi nĩ cho phép học và áp dụng cơng nghệ chuyên mơn hĩa. Toolbox là bộ sưu tập các hàm MATLAB (M- 36 Báo cáo tổng kết đề tài khoa học file) mở rộng mơi trường MATLAB để giải quyết từng lớp vấn đề. Các lĩnh vực mà toolbox cĩ thể làm việc gồm xử lý tín hiệu, hệ thống kiểm sốt, mạng thần kinh, logic mờ, phép biến đổi wavelet, mơ phỏng. Chính vì vậy việc áp dung phần mềm MATLAB trong nghiên cứu về kỹ thuật máy học là việc cần thiết. Nghiên cứu này thiết lập mơ hình dự báo dựa trên các thuật tốn thơng minh trong mơi trường MATLAB, nhằm hỗ trợ giải quyết các vấn đề về phân tích các siêu dữ liệu và thiết lập mơ hình dự báo thơng minh [4]. 37 Báo cáo tổng kết đề tài khoa học CHƯƠNG IV. ỨNG DỤNG VÀ KẾT QUẢ 4.1. Giới thiệu trường hợp ứng dụng 4.1.1. Quy trình TEP Quy trình Tennessee Eastman (TEP) là quy trình được phát triển bởi Cơng ty hĩa chất Eastman để cung cấp mơ phỏng của một quy trình cơng nghiệp thực để thử nghiệm các phương pháp kiểm sốt và / hoặc giám sát quá trình [2]. Thật vậy, quy trình Tennessee Eastman lần đầu tiên được đề xuất bởi Downs và Vogel để cung cấp một mơ hình mơ phỏng của quy trình cơng nghiệp phức tạp như thực tế để nghiên cứu các phương pháp giám sát và kiểm sốt quy trình quy mơ lớn. Như thể hiện trong Hình IV.1, quy trình bao gồm năm phần tử chính: một lị phản ứng, một bình ngưng tụ, một máy nén, một bộ phân tách rỉ kim loại và một bộ tách trong. Các chất phản ứng khí trơ A, C, D, E và B được đưa vào lị phản ứng. Thành phần G và H là hai sản phẩm của TEP dưới dạng chất lỏng, trong khi F là một sản phẩm phụ khơng mong muốn (thải). Các phản ứng hĩa học của quá trình được cho bởi hệ phương trình (7.1) �(�) + �(�) + �(�) → �(��) �(�) + �(�) + �(�) → �(��) �(�) + �(�) → �(��) 3�(�) → 2�(��) (7.1) Tất cả các phản ứng này là khơng thể đảo ngược, tỏa nhiệt, và theo 1 trật tự liên quan đến nồng độ chất phản ứng khác nhau. Tốc độ phản ứng theo một luật Arrhenius, và các phản ứng sản xuất G cĩ năng lượng hoạt hĩa cao, phản ứng hoạt hĩa sinh ra H, dẫn đến độ nhạy cao hơn với nhiệt độ. Các chất phản ứng khí (A, C, D và E) là nguồn cấp dữ liệu cho lị phản ứng mà họ phản ứng và hình thành, với sự trợ giúp của một chất xúc tác, G và H sản phẩm ở dạng khí. Một chất lỏng làm mát (nước) của lị phản ứng cho phép loại bỏ một phần lớn nhiệt được sản xuất. Các sản phẩm rời khỏi lị phản ứng, trong khi chất xúc tác vẫn cịn trong đĩ. Khí sản phẩm được làm mát thơng qua bình ngưng ( condenseur) và sau đĩ được tách lỏng hơi (separateur). Hơi khơng ngưng tụ trong tách lỏng hơi (separateur) được trả lại cho lị phản ứng bằng một máy nén ( compresseur ). Khí trơ B và F phát sinh 38 Báo cáo tổng kết đề tài khoa học được thanh lọc từ quá trình tách trong ( separateur). Các dịng đặc trong tách lỏng hơi được gửi đến các decapeur ( tách rỉ kim loai) nhằm mục đích loại bỏ các dấu vết cuối cùng của thuốc thử. Sau đĩ, các sản phẩm G và H được rút ra bên ngồi của quá trình bởi một thiết bị khơng được hiển thị trong hình 4.1. 39 Báo cáo tổng kết đề tài khoa học Hình IV.1 Sơ đồ qui trình sản xuất hơi cơng nghiệp TEP 40 Báo cáo tổng kết đề tài khoa học Quá trình này bao gồm 53 biến: 12 biến phu thuoc và 41 biến kiểm sốt đo.Trong số 41 biến đo lường, 22 biến được đo liên tục (đây là những giá trị của các bộ cảm biến của quá trình), trong khi những cái khác là những đo lường của các thành phần như nồng độ, và do đĩ khơng cĩ liên tục, nhưng lấy mẫu. 22 biến đo liên tục được liệt kê trong Bảng 4.1 trong khi các biến đo lường khác cĩ thể nhìn thấy trong bảng 4.2. 12 biến phu thuoc được đưa ra trong bảng 4.3. ( Biến số độc lập : các biến số này gây ra sự thay đổi cho 1 hiện tượng, 1 tình huống Biến số phụ thuộc là những kết quả của sự biến đổi gây bởi biến số độc lập Biến số ngoại lai là những biến số khác, nhân tố khác diễn ra trong quá trình thực tiễn cĩ thể tạo ra những thay đổi lên biến số độc lập Biến số đan xenhay là biến số xáo trộn, là những biến số cho biết mối quan hệ liên kết giữa các biến số độc lập và biến số phụ thuộc ) Về quá trình giám sát của TEP, người ta ghi lại cĩ thể được đến 20 lỗi khác nhau. Những lỗi này là cĩ tính chất khác nhau: sự nhảy của một số cấp biến nội bộ, sự tăng tính biến thiên của những biến khác, hoặc lỗi của thiết bị truyền động như van bị chặn. Mơ tả những 20 lỗi được thực hiện trong Bảng 4.4. Trong đĩ người ta quan sát các lỗi F16 đến F20 là lỗi chưa biết do chưa trải qua quá trình xác nhận. Để hiểu rõ hơn những gì đại diện cho một lỗi, chúng tơi lấy trường hợp của lỗi F6. Lỗi này gây ra hiện tượng bão hịa của quá trình (xem [3]). Lỗi F6 là lỗi trong việc cung cấp khí A. Ngay khi khơng cịn khí A trong bình phản ứng thì các phản ứng hố học khơng cịn diễn ra nữa, mặc dù bình phản ứng vẫn cung cấp khí D và E. Việc cung cấp D và E này làm tăng áp suất lị phản ứng đến điểm cận trên an tồn là 2950kPa. Sự bão hịa này gây ra sự chặn đứng của nhiều biến (luơn ở cùng một giá trị trong nhiều giờ), làm giảm sự thay đổi của chúng. Tuy nhiên, việc chặn các biến khơng phải lúc nào cũng nằm chính xác tại cùng một điểm, tạo ra giá trị trung bình khác nhau từ lỗi F6 này sang lỗi F6 khác. Tuy nhiên vì độ biến thiên thấp của giá trị trung bình nên lỗi F6 bị loại bỏ về khoảng cách này. 41 Báo cáo tổng kết đề tài khoa học Trong ví dụ này, chúng ta thấy rằng rằng F6 lỗi tạo ra hậu quả rất rõ ràng về các biến của quá trình. Đây là loại lỗi dễ dàng phát hiện. Tuy nhiên, một số lỗi khơng gây ra thay đổi đột ngột nếu các biến của quá trình, phát hiện ít rõ ràng hơn (ví dụ như lỗi F9). Bảng 4.1 biến đo lường liên tục Variable Description Đơn vị XMES 1 Lưu lượng tiếp liệu ở A( stream 1) Kscmh XMES 2 Lưu lượng tiếp liệu ở D (stream 2) Kg/hr XMES 3 Lưu lượng tiếp liệu ở E (stream 3) Kg/hr XMES 4 Lưu lượng tiếp liệu tổng (steam 4) Kscmh XMES 5 Lưu lượng tuần hồn lại(stream 8) Kscmh XMES 6 Lưu lượng tiếp liệu cho lị phản ứng (stream 6) Kscmh XMES 7 Áp suất của lị phản ứng kPa XMES 8 Mức của lị phản ứng % XMES 9 Nhiệt độ của lị phản ứng °C XMES 10 Lưu lượng làm sạch, gột rửa (stream 9) kscmh XMES 11 Nhiệt độ của separateur °C XMES 12 Mức của separateur % XMES 13 Áp suất của separateur kPa XMES 14 Lưu lượng của separateur ( stream 10) m3/hr XMES 15 Mức của decapeur % XMES 16 Áp suất của decapeur kPa XMES 17 Lưu lượng của decapeur (stream 11) m3/hr XMES 18 Nhiệt độ của decapeur °C XMES 19 Lưu lượng khí ga của decapeur Kg/hr XMES 20 cơng suất của máy nén kW XMES 21 Nhiet do làm mát chất lỏng tại đầu ra của lị phản ứng °C XMES 22 Nhiet do làm mát chất lỏng tại đầu ra của lị separateur °C Bảng 4.2: biến đo lấy mẫu Variable Description Stream Sampling(min) Units XMESA 23 Component A 6 6 Mol% XMESA 24 Component B 6 6 XMESA 25 Component C 6 6 XMESA 26 Component D 6 6 XMESA 27 Component E 6 6 XMESA 28 Component F 6 6 XMESA 29 Component A 9 6 XMESA 30 Component B 9 6 XMESA 31 Component C 9 6 XMESA 32 Component D 9 6 XMESA 33 Component E 9 6 XMESA 34 Component F 9 6 XMESA 35 Component G 9 6 XMESA 36 Component H 9 6 42 Báo cáo tổng kết đề tài khoa học XMESA 37 Component D 11 15 XMESA 38 Component E 11 15 XMESA 39 Component F 11 15 XMESA 40 Component G 11 15 XMESA 41 Component H 11 15 Bảng 4.3 biến điều khiển TEP Variable Description Unity XC1(42) Lưu lượng cấp liệu ở D ( stream 2) Kg/hr XC2(43) Lưu lượng cấp liệu ở E ( stream 3) Kg/hr XC3(44) Lưu lượng cấp liệu ở A (stream 1) Kscmh XC4(45) Lưu lượng cấp liệu tổng ( stream 4) Kscmh XC5(46) Van tuần hồn lại của máy nén % XC6(47) Van trị tuần hồn lại phần gột rửa ( stream 9) % XC7(48) Lưu lượng cấp liệu của séparateur ( stream 10) m3/hr XC8(49) Lưu lượng san pham cua décapeur ( stream 11) m3/hr XC9(50) Giá trị của décapteur ( hiệu suất) % XC10(51) Lưu lượng của dung dịch là mát của lị phản ứng m3/hr XC11(52) Lưu lượng của dung dịch là mát của bình ( condenseur) m3/hr XC12(53) Vận tốc của máy trộn tr/min Bảng 4.4: lỗi Faute Description Loại biến F1 Tỉ số cấp liệu của A/C Nhảy(saut) F2 Thành phan của B khí trơ ( thành phần sai dẫn đến cấu tạo lỗi) Nhảy(saut) F3 Nhiệt độ tiếp liệu của D Nhảy(saut) F4 Nhiệt độ đầu vào của dung dịch làm mát lị phản ứng Nhảy(saut) F5 Nhiệt độ đầu vào của dung dịch làm mát bình condenser Nhảy(saut) F6 Sự giảm đi cấp liệu của A Nhảy(saut) F7 Sự giảm áp lực của cấp liệu của C Nhảy(saut) F8 Cấu tạo thành phần cấp liệu của A, B và C Nhiễu loạn F9 Nhiệt độ tiếp liệu của D Nhiễu loạn F10 Nhiệt độ tiếp liệu của C Nhiễu loạn F11 Nhiệt độ đầu vào của dung dịch làm mát lị phản ứng Nhiễu loạn F12 Nhiệt độ đầu vào của dung dịch làm mát bình condenser Nhiễu loạn F13 Phản ứng động học Lệch từ từ F14 Van dung dịch làm mát lị p/ứng Bị chặn F15 Van dung dịch làm mát bình condender Bị chặn F16 Unknown Unknown F17 Unknown Unknown F18 Unknown Unknown F19 Unknown Unknown F20 Unknown Unknown 43 Báo cáo tổng kết đề tài khoa học Với mục đích minh hoạ quy trình chuẩn đốn lỗi đề xuất, trong nghiên cứu này, chúng tơi minh hoạ nĩ với chỉ duy nhất lỗi F6 và qui trình xây dựng quá trình chuẩn đốn được mơ tả rõ hơn ở phần tiếp theo. 4.1.2. Đề xuất mơ hình chuẩn đốn trên TEP theo Mạng Bayesian phân cấp Từ sơ đồ khối của mơ hình, tác giả thực hiện hố quá trình thiết lập mạng Bayesian cho vấn đề chuẩn đốn bao gồm hai bước chính được mơ tả như hình. Hình IV.2 Quy trình phương pháp chuẩn đốn lỗi bằng mạng Bayesian Phân tích quan hệ nhân quả Phân tích chế độ lỗi và hệ quả (Failure mode and effects analysis – FMEA) là phương pháp thường được sử dụng để xác định một danh sách các loại lỗi và nguyên nhân lỗi bởi các chuyên gia. Trên thực tế, bảng phân tích chế độ lỗi và hệ quả này được thể hiện thơng qua một bảng dẫn báo cáo tổng hợp từ nhiều kỹ sư vận hành trực tiếp đến giám sát hệ thống sản xuất. Nĩ được xác định bởi sự phân loại định tính các chế độ lỗi và các kết quả bảo trì thực hiện bởi các chuyên gia dựa trên kinh nghiệm và sự hiểu biết của họ [3]. Ứng dụng phương pháp này vào mạng Bayesian, bảng phân tích lỗi và hệ quả của nĩ được chuyển hố thành các núi mạng (node) và các đường biểu thị nguyên nhân kết quả (arc) trong mơ hình mạng dưới dạng như mơ tả trong hình trước đĩ. Trong bài viết này, tác giả sử dụng phân tích chế độ lỗi và hệ quả FMEA được sử dụng tối ưu bởi kinh nghiệm từ người vận hành và giám sát hệ thống sản 44 Báo cáo tổng kết đề tài khoa học xuất đã được thiết lập ở hầu hết các hệ thống sản xuất thực tế, trong khi đĩ cơ sở dữ liệu thể hiện các phân tích nguyên nhân - hệ quả chưa thực sự được quan tâm ở nhiều cơ sở sản xuất. Trong thực tế, [2] thực hiện một phép đo PCA quan sát sự biến thiên của lỗi F6 đối với tất cả các biến trong mơ hình, chúng tơi cân nhắc nĩ cùng với ý kiến của chuyên gia về quá trình để thiết lạp danh sách các biến ảnh hưởng tới lỗi này được mơ hình hố trong bảng 4.5, đồng thời qua quá trình học tập dữ liệu với tính tốn chỉ số Person thể hiện độ tương quan của các biến qua dữ liệu để mơ hình hố các mối quan hệ trong hình. Bảng 4.5 Các biến sử dụng trong mơ hình chuẩn đốn Nút Mơ tả Đơn vị F6 Lỗi sự giảm đi cấp liệu của A -- XMES1 Lưu lượng tiếp liệu ở A (stream 1) Kscmh XMES2 Lưu lượng tiếp liệu ở D (stream 2) Kg/hr XMES3 Lưu lượng tiếp liệu ở E (stream 3) Kg/hr XMES10 Lưu lượng làm sạch, gột rửa (stream 9) Kg/hr XMES14 Lưu lượng của separateur (stream 10) Kg/hr XC2 Lưu lượng cấp liệu ở E (stream 3) Kg/hr XC4 Lưu lượng cấp liệu tổng (stream 4) Kg/hr XC5 Van tuần hồn lại của máy nén % XC3 Lưu lượng cấp liệu ở A (stream 1) Kg/hr XC11 Lưu lượng của dung dịch là mát của bình Kg/hr ( condenseur) Mơ hình hố Trong mục này, tác giả đề xuất một cơ chế học dữ liệu để kiểm tra lại mối quan hệ nhân quả đề xuất bởi các chuyên gia (và cĩ thể tìm ra mối quan hệ mới) như trong hình IV.2. Cơ chế tự học tự động được thực hiện bởi việc trích xuất từ dữ liệu lịch sử sản xuất. Mục tiêu của giai đoạn học tập là tìm ra cấu trúc của mạng Bayes (học cấu trúc) và ước tính xác suất cĩ điều kiện (học các tham số). Cĩ thể chia ra hai loại dữ liệu học tập: (i) với dữ liệu đầy đủ, tất cả các biến được quan sát, khơng cĩ biến tiềm ẩn. Phương pháp đơn giản và được sử dụng rộng rãi nhất là ước tính thống kê, bao gồm ước tính xác suất của một sự kiện theo tần suất xuất hiện của sự kiện 45 Báo cáo tổng kết đề tài khoa học trong cơ sở dữ liệu. Cách tiếp cận này, được gọi là khả năng tối đa (Maximum Likelihood Estimation) [4]: ��,�,� �(�� = ��|��(��) = ��) = ��,�,� = (2) ∑� ��,�,� Trong đĩ Ni, j, k là số lượng sự kiện trong cơ sở dữ liệu mà biến Xi ở trạng thái xk và cha mẹ của nĩ nằm trong cấu hình xj. (ii) với dữ liệu khơng đầy đủ: Trong các ứng dụng thực tế, cơ sở dữ liệu rất thường khơng đầy đủ. Sau khi nhận thấy sự tồn tại của các loại dữ liệu khơng đầy đủ khác nhau, chúng tơi sẽ tiếp cận hai trường hợp cĩ thể được xử lý tự động và sau đĩ tập trung vào một trong các thuật tốn được sử dụng nhiều nhất là thuật tốn cực đại hĩa kỳ vọng (Expectation–maximization algorithm) [5]. Về cơ bản, phương pháp Bayesian là một phương pháp suy luận dựa trên báo cáo xác suất. Nghĩa là kết quả của quá trình học tập từ dữ liệu của mơ hình mạng này là một bảng xác suất bao gồm hai loại xác suất [6]: xác suất biên (Marginal probability) là xác suất của một sự kiện (biến) mà khơng quan tâm đến các sự kiện (biến) khác và xác suất cĩ điều kiện (Conditional probability) là xác suất của một sự kiện (biến) A nào đĩ, biết rằng một sự kiện (biến) B khác xảy ra. p (A│B) = (p (B│A) p (A)) / p (B) Định lý của Bayes cho phép đảo ngược xác suất. Đĩ là nĩi từ nguyên nhân để suy ra hậu quả. Hay nĩi cách khác, bắt đầu từ một hậu quả để quay trở lại nguyên nhân, tức là chuẩn đốn. Do đĩ từ một sự thất bại (hoặc lỗi), một hệ thống dựa trên các mạng Bayes sẽ cĩ thể xác định các nguyên nhân cĩ thể xảy ra nhất dẫn đến sự cố. Mối quan hệ để thiết lập nên mạng Bayesian của các điểm nút trong bảng 1 thực tế đã được đề xuất bởi chuyên gia của cơng ty Eastman. Tác giả đề xuất tham khảo thêm các mối quan hệ giữa các biến lỗi và thơng số cảm biến tại [2]. Hơn thế nữa, trên quy trình được đề xuất ở hình 2- mục 2 trong bài báo, các mối quan hệ giữa các biến trong bảng 1 được xác nhận bởi một quá trình học dữ liệu, mà tương ứng độ chính xác của mối quan hệ đĩ được đánh giá bởi điểm số học từ dữ liệu (score by learning) thực hiện dựa trên thuật tốn kiểm tra mối tương quan [42]. 46 Báo cáo tổng kết đề tài khoa học Cơng việc mơ phỏng trong bài báo được thực hiện trên mơi trường Matlab, thư viện BNT [43]. Hình IV.3 thể hiện mơ hình Bayesian các mối quan hệ nguyên nhân- hệ quả của các biến trong ví dụ lỗi F6 đã nêu ở trên (các đường mũi tên bình thường thể hiện mối quan hệ được xác nhận, các đường nét đứt mờ thể hiện mối quan hệ khơng được xác nhận do điểm số Person thấp). Theo đĩ, ta thấy một số mối quan hệ đã bị lược bỏ (đồng thời lược bỏ đi một vài biến khơng cĩ tác dụng nào trong mơ hình) bằng việc kiểm nghiệm với dữ liệu học tập để tinh giản mơ hình chuẩn đốn trong trường hợp này. Hình IV.3 Mơ hình được xây dừng và các mối quan hệ của các biến được xác nhận Trên cơ sở đĩ, hình thể hiện mơ hình chuẩn đốn chúng tơi đã mơ hình hố trên mơi trường Matlab. Hình IV.4 Mơ hình chuẩn đốn mạng Bayesian trên Matlab 47 Báo cáo tổng kết đề tài khoa học Quá trình học dữ liệu đào tạo cũng được thực hiện thơng qua mơi trường này. Dữ liệu đào tạo là dữ liệu đã được quy chuẩn hố. Chúng trải qua một quá trình từ tinh chỉnh, lọc nhiễu đến rời rạc hố cẩn thận để thể hiện từ dữ liệu liên tục thành dữ liệu rời rạc hố để mơ hình học tập. Dữ liệu được dùng để đào tạo mơ hình được chúng tơi khai thác từ các cơng việc đã được chuẩn hố trước đây, chẳng hạn như trong [2, 42] với các dữ liệu đầy đủ từ hoạt động bình thường của hệ thống và hoạt động bất bình thường (cĩ xuất hiện lỗi) trên hệ thống với các bảng giá trị được rời rạc hố như trong bảng 4.6. Bảng 4.6 Các giá trị rời rạc hố của các biến Rời F6 XMEAS1 XMEAS2 XMEAS3 XC3 XC4 XC5 XC11 rạc True [-0.0043 [3 [4 [-0.0935 [-0.0032 1 (cĩ [2 1270.8] [3 1563.2] 0.3276] 35.3] 36] 33.23] 33.32] lỗi) False [0.3276 [1270.8 [1563.2 [35.3 [36 [33.23 [33.23 2 (ko 0.6596] 2539.6] 3123.5] 67.7] 68] 66.55] 66.66] lỗi) [0.6596 [2539.6 [3123.5 [67.7 [68 [66.55 [66.66 3 -- 1.0000] 3808.4] 4683.7] 100.1] 100] 100] 100] 4.2. Kết quả chuẩn đốn lỗi Dựa trên dữ liệu đã được chuẩn hố trước đĩ trong [2, 42], chúng tơi thực hiện việc test và chuẩn đốn lỗi của mơ hình vưà thiết lập được trên một một ví dụ mà dữ liệu đĩ đã chứng thực: Mơ tả: Tình huống được thể hiện qua sơ đồ dữ liệu của hình IV.5. Quan sát dữ liệu xảy ra lỗi F6 (lỗi xảy ra sự rối loạn cấp nguyên liệu ở Steam A), cĩ thể thấy rằng điều đĩ cĩ sự liên quan đến các biến điều khiển mà ta theo dõi ở mơ hình gồm: XC3, XC4, XC5 và XC11. Tuy nhiên rõ nét nhất cĩ thể thấy đến sự thay đổi của biến XC4 bởi sự tăng đột ngột của biến này. Biến XC3 và XC11 cũng cho thấy sự ảnh hướng của việc tăng liệu cấp các nguyên liệu đầu vào nhưng việc điều khiển của 48 Báo cáo tổng kết đề tài khoa học chúng mang độ biến thiên quá lớn lúc hoạt động bình thường và khơng cĩ được sự ổn định trong dữ liệu ghi nhận được. Ngược lại, cĩ thể thấy rằng biến XC5 cũng đã ảnh hưởng khơng nhỏ đến hệ thống và dẫn đến tình trạng xảy ra lỗi F6 bởi biến XC5 khi được điều khiển một cách ổn định hệ thống đã khơnh cho ra lỗi đến khi xuất hiện sự rối loạn trong điều khiển. Nhận định trước mắt nguyên nhân của lỗi F6 trong tìh huống này đã được ghi nhận sẵn trên hệ thơngs dữ liệu ở [42]. Tuy nhiên thực tế do việc cĩ ảnh hưởng tương tác nhân quả phức tạp của các biến lên nhau mà khĩ nhận được định thực sự lỗi ở một biến nào. Mức độ quyết định luơn cần một cơng cụ cĩ thể nhận định nĩ ra thành một dạng điểm số so sánh. Hình IV.5 Dữ liệu của các biến và lỗi F6 biến thiên theo thời gian. Kết quả cĩ được từ Mơ hình Bayes: Để mơ phỏng được tình huống đĩ, chúng tơi đối chiếu giá trị đo của thời điểm trước khi xảy ra lỗi và sau khi xuất hiện lỗi của mỗi biến với bảng dữ liệu đã được rời rạc hố. Từ đĩ thiết lập các thơng số ban đầu cho mỗi một quan sát để nhìn nhận sự thay đổi của xác suất cĩ điều kiện của mỗi một biến điều khiển. Chúng tơi tiến hành hai thời điểm quan sát như sau: 49 Báo cáo tổng kết đề tài khoa học - Thời điểm 1(bình thường): Thời điểm trước khi lỗi, thể hiện khi F6 đang ở vị trí mức 2 (False), lúc này cĩ thể thấy các giá trị của các biến điều khiển ở các mức lần lượt như sau: xmeas1 ở mức 2, xmeas 2,3 ở mức 3 (so sánh giá trị ở sơ đồ với giá trị chuẩn quy định trong bảng 4.6). Ta qui định chúng ở các mức giá trị đĩ bằng câu lệnh sau ở mơi trường Matlab: %observation 1: evidence{F6}=2; evidence{xmeas1}=2; evidence{xmeas2}=3; evidence{xmeas3}=3; Hình IV.6 Xác suất cĩ điều kiện của các biến điều khiển. - Thời điểm 2 (cĩ lỗi): Thời điểm cĩ lỗi là khi xuất hiện F6 (từ 2 nhảy xuống 1) trong sơ đồ hình IV.5, tương ứng với nĩ là giá trị đo xmeas1 bị thay đổi tuy nhiên các giá trị xmeas2 và 3 vẫn giữ nguyên mức giá trị. Câu lệnh cho thời điểm này là: evidence{F6}=1; evidence{xmeas1}=1; evidence{xmeas2}=3; evidence{xmeas3}=2; Sau đĩ, ta thực hiện tính tốn các xác suất cĩ điều kiện ở mỗi một thời điểm: P(XCi/{F6, xmeas1, xmeas2, xmeas3}). Xác suất này biểu thị xác xuất của các biến 50 Báo cáo tổng kết đề tài khoa học điều khiển khi ta đã biết giá trị của các biến F6, xmeas1, xmeas2 và xmeas3 trong mơ hình. Từ đĩ thể hiện kết quả các xác suất đĩ trên hình IV.6. Giải thích kết quả: Quá kết quả sự thay đổi về xác suất của các biến điều khiển XCi ta thấy sự thay đổi lớn nhất là ở biến XC4 khi mà xác suất của biến này đã thay đổi từ phần lớn đang tập trung ở mức 3 về mức 1 và mức 2. Bên cạnh đĩ là sự thay đổi khơng nhỏ ở biến XC5 cũng thể hiện được phần nào nguyên nhân lỗi đến từ sự biến thiên của giá trị biến này. Mức quan sát được ở biến XC3 qua mơ hình là khơng thực sự rõ nét. Tuy nhiên điều đĩ cũng đã thể hiện được phần nào mơ tả ban đầu của ví dụ. Và trên thực tế, tuỳ vào biến điều khiển cĩ mức tác động ra sao đến kết quả lỗi của chu trình thể hiện trên dữ liệu mà cân nhắc đến việc bảo trì. Hiệu suất cao của mơ hình chuẩn đốn này cho thấy hiệu suất của mơ hình dự báo đã đạt được mức ý nghĩa mong muốn. Do đĩ, mơ hình là các cơng cụ dự bá...for Para4 Drying pressure learning consist of production time, machine‟s name, Para5 Drying temperature machine ID, function, recipe, human factor. Moreover, the Para6 Drying volume dataset of maintenance consists of Time, Machine‟s name, Machine state evaluation. The dataset is collected in six • Third class: The Parameter descriptions Paran months from the CMMS, the metrology detects the product (n=1→50): they are determined by the real Danapha‟s quality where final products are detected as good or bad process. There are totally 50 parameters that identified in this product.Also, the metrology data composes of time, product process by Danapha‟s operators. In this paper, we propose type, Lot number and Product quality in real time. Our table I in which present only six collected parameter which learning data is built by collecting from FDC, SPC, RMS, are considered. In order to model, these variables have either metrology data, production data as shown in Fig. 5. a binary mode (true/ false) which is resulting from discretization process. A graph structure model with these three variables classes is proposed based on Bayes „s rules. That classify the diagnosis failure causes with two hierarchical classes RCj and Paran. In which the RCj is represented by knowing the parameter Paran nodes who is considered also as the causes. This model offers at the final the probability distributions Fig. 5. Collected production data for Bayes learning associated with each of variable in Fig. 4. In follow section, our result would be presented in next section. Published By: Retrieval Number: F9796038620/2020©BEIESP Blue Eyes Intelligence Engineering DOI:10.35940/ijrte.F9796.059120 7 & Sciences Publication Diagnosis Failure Cause of complex Pharmaceutical System by Bayes Learning for Decision Support Fig. 6. Diagnosis results by probabilites of variables Then, Fig. 6 present results illustrative a scenario inference This research is funded by University of Technology and whereas have only the probability distributions of a part of Education – The University of Danang under project number variables on table I after learning from database. The T2019-06-131. probabilities of these variables from two case without and appear of failure mode FM1 in system. By comparing it‟s REFERENCES probabilities in two case, operator can make a correct 1. Zio, Enrico. (2013). "System Reliability and Risk Analysis." The decision. P(RCi|FM) and P(Paran|RCi) of each variable show Monte Carlo Simulation Method for System Reliability and Risk us how‟s our model work since the observation a failure Analysis. Springer, London, 7-17. 2. Bouaziz. M.-F, Zamạ. E, Duvivier. F. (2013). “Towards Bayesian mode. In fact, probabilistic inference is obviously based on Network Methodology for Predicting the equipment Health Factor of learning results. The result show in Fig. 6 that the proposed Complex Semiconductor Systems”. International Journal of method performs good detection capability by showing the Production Research, Volume 51, Issue 15, 4597-4617. root cause RC and Para who cause the high speed of roller 3. Tran, N. H., Bouaziz, M. F., & Zamạ, E. (2014). “Identification and 3 3 classification protocol for complex systems”. In 2nd European of drying. Conference of the Prognostics and Health Management Society, A real problem drift of Air Heater Pressure of PHME 2014 (pp. 58-65). manufacturing process is happened in reality on April 2016 in 4. Pearl J., (1988). Probabilistic reasoning in intelligent systems: Networks of plausible inference. Morgan – Kaufmann, San Diego. this Danapha‟s atelier. Base on learning and inference results, 5. Pearl, Judea. (2014). Probabilistic reasoning in intelligent systems: a similar inference is founded as comparing with happens networks of plausible inference. Elsevier. reality. This show how our model works for supporting to 6. M. Sampath, S. Lafortune and D. Teneketzis, (1998). Active diagnosis of discrete-event systems, Auto- matic Control, IEEE Transactions on, make a correct decision. 43(7), pp 908–929. However, it must be note that the structure of classifier is 7. E. Deschamps and E. Zamai, (2007). Diagnosis for control system not easily established even either by learning from data or reconfiguration, In IFAC Manage- ment and Control of Production and Logistics, volume 4, no.1, pp. 377–382. expert's opinion if it's existant too many variables 8. Jensen F.V., (1996). Introduction to Bayesian networks, UCL Press, representing production process. Therefore, it should be London. necessary to propose weights primarily for each variable 9. Bishop, C. M. and Tipping M. E., (1998). “A hierarchical latent variable model for data visualization”. IEEE Transactions on Pattern depend on their differences properties in order to make Analysis and Machine Intelligence 20(3), 281–293. optimal distribution. These indicators can be proposed by 10. Murphy K.,. The Bayes Net Toolbox for Matlab. (2011). Computing operator‟s experience or by learning from historical Science and Statistics: Proceedings of Inference, vol. 33. production data in some case. 11. Tran, N. H., Henry Sébastien, and Eric Zamạ. (2016). "Generic and configurable diagnosis function based on production data stored in Manufacturing Execution System." Third European Conference of the IV. CONCLUSION Prognostics and Health Management Society 2016. Vol. 7. No. 057. 12. Gibson, Mark, ed. Pharmaceutical preformulation and formulation: a This paper deal with diagnosis problem of industrial practical guide from candidate drug selection to commercial dosage pharmaceutical production. Our methodology is presented form. CRC Press, 2016. with detailed steps from definition of characteristics of pharmaceutical context to particular Bayes approaches for AUTHORS PROFILE modelling diagnosis process. In simulation result, this Mr Ngoc-Hoang Tran was born in Danang, Vietnam in method is effectiveness for diagnosis failure cause on 1986. He completed his Master‟s degree on engineering of complex system in 2013 and PhD degree in automation complex data in Danapha‟s case study. and civil production from Grenoble-INP, France in 2018. He is currently working on Mechatronics department- ACKNOWLEDGMENT Faculty of Mechanical engineering, University of Technology and Education – The University of Danang. The author wishes to thank Danapha Pharmaceutical His main research interests include equipment diagnosis, IoT supervision Company. This work was supported in part by their and AI recognition with Bayes network technology. description documents of manufacturing process, learning production data and real scenarios. Published By: Retrieval Number: F9796038620/2020©BEIESP Blue Eyes Intelligence Engineering DOI:10.35940/ijrte.F9796.059120 8 & Sciences Publication PHÂN TÍCH VÀ ỨNG DỤNG PHƯƠNG PHÁP HỌC MÁY ĐỂ CHUẨN ĐỐN LỖI CHO CHU TRÌNH SẢN XUẤT CƠNG NGHIỆP ANALYZE AND APPLICATION MACHINE LEARNING TECHNIQUE FOR DIAGNOSIS INDUSTRIAL PRODUCTION PROCESS Trần Ngọc Hồng1 1 Trường Đại học Sư phạm Kỹ thuật – Đại học Đà Nẵng, 48 Cao Thắng, Đà Nẵng, Việt Nam TĨM TẮT Bài viết này đề xuất một giao thức ứng dụng của quá trình chuẩn đốn trong một máy phản ứng của một quy trình phức tạp. Bằng cách sử dụng Kỹ thuật học tập Bayes, giao thức này được đào tạo bằng cách học cơ sở dữ liệu sản xuất lịch sử để chuẩn đốn nguyên nhân thất bại của lị phản ứng này trong quá trình sản xuất. Ứng dụng trong lĩnh vực tự động hĩa, mơ hình đề xuất được cấu trúc tự động từ trích xuất dữ liệu được thu thập trực tiếp từ các cảm biến. Dựa trên thuật tốn Tối đa hĩa kỳ vọng trong học máy, chúng tơi cho thấy kết quả của mơ hình này là phân loại và cũng để xác định nguyên nhân gốc rễ của vấn đề trơi dạt trong một mơ phỏng kịch bản cụ thể. Do đĩ, đĩng gĩp chính của chúng tơi để hỗ trợ máy cơng cụ bảo trì để tăng kỹ thuật vịng đời. Từ khĩa: Điều khiển hệ thống sản xuất; Học mạng Bayes; Hệ thống sản xuất phức tạp; Chu trình chuẩn đốn; Bảo trì sữa chữa. ABSTRACT This paper proposes an application protocol of diagnosis process in a reactor machine of a complex process. By using Bayes Learning Technique, this protocol is trained by learning historical production database in order to diagnosis the failure cause of this reactor in production process. Application in automation field, the model propose is structured automatically from collected data extract directly from sensors. Based on Expectation Maximization algorithm in machine learning, we show that the result of this model is to classify and also to identify the root causes of drift problem in a specific scenario simulation. Therefore, our key contribution to support maintenance tool machine for increasing life-cycle engineering. Keywords: Control production; Bayes learning; Complex system; Diagnostics process; Corrective Maintenance. 1. GIỚI THIỆU trình sản xuất luơn luơn tồn tại rất nhiều rủi ro Ngày nay, quá trình cơng nghiệp hố của việc khơng thể quan sát được các nhiễu đẩy các doanh nghiệp vào một sự cạnh tranh loạn hoặc trơi dạt mà ở đĩ máy mĩc khơng khốc liệt. Trong bối cảnh đĩ, sự thành cơng hoạt động đúng như chúng ta yêu cầu, tạo nên phụ thuộc vào chất lượng sản xuất lẫn chất những ảnh hưởng tới chất lượng sản phẩm. lượng sản phẩm. Do đĩ, các nhà sản xuất phải Trong khi đĩ thiết bị sản xuất gần như khơng tối đa hố hiệu suất và chất lượng sản xuất cĩ một cơ chế nội tại nào để xác định vấn đề thơng qua ba tiêu chí: vịng đời sản phẩm, giá đến từ đâu nếu sản phẩm đưa ra khơng chất và hiệu quả [1]. Để đạt được những điều đĩ, lượng. Do đĩ, trên thực tế rất nhiều sự trơi dạt họ thường tập trung vào việc tăng khả năng hoạt động (sự sai lệch hoạt động khiến cho sẵn sàng của thiết bị sản xuất thơng qua một thiết bị sản xuất khơng thể đem lại được kết kế hoạch bảo trì bảo dưỡng chặt chẽ và hiệu quả chất lượng sản phẩm như dự kiến) khơng quả. thể tránh khỏi trong quá trình sản xuất. Tuy nhiên, thực tế là khơng phải tất cả Trong bối cảnh đĩ, vấn đề này lại trở các khâu trên thiết bị sản xuất đều được trang nên nghiêm trọng hơn khi mà thời đại cơng bị cảm biến để đo và phản hồi kết quả vì lý do nghiệp 4.0 tạo nên một khối lượng đồ sộ dữ kỹ thuật lẫn lý do đầu tư sản xuất. Do vậy, quá liệu sản xuất (con người, cảm biến, cơng thức, vật liệu). Quy trình phân tích khối dữ liệu phẩm) và thời gian sản xuất cũng kéo dài (cĩ đĩ để trích xuất những thơng tin cần thiết cho khi lên đến 8 đến 10 tuần sản xuất). Do đĩ, quá trình giám sát và theo dõi thiết bị được mơ mơi trường sản xuất trong cơng nghiệp hàm tả tổng quát như hình 1. chứa nhiều yếu tố khơng chắc chắn nhất định (sự sai lệch hoạt động của thiết bị sản xuất, sai sĩt của người vận hành...) cĩ thể ảnh hưởng đến quá trình điều khiển và bối cảnh bảo trì. Do đĩ, tác giả phân tích những phương pháp học máy phổ biến dựa trên các tiêu chuẩn được định ra để phù hợp với bối cảnh sản xuất cơng nghiệp 4.0: • Thích hợp sử dụng với đa dạng đặc tính của tập hợp tham số (rời rạc, liên tục, định tính và định lượng). Ví dụ: thời gian, số đo Hình 1. Mơ hình mơ tả các bước của quá kỹ thuật số, số lượng...). trình quan sát và theo dõi sức khoẻ thiết bị • Thích hợp sử dụng với nhiều lớp sản xuất tham số, dữ liệu từ thiết bị sản Cơng việc trong bài viết này của tác giả xuất (cảm biến, động cơ...) và tập trung vào quá trình trích xuất dữ liệu và sản phẩm. đưa ra mơ hình chuẩn đốn lỗi cho thiết bị • Thích hợp sử dụng với đa dạng máy mĩc sản xuất. nhiều loại biến (biến quan sát Để làm rõ được điều đĩ, bài viết này sẽ được và khơng quan sát được). được tổ chức như sau: trong mục 2, tác giả • Thể hiện được mối tương quan trình bày một cơ sở phân tích lý thuyết xung (mối quan hệ nguyên nhân – hệ quanh các kỹ thuật học máy (machine quả) giữa các biến và các sự learning), từ đĩ chọn ra và áp dụng kỹ thuật kiện. học mạng Bayesian. Mục 3 trên cơ sở đĩ trình • Xử lý được các vấn đề thiếu/mất bày một chu trình ứng dụng mạng Bayesian một phần dữ liệu và hoặc dữ liệu vào quá trình học dữ liệu từ hệ thống sản xuất. khơng chắc chắn (trong các Tiếp đĩ, mục 4 trình bày trường hợp ứng dụng trường hợp dữ liệu học đầy đủ của phương pháp này và đưa ra kết quả chuẩn và dữ liệu học khơng đầy đủ). đốn nguyên nhân lỗi áp dụng trong một ví dụ • Khả năng thích ứng: được định mơ phỏng quá trình sản xuất lị hơi Tenessse nghĩa như là khả năng sử dụng Eastman. Cuối cùng, kết luận và thảo luận của đa mục đích của phương pháp đề tài sẽ đĩng lại bài viết này. mơ hình hố từ dữ liệu, chẳng hạn: cĩ thể sử dụng để chuẩn 2. CƠ SỞ LÝ THUYẾT đốn, dự đốn, tiên lượng lỗi, Trong bối cảnh mà hệ thống sản xuất truy xuất nguyên nhẫn lỗi... được đặc trưng bởi sự phức tạp cao và sự khơng chắc chắn bởi nhiều yếu tố rủi ro. Sản Dựa trên các tiêu chi này, tác giả tiến hành xuất cơng nghiệp thậm chí cịn phức tạp hơn phân tích ba loại phương pháp học máy phổ với nhiều chu trình sản xuất cùng chạy trên biến nhất: Cây quyết định (Decision tree), một dây chuyền sản xuất với khối lượng các mạng Nơ ron và mạng Bayesian. bước thực hiện sản xuất rất lớn (đặc biệt trong 2.1 Cây quyết định mơi trường bán dẫn và cơng nghiệp dược Cây quyết định là một cơng cụ phổ biến nhất để phân biệt các lớp (biến, tham số hoặc Ưu điểm chính của việc xác định bởi một sự kiện). Ưu điểm chính của cây quyết định là mạng thần kinh là cho phép mơ hình hĩa các chúng cĩ thể dễ dàng được chuyển đổi thành quá trình đa biến phi tuyến tính. Thật vậy, sức các quy tắc dễ hiểu. Do đĩ, đường dẫn (logic) mạnh của mạng nằm ở cấu trúc của nĩ và trên dẫn cây đến một quyết định rất rõ ràng đối với các trọng số được áp dụng cho các kết nối của người dùng. Nếu thuộc tính là nhị phân, chúng nĩ, nhưng điều này do đĩ khơng cho phép ta cĩ hai quyết định cĩ thể, trong khi nếu thuộc "tính thích ứng" được tính đến. tính cĩ phương thức k, chúng ta cĩ k quyết 2.3 Mạng Bayesian định cĩ thể. Do đĩ, mặc dù việc quyết định được thực hiện nhanh chĩng, việc xây dựng Mạng Bayes là một hệ thống đại diện cho mơ hình cây tốn nhiều thời gian hơn. Do đĩ, kiến thức và giúp tính tốn xác suất cĩ điều khả năng quản lý các lớp tham số, Cây quyết kiện cung cấp giải pháp cho các loại vấn đề định là khơng lớn và khĩ khả thi. khác nhau. Cấu trúc của loại mạng này rất đơn giản: một biểu đồ trong đĩ các nút biểu thị các Cây quyết định vẫn cịn một số hạn chế: biến ngẫu nhiên và các cung (do đĩ là đồ thị Đầu tiên trong số đĩ là chúng khơng thực sự được định hướng) kết nối mạng sau cĩ liên hỗ trợ các giá trị liên tục. Luơn luơn cĩ thể quan đến xác suất cĩ điều kiện [2]. Biểu diễn phân biệt chúng nhưng điều này sau đĩ đặt ra đồ họa trực quan nhất về ảnh hưởng của một vấn đề phân biệt tối ưu (mất thơng tin so với sự kiện độc lập hoặc một sự kiện với một biến biến ban đầu). Ngồi ra, cây quyết định rất số khác, liên kết nguyên nhân với hiệu ứng nhạy cảm với ồn nhiễu trong dữ liệu. Điều này bằng một mũi tên. Các biến này cĩ thể rời rạc cĩ nghĩa là luơn cần một bộ lọc dữ liệu cho hoặc liên tục (phân phối bình thường), cĩ thể phương pháp này. quan sát hoặc khơng quan sát được, phát hiện 2.2 Mạng Nơ ron hoặc khơng phát hiện ... Mạng nơ-ron nhân tạo, cịn được gọi là Trong trường hợp chung, tập hợp biến mạng nơ-ron thần kinh, là một kỹ thuật phi X = {X1, X2, ... Xn}, hàm phân phối chung P tuyến tính để dự đốn dữ liệu và thực hiện kết (X) được viết như sau: nối một số tế bào thần kinh làm phát sinh một n (1) mạng lưới thần kinh. Mạng cĩ các đầu vào từ P (X ) = P(X i / Parents(X i )) bên ngồi được kết nối với một số nơ-ron nhất i=1 định và sau đĩ mạng cung cấp một hoặc nhiều Cĩ thể nĩi, chỉ cĩ một cơng cụ cĩ thể xử đầu ra ra bên ngồi (đầu ra của một hoặc nhiều lý cả trường hợp các biến rời rạc và biến liên nơ-ron trong mạng). Do đĩ, một tế bào thần tục: mạng Bayesian. Bởi vì, chúng ta cĩ thể kinh làm cho nĩ cĩ thể mơ hình hĩa một số xây dựng mạng Bayesian với biểu đồ của mơ lượng đáng kể các hành vi theo các trọng số. hình trên dữ liệu của các biến rời rạc hoặc các Tuy nhiên, mạng lưới thần kinh hầu như chỉ bảng xác suất của từng biến liên tục. xử lý các biến liên tục. Mạng Bayesian cĩ thể đại diện cho nhiều Mặc dù số lượng tế bào thần kinh trong biến số (theo nút) và các lớp phân cấp. Việc lớp đầu vào và đầu ra được áp đặt bởi số lượng tính tốn xác suất được thực hiện từ thuật tốn đầu vào cho hệ thống cũng như mã hĩa của ước tính tối ưu (Tối đa hĩa khả năng và tối đa các lớp khác nhau (đối với lớp đầu ra), khơng hĩa kỳ vọng) cĩ thể biểu thị mối tương quan cĩ quy tắc tốn học nào để xác định số lượng giữa các nút (sẽ được trình bày ở mục sau). các lớp ẩn và số lượng tế bào thần kinh trong Do đĩ, lợi thế lớn của mạng Bayesian là khả mỗi lớp này. Tuy nhiên, một thực tế phổ biến năng thích ứng. Bên cạnh đĩ các mạng Bayes là người ta sử dụng một lớp ẩn duy nhất được cho phép tính đến khía cạnh thời gian nhờ vào tạo thành từ khoảng một nửa số nơ-ron trong các mạng Bayes động [22]. Thật vậy, cấu trúc hệ thống cộng với một. Vì vậy, để xử lý dữ và tham số của nĩ khơng thay đổi theo thời liệu bị thiếu là cần thiết nhất định cĩ điều kiện. gian, nhưng cĩ thể biểu diễn mạng Bayesian [8] với các mối tương quan thời gian. Trong bài báo, tác giảthực hiện một phần Bayesian, bảng phân tích lỗi và hệ quả của nĩ phân tích theo các yếu tố tiêu chí đã được trình được chuyển hố thành các núi mạng (node) bày để làm rõ hơn về sự chọn lựa mạng và các đường biểu thị nguyên nhân kết quả Bayesian trong cách xây dựng mơ hình chuẩn (arc) trong mơ hình mạng dưới dạng như mơ đốn dựa trên học dữ liệu, chi tiết về phương tả trong hình 4. pháp tiếp tục được giới thiệu trong mục 3. Trong bài viết này, tác giả sử dụng phân tích chế độ lỗi và hệ quả FMEA được sử dụng 3. QUÁ TRÌNH THIẾT LẬP MẠNG tối ưu bởi kinh nghiệm từ người vận hành và BAYESIAN CHO VẤN ĐỀ CHUẨN giám sát hệ thống sản xuất đã được thiết lập ở ĐỐN LỖI hầu hết các hệ thống sản xuất thực tế, trong khi đĩ cơ sở dữ liệu thể hiện các phân tích Trong phần này, tác giả mơ tả quá trình nguyên nhân - hệ quả chưa thực sự được quan thiết lập mạng Bayesian cho vấn đề chuẩn tâm ở nhiều cơ sở sản xuất. đốn bao gồm hai bước chính được mơ tả như hình 2. 3.2 Mơ hình hố Trong mục này, tác giả đề xuất một cơ chế học dữ liệu để kiểm tra lại mối quan hệ nhân quả đề xuất bởi các chuyên gia (và cĩ thể tìm ra mối quan hệ mới). Cơ chế tự học tự động được thực hiện bởi việc trích xuất từ dữ liệu lịch sử sản xuất. Mục tiêu của giai đoạn học tập là tìm ra cấu trúc của mạng Bayes (học cấu trúc) và ước tính xác suất cĩ điều kiện (học các tham số). Cĩ thể chia ra hai loại dữ liệu học tập: (i) với dữ liệu đầy đủ, tất cả các biến được quan sát, khơng cĩ biến tiềm ẩn. Phương pháp đơn giản và được sử dụng rộng rãi nhất là ước tính thống kê, bao gồm ước tính xác suất của một sự kiện theo tần suất xuất hiện của sự kiện trong cơ sở dữ liệu. Cách tiếp cận này, được gọi là khả năng tối đa (Maximum Likelihood Estimation) [4]: ��,�,� �(�� = ��|��(��) = ��) = ��,�,� = (2) Hình 2. Quy trình phương pháp chuẩn ∑� ��,�,� đốn lỗi bằng mạng Bayesian Trong đĩ Ni, j, k là số lượng sự kiện trong 3.1 Phân tích quan hệ nhân quả cơ sở dữ liệu mà biến Xi ở trạng thái xk và cha Phân tích chế độ lỗi và hệ quả (Failure mẹ của nĩ nằm trong cấu hình xj. mode and effects analysis – FMEA) là (ii) với dữ liệu khơng đầy đủ: Trong các ứng phương pháp thường được sử dụng để xác dụng thực tế, cơ sở dữ liệu rất thường khơng định một danh sách các loại lỗi và nguyên đầy đủ. Sau khi nhận thấy sự tồn tại của các nhân lỗi bởi các chuyên gia. Trên thực tế, bảng loại dữ liệu khơng đầy đủ khác nhau, chúng phân tích chế độ lỗi và hệ quả này được thể tơi sẽ tiếp cận hai trường hợp cĩ thể được xử hiện thơng qua một bảng dẫn báo cáo tổng hợp lý tự động và sau đĩ tập trung vào một trong từ nhiều kỹ sư vận hành trực tiếp đến giám sát các thuật tốn được sử dụng nhiều nhất là hệ thống sản xuất. Nĩ được xác định bởi sự thuật tốn cực đại hĩa kỳ vọng (Expectation– phân loại định tính các chế độ lỗi và các kết maximization algorithm) [5]. quả bảo trì thực hiện bởi các chuyên gia dựa trên kinh nghiệm và sự hiểu biết của họ [3]. Về cơ bản, phương pháp Bayesian là một Ứng dụng phương pháp này vào mạng phương pháp suy luận dựa trên báo cáo xác suất. Nghĩa là kết quả của quá trình học tập từ chất Eastman nhằm cung cấp một mơ phỏng dữ liệu của mơ hình mạng này là một bảng xác của một quy trình cơng nghiệp thực sự để thử suất bao gồm hai loại xác suất [6]: xác suất nghiệm các phương pháp kiểm sốt và / hoặc biên (Marginal probability) là xác suất của giám sát quá trình [7]. Quy trình này bao gồm một sự kiện (biến) mà khơng quan tâm đến các năm thành phần chính: lị phản ứng, thiết bị sự kiện (biến) khác và xác suất cĩ điều kiện ngưng tụ, máy nén tái chế, thiết bị phân tách (Conditional probability) là xác suất của một và bộ tháo gỡ. Thuốc thử khí (gas) A, C, D, E sự kiện (biến) A nào đĩ, biết rằng một sự kiện và khí trơ B được đưa vào lị phản ứng. Thành (biến) B khác xảy ra. phần G và H là hai sản phẩm khí mong muốn tạo ra (product), trong khi F là sản phẩm phụ p (A│B) = (p (B│A) p (A)) / p (B) (3) khơng mong muốn. Các phản ứng hĩa học của Định lý của Bayes cho phép đảo ngược quá trình được đưa ra bởi hệ phương trình (4). xác suất. Đĩ là nĩi từ nguyên nhân để suy ra A(g)+C(g)+D(g) →G(lig) hậu quả. Hay nĩi cách khác, bắt đầu từ một hậu quả để quay trở lại nguyên nhân, tức là A(g)+C(g)+E(g) →H(lig) chuẩn đốn. Do đĩ từ một sự thất bại (hoặc → lỗi), một hệ thống dựa trên các mạng Bayes sẽ A(g)+E(g) F(lig) cĩ thể xác định các nguyên nhân cĩ thể xảy ra 3D(g) →2F(lig) (4) nhất dẫn đến sự cố. (g) được ký hiệu chỉ khí gas 4. ỨNG DỤNG CHUẨN ĐỐN TRÊN QUY TRÌNH SẢN XUẤT (lig) được ký hiệu chỉ chất lỏng TENNESSEE EASTMAN Trong khuơn khổ của bài báo, chúng tơi 4.1 Quy trình Tennessee Eastman chỉ ứng dụng mơ hình Bayesian chuẩn đốn lỗi cho lị phản ứng trong chu trình sản xuất Quy trình Tennessee Eastman là một quy Hình 3. Mơ hình mơ phỏng quy trình cơng nghiệp Tennessee Eastman [9] trình được phát triển bởi Cơng ty Hĩa Tennesse Eastman. Tại lị phản ứng, các thuốc thử và các loại khí được đưa vào để bắt đầu Kết quả mơ phỏng được tác giả thể hiện quá trình sản xuất, được mơ tả phần khoanh trên hai nội dung: trịn như hình 3. a) Mối quan hệ để thiết lập nên mạng Tất cả các phản ứng là khơng thể đảo Bayesian của các điểm nút trong bảng ngược, tỏa nhiệt và thứ tự được quy định bởi 1 thực tế đã được đề xuất bởi chuyên hệ phương trình (4). Tốc độ phản ứng được gia của cơng ty Eastman. Tác giả đề biểu thị như là một hàm của nhiệt độ xuất tham khảo thêm các mối quan hệ Arrhenius. Phản ứng tạo năng lượng G lớn giữa các biến lỗi và thơng số cảm biến hơn kích hoạt tạo ra H, dẫn đến độ nhạy nhiệt tại [7]. Hơn thế nữa, trên quy trình độ cao hơn. được đề xuất ở hình 2- mục 2 trong bài Quy trình Tennessee Eastman bao gồm báo, các mối quan hệ giữa các biến hơn 20 lỗi khác nhau. Những lỗi này cĩ nhiều trong bảng 1 được xác nhận bởi một tính chất khác nhau: chẳng hạn như thiếu thiết quá trình học dữ liệu, mà tương ứng độ bị truyền động hay như van bị chặn... Bên chính xác của mối quan hệ đĩ được cạnh đĩ, quy trình bao gồm 53 tham số (cảm đánh giá bởi điểm số học từ dữ liệu biến, thơng số thiết lập, tuỳ chỉnh van...). Mơ (score by learning) thực hiện dựa trên tả về 20 lỗi này và 53 tham số được đưa ra thuật tốn kiểm tra mối tương quan trong cơng việc [7]. Tuy nhiên, tác giả thực [11]. hiện phần ứng dụng của mình để mơ hình hố Cơng việc mơ phỏng trong bài báo khả năng áp dụng mơ hình chuẩn đốn này với được thực hiện trên mơi trường chỉ một số biến nhất định, được mơ tả như Matlab, thư viện BNT [12]. Hình 4 thể hiện mơ hình Bayesian các mối quan bảng 1. hệ nguyên nhân- hệ quả của các biến trong ví dụ (các đường mũi tên bình thường thể hiện mối quan hệ được xác Bảng 1. Các biến sử dụng trong mơ hình nhận, các đường nét đứt mờ thể hiện chuẩn đốn mối quan hệ khơng được xác nhận do Nút Mơ tả Đơn vị điểm số thấp). F4 Lỗi báo nhiệt độ °C của bình ngưng tụ làm mát của lị phản ứng XMES9 Thơng số nhiệt độ °C của lị phản ứng XMES16 Thơng số áp lực Kpa Hình 4. Mơ hình chuẩn đốn mạng cuả bộ tháo dỡ Bayesian XMES21 Nhiệt độ của chất °C b) Sau khi mơ hình Bayesian được xác làm mát ở đầu ra lập, bước cịn lại chỉ cịn là vấn đề của lị phản ứng sự tính tốn. Bảng xác suất của mỗi XC3 Lưu lượng nạp Kg/hr biến trong mạng Bayesian được xác khí A (Luồng 1) lập sau quá trình học dữ liệu trên một cơ sở lịch sử dữ liệu sản xuất mơ XC1 Lưu lượng nạp Kg/hr phỏng, được cung cấp trong [11]. khí D (Luồng 2) Xác xuất cĩ điều kiện P(XMES21 | F4) XC2 Lưu lượng nạp Kg/hr thể hiện xác suất của việc nhiệt độ quá khí E (Luồng 3) cao của chất làm mát ở đầu vào của lị phản ứng gây nên lỗi báo quá nhiệt của 4.2 Kết quả mơ phỏng bình ngưng tụ làm mát của lị phản ứng trong chu trình Tennessee của mơ hình. Do đĩ, việc xác nhận lại mối Eastman. Tương ứng với dữ liệu lịch quan hệ nguyên nhân – hệ quả bằng một sử học tập và giả định do tác giả tạo phương pháp tính điểm score các mối quan hệ nên trong dữ liệu học tập đĩ. Hình 5 như trong cơng việc của tác giả là rất cần thiết. thể hiện rất rõ xác suất của sự thay đổi Kết quả của việc chuẩn đốn cũng phụ thuộc này khi phát hiện lỗi F4 trong hệ thống. rất lớn vào chất lượng của dữ liệu sử dụng để Kết quả này cho thấy sự tương đồng học tập. Vì thế, kết quả chuẩn đốn dựa trên của về mặt chuẩn đốn cĩ từ mơ hình xác suất chỉ là để hỗ trợ cho quyết định can và dữ liệu giả định của tác giả. thiệp của con người. 5. KẾT LUẬN Cơng việc của bài báo này đưa ra một phương pháp xây dựng mơ hình chuẩn đốn lỗi dựa trên mạng Bayesian căn cứ trên những phân tích đặc tính của các phương pháp máy học hữu dụng nhất. Tác giả cũng đã thực hiện một mơ phỏng ví dụ ngắn gọn trên một hệ thống sản xuất mơ phỏng thực, mơ hình Tennessee Eastman được áp dụng rộng rãi trong học thuật quốc tế. Kết quả từ mơ hình mơ phỏng của bài báo cho thấy hiệu quả của mơ hình trong bước đầu hỗ trợ quyết định bảo trì bảo dưỡng của người vận hành chu trình sản xuất. Bên cạnh đĩ, mơ hình Bayesian bài báo xây dựng vẫn cịn một số hạn chế: (i) phụ Hình 5. So sánh sự thay đổi của bảng thuộc vào chất lượng của cơ sở dữ liệu cĩ thể xác suất điều kiện của các nút mạng khi dẫn đến những kết quả sai lệch trong trường phát hiện lỗi trong hệ thống sản xuất. hợp dữ liệu học tập khơng đầy đủ; (ii) chưa thể hiện được những mối quan hệ nguyên Bên cạnh đĩ, kết quả của bài báo này cũng thể nhân – hệ quả theo thời gian bởi thực tế cĩ các hiện sự sàng lọc lại các mối quan hệ khơng những rủi ro tác động gây ra lỗi theo những chắc chắn (được thể hiện bằng mũi tên nét đứt thời gian khác nhau. Hạn chế này sẽ được ở hình 4) so với một số kết quả thực nghiệm khắc phục bởi một mạng Bayesian thời gian phân loại lỗi và chuẩn đốn ở những nghiên sẽ được tác giả tiếp tục nghiên cứu của mình cứu tương tự như [3,7]. Điều đĩ tạo nên sự trong thời gian tới. tinh giảm hữu ích kích thước của mơ hình mạng Bayesian. LỜI CẢM ƠN Tuy nhiên, cần phải lưu ý rằng việc phân loại Nghiên cứu này được tài trợ kinh phí bởi các biến lỗi cũng như thơng số của nĩ sẽ quyết Trường Đại học Sư phạm Kỹ Thuật – Đại học định kết quả học tập và kết quả chuẩn đốn Đà Nẵng trong đề tài cĩ mã số T2019-06-131. TÀI LIỆU THAM KHẢO [1] Kunio S., Mitsugu K., Yoshifumi K., An Advanced step in TPM Implementation. (pages 64-65). Paris, France, 1995. [2] Jensen F.V,. Introduction to Bayesian networks, UCL Press, London, 1996. [3] Tran et al., Identification and classification protocol for complex systems. In: 2nd European Conference of the Prognostics and Health Management Society, PHME 2014. 2014. p. 58-65. [4] Philippe Leray. Réseaux bayésiens « apprentissage et modélisation de systèmes complexes ». 2006. [5] Sayad Mahmoud et Abbaris Amara. Modèle discriminant pour la classification de documents XML à l’aide des réseaux bayésiens et le noyau de Fisher. Ecole nationale Supérieure d’Informatique (ESI). Mémoire de fin d’études. 2010. [6] Feller, William. An introduction to probability theory and its applications. Vol. 1. John Wiley & Sons,, 1968. [7] Par Sylvain VERRON. Diagnostic et surveillance des processus complexes par réseaux Bayésiens. Thèse doctorale d’Angers. 2007. [8] Dreyfus, Gérard. Réseaux de neurones: méthodologie et applications. Eyrolles, 2004. [9] Lau, C. K., et al. Fault diagnosis of Tennessee Eastman process with multi-scale PCA and ANFIS. Chemometrics and Intelligent Laboratory Systems 120 (2013): 1-14. [10] Basha, Nour, et al. Multiclass Data Classification using Fault-Detection-based Techniques. Computers & Chemical Engineering (2020): 106786. [11] Wetzels, Ruud, and Eric-Jan Wagenmakers. A default Bayesian hypothesis test for correlations and partial correlations. Psychonomic bulletin & review 19.6 (2012): 1057-1064. [12] Murphy, K. The BayesNet Toolbox for Matlab. Computing Science and Statistics. Proceedings of Infence, vol.33. Tác giả chịu trách nhiệm bài viết: Họ tên: Trần Ngọc Hồng Học vị: Tiến Sĩ Chuyên ngành: Cơ điện tử Đơn vị: Khoa Cơ Khí, trường Đại học Sư Phạm Kỹ Thuật – Đại học Đà Nẵng, Đà Nẵng Điện thoại: +(84) 979728986 Email: tnhoang@ute.udn.vn

Các file đính kèm theo tài liệu này:

bao_cao_tong_ket_de_tai_thiet_lap_giao_thuc_nhan_dang_va_pha.pdf