Nghiên cứu ứng dụng công nghệ mạng nơron tế bào vào bài toán phân đoạn ảnh

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ THỊ NGỌC TÚ NGHIÊN CỨU ỨNG DỤNG CÔNG NGHỆ MẠNG NƠRON TẾ BÀO VÀO BÀI TOÁN PHÂN ĐOẠN ẢNH LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên năm 2015 Số hóa bởi Trung tâm Học liệu – ĐHTN ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ THỊ NGỌC TÚ NGHIÊN CỨU ỨNG DỤNG CÔNG NGHỆ MẠNG NƠRON TẾ BÀO VÀO BÀI TOÁN PHÂN ĐOẠN ẢNH Chuyên ngành: Khoa học máy tính Mã số: 60 48

pdf80 trang | Chia sẻ: huong20 | Ngày: 13/01/2022 | Lượt xem: 480 | Lượt tải: 0download
Tóm tắt tài liệu Nghiên cứu ứng dụng công nghệ mạng nơron tế bào vào bài toán phân đoạn ảnh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƢỜI HƢỚNG DẪN KHOA HỌC TS. VŨ ĐỨC THÁI Thái Nguyên năm 2015 Số hóa bởi Trung tâm Học liệu – ĐHTN LỜI CAM ĐOAN Tôi xin cam đoan luận văn này do tôi thực thiện, có sự hướng dẫn tận tình và chu đáo của người hướng dẫn là TS. Vũ Đức Thái. Những số liệu trong các bảng biểu, hình ảnh phục vụ cho việc phân tích, nhận xét, đánh giá được thu thập từ các nguồn khác nhau có ghi trong phần tài liệu tham khảo, trong phạm vi hiểu biết của tôi. Nếu phát hiện có bất kỳ sự gian lận nào tôi xin hoàn toàn chịu trách nhiệm trước Hội đồng, cũng như kết quả luận văn của mình. Thái Nguyên, ngày 13 tháng 4 năm 2015 Học viên Lê Thị Ngọc Tú Số hóa bởi Trung tâm Học liệu – ĐHTN LỜI CẢM ƠN Để hoàn thành được luận văn này em xin chân thành xảm ơn thầy giáo TS.Vũ Đức Thái đã hướng dẫn tận tình và tạo mọi điều kiện cho em hoàn thành luận văn. Em xin chân thành cảm ơn ban lãnh đạo các thầy giáo, cô giáo, các cán bộ nhân viên Trường Đại học Công nghệ thông tin và Truyền thông – ĐH Thái Nguyên đã giúp đỡ, tạo điều kiện cho em hoàn thành bản luận văn này. Cuối cùng, em xin chân thành cảm ơn sự quan tâm giúp đỡ của gia đình, bạn bè và tập thể lớp Cao học K12G đã cổ vũ động viên em hoàn thành tốt luận văn của mình. Thái nguyên, ngày 13 tháng 4 năm 2015 Học viên Lê Thị Ngọc Tú Số hóa bởi Trung tâm Học liệu – ĐHTN DANH MỤC CÁC CHỮ VIẾT TẮT - CNN (Cellular Neural Network): Công nghệ mạng nơron tế bào. - CPU (Central Processing Unit): Bộ xử lí trung tâm. - A(Digital)/A(Analog):Tín hiệu số/Tín hiệu tương tự - IC (Integrated Circuit): Các vi mạch tích hợp - CNN-UM (CNN-Universal Machine): Máy tính mạng nơron tế bào. - PDE (Partial differential Equation): Phương trình vi phân đạo hàm riêng (trong luận văn dùng thuật ngữ tiếng Việt là “phương trình đạo hàm riêng”). - FPGA (Field Programmable Gate Array): Mảng cổng dạng trường lập trình - ADC (Analog Digital Converter): Bộ chuyển đổi tín hiệu tương tự thành tín hiệu số. - GAPU (Global Analogic Program Unit): khối lập trình toàn cục Số hóa bởi Trung tâm Học liệu – ĐHTN DANH MỤC HÌNH VẼ Hình 1.1. Một số kiểu mạng CNN .................................................................... 5 Hình 1.2. Kiến trúc mạng nơron tế bào chuẩn .................................................. 5 Hình 1.3. Mô tả kiến trúc của CNN .................................................................. 9 Hình 1. 4. Cấu trúc máy tính CNN-UM .......................................................... 10 Hình 1.5. Mô tả khái quát các bước lập trình ở các ngôn ngữ khác nhau ...... 12 Hình 1.6. Sáu kiểu hệ số của mẫu A (3x3) cho phép CNN ổn định ............... 14 Hình 1.7. Các bước cơ bản trong một hệ thống xử lý ảnh .............................. 16 Hình 1.8 : Các thành phần chính của hệ thống xử lý ảnh .............................. 18 Hình 1.9. Giao diện Candy .............................................................................. 23 Hình 1.10. Nạp ảnh trong Candy .................................................................... 24 Hình 1.11.Ảnh ban đầu ................................................................................... 24 Hình 1.12. Ảnh sau khi chạy Template EdgeDetect ....................................... 24 Hình 2.1. Tách cây tứ phân ............................................................................. 35 Hình 2.2. Hệ động lực của một tế bào CNN ................................................... 44 Hình 2.3. Mẫu tìm vùng và hiệu quả của mẫu ................................................ 45 Hình 2.4. Mẫu tìm đường xiên và hiệu quả của mẫu ...................................... 46 Hình 2.5. Sơ đồ các bước thiết kế mẫu theo phương pháp trực tiếp ............... 48 Hình 2.6. Quy trình tìm mẫu bằng phương pháp học ..................................... 49 Hình 2.7. Sơ đồ cơ bản của thuật toán ............................................................ 50 Hình 3.1: mặt nạ xác định điểm ...................................................................... 52 Hình 3.2: Mặt nạ phát hiện dòng ..................................................................... 53 Hình 3.3. Minh họa việc phát hiện dòng ......................................................... 54 Hình 3.4. Biểu đồ mức xám của đường ngang ............................................... 55 Hình 3.5. Biểu đồ mức xám của đường nghiêng thông qua ảnh ..................... 56 Hình 3.6. Mặt nạ phát hiện cạnh và 8 hướng cạnh ......................................... 58 Hình 3.7. Ví dụ về tăng trưởng miền ảnh ....................................................... 59 Hình 3.8. Lược đồ mức xám ........................................................................... 61 Số hóa bởi Trung tâm Học liệu – ĐHTN Hình 3. 9. Tách cây tứ phân ............................................................................ 61 Hình 3.10 Thử nghiệm mẫu phân đoạn ảnh .................................................. 65 Số hóa bởi Trung tâm Học liệu – ĐHTN MỤC LỤC Chương I: CÁC LÝ THUYẾT BỔ TRỢ .......................................................... 3 1.1. Mạng nơron tế bào ..................................................................................... 3 1.1.1. Kiến trúc mạng nơron tế bào CNN ......................................................... 3 1.1.1.1. Giới thiệu chung về mạng nơron tế bào ............................................... 3 1.1.1.2.Kiến trúc mạng Nơron tế bào ................................................................ 4 1.1.1.3.Kiến trúc của máy tính mạng Nơron tế bào ........................................ 10 1.1.1.4. Một số vấn đề cơ bản của CNN ......................................................... 13 1.2. Xử lý ảnh .................................................................................................. 15 1.2.1. Giới thiệu chung về xử lý ảnh ............................................................... 15 1.3. Ngôn ngữ Matlab ..................................................................................... 18 1.3.1. Giới thiệu chung về Matlab .................................................................. 18 1.3.2. Ngôn ngữ lập trình Matlab và ứng dụng trong mô phỏng .................... 19 1.3.3. Các công cụ để cài đặt mô phỏng tính toán .......................................... 20 1.3.3.1. Đọc và ghi dữ liệu ảnh ....................................................................... 20 1.3.3.2. Lớp lưu trữ của file matlab ................................................................ 21 1.3.3.3. Truy vấn một file đồ hoạ .................................................................... 21 1.3.3.4. Hiển thị ảnh ....................................................................................... 22 1.4. Phần mềm mô phỏng CANDY ................................................................ 22 Chương II: BÀI TOÁN PHÂN ĐOẠN ẢNH ................................................. 25 2.1. Giới thiệu chung về phân đoạn ảnh.......................................................... 25 2.2. Các hướng tiếp cận phân đoạn ảnh .......................................................... 27 2.2.1. Các phương pháp dựa trên không gian đặc trưng ................................. 27 2.2.2. Các phương pháp dựa trên không gian ảnh .......................................... 28 2.2.3. Các phương pháp dựa trên mô hình vật lý ............................................ 29 2.3. Một số phương pháp phân đoạn ảnh ........................................................ 29 2.3.1. Phương pháp phân đoạn dựa vào ngưỡng cố định ............................... 29 Số hóa bởi Trung tâm Học liệu – ĐHTN 2.3.2. Phương pháp phân đoạn dựa vào miền đồng nhất ................................ 32 2.3.2.1. Giới thiệu chung ................................................................................. 32 2.3.2.2. Phương pháp tách cây tứ phân ........................................................... 33 2.3.2.3. Phương pháp tổng hợp ....................................................................... 35 2.4. Giải pháp phân đoạn ảnh bằng công nghệ CNN ...................................... 37 2.4.1. Xử lý ảnh dùng PDE ............................................................................. 37 2.4.2. Công nghệ xử lý ảnh nhanh trên mạng CNN ........................................ 38 2.4.2.1. Tính ưu việt và ý nghĩa ..................................................................... 39 2.4.2.2. Tình hình nghiên cứu về xử lý ảnh dùng CNN trong nuớc ............... 40 2.4.2.3. Kết quả xử lý ảnh dùng CNN ............................................................. 41 2.4.2.4. Hạn chế và giải pháp ứng dụng CNN ................................................ 42 2.4.3. Mẫu và vai trò của mẫu ......................................................................... 43 2.4.3.1. Giới thiệu chung ................................................................................. 43 2.4.3.2. Thư viện mẫu CNN ........................................................................... 45 2.4.3.3. Các phương pháp thiết kế mẫu cho CNN .......................................... 47 2.5. Thuật toán phân đoạn ảnh trên CNN ....................................................... 49 2.6. Kết luận .................................................................................................... 51 Chương III: MÔ PHỎNG THUẬT TOÁN PHÂN ĐOẠN ẢNH ................. 52 3.1. Mô tả bài toán mô phỏng ......................................................................... 52 3.1.1. Phát hiện biên ........................................................................................ 52 3.1.1.1. Phát hiện điểm .................................................................................... 52 3.1.1.2. Phát hiện dòng .................................................................................... 53 3.1.1.3. Phát hiện cạnh .................................................................................... 55 3.1.1.4. Phát hiện biên Candy ......................................................................... 56 3.1.2. Bài toán phân đoạn ảnh ......................................................................... 58 3.1.2.1. Công thức cơ sở ................................................................................. 58 3.1.2.2. Tăng trưởng miền ảnh ........................................................................ 59 Số hóa bởi Trung tâm Học liệu – ĐHTN 3.1.2.3. Tách và ghép miền ............................................................................. 61 3.2. Cài đặt mô phỏng ..................................................................................... 62 3.2.1. Ví dụ: Đoạn mã lệnh ............................................................................. 62 3.2.2. Mô phỏng 1: .......................................................................................... 65 3.2.3. Mô phỏng 2 ........................................................................................... 66 3.3.3. Đánh giá kết quả mô phỏng .................................................................. 67 KẾT LUẬN ..................................................................................................... 68 TÀI LIỆU THAM KHẢO ............................................................................... 69 Số hóa bởi Trung tâm Học liệu – ĐHTN 1 MỞ ĐẦU Trong xã hội loài người ngôn ngữ là một phương tiện trao đổi thông tin phổ biến trong quá trình giao tiếp. Bên cạnh đó hình ảnh cũng là một cách trao đổi thông tin mang tính chính xác, biểu cảm khá cao và đặc biệt bị cảm giác chủ quan của đối tượng chi phối. Thông tin trên hình ảnh rất phong phú, đa dạng và có thể xử lý bằng máy tính. Chính vì vậy, trong những năm gần đây sự kết hợp giữa ảnh và đồ họa đã trở nên rất chặt chẽ trong lĩnh vực xử lý thông tin. Cũng như xử lý dữ liệu hình ảnh bằng đồ họa, việc xử lý ảnh số là một lĩnh vực của tin học ứng dụng. Xử lý ảnh số thao tác trên các ảnh tự nhiên thông qua các phương pháp và kỹ thuật mã hóa. Phân đoạn ảnh là bước then chốt trong xử lý ảnh, giai đoạn này nhằm phân tích ảnh thành các phần có cùng tính chất nào đó dựa theo biên hay các vùng liên thông. Mục đích của phân đoạn ảnh là có thể miêu tả tổng hợp từ nhiều phần tử khác nhau cấu tạo nên ảnh thô. Vì lượng thông tin chứa trong ảnh rất lớn, trong khi đó đa số các ứng dụng chỉ cần trích chọn một vài đặc trưng nào đó, do vậy cần có một quá trình để giảm lượng thông tin khổng lồ ấy. Quá trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu. Tuy nhiên các phương pháp xử lý ảnh truyền thống lại đòi hỏi nhiều thời gian xử lý nhất là với những ảnh có kích thước lớn. Để đáp ứng yêu cầu đó người ta đã và đang tìm kiếm nhiều phương pháp xử lý ảnh song song khác nhau nhằm giảm thời gian xử lý. Mạng nơron tế bào CNN là một trong những công cụ xử lý ảnh thời gian thực sự hữu hiệu và đang được quan tâm nghiên cứu rộng rãi trên thế giới do có nhiều ưu điểm trong đó có bản chất xử lý song song. Ảnh số là một mảng số thực hai chiều kích thước MxN trong đó mỗi phần tử ảnh là một tế bào C(i,j), i = 1, 2,..., M, j = 1, 2,..., N, biểu thị mức xám của ảnh tại các vị trí (i,j) tương ứng. Ảnh được coi là ảnh nhị phân nếu C(i,j) Số hóa bởi Trung tâm Học liệu – ĐHTN 2 chỉ nhận giá trị 0 hoặc 1. Các đặc trưng của ảnh thường bao gồm các thành phần như: mật độ xám, phân bố xác suất, phân bố không gian, biên ảnh. Được sự gợi ý của giáo viên hướng dẫn và nhận thấy tính thiết thực của vấn đề này, tôi đã chọn đề tài: “Nghiên cứu ứng dụng công nghệ mạng Nơron tế bào vào bài toán phân đoạn ảnh” để làm đề tài cho luận văn tốt nghiệp của mình Số hóa bởi Trung tâm Học liệu – ĐHTN 3 Chƣơng I CÁC LÝ THUYẾT BỔ TRỢ 1.1. Mạng nơron tế bào 1.1.1. Kiến trúc mạng nơron tế bào CNN 1.1.1.1. Giới thiệu chung về mạng nơron tế bào Công nghệ mạng nơron tế bào CNN (Cellular Neural Networks) đã được các nhà khoa học Mỹ và Hungary phát minh ra vào năm 1988 có tốc độ xử lý 1012 phép tính/giây và được áp dụng cho các hệ thống xử lý ảnh nhanh 10 - 50000 ảnh/giây. Đây là bước đột phá về chất do cấu trúc của máy tính xử lý CNN là song song với hàng trục ngàn CPU được kết nối thành mạng trong một chip. Công nghệ này cho phép giải quyết nhiều bài toán xử lý phức tạp trong thời gian thực hiện mà các máy tính thông thường chưa làm được.[2] Sự ra đời của mạng nơron tế bào CNN đã mở ra một thời đại mới cho sự phát triển của khoa học tính toán tiếp cận đến các phương thức xử lý. Ta biết rằng các máy tính số hiện nay về cơ bản là loại máy logic với các dữ liệu rời rạc được mã hóa theo hệ nhị phân. Tính chất cơ bản của nó là khả năng thực hiện thuật toán theo chương trình được lưu trong bộ nhớ. Ðây là loại máy tính vạn năng xử lý trên các số nguyên hay còn gọi là máy Turing. Các phép tính cơ bản của nó là các phép số học và logic. Thuật toán là các chuỗi logic của các phép tính cơ bản này. Sự ra đời của bóng bán dẫn năm 1948 và của các vi mạch tích hợp IC năm 1960 đã tạo ra các máy tính số có tính thực tiễn cao với giá thành rẻ và hiện nay đã trở thành một loại hàng hóa thông dụng. Sự hoàn thiện chíp CNN đặc trưng bởi kích thước và chức năng một vài loại có mẫu cố định là 256 tế bào, một số loại khác có kích thước giới hạn là 30 tế bào. Hiện nay có loại chíp có thể lập trình có kích thước 1024 tế bào. Khả năng lập trình được và tốc độ cao làm cho CNN phù hợp tốt hơn với các xử lý phi tuyến, nó cho phép nhận được và xử lý tín hiệu phi tuyến. Tuy vậy Số hóa bởi Trung tâm Học liệu – ĐHTN 4 những ưu thế thực sự của CNN là nó tương đương với chíp có mật độ tích hợp lớn tiêu thụ nhiều năng lượng. Một ứng dụng quan trọng của mạng nơron tế bào là xử lý ảnh. Chức năng cơ bản của mạng nơron tế bào trong quá trình xử lý ảnh là ánh xạ hoặc chuyển hình ảnh đầu vào tương ứng với hình ảnh đầu ra.[3]. Ngoài ứng dụng xử lý ảnh tốc độ cao ra công nghệ CNN còn được dùng để tối ưu hoá hệ thống truyền dữ liệu băng thông rộng, giải phương trình vi phân đạo hàm hàm riêng PDE. Ngược lại, với cấu trúc xử lý song song hoàn toàn, liên tục theo luồng theo thời gian, với việc cho phép triển khai nhiều mô hình toán học trong cả trường số thực và số phức người ta có thể xây dựng các mô hình CNN một lớp hoặc nhiều lớp trên phần cứng. 1.1.1.2.Kiến trúc mạng Nơron tế bào - Có hai định nghĩa tổng quát của một CNN như sau: + Ðịnh nghĩa 1: Một mạng nơron tế bào CNN là một mảng 2, 3 hoặc n chiều của các hệ thống động lực học được gọi là các tế bào, hầu hết các hệ này là đồng nhất và thoả mãn hai thuộc tính:  Ảnh hưởng phổ biến là cục bộ trong phạm vi bán kính r.  Tất cả các biến trạng thái là giá trị tín hiệu liên tục. + Ðịnh nghĩa 2: Một mạng nơron tế bào CNN là một mạch điện phi tuyến động lực học bậc cao được tạo nên bởi ghép nối liên kết cục bộ theo không gian các khối mạch điện giống nhau - mỗi khối mạch điện được gọi là một tế bào. Mạng được tạo thành có thể có kiến trúc bất kỳ như dạng lưới hình chữ nhật, 6 cạnh, 3 cạnh, hình cầu,... Số hóa bởi Trung tâm Học liệu – ĐHTN 5 Hình 1.1. Một số kiểu mạng CNN - Công nghệ CNN gồm tập các chíp (tế bào) có liên kết cục bộ với nhau tạo thành lưới với nhiều hình trạng khác nhau. Để đơn giản, ta xét kiến trúc chuẩn của CNN là một mảng hình chữ nhật kích thước MxN tế bào, mỗi tế bào ký hiệu là C(i,j), ứng với tọa độ (i,j) trong không gian Đề - Các hai chiều. Chỉ số i, j thỏa mãn điều kiện i=1...M; j=1...N . Hình 1.2. Kiến trúc mạng nơron tế bào chuẩn Trong đó, mỗi ô vuông biểu diễn cho một tế bào C(i,j) có liên kết trực tiếp về tín hiệu điện với các tế bào láng giềng. [1]. - CNN là mạch điện phi tuyến động có kích thước lớn, được tạo bởi cặp các tế bào liên kết với nhau, phân bố đều không gian. Mạch này có cấu trúc hình chữ nhật, lục giác đều, hình cầu,... với những đặc trưng: + Luật tiếp hợp trong CNN biểu diễn sự tương tác từng cặp của tế bào C(i,j) với các tế bào láng giềng C(k,1) của nó. + Mỗi tế bào có điều kiện biên và điều kiện ban đầu. Số hóa bởi Trung tâm Học liệu – ĐHTN 6 - Hệ CNN là ma trận n chiều của những phần tử động giống hệt nhau, mỗi phần tử là một mạch tích hợp gọi là tế bào, mỗi tế bào có hai thuộc tính: + Chỉ tương tác với các tế bào lân cận trong phạm vi bán kính là r (r là số nguyên dương) + Giá trị trạng thái của tế bào là những tín hiệu có giá trị liên tục. - Các phương trình quan trong mô tả cho hệ CNN là: + Phương trình trạng thái: xij  x ij  Aijkly(,;,)(,;,)kl  Bijkluz kl  ij (1.1) CklSij(,)(,)(,)(,)rr CklSij xij R, y ij R và zij  R được gọi là trạng thái: đầu ra, đầu vào, ngưỡng của tế bào C(i,j), A(i, j; k, l) và B(i, j; k, l) được gọi là toán tử phản hồi và toán tử dẫn nhập đầu vào. + Phương trình đầu vào Vuij=Eij với 1 ≤ i ≤ M; 1≤ j ≤ N (1.2) Giá trị Vuij tương ứng với giá trị ban đầu của phương trình vi phân khi áp dụng CNN để giải phương trình vi phân hoặc ảnh đầu vào đối với bài toán xử lý ảnh. + Phương trình đầu ra 11 y f( x )  x  1  x  1 (1.3) ij ij22 ij ij + Phương trình mô tả các ràng buộc │vxij(O) │≤ 1 với 1≤ i≤ M; 1 ≤ j≤ N (1.4) │vxij │≤ 1 với 1≤ i≤ M; 1 ≤ j≤ N (1.5) + Phương trình tham số giả định A(i,j;k,l) = A(k,l;i,j) với 1≤ i≤ M; 1 ≤ j≤ N (1.6) + Điều kiện biên xác định và là các tế bào thuộc hiệu ứng cầu của các tế bào cạnh nhưng nằm ngoài mảng kích thước MxN Số hóa bởi Trung tâm Học liệu – ĐHTN 7 - Đối với ứng dụng CNN trong xử lý ảnh, đầu vào thường là cường độ điểm ảnh, thang độ xám kích thước MxN, -1 <ukl < +1 khi đó mức “trắng” được mã hóa là -1 và “đen” được mã hóa là +1. - Đối với ảnh tĩnh, ukl là hằng số, đối với ảnh động (video) ukl là một hàm theo thời gian. A(i,j;k,l), B(i,j;k,l) và zij thay đổi theo vị trí (i,j) và thời gian t. Một số trường hợp khác có thể coi A(i,j; k,l), B(i,j; k,l) và zij không đổi theo không gian và thời gian. Mạng CNN bất biến không gian và đẳng hướng nếu các toán tử A(i,j;k,l), B(i,j;k,l) và toán tử ngưỡng zij không đổi theo không gian. Trong trường hợp này ta có CNN chuẩn (với toán tử dẫn nạp tuyến tính) có phương trình trạng thái như sau: Aijkly(,;,)(,)kl   Aikjly   kl CklSij(,)(,) kirljr     r Bijklu(,;,)(,)kl   Bikjlu   kl CklSij(,)(,)r kirljr     Phần lớn các ứng dụng của CNN chỉ sử dụng CNN chuẩn bất biến không gian lân cận 3 x 3 (r = 1). Các cell C i, j Sr  i, j với các mẫu: C(i-1,j-1) C(i-1,j) C(i-1,j+1) C(i,j-1) C(i,j) C(i,j+1) C(ij-1) C(i+1,j) C(i+1,j+1) + Toán tử dẫn nạp hồi tiếp A(i,j;k,l), trong không gian bất biến có thể viết như sau: Công thức tính mẫu Aijkly(,;,)(,)kl   Aikjly   kl CklSij(,)(,)r kirljr     Bijklu(,;,)(,)kl   Bikjlu   kl CklSij(,)(,)r kirljr     zzij  ; (1.7) Số hóa bởi Trung tâm Học liệu – ĐHTN 8 Phép toán nhân chập Aijkly(,;,)(,)kl   Aikjly   kl CklSij(,)(,)r kirljr     a1,1 yi 1,1 j  a  1,0 y i 1, j  a  1,1 y i 1,1 j  a 0,1  y i ,1 j  a 0,0 y i , j  a0,1 yi , j 1 a 1,  1 y i  1, j  1  a 1,0 y i  1, j  a 1,1 y i  1, j  1 11  ayk,, l i k j l (1.8) kl11  hoặc có thể minh hoạ phép toán nhân chập như sau: a1,  1 a  1,0 a  1,1   y  1,  1 y  1,0 y  1,1       a0,1 a 0,0 a 0,1 *  y 0,1 y 0,0 y 0,1  A * Yij (1.9)     a1, 1 a 1,0 a 1,1   y 1, 1 y 1,0 y 1,1  - Ma trận A kích thước 3 x 3 được gọi là mẫu vô hướng hồi tiếp và ký tự bao hàm tổng của các tích điểm, nên được gọi là tích điểm mẫu, toán tử này được gọi là toán tử “xoắn không gian”. Ma trận 3 x 3, Yij thu được bởi việc di chuyển một mặt nạ mờ với kích thước cửa sổ 3x3 đến vị trí (i,j) của ma trận MxN đầu ra ảnh Y do vậy được gọi là ảnh đầu ra tại C(i,j). - Một phần tử akl là phần tử trung tâm, trọng số hoặc hệ số của mẫu hồi tiếp A, nếu và chỉ nếu (k,l) = (0,0). Để thuận tiện phân tích mẫu A như sau, khi đó A0 và A lần lượt được gọi là các thành phần mẫu trung tâm và đường biên.  AAA  0 0 0 0 a-1,-1 a-1,0 a-1,1  A  0 a0,0 0 A  a0,-1 0 a0,1 (1.10) 0 0 0 a1,-1 a1,0 a1,1 + Vai trò toán tử dẫn nhập đầu vào B(i,j;k,l) Số hóa bởi Trung tâm Học liệu – ĐHTN 9 11 Bijkly(,;,)(,)kl   Bikjlu   kl    bu k,, l i k j l (1.11) CklSij(,)(,)r kirljr     kirljr     b1,  1 b  1,0 b  1,1 ui  1, j  1 u i  1, j u i  1, j  1   b0,1 b 0,0 b 0,1** ui ,1 j  u i , j u i ,1 j  B U ij (1.12)  b1, 1 b 1,0 b 1,1 ui  1, j  1 u i  1, j u i  1, j  1 Ma trận B kích thước 3 x 3 được gọi là mẫu dẫn nhập hoặc mẫu vô hướng đầu vào, và Uij là mặt nạ biên dịch ảnh đầu vào, tương tự ta có thể viết Bo và B gọi là mẫu dẫn nhập trung tâm và đường biên.  BBB  0 0 0 0 b-1,-1 b-1,0 b-1,1  B  0 b0,0 0 B  b0,-1 0 b0,1 (1.13) 0 0 0 b1,-1 b1,0 b1,1 - Kiến trúc xử lý của máy tính mạng nơron tế bào CNN-UM Cấu trúc xử lý của tế bào C(i,j) Hình 1.3. Mô tả kiến trúc của CNN Mạng nơron tế bào được L.O. Chua và L. Yang đưa ra năm 1988 có kiến trúc chuẩn là một mảng hai chiều các tế bào mà mỗi tế bào là một chip xử lý, các tế bào chỉ có liên kết cục bộ với các tế bào láng giềng. Các tế bào có cấu tạo giống hệt nhau gồm các điện trở, tụ tuyến tính; các nguồn dòng tuyến tính và phi tuyến. Cho đến nay kiến trúc mạng CNN đã được phát triển đa dạng phức tạp trong nhiều ứng dụng khác nhau nhưng vẫn hoạt động dựa trên nguyên tắc mà Chua và Yang đưa ra. [7]. Số hóa bởi Trung tâm Học liệu – ĐHTN 10 1.1.1.3.Kiến trúc của máy tính mạng Nơron tế bào - Cấu trúc phần cứng Máy tính vạn năng CNN-UM có thể được coi là mảng các tế bào xử lý phi tuyến đa chiều được liên kết cục bộ. CNN-UM có khả năng xử lý tín hiệu hỗn hợp tương tự số do vậy có tên Analogic (Analog-logic) computer. Khác với các máy tính lai, ở máy tính CNN không có các bộ biến đổi A/D và D/A và cũng không có khái niệm biểu diễn các giá trị tương tự bằng số. Tất cả tín hiệu và máy tính cơ bản đều là tương tự và logic. Cấu trúc của máy CNN-UM được mô tả trong hình 1.4. Mạng nơron tế bào gồm các tế bào có cấu trúc đồng nhất. Lõi của các tế bào này thực hiện chức năng của hệ động lực chuẩn tế bào CNN như mô tả. Để mạng có thể hoạt động và có khả năng lập trình thay đổi các trọng liên kết, ở mỗi tế bào đều có bộ nhớ, các thanh ghi, các khối vào ra và truyền thông cục bộ. Ngoài ra toàn mạng còn có khối lập trình toàn cục GAPU phục vụ cho điều hành toàn mạng. Hình 1. 4. Cấu trúc máy tính CNN-UM Khối OPT (Optical Sensor) ở mỗi tế bào làm chức năng thu nhận tín hiệu (điểm ảnh) đầu vào trực tiếp cho tế bào mà không cần bộ chuyển đổi A/D. Bộ nhớ cục bộ Analog (LAM) và logic (LLM) lưu giữ các giá trị analog Số hóa bởi Trung tâm Học liệu – ĐHTN 11 và logic của tế bào. Khối xử lý logic cục bộ (LLU) và khối logic đầu ra tương tự cục bộ (LAOU) thực hiện các phép tính toán logic và tương tự cho mỗi tế bào của mình. Các kết quả của mỗi tế bào được lưu giữ trong các bộ nhớ cục bộ. Khối điều khiển và truyền thông cục bộ (LCCU) thực hiện chức năng điều khiển và trao đổi thông tin giữa các tế bào lân cận và tới khối lập trình toàn cục (GAPU). Khối lập trình tương tự - số toàn cục GAPU có các thanh ghi và khối điều khiển toàn cục. Thanh ghi chương trình analog APR lưu trữ các trọng số của tế bào mạng CNN. Trong trường hợp r = 1 tổng số trọng lưu trữ là 19 số thực. Thanh ghi chương trình logic LPR chứa các lệnh logic cần thực hiện cho các tế bào. Thanh ghi cấu hình chuyển mạch (SRC) chứa các thông số khởi động và các tham số cho các chức năng hoạt động của tế bào. Khối điều khiển tương tự số toàn cục (GACU) lưu các lệnh tuần tự của chương trình chính (analogic) và thực hiện các chức năng điều khiển toàn cục khác. Một thuật toán chạy trong CNN-UM có thể được thực hiện tuần tự qua các lệnh analog và logic. Mức độ kết quả trung gian có thể được tổ hợp và lưu trữ cục bộ. Các phép tính analog (analog operation ) được định nghĩa bởi các trọng liên kết tuyến tính hoặc phi tuyến. Đầu ra có thể được định nghĩa cả trong trạng thái xác định hoặc không xác định của mạng. Các phép tính logic (NOT, AND, OR,) và số học (cộng, trừ) có thể được thực hiện trong mỗi tế bào. Dữ liệu có thể được chuyển đổi giữa các bộ nhớ cục bộ LAM và LLM. - Ngôn ngữ, chương trình dịch, hệ điều hành của CNN-UM Số hóa bởi Trung tâm Học liệu – ĐHTN 12 Hình 1.5. Mô tả khái quát các bước lập trình ở các ngôn ngữ khác nhau cho máy tính CNN-UM Cũng như các máy tính điện tử khác CNN-UM có các ngôn ngữ để lập trình từ mức thấp đến cao. Ở mức thấp nhất là mã máy, tiếp đến là ngôn ngữ assemly của CNN được gọi là AMC (Analogic Macro Code). Mã AMC được dịch thành mã máy và các tín hiệu điện cho chip CNN hoạt động. Ở mức cao có ngôn ngữ a mô tả các chu trình xử lý, mẫu trọng số, các chương trình con. Chương trình dịch a sẽ chuyển các lệnh ngôn ngữ a sang dạng hợp ngữ AMC để chạy trên máy CNN. AMC có thể cho chạy trên phần cứng có chip CNN. Hệ điều hành COS (CNN Operating System) được cài đặt trên các máy CNN- UM phục vụ cho chạy các chương trình AMC cũng như giao tiếp với các hệ Số hóa bởi Trung tâm Học liệu – ĐHTN 13 thống kết nối bên ngoài. Để phục vụ nghiên cứu và đào tạo ta có thể cho chạy chương trình AMC trong môi trường mô phỏng số CNN-UM hoặc mô phỏng mềm trên máy PC Pentium với hệ điều hành Windows hoặc Unix. - Hệ điều hành CNN và giao diện vật lý CNN chuẩn. Hệ điều khiển trên PC có thể tích hợp trên mainboard của máy PC gọi là PCS (CNN Prototyping System Board). - Nền tảng kết cấu vật lý cho CNN-UM: Cũng như máy tính PC, mỗi xử lý đều được xây dựng nên từ các câu lệnh, có thể đóng gói thành các hàm thư viện. CNN UM cũng cung cấp cho người dùng một tập thư viện các mẫu và ngày càng được bổ sung thêm.[2] 1.1.1.4. Một số vấn đề cơ bản của CNN - Giới hạn động lực học của CNN Trước khi thiết kế một CNN vật lý cần phải biết rằng giới hạn động lực học của nó có thoả mãn điều kiện để xây dựng các tế bào bằng các phần tử bán dẫn hiện đang sử dụng trong lĩnh vực điện tử hay không. Ðây cũng là sự khác nhau cơ bản giữa các CNN và các mạng nơron thông thường vì một CNN có phạm vi động lực học thực sự có thể tính toán được. - Ðộ ổn định của CNN. Với một CNN xác định (A,B,z xác định), điều kiện khởi tạo, tín hiệu vào bất kỳ thì sau quá trình quá độ phân rã về không trạng thái của mạch điện sẽ hội tụ như thế nào và trong những điều kiện nào? Trả lời các câu hỏi này vấn đề độ ổn định của CNN một lớp đơn chuẩn là: + Sau thời gian quá độ phân rã về 0 luôn thu được một hằng số tín hiệu ở đầu ra của CNN. + Một CNN tuyến tính tiêu chuẩn một lớp luôn có các trạng thái cân bằng ổn định. Số hóa bởi Trung tâm Học liệu – ĐHTN 14 Trong một số trường hợp có thể sử dụng định lý về đối xứng dấu của LO.Chua [8] để khảo sát nhanh chóng tính ổn định của CNN. Tuy nhiên có những CNN không thoả mãn định lý đối xứng dấu này thì cũng không có nghĩa là chúng không ổn định. - Ðịnh nghĩa Mẫu đối xứng dấu [5] Sáu kiểu giá trị của các hệ số trong ma trận mẫu A với mẫu 3x3 đã được chứng minh là cho CNN ổn định [8] Hình 1.6. Sáu kiểu hệ số của mẫu A (3x3) cho phép CNN ổn định Trong đó: - 0: ký hiệu giá trị hệ số mẫu A bằng 0. - : ký hiệu giá trị hệ số mẫu A dương hoặc bằng 0. Số hóa bởi Trung tâm Học liệu – ĐHTN 15 - : ký hiệu giá trị hệ số mẫu A âm hoặc bằng 0. - 5: là một giá trị giả định. 1.2. Xử lý ảnh 1.2.1. Giới thiệu chung về xử ...lý ảnh dùng PDE có nhiều đặc tính tốt do: - Tính chất cục bộ tự nhiên của PDE phù hợp với rất nhiều các đặc điểm cục bộ của ảnh. Do vậy biểu diễn quá trình biến đổi ảnh qua PDE là rất thích hợp. - Ðã sẵn có nền tảng lý thuyết toán học về PDE chặt chẽ và phong phú bao gồm sự hội tụ, tính ổn định, lời giải duy nhất - Ðã có nhiều dạng sơ đồ rời rạc hoá cho thực hiện các thuật toán PDE. - Thuật toán được mô tả ngắn gọn không dài dòng phức tạp và dễ hiểu. - Dễ dàng khái quát hoá mở rộng chiều một cách đơn giản bằng cách sử dụng các toán tử Laplace, divergence và gradient. - Có thể quan sát được quá trình biến đổi thời gian thực của ảnh nếu sử dụng công cụ CNN. Các PDE được sử dụng để xử lý ảnh thường ở hai lớp: PDE khuếch tán tuyến tính (hệ số khuếch tán hằng số, đẳng hướng) và PDE khuếch tán phi tuyến (hệ số khuếch tán phi tuyến và không đẳng hướng). Số hóa bởi Trung tâm Học liệu – ĐHTN 38 Cũng như với tất cả các tác vụ xử lý ảnh khác trên máy tính hệ lệnh tuần tự xử lý ảnh dùng PDE gặp phải một vấn đề đó là tổng số lượng các phép tính toán, xử lý rất lớn, điều này làm cho mong muốn xử lý ảnh thời gian thực trong đa số các trường hợp yêu cầu là không thực hiện được. Tuy nhiên với các mô hình CNN 1 lớp, nhiều lớp được thiết kế với các bộ mẫu thích hợp việc giải các PDE này theo phương pháp sai phân sẽ chỉ tốn những khoảng thời gian vài phần triệu giây, không phụ thuộc vào kích thước lưới sai phân, cho phép thực hiện được các xử lý ảnh dùng PDE với thời gian thực. Tuy nhiên các kết quả nghiên cứu về xử lý ảnh dùng PDE trên CNN mới chỉ rất ít ỏi; đây là một thực tế khách quan bởi lực lượng nghiên cứu về CNN chưa phải là rất đông đảo trong khi các công việc và hướng nghiên cứu thì rất rộng: - Đã có các mô hình CNN tìm biên dùng PDE. Đã có các nghiên cứu về giảm nhiễu dùng PDE trên CNN với các phương trình tuyến tính các hệ số, thành phần của PDE là số thực. - Tuy nhiên các mô hình CNN thực hiện các PDE khuếch tán sử dụng cho xử lý ảnh mới được quan tâm đến các mô hình CNN một lớp đơn. Các thành phần và hệ số của các CNN thực hiện PDE này chỉ là số thực. Các mô hình CNN nhiều lớp thực hiện PDE với các thành phần phi tuyến và phức áp dụng cho xử lý ảnh chưa được quan tâm nghiên cứu. - Nhiều công việc xử lý ảnh cơ bản hữu dụng như các bộ lọc shock, lọc nhiễu đốm chưa được quan tâm xử lý trên CNN - Cuối cùng là các mô hình, các thuật toán xử lý ảnh trên CNN (cũng như các mô hình CNN cho các nhiệm vụ khác như giải PDE, quan sát đa mục tiêu, ) cần phải được nghiên cứu tích hợp tạo ra bởi phần cứng để có các sản phẩm nổi trội, sắc bén. 2.4.2. Công nghệ xử lý ảnh nhanh trên mạng CNN Số hóa bởi Trung tâm Học liệu – ĐHTN 39 2.4.2.1. Tính ƣu việt và ý nghĩa - Tính ƣu việt Xử lý thông tin ảnh là một công việc khó khăn do tính bất định, đa dạng của ảnh, do lượng thông tin cần xử lý vô cùng lớn. Xử lý ảnh dùng CNN đã giải quyết được sự xung đột về lượng thông tin đồ sộ cần xử lý và tốc độ thực hiện. Vấn đề xử lý ảnh thời gian thực, xử lý ảnh trong những khoảng thời gian vài phần nghìn giây, xử lý ảnh từ nhiều nguồn thu khác nhau đã trở thành hiện thực. Do tính chất động học liên tục về thời gian nên luồng ảnh được xử lý (thực chất là luồng tín hiệu điện), trạng thái biến đổi của ảnh có thể quan sát được liên tục, đây là thuộc tính không thể có được khi xử lý trên máy tính tuần tự. - Ý nghĩa khoa học: Việc ứng dụng CNN cho các yêu cầu tính toán và xử lý nhanh đã cung cấp cho xã hội con người một công cụ mạnh, sắc bén có tiềm năng lớn trong các hoạt động khoa học, công nghệ, quân sự và dân dụng. Việc nghiên cứu về CNN giúp cho việc thúc đẩy nghiên cứu tiếp cận các hoạt động sống của động vật: các cơ chế thu nhận và xử lý âm thanh, hình ảnh, áp suất, ... của tai, mắt, da,... của động vật có thể giống như mô hình các hệ thu và xử lý tín hiệu CNN. - Ý nghĩa thực tiễn Một điều rất lý thú và cũng là đặc điểm nổi bật của mạng nơron tế bào CNN là do tính đơn giản về kết cấu và chúng có giới hạn động lực học xác định nên việc thực hiện trên phần cứng tương đối đơn giản hơn so với việc cứng hoá các chip xử lý tuần tự. Các hệ thống xử lý ảnh tốc độ cao dùng CNN có thể được cứng hoá trên các mảng FPGA, tích hợp trong các hệ nhúng sẽ là những sản phẩm phổ biến trong thời kỳ hậu PC hiện nay. Ở mức cao hơn nữa người ta tìm cách cứng hoá các thuật toán CNN. Khi đó các thuật toán sẽ Số hóa bởi Trung tâm Học liệu – ĐHTN 40 được thực hiện với thời gian ở gần mức quá độ của mạch điện (thường khoảng vài micro giây) có nghĩa là các thuật toán xử lý phức tạp sẽ chạy ngay trực tiếp trên các mạch điện được thiết kế theo yêu cầu của nhiệm vụ cụ thể. Ðiều này là hoàn toàn cho phép do công nghệ FPGA đang càng ngày càng phát triển và giá thành càng hạ. Ðây cũng là một hướng nghiên cứu mở vô hạn cho những người nghiên cứu về xử lý và tính toán thời gian thực dùng CNN. 2.4.2.2. Tình hình nghiên cứu về xử lý ảnh dùng CNN trong nuớc Từ đầu năm 2005 thông qua chương trình hợp tác khoa học công nghệ quốc tế giữa Việt Nam và Hung-ga-ry công nghệ CNN tại Việt Nam đã được bắt đầu nghiên cứu tại Viện Công nghệ thông tin - Viện Khoa học và Công nghệ Việt Nam. Thông qua đề tài hợp tác các nhà nghiên cứu Việt Nam đã làm chủ được những thành tựu mới nhất về CNN cả về lý thuyết và công nghệ. Từ việc nắm bắt này nhiều nghiên cứu về CNN đã được tiến hành và thu được kết quả tốt. Các thực nghiệm về nhận dạng thuốc viên tốc độ cao trong khi sản xuất, nhận dạng sự phát sinh tia lửa điện bugi, phát hiện mất ốc trên đường ray, phát hiện sự xuất hiện các trạng thái thay đổi đột ngột trong thí nghiệm nổ bóng, nhận dạng vân tay,... dùng CNN đã được thực hiện thành công. Mặc dù mới tham gia vào lĩnh vực này nhưng nhiều đóng góp khoa học nghiên cứu về CNN đã được công nhận trong các hội thảo khoa học quốc tế như thuật toán khôi phục ảnh đối xứng thời gian thực, mô hình CNN 3 lớp giải PDE cho bài toán ô nhiễm, giải PDE bài toán dòng chảy, mô hình CNN 2 lớp phức ứng dụng trong xử lý ảnh, các thuật toán lai giảm nhiễu, phân đoạn ảnh các sơ đồ cứng hoá thuật toán lai, nghiên cứu ứng dụng camera CNN nhận dạng hình ảnh trên robot tự động sử dụng trong công nghiệp...Hiện nay việc nghiên cứu về ứng dụng CNN vẫn được tiếp tục phát triển thông qua các Số hóa bởi Trung tâm Học liệu – ĐHTN 41 đề tài hợp tác quốc tế như Việt Nam-Hung-ga-ry. (chế tạo chip CNN giải PDE dùng công nghệ FPGA),Việt Nam-Hàn Quốc 2010- 2011(sử dụng camera CNN trong điều khiển xe bốc xếp hàng tự động tại kho cảng) mà đơn vị thực hiện trực tiếp của Việt Nam là Viện Công nghệ thông tin-Viện Khoa học và Công nghệ Việt Nam.[5]. 2.4.2.3. Kết quả xử lý ảnh dùng CNN Mạng nơron tế bào CNN cho phép xử lý các mảng tín hiệu tốc độ cao bởi hai yếu tố cơ bản và khó có thể tách rời nhau: - Một bộ xử lý tế bào trong mảng CNN là một mạch điện phi tuyến đơn giản liên kết cục bộ với các bộ xử lý tế bào khác trong bán kính ảnh hưởng trực tiếp có tốc độ xử lý tín hiệu đầu vào là thời gian quá độ của một mạch điện (khoảng vài micro giây). Hàng chục ngàn bộ xử lý tế bào trong một chip CNN xử lý hàng chục ngàn tín hiệu đầu vào khác nhau để cho ra đồng thời ở đầu ra hàng chục ngàn tín hiệu đã được xử lý cũng chỉ cần một lệnh duy nhất là bộ trọng số liên kết giữa các bộ xử lý này. - Các cảm biến thu mảng tín hiệu (ánh sáng, áp suất, âm thanh,...) có thể đưa trực tiếp vào đầu vào của mỗi nơron trong mạng nơron tế bào để xử lý không cần qua các bộ ADC. Như vậy đã bỏ được rất nhiều khâu biến đổi, truyền dẫn trung gian giữa tín hiệu cần xử lý và bộ xử lý. Xử lý ảnh dùng CNN hiện nay đã thực hiện được tất cả các công việc kinh điển mà một chương trình xử lý ảnh thường phải thực hiện: - Tiền xử lý: Loại bỏ các đối tượng nhiễu, tăng cường độ tương phản, tăng cường các thông tin cần quan tâm. - Trích chọn đặc tính. - Rút ra các quyết định. Như đã nói ở phần trên xử lý ảnh dùng PDE là một hướng mới trong xử lý ảnh. Ðã có rất nhiều nghiên cứu về xử lý ảnh dùng PDE trên máy tính hệ Số hóa bởi Trung tâm Học liệu – ĐHTN 42 lệnh tuần tự, nhưng các kết quả nghiên cứu về xử lý ảnh dùng PDE trên CNN mới chỉ rất ít ỏi; đây là một thực tế khách quan bởi lực luợng nghiên cứu về CNN chưa phải là rất đông đảo trong khi các công việc và hướng nghiên cứu thì rất rộng: - Ðã có các mô hình CNN tìm biên dùng PDE. Ðã có các nghiên cứu về giảm nhiễu dùng PDE trên CNN với các phương trình tuyến tính các hệ số, thành phần của PDE là số thực. - Tuy nhiên các mô hình CNN thực hiện các PDE khuếch tán sử dụng cho xử lý ảnh mới được quan tâm đến là các mô hình CNN 1 lớp đơn. Các thành phần và hệ số của các CNN thực hiện PDE này chỉ là số thực. Các mô hình CNN nhiều lớp thực hiện PDE với các thành phần phi tuyến và phức áp dụng cho xử lý ảnh đã chưa được quan tâm nghiên cứu. - Nhiều công việc xử lý ảnh cơ bản, hữu phân đoạn ảnh chưa quan tâm xử lý trên CNN. - Cuối cùng là các mô hình, các thuật toán xử lý ảnh trên CNN (cũng như các mô hình CNN cho các nhiệm vụ khác như giải PDE, quan sát đa mục tiêu,...) cần phải được nghiên cứu tích hợp tạo ra bởi phần cứng để có các sản phẩm nổi trội, sắc bén. - Nếu xử lý trên mạng CNN thì theo lý thuyết tốc độ phân đoạn ảnh nhanh hơn n lần so với CPU có cùng tốc độ xung nhịp (với n=NxM) . 2.4.2.4. Hạn chế và giải pháp ứng dụng CNN - Hạn chế Hạn chế khi sử dụng CNN là do sai số. Cũng như một số phương pháp giải gần đúng PDE, khi giải trên CNN ta có những sai số (không kể sai số do các phép do): + Sai số gây ra do phép làm tròn. + Sai số do sai phân phương trình ban đầu và lấy các giá trị xấp xỉ. Số hóa bởi Trung tâm Học liệu – ĐHTN 43 - Giải pháp Với độ sai số lớn có ba phương pháp: + Phương pháp thứ nhất: Thêm hệ CNN thứ cấp tính cho các đạo hàm bậc cao bổ sung vào kết quả cuối cùng, như vậy ta phải thiết kế lại mẫu dẫn đến có thể phải dùng hệ CNN đa lớp. + Phương pháp thứ hai: Dùng cấu trúc láng giềng r lớn hơn (r=2, 3) với mẫu 5x5, 7x7 để tính cho thành phần đạo hàm bậc cao. Trường hợp này, có thể xây dựng hệ CNN không đồng nhất. + Phương pháp thứ ba: Dùng phương pháp huấn luyện qua thực nghiệm để tìm ta mẫu tối ưu với độ chính xác chấp nhận được. Ðây là phương pháp đã được sử dụng trong một số bài toán. 2.4.3. Mẫu và vai trò của mẫu 2.4.3.1. Giới thiệu chung Các máy tính vạn năng tương tự logic CNN-UM xử lý song song với hàng chục ngàn bộ xử lý đồng thời làm việc bởi một lệnh duy nhất đã được phát minh năm 1993 dựa trên nền tảng công nghệ mạng nơron tế bào CNN .Đây là một bước đột phá về chất trong lĩnh vực công cụ xử lý so với các máy tính số thực hiện hệ lệnh tuần tự. Các tế bào của mạng nơron (các tế bào xử lý) xử lý các mảng tín hiệu analog hoặc các mảng tín hiệu đồng thời cùng một lúc bằng một lệnh duy nhất cho tất cả các tế bào, điều mà các máy tính số không thực hiện được. Do tính chất động học liên tục về thời gian, bố trí không gian đồ sộ các mảng bộ xử lý nên các CNN-UM có thể thực hiện các tác vụ xử lý có yêu cầu ngặt nghèo về không - thời gian trong thời gian thực. Các máy tính vạn năng chế tạo trên nền tảng công nghệ CNN được sử dụng đắc lực trong các lĩnh vực xử lý ảnh, quan sát đa mục tiêu di động, giải phương trình vi phân đạo hàm riêng nhiều biến và nhiều lĩnh vực khác. Số hóa bởi Trung tâm Học liệu – ĐHTN 44 Hình 2.4. Hệ động lực của một tế bào CNN Trạng thái ổn định của mạng CNN sau thời gian quá độ phụ thuộc vào bộ ba ma trận trọng số liên kết (A, B, z) của mạng CNN. A, B được gọi là các toán tử hồi tiếp và các toán tử điều khiển hoặc còn được gọi là các mẫu vô tính (một số tài liệu còn dùng từ tập gien để chỉ các toán tử này). Trong mạng CNN 2D đồng nhất, tuỳ theo bán kính liên kết các láng giềng của một tế bào r = 1, r = 2 hay r = 3 mà A, B sẽ là các ma trận trọng số 3x3, 5x5 hoặc 7x7. z là dòng ngưỡng của tế bào. Bộ ba trọng số liên kết (A, B, z) chính là chương trình của mạng CNN. Với mỗi yêu cầu xử lý cụ thể sẽ có một bộ (A, B, z) riêng. Phối hợp các bộ (A, B, z) khác nhau sẽ thu được kết quả mong muốn ở đầu ra của mạng CNN khi đưa các tín hiệu vào đầu vào để xử lý. Trong những thời kỳ đầu, các mẫu của CNN được chế tạo cứng, như vậy rất bất tiện cho sử dụng khi cần thay đổi mẫu với các nhiệm vụ xử lý khác nhau. Về sau khi CNN - UM ra đời các mẫu được chứa trong bộ nhớ mẫu và có thể thay đổi được [9]. Ngày nay các mẫu cho CNN đã có thể được nạp và thay đổi một cách dễ dàng từ các máy tính PC sử dụng các hệ điều hành Windows 2000, XP. Mẫu là một vấn đề mấu chốt trong CNN và vẫn đang được các nhà nghiên cứu trên thế giới dành thời gian nghiên cứu nhằm tìm ra những con đường thiết kế mẫu mới, tìm ra những mẫu mới phục vụ cho các yêu cầu xử lý ngày càng đa dạng trong thực tiễn. Số hóa bởi Trung tâm Học liệu – ĐHTN 45 2.4.3.2. Thƣ viện mẫu CNN Một số mẫu cơ bản đã được các nhà khoa học thuộc Viện hàn lâm khoa học Hungary soạn thảo tập hợp trong thư viện phần mềm các mẫu cho CNN (CNN Software Library 2.1) [4]. Các mẫu này có thể được sử dụng qua các hàm của các thư viện phần mềm hoạt động trên các thiết bị CNN như InstantVision chạy trên thiết bị Bi-I sử dụng chip ACE16k. Các mẫu này cũng có thể được người sử dụng nạp trực tiếp từ các file text chứa mẫu vào ACE16k và sau quá trình quá độ ta nhận được kết quả ở đầu ra. Có thể tải các mẫu từ trang web của Viện nghiên cứu máy tính và tự động hoá thuộc Viện hàn lâm khoa học Hungary. Các mẫu này bao gồm các mẫu thực hiện các tác vụ cơ bản cho xử lý ảnh như phân ngưỡng, dò biên, thực hiện logic, hình thái học, ...ngoài ra còn có một số mẫu như mẫu dò tìm sự di chuyển trên ảnh xám, phân vùng các mẫu dệt, vải, chọn các đối tượng được đánh dấu, giải phương trình vi phân đạo hàm riêng PDE, ... Một số ví dụ về mẫu như sau: Mẫu tìm vùng Hình 2.5. Mẫu tìm vùng và hiệu quả của mẫu Mẫu chọn các đường nghiêng trong ảnh xám Số hóa bởi Trung tâm Học liệu – ĐHTN 46 Hình 2.6. Mẫu tìm đường xiên và hiệu quả của mẫu Mẫu giải phương trình PDE Laplace Mạng nơron tế bào CNN như đã nói ở trên là một hệ tính toán song song đặc biệt thuận tiện cho các tác vụ xử lý các luồng mảng tín hiệu. Với cấu trúc liên kết cục bộ giống nhau ở tất cả các tế bào của mạng nên mạng CNN dễ dàng được thực thi trên một chip CMOS, FPGA. Hoạt động của mạng CNN hoàn toàn được xác định bởi bộ mẫu liên kết cục bộ. Việc thiết kế các mẫu liên kết cho mạng CNN là một vấn đề khó vì thực chất là bài toán xác định các tham số cho một hệ động lực phi tuyến phụ thuộc cả các biến không gian và thời gian cho một tác vụ xử lý cụ thể. Trong khi xây dựng các ứng dụng mạng nơron tế bào CNN truớc hết người ta xác định mô hình của mạng: 1 lớp hay nhiều lớp, cấu trúc mối liên kết cục bộ...Sau đó là bước thiết kế bộ mẫu (hoặc các bộ mẫu với mạng nhiều Số hóa bởi Trung tâm Học liệu – ĐHTN 47 lớp) xác định hành vi động học của mạng. Ðây chính là bước xác định giá trị của các hệ số trong các ma trận A, B và giá trị nguỡng z sao cho ứng với các bộ giá trị đó mạng CNN đảm bảo thu được mảng các giá trị đầu ra theo yêu cầu. Việc xử lý tính toán trên mạng CNN về bản chất là tìm được các mô hình, các bộ mẫu cơ bản, các thuật toán cơ sở phối hợp các bộ mẫu cho ứng dụng cụ thể. Trên máy tính PC dùng các câu lệnh sai, thuật toán sai thì không thể thu được kết quả mong muốn sau khi chạy chương trình. Cũng như vậy trên máy tính CNN- UM sẽ không nhận được kết quả đúng khi chạy các bộ mẫu được thiết kế sai. 2.4.3.3. Các phƣơng pháp thiết kế mẫu cho CNN - Sử dụng các mặt nạ trong kỹ thuật xử lý ảnh truyền thống Dùng các mặt nạ đã được sử dụng, kiểm nghiệm trong quá trình xử lý ảnh trên máy tính số như các mẫu lọc trung bình, các mẫu co ảnh, dãn ảnh,Trong mạng CNN mặt nạ này được dùng làm ma trận A cho phép thực hiện các phép biến đổi tương đương. - Phân tích hoạt động của CNN để tìm ra mẫu Theo phương pháp này để tìm ra một tập mẫu trước hết cần phải phân tích mô tả hoạt động của mẫu đó thành các tác vụ chi tiết – các luật cục bộ sau đó dựa vào phương trình trạng thái và đồ thị quan hệ giữa biến trạng thái và đạo hàm bậc nhất của nó để xác định mẫu. - Phương pháp thiết kế mẫu dùng bảng logic Phương pháp này được L.O Chua phân tích đầu tiên. Đây là phương pháp xác định các mẫu cho các mạng CNN không ghép cặp mẫu A chỉ có thành phần trung tâm khác 0 các thành phần khác bằng 0. Phương pháp này có đặc điểm đơn giản nhưng chỉ áp dụng được với các ảnh nhị phân và các táp vụ không phức tạp. -Phương pháp thiết kế mẫu trực tiếp Số hóa bởi Trung tâm Học liệu – ĐHTN 48 Đây là phương pháp dùng thiết kế mẫu cho xử lý ảnh nhị phân được Akos Zarandy đề xuất. Phương pháp này được dùng để thiết kế mẫu khi nhiệm vụ yêu cầu đã được xác định chính xác. Các mẫu tìm được có thể cho mạng CNN ghép cặp hoặc không ghép cặp. Trình tự tiến hành thiết kế mẫu theo phương pháp trực tiếp theo 4 bước sau: Tạo hệ Định hình Giải hệ thống quy Chọn mẫu thống quy luật dạng mẫu luật quan hệ mạnh nhất quan hệ Hình 2.7. Sơ đồ các bước thiết kế mẫu theo phương pháp trực tiếp - Thiết kế mẫu dùng phương pháp học Phương pháp học để tìm bộ trọng số liên kết (bộ mẫu trong mạng CNN là phương pháp học theo tham số và có giám sát. Đầu vào của thủ tục học là: các ảnh cần xử lý và ảnh yêu cầu ở đầu ra điều kiện đối xứng của các hệ số ma trận mẫu. Đầu ra của thủ tục là bộ mẫu cần tìm gồm 2 ma trận 3x3 (18 hệ số ma trận) và một tham số ngưỡng. Tổng cộng là 19 tham số cần tìm cho một bộ mẫu. Mẫu học là phương pháp thiết kế rất quan trọng khi mà đầu ra yêu cầu tồn tại không rõ ràng, việc thiết kế mẫu trực tiếp không thực hiện được ví dụ như khi phân đoạn các mẫu dệt. Quy trình tìm mẫu bằng phương pháp học Số hóa bởi Trung tâm Học liệu – ĐHTN 49 đầu vào Nạp mẫu Yêu cầu xử lý cụ thể đầu ra Hình 2.8. Quy trình tìm mẫu bằng phương pháp học - Bƣớc 1: Nạp ảnh đầu vào; - Bƣớc 2: Đưa yêu cầu xử lí (ví dụ làm mờ, dò biên, dãn ảnh); - Bƣớc 3: Thực hiện các xử lý logic hoặc analogic để tìm mẫu; - Bƣớc 4: Thực thiện xử lí song song với mẫu tìm được; - Bƣớc 5: Đánh giá kết quả thu được, nếu đầu ra chưa hội tụ đến đầu ra của biên lí tưởng tiến hành quay trở lại bước 3 cho tới khi đạt được mẫu CNN tối ưu 2.5. Thuật toán phân đoạn ảnh trên CNN - Bƣớc 1: Nạp đầu vào CNN được khai thác để xử lý hình ảnh bằng cách kết hợp mỗi pixel của hình ảnh để các đầu vào có thế là một ảnh hoặc một chuỗi các điểm ảnh. Sau đó, các pixel và đầu ra của ma trận CNN phát triển để đạt được một trạng thái cân bằng. - Bƣớc 2: Nạp mẫu xử lý Nạp mẫu xử lý chính là đưa các tín hiệu đầu vào để thực hiện các chương trình xử lý. Số hóa bởi Trung tâm Học liệu – ĐHTN 50 Mẫu có thể sử dụng các mẫu có sẵn trong thư viện mẫu hoặc thiết kế mẫu theo yêu cầu sử dụng. - Bƣớc 3: Xử lý chương trình Sau khi nạp mẫu xử lý theo yêu cầu, sẽ thực hiện việc chạy chương trình theo phần mềm sử dụng - Bƣớc 4: Kiểm tra kết quả nếu phù hợp thì đưa ra kết quả, nếu không thì quay lại bước 2. - Bƣớc 5: Đưa ra kết quả xử lý Đưa ra kết quả xử lý là công đoạn cuối cùng trong tiến trình phân đoạn trên CNN. Thuật toán có thể đƣợc khái quát theo sơ đồ: Chuỗi đầu vào Mẫu xử lý Xử lý S Kiểm tra Đ Chuỗi đầu ra Hình 2.9. Sơ đồ cơ bản của thuật toán Số hóa bởi Trung tâm Học liệu – ĐHTN 51 2.6. Kết luận Thao tác phân đoạn ảnh phục vụ cho việc trích chọn thông tin từ ánh gốc để phục vụ cho nhiều ứng dụng trong đó có ứng dụng vào hệ thống tính toán điều khiển, tự động hóa quá trình sản xuất. Để đưa vào ứng dụng trong điều khiển dây chuyền sản xuất công nghiệp cần hệ thống nhỏ gọn chuyên dụng nếu đưa vào xử lý trên máy PC thì cồng kềnh phức tạp cần có chip xử lý chuyên dụng cho từng lĩnh vực sản xuất cụ thể. Do vậy,, thực hiện thao tác phân đoan ảnh theo thuật toán CNN làm nền tảng cơ sở để chế tạo chip chuyên dung cho các ứng dụng cụ thể nâng cao năng lực tính toán của các bộ vi xử lý nói riêng và của lính vực công nghệ thông tin nói chung. Theo xu thế mở rộng công năng của máy tính trong nhiều lĩnh vực khác nhau. Ngoài ra, việc nghiên cứu xử lý ảnh trên CNN còn có những khả năng xử lý đặc trưng như dùng PDE, hàm khuếch tán, khuếch tán phức...làm cho giải quyết bài toán ứng dụng càng thêm phong phú. Từ nghiên cứu phân tích bài toán ở chương này ta có thể cài đặt thử nghiệm trong chương 3 \ Số hóa bởi Trung tâm Học liệu – ĐHTN 52 Chƣơng III MÔ PHỎNG THUẬT TOÁN PHÂN ĐOẠN ẢNH BẰNG CNN 3.1. Mô tả bài toán mô phỏng 3.1.1. Phát hiện biên Để phân đoạn ảnh thì đầu tiên phải tìm được biên và tách biên để phân chia thành các vùng khác nhau có cùng tính chất nào đó. Việc phát hiện sự thay đổi của cường độ nhằm mục đích tìm các biên có thể được thực hiện bằng cách lấy các đạo hàm cấp một hoặc cấp hai. 3.1.1.1. Phát hiện điểm Việc phát hiện các điểm tách biệt trong một ảnh là đơn giản. Sử dụng mặt nạ được cho như sau: Hình 3.1: mặt nạ xác định điểm a. Mặt nạ phát hiện điểm. b. Ảnh tia X của tuabin khí trạng thái rổng bên trong. c. Kết quả của phát hiện điểm. d. Kết quả việc sử dụng phương trình. Đó là một điểm đã được phát hiện tại vị trí mà mặt nạ là trung tâm, nếu: │R│ ≥ Z (3.1) Z: nguỡng không âm, (3.1) Về cơ bản, phương trình (3.1) là do sự khác nhau giữa điểm trung tâm và những điểm lân cận. Một Điểm tách biệt (một điểm mà mức xám của nó Số hóa bởi Trung tâm Học liệu – ĐHTN 53 khác nhau đáng kể và nó được đặt tại vùng đồng nhất hay gần đồng nhất), sẽ hơi khác với những điểm xung quanh nó, và vì vậy sẽ dễ dàng được phát hiện bởi loại mặt nạ này. Tuy nhiên, điểm nổi bật ở đây là việc phát hiện các điểm. Nghĩa là sự khác biệt được quan tâm phải đủ lớn để xem xét số điểm tách biệt. Các hệ số mặt nạ có tổng là không, nghĩa là đáp ứng mặt nạ sẽ bằng không trong những vùng mà mức xám không đổi. 3.1.1.2. Phát hiện dòng Xét các mặt nạ được cho trong hình sau: Ngang +450 Dọc -450 Hình 3.2: Mặt nạ phát hiện dòng Nếu mặt nạ đầu tiên được di chuyển quanh một ảnh thì nó sẽ đáp ứng tốt hơn cho các dòng theo hướng. Ðặt R1, R2, R3, R4 ký hiệu cho các đáp ứng của các mặt nạ trong Hình 3.2, từ trái sang phải. Giả sử bốn mặt nạ riêng lẽ đi qua một điểm ảnh. Nếu tại một số điểm ảnh │Ri│≥│Rj, với tất cả i≠j thì điểm đó được gọi là hơi có vẽ liên kết với một đường theo hướng mặt nạ thứ i. Ví dụ, nếu tại một điểm trong ảnh │Ri│≥│Rj│, với j=2,3,4. Điểm cụ thể đó được gọi là có nhiều khả năng liên kết với một dòng ngang. Ngoài ra, có thể quan tâm đến việc phát hiện những dòng theo hướng cụ thể. Trong trường hợp này, sẽ sử dụng mặt nạ này kết hợp với hướng và ngưỡng ngõ ra của nó, như trong phương trình 3.1. Số hóa bởi Trung tâm Học liệu – ĐHTN 54 Nói cách khác, nếu quan tâm đến việc phát hiện tất cả các dòng trong một ảnh theo hướng được xác định bằng một mặt nạ cho sẵn, chỉ đơn giản trượt mặt nạ qua các ảnh này và lấy ngưỡng trị tuyệt đối của kết quả này. Các điểm bên trái là những đáp ứng mạnh nhất cho các đường có độ dày một pixel tương ứng gần nhất với hướng được xác định bằng mặt nạ này. (a) (b) (c) Hình 3.3. Minh họa việc phát hiện dòng a. Mặt nạ nối dây nhị phân b. Lấy trị tuyệt đối của kết quả thực hiện với bộ phát hiện đường -450 c. Kết quả lấy ngưỡng ảnh (b) Số hóa bởi Trung tâm Học liệu – ĐHTN 55 3.1.1.3. Phát hiện cạnh Theo quan sát, một cạnh là một bộ liên thông các pixel mà nằm trên đường bao giữa hai vùng. Một định nghĩa hợp lý của "cạnh" đòi hỏi khả năng đo được sự chuyển đổi mức xám. Một cạnh lý tưởng có các đặc điểm của mô hình được cho trong trong mô hình một cạnh lý tưởng như sau: Mô hình một cạnh lý tƣởng Hình 3.4. Biểu đồ mức xám của đường ngang Một cạnh lý tuởng theo mô hình này là một tổ hợp các liên thông pixel mà mỗi một pixel được đặt tại một mức chuyển đổi mức xám trực giao. Thực tế, việc sai hỏng thu nhận ảnh quang, ảnh lấy mẫu, và ảnh khác tạo ra các ảnh bị nhòe, với mức độ nhòe được xác định bởi các yếu tố như chất lượng của hệ thống thu nhận ảnh, tốc độ lấy mẫu, và dưới các điều kiện chiếu sáng mà ảnh được thu. Theo một kết quả nghiên cứu, các cạnh được mô hình dày hơn như có một đường bao “hơi nghiêng”. Mô hình cạnh nghiêng Số hóa bởi Trung tâm Học liệu – ĐHTN 56 Hình 3.5. Biểu đồ mức xám của đường nghiêng thông qua ảnh 3.1.1.4. Phát hiện biên Candy Mặc dù rất phức tạp nhưng thuật toán canny nhìn chung có ưu điểm hơn cho việc phát hiện biên. Phương pháp tiếp cận của canny là dựa trên 3 mục tiêu chính: - Tỷ lệ sai thấp: Tất cả các biên cần được phát hiện không nên đáp ứng với tạp nhiễu. Nghĩa là biên được tách càng dày đặc thì càng tốt so với biên thực. - Các điểm biên nên được xác định chính xác: Các biên được xác định phải càng dày đặc càng tốt so với biên thực. Nghĩa là: khoảng cách giữa một điểm được đánh dấu bằng một biên và tâm của biên thực nên nhỏ. - Ðáp ứng điểm đơn biên: Bộ dò biên nên trả về một điểm cho mỗi điểm biên thực. Nghĩa là: số luợng vị trí tối đa xung quanh biên thực nên nhỏ. Ðiều này có nghĩa là bộ dò không nên xác định nhiều pixel biên mà ở đó chỉ duy nhất một điểm đơn biên tồn tại. Bản chất của thuật toán canny là biểu diễn theo toán học 3 tiêu chuẩn đó và cố gắng tìm ra giải pháp tối ưu cho những mục đích này. Nhìn chung rất khó để tìm ra giải pháp mà thỏa mãn cả 3. Tuy nhiên, việc sử dụng tối ưu hóa số với các biên bậc 1-D bị nhiễu bởi nhiễu Gauss trắng dẫn đến giải pháp mà xấp xỉ tốt cho bộ dò bậc tối ưu là lấy đạo hàm cấp 1 của một hàm gauss như sau : (3.2) Kết quả này đối với 2-D giải quyết việc nhận dạng mà phương pháp 1- D vẫn áp dụng theo hướng của biên chuẩn. Do hướng của biên chuẩn được biết trước, điều này sẽ cần áp dụng bộ dò biên 1-D trong tất cả các hướng có thể. Công việc này có thể được xấp xỉ bằng cách làm trơn ảnh trước tiên với Số hóa bởi Trung tâm Học liệu – ĐHTN 57 một hàm gauss 2-D, tính toán đạo hàm cấp 1 của kết quả này và sau đó sử dụng độ lớn và hướng đạo hàm cấp một để ước tính độ lớn và hướng biên tại mọi điểm. Ðặt f(x, y) ảnh ngõ vào, G(x, y) ký hiệu hàm Gauss: (3.3) Tạo một ảnh được làm nhẵn (x,y)=G(x,y)* (x,y) (3.4) Phép tính này được suy ra bằng cách tính đạo hàm cấp 1 theo biên độ: M(x,y) = (3.5) Đạo hàm cấp 1 theo hướng (góc) (x,y) = và (3.6) Bất kỳ cặp mặt nạ nào trong hình trên đều có thể được dùng để đạt được gx và gy. Phương trình (x,y)=G(x,y)* (x,y) được thực hiện bằng cách dùng mặt nạ Gauss nxn. M(x,y) và (x,y) là mảng có cùng kích thước bằng với ảnh mà chúng được tính toán. Bởi vì nó được tạo ra bằng cách dùng đạo hàm cấp 1, M(x, y) chứa các đường ngoằn ngèo rộng xung quanh vị trí lớn nhất. Tiếp theo là làm mảnh đường này. Một phương pháp là sử dụng triệt điểm không cực đại. Bản chất của phương pháp là để định rõ một hướng biên chuẩn rời rạc. Ví dụ trong vùng 3×3 có thể định 4 hướng cho một biên thông qua điểm trung tâm của vùng ngang, dọc, +450, -450. Bởi vì phải lượng tử tất cả các huớng biên theo 4 hướng nên phải định một phạm vi hướng mà ta xét đến biên ngang. định hướng biên theo hướng của một biên chuẩn mà nhận được từ dữ liệu ảnh bằng cách dùng phương trình: Số hóa bởi Trung tâm Học liệu – ĐHTN 58 (x,y) = Ví dụ: (a) (b) Hình 3.6. Mặt nạ phát hiện cạnh và 8 hướng cạnh a. 2 hướng có khả năng của một cạnh ngang trong cửa sổ 3×3 b. Giá trị, góc hướng của cạnh chuẩn so với cạnh ngang 3.1.2. Bài toán phân đoạn ảnh 3.1.2.1. Công thức cơ sở Với R đặc trưng toàn bộ miền ảnh. có thể xem sự phân đoạn như một quá trình mà nó phân chia R thành n miền con, R1, R2, ,Rn, như sau: Ðiều kiện này chỉ ra rằng phân đoạn phải hoàn thành, trong đó mỗi điểm ảnh phải trong một miền. - Ri là một miền liên thông, i=1,2,,n Ðiều kiện này yêu cầu là các điểm trong một miền phải được kết nối trong các cảm nhận được xác định trước. - Ri I Rj =  cho mọi i và j, i ≠j Ðiều kiện này chỉ ra rằng các miền phải được tháo rời ra. - P(Ri)=TRUE với i=1,2,...,n Số hóa bởi Trung tâm Học liệu – ĐHTN 59 Ðiều kiện này đối phó với các tính chất mà nó phải được thỏa mãn bởi các điểm ảnh trong một miền phân đoạn cho ví dụ P(Rt) = TRUE nếu toàn bộ các điểm ảnh trong R có cùng mức xám - P(Ri Rj)=FALSE với i ≠j Điều kiện này chỉ ra rằng các miền Ri và Rt khác nhau trong cảm nhận của dự đoán P. 3.1.2.2. Tăng trƣởng miền ảnh Tăng trưởng miền ảnh là một thủ tục mà các nhóm các điểm ảnh hay các miền con trong các miền lớn hơn dựa trên tiêu chuẩn được định nghĩa trước. (a) (b) (b) (d) Hình 3.7. Ví dụ về tăng trưởng miền ảnh a. Ảnh bị hỏng nặng b. Các điểm hạt c. Kết qủa của tăng vùng d. Đường bao của các phần hỏng Số hóa bởi Trung tâm Học liệu – ĐHTN 60 Hình 3.7(a) biểu hiện một ảnh tia X của một mối hàn (miền tối hàng ngang) chứa vài vết nứt và trạng thái xốp (ánh sáng, đường sọc trắng chạy theo hàng ngang xuyên qua trung điểm của ảnh). mong đợi sử dụng tăng trưởng miền để phân đoạn các miền lỗi của mối hàn. Các cấu hình phân đoạn này có thể được sử dụng cho việc kiểm tra một hệ thống mối hàn tự động, và cho các ứng dụng số học khác. Ðầu tiên là quyết định điểm khởi đầu. Trong ứng dụng này, nó được biết như các điểm ảnh của các mối hàn bị hỏng dẫn đến có giá trị số có thể cho phép tối đa (255 trong truờng hợp này). Dựa trên thông tin này, chọn các điểm bắt đầu trên toàn bộ các điểm ảnh có giá trị của 255. Các điểm được trích từ ảnh nguồn được biểu hiện trong Hình 3.7(b). Tiếp theo là chọn tiêu chuẩn cho sự p

Các file đính kèm theo tài liệu này:

  • pdfnghien_cuu_ung_dung_cong_nghe_mang_noron_te_bao_vao_bai_toan.pdf