ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
LÊ THỊ NGỌC TÚ
NGHIÊN CỨU ỨNG DỤNG CÔNG NGHỆ MẠNG
NƠRON TẾ BÀO VÀO BÀI TOÁN PHÂN ĐOẠN ẢNH
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên năm 2015
Số hóa bởi Trung tâm Học liệu – ĐHTN
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
LÊ THỊ NGỌC TÚ
NGHIÊN CỨU ỨNG DỤNG CÔNG NGHỆ MẠNG
NƠRON TẾ BÀO VÀO BÀI TOÁN PHÂN ĐOẠN ẢNH
Chuyên ngành: Khoa học máy tính
Mã số: 60 48
80 trang |
Chia sẻ: huong20 | Ngày: 13/01/2022 | Lượt xem: 494 | Lượt tải: 0
Tóm tắt tài liệu Nghiên cứu ứng dụng công nghệ mạng nơron tế bào vào bài toán phân đoạn ảnh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
01 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƢỜI HƢỚNG DẪN KHOA HỌC
TS. VŨ ĐỨC THÁI
Thái Nguyên năm 2015
Số hóa bởi Trung tâm Học liệu – ĐHTN
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này do tôi thực thiện, có sự hướng dẫn tận
tình và chu đáo của người hướng dẫn là TS. Vũ Đức Thái. Những số liệu
trong các bảng biểu, hình ảnh phục vụ cho việc phân tích, nhận xét, đánh giá
được thu thập từ các nguồn khác nhau có ghi trong phần tài liệu tham khảo,
trong phạm vi hiểu biết của tôi.
Nếu phát hiện có bất kỳ sự gian lận nào tôi xin hoàn toàn chịu trách
nhiệm trước Hội đồng, cũng như kết quả luận văn của mình.
Thái Nguyên, ngày 13 tháng 4 năm 2015
Học viên
Lê Thị Ngọc Tú
Số hóa bởi Trung tâm Học liệu – ĐHTN
LỜI CẢM ƠN
Để hoàn thành được luận văn này em xin chân thành xảm ơn thầy giáo
TS.Vũ Đức Thái đã hướng dẫn tận tình và tạo mọi điều kiện cho em hoàn
thành luận văn.
Em xin chân thành cảm ơn ban lãnh đạo các thầy giáo, cô giáo, các cán
bộ nhân viên Trường Đại học Công nghệ thông tin và Truyền thông – ĐH
Thái Nguyên đã giúp đỡ, tạo điều kiện cho em hoàn thành bản luận văn này.
Cuối cùng, em xin chân thành cảm ơn sự quan tâm giúp đỡ của gia
đình, bạn bè và tập thể lớp Cao học K12G đã cổ vũ động viên em hoàn thành
tốt luận văn của mình.
Thái nguyên, ngày 13 tháng 4 năm 2015
Học viên
Lê Thị Ngọc Tú
Số hóa bởi Trung tâm Học liệu – ĐHTN
DANH MỤC CÁC CHỮ VIẾT TẮT
- CNN (Cellular Neural Network): Công nghệ mạng nơron tế bào.
- CPU (Central Processing Unit): Bộ xử lí trung tâm.
- A(Digital)/A(Analog):Tín hiệu số/Tín hiệu tương tự
- IC (Integrated Circuit): Các vi mạch tích hợp
- CNN-UM (CNN-Universal Machine): Máy tính mạng nơron tế bào.
- PDE (Partial differential Equation): Phương trình vi phân đạo hàm riêng
(trong luận văn dùng thuật ngữ tiếng Việt là “phương trình đạo hàm riêng”).
- FPGA (Field Programmable Gate Array): Mảng cổng dạng trường lập trình
- ADC (Analog Digital Converter): Bộ chuyển đổi tín hiệu tương tự thành
tín hiệu số.
- GAPU (Global Analogic Program Unit): khối lập trình toàn cục
Số hóa bởi Trung tâm Học liệu – ĐHTN
DANH MỤC HÌNH VẼ
Hình 1.1. Một số kiểu mạng CNN .................................................................... 5
Hình 1.2. Kiến trúc mạng nơron tế bào chuẩn .................................................. 5
Hình 1.3. Mô tả kiến trúc của CNN .................................................................. 9
Hình 1. 4. Cấu trúc máy tính CNN-UM .......................................................... 10
Hình 1.5. Mô tả khái quát các bước lập trình ở các ngôn ngữ khác nhau ...... 12
Hình 1.6. Sáu kiểu hệ số của mẫu A (3x3) cho phép CNN ổn định ............... 14
Hình 1.7. Các bước cơ bản trong một hệ thống xử lý ảnh .............................. 16
Hình 1.8 : Các thành phần chính của hệ thống xử lý ảnh .............................. 18
Hình 1.9. Giao diện Candy .............................................................................. 23
Hình 1.10. Nạp ảnh trong Candy .................................................................... 24
Hình 1.11.Ảnh ban đầu ................................................................................... 24
Hình 1.12. Ảnh sau khi chạy Template EdgeDetect ....................................... 24
Hình 2.1. Tách cây tứ phân ............................................................................. 35
Hình 2.2. Hệ động lực của một tế bào CNN ................................................... 44
Hình 2.3. Mẫu tìm vùng và hiệu quả của mẫu ................................................ 45
Hình 2.4. Mẫu tìm đường xiên và hiệu quả của mẫu ...................................... 46
Hình 2.5. Sơ đồ các bước thiết kế mẫu theo phương pháp trực tiếp ............... 48
Hình 2.6. Quy trình tìm mẫu bằng phương pháp học ..................................... 49
Hình 2.7. Sơ đồ cơ bản của thuật toán ............................................................ 50
Hình 3.1: mặt nạ xác định điểm ...................................................................... 52
Hình 3.2: Mặt nạ phát hiện dòng ..................................................................... 53
Hình 3.3. Minh họa việc phát hiện dòng ......................................................... 54
Hình 3.4. Biểu đồ mức xám của đường ngang ............................................... 55
Hình 3.5. Biểu đồ mức xám của đường nghiêng thông qua ảnh ..................... 56
Hình 3.6. Mặt nạ phát hiện cạnh và 8 hướng cạnh ......................................... 58
Hình 3.7. Ví dụ về tăng trưởng miền ảnh ....................................................... 59
Hình 3.8. Lược đồ mức xám ........................................................................... 61
Số hóa bởi Trung tâm Học liệu – ĐHTN
Hình 3. 9. Tách cây tứ phân ............................................................................ 61
Hình 3.10 Thử nghiệm mẫu phân đoạn ảnh .................................................. 65
Số hóa bởi Trung tâm Học liệu – ĐHTN
MỤC LỤC
Chương I: CÁC LÝ THUYẾT BỔ TRỢ .......................................................... 3
1.1. Mạng nơron tế bào ..................................................................................... 3
1.1.1. Kiến trúc mạng nơron tế bào CNN ......................................................... 3
1.1.1.1. Giới thiệu chung về mạng nơron tế bào ............................................... 3
1.1.1.2.Kiến trúc mạng Nơron tế bào ................................................................ 4
1.1.1.3.Kiến trúc của máy tính mạng Nơron tế bào ........................................ 10
1.1.1.4. Một số vấn đề cơ bản của CNN ......................................................... 13
1.2. Xử lý ảnh .................................................................................................. 15
1.2.1. Giới thiệu chung về xử lý ảnh ............................................................... 15
1.3. Ngôn ngữ Matlab ..................................................................................... 18
1.3.1. Giới thiệu chung về Matlab .................................................................. 18
1.3.2. Ngôn ngữ lập trình Matlab và ứng dụng trong mô phỏng .................... 19
1.3.3. Các công cụ để cài đặt mô phỏng tính toán .......................................... 20
1.3.3.1. Đọc và ghi dữ liệu ảnh ....................................................................... 20
1.3.3.2. Lớp lưu trữ của file matlab ................................................................ 21
1.3.3.3. Truy vấn một file đồ hoạ .................................................................... 21
1.3.3.4. Hiển thị ảnh ....................................................................................... 22
1.4. Phần mềm mô phỏng CANDY ................................................................ 22
Chương II: BÀI TOÁN PHÂN ĐOẠN ẢNH ................................................. 25
2.1. Giới thiệu chung về phân đoạn ảnh.......................................................... 25
2.2. Các hướng tiếp cận phân đoạn ảnh .......................................................... 27
2.2.1. Các phương pháp dựa trên không gian đặc trưng ................................. 27
2.2.2. Các phương pháp dựa trên không gian ảnh .......................................... 28
2.2.3. Các phương pháp dựa trên mô hình vật lý ............................................ 29
2.3. Một số phương pháp phân đoạn ảnh ........................................................ 29
2.3.1. Phương pháp phân đoạn dựa vào ngưỡng cố định ............................... 29
Số hóa bởi Trung tâm Học liệu – ĐHTN
2.3.2. Phương pháp phân đoạn dựa vào miền đồng nhất ................................ 32
2.3.2.1. Giới thiệu chung ................................................................................. 32
2.3.2.2. Phương pháp tách cây tứ phân ........................................................... 33
2.3.2.3. Phương pháp tổng hợp ....................................................................... 35
2.4. Giải pháp phân đoạn ảnh bằng công nghệ CNN ...................................... 37
2.4.1. Xử lý ảnh dùng PDE ............................................................................. 37
2.4.2. Công nghệ xử lý ảnh nhanh trên mạng CNN ........................................ 38
2.4.2.1. Tính ưu việt và ý nghĩa ..................................................................... 39
2.4.2.2. Tình hình nghiên cứu về xử lý ảnh dùng CNN trong nuớc ............... 40
2.4.2.3. Kết quả xử lý ảnh dùng CNN ............................................................. 41
2.4.2.4. Hạn chế và giải pháp ứng dụng CNN ................................................ 42
2.4.3. Mẫu và vai trò của mẫu ......................................................................... 43
2.4.3.1. Giới thiệu chung ................................................................................. 43
2.4.3.2. Thư viện mẫu CNN ........................................................................... 45
2.4.3.3. Các phương pháp thiết kế mẫu cho CNN .......................................... 47
2.5. Thuật toán phân đoạn ảnh trên CNN ....................................................... 49
2.6. Kết luận .................................................................................................... 51
Chương III: MÔ PHỎNG THUẬT TOÁN PHÂN ĐOẠN ẢNH ................. 52
3.1. Mô tả bài toán mô phỏng ......................................................................... 52
3.1.1. Phát hiện biên ........................................................................................ 52
3.1.1.1. Phát hiện điểm .................................................................................... 52
3.1.1.2. Phát hiện dòng .................................................................................... 53
3.1.1.3. Phát hiện cạnh .................................................................................... 55
3.1.1.4. Phát hiện biên Candy ......................................................................... 56
3.1.2. Bài toán phân đoạn ảnh ......................................................................... 58
3.1.2.1. Công thức cơ sở ................................................................................. 58
3.1.2.2. Tăng trưởng miền ảnh ........................................................................ 59
Số hóa bởi Trung tâm Học liệu – ĐHTN
3.1.2.3. Tách và ghép miền ............................................................................. 61
3.2. Cài đặt mô phỏng ..................................................................................... 62
3.2.1. Ví dụ: Đoạn mã lệnh ............................................................................. 62
3.2.2. Mô phỏng 1: .......................................................................................... 65
3.2.3. Mô phỏng 2 ........................................................................................... 66
3.3.3. Đánh giá kết quả mô phỏng .................................................................. 67
KẾT LUẬN ..................................................................................................... 68
TÀI LIỆU THAM KHẢO ............................................................................... 69
Số hóa bởi Trung tâm Học liệu – ĐHTN
1
MỞ ĐẦU
Trong xã hội loài người ngôn ngữ là một phương tiện trao đổi thông tin
phổ biến trong quá trình giao tiếp. Bên cạnh đó hình ảnh cũng là một cách
trao đổi thông tin mang tính chính xác, biểu cảm khá cao và đặc biệt bị cảm
giác chủ quan của đối tượng chi phối. Thông tin trên hình ảnh rất phong phú,
đa dạng và có thể xử lý bằng máy tính. Chính vì vậy, trong những năm gần
đây sự kết hợp giữa ảnh và đồ họa đã trở nên rất chặt chẽ trong lĩnh vực xử lý
thông tin.
Cũng như xử lý dữ liệu hình ảnh bằng đồ họa, việc xử lý ảnh số là một
lĩnh vực của tin học ứng dụng. Xử lý ảnh số thao tác trên các ảnh tự nhiên
thông qua các phương pháp và kỹ thuật mã hóa.
Phân đoạn ảnh là bước then chốt trong xử lý ảnh, giai đoạn này nhằm
phân tích ảnh thành các phần có cùng tính chất nào đó dựa theo biên hay các
vùng liên thông. Mục đích của phân đoạn ảnh là có thể miêu tả tổng hợp từ
nhiều phần tử khác nhau cấu tạo nên ảnh thô. Vì lượng thông tin chứa trong
ảnh rất lớn, trong khi đó đa số các ứng dụng chỉ cần trích chọn một vài đặc
trưng nào đó, do vậy cần có một quá trình để giảm lượng thông tin khổng lồ
ấy. Quá trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu.
Tuy nhiên các phương pháp xử lý ảnh truyền thống lại đòi hỏi nhiều thời
gian xử lý nhất là với những ảnh có kích thước lớn. Để đáp ứng yêu cầu đó
người ta đã và đang tìm kiếm nhiều phương pháp xử lý ảnh song song khác
nhau nhằm giảm thời gian xử lý. Mạng nơron tế bào CNN là một trong những
công cụ xử lý ảnh thời gian thực sự hữu hiệu và đang được quan tâm nghiên
cứu rộng rãi trên thế giới do có nhiều ưu điểm trong đó có bản chất xử lý song
song. Ảnh số là một mảng số thực hai chiều kích thước MxN trong đó mỗi
phần tử ảnh là một tế bào C(i,j), i = 1, 2,..., M, j = 1, 2,..., N, biểu thị mức xám
của ảnh tại các vị trí (i,j) tương ứng. Ảnh được coi là ảnh nhị phân nếu C(i,j)
Số hóa bởi Trung tâm Học liệu – ĐHTN
2
chỉ nhận giá trị 0 hoặc 1. Các đặc trưng của ảnh thường bao gồm các thành
phần như: mật độ xám, phân bố xác suất, phân bố không gian, biên ảnh.
Được sự gợi ý của giáo viên hướng dẫn và nhận thấy tính thiết thực của
vấn đề này, tôi đã chọn đề tài: “Nghiên cứu ứng dụng công nghệ mạng
Nơron tế bào vào bài toán phân đoạn ảnh” để làm đề tài cho luận văn tốt
nghiệp của mình
Số hóa bởi Trung tâm Học liệu – ĐHTN
3
Chƣơng I
CÁC LÝ THUYẾT BỔ TRỢ
1.1. Mạng nơron tế bào
1.1.1. Kiến trúc mạng nơron tế bào CNN
1.1.1.1. Giới thiệu chung về mạng nơron tế bào
Công nghệ mạng nơron tế bào CNN (Cellular Neural Networks) đã
được các nhà khoa học Mỹ và Hungary phát minh ra vào năm 1988 có tốc độ
xử lý 1012 phép tính/giây và được áp dụng cho các hệ thống xử lý ảnh nhanh
10 - 50000 ảnh/giây. Đây là bước đột phá về chất do cấu trúc của máy tính xử
lý CNN là song song với hàng trục ngàn CPU được kết nối thành mạng trong
một chip. Công nghệ này cho phép giải quyết nhiều bài toán xử lý phức tạp
trong thời gian thực hiện mà các máy tính thông thường chưa làm được.[2]
Sự ra đời của mạng nơron tế bào CNN đã mở ra một thời đại mới cho
sự phát triển của khoa học tính toán tiếp cận đến các phương thức xử lý. Ta
biết rằng các máy tính số hiện nay về cơ bản là loại máy logic với các dữ liệu
rời rạc được mã hóa theo hệ nhị phân. Tính chất cơ bản của nó là khả năng
thực hiện thuật toán theo chương trình được lưu trong bộ nhớ. Ðây là loại
máy tính vạn năng xử lý trên các số nguyên hay còn gọi là máy Turing. Các
phép tính cơ bản của nó là các phép số học và logic. Thuật toán là các chuỗi
logic của các phép tính cơ bản này. Sự ra đời của bóng bán dẫn năm 1948 và
của các vi mạch tích hợp IC năm 1960 đã tạo ra các máy tính số có tính thực
tiễn cao với giá thành rẻ và hiện nay đã trở thành một loại hàng hóa thông
dụng. Sự hoàn thiện chíp CNN đặc trưng bởi kích thước và chức năng một vài
loại có mẫu cố định là 256 tế bào, một số loại khác có kích thước giới hạn là
30 tế bào. Hiện nay có loại chíp có thể lập trình có kích thước 1024 tế bào.
Khả năng lập trình được và tốc độ cao làm cho CNN phù hợp tốt hơn với các
xử lý phi tuyến, nó cho phép nhận được và xử lý tín hiệu phi tuyến. Tuy vậy
Số hóa bởi Trung tâm Học liệu – ĐHTN
4
những ưu thế thực sự của CNN là nó tương đương với chíp có mật độ tích
hợp lớn tiêu thụ nhiều năng lượng.
Một ứng dụng quan trọng của mạng nơron tế bào là xử lý ảnh. Chức
năng cơ bản của mạng nơron tế bào trong quá trình xử lý ảnh là ánh xạ hoặc
chuyển hình ảnh đầu vào tương ứng với hình ảnh đầu ra.[3].
Ngoài ứng dụng xử lý ảnh tốc độ cao ra công nghệ CNN còn được
dùng để tối ưu hoá hệ thống truyền dữ liệu băng thông rộng, giải phương
trình vi phân đạo hàm hàm riêng PDE. Ngược lại, với cấu trúc xử lý song
song hoàn toàn, liên tục theo luồng theo thời gian, với việc cho phép triển
khai nhiều mô hình toán học trong cả trường số thực và số phức người ta có
thể xây dựng các mô hình CNN một lớp hoặc nhiều lớp trên phần cứng.
1.1.1.2.Kiến trúc mạng Nơron tế bào
- Có hai định nghĩa tổng quát của một CNN như sau:
+ Ðịnh nghĩa 1: Một mạng nơron tế bào CNN là một mảng 2, 3 hoặc n
chiều của các hệ thống động lực học được gọi là các tế bào, hầu hết các hệ
này là đồng nhất và thoả mãn hai thuộc tính:
Ảnh hưởng phổ biến là cục bộ trong phạm vi bán kính r.
Tất cả các biến trạng thái là giá trị tín hiệu liên tục.
+ Ðịnh nghĩa 2: Một mạng nơron tế bào CNN là một mạch điện phi tuyến
động lực học bậc cao được tạo nên bởi ghép nối liên kết cục bộ theo không
gian các khối mạch điện giống nhau - mỗi khối mạch điện được gọi là một tế
bào. Mạng được tạo thành có thể có kiến trúc bất kỳ như dạng lưới hình chữ
nhật, 6 cạnh, 3 cạnh, hình cầu,...
Số hóa bởi Trung tâm Học liệu – ĐHTN
5
Hình 1.1. Một số kiểu mạng CNN
- Công nghệ CNN gồm tập các chíp (tế bào) có liên kết cục bộ với nhau
tạo thành lưới với nhiều hình trạng khác nhau. Để đơn giản, ta xét kiến trúc
chuẩn của CNN là một mảng hình chữ nhật kích thước MxN tế bào, mỗi tế
bào ký hiệu là C(i,j), ứng với tọa độ (i,j) trong không gian Đề - Các hai chiều.
Chỉ số i, j thỏa mãn điều kiện i=1...M; j=1...N .
Hình 1.2. Kiến trúc mạng nơron tế bào chuẩn
Trong đó, mỗi ô vuông biểu diễn cho một tế bào C(i,j) có liên kết trực tiếp về
tín hiệu điện với các tế bào láng giềng. [1].
- CNN là mạch điện phi tuyến động có kích thước lớn, được tạo bởi cặp
các tế bào liên kết với nhau, phân bố đều không gian. Mạch này có cấu trúc
hình chữ nhật, lục giác đều, hình cầu,... với những đặc trưng:
+ Luật tiếp hợp trong CNN biểu diễn sự tương tác từng cặp của tế bào
C(i,j) với các tế bào láng giềng C(k,1) của nó.
+ Mỗi tế bào có điều kiện biên và điều kiện ban đầu.
Số hóa bởi Trung tâm Học liệu – ĐHTN
6
- Hệ CNN là ma trận n chiều của những phần tử động giống hệt nhau,
mỗi phần tử là một mạch tích hợp gọi là tế bào, mỗi tế bào có hai thuộc tính:
+ Chỉ tương tác với các tế bào lân cận trong phạm vi bán kính là r (r là
số nguyên dương)
+ Giá trị trạng thái của tế bào là những tín hiệu có giá trị liên tục.
- Các phương trình quan trong mô tả cho hệ CNN là:
+ Phương trình trạng thái:
xij x ij Aijkly(,;,)(,;,)kl Bijkluz kl ij (1.1)
CklSij(,)(,)(,)(,)rr CklSij
xij R, y ij R và zij R được gọi là trạng thái: đầu ra, đầu vào, ngưỡng của tế
bào C(i,j), A(i, j; k, l) và B(i, j; k, l) được gọi là toán tử phản hồi và toán tử
dẫn nhập đầu vào.
+ Phương trình đầu vào
Vuij=Eij với 1 ≤ i ≤ M; 1≤ j ≤ N (1.2)
Giá trị Vuij tương ứng với giá trị ban đầu của phương trình vi phân khi áp
dụng CNN để giải phương trình vi phân hoặc ảnh đầu vào đối với bài toán xử
lý ảnh.
+ Phương trình đầu ra
11
y f( x ) x 1 x 1 (1.3)
ij ij22 ij ij
+ Phương trình mô tả các ràng buộc
│vxij(O) │≤ 1 với 1≤ i≤ M; 1 ≤ j≤ N (1.4)
│vxij │≤ 1 với 1≤ i≤ M; 1 ≤ j≤ N (1.5)
+ Phương trình tham số giả định
A(i,j;k,l) = A(k,l;i,j) với 1≤ i≤ M; 1 ≤ j≤ N (1.6)
+ Điều kiện biên xác định và là các tế bào thuộc hiệu ứng cầu của các
tế bào cạnh nhưng nằm ngoài mảng kích thước MxN
Số hóa bởi Trung tâm Học liệu – ĐHTN
7
- Đối với ứng dụng CNN trong xử lý ảnh, đầu vào thường là cường độ
điểm ảnh, thang độ xám kích thước MxN, -1 <ukl < +1 khi đó mức “trắng”
được mã hóa là -1 và “đen” được mã hóa là +1.
- Đối với ảnh tĩnh, ukl là hằng số, đối với ảnh động (video) ukl là một
hàm theo thời gian. A(i,j;k,l), B(i,j;k,l) và zij thay đổi theo vị trí (i,j) và thời
gian t. Một số trường hợp khác có thể coi A(i,j; k,l), B(i,j; k,l) và zij không đổi
theo không gian và thời gian.
Mạng CNN bất biến không gian và đẳng hướng nếu các toán tử
A(i,j;k,l), B(i,j;k,l) và toán tử ngưỡng zij không đổi theo không gian. Trong
trường hợp này ta có CNN chuẩn (với toán tử dẫn nạp tuyến tính) có phương
trình trạng thái như sau:
Aijkly(,;,)(,)kl Aikjly kl
CklSij(,)(,) kirljr
r
Bijklu(,;,)(,)kl Bikjlu kl
CklSij(,)(,)r kirljr
Phần lớn các ứng dụng của CNN chỉ sử dụng CNN chuẩn bất biến
không gian lân cận 3 x 3 (r = 1). Các cell C i, j Sr i, j với các mẫu:
C(i-1,j-1) C(i-1,j) C(i-1,j+1)
C(i,j-1) C(i,j) C(i,j+1)
C(ij-1) C(i+1,j) C(i+1,j+1)
+ Toán tử dẫn nạp hồi tiếp A(i,j;k,l), trong không gian bất biến có thể viết
như sau:
Công thức tính mẫu
Aijkly(,;,)(,)kl Aikjly kl
CklSij(,)(,)r kirljr
Bijklu(,;,)(,)kl Bikjlu kl
CklSij(,)(,)r kirljr
zzij ; (1.7)
Số hóa bởi Trung tâm Học liệu – ĐHTN
8
Phép toán nhân chập
Aijkly(,;,)(,)kl Aikjly kl
CklSij(,)(,)r kirljr
a1,1 yi 1,1 j a 1,0 y i 1, j a 1,1 y i 1,1 j a 0,1 y i ,1 j a 0,0 y i , j
a0,1 yi , j 1 a 1, 1 y i 1, j 1 a 1,0 y i 1, j a 1,1 y i 1, j 1
11
ayk,, l i k j l (1.8)
kl11
hoặc có thể minh hoạ phép toán nhân chập như sau:
a1, 1 a 1,0 a 1,1 y 1, 1 y 1,0 y 1,1
a0,1 a 0,0 a 0,1 * y 0,1 y 0,0 y 0,1 A * Yij (1.9)
a1, 1 a 1,0 a 1,1 y 1, 1 y 1,0 y 1,1
- Ma trận A kích thước 3 x 3 được gọi là mẫu vô hướng hồi tiếp và ký
tự bao hàm tổng của các tích điểm, nên được gọi là tích điểm mẫu, toán tử
này được gọi là toán tử “xoắn không gian”. Ma trận 3 x 3, Yij thu được bởi
việc di chuyển một mặt nạ mờ với kích thước cửa sổ 3x3 đến vị trí (i,j) của
ma trận MxN đầu ra ảnh Y do vậy được gọi là ảnh đầu ra tại C(i,j).
- Một phần tử akl là phần tử trung tâm, trọng số hoặc hệ số của mẫu hồi
tiếp A, nếu và chỉ nếu (k,l) = (0,0). Để thuận tiện phân tích mẫu A như sau,
khi đó A0 và A lần lượt được gọi là các thành phần mẫu trung tâm và đường
biên.
AAA 0
0 0 0 a-1,-1 a-1,0 a-1,1
A 0 a0,0 0 A a0,-1 0 a0,1 (1.10)
0 0 0 a1,-1 a1,0 a1,1
+ Vai trò toán tử dẫn nhập đầu vào B(i,j;k,l)
Số hóa bởi Trung tâm Học liệu – ĐHTN
9
11
Bijkly(,;,)(,)kl Bikjlu kl bu k,, l i k j l (1.11)
CklSij(,)(,)r kirljr kirljr
b1, 1 b 1,0 b 1,1 ui 1, j 1 u i 1, j u i 1, j 1
b0,1 b 0,0 b 0,1** ui ,1 j u i , j u i ,1 j B U ij (1.12)
b1, 1 b 1,0 b 1,1 ui 1, j 1 u i 1, j u i 1, j 1
Ma trận B kích thước 3 x 3 được gọi là mẫu dẫn nhập hoặc mẫu vô
hướng đầu vào, và Uij là mặt nạ biên dịch ảnh đầu vào, tương tự ta có thể viết
Bo và B gọi là mẫu dẫn nhập trung tâm và đường biên.
BBB 0
0 0 0 b-1,-1 b-1,0 b-1,1
B 0 b0,0 0 B b0,-1 0 b0,1 (1.13)
0 0 0 b1,-1 b1,0 b1,1
- Kiến trúc xử lý của máy tính mạng nơron tế bào CNN-UM
Cấu trúc xử lý của tế bào C(i,j)
Hình 1.3. Mô tả kiến trúc của CNN
Mạng nơron tế bào được L.O. Chua và L. Yang đưa ra năm 1988 có
kiến trúc chuẩn là một mảng hai chiều các tế bào mà mỗi tế bào là một chip
xử lý, các tế bào chỉ có liên kết cục bộ với các tế bào láng giềng. Các tế bào
có cấu tạo giống hệt nhau gồm các điện trở, tụ tuyến tính; các nguồn dòng
tuyến tính và phi tuyến. Cho đến nay kiến trúc mạng CNN đã được phát triển
đa dạng phức tạp trong nhiều ứng dụng khác nhau nhưng vẫn hoạt động dựa
trên nguyên tắc mà Chua và Yang đưa ra. [7].
Số hóa bởi Trung tâm Học liệu – ĐHTN
10
1.1.1.3.Kiến trúc của máy tính mạng Nơron tế bào
- Cấu trúc phần cứng
Máy tính vạn năng CNN-UM có thể được coi là mảng các tế bào xử lý phi
tuyến đa chiều được liên kết cục bộ. CNN-UM có khả năng xử lý tín hiệu hỗn
hợp tương tự số do vậy có tên Analogic (Analog-logic) computer. Khác với
các máy tính lai, ở máy tính CNN không có các bộ biến đổi A/D và D/A và
cũng không có khái niệm biểu diễn các giá trị tương tự bằng số. Tất cả tín
hiệu và máy tính cơ bản đều là tương tự và logic.
Cấu trúc của máy CNN-UM được mô tả trong hình 1.4. Mạng nơron tế
bào gồm các tế bào có cấu trúc đồng nhất. Lõi của các tế bào này thực hiện
chức năng của hệ động lực chuẩn tế bào CNN như mô tả. Để mạng có thể
hoạt động và có khả năng lập trình thay đổi các trọng liên kết, ở mỗi tế bào
đều có bộ nhớ, các thanh ghi, các khối vào ra và truyền thông cục bộ. Ngoài
ra toàn mạng còn có khối lập trình toàn cục GAPU phục vụ cho điều hành
toàn mạng.
Hình 1. 4. Cấu trúc máy tính CNN-UM
Khối OPT (Optical Sensor) ở mỗi tế bào làm chức năng thu nhận tín
hiệu (điểm ảnh) đầu vào trực tiếp cho tế bào mà không cần bộ chuyển đổi
A/D. Bộ nhớ cục bộ Analog (LAM) và logic (LLM) lưu giữ các giá trị analog
Số hóa bởi Trung tâm Học liệu – ĐHTN
11
và logic của tế bào. Khối xử lý logic cục bộ (LLU) và khối logic đầu ra tương
tự cục bộ (LAOU) thực hiện các phép tính toán logic và tương tự cho mỗi tế
bào của mình. Các kết quả của mỗi tế bào được lưu giữ trong các bộ nhớ cục
bộ. Khối điều khiển và truyền thông cục bộ (LCCU) thực hiện chức năng điều
khiển và trao đổi thông tin giữa các tế bào lân cận và tới khối lập trình toàn
cục (GAPU). Khối lập trình tương tự - số toàn cục GAPU có các thanh ghi và
khối điều khiển toàn cục. Thanh ghi chương trình analog APR lưu trữ các
trọng số của tế bào mạng CNN. Trong trường hợp r = 1 tổng số trọng lưu trữ
là 19 số thực. Thanh ghi chương trình logic LPR chứa các lệnh logic cần thực
hiện cho các tế bào. Thanh ghi cấu hình chuyển mạch (SRC) chứa các thông
số khởi động và các tham số cho các chức năng hoạt động của tế bào. Khối
điều khiển tương tự số toàn cục (GACU) lưu các lệnh tuần tự của chương
trình chính (analogic) và thực hiện các chức năng điều khiển toàn cục khác.
Một thuật toán chạy trong CNN-UM có thể được thực hiện tuần tự qua các
lệnh analog và logic. Mức độ kết quả trung gian có thể được tổ hợp và lưu trữ
cục bộ. Các phép tính analog (analog operation ) được định nghĩa bởi các
trọng liên kết tuyến tính hoặc phi tuyến. Đầu ra có thể được định nghĩa cả
trong trạng thái xác định hoặc không xác định của mạng. Các phép tính logic
(NOT, AND, OR,) và số học (cộng, trừ) có thể được thực hiện trong mỗi tế
bào. Dữ liệu có thể được chuyển đổi giữa các bộ nhớ cục bộ LAM và LLM.
- Ngôn ngữ, chương trình dịch, hệ điều hành của CNN-UM
Số hóa bởi Trung tâm Học liệu – ĐHTN
12
Hình 1.5. Mô tả khái quát các bước lập trình ở các ngôn ngữ khác nhau
cho máy tính CNN-UM
Cũng như các máy tính điện tử khác CNN-UM có các ngôn ngữ để lập
trình từ mức thấp đến cao. Ở mức thấp nhất là mã máy, tiếp đến là ngôn ngữ
assemly của CNN được gọi là AMC (Analogic Macro Code). Mã AMC được
dịch thành mã máy và các tín hiệu điện cho chip CNN hoạt động. Ở mức cao
có ngôn ngữ a mô tả các chu trình xử lý, mẫu trọng số, các chương trình con.
Chương trình dịch a sẽ chuyển các lệnh ngôn ngữ a sang dạng hợp ngữ AMC
để chạy trên máy CNN. AMC có thể cho chạy trên phần cứng có chip CNN.
Hệ điều hành COS (CNN Operating System) được cài đặt trên các máy CNN-
UM phục vụ cho chạy các chương trình AMC cũng như giao tiếp với các hệ
Số hóa bởi Trung tâm Học liệu – ĐHTN
13
thống kết nối bên ngoài. Để phục vụ nghiên cứu và đào tạo ta có thể cho chạy
chương trình AMC trong môi trường mô phỏng số CNN-UM hoặc mô phỏng
mềm trên máy PC Pentium với hệ điều hành Windows hoặc Unix.
- Hệ điều hành CNN và giao diện vật lý CNN chuẩn. Hệ điều khiển
trên PC có thể tích hợp trên mainboard của máy PC gọi là PCS (CNN
Prototyping System Board).
- Nền tảng kết cấu vật lý cho CNN-UM: Cũng như máy tính PC, mỗi
xử lý đều được xây dựng nên từ các câu lệnh, có thể đóng gói thành các hàm
thư viện. CNN UM cũng cung cấp cho người dùng một tập thư viện các mẫu
và ngày càng được bổ sung thêm.[2]
1.1.1.4. Một số vấn đề cơ bản của CNN
- Giới hạn động lực học của CNN
Trước khi thiết kế một CNN vật lý cần phải biết rằng giới hạn động lực
học của nó có thoả mãn điều kiện để xây dựng các tế bào bằng các phần tử
bán dẫn hiện đang sử dụng trong lĩnh vực điện tử hay không. Ðây cũng là sự
khác nhau cơ bản giữa các CNN và các mạng nơron thông thường vì một
CNN có phạm vi động lực học thực sự có thể tính toán được.
- Ðộ ổn định của CNN.
Với một CNN xác định (A,B,z xác định), điều kiện khởi tạo, tín hiệu
vào bất kỳ thì sau quá trình quá độ phân rã về không trạng thái của mạch điện
sẽ hội tụ như thế nào và trong những điều kiện nào? Trả lời các câu hỏi này
vấn đề độ ổn định của CNN một lớp đơn chuẩn là:
+ Sau thời gian quá độ phân rã về 0 luôn thu được một hằng số tín hiệu
ở đầu ra của CNN.
+ Một CNN tuyến tính tiêu chuẩn một lớp luôn có các trạng thái cân
bằng ổn định.
Số hóa bởi Trung tâm Học liệu – ĐHTN
14
Trong một số trường hợp có thể sử dụng định lý về đối xứng dấu của
LO.Chua [8] để khảo sát nhanh chóng tính ổn định của CNN. Tuy nhiên có
những CNN không thoả mãn định lý đối xứng dấu này thì cũng không có
nghĩa là chúng không ổn định.
- Ðịnh nghĩa Mẫu đối xứng dấu [5]
Sáu kiểu giá trị của các hệ số trong ma trận mẫu A với mẫu 3x3 đã được
chứng minh là cho CNN ổn định [8]
Hình 1.6. Sáu kiểu hệ số của mẫu A (3x3) cho phép CNN ổn định
Trong đó:
- 0: ký hiệu giá trị hệ số mẫu A bằng 0.
- : ký hiệu giá trị hệ số mẫu A dương hoặc bằng 0.
Số hóa bởi Trung tâm Học liệu – ĐHTN
15
- : ký hiệu giá trị hệ số mẫu A âm hoặc bằng 0.
- 5: là một giá trị giả định.
1.2. Xử lý ảnh
1.2.1. Giới thiệu chung về xử ...lý ảnh dùng PDE có nhiều đặc tính tốt do:
- Tính chất cục bộ tự nhiên của PDE phù hợp với rất nhiều các đặc
điểm cục bộ của ảnh. Do vậy biểu diễn quá trình biến đổi ảnh qua PDE là rất
thích hợp.
- Ðã sẵn có nền tảng lý thuyết toán học về PDE chặt chẽ và phong phú
bao gồm sự hội tụ, tính ổn định, lời giải duy nhất
- Ðã có nhiều dạng sơ đồ rời rạc hoá cho thực hiện các thuật toán PDE.
- Thuật toán được mô tả ngắn gọn không dài dòng phức tạp và dễ hiểu.
- Dễ dàng khái quát hoá mở rộng chiều một cách đơn giản bằng cách sử
dụng các toán tử Laplace, divergence và gradient.
- Có thể quan sát được quá trình biến đổi thời gian thực của ảnh nếu sử
dụng công cụ CNN.
Các PDE được sử dụng để xử lý ảnh thường ở hai lớp: PDE khuếch tán
tuyến tính (hệ số khuếch tán hằng số, đẳng hướng) và PDE khuếch tán phi
tuyến (hệ số khuếch tán phi tuyến và không đẳng hướng).
Số hóa bởi Trung tâm Học liệu – ĐHTN
38
Cũng như với tất cả các tác vụ xử lý ảnh khác trên máy tính hệ lệnh
tuần tự xử lý ảnh dùng PDE gặp phải một vấn đề đó là tổng số lượng các phép
tính toán, xử lý rất lớn, điều này làm cho mong muốn xử lý ảnh thời gian thực
trong đa số các trường hợp yêu cầu là không thực hiện được. Tuy nhiên với
các mô hình CNN 1 lớp, nhiều lớp được thiết kế với các bộ mẫu thích hợp
việc giải các PDE này theo phương pháp sai phân sẽ chỉ tốn những khoảng
thời gian vài phần triệu giây, không phụ thuộc vào kích thước lưới sai phân,
cho phép thực hiện được các xử lý ảnh dùng PDE với thời gian thực.
Tuy nhiên các kết quả nghiên cứu về xử lý ảnh dùng PDE trên CNN
mới chỉ rất ít ỏi; đây là một thực tế khách quan bởi lực lượng nghiên cứu về
CNN chưa phải là rất đông đảo trong khi các công việc và hướng nghiên cứu
thì rất rộng:
- Đã có các mô hình CNN tìm biên dùng PDE. Đã có các nghiên cứu về
giảm nhiễu dùng PDE trên CNN với các phương trình tuyến tính các hệ số,
thành phần của PDE là số thực.
- Tuy nhiên các mô hình CNN thực hiện các PDE khuếch tán sử dụng
cho xử lý ảnh mới được quan tâm đến các mô hình CNN một lớp đơn. Các
thành phần và hệ số của các CNN thực hiện PDE này chỉ là số thực. Các mô
hình CNN nhiều lớp thực hiện PDE với các thành phần phi tuyến và phức áp
dụng cho xử lý ảnh chưa được quan tâm nghiên cứu.
- Nhiều công việc xử lý ảnh cơ bản hữu dụng như các bộ lọc shock, lọc
nhiễu đốm chưa được quan tâm xử lý trên CNN
- Cuối cùng là các mô hình, các thuật toán xử lý ảnh trên CNN (cũng
như các mô hình CNN cho các nhiệm vụ khác như giải PDE, quan sát đa mục
tiêu, ) cần phải được nghiên cứu tích hợp tạo ra bởi phần cứng để có các
sản phẩm nổi trội, sắc bén.
2.4.2. Công nghệ xử lý ảnh nhanh trên mạng CNN
Số hóa bởi Trung tâm Học liệu – ĐHTN
39
2.4.2.1. Tính ƣu việt và ý nghĩa
- Tính ƣu việt
Xử lý thông tin ảnh là một công việc khó khăn do tính bất định, đa
dạng của ảnh, do lượng thông tin cần xử lý vô cùng lớn. Xử lý ảnh dùng CNN
đã giải quyết được sự xung đột về lượng thông tin đồ sộ cần xử lý và tốc độ
thực hiện. Vấn đề xử lý ảnh thời gian thực, xử lý ảnh trong những khoảng thời
gian vài phần nghìn giây, xử lý ảnh từ nhiều nguồn thu khác nhau đã trở thành
hiện thực. Do tính chất động học liên tục về thời gian nên luồng ảnh được xử
lý (thực chất là luồng tín hiệu điện), trạng thái biến đổi của ảnh có thể quan
sát được liên tục, đây là thuộc tính không thể có được khi xử lý trên máy tính
tuần tự.
- Ý nghĩa khoa học:
Việc ứng dụng CNN cho các yêu cầu tính toán và xử lý nhanh đã cung
cấp cho xã hội con người một công cụ mạnh, sắc bén có tiềm năng lớn trong
các hoạt động khoa học, công nghệ, quân sự và dân dụng. Việc nghiên cứu về
CNN giúp cho việc thúc đẩy nghiên cứu tiếp cận các hoạt động sống của động
vật: các cơ chế thu nhận và xử lý âm thanh, hình ảnh, áp suất, ... của tai, mắt,
da,... của động vật có thể giống như mô hình các hệ thu và xử lý tín hiệu
CNN.
- Ý nghĩa thực tiễn
Một điều rất lý thú và cũng là đặc điểm nổi bật của mạng nơron tế bào
CNN là do tính đơn giản về kết cấu và chúng có giới hạn động lực học xác
định nên việc thực hiện trên phần cứng tương đối đơn giản hơn so với việc
cứng hoá các chip xử lý tuần tự. Các hệ thống xử lý ảnh tốc độ cao dùng CNN
có thể được cứng hoá trên các mảng FPGA, tích hợp trong các hệ nhúng sẽ là
những sản phẩm phổ biến trong thời kỳ hậu PC hiện nay. Ở mức cao hơn nữa
người ta tìm cách cứng hoá các thuật toán CNN. Khi đó các thuật toán sẽ
Số hóa bởi Trung tâm Học liệu – ĐHTN
40
được thực hiện với thời gian ở gần mức quá độ của mạch điện (thường
khoảng vài micro giây) có nghĩa là các thuật toán xử lý phức tạp sẽ chạy ngay
trực tiếp trên các mạch điện được thiết kế theo yêu cầu của nhiệm vụ cụ thể.
Ðiều này là hoàn toàn cho phép do công nghệ FPGA đang càng ngày càng
phát triển và giá thành càng hạ. Ðây cũng là một hướng nghiên cứu mở vô
hạn cho những người nghiên cứu về xử lý và tính toán thời gian thực dùng
CNN.
2.4.2.2. Tình hình nghiên cứu về xử lý ảnh dùng CNN trong nuớc
Từ đầu năm 2005 thông qua chương trình hợp tác khoa học công nghệ
quốc tế giữa Việt Nam và Hung-ga-ry công nghệ CNN tại Việt Nam đã được
bắt đầu nghiên cứu tại Viện Công nghệ thông tin - Viện Khoa học và Công
nghệ Việt Nam. Thông qua đề tài hợp tác các nhà nghiên cứu Việt Nam đã
làm chủ được những thành tựu mới nhất về CNN cả về lý thuyết và công
nghệ. Từ việc nắm bắt này nhiều nghiên cứu về CNN đã được tiến hành và
thu được kết quả tốt. Các thực nghiệm về nhận dạng thuốc viên tốc độ cao
trong khi sản xuất, nhận dạng sự phát sinh tia lửa điện bugi, phát hiện mất ốc
trên đường ray, phát hiện sự xuất hiện các trạng thái thay đổi đột ngột trong
thí nghiệm nổ bóng, nhận dạng vân tay,... dùng CNN đã được thực hiện thành
công.
Mặc dù mới tham gia vào lĩnh vực này nhưng nhiều đóng góp khoa học
nghiên cứu về CNN đã được công nhận trong các hội thảo khoa học quốc tế
như thuật toán khôi phục ảnh đối xứng thời gian thực, mô hình CNN 3 lớp
giải PDE cho bài toán ô nhiễm, giải PDE bài toán dòng chảy, mô hình CNN 2
lớp phức ứng dụng trong xử lý ảnh, các thuật toán lai giảm nhiễu, phân đoạn
ảnh các sơ đồ cứng hoá thuật toán lai, nghiên cứu ứng dụng camera CNN
nhận dạng hình ảnh trên robot tự động sử dụng trong công nghiệp...Hiện nay
việc nghiên cứu về ứng dụng CNN vẫn được tiếp tục phát triển thông qua các
Số hóa bởi Trung tâm Học liệu – ĐHTN
41
đề tài hợp tác quốc tế như Việt Nam-Hung-ga-ry. (chế tạo chip CNN giải
PDE dùng công nghệ FPGA),Việt Nam-Hàn Quốc 2010- 2011(sử dụng
camera CNN trong điều khiển xe bốc xếp hàng tự động tại kho cảng) mà đơn
vị thực hiện trực tiếp của Việt Nam là Viện Công nghệ thông tin-Viện Khoa
học và Công nghệ Việt Nam.[5].
2.4.2.3. Kết quả xử lý ảnh dùng CNN
Mạng nơron tế bào CNN cho phép xử lý các mảng tín hiệu tốc độ cao
bởi hai yếu tố cơ bản và khó có thể tách rời nhau:
- Một bộ xử lý tế bào trong mảng CNN là một mạch điện phi tuyến đơn
giản liên kết cục bộ với các bộ xử lý tế bào khác trong bán kính ảnh hưởng
trực tiếp có tốc độ xử lý tín hiệu đầu vào là thời gian quá độ của một mạch
điện (khoảng vài micro giây). Hàng chục ngàn bộ xử lý tế bào trong một chip
CNN xử lý hàng chục ngàn tín hiệu đầu vào khác nhau để cho ra đồng thời ở
đầu ra hàng chục ngàn tín hiệu đã được xử lý cũng chỉ cần một lệnh duy nhất
là bộ trọng số liên kết giữa các bộ xử lý này.
- Các cảm biến thu mảng tín hiệu (ánh sáng, áp suất, âm thanh,...) có
thể đưa trực tiếp vào đầu vào của mỗi nơron trong mạng nơron tế bào để xử lý
không cần qua các bộ ADC. Như vậy đã bỏ được rất nhiều khâu biến đổi,
truyền dẫn trung gian giữa tín hiệu cần xử lý và bộ xử lý.
Xử lý ảnh dùng CNN hiện nay đã thực hiện được tất cả các công việc kinh
điển mà một chương trình xử lý ảnh thường phải thực hiện:
- Tiền xử lý: Loại bỏ các đối tượng nhiễu, tăng cường độ tương phản,
tăng cường các thông tin cần quan tâm.
- Trích chọn đặc tính.
- Rút ra các quyết định.
Như đã nói ở phần trên xử lý ảnh dùng PDE là một hướng mới trong xử
lý ảnh. Ðã có rất nhiều nghiên cứu về xử lý ảnh dùng PDE trên máy tính hệ
Số hóa bởi Trung tâm Học liệu – ĐHTN
42
lệnh tuần tự, nhưng các kết quả nghiên cứu về xử lý ảnh dùng PDE trên CNN
mới chỉ rất ít ỏi; đây là một thực tế khách quan bởi lực luợng nghiên cứu về
CNN chưa phải là rất đông đảo trong khi các công việc và hướng nghiên cứu
thì rất rộng:
- Ðã có các mô hình CNN tìm biên dùng PDE. Ðã có các nghiên cứu
về giảm nhiễu dùng PDE trên CNN với các phương trình tuyến tính các hệ số,
thành phần của PDE là số thực.
- Tuy nhiên các mô hình CNN thực hiện các PDE khuếch tán sử dụng
cho xử lý ảnh mới được quan tâm đến là các mô hình CNN 1 lớp đơn. Các
thành phần và hệ số của các CNN thực hiện PDE này chỉ là số thực. Các mô
hình CNN nhiều lớp thực hiện PDE với các thành phần phi tuyến và phức áp
dụng cho xử lý ảnh đã chưa được quan tâm nghiên cứu.
- Nhiều công việc xử lý ảnh cơ bản, hữu phân đoạn ảnh chưa quan tâm
xử lý trên CNN.
- Cuối cùng là các mô hình, các thuật toán xử lý ảnh trên CNN (cũng
như các mô hình CNN cho các nhiệm vụ khác như giải PDE, quan sát đa mục
tiêu,...) cần phải được nghiên cứu tích hợp tạo ra bởi phần cứng để có các sản
phẩm nổi trội, sắc bén.
- Nếu xử lý trên mạng CNN thì theo lý thuyết tốc độ phân đoạn ảnh
nhanh hơn n lần so với CPU có cùng tốc độ xung nhịp (với n=NxM) .
2.4.2.4. Hạn chế và giải pháp ứng dụng CNN
- Hạn chế
Hạn chế khi sử dụng CNN là do sai số. Cũng như một số phương pháp
giải gần đúng PDE, khi giải trên CNN ta có những sai số (không kể sai số do
các phép do):
+ Sai số gây ra do phép làm tròn.
+ Sai số do sai phân phương trình ban đầu và lấy các giá trị xấp xỉ.
Số hóa bởi Trung tâm Học liệu – ĐHTN
43
- Giải pháp
Với độ sai số lớn có ba phương pháp:
+ Phương pháp thứ nhất: Thêm hệ CNN thứ cấp tính cho các đạo
hàm bậc cao bổ sung vào kết quả cuối cùng, như vậy ta phải thiết kế lại mẫu
dẫn đến có thể phải dùng hệ CNN đa lớp.
+ Phương pháp thứ hai: Dùng cấu trúc láng giềng r lớn hơn (r=2, 3)
với mẫu 5x5, 7x7 để tính cho thành phần đạo hàm bậc cao. Trường hợp
này, có thể xây dựng hệ CNN không đồng nhất.
+ Phương pháp thứ ba: Dùng phương pháp huấn luyện qua thực
nghiệm để tìm ta mẫu tối ưu với độ chính xác chấp nhận được. Ðây là phương
pháp đã được sử dụng trong một số bài toán.
2.4.3. Mẫu và vai trò của mẫu
2.4.3.1. Giới thiệu chung
Các máy tính vạn năng tương tự logic CNN-UM xử lý song song với
hàng chục ngàn bộ xử lý đồng thời làm việc bởi một lệnh duy nhất đã được
phát minh năm 1993 dựa trên nền tảng công nghệ mạng nơron tế bào CNN
.Đây là một bước đột phá về chất trong lĩnh vực công cụ xử lý so với các máy
tính số thực hiện hệ lệnh tuần tự. Các tế bào của mạng nơron (các tế bào xử
lý) xử lý các mảng tín hiệu analog hoặc các mảng tín hiệu đồng thời cùng một
lúc bằng một lệnh duy nhất cho tất cả các tế bào, điều mà các máy tính số
không thực hiện được. Do tính chất động học liên tục về thời gian, bố trí
không gian đồ sộ các mảng bộ xử lý nên các CNN-UM có thể thực hiện các
tác vụ xử lý có yêu cầu ngặt nghèo về không - thời gian trong thời gian thực.
Các máy tính vạn năng chế tạo trên nền tảng công nghệ CNN được sử
dụng đắc lực trong các lĩnh vực xử lý ảnh, quan sát đa mục tiêu di động, giải
phương trình vi phân đạo hàm riêng nhiều biến và nhiều lĩnh vực khác.
Số hóa bởi Trung tâm Học liệu – ĐHTN
44
Hình 2.4. Hệ động lực của một tế bào CNN
Trạng thái ổn định của mạng CNN sau thời gian quá độ phụ thuộc vào
bộ ba ma trận trọng số liên kết (A, B, z) của mạng CNN. A, B được gọi là các
toán tử hồi tiếp và các toán tử điều khiển hoặc còn được gọi là các mẫu vô
tính (một số tài liệu còn dùng từ tập gien để chỉ các toán tử này). Trong mạng
CNN 2D đồng nhất, tuỳ theo bán kính liên kết các láng giềng của một tế bào r
= 1, r = 2 hay r = 3 mà A, B sẽ là các ma trận trọng số 3x3, 5x5 hoặc 7x7. z là
dòng ngưỡng của tế bào. Bộ ba trọng số liên kết (A, B, z) chính là chương
trình của mạng CNN. Với mỗi yêu cầu xử lý cụ thể sẽ có một bộ (A, B, z)
riêng. Phối hợp các bộ (A, B, z) khác nhau sẽ thu được kết quả mong muốn ở
đầu ra của mạng CNN khi đưa các tín hiệu vào đầu vào để xử lý. Trong
những thời kỳ đầu, các mẫu của CNN được chế tạo cứng, như vậy rất bất tiện
cho sử dụng khi cần thay đổi mẫu với các nhiệm vụ xử lý khác nhau. Về sau
khi CNN - UM ra đời các mẫu được chứa trong bộ nhớ mẫu và có thể thay đổi
được [9]. Ngày nay các mẫu cho CNN đã có thể được nạp và thay đổi một
cách dễ dàng từ các máy tính PC sử dụng các hệ điều hành Windows 2000,
XP. Mẫu là một vấn đề mấu chốt trong CNN và vẫn đang được các nhà
nghiên cứu trên thế giới dành thời gian nghiên cứu nhằm tìm ra những con
đường thiết kế mẫu mới, tìm ra những mẫu mới phục vụ cho các yêu cầu xử
lý ngày càng đa dạng trong thực tiễn.
Số hóa bởi Trung tâm Học liệu – ĐHTN
45
2.4.3.2. Thƣ viện mẫu CNN
Một số mẫu cơ bản đã được các nhà khoa học thuộc Viện hàn lâm khoa
học Hungary soạn thảo tập hợp trong thư viện phần mềm các mẫu cho CNN
(CNN Software Library 2.1) [4]. Các mẫu này có thể được sử dụng qua các
hàm của các thư viện phần mềm hoạt động trên các thiết bị CNN như
InstantVision chạy trên thiết bị Bi-I sử dụng chip ACE16k. Các mẫu này cũng
có thể được người sử dụng nạp trực tiếp từ các file text chứa mẫu vào
ACE16k và sau quá trình quá độ ta nhận được kết quả ở đầu ra. Có thể tải các
mẫu từ trang web của Viện nghiên cứu máy tính và tự động hoá thuộc Viện
hàn lâm khoa học Hungary. Các mẫu này bao gồm các mẫu thực hiện các tác
vụ cơ bản cho xử lý ảnh như phân ngưỡng, dò biên, thực hiện logic, hình thái
học, ...ngoài ra còn có một số mẫu như mẫu dò tìm sự di chuyển trên ảnh
xám, phân vùng các mẫu dệt, vải, chọn các đối tượng được đánh dấu, giải
phương trình vi phân đạo hàm riêng PDE, ... Một số ví dụ về mẫu như sau:
Mẫu tìm vùng
Hình 2.5. Mẫu tìm vùng và hiệu quả của mẫu
Mẫu chọn các đường nghiêng trong ảnh xám
Số hóa bởi Trung tâm Học liệu – ĐHTN
46
Hình 2.6. Mẫu tìm đường xiên và hiệu quả của mẫu
Mẫu giải phương trình PDE Laplace
Mạng nơron tế bào CNN như đã nói ở trên là một hệ tính toán song
song đặc biệt thuận tiện cho các tác vụ xử lý các luồng mảng tín hiệu. Với cấu
trúc liên kết cục bộ giống nhau ở tất cả các tế bào của mạng nên mạng CNN
dễ dàng được thực thi trên một chip CMOS, FPGA. Hoạt động của mạng
CNN hoàn toàn được xác định bởi bộ mẫu liên kết cục bộ. Việc thiết kế các
mẫu liên kết cho mạng CNN là một vấn đề khó vì thực chất là bài toán xác
định các tham số cho một hệ động lực phi tuyến phụ thuộc cả các biến không
gian và thời gian cho một tác vụ xử lý cụ thể.
Trong khi xây dựng các ứng dụng mạng nơron tế bào CNN truớc hết
người ta xác định mô hình của mạng: 1 lớp hay nhiều lớp, cấu trúc mối liên
kết cục bộ...Sau đó là bước thiết kế bộ mẫu (hoặc các bộ mẫu với mạng nhiều
Số hóa bởi Trung tâm Học liệu – ĐHTN
47
lớp) xác định hành vi động học của mạng. Ðây chính là bước xác định giá trị
của các hệ số trong các ma trận A, B và giá trị nguỡng z sao cho ứng với các
bộ giá trị đó mạng CNN đảm bảo thu được mảng các giá trị đầu ra theo yêu
cầu. Việc xử lý tính toán trên mạng CNN về bản chất là tìm được các mô
hình, các bộ mẫu cơ bản, các thuật toán cơ sở phối hợp các bộ mẫu cho ứng
dụng cụ thể. Trên máy tính PC dùng các câu lệnh sai, thuật toán sai thì không
thể thu được kết quả mong muốn sau khi chạy chương trình. Cũng như vậy
trên máy tính CNN- UM sẽ không nhận được kết quả đúng khi chạy các bộ
mẫu được thiết kế sai.
2.4.3.3. Các phƣơng pháp thiết kế mẫu cho CNN
- Sử dụng các mặt nạ trong kỹ thuật xử lý ảnh truyền thống
Dùng các mặt nạ đã được sử dụng, kiểm nghiệm trong quá trình xử lý
ảnh trên máy tính số như các mẫu lọc trung bình, các mẫu co ảnh, dãn
ảnh,Trong mạng CNN mặt nạ này được dùng làm ma trận A cho phép thực
hiện các phép biến đổi tương đương.
- Phân tích hoạt động của CNN để tìm ra mẫu
Theo phương pháp này để tìm ra một tập mẫu trước hết cần phải phân
tích mô tả hoạt động của mẫu đó thành các tác vụ chi tiết – các luật cục bộ sau
đó dựa vào phương trình trạng thái và đồ thị quan hệ giữa biến trạng thái và
đạo hàm bậc nhất của nó để xác định mẫu.
- Phương pháp thiết kế mẫu dùng bảng logic
Phương pháp này được L.O Chua phân tích đầu tiên. Đây là phương
pháp xác định các mẫu cho các mạng CNN không ghép cặp mẫu A chỉ có
thành phần trung tâm khác 0 các thành phần khác bằng 0. Phương pháp này
có đặc điểm đơn giản nhưng chỉ áp dụng được với các ảnh nhị phân và các táp
vụ không phức tạp.
-Phương pháp thiết kế mẫu trực tiếp
Số hóa bởi Trung tâm Học liệu – ĐHTN
48
Đây là phương pháp dùng thiết kế mẫu cho xử lý ảnh nhị phân được
Akos Zarandy đề xuất. Phương pháp này được dùng để thiết kế mẫu khi
nhiệm vụ yêu cầu đã được xác định chính xác. Các mẫu tìm được có thể cho
mạng CNN ghép cặp hoặc không ghép cặp. Trình tự tiến hành thiết kế mẫu
theo phương pháp trực tiếp theo 4 bước sau:
Tạo hệ
Định hình Giải hệ thống quy Chọn mẫu
thống quy luật
dạng mẫu luật quan hệ mạnh nhất
quan hệ
Hình 2.7. Sơ đồ các bước thiết kế mẫu theo phương pháp trực tiếp
- Thiết kế mẫu dùng phương pháp học
Phương pháp học để tìm bộ trọng số liên kết (bộ mẫu trong mạng CNN
là phương pháp học theo tham số và có giám sát. Đầu vào của thủ tục học là:
các ảnh cần xử lý và ảnh yêu cầu ở đầu ra điều kiện đối xứng của các hệ số
ma trận mẫu. Đầu ra của thủ tục là bộ mẫu cần tìm gồm 2 ma trận 3x3 (18 hệ
số ma trận) và một tham số ngưỡng. Tổng cộng là 19 tham số cần tìm cho một
bộ mẫu. Mẫu học là phương pháp thiết kế rất quan trọng khi mà đầu ra yêu cầu
tồn tại không rõ ràng, việc thiết kế mẫu trực tiếp không thực hiện được ví dụ
như khi phân đoạn các mẫu dệt.
Quy trình tìm mẫu bằng phương pháp học
Số hóa bởi Trung tâm Học liệu – ĐHTN
49
đầu vào Nạp mẫu
Yêu cầu xử lý cụ
thể
đầu ra
Hình 2.8. Quy trình tìm mẫu bằng phương pháp học
- Bƣớc 1: Nạp ảnh đầu vào;
- Bƣớc 2: Đưa yêu cầu xử lí (ví dụ làm mờ, dò biên, dãn ảnh);
- Bƣớc 3: Thực hiện các xử lý logic hoặc analogic để tìm mẫu;
- Bƣớc 4: Thực thiện xử lí song song với mẫu tìm được;
- Bƣớc 5: Đánh giá kết quả thu được, nếu đầu ra chưa hội tụ đến đầu ra của
biên lí tưởng tiến hành quay trở lại bước 3 cho tới khi đạt được mẫu CNN tối
ưu
2.5. Thuật toán phân đoạn ảnh trên CNN
- Bƣớc 1: Nạp đầu vào
CNN được khai thác để xử lý hình ảnh bằng cách kết hợp mỗi pixel của hình
ảnh để các đầu vào có thế là một ảnh hoặc một chuỗi các điểm ảnh. Sau đó, các
pixel và đầu ra của ma trận CNN phát triển để đạt được một trạng thái cân
bằng.
- Bƣớc 2: Nạp mẫu xử lý
Nạp mẫu xử lý chính là đưa các tín hiệu đầu vào để thực hiện các chương
trình xử lý.
Số hóa bởi Trung tâm Học liệu – ĐHTN
50
Mẫu có thể sử dụng các mẫu có sẵn trong thư viện mẫu hoặc thiết kế mẫu
theo yêu cầu sử dụng.
- Bƣớc 3: Xử lý chương trình
Sau khi nạp mẫu xử lý theo yêu cầu, sẽ thực hiện việc chạy chương trình theo
phần mềm sử dụng
- Bƣớc 4: Kiểm tra kết quả nếu phù hợp thì đưa ra kết quả, nếu không thì
quay lại bước 2.
- Bƣớc 5: Đưa ra kết quả xử lý
Đưa ra kết quả xử lý là công đoạn cuối cùng trong tiến trình phân đoạn trên
CNN.
Thuật toán có thể đƣợc khái quát theo sơ đồ:
Chuỗi đầu vào
Mẫu xử lý
Xử lý
S
Kiểm tra
Đ
Chuỗi đầu ra
Hình 2.9. Sơ đồ cơ bản của thuật toán
Số hóa bởi Trung tâm Học liệu – ĐHTN
51
2.6. Kết luận
Thao tác phân đoạn ảnh phục vụ cho việc trích chọn thông tin từ ánh
gốc để phục vụ cho nhiều ứng dụng trong đó có ứng dụng vào hệ thống tính
toán điều khiển, tự động hóa quá trình sản xuất.
Để đưa vào ứng dụng trong điều khiển dây chuyền sản xuất công
nghiệp cần hệ thống nhỏ gọn chuyên dụng nếu đưa vào xử lý trên máy PC thì
cồng kềnh phức tạp cần có chip xử lý chuyên dụng cho từng lĩnh vực sản
xuất cụ thể. Do vậy,, thực hiện thao tác phân đoan ảnh theo thuật toán CNN
làm nền tảng cơ sở để chế tạo chip chuyên dung cho các ứng dụng cụ thể
nâng cao năng lực tính toán của các bộ vi xử lý nói riêng và của lính vực công
nghệ thông tin nói chung. Theo xu thế mở rộng công năng của máy tính trong
nhiều lĩnh vực khác nhau. Ngoài ra, việc nghiên cứu xử lý ảnh trên CNN còn
có những khả năng xử lý đặc trưng như dùng PDE, hàm khuếch tán, khuếch
tán phức...làm cho giải quyết bài toán ứng dụng càng thêm phong phú.
Từ nghiên cứu phân tích bài toán ở chương này ta có thể cài đặt thử nghiệm
trong chương 3
\
Số hóa bởi Trung tâm Học liệu – ĐHTN
52
Chƣơng III
MÔ PHỎNG THUẬT TOÁN PHÂN ĐOẠN ẢNH BẰNG CNN
3.1. Mô tả bài toán mô phỏng
3.1.1. Phát hiện biên
Để phân đoạn ảnh thì đầu tiên phải tìm được biên và tách biên để phân
chia thành các vùng khác nhau có cùng tính chất nào đó. Việc phát hiện sự
thay đổi của cường độ nhằm mục đích tìm các biên có thể được thực hiện
bằng cách lấy các đạo hàm cấp một hoặc cấp hai.
3.1.1.1. Phát hiện điểm
Việc phát hiện các điểm tách biệt trong một ảnh là đơn giản. Sử dụng
mặt nạ được cho như sau:
Hình 3.1: mặt nạ xác định điểm
a. Mặt nạ phát hiện điểm.
b. Ảnh tia X của tuabin khí trạng thái rổng bên trong.
c. Kết quả của phát hiện điểm.
d. Kết quả việc sử dụng phương trình.
Đó là một điểm đã được phát hiện tại vị trí mà mặt nạ là trung tâm, nếu:
│R│ ≥ Z (3.1) Z: nguỡng không âm,
(3.1)
Về cơ bản, phương trình (3.1) là do sự khác nhau giữa điểm trung tâm
và những điểm lân cận. Một Điểm tách biệt (một điểm mà mức xám của nó
Số hóa bởi Trung tâm Học liệu – ĐHTN
53
khác nhau đáng kể và nó được đặt tại vùng đồng nhất hay gần đồng nhất), sẽ
hơi khác với những điểm xung quanh nó, và vì vậy sẽ dễ dàng được phát hiện
bởi loại mặt nạ này. Tuy nhiên, điểm nổi bật ở đây là việc phát hiện các điểm.
Nghĩa là sự khác biệt được quan tâm phải đủ lớn để xem xét số điểm tách
biệt.
Các hệ số mặt nạ có tổng là không, nghĩa là đáp ứng mặt nạ sẽ bằng
không trong những vùng mà mức xám không đổi.
3.1.1.2. Phát hiện dòng
Xét các mặt nạ được cho trong hình sau:
Ngang +450 Dọc -450
Hình 3.2: Mặt nạ phát hiện dòng
Nếu mặt nạ đầu tiên được di chuyển quanh một ảnh thì nó sẽ đáp ứng
tốt hơn cho các dòng theo hướng.
Ðặt R1, R2, R3, R4 ký hiệu cho các đáp ứng của các mặt nạ trong Hình
3.2, từ trái sang phải.
Giả sử bốn mặt nạ riêng lẽ đi qua một điểm ảnh. Nếu tại một số điểm
ảnh │Ri│≥│Rj, với tất cả i≠j thì điểm đó được gọi là hơi có vẽ liên kết với
một đường theo hướng mặt nạ thứ i. Ví dụ, nếu tại một điểm trong ảnh
│Ri│≥│Rj│, với j=2,3,4. Điểm cụ thể đó được gọi là có nhiều khả năng liên
kết với một dòng ngang. Ngoài ra, có thể quan tâm đến việc phát hiện những
dòng theo hướng cụ thể. Trong trường hợp này, sẽ sử dụng mặt nạ này kết
hợp với hướng và ngưỡng ngõ ra của nó, như trong phương trình 3.1.
Số hóa bởi Trung tâm Học liệu – ĐHTN
54
Nói cách khác, nếu quan tâm đến việc phát hiện tất cả các dòng trong
một ảnh theo hướng được xác định bằng một mặt nạ cho sẵn, chỉ đơn giản
trượt mặt nạ qua các ảnh này và lấy ngưỡng trị tuyệt đối của kết quả này. Các
điểm bên trái là những đáp ứng mạnh nhất cho các đường có độ dày một pixel
tương ứng gần nhất với hướng được xác định bằng mặt nạ này.
(a)
(b)
(c)
Hình 3.3. Minh họa việc phát hiện dòng
a. Mặt nạ nối dây nhị phân
b. Lấy trị tuyệt đối của kết quả thực hiện với bộ phát hiện đường -450
c. Kết quả lấy ngưỡng ảnh (b)
Số hóa bởi Trung tâm Học liệu – ĐHTN
55
3.1.1.3. Phát hiện cạnh
Theo quan sát, một cạnh là một bộ liên thông các pixel mà nằm trên
đường bao giữa hai vùng. Một định nghĩa hợp lý của "cạnh" đòi hỏi khả năng
đo được sự chuyển đổi mức xám.
Một cạnh lý tưởng có các đặc điểm của mô hình được cho trong trong
mô hình một cạnh lý tưởng như sau:
Mô hình một cạnh lý tƣởng
Hình 3.4. Biểu đồ mức xám của đường ngang
Một cạnh lý tuởng theo mô hình này là một tổ hợp các liên thông pixel
mà mỗi một pixel được đặt tại một mức chuyển đổi mức xám trực giao.
Thực tế, việc sai hỏng thu nhận ảnh quang, ảnh lấy mẫu, và ảnh khác
tạo ra các ảnh bị nhòe, với mức độ nhòe được xác định bởi các yếu tố như
chất lượng của hệ thống thu nhận ảnh, tốc độ lấy mẫu, và dưới các điều kiện
chiếu sáng mà ảnh được thu. Theo một kết quả nghiên cứu, các cạnh được mô
hình dày hơn như có một đường bao “hơi nghiêng”.
Mô hình cạnh nghiêng
Số hóa bởi Trung tâm Học liệu – ĐHTN
56
Hình 3.5. Biểu đồ mức xám của đường nghiêng thông qua ảnh
3.1.1.4. Phát hiện biên Candy
Mặc dù rất phức tạp nhưng thuật toán canny nhìn chung có ưu điểm
hơn cho việc phát hiện biên. Phương pháp tiếp cận của canny là dựa trên 3
mục tiêu chính:
- Tỷ lệ sai thấp: Tất cả các biên cần được phát hiện không nên đáp ứng
với tạp nhiễu. Nghĩa là biên được tách càng dày đặc thì càng tốt so với biên
thực.
- Các điểm biên nên được xác định chính xác: Các biên được xác định
phải càng dày đặc càng tốt so với biên thực. Nghĩa là: khoảng cách giữa một
điểm được đánh dấu bằng một biên và tâm của biên thực nên nhỏ.
- Ðáp ứng điểm đơn biên: Bộ dò biên nên trả về một điểm cho mỗi
điểm biên thực. Nghĩa là: số luợng vị trí tối đa xung quanh biên thực nên nhỏ.
Ðiều này có nghĩa là bộ dò không nên xác định nhiều pixel biên mà ở đó chỉ
duy nhất một điểm đơn biên tồn tại.
Bản chất của thuật toán canny là biểu diễn theo toán học 3 tiêu chuẩn
đó và cố gắng tìm ra giải pháp tối ưu cho những mục đích này. Nhìn chung rất
khó để tìm ra giải pháp mà thỏa mãn cả 3. Tuy nhiên, việc sử dụng tối ưu hóa
số với các biên bậc 1-D bị nhiễu bởi nhiễu Gauss trắng dẫn đến giải pháp mà
xấp xỉ tốt cho bộ dò bậc tối ưu là lấy đạo hàm cấp 1 của một hàm gauss như
sau :
(3.2)
Kết quả này đối với 2-D giải quyết việc nhận dạng mà phương pháp 1-
D vẫn áp dụng theo hướng của biên chuẩn. Do hướng của biên chuẩn được
biết trước, điều này sẽ cần áp dụng bộ dò biên 1-D trong tất cả các hướng có
thể. Công việc này có thể được xấp xỉ bằng cách làm trơn ảnh trước tiên với
Số hóa bởi Trung tâm Học liệu – ĐHTN
57
một hàm gauss 2-D, tính toán đạo hàm cấp 1 của kết quả này và sau đó sử
dụng độ lớn và hướng đạo hàm cấp một để ước tính độ lớn và hướng biên tại
mọi điểm.
Ðặt f(x, y) ảnh ngõ vào, G(x, y) ký hiệu hàm Gauss:
(3.3)
Tạo một ảnh được làm nhẵn
(x,y)=G(x,y)* (x,y) (3.4)
Phép tính này được suy ra bằng cách tính đạo hàm cấp 1 theo biên độ:
M(x,y) = (3.5)
Đạo hàm cấp 1 theo hướng (góc)
(x,y) = và (3.6)
Bất kỳ cặp mặt nạ nào trong hình trên đều có thể được dùng để đạt được gx và
gy. Phương trình (x,y)=G(x,y)* (x,y) được thực hiện bằng cách dùng mặt
nạ Gauss nxn.
M(x,y) và (x,y) là mảng có cùng kích thước bằng với ảnh mà chúng
được tính toán.
Bởi vì nó được tạo ra bằng cách dùng đạo hàm cấp 1, M(x, y) chứa các
đường ngoằn ngèo rộng xung quanh vị trí lớn nhất. Tiếp theo là làm mảnh
đường này. Một phương pháp là sử dụng triệt điểm không cực đại. Bản chất
của phương pháp là để định rõ một hướng biên chuẩn rời rạc. Ví dụ trong
vùng 3×3 có thể định 4 hướng cho một biên thông qua điểm trung tâm của
vùng ngang, dọc, +450, -450. Bởi vì phải lượng tử tất cả các huớng biên theo 4
hướng nên phải định một phạm vi hướng mà ta xét đến biên ngang. định
hướng biên theo hướng của một biên chuẩn mà nhận được từ dữ liệu ảnh bằng
cách dùng phương trình:
Số hóa bởi Trung tâm Học liệu – ĐHTN
58
(x,y) =
Ví dụ:
(a) (b)
Hình 3.6. Mặt nạ phát hiện cạnh và 8 hướng cạnh
a. 2 hướng có khả năng của một cạnh ngang trong cửa sổ 3×3
b. Giá trị, góc hướng của cạnh chuẩn so với cạnh ngang
3.1.2. Bài toán phân đoạn ảnh
3.1.2.1. Công thức cơ sở
Với R đặc trưng toàn bộ miền ảnh. có thể xem sự phân đoạn như một
quá trình mà nó phân chia R thành n miền con, R1, R2, ,Rn, như sau:
Ðiều kiện này chỉ ra rằng phân đoạn phải hoàn thành, trong đó mỗi điểm ảnh
phải trong một miền.
- Ri là một miền liên thông, i=1,2,,n
Ðiều kiện này yêu cầu là các điểm trong một miền phải được kết nối trong các
cảm nhận được xác định trước.
- Ri I Rj = cho mọi i và j, i ≠j
Ðiều kiện này chỉ ra rằng các miền phải được tháo rời ra.
- P(Ri)=TRUE với i=1,2,...,n
Số hóa bởi Trung tâm Học liệu – ĐHTN
59
Ðiều kiện này đối phó với các tính chất mà nó phải được thỏa mãn bởi các
điểm ảnh trong một miền phân đoạn cho ví dụ P(Rt) = TRUE nếu toàn bộ các
điểm ảnh trong R có cùng mức xám
- P(Ri Rj)=FALSE với i ≠j
Điều kiện này chỉ ra rằng các miền Ri và Rt khác nhau trong cảm nhận của dự
đoán P.
3.1.2.2. Tăng trƣởng miền ảnh
Tăng trưởng miền ảnh là một thủ tục mà các nhóm các điểm ảnh hay
các miền con trong các miền lớn hơn dựa trên tiêu chuẩn được định nghĩa
trước.
(a) (b)
(b) (d)
Hình 3.7. Ví dụ về tăng trưởng miền ảnh
a. Ảnh bị hỏng nặng
b. Các điểm hạt
c. Kết qủa của tăng vùng
d. Đường bao của các phần hỏng
Số hóa bởi Trung tâm Học liệu – ĐHTN
60
Hình 3.7(a) biểu hiện một ảnh tia X của một mối hàn (miền tối hàng
ngang) chứa vài vết nứt và trạng thái xốp (ánh sáng, đường sọc trắng chạy
theo hàng ngang xuyên qua trung điểm của ảnh). mong đợi sử dụng tăng
trưởng miền để phân đoạn các miền lỗi của mối hàn. Các cấu hình phân đoạn
này có thể được sử dụng cho việc kiểm tra một hệ thống mối hàn tự động, và
cho các ứng dụng số học khác.
Ðầu tiên là quyết định điểm khởi đầu. Trong ứng dụng này, nó được
biết như các điểm ảnh của các mối hàn bị hỏng dẫn đến có giá trị số có thể
cho phép tối đa (255 trong truờng hợp này). Dựa trên thông tin này, chọn các
điểm bắt đầu trên toàn bộ các điểm ảnh có giá trị của 255. Các điểm được
trích từ ảnh nguồn được biểu hiện trong Hình 3.7(b).
Tiếp theo là chọn tiêu chuẩn cho sự p
Các file đính kèm theo tài liệu này:
- nghien_cuu_ung_dung_cong_nghe_mang_noron_te_bao_vao_bai_toan.pdf