Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
LUẬN VĂN THẠC SỸ KỸ THUẬT
ĐỀ TÀI: TÌM HIỂU PHÉP TOÁN HÌNH THÁI, PHƯƠNG PHÁP DI TRUYỀN VÀ
ỨNG DỤNG
HỌC VIÊN THỰC HIỆN: PHẠM ĐĂNG TỨ
GIÁO VIÊN HƯỚNG DẪN: PGS.TS. NGÔ QUỐC TẠO
THÁI NGUYÊN – NĂM 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
LỜI CẢM ƠN
Trong lời đầu tiên của báo cáo luận văn tốt nghiệp “Tìm hiểu phép toán hình
thái, phương pháp di truyền và ứng dụng” n
72 trang |
Chia sẻ: huyen82 | Lượt xem: 1600 | Lượt tải: 1
Tóm tắt tài liệu Tìm hiểu phép toán hình thái, phương pháp di truyền và ứng dụng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ày, tôi muốn gửi những lời cảm ơn và
biết ơn chân thành của mình tới tất cả những người đã hỗ trợ, giúp đỡ tôi về chuyên
môn, vật chất và tinh thần trong quá trình thực hiện luận văn.
Trước hết, tôi xin chân thành cảm ơn PGS. TS. Ngô Quốc Tạo thuộc viện
Công nghệ thông tin, người đã trực tiếp hướng dẫn, nhận xét, giúp đỡ tôi trong suốt
quá trình thực hiện luận văn.
Xin chân thành cảm ơn Khoa Công nghệ thông tin, Viện Công nghệ thông
tin đã giúp đỡ tôi trong suốt quá trình học tập và nghiên cứu.
Tôi cũng xin bày tỏ lòng biết ơn đến gia đình và những người bạn thân đã
giúp đỡ, động viên tôi rất nhiều trong suốt quá trình học tập và làm luận văn tốt
nghiệp.
Do thời gian thực hiện có hạn, kiến thức chuyên môn còn nhiều hạn chế nên
đồ án tôi thực hiện chắc chắn không tránh khỏi những thiếu sót nhất định. Tôi rất
mong nhận được ý kiến đóng góp của thầy, cô giáo và các bạn.
Xin chân thành cảm ơn !
Thái Nguyên, tháng 11/2009
Phạm Đăng Tứ
Trang 1
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
MỤC LỤC
DANH MỤC CÁC HÌNH VẼ
LỜI NÓI ĐẦU 5
Chƣơng I. Giới thiệu chung về xử lý ảnh và phƣơng pháp nâng
cao chất lƣợng hình ảnh
7
1. Giới thiệu chung về xử lý ảnh 7
2. Giới thiệu ảnh nhị phân 9
2.1. Một số khái niệm 9
2.2. Đặt bài toán nâng cao chất lượng ảnh bằng các phép toán hình
thái
11
2.3. Đặt bài toán nâng cao chất lượng ảnh bằng kỹ thuật tìm xương
và làm mảnh
13
3. Khái quát về phương pháp nâng cao chất lưởng hình ảnh 14
Chương II: Các khái niệm cơ bản về toán học hình thái 16
1. Quan hệ giữa khái niệm tập hợp và phép toán hình thái 16
1.1. Một số khái niệm cơ bản về tập hợp 17
1.2. Các phép toán logic trên ảnh nhị phân 20
2. Phép toán làm béo (Dilation) và làm gầy (Erosion) 21
2.1. Làm béo 21
2.2. Làm gầy 23
2.3. Phép toán Opening và Closing 23
2.4. Biến đổi Hit or Miss 27
3. Một số thuật toán dựa trên phép toán hình thái 28
3.1. Trích chọn biên 28
3.2. Tô miền 30
3.3. Tách các thành phần liên thông 31
3.4. Làm mảnh 33
3.5. Làm dầy 34
3.6. Tìm xương của ảnh 35
Chƣơng III: Thuật toán di truyền 37
Trang 2
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1. Thuật toán di truyền là gì? 37
2. Sử dụng thuật toán di truyền trong toán học hình thái 37
3. Hoạt động của thuật toán di truyền 38
3.1. Quá trình lai ghép (phép lai) 41
3.2. Quá trình đột biến (phép đột biến) 43
3.3. Quá trình sinh sản và chọn lọc (phép tái sinh và phép chọn) 44
4. Mô hình thuật toán 44
Chƣơng IV: Một cách tiếp cận di truyền trong bài toán phân rã
phân tử cấu trúc
46
1. Tiếp cận ngẫu nhiên 50
2. Cấu trúc dữ liệu 51
3. Giải thuật dựa trên thuật toán tìm kiếm di truyền 55
Chƣơng V: Thực nghiệm 61
1. Mô tả bài toán và giả thuyết 61
2. Giao diện chính của chương trình 61
3. Một số kết quả thử nghiệm 62
Chƣơng VI: Kết luận 67
Trang 3
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
DANH MỤC CÁC HÌNH VẼ
Hình I.1. Sơ đồ quy trình xử lý ảnh 8
Hình I.2. Mô hình tổng quát của hệ thống nhận dạng ảnh 13
Hình II.1.1. Ảnh nhị phân 16
Hình II.1.2. Ảnh đa cấp xám 17
Hình II.1.3. Các phép toán cơ bản trên tập hợp 19
HÌnh II.1.4. Các phép toán cơ bản 20
Hình II.2.1. Phép toán dilation 22
Hình II.2.2. Ứng dụng của phép toán dilation 22
Hình II.2.3. Loại bỏ thành phần nhiễu 23
Hình II.2.4. Phép toán Opening 24
Hình II.2.5. Phép toán Closing 24
Hình II.2.6. Phép toán Opening và Closing 25
Hình II.2.7. Xử lý nhiễu trong ảnh vân tay 26
Hình II.2.8. Phép toán Hit ỏ Miss 27
Hình II.3.1. Trích chọn biên 29
Hình II.3.2. Ảnh được trích chọn biên 30
Hình II.3.3. Ví dụ thuật toán tô miền . 31
Hình II.3.4. Tìm các thành phần liên thông trong ảnh 32
Hình II.3.5. Xác định vật thể lạ trong ảnh 33
Hình II.3.6. Làm mảnh ảnh 34
Hình II.3.7. Làm dầy ảnh 35
Hình II.3.8. Tìm xương của ảnh 36
Hình III.1. Mô phỏng quá trình tiến hóa 40
Hình III.2. Lai ghép một điểm 42
Hình III.3. Lai ghép hai điểm 42
Hình III.4. Cắt và ghép 42
Hình III.5. Ví dụ về phép lai . 43
Hình III.6. Đột biến tại bít thứ 6 44
Trang 4
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Hình III.7. Mô tả hoạt động thuật toán 45
Hình IV.1. Cấu trúc dữ liệu 53
Hình IV.2. Ví dụ về cắt và ghép nối 58
Trang 5
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
LỜI NÓI ĐẦU
Trong thực tế, hình dạng thường được chú trọng hơn kích thước và con
người nhận ra các đối tượng xung quanh chủ yếu thông qua hình dạng. Chính
vì vậy, biểu diễn hình dạng là một vấn đề quan trọng và không thể thiếu trong
quá trình nhận dạng đối tượng.
Xử lý ảnh quan tâm chủ yếu đến việc trích chọn các thông tin hữu ích
từ trong ảnh. Các thuật toán xử lý ảnh được phân ra làm 3 mức. Mức thấp
nhất là các phương pháp thao tác trực tiếp với các dữ liệu thô, các giá trị điểm
ảnh có thể bị nhiễu. Mức thứ hai là tận dụng các kết quả ở mức 1 để đưa ra
các kết quả tốt hơn như: phân đoạn ảnh, liên kết ảnh. Mức thứ ba là các
phương pháp trích trọn ngữ nghĩa các thông tin dựa trên các kết quả của các
mức thấp hơn, ví dụ như: nhận dạng chữ viết tay, nhận dạng mặt người.
Toán học hình thái (Mathematic Morphology) là một lĩnh vực riêng
biệt trong xử lý ảnh. Không giống như các cách tiếp cận khác thiên về toán
học tính toán, MM dựa trên cấu trúc và hình dạng, dùng các toán hình thái cơ
bản để làm đơn giản ảnh nhưng vẫn giữ lại những đặc trưng chính. MM còn là
một công cụ cơ bản để trích chọn các thành phần ảnh, như biên ảnh, xương
ảnh, rất hữu dụng cho việc biểu diễn các các vùng khác nhau trên một ảnh.
Những kỹ thuật dùng toán hình thái như lọc ảnh, làm mảnh ảnh hay làm dầy
ảnh có sử dụng toán học hình thái cũng được sử dụng trong quá trình tiền xử
lý ảnh. Ngoài ra, một trong các ứng dụng quan trọng mà tôi đề cập chính
trong luận văn này là: Phân rã phần tử cấu trúc thành các phần tử cấu trúc nhỏ
hơn. Phần tử cấu trúc là phần tử tham gia trong các phép toán hình thái, và
việc phân rã phần tử cấu trúc hoặc nói một cách khác là ma trận điểm ảnh có
ba lợi ích quan trọng: Thứ nhất, làm giảm phép toán trong các ứng dụng mà
phần tử đó tham gia. Thứ hai, giảm không gian lưu trữ ảnh. Thứ ba, đối với
Trang 6
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
các hệ thống chỉ hỗ trợ tập lệnh SIMD trên các phần tử nhỏ hơn nhiều phần tử
cấu trúc, thì việc phân rã phần tử cấu trúc thành các phần tử cấu trúc nhỏ hơn
là cần thiết.
Trong khuôn khổ của luận văn này tôi đi tìm hiểu các khái niệm cơ
bản về toán học hình thái như phép toán làm béo, làm gầy dựa vào cấu trúc
mẫu, một số thuật toán dựa trên phép toán hình thái; Tìm hiểu về thuật toán di
truyền, lai ghép, đột biến tái sinh và lựa chọn, phương pháp phân rã phần tử
cấu trúc mẫu dựa trên thuật toán di truyền ..vv. Bố cục của luận văn được tổ
chức như sau:
Chƣơng I. Giới thiệu chung về xử lý ảnh và phương pháp nâng cao
chất lượng hình ảnh.
Chƣơng II: Trình bày các khái niệm cơ bản về toán học hình thái.
Chƣơng III: Trình bày các khái niệm liên quan đến thuật toán di
truyền.
Chƣơng IV: Giải quyết bài toán phân rã phần tử cấu trúc bằng phương
pháp tiếp cận ngẫu nhiên dựa trên thuật toán di truyền.
Chƣơng V: Trình bày kết quả thực nghiệm
Trang 7
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
CHƢƠNG I. GIỚI THIỆU CHUNG VỀ XỬ LÝ ẢNH
VÀ PHƢƠNG PHÁP NÂNG CAO CHẤT LƢỢNG HÌNH ẢNH
1. Giới thiệu chung về xử lý ảnh
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin
học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các
ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các
chương trình. Xử lý ảnh số bao gồm các phương pháp và kỹ thuật để biến đổi,
để truyền tải hoặc mã hóa các ảnh tự nhiên. Mục đích của xử lý ảnh gồm:
* Thứ nhất, biến đổi ảnh và làm đẹp ảnh.
* Thứ hai, tự động nhận dạng ảnh hay đoán nhận ảnh và đánh giá các nội
dung của ảnh.
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người
ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các
đặc tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng
- Mô tả tham số (nhận dạng theo tham số)
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc)
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh
thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác.
Dựa vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu.
Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên
của một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh ... Kỹ thuật này
được sử dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể).
Trong thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công
với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ
(chữ cái, chữ số, chữ có dấu). Nhận dạng chữ in hoặc đánh máy trong văn bản
Trang 8
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
phục vụ cho việc tự động hoá quá trình đọc tài liệu, tăng nhanh tốc độ và chất
lượng thu nhận thông tin từ máy tính, Nhận dạng chữ viết tay (với múc độ
ràng buộc khác nhau về cách viết, kiểu chữ, ...
Các quá trình của xử lý ảnh:
Các quá trình của xử lý ảnh được tiến hành theo sơ đồ sau:
Hình I.1 Sơ đồ quy trình xử lý ảnh
Trước hết là qúa trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu
CCIR), nhưng cũng có thể là tín hiệu số hoá (loại CCD - Charge Coupled
Device).
Ảnh có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh,
tranh được quét qua scanner. Tiếp theo là quá trình số hóa (Digitalizer) để
biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng
hóa, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại.
Trang 9
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước
hết là công việc tăng cường hình ảnh (Image Enhancement) để nâng cao chất
lượng hình ảnh. Do những nguyên nhân khác nhau: có thể do thiết bị thu nhận
ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần phải
tăng cường và khôi phục (Image Restoration) lại ảnh để làm nổi bật một số
đặc tính chính của ảnh, hay làm cho ảnh gần giống với trạng thái gốc- trạng
thái trước khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc tính
như biên (Edge Detection), phân vùng ảnh (Image Segmentation), trích chọn
các đặc tính (Feature Extraction),v.v...
Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng,
phân lớp hay các quyết định khác. Các giai đoạn chính của quá trình xử lý ảnh
có thể mô tả ở hình I.1
2 Giới thiệu ảnh nhị phân
Như đã giới thiệu ở trên. Trong quá trình xử lý ảnh, một ảnh thu nhập
vào máy tính phải được mã hoá. Hình ảnh khi lưu trữ dưới dạng tập tin phải
được số hoá. Tiêu chuẩn đặt ra là ảnh phải lưu trữ thế nào sao cho các ứng
dụng khác nhau có thể thao tác trên các loại dữ liệu này. Hiện nay có trên 30
kiểu lưu trữ ảnh khác nhau, trong đó ta thường gặp các dạng ảnh sau: TIFF,
GIF, BMP, PCX, JPEG, ... Nói chung mỗi kiểu lưu ảnh có ưu điểm riêng.
2.1. Một số khái niệm
* Pixel (Picture Element): Phần tử ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng.
Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong
quá trình số hoá, ngươì ta biến đổi tín hiêụ liên tục sang tín hiệu rời rạc thông
qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần
giá trị mà về nguyên tắc, mắt thường không phân biệt được hai điểm kề nhau.
Trang 10
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Trong quá trình này, người ta sử dụng khái niệm Picture Element mà ta quen
gọi hay viết là pixel - phần tử ảnh. Như vậy một ảnh là một tập hợp các pixel.
Ở đây cũng cần phân biệt khái niệm pixel hay đề cập đến trong các hệ thống
đồ hoạ máy tính. Để tránh nhầm lẫn ta tạm gọi khái niệm pixel này là pixel
thiết bị. Khái niệm pixel thiết bị có thể xem xét như sau: Khi ta quan sát màn
hình (trong chế độ đồ hoạ), màn hình không liên tục mà gồm nhiều điểm nhỏ,
gọi là pixel. Mỗi pixel gồm một cặp toạ độ x,y và màu.
* Ảnh nhị phân.
Tuỳ theo vùng các giá trị mức xám của điểm ảnh, mà các ảnh được phân
chia ra thành ảnh màu, ảnh xám, hay ảnh nhị phân. Khi trên một ảnh chỉ có
giá trị 0 hoặc 1 thì ta nói đó là một ảnh nhị phân hoặc ảnh đen trắng và các
điểm ảnh của nó gọi là điểm ảnh nhị phân.
* Với ảnh xám.
Nếu dùng 8 bít (1 byte) để biểu diễn mức xám thì số các mức xám có thể
biểu diễn được là 28 hay 256. Mỗi mức xám được biểu diễn dưới dạng là một
số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn chúc mức
cường độ tối nhất và mức 255 biểu diễn cho mức cường độ sáng nhất.
* Với ảnh mầu.
Cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số
tại mỗi phần tử của ma trận biểu diễn cho ba mầu riêng rẽ gồm: đỏ(red),
lục(green) và lam(blue). Để biểu diễn cho một điểm ảnh mầu cần 24 bít, 24
bít này được chia thành ba khoảng 8 bít. Mỗi khoảng này biểu diễn cho cường
độ sáng của một trong các mầu chính tổ hợp của các mầu ta được nhiều mức
biểu diễn, như vậy mỗi điểm ảnh có thể được mô tả rõ giá trị màu tự nhiên
của nó (true color).
Trang 11
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
* Ảnh đa cấp xám
Ảnh đa cấp xám được áp dụng tronh nhiều lĩnh vực như sinh vật học
hoặc trong công nghiệp. Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh
mức xám cũng ứng dụng được trên ảnh mầu. Ta có thể biến đổi ảnh mầu về
ảnh xám. Mỗi điểm ảnh mầu có 3 giá trị (Red, Green, Blue), nếu 3 giá trị này
bằng nhau thi ta có màu xám(Grey), khi đó với mỗi điểm ảnh ta chỉ cần lưu 1
giá trị.
Việc xử lý ảnh nhị phân là một bước tiền xử lý các ảnh, để phân đoạn và
tách ra các đặc tính. Nhờ vậy ta có thể biết được mối quan hệ tôpô giữa các
điểm ảnh cũng như thực hiện các phép biến đổi ảnh không tuyến tính đạt hiệu
quả; trong quá trình xử lý ảnh các phép biến đổi này dẫn đến sự đơn giản hóa
việc đánh giá ảnh. Việc đếm các điểm ảnh trên ảnh nhị phân đã qua biến đổi
tạo điều kiện thuận lợi cho việc tách ra các đặc tính. Bằng cách sử dụng các
ảnh nhị phân đã qua xử lý như là những mặt nạ đối với các ảnh xám, ta có thể
tách ra các vùng đáng quan tâm của một ảnh xám từ tập hợp các ảnh.
Để tạo ra một ảnh nhị phân, một ảnh xám cần phải được biến đổi thành
một ảnh nhị phân nhờ một quá trình phân đoạn thích hợp. Muốn thế phương
pháp đơn giản nhất là phương pháp tách ngưỡng. Các giá trị nằm ở bên trên
ngưỡng được gán giá trị 1 còn ở bên dưới ngưỡng thì được gán giá trị 0. Việc
tìm giá trị ngưỡng có thể thực hiện tự động nhờ kỹ thuật tách ngưỡng tự động.
2.2. Đặt bài toán nâng cao chất lƣợng ảnh bằng các phép toán hình thái.
Hình ảnh trong thực tế khi nhận được qua các thiết bị như: Photocopy,
Fax, .. ít nhiều đều bị nhiễu, thâm chí có thể biến dạng đến mức độ có thể
khiến người nhận được hiểu sai về mặt ý nghĩa. Như chúng ta đã biết trong
các ngành Thiết kế kỹ thuật như: Thiết kế máy, Thiết kế xây dựng, Thiết kế
mạch điện v.v. dù là theo TCVN (tiêu chuẩn Việt Nam) hay ISO(International
Trang 12
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Standard Oganize), một bản vẽ được thể hiện chỉ xoay quanh một số dạng
đường như: đường thẳng, đường cong khép kín ,đường cong mở (có thể lồi
hoặc lõm), các cung tròn, elip, đường ZigZag...Các dạng đường như thế được
biểu diễn bằng những nét vẽ. Nét vẽ có thể là nét liền (Continuous), có thể là
nét đứt (dash), có thể là nét chấm gạch như đường tâm (Center), có thể là
đường khuất (Hide)... (Hình 1.2).., Mỗi độ lớn (high) của nét vẽ (nét mảnh
hoặc nét đậm), có khi thể hiện một ý nghiã khác nhau . Như trong thể hiện
của đường ren của một bulon chẳng hạn: Đường chân ren phải được thể hiện
bằng một nét liền mảnh, trong khi đường đỉnh của ren lại phải thể hiện bằng
một nét đậm. Hoặc một đường khuất, sẽ thể hiện cho hình chiếu cuả một
đường thuộc một mặt được nằm ở phía sau của một mặt khác theo góc nhìn
vuông góc với mặt phẳng chiếu. Trong khi đó, nét liền sử dụng để biểu diễn
cho hình chiếu cuả đối tượng ở mặt trước đó.
Do vậy, nếu như nét vẽ của một đường thẳng lẽ ra là một nét vẽ liền
trong khi đó đường mà chúng ta nhận được lại là một nét đứt thì việc đọc các
thông tin trên bản vẽ sẽ dẫn đến việc hiểu sai về mặt ý nghĩa là điều không
tránh khỏi. Để giải quyết bài toán này như: Nối liền những nét đứt, làm trơn
biên ảnh ... các phép toán hình thái nhị phân đã ra đời, thông qua đó các phép
đóng ảnh, mở ảnh cũng được định nghĩa để giải quyết bài toán nêu trên.
Trang 13
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2.3. Đặt bài toán nâng cao chất lƣợng ảnh bằng kỹ thuật tìm xƣơng và
làm mảnh
Trong xử lý ảnh và nhận dạng ảnh, có một số loại ảnh đường nét gồm
các đối tượng (objects) là các đường cong có độ dài lớn hơn nhiều so với độ
dày của nó, ví dụ như là ảnh các kí tự, dấu vân tay, sơ đồ mạch điện tử, bản vẽ
kỹ thuật, bản đồ v.v... Để xử lý các loại ảnh này người ta thường xây dựng các
hệ mô phỏng theo cách phân tích ảnh của con người gọi là hệ thống thị giác
máy (Computer Vision System). Có nhiều hệ thống được cài đặt theo phương
pháp này như hệ thống nhận dạng chữ viết bằng thiết bị quang học OCR
(Optical Character Recognition ), hệ thống nhận dạng vân tay AFIS
(Automated fingerprint Identification System) v.v...
Hình I.2. Mô hình tổng quát của hệ thống nhận dạng ảnh
Có nhiều phương pháp trích chọn đặc điểm được biết tới như phương
pháp sử dụng sóng ngắn (Wavelet), sử dụng hệ số Fourier, sử dụng các mô
men bất biến, sử dụng các đặc trưng của biên như tính trơn và các điểm đặc
biệt, sử dụng các đặc trưng tô pô dựa trên xương của đường nét Phương
pháp trích chọn đặc điểm sử dụng ảnh đã mảnh được sử dụng nhiều vì việc
Trang 14
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
trích chọn đặc điểm trở nên dễ dàng. Sau bước này các đường nét đã mảnh
được véctơ hoá ảnh phục vụ việc nén dữ liệu, nhằm giảm thiểu yêu cầu về
không gian lưu trữ, xử lý và thời gian xử lý. Kỹ thuật làm mảnh là một trong
nhiều ứng dụng của phép toán hình thái học (Morphology) sẽ giải quyết một
số vấn đề cuả bài toán nêu trên trong công đoạn tiền xử lý ảnh.
3. Khái quát về phƣơng pháp nâng cao chất lƣợng hình ảnh.
Nâng cao chất lượng hình ảnh là một bước quan trọng tạo tiền đề cho xử
lý ảnh. Mục đích chính là nhằm làm nổi một số đặc tính của ảnh như thay đổi
độ tương phản, lọc nhiễu, nổi biên, làm trơn ảnh, khuếch đại ảnh, ... tăng
cường ảnh và khôi phục ảnh là hai quá trình khác nhau về mục đích.
Tăng cường ảnh bao gồm một loạt các phương pháp nhằm hoàn thiện
trạng thái quan sát của một ảnh. Tập hợp các kỹ thuật này tạo nên giai đoạn
tiền xử lý ảnh. Nhiệm vụ của tăng cường ảnh không phải là làm tăng lượng
thông tin vốn có trong ảnh mà làm nổi bật các đặc trưng đã chọn làm sao để
có thể phát hiện tốt hơn, tạo thành quá trình tiền xử lý cho phân tích ảnh.
Khôi phục ảnh nhằm khôi phục ảnh gần với ảnh thực nhất trước khi nó
bị biến dạng do nhiều nguyên nhân khác nhau. Khôi phục ảnh đề cập tới các
kỹ thuật loại bỏ hay tối thiểu hóa các ảnh hưởng của môi trường hay các hệ
thống thu nhận, phát hiện và lưu trữ ảnh đến ảnh thu nhận được. Ở đây, ta có
thể liệt kê các nguyên nhân biến dạng: do nhiễu bộ phận cảm nhận tín hiệu,
ảnh mờ do Camera, nhiễu ngẫu nhiên của khí quyển, ... khôi phục ảnh bao
gồm nhiều quá trình như: lọc ảnh, khử nhiễu nhằm làm giảm các biến dạng để
có thể khôi phục lại ảnh gần giống ảnh gốc tùy theo các nguyên nhân gây ra
biến dạng.
Về nguyên tắc khôi phục ảnh nhằm xác định mô hình toán học của quá
trình đã gây ra biến dạng, tiếp theo là dùng ánh xạ ngược để xác định lại ảnh.
Trang 15
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Việc xác định mô hình có thể thực hiện theo hai hướng: trước và sau. Theo
hướng thưc nhất, một mô hình sẽ được xây dựng từ các ảnh kiêm nghiệm để
xác định đáp ứng xung của hệ thống nhiễu. Theo hướng thứ 2 người ta thực
hiện các phép đo trên ảnh. Nói chung là mô hình không biết trước. các mô
hình toán học dùng cho cả hai phương pháp là rất phức tạp.
Trang 16
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
CHƢƠNG II: CÁC KHÁI NIỆM CƠ BẢN VỀ TOÁN HỌC HÌNH THÁI
1. Quan hệ giữa khái niệm tập hợp và phép toán hình thái
Toán học hình thái (MM) dựa trên khái niệm về tập hợp, và chính nhờ có
khái niệm này mà toán học hình thái mang lại một cách tiếp mới cận đối với
các bài toán xử lý ảnh. Trong hầu hết các trường hợp, phép toán hình thái đều
thể hiện một tính chất nào đó của phép toán liên quan đến khái niệm tập hợp.
Bằng các khái niệm đơn giản về phép toán hợp,giao, phần bù...v.v, chúng ta
có thể xây dựng các phép toán rất hữu ích cho các kỹ thuật xử lý ảnh.
Ảnh số là sự biểu diễn ảnh dưới dạng tín hiệu tương tự hoặc tín hiệu số.
Trong biểu diễn số của các ảnh đa mức xám, tập hợp các điểm ảnh được biểu
diễn dưới dạng một ma trận hai chiều. Mỗi phần tử của ma trận biểu diễn cho
mức xám hay cường độ của ảnh tại vị trí đó, phần tử trong ma trận được gọi là
một phần tử ảnh, thông thường kí hiệu là PEL (Picture Element) hoặc là điểm
ảnh (Pixel).
Đối với ảnh nhị phân, ta ngầm định các điểm ảnh thể hiện đối tượng ảnh
được mã hóa bởi các điểm ảnh có giá trị 1. Tương ứng với đó, nền sẽ được mã
hóa bởi các điểm ảnh có giá trị 0.
Hình II.1.1. Ảnh nhị phân
Trang 17
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Mỗi một phần tử được đại diện bởi một bộ 3 phần tử (x1,x2,x3) tương
ứng là toạ độ điểm ảnh và mức xám tại ảnh đó. Hình II.1.2 mô tả một thể hiện
đơn giản của ảnh đa cấp xám
Hình II.1.2. Ảnh đa cấp xám
Như vậy, ta đã hình dung được mối quan hệ giữa ảnh và khái niệm tập
hợp. Đối với mỗi ảnh thì sẽ có tương ứng một tập hợp thể hiện ảnh và ngược
lại, từ một tập hợp, ta có thể dựng lại ảnh tương ứng.
1.1. Một số khái niệm cơ bản về tập hợp.
Giả sử A là một tập thuộc Z2. Nếu a = (a1,a2) là một phần tử của A, thì
ta kí hiệu là:
a A
Trang 18
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Tương tự như vậy, trong trường hợp a không phải là phần tử con của A
thì kí hiệu:
a A
Tập hợp không chứa phần tử nào thì được gọi là tập rỗng
Trong khuôn khổ của luận văn này, chúng ta sẽ quan tâm tới khái niệm
phần tử của một tập hợp trong phạm vi của ảnh nhị phân. Ví dụ như khi ta
viết C =
,w w d d D
thì nghĩa là C là tập các phần tử, w là đối của các
phần tử tương ứng của tập D qua gốc tọa độ.
Nếu như với mọi phần tử A đều thuộc tập B thì ta nói rằng tập A là một
tập con của tập B và kí hiệu là :
A B
Hợp của hai tập A và tập B là tập tất cả các phần tử hoặc thuộc A hoặc
thuộc B và kí hiệu là:
C = A
B
Tương tự như vậy giao của hai tập A và tập B là tất cả các phần tử vừa
thuộc A lại đồng thời thuộc B :
C = A
B
Trang 19
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Hình II.1.3. Các phép toán cơ bản trên tập hợp
Phần bù của tập A là tập tất cả các phần tử không thuộc A
A
c
=
w w A
Hiệu của A vả B, kí hiệu là A-B được định nghĩa bởi
w w A,w cA B B A B
Ngoài ra, trong toán học hình thái người ta còn đưa ra hai định nghĩa
khác, tập nghịch của A:
{ | , }B w w b b B
và tập tịnh tiến của A bởi véc tơ z(z1,z2), được định nghĩa là tập tất cả
các phần tử là ảnh của tập A trong phép tịnh tiến theo véc tơ z:
,zA c c a z a A
Trang 20
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1.2. Các phép toán logic trên ảnh nhị phân
Phần lớn các ứng dụng trong chương này là đề cập tới ảnh nhị phân,
các phép toán logic dù đơn giản nhưng cung cấp một cách thực thi hiệu quả
để có thể triển khai các thuật toán xử lý ảnh dựa trên phép toán hình thái.
Phép toán cơ bản nhất được sử dụng trong xử lý ảnh là : phép toán
AND, phép toán OR và phép toán NOT. Các tính chất của chúng được định
nghĩa trong bảng dưới đây :
P Q P AND Q P OR Q NOT P
0 0 0 0 1
0 1 0 1 1
1 0 0 1 0
1 1 1 1 0
Dựa trên ba phép toán cơ bản trên, ta có thể xây dựng được các phép
toán phức tạp hơn bằng cách kết hợp chúng lại với nhau. Hình II.1.4 dưới đây
thể hiện các phép toán dựa trên bộ các phép toán cơ bản ở trên.
HìnhII.1.4. Các phép toán cơ bản
Trang 21
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2. Phép toán làm béo (Dilation) và làm gầy (Erosion)
Ta bắt đầu thảo luận về phép toán hình thái, bước đầu xem xét 2 phép
toán hình thái cơ bản: làm béo và làm gầy. Đây là 2 phép toán cơ bản nhất và
thực tế rằng đa số các thuật toán đều dựa trên 2 phép toán này.
2.1. Làm béo
Với A và B là 2 tập trong Z2, tập béo của A gây bởi tập B được ký hiệu
là:
{ | ( ) }zA B z B A
Tập B thường được gọi là phần tử cấu trúc do sự tác động của nó gây
sự ảnh hưởng về cấu trúc lên tập A.
Phương trình trên không chỉ nhằm đưa ra định nghĩa của phép toán làm
béo mà còn mang lại những lợi thế khác, nó mang lại một cảm giác trực quan
rằng các phần tử cấu trúc này như là một mặt nạ xoắn làm thay đổi cấu trúc
của ảnh ban đầu.
Hình II.2.1(a) thể hiện ảnh tham gia thuật toán làm béo, hình II.2.1(b)
mô tả phần tử cấu trúc và tập ngược của nó( những điểm chấm đen mô tả các
phần tử gốc). Trong trường hợp này phần tử cấu trúc và phần tử cấu trúc
nghịch của nó trùng nhau do B đối xứng.
Trang 22
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Hình II.2.1. Phép toán làm béo
Một trong các ứng dụng đơn giản nhất của phép toán làm béo là nối
các nét đứt trong quá trình nâng cao chất lượng ảnh. Hình II.2.2 dưới đây là
một ví dụ ảnh với các kí tự đứt gãy do quá trình quét ảnh không được tốt hay
do việc zoom ảnh quá lớn. Độ dài lớn nhất của mỗi phần gãy trong ví dụ này
là 2 pixel. Ta có thể dùng một phần tử cấu trúc đơn giản để nối các nét đứt
này lại với nhau. Kết quả của việc thực hiện phép toán làm béo này là ảnh
được khôi phục, các vết đứt gãy được thay thế bởi các điểm ảnh tạo cho các
nét chữ được trơn và liên tục.
HìnhII.2.2. Ứng dụng của phép toán dilation
Trang 23
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2.2. Làm gầy
Cho tập A và B trong Z2, tập gầy của A gây bởi B được kí hiệu là
Một trong các ứng dụng đơn giản nhất của phép toán làm gầy là loại bỏ
các thành phần dư thừa hay các thành phần nhiễu. Hình II.2.3 mô tả một ảnh
nhị phân được cấu tạo bởi các hình vuông với các kích thước là 1,2,5,7,9 và
15 điểm ảnh. Bằng cách sử dụng phần tử cấu trúc với kích thước phù hợp và
sử dụng phép toán làm gầy, chúng ta có thể loại bỏ các hình vuông điểm ảnh
nhỏ (nhiễu) và giữ lại các hình vuông điểm ảnh với kích thước lớn (các thành
phần chính của ảnh)
Hình II.2.3. Loại bỏ thành phần nhiễu
2.3. Phép toán Opening và Closing
Như chúng ta đã thấy, phép toán làm béo tăng kích thước của ảnh còn
phép toán làm gầy giảm kích thước của ảnh. Trong phần này, chúng ta sẽ bàn
đến 2 trong những phép toán quan trọng nhất: Opening và Closing. Opening
ban đầu làm mịn đường biên của đối tượng sau đó loại bỏ các phần lồi ra.
Closing cũng nhằm mục đích làm mịn đường biên nhưng khác với phép toán
Opening, phép toán Closing ban đầu sẽ làm dày đối tượng và sau đó mới thực
hiện việc làm mịn biên của ảnh.
Trang 24
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Opening của tập A bởi phần tử cấu trúc B được ký hiệu là:
A B A B B
Tương tự Closing của A bởi B là:
A B A B B
Phép toán Opening có một cách thể hiện hình học đơn giản. Giả sử
chúng ta coi phần tử cấu trúc B như là một quả bóng. Đường bao của
tập A B được hình thành bằng cách cho B lăn trong cấu trúc hình học của A.
{( ) }zA B B A
Hình II.2.4. Phép toán Opening
Ngược lại, phép toán Closing cũng có một thể hiện tương tự, nhưng
bằng cách ngược lại. Quả bóng sẽ được lăn ở phía ngoài cấu trúc hình học của
A.
Hình II.2.5. Phép toán Closing
Trang 25
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Hình II.2.6. Phép toán Opening
Một số tính chất cơ bản của phép toán opening:
-
A B
là tập con của A
- Nếu C là tập con của D thì
C B
là tập con của
D B
-
A B B A B
Tương tự như vậy, phép toán closing thỏa mãn các tính chất sau:
- A là tập con của
A B
- Nếu C là tập con của D thì
C B
là tập con của
D B
-
A B B A B
Trang 26
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Các phép toán hình thái còn được sử dụng để xây dựng các bộ lọc. Ví
dụ như trong bài toán nhận dạng vân tay người, ảnh cần nhận dạng có nhiễu
(như thể hiện trong hình II.2.7(a). Các nhiễu là các chấm trắng nhỏ (khác với
ví dụ trước, trong ví dụ này nội dung của ảnh được thể hiện bởi các điểm ảnh
sáng còn nền là các điểm ảnh sẫm mầu). Mục tiêu của quá trình tiền xử lý ảnh
trước khi nhận dạng là việc lọc các thành phần nhiễu nhưng đồng thời phải
đảm bảo sự ảnh hưởng đến các thành phần vân tay ít nhất có thể. Để lọc các
thành phần nhiễu, ta sử dụng phần tử cấu trúc được mô tả trong hình II.2.7(b)
Toàn bộ hình II.2.7 thể hiện từng bước của quá trình lọc ảnh. Các nhiễu được
hoàn toàn loại bỏ trong phép toán làm gầy ở giai đoạn đầu do kích thước của
các điểm nhiễu là nhỏ hơn kích thước của phần tử cấu trúc và sau đó được
khôi phục lại nguyên dạng như ảnh lúc đầu. Chú ý rằng, sau quá trình này gần
như toàn bộ các thành phần nhiễu đã bị lọc bỏ.
Hình II.2.7. Xử lý nhiễu trong ảnh vân tay
Trang 27
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2.4. Biến đổi Hit or Miss
Biến đổi Hit or Miss là một công cụ cơ bản để dò tìm ảnh. Tôi giới
thiệu khái niệm này với sự trợ giúp của hình I.2.8. Trong hình, tập A bao gồm
3 ảnh X, Y, Z. mục tiêu là tìm vị trí của một trong 3 ảnh trên, giả sử là X
Giả ._.
Các file đính kèm theo tài liệu này:
- LA9536.pdf