TRƯỜNG ĐẠI HỌC QUỐC TẾ SÀI GÒN
KHOA CÔNG NGHỆ THÔNG TIN
-----------------------
PHẠM THỊ QUỲNH - TRẦN LÊ HẢI BÌNH
NHẬN DẠNG VÂN MẠCH MÁU LÒNG BÀN TAY DỰA
VÀO ĐẶC TRƯNG HƯỚNG ĐƯỜNG VÂN CỤC BỘ VÀ ĐẶC
TRƯNG SIFT CẢI TIẾN
BÁO CÁO NGHIÊN CỨU KHOA HỌC LẦN 3 - 2021
TP. HỒ CHÍ MINH - 2021
TRƯỜNG ĐẠI HỌC QUỐC TẾ SÀI GÒN
KHOA CÔNG NGHỆ THÔNG TIN
PHẠM THỊ QUỲNH - TRẦN LÊ HẢI BÌNH
NHẬN DẠNG VÂN MẠCH MÁU LÒNG BÀN TAY DỰA
VÀO ĐẶC TRƯNG HƯỚNG ĐƯỜNG VÂN CỤC BỘ VÀ ĐẶ
75 trang |
Chia sẻ: huong20 | Ngày: 04/01/2022 | Lượt xem: 360 | Lượt tải: 0
Tóm tắt tài liệu Báo cáo Nghiên cứu khoa học - Nhận dạng vân mạch máu lòng bàn tay dựa vào đặc trưng hướng đường vân cục bộ và đặc trưng sift cải tiến, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ẶC
TRƯNG SIFT CẢI TIẾN
BÁO CÁO NGHIÊN CỨU KHOA HỌC LẦN 3 - 2021
NGƯỜI HƯỚNG DẪN
TS. VĂN THIÊN HOÀNG
THS. VÕ ANH TIẾN
TP. HỒ CHÍ MINH - 2021
LỜI CAM ĐOAN
Tôi xin cam đoan báo cáo nghiên cứu khoa học với đề tài: “Nhận dạng vân
mạch máu lòng bàn tay dựa vào đặc trưng hướng đường vân cục bộ và đặc trưng
sift cải tiến” là công trình nghiên cứu của riêng chúng tôi.
Các trích dẫn, tham khảo trong quá trình nghiên cứu đều được trích dẫn đầy đủ,
ghi rõ nguồn gốc.
Tôi xin chịu hoàn toàn trách nhiệm nếu có bất kỳ sao chép không hợp lệ, vi
phạm quy chế đào tạo.
Người thực hiện
Phạm Thị Quỳnh – Trần Lê Hải Bình
LỜI CẢM ƠN
Lời đầu tiên em xin gửi lời cảm ơn đến Ban lãnh đạo, toàn thể quý Thầy, Cô
giảng viên Trường Đại học Quốc tế Sài Gòn đã tận tạo điệu kiện và cơ hội để chúng
em được tham dự một cuộc thi trí tuệ, chuyên nghiệp và sáng tạo.
Em xin gửi lời cảm ơn sâu sắc đến thầy TS. Văn Thiên Hoàng và thầy ThS.
Võ Anh tiến đã tận tình hướng dẫn, tạo mọi điều kiện thuận lợi và chỉ bảo chúng em
trong suốt thời gian làm nghiên cứu khoa học.
Tuy vậy, do thời gian có hạn, mặc dù đã cố gắng hết sức nhưng chắc rằng bài
nghiên cứu khoa học không tránh khỏi sự thiếu sót. Chúng em rất mong nhận được
sự thông cảm và chỉ bảo tận tình của quý Thầy Cô và các bạn.
Trân trọng cảm ơn.
Phạm Thị Quỳnh – Trần Lê Hải Bình
MỤC LỤC
DANH MỤC TỪ VIẾT TẮT .................................................................................. 7
DANH MỤC BẢNG ............................................................................................... 9
DANH MỤC HÌNH ẢNH ..................................................................................... 10
TÓM TẮT ......................................................................................................... 12
CHƯƠNG 1 TỔNG QUAN .................................................................................. 13
1.1 Giới thiệu chung ....................................................................................... 13
1.2 Hệ thống nhận dạng vân mạch máu lòng bàn tay ...................................... 17
1.3 Mục tiêu đề tài .......................................................................................... 26
1.4 Phương pháp nghiên cứu .......................................................................... 26
1.5 Đặc trưng và phạm vi nghiên cứu ............................................................. 27
1.6 Cấu trúc báo cáo ....................................................................................... 27
CHƯƠNG 2 CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN ......................... 29
2.1 Bộ lọc MFRAT ........................................................................................ 29
2.2 Các đặc trưng mẫu nhị phân cục bộ .......................................................... 30
2.3 Đặc trưng dẫn xuất cục bộ (Local derivative pattern - LDP) ..................... 35
2.4 Các đặc trưng cục bộ bất biến ................................................................... 36
CHƯƠNG 3 PHƯƠNG PHÁP ĐỀ XUẤT ............................................................ 62
3.1 Ý tưởng .................................................................................................... 62
3.2 Thuật toán ................................................................................................ 62
CHƯƠNG 4 KẾT QUẢ THỰC NGHIỆM ............................................................ 66
4.1 Cơ sở dữ liệu thực nghiệm ........................................................................ 66
4.2 Kết quả thực nghiệm ................................................................................ 66
CHƯƠNG 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN......................................... 69
5.1 Kết luận .................................................................................................... 69
5
5.2 Kiến nghị.................................................................................................. 69
TÀI LIỆU THAM KHẢO ..................................................................................... 70
6
DANH MỤC TỪ VIẾT TẮT
TỪ NỘI DUNG DIỄN GIẢI
NIR Near-infrared Ánh sáng hồng ngoại
ATM Automated Teller Machine Máy rút tiền tự động
DNA Deoxyribonucleic acid Phân tử mang thông tin di truyền
PDA Personal Digital Assistant Thiết bị kỹ thuật số hỗ trợ cá nhân
CCD Charge Coupled Device Cảm biến CCD
ROI Region of interest Vùng quan tâm
LDP Local derivative pattern Đặc trưng dẫn xuất cục bộ
LBP Local binary pattern Mẫu nhị phân cục bộ
MFRAT Modified Finite Radon Transform Biến đổi radon hữu hạn
Đặc trưng biến đổi bất biến theo tỉ
SIFT Scale-invariant feature transform
lệ
SURF Speeded up robust feature Đặc trưng cải thiện tốc độ
Affine scale invariant feature Đặc trưng biến đổi bất biến theo tỉ
ASIFT
transform lệ affin
Root Scale-invariant feature
RootSIFT Bộ mô tả SIFT nâng cao
transform
Phương pháp phân tích thành
PCA Principal component analysis
phần chính
Two-dimensional principal Phương pháp phân tích thành
2D-PCA
component analysis phần chính 2 chiều
Two-dimensional fisher Phân tích phân biệt hai chiều
2D-FDA
discriminant analysis fisher
7
Enhanced centersymmetric local Mẫu nhị phân cục bộ đối xứng
ECS-LBP
binary pattern tâm cải tiến
Enhanced centersymmetric local Mẫu nhị phân cục bộ đối xứng
EL-SIFT
binary pattern with SIFT tâm cải tiến với SIFT
MLBP Multivariate Local binary pattern Mẫu nhị phân cục bộ đa biến
ELBP Enhanced local binary pattern Mẫu nhị phân cục bộ nâng cao
LBPV Local binary pattern variance Phương sai mẫu nhị phân cục bộ
DoG Difference-of-Gaussian Bộ lọc Gaussian xác định cạnh
Modified Scale-invariant feature
MSIFT Đặc trưng SIFT sửa đổi
transform
8
DANH MỤC BẢNG
Bảng 4.1 Cơ sở dữ liệu huấn luyện và so khớp trong thực nghiệm ........................ 67
Bảng 4.3 Hiệu suất trung bình từ tay trái của PUT ................................................ 68
Bảng 4.4 Hiệu suất trung bình từ tay phải của PUT .............................................. 68
9
DANH MỤC HÌNH ẢNH
Hình 1.1 Các đặc điểm sinh trắc học về cơ thể và hành vi. .................................... 14
Hình 1.2 Sơ đồ khối nhận diện bằng hình ảnh vân mạch máu lòng bàn tay ........... 18
Hình 1.3 Thiết bị chụp ảnh đa phổ lòng bàn tay .................................................... 19
Hình 1.4 Sáu hình ảnh vân lòng bàn tay điển hình trong cơ sở dữ liệu .................. 20
Hình 1.5 Lưu đồ của phương pháp đường tròn nối tiếp cực đại rút trích ROI ........ 21
Hình 1.6 Hình ảnh mức xám ................................................................................. 22
Hình 1.7 Hình ảnh nhị phân sau các phép toán hình thái ....................................... 22
Hình 1.8 Hình ảnh xoay ........................................................................................ 23
Hình 1.9 Cắt hình ảnh ROI ................................................................................... 24
Hình 1.10 Hình ảnh ROI vân lòng bàn tay ............................................................ 24
Hình 1.11 Hình ảnh ROI của vân mạch máu lòng bàn tay ..................................... 24
Hình 2.3 36 mẫu bất biến xoay được tạo ra bởi phép toán 푳푩푷ퟖ, 푹풓풊 .................. 32
Hình 2.4 Phép đo kết cấu MLBP mô tả các mối quan hệ không gian trong một dải và
giữa các dải ........................................................................................................... 32
Hình 2.5 Sơ đồ phép toán E – LBP4,4,3 .................................................................. 34
Hình 2.6 Mẫu 8 pixel lân cận xung quanh Z0 ........................................................ 35
Hình 2.7 Hình ảnh Gaussian liền về và sau mỗi quãng tám ................................... 41
Hình 2.8 Cực đại và cực tiểu của ảnh chênh lệch Gaussian ................................... 42
Hình 2.9 Biểu đồ số điểm chính được phát hiện trong một hình ảnh điển hình dưới
dạng hàm của số lượng mẫu tỉ lệ............................................................................ 43
Hình 2.10 Dòng trên cùng trong biểu đồ hiển thị phần trăm các vị trí nổi bật được
phát hiện lặp lại trong một hình ảnh đã biến đổi dưới dạng một hàm làm mịn hình ảnh
trước đó cho mức độ đầu tiên của mỗi quãng tám. Dòng dưới hiển thị phần trăm bộ
mô tả được so khớp chính xác với cơ sở dữ liệu lớn. ............................................. 43
Hình 2.11 Cho thấy các giai đoạn lựa chọn điểm chính......................................... 47
Hình 2.12 Dòng trên cùng trong biểu đồ hiển thị phần trăm các vị trí nổi bật và tỉ lệ
được phát hiện lặp lại như một hàm của nhiễu pixel. Dòng thứ hai cho thấy độ lặp lại
sau khi yêu cầu sự thống nhất trong hướng. Dòng dưới cùng hiển thị phần trăm của
các bộ mô tả được so khớp chính xác với cơ sở dữ liệu lớn. .................................. 51
Hình 2.13 Mảng bộ mô tả 2x2 được tính toán từ một tập hợp 8x8 mẫu. ................ 52
10
Hình 2.14 Biểu đồ này cho thấy phần trăm các điểm chính cho kết quả so khớp chính
xác với cơ sở dữ liệu gồm 40.000 điểm chính dưới dạng hàm số chiều rộng của bộ
mô tả điểm chính 풏 × 풏 và số hướng trong mỗi biểu đồ. Biểu đồ được tính toán cho
hình ảnh có góc nhìn affin thay đổi 50 độ và thêm 4% nhiễu. ................................ 55
Hình 2.15 Biểu đồ này cho thấy phát hiện vị trí điểm chính ổn định, hướng và so
khớp cuối cùng với cơ sở dữ liệu như một hàm biến dạng affine. Mức độ biến dạng
affine được biểu thị theo chiều sâu của góc quay tương đương đối với một bề mặt
phẳng..................................................................................................................... 56
Hình 2.16 Các thay đổi tỉ lệ và xoay ngẫu nhiên, biến đổi affine 30 độ và nhiễu hình
ảnh thêm 2% trước khi so khớp. ............................................................................ 57
Hình 2.17 Ở bên trái cách tiếp cận sử dụng SIFT; ở bên phải cách tiếp cận MSIFT
trên vân lòng bàn tay không tiếp xúc. .................................................................... 58
Hình 3.1 Sơ đồ của phương pháp đề xuất. ............................................................. 62
Hình 3.2 (a) Đặc trưng CS-LBP với 8 điểm lân cận và (b) Đặc trưng ECS-LBP với
16 khối lân cận (các khối bao gồm 4 điểm) ............................................................ 63
Hình 3.3 (a), (e) Hình ảnh gốc của cùng một người, (b), (f) CS-LBP, (c), g) ECS-
LBP, (d) Khớp giữa (b) và (f ), và (h) So khớp giữa (c) và (g). .............................. 64
Hình 3.4 (a), (e) Hình ảnh gốc của hai người khác nhau, (b), (f) CS-LBP, (c), (g)
ECS-LBP, (d) So khớp giữa (b) và ( f), và (h) So khớp giữa (c) và (g). ................. 65
Hình 4.2 Ảnh vân mạch máu từ bàn tay trái trong cơ sở dữ liệu PUT_left_100..... 66
Hình 4.4 Ảnh vân mạch máu từ bàn tay phải trong cơ sở dữ liệu PUT_right_100 . 66
11
TÓM TẮT
Gần đây, nhận dạng vân mạch máu lòng bàn tay là công nghệ sinh trắc học
mới với mức độ riêng tư và bảo mật cao vì kỹ thuật này sử dụng các mạch máu dưới
da lòng bàn tay để thiết lập nhận dạng. Nghiên cứu đề xuất phương pháp rút trích đặc
trưng vân mạch máu lòng bàn tay mới để nhận dạng vân mạch máu lòng bàn tay
không tiếp xúc dựa trên việc kết hợp mô hình nhị phân cục bộ đối xứng trung tâm
(ECS-LBP) cải tiến với SIFT và MFRAT, được gọi là MFRAT SIFT - ECS-LBP.
Phương pháp đề xuất bao gồm hai bước: 1) áp dụng bộ lọc MFRAT để rút trích đặc
trưng hướng của đường vân. 2) Áp dụng phương pháp ECS-LBP để phát hiện các
đường vân mạch máu lòng bàn tay ổn định và rõ ràng. 3) Rút trích đặc trưng cục bộ
bất biến SIFT trên hình ảnh đường vân mạch máu lòng bàn tay. Kết quả thử nghiệm
trên cơ sở dữ liệu vân mạch máu lòng bàn tay không tiếp xúc công khai PUT cho thấy
rằng phương pháp đề xuất của đề tài đạt độ chính xác cao và mạnh mẽ để nhận dạng
vân mạch máu lòng bàn tay so với các phương pháp khác.
TP Hồ Chí Minh, ngày 14 tháng 5 năm 2021
Phạm Thị Quỳnh – Trần Lê Hải Bình
12
CHƯƠNG 1 TỔNG QUAN
1.1 Giới thiệu chung
1.1.1 Giới thiệu sinh trắc học
Trong thời đại công nghệ phát triển, việc nhận dạng cá nhân tự động được thực
hiện ngày càng nhanh chóng và dễ dàng. Công nghệ sinh trắc học ngày càng được
ứng dụng phổ biến. Ví dụ ứng dụng nhận dạng vân tay trên thiết bị di động. Ứng dụng
dụng này hết sức tiện lợi để bảo mật thiết bị di động. Theo kết quả từ một cuộc khảo
sát gần đây, sinh trắc học được người sử dụng yêu thích và ngày càng thay thế việc
sử dụng mật khẩu [1]. Sinh trắc học mang lại những lợi thế nhất định mà các cơ chế
xác thực khác không thể cung cấp. Cơ chế này gắn kết chặt chẽ giữ danh tính người
dùng với đặc điểm của người đó. Đặc điểm sinh trắc học này không bị mất và không
bị trùng lắp [2]. Sinh trắc học có khả năng chống lại các cuộc tấn công cao hơn so với
các phương pháp khác. Một trong những lợi thế chính của hệ thống nhận dạng sinh
trắc học là hệ thống xác định được các người dùng đã được đăng ký trong hệ thống
[3]. Ngoài ra, các hệ thống sinh trắc học yêu cầu sự hiện diện của người dùng tại thời
điểm xác thực, ngăn chặn các cá nhân đưa ra các yêu cầu từ chối sai [4]. Cả hai điều
khoản này đều đặc biệt quan trọng trong các ứng dụng yêu cầu bảo mật, nơi những
kẻ mạo danh có thể cố gắng yêu cầu các danh tính khác nhau và đạt được lợi ích. Bên
cạnh việc tăng cường bảo mật, các hệ thống sinh trắc học cũng mang lại sự tiện lợi
cho người dùng bằng cách giảm bớt yêu cầu thiết kế mật khẩu và mã thông báo [5].
Hệ thống sinh trắc học sử dụng các đặc điểm cơ thể hoặc hành vi làm đặc trưng
nhận dạng. Hình 1.1 minh họa một số ví dụ về các đặc điểm sinh trắc học có thể được
sử dụng để xác thực người dùng. Chúng bao gồm khuôn mặt, tai, mống mắt, quét
võng mạc, giọng nói, vân tay, dấu vân tay, hình dạng bàn tay/ngón tay, các mẫu vân
mạch máu, nhịp tim hoặc thậm chí DNA [6], [7].
13
Hình 1.1 Các đặc điểm sinh trắc học về cơ thể và hành vi.
Đặc điểm hành vi là những đặc trưng thoái quen về hành động cơ thể của mỗi
người ví dụ như: dáng đi, chữ ký, lực gõ phím/nhịp gõ, cách sử dụng chuột của máy
tính và đặc điểm cầm thiết bị của người khác. Hơn nữa, các đặc trưng sinh trắc học
khác như: da, mắt, màu tóc, sự hiện diện của râu, chiều cao, cân nặng, hình xăm và
các yếu tố khác, cũng được sử dụng rộng rãi cho mục đích nhận diện [8]. Các thiết
bị, chẳng hạn như camera từ siêu thị đến các địa điểm công cộng và đường đi, có thể
xác định những người đi qua. Các hệ thống mới được thiết kế cẩn thận để có thể giảm
thiểu các lỗi nhận dạng sai. Trong tương lai các hệ thống thế hệ tiếp theo có thể giảm
hơn nữa lỗi nhận dạng sai bằng cách phát hiện các điều kiện làm suy yếu bất kỳ yếu
tố bên ngoài nào có thể ảnh hưởng đến hiệu quả của thiết bị dựa trên sinh trắc học.
14
1.1.2 Các ứng dụng của sinh trắc học
Hệ thống sinh trắc học được áp dụng trong nhiều lĩnh vực, đặc biệt là liên quan
đến bảo mật như kiểm soát truy cập vật lý và logic. Bao gồm các lĩnh vực sau:
1. Dịch vụ ngân hàng/tài chính như máy ATM, thiết bị thanh toán đầu cuối, thanh
toán không dùng tiền mặt, rút tiền mặt tự động,
2. Bảo mật máy tính & công nghệ thông tin như giao dịch Internet, đăng nhập
máy tính cá nhân,
3. Chăm sóc sức khỏe như quan tâm đến quyền riêng tư, kiểm soát thông tin bệnh
nhân, kiểm soát thuốc,
4. Nhập cư như kiểm soát biên giới, du khách thường xuyên, người tị nạn,
5. Luật pháp và trật tự xã hội như thẻ căn cước, bỏ phiếu, kiểm soát súng, nhà
tù,
6. Người gác cổng/Kiểm soát ra vào cửa như thiết lập an toàn, quân đội, khách
sạn, quản lý tòa nhà,
7. Viễn thông như điện thoại, gian lận thuê bao, trung tâm cuộc gọi, trò chơi,
8. Điểm danh và sự chuyên cần trong học tập và chấm công trong công ty.
9. Phúc lợi, bao gồm các dịch vụ chăm sóc sức khỏe và các khoản thanh toán
phúc lợi.
10. Sản phẩm tiêu dùng như máy dịch vụ tự động, ATM, thiết bị khóa, PDA,
1.1.3 Yêu cầu của đặc trưng sinh trắc học
Đặc trưng sinh trắc học cần thỏa các tính chất để có thể áp dụng được bao
gồm: tính phổ biến, tính duy nhất, tính lâu dài, khả năng thu thập, khả năng đo lường,
hiệu suất, khả năng chấp nhận và độ tin cậy. Trong “Sổ tay sinh trắc học” [13], “Công
nghệ sinh trắc học và các hoạt động phát triển tiêu chuẩn sinh trắc học quốc tế-bảo
mật” [14], các đặc tính này được trình bày như sau:
Tính phổ biến: Mỗi cá nhân truy cập ứng dụng sinh trắc học phải có một
phương thức cụ thể như dấu vân tay, mống mắt hoặc tai mà họ có thể sử dụng để nhận
dạng bản thân.
15
Tính duy nhất: Đặc tính đã cho phải đủ khác biệt giữa các cá nhân. Các đặc
điểm duy nhất có thể được sử dụng để ngăn chặn truy cập trái phép vào hệ thống sinh
trắc học, ngăn chặn các cuộc tấn công. Do vậy, tính chất này hết sức quan trong, đảm
bảo nhu cầu bảo mật và quyền riêng tư khi khi thiết kế hệ thống sinh trắc học.
Tính lâu dài: Đặc tính sinh trắc học của một cá nhân phải đủ bất biến trong
một khoảng thời gian đối với thuật toán so khớp áp dụng của hệ thống.
Khả năng thu thập: Đề cập đến sự dễ dàng của việc lấy dữ liệu sinh trắc học.
Có thể thu thập và số hóa các đặc trưng sinh trắc học bằng cách sử dụng các thiết bị
phù hợp với các cảm biến mà không gây bất tiện quá mức cho người dùng. Bằng cách
đó, chúng ta có thể rút trích và biểu diễn thành công tập dữ liệu trong các mẫu sinh
trắc học.
Khả năng đo lường: Bộ dữ liệu sinh trắc học phải phù hợp cho việc phân tích
thống kê xác định kết quả phù hợp. Cần đánh giá độ phức tạp của các thuật toán áp
dụng, thời gian tính toán và chi phí các thành phần của sơ đồ để xác định hiệu quả
của hệ thống trong các ứng dụng trong thực tế.
Hiệu suất: Được sử dụng để xác định độ chính xác của hệ thống nhằm cho
phép người dùng được ủy quyền mới có quyền truy cập và từ chối những kẻ mạo
danh.
Khả năng chấp nhận: Đề cập đến cách mọi người phản ứng với hệ thống sinh
trắc học, mức độ quen thuộc với các công nghệ sinh trắc học và việc sử dụng các ứng
dụng (thói quen) và mức độ sẵn sàng cung cấp dữ liệu sinh trắc học.
Độ tin cậy: Xác định chất lượng của đặc tính sinh trắc học. Trong cùng một
ngữ cảnh, thuộc tính gian lận/giả mạo được sử dụng để đánh giá các cuộc tấn công
giả mạo tiềm ẩn và đo lường mức độ dễ dàng bắt chước một đặc điểm sinh trắc học.
1.1.4 Đặc trưng vân mạch máu lòng bàn tay
Nhận dạng vân mạch máu lòng bàn tay xuất hiện vào năm 1991 [17], thu hút sự
chú ý của mọi người vì tính bảo mật cao, khả năng phát hiện trực tiếp, khả năng chấp
nhận của người dùng và sự tiện lợi. Đặc trưng nhận dạng vân mạch máu lòng bàn tay
thể hiện tính bảo mật cao, vì sử dụng mạng lưới các mạch máu dưới da lòng bàn tay
16
để nhận dạng. Vân mạch máu lòng bàn tay là thông tin sinh học bên trong cơ thể, nên
những kẻ xâm nhập khó sao chép các mẫu vân mạch máu hơn nhiều so với các đặc
điểm sinh trắc học khác. Mạch máu lòng bàn tay hầu như không nhìn thấy được đối
với mắt người; thường được chụp dưới ánh sáng hồng ngoại (NIR). Ở trạng thái tự
nhiên, các vân mạch máu lòng bàn tay được che giấu một cách tự nhiên. Hơn nữa,
các mẫu vân mạch máu không bị trùng lặp ở những người khác nhau. Do đó, vân
mạch máu được coi như một mã nhận dạng an toàn cao của con người. Trên thực tế,
kiểu mạch máu ở tay trái và tay phải cũng khác nhau [18]. Nhận dạng vân mạch máu
lòng bàn tay đảm bảo tính sống trong mẫu sinh trắc học. Nếu không có máu chảy,
hình ảnh mạch máu sẽ biến mất và hệ thống nhận dạng vân mạch máu lòng bàn tay
có khả năng chấp nhận cao của người dùng. Thu thập hình ảnh vân mạch máu lòng
bàn tay dễ dàng và không làm phiền [19]. Vì hình ảnh mẫu vân mạch máu lòng bàn
tay thu được không cần tiếp xúc trực tiếp với cảm biến rút trích mẫu vân mạch máu,
nên không có sự nhiễm bẩn nào từ bề mặt sang tay của đặc trưng. Ngoài ra, các điều
kiện bên ngoài từ bàn tay, như dầu mỡ và bụi bẩn, sự hao mòn của bàn tay và bề mặt
tay khô và ướt không ảnh hưởng đến cấu trúc vân mạch máu.
1.2 Hệ thống nhận dạng vân mạch máu lòng bàn tay
1.2.1 Hệ thống định danh
Hệ thống định danh cho biết người được định danh có trong cơ sở dữ liệu của
hệ thống nhận dạng vân mạch máu và hệ thống có thể lấy ra danh tính của một người
bằng cách so khớp các thuộc tính vân mạch máu của người này với các thuộc tính
được lưu trữ của tất cả những người khác trong cơ sở dữ liệu. Do đó, việc định danh
liên quan đến tìm kiếm một-nhiều [29].
1.2.2 Hệ thống xác thực
Hệ thống xác thực kiểm tra xác nhận danh tính được yêu cầu bởi người dùng
với hệ thống. Do đó, hệ thống xác thực không cần phải so khớp các thuộc tính vân
mạch máu đã chỉ định với tất cả các thuộc tính được lưu trữ; nó chỉ cần so khớp với
một cặp thuộc tính, một thuộc tính đại diện cho danh tính được yêu cầu và một thuộc
17
tính khác được đo lường tại thời điểm yêu cầu. Do đó, xác thực bao gồm tìm kiếm
một-một [29].
1.2.3 Quy trình nhận dạng vân mạch máu lòng bàn tay
Một hệ thống nhận dạng vân mạch máu lòng bàn tay điển hình bao gồm bốn
bước: thu nhận hình ảnh vân mạch máu lòng bàn tay, tiền xử lý, đặc biệt là ở vị trí
ROI, rút trích đặc trưng và so khớp, được minh họa trong Hình 1.2. Thu nhận hình
ảnh vân mạch máu lòng bàn tay. Tiền xử lý trước một phần phân đoạn hình ảnh vân
mạch máu lòng bàn tay để rút trích đặc trưng. Quá trình rút trích đặc trưng thu được
các đặc trưng hiệu quả từ vân mạch máu lòng bàn tay được xử lý trước. So khớp đặc
trưng so sánh hai đặc trưng vân mạch máu lòng bàn tay và cơ sở dữ liệu lưu trữ các
mẫu đã đăng ký.
Thu nhận ảnh
vân mạch máu
lòng bàn tay Vị trí
ROI
Quyết định:
So khớp Rút trích
Thật hoặc đặc trưng đặc trưng
giả mạo
Hình 1.2 Sơ đồ khối nhận diện bằng hình ảnh vân mạch máu lòng bàn tay
Thu nhận ảnh
1.2.3.1.1 Giới thiệu
Trong nghiên cứu sinh trắc học, kết hợp nhiều phương thức hình ảnh đã được
chứng minh một cách đầy hứa hẹn để nâng cao hiệu suất nhận dạng. Theo lý thuyết
điện từ, các sóng hertzian từ ánh sáng quang phổ nhìn thấy được đến tia hồng ngoại
phụ cận cung cấp khả năng xâm nhập mạnh hơn vào các đặc trưng. Đối với sinh trắc
học bàn tay, đèn chiếu sáng đa phổ có thể xuyên qua các mô dưới da ở các độ sâu
18
khác nhau trong các vùng lòng bàn tay và hình thành hình ảnh kết cấu bề mặt da và
động mạch (bao gồm vân mạch máu lòng bàn tay). Dựa trên đặc tính này, thiết kế
một thiết bị hình ảnh đa phổ để thu thập thông tin tương quan và bổ sung của bàn tay
con người [15].
1.2.3.1.2 Mô tả thu nhận ảnh
Thiết bị chụp ảnh đa quang phổ lòng bàn tay, như thể hiện trong Hình 1.3. Tất
cả hình ảnh lòng bàn tay với mức xám 8 bit. Đối với mỗi bàn tay, chụp hai phiên hình
ảnh lòng bàn tay. Khoảng thời gian giữa hai đợt hơn một tháng. Trong mỗi phiên, có
ba mẫu. Mỗi mẫu chứa sáu hình ảnh lòng bàn tay được chụp cùng một lúc với sáu
quang phổ khác nhau. Bước sóng của đèn chiếu sáng tương ứng với sáu quang phổ
lần lượt là 460nm, 630nm, 700nm, 850nm, 940nm và ánh sáng trắng. Giữa hai mẫu,
cho phép thay đổi các tư thế tay ở một mức độ nhất định. Thông qua đó, hướng tới
việc tăng tính đa dạng của các mẫu nội lớp (intra-class) và mô phỏng ứng dụng thực
tế[15].
Hình 1.3 Thiết bị chụp ảnh đa phổ lòng bàn tay
Trong thiết bị chụp ảnh đa phổ lòng bàn tay không có chốt để hạn chế tư thế
và vị trí của lòng bàn tay. Đặc trưng được yêu cầu đặt lòng bàn tay vào thiết bị và đặt
nó trước nền đồng màu. Thiết bị cung cấp ánh sáng phân bố đồng đều và chụp ảnh
19
lòng bàn tay bằng camera CCD được gắn cố định trên đáy thiết bị. Một mạch điều
khiển được thiết kế để điều chỉnh phổ một cách tự động. Sáu hình ảnh vân lòng bàn
tay điển hình trong cơ sở dữ liệu được hiển thị trong Hình 1.4[15].
Hình 1.4 Sáu hình ảnh vân lòng bàn tay điển hình trong cơ sở dữ liệu
Tiền xử lý
Rút trích ROI là một vấn đề nóng đối với việc xác định vân lòng bàn tay và
vân mạch máu lòng bàn tay. Rút trích ROI đề cập đến việc thực hiện một loạt các
điều chỉnh và vị trí các điểm chính (key point) cho các hình ảnh vân mạch máu lòng
bàn tay và lòng bàn tay khác nhau, sau đó khu vực trung tâm hiệu quả được chọn để
rút trích và so sánh đặc trưng được thực hiện để nhận dạng. Vùng trung tâm này
thường được gọi là vùng quan tâm (ROI), đối với hình ảnh vân mạch máu và vân lòng
bàn tay của cùng một lòng bàn tay, vị trí của ROI phải giống nhau. Mục đích xác định
vị trí và lựa chọn ROI để thực hiện normalization khu vực đặc trưng các đường vân
lòng bàn tay và vân mạch máu lòng bàn tay khác nhau, do đó ảnh hưởng của các yếu
tố bất lợi sẽ được loại bỏ và hình ảnh phụ bao gồm thông tin đa dạng về vân lòng bàn
tay hoặc vân mạch máu lòng bàn tay được rút trích thuận tiện cho việc rút trích và so
khớp đặc trưng sau này. Hiện nay có rất nhiều phương pháp rút trích ROI [25-28].
Các phương pháp rút trích ROI của vân mạch máu lòng bàn tay và vân lòng bàn tay
20
dựa trên đường tròn nội tiếp cực đại [27] và phương pháp tâm [16]. Phương pháp
đường tròn nội tiếp cực đại sử dụng tâm và bán kính được xác định trong lòng bàn
tay, và đường tròn nội tiếp lớn nhất trong tất cả các diện tích lòng bàn tay sẽ được
thực hiện, sau đó thực hiện hiệu chỉnh góc quay của lòng bàn tay. Hình vuông nội
tiếp lớn nhất được cắt ra trong hình tròn nội tiếp, cuối cùng được chuẩn hóa thành
kích thước của hình ảnh ROI 128 × 128. Phương pháp dựa trên việc rút trích tâm sử
dụng tâm của hình ảnh lòng bàn tay đã thu được và hình ảnh con hình chữ nhật có
kích thước là 256 × 256 được ngăn lại bằng cách sử dụng tâm làm trung tâm.
Trong đó phương pháp đường tròn nội tiếp cực đại thường hay được sử dụng trong
giai đoạn tiền xử lý để rút trích ROI, đặc trưng vân mạch máu lòng bàn tay nhận được
sau khi rút trích giàu thông tin.
Lưu đồ phương pháp đường tròn nội tiếp cực đại.
Nhận đường Xoay hình ảnh,
tròn nội tiếp cắt hình chữ
Tiền xử lý cực đại nhật nội tiếp Cắt vùng ROI
Cắt Nhị Hoạt động
hình ảnh phân hình thái
Hình 1.5 Lưu đồ của phương pháp đường tròn nối tiếp cực đại rút trích ROI
Vì có một số nhiễu trên cạnh của hình ảnh, trước tiên cắt bỏ một số cạnh không
cần thiết và sau đó xử lý nhị phân hình ảnh, biến ảnh thành ảnh đen trắng để giảm
đáng kể chi phí tính toán. Sau khi xử lý nhị phân, hình ảnh thu được không lý tưởng,
có một số đốm trắng nhỏ là nhiễu không hữu dụng. Do đó, sử dụng phép toán hình
thái (morphological) để loại bỏ những nhiễu này. Ví dụ, hình ảnh bảng màu dưới
nguồn sáng trắng được chọn ngẫu nhiên từ cơ sở dữ liệu CASIA [15]. Hình 1.6 là
hình ảnh màu xám và Hình 1.7 là hình ảnh nhị phân sau các phép toán hình thái.
21
Hình 1.6 Hình ảnh mức xám
Hình 1.7 Hình ảnh nhị phân sau các phép toán hình thái
Bởi vì mỗi người có kích thước lòng bàn tay khác nhau và vị trí của lòng bàn
tay cũng khác nhau khi thu thập các bảng màu, phương pháp xác định vị trí dựa trên
đường tròn nội tiếp cực đại. Cách tiếp cận này tận dụng các đặc điểm đường viền
hình dạng bàn tay, các bước cụ thể như sau:
1) Sau khi tiền xử lý, thu được hình ảnh nhị phân của lòng bàn tay, điểm trung
tâm của đường tròn nội tiếp cực đại trong lòng bàn tay nằm trong vùng lòng
bàn tay. Để nâng cao hơn nữa hiệu quả của các phép tính, điểm trung tâm có
thể nằm trong lòng bàn tay xung quanh tâm. Sử dụng tâm làm điểm gốc để xác
định một hình chữ nhật có chiều dài nhất định. Theo kinh nghiệm, thường xác
định kích thước hình chữ nhật là 100 × 100. Tìm kiếm tâm vòng tròn trong
khu vực này sẽ cải thiện hiệu quả rất nhiều.
2) Lấy một điểm trong hình chữ nhật làm tâm của đường tròn và thay đổi dần bán
kính của hình tròn. Khi cạnh của vòng tròn này rơi vào cạnh của vân mạch
máu lòng bàn tay, sẽ ngừng tìm kiếm bán kính và ghi lại bán kính của hình
tròn này.
22
3) Thay đổi tâm của đường tròn và tiếp tục tìm bán kính của đường tròn. Cuối
cùng, ghi lại tâm điểm và bán kính của hình tròn lớn nhất. Đường tròn này là
đường tròn nội tiếp cực đại của toàn bộ diện tích lòng bàn tay.
Không có giới hạn đối với vị trí xoay của lòng bàn tay khi thu thập hình ảnh, vì
vậy thực hiện hiệu chỉnh xoay hình ảnh lòng bàn tay trước khi ROI bị chặn.
Ngoài tâm O, đặt thêm một điểm tham chiếu L. Xác định bán kính đường tròn nội
tiếp lớn nhất bằng R, lấy tâm của đường tròn làm gốc, vẽ đường tròn với KR (K> 1),
đường tròn sẽ giao nhau với các ngón tay. Tìm giao điểm A, B của ngón giữa và ngón
đeo nhẫn, sau đó nhận được điểm trung tâm L, nối OL là trục tọa độ x mới như Hình
1.8. Trong tọa độ mới, hình ảnh lòng bàn tay được xoay.
Hình 1.8 Hình ảnh xoay
Và sau đó, lấy O làm tâm, R là bán kính và lấy kích thước R × R của hình ảnh
con có kích thước không cố định. Đó là trong hình tròn nội tiếp cực đại, tiến hành
chặn hình vuông nội tiếp lón nhất là ROI, và sau đó chuẩn hóa thành kích thước 128
× 128. Các thực nghiệm sau sử dụng bảng màu dưới nguồn sáng trắng làm ví dụ, kết
quả được thể hiện trong Hình 1.9 và 1.10.
23
Hình 1.9 Cắt hình ảnh ROI Hình 1.10 Hình ảnh ROI vân lòng bàn
tay
Hình ảnh vân mạch máu lòng bàn tay và hình ảnh lòng bàn tay tương tự nhau,
cả hai đều là từ lòng bàn tay, nhưng dưới các bước sóng khác nhau của nguồn sáng,
thông tin hiển thị là khác nhau. Dưới nguồn ánh sáng trắng, thông tin về vân lòng bàn
tay được hiển thị và dưới ánh sáng hồng ngoại gần 850nm, thông tin về vân mạch
máu lòng bàn tay được thể hiện, vì vậy các bước rút trích giống nhau. Hình ảnh ROI
vân mạch máu lòng bàn tay được trích xuất cuối cùng được hiển thị trong Hình 1.11.
Có thông tin đa dạng về vân mạch máu lòng bàn tay trong hình ảnh.
Hình 1.11 Hình ảnh ROI của vân mạch máu lòng bàn tay
Rút trích đặc trưng và so khớp
Khi hình ảnh ROI đượ...ỗi quãng tám.
Việc lặp lại không tiếp tục được cải thiện khi có nhiều tỉ lệ hơn được lấy mẫu.
Vì điều này dẫn đến nhiều điểm cực trị cục bộ hơn được phát hiện, nhưng các điểm
cực trị này trung bình kém ổn định hơn và do đó ít có khả năng được phát hiện trong
hình ảnh đã biến đổi. Điều này được thể hiện bằng biểu đồ thứ hai trong Hình 2.9,
cho thấy số lượng trung bình các điểm chính được phát hiện và so khớp chính xác
trong mỗi hình ảnh. Số lượng các điểm chính tăng lên cùng với việc tăng mẫu tỉ lệ và
tổng số các kết quả so khớp chính xác cũng tăng lên. Việc nhận dạng đặc trưng thường
phụ thuộc nhiều vào số lượng các điểm chính được so khớp chính xác, trái ngược với
44
tỉ lệ phần trăm so khớp đúng của chúng, nên đối với nhiều ứng dụng, sẽ là tối ưu khi
sử dụng số lượng mẫu theo tỉ lệ lớn hơn. Tuy nhiên, chi phí tính toán cũng tăng theo.
Tóm lại, các thực nghiệm này cho thấy rằng hàm không gian tỉ lệ DoG có một
số lượng lớn các cực trị và sẽ rất tốn kém để phát hiện tất cả các điểm này. Tuy nhiên,
chúng ta có thể phát hiện ra tập hợp con hữu ích và ổn định khi lấy mẫu theo tỉ lệ thô.
2.4.1.2.3 Tần suất lấy mẫu trong miền không gian
Xác định tần số lấy mẫu trong miền ảnh so với tỉ lệ làm mịn. Các điểm cực trị
có thể gần nhau một cách tùy ý, có sự cân bằng tương tự giữa tần suất lấy mẫu và tốc
độ phát hiện. Hình 2.10 xác định thực nghiệm về lượng làm mịn trước, 휎, được áp
dụng cho mỗi cấp độ hình ảnh trước khi xây dựng biểu diễn không gian tỉ lệ cho một
quãng tám. Điểm mấu chốt là khả năng lặp lại phát hiện điểm chính, và kết quả cho
thấy độ lặp lại tiếp tục tăng theo 휎. Tuy nhiên, chi phí để sử dụng 휎 lớn về mặt hiệu
quả, chọn sử dụng 휎 = 1.6, gần với độ lặp lại tối ưu. Giá trị này được sử dụng cho
kết quả trong Hình 2.9.
Làm mịn hình ảnh trước khi phát hiện điểm cực trị, sẽ loại bỏ các tần số không
gian cao nhất một cách hiệu quả. Do đó, để tận dụng tối đa đầu vào, hình ảnh có thể
được mở rộng để tạo ra nhiều điểm mẫu hơn so với hình ảnh ban đầu. Tăng gấp đôi
kích thước của hình ảnh đầu vào bằng cách sử dụng tuyến tính. Có thể thực hiện một
cách hiệu quả bằng cách sử dụng các bộ lọc subpixel-offset trên hình ảnh gốc, việc
nhân đôi hình ảnh dẫn đến việc triển khai hiệu quả hơn. Giả định rằng hình ảnh gốc
có độ mờ ít nhất là 휎 = 0.5 (mức tối thiểu cần thiết để ngăn hiện tượng lỗi đáng kể)
và do đó hình ảnh được nhân đôi có 휎 = 1.0 so với khoảng cách pixel mới. Điều này
có nghĩa là cần phải làm mịn thêm hình ảnh trước khi tạo ra quãng tám đầu tiên của
không gian tỉ lệ. Việc nhân đôi hình ảnh làm tăng số lượng điểm chính ổn định lên hệ
số 4, nhưng không tìm thấy cải tiến đáng kể nào với hệ số mở rộng lớn hơn.
Định vị điểm chính
Khi một điểm chính nổi bật được tìm thấy bằng cách so sánh một pixel với các
điểm ảnh lân cận, bước tiếp theo thực hiện so khớp chi tiết với dữ liệu lân cận về vị
trí, tỉ lệ và các độ cong chính. Thông tin này cho phép loại bỏ các điểm có độ tương
45
phản thấp (và do đó nhạy cảm với nhiễu) hoặc được khoanh vùng kém dọc theo một
cạnh.
Ban đầu phương pháp này (Lowe, 1999) chỉ đơn giản là định vị các điểm chính
ở vị trí và tỉ lệ của điểm mẫu trung tâm. Tuy nhiên, Brown đã phát triển một phương
pháp (Brown và Lowe, 2002) để so khớp một hàm bậc hai 3D với các điểm mẫu cục
bộ để xác định vị trí nội suy của điểm cực đại, và các thực nghiệm cho thấy rằng điều
này cung cấp một cải tiến đáng kể cho việc so khớp và ổn định. Cách tiếp cận của
ông sử dụng hàm mở rộng không gian tỉ lệ của Taylor (lên đến các số hạng bậc hai),
퐷(푥, 푦, 휎), được dịch chuyển sao cho điểm gốc là điểm mẫu:
휕퐷푇 1 휕2퐷
퐷(푋) = 퐷 + 푋 + 푋푇 푋 (2.10)
휕푋 2 휕푋2
trong đó D và các đạo hàm được đánh giá tại điểm mẫu và 푋 = (푥, 푦, 휎)푇 là phần bù
từ điểm này. Vị trí của điểm cực trị, 푋̂, được xác định bằng cách lấy đạo hàm của hàm
này đối với 푋 và gán giá trị bằng 0, theo công thức
휕2퐷−1 휕퐷
푋̂ = − (2.11)
휕푋2 휕푋
46
Hình 2.9 Cho thấy các giai đoạn lựa chọn điểm chính.
(a) Hình ảnh gốc 233x189 pixel. (b) 832 điểm chính ban đầu xác định vị trí tại cực đại
và cực tiểu của DoG. Các điểm chính được hiển thị dưới dạng vectơ cho biết tỉ lệ,
hướng và vị trí. (c) Sau khi áp dụng ngưỡng về độ tương phản tối thiểu, 729 điểm
chính vẫn còn. (d) 536 điểm chính cuối cùng vẫn tuân theo một ngưỡng bổ sung về tỉ
lệ độ cong chính.
Theo đề xuất của Brown, Hessian và đạo hàm của D được tính gần đúng bằng
cách sử dụng sự khác biệt của các điểm mẫu lân cận. Kết quả hệ thống tuyến tính 3x3
có thể được giải quyết với chi phí tối thiểu. Nếu độ lệch 푋̂ lớn hơn 0,5 theo bất kỳ
hướng nào, điều đó cho biết điểm cực trị nằm gần một điểm mẫu khác hơn. Trong
trường hợp này, điểm mẫu được thay đổi và thực hiện nội suy thay thế cho điểm đó.
Phần bù cuối cùng 푋̂ được thêm vào vị trí của điểm mẫu để có được ước lượng nội
suy cho vị trí của điểm cực trị.
Giá trị hàm tại điểm cực trị, D (푋̂), rất hữu ích để loại bỏ điểm cực trị không
ổn định với độ tương phản thấp. Điều này có thể nhận được bằng cách thay thế
phương trình (2.11) vào (2.10), cho như sau
47
1 휕퐷푇
퐷(푋̂) = 퐷 + 푋̂
2 휕푋
Hình 2.11 cho thấy các tác động của việc chọn điểm chính đối với hình ảnh tự
nhiên. Để tránh quá nhiều xáo trộn, hình ảnh có độ phân giải thấp 233 x 189 pixel
được sử dụng và các điểm chính được hiển thị dưới dạng vectơ cho biết vị trí, tỉ lệ và
hướng của mỗi điểm chính. Hình 2.11 (a) cho thấy hình ảnh ban đầu, được hiển thị ở
độ tương phản giảm phía sau các hình tiếp theo. Hình 2.11 (b) cho thấy 832 điểm
chính ở tất cả các điểm cực đại và cực tiểu được phát hiện của hàm DoG, trong khi
(c) cho thấy 729 điểm chính vẫn còn sau khi loại bỏ các điểm có giá trị là |(푋̂)| nhỏ
hơn 0,03. Phần (d) sẽ được giải thích trong phần sau.
2.4.1.3.1 Loại bỏ cạnh không ổn định
Để ổn định, không đủ để loại bỏ các điểm chính có độ tương phản thấp. Hàm
DoG phản hồi mạnh mẽ dọc theo các cạnh, ngay cả khi vị trí dọc theo cạnh được xác
định kém và do đó không ổn định đối với lượng nhiễu nhỏ.
Một đỉnh được xác định kém trong hàm DoG sẽ có độ cong chính lớn qua cạnh
nhưng lại nhỏ theo hướng vuông góc. Các độ cong chính có thể được tính toán từ ma
trận Hessian 2x2, 푯, được tính toán tại vị trí và tỉ lệ của điểm chính:
퐷 퐷
푯 = [ 푥푥 푥푦] (2.12)
퐷푥푦 퐷푦푦
Các đạo hàm được ước tính bằng cách lấy sự khác biệt của các điểm mẫu lân
cận.
Các giá trị riêng của 푯 tỉ lệ với độ cong chính của D. Mượn từ cách tiếp cận
được sử dụng bởi Harris và Stephens (1988), có thể tránh tính toán rõ ràng các giá trị
riêng, chỉ quan tâm đến tỉ lệ của chúng. Gọi 훼 là giá trị riêng có độ lớn lớn nhất và 훽
là giá trị nhỏ hơn. Sau đó, có thể tính tổng các giá trị riêng từ dấu vết của 푯 và tích
của chúng từ yếu tố quyết định:
푇푟(푯) = 퐷푥푥 + 퐷푦푦 = 훼 + 훽,
2
퐷푒푡(푯) = 퐷푥푥퐷푦푦 − (퐷푥푦) = 훼훽.
48
Trong trường hợp không chắc chắn rằng yếu tố xác định là âm, các đường
cong có các dấu hiệu khác nhau nên điểm bị loại bỏ vì không phải là điểm cực trị.
Gọi 푟 là tỷ số giữa cường độ giá trị riêng lớn nhất và giá trị nhỏ hơn, sao cho 훼 = 푟훽.
Sau đó,
푇푟(푯)2 (훼 + 훽)2 (푟훽 + 훽)2 (푟 + 1)2
= = = ,
퐷푒푡(푯) 훼훽 푟훽2 푟
điều này chỉ phụ thuộc vào tỉ lệ của các giá trị riêng. Đại lượng (푟 + 1)2⁄푟 là nhỏ
nhất khi hai giá trị riêng bằng nhau và tăng theo 푟. Do đó, để kiểm tra tỉ lệ độ cong
cơ bản dưới ngưỡng nào đó, 푟, chúng ta chỉ cần kiểm tra
푇푟(푯)2 (푟 + 1)2
< .
퐷푒푡(푯) 푟
Điều này hiệu quả để tính toán, với ít hơn 20 phép toán số thực dấu phẩy động
được yêu cầu để kiểm tra mỗi điểm chính.
Xác định hướng
Bằng cách gán một hướng thích hợp cho mỗi điểm chính dựa trên các thuộc
tính hình ảnh cục bộ, bộ mô tả điểm chính có thể được biểu diễn liên quan đến hướng
này và do đó đạt được sự bất biến đối với việc xoay hình ảnh. Nhược điểm của cách
tiếp cận là hạn chế các bộ mô tả có thể được sử dụng và loại bỏ thông tin hình ảnh do
không yêu cầu tất cả sự đo lường phải dựa trên việc xoay hình ảnh thích hợp.
Tỉ lệ của điểm chính được sử dụng để chọn hình ảnh làm mịn Gaussian, 퐿, với
tỉ lệ gần nhất, để tất cả các phép tính được thực hiện theo tỉ lệ bất biến. Đối với mỗi
mẫu hình ảnh, 퐿(푥, 푦), ở tỉ lệ này, cường độ gradient, 푚(푥, 푦) và hướng, 휃(푥, 푦),
được tính toán trước bằng cách sử dụng các pixel khác nhau:
2 2
푚(푥, 푦) = √(퐿(푥 + 1, 푦) − 퐿(푥 − 1, 푦)) + (퐿(푥, 푦 + 1) − 퐿(푥, 푦 − 1))
휃(푥, 푦) = 푡푎푛−1 ((푥, 푦 + 1) − 퐿(푥, 푦 − 1))⁄(퐿(푥 + 1, 푦) − 퐿(푥 − 1, 푦))
Biểu đồ hướng được hình thành từ các hướng gradient của các điểm mẫu trong
vùng xung quanh điểm chính. Biểu đồ hướng có 36 bin bao gồm phạm vi hướng 360
49
độ. Mỗi mẫu được thêm vào biểu đồ được tính trọng số bằng độ lớn gradient và vòng
tròn có trọng số Gaussian với 휎 gấp 1,5 lần tỉ lệ của điểm chính.
Các đỉnh trong biểu đồ hướng tương ứng với các hướng chính của gradient
cục bộ. Đỉnh cao nhất trong biểu đồ được phát hiện và sau đó bất kỳ đỉnh cục bộ nào
khác nằm trong khoảng 80% của đỉnh cao nhất cũng được sử dụng để tạo ra một điểm
chính với hướng đó. Do đó, đối với các vị trí có nhiều đỉnh có độ lớn tương tự nhau,
sẽ có nhiều điểm chính được tạo ra tại cùng một vị trí và tỉ lệ nhưng hướng khác nhau.
Khoảng 15% số điểm được gán nhiều hướng, nhưng những điểm này góp phần đáng
kể vào sự ổn định khi so khớp. Cuối cùng, một parabol phù hợp với 3 giá trị biểu đồ
gần nhất với mỗi đỉnh để nội suy vị trí đỉnh có độ chính xác tốt hơn.
Hình 2.12 cho thấy sự ổn định về vị trí, tỉ lệ và phân định hướng dưới các
lượng nhiễu ảnh khác nhau. Như trước đây, các hình ảnh được xoay và thu nhỏ theo
số lượng ngẫu nhiên. Dòng trên cùng cho thấy sự ổn định của vị trí nổi bật và chỉ định
tỉ lệ. Dòng thứ hai cho thấy sự ổn định trong so khớp khi hướng được yêu cầu trong
phạm vi 15 độ. Như được hiển thị bởi khoảng cách giữa hai dòng trên cùng, việc gán
hướng vẫn chính xác 95% thời gian ngay cả sau khi thêm nhiễu điểm ảnh ± 10%.
Phương sai hướng đo được cho các kết quả phù hợp chính xác là khoảng 2,5 độ, tăng
lên 3,9 độ đối với nhiễu 10%. Dòng dưới cùng trong Hình 2.12 cho thấy độ chính xác
cuối cùng của việc so khớp chính xác một bộ mô tả điểm chính với cơ sở dữ liệu gồm
40.000 điểm chính. Như biểu đồ này cho thấy, các đặc trưng SIFT có khả năng chống
lại lượng lớn nhiễu pixel và nguyên nhân chính gây ra lỗi là do phát hiện vị trí và tỉ
lệ ban đầu.
50
Hình 2.10 Dòng trên cùng trong biểu đồ hiển thị phần trăm các vị trí nổi bật và tỉ lệ
được phát hiện lặp lại như một hàm của nhiễu pixel. Dòng thứ hai cho thấy độ lặp lại
sau khi yêu cầu sự thống nhất trong hướng. Dòng dưới cùng hiển thị phần trăm của
các bộ mô tả được so khớp chính xác với cơ sở dữ liệu lớn.
Bộ mô tả điểm chính
Các thao tác trước đó đã chỉ định vị trí, tỉ lệ và hướng hình ảnh cho mỗi điểm
chính. Các tham số này áp đặt một hệ tọa độ cục bộ 2D có thể lặp lại để mô tả vùng
ảnh cục bộ và do đó cung cấp sự bất biến cho các tham số. Bước tiếp theo là tính toán
bộ mô tả cho vùng hình ảnh cục bộ có tính phân biệt cao nhưng bất biến nhất đối với
các biến thể còn lại, chẳng hạn như sự thay đổi về độ chiếu sáng hoặc góc nhìn 3D.
Một cách tiếp cận rõ ràng là lấy mẫu các cường độ hình ảnh cục bộ xung quanh
điểm chính ở tỉ lệ thích hợp và so khớp các cường độ này bằng cách sử dụng một
thước đo tương quan chuẩn hóa. Tuy nhiên, mối tương quan đơn giản của các mảng
hình ảnh rất nhạy cảm với những thay đổi gây ra đăng ký sai mẫu, chẳng hạn như
thay đổi góc nhìn affine hoặc 3D hoặc các biến dạng linh hoạt.
Một bộ mô tả điểm chính được tạo ra bằng cách tính toán độ lớn và hướng
gradient tại mỗi điểm mẫu ảnh trong vùng xung quanh vị trí điểm chính, như được
hiển thị bên trái. Cân bằng Gaussian, được biểu thị bằng vòng tròn phủ. Sau đó, các
mẫu này được tích lũy thành các biểu đồ hướng tóm tắt nội dung trên các tiểu vùng
51
4x4, như được hiển thị ở bên phải, với độ dài của mỗi mũi tên tương ứng với tổng độ
lớn của gradient gần hướng đó trong vùng.
Hình 2.11 Mảng bộ mô tả 2x2 được tính toán từ một tập hợp 8x8 mẫu.
2.4.1.5.1 Biểu diễn bộ mô tả (Descriptor representation)
Hình 2.13 minh họa tính toán của bộ mô tả điểm chính. Đầu tiên, cường độ và
hướng của hình ảnh gradient được lấy mẫu xung quanh vị trí điểm chính, sử dụng tỉ
lệ của điểm chính để chọn mức độ mờ Gaussian cho hình ảnh. Để đạt được hướng
bất biến, tọa độ của bộ mô tả và các hướng gradient được xoay so với hướng của điểm
chính. Để đạt hiệu quả cao, các độ dốc được tính toán trước cho tất cả các cấp của
hình chóp. Được minh họa bằng các mũi tên nhỏ tại mỗi vị trí mẫu ở bên trái của
Hình 2.13.
Một hàm trọng số Gaussian với 휎 bằng một nửa chiều rộng của bộ mô tả được
sử dụng để gán trọng số cho độ lớn của mỗi điểm mẫu. Điều này được minh họa bằng
hình tròn bên trái của Hình 2.13. Mục đích của hàm Gaussian này là để tránh những
thay đổi đột ngột trong bộ mô tả với những thay đổi nhỏ về vị trí của và ít nhấn mạnh
hơn đến các gradient ở xa tâm của bộ mô tả, vì chúng bị ảnh hưởng nhiều nhất bởi
lỗi đăng ký sai.
Bộ mô tả điểm quan trọng được hiển thị ở bên phải của Hình 2.13. Cho phép
thay đổi các vị trí gradient bằng cách tạo các biểu đồ hướng trên các vùng mẫu 4x4.
Hình ảnh cho thấy tám hướng của từng biểu đồ hướng, với độ dài của mỗi mũi tên
52
tương ứng với độ lớn đầu vào biểu đồ đó. Một mẫu gradient ở bên trái có thể thay đổi
đến 4 vị trí mẫu, do đó cho phép dịch chuyển vị trí cục bộ lớn hơn.
Tránh tất cả các ảnh hưởng đến đường biên trong đó bộ mô tả thay đổi đột
ngột khi một mẫu chuyển dịch từ biểu đồ này sang biểu đồ khác hoặc từ hướng này
sang hướng khác. Do đó, phép nội suy ba tuyến được sử dụng để phân phối giá trị
của mỗi mẫu gradient vào các ngăn biểu đồ liền kề. Nói cách khác, mỗi đầu vào từng
ngăn được nhân với trọng lượng 1 − 푑 cho mỗi kích thước, trong đó 푑 là khoảng cách
của mẫu từ giá trị trung tâm của từng ngăn như được đo bằng đơn vị của khoảng cách
từng ngăn của biểu đồ.
Bộ mô tả được hình thành từ một vectơ chứa các giá trị của tất cả các đầu vào
biểu đồ hướng, tương ứng với độ dài của các mũi tên ở phía bên phải của Hình 2.13.
Hình vẽ cho thấy một mảng biểu đồ hướng 2x2.
Cuối cùng, vector đặc trưng được sửa đổi để giảm tác động của sự thay đổi độ
chiếu sáng. Đầu tiên, vectơ được chuẩn hóa thành độ dài đơn vị. Một sự thay đổi về
độ tương phản của hình ảnh trong đó mỗi giá trị pixel được nhân với một hằng số sẽ
nhân gradient với cùng một hằng số, do đó, sự thay đổi độ tương phản này sẽ bị hủy
bỏ bằng cách chuẩn hóa vectơ. Thay đổi độ sáng trong đó một hằng số được thêm
vào mỗi pixel hình ảnh sẽ không ảnh hưởng đến các giá trị gradient. Do đó, bộ mô tả
là bất biến đối với những thay đổi của affin trong độ chiếu sáng. Tuy nhiên, những
thay đổi về độ chiếu sáng không tuyến tính cũng có thể xảy ra do độ bão hòa của máy
ảnh hoặc do những thay đổi về độ chiếu sáng ảnh hưởng đến các bề mặt 3D với các
hướng khác nhau theo số lượng khác nhau. Những hiệu ứng này có thể gây ra sự thay
đổi lớn về cường độ tương đối đối với một số gradient, nhưng ít có khả năng ảnh
hưởng đến các hướng gradient. Do đó, giảm ảnh hưởng của các cường độ gradient
lớn bằng cách đặt ngưỡng các giá trị trong vectơ đặc trưng đơn vị không lớn hơn 0,2,
sau đó chuẩn hóa lại thành độ dài đơn vị. Việc so khớp các cường độ cho các gradient
lớn không còn quan trọng và sự phân bố các hướng có trọng tâm hơn. Giá trị 0,2 được
xác định bằng thực nghiệm sử dụng các hình ảnh có độ chiếu sáng khác nhau cho các
đặc trưng 3D giống nhau.
53
2.4.1.5.2 Kiểm tra bộ mô tả
Có hai tham số có thể được sử dụng để thay đổi độ phức tạp của bộ mô tả: số
hướng, 푟, trong biểu đồ và chiều rộng, 푛, của dãy 푛 × 푛 biểu đồ hướng. Kích thước
của vector bộ mô tả kết quả là 푟푛2. Khi độ phức tạp của bộ mô tả tăng lên, có thể
phân biệt tốt hơn trong một cơ sở dữ liệu lớn, nhưng cũng nhạy cảm hơn với các biến
thể và hấp thụ hình dạng.
Hình 2.14 cho thấy các kết quả thực nghiệm trong đó số lượng hướng và kích
thước của bộ mô tả khác nhau. Biểu đồ được tạo để chuyển đổi điểm nhìn trong đó
bề mặt phẳng nghiêng 50 độ so với người xem và thêm 4% nhiễu hình ảnh. Điều này
gần giới hạn của so khớp đáng tin cậy, vì trong những trường hợp khó hơn, hiệu suất
của bộ mô tả là quan trọng nhất. Kết quả cho thấy phần trăm các điểm chính tìm thấy
so khớp chính xác với lân cận gần nhất trong cơ sở dữ liệu gồm 40.000 điểm chính.
Biểu đồ cho thấy hướng đơn (푛 = 1) rất kém trong việc phân biệt, nhưng kết quả tiếp
tục cải thiện trên mảng 4x4 biểu đồ với 8 hướng. Việc thêm nhiều hướng hơn hoặc
bộ mô tả lớn hơn thực sự có thể làm ảnh hưởng đến việc so khớp bằng cách làm cho
bộ mô tả nhạy cảm hơn với sự biến dạng. Các kết quả này gần như tương tự đối với
các mức độ thay đổi góc nhìn và nhiễu khác, mặc dù trong một số trường hợp đơn
giản hơn, sự phân biệt tiếp tục được cải thiện với kích thước bộ mô tả 5x5 và cao hơn.
54
Hình 2.12 Biểu đồ này cho thấy phần trăm các điểm chính cho kết quả so khớp chính
xác với cơ sở dữ liệu gồm 40.000 điểm chính dưới dạng hàm số chiều rộng của bộ mô
tả điểm chính 풏 × 풏 và số hướng trong mỗi biểu đồ. Biểu đồ được tính toán cho hình
ảnh có góc nhìn affin thay đổi 50 độ và thêm 4% nhiễu.
2.4.1.5.3 Tính nhạy cảm với việc cho phép thay đổi
Độ nhạy của bộ mô tả đối với sự thay đổi affine được xem xét trong Hình 2.15.
Biểu đồ cho thấy độ tin cậy của vị trí điểm chính và lựa chọn tỉ lệ, gán hướng và so
khớp vùng gần nhất với cơ sở dữ liệu.
Để đạt được sự so khớp đáng tin cậy trên một góc quan sát rộng hơn, một trong
các bộ phát hiện bất biến affine có thể được sử dụng để chọn và lấy mẫu lại các vùng
ảnh. Những bất lợi là giá trị tính toán cao hơn nhiều, giảm số lượng các điểm chính
và độ ổn định kém hơn đối với các thay đổi affine nhỏ do lỗi trong việc gán khung
liên kết thích hợp dưới nhiễu. Trên thực tế, phạm vi xoay cho phép đối với các đặc
trưng 3D ít hơn so với các bề mặt phẳng, do đó, sự bất biến affine thường không phải
là yếu tố giới hạn trong khả năng so khớp qua sự thay đổi góc nhìn. Nếu mong muốn
một loạt các bất biến affine, chẳng hạn như đối với một bề mặt được biết là phẳng,
một giải pháp đơn giản là áp dụng phương pháp của Pritchard và Heidrich (2003),
trong đó các đặc trưng SIFT bổ sung được tạo ra từ 4 phiên bản định dạng affine hình
ảnh huấn luyện tương ứng với góc nhìn 60 độ thay đổi. Điều này cho phép sử dụng
các đặc trưng SIFT tiêu chuẩn mà không mất thêm chi phí khi xử lý hình ảnh để được
nhận dạng, nhưng dẫn đến việc tăng kích thước của cơ sở dữ liệu đặc trưng lên hệ số
3.
55
Hình 2.13 Biểu đồ này cho thấy phát hiện vị trí điểm chính ổn định, hướng và so
khớp cuối cùng với cơ sở dữ liệu như một hàm biến dạng affine. Mức độ biến dạng
affine được biểu thị theo chiều sâu của góc quay tương đương đối với một bề mặt
phẳng.
2.4.1.5.4 Sơ khớp với cơ sở dữ liệu lớn
Để đo lường tính phân biệt của các đặc trưng là độ tin cậy của so khớp thay
đổi như thế nào khi là một hàm số lượng đặc trưng trong cơ sở dữ liệu được so khớp.
Hình 2.16 cho thấy độ tin cậy phù hợp thay đổi như thế nào khi là một hàm của kích
thước cơ sở dữ liệu. Hình này được tạo ra bằng cách sử dụng cơ sở dữ liệu lớn hơn
gồm 112 hình ảnh, với góc quay 30 độ theo chiều sâu và nhiễu hình ảnh 2% bên cạnh
việc xoay hình ảnh ngẫu nhiên và thay đổi tỉ lệ thông thường.
Đường nét đứt hiển thị phần đặc trưng hình ảnh cục bộ mà lân cận gần nhất
trong cơ sở dữ liệu so khớp đúng, như một hàm kích thước cơ sở dữ liệu được hiển
thị trên thang logarit. Điểm ngoài cùng bên trái đang so khớp với các đặc trưng chỉ
từ một hình ảnh trong khi điểm ngoài cùng bên phải đang chọn các kết quả phù hợp
từ cơ sở dữ liệu của tất cả các đặc trưng từ 112 hình ảnh. Có thể thấy rằng độ tin cậy
của so khớp giảm đi khi là một hàm của số lượng yếu tố gây phân tán, nhưng tất cả
các dấu hiệu cho thấy rằng nhiều so khớp chính xác sẽ tiếp tục được tìm thấy với kích
thước cơ sở dữ liệu lớn.
56
Đường nét liền là tỉ lệ phần trăm các điểm chính đã được xác định tại vị trí và
hướng so khớp chính xác trong hình ảnh đã biến đổi, vì vậy chỉ những điểm này mới
có bộ mô tả phù hợp trong cơ sở dữ liệu. Khoảng cách giữa hai dòng là nhỏ, cho thấy
rằng các lỗi so khớp là do các vấn đề định vị đặc trưng ban đầu và gán hướng hơn là
các vấn đề về tính phân biệt của đặc trưng, ngay cả do kích thước cơ sở dữ liệu lớn.
Hình 2.14 Các thay đổi tỉ lệ và xoay ngẫu nhiên, biến đổi affine 30 độ và nhiễu hình
ảnh thêm 2% trước khi so khớp.
Đường nét đứt cho thấy phần trăm các điểm chính được so khớp chính xác với
cơ sở dữ liệu dưới dạng một hàm kích thước cơ sở dữ liệu (sử dụng thang đo logarit).
Đường nét liền hiển thị phần trăm các điểm chính được chỉ định vị trí, tỉ lệ và hướng
chính xác
2.4.2 Đặc trưng SIFT sửa đổi
SIFT ban đầu được đề xuất trong [75]. Trong [76], tiện ích của các đặc trưng
SIFT để nhận dạng vân lòng bàn tay đã được kiểm tra với kết quả tương đối kém bằng
cách sử dụng hình ảnh thu được từ máy quét phẳng. Các đặc trưng được rút trích
không thay đổi đối với tỉ lệ hình ảnh, xoay và một phần bất biến để thay đổi độ sáng
và độ méo hình ảnh. SIFT là một phương pháp rút trích đặc trưng dựa trên việc rút
trích thông tin cục bộ. Hình 2.17 tiếp tục các giai đoạn chính để tạo ra tập hợp các
57
đặc trưng do Lowe [75] đề xuất và đề xuất điều chỉnh với hệ thống sinh trắc học
không tiếp xúc vân lòng bàn tay được gọi là MSIFT.
Hình 2.15 Ở bên trái cách tiếp cận sử dụng SIFT; ở bên phải cách tiếp cận MSIFT
trên vân lòng bàn tay không tiếp xúc.
Thuật toán SIFT dựa trên việc phát hiện các điểm chính có các thuộc tính
tương tự có trong hình ảnh tham chiếu và hình ảnh được hỏi. Trong các hình ảnh được
thu nhận không tiếp xúc khi di chuyển bằng tay có độ phân giải thấp (800 × 600) và
hình ảnh mờ, có một số biến dạng làm giảm khả năng phát hiện các điểm chính chung.
Để giảm bớt vấn đề này, một quy trình tiền xử lý làm nổi bật các điểm chính quan
tâm. Thuật toán tiền xử lý hình ảnh thu được áp dụng thuật toán SIFT trước đó được
gọi là SIFT đã sửa đổi (MSIFT) và bao gồm sáu bước.
Tiền xử lý
So sánh đánh giá một số lựa chọn thay thế tiền xử lý để thêm mạnh mẽ cho
phương pháp rút trích đặc trưng dựa trên SIFT: cân bằng biểu đồ thích ứng giới hạn
tương phản, lọc Gaussian và lọc Gabor.
58
Cân bằng biểu đồ thích ứng giới hạn độ tương phản [77] là một phương pháp
tiền xử lý được sử dụng để cải thiện độ tương phản trong hình ảnh. Đối với hình ảnh
đầu vào 퐼(푥, 푦), hàm phân phối tích lũy được sử dụng để ước tính biểu đồ hình ảnh
và độ dốc mong muốn tối đa để giới hạn độ tương phản. Hàm được sử dụng để chuyển
đổi hàm mật độ độ xám thành một hàm mật độ xấp xỉ đồng đều.
Bộ lọc Gaussian dựa trên bộ lọc Gaussian 2D để thu được cường độ trung bình
có trọng số của một vùng dạng đường. Biểu hiện như sau:
푥푐표푠휃 + 푦푠푖푛휃 2 푥푠푖푛휃 + 푦푐표푠휃 2
푓(푥, 푦, 휃) = 푒푥푝 [− ( ) − ( ) ]
훿푥 훿푦
trong đó 휃 biểu thị hướng của bộ lọc Gaussian 2D, 훿푥 biểu thị tỉ lệ ngang của bộ lọc
và 훿푦 biểu thị thông số tỉ lệ dọc của bộ lọc. Theo kinh nghiệm, nên lựa chọn các tham
số là 휃 = 0, 훿푥 = 5 và 훿푥 = 1.
Bộ lọc thực Gabor 2D được sử dụng để tiền xử lý hình ảnh bảng màu được
định nghĩa như sau:
1 푥2 + 푦2
퐺(푥, 푦, 휃, 푢, 휑) = 푒푥푝 {− } × 푐표푠{2휋(푢푥 cos 휃 + 푢푦 sin 휃)}
2휋휑2 2휑2
trong đó 푢 là tần số của sóng hình sin, 휃 xác định chọn lọc hướng của hàm và 휑 độ
lệch chuẩn của đường bao Gauss.
Phát hiện cực trị không gian theo tỉ lệ
Được sử dụng trên tất cả các tỉ lệ và vị trí hình ảnh. Dựa trên hàm DoG để xác
định các điểm quan tâm nổi bật không thay đổi theo tỉ lệ và hướng. Dữ liệu đầu vào
được chuyển thành không gian 퐿(푥, 푦, 휎) như sau:
퐿(푥, 푦, 휎) = 푔(푥, 푦, 휎) ∗ 퐼′(푥, 푦),
trong đó ∗ tương ứng với toán tử tích chập, 퐼′(푥, 푦) là hình ảnh đầu vào được xử lý
trước và 푔(푥, 푦, 휎) là một hàm Gaussian với băng thông 휎. DoG được định nghĩa như
sau:
퐷(푥, 푦, 휎) = (푔(푥, 푦, 푘휎) − 푔(푥, 푦, 휎)) ∗ 퐼′(푥, 푦)
59
= 퐿(푥, 푦, 푘휎) − 퐿(푥, 푦, 휎).
Định vị điểm chính
Một mô hình chi tiết phù hợp để xác định vị trí và tỉ lệ của từng vị trí nổi bật.
Phép nội suy được thực hiện bằng cách sử dụng hàm Taylor bậc hai của hàm không
gian tỉ lệ DoG 퐷(푥, 푦, 휎) với điểm chính nổi bật là điểm gốc. Hàm Taylor này như
sau:
휕퐷푇 1 휕2퐷
퐷(푋) = 퐷 + + 푥푇 푥
휕푥 2 휕푥2
Trong đó điểm cực đại và điểm cực tiểu của 퐷 và các đạo hàm được đánh giá
tại điểm nổi bật và 푥 = (푥, 푦, 휎) là phần bù từ điểm này.
Xác định hướng
Sử dụng 16 hướng cho mỗi vị trí điểm chính dựa trên các hướng gradient của
hình ảnh cục bộ. Đối với mẫu hình ảnh 퐿(푥, 푦) ở tỉ lệ 휎, cường độ gradient, 휃(푥, 푦)
và hướng, 푚(푥, 푦), được xử lý bằng cách sử dụng sự khác biệt về pixel
퐿(푥, 푦 + 1) − 퐿(푥, 푦 − 1)
휃(푥, 푦) = 푡푎푛−1 ( )
퐿(푥 + 1, 푦) − 퐿(푥 − 1, 푦)
Bộ mô tả điểm chính
Xung quanh mỗi điểm chính, các gradient cục bộ được đo đã chọn để thu được
푀
vectơ bộ mô tả (푑푖)푖=1 với 푀 điểm chính. Khi các điểm chính được rút trích, hình
ảnh truy vấn sẽ được so khớp và so sánh với từng đặc trưng được rút trích với các
hình ảnh tương ứng trong cơ sở dữ liệu đăng ký (từ các bộ đặc trưng huấn luyện).
Người xác thực đánh giá số lượng giữa một câu hỏi và hình ảnh huấn luyện. Gọi
퐿
(푑푡)푀 và (푑푞) lần lượt là tập các bộ mô tả điểm chính huấn luyện và câu hỏi.
푖 푖=1 푖 푗=1
Khoảng cách giữa các bộ mô tả điểm nổi bật được tính từ giá trị sau:
푡 푞 2
퐷푑(푖, 푗) = ‖푑푖 − 푑푖 ||
60
푡
Trong đó ‖∙|| là chuẩn Euclide. Xác định sự phù hợp giữa điểm huấn luyện 푑푖
푞
và điểm chính 푑푖 được hỏi khi
퐿
1.5퐷푑(푖, 푗) < 푚푖푛 = {퐷푑(푖, 푗)}푛=1
với 푛 ≠ 푗. Ngưỡng được ước tính trong giai đoạn huấn luyện và không nhạy cảm với
các giá trị trong khoảng 1,2-1,7.
Xác thực so khớp
Việc xác nhận điểm phù hợp cho các quyết định xác thực là phổ biến trong
một số phương pháp khai thác đặc trưng sinh trắc học khác. Xác nhận dựa trên khoảng
cách tọa độ giữa các điểm chính để cải thiện hiệu suất SIFT trên sinh trắc học bảng
màu không tiếp xúc. Giả thuyết là tọa độ từ hai điểm chính được so khớp phải giống
푡
nhau nếu hiệu chỉnh độ dịch chuyển trung bình từ tất cả các điểm so khớp. Gọi 푐푖 =
퐿
{푥푡, 푦푡}푀 và 푐푞 = {푥푞, 푦푞} lần lượt là tập các tọa độ trọng tâm huấn luyện và nghi
푖 푖 푖=1 푖 푖 푖 푖=1
vấn. Khoảng cách giữa các tọa độ được tính như sau:
푡 푞 2
퐷푐(푖, 푗) = ‖푐푖 − 푐푖 ||
Trong đó ‖∙|| là chuẩn Euclide. Xác định sự phù hợp giữa điểm chính huấn
푡 푞
luyện 푐푖 và điểm chính 푐푖 được hỏi khi
푀
1.5 2
퐷 (푖, 푗) = ∑‖푐푡 − 푐푞‖
푐 푀 푖 푗
푖=1
Do phương sai hình dáng cao trong chụp ảnh không tiếp xúc, sử dụng hệ số
trọng số 1,5 để điều chỉnh các lỗi căn chỉnh nhỏ giữa các lòng bàn tay. Số so khớp tối
đa giữa bộ câu hỏi và tập huấn luyện là điểm tương đồng. Nếu điểm tương đồng lớn
hơn một ngưỡng, hình ảnh được hỏi sẽ được xác thực.
61
CHƯƠNG 3 PHƯƠNG PHÁP ĐỀ XUẤT
3.1 Ý tưởng
Phương pháp đề xuất bao gồm ba bước: (1) trích xuất đường đặc trưng bằng bộ
lọc MFRAT, (2) áp dụng phương pháp ECS-LBP để phát hiện các đường vân mạch
máu lòng bàn tay ổn định và rõ ràng; và (3) rút trích đặc trưng cục bộ bất biến SIFT
trên hình ảnh đường vân mạch máu lòng bàn tay (Hình 3.1).
Palm MFRAT-
vein MFRAT ECS-LBP SIFT EL-SIFT
image fearture
Hình 3.1 Sơ đồ của phương pháp đề xuất.
3.2 Thuật toán
3.2.1 Bộ lọc dựa vào phép biến đổi radon sửa đổi (MFRAT)
MFRAT được đề xuất để kết nối các vân đứt gãy với nhau. Hơn nữa, bộ lọc
này được sử dụng để tăng tính đối xứng tuyến tính của các đường gờ để bộ lọc đối
xứng tuyến tính có thể được sử dụng để xác định các chi tiết nhỏ trong các khu vực
thiếu đối xứng tuyến tính. Đề xuất sử dụng bộ lọc này giúp loại bỏ bớt nhiễu, làm
tăng độ chính xác, tính ổn định trong nhận dạng vân mạch máu lòng bàn tay.
3.2.2 Thuật toán mẫu nhị phân cục bộ đối xứng (CS-LBP)
CS-LBP so sánh các cặp pixel đối xứng tâm (Hình 3.2a). Độ mạnh trên các
vùng ảnh phẳng thu được bằng cách lập ngưỡng chênh lệch mức xám với một giá trị
nhỏ T như được đề xuất trong [18]:
푁
( ⁄2)−1
푖
퐶푆 − 퐿퐵푃푅,푁,푇(푥, 푦) = ∑ 푠 (푝푖 − 푝 푁 ) 2 ,
푖+( ⁄2)
푖=0
1 푥 > 푇
푠(푥) = { (2)
0 표푡ℎ푒푟푤푖푠푒
62
Trong đó 푝푖 và 푝 푁 tương ứng với các giá trị màu xám của các cặp pixel
푖+( ⁄2)
đối xứng tâm của N pixel cách đều nhau trên một vòng tròn bán kính R. CS-LBP có
liên quan chặt chẽ với toán tử gradient, vì giống như một số toán tử gradient, nó coi
sự khác biệt mức xám giữa các cặp pixel đối diện trong một vùng lân cận.
3.2.3 Phương pháp ECS-LBP để cải thiện các mẫu vân mạch máu lòng bàn tay
Hình 3.2 (a) Đặc trưng CS-LBP với 8 điểm lân cận và (b) Đặc trưng ECS-LBP với 16
khối lân cận (các khối bao gồm 4 điểm)
Tương tự như phương pháp tăng cường LBP [38], tăng cường CS-LBP (ECS-
LBP), sửa đổi phiên bản CS-LBP, tính toán các giá trị đặc trưng từ các khối (tập hợp
điểm) thay vì các điểm cô lập. Đặc trưng ECS-LBP được tạo theo cách tương tự như
thuật toán CS-LBP như sau:
Tham số là giá trị màu xám trung bình của các cường độ pixel lân cận của
điểm (Hình 3.2b). Tương tự với CS-LBP, và tương ứng với các cặp pixel
đối xứng tâm của N pixel cách đều nhau trên một vòng tròn bán kính R. Lưu ý rằng
có thể xem xét một số cấu trúc liên kết tập hợp điểm có kích thước khác nhau để nắm
bắt thông tin kết cấu khác nhau. Trong phương pháp này, các hình vuông có kích
thước 2 × 2, được sử dụng.
63
3.2.4 Phương pháp EL-SIFT để phát hiện các đặc trưng chính của vân mạch
máu lòng bàn tay và so khớp
Đặc trưng SIFT là bộ mô tả nổi tiếng nhất sử dụng gradient làm đặc trưng cục
bộ. SIFT là một phương pháp mạnh mẽ để phát hiện các đặc điểm hình ảnh cục bộ
bất biến đối với tỉ lệ hình ảnh, dịch và xoay [40]. Các đặc trưng này có được bằng
cách chọn các vị trí chính cực đại cục bộ và cực tiểu của sự
Các file đính kèm theo tài liệu này:
- bao_cao_nghien_cuu_khoa_hoc_nhan_dang_van_mach_mau_long_ban.pdf