Hệ thống xử lý tín hiệu 2 chiều

TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN BỘ MÔN CÔNG NGHỆ THÔNG TIN TIỂU LUẬN MÔN HỌC XỬ LÝ ẢNH Đề tài : Nghiên cứu và trình bày các vấn đề trong xử lý ảnh: - Hệ thống xử lý tín hiệu hai chiều ( Two-dimensional Systems) - Cảm thụ ảnh ( Image Perception ) - Lấy mẫu và lượng tử hóa ( Image Sampling and Quantization) MỤC LỤC Hệ thống xử lý tín hiệu hai chiều 3 Giới thiệu 3 Ký hiệu và định nghĩa 3 Hệ thống tuyến tính và dịch chuyển bất biến 4 Biến đổi Fourier 6 Phép biến đổi Z hoặc dãy Lau

doc71 trang | Chia sẻ: huyen82 | Lượt xem: 1843 | Lượt tải: 0download
Tóm tắt tài liệu Hệ thống xử lý tín hiệu 2 chiều, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
rent 9 Hàm chuyển đổi điều tiết và thị giác 11 Kết quả lý thuyết ma trận 11 Ma trận khối và tích Kronecker 15 Tín hiệu ngẫu nhiên 17 Cảm thụ ảnh 18 I. Giới thiệu 18 II. Ánh sáng, độ chói, độ sáng và độ tương phản 18 III. MTF của hệ thống thị giác 24 IV. Chức năng nhìn 25 V. Mô hình thị giác đơn sắc 26 VI. Độ trung thực của ảnh 27 VII. Biểu diễn màu 30 VIII. Tổng hợp màu và sánh màu 31 IX. Hệ tọa độ màu 34 X. Đo độ khác nhau của màu 38 XI. Mô hình nhìn màu 40 XII. Thuộc tính thời gian của thị giác 41 Lấy mẫu và lượng tử hóa 42 I. Giới thiệu 42 II. Định lý lấy mẫu hai chiều 45 III. Mở rộng của định lý lấy mẫu 49 IV. Kiểm tra những thiếu sót trong lấy mẫu và khôi phục ảnh 51 V. Lượng tử hóa ảnh 55 VI. Trung bình bình phương cực tiểu hay lượng tử hóa Lloy-Max 56 VII. Thiết kế một Compandor 60 VIII. Điều kiện thuận lợi để lượng tử hóa chuẩn của giá trị trung bình bình phương 62 IX. Ví dụ, so sánh và thực hành 62 X. Phân tích kiểu cho phép lượng tử trên thực tế 64 XI. Lượng tử hóa của một biến phức ngẫu nhiên 64 XII. Lượng tử hóa trực quan 65 Kết luận 71 Tài liệu tham khảo 72 HỆ THỐNG XỬ LÝ TÍN HIỆU HAI CHIỀU (Two-Dimensional Systems) I.Giới thiệu Trong chương này chúng ta sẽ định nghĩa về các ký hiệu và thảo luận một số khái niệm về nhập môn toán học, sẽ có ích trong suốt quyển sách. Bởi vì ảnh thông thường là đầu ra của hệ thống xử lý hai chiều, các khái niệm toán học được sử dụng để nghiên cứu một số hệ thống cần thiết. Chúng ta bắt đầu định nghĩa ký hiệu sau đó xem lại các định nghĩa và thuộc tính của hệ thống tuyến tính và biến đổi Fourier. Tiếp đó xem xét đến các kết quả cơ bản của ma trận, một lý thuyết quan trọng trong lý thuyết xử lý ảnh số. Các trường ngẫu nhiên hai chiều và một vài các khái niệm quan trọng từ lý thuyết ước lượng và xác suất sẽ được xem xét lại. Nhấn mạnh vào những kết quả cuối cùng và ứng dụng của chúng trong Xử lý ảnh. Giả sử rằng người đọc đã từng bắt gặp các khái niệm cơ bản trước đây. Tóm tắt những điều thảo luận được cung cấp ở đây nhằm mục đích phục vụ cho việc tham khảo dễ dàng hơn trong những chương tiếp theo. Những vấn đề ở cuối chương sẽ cung cấp cơ hội để xem lại những khái niệm đó thông qua các trường hợp và ví dụ đặc biệt. II Ký hiệu và định nghĩa Tín hiệu liên tục một chiều sẽ được tái thể hiện như một hàm của một biến : f(x), u(x), s(t)… và tương tự thế. Các tín hiệu mẫu một chiều được viết như một chuỗi các chỉ số đơn : un, u(n)… Một ảnh liên tục sẽ được tái thể hiện như một hàm của hai biến độc lập : u(x,y), v(x,y), f(x,y)… Một ảnh mẫu sẽ được tái thể hiện như một chuỗi hai (hoặc nhiều hơn) chiều của các số thực um,n, v(m,n), u(i,j,k)… Trừ phi được xác định nếu không các ký hiệu i, j, k, l, m … sẽ được dùng để xác định các chỉ mục dương của mảng và vector. Ký tự la mã j sẽ biểu diễn . Sự kết hợp của một biến phức tạp như là z sẽ được biểu diễn bởi z*. Các ký hiệu nhất định sẽ được tái định nghĩa ở một vị trí thích hợp trong tài liệu này một cách rõ ràng. Bảng 2.1 sẽ liệt kê một vài hàm một chiều quen thuộc mà chúng ta sẽ gặp thường xuyên. Các phiên bản hai chiều là các hàm của dạng có thể tách ra. F(x,y) = f1(x)f2(y) (2.1) Ví dụ, các hàm delta hai chiều được định nghĩa như sau: Dirac : δ(x,y) = δ(x)δ(y) (2.2a) Kronecker : δ(m,n) = δ(m) δ(n) (2.2b) thỏa mãn các tính chất sau: (2.3) (2.4) Các định nghĩa và tính chất của hàm rect(x,y), sinc(x,y), comb(x,y) có thể định nghĩa theo các cách tương tự. Bảng 2.1 Một vài hàm đặc biệt Function Definition Function Definition Dirac delta Rectangle Sifting property Signum Scaling property Sinc Kronecker delta Comb Sifting property Triangle III. Hệ thống tuyến tính và dịch chuyển bất biến Một số lượng lớn các hệ thổng ảnh có thể được mô hình hóa như là hệ thống tuyến tính hai chiều. Các hàm x(m,n) và y(m,n) sẽ lần lượt tái thể hiện các chuỗi đầu vào và đầu ra của hệ thống hai chiều ( hình 2.1 ) được viết như là: y(m,n) = H [x(m,n) ] (2.5) Hế thống này được gọi là tuyến tính khi và chỉ khi bất kỳ sự kết hợp tuyến tính của hai đầu vào x1(m,n) và x2(m,n) đưa ra cùng một cách kết hợp của đầu ra tương ứng y1(m,n) và y2(m,n)… Với hằng số a1 và a2 bất kỳ : H [a1x1(m,n) + a2xx(m,n)] = a1H [x1(m,n)] + a2H [x2(m,n)] = a1y1(m,n) + a2y2(m,n) (2.6) Đây được gọi là xếp chồng tuyến tính khi đầu vào là một hàm delta hai chiều Kronecker ở vị trí (m’,n’), đầu ra ở vị trí (m,n) được định nghĩa như sau : h(m,n; m’,n’) H [d(m – m’, n – n’)] (2.7) Và được gọi là đáp ứng xung của hệ thống. Với một hệ thống ảnh, nó là một ảnh trong mặt phẳng ra đối với một điểm nguồn lý tưởng ở vị trí (m’,n’) trong mặt phẳng vào. Trong các ký hiệu, dấu “;”được đùng để phân biệt các cặp tọa độ đầu vào và đầu ra. Đáp ứng xung được gọi là các hàm trải điểm (PSF) khi các đầu vào và các đầu ra tái thể hiện rõ ràng các đại lượng như cường độ sáng của một hệ thống ảnh. Thuật ngữ đáp ưng xung khá tổng quát và cho phép lấy các giá trị âm và các giá trị hỗn hợp. Miền giá trị của đáp ứng xung là miền gần nhất và nhỏ nhất trong mặt phẳng m,n bên ngoài, tại đó đáp ứng xung bằng 0. Một hệ thống được gọi là đáp ứng xung có giới hạn (FIR) hoặc một đáp ứng xung vô hạn (IIR) nếu đáp ứng xung của nó có miền giá trị giới hạn hoặc vô hạn. Đầu ra của bất kỳ hệ thống tuyến tính nào có thể được xác định bằng đáp ứng xung của nó và đầu vào bằng cách áp dụng nguyên lý xếp chồng của (2.6) dựa vào (2.4) Y(m,n) = H [x(m,n)] = H = (2.8) Hình 2.1 Một hệ thống Một hệ thống được gọi là khoảng không bất biến hoặc dịch chuyển bất biến nếu sự thay đổi đầu vào gây ra sự thay đổi cả ở đầu ra. Theo định nghĩa (2.7) nếu như sự đáp ứng xảy ra ở lúc ban đầu thì ta sẽ có H Như vậy, nó phải đúng cho hệ thống dịch chuyển bất biến : H = h(m-m’, n-n’; 0,0) (2.9) Đáp ứng xung là một hàm của hai biến dịch chuyển. Điều này có nghĩa là dạng của đáp ứng xung sẽ không thay đổi như là di chuyển xung về mặt phẳng m,n. Hệ thống được gọi là khoảng không không ổn định khi (2.9) không được thỏa mãn. (2,2) chỉ ra ví dụ của các hàm trải điểm của hệ thống ảnh với các đáp ứng xung riêng biệt hoặc đối xứng vòng. Đối với hệ thống dịch chuyển bất biến, đầu ra trở thành (2.10) nó được gọi là phép nhân chập của đầu vào với đáp ứng xung. (2.3) minh họa một thể hiện hình học của phương trình này. Mảng đáp ứng xung được quay 1800 so với ban đầu, sau đó dịch chuyển (m,n) và bao phủ mảng x(m,n). Tổng của các tích của mảng {x()} và {h()} trong vùng chồng đưa ra kết quả tại (m,n). Chúng ta sẽ sử dụng ký tự để ký hiệu phép toán nhân chập trong các trường hợp liên tục và rời rạc. (2.11) Phép toán nhân chập có một vài tính chất, được thể hiện trong 2.2 và 2.3 IV. Biến đổi Fourier Biến đổi hai chiều như biến đổi Fourier và biến đổi Z có ý nghĩa căn bản trong xử lý ảnh số sẽ thể hiện rõ ràng trong các chương sau. Trong biến đổi một chiều, biến đổi Fourier của một hàm phức tạp f(x) được định nghĩa: F[f(x)] (2.12) Nghịch đảo của biến đổi Fourier F(ξ) là F- -1 (2.13) Biến đổi Fourier hai chiều và nghịch đảo của nó được định nghĩa tương tự bởi biến đổi tuyến tính (2.14) (2.15) 4.1 Tính chất của biến đổi Fourier Bảng 2.3 đưa ra các tóm tắt tính chất của biến đổi Fourier hai chiều. Một vài các tính chất sẽ được thảo luận dưới đây. Tần số không gian. Nếu f(x,y) là độ chói và x, y là tọa độ không gian, ξ1, ξ2 là các tần số không gian thể hiện sự thay đổi độ chói với khía cạnh về khoảng cách không gian. Đơn vị của ξ1 và ξ2 là đảo của x và y. Thỉnh thoảng các chiều x và y được chuẩn hóa bởi khoảng cách nhìn của ảnh f(x,y), sau đó thì đơn vị của ξ1 và ξ2 là số vòng/độ. Tính đơn trị. Đối với các hàm liên tục f(x,y) và F(ξ1,ξ2) là duy nhất với ???. Không có sự mất mát thông tin nếu như thay vì bảo toàn ảnh, phép biến đổi Fourier cũng được bảo toàn. Thực tế này đã được sử dụng trong các kỹ thuật nén ảnh gọi là mã hõa chuyển đổi. Tính phân tách. Theo định nghĩa cốt lõi của phép biến đổi Fourier là phân tách, để có thể viết như là một phép biến đổi tách rời đối với x và y điều này có nghĩa là phép biến đổi hai chiều có thể nhận ra bới trình tự của các phép biến đổi một chiều, đối với một chiều không gian Bảng 2.2 : Các cặp biến đổi Fourier hai chiều f(x,y) F() d(x,y) 1 rect(x,y) Sinc() tri(x,y) Sinc2() Comb(x,y) Comb() Bảng 2.3 : Tính chất của biến đổi Fourier hai chiều Tính chất Hàm f(x,y) Biến đổi Fourier F() Rotation Linearity Conjugation Separability Scaling Đáp ứng tần số và hàm riêng của hệ thống dịch chuyển bất biến. Hàm riêng của hệ thống được định nghĩa như là một hàm đầu vào mà nó sẽ đưa ra được đầu ra với duy nhất sự thay đổi có thể dựa trên biên độ. Thuộc tính tông quan của hệ thống dịch chuyển bất biến tuyến tính là hàm riêng của nó được cung cấp bởi một hàm số mũ phức tạp . Vì thế trong hình 2.4 với bất kỳ (ξ1,ξ2) cố định, đầu ra của hệ thống dịch chuyển bất biến tuyến tính sẽ là : để biểu diễn sự thay đổi của biến và rút gọn kết quả, ta có Hàm H(ξ1,ξ2)là phép biến đổi Fourier của đáp ứng xung còn được gọi là đáp ứng tần số của hệ thống. Nó thể hiện biên độ (phức tạp) của đáp ứng hệ thống ở tần số không gian (ξ1,ξ2). Hình 2.4 Hàm riêng của hệ thống dịch chuyển tuyến tính bất biến Định lý nhân chập. Phép biến đổi Fourier của phép nhân chập hai hàm là tích của các phép biến Fourier của chúng. Ví dụ (2.17) Định lý này chỉ ra rằng phép nhân chập của hai hàm có thể được đánh giá bởi phép biến đổi Fourier nghịch đảo tích của phép biến đổi Fourier của chúng. Dạng rời rạc của định lý này tiến hành một phép biến đổi Fourier nhanh dựa trên thuật toán nhân chập. Định lý đảo định lý nhân chập là phép biến đổi Fourier của tích của hai hàm là phép nhân chập của các biến đổi Fourier của chúng. Kết quả của định lý nhân chập cũng có thể được mở rộng cho tương quan không gian giữa hai hàm thực h(x,y) và f(x,y) được định nghĩa như sau: (2.18) Sự thay đổi của các biến đã chỉ ra rằng c(x,y) cũng được coi là phép nhân chập của h(-x,-y) f(x,y) được tiến hành như sau (2.19) Sự bảo toàn tích trong. Một thuộc tính của phép biến đổi Fourier là tích trong của hai hàm tương đương với các phép biến đổi Fourier của chúng. Ví dụ: (2.20) Đặt h = f, ta có được công thức chuyển đổi năng lượng Paseval nổi tiếng (2.21) Ví dụ, tổng năng lượng trong một hàm là tương đương như phép biến đổi Fourier của nó. Phép chuyển đổi Hankel. Phép biến đổi Fourier của hàm đối xứng vòng cũng là một đối xứng vòng và được cho bởi phép biển đổi Hankel. 4.2 Phép biến đổi Fourier của chuỗi (Fourier Series) Đối với chuỗi một chiều x(n), số thực hoặc số phức, phép biến đổi Fourier của chung được định nghĩa như một chuỗi , (2.22) Phép biến đổi nghịch đảo được cho bởi (2.23) Lưu ý rằng X(ω) là tuần hoàn với chu kỳ 2π, vì thế nó đủ để xác định thông qua một chu kỳ . Cặp biến đổi Fourier của một chuỗi hai chiều x(m,n) được định nghĩa (2.24) (2.25) Bây giờ X(ω1,ω2) tuần hoàn với chu kỳ 2π trong mỗi đối số, ví dụ (2.25) thường xuyên chuỗi x(m,n) trong dãy 2.24 là tổng tuyệt đối (2.26) Tương tự như trường hợp liên tục H(ω1,ω2), chuỗi biến đổi Fourier của đáp ứng xung dịch chuyển bất biến được gọi là đáp ứng tần số. Phép biến đổi Fourier của chuỗi có rất nhiều tính chất tương tự như phép biến đổi Fourier của các hàm liên tục. Chúng được tổng quát trong bảng 2.4 Bảng 2.4 Tính chất và ví dụ của chuỗi biến đổi Fourier hai chiều Tính chất Chuỗi Biến đổi x(m,n), y(m,n), h(m,n)… Linearity a1x1(m,n) + a2x2(m,n) Conjugation x*(m,n) Separability x1(m)x2(n) Shifting x(mm0,nn0) Modulation exp Convolution Multiplication H(m,n)x(m,n) Spatial correlation Inner product Energy conservation C C= V. Phép biến đổi Z hoặc dãy Laurent Một dạng suy rộng của dãy Fourier là phép biến đổi Z dành cho chuỗi phức hai chiều x(m,n) được định nghĩa như sau: (2.27) ở đây z1, z2 là các biến phức. Tập hợp giá trị của z1,z2 là chuỗi hội tụ đều được gọ là miền hội tụ (region of convergence). Biến đổi Z của đáp ứng xung của dịch chuyển tuyến tính bất biến của hệ thống rời rạc được gọi là hàm chuyển đổi. Áp dụng định lý nhân chập cho biến đổi Z, ta có thể biến đổi như sau: Hàm chuyển đổi cũng được coi là tỷ số của biến đổi Z của chuỗi đầu ra và đầu vào. Nghịch đảo của biến đổi Z được biểu diễn bởi hai phép tích phân đường (2.28) Tích phân đường ngược chiều kim đồng hồ và nằm trong miền hội tụ. Khi miền hội tụ bao gồm các đường tròn đơn vị , và các ước lượng của X(z1,z2), trong đó cho biến đổi Fourier của x(m,n). Thỉnh thoảng X(z1,z2) có khả năng như một chuỗi hữu hạn (ví dụ hàm chuyển đổi của bộ lọc FIR). Sau đó x(m,n) có thể được xác định cách kiểm tra hệ số của . Bảng 2.5 Tính chất của biến đổi Z hai chiều Tính chất Chuỗi Biến đổi Z x(m,n), y(m,n), h(m,n)… Rotation x(-m,-n) Linearity a1x1(m,n) + a2x2(m,n) Conjugation X*(m,n) Separability x1(m)x2(n) Shifting x(mm0,nn0) Modulation Convolution Multiplication x(m,n)y(m,n) 5.1 Tính nhân quả và tính ổn định Một hệ thống dịch chuyển bất biến tuyến tính có tính nhân quả nếu đầu ra của nó ở bất kỳ thời gian nào cũng không ảnh hưởng đến đầu vào sau này. Điểu đó có nghĩa là đáp ứng xung của nó h(n) = 0 với n < 0 và hàm chuyển đổi của nó phải có dãy Laurent một phía. (2.29) Mở rộng định nghĩa, bất kỳ chuỗi x(n) có tính nhân quả nếu x(n) = 0, n < 0, và phản nhân quả nếu x(n) = 0, n ≥ 0, không có tính nhân quả trong trường hợp còn lại. Một hệ thống có tính ổn định nếu đầu ra còn lại của nó giới hạn đều với một đầu vào giới hạn. Đối với hệ thống dịch chuyển tuyến tính bất biến, điều kiện này cần một đáp ứng xung khả tích tuyệt đối (2.30) Điều này có nghĩa H(z) không thể có bất kỳ một cực nào trên vòng tròn đơn vị . Nếu hệ thống có tính nhân quả và ổn định, thì hội tụ (2.29) tại |z|=1 bảo toàn dãy phải hội tụ đối với tất cả |z| ≥ 1, cực của H(z) phải nằm trong vòng tròn đơn vị. Hệ thống dịch chuyển bất biến tuyến tính hai chiều ổn định khi (2.31) bảo toàn miền hội tụ của H(z1,z2) phải bao gồm cả vòng tròn đơn vị |z1| = 1, |z2| = 1. VI. Hàm chuyển đổi điều tiết và thị giác Đối với một hệ thống ảnh không gian bất biến, hàm chuyển đổi thị giác (OTF) được định nghĩa như đáp ứng tần số chuẩn của nó: (2.32) Hàm chuyển đổi điều tiết (MTF) được định nghĩa như độ lớn của OTF (2.33) Các quan hệ tương tự là hợp lệ đối với các hệ thống rời rạc, hình 2.5 trình bày MTFs của hệ thống mà các PSF của nó được trình bày trong hình 2.2. Trong thực tế, các hàm MTF thường rất lớn, pha của đáp ứng tần số được ước lượng từ sự xem xét vật lý. Đối với nhiều hệ thống thị giác, bản thân OTF là dương VII. Kết quả lý thuyết ma trận 7.1 Vector và ma trận Thông thường, các chuỗi một hoặc hai chiều sẽ được biểu diễn tương ứng bởi vector và ma trận. Một cột vector u có thể chứa N phần tử sẽ được biểu diễn như : (2.34) Phần tử thứ N của vector u sẽ được biểu diễn bởi u(n), un, hoặc [u]n. Trừ phi được xác định nếu không tất cả các vector là vector cột. Một vector cột có kích thước N cũng được gọi là vector Nx1. Giống như vậy, một vector hàng có kích thước N, được gọi là vector 1xN. Một ma trận A có kích thước MxN, sẽ có M hàng và N cột được định nghĩa như (2.35) Thành phần ở hàng thứ M và cột thứ N của ma trận A được viết là . Cột thứ N của A được biểu diễn là an. Trong đó phần tử thứ m của nó được viết là an(m) hoặc là a(m,n). Khi chỉ số bắt đầu của ma trận khác (1,1)thì nó sẽ được chỉ ra. Ví dụ A = {a(m,n)} thể hiện một ma trân NxN với chỉ số bắt đầu là (0,0). Các định nghĩa chung về lý thuyết ma trận được tổng quát trong bảng (2.6) Với hệ thống hai chiều nó thường xuyên rất có ích khi coi ảnh như một ma trân, việc thể hiện một ma trận chỉ đơn thuần là một phép quay 900 theo chiều kim đồng hồ của hệ tọa độ Cartesian hai chiều. 7.2 Thứ tự của hàng và cột Thỉnh thoảng, việc viết một ma trận dưới dạng một vector là rất cần thiết. Ví dụ trong trường hợp lưu trữ ảnh vào đĩa hoặc băng từ. Là thứ tự một - một của các phần tử của mảng {x(m,n) }vào vector x. Với một ma trận MxN, việc ánh xạ thường xuyên được sử dụng gọi là thứ tự từ điển, đó là một vector sắp xếp thứ tự theo hàng và được định nghĩa như Vì thế, xT là một vector hàng tạo ra bởi việc xếp mỗi hàng sang bên phải của hàng trước của x. Một phép ánh xạ thường dùng khác là sắp xếp cột tiếp nối cột sẽ tạo ra một vector được sắp xếp theo cột Trong đó x là cột thứ n của X Bảng 2.6 Mục Định nghĩa Ghi chú Ma trận A = {a(m,n)} m: số chỉ mục hàng, n: số chỉ mục cột Chuyển vị AT= {a(n,m)} Hàng và cột hoán vị Liên hợp phức A*= {a*(m,n)} Chuyển vị phức A*T= {a*(n,m)} Ma trận đồng nhất I = Ma trận vuông với đường chéo đơn vị Ma trận không O = {0} Tất cả các phần tử bằng 0 Phép cộng ma trận A + B = {a(m,n)+b(m,n)} A,B có chiều giống nhau Phép nhân vô hướng Tích trong vector , A có chiều MxK, B có chiều NxK, C có chiều là MxN, ABBA Tích ngoài vector Đại lượng vô hướng. Nếu 0, x và y được gọi là trực giao Đối xứng X có chiều là Mx1, y có chiều là Nx1, tích đầu ra có chiều là MxN, là ma trận bậc 1 Hermitian A = A *T Ma trận đối xứng là Hermitian. Tất cả các giá trị riêng là số thực Giá trị tuyệt đối Ma trận vuông Bậc Số số hàng (cột) độc lập tuyến tính Nghịch đảo, A-1 A-1A = AA-1= I Ma trận vuông Suy biến A-1 không tồn tại Trace Tổng của các phần tử đường chéo Giá trị riêng, Tất cả căn của Vector riêng, Tất cả nghiệm của Bổ đề (A-BCD)-1 = A-1+A-1B(C-1-DA-1B)-1DA-1 A,C không suy biến 7.3 Phép chuyển vị và giao hợp A*T = [AT]* [AB]T = BTAT [A-1]T = [AT]-1 [AB]* = A*B* Chú ý rằng liên hợp chuyển vị được ký hiệu là A*T. Trong lý thuyết ma trận, một ký tự mẫu A thường được sử dụng để ký hiệu liên hợp chuyển vị của A. Trong lý thuyết biến đổi ảnh, ta sẽ phải phân biệt A, A*, AT và A*T, như vậy đây là những ký tự cần thiết. 7.4 Ma trận tuần hoàn và ma trận Toeplitz Ma trận Toeplitz T là một ma trận có các phần tử không đổi dọc theo đường chéo chính và đường chéo phụ. Điều đó có nghĩa là các phần tử t(m,n) chỉ phụ thuộc vào toán tử m – n, ví dụ t(m,n) = tm-n. Do đó một ma trận Toeplitz NxN có dạng Và nó được định nghĩa một cách đầy đủ bởi (2N – 1 ) phần tử . Ma trận Toeplitz được mô tả là đầu vào và đầu ra của hệ thống dịch chuyển tuyến tính một chiều và ma trận tương quan của các chuỗi dừng. Ma trận C được gọi là tuần hòan nếu mỗi hàng (hoặc cột) là dịch chuyển tuần hoàn của hàng trước (hoặc cột trước) Chú ý rằng C cũng là Toeplitz và C(m,n) = c(m-n) modulo(N) (2.39) Ma trận tuần hoàn được mô tả là đầu vào và đầu ra của hệ thống tuần hoàn tuyến tính một chiều và ma trận tương quan của chuỗi tuần hoàn. 7.5 Ma trận đơn vị và ma trận trực giao Ma trận trực giao có nghịch đảo của nó cũng giống với chuyển vị của nó. Một ma trận là trực giao nếu: A-1 = AT hoặc ATA = AAT = I (2.40) Một ma trận được gọi là ma trận đơn vị nếu nghịch đảo của nó cũng giống liên hợp chuyển vị A-1 = A*T hoặc AA*T = A*TA = I (2.41) Một ma trận trực giao cũng là ma trận đơn vị, nhưng ma trận đơn vị không có nghĩa là ma trận trực giao. Một định nghĩa nói trước bao hàm các cột (hoặc hàng ) của ma trận đơn vị là trực giao và có dạng là các vector cơ bản trong không gian vector N chiều. 7.6 Tính xác định và Dạng toàn phương Một ma trận Hermitian NxN được xác định đại lượng dương nếu dạng toàn phương : Là đại lượng dương hoặc không âm. Tương tự A xác định đại lượng âm nếu Q<0 hoặc Q0. Một ma trận không thỏa mãn bất kì các điều kiện trên thì không xác định. Nếu A là ma trận dương đối xứng thì tất cả các giá trị riêng của nó là đại lượng dương và các định thức của A thỏa mãn bất đẳng thức (2.43) 7.7 Dạng đường chéo Đối với bất kì ma trận Hermitian là ma trận đơn vị nếu (2.44) A là ma trận đường chéo có chứa các giá trị riêng của R. Dạng so le của phương trình là (2.45) Tập hợp của phương trình giá trị riêng (2.46) và lần lượt là các giá trị riêng và vecto riêng của R. Đối với ma trận Hermitian thì vecto riêng để phân biệt vecto riêng là trực giao. Đối với các giá trị riêng lặp thì các vecto riêng của chúng có dạng là vecto con có thể trực giao hóa thành tập hợp vecto riêng trực giao đầy đủ. Chuẩn hóa của các vecto riêng là tập hợp trực giao. Ví dụ ma trận đơn vị có các cột của nó là các vecto riêng. Ma trận ? cũng được gọi là ma trận riêng của R. VIII.Ma trận khối và tích Kronecker Trong xử lí ảnh phân tích nhiều vấn đề có thể được đơn giản hóa bằng cách làm việc với ma trận khối và tích Kronecker. Ví dụ, phép nhân chập hai chiều có thể được diễn đạt bởi phép toán ma trận khối mẫu. 8.1 Ma trận khối Phần tử của bất kì ma trận A nào cũng là một ma trận thì được gọi là ma trận khối Là ma trận khối {Ai, -j}pxq. Ma trận A được gọi là ma trận mxn với chiều cơ bản là pxq. Nếu Ai,j là ma trận vuông pxp thì ta cũng gọi A là ma trận khối mxn với chiều cơ bản là p. Nếu cấu trúc khối là Toeplitz Ai,j = Ai-j hoặc vòng Thì A được gọi là khối Toeplitz hoặc khối vòng. Thêm vào đó nếu mỗi khối tự nó là Toeplitz hoặc vòng thì A được gọi là Toeplitz hoặc vòng hai lần.Cuối cùng, nếu {Ai,j} là Toeplitz hoặc vòng nhưng Thì A được gọi là ma trận khốiToeplitz hoặc vòng. Chú ý rằng ma trận Toeplitz(hoặc vòng) hai lần không có nghĩa là Toeplitz (hoặc vòng ) đầy đủ. Ví dụ các phần tử của mạch đếm gộp của A không là hằng số dọc theo đường chéo phụ. 8.2 Tích Kronecker Nếu A và B là ma trận M1xM2 và N1xN2 thì tích Kronecker được xác định như sau: (2.48) Đây là ma trận khối của chiều cơ bản N1xN2. Chú ý rằng . Tích Kronecker rất có ích trong việc tạo thành các ma trận cấp cao từ ma trận cấp thấp. Một vài tính chất của tích Kronecker được liệt kê trong bảng 2.7 Nó biểu thị phép nhân ma trận của hai tích Kronecker giống như tích Kronecker của hai ma trận. Đối với ma trận NxN, phép toán được tính toán từ trái sang phải ngược lại chỉ có phép toán O(N4) được tính toán từ phải sang. Nguyên lí này rất có ích trong việc phát triển các thuật toán nhân ma trận có thể được diễn đạt như tích Kronecker. Bảng 2.7 Tính chất của tích Kronecker 12. Nếu A và B là ma trận đơn vị thị AB cũng là ma trận đơn vị. 13. Nếu thì 8.3 Phép tách Xét biến đổi Hoặc (2.50) Định nghĩa một lớp của phép tách A được tính toán trên các cột của U và B được tính toán trên các hàng của kết quả. Nếu vk và um kí hiệu vecto hàng thứ k và thứ m của U thì dãy trên trở thành Khi là khối thứ (k,m) của do đó nếu U và V là thứ tự các hàng của vecto u và v thì Ví dụ biến đổi tách của (2.50) ánh xạ thành phép toán tích Kronecker trên một vector. IX.Tín hiệu ngẫu nhiên: Một tín hiệu phức ngẫu nhiên rời rạc hoặc một quá trình ngẫu nhiên rời rạc là một chuỗi của các biến ngẫu nhiên u(m,n) đối với chuỗi phức ngẫu nhiên ta xác định Mean (2.51) Variance (2.52) Covariance (2.53) Cross covariance (2.54) Autocorrelation (2.55) Cross-correlation (2.56) Kí tự E là kì vọng toán. Bình thường, ta sẽ bỏ chỉ số dưới u từ các hàng khác nhau đối với Nx1 vecto u thì phương sai, trung bình và các tính chất khác sẽ đc xác định như sau (2.57) Bây giờ và R thể hiện vecto trung bình và ma trận phương sai của vecto u. Cảm thụ ảnh (Image Perception) I./Giới thiệu: Trong quá trình hiển thị đầu ra của hệ thống ảnh sang cách quan sát của con người, yếu tố được coi là cần thiết là làm thế nào nó có thể biến đổi thành thông tin bởi người quan sát. Tìm hiểu quá trình cảm thụ thị giác là rất quan trọng trong việc phát triển việc tính toán độ chính xác của ảnh, cái mà giúp rất nhiều trong việc thiết kế và đánh giá thuật toán xử lý ảnh và hệ thống ảnh. Dữ liệu ảnh thị giác chính nó đã mô tả sự phân bố về không gian về số lượng các phần tử vật lý ví dụ như độ chói và miền tần số của đối tượng. Những thông tin nhận được có thể được tái hiện bởi các thuộc tính như độ sáng, màu sắc, và biên ảnh. Mục đích chính của chúng ta là tìm hiểu làm thế nào mà các thông tin giác quan, tri giác có thể được tái hiện một cách định lượng. II./Ánh sáng, độ chói, độ sáng, và độ tương phản: 1.Tổng quan: Ánh sáng là bức xạ điện từ cái mà kích thích sự phản ứng của thị giác. Nó chính là sự phân bố năng lượng quang phổ L(l), trong đó l là bước sóng ánh sáng nằm trong miền mà mắt nhìn thấy được, từ 350 nm đến 780 nm, của quang phổ điện từ. Ánh sáng nhận được từ đối tượng có thể được viết như sau: I(l) = r(l)L(l) (3.1) trong đó r(l) là hệ số phản xạ, L(l) là sự phân bố năng lượng tới. Phạm vi chiếu sáng chính là miền mà hệ thống thị giác có thể hoạt động, nó vào khoảng từ 1 đến 1010 hoặc là 10 luỹ thừa của cường độ hay độ lớn. Hình 1: Mắt người Retina: võng mạc Lens: thuỷ tinh thể Iris: mống mắt (tròng đen) Pupil : đồng tử Cornea : giác mạc Optical nerve: thần kinh thị giác Võng mạc của mắt người (Hình 1) gồm hai loại tế bào nhận kích thích ánh sáng là tế bào hình que và tế bào hình nón. Tế bào hình que, với số lượng khoảng 100 triệu tế bào, có hình dạng tương đối dài và mỏng. Chúng cung cấp khả năng nhìn tối, cái mà hệ thống thị giác phản ứng kém trong điều kiện cường độ chiếu sáng thấp. Tế bào hình nón, với số lượng ít hơn nhiều, chỉ khoảng 6.5 triệu tế bào, chúng ngắn và dày hơn, ít nhạy hơn các tế bào hình que. Nó cung cấp khả năng nhìn sáng, thị giác phản ứng lại ở trong khoảng từ 5 hay 6 luỹ thừa của cường độ của độ chiếu sáng ( ví dụ, trong phòng có ánh sáng tốt hoặc dưới ánh sáng mặt trời). Trong điều kiện chiếu sáng ở mức trung bình, cả tế bào hình que và tế bào hình nón đều hoạt động và cung cấp khả năng nhìn tốt. Tế bào hình nón cũng gây ra khả năng nhìn màu sắc hay nói cách khác là khả năng cảm nhận màu sắc. Tế bào hình nón tập trung rất đông ở trung tâm của võng mạc (được gọi là điểm vàng), với mật độ lên tới 120 tế bào trên một độ của cung trong tầm nhìn. Nó tương đương với khoảng cách là 0.5 phút hay 2 mm. Mật độ của tế bào hình nón giảm một cách nhanh chóng khi ra ngoài đường tròn bán kính 1° kể từ điểm vàng. Đồng tử của mắt hoạt động giống như một ống kính máy ảnh. Trong ánh sáng ban ngày nó có đường kính vào khoảng 2 mm và hoạt động giống như một bộ lọc thông thấp (đối với ánh sáng xanh) với thông (passband) vào khoảng 60 vòng trên độ. Tế bào hình nón được liên kết với phần bên bởi các tế bào ngang và liên kết với phía trước bởi các tế bào lưỡng cực. Các tế bào lưỡng cực được liên kết với các tế bào hạch, cái mà ghép với nhau để tạo thành hệ thần kinh thị giác cung cấp khả năng kết nối với hệ thần kinh trung ương. Độ chói hay cường độ ánh sáng phân bố trên đối tượng với sự phân bố ánh sáng I(x, y, l) được xác định như sau: f(x, y) = (2.2) Hình 2: V(l) Wavelength: độ dài sóng (nm) photopic : là sức nhìn của mắt trong điều kiện ánh sáng bình thường scotopic: khẳ năng nhìn (đơn sắc) trong điều kiện ánh sáng yếu trong đó V(l) được gọi là hiệu suất phát sáng tương đối trong bóng tối của hệ thống thị giác. Đối với mắt người, đồ thị V(l) có hình dạng là đường cong giống quả chuông ( Hình 2- photopic ) cái mà những đặc điểm của nó phụ thuộc vào khả năng thích ứng nhìn tối hay khả năng nhìn sáng. Độ chói của đối tượng là độc lập với độ chói xung quanh đối tượng. Độ sáng (còn được gọi là độ sáng biểu kiến) của đối tượng chính là độ chói thấy được và nó phụ thuộc vào độ chói của xung quanh đối tượng. Hai đối tượng với phụ cận khác nhau có thể có cùng độ chói nhưng lại có độ sáng hoàn toàn khác nhau. Hiện tượng thị giác dưới đây sẽ minh hoạ sự khác nhau giữa độ chói và độ sáng. 2.Độ tương phản đồng thời Trong hình 3a, hai hình vuông nhỏ ở trung tâm có cùng một giá trị độ chói, nhưng hình ở bên trái ta nhìn thấy sáng hơn. Mặt khác, trong hình 3b, hai hình vuông xuất hiện với cùng một giá trị độ sáng mặc dù độ chói của chúng khá là khác nhau. Lý do ở đây chính là sự cảm thụ của chúng ta bị ảnh hưởng của độ chói tương phản nhiều hơn là chỉ có giá trị độ chói của chính nó. Theo định luật Weber, nếu độ chói f0 của đối tượng khác biệt quá nhiều so với độ chói fs xung quanh nó, thì tỉ lệ hằng số (2.3) Đặt f0 = f, fs= f + Df, trong đó Df là nhỏ so với sự khác nhau đáng kể của độ chói. Công thức trên có thể viết lại thành (hằng số) (2.4) 3a 3b Hình 3: Độ tương phản đồng thời Giá trị của độ tương phản có thể tìm thấy là 0.02, nó có nghĩa là phải có ít nhất 50 mức trong hệ thống chia độ từ 0 đến 1. Biểu thức (2.4) nói rằng số gia trong hàm log của độ chói có thể nhận được đều khác nhau, D( log f ) là tương ứng với Dc , sự biến đổi độ tương phản. Do đó ta có: c = a1 + a2 log f (2.5) trong đó a1, a2 là hằng số, được gọi là độ tương phản. Ta có một công thức của độ tương phản (xem bảng 1 và hình 4): c = f 1/n (2.6) Bảng 1: Luminance to contrast models 1 Quy tắc loga c= 50log10f với 1£ f £ 100 2 Quy tắc luỹ thừa c= anf1/n với n = 2, 3 a2 = 10, a3 = 21.9 3 Tỉ số nền FB là độ sáng nền Độ chói hay độ sáng f nằm trong đoạn [0, 100] ngoại trừ trong quy tắc loga. Độ tương phản tồn tại ở [0, 100] Hình 4 : Mô hình độ tương phản Thường chọn n = 3 trong thuật toán của quá trình nghiên cứu mã hoá ảnh. Tuy nhiên, thuật toán vẫn còn rất nhiều sự lựa chọn khác nữa. 3.Hiệu ứng Mach band Sự tương tác về không gian của độ chói từ đối tượng và độ chói xung quanh nó tạo nên hiện tượng gọi là hiệu ứng Mach band. Hiệu ứng này cho thấy độ sáng không chỉ là một chức năng đơn lẻ của độ chói. Hình 5a minh hoạ dải mức xám mà trong đó mỗi dải có độ chói không đổi. Nhưng ánh sáng biểu kiến không đồng đều dọc theo bề rộng của dải. Chúng sáng hơn ở phía bên phải và tối hơn ở phía bên trái chỗ chuyển tiếp giữa mỗi dải. .: Nét đứt trong hình 5b biểu thị độ sáng có thể nhìn thấy được. Hình 5a : Dải mức xám Luminance : độ chói Brightness: độ sáng Hình 5: Hiệu ứng Mach band Mach band cũng có thể nhìn thấy trong hình 6, cái mà được đưa ra là đường tối và sáng ( D và B) gần miền chuyển tiếp trơn mượt. Các số đo của hiệu ứng Mach band có thể được sử dụng để ước lượng đáp ứng xung của hệ thống thị giác. a) b) D: dải tối B: Dải sáng Hiệu ứng Mach band n h(n) 0.75 -0.20 1.0 Nature of the visual system impulse response: Bản chất Đáp ứng xung của hệ thống thị giác Hì._.nh 6: Mach band Hình 6c cho thấy trạng thái tự nhiên của sự đáp ứng xung. Phần âm của đồ thị chứng minh hiện tượng kì lạ được biết đến như những hạn chế ở bên. Giá trị đáp ứng xung miêu tả độ lớn tương đối (của độ tương phản) bởi cơ quan cảm nhận, tế bào hình nón và tế bào hình que. Phần âm của đồ thị cũng chỉ ra rằng tín hiệu thần kinh ở vị trí cho trước thiếu tự nhiên bởi cơ quan cảm thụ cho trước. III./MTF của hệ thống thị giác: Hiệu ứng Mach band đo sự phản ứng lại của hệ thống thị giác trong toạ độ không gian. Biến đổi Fourier của đáp ứng xung sẽ cho ta đáp ứng tần số của hệ thống mà từ đó MTF có thể được xác định. Việc đo đạc trực tiếp MTF là hoàn toàn có thể bằng việc tính hàm sin của sự thay đổi độ tương phản ( tỉ số của cường độ lớn nhất và nhỏ nhất) và tần số(Hình 7a). Sự quan sát hình (ở khoảng cách khoảng 1m) cho thấy ngưỡng của khả năng nhìn ở các tần số khác nhau. Đường cong miêu tả ngưỡng cũng là của MTF và nó thay đổi tuỳ theo người nhìn và tuỳ theo góc nhìn. Hình dạng điển hình của nó là hình dạng được chỉ ra ở hình . Đường cong thực tế được quan sát trong hình 7a là hệ MTF của mắt ( bị bóp méo bởi quá trình in). Hình dạng của đường cong giống với bộ lọc thông dài và giả thiết rằng hệ thống thị giác của người nhạy nhất với tần số trung bình và ít nhạy nhất với tần số cao. Tần số mà ở đó cực đại xảy ra thay đổi tuỳ thuộc vào người quan sát và 7a 7b Hình 7: Hệ MTF của hệ thống thị giác. thông thường nằm trong khoảng từ 3 đến 10 vòng/độ.Trên thực tế, độ nhạy tương phản phụ thuộc vào sự định hướng của toạ độ : nó sẽ là lớn nhất khi toạ độ nằm ngang và thẳng đứng. Tuy nhiên, với góc nhạy biến đổi trong khoảng 3dB (với độ lệch lớn nhất là 45°) và lấy xấp xỉ thì hệ MTF có thể được coi như đẳng hướng và hiệu ứng pha có thể được bỏ qua. Thủ tục điều chỉnh đường cong đưa ra công thức cho đáp ứng tần số của hệ thống thị giác như sau: H(x1, x2) = Hp(r) = A exp r = vòng/ độ (2.7) trong đó A, a, b và r0 là hằng số. Với a= 0 và b= 1, thì r0 là tần số mà ở đó cực đại xảy ra. Ví dụ, trong ứng dụng mã hoá ảnh, giá trị A= 2.6, a= 0.0192, r0=(0.114)-1= 8.772, và b=1.1 được cho là hiệu quả. Tần số cao là 8 vòng/độ và giá trị cực đại bình thường sẽ tiến tới 1. IV./Chức năng nhìn: Trong nhiều hệ thống xử lý ảnh, ví dụ trong mã hoá ảnh- ảnh đầu ra u(m,n) chứa rất nhiều phần tử được thêm vào hay còn gọi là nhiễu q(m,n), nó phụ thuộc vào e(m,n), một chức năng của ảnh đầu vào u(m,n) (xem hình 8). Dãy e(m,n) đôi khi còn được gọi là chức năng mặt nạ hay chức năng phủ nhiễu. + + h(m,n) q(m,n) + Noise source u(m,n) u’(m,n) Hình 8 Chức năng mặt nạ hay phủ nhiễu là đặc trưng của ảnh cái mà được quan sát hay xử lý trong ứng dụng đã cho.Ví dụ, e(m, n)= u(m, n) trong biến đổi PCM của ảnh. Ngoài ra ta còn có thêm một vài ví dụ tương tự: 1.e(m, n)= u(m, n) – u(m-1, n) 2.e(m, n)= u(m, n) – a1u(m-1, n) – a2u(m, n-1) – a3u(m-1. n-1) 3.e(m, n)= u(m, n) - a[ u(m-1, n)+ u(m+1, n)+ u(m, n-1)+ u(m, n+1)] Chức năng nhìn đo sự thấy được một cách chủ quan trong đoạn bao gồm chức năng phủ nhiễu dựa vào nhiễu q(m, n). Với một giá trị Dx nhỏ phù hợp, và đoạn cố định [x,x+Dx] , thêm nhiễu Pe cho tất cả các điểm ảnh trong ảnh gốc nơi mà độ lớn của mặt nạ nằm trong đoạn trên. Sau khi tạo được một ảnh khác bằng cách thêm độ lớn Pw vào tất cả các điểm ảnh trong ảnh gốc. ta được hai ảnh là tương đương nhau dựa trên sự cân bằng khách quan về tỉ lệ, được chỉ ra trong bảng 3. Sau đó, chức năng thị giác v(x) được xác định như sau: v(x)= (2.8) trong đó V(x)= Do vậy chức năng nhìn miêu tả khả năng nhìn khách quan trong một đoạn đơn vị mặt nạ. Chức năng này thay đổi theo đối tượng hay cảnh. Nó rất có tác dụng trong việc xác định tiêu chuẩn một cách định lượng cho việc đánh giá chủ quan lỗi trong ảnh. V./Mô hình thị giác đơn sắc: Dựa trên những vấn đề đã đề cập ở trên, một mô hình đơn giản của thị giác đơn sắc có thể thu được như Hình 9. Ánh sáng đi vào mắt, các đặc tính thị giác được tái hiện lại bằng bộ lọc thông thấp với đáp ứng tần số H(x1,x2). Đáp ứng của mắt về không gian được tái hiện bằng hiệu suất phát sáng tương đối trong bóng tối ( dạ quang) V(l), cái mà sinh ra sự phân bố độ chói f(x, y) qua công thức 2.2. Hình 9 Đáp ứng phi tuyến của tế bào hình nón và tế bào hình que được mô tả bằng đường đứt đoạn g( . ), sinh ra độ tương phản e( x, y ). Những hiện tượng hạn chế ở bên được mô tả bởi sự bất biến của không gian, sự đẳng hướng, hệ thống tuyến tính cái mà có đáp ứng tần số là H(x1, x2). Đầu ra của nó là tín hiệu thần kinh, cái mà mô tả ánh sáng biểu kiến b( x, y ). Đối với mắt có thị giác tốt, bộ lọc thông thấp giảm sút chậm hơn với sự tăng của tần số hơn là nó của những kĩ thuật hạn chế ở bên. Do đó tác động của thị giác có thể bị bỏ qua, và mô hình đơn giản hơn chỉ ra phép biến đổi giữa độ chói và độ sáng. Kết quả của thí nghiệm sử dụng đồ thị hàm sin chỉ ra các thành phần cấu tạo nên tần số không gian, được chia thành tám phần, có thể được phát hiện riêng rẽ bởi người quan sát. Do đó, nó đưa ra rằng hệ thống thị giác bao gồm một số các kênh độc lập, mỗi kênh tương ứng có tần số và cung định hướng khác nhau. Nó sinh ra mô hình lọc, cái mà rất hữu dụng trong việc phân tích và ước lượng hệ thống xử lý ảnh cái mà khá xa chuẩn và đưa ra mức bóp méo lớn. Đối với một hệ thống gần chuẩn, nơi mà ảnh đầu ra chỉ bị suy biến ít, mô hình đơn giản trong Hình 9 là thích hợp và duy nhất mà chúng ta thường đề cập VI./Độ trung thực của ảnh: Tiêu chuẩn độ trung thực của ảnh rất hữu ích trong việc đo hay đánh giá chất lượng của ảnh và trong việc phân loại hiệu suất của kĩ thuật xử lý hay hệ thống thị giác. Có hai tiêu chuẩn thường được sử dụng nhiều nhất trong việc ước lượng chất lượng ảnh đó là chủ quan và khách quan ( hay nói cách khác là định lưọng). Tiêu chuẩn chủ quan sử dụng cách bầu chọn tỉ lệ ví dụ như tốt nhất và tồi nhất. Tiêu chuẩn nói chung phân loại chất lượng ảnh nằm trong phạm vi từ xuất sắc đến không chấp nhận được. Tập hợp các ảnh được dùng để định cỡ cho hệ thống phân loại. Các tiêu chuẩn được xác định dựa trên sự so sánh trong tập ảnh. Sự sắp xếp thứ tự độ suy hao của ảnh (Bảng 3) xếp loại một ảnh trên nền tảng của sự nhạt đi thể hiện trong ảnh khi mà so sánh nó với ảnh lý tưởng. Nó rất hữu ích trong các ứng dụng như mã hoá ảnh, mà trong đó quá trình mã hoá làm cho ảnh đầu ra mờ đi hay nói cách khác là nhạt đi, suy biến. Tổng quát Nhóm Xuất sắc Tốt Khá tốt Kém Quá kém (5) (4) (3) (2) (1) Tốt nhất Tốt trên mức TB Hơn TB 1 ít Trung bình Dưới TB 1 ít Dưới mức TB Tồi (7) (6) (5) (4) (3) (2) (1) (Số trong dấu ngoặc đơn biểu thị hạng trong sắp xếp) Bảng 3: Thang ảnh tối ưu Đôi khi phương pháp sắp xếp nổi bọt lại rất hữu ích trong việc xếp loại ảnh. Hai ảnh A và B trong một nhóm được so sánh với nhau và thứ tự sẽ được định đoạt (giả sử là A B). Sau đó, ảnh thứ 3 được so sánh với B và một lần nữa thứ tự lại được thiết lập, có thể là A B C hoặc A C B. Nếu thứ tự là A C B, thì A sẽ được so sánh với C và một thứ tự mới được thiết lập. Bằng cách này, ảnh tốt nhất sẽ được lên đầu tiên. Bảng xếp loại có thể được đưa ra sau khi ảnh được xếp loại. Nếu vài người quan sát được sử dụng để đánh giá quá trình, thì giá trị trung bình có thể được tính theo công thức: R= (2.9) trong đó Sk là tỉ số liên hợp với sắp xếp thứ k, nk là người quan sát tương ứng với sự sắp xếp đó, và n là số mức trong bảng sắp xếp. Trong đo đạc một cách định lượng, loại tiêu chuẩn thường được sử dụng là tiêu chuẩn bình phương trung bình. Nó nói đến cách sắp xếp giá trị trung bình hay tổng (toàn bộ) của bình phương của lỗi giữa hai ảnh. Đối với ảnh MxN u(m,n) và u’(m,n) (hoặc v(x,y) và v’(x,y) trong trường hợp tiếp dưới), thì số: s2ls |u(m,n) – u’(m,n)|2 hoặc |v(x,y) – v’(x,y)|2 dxdy (2.10) trong đó R là miền trên đó ảnh được đưa ra, được gọi là trung bình bình phương lỗi ít nhất. s2ms E[|u(m,n) – u’(m,n)|2 ] hoặc E[|v(x,y) – v’(x,y)|2] (2.11) nó gọi là giá trị dự tính bình phương của lỗi, trong đó E là kì vọng toán. Công thức 2.10 thường được sử dụng để đánh giá 2.11 khi mà toàn bộ u(m,n) và u’(m,n) hay v(x,y) và v’(x,y) không có giá trị. s2a = E[|u(m,n) – u’(m,n)|2 hoặc E[|v(x,y) – v’(x,y)|2]dxdy (2.12) s2a được gọi là trung bình dự tính bình phương của lỗi (average mean square) được dùng rất nhiều lần. Trong nhiều ứng dụng thì lỗi rõ ràng là giới hạn của tỉ lệ của công suất tín hiệu trên công suất nhiễu làm hỏng tín hiệu (signal-to-noise ratio SNR), được xác định như sau: SNR=10 log10, se =sa, sms, sls (2.13) trong đó s2 là sai số kì vọng của ảnh. Có một cách xác định khác của SNR, thường được sử dụng trong các ứng dụng mã hoá ảnh,: SNR’ = 10 log10 (2.14) Cách xác định này thường cho kết quả của SNR’ nằm trong khoảng từ 12 đến 15 dB, lớn hơn giá trị của SNR. Chuỗi u(m,n) hay v(x,y) không phải lúc nào cũng mô tả chức năng độ chói của ảnh. Ví dụ, trong mô hình ảnh đơn sắc ở hình 9, v(x,y)b(x,y) có thể mô tả chức năng độ sáng. Từ công thức 2.10, ta có thể suy ra đối với ảnh lớn hơn: s2ls = (2.15) = (2.16) trong đó B(x1,x2) là biến đổi Furier của b(x,y) và 2.16 kế thừa những ưu điểm của định lý Parseval. Từ hình 9 ta thu được: s2ls = (2.17) cái mà tiêu chuẩn bình phương trung bình độ lớn của tần số được ứng dụng cho chức năng tương phản. Tiểu chuẩn thị giác luân phiên dùng để xác định kỳ vọng toán đối với chức năng nhìn (hơn là xác suất ), ví dụ như: s2msse (2.18) trong đó eu - u’, là giá trị của lỗi ở điểm ảnh bất kì và v(e) là cái nhìn thấy được. Giá trị của s2msse mô tả độ sai lệch khách quan của bình phương trung bình. Tiêu chuẩn độ sai lệch bình phương trung bình không phải là không có giới hạn, đặc biệt là khi sử dụng để đo trên phương diện toàn bộ sự trung thực của ảnh. Nó thường được vận dụng một cách chính xác để phát triển các thuật toán xử lý ảnh. Khi sử dụng ở mức cục bộ, ví dụ, trong kỹ thuật thích ứng, nó được chứng minh là có hiệu quả cao. VII./Biểu diễn màu: Nghiên cứu màu là một công việc hết sức quan trọng trong việc thiết kế và phát triển hệ thống thị giác cảm nhận màu. Ứng dụng màu trong hiển thị ảnh không chỉ làm cho người xem cảm thấy dễ chịu, mà còn cho phép chúng ta nhận được nhiều thông tin thị giác hơn. Trong khi chúng ta chỉ cảm nhận được vài chục màu, nhưng chúng ta lại có khả năng phân biệt tới hàng ngàn màu. Các thuộc tính chủ yếu trong cảm nhận màu: độ sáng, sắc lượng hay sắc thái màu, và độ bão hoà. Độ sáng mô tả sự cảm nhận độ chói như đã đề cập ở trên. Đối với nguồn ánh sáng đơn sắc, sự khác nhau trong sắc thái màu được biểu thị bởi sự khác nhau về bước sóng. Độ bão hoà thay đổi rất nhanh nếu ta thêm lượng ánh sáng trắng vào ánh sáng đơn sắc. Những khái niệm này có đôi chút mơ hồ, không chính xác bởi sắc thái màu, độ bão hoà và độ sáng đều thay đổi khi bước sóng, độ mạnh của sắc thái màu hay lượng ánh sáng trắng trong màu bị thay đổi. Độ sáng W* thay đổi dọc theo trục tung, sắc thái màu q thay đổi dọc theo đường tròn, và độ bão hoà thay đổi dọc theo bán kính. Với mỗi một điểm W* cố định, các kí hiệu G, R, B chỉ ra vị trí tương đối của màu đỏ, xanh lá cây và xanh da trời. Biểu diễn màu dựa trên giả thuyết cổ điển của Thomas Young (1802), người đã tuyên bố rằng bất kì màu nào cũng có thể được mô phỏng bằng cách trộn một lượng xấp xỉ ba màu chính. Hình 10: Không gian màu. Saturation : độ bão hoà Hue: màu sắc Pure color: màu tinh khiết (màu đơn) Maxwell đã nói rằng có ba loại tế bào hình nón trong võng mạc cảm thụ ba màu cơ bản ứng với ba loại phổ hấp thụ S1(l), S2(l), S3(l) trong đó lmin £ l £ lmax với lmin= 380 nm, lmax= 780 nm. Hình 11 :a)Phổ hấp thụ điển hình của 3 loại tế bào hình nón trong võng mạc, b)Nguyên tắc tổ hợp màu. Chúng ta có thể thấy rõ hơn trong Hình 11. Chú ý rằng ở đây có sự chồng lên đáng kể giữa S1 và S2. Dựa trên thuyết ba màu, sự phân bố phổ năng lượng của nguồn sáng màu, C(l), đưa ra cảm giác màu cái mà được mô tả bởi đáp ứng phổ (Hình 11b) như sau: a1(C)= i = 1, 2, 3 (2.19) Phương trình 2.19 có thể hiểu như phương trình biểu diễn màu. Nếu C1(l) và C2(l) là hai phân bố phổ năng lượng tạo nên đáp ứng phổ a1(C1) và a1(C2) mà ai(C1) = ai(C2) với i = 1, 2, 3 (2.20) thì hai màu C1 và C2 được coi là như nhau. Do đó, hai màu nhìn giống nhau có thể có phổ năng lượng khác nhau. IIX./Tổng hợp màu và sánh màu: 1.Tổng quát: Một trong nhưng vấn đề cơ bản trong lý thuyết biểu diễn màu là sử dụng một tập hợp các nguồn sáng để biểu diễn màu. Nói chung, số lượng nguồn sáng bị giới hạn ở ba, vì đối với mô hình cảm thụ màu (nguyên tắc tổ hợp màu), nó là số được yêu cầu nhỏ nhất để có thể mô phỏng lại một màu bất kì. Giả sử rằng ba nguồn sáng có sự phân bổ phổ năng lượng là Pk(l) với k=1, 2, 3 và : (2.21) trong đó giới hạn của tích phân nằm từ lmin đến lmax, và nguồn sáng là độc lập tuyến tính, tổ hợp tuyến tính của hai nguồn sáng bất kì không thể tạo thành nguồn sáng thứ ba. Để tổng hợp một màu C(l), giả sử rằng ba màu chính được trộn với nhau theo tỉ lệ bk với k= 1, 2, 3 (Hình 12). Do vậy có thể được thấy như là C(l) a1(C)= i= 1, 2, 3 (2.22) Xác định tác động của tế bào hình nón thứ i phát ra bởi một đơn vị thứ k như sau: ai,k i, k = 1, 2, 3 (2.23) Ta có: i = 1, 2, 3 (2.24) P1 P2 P3 b1 b2 b3 Si(l) ai Hình 12: Tổng hợp màu với ba màu cơ bản. Phương trình trên gọi là phương trình sánh màu. Với một phân bố phổ năng lượng của một màu bất kỳ C(l), nguồn sáng chính Pk(l), và đường cong chỉ độ nhạy quang phổ là Si(l), với lượng bk, với k= 1, 2, 3, ta có thể giải phương trình trên. Trong thực tế, nguồn sáng chính có thể được định cỡ tương phản với một ánh sáng trắng tham khảo cái mà được biết đến với sự phân bố năng lượng W(l). Hình 13 2.Định luật sánh màu Giả thuyết đưa đến một tập hợp các quy tắc sánh màu, được phát biểu như sau : 1.Một màu bất kì có thể được sánh bởi ít nhất ba màu. Nó có nghĩa là ta luôn luôn có thể tìm được ba màu chính như ma trận { ai,k } không phải là suy nhất và (2.24) luôn có một đáp số duy nhất. 2.Độ sáng của màu được pha trọn sẽ có giá trị bằng tổng độ độ sáng của các màu thành phần. Độ sáng Y của màu C(l) có thể được biểu diễn qua (2.2) như sau: Y= Y(C) = (2.25) Từ công thức trên, độ sáng của thành phần thứ k với tỉ lệ ba màu thiết lập là bk = wkTk (Hình 12) sẽ là wkTk . Do đó, độ sáng của một màu với giá trị Tk, với k=1, 2, 3 có thể viết lại : Y= (2.26) trong đó lk là hệ số độ sáng của thành phần thứ k. Nói chung, ta nên chú ý rằng : C(l) ¹ (2.27) kể cả khi một màu được sánh. 3.Mắt người không thể phân tích được thành phần của một màu pha trộn. Nó có nghĩa là mội nguồn sáng đơn sắc và màu của nó cũng không là duy nhất đối với các nguồn sáng khác, mắt không thể phân tích được bước sóng từ một màu cho trước. 4.Một màu sánh ở một mức sáng xác định hoàn lại một miền rộng độ sáng. 5.Luật cộng màu: Nếu một màu C1 sánh với màu C2 và màu C1’ sánh với màu C2’ thì màu trộn của C1 và C2 sẽ sánh với màu trộn của C1’ và C2’. Kí hiệu: [C1 ] = [C2 ] : màu C1 sánh với màu C2 a1 [C1 ] + a2 [C2 ] : trộn một lượng a1 màu C1 với một lượng a2 màu C2. Ta có thể viết lại như sau: Nếu [C1 ] = [C1’] và [C2 ] = [C2’] thì a1 [C1 ] + a2 [C2 ] = a1 [C1’] + a2 [C2’] 6.Luật trừ màu: Nếu màu trộn của C1 và C2 sánh với màu trộn của C1’ và C2’ và nếu C2 sánh với C2’ thì C1 sánh với C1’. Kí hiệu: Nếu [C1 ] + [C2 ] = [C1’] + [C2’] và [C2 ] = [C2’] Thì [C1 ] = [C1’] 7.Luật bắc cầu: Nếu C1 sánh với C2 và nếu C2 sánh với C3 thì C1 sánh với C3. Kí hiệu: Nếu [C1 ] = [C2 ] và [C2 ] = [C3] thì [C1 ] = [C3 ] 8.Luật sánh màu: Ba loại màu sánh được xác định: a.a[C] = a1 [C1 ] + a2 [C2 ] + a3 [C3 ] : một lượng a màu C được sánh bởi cách trộn một lượng a1 màu C1, a2 màu C2, và a3 màu C3. Đó là cách tổng hợp trực tiếp.Tổng hợp gián tiếp được xác định như sau b.a[C] + a1 [C1] = a2 [C2 ] + a3 [C3 ] c.a[C] + a1 [C1] + a2 [C2 ] = a3 [C3 ] Nó còn được gọi là định luật Grassman. Khi mà mức sáng quá lớn hoặc quá nhỏ thì định luật không còn đúng nữa. Định luật rất hữu dụng trong các thiết bị tái hiện lại màu sắc, trong các nghiên cứu đo màu một cách định lượng. IX./Hệ toạ độ màu: Với nhiều lí do khác nhau thì có một vài hệ toạ độ màu khác nhau (Bảng 4) Hệ toạ độ màu Mô tả 1.Chuẩn màu C.I.E – RGB Được tạo bởi các nguồn sáng đơn sắc P1 đỏ=700nm, P2 xanh lá cây=546.1nm, P3 xanh da trời=435.8nm. Ánh sáng trắng: R=G=B=1. 2.Chuẩn màu C.I.E – XYZ. Với Y = độ chói 3.Chuẩn màu C.I.E – u,v,Y (hệ thống UCS) u,v : chất lượng màu hay tính chất màu Y: độ chói U, V, W: thành phần màu tương ứng với u, v, w u= v= U=, V=Y, W= 4.Hệ U*, V*, W* (hệ sửa đổi của UCS) Y= độ chói [0.01, 1] U*= 13W*(u-u0) V*=13W*(v-v0) W*=25(100Y)1/3-17 , 1£100Y£100 u0, v0 : chất lượng của ánh sáng tham khảo W*: độ tương phản hoặc độ sáng 5.Hệ S, q, W* S: độ bão hoà q: sắc thái màu W*: độ sáng S=[(U*)2 +(V*)2 ]1/2=13W*[(u-u0)2+(v-v0)2 ]1/2 q=;0£q£2p 6.Hệ NTSC : RN,GN, BN Biến đổi tuyến tính của X,Y, Z. Ánh sáng trắng : RN= GN = BN= 1 7.Hệ biến đổi NTSC Y: độ chói I, Q: chất lượng màu hay tính chất màu Y=0.299RN + 0.587GN + 0.114BN I =0.596RN – 0.274GN – 0.322BN Q = 0.211RN – 0.523GN + 0.312BN 8.Hệ L*, a*, b*: L*: độ sáng a*: chứa màu đỏ-xanh lá cây b*:chứa vàng-xanh da trời L*= , 1£100Y£100 a*= b*= X0, Y0, Z0: giá trị ….của ánh sáng tham khảo Bảng 4: Hệ toạ độ màu Như đã đề cập ở trên, tổ chức chuẩn hoá màu quốc tế CIE không thể liệt kê hết tất cả các màu có thể sinh ra. Trong thực tế, không có một tập hợp của ba màu nào có thể sinh ra toàn bộ các màu. Nó dẫn đến sự phát triển của hệ CIE X, Y, Z với giả thuyết màu chính do đó tất cả giá trị tỉ lệ quang phổ là dương. Mặc dù nguồn sáng chính là không thể có thực, đó là hệ toạ độ thuận tiện để tính toán đo đạc màu. Trong hệ thống này Y mô tả độ chói của màu. Toạ độ X, Y, Z là liên quan tới hệ CIE R, G, B qua biến đổi tuyến tính được chỉ ra ở Bảng 4. Hình 15 chỉ ra biểu đồ tính chất nguyên chất của màu của hệ thống này. Màu tham khảo cho hệ thống có một phổ phẳng như trong hệ R, G, B. Tỉ lệ từng màu cho màu trắng tham khảo là X= Y= Z= 1. Hình 15: Biểu đồ tính chất màu (chromaticity) cho hệ toạ độ màu CIE XYZ. Hình 15 còn bao gồm một số các hình elíp với các kích cỡ khác nhau và có hướng xác định. Những hình elíp này, còn được gọi là hình elíp MacAdam, là do các màu nằm bên trong là không thể phân biệt được. Bất kỳ màu nào mà nằm ngoài các hình elíp là có sự khác nhau đáng lưu ý so với màu ở trung tâm của hình elíp. Kích cỡ, sự định hướng, và độ lệch tâm của các elíp thay đổi trong suốt không gian màu. Hệ UCS u, v, Y biến đổi các elíp với độ lệch tâm lớn ( gần 20:1) gần thành đường tròn có cỡ bằng nhau trong mặt phẳng u, v. Nó có liên quan tới hệ X, Y, Z qua biến đổi được chỉ ra trong Bảng 4. Chú ý rằng x, y và u, v là toạ độ tính chất màu-chromaticity và Y là độ chói. Hình 16 chỉ ra biểu đồ tính chất màu (chromaticity) của hệ toạ độ UCS. Hình 16: Biểu đồ tính chất màu (chromaticity) cho hệ toạ độ màu CIE UCS. Hệ U*, V*, W* là hệ UCS sửa đổi cái mà có gốc (u0, v0) là thay đổi thành màu tham khảo trong mặt phẳng tính chất màu u, v. Toạ độ W* là biến đổi căn bậc 3 của độ chói và nó mô tả độ tương phản (hay độ sáng) của một màu không đổi. Hệ toạ độ này rất hữu dụng trong việc đo sự khác nhau của màu sắc một cách định lượng. Hệ S, q, W* là sự biểu diễn đơn cực của U*, V*, W*, trong đó S và q mô tả, theo thứ tự định sẵn thuộc tính bão hoà và sắc thái của màu (Hình 10). Giá trị S lớn đưa ra màu với độ bão hoà cao. Hệ NTSC (National Television Systems Committee) được phát triển như một chuẩn cho vô tuyến truyền hình. Hệ NTSC đã dùng ba thành phần phốt pho để tạo ra ba dải quang phổ đỏ, xanh da trời, xanh lá cây. Ánh sáng trắng được tạo thành từ tỉ lệ ba màu cơ bản R= G= B=1. Bảng 5 đưa ra toạ độ của một số màu chính. Màu đơn đối với hệ toạ độ này là hình lập phương (Hình 17). Biểu đồ tính chất của màu đổi với hệ này được chỉ ra trong Hình 18. Chú ý rằng ánh sáng trắng đối với hệ NTSC khác với nó trong hệ CIE. Bảng 5: Giá trị tỉ lệ của từng màu trên ba màu cơ bản và màu nguyên chất của một số màu chính trong hệ NTSC. Red Yellow Green Cyan Blue Magenta White Black RN GN BN rN gN bN 1.0 0.0 0.0 1.0 0.0 0.0 1.0 1.0 0.0 0.5 0.5 0.0 0.0 1.0 0.0 0.0 1.0 0.0 0.0 1.0 1.0 0.0 0.5 0.5 0.0 0.0 1.0 0.0 0.0 1.0 1.0 0.0 1.0 0.5 0.0 0.5 1.0 1.0 1.0 0.333 0.333 0.333 0.0 0.0 0.0 0.333 0.333 0.333 Hệ biến đổi NTSC (Y, I, Q) được phát triển để biến đổi màu một cách thuận tiện từ ảnh màu sử dụng màu đơn sắc. Toạ độ Y là độ chói – luminance (kênh đơn sắc) của màu. Hai tín hiệu tỉ lệ I và Q cùng biểu thị sắc thái và độ bão hoà của màu và có độ rộng dải tần nhỏ hơn nhiều so với tín hiệu độ chói. Thành phần I và Q được truyền trong kênh sử dụng phép điều chế cầu phưong mà theo cách này phổ không gian I, Q không bị chồng lên phổ của Y và độ rộng dải tần yêu cầu cho sự chuyền không đổi (sẽ được làm rõ trong chương sau). Hệ Y, I, Q có liên quan tới hệ RN, GN, BN qua phép biến đổi tuyến tính. Nó và một số các biến đổi sang các hệ màu khác được đưa ra trong Bảng 6. Hình 18: biểu đồ tính chất của màu đối với hệ thu NTSC. Line of purples: màu tía.(đường chung nhau giữa màu đỏ và màu xanh lá cây) Hình 17 và 18 Hệ L*, a*, b* đưa ra biểu thức một cách định lượng cho hệ phân loại màu của Munsell. Giống như hệ U*, V*, W*, nó cũng đưa ra các công thức màu khác nhau. Tương tự, đối với các hệ toạ độ khác, chúng ta thu được: X= 0.781 Y= 0.886 Z= 0.066 x= 0.451 y= 0.511 z= 0.038 U= 0.521 V= 0.886 W= 0.972 u= 0.219 v= 0.373 w= 0.408 Y= 0.886 I= 0.322 Q= -0.312 Bảng 6:Biến đổi từ hệ thu NTSC sang các hệ toạ độ khác. Vecto đầu vào là [RN, GN, BN]T Vecto đầu ra Ma trận biến đổi Chú giải Hệ CIE gốc Hệ CIE X, Y, Z Hệ CIE UCS Hệ NTSC X./Đo độ khác nhau của màu: Tính toán sự khác nhau của hai màu bất kì đưa ra một vấn đề trong việc mã hoá, nâng cấp và phân tích ảnh màu. Sử dụng các dấu hiệu gợi ý rằng tỉ lệ các màu đơn có thể được quan tâm như không gian Riemannian với khoảng cách màu: (ds)2= (2.28) ds mô tả khác nhau vi phân giữa hai màu với toạ độ Xi và Xi+ dXi trong hệ toạ độ màu đã chọn. Hệ số ci, j đo độ nhạy trung bình do sự khác nhau nhỏ trong toạ độ thứ i và thứ j. Sự khác nhau nhỏ trong hai màu sẽ được mô tả trong sự quan sát những chi tiết đáng chú ý của màu (JND). Một đơn vị xác định bởi: I= (2.29) là phương trình mô tả đối với một elipsoit. Nếu hệ số ci, j là hằng số trong suốt không gian màu thì elipsoit JND có thể có kích thước không đổi trong không gian màu. Không gian màu có thể bị giảm thành không gian ơ-clít, trong đó sự khác nhau của hai màu bất kì có thể trở thành tương ứng đối với chiều dài của đường thẳng nối chúng. Nhưng ci,j thay đổi rất lớn đối với giá trị tỉ lệ giữa các màu, do đó cỡ của chúng cũng như sự định hướng của các elipsoit luôn thay đổi. Bởi vậy, khoảng cách giữa hai màu bất kì C1 và C2 được đưa ra bởi một chuỗi nhỏ các elipsoit nằm dọc đường cong C* nối C1 và C2 do đó khoảng cách: (2.30) là nhỏ nhất khi đánh giá dọc đường cong. Đường cong đó được gọi là sự đo đạc (geodesic) giữa C1 và C2. Hình 19: Geodesic trong mặt phẳng (u,v) Nếu ci, j là hằng số trong không gian tỉ lệ thì đường cong sẽ thành đường thẳng. Geodesic trong không gian màu có thể quyết định bởi kĩ thuật khách quan ví dụ như các phép tính toán học của sự biến đổi hay chương trình động. Hình 19 chỉ ra phép chiếu của một vài đường cong geodesic giữa các màu chính NTSC trong hệ UCS. Geodesic giữa hai màu chính sẽ gần là đường thẳng nhưng geodesic giữa các màu khác nói chung là đường cong. Bảng 7:Một số công thức: Công thức Số công thức Chú giải (Ds)2=(DU*)2+(DV*)2+(DW*)2 2.31 Công thức CIE 1964 (Ds)2=(DL*)2+(Du*)2+(Dv*)2 u*=13L*(u’-u0) v*=13L*(v’- v0) u’= u 2.32 Công thức CIE 1976, biến đổi của không gian u,v,Y thành không gian u*, v*, L*. u0, v0, Y0 : các thông số của màu tham khảo (Ds)2=(DL*)2+(Da*)2+(Db*)2 2.33 Hệ toạ độ màu L*, a*, b*. Do các thủ tục phức tạp nói trên của việc xác định khoảng cách giữa các màu, ta luôn muốn có một cách đo đạc đơn giản hơn. Một số công thức xấp xỉ không gian màu Riemannian gần với không gian màu Ơclit được đưa ra bởi CIE (Bảng 7). Công thức đầu tiên trong bảng được thông qua vào năm 1964. Công thức thứ 2 được gọi là công thức L*, u*, v* CIE 1976, nó là công thức sửa đổi của công thức CIE U*, V*, W* 1964, liên quan đến không gian màu không đổi. Công thức thứ ba được gọi là công thức màu khác nhau CIE 1976 L*, a*, b*. XI./Mô hình nhìn màu: Với cách mô tả màu bằng cách dùng vecto ba thành phần, một mô hình nhìn màu bao gồm ba kênh, mỗi kênh tương tự với mô hình đơn giản hoá trong Hình 9, được chỉ ra trong Hình 20. Ảnh màu được mô tả bởi toạ độ RN, GN, BN ở mỗi điểm ảnh. Ma trận A biến đổi đầu vào thành ba đáp ứng ak(x,y,C), với k=1, 2, 3, trong đó (x, y ) là toạ độ không gian của điểm ảnh và C là màu của nó. k= 1, 2, 3 (2.34) Hình 20: Mô hình nhìn màu Tk qua biến đổi phi tuyến sẽ đưa ra ba trường T~k(x,y), với k= 1, 2, 3. Ma trận B3x3 biến đổi T~k(x,y) thành Ck(x,y). Các Ck(x,y) sẽ đi qua các đáp ứng tần số của hệ thống thị giác Hk( x1,x2), đây chính là các bộ lọc thông thấp.Ma trận A và B như sau: Từ mô hình ở Hình 20, một tiêu chuẩn cho độ chính xác của ảnh màu có thể được định nghĩa. Ví dụ, đối với hai ảnh màu {RN, GN, BN} và {R’N,G’N,B’N}, giá trị dự tính của bình phương của lỗi (mean square error) có thể được định nghĩa bằng: (2.35) Trong đó R là miền mà trên đó ảnh được định nghĩa, A là diện tích của nó, và Bk(x,y) và B’k(x,y) là đầu ra của mô hình đối với hai ảnh màu. Hình 21: Đáp ứng tần số của ba kênh màu C1, C2, C3 của mô hình nhìn. XII./Thuộc tính thời gian của thị giác: Khía cạnh thời gian của chức năng thị giác trở nên quan trọng trong quá trình xử lý ảnh động và trong thiết kế hiển thị ảnh đối với ảnh tĩnh. Nó được đề cập dưới đây. 1.Quy luật Bloch: Tia sáng ở khoảng thời gian khác nhau nhưng có độ lớn năng lượng bằng nhau là không thể phân biệt được dưới một khoảng thời gian tới hạn. Khoảng thời gian tới hạn vào khoảng 30ms, khi mà mắt thích ứng với mức rọi sáng vừa phải. Mắt càng thích ứng tốt với bóng tối thì thời gian tới hạn càng dài. 2.Tần số tới hạn hợp nhất (Critical Fusion Frequency CFF) Khi quan sát chậm một tia sáng, các tia sáng đơn lẻ là có thể phân biệt được. Với tần số của tia sáng trên tần số hợp nhất CFF, thì các tia sáng là có thể phân biệt được từ một ánh sáng với cường độ trung bình như nhau. Tần số này thông thường không vượt quá 50 đến 60 Hz (xem hình 22). Thuộc tính này là nền tảng của việc quét và hiển thị của máy ảnh và ti vi. Trường ảnh trộn lẫn được lấy mẫu và hiển thị lại ở tần số 50 đến 60 Hz (Tần số được chọn để khớp với tần số điện để tránh nhiễu). Đối với hiển thị ảnh số tĩnh, các màn hình hiện đại được refresh với tỉ lệ 60 khung/s để tránh sự nháy hình. 3.Hiệu ứng không gian và thời gian (Spatial versus temporal effects): Hình 22 Mắt nhạy đối với không gian tần số cao hơn là đối với không gian tần số thấp. Hình 22 so sánh hệ MTF thời gian for flickering fields với sự không gian tần số khác nhau. Có thể nhận thấy rằng nó rất hữu ích trong việc mã hoá ảnh động bằng cách lấy mẫu bất kì đâu trong miền động ngoại trừ biên. Với lí do tương tự, màn hình sử dụng tốc độ refresh ở 60 Hz. LẤY MẪU VÀ LƯỢNG TỬ HÓA ẢNH (Image sampling and Quantization) I. Lời mở đầu: Yêu cầu cơ bản nhất trong việc xử lý hình ảnh trên máy tính là hình ảnh phải ở dạng biểu diễn số, tức là, dạng mảng những từ nhị phân có độ dài hữu hạn. Để số hóa (hình 4.1), những hình ảnh cho trước được lấy mẫu trên các lưới riêng và mỗi mẫu hoặc mỗi pixel được lượng tử hóa bởi một số hữu hạn bit. Ảnh số được lượng tử hóa có thể được xử lý hay chuyển qua bước biến đổi số tương tự. Máy tính số Lượng tử hóa Mẫu f(x, y) f(x, y) u(m, n) Ảnh vào Digitization Hiển thị Máy tính số Chuyển đổi từ D->A u(m, n) Display Hình 4.1: Lấy mẫu, lượng tử hóa và hiển thị ảnh. 1.Quét hình ảnh (Image Scanning): Phương pháp chung của việc lấy mẫu hình ảnh là quét ảnh theo từng hàng và lấy mẫu theo mỗi hàng đó. Một đối tượng, phim ảnh, hoặc giấy trong suốt là các dạng chiếu sáng liên tục để tạo nên hình ảnh điện tử trên một tấm kẽm nhạy cảm được gọi là tấm cảm quang. Tùy theo các loại camera mà tấm cảm quang là chất quang dẫn hay quang truyền, trái lại, trong ống phân tích hình ảnh, tấm cảm quang lại là hiệu ứng quang điện. Một khe hổng điện tử nhỏ quét tấm cảm quang và phát ra dòng điện tương ứng với ánh sáng đồng nhất trên tấm cảm quang. Một hệ thống với kỹ thuật quét như vậy được gọi là kỹ thuật số hóa scan-out. Một vài thiết bị quét hiện đại, như thiết bị cameras charge-coupled (CCD) chứa một mảng các bộ tách sóng quang, đó là một tập các công tắc điện tử điều khiển các mạch trên tất cả các chip đơn. Bằng khóa bên ngoài, mảng này có thể được quét bởi các phần tử theo cách mong muốn (xem hình 4.3). Đây thực sự là một thiết bị lấy mẫu hai chiều và thường được gọi là mảng self-scanning. Hình 4.3 Một kỹ thuật khác được gọi là phương pháp scan-in, đối tượng được quét bởi một ánh sáng chuẩn, mỏng giống tia laze, nó sẽ chiếu sáng chỉ trên những chấm nhỏ tại 1 thời điểm. Sự truyền ánh sáng được hình ảnh hóa bằng một thấu kính trên bộ tách sóng quang (hình 4.4). Một máy quét có độ phân giải cao và một trống quét xoay dùng để tạo ra những hình ảnh kỹ thuật số, hiển thị hoặc ghi những hình ảnh này. Hình 4.4 + 4.5 2 .Chuẩn truyền hình (Television Standards): Ở Mỹ, một phát minh máy quét chuẩn được đưa ra bởi RETMA. Mỗi lần hoàn thành việc quét của tấm cảm quang được gọi là một khung, nó chứa 525 dòng và được quét ở tốc độ 30 khung/giây. Mỗi khung bao gồm hai trường kết hợp, mỗi trường chứa 262.5 dòng, như trong hình 4.5. Để loại bỏ những ánh sáng lập lòe, các trường xen kẽ nhau được gửi với tốc độ 60 trường/giây. Việc quét các dòng này có một độ nghiêng vì tốc độ quét theo chiều dọc chậm hơn. Trường đầu tiên chứa tất cả những dòng lẻ, trường thứ hai chứa các dòng chẵn. Bằng cách duy trì các trường ở tốc độ khá hơn những khung ở tốc độ 60Hz, dải thông của sự truyền tín hiệu giảm và vào khoảng 4.0MHz. Tại điểm cuối của trường đầu tiên, ống ti._.

Các file đính kèm theo tài liệu này:

  • docDAN107.doc