Ch−ơng 1: Tổng quan về truyền hình số
Chương 1 của luận văn trình bầy các đặc điểm cơ bản, các vấn đề chủ yếu trong quá trình chuyển đổi tín hiệu Video từ dạng tương tự sang dạng số.
1.1. Giới thiệu
Truyền hình đen trắng ra đời từ những năm đầu của thập kỷ XX với nhiều tiêu chuẩn khác nhau: L, M, N, B, G, H, I, D, K.
Truyền hình màu với ba hệ: NTSC, PAL, SECAM xuất hiện vào thập kỷ 50 đã tạo nên một bước ngoặt mới trong quá trình phát triển của công nghệ truyền hình. Cả ba hệ đều sử dụng các
77 trang |
Chia sẻ: huyen82 | Lượt xem: 1713 | Lượt tải: 0
Tóm tắt tài liệu Tín hiệu truyền hình số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
tín hiệu thành phần là tín hiệu chói và hai tín hiệu hiệu màu (Y, R-Y, B-Y). Điều khác nhau cơ bản là phương pháp điều chế tín hiệu hiệu màu, tần số sóng mang màu và phương pháp ghép kênh.
Do sự phát triển nhanh chóng của công nghệ điện tử với sự ra đời của các vi mạch cỡ lớn, các bộ xử lý tín hiệu với tốc độ cao, các bộ nhớ với dung lượng lớn và nhất là sự bùng nổ của công nghệ thông tin trong những năm gần đây, video số, truyền hình số đã hoàn toàn mang tính khả thi và từng bước trở thành hiện thực.
Số hoá tín hiệu video thực tế là sự biến đổi tín hiệu video tương tự (Analog) sang dạng số (Digital).
Công nghệ truyền hình số đã và đang bộc lộ thế mạnh tuyệt đối so với công nghệ tương tự trên nhiều lĩnh vực.
Tuy nhiên việc chuyển đổi tín hiệu video từ tương tự sang số cũng có nhiều vấn đề cần xem xét nghiên cứu.
Tín hiệu video, theo tiêu chuẩn OIRT có tần số ≤ 6MHz vì vậy theo tiêu chuẩn Nyquist để đảm bảo chất lượng, tần số lấy mẫu phải lớn hơn 12MHz; với số hoá 8 bít, để truyền tải đầy đủ thông tin một tín hiệu video thành phần có độ phân giải tiêu chuẩn, tốc độ phải lớn hơn 200Mbit/s. Đối với truyền hình độ phân giải cao, tốc độ bit lớn hơn 1Gbit/s.
Dung lượng này quá lớn, các kênh truyền hình thông thường không có khả năng truyền tải. Các vấn đề mấu chốt cần xem xét trong quá trình số hoá tín hiệu video bao gồm:
Tần số lấy mẫu
Phương thức lấy mẫu
Tỷ lệ giữa tần số lấy mẫu tín hiệu chói và tín hiệu hiệu màu (trong trường hợp số hoá tín hiệu thành phần)
Nén tín hiệu video để có thể truyền tín hiệu truyền hình số trên các kênh truyền hình thông thường trong khi vẫn đảm bảo chất lượng tín hiệu theo từng mục đích sử dụng.
1.2. Sơ đồ khối tổng quát của một hệ thống truyền hình số .
Sơ đồ khối của một hệ thống truyền hình số có dạng như hình 1.1.
Đầu vào của thiết bị sẽ tiếp nhận tín hiệu truyền hình tương tự. Trong thiết bị mã hoá (biến đổi AD), tín hiệu hình sẽ được biến đổi thành tín hiệu số, các tham số và đặc trưng của tín hiệu này được xác định từ hệ thống truyền hình được lựa chọn.
Tín hiệu truyền hình số được đưa tới thiết bị phát. Sau đó qua kênh thông tin, tín hiệu truyền hình số đưa tới thiết bị thu cấu tạo từ thiết bị biến đổi tín hiệu ngược lại với quá trình xử lý tại phía phát.
Giải mã tín hiệu truyền hình thực hiện biến đổi tín hiệu truyền hình số thành tín hiệu truyền hình tương tự. Hệ thống truyền hình số sẽ trực tiếp xác định cấu trúc mã hoá và giải mã tín hiệu truyền hình.
Mã hoá kênh đảm bảo chống các sai sót cho tín hiệu trong kênh thông tin. Thiết bị mã hoá kênh phối hợp đặc tính của tín hiệu số với kênh thông tin. Khi tín hiệu truyền hình số được truyền đi theo kênh thông tin, các thiết bị biến đổi trên được gọi là bộ điều chế và bộ giải điều chế.
1.3. Đặc điểm của truyền hình số
Đặc điểm của truyền hình số được xem xét thông qua các ưu nhược điểm của nó, vì nó giải thích lý do của việc cần thiết phải thay thế truyền hình Analog sang truyền hình số, những đặc điểm dưới đây chính là tính ưu việt của truyền hình số so với truyền hình tương tự, bao gồm:
+ Có thể tiến hành rất nhiều quá trình xử lý trong Studio (trung tâm truyền hình) mà tỷ số S/N không giảm. Trong truyền hình tương tự thì việc này gây méo tích luỹ (mỗi khâu xử lý đều gây méo).
+ Thuận lợi cho quá trình ghi, đọc: có thể ghi đọc vô hạn lần mà chất lượng không bị giảm.
+ Dễ sử dụng thiết bị tự động kiểm tra và điều khiển nhờ máy tính.
+ Có khả năng lưu tín hiệu số trong các bộ nhớ có cấu trúc đơn giản và sau đó đọc nó với tốc độ tuỳ ý.
+ Khả năng truyền trên cự ly lớn: tính chống nhiễu cao (do việc cài mã sửa lỗi, chống lỗi, bảo vệ…).
+ Dễ tạo dạng lấy mẫu tín hiệu, do đó dễ thực hiện việc chuyển đổi hệ truyền hình, đồng bộ từ nhiều nguồn khác nhau. dễ thực hiện những kỹ xảo trong truyền hình.
+ Các thiết bị số làm việc ổn định, vận hành dễ dàng và không cần điều chỉnh các thiết bị trong khi khai thác.
+ Có khả năng xử lý nhiều lần đồng thời một số tín hiệu (nhờ ghép kênh phân chia theo thời gian).
+ Có khả năng thu tốt trong truyền sóng đa đường. Hiện tượng bóng ma thường xảy ra trong hệ thống truyền hình tương tự do tín hiệu truyền đến máy thu theo nhiều đường. Việc tránh nhiễu đồng kênh trong hệ thống thông tin số cũng làm giảm đi hiện tượng này trong truyền hình quảng bá.
+ Tiết kiệm được phổ tần nhờ sử dụng các kỹ thuật nén băng tần, tỉ lệ nén có thể lên đến 40 lần mà hầu như người xem không nhận biết được sự suy giảm chất lượng. Từ đó có thể thấy được nhiều chương trình trên một kênh sóng, trong khi truyền hình tương tự mỗi chương trình phải dùng một kênh sóng riêng.
+ Có khả năng truyền hình đa phương tiện, tạo ra loại hình thông tin hai chiều, dịch vụ tương tác, thông tin giao dịch giữa điểm và điểm. Do sự phát triển của công nghệ truyền hình số, các dịch vụ tương tác này ngày càng phong phú đa dạng và ngày càng mở rộng. Trong đó có sự kết hợp giữa máy thu hình và hệ thống máy tính, truyền hình từ phương tiện thông tin đại chúng trở thành thông tin cá nhân.
Tuy nhiên truyền hình số cũng có những nhược điểm đáng quan tâm:
+ Dải thông của tín hiệu chưa nén tăng do đó độ rộng băng tần của thiết bị và hệ thống truyền lớn hơn nhiều so với tín hiệu tương tự.
+ Việc kiểm tra chất lượng tín hiệu số ở mỗi điểm của kênh truyền thường phức tạp hơn (phải dùng mạch chuyển đổi số – tương tự).
1.4. Số hoá tín hiệu video
1.4.1. Lấy mẫu tín hiệu Video
a. Lựa chọn tần số lấy mẫu
Công đoạn đầu tiên của quá trình biến đổi tín hiệu tương tự sang tín hiệu số là lấy mẫu (có nghĩa là rời rạc tín hiệu tương tự theo thời gian). Do đó tần số lấy mẫu là một trong những thông số cơ bản của hệ thống kỹ thuật số. Có nhiều yếu tố quyết định việc lựa chọn tần số lấy mẫu. Tần số lấy mẫu cần được xác định sao cho hình ảnh nhận được có chất lượng cao nhất, tín hiệu truyền đi với tốc độ bit nhỏ nhất, độ rộng băng tần nhỏ nhất và mạch đơn giản.
Để cho việc lấy mẫu không gây méo, ta phải chọn tần số lấy mẫu thoả mãn định lý lấy mẫu Nyquist - Shannon Ưsa ³ 2Ưmax .
Trường hợp Ưsa < 2Ưmax sẽ xảy ra hiện tượng chồng phổ làm xuất hiện các thành phần phụ và xuất hiện méo, ví dụ như hiệu ứng lưới trên màn hình (do các tín hiệu vô ích nằm trong băng tần video), méo sườn xung tín hiệu, làm nhoè biên ảnh (do hiệu ứng bậc thang), các điểm sáng tối nhấp nháy trên màn hình.
Trị số fsa tối ưu sẽ khác nhau cho các trường hợp: tín hiệu chói, tín hiệu màu cơ bản (R, G, B), các tín hiệu hiệu số màu, tín hiệu Video màu tổng hợp. Cuối cùng việc chọn tần số lấy mẫu phụ thuộc vào hệ thống truyền hình màu.
* Lấy mẫu tín hiệu video tổng hợp (video composite):
Theo định lý lấy mẫu Nyquist - Shannon thì tần số lấy mẫu phải ³ 2 lần tần số lớn nhất của tín hiệu (sẽ tránh được hiện tượng chồng phổ). Với dải thông video là 6 MHz thì tần số lấy mẫu tối thiểu cho tín hiệu video phải lớn hơn hoặc bằng 12 MHz. Tuy nhiên nếu chọn tần số lấy mẫu ( fsa ) không có quan hệ với tần số sóng mang màu (fsc) thì có hiện tượng xuyên điều chế giữa fsa và fsc, gây ra méo tín hiệu sau khi khôi phục. Có thể chọn tần số lấy mẫu fsa = 3fsc, tuy nhiên chất lượng không đáp ứng được cho Studio. Tiêu chuẩn tần số lấy mẫu được áp dụng cho video số composite là: fsa = 4fsc .
Như vậy tần số lấy mẫu đối với tín hiệu tổng hợp hệ PAL:
4,433 MHz ´ 4 = 17,7344 MHz
Sử dụng cấu trúc lấy mẫu trực giao, mỗi mẫu được lượng tử hoá 8 bit hoặc 10 bit sẽ tạo ra dòng bit nối tiếp có tốc độ 141,76 Mbps hoặc 177,2 Mbps. Tín hiệu Video tổng hợp dưới dạng số có chất lượng hạn chế do không thể giải quyết các vấn đề pha tải màu, can nhiễu giữa tín hiệu chói và màu nên không còn được sử dụng rộng rãi trong những năm gần đây.
* Lấy mẫu tín hiệu video thành phần (component)
Lấy mẫu và mã hoá tín hiệu video thành phần có ưu điểm là loại bỏ được sự phức tạp về tải tần màu và các méo khác mà lấy mẫu tín hiệu video tổng hợp không thể đạt được. Khuyến nghị 601 của ITU ( ITU-R.BT601/656) đã định nghĩa chuẩn lấy mẫu Video số cho Studio truyền hình của cả hai hệ thống 625 dòng và 525 dòng dựa trên việc số hoá các thành phần Y, CR, CB trong đó CR, CB là các tín hiệu biểu diễn tín hiệu hiệu màu R-Y và B-Y đã qua quá trình chuyển đổi A/D, được biểu diễn chung cho cả PAL và NTSC với CR = 0,71(R-Y) và CB = 0,564(B-Y ). Tần số lấy mẫu tín hiệu chói được chọn chung, bằng bội số nguyên của tần số dòng cho cả hai hệ 625 dòng & 525 dòng. Tần số lấy mẫu của tín hiệu chói Y:
fSa luminance = 858 fh 525 = 864fh 625 = 13,5 MHz.
Tần số lấy mẫu tín hiệu màu tuỳ thuộc theo chuẩn lấy mẫu, biểu thị tỷ lệ lấy mẫu giữa các tín hiệu thành phần Y, CR và CB. Cấu trúc lấy mẫu trực giao các tín hiệu Y, CR, CB theo chuẩn lấy mẫu 4:4:4 ; 4:2:2 ; 4:2:0 ; 4:1:1. Cấu trúc này được mô tả ở hình vẽ dưới. [3]
Hình 1.2. Các chuẩn lấy mẫu tín hiệu số
Trong tiêu chuẩn này, các mẫu được lượng tử và biểu diễn bằng 8 bit hoặc 10 bit/mẫu. Lượng tử hoá 8 bit ta có 256 mức lượng tử và 10 bit là 1024 mức lượng tử, các mức này được qui định khoảng bảo vệ cần thiết phù hợp với từng thành phần tín hiệu video.
Tốc độ dòng dữ liệu theo chuẩn lấy mẫu 4: 2: 2 (PAL)
Khi lấy mẫu 10 bit: (864 + 432+ 432) ´ 625 ´25´10 = 270 (Mbit/s)
Với hệ PAL 625 dòng: có 576 dòng tích cực, mỗi dòng tín hiệu chói được biểu diễn bằng 720 mẫu ta có tốc độ dòng dữ liệu tích cực theo chuẩn lấy mẫu 4: 2: 2. [3]
Khi lấy mẫu 8 bit: (720 + 360+ 360) ´576 ´25´ 8 = 166 (Mbit/s)
Khi lấy mẫu 10 bit: (720 + 360+ 360) ´576 ´25´10 = 207 (Mbit/s)
Chuẩn 4:2:2 cho chất lượng hình ảnh cao nên được sử dụng là chuẩn trong sản xuất chương trình (Studio), chuẩn 4:1:1 có chất lượng màu kém hơn so với 4:2:2 nhưng có tốc độ bit thấp hơn nên được sử dụng làm các chương trình thời sự, khoa học giáo dục....Trong công đoạn phát sóng sử dụng chuẩn 4:2:0, chất lượng hình khi phát sóng tương đương với sử dụng thiết bị Betacam Analog.
Tuy nhiên tốc độ bit lớn sẽ đòi hỏi bộ nhớ lớn khi lưu trữ và dải thông rộng khi truyền dẫn. Do đó cần phải nén dòng bit video, tức là cần phải biểu diễn dòng bit video với tốc độ bit thấp hơn mà chất lượng hình ảnh không bị suy giảm hoặc suy giảm ở mức chấp nhận được.
b. Cấu trúc lấy mẫu.
Để khôi phục chính xác hình ảnh thì tần số lấy mẫu phải là bội của tần số dòng. Khi này, điểm lấy mẫu trên các dòng quét kề nhau sẽ thẳng hàng với nhau và tránh được các méo đường biên gây ra.
Như vậy, việc lấy mẫu không những phụ thuộc theo thời gian mà còn phụ thuộc vào toạ độ các điểm lấy mẫu. Có 3 dạng liên kết vị trí các điểm lấy mẫu được sử dụng phổ biến cho cấu trúc lấy mẫu tín hiệu video:
Cấu trúc trực giao.
Cấu trúc “quincunx” mành.
Cấu trúc “quincunx” dòng.
1.4.2. Lượng tử hoá
a. Khái niệm
Lượng tử hoá là bước tiếp theo trong quá trình biến đổi AD, là quá trình mà biên độ tín hiệu được chia thành các mức- gọi là mức lượng tử, khoảng cách giữa hai mức lượng tử kề nhau được gọi là bước lượng tử.
Số giá trị lượng tử Q được xác định theo biểu thức:
(2.4)
N – là số bit biểu diễn mỗi mẫu.
Tín hiệu số nhận được là một giá trị xấp xỉ của tín hiệu ban đầu bởi vì tất cả các giá trị nằm trong một mức lượng tử đều có một giá trị như nhau- đó chính là mức lượng tử Q.
Biên độ
Mức lượng tử
Q
Q
Q
Q
Q
Q
n+5
n+4
n+3
n+2
n+1
n
Thời gian
T
T
T
T
T
T
T
T
Q
Lỗi lượng tử
Các mẫu
Hình 1.3: Quá trình lượng tử hoá
Quá trình lượng tử hóa gây ra sai số lượng tử, đây là một nguồn nhiễu không thể tránh khỏi trong các hệ thống số, nhiều trường hợp nó ảnh hưởng nghiêm trọng đến độ chính xác và tin cậy của tín hiệu.
Biểu thức sai số lượng tử có dạng là:
eq = x - Q(x)
trong đó:
eq: là sai số lượng tử.
x: là giá trị các mẫu tín hiệu trước khi lượng tử.
Q(x): là giá trị các mẫu tín hiệu sau khi lượng tử.
eq phụ thuộc vào tính thống kê của tín hiệu đầu vào và độ rộng các bước lượng tử.
Theo định nghĩa sai số trung bình bình phương (MSE) ta có
=
Trong lượng tử hoá tuyến tính, giả sử các lỗi có phân bố đều
Giá trị căn bình phương trung bình của eq :
Trong đó di (i=1.....N) là giá trị lượng tử, D : bước lượng tử, fx(x) là xác suất lỗi
Tỉ số tín hiệu đỉnh trên nhiễu lượng tử của bộ lượng tử tuyến tính có lỗi phân bố đều có giá trị tính theo biểu thức:
Với nguồn tín hiệu video có phân bố ngẫu nhiên thì sai số lượng tử phụ thuộc vào số bit biểu diễn mẫu, khoảng cách giữa các bước lượng tử, tính thống kê của nguồn tín hiệu.
Sai số lượng tử (eq) là một nguồn nhiễu (nhiễu lượng tử) không thể tránh khỏi trong hệ thống số. Với các ứng dụng trong truyền hình người ta sử dụng lượng tử hoá 8 bit, 10 bit hoặc 12 bit. Hầu hết các thiết bị có chất lượng cao đều sử dụng lượng tử hoá 10 bit/mẫu ( 210 = 1024 mức lượng tử ) từ 0 đến 1023 (từ 000 đến 3FF trong hệ HEX). Các mức 000, 001, 002, 003 và 3FC, 3FD, 3FE, 3FF được dùng làm khoảng dự phòng mức dưới và trên của tín hiệu video, các mức còn lại để lượng tử tín hiệu video tích cực.
Méo lượng tử phụ thuộc vào số mức lượng tử. Đối với tín hiệu video, méo lượng tử xuất hiện ở hai dạng chính: Hiệu ứng đường viền và nhiễu hạt ngẫu nhiên.
Hiệu ứng đường viền xuất hiện ở những vùng có độ sáng thay đổi chậm và đều theo chiều ngang, khi đó có những sọc với độ sáng cố định chia thành nhiều đường rõ nét theo chiều đứng như đường biên. Nếu tăng số mức lượng tử, hiệu ứng đường viền sẽ giảm, khi sử dụng từ mã 8 bit để biểu diễn màu, hiệu ứng đường viền hầu như không xuất hiện.
Hiệu ứng hạt là loại nhiễu có dạng như sương mù xuất hiện ở vùng ảnh rộng và có độ sáng đồng đều.
b. Phân loại
Có hai phương pháp lượng tử hoá là:
Lượng tử hoá tuyến tính có các bước lượng tử Q bằng nhau.
Lượng tử hoá phi tuyến có các bước lượng tử Q khác nhau.
1.4.3. Mã hoá
a. Khái quát
Mã hoá là khâu cuối cùng trong biến đổi AD, là quá trình biến đổi cấu trúc nguồn tín hiệu mà không làm thay đổi tin tức, mục đích là cải thiện các chỉ tiêu kỹ thuật của hệ thống truyền tin. Dữ liệu sau mã hoá có nhiều ưu điểm: Tính chống nhiễu cao hơn, tốc độ hình thành tương đương khả năng thông qua của kênh.
Quá trình mã hoá biến đổi các mức lượng tử hoá thành chuỗi các bit “0”, “1”. Độ dài của dãy tín hiệu nhị phân này (gọi là từ mã nhị phân) được tính bằng số lượng các con số “0”, “1” là một trong các chỉ tiêu chất lượng của kỹ thuật số hoá tín hiệu, nó phản ánh mức sáng, tối, màu sắc của hình ảnh được ghi nhận và biến đổi. Về nguyên tắc, độ dài dãy nhị phân này càng lớn thì độ phân giải tín hiệu càng cao, độ phân giải hiện nay là 8 bit/ mẫu.
Phân loại các mã trong truyền hình số:
Các mã để mã hoá tín hiệu truyền hình.
Các mã để truyền có hiệu quả cao qua kênh thông tin.
Các mã để thuận tiện cho việc giải mã và đồng bộ bên thu.
Các mã xử lý số tín hiệu trong các phần khác nhau của hệ thống truyền hình số.
Về cấu trúc toán học, ta có các loại mã:
- Mã hóa sơ cấp.
- Mã hóa hiệu chỉnh.
b. Các đặc tính cơ bản của mã
Quá trình biến đổi các giá trị lượng tử hoá của tín hiệu thành tổ hợp các tín hiệu khác nhau gọi là sự mã hoá, còn các nhóm ký hiệu thông tin cách điểm mã hoá gọi là mã.
Các mã mà các tổ hợp của nó bao gồm một số các ký hiệu như nhau gọi là mã đều đặn, còn các mã mà các tổ hợp của nó bao gồm một số các ký hiệu khác nhau gọi là mã không đều đặn.
Lý thuyết mã có hai hướng nghiên cứu để khắc phục độ dư tín hiệu truyền hình:
Nghiên cứu các cấu trúc mã nâng cao độ chính xác của việc truyền theo kênh thông tin có nhiễu (mã chống sai số, mã hiệu chỉnh…).
Nghiên cứu các mã làm triệt tiêu độ dư của tín hiệu đã mã hoá trong kênh chống nhiễu (nén tín hiệu).
Để phục vụ các yêu cầu về ghi, truyền tín hiệu video, mã hoá được sử dụng trong các trường hợp:
Mã hoá sơ cấp: Dùng để tạo tín hiệu số ở studio.
Mã bảo vệ và sửa sai: Tăng khả năng chịu đựng của tín hiệu trong kênh có nhiễu.
Mã truyền tuyến tính: Tăng khả năng truyền dẫn.
Ban đầu, tất của các tín hiệu video số được mã hoá sơ cấp, sau đó là mã hoá chuyển đổi. Mã sơ cấp là mã cơ sở mà từ đó hình thành mã bảo vệ.
1.5. Giảm tốc độ bit trong truyền hình
Nếu sử dụng PCM tuyến tính để biến đổi số tín hiệu Video tương tự thì tốc độ bit sẽ tăng rất cao và do đó thiết bị Video số cũng như thiết bị truyền dẫn số cần phải có dải thông rất lớn so với trường hợp tín hiệu Video tương tự.
Trong truyền hình số người ta thường lấy tỷ lệ tần số lấy mẫu tín hiệu chói và tần số lấy mẫu tín hiệu số màu để đánh giá chất lượng hình ảnh.
ƯsY : Ưsc:R-Y : Ưsc:B-Y
4 : 4 : 4 chất lượng cao nhất
4 : 2 : 2 chất lượng cao
4 : 1 : 1 chất lương trung bỡnh
2 : 1 : 1 (dựng cho thoại truyền hỡnh )
Việc giảm tốc độ bit dựa vào các yếu tố sau:
+ Nguồn tín hiệu Video được xem như nguồn có nhớ. Các thông tin được truyền trên hai dòng kề nhau chỉ khác nhau rất ít và được xem là giống nhau. Nó cũng đúng cho cả hai mành (nửa mành) và 2 ảnh kề nhau. Hay nói cách khác: Một số thông tin nhất định trong tín hiệu Video có thể được khôi phục lại ở đầu thu mà không cần truyền đi nó.
+ Dựa vào những đặc điểm sinh lý của mắt người: độ nhạy của mắt, các đặc điểm về phổ của mắt, khả năng phân biệt của mắt, độ lưu ảnh của võng mạc nên không cần truyền đi toàn bộ thông tin chứa trong các dòng và các mành hoặc các ảnh liên tục, các tín hiệu không truyền đi đó gọi là tín hiệu dư thừa (Redundanced Video Signal).
+ Để giảm tốc độ bit truyền hình số còn thực hiện chọn mã thích hợp có thể thực hiện theo các nhóm sau:
DPCM: PCM phi tuyến, PCM có dự báo, PCM vi sai.
Mã chuyển vị (chuyển đổi)
Mã nội suy và ngoại suy
Trong đó: PCM đòi hỏi tốc độ bit cao. DPCM sử dụng đặc trưng thống kê ảnh và tín hiệu Video và cũng như đặc điểm của mắt người cho phép làm giảm tốc độ bit nên trong truyền hình số người ta thường dùng phương pháp điều chế xung mã vi sai hơn cả.
1.6. Phương thức truyền dẫn tín hiệu truyền hình số
Truyền hình quảng bá tiết kiệm được bộ nhớ và tiết kiệm kênh truyền. Một kênh truyền hình quảng bá truyền thống khi truyền tín hiệu truyền hình số có thể truyền được trên 6 chương trình và mỗi chương trình có thể kèm theo 2 đến 4 đường tiếng. ứng dụng kỹ thuật truyền hình số có nén có thể truyền một chương trình truyền hình độ phân giải cao HDTV trên một kênh thông thường có băng thông (6-8)MHz, điều mà kỹ thuật tương tự không thể giải quyết được.
Truyền hình số có nén được sử dụng rộng rãi cho nhiều cấp chất lượng khác nhau. Từ S DTV có chất lượng tiêu chuẩn đến HDTV có chất lượng cao với tốc độ bit từ 5 – 24 Mb/s, được truyền dẫn và phát sóng qua cáp, qua vệ tinh và trên mặt đất. Có rất nhiều tiêu chuẩn nén dùng cho truyền hình số: MPEG-1, 2, 3, 4, 7….(Moving Picture Experts Group).
Chương trình quảng bá truyền hình số (digital video broadcasting DVB) chủ yếu sử dụng tiêu chuẩn nén MPEG-2, nó có phương thức sửa mã sai; căn cứ vào các chương trình Multimedia, sẽ chọn lựa các phương thức điều chế tương ứng và biên mã của các đường thông tin.
Hiện nay có ba tiêu chuẩn truyền hình số là DVB (Châu âu), ATSC (Mỹ), ISDB-T (Nhật), trong đó DVB tỏ ra có nhiều ưu điểm và có khoảng 84% số nước trên thế giới trong đó có Việt Nam lựa chọn sử dụng.
Mô hình hệ thống truyền dẫn DVB được mô tả như hình vẽ dưới đây:
Truyền đa chương trỡnh
Mó hoỏ đầu cuối cỏp
Điều chế
QAM
Truyền đa chương trỡnh
Mó hoỏ
kờnh
Điều chế
QPSK
Truyền đa chương trỡnh
Mó hoỏ
kờnh
Điều chế
COFDM
Ghộp kờnh chương trỡnh
Dũng chương
trỡnh 1
Dũng chương
trỡnh 2
Dũng chương
trỡnh n
Truy cập cú điều kiện
Đến mạng
cỏp
Đến vệ
tinh
Đến mỏy phỏt súng trạm mặt đất
Hỡnh 1.4: Mụ hỡnh hệ thống truyền dẫn DVB
Sau khi xác định các tiêu chuẩn của phát truyền hình số DVB, do các sự truyền tải Multimedia khác nhau, lĩnh vực ứng dụng khác nhau nên DVB đã được tổ chức và phân chia thành một số hệ thống, cụ thể là hệ thống quảng bá truyền hình số vệ tinh DVB-S; hệ thống quảng bá truyền hình số cáp DVB-C (Cable); hệ thống quảng bá truyền hình số vi ba DVB-M (Microwave); hệ thống quảng bá truyền hình số mặt đất DVB-T (Terrestrial); hệ thống truyền hình số theo mạng tương tác DVB-I (Interact); hệ thống truyền hình số hệ thống cộng đồng DVB-CS (Community System)….
1.6.1. Hệ thống quảng bá truyền hình số qua cáp DVB-C
DVB-C: Hệ thống truyền dẫn qua cáp sử dụng độ rộng kênh truyền 7-8MHz, điều chế QAM với 64 trạng thái, tốc độ dữ liệu cực đại từ lớp truyền MPEG-2 là 38,1 Mb/s.
Trong mạng truyền hình hữu tuyến do tín hiệu hình ảnh được truyền tải trên đường dây cáp đồng trục nên nó ít bị can nhiễu bên ngoài. Trong các nguyên tắc DVB đã quy định sử dụng các phương thức điều chế QAM, căm cứ vào trạng thái môi trường truyền tải có thể sử dụng các tốc độ điều chế khác nhau như 16-QAM; 128-QAM; 256-QAM.
Mỏy thu vệ tinh số
Mỏy thu vệ tinh số
Mỏy thu vệ tinh số
Bộ giải điều chế số
Bộ giải điều chế số
Bộ giải điều chế số
Bộ trộn
Mỏy phỏt
Mạng hữu tuyến
Tớn hiệu từ vệ tinh
Tớn hiệu từ vệ tinh
Tớn hiệu từ vệ tinh
Hỡnh 1.5. Sơ đồ khối hệ thống truyền hỡnh số qua c ỏp
Hình 1.5 là sơ đồ của hệ thống quảng bá truyền hình số hữu tuyến. Nguồn tín hiệu truyền hình lấy nguồn từ vệ tinh thì cần một máy thu vệ tinh số IRD (Integrated Receiver Coder) để thu các chương trình khác nhau và chuyển đổi thành dòng dữ liệu MPEG-2, đối với tín hiệu thị tần-âm tần AV thì cần bộ giải nén biên mã số để giải mã tín hiệu, tạo ra dòng dữ liệu MPEG-2. Nguồn tín hiệu khác nhau sẽ tạo ra dòng dữ liệu MPEG-2 ở bộ trộn nhiều đường số để tiến hành trộn và thu được dòng tín hiệu có tốc độ cao hơn. Sau đó tín hiệu này đưa vào bộ điều chế QAM, bộ biến tần để đạt được dải tần cần thiết cho mạng truyền hình hữu tuyến.
1.6.2. Hệ thống quảng bá truyền hình số vệ tinh DVB-S
Hệ thống truyền dẫn qua vệ tinh DVB-S có các đặc trưng như sau: Sử dụng băng tần C và Ku, điều chế số QPSK, tối ưu hoá cho từng tải riêng cho từng bộ phát đáp (Transponder: thiết bị thu phát trên vệ tinh) và công suất hiệu dụng, tốc độ dữ liệu cực đại từ lớp truyền MPEG-2 là 38,1 Mb/s.
Bộ mó húa MPEG
Bộ mó húa MPEG
Bộ mó húa MPEG
Bộ trộn nhiều đường
Bộ điều chế QPSK
Bộ đổi tần lờn
Phỏt lờn vệ tinh
Hỡnh 1.6. Sơ đồ khối hệ thống quảng bỏ truyền hỡnh số vệ tinh
Nguyên lý truyền hình số vệ tinh trình bày ở hình 1.6. Thông tin âm tần và thị tần và các tín hiệu số trước tiên sẽ đi qua bộ nén số MPEG-2 (ENC) tiến hành việc nén biên mã, tín hiệu truyền hình số với tốc độ trên 200Mb/s được nén xuống còn 6Mb/s, dòng số liệu MPEG-2 bị nén nhiều đường sẽ được đưa vào bộ trộn nhiều đường số tiến hành việc trộn, ở ngõ ra sẽ nhận được dòng mã MPEG-2 có tốc độ cao hơn. Căn cứ vào yêu cầu, các chương trình truyền hình cần tải sẽ được thực hiện việc mã hoá, sau đó dòng số liệu MPEG-2 được đưa vào bộ điều chế số QPSK. Cuối cùng tiến hành biến tần, tín hiệu QPSK được điều chế tới trung tần IF, đạt tới tần số vi ba cần thiết của dải sóng C hoặc Ku, thông qua anten phát tiến hành phát lên vệ tinh.
Sơ đồ khối của hệ thống thu truyền hình số vệ tinh như hình 1.7. Tín hiệu vệ tinh qua bộ biến tần LNB, máy thu vệ tinh số IRD sẽ tiến hành việc giải điều chế QPSK, giải mã đưa ra tín hiệu âm tần và thị tần, nếu dùng đầu nối thu CATV ở trước thì mạng truyền hình hữu tuyến có thể được chia thành phương thức truyền tải tương tự và phương thức truyền tải số.
Trong phương thức truyền tải tương tự thì số đường truyền đạt và số lượng máy thu bằng nhau, do tín hiệu đầu ra của máy thu vệ tinh số IRD là AV cho nên cần phải dùng các bộ điều chế tương tự với các kênh tần khác nhau để truyền tải tín hiệu tới hộ dùng.
Bộ biến tần
Mỏy thu vệ tinh số
Tivi thụng thường
A
V
Tớn hiệu từ vệ tinh
Hỡnh 1.7. Sơ đồ khối hệ thống thu truyền hỡnh số
1.6.3. Hệ thống quảng bá truyền hình số trên mặt đất DVB-T
Mỏy thu vệ tinh số
Mỏy thu vệ tinh số
Bộ mó húa MPEG - 2
Bộ mó húa MPEG - 2
Bộ trộn nhiều đường
Bộ điều chế số
Bộ nõng tần
VHF UHF
A
V
A
V
Tớn hiệu từ vệ tinh
Hỡnh 1.8. Sơ đồ khối hệ thống DVB-T
Tớn hiệu từ vệ tinh
Hệ thống phát sóng số trên mặt đất DVB-T sử dụng độ rộng kênh 7-8MHz, tốc độ dữ liệu cực đại từ lớp truyền MPEG-2 là 24Mb/s. Người ra sử dụng phương pháp điều chế số mã hoá ghép kênh theo tần số trực giao COFDM do sự truyền tải của hệ thống quảng bá truyền hình số trên mặt đất tương đối đặc biệt, có hiện tượng phản xạ tín hiệu nhiều lần, can nhiễu rất nghiêm trọng.
Kết luận chương 1
Những nội dung đã trình bày trong chương 1 cho ta cái nhìn tổng thể về các vấn đề của truyền hình số, vai trò của việc lựa chọn tần số lấy mẫu, số bit lượng tử, các loại mã và sự cần thiết phải nén tín hiệu nhằm đưa truyền hình số vào ứng dụng thực tiễn. Vấn đề về nén tín hiệu video trong truyền hình số sẽ được giải quyết trong chương 2.
Chương 2: các công nghệ Nén tín hiệu video trong truyền hình số
Nén nhằm giảm tốc độ bit của các dòng dữ liệu tốc độ cao mà vẫn đảm bảo chất lượng hình ảnh hoặc âm thanh cần truyền tải. Tín hiệu Video sau khi được số hoá (8 bit) có tốc độ bằng 216 Mb/s. Để có thể truyền trong một kênh truyền hình thông thường, thì tín hiệu video số cần phải được nén trong khi vẫn đảm bảo được chất lượng hình ảnh. Chương 2 nêu các nội dung này nhằm xây dựng nội dung lý luận cho các giải pháp sẽ đưa ra trong chương tiếp theo (chương 3) về ứng dụng công nghệ nén trong sản xuất chương trình truyền hình.
2.1. Tổng quan về kỹ thuật nén Video số
2.1.1. Khái niệm chung
2.1.1.1. Mục đích của nén Video số
Nén video có hai lợi ích quan trọng thấy rõ:
Thứ nhất: nén video giúp chúng ta có thể sử dụng nguồn video số đã được mã hoá để truyền đi hay lưu trữ một cách có hiệu quả ngay cả trên những môi trường truyền dẫn không hỗ trợ những file video chưa được nén lúc đầu. Ví dụ, một đĩa DVD sẽ chỉ có thể chứa được vài giây một đoạn video nguyên bản không qua nén ở độ phân giải và tốc độ khung hình tương đương với chất lượng tương ứng trên tivi truyền hình sẽ không thể sử dụng như lý giải ở trên.
Thứ hai: quá trình nén video cho phép việc sử dụng những nguồn video đã qua nén cho quá trình lưu trữ hay truyền đi một cách có hiệu quả. Ví dụ, với một kênh truyền dẫn tốc độ cao, việc lựa chọn và truyền đi một video nén với độ phân giải cao thậm chí cả những luồng video nén là hợp lý hơn nhiều so với việc sẽ truyền đi một video đơn lẻ với độ phân giải thấp hay từng luồng video chưa qua nén.
2.1.1.2. Bản chất của nén
Khác với nguồn dữ liệu một chiều nh− nguồn âm, đặc tuyến đa chiều của nguồn hình ảnh cho thấy: nguồn ảnh chứa nhiều sự d− thừa hơn các nguồn thông tin khác. Đó lμ:
Sự d− thừa về mặt không gian (spatial redundancy):
Các điểm ảnh kề nhau trong một mμnh có nội dung gần giống nhau.
Sự d− thừa về mặt thời gian (temporal redundancy):
Các điểm ảnh có cùng vị trí ở các mμnh kề nhau rất giống nhau.
Sự d− thừa về mặt cảm nhận của con ng−ời:
Mắt ng−ời nhạy cảm hơn với các thμnh phần tần số thấp vμ ít nhạy cảm với sự thay đổi nhanh, tần số cao.
Do vậy, có thể coi nguồn hình ảnh lμ nguồn có nhớ (memory source).
Nén ảnh thực chất lμ quá trình sử dụng các phép biến đổi để loại bỏ đi các sự d− thừa vμ loại bỏ tính có nhớ của nguồn dữ liệu, tạo ra nguồn dữ liệu mới có l−ợng thông tin nhỏ hơn. Đồng thời sử dụng các dạng mã hoá có khả năng tận dụng xác suất xuất hiện của các mẫu sao cho số l−ợng bít sử dụng để mã hoá một l−ợng thông tin nhất định lμ nhỏ nhất mμ vẫn đảm bảo chất l−ợng theo yêu cầu. Nhìn chung quá trình nén vμ giải nén có thể lý giải một cách đơn giản nh− hình 2.1.
Dữ liệu
Dữ liệu
Dữ liệu đã nén
Biến đổi
Mã hoá
Giải mã
Biến đổi ngược
Dữ liệu đã nén
Quá trình nén
Quá trình giải nén
Hình 2.1: Sơ đồ khối quá trình nén vμ giải nén
Biến đổi:
Một số phép biến đổi vμ kỹ thuật đ−ợc sử dụng để loại bỏ tính có nhớ của nguồn dữ liệu ban đầu, tạo ra một nguồn dữ liệu mới t−ơng đ−ơng chứa l−ợng thông tin ít hơn. Ví dụ nh− kỹ thuật tạo sai số dự báo trong công nghệ DPCM hay phép biến đổi cosin rời rạc của công nghệ mã hoá chuyển đổi. Các phép biến đổi phải có tính thuận nghịch để có thể khôi phục tín hiệu ban đầu nhờ phép biến đổi ng−ợc.
M∙ hoá:
Các dạng mã hoá đ−ợc lựa chọn sao cho có thể tận dụng đ−ợc xác suất xuất hiện của mẫu. Thông th−ờng sử dụng mã RLC (run length coding: mã hoá loạt dμi) vμ mã VLC (variable length coding): gắn cho mẫu có xác suất xuất hiện cao từ mã có độ dμi ngắn sao cho chứa đựng một khối l−ợng thông tin nhiều nhất với số bit truyền tải ít nhất mμ vẫn đảm bảo chất l−ợng yêu cầu.
2.1.1.3. Phân loại nén
Các thuật toán nén có thể phân lμm hai loại: Nén không tổn thất (lossless
compression) vμ nén có tổn thất (lossy compression).
Thuật toán nén không tổn thất không lμm suy giảm, tổn hao dữ liệu. Do vậy, ảnh khôi phục hoμn toμn chính xác với ảnh nguồn.
Các thuật toán nén có tổn thất chấp nhận loại bỏ một số thông tin không quan trọng nh− các thông tin không quá nhạy cảm với cảm nhận của con
ng−ời để đạt đ−ợc hiệu suất nén cao hơn, Do vậy, ảnh khôi phục chỉ rất gần chứ
không phải lμ ảnh nguyên thủy.
Đối với nén có tổn thất, chất l−ợng ảnh lμ một yếu tố vô cùng quan trọng, Tuỳ theo yêu cầu ứng dụng mμ các mức độ loại bỏ khác nhau đ−ợc sử dụng, cho mức độ chất l−ợng theo yêu cầu.
2.1.2. Một số dạng mã hoá sử dụng trong các công nghệ nén.
Các dạng mã hoá sử dụng trong công nghệ nén đều tận dụng đ−ợc xác suất xuất hiện mẫu nhằm đạt đ−ợc độ dμi mã trung bình (số bit trung bình cần để mã hoá một mẫu) lμ nhỏ nhất. Tuy nhiên, độ dμi nμy có một giới hạn d−ới mμ không một ph−ơng pháp mã hoá nμo có thể cung cấp độ dμi từ mã trung bình nhỏ hơn. Đó lμ “ entropy” của nguồn tín hiệu.
2.1.2.1. Khái niệm entropy của nguồn tín hiệu
Khái niệm ”entropy” của nguồn tín hiệu đ−ợc sử dụng để đo l−ợng thông tin một nguồn tin chứa đựng.
Một nguồn tin có N mẫu {s1,s2,..,sN} với xác suất xuất hiện các mẫu t−ơng ứng lμ {p(s1), p(s2),.., p(sN)}. Khi đó,” entropy” của nguồn tin đ−ợc định nghĩa nh− sau: [1]
Ví dụ một nguồn tin gồm các mẫu {1,0} với:
+ xác suất xuất hiện mẫu “1” lμ 0,8.
+ xác suất xuất hiện mẫu “0” lμ 0,2.
Khi đó “entropy” của nguồn lμ:
H = - (0,8.log20,8 + 0,2.log20,2)
= 0,7219 bit
“Entropy” của nguồn tin quy định giới hạn d−ới tốc độ bit tại đầu ra bộ mã hoá. Ph−ơng pháp mã hoá nμo có độ dμi mã trung bình (số bit trung bình cần để mã hoá một mẫu) cμng gần giá trị H thì ph−ơng pháp mã hoá đó cμng hiệu quả.
2.1.2.2. Mã hoá với độ dμi chạy RLC (run length coding). [3]
Phương pháp nén RLC này dựa trên cơ sở là sự liên tiếp lặp đi lặp lại các điểm ảnh t._.rong ảnh số, xuất hiện là do sự tương quan giữa các điểm ảnh, đặc biệt là với các ảnh 2 mức (bi – level images). RLC tách các giá trị giống nhau và biểu diễn như là một tổng, kỹ thuật này chỉ áp dụng cho các chuỗi symbols tuyến tính.
Có hai cách mã hoá RLC:
1- Tạo ra những từ mã cho mỗi độ dài chạy (động) và kết hợp với symbol nguồn.
2- Sử dụng một số độ dài chạy và một symbol nguồn nếu như symbol nguồn không phải là một số hay một ký đặc biệt để chỉ ra cho mỗi symbol nguồn.
Kỹ thuật RLC được dùng cho các hệ số lượng tử hoá tốt hơn là dùng trực tiếp cho số liệu ảnh.
Một dạng cải tiến của mãc RLC là mã có độ dài thay đổi VLC (Variable Length Code) dùng để biểu diễn các độ dài chạy cũng như các giá trị symbol. Cách thực hiện là tính phân bố xác xuất của độ dài chạy và các giá trị symbol. Đây là sự kết hợp của mã hoá RLC với mã hoá thống kê.
2.1.2.3. Mã hoá với độ dμi thay đổi VLC (variable length coding) (mã Huffman)
Trong các công nghệ nén, mã Huffman lμ dạng mã đ−ợc sử dụng phổ biến nhất. Bảng mã Huffman có thể cho độ dμi mã trung bình để mã hoá cho một mẫu lμ nhỏ nhất do tận dụng xác suất xuất suất hiện của các mẫu trong nguồn tín hiệu.
Trong đó, mẫu có xác suất xuất hiện cao nhất sẽ đ−ợc gắn với một từ mã có độ dμi ngắn nhất. Mặc dù có độ dμi mã thay đổi song mã Huffman vẫn có khả năng giải mã đúng do có thuộc tính tiền tố duy nhất (không có bất cứ từ mã nμo lại lμ phần đầu của từ mã tiếp theo).
Để xây dựng cây mã Huffman gồm các b−ớc sau:
Liệt kê các xác suất của các symbol nguồn và tạo ra các tập nút bằng cách cho các xác suất này thành các nhánh của cây nhị phân.
Lấy hai nút với xác suất nhỏ nhất từ tập nút và tạo ra một xác suất mới bằng tổng xác suất của các xác suất đó.
Tạo ra một nút mẹ với các xác suất mới, và đánh dấu 1 cho nút con ở trên và 0 cho nút con ở dưới.
Tạo tiếp tập nút bằng cách thay thế 2 nút với xác xuất nhỏ nhất cho nút mới. Nếu tập nút chỉ chứa một nút thì kết thúc, ngược lại thì ta quay lại bước 2.
Ph−ơng pháp mã hoá thống kê Huffman sẽ trở nên nặng nề khi số tin của nguồn quá lớn. Trong tr−ờng hợp nμy ng−ời ta dùng một biện pháp phụ để giảm nhẹ công việc mã hoá. Tr−ớc tiên liệt kê các tin của nguồn theo thứ tự xác suất giảm dần, sau đó ghép thμnh từng nhóm tin có tổng xác suất gần bằng nhau. Dùng một mã đều để mã hoá các tin trong cùng một nhóm. Sau đó xem các nhóm tin nh− một khối tin vμ dùng ph−ơng pháp Huffman để mã hoá các khối tin. Từ mã cuối cùng t−ơng ứng với mỗi tin của nguồn gồm hai phần: một phần lμ mã Huffman vμ một phần lμ mã đều.
Xét ví dụ thiết lập cây mã Huffman cho một nguồn tin chứa các mẫu :
{s0, s1, ..,s7} với xác suất xuất hiện lần l−ợt lμ :
p(si) = {0,1;0,19;0,21;0,3;0,05;0,05;0,07;0,03}.
Cây mã Huffman xây dựng cho nguồn tin nμy nh− sau:
1.0
1
0.4
0
0
0.13
1
1
0.18
0
0
0
0
0
1
1
P(s2)=0.21
P(s3)=0.3
P(s4)=0.05
P(s5)=0.05
P(s6)=0.07
P(s7)=0.03
P(s1)=0.19
P(s0)=0.1
1
0011
11
10
01
0001
00101
0000
00100
Liệt kê Thiết kế mã Từ mã
xác suất
`
Mặc dù mã Huffman hiệu quả nh−ng chúng ta phải hiểu rằng mã hoá Huffman chỉ tối −u khi đã biết tr−ớc xác suất của mã nguồn vμ mỗi biểu tr−ng của mã nguồn đ−ợc mã hoá bằng một số bit nguyên.
Đặc biệt mã hoá Huffman đ−ợc phát triển cho ảnh số nh−ng áp dụng cho rất nhiều loại ảnh, mỗi ảnh có xác suất xuất hiện biểu tr−ng của riêng nó. Do đó mã Huffman không phải lμ tối −u cho bất cứ loại ảnh đặc biệt nμo.
2.1.2.4. Mã hoá dự đoán (Predictive coding)
Nh− đã nói, nguồn ảnh chứa một l−ợng thông tin rất lớn. Nếu mã hoá trực tiếp nguồn tin nμy theo PCM, tốc độ dòng bit thu đ−ợc sẽ rất cao. Mặt khác, nguồn ảnh lại chứa đựng sự d− thừa vμ tính “có nhớ”: giữa các điểm ảnh lân cận có mối quan hệ t−ơng hỗ với nhau.
Mã hoá dự đoán đ−ợc xây dựng dựa trên nguyên tắc cơ bản nh− sau:
♦ Lợi dụng mối quan hệ t−ơng hỗ nμy, từ giá trị các điểm ảnh lân cận, theo một nguyên tắc nμo đó có thể tạo nên một giá trị gần giống điểm ảnh hiện hμnh. Giá trị nμy đ−ợc gọi lμ giá trị “dự báo”.
♦ Loại bỏ đi tính “có nhớ” của nguồn tín hiệu bằng một bộ lọc đặc biệt có đáp ứng đầu ra lμ hiệu giữa tín hiệu vμo s(n) vμ giá trị dự báo của nó.
♦ Thay vì l−ợng tử hoá trực tiếp các mẫu điểm ảnh, mã hoá dự đoán l−ợng tử vμ mã hoá các “sai số dự báo” tại đầu ra bộ lọc. “Sai số dự báo”lμ sự chênh lệch giữa giá trị dự báo vμ giá trị thực của mẫu hiện hμnh. Do nguồn “sai số dự báo”(error prediction source) lμ nguồn không có nhớ vμ chứa đựng l−ợng thông tin thấp, nên số bit cần để mã hoá sẽ giảm đi rất nhiều.
Ph−ơng pháp tạo điểm ảnh dựa trên tổng giá trị của điểm dự đoán vμ sai số dự báo gọi lμ “điều chế xung mã vi sai (DPCM)”.
Hình 2.2: Sơ đồ khối bộ mã hoá DPCM
S
Bộ dự đoán
Mã hoá
entropy
Bộ lượng tử hoá
S
Tín hiệu video số
V +
e
+
Kênh
V’
p
+
V: Tín hiệu vào.
e = V-P (P- sai số dự đoán)
eq – là sai số lượng tử
V’ = eq + p tín hiệu tạo lại
Sơ đồ khối bộ mã hoá và giải mã DPCM có dạng sau:
eq +
Giải mã
entropy
S
Bộ dự đoán
Kênh tín hiệu
-
V’
Đầu ra giải mã
p
Hình 2.3: Sơ đồ khối bộ giải mã DPCM
Nhằm tránh các lỗi có thể xuất hiện trong khi truyền, một mẫu đầy đủ sẽ được gửi đi theo chu kỳ nhất định cho phép cập nhật được các giá trị chính xác. Mã hoá DPCM cũng sử dụng thêm các kỹ thuật dự đoán và lượng tử hoá thích nghi để hoàn thiện thêm kỹ thuật nén này.
2.1.2.5. Mã hoá chuyển đổi (Transform coding)
Đối với việc mã hoá riêng rẽ từng điểm một sẽ không đạt được hiệu quả bởi ta không tận dụng được hết mối quan hệ giữa các khối điểm trong ảnh số. Phương pháp mã chuyển vị là một phương pháp có hiệu quả trong việc mã hoá khối điểm thông qua biến đổi tuyến tính các điểm này thành các hệ số chuyển vị và mã hoá các hệ số chuyển vị đó. Phương pháp này tập trung vào một số các hệ số chuyển vị mà không phải là các điểm ảnh của ảnh gốc và lượng thông tin chỉ trong một số ít hệ số chuyển vị. Như vậy, số bit dùng cho quá trình mã hoá sẽ ít đi.
Hơn nữa, do hệ thống thị giác của con người không thể nhận biết hoàn toàn các chi tiết của ảnh khi những chi tiết đó biến đổi nhanh so với các biến đổi chậm, bởi vậy để mã hoá các hệ số chuyển vị ở tần số cao, ta chỉ cần một số ít bit mà chất lượng hình ảnh vẫn tốt.
2.2. Các chuẩn nén video
Hiệp hội viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/Uỷ ban kỹ thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá Video. Theo ITU-T, các tiêu chuẩn mã hoá video được coi là các khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263, H.264). Với tiêu chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và MPEG-4). Những khuyến nghị của ITU được thiết kế dành cho các ứng dụng truyền thông video thời gian thực như video Conferencing hay điện thoại truyền hình. Mặt khác, những tiêu chuẩn MPEG được thiết kế hướng tới mục tiêu lưu trữ Video chẳng hạn như trên đĩa quang DVD, quảng bá video số trên mạng cáp, đường truyền số DSL, truyền hình vệ tinh hay những ứng dụng truyền dòng video trên mạng Internet hoặc thông qua mạng không dây. Với đối tượng để truyền dẫn video là mạng Internet thì ứng cử viên hàng đầu là chuẩn nén MPEG-4 AVC, còn được gọi là H.264, MPEG-4 part 10, H.26L hoặc JVT.
2.3. Nén Video theo tiêu chuẩn MPEG
Nhóm các chuyên gia về ảnh động (Motion Pictures Expert Group-MPEG) làm việc cho tổ chức tiêu chuẩn quốc tế ISO (ISO/IEC) có nhiệm vụ nghiên cứu và phát triển các tiêu chuẩn nén, giải nén tín hiệu video, audio. Hiện nay các chuẩn nén MPEG đang được sử dụng phổ biến và được các tổ chức ISO/IEC, ITU (International Telecommunication Union) công nhận là chuẩn nén quốc tế, áp dụng cho các hệ truyền hình tại Mỹ, Nhật Bản, Châu âu.
MPEG-1: được phát triển vào năm 1988 – 1992, là tiêu chuẩn đầu tiên của MPEG. Chuẩn MPEG-1 được sử dụng chủ yếu để nén tín hiệu VCD và các luồng tốc độ thấp khoảng 1.5Mbps. MPEG-1 hỗ trợ nén các tín hiệu có phân giải thấp 352 x 240(60Hz) và 352 x 288(50Hz), sử dụng biến đổi cosin rời rạc (DCT) để loại bỏ dư thừa không gian, có dự đoán và bù chuyển động. Điểm nổi bật của MPEG-1 khi đó là có hỗ trợ nén các hình ảnh quét lần lượt.
MPEG-2: Được xây dựng từ năm 1991 đến 1994 và vẫn đang được sử dụng rộng rãi đến tận bây giờ. MPEG-2 có thuật toán nén tương tự như MPEG-1, song đã được phát triển lên tầm cao hơn, hoàn chỉnh hơn với hệ thống công cụ và cấp đa dạng (Profile và Level), hỗ trợ nén cho rất nhiều định dạng tín hiệu video, part 3 là về audio. MPEG-2/part 2 tương tự như MPEG-1 song đã có hỗ trợ nén hình ảnh quét xen kẽ. Chính vì vậy, MPEG-2 được sử dụng rộng rãi và chính thức trong các tiêu chuẩn truyền hình DVB, ISDB.
MPEG-3: Được phát triển vào năm 1992 với mục đích áp dụng cho HDTV, tuy nhiên nó bị huỷ bỏ vào năm 1993 do nhận thấy rằng: MPEG-2 hoàn toàn có thể thực hiện cho HDTV.
MPEG-4: Là thiết kế của MPEG nhằm hỗ trợ các ứng dụng audio/video hướng đối tượng, các nội dung 3D và hỗ trợ quản lý bản quyền nội dung số DRM (Digital Rights Management). Đây là một định dạng nén/mã hoá video có khả năng truyền thông trong các môi trường băng thông rất khác nhau. So với MPEG-2, MPEG-4 ưu việt hơn hẳn về tính năng tương tác. Hiện nay đa số các nhà cung cấp dịch vụ Multimedia như, RealNetworks, DivXNetworks, Microsoft đều đã hỗ trợ chuẩn MPEG-4 trong cấu trúc hạ tầng cũng như công cụ Codecs của mình (Apple với Quick Time và các máy chủ Darwin Streaming Servers, RealNetWorks với RealPlayers và các máy chủ Helix Servers, DivXNetworks với DivX, Microsoft với Card Plug-ins cắm nối với Windows Media Players…). Trên môi trường mạng sử dụng kỹ thuật TCP/UDP Streaming, chuẩn MPEG-4 AVC/H.264 có thể cho phép xem truyền hình trực tuyến Online với chất lượng khá tốt tại các tốc độ bit ≤ 500kbps.
MPEG-7: Là một chuẩn dùng để mô tả các nội dung multimedia, chứ không phải là một chuẩn cho nén và mã hoá audio/ảnh động như MPEG-1,MPEG-2 hay MPEG-4. MPEG-7 sử dụng ngôn ngữ đánh dấu mở rộng XML để lưu trữ các siêu dữ liệu Metadata, đính kèm timecode để gắn thẻ cho các sự kiện hay đồng bộ các dữ liệu. MPEG-7 bao gồm 03 bộ chuẩn sau:
Bộ các sơ đồ đặc tả (description schemes) và các đặc tả (descriptors);
Ngôn ngữ xác định DDL (Description Definition Languae) để định nghĩa các sơ đồ đặc tả;
Sơ đồ mã hoá quá trình đặc tả;
2.3.1. Nén Video theo MPEG-1
Tiêu chuẩn MPEG-1 gồm 4 phần:
Phần 1: Hệ thống (ISO/IEC 11172-1)
Phần 2: Nén video (ISO/IEC 11172-2)
Phần 3: Nén Audio (ISO/IEC 11172-3)
Phần 4: Kiểm tra (ISO/IEC 11172- 4)
MPEG-1 nghiên cứu cách thức ghép nối một hoặc vμi dòng dữ liệu chứa thông tin thời gian để hình thμnh nên một dòng dữ liệu. Nó cung cấp qui tắc cú pháp đồng bộ hoá quá trình phát lại cho một dải ứng dụng Video rộng.
MPEG-1 coi ảnh chuyển động nh− dạng thức dữ liệu máy tính (gồm các điểm ảnh). Cũng nh− các dữ liệu máy tính (ảnh vμ văn bản), ảnh video chuyển động có khả năng truyền vμ nhận bằng máy tính vμ mạng truyền thông. Chúng cũng có thể đ−ợc l−u trữ trong các thiết bị l−u trữ dữ liệu số nh− đĩa CD, đĩa Winchester vμ ổ quang.
MPEG-1 cung cấp cả các ứng dụng đối xứng vμ không đối xứng:
Trong ứng dụng không đối xứng, ảnh động đ−ợc nén một lần, sau đó giải nén nhiều lần để truy cập thông tin, ví dụ trò chơi games.
Trong ứng dụng đối xứng, quá trình nén vμ giải nén phải cân bằng
nhau. VD: điện thoại hình, th− điện tử.
Để đạt đ−ợc hiệu suất nén cao mμ vẫn giữ tốt chất l−ợng ảnh phục hồi, chuẩn MPEG-1 sử dụng cả công nghệ nén trong ảnh (Intraframe) vμ liên ảnh (Interframe) để loại bỏ đ−ợc cả sự d− thừa không gian vμ thời gian.
Do MPEG-1 đ−ợc phát triển cho l−u trữ dữ liệu số nên đòi hỏi có sự truy cập ngẫu nhiên (Random Access). Cách thức mã hoá tốt nhất cho truy cập ngẫu nhiên lμ mã hoá Intraframe đơn thuần. Song do sự d− thừa thông tin về thời gian ch−a đ−ợc loại bỏ nên hiệu suất nén rất thấp. Do vậy trong tiêu chuẩn nén MPEG-1, có sự cân bằng giữa nén trong ảnh (Intraframe) vμ nén liên ảnh (Interframe) bằng cách sử dụng các công nghệ sau đây:
Bù chuyển động
Dự báo
Nội suy
Biến đổi cosine rời rạc
L−ợng tử hoá
Mã hoá độ dμi thay đổi (mã Huffman-VLC)
Tức lμ có sự kết kết hợp hai công nghệ nén DPCM vμ Trasform Coding. Thuật toán nén MPEG-1 sử dụng bù chuyển động khối để giảm sự d− thừa thời gian với vecto chuyển động cho mỗi khối kích th−ớc 16 x16 điểm ảnh. Bù chuyển động đ−ợc sử dụng cho cả dự báo nhân quả vμ không nhân quả
Dự báo nhân quả tạo dự báo ảnh hiện hμnh từ ảnh tr−ớc đó.
Dự báo không nhân quả tạo dự báo cho ảnh hiện hμnh dựa trên ảnh
trong quá khứ vμ cả t−ơng lai.
Vòng lặp DPCM đ−ợc sử dụng để tạo khung sai số dự báo. Sau đó,công nghệ mã hoá chuyển đổi chuyển khung sai số nμy sang miền tần số để nén các hệ số nhờ l−ợng tử hoá vμ mã hoá Huffman tr−ớc khi truyền tải hay l−u trữ.
2.3.1.1. Các thμnh phần ảnh cơ bản trong chuẩn nén MPEG
Các tiêu chuẩn MPEG cấu trúc dữ liệu dạng lớp. Bao gồm các thμnh phần cơ bản sau đây:
Khối (Block): Lμ đơn vị cơ bản cho chuyển đổi DCT. Bao gồm 8x8 điểm ảnh tín hiệu chói hoặc tín hiệu mμu.
Macro Block: Lμ nhóm các khối DCT t−ơng ứng với thông tin của một cửa sổ 16x16 điểm ảnh gốc. Có nhiều dạng Macro Block khác nhau phụ thuộc vμo cấu trúc lấy mẫu đ−ợc sử dụng.
Phần đầu đề (header) của Macroblock chứa thông tin phân loại (Y hay Cb, CR) vμ vector bù chuyển động t−ơng ứng.
Lát (slice): Đ−ợc cấu thμnh từ một hay một số MB liên tiếp nhau.
Phần header của slice chứa thông tin về vị trí của nó trong ảnh vμ tham số quét l−ợng tử (quantized scaling factor). Kích cỡ của slice quyết định bởi mức bảo vệ lỗĩ cần có trong ứng dụng vì bộ giải mã sẽ bỏ qua slice bị lỗi. Hệ số một chiều DC đ−ợc định vị tại điểm bắt đầu mỗi slice.
ảnh: Lớp ảnh cho bên thu biết về loại mã hoá khung I,P,B). Phần header mang thứ tự truyền tải của khung để bên thu hiển thị khung theo đúng thứ tự, ngoμi ra còn có một số thông tin bổ sung nh− thông tin đồng bộ, độ phân giải vμ vecto chuyển động.
Hình 2.4: Cấu trúc Macroblock của các dạng lấy mẫu
Nhóm ảnh (group of picture): Gồm cấu trúc các ảnh I,B vμ P. Mỗi nhóm bắt đầu bằng ảnh I cung cấp điểm vμo ra vμ tìm kiếm. Phần header chứa 25 bit thời gian vμ chế độ điều khiển cho VTR vμ thông tin thời gian. Trong MPEG có các cấu trúc nhóm ảnh điển hình nh− sau:
F1
F1
F2
F2
F3
F3
F4
F4
F5
F5
F6
F6
F7
F7
F8
F8
F9
F9
F10
F10
I
I
B
B
B
B
P
P
B
B
B
B
P
P
B
BB
B
B
B
I
I
R-601:
Khung
đã nénu truực:
IBBPBBPBBI
Cấu trúc IB
I
I
B
B
I
I
I
I
B
B
P
P
I
I
P
P
Cấu trúc IBP
Cấu trúc IP
Cấu trúc IBBPBBPBBI
Khung
CCIR_ 601
nguyên thuỷ IBBPBBPBBI
Hình 2.5: Các cấu trúc nhóm ảnh trong tiêu chuẩn MPEG
Chuỗi Video (Video Sequence): lớp chuỗi bao gồm phần header, một hoặc một số nhóm ảnh (Picture Group) vμ phần kết thúc chuỗi Sequence end Code).
Y CB CR
Frame
me
8X8
8X8
8X8
8X8
Y
CB
CR
Macroblock
Slice
frame
GOP
4:2:0
Thông tin quan trọng nhất của phần header lμ kích th−ớc (dọc, ngang) của mỗi ảnh, tốc độ bit, tốc độ ảnh vμ dung l−ợng đòi hỏi bộ đệm dữ liệu bên thu. Thông tin chuỗi ảnh vμ phần header của chuỗi lμ dòng bit đã mã hoá, còn gọi lμ dòng video cơ bản.
Hình 2.6: Cấu trúc dòng dữ liệu video MPEG
2.3.1.2. Sự phân loại ảnh MPEG
Tiêu chuẩn nén video MPEG định nghĩa 3 loại ảnh: ảnh I, ảnh B vμ ảnh P.
a. ảnh I: (Intra - Coded Picture)
Các ảnh I đ−ợc mã hoá theo mode Intra để có thể giải mã mμ không cần sử dụng dữ liệu từ bất cứ một ảnh nμo khác. Đặc điểm của ph−ơng pháp mã hoá nμy nh− sau:
Chỉ loại bỏ đ−ợc sự d− thừa không gian.
Dùng các điểm trong cùng một khung để tạo dự báo.
Không có bù chuyển động.
Các thông tin đ−ợc mã hoá rõ rμng, minh bạch nên số l−ợng bít yêu cầu lớn.
Do đ−ợc mã hoá Intra, ảnh I bao giờ cũng lμ ảnh đầu tiên trong một nhóm ảnh hay một chuỗi ảnh. Nó cung cấp thông tin khởi động các ảnh tiếp theo trong nhóm.
b. ảnh P (Predictive Code Picture)
ảnh P đ−ợc mã hoá liên ảnh một chiều (Interframe một chiều):
Dự báo Inter một chiều.
ảnh dự báo đ−ợc tạo ảnh tham chiếu tr−ớc đó (dự báo nhân quả). ảnh tham chiếu nμy có thể lμ ảnh I hoặc ảnh P gần nhất.
Có sử dụng bù chuyển động. Thông tin −ớc l−ợng chuyển động của các khối nằm trong vecto chuyển động (motion vecto). Vecto nμy xác định Macroblock nμo đ−ợc sử dụng từ ảnh tr−ớc.
Do vậy ảnh P bao gồm cả những MB mã hoá Inter (I - MB) lμ những macroblock chứa thông tin lấy từ ảnh tham chiếu vμ những MB mã hoá Intra lμ những MB ch−á thông tin không thể m−ợn từ ảnh tr−ớc. ảnh P có thể đ−ợc sử dụng lμm ảnh tham chiếu tạo dự báo cho ảnh sau.
c. ảnh B (Bidirectionally Predicted Pictures)
ảnh B lμ ảnh mã hoá liên ảnh hai chiều.Tức lμ :
Có sử dụng bù chuyển động.
Dự báo không nhân quả, ảnh dự báo gồm các macroblock của cả khung hình tr−ớc đó vμ sau đó.
Việc sử dụng thông tin lấy từ ảnh trong t−ơng lai hoμn toμn có thể thực hiện đ−ợc vì tại thời điểm mã hoá thì bộ mã hoá đã sẵn sμng truy cập tới ảnh phía sau. ảnh B không đ−ợc sử dụng lμm ảnh tham chiếu tạo dự báo cho các ảnh sau. [3]
Khung dự báo (B) = khung trước
- khung sau
+ vecto chuyển
động hai chiều
Đường di chuyển của vật thể
Vị trí nội suy
Vùng không bao phủ
Khung kề trước (n)
Khung hiện hành (n+1)
Dự báo bù chuyển động ảnh P
Khung dự báo (P) = khung trước
khung hiện hành
+ vecto chuyển động
Khung kề trước (n-1)
Khung hiện hành (n)
Khung kề sau (n+1)
Dự báo bù chuyển động ảnh B
Hình 2.7: Nội suy bù chuyển động
d. Thứ tự truyền dẫn vμ thứ tự hiển thị ảnh.
Chuỗi ảnh MPEG th−ờng có cấu trúc IBBPBBPBBI nh−ng thứ tự truyền dẫn vμ thứ tự hiển thị ảnh lμ khác nhau do khi tạo ảnh B cần thông tin từ cả khung quá khứ vμ t−ơng lai.Nh− vậy có nghĩa, ảnh trong t−ơng lai cần phải đ−ợc truyền dẫn
tr−ớc. Trong khi đó, lúc hiển thị phải theo đúng thứ tự nguồn. Để thực hiện điều nμy, lớp ảnh (Picture layer) của dòng dữ liệu MPEG có thông tin về số thứ tự ảnh trợ giúp hiển thị.
F1
F1
F2
F2
F3
F3
F4
F4
F5
F5
F6
F6
F7
F7
F8
F8
F9
F9
F10
F10
I1
I
B2
B
B3
B
P4
P
B5
B
B6
B
P7
P
B8
BB
B
B9
B
I10
I
R-601:
Thứ tự hiển thị
IBBPBBPBBI
I1
I
P4
B
B2
I
B3
I
P7
B
B5
P
B6
I
I10
P
Thứ tự
khung gốcI
B8
P
B9
P
Thứ tự truyền IBBPBBPBBI
Hình 2.8: Thứ tự truyền dẫn vμ thứ tự hiển thị ảnh
2.3.1.3. Tiêu chuẩn MPEG-1
MPEG-1 có phạm vi ứng dụng rộng rãi cho dạng thức CSIF (Common Source Intermediate Format). CSIF lμ một định dạng nguồn dữ liệu đầu vμo của các bộ nén vμ giải nén (codec) do CCITT qui định phù hợp với hai dạng quét TV 525/60 vμ 625/50. Dạng thức nμy gắn với cấu trúc lấy mẫu 4:2:0 đ−ợc qui định như sau: [3]
CCIR – 601
525
CSIF- 525
4:2:0
CCIR - 601
625
CCIR - 601
625
Số điểm/dòng tích cực
+ Chói Y
+ Mμu Cb, CR)
720
360
352
176
720
360
352
176
Tần số lấy mẫu (MHz)
+ Chói Y Chói Y
+ Mμu (Cb, CR)
13,5
6,75
6,75
3,38
13,5
6,75
6,75
3,38
Số dòng tích cực
+ Chói Y
+ Mμu (Cb,CR)
480
480
240
120
576
576
288
144
Tốc độ khung (Hz)
30
30
25
25
Tử số ảnh
(Kích cỡ ảnh)
4:3
4:3
4:3
4:3
Bảng 1: Dạng thức ảnh cơ bản của CSIF
Nh− vậy đối với MPEG-1, dòng dữ liệu truyền hình chuẩn theo CCIR- 601 phải đ−ợc biến đổi sang dạng CSIF bằng một bộ chuyển đổi (converter). Điều nμy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontal decimation filter) cho tín hiêụ chói mμnh lẻ vμ bộ lọc dòng vμ mμnh cho tín hiệu CR, CB mμnh lẻ. Quá trình giải mã tại bộ thu phải dự báo mμnh chẵn từ mμnh lẻ nội suy. Để giảm mức độ phức tạp vμ giá thμnh bộ giải mã, trong MPEG 1 một số tham số đ−ợc mặc định thμnh hằng số nh− sau:
Tham số
Giá trị cực đại
Độ rộng ảnh
Chiều cao ảnh
Tốc độ ảnh
Số l−ợng MB (Macroblock)
Giải vecto chuyển động
Kích th−ớc bộ đệm đầu vμo
Tốc độ bit
768 điểm
576 dòng
30 ảnh/s
396
± 64 điểm
327.680 bit
1,8 Mbps
Bảng 2: Các tham số mặc định trong chuẩn MPEG-1
MPEG-1 có một số tiêu chuẩn cơ bản nh− sau:
Chỉ có một cấu trúc lấy mẫu 4:2:0.
Kích cỡ ảnh tối đa 720 pixel với 576 dòng sử dụng các tham số mặc định.
Độ chính xác mẫu đầu vμo 8 bit.
Độ chính xác l−ợng tử hoá vμ DCT: 9 bit.
Sử dụng l−ợng tử hoá DPCM tuyến tính cho hệ số DC.
L−ợng tử thích nghi cho lớp macroblock (16x16 điểm).
Độ chính xác cực đại của hệ số DC lμ 8 bit.
Ma trận l−ợng tử chỉ có thể thay đổi ở lớp chuỗi.
Sử dụng khung P vμ B.
Độ chính xác dự báo chuyển động lμ nửa điểm.
Tốc độ bit tối đa lμ 1,85 Mbps khi dùng tham số mặc định cho ảnh 720x576 vμ 100 Mbps khi dùng tham số đầy đủ cho ảnh 4095 x 4095.
MPEG-1 cho phép có sự truy cập ngẫu nhiên các khung video, tìm kiếm nhanh thuận ng−ợc theo dòng bit đã nén, phát lại ng−ợc dòng video vμ khả năng dời bỏ dòng bit nén.
2.3.1.4. Hệ thống nén MPEG-1
Sơ đồ khối chi tiết bộ codec (bộ mã hoá vμ giải mã) trong chuẩn MPEG-1 trình bày trên hình 2.9 và 2.10.
Bộ phân loại Inter/Intra căn cứ vμo thông tin phân loại ảnh (I, P, B) sẽ cho tín hiệu ra Inter/Intra xác định ảnh đ−ợc mã hóa theo mode Inter hay mode Intra.Thông tin nμy lμ tác nhân chuyển mạch kích hoạt bộ tạo dự báo t−ơng ứng.
♦ Nếu ảnh I (mã hóa Intra): sử dụng dự báo Intra, lấy MB lân cận tr−ớc đó lμm dự báo cho MB hiện hμnh. MB lân cận nμy đ−ợc phục hồi nhờ bộ giải l−ợng tử vμ biến đổi DCT ng−ợc (IDCT).
♦ Nếu ảnh B, P (mã hóa Inter): sử dụng bộ tạo dự báo Inter có bù chuyển động.
Bộ tạo dự báo nμy hoạt động nh− sau: [1]
• Chuyển động của các MB đ−ợc tính toán nhờ bộ −ớc l−ợng chuyển động theo các thuật toán Blocking Matching. Kết quả cho vecto chuyển động
Hình 2.9: Sơ đồ khối quá trình mã hoá MPEG-1
4:2:2
4:2:0
+
S
DCT
Lượng tử hoá
Mã hoá entropy
Trộn
KĐ
đệm
Giải lượng tử hoá
IDCT
S
ảnh so sánh
ảnh dự đoán
Xác định vector chuyển động
Bảng lượng tử
Điều khiển tốc độ bit
Video
Video nén
+
-
+
Vector chuyển động
Điều khiển nhóm ảnh
• Vecto chuyển động nμy đ−ợc đ−a đến khối dự báo có bù chuyển động để tạo giá trị dự báo có bù chuyển động.
• Do quá trình −ớc l−ợng chuyển động cần so sánh giữa khung hiện hμnh với khung quá khứ (ảnh P) hoặc với cả khung quá khứ lẫn t−ơng lai (ảnh
B) nên cần có hai bộ l−u trữ ảnh.
♦ Sai số giữa MB dự báo vμ hiện hμnh đ−ợc biến đổi DCT, l−ợng tử hóa, mã hóa VLC rồi đ−a tới bộ nhớ đệm. Đầu ra bộ nhớ đệm lμ dòng bit đã đ−ợc mã hóa vμ có tốc độ ổn định.
♦ Tham số l−ợng tử, thông tin phân loại Inter/Intra vμ Vecto chuyển động sẽ đ−ợc ghép kênh với thông tin ảnh đ−a tới bên thu phục vụ cho quá trình tạo dự báo vμ giải mã khôi phục ảnh.
Nhớ đệm
Giải mã entropy
Giải lượng tử hoá
Biến đổi DCT ngược
S
Nhớ
ảnh
Dự báo
ảnh
Số liệu
điều khiển
Video
Hình 2.10: Sơ đồ bộ giải mã MPEG-1
Trong dòng bit truyền đi từ bên phát sẽ có thông tin ảnh gốc cũng nh− các tham số quy định b−ớc l−ợng tử vμ vecto chuyển động. Vecto chuyển động nμy đ−ợc bên thu sử dụng để tạo dự báo có bù chuyển động t−ơng tự nh− phía phát.
Giá trị sai số dự báo từ bên thu sau khi giải l−ợng tử vμ biến đổi DCT ng−ợc đ−ợc cộng với giá trị dự báo. Kết quả thu đ−ợc ảnh cần hồi phục.
2.3.2. Nén tín hiệu video theo MPEG-2
2.3.2.1. Tiêu chuẩn nén video MPEG-2
Tiêu chuẩn MPEG-2 còn đ−ợc gọi lμ ISO/IEC 13818 lμ sự phát triển tiếp theo của MPEG-1 ứng dụng cho độ phân giải tiêu chuẩn của truyền hình do CCIR- 601 qui định.
MPEG 2 gồm 4 phần:
Phần 1: Hệ thống (ISO/IEC 13818-1): xác định cấu trúc ghép kênh audio, video vμ cung cấp đồng bộ thời gian thực.
Phần 2: Video (ISO/IEC 13828-2): xác định những thμnh phần mã hóa đại diện cho dữ liệu video vμ phân loại xử lý giải mã để khôi phục lại khung hình ảnh.
Phần 3: Audio (ISO/IEC 13818-3): mã hóa vμ giải mã dữ liệu âm thanh.
Phần 4: Biểu diễn (ISO/IEC 13818-3): định nghĩa quá trình kiểm tra các yêu cầu của MPEG-2 .
So với MPEG-1, MPEG-2 có nhiều cải thiện, ví dụ về kích th−ớc ảnh vμ độ phân giải ảnh, tốc độ bit tối đa, tính phục hồi lỗi, khả năng co giãn dòng bit. Khả năng co giãn dòng bit của MPEG-2 cho phép khả năng giải mã một phần dòng bit mã hóa để nhận đ−ợc ảnh khôi phục có chất l−ợng tuỳ thuộc mức độ yêu cầu.
Sau đây lμ một số đặc điểm chủ yếu của tiêu chuẩn nμy :
♦ Hỗ trợ nhiều dạng thức video, đặc biệt lμ các dạng thức video độ phân giải không gian cao, dạng thức video xen kẽ của truyền hình.
♦ Cú pháp dòng bit MPEG-2 lμ sự mở rộng của dòng bit MPEG-1.
♦ Nén video MPEG-2 t−ơng hợp với nén video MPEG-1. Đ−ợc thể hiện qua 4 hình thức t−ơng hợp.
∗ T−ơng hợp thuận: bộ giải mã MPEG-2 có khả năng giải mã dòng bit (hoặc một phần dòng bit MPEG-1).
∗ T−ơng hợp ng−ợc: bộ giải mã MPEG-1 có khả năng giải mã đ−ợc một phần dòng bit MPEG-2.
∗ T−ơng hợp lên: bộ giải mã độ phân giải cao có khả năng giải mã đ−ợc dòng bit của bộ mã hoá có độ phân giải thấp.
∗ T−ơng hợp xuống: bộ giải mã độ phân giải thấp có thể giải mã đ−ợc một phần dòng bit của bộ mã hóa độ phân giải cao.
♦ MPEG-2 hỗ trợ khả năng co giãn (scalability): co giãn không gian, co giãn SNR (Signal to Noise Ratio), co giãn phân chia số liệu...
♦ Ngoμi ra còn có nhiều cải tiến khác trong MPEG-2 bao gồm:
∗ Cho phép nhiều cấu trúc lấy mẫu: 4:4:4, 4:2:2 vμ 4:2:0.
∗ Hệ số DC đ−ợc mã hóa với độ chính xác đặc biệt.
∗ Bảng l−ợng tử riêng biệt cho các thμnh phần chói vμ mμu nên lợi dụng đ−ợc đặc điểm của mắt ng−ời ít nhạy cảm hơn với tín hiệu mμu.
∗ Cho phép cả hai dạng quét: quét xen kẽ vμ quét liên tục.
∗ Có khả năng hồi phục lỗi.
♦ Cú pháp đầy đủ của MPEG-2 đ−ợc thể hiện qua các tập con gọi lμ profile, phù hợp với các lĩnh vực áp dụng. Mỗi profile lại bao gồm từ 1 đến 4 mức độ hạn chế về độ phân giải không gian, tốc độ bit.
2.3.2.2. Cấu trúc dòng bit video MPEG-2
Dòng bit MPEG-2 về cơ bản t−ơng hợp với MPEG-1, tức lμ cũng gồm cấu trúc 6 lớp nh− đã trình bμy trong mục 2.3.1.1
Tên gọi vμ chức năng các lớp đ−ợc liệt kê lại nh− sau:
Lớp
Chức năng
Lớp chuỗi (Sequence Layer)
Lớp nhóm ảnh (GOP Layer)
Lớp ảnh (Picture Layer)
Lớp lát (Slice Layer)
Lớp Macro Block (MB Layer)
Lớp khối (Block Layer)
Đơn vị nội dung
Đơn vị truy nhập ngẫu nhiên dòng video mã hóa.
Đơn vị mã hóa cơ bản
Đơn vị tái đồng bộ
Đơn vị bù chuyển động
Đơn vị chuyển đổi DCT
Bảng 3: Dạng lớp của cú pháp dòng bit MPEG-2
∗ Lớp chuỗi lμ đại diện mã hóa cho một chuỗi ảnh (Video Sequence).
∗ Lớp nhóm ảnh cung cấp điểm truy cập ngẫu nhiên. ảnh bắt đầu của chuỗi bao giờ cũng lμ một ảnh I. ảnh I nμy cung cấp điểm truy cập vμo dòng bit mã hóa.
∗ Lớp lát có chức năng hồi phục đồng bộ. Khi dòng bit có lỗi, bộ giải mã có thể bỏ qua slice có lỗi vμ bắt đầu bằng một slice mới. Mỗi lát chứa một hoặc một số MB.
∗ Mỗi macro block (MB) lμ một đơn vị đ−ợc −ớc l−ợng chuyển động vμ có vecto chuyển động riêng trong phần header của nó.
∗ Lớp khối lμ lớp thấp nhất. Mỗi khối lμ một đơn vị DCT gồm 64 hệ số (một hệ số DC vμ 63 hệ số AC nh− trình bμy trong mục 2.2.2: phép chuyển đổi cosine rời rạc) của khối ảnh I hoặc khối sai số dự báo (ảnh P, B).
So với MPEG-1, cú pháp dòng bit MPEG-2 có thêm một số chức năng mở rộng. Do đó có 2 h−ớng đi trong dòng bit MPEG-2 nh− hình vẽd−ới đây: hoặc theo quy trình MPEG-1 hoặc theo các chức năng mở rộng riêng của MPEG-2.
Sequence header
(đầu đề chuỗi)
MPEG-1
ISO/IEC 11172-2
Dòng bit
Extended Sequence
(chuỗi mở rộng)
Hình 2.11: Cú pháp dòng bít MPEG-2
2.3.2.3. Khả năng co giãn của MPEG-2
Một trong những đặc điểm quan trọng nhất của MPEG-2 lμ sự phù hợp với nhiều ứng dụng video. Có thể sử dụng MPEG-2 cho phân phối truyền hình tiêu chuẩn (Standard Television), truyền hình phân giải cao (HDTV: High Definition Television) hoặc cho truyền dẫn tín hiệu truyền hình thông qua các mạng truyền thông.
Tính co giãn của dòng bít MPEG-2 lμ khả năng giải mã đ−ợc một phần dòng bít MPEG-2 độc lập với phần còn lại của dòng bít đó nhằm khôi phục video với chất l−ợng hạn chế ( hạn chế độ phân giải không gian, độ phân giải thời gian hoặc hạn chế về SNR...). Dựa theo tính co giãn, dòng bít đ−ợc phân thμnh hai hay nhiều lớp. Tập con nhỏ nhất của cú pháp dòng bít có thể giải mã một cách độc lập đ−ợc gọi lμ lớp cơ bản. Các lớp còn lại đ−ợc gọi lμ các lớp nâng cao. Có nhiều loại co giãn khác nhau nh−:
∗ Co giãn không gian: Dòng bít gồm hai hay nhiều lớp video có độ phân giải không gian khác nhau.
∗ Co giãn SNR: dòng bít gồm hai hay nhiều lớp video có cùng độ phân giải không gian nh−ng tỉ số tín hiệu trên nhiễu SNR lμ khác nhau.
∗ Co giãn thời gian:dòng bít gồm hai hay nhiều lớp video có cùng độ phân giải không gian nh−ng có độ phân giải thời gian khác nhau.
∗ Co giãn phân chia số liệu: dòng bít video đ−ợc chia lμm hai phần : phần −u tiên cao (lớp cơ bản) gồm các hệ số DCT tần số thấp, phần −u tiên thấp (lớp nâng cao) gồm các hệ số DCT tần số cao.
∗ Co giãn phân chia số liệu chính lμ một dạng cơ bản của co giãn tần số.
Tiêu chuẩn MPEG-2 đã qui định chính thức hai loại co giãn: co giãn không gian vμ co giãn SNR. Các loại co giãn khác chỉ mới ở dạng dự thảo.
2.3.2.4. MPEG-2: Profile vμ Level
Phạm vi ứng dụng của MPEG-2 rất rộng. Mỗi ứng dụng đòi hỏi mức độ phức tạp khác nhau. Bởi vậy, MPEG-2 định nghĩa các mức (level) vμ các tập con (profile) phù hợp cho từng lĩnh vực áp dụng. Profile xác định cú pháp dòng bit vμ level xác định các tham số hạn chế độ phân giải không gian, tốc độ bit.
Có 4 mức: low (thấp), main (chính), high-1440 (cao-1440) vμ high (cao). Kích cỡ ảnh quy định bởi 4 mức t−ơng ứng sau:
Level
Cỡ khung
Low
Main
High-1440
High
352x288 (bằng 1/4 cỡ ảnh TV chuẩn)
720x576 (cỡ ảnh TV chuẩn)
1440x1152
960x576 hoặc 1920x1152
Bảng 4 : Mức ảnh trong MPEG-2
Có 5 profile lμ: Simple (đơn giản), Main (chính), SNR scalable (co giãn SNR), Spatial scalable (có khả năng co giãn không gian) vμ High profile. Tổng cộng có 12 tổ hợp profile, level. Trong đó:
♦ MP @ ML (Main profile @ Main level):
Lấy mẫu 4:2:0
Độ phân giải: 720*576
Tốc độ bit: 15Mbps
Dạng ảnh: I, P, B
ứng dụng vμo việc số hóa truyền hình tiêu chuẩn (Standard television).
♦ MP @ HL (Main profile @ High level):
Lấy mẫu 4:2:0
Độ phân giải: 1920x1152
Tốc độ bit: 80Mbps
Dạng ảnh sử dụng: I, P, B
ứng dụng vμo HDTV (truyền hình số có độ phân giải cao).
♦ Sau nμy có bổ sung 4:2:2P @ ML (4:2:2 profile @ Main level) áp dụng vμo lĩnh vực sản xuất ch−ơng trình truyền hình (studio) vì các lý do sau:
∗ Chất l−ợng cao: độ phân giải mμu tốt hơn so với MP @ ML (lấy mẫu 4:2:0), chất l−ợng tổng quát cao hơn do sử dụng tốc độ bit lớn hơn.
∗ Có khả năng sao chép nhiều lần mμ vẫn đảm bảo chất l−ợng y nh−._.
Các file đính kèm theo tài liệu này:
- 31762.doc