Khảo sát âm lượng (loudness) các kênh truyền
hình tại Việt Nam
Nguyễn Hữu Phong∗, Nguyễn Đức Hoàng∗, Đỗ Thế Thiện∗, Võ Nguyễn Quốc Bảo†, và Huỳnh Hữu Tuệ‡
∗ Trung tâm Nghiên cứu Ứng dụng Khoa học Kỹ thuật Truyền hình
Email: {phongnguyen; hoangnd; dothethien}@vtv.gov.vn
† Phòng Thí Nghiệm Thông Tin Vô Tuyến
Học Viện Công Nghệ Bưu Chính Viễn Thông Cơ Sở TP. Hồ Chí Minh
Email: baovnq@ptithcm.edu.vn
‡ Khoa Điện Tử - Viễn Thông, Đại Học Quốc Tế, Đại Học Quốc Gia TP.HCM
Email: hhtue@hcmiu.edu
8 trang |
Chia sẻ: huongnhu95 | Lượt xem: 488 | Lượt tải: 0
Tóm tắt tài liệu Khảo sát âm lượng (loudness) các kênh truyền hình tại Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
.vn
Tóm tắt nội dung—Âm lượng (loudness) của các kênh
truyền hình có thể thay đổi đột ngột giữa các thể loại
chương trình khác nhau trong cùng một kênh, hoặc khi
chuyển giữa các kênh với nhau. Bài báo này nhằm khảo sát
sự thay đổi mức loudness của một số kênh chương trình
được lấy mẫu từ các phương thức phân phối quảng bá khác
nhau: mặt đất, vệ tinh và cáp tại Việt Nam. Mức loudness
của cả chương trình truyền hình số và analog được lấy
mẫu và đo đạc. Một công cụ đo loudness được phát triển
trong Matlab dựa trên khuyến nghị ITU-R BS.1770-2 và
khuyến nghị EBU R128 dùng để đo loudness các file audio
2 kênh. Dữ liệu thu thập được sẽ tiến hành đo và phân
tích mức loudness. Cuối cùng giải pháp chuẩn hóa loudness
theo EBU R128 nhằm đạt mức cân bằng loudness cho các
chương trình truyền hình tại Việt Nam được đề xuất.
Index Terms—Loudness, ITU-R BS.1770-2, EBU R128,
TV, Volume control.
I. GIỚI THIỆU
Âm thanh đóng vai trò cực kỳ quan trọng trong truyền
hình. Trước đây, khi truyền hình còn phát đen trắng, sóng
yếu, ở những khu vực xa khi xem tín hiệu lúc được lúc
mất, âm thanh bị nhiễu nhiều khi át cả âm thanh chính.
Cùng với sự phát triển của công nghệ, ngành truyền hình
tại Việt Nam cũng đã phát triển nhanh chóng và ngày
càng mang đến cho người xem nhiều chương trình chất
lượng về nội dung bao gồm cả chất lượng hình ảnh và
âm thanh. Dù đã được nâng cao về chất lượng âm thanh
thì cho đến gần đây, người xem vẫn còn nhiều điều chưa
hài lòng khi mà âm thanh quảng cáo thường đột nhiên
to hơn nhiều so với âm thanh chương trình đang xem,
hoặc khi chuyển kênh truyền hình thì phải điều chỉnh
lại âm lượng giữa các kênh. Nghĩa là không có cách nào
để đo được âm lượng của âm thanh từ phía nhà cung
cấp cho tới phía người xem. Việc chuẩn hóa âm thanh
theo mức đỉnh (peak normalisation) không phải là cách
thức để xác định âm lượng/độ ồn (loundness) của tín
hiệu âm thanh.
Loudness (âm lượng) có thể hiểu đơn giản là cách
mà người nghe cảm nhận được biên độ âm thanh hay
là thuộc tính về độ nhạy cảm của tai người nghe khi
chuyển từ mức im lặng đến mức ồn của âm thanh [1].
Loudness đo cảm nhận của tai người nghe về âm
thanh, khác với mức áp lực âm thanh (sound pressure
level - SPL) chỉ mô tả cường độ âm thanh theo thang
dB. Loudness chịu ảnh hưởng bởi nhiều thông số hơn so
với SPL, bao gồm tần số, băng thông và độ lâu của âm
thanh [2]. Trong suốt quá trình xem TV (Television),
sự thay đổi loudness có thể gây khó chịu cho người
xem khi họ phải thường xuyên dùng Volume control
(điều khiển từ xa) để điều chỉnh lại mức loudness. Ví
dụ như khi thực hiện chuyển kênh chương trình, hoặc
sự thay đổi âm lượng đột ngột giữa các chương trình
tin tức và chương trình quảng cáo. Nguyên nhân là do
các nhà quảng bá đã không thực hiện điều chỉnh mức
loudness thống nhất trước khi phát sóng, các kỹ thuật
nén dải động âm thanh cũng góp phần gây ra sự nhảy
mức loudness này, và phương pháp chuẩn hóa âm thanh
theo mức đỉnh trước đây không giải quyết triệt để vấn
đề nhảy mức âm lượng. Tiêu chuẩn ITU-R BS.645-2
khuyến nghị chuẩn hóa theo mức đỉnh – 9 dBFS (decibel
to full scale) [3] dùng máy đo PPM (Peak Programme
Meter) hiện nay vẫn còn nhiều quốc gia sử dụng, trong
đó có Việt Nam.
Gần đây, vấn đề nhảy âm lượng đã được giải quyết
thông qua khuyến nghị EBU R128 của EBU [4]. Khuyến
nghị này được xem như một chuẩn mở cho việc cân bằng
âm lượng của các chương trình audio theo như cách mà
Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014)
ISBN: 978-604-67-0349-5 358
người nghe/xem cảm nhận được âm lượng thực tế. Việc
đưa ra khuyến cáo này đánh dấu một trong những thay
đổi cơ bản nhất trong lịch sử audio của ngành phát thanh
truyền hình vì nó đã giải quyết được sự tăng vọt âm
lượng audio trong các chương trình, giữa các chương
trình và giữa các kênh truyền hình. EBU R128 được
phát triển kế thừa tiêu chuẩn ITU-R BS.1770-2: “Thuật
toán đo âm lượng chương trình và mức đỉnh thực của
tín hiệu audio” [5]. Khuyến nghị ITU-R BS.1770-2 phát
triển thuật toán đo âm lượng chương trình (programme
loudness) cho các file audio dạng mono, stereo và âm
thanh đa kênh 5.1. Khuyến nghị ITU-R BS.1770-2 lần
đầu tiên đưa ra khái niệm mức đỉnh thực (true-peak
- TP) của tín hiệu audio. Mức TP được đo với máy đo
đỉnh thực (true-peak meter hay oversampling PPM), đơn
vị đo là dBTP (dB relative to digital full scale). dBTP
được đo trong miền thời gian liên tục, tần số lấy mẫu ít
nhất gấp 4 lần tần số tín hiệu audio đầu vào. Khác với
đo đỉnh mẫu dBFS sử dụng máy đo PPM hay QPPM
(Quasi-Peak Programme Meter), và đo giá trị trong miền
rời rạc. Giá trị mức đỉnh thực luôn lớn hơn giá trị đo bởi
dBFS, tiệm cận với mức đỉnh thực của tín hiệu audio vì
vậy máy đo đỉnh thực dự đoán chính xác hơn mức đỉnh
tín hiệu audio, hạn chế vấn đề méo tín hiệu (clipping)
xảy ra khi chuyển audio từ số sang tương tự (D/A).
Hình 1 minh họa so sánh giữa mức đỉnh thực dBTP
và mức đỉnh mẫu dBFS, máy đo đỉnh thực đọc tiệm
cận mức đỉnh thực của tín hiệu audio, là mức đỉnh
lớn nhất đo trong miền thời gian liên tục, còn máy đo
PPM/QPPM đọc mức đỉnh dBFS tại các vị trí lấy mẫu
rời rạc, vì vậy dBFS có sai số lớn so với mức đỉnh của
tín hiệu audio. Hiện nay phần lớn các đài phát thanh-
truyền hình tại Châu Âu đã chuyển qua sử dụng máy đo
đỉnh thực và tích hợp khuyến nghị EBU R128 vào dòng
làm việc (workflow) truyền hình.
Khuyến nghị EBU R128 được nhóm EBU PLOUD
phát triển, ngoài giá trị đo âm lượng tích hợp/âm lượng
chương trình (programme loudness) dùng đo tích hợp
trong một thời gian dài hay đo toàn bộ chương trình,
với đơn vị đo là LUFS (Loudness Units Full Scale)
hay LKFS (Loudness K-weighted Full Scale theo cách
gọi của ITU-R BS.1770), EBU R128 còn định nghĩa
thêm đo loudness theo khoảng thời gian ngắn ’S’ (short-
term loudness), đo loudness tức thời ’M’ (Momentary
loudness) để thực hiện đo và giám sát loudness các
chương trình truyền hình trực tiếp. Loudness ’S’ đo các
mẫu audio dùng cửa sổ trượt 3s, loudness ’M’ đo các
mẫu audio dùng cửa sổ trượt 400ms. Để đo programme
loudness (hay intergrated loudness: ‘I’), EBU R128 dùng
cơ chế đo gating với mức ngưỡng -10 LU (Loudness
7KӡLJLDQ
G%73G%)6 7UXHSHDNÿӑFEӣLPi\ÿR
2YHUVDPSOLQJ730HWHU
VDPSOHSHDNÿӑFEӣLPi\
ÿR330RU4330
Hình 1. So sánh dBTP và dBFS.
Hình 2. LRA khác nhau tùy theo môi trường phát lại [6].
Unit). Cơ chế gating sẽ bỏ qua không đo những phần
âm thanh có âm lượng dưới mức ngưỡng (xem là nhiễu),
vì vậy kết quả đo âm lượng tích hợp của toàn bộ file sẽ
chính xác. Cơ chế gating trình bày chi tiết trong tài liệu
ITU-R BS.1770-2. Mức đỉnh thực được đo theo thuật
toán trình bày trong Phụ Lục 2 của ITU-R BS.1770-2.
EBU R128 giới hạn mức đỉnh thực tối đa cho các tín
hiệu audio là –1dBTP.
Ngoài ra, EBU R128 còn định nghĩa thêm thông số
dải âm lượng LRA (loudness range), đơn vị đo LU, 1LU
tương ứng 1dB. LRA mô tả sự phân bố của âm lượng
chương trình từ mức yên lặng đến mức ồn nhất, LRA đo
bằng phương pháp phân phối thống kê. LRA được định
nghĩa bởi sự khác nhau giữa ước lượng 10% mức thấp
và 95% mức cao của phân phối. Phép đo LRA tương tự
như đo IQR (Interquartile Range) trong phân phối thống
kê. LRA tương tự như thông số dải động DRC (Dynamic
Range Compressor) của tín hiệu audio. Thông số LRA
phụ thuộc vào nền tảng phân phối (ví dụ: truyền dẫn
qua mạng cáp, mặt đất, vệ tinh), đối tượng người nghe
(ví dụ: nhỏ tuổi, trung niên, người già) hay môi trường
phát lại (ví dụ: nghe ở trong xe hơi, trong rạp hát, trong
nhà) xem Hình 2.
Để đạt cân bằng loudness giữa các kênh chương trình
Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014)
ISBN: 978-604-67-0349-5 359
truyền hình (ví dụ kênh VTV1 và VTV3), hay giữa các
nội dung chương trình (quảng cáo, tin tức, thời sự) phát
trong cùng một kênh sóng. EBU R128 đưa ra khuyến
nghị chuẩn hóa âm lượng trong các khâu sản xuất, hậu
kỳ, truyền dẫn và phát sóng. Cụ thể là đối với một
tín hiệu audio, các thông số sau cần phải chuẩn hóa:
Loudness “I” chuẩn hóa về mức -23 LUFS, với các
chương trình truyền hình trực tiếp thông số này có thể
chấp nhận trong giới hạn:- 23 LUFS ± 1 LU. Mức đỉnh
thực tín hiệu audio phải thõa mức giới hạn nhỏ hơn hoặc
bằng- 1 dBTP. Thông số LRA tùy thuộc vào nền tảng
truyền dẫn và môi trường phát lại. Các thông số này
được đo tham chiếu đến tín hiệu audio baseband dạng
PCM không nén. Đo dùng phần mềm hay máy đo tương
thích với tiêu chuẩn EBU R128 và ITU-R BS.1770-2.
Việc chuẩn hóa âm lượng theo EBU R128 sẽ thống
nhất mức âm lượng, người xem truyền hình sẽ không
còn phải dùng thiết bị điều khiển âm lượng để điều
chỉnh lại mức âm lượng mỗi khi họ chuyển kênh TV,
hay khi xuất hiện chương trình quảng cáo có âm lượng
tăng vọt, gây khó chịu cho người xem. Giải quyết được
bài toán mất cân bằng âm lượng trong truyền hình, mà
phương pháp chuẩn hóa theo mức đỉnh trước đây không
giải quyết triệt để.
Hình 3 so sánh sự khác nhau giữa chuẩn hóa theo mức
đỉnh và chuẩn hóa loudness. Với mức đỉnh, việc chuẩn
hóa của tín hiệu audio được dựa trên mức cho phép tối
đa (PML – Permitted Maximum Level, ví dụ là mức
-9 dBFS) vẫn là cách xử lý mức audio được chấp nhận
phổ biến nhằm thống nhất chung mức đỉnh cho phép
của các chương trình. Tuy nhiên, với các mức âm lượng
thì có đặc thù là độ biến thiên lớn, và độ biến thiên này
phụ thuộc vào mức độ nén dải động của tín hiệu. Việc
chuẩn hóa âm lượng nhằm đạt kết quả âm lượng trung
bình cân bằng giữa các chương trình dù mức đỉnh thay
đổi tùy theo nội dung (dựa trên các yếu tố về nghệ thuật
và kỹ thuật). Với chuẩn hóa âm lượng, khi dải âm lượng
của một chương trình nằm trong giới hạn chấp nhận của
người nghe thì người nghe có thể hài lòng với mức âm
lượng trung bình thống nhất cho tất cả các chương trình,
họ không cần phải dùng điều khiển từ xa để điều chỉnh
âm lượng nữa.
Phần còn lại của bài báo được tổ chức như sau, Phần II
trình bày thuật toán đo loudness theo ITU-R BS.1770-2.
Trong Phần III, chúng tôi trình bày cách thức thu thập
mẫu đo. Phần IV và Phần V là kết quả đo đạc thực
tế với Phần IV là kết quả đo trước khi chuẩn hóa và
Phần V trình bày kết quả sau khi chuẩn hóa loudness.
Cuối cùng, Phần VI đưa ra một số kết luận sau khi khảo
sát.
Hình 3. Chuẩn hóa mức đỉnh so với chuẩn hóa âm lượng [6].
%ӝOӑF.
%ӝOӑF.
%ӝOӑF.
%ӝOӑF.
%ӝOӑF. 0HDQ6TXDUH
0HDQ6TXDUH
0HDQ6TXDUH
0HDQ6TXDUH
0HDQ6TXDUH *>
*Z
*&
*/6
*56
'd/E'/RJ .ӂ748Ҧ
;/
;5
;&
;/6
;56
</
<5
<&
</6
<56
=/
=5
=&
=/6
=56
Hình 4. Sơ đồ thuật toán đo audio loudness đa kênh [5].
II. THUẬT TOÁN ĐO LOUDNESS THEO ITU-R
BS.1770-2
Thuật toán đo âm lượng được xây dựng tổng quát
cho tín hiệu audio đa kênh (5.1 kênh). Sơ đồ khối trong
Hình 4 trình bày kèm các nhãn ký hiệu theo các khối
nhằm mô tả thứ tự xử lý của thuật toán. Theo đó, có 5
kênh audio ở ngõ vào left (L), centre (C), right (R), left
surround (LS) và right surround (RS), trường hợp chỉ
gồm một kênh audio (mono) hoặc stereo thì tương ứng
chỉ có ngõ vào XL, hoặc/và XR ở ngõ vào. Kênh audio
tần số thấp (Low frequency effect - LFE) được bỏ qua
không đo trong giải thuật. Giải thuật thực hiện qua bốn
bước như sau:
• Bước 1: Gán trọng số K theo tần số
Trọng số K áp dụng bộ lọc K-filter (còn gọi là
pre-filter) hai tầng cho tín hiệu ngõ vào. Tầng thứ
nhất của bộ lọc pre-filter nâng hiệu ứng âm học
vùng tần số cao. Các hệ số bộ lọc dùng với tần số
lấy mẫu (sampling rate) của tín hiệu audio là 48
kHz [5], với các tần số lấy mẫu khác thì các hệ số
cần được tính toán và thiết kế lại. Để đơn giản, tín
hiệu audio lấy mẫu ở những tần số khác có thể lấy
mẫu lại ở tần số 48 kHz và dùng các hệ số bộ lọc
như khuyến cáo.
Tầng thứ 2 của bộ lọc K-filter là bộ lọc thông cao
(high-pass filter). Đường cong trọng số RLB của
tầng này được xác định bởi bộ lọc bậc 2 với các
Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014)
ISBN: 978-604-67-0349-5 360
hệ số cho trong [5, Table 2]. Tương tự, các hệ số
này cũng được sử dụng ứng với tần số lấy mẫu của
tín hiệu audio là 48 kHz, và phải tính lại các hệ số
khi sử dụng với tần số lấy mẫu khác.
• Bước 2: Tính toán trung bình bình phương mỗi
kênh
Năng lượng (hoặc trung bình bình phương) của tín
hiệu ở ngõ vào bộ lọc trong một khoảng thời gian
T được tính bởi công thức sau:
zi =
1
T
T∫
0
y2
i dt, (1)
với yi là tín hiệu ngõ vào đã được lọc từ bộ lọc pre-
filter ở Bước 1 và i ∈ I với I = [L, R, C, LS, RS]
là tập các kênh audio ngõ vào.
• Bước 3: Tổng trọng số các kênh
Khi tính tổng trọng số các kênh, chúng ta dùng
trọng số lớn hơn cho các kênh surround và bỏ
qua kênh LFE. Loudness theo đơn vị LKFS trong
khoảng thời gian T được định nghĩa bởi
LK = −0.691 + 10log10
∑
i
Gizi (2)
với Gi là các hệ số trọng số cho các kênh riêng.
• Bước 4: Cơ chế đo gating
Cơ chế đo gating dùng block 400ms, hệ số chồng
lấp 75%. Để đo loudness dùng cơ chế đo gating,
khoảng thời gian T được chia theo các khoảng
block chồng lấp (gọi là gating block là một khoảng
thời gian chứa các mẫu audio kế tiếp nhau có giá trị
Tg = 400ms). Hệ số chồng lấp (overlap) của mỗi
gating block là 75% của khoảng thời gian gating
block. Năng lượng hoặc trung bình bình phương
của gating block thứ j của kênh ngõ vào thứ i trong
khoảng T được tính bởi
zij =
1
Tg
Tgj(Step+1)∫
TgjStep
y2
i dt (3)
với Step = 1 − Overlap và j ∈{
0, 1, 2, . . . ,
T−Tg
TgStep
}
. Khi đó, loudness của
gating block thứ j được định nghĩa bởi
Lj = −0.691 + 10log10
∑
i
Gizij (4)
với ngưỡng gating, Γ, sẽ có một tập các gating
block ký hiệu Jg = {j : lj > Γ}, nghĩa là tập các
gating block có loudness lớn hơn giá trị ngưỡng
gating Γ. Số lượng các thành phần trong Jg ký
Bảng I
TRỌNG SỐ CHO CÁC KÊNH AUDIO.
Kênh Trọng số Gi
Kênh trái (L) 1.0 (0 dB)
Kênh phải (R) 1.0 (0 dB)
Kênh trung tâm (C) 1.0 (0 dB)
Kênh surround trái (LS) 1.41 (1.5 dB)
Kênh surround phải (RS) 1.41 (1.5 dB)
hiệu là |Jg|. Giá trị gated loudness, LKG, theo đơn
vị LKFS đo trong khoảng T được định nghĩa:
LKG = −0.691 + 10log10
∑
i
Gi
⎛
⎝ 1
|Jg|
∑
Jg
zij
⎞
⎠ .
(5)
Lúc này, một quá trình xử lý hai bước được thực
hiện để đo gating dựa trên giá trị ngưỡng tuyệt đối
và tương đối. Ngưỡng tương đối theo đơn vị LKFS
được tính toán dựa trên ngưỡng tuyệt đối Γa = −70
LKFS theo công thức sau:
Γr = −0.691 + 10log10
∑
i
Gi .
⎛
⎝ 1
Jg
.
∑
Jg
zij
⎞
⎠ − 10
(6)
với Jg = {j : lj > Γa} và Γa = −70 LKFS.
Giá trị gated loudness, LKG theo LKFS, đo dùng
ngưỡng Γr được tính như sau:
LKG = −0.691 + 10log10
⎡
⎣∑
i
Gi
⎛
⎝ 1
|Jg|
∑
Jg
zij
⎞
⎠
⎤
⎦ ,
(7)
trong đó Jg = {j : lj > Γr}.
Ở đây, đơn vị LKFS tương đương decibel, nghĩa là
mức tín hiệu gia tăng 1 dB thì loudness gia tăng
tương ứng 1 LKFS. Một ví dụ minh họa cho kết
quả khi thực hiện giải thuật là: nếu các ngõ vào left,
center, hoặc right là tín hiệu sin 0 dBFS 1 kHz thì
kết quả đo loudness là -3.01 LKFS.
III. PHƯƠNG PHÁP THU THẬP MẪU ĐO
Các mẫu đo được lấy từ các phương thức truyền dẫn
khác nhau: vệ tinh, mạng cáp, truyền hình mặt đất. Các
kênh được lấy mẫu bao gồm các kênh truyền hình của
Đài truyền hình Việt Nam (VTV), các kênh truyền hình
trong nước khác như: Công ty cổ phần truyền thông
đa phương tiện (VTC), Công ty truyền hình cáp Saigon
Tourist (SCTV), và các kênh truyền hình nước ngoài,
ví dụ như BBC, KBS, Arirang, Australia. Lấy mẫu cho
Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014)
ISBN: 978-604-67-0349-5 361
cả truyền hình phát quảng bá analog và số. Các mẫu
đo được thu thập và xử lý trong suốt thời gian từ tháng
04/2013-04/2014.
A. Cách thức lấy mẫu
1) Lấy mẫu theo thể loại chương trình phát sóng:
Các thể loại chương trình được lấy mẫu: chọn
một số chương trình điển hình sau: quảng cáo,
thời sự, phim truyện, gameshow, thể thao, ca nhạc,
thời tiết, phóng sự, tin tức và các thể loại khác.
Thời lượng cho mỗi mẫu từ 2-3 phút. Mỗi thể loại
chương trình lấy 4 đến 10 mẫu.
2) Lấy mẫu theo kênh phát sóng: Thời lượng cho mỗi
mẫu là 3 phút. Các mẫu được lấy từ các kênh ứng
với khoảng thời gian liên tiếp nhau để đánh giá
nhảy mức âm lượng khi chuyển kênh truyền hình.
B. Hệ thống lấy mẫu
1) Thu chương trình từ truyền hình quảng bá mặt
đất: Dùng card DVB-T Hauppauge WinTV-HVR-
1300 kết nối trực tiếp với anten truyền hình Yagi
UHF/VHF và máy vi tính thông qua cáp TV và
khe cắm. Dùng phần mềm Win TV 7 để capture
chương trình từ các kênh phát sóng và ghi lại các
kênh chương trình, card có khả năng thu tín hiệu
truyền hình analog và DVB-T. Mẫu được capture
là các dòng TS có định dạng MPEG-2. Sau đó
dùng phần mềm NxTSA tách dòng TS thành các
file video và audio có định dạng MPG, tiếp tục
dùng phần mềm chuyển đổi file audio định dạng
MPG thành file audio có định dạng WAV để đưa
vào xử lý (đo và chỉnh) loudness bằng phần mềm
Matlab.
2) Thu chương trình từ vệ tinh: Dùng card DTA 140
để gắn vào máy tính và phần mềm DtGrabber+
để capture chương trình từ vệ tinh tại tổng khống
chế (Head-End) của VTV9 (Trung tâm truyền hình
Việt Nam tại TP. Hồ Chí Minh.
Dùng phần mềm NxTSA để tách luồng (Transport
Stream - TS) gồm nhiều kênh thành các dòng TS
của các kênh riêng lẻ. Dùng phần mềm TOTAL
VIDEO CONVERTER chuyển đổi các file audio
có định dạng MPG của các kênh đó thành định
dạng WAV để xử lý.
3) Thu chương trình từ mạng truyền hình cáp SCTV:
Dùng đầu thu Set-Top-Box (STB) A800 để thu
chương trình các kênh truyền hình trong nước
và nước ngoài từ hệ thống truyền hình cáp của
SCTV. Các kênh capture là: VTV1, VTV2, VTV3,
VTV4, VTV6, Arirang, KBS World HD, BBC,
Australia. Mẫu được lấy từ các kênh truyền hình
0 2000 4000 6000 8000 10000
í70
í60
í50
í40
í30
í20
í10
0
VTV6í3105í0957
LU
FS
Thoi gian
Hình 6. Minh họa kết quả đo loudness với cửa sổ trượt 3s.
nêu trên. Thời lượng mỗi mẫu từ 1 phút 30 giây
đến 2 phút. Thời gian lấy mẫu là ngẫu nhiên trong
hai ngày (ngày 08 và 09/10/2013). Mẫu được lấy
tiếp tục chuyển thành định dạng WAV để đo các
thông số loudness.
Để đo loudness và chuẩn hóa loudness, chúng tôi xây
dựng một công cụ trong Matlab. Thuật toán có thể đo và
xử lý file audio stereo 2.0, đo loudness, LRA, true-peak
và chuẩn hóa các thông số loudness và true-peak theo
EBU-R 128. Để kiểm chứng sự tương thích của thuật
toán, trước khi tiến hành đo các mẫu thực, chúng tôi
tiến hành đo các file audio mẫu cung cấp từ trang web
EBU trong [7], với sai số của các giá trị loundess, LRA
và dBTP trong giới hạn ±0.1 , giới hạn chấp nhận của
các máy đo tương thích với chuẩn EBU R128. Hình 5
trình bày quy trình thu thập và xử lý các mẫu đo, trước
tiên dữ liệu có thể xuất phát từ: Mạng truyền hình vệ
tinh, mặt đất hay truyền hình cáp. Hệ thống thu thập dữ
liệu bao gồm phần cứng và phần mềm để ghi lại các
dòng chương trình dạng TS cho các xử lý về sau. Tiếp
theo dùng phần mềm chuyên dụng để tách riêng các
dòng video và audio. Các file audio dạng WAV sẽ được
đo và chuẩn hóa loudness riêng, sau đó ghép audio và
video thành file hoàn chỉnh, lưu các file video đã chuẩn
hóa các thông số loudness.
IV. KẾT QUẢ ĐO
Trong phần này, chúng tôi sẽ trình bày các kết quả đo
đạc trước khi chuẩn hóa. Bắt đầu từ Hình 6, chúng tôi
minh họa kết quả đo loudness của kênh VTV6, mẫu đo
ngày 31/05/2013 với thời gian lấy mẫu bắt đầu lúc 9h57,
âm lượng tích hợp của file này là -14 LUFS, lớn hơn 9
LUFS so với khuyến nghị EBU R 128 là -23 LUFS.
Trong Hình 7, chúng tôi trình bày kết quả đo loudness
trên cùng một kênh (kênh VTV3 của Đài Truyền hình
Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014)
ISBN: 978-604-67-0349-5 362
9ӋWLQK
PһWÿҩW
FiS
7RROÿRYj
FKXҭQKyD
ORXGQHVV3KҫQPӅPWiFKDXGLRYj
YLGHR
7KXWKұSOѭX
WUӳYjRKӋ
WKӕQJGzQJ76
3KҫQPӅP
JKpSDXGLRYj
YLGHR
/ѭXWUӳFiF
ILOHÿmFKXҭQ
KyDORXGQHVV
$XGLR
9LGHR
Hình 5. Quy trình thu thập và xử lý loudness dựa trên file.
1 2 3 4 5 6
í20
í15
í10
í5
0
Mau
lo
ud
ne
ss
[L
U
FS
]
Hình 7. Sự biến thiên loudness của các chương trình ca nhạc trên kênh
VTV3
Việt Nam) và trên cùng một chương trình (chương trình
ca nhạc), các mẫu đo được lấy vào tháng 04/2013 qua
hệ thống truyền hình số mặt đất DVB-T, thời gian của
mỗi mẫu là 2-3 phút. Kết quả cho thấy mức âm lượng
của các chương trình ca nhạc có mức biến động lớn,
chênh lệch 10 LUFS giữa mẫu đo 1 và mẫu 2.
Tiếp theo, chúng tôi khảo sát trên các kênh khác nhau
trong Hình. 8, minh họa kết quả đo loudness của 3 kênh
VTV1, VTV2, VTV3 được lấy mẫu vào 04/2013 vời thời
lượng 3 phút trong các khoảng thời gian liên tiếp nhau
theo thứ tự (8h10-8h13, 8h13-8h16, 8h16-8h19). Điều
này tương tự như khi người xem truyền hình đang muốn
chuyển kênh chương trình từ kênh VTV1 và VTV2 hay
VTV3. Mức âm lượng chênh lệch là 17 LUFS, với mức
này người nghe/xem sẽ cảm nhận được rất rõ sự khác
biệt của âm lượng khi chuyển kênh, âm lượng có thể tự
nhiên tăng đột ngột, gây khó chịu cho người xem và họ
phải dùng volume control điều chỉnh lại mức âm lượng.
Trong Hình 9, chúng tôi khảo sát ở các kênh khác
nhau giữa hai đài khác nhau. Kết quả đo các kênh từ hệ
í35
í30
í25
í20
í15
í10
í5
0
Kenh
Lo
ud
ne
ss
[L
U
FS
]
Loudness luc chuyen kenh chuong trinh
VTV1 (í17 LUFS)
VTV2 (í31 LUFS)
VTV3:í14 LUFS
Hình 8. Sự nhảy âm lượng lúc chuyển kênh chương trình VTV1 (8h10-
8h13), VTV2 (8h13-8h16), VTV3 (8h16-8h19).
1 2 3 4 5 6 7 8 9 10 11 12
í30
í25
í20
í15
í10
í5
0
Lo
ud
ne
ss
[L
U
FS
]
Mau do
Kenh SCTV4&13
Kenh VTC1&2
Hình 9. Loudness các kênh truyền hình cáp SCTV và kỹ thuật số
VTC.
thống truyền hình kỹ thuật số VTC và truyền hình cáp
SCTV. Các kênh lấy mẫu với thời gian 1 phút vào tháng
12/2013. Kênh SCTV (SCTV4 và SCTV13), kênh VTC
(VTC1 và VTC2) có sự chênh lệch âm lượng lớn nhất
Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014)
ISBN: 978-604-67-0349-5 363
1 2 3 4 5 6
í35
í30
í25
í20
í15
í10
í5
Mau do
LU
FS
The thao
Phim
Quang cao
Thoi su
Hình 10. Sự biến thiên âm lượng kênh VTV.
í35
í30
í25
í20
í15
í10
í5
Mau do
LU
FS
VTV3
Arirang
KBS
BBC
Australia
Hình 11. So sánh với các kênh nước ngoài.
14 LUFS, mức âm lượng các kênh không ổn định.
Hình 10 trình bày sự biến động âm lượng được lấy
mẫu theo thể loại chương trình phát sóng (tin tức, phim
thời sự, thể thao. . . ) của VTV. Kết quả cho thấy âm
lượng có độ vênh rất lớn, các mẫu có thời gian từ 2-3
phút, lấy mẫu vào tháng 04/2013, thời gian lấy mẫu là
các giờ trong ngày từ 9h-16h. Các chương trình quảng
cáo có mức âm lượng rất lớn so với các chương trình
khác, cao hơn 10-15 LUFS.
Hình 11 so sánh âm lượng kênh VTV3 so với các kênh
nước ngoài lấy mẫu vào tháng 10/2013. Thời gian lấy
mẫu là 1 phút 30 giây. Kênh VTV3 có sự biến thiên âm
lượng rất lớn từ [-10 LUFS, -33 LUFS], kênh BBC của
Anh có mức âm lượng dao động ổn định quanh mức -18
LUFS, kênh Australia dao động khoảng [-23 LUFS, -19
LUFS], kênh Arirang (kênh ca nhạc Hàn Quốc) mức dao
động [-21 LUFS, -18 LUFS], kênh KBS HD World (Hàn
Quốc) mức dao động [-21 LUFS, -18 LUFS]. Mức biến
động âm lượng của các kênh BBC là ổn định, do Anh
và phần lớn các nước Châu Âu đã chấp thuận khuyến
nghị EBU R128, với chuẩn hóa mức âm lượng mục tiêu
là -23 LUFS [8] từ 2012, và Úc chấp thuận tiêu chuẩn
ITU-R BS.1770 với mức âm lượng chuẩn hóa mục tiêu
là -24 LKFS [8] từ 2012. Ở Hàn Quốc, một số giải pháp
điều chỉnh loudness tự động được áp dụng để cân bằng
mức loudness cho các chương trình phát sóng truyền
hình, ví dụ như IPTV [9]. Các giá trị đo được từ STB
đặt tại Việt Nam của kênh nước ngoài có chênh lệch
từ 2-3 LUFS so với giá trị trung bình -23 LUFS của
tiêu chuẩn EBU R128, đây là kết quả đo sau khi tín
hiệu truyền qua đường vệ tinh, rồi phân phối lại qua
hệ thống truyền hình cáp SCTV, và sau đó giải mã lại
từ STB nên mức tín hiệu có thay đổi, tuy nhiên mức
loudness trung bình giữa các kênh ít biến động, nằm
trong giới hạn cho phép, với sự thay đổi từ 2-3 LUFS
người nghe khó cảm nhận được sự biến động âm lượng.
V. KẾT QUẢ CHUẨN HÓA ÂM LƯỢNG
Việc chuẩn hóa âm lượng nhằm đưa mức âm lượng
trung bình thống nhất về một mức chung, sẽ làm giảm
sự khác biệt âm lượng của các thể loại trong cùng một
kênh chương trình (ví dụ chương trình quảng cáo, thời
sự, phim) hay giữa các kênh chương trình với nhau (ví dụ
VTV1, VTV2, HTV7) giúp tạo ra sự hài hòa âm thanh
cho người nghe/xem truyền hình. Người xem không
cần phải dùng thiết bị điều khiển âm lượng (volume
control) khi xem TV. Chúng tôi đã thực nghiệm chuẩn
hóa loudness theo các yêu cầu của khuyến nghị EBU
R128, với thông số loudness đưa về mức -23 LUFS, giới
hạn true-peak là nhỏ hơn hoặc bằng -1 dBTP và giá trị
LRA tùy thuộc vào nền tảng phân phối và môi trường
người nghe. Kết quả sau khi chuẩn hóa các thông số
loudness, xem Hình 12 và Bảng II, không còn sự nhảy
vọt âm lượng đột ngột khi chuyển kênh chương trình,
các mẫu trước và sau khi chuẩn hóa âm lượng được
cho một số đối tượng nghe trong điều kiện phòng thông
thường không phát hiện sự nhảy vọt âm lượng nào sau
khi chuẩn hóa loudness.
VI. KẾT LUẬN
Bài báo này đã trình bày hiện trạng âm lượng trong
sản xuất, phát sóng tại VTV là đơn vị mà nhóm thực
hiện có cơ hội khảo sát. Các đài khác, ví dụ như VTC
và SCTV, nhóm chỉ thực hiện việc đo các chương trình
thông qua thu sóng từ các hệ thống phát sóng. Một số
Đài truyền hình khác mà nhóm thực hiện có cơ hội tìm
hiểu và có thông tin như: HTV (Đài Tp.HCM), Vĩnh
Long, Trà Vinh, Sóc Trăng, và Tây Ninh, thì vấn đề
kiểm soát âm lượng cũng chưa được các Đài quan tâm,
điều này dẫn đến trên địa bàn Tp. Hồ Chí Minh khi
người dân thu sóng từ các kênh sóng của các đài khác
Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014)
ISBN: 978-604-67-0349-5 364
Bảng II
KẾT QUẢ ĐO LOUDNESS VÀ CHUẨN HÓA KÊNH VTV3-HD, NGÀY 02/07/2013.
Kết quả đo trước chuẩn hóa Kết quả sau chuẩn hóa
STT Tên mẫu Tên chương trình Loudness LRA True Peak Loudness LRA True Peak
1 VTV3HD-0207-1004 Chúng tôi là chiến sỹ -21.3577 15.8869 -10.1225 -22.9939 15.8869 -11.7591
2 VTV3HD-0207-1008 Chúng tôi là chiến sỹ -21.2166 17.2823 -10.2902 -23.0181 17.2823 -12.0918
3 VTV3HD-0207-1051 Quảng cáo -18.5065 16.1065 -9.1228 -22.9999 16.1065 -13.6159
4 VTV3HD-0207-1105 Vui sóng mỗi ngày -27.4586 14.7628 -12.4597 -23.0007 14.7628 -8.0016
5 VTV3HD-0207-1200 Phim truyện -24.9318 14.7246 -10.2497 -22.9832 14.7246 -8.3009
6 VTV3HD-0207-1211 Quảng cáo -22.734 20.3828 -9.1509 -22.734 20.3828 -9.1509
7 VTV3HD-0207-1330 Phim -19.8765 23.7393 -8.4418 -23.0106 23.6403 -11.5944
8 VTV3HD-0207-1356 Thể thao -22.339 20.1832 -9.1694 -22.339 20.1832 -9.1694
9 VTV3HD-0207-1609 Vua đầu bếp -23.7787 22.4803 -8.5955 -23.7787 22.4803 -8.5955
10 VTV3HD-0207-1700 360 độ thể thao -25.8948 18.2827 -9.5511 -22.9982 18.2827 -6.6513
11 VTV3HD-0207-1804 Quảng cáo -26.6231 21.4746 -12.4737 -23.012 21.5251 -8.8502
12 VTV3HD-0207-1834 Phim truyện -30.3537 24.944 -13.7609 -22.9785 24.944 -6.3712
13 VTV3HD-0207-1930 Thời sự -21.9057 17.1782 -12.5234 -22.9866 17.1782 -13.6049
14 VTV3HD-0207-1950 Thời sự -26.5142 15.726 -15.5236 -23.019 15.726 -12.0284
15 VTV3HD-0207-2022 Ai là triệu phú -23.5972 15.8781 2.534 -23.5972 15.8781 2.534
16 VTV3HD-0207-2126 Phim truyện -26.5419 17.0156 -11.8635 -23.0229 17.0156 -8.3241
0 2 4 6 8 10 12 14 16
í35
í30
í25
í20
í15
í10
í5
0
Thoi gian
Lo
ud
ne
ss
Ket qua do sau chuan hoa loudness
Ket qua do truoc khi chuan hoa loudness
Hình 12. Kênh VTV3 trước và sau khi chuẩn hóa âm lượng.
nhau có âm lượng khác nhau, dẫn đến sự khó chịu của
người xem khi chuyển kênh giữa các đài. Bản thân giữa
các chương trình trong mỗi kênh của mỗi đài thì vấn đề
kiểm soát âm lượng vẫn chưa được quan tâm đúng mức.
Sự phản ánh của người xem về chất lượng âm thanh
gây khó chịu khi họ chuyển kênh, khi quảng cáo đan
xen giữa các chương trình trên một kênh truyền hình
có âm lượng tăng đột biến là minh chứng cụ thể cho
việc không đạt yêu cầu về mức chuẩn hóa âm lượng
các chương trình phát sóng của nhiều đài. Vấn đề này
sẽ được giải quyết thông qua việc chuẩn hóa âm lượng
trong khâu phân phối, sản xuất và phát sóng theo khuyến
nghị EBU R128. Việc chuẩn hóa loudness cũng có thể
thực hiện tại phía khách hàng. Tuy nhiên, các đầu thu
STB tích hợp giải mã metadata tương thích với EBU
R128 chưa phổ biến, nhóm thực hiện khuyến nghị trước
hết nên chuẩn hóa tại phía nhà cung cấp dịch vụ, chuẩn
hóa âm lượng ngay tại khâu tổng khống chế của nhà
quảng bá để đạt mức cân bằng âm lượng cho người
xem truyền hình tại Việt Nam.
LỜI CẢM ƠN
Nghiên cứu này được thực hiện dưới đề tài:“Nâng
cao chất lượng audio cho phát sóng truyền hình số đa
kênh” với sự hỗ trợ của Trung tâm Nghiên cứu Ứng
dụng KHKT Truyền hình (BRAC), Đài Truyền hình Việt
Nam.
TÀI LIỆU
[1] ANSI, American national psychoacoustical terminology, Ameri-
can National Standards Institute, New York, ANS Std., Rev. Vol
S3.20, 1973.
[2] H. F. Olson, “The measurement of loudness,” Audio Magazine,
pp. 18–22, 1972.
[3] ITU, “Recommendation ITU-R.645-2: Test signals and metering
to be used on international sound programme connections,” 1992.
[4] EBU, “128 recommendation:" Loudness normalization and per-
mitted maximum level of audio signals,” 2011.
[5] ITU-R, “Algorithms to measure audio programme loudness and
true-peak audio level,” Mar. 2011.
[6] EBU, “Practical guidelines for production and implementation in
accordance with EBU R128,” Geneva, 2011.
[7] EBUR128. (2014). [Online]. Available:
https://tech.ebu.ch/loudness
[8] TCelectronic. (2014). [Online]. Available:
[9] Miranda. (2014). [Online]. Available:
Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014)
ISBN: 978-604-67-0349-5 365
Các file đính kèm theo tài liệu này:
- khao_sat_am_luong_loudness_cac_kenh_truyen_hinh_tai_viet_nam.pdf