Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 9 - 2020 11
HỌC MÁY VÀ KHẢ NĂNG ỨNG DỤNG
TRONG CÁC HỆ THỐNG THÔNG TIN VÔ TUYẾN
Bùi Thị Thanh Tâm1*, Trần Xuân Nam2
Tóm tắt: Cùng với sự phát triển của Cuộc cách mạng công nghiệp lần thứ 4,
truyền thông vô tuyến đang ngày càng phát triển nhằm đảm bảo truyền dẫn, thông tin
liên lạc nhanh, an toàn, tin cậy trong các điều kiện chịu ảnh hướng lớn của môi
trường truyền sóng vô tuyến phức tạp. Sự phá
13 trang |
Chia sẻ: huongnhu95 | Lượt xem: 563 | Lượt tải: 0
Tóm tắt tài liệu Học máy và khả năng ứng dụng trong các hệ thống thông tin vô tuyến, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
t triển mạnh mẽ của các công nghệ xử lý
tiên tiến đã thúc đẩy việc nghiên cứu ứng dụng trí tuệ nhân tạo (Artificial Intelligence
- AI) vào các hệ thống thông tin vô tuyến (TTVT) thế hệ tiếp theo nhằm tăng khả năng
tự học, nhận biết, và tự xử lý để có thể kết nối với nhau thích nghi theo điều kiện
truyền dẫn thực tế, giảm bớt thời gian xử lý, đồng thời có thể đạt được hiệu năng cao
hơn. Bài báo này trình bày một nghiên cứu tổng quan về nguyên lý và các kết quả đạt
được gần đây về ứng dụng học máy trong các hệ thống TTVT, trên cơ sở đó gợi mở
một số chủ đề nghiên cứu có ý nghĩa khoa học và thực tiễn.
Từ khóa: Hệ thống thông tin vô tuyến; Học máy; Học sâu.
1. GIỚI THIỆU
Các hệ thống thông tin vô tuyến luôn đòi hỏi ứng dụng các công nghệ mới
nhằm đáp ứng yêu cầu truyền tin tốc độ nhanh, độ tin cậy cao trong điều kiện băng
tần hạn chế, môi trường kênh truyền phức tạp chịu ảnh hưởng của các nguồn nhiễu
và hiện tượng pha-đinh vô tuyến. Cùng với sự phát triển của các công nghệ tính
toán tiên tiến, trí tuệ nhân tạo ngày càng được ứng dụng rộng rãi trong các hệ
thống công nghệ điện tử, truyền thông và công nghệ thông tin. Các nghiên cứu mới
nhất về thông tin vô tuyến đã cho thấy trí tuệ nhân tạo, mà cụ thể là học máy
(Machine Learning - ML), sẽ được ứng dụng rộng rãi trong thông tin vô tuyến thế
hệ tiếp theo như thông tin quân sự, thông tin di động thế hệ thứ 6 (6G) [1], hệ
thống kết nối Internet vạn vật (Internet of Things - IoT) [2], hệ thống thông tin
phục vụ giao thông thông minh (Intelligence Transport System - ITS) [3],... Việc
ứng dụng ML trong TTVT đem lại nhiều tiềm năng về xử lý tín hiệu nhờ đặc tính
tự học như không yêu cầu thông tin trạng thái kênh thông tin trạng thái kênh [4],
mã hóa [5, 6], xử lý dữ liệu lớn, đa chiều [7] theo định hướng của các hệ thống vô
tuyến cấu hình mềm, thông minh.
Bài báo này trình bày tổng quan về khả năng ứng dụng học máy trong TTVT,
các kết quả bước đầu đạt được và tiềm năng phát triển trong tương lai. Bài báo tập
trung chủ yếu vào khả năng ứng của học sâu (Deep Learning - DL) vào xử lý tín
hiệu tại lớp vật lý vẫn được coi là lớp phức tạp nhất trong hệ thống TTVT.
Bài báo có cấu trúc như sau: Mục 2 trình bày lý thuyết chung về học máy và
học sâu, một số mô hình điển hình; Mục 3 trình bày các ứng dụng tiềm năng của
học máy và học sâu trong các hệ thống TTVT; Cuối cùng Mục 4 rút ra các kết luận
và gợi mở một số hướng nghiên cứu tiềm năng về ứng dụng học máy trong TTVT.
2. HỌC MÁY VÀ CÁC MÔ HÌNH CỦA MẠNG HỌC SÂU
2.1. Học máy
Học máy là một lĩnh vực của khoa học máy tính, một nhánh của trí tuệ nhân tạo,
12
sử dụng các thuật toán để xây dựng các mô h
đầu
định tự động thông qua trải nghiệm tự học
hu
dụng một tập dữ liệu hữu hạn đầu v
hình x
hu
bộ lọc hoặc san bằng tín hiệu trong xử lý tín hiệu. Tuy nhi
học máy v
của bộ lọc đ
trọng số trong mô h
luy
sau:
learning
sát s
(còn g
giám
dụng tập dữ liệu gồm dữ liệu đầu v
vào đ
luy
m
(classification
không giám sát là
reduction
pháp h
cao
các thu
Neural Network
trợ (
m
[9]
mô hình nh
vào thông qua quá trình hu
Hình 1 trình bày m
ấn luyện (
ấn luyện. Quá tr
ện. Dựa tr
ử dụng một tập dữ liệu gồm dữ liệu huấn luyện v
ện đ
ỗi nhi
nh
Các mô hình h
ạng Bayes (
. H
ử lý tín hiệu với các tham số đảm bảo dữ liệu đầu ra chính xác với dữ liệu
học có giám sát (
ọi l
sát s
ể thực hiện các t
ệ thống học cách xác định hoạt động dựa tr
ấ
ật toán xác định n
Support Vector Machine
ọc sâu l
) và h
à d
ử dụng tập dữ liệu chỉ gồm duy nhất dữ liệu đầu v
ược lựa ch
ệm vụ
) đ
t. Hi
B
training
à b
ữ liệu giám sát) để xây dựng mô h
ể thuận tiện trong việc l
ện tại, học tăng c
ư
. T
ộ lọc l
ã đư
ên phương pháp hu
ọc
cụ thể
) và h
Bayesian Networks
à m
biểu diễn ở h
. T. Tâm
ợc xác định v
tăng cư
ọn để
ọc máy phổ biến gồm mô h
- ANN),
ột nhánh của học máy dựa tr
)
ình này t
à
ình h
.
ồi quy (
phân nhóm (
, T
Hình 1
ột mô h
và quá trình x
ở chỗ thuật toán v
ương tác yêu c
Hai
. X
ọc máy đ
supervised learning
ờng
đưa ra m
ứng dụng phổ biến nhất của học có giám sát l
ước đi tiếp theo để đạt đ
mô hình
ình 2.
. Nam
ương t
(
regression
ấn luyện nhằm thực hiện các dự đoán hoặc quyết
. Mô hình h
ình h
à l
reinforce
clustering
ường chủ yếu
-
, “H
ự q
ập tr
ư
ấn luyện có thể phân học máy th
ột mô h
SVM), phân tích h
) và thu
ọc máy v
ọc máy điển h
ử lý dữ liệu. Trong quá tr
ào các thu
uá trình hu
ợc xây dựng tự động thông qua quá tr
ào, d
ầu nh
ưu tr
cây quy
à các tr
ình tr
ment learning
),
ật toán di truyền (
[8]
ọc máy điển h
ữ liệu đầu ra nhất định v
ư đi
ình v
trong khi đó
) ho
ữ v
ết định (
à kh
ình toán h
.
ật toán học máy sẽ xây dựng một mô
ư
), h
ặc giảm số chiều dữ liệu (
à tính toán. H
đư
ình
ên ANN v
ả năng ứng dụng
ấn luyện để xác định các trọng số
ọng số trong mô h
ớc, trong khi đó
ọc không giám sát (
ình
ều khiển, tr
ới độ chính xác cao nhất có thể
ợc áp dụng trong lý thuyết tr
ư
ình v
,
ên hoàn c
ợc điểm số cao nhất.
mạng n
Decision Tree
).
à d
trong khi đó
,
ồi quy (
ọc dựa tr
ình
ới hai quá tr
Các thu
ữ liệu mong muốn đầu ra
ứng dụng chủ yếu của học
ới nhiều lớp li
.
ên, đi
ò ch
ọc tăng c
ảnh để đạt đ
ơ-ron nhân t
Genetic Algorithm
ào. H
analysis regression
ên t
ình hu
ểm khác biệt giữa
ình x
, thu
ật toán học có giám
,
ọc tăng c
ơi. B
thông tin vô tuy
ập dữ liệu mẫu
ật toán v
ành 3 lo
thu
à tiêu chu
ộ
ường l
), máy véc
Kỹ thuật điện tử
ình: quá trình
ấn luyện, sử
ử lý tín hiệu
uns
ật toán không
d
ạo (
ên k
ình hu
upervised
ữ liệu
à phân lo
dimension
à phương
ược lợi ích
Artificial
ại nh
ường sử
ẩn đầu
ò ch
-
ết trong
ến
à các
hu
v
tơ h
- GA)
.”
ấn
ư
ấn
ới
ại
ơi,
ỗ
),
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 9 - 2020 13
input layer
hidden layer 1 hidden layer 2 hidden layer 3
output layer
Hình 2. Cấu trúc mạng nơ-ron sâu.
2.2. Một số mô hình mạng học sâu
Những nghiên cứu nền tảng của học sâu thực tế đã xuất hiện từ những năm
1940 [10, 11]. Mặc dù được biết đến là một mô hình học máy hiệu quả, tuy nhiên,
học sâu gặp phải nhiều khó khăn và thách thức lớn như xử lý dữ liệu phi tuyến,
giải quyết vấn đề quá khớp (overfitting), biến mất gra-đi-ên (vanishing gradient)
và tải tính toán (computational load) [12]. Cho đến đầu những năm 2010, với sự
phát triển của phần cứng có khả năng tính toán tốc độ cao, học sâu mới được quan
tâm trở lại và phát triển bùng nổ. Cho đến nay, có rất nhiều các mô hình học sâu
khác nhau đã được đề xuất. Trong bài báo này, chúng tôi không trình bày lại cấu
trúc cơ bản của mạng nơ-ron học sâu mà tập trung vào 3 mô hình mạng học sâu có
tính chất nền tảng và đang được sử dụng rộng rãi trong các nghiên cứu mới. Đó là
mạng nơ-ron chiều thuận (Feedforward Neural Networks - FNN), mạng nơ-ron
chập (Convolution Neural Networks - CNN) và mạng nơ-ron hồi quy (Recurrent
Neural Networks - RNN).
2.2.1. Feedforward Neural Networks (FNN)
Mạng nơ-ron hướng thuận (FNN) còn có tên gọi khác là mạng nơ-ron sâu (Deep
Neural Networks - DNN) là một trong các mô hình học máy được sử dụng trong
nhiều ứng dụng thực tế. Trong FNN, dữ liệu đầu vào của một lớp chỉ phụ thuộc dữ
liệu đầu ra của lớp trước. Trong mạng học sâu có L lớp, biểu thức tính dữ liệu đầu
ra ở lớp thứ l (với 1,2, ,l L ) có thể biểu diễn như sau:
1l l l l y f W y b
trong đó, ma trận trọng số
l
W biểu diễn trọng số (weight) kết nối từ lớp thứ
( 1)l đến lớp thứ l ,
lb là véc-tơ biểu diễn độ lệch (bias) ở lớp thứ l , ( )f là các
hàm kích hoạt ở đầu ra các nút. Giả thiết mạng FNN thực hiện nhiệm vụ phân loại
dữ liệu, bộ dữ liệu đưa vào huấn luyện ( , )x y với x là dữ liệu đầu vào, y là dữ
liệu đầu ra cho trước để điều chỉnh các tham số của mạng. Quá trình tối ưu mạng là
quá trình bộ tham số mạng ,W b được điều chỉnh theo chiều làm cực tiểu hàm mất
mát ˆ( , )L y y , với y là đầu ra đúng và yˆ là đầu ra ước lượng được. Một số các hàm
kích hoạt và hàm mất mát điển hình được trình bày trong [13]. Các thuật toán tối
ưu điển hình thường được sử dụng là xuống dốc gra-đi-ên (gradient descent),
Kỹ thuật điện tử
B. T. T. Tâm, T. X. Nam, “Học máy và khả năng ứng dụng thông tin vô tuyến.” 14
xuống dốc gra-đi-ên ngẫu nhiên (Stochastic Gradient Descent), Adagrad, căn bậc
hai của bình phương sai số (Root Mean Square - RMS), Adam [10]. Năm 1986,
Geoffrey Hinton [14] chứng minh mạng nơ-ron với nhiều lớp ẩn có thể được huấn
luyện hiệu quả hơn khi sử dụng quy trình lan truyền ngược (Back Propagation -
BP). Mạng được huấn huyện bằng BP, có nghĩa là ở đầu ra của mạng có đường
phản hồi đến các lớp phía trước để điểu chỉnh các tham số mạng từ lớp L , lớp L -
1, lớp 1. Hầu hết các mạng học sâu hiện nay vẫn sử dụng phương pháp huấn
luyện mạng dựa trên BP.
2.2.2. Convolution Neural Networks (CNN)
Mạng nơ-ron chập (CNN) được giới thiệu trong [15] và được đề xuất ứng dụng
nhiều trong các bài toán thực tế [16-18]. CNN là một kiểu mạng nơ-ron xử lý tốt
dữ liệu dạng lưới (grid-like data), đa chiều và có kích thước thay đổi. Đầu vào của
mạng CNN có thể theo chuỗi theo thời gian, nhưng cơ bản phù hợp với dữ liệu đầu
vào ở dạng ảnh. CNN có sử dụng phép tính tích chập nhân ma trận ở ít nhất một
lớp, với ảnh I đầu vào ta có phép tính tích chập biểu diễn như sau [10]:
, * , , ,
m n
S i j K I i j I m n K i m j n
trong đó S thường là bản đồ đặc tính, K được gọi là Kernel. Phép tính trên biểu
diễn cho dữ liệu 2 chiều, nhưng cũng có thể mở rộng thành dữ liệu nhiều chiều
hơn. Các tham số của K tương tự các tham số trọng số trong mạng FNN, có để
được học bằng thuật toán SGD và BP. Một ưu điểm của CNN so với FNN là đặc
tính chia sẻ tham số (parameter sharing), nhờ đặc tính này CNN chỉ phải học một
bộ tham số duy nhất, do đó, giảm yêu cầu về bộ nhớ. Một số dạng biến đổi của
CNN là LSTM (Long Short Term Memory), RN (Residual Network), HNN
(Highway Neural Network) cho phép chống lại vấn đề vanishing gradients trong
quá trình huấn luyện mạng.
2.2.3. Recurrent Neural Network (RNN)
RNN được giới thiệu trong [10] là một cách để điều chỉnh xử lý dữ liệu nối tiếp.
Kiểu mạng này tương tự như CNN theo nghĩa chia sẻ tham số; tuy nhiên, trong
RNN các tham số được chia sẻ theo các bước thời gian và chỉ số của đầu vào nối
tiếp. Mạng có tên gọi là hồi quy (recurrent) do chúng lặp lại kết nối giữa các nút
ẩn. Biểu diễn toán học đầu ra của một nút tại thời điểm t như sau:
1 , ;y t f y t x t
trong đó, hàm ( )f là hàm kích hoạt ở một nút, ( )y t là trạng thái ra của các nút ẩn
ở thời điểm t , ( )x t là đầu vào thời điểm t , là các tham số cần học của mạng.
không có chỉ số hay biến theo thời gian vì tham số trọng số, độ lệch của mạng là
giống nhau với mọi thời điểm của chuỗi đầu vào. Các thuật toán SGD và BPTT
[10] (Back-Propagation Through Time) thường được sử dụng để huấn luyện RNN.
Các mạng mở rộng của RNN phổ biến là LSTM và GRU (Gated Recurrent Unit).
3. CÁC ỨNG DỤNG CỦA ML TRONG THÔNG TIN VÔ TUYẾN
Trong những năm gần đây, học máy đã được nghiên cứu đề xuất ứng dụng
Nghiên c
Tạp chí Nghi
trong các h
dụng công nghệ xử lý ti
ch
lo
autoencoder
kênh và gi
dạng điều chế
3.1
hóa t
ưu h
của hệ thống trong các tr
các mô hình toán h
đư
sau đó đư
layer
cũng đ
kích ho
Bộ
entropy
tương đương v
Trong m
autoencoder
(Single Input Single Output
Output
kênh thông tin
trư
so sánh h
th
ất l
ại: một l
. Ứng dụng DL cho hệ thống thông tin từ máy phát đến máy thu
Trong
ệ thống đồng bộ từ máy phát đến máy thu, hứa hẹn cải thiện đ
ợc biểu diễn nh
Ở máy phát, tập dữ liệu phát đầu v
autoencoder
Gi
ờng hợp hệ thống không có k
ống thông tin MIMO sử dụng DL ch
ượng truyền dẫn
ự động
). Kênh đư
ư
ạt softmax có đầu ra
ải pháp n
)
ứu khoa học công nghệ
công trình
ợc đ
ợc biểu diễn bằng một mạng FNN,
gi
ột số tr
[20]
ệ thống MIMO phân tập không gian sử dụng m
ên c
ệ thống
à
ải m
(
ữa
cho ph
ứu KH&
ứng dụng
[10]
ã kênh, mã
hay
autoencoder
ưa vào m
1
s
ới một hệ thống thông tin thông th
ày ti
qua kênh
ph
duy nh
Hình 3.
đư
ư m
ợc biểu
đư
và
ường hợp khó h
ản hồi trạng thái k
TTVT nh
tách tín hi
ợc biểu diễn nh
[13]
ọc
ợc huấn
p
ẩm chất tốt h
ếp tục đ
CN
ên ti
. Các
[19]
ột mạng n
ột mạng FNN, tiếp theo l
di
. K
pha
quân s
đầy đủ
ất;
M
các tác gi
)
ường hợp phức tạp, khó có thể mô h
. Toàn b
ễn bằng một lớp tạp âm
ết quả cho thấy
-
ến trong
ứng dụng của
hai là
hóa
ệu.
ột hệ thống thông tin qua k
biểu diễn tr
p
luy
ư
) lên h
đinh Rayleigh, cho trư
ự,
ằm đem lại những tiềm năng lớn về khả năng ứng
s
ơ
ện bằng thuật toán SGD với h
ơn h
ợc phát triển ứng dụng từ hệ thống thông tin SISO
Số Đặc san
từ máy phát đến máy thu,
ửa lỗi, m
ả
ộ hệ thống từ máy phát, k
-ron.
(0,1)
ơn khi h
ệ thống thông tin MIMO (
ênh ph
đơn gi
thay th
ư là m
bi
ệ thống thông tin thông th
ênh (
ểu diễn một hệ thống
ên hình 3.
ào
là m
ản hồi thông tin trạng thái k
học máy
ế
ã hóa và gi
ột bộ autoencoder
s
ột vec
, h
ệ thống sử dụng mức điều chế cao th
Channel State Information
o toàn b
Viện Điện tử
ản hóa cấu trúc máy thu phát, nâng cao
m
đư
trong đó
ệ thống ứng dụng DL cho phẩm chất
ột khối chức nă
ợc m
à m
-
ư
đ
Cách bi
ã hóa b
ột lớp chuẩn hóa (
cộ
tơ xác su
ờng sử dụng bộ tách hợp lệ tối đa.
ờng hợp hệ thống có v
ộ hệ thống qua k
ã đ
ải m
ênh AWGN
ng tính (
,
, 9 -
ề xuất
lớp cuối c
20
ã, tr
ểu diễn n
ằng một véc
ất xuất hiện một symbol.
Multiple Input Multiple
ã STBC 2x1
20
có th
ng như là san b
ải phổ
[13]
TTVT
ình hóa h
ênh tr
noise layer
àm m
ườ
tạo th
.
ùng s
ng.
ể chia th
như m
ày cho phép t
ư
uy
ất mát l
ênh, các tác gi
ành m
tín hi
ợc phẩm chất
ệ thống bằng
ền v
-
normalization
ử dụng h
- CSI). Trong
ênh pha
ột bộ
à máy thu
tơ one
). Máy thu
à không có
[21]
ành hai
ệu, nh
à
ột bộ
ằng
-hot,
cross
và h
-đinh
15
ận
mã
ối
àm
-
ì
ả
ệ
Kỹ thuật điện tử
B. T. T. Tâm, T. X. Nam, “Học máy và khả năng ứng dụng thông tin vô tuyến.” 16
Rayleigh. Kết quả cho thấy, tỷ số lỗi bít của hệ thống ứng dụng DL thấp hơn hệ
thống MIMO thông thường khi tỷ số tín/tạp (SNR) lớn hơn 15 dB.
Trong trường hợp có kênh thông tin phản hồi CSI tốt về máy phát, máy phát sử
dụng tiền mã hóa SVD (Singular Value Decomposition) để mã hóa symbol phát.
Kết quả mô phỏng cho thấy, hệ thống MIMO sử dụng mạng nơ-ron cho phẩm chất
tốt hơn hệ thống phân tập không gian MIMO thông thường với mọi giá trị SNR.
Giải pháp ứng dụng DL đồng bộ cho hệ thống thông tin từ máy phát đến máy
thu cung cấp một phương pháp mới trong thiết kế hệ thống ở lớp vật lý. Mặc dù,
còn nhiều vấn đề vẫn cần phải thực hiện và cải thiện để hệ thống hoạt động hiệu
quả hơn, nhưng với các kết quả đạt được trong các nghiên cứu cho thấy, những cải
thiện của giải pháp này có ý nghĩa quan trọng, đó là cải thiện phẩm chất, giảm độ
phức tạp tính toán so với các mô hình hệ thống thông tin trước đó.
3.2. San bằng kênh và giải mã sửa lỗi kênh
Một trong các ứng dụng DL trong các hệ thống thông tin vô tuyến là bộ san
bằng và mã sửa lỗi kênh để hạn chế ảnh hưởng của méo tín hiệu do đặc tính làm
việc của các bộ trộn và bộ khếch đại phi tuyến, kênh pha-đinh đa đường gây ra
nhiễu xuyên dấu (Inter-Symbol Interference - ISI). Có rất nhiều nghiên cứu đề xuất
giải pháp san bằng méo phi tuyến mà không cần biết chính xác thông tin trạng thái
kênh. Các tác giả trong [22] trình bày một phương pháp san bằng kênh bằng mạng
nơ-ron chỉ gồm 3 lớp, lớp đầu vào, lớp ẩn với hàm kích hoạt phi tuyến RBF
(Radial Basis Function) và lớp đầu ra. Tín hiệu phát đi qua kênh truyền phi tuyến
và có ảnh hưởng bởi nhiễu xuyên dấu. Nghiên cứu so sánh bộ san bằng kênh đề
xuất với hai bộ san bằng kênh tuyến tính khác là LTE (Linear Transversal
Equalizer) và mạng FNN sử dụng hàm kích hoạt sigmoid. Kết quả mô phỏng cho
bộ san bằng RBF cho phẩm chất tốt hơn nhiều so với hai san bằng còn lại. Bài báo
[23] đề xuất bộ san bằng sử dụng mạng nơ-ron CNN. Một số nghiên cứu ứng dụng
DL cho giải mã sửa lỗi kênh, mã sửa lỗi BCH [5], mã sửa lỗi polar code [6, 24].
Công trình [17] đề xuất kết hợp san bằng kênh và giải mã sửa lỗi kênh trong
một quá trình tạo thành bộ giải mã và san bằng không cần có thông tin trạng thái
kênh. Nghiên cứu sử hai mạng nơ-ron, một mạng có cấu trúc CNN để khôi phục
tín hiệu phát khi truyền qua kênh khó và có méo phi tuyến, một mạng DNN thực
hiện giải mã tín hiệu từ bộ san bằng CNN. Mạng CNN cho phép san bằng kênh với
số lượng tham số cần huấn luyện ít hơn so với mạng DNN và có khả năng phân
tách các đặc tính tốt. CNN hiệu quả với các dữ liệu đầu vào bị ảnh hưởng bởi các
bit lân cận nhờ đặc tính chia sẻ tham số (parameter sharing), điều này phù hợp với
kênh có ISI và ảnh hưởng của méo phi tuyến. Lớp cuối của CNN sử dụng hàm
softmax, hàm mất mát MSE, mạng được tối ưu bằng SGD và kỹ thuật BP. Nghiên
cứu thực hiện so sánh, đánh giá mô hình đề xuất với một số các bộ san bằng khác
trên kênh AWGN và kênh pha-đinh. Kết quả cho thấy, giải pháp đề xuất cho phẩm
chất tốt hơn các bộ san bằng và giải mã trước đó.
3.3. Trải phổ, đa truy cập
Kỹ thật DL được ứng dụng nhiều trong các hệ thống đa truy cập và trải phổ nhằm
hạn chế các tác động của xuyên nhiễu đa người dùng (Multiple Access Interference -
MAI). Các tác giả công trình [25] đề xuất ứng dụng mạng DNN cho sơ đồ đa truy
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 9 - 2020 17
cập SCMA (Sparse Code Multiple Access) được gọi là DL-SCMA thực hiện học giải
mã các tín hiệu SCMA trên kênh Gauss khắc phục bộ giải mã SCMA đã có với độ
chính xác cao, độ phức tạp thấp. Xây dựng và huấn luyện bộ AE-SCMA
(Autoencoder - Sparse Code Multiple Access) để tạo ra các từ mã SCMA tối ưu, khôi
phục các tín hiệu gốc. Bộ AE-SCMA giúp khái quát SCMA, từ đó, các tác giả đề
xuất sơ đồ DCMA (Dense Code Multiple Access) cho phẩm chất tốt hơn bộ SCMA.
Mạng nơ-ron được đề xuất sử dụng làm bộ tách đa người dùng ở máy thu cho hệ
thống MC-CDMA kết hợp điều khiển công suất trên kênh pha-đinh Rayleigh trình
bày trong [26]. Trong nghiên cứu này, mạng nơ-ron được đặt sau bộ kết hợp tỉ số
cực đại (Maximal Ratio Combining - MRC). Số các nút ở lớp đầu vào, lớp ẩn và lớp
đầu ra của mạng FNN bằng số người dùng, hàm kích hoạt ở lớp ẩn là sigmoid, mạng
được huấn luyện bằng thuật toán Levenberg-Marquardt. Kết quả cho thấy, phẩm
chất của hệ thống đề xuất được cải thiện nhiễu so với máy thu đơn thuần sử dụng
MRC, và đường BER tiến đến gần với BER của hệ thống đơn người dùng (SUB).
Bài báo [27] thực hiện so sánh phẩm chất của bộ tách đa người dùng tuyến tính và
bộ tách phi tuyến sử dụng mạng nơ-ron đặt ở phía sau các bộ lọc phối hợp sử dụng
mã Gold trong hệ thống DS-CDMA. Bộ tách mạng nơ-ron là mạng FNN sử dụng
thuật toán BP trong huấn luyện. Các bộ tách có thể làm việc ở 2 chế độ truyền dẫn
đồng bộ và không đồng bộ qua kênh Gauss. Kết quả mô phỏng cho thấy, bộ tách đa
người dùng sử dụng mạng nơ-ron cho phẩm chất tốt hơn so với bộ tách tuyến tính.
Với một số mô hình tương tự như trong [27], [28] thực hiện tiền xử lý để triệt MAI
cho hệ thống qua kênh pha-đinh Rayleigh. Tác giả thực hiện tiền xử lý ở dữ liệu sau
bộ lọc phối hợp, đó là chuẩn hóa biên bộ dữ liệu đa người dùng trước khi đưa vào
mạng nơ-ron tách sóng. Kết quả mô phỏng cho thấy, với cùng mức BER, hệ thống
có tiền xử lý cho phép giảm số lần thực hiện triệt nhiễu song song (PIC), nhờ vậy,
máy thu giảm bớt độ phức tạp.
3.4. Nhận dạng tín hiệu điều chế số và tương tự
Nhận dạng tín hiệu điều chế là thực hiện phân loại kiểu điều chế của tín hiệu vô
tuyến thu được, đây là một bước để hiểu về nguồn phát ra tín hiệu loại gì, như là
tín hiệu ra-đa, tín hiệu tiếng nói, Công trình [16] thực hiện so sánh hiệu quả
phân loại điều chế giữa các phương pháp dựa trên các đặc tính đã có và phương
pháp học đặc tính bằng CNN và DNN. Với việc ứng dụng CNN và DNN trong
phân loại điều chế đảm bảo tính mềm dẻo của hệ thống khi học các đặc tính với độ
chính xác phân loại cao. Nghiên cứu thực hiện phân loại 11 loại điều chế trong đó
8 loại điều chế số (BPSK, QPSK, 8PSK, 16QAM, 64QAM, BFSK, CPFSK,
PAM4) và 3 loại điều chế tương tự (WB-FM, AM-SSB, AM-DSB).
Trong nghiên cứu [29] đề xuất mô hình mạng DNN cho bộ tự phân loại điều
chế (AMC) sử dụng hàm kích hoạt RBFN cho hệ thống MIMO-STBC. Nghiên cứu
về AMC có thể được phân thành hai loại, đó là dựa trên tính hợp lệ (Likelihood
Based - LB) và dựa trên đặc tính (Feature Based - FB). Mặc dù các phương pháp
LB cho độ chính xác tối ưu nhưng phải trả giá về độ phức tạp tính toán cao không
phù hợp với các ứng dụng yêu cầu thời gian thực. Các phương pháp FB cho độ
chính xác cận tối ưu so với LB, tuy nhiên, phương pháp này cho hiệu quả tính toán
tốt hơn phù hợp hơn với các ứng dụng thực thế. Thuật toán L-BFGS [10] và
Kỹ thuật điện tử
B. T. T. Tâm, T. X. Nam, “Học máy và khả năng ứng dụng thông tin vô tuyến.” 18
phương pháp tối thiểu bình phương (Least Square - LS) được sử dụng để tối ưu
trọng số của DNN và RBFN. Nghiên cứu so sánh phẩm chất của phương pháp đề
xuất với các nghiên cứu gần đây nhất, đó là bộ phân loại hợp lệ tối đa và các bộ
phân loại có ứng dụng ML bao gồm AdaBoost và CNN. Các kết quả mô phỏng
thực hiện đánh giá trên ba cấu hình khác nhau trên hệ thống MIMO-STBC (2x1,
2x2 và 4x4) cho trường hợp có thông tin trạng thái kênh tốt và trường hợp xấu hơn
đó là xảy ra lỗi ước lượng kênh. Cùng hướng nghiên cứu này, có thể kể đến [24] đề
xuất sử dụng CNN để phân loại điều chế, [30] sử dụng DNN cho tự động nhận
dạng tín hiệu điều chế của hệ thống trên kênh Rice.
3.5. Tách tín hiệu thu
Một hệ thống thông tin được thiết kế và phân tích chất lượng dựa trên một số
các mô hình toán học mô tả quá trình mã hóa và giải mã tín hiệu, quá trình lan
truyền tín hiệu trong không gian, các loại nhiễu ảnh hưởng đến chất lượng tín hiệu.
Tuy nhiên, trong một số trường hợp các sóng điện từ lan truyền hết sức phức tạp,
không thể mô hình bằng một mô hình toán học xác định. Ví dụ như mô hình kênh
truyền cho thông tin thủy âm sử dụng tín hiệu ở dải sóng âm thanh [31], hoặc một
hệ thống thông tin mới được gọi là thông tin tế bào liên quan đến các tín hiệu y
sinh kết nối giữa các thiết bị rất nhỏ, tín hiệu lan truyền trên bề mặt và bên trong cơ
thể con người [32, 33]. Vì vậy, việc thiết kế một máy thu, bộ tách tín hiệu mà
không cần phải có một kênh truyền được mô hình hóa là vấn đề cần thiết.
Trong nghiên cứu [34] thiết kế thuật toán tách tín hiệu và đánh giá phẩm chất bộ
tách sử dụng DL trong hệ thống thông tin tế bào mà không cần biết thông tin trạng
thái kênh truyền. Dữ liệu phát được biểu diễn qua hàm one-hot, và quá trình tách
tín hiệu phát từ tín hiệu thu được ở đầu vào máy thu trở thành nhiệm vụ phân nhóm
(clustering) của học máy, lớp đầu ra sử dụng hàm kích hoạt softmax. Nghiên cứu
đã tiến hành đo thử nghiệm để đánh giá hệ thống với các cấu hình, kiến trúc khác
nhau. Kết quả cho thấy, các bộ tách sử dụng DL cải thiện phẩm chất so với các
phương pháp trước đây mà không cần mô hình kênh truyền. Một số các nghiên cứu
khác ứng dụng DL cho hai nhiệm vụ ước lượng kênh và tách tín hiệu [40, 41]. Tuy
nhiên, các nghiên cứu này còn tách rời hai quá trình, do vậy, chưa đạt được hiệu
quả cao. Nghiên cứu [35] đề xuất kết hợp ước lượng kênh tách tín hiệu cho hệ
thống OFDM đa truy cập không trực giao (OFDM-NOMA) cho đường lên
(uplink), đa người dùng có thể truy cập vào cùng một sóng mang tại cùng một thời
điểm. Máy thu NOMA thiết kế dựa trên DL có thể tách bản tin người dùng trong
một quá trình one-hot mà không cần thông tin ước lượng kênh thật hoàn hảo. Kết
quả nghiên cứu đưa ra cho thấy, phương pháp dựa trên DL cho phẩm chất tốt hơn
các phương pháp ước lượng kênh dựa vào tín hiệu lái (pilot) thông thường.
Nhóm các nghiên cứu ứng dụng tách tín hiệu sử dụng DL cho một hệ thống
phức tạp hơn và cũng là hệ thống tiềm năng trong cải thiện phẩm chất, cung cấp
hiệu quả phổ tần cao, độ tin cậy và thông lượng tốt cho các hệ thống thông tin, đó
là hệ thống MIMO. Các thuật toán để cải thiện phẩm chất của hệ thống này vấp
phải một thách thức, thách thức về độ phức tạp tính toán, đặc biệt khi tăng số ăng-
ten thu và phát thì độ khó tính toán cũng tăng lên rất lớn. Công trình [36] đề xuất
ứng dụng DL cho tách tín hiệu trong hệ thống massive MIMO. [37] thực hiện tách
Nghiên c
Tạp chí Nghi
sóng đa ngư
cứu
DeNet cho trư
trúc là
DeNet có đưa thông tin tr
hi
ZF, MMSE, FC, DeNet cho các trư
a. Ph
ZF và FC có ph
bộ tách MMSE nh
phát, c
phía thu. DeNet có đư
MIMO 10x10, DeNet đ
số lỗi bit đó ở
MMSE đ
và 14dB
3.6
m
ứng dụng cho các nhiệm vụ khác nh
th
khi
m
số các nghi
tin di đ
ệu quả cho tr
Hình 4 so sánh ph
Ta th
. M
Trong các ph
ạng n
ống thông tin vô tuyến thủy âm
ển l
ạng không dây
[38]
ẩm chất hệ thống khi sử dụng các
ả 2 bộ tách đều cho đ
ột số các ứng dụng khác
ưu lư
ộng
ứu khoa học công nghệ
đ
mạng FNN đ
ấy
ạt phẩm chất
.
ơ-ron DL trong các h
ên c
ời d
ề xuất hai mô h
bộ tách khác nhau
Hình 4.
, v
ợng mạng, định tuyến
ên c
[45, 46]
ứu KH&
ờng hợp k
ư
bộ tách tín hiệu truyền thống v
ới c
ứu ứng dụng mạng n
ùng cho h
ờng hợp k
ùng s
ẩm chất xấu, đ
SNR 12dB
ần tr
[41]
ư
So sánh ph
ư bi
ư
.
CN
ợc sử dụng cho tr
ẩm chất một số bộ
ố ăng
ểu diễn tr
ờng BER hạ thấp nhanh h
ạt
ớc, chúng tôi đ
, các
quân s
ênh không thay đ
ạng thái k
ênh thay đ
BER 10
BER 5.10
ứng dụng cho định vị
ệ thống MIMO
ình tách tín hi
.
-ten thu phát là 30x30 trên kênh pha đinh, các b
ường phẩm chất tốt h
ự,
ẩm chất hệ thống MIMO sử dụng một số
ường BER của DeNet tiến đến gần đ
. Tăng s
ệ thống thông tin vô tuyến. Ngo
Số Đặc san
ờng hợp số ăng
ên hình 4a. T
[39]
[40]
ênh vào khi hu
ổi.
ã trình bày m
ư là l
ơ-
2 ở
ố ăng
3 l
. DL đư
, tối
ron cho các h
-NOMA s
ệu thu MIMO fully
ổi v
ường hợp k
tách tín hi
SNR 16dB
ần l
ựa chọn CDMA v
ưu vi
Viện Điện tử
b. Ph
à
ượt tại tại các giá trị SNR bằng 16dB
ợc ứng dụng trong các hệ thống điều
à kên
ứng dụng kỹ thuật DL.
ừ h
ơn so v
-ten thu phát lên 30x30, DeNet và
ệc phân phối nguồn t
[42, 43]
ệu cho hệ thống MIMO, nh
-ten thu phát khác nhau.
ẩm chất hệ thống MIMO khi số
ình 4b, khi t
ơn do thu đư
ột số các ứng dụng c
ệ thống thông tin vệ tinh, thông
ử dụng mạng n
h thay
ênh không thay đ
ấn luyện tối
ăng
, 9 -
ới MMSE. Với tr
, MMSE đ
, đ
20
đ
-ten thay đ
ảo tuyến tính
20
-
ổi. Bộ tách FC có cấu
ợc độ lợi phân tập ở
à OFDM tron
connected (FC) và
ưu m
ăng s
ài ra, DL còn
ư
ạt đ
ơ-ron. Nghiên
ổi. Bộ tách
ạng, bộ tách
ổi.
ờng BER của
ố ăng
ư
ài nguyên c
ư
ợc c
ơ b
[44]
ộ tách
-ten thu
ờng hợp
ùng t
ản của
g các h
ư là
đư
. M
19
ỷ
ợc
ệ
ủa
ột
Kỹ thuật điện tử
B. T. T. Tâm, T. X. Nam, “Học máy và khả năng ứng dụng thông tin vô tuyến.” 20
4. KẾT LUẬN
Bài báo này đã trình bày tổng quan về học máy, các mô hình cơ bản của học sâu
và khái quát các ứng dụng cơ bản nhất của mạng nơ-ron DL cho các hệ thống
thông tin vô tuyến. DL được ứng dụng từ máy phát đến máy thu như một bộ
autoencoder, và DL được ứng dụng như một khối chức năng trong hệ thống thông
tin đó là các bộ san bằng và giải mã kênh, trải phổ, đa truy cập, tách tín hiệu thu,
nhận dạng tín hiệu, và một số các ứng dụng khác. Các nghiên cứu cho thấy, ứng
dụng mạng nơ-ron cho các hệ thống TTVT có tiềm năng rất lớn và sẽ nhanh chóng
thay thế phương pháp xử lý tín hiệu truyền thống trong tương lại gần. Tuy nhiên,
để hoàn chỉnh về công nghệ và đưa vào ứng dụng thực tiễn cần tiếp tục đầu tư
nghiên cứu hơn nữa về hướng này, đặc biệt là các ứng dụng DL cho các hệ thống
TTVT quân sự nhằm tăng khả năng bảo mật, chống nhiễu, chống thu chặn tín hiệu.
Ngoài ra, ứng dụng học máy trong các hệ thống sô-na, cảnh giới ngầm cũng là các
đề tài nghiên cứu có ý nghĩa khoa học và thực tiễn.
TÀI LIỆU THAM KHẢO
[1]. S. J. Nawaz et al., "Quantum Machine Learning for 6G Communication
Networks: State-of-the-Art and Vision for the Future," IEEE Access, vol. 7
(2019), pp. 46317-46350.
[2]. J. Jagannath et al., "Machine learning for wireless communications in the
Internet of Things: A comprehensive survey," Ad Hoc Networks, vol. 93
(2019), p. 101913.
[3]. A. Ferdowsi et al., "Deep Learning for Reliable Mobile Edge Analytics in
Intelligent Transportation Systems: An Overview," IEEE Vehicular
Technology Magazine, vol. 14 (2019), no. 1, pp. 62-70.
[4]. Y. Jeon et al., "Blind detection for MIMO systems with low-resolution ADCs
using supervised learning," in 2017 IEEE International Conference on
Communications (ICC) (2017), pp. 1-6.
[5]. E. Nachmani et al., "Deep Learning Methods for Improved Decoding of
Linear Codes," IEEE Journal of Selected Topics in Signal Processing, vol. 12
(2018), no. 1, pp. 119-131.
[6]. W. Xu et al., "Improved polar decoder based on deep learning," in 2017
IEEE International Workshop on Signal Processing Systems (SiPS) (2017),
pp. 1-6
[7]. F. Ullah et al., "Future of Big Data and Deep Learning for Wireless Body
Area Networks," in Deep Learning: Convergence to Big Data Analytics, M.
Khan, B. Jan, and H. Farman, Eds. Singapore: Springer Singapore, 2019, pp.
53-77.
[8]. https://en.wikipedia.org/wiki/Machine_learning#cite_note
Các file đính kèm theo tài liệu này:
- hoc_may_va_kha_nang_ung_dung_trong_cac_he_thong_thong_tin_vo.pdf