Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2020 3
KỸ THUẬT CHỈ DẪN CHO GIẢI THUẬT TIẾN HÓA ĐA MỤC TIÊU
SỬ DỤNG MÔ HÌNH ĐẠI DIỆN
Nguyễn Đức Định1*, Nguyễn Long2, Thái Trung Kiên1
Tóm tắt: Trong thực tế, có nhiều bài toán đa mục tiêu (Multi-objective problems -
MOPs) khó, nếu giải bằng phương pháp thông thường, kể cả sử dụng giải thuật tiến hóa,
vẫn gặp phải nhiều thách thức như: hàm mục tiêu khó mô hình hóa, chi phí tính toán lớn,
tài ng
20 trang |
Chia sẻ: huongnhu95 | Lượt xem: 615 | Lượt tải: 0
Tóm tắt tài liệu Kỹ thuật chỉ dẫn cho giải thuật tiến hóa đa mục tiêu sử dụng mô hình đại diện, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
uyên tính toán có hạn, Ý tưởng chung để giải quyết các bài toán khó này là làm
đơn giản hóa, tách ra thành các bài toán con. Có hai phương pháp phổ biến để thực hiện
ý tưởng đó là mô phỏng và sử dụng mô hình xấp xỉ. Trong đó, mô hình xấp xỉ, còn gọi là
mô hình đại diện (surrogate model), sử dụng hàm đại diện thay thế cho hàm mục tiêu gốc
tỏ ra khá hiệu quả, dễ thực hiện, phù hợp với các bài toán thực tế.
Giải thuật tiến hóa đa mục tiêu (Multi-objective evolutionary algorithms - MOEAs) sử
dụng mô hình đại diện đang được nhiều nhà nghiên cứu quan tâm. Việc duy trì sự cân
bằng giữa khả năng thăm dò (exploration) và khai thác (exploitation) trong quá trình tiến
hóa cũng như cân bằng giữa chất lượng hội tụ (convergence) và đa dạng (diversity) của
quần thể giải pháp là vấn đề nghiên cứu hết sức cần thiết nhằm nâng cao chất lượng, duy
trì tính bền vững của giải thuật. Bài báo tập trung đánh giá một số yếu tố tác động đến
chất lượng, hiệu quả của giải thuật, đồng thời phân tích kỹ thuật chỉ dẫn, tác động của các
tham số điều khiển quá trình tiến hóa. Từ đó, đề xuất các kỹ thuật chỉ dẫn để nâng cao
chất lượng giải thuật thông qua các cơ chế thích ứng, quá trình tiến hóa tự điều chỉnh.
Thông qua thử nghiệm với các bài toán mẫu tiêu biểu, sử dụng các độ đo phổ biến, kết
quả đã chứng minh tính hiệu quả của các kỹ thuật chỉ dẫn, góp phần tạo ra những phiên
bản giải thuật mới giải quyết tốt hơn các bài toán khó.
Từ khóa: Kỹ thuật chỉ dẫn; Mô hình đại diện; Kriging; Giải thuật tiến hóa đa mục tiêu.
1. ĐẶT VẤN ĐỀ
Các bài toán tối ưu trong thực tế thường có nhiều mục tiêu xung đột với nhau. Bài
toán đòi hỏi tìm kiếm các giải pháp tối ưu cho các mục tiêu một cách đồng thời. Bài toán
đó được định nghĩa là bài toán tối ưu đa mục tiêu hay bài toán đa mục tiêu và được biểu
diễn như sau [10]:
minimize {f1(x), f2(x),, fk(x)} x S (1)
Trong đó: k (≥ 2) là số mục tiêu, fi : Rn → R là hàm mục tiêu (i =1, 2,, k).
Véc-tơ các hàm mục tiêu được ký hiệu là f(x) = (f1(x), f2(x),, fk(x))T. Véc-tơ biến hay
véc-tơ quyết định được ký hiệu là x = (x1, x2,, xn)T thuộc vùng (tập hợp) khả thi S, là
không gian con của không gian biến Rn (không gian quyết định). Thuật ngữ “minimize”
có nghĩa là tất cả các hàm mục tiêu được cực tiểu hóa đồng thời. Nếu không có sự xung
đột giữa các hàm mục tiêu, thì một giải pháp có thể tìm được thỏa mãn mọi hàm mục tiêu
là tối ưu. Trong trường hợp này, không cần đến một phương pháp đặc biệt nào để giải
quyết. Để tránh trường hợp tầm thường này, giả sử rằng, không tồn tại một giải pháp tối
ưu cho tất cả các mục tiêu, có nghĩa là các hàm mục tiêu ít nhất xung đột nhau một phần.
Bài toán đa mục tiêu thường có hai hoặc ba mục tiêu, nhưng trong thực tế có nhiều
bài toán phức tạp với các đặc điểm như: nhiều mục tiêu, không gian tìm kiếm lớn, hàm
mục tiêu khó, do đó, độ phức tạp tính toán lớn, thậm chí là “hộp đen” không mô hình
hóa được về toán học. Các bài toán mang đặc điểm đó được xếp vào lớp bài toán đa mục
tiêu khó, chi phí lớn (bài toán đa mục tiêu khó).
Công nghệ thông tin
4 N. Đ. Định, N. Long, T. T. Kiên, “Kỹ thuật chỉ dẫn cho giải thuật mô hình đại diện.”
Với bài toán đa mục tiêu thông thường, giải thuật tiến hóa khá phù hợp, hiệu quả và
được gọi là giải thuật tiến hóa đa mục tiêu. Giải thuật có nhiều ưu điểm như: Làm việc
trên quần thể, sử dụng cơ chế tiến hóa, làm việc theo cơ chế ngẫu nhiên, xấp xỉ, nên có
thể giải được hầu hết các bài toán, kể cả bài toán không khả vi. Tuy vậy, với lớp bài toán
đa mục tiêu khó, giải thuật gặp nhiều khó khăn.
Để giải các bài toán đa mục tiêu khó, chúng ta có thể sử dụng một số phương pháp
phổ biến như: mô phỏng, phân hoạch, sử dụng mô hình xấp xỉ. Trong phương pháp mô
phỏng, với các kỹ thuật máy tính, không gian tìm kiếm được biểu diễn trực quan và
người dùng sẽ quan sát, lựa chọn một hoặc nhiều giải pháp tối ưu. Phương pháp này có
ưu điểm là trực quan và vai trò của người dùng rất quan trọng, có tính quyết định. Tuy
vậy, để sử dụng phương pháp này đòi hỏi nhiều chi phí và kiến thức chuyên gia của
người dùng. Trong phương pháp phân hoạch, bài toán được phân chia thành các bài toán
con, đơn giản hơn. Các bài toán con được giải đồng thời để tạo ra tập giải pháp tối ưu.
Phương pháp này tương đối hiệu quả, nhưng có nhiều bài toán, việc phân hoạch thành
các bài toán con là rất khó, thậm chí không thể phân hoạch. Còn phương pháp sử dụng
mô hình xấp xỉ (mô hình đại diện) với các kỹ thuật như bề mặt đáp ứng đa thức (PRS),
hàm cơ sở bán kính (RBF), Kriging, máy véc-tơ hỗ trợ (SVM), kết hợp học máy để
xây dựng các hàm đại diện (huấn luyện mô hình) nhằm đơn giản hóa, giảm chi phí tính
toán là lựa chọn hiệu quả cho các bài toán đa mục tiêu khó trong thời gian gần đây.
Bài báo khảo sát phương pháp sử dụng mô hình đại diện để giải bài toán đa mục tiêu
khó, đồng thời đánh giá các yếu tố tác động trong quá trình tiến hóa và cơ chế của mô
hình đại diện tới hiệu quả thực thi, chất lượng quần thể giải pháp. Qua đó, đề xuất kỹ
thuật chỉ dẫn nhằm cải thiện, nâng cao chất lượng giải thuật.
2. PHƯƠNG PHÁP GIẢI BÀI TOÁN BẰNG MÔ HÌNH ĐẠI DIỆN
2.1. Các kỹ thuật sử dụng mô hình đại diện
Mô hình đại diện sử dụng phương pháp xấp xỉ để giảm chi phí tính toán cho các bài
toán đa mục tiêu khó và được mô tả như sau:
Nếu gọi ( )f x là hàm hàm mục tiêu (hàm thích nghi) gốc, thì khi đó chúng ta có '( )f x
là một hàm đại diện được xác định theo công thức (2) [24]:
'( ) ( ) ( )f x f x e x= + (2)
Hàm ( )e x là sai số của xấp xỉ. Trong trường hợp này, hàm thích nghi ( )f x không
được biết và chúng ta chỉ quan tâm đến giá trị đầu vào hoặc đầu ra. Dựa trên những phản
hồi của bộ mô phỏng từ tập dữ liệu lựa chọn huấn luyện, xây dựng lên một hàm đại diện,
khi đó mô hình dễ dàng sinh ra các đại diện mô tả mối quan hệ giữa thông tin tham chiếu
của đầu vào và đầu ra. Có nhiều cách tiếp cận cho mô hình đại diện và sau đây là một số
phương pháp tiếp cận tiêu biểu.
2.1.1. Hàm cơ sở bán kính (The radial basis function - RBF)
Trong công trình [5], tác giả đề xuất một phương pháp để xây dựng phương trình cho
mặt địa hình cùng các bề mặt bất thường khác, đó là phương pháp phân tích đa phân
(multi-quadric analysis). Phương pháp này sử dụng khái niệm hàm cơ sở bán kính
(RBF), là hàm có giá trị thực xác định khoảng cách từ tâm của mạng nơ-ron tới điểm đầu
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2020 5
vào (input point) và được tính theo công thức (3):
( ) ( )x x = (3)
Mô hình RBF thường bao gồm ba lớp:
- Lớp đầu vào (Input layer): Làm việc trên một hàm xác định;
- Lớp ẩn (Hidden layer): Làm việc trên một hàm kích hoạt RBF phi tuyến;
- Lớp đầu ra (Output layer): Làm việc trên hàm dưới đây:
( )1: : ( )
Nn
i i ii
R R x w x c
=
→ = − (4)
Trong phương pháp này, một vài tham số được sử dụng như: véc-tơ tâm
ic , trọng số
wi và khoảng cách RBF i. Quá trình tối ưu chính là quá trình tinh chỉnh các tham số
này. Dựa trên mô hình, có một số đề xuất gần đây như [3, 8, 13, 21].
2.1.2. Bề mặt đáp ứng đa thức (The polynomial response surface - PRS)
Các tác giả trong [15] đã đề xuất khái niệm tĩnh (static) để phân tích hồi quy nhằm
tìm ra phương sai đáp ứng cực tiểu (miminum responsive variance) và được gọi là
phương pháp bề mặt đáp ứng (The response surface methodology - RSM). Phương pháp
bề mặt đáp ứng đa thức là sự kết hợp giữa RSM với đa thức, được mô tả như sau:
( )p p
Ty x= (5)
Trong đó, tập dữ liệu kích thước n được biểu diễn là
1 2, ,..., ,nx x x
là véc-tơ hệ số
được ước lượng,
p
x là véc-tơ tương ứng để tạo thành cặp x1(p) và x2(p).
Có hai cách để ước lượng các hệ số không xác định là phương pháp đạo hàm và
phương pháp bình phương tối thiểu. Ở đây, số hệ số chính là số mẫu dữ liệu cần có.
Phương pháp bề mặt đáp ứng đa thức thường gồm các bước sau:
- Bước 1: Khởi tạo mô hình;
- Bước 2: Thực hiện vòng lặp, mô hình sẽ liên tục được thêm hoặc loại bỏ các biến dự
báo theo một tiêu chí đặc biệt;
- Bước 3: Dừng tìm kiếm khi vòng lặp kết thúc.
Dựa trên kỹ thuật này, có một số đề xuất gần đây như [2, 4, 9, 14, 16].
2.1.3. Máy véc-tơ hỗ trợ (The support vector machine - SVM)
Trong công trình [16], dựa trên lý thuyết học máy thống kê, tác giả đề xuất phương
pháp sử dụng máy véc-tơ hỗ trợ bao gồm một số phương pháp học có giám sát. Ở đây,
tập dữ liệu được phân tích để nhận dạng mẫu. Phương pháp này sử dụng các siêu bề mặt
(hyperlanes) trong không gian nhiều chiều để phân lớp, hồi quy và phân tích dữ liệu. Tập
đầu vào ánh xạ tới không gian rộng hơn và khi đó chi phí tính toán sẽ giảm đi đáng kể so
với việc tính toán tích véc-tơ của các biến trong không gian ban đầu. Khái niệm hàm
nhân (kernel function) K(x, y) được sử dụng để giải bài toán hồi quy, là tích véc-tơ có
hướng trong không gian rộng hơn. Hàm mất mát (loss function) cũng được dùng đến, là
giá trị đo khoảng cách. Bài toán xấp xỉ tập dữ liệu được biểu diễn như sau:
( ) ( ) , wf x g x b= + (6)
Công nghệ thông tin
6 N. Đ. Định, N. Long, T. T. Kiên, “Kỹ thuật chỉ dẫn cho giải thuật mô hình đại diện.”
Và cực tiểu của hàm (7) được gọi là hàm hồi quy tối ưu, trong đó: C là một giá trị xác
định, − và + là các biến không chặt thể hiện ràng buộc trên và dưới của tập kết quả.
( )2
1
1
( , )
2
n
i i
i
w w C − +
=
= + + (7)
Có một số đề xuất theo phương pháp SVM được công bố ở [10, 15, 16].
2.1.4. Kriging (KRG)
Trong đề xuất [11], tác giả giới thiệu phương pháp Kriging, là một phương pháp bề
mặt đáp ứng dựa trên kỹ thuật dự báo không gian. Phương pháp này cực tiểu hóa sai số
bình phương trung bình để xây dựng mối tương quan không gian theo các giá trị của một
thuộc tính. Trong công trình [18], tác giả phát triển một mô hình hồi quy tham số, được
gọi là DACE. Mô hình này là sự mở rộng của phương pháp Kriging đối với bài toán có
tối thiểu ba mục tiêu. Mô hình kết hợp giữa hàm đã biết f(x) và hàm ngẫu nhiên Gauss
f’(x) được giả định có giá trị trung bình bằng không và hiệp phương sai là:
( ) ( ) ( ) ( ) ( ) ( )
2( '( ), '( )) ( '( ), '( )) ( , , )
i j i j i j
E f x f x Cov f x f x R x x = = (8)
Trong đó,
( )j
x là hàm tương quan với tham số θ, σ là phương sai quá trình của đáp
ứng và
( ) ( )
( , , )
i j
R x x .
Dựa trên phương pháp Kriging, có một số công bố gần đây như [1, 2, 5, 7, 20].
Trong phần tiếp theo của bài báo, chúng ta sẽ tìm hiểu và phân tích hiệu quả của kỹ
thuật Kriging, kỹ thuật hay được chọn để giải bài toán đa mục tiêu khó, thông qua một số
giải thuật tiêu biểu.
2.2. Một số giải thuật tiêu biểu
Bài báo lựa chọn hai giải thuật gần đây sử dụng mô hình đại diện dựa trên kỹ thuật
Kriging giải bài toán đa mục tiêu khó được xem là hiệu quả để phân tích, đánh giá những
vấn đề về cải thiện, nâng cao chất lượng giải thuật. Hai giải thuật đó là K-RVEA
(Kriging-assisted reference vector guided evolutionary algorithm) và CSEA
(Classification based surrogate-assisted evolutionary algorithm).
2.2.1. Giải thuật K-RVEA
Giải thuật K-RVEA được xây dựng dựa trên giải thuật RVEA [21], một giải thuật tiến
hóa đa mục tiêu sử dụng véc-tơ tham chiếu. Trong giải thuật RVEA, quá trình tìm kiếm
được chỉ dẫn bởi một tập véc-tơ tham chiếu được sinh ra từ các véc-tơ hướng. Các véc-tơ
tham chiếu chia không gian mục tiêu thành các không gian con. Sau đó, thực hiện chiến
lược lựa chọn giải pháp tinh tú trong mỗi không gian con, sử dụng giá trị khoảng cách
góc phạt (angle-penalized distance - APD) để đo khoảng cách giải pháp tới điểm lý
tưởng và mức độ gần của giải pháp với véc-tơ tham chiếu. Ví dụ minh họa cho giải thuật
RVEA được thể hiện hình 1. Ở ví dụ này, f’ là véc-tơ mục tiêu chuyển đổi, v1 và v2 là hai
véc-tơ tham chiếu đơn vị, 1 và 2 là góc giữa f’ với v1, f’ với v2. Nếu 2 < 1 thì giải
pháp biểu diễn bởi f’ sẽ được gán với v2.
Giải thuật K-RVEA gồm ba bước cơ bản là: khởi tạo, sử dụng và cập nhật mô hình
đại diện.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2020 7
- Khởi tạo: Giải thuật khởi tạo quần thể bằng phương pháp lấy mẫu LHS (Latin
hypercube sampling). Tạo hai tập A1 và A2 để lưu trữ các cá thể được đánh giá bởi hàm
mục tiêu gốc. Mô hình Kriging cho mỗi hàm mục tiêu sẽ được xây dựng bởi các cá thể
của tập A1.
- Sử dụng mô hình đại diện: Giải thuật sử dụng mô hình Kriging thay cho hàm mục
tiêu gốc để tính giá trị thích nghi. Mô hình này được sử dụng để đánh giá thích nghi cho
một số cố định thế hệ mà không cần cập nhật mô hình.
- Cập nhật mô hình đại diện: Sau khi quá trình tiến hóa sử dụng mô hình đại diện trải
qua một số thế hệ, mô hình Kriging sẽ được cập nhật. Việc lựa chọn cá thể để đánh giá
lại bởi hàm gốc để cập nhật mô hình là có ý nghĩa rất lớn đối với hiệu quả giải thuật. Các
thông tin từ mô hình Kriging được sử dụng để lựa chọn các cá thể cho việc huấn luyện
lại mô hình.
Hình 1. Ví dụ biểu diễn cách gán một giải pháp với một véc-tơ tham chiếu.
Hình 2. Phân cụm các véc-tơ tham chiếu thích ứng tích cực Va.
Các cá thể này sẽ được đánh giá lại bởi hàm mục tiêu gốc và các dữ liệu mẫu này sẽ
được thêm vào cả tập A1 và A2. Tác giả cũng sử dụng kỹ thuật lựa chọn dựa trên véc-tơ
tham chiếu để đảm bảo tập A1 chỉ lưu trữ một số lượng cá thể nhất định, nghĩa là sẽ phải
loại bỏ cá thể dư thừa. Kỹ thuật này được thực hiện bằng cách phân cụm các véc-tơ tham
chiếu rồi lựa chọn ngẫu nhiên một điểm dữ liệu được giữ lại từ mỗi cụm và phần dữ liệu
còn lại sẽ bị loại bỏ. Điều này giúp giải thuật duy trì được một số lượng cố định dữ liệu
huấn luyện có tính đa dạng trong tập A1.
2.2.2. Giải thuật CSEA
Các tác giả trong [20] đã đề xuất CSEA, một giải thuật tiến hóa đa mục tiêu dựa vào
Công nghệ thông tin
8 N. Đ. Định, N. Long, T. T. Kiên, “Kỹ thuật chỉ dẫn cho giải thuật mô hình đại diện.”
kỹ thuật phân lớp sử dụng mô hình đại diện để giải các bài toán đa mục tiêu khó. Với
CSEA, các giải pháp sẽ được phân thành hai nhóm khác nhau, sau đó sử dụng một mô
hình đại diện để huấn luyện tiêu chí phân lớp nhằm dự báo các giải pháp ứng viên sẽ vào
nhóm nào và sử dụng chiến lược lựa chọn để tìm các giải pháp có chất lượng hội tụ tốt
cho việc đánh giá. Đặc điểm chính của CSEA là tiêu chí phân lớp và chiến lược quản lý
mô hình đại diện.
- Tiêu chí phân lớp: Cách phân lớp phụ thuộc rất lớn vào tiêu chí phân lớp. Dựa trên
cơ sở các bài toán đa mục tiêu chỉ có hai loại giải pháp là trội và không trội, nên cần có
một tập giải pháp tham chiếu làm biên trội Pareto để chia tất cả các giải pháp vào hai
nhóm khác nhau. Để chọn tập giải pháp tham chiếu này, các tác giả đã sử dụng chiến
lược lựa chọn dựa trên kỹ thuật phân chia không gian hướng tia, tức là chọn các giải
pháp được đánh giá bởi hàm mục tiêu mà chiếu đầu tiên vào trong không gian hướng tia
2 chiều.
xd
xi
x1
b1
b2
bh
bq
y1
yj
yl
...
...
...
...
...
...
Lớp đầu vào Lớp ẩn Lớp đầu ra
v1h
vih
vdh
w1j
w2j
whj
wqj
( ),h hidden hb K =
1
d
h ih i
i
v x
=
= ( ),j output jy K =
1
w
q
j hj h
h
b
=
=
Hình 3. Minh họa cấu trúc 3 lớp mạng nơ-ron truyền thẳng sử dụng trong CSEA.
- Để quản lý mô hình đại diện, CSEA chia thành bốn bước cơ bản:
+ Khởi tạo: Khởi tạo các tham số (K: Số giải pháp tham chiếu, gmax: số giải pháp
được đánh giá bởi mô hình) và cấu trúc của mạng nơ-ron truyền thẳng (Feedforward
neural networks - FNNs) như trong hình 3. Mạng nơ-ron này có kết nối giữa các nơ-ron
không tạo thành một vòng khép kín. Ba thành phần chính của mạng nơ-ron cần phải khởi
tạo là: cấu trúc mạng, trọng số và hàm kích hoạt;
+ Cập nhật: Cập nhật trọng số cho mạng nơ-ron với tập dữ liệu huấn luyện. Phương pháp
lan truyền ngược Lenvenberg-Marquardt được sử dụng để cập nhật trọng số cho mạng;
+ Kiểm tra hợp lệ: Sử dụng sai số trên tập dữ liệu kiểm tra để ước lượng khả năng dự báo
không chắc chắn của mạng nơ-ron. Các sai số được tính toán bằng kiểm tra hợp lệ chéo;
+ Lựa chọn sử dụng mô hình đại diện: Trong bước này, các giải pháp tiềm năng được
chọn để đánh giá thích nghi. Việc lựa chọn dựa vào khả năng dự báo cũng như độ tin
cậy. Sử dụng các sai số trên tập dữ liệu kiểm tra để ước lượng độ tin cậy trong dự báo
của mạng nơ-ron. Một cặp sai số (cho hai nhóm giải pháp) tạo ra một điểm đặt trong
vùng cấu hình tin cậy, tính không chắc chắn của mạng. Không gian ở đây sử dụng để
biểu diễn quan hệ giữa độ không chắc chắn và sai số kiểm tra của mạng.
Trong giải thuật CSEA, có hai vòng lặp: vòng lặp chính biểu diễn quá trình tiến hóa
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2020 9
sử dụng hàm mục tiêu gốc; và tại vòng lặp thứ hai, các giải pháp được chọn thông qua
việc phân lớp của mô hình đại diện, minh họa thể hiện trong hình 4.
Cá thể con
Cập nhật và kiểm
tra mô hình
Lựa chọn cá
thể tham chiếu
Toán tử tiến
hóa
Kết hợp giải pháp
tốt và tham chiếu
Kết hợp cá thể cha
mẹ và cá thể con
Lựa chọn môi
trường
VÒNG LẶP
CHÍNH
Kết thúc
Các toán tử tiến hóa
Cá thể con
Kết thúc
Cá thể tốt
Lựa chọn mô
hình đại diện
Cá thể cha mẹ
Đánh giá lại
Khởi tạo
Cập nhật mô hình và
cấu hình độ tin cậy
VÒNG LẶP
PHỤ
Đánh giá lại
Hình 4. Minh họa vòng lặp chính đánh giá bằng hàm mục tiêu gốc và vòng lặp phụ chọn
các giải pháp từ mô hình đại diện.
2.3. Tiêu chí đánh giá chất lượng, hiệu quả giải thuật
Để có cơ sở đánh giá chất lượng, hiệu quả của giải thuật tiến hóa đa mục tiêu, chúng
ta quan tâm đến những tiêu chí sau:
- Thứ nhất, cân bằng giữa khả năng thăm dò và khai thác của quá trình tiến hóa: Bài
toán đa mục tiêu là bài toán tối ưu toàn cục. Do đó, giải thuật hiệu quả cần phải định
hướng tìm kiếm theo chiều sâu để nhanh chóng tìm ra giải pháp khả thi, hay nói cách
khác quá trình tiến hóa cần phải có khả năng khai thác (exploitation). Đồng thời, giải
thuật cũng cần phải tìm kiếm theo chiều rộng để tìm đa dạng lời giải, tránh các điểm tối
ưu cục bộ, nghĩa là quá trình tiến hóa cần phải có khả năng thăm dò (exploration). Do
vậy, để tìm kiếm hiệu quả các giải pháp tối ưu, cần duy trì sự cân bằng giữa khả năng
thăm dò và khả năng khai thác trong suốt quá trình tiến hóa.
- Thứ hai, chất lượng hội tụ và đa dạng của quần thể giải pháp: Với bài toán đa mục
tiêu, lời giải của giải thuật là tập các giải pháp không trội lẫn nhau và thường được tìm
kiếm theo nguyên lý Pareto. Do vậy, để giúp người dùng có cơ sở lựa chọn lời giải tốt
nhất, tập giải pháp tìm kiếm phải tiệm cận đến tập giải pháp lý tưởng hay lớp tối ưu
Pareto (Pareto optimal front - POF). Mặt khác, để có nhiều chọn lựa, các giải pháp đạt
được phải đa dạng trên không gian tìm kiếm. Vì vậy, để có quần thể giải pháp tốt, giải
thuật cần tìm kiếm tập giải pháp vừa có tính hội tụ, vừa có tính đa dạng. Nói cách khác,
về mặt trực quan, giải thuật cần định hướng tìm kiếm tập giải pháp vừa tiếp cận, vừa trải
đều trên mặt lớp tối ưu Pareto trong không gian mục tiêu.
Sự cân bằng giữa khả năng thăm dò và khai thác của quá trình tiến hóa có tác động
trực tiếp để đạt được tập giải pháp vừa có chất lượng hội tụ tốt, vừa đa dạng.
Từ phân tích nêu trên cho thấy, sự cân bằng giữa khả năng thăm dò và khai thác cùng
với việc hướng tới tập giải pháp có chất lượng hội tụ tốt và đa dạng là các tiêu chí chính
để đánh giá chất lượng, hiệu quả của giải thuật, là cơ sở để phát triển các giải thuật tốt.
Công nghệ thông tin
10 N. Đ. Định, N. Long, T. T. Kiên, “Kỹ thuật chỉ dẫn cho giải thuật mô hình đại diện.”
2.4. Đánh giá các yếu tố ảnh hưởng đến chất lượng, hiệu quả của giải thuật sử dụng
mô hình đại diện
Từ nghiên cứu cơ chế hoạt động của các giải thuật tiến hóa đa mục tiêu sử dụng mô
hình đại diện có thể nhận thấy một số yếu tố có tác động quan trọng đến quá trình tìm
kiếm, đó là:
- Thứ nhất, việc cập nhật mô hình (updating model): Cập nhật mô hình là bước quan
trọng, dựa trên việc huấn luyện tập dữ liệu mẫu là tập giải pháp có được trong quá trình
tìm kiếm. Đây là yếu tố ảnh hưởng đến khả năng tìm kiếm theo hướng khai thác, hướng
tập giải pháp hội tụ đến lớp tối ưu Pareto. Việc lựa chọn thời điểm để cập nhật mô hình rất
quan trọng, mang tính chiến lược, có tác động điều chỉnh quá trình tiến hóa cho phù hợp.
- Thứ hai, lựa chọn dữ liệu mẫu (sample data) để huấn luyện mô hình: Việc lựa chọn
số lượng, chất lượng dữ liệu mẫu là yếu tố tác động trực tiếp đến quá trình học máy để
huấn luyện mô hình, có ảnh hưởng đến khả năng tìm kiếm theo hướng thăm dò, tạo ra
tính đa dạng cho quần thể giải pháp.
Hai yếu tố trên được tham số hóa cho các giải thuật, giúp người dùng có nhiều lựa
chọn trong quá trình thiết lập môi trường. Tuy vậy, các tham số này thường được thiết
lập cố định từ đầu, không thay đổi, không điều chỉnh trong suốt quá trình tìm kiếm.
Qua phân tích quá trình tìm kiếm, có thể thấy rằng một số điều kiện có tác động trực
tiếp đến hai yếu tố trên như sau: Về thời điểm của quá trình tiến hóa, ở những thế hệ đầu,
xuất phát từ quần thể khởi tạo, khi dữ liệu cho huấn luyện còn ít, cần ưu tiên tìm kiếm
chiều sâu (hướng khai thác) để tìm các giải pháp có xu hướng hội tụ. Ở những thế hệ giai
đoạn giữa của quá trình, cần phải duy trì tìm kiếm theo cả hướng thăm dò và khai thác để
đạt được tập giải pháp tốt cả về chất lượng hội tụ và đa dạng. Ngược lại, ở những thế hệ
cuối, khi các giải pháp đã đủ tốt về chất lượng hội tụ, ít có cải thiện qua các thế hệ thì lúc
này cần ưu tiên tìm kiếm theo hướng thăm dò để đạt được tính đa dạng của quần thể giải
pháp. Một trong các điều kiện tác động đến việc cần điều chỉnh các tham số để hướng
đến sự cân bằng thăm dò và khai thác, cải thiện tính hội tụ và đa dạng, đó chính là chất
lượng của quần thể tại thời điểm đánh giá, trong đó số giải pháp không bị trội (non-
dominated) là thể hiện cơ bản về chất lượng quần thể.
Một yếu tố hết sức quan trọng nữa đó là độ phức tạp của hàm mục tiêu gốc. Do giải
thuật sử dụng mô hình đại diện vẫn sử dụng hàm gốc để tạo ra tập dữ liệu dùng cho huấn
luyện, vì thế đánh giá sự phức tạp của hàm mục tiêu gốc cũng là yếu tố để điều chỉnh các
tham số cho phù hợp.
Với những phân tích ở trên thấy rằng, việc thiết lập các tham số cố định, không tính
đến các điều kiện trong quá trình tìm kiếm có thể tạo ra cơ chế mang tính cứng, làm
giảm sự linh hoạt và khả năng điều chỉnh quá trình tiến hóa.
Vấn đề đặt ra là chúng ta có thể đánh giá, quan sát các điều kiện liên quan ở trên để
chỉ dẫn cho giải thuật hướng tới duy trì tốt sự cân bằng thăm dò và khai thác của quá
trình tiến hóa, cải thiện chất lượng hội tụ và đa dạng của quần thể giải pháp, thông qua
việc điều chỉnh các tham số tại một số thời điểm cụ thể.
Bằng các lập luận ở trên, khi phân tích cơ chế hoạt động của các giải thuật sử dụng
mô hình đại diện tiêu biểu là K-RVEA và CSEA, có thể thấy một số vấn đề như sau:
- Với K-RVEA, giải thuật đã sử dụng các tham số cố định (được thiết lập giá trị từ đầu)
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2020 11
cho việc cập nhật mô hình đại diện. Điều này làm cho giải thuật thiếu tính linh hoạt, gây
ra sự mất cân bằng giữa khả năng thăm dò và khai thác. Qua thử nghiệm giải thuật K-
RVEA với lớp bài toán DTLZs cùng với các tham số khác nhau, đó là sử dụng tham số
wmax (số thế hệ sử dụng mô hình đại diện trước khi cập nhật mô hình Kriging) với các giá
trị 10, 20, 30, 50, 70 cho các bài toán DTLZ1 đến DTLZ9 và tham số FEmax là 20.000 lần
đánh giá, kết quả thể hiện qua hai độ đo GD và IGD như sau: Tại mỗi thời điểm, phụ
thuộc vào quá trình tiến hóa, giá trị wmax có ảnh hưởng đến khả năng thăm dò và khai
thác hay nói cách khác là chất lượng hội tụ và đa dạng của quần thể. Đặc biệt, ở các thế
hệ đầu, việc cập nhật nhanh mô hình cho kết quả tốt hơn khi wmax có giá trị nhỏ với các
bài toán DTLZ1, DTLZ2, DTLZ4, DTLZ5. Ở các thế hệ tiếp theo, có sự thay đổi là kết
quả tốt hơn với các bài toán DTLZ1, DTLZ2, DTLZ6, DTLZ7 khi tăng giá trị wmax, nhất
là với bài toán DTLZ9. Như vậy, khi tham số wmax với giá trị được thiết lập cố định thì
chưa thực sự đạt hiệu quả giải thuật, giảm chất lượng hội tụ và đa dạng. Việc áp dụng số
thế hệ sử dụng các hàm mục tiêu gốc trước khi sử dụng hàm đại diện theo mô hình
Kriging có liên hệ với chất lượng của quần thể tại thời điểm xét. Khi số giải pháp không
bị trội trong quần thể là nhỏ và còn xa lớp tối ưu Pareto, sẽ rất thích hợp nếu tham số này
đặt ở mức phù hợp (mức giá trị 30 hoặc 50). Nếu tỉ lệ này cao, chất lượng phụ thuộc rất
lớn vào việc sử dụng hàm mục tiêu gốc và hiệu quả của việc sử dụng hàm đại diện không
đáng kể. Nếu tỉ lệ này thấp, số cá thể nhiều, việc cập nhật mô hình đại diện sẽ không có
nhiều tác động đến chất lượng. Khi số giải pháp không bị trội trong quần thể đủ lớn
nhưng vẫn chưa gần lớp tối ưu Pareto, sẽ cần phải tăng số lần đánh giá sử dụng hàm đại
diện và tăng tần suất cập nhật mô hình Kriging (phụ thuộc vào chất lượng quần thể, giá
trị của wmax có thể là 20 hoặc 30). Khi số giải pháp không bị trội trong quần thể tiệm cận
lớp tối ưu Pareto thì tần suất sử dụng hàm đại diện và tần suất cập nhật mô hình cần lớn
hơn, lúc này giá trị wmax có thể là 10. Nhìn chung, việc tăng hay giảm giá trị wmax phụ
thuộc vào các yếu tố chính là: thời gian tiến hóa, chất lượng hội tụ của quần thể và độ
phức tạp tính toán của mỗi bài toán.
- Với CSEA, chiến lược để lựa chọn các giải pháp tham chiếu là một yếu tố quan trọng
đối với hiệu quả giải thuật. Tham số chính của giải thuật CSEA là K, tức là số giải pháp
tham chiếu được lựa chọn. Tham số K có tác động khá lớn tới sự hội tụ đến lớp tối ưu
Pareto cũng như khả năng mở rộng tìm kiếm giải pháp ở các khu vực lân cận. Nói cách
khác, từ các giải pháp tham chiếu được chọn, sẽ có chiến lược thăm dò hoặc khai thác ở
mức độ khác nhau trong quá trình tiến hóa. Việc chọn nhiều giải pháp tham chiếu có thể
tăng cường khả năng khai thác, hướng đến các giải pháp tốt một cách nhanh nhất, nhưng
có thể làm hạn chế khu vực tìm kiếm giải pháp, hay khả năng thăm dò giảm đi. Những
xu hướng khác nhau đó sẽ tạo ra sự khác nhau về chất lượng hội tụ và đa dạng. Thực
vậy, khi thử nghiệm với các giá trị K khác nhau, chúng tôi nhận thấy rằng: khi giá trị K
lớn, tiến trình hướng đến lớp tối ưu Pareto khá nhanh (thể hiện qua giá trị độ đo GD), có
nghĩa là chất lượng hội tụ của tập giải pháp khá tốt, nhưng không gian tìm kiếm lại
hướng đến khu vực tương đối cục bộ, thậm chí có thể bị “tắc” ở một khu vực cục bộ, làm
giảm tính chất toàn cục của bài toán, đồng thời tính đa dạng của tập giải pháp không
được tốt. Ngược lại, khi giá trị K nhỏ, khả năng thăm dò của quá trình tiến hóa và tính đa
dạng của quần thể là tốt, nhưng khả năng khai thác lại kém đi, thể hiện qua tính hội tụ
của quần thể không tốt.
Vấn đề đặt ra là làm thế nào có thể tùy biến giá trị K một cách thích hợp để nâng cao
Công nghệ thông tin
12 N. Đ. Định, N. Long, T. T. Kiên, “Kỹ thuật chỉ dẫn cho giải thuật mô hình đại diện.”
hiệu quả của giả thuật thông qua việc duy trì tính cân bằng giữa khả năng thăm dò và
khai thác của quá trình tiến hóa, đồng thời, duy trì quần thể đạt chất lượng cao nhất cả về
tính hội tụ và đa dạng. Trong công bố về CSEA, các tác giả cũng đã đánh giá được mức
độ ảnh hưởng quan trọng của tham số K, tuy nhiên, các tác giả chỉ phân tích về mối quan
hệ giữa K và số mục tiêu để chọn một giá trị K thực nghiệm và giá trị đó luôn là 6. Tuy
nhiên, vì giá trị của K được thiết lập cố định từ đầu nên CSEA thiếu đi sự thích ứng linh
hoạt, có thể làm mất sự cân bằng giữa khả năng thăm dò và khai thác của giải thuật.
Từ phân tích về các đặc điểm của các giải thuật tiến hóa đa mục tiêu nói chung và giải
thuật sử dụng mô hình đại diện nói riêng, chúng tôi giả thuyết rằng để đánh giá đầy đủ
hiệu quả của giải thuật, cần phải tính đến các yếu tố tác động khác để có chiến lược xác
định số giải pháp tham chiếu phù hợp hơn. Qua đó, có thể sử dụng kỹ thuật chỉ dẫn để
tăng cường chất lượng của giải thuật, nâng cao khả năng giải quyết các bài toán khó
trong thực tế.
3. KỸ THUẬT CHỈ DẪN
Chỉ dẫn (guidance technique) là một kỹ thuật nhận được nhiều sự quan tâm, nghiên
cứu và đã có nhiều kết quả được công bố. Kỹ thuật chỉ dẫn là từ việc phân tích thông tin
tham chiếu từ các nguồn như: quá trình tiến hóa; thông tin trích rút từ quần thể giải pháp,
tập lưu trữ ngoài, giá trị độ đo, dự báo; thông tin người dùng, để điều chỉnh quá trình
tiến hóa hướng đến sự cải thiện nào đó.
Kỹ thuật chỉ dẫn được phân làm hai loại chính là: Chỉ dẫn tự động và chỉ dẫn thông
qua tương tác.
Với phương pháp chỉ dẫn tự động, quá trình điều chỉnh tham số được tiến hành liên
tục, đều đặn qua mỗi thế hệ hoặc tại một thời điểm xác định nào đó. Ưu điểm của
phương pháp này là quá trình điều chỉnh linh hoạt hơn, kịp thời hơn. Tuy nhiên, việc
đánh giá trước khi quyết định điều chỉnh tại mỗi thời điểm lại khó khăn hơn, cần phải có
cơ chế để giới hạn biên cho các điều chỉnh từ các phép tính tự động giá trị tham số.
Với phương pháp chỉ dẫn thông qua tương tác, các thông tin tham chiếu được biểu
diễn, mô phỏng, cung cấp cho người dùng một cách trực quan và người dùng với kỹ
năng, kinh nghiệm sẽ điều chỉnh các tham số theo việc phân tích các điều kiện tác động
tại thời điểm cụ thể. Phương pháp này dễ tiến hành nhưng lại đòi hỏi người ra quyết định
phải có kiến thức và phải có chiến lược lựa chọn thời điểm tương tác phù hợp.
4. KỸ THUẬT CHỈ DẪN CHO GIẢI THUẬT TIẾN HÓA ĐA MỤC TIÊU
SỬ DỤNG MÔ HÌNH ĐẠI DIỆN
Trên cơ sở phân tích các yếu tố ảnh hưởng đến việc tăng cường duy trì sự cân bằng
giữa khả năng thăm dò và khai thác, đặc điểm của giải thuật tiến hóa đa mục tiêu sử
dụng mô hình đại diện, chúng tôi giả thuyết rằng: Việc cập nhật mô hình đại
Các file đính kèm theo tài liệu này:
- ky_thuat_chi_dan_cho_giai_thuat_tien_hoa_da_muc_tieu_su_dung.pdf