ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CƠNG NGHỆ
Trần Hồi Nam
CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
YÊU CẦU VÀ CÁC VẤN ĐỀ
LUẬN VĂN THẠC SĨ
Hà Nội – 2004
2
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CƠNG NGHỆ
Trần Hồi Nam
CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
YÊU CẦU VÀ CÁC VẤN ĐỀ
Chuyên ngành : Cơng nghệ thơng tin
Mã số : 1.01.10
LUẬN VĂN THẠC SĨ
Người hướng dẫn khoa học: PGS.TS. Vũ Đức Thi
Hà Nội – 2004
3
Mục lục
BẢNG THUẬT NGỮ VÀ CÁC CHỮ VIẾT TẮT .........................
88 trang |
Chia sẻ: huyen82 | Lượt xem: 1690 | Lượt tải: 0
Tóm tắt tài liệu Cơ sở dữ liệu đa phương tiện yêu cầu và các vấn đề, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
................................4
LỜI CẢM ƠN ..................................................................................................................5
MỞ ĐẦU..........................................................................................................................7
CHƯƠNG 1 ...................................................................................................................10
GIỚI THIỆU CHUNG VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN............................10
1.1 Các kiểu truyền thơng và multimedia .............................................................11
1.1.1. Cơ sở dữ liệu và các DBMS ....................................................................12
1.1.2. Truy tìm thơng tin tài liệu văn bản ..........................................................12
1.1.3. Truy xuất và chỉ số hố multimedia.........................................................13
1.1.4. Trích rút đặc trưng, biểu diễn nội dung và chỉ số hố .............................13
1.2 Sự cần thiết đối với MIRS...............................................................................13
1.2.1. Sự phát triển về dữ liệu multimedia và các đặc trưng của nĩ..................14
1.2.2. Các DBMS và vai trị của chúng trong việc xử lý dữ liệu multimedia....15
1.2.3. Hệ thống IR và vai trị của nĩ trong việc truy xuất multimedia ..............18
1.2.4. Cách tiếp cận tích hợp việc truy xuất và chỉ số hố thơng tin multimedia
19
1.3 Tổng quan về MIRS ........................................................................................19
1.4 Các ứng dụng nĩi chung và khả năng mong đợi của MIRS...........................20
CHƯƠNG 2 ...................................................................................................................24
CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (Multimedia Database) ................................24
2.1 Kiến trúc cho việc tổ chức nội dung................................................................25
2.4.1 Nguyên lý tự trị ........................................................................................25
2.4.2 Nguyên lý đồng nhất ................................................................................26
2.4.3 Nguyên lý lai ghép ...................................................................................27
2.2 Tổ chức dữ liệu multimedia dựa trên nguyên lý đồng nhất. ..........................30
2.3 Cấu trúc tĩm tắt media ....................................................................................32
2.4.1 Dữ liệu ảnh như là một tĩm tắt media. ....................................................33
2.4.2 Dữ liệu video như là một tĩm tắt media. .................................................34
2.4.3 Định nghĩa về một CSDL Multimedia đơn giản ......................................36
2.4.4 Định nghĩa về một CSDL Multimedia cĩ cấu trúc ..................................37
2.4 Ngơn ngữ truy vấn khai thác dư liệu multimedia............................................39
2.4.1 Truy vấn SMDSs (mơ tả đồng nhất) ........................................................40
2.4.2 Truy vấn dữ liệu multimedia mơ tả dưới kiến trúc lai tạo. ......................43
2.4.3 Chỉ số hố SMDS với chỉ số đảo. ............................................................46
CHƯƠNG 3 ...................................................................................................................52
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯONG TIỆN – YÊU CẦU VÀ CÁC VẤN
ĐỀ...................................................................................................................................52
3.1 Mục đích của MDBMS ...................................................................................52
4
3.2 Các yêu cầu của một MDBMS........................................................................55
3.2.1 Khả năng quản trị lưu trữ lớn...................................................................57
3.2.2 Hỗ trợ truy vấn và khai thácdữ liệu. ........................................................58
3.2.3 Tích hợp các phương tiện, tổng hợp và thể hiện......................................59
3.2.4 Giao diện và tương tác. ............................................................................59
3.2.5 Hiệu suất. .................................................................................................60
3.3 Các vấn đề của MDBMS.................................................................................60
3.3.1 Mơ hình hố dữ liệu MULTIMEDIA ......................................................60
3.3.2 Lưu trữ đối tượng MULTIMEDIA..........................................................62
3.3.3 Tích hợp multimedia, thể hiện và chất lượng của dịch vụ (QoS)............63
3.3.4 Chỉ số hố multimedia .............................................................................64
3.3.5 Hỗ trợ truy vấn multimedia, khai thác và duyệt qua................................65
3.3.6 Quản trị CSDL multimedia phân tán .......................................................66
3.3.7 Sự hỗ trợ của hệ thống .............................................................................67
CHƯƠNG 4 ...................................................................................................................69
XÂY DỰNG HỆ THỐNG MUA BÁN HÀNG QUA MẠNG......................................69
4.2.1. Giới thiệu .....................................................................................................69
4.2.2. Ứng dụng CSDL đa phương tiện vào hệ thống bán hàng qua mạng...........70
4.2.1. Xây dựng kho dữ liệu hình ảnh 2D và 3D...............................................71
4.2.2. Xây dựng cơ chế truy vấn đối với kho dữ liệu hình ảnh .........................71
4.2.3. Hệ thống bán hàng qua mạng ......................................................................73
4.3.1. Mơ hình hệ thống .....................................................................................73
4.3.2. Các chức năng cơ bản của hệ thống.........................................................75
4.3.3. Các cơng cụ phát triển hệ thống...............................................................76
4.3.4. Quy trình thực hiện giao dịch của hệ thống.............................................77
4.3.5. Cài đặt hệ thống .......................................................................................78
4.4. Giải pháp tích hợp các hệ thống khác .............................................................80
4.4.1. Hệ thống quản lý và cấp phát chứng chỉ số (CA)....................................80
4.4.2. Hệ thống thanh tốn trực tuyến (VASC Payment) ..................................81
4.5. Một số giao diện chính của hệ thống...............................................................83
KẾT LUẬN....................................................................................................................86
TÀI LIỆU THAM KHẢO..............................................................................................87
BẢNG THUẬT NGỮ VÀ CÁC CHỮ VIẾT TẮT
5
STT Ký hiệu viết tắt Giải thích
1 Web browser Trình duyệt Web
2 CSDL Cơ sở dữ liệu
3 DBMS Hệ quản trị cơ sở dữ liệu
4 MDBMS Hệ quản trị cơ sở dữ liệu đa phương tiện
5 Video frame Khung hình video
6 RDBMS Hệ quản trị cơ sở dữ liệu quan hệ
7 Multimedia Đa phương tiện
8 MIRS Hệ thống truy vấn thơng tin đa phương tiện
9 Metadata Siêu dữ liệu
10 Media Phương tiện
11 SMDS Hệ thống cơ sở dữ liệu đa phương tiện cĩ cấu trúc
12 Information Retrival(IR) Truy xuất thơng tin
13 Multimedia Information
Retrieval System (MIRS)
Hệ thống truy xuất thơng tin đa phương tiện
LỜI CẢM ƠN
6
Tơi xin bầy tỏ lịng kính trọng và biết ơn sâu sắc tới PGS.TS Vũ Đức Thi, người thầy,
người đồng nghiệp đã trực tiếp hướng dẫn, cho tơi những định hướng và những ý kiến
rất quý báu về cơ sở dữ liệu đa phương tiện. Tơi cũng xin chân thành cám ơn các đồng
nghiệp của tơi tại phịng Các hệ thống quản trị dữ liệu – Viện Cơng nghệ thơng tin đã
giúp đỡ tơi rất nhiều trong quá trình cơng tác để tơi cĩ thể hồn thành bản luận văn này
một cách tốt đẹp
Xin chân thành cám ơn các bạn bè của tơi, trong nước cũng như ngồi nước đã giúp đỡ
tơi rất nhiều trong quá trình tìm tịi và sưu tầm tài liệu.
Cuối cùng xin châm thành cám ơn các thành viên trong gia đình đã động viên và tạo
mọi điều kiện thuận lợi để tơi cĩ được kết quả như ngày hơm nay.
Hà nội ngày 20/06/2004
Học viên
Trần Hồi Nam
7
MỞ ĐẦU
Cơng nghệ multimedia liên quan tới việc mơ tả sự kết hợp các dạng thức thơng tin
khác nhau (văn bản, dữ liệu, hình ảnh, âm thanh, video) dưới dạng tín hiệu số. Cĩ thể
nêu ra đây một số ứng dụng multimedia như :
• E-learning.
• Hội thảo Video (Video Conferencing).
• Thư viện điện tử (Elibrary).
• Hiện tại ảo (Vitual Reality).
Các cơng nghệ truyền dùng để thao tác, truyền phát, điều khiển các dữ liệu multimedia
đã và đang được nghiên cứu một cách rất sơi động.
Các hệ thống multimedia cần cĩ một hệ thống phân phối nhằm mục đích thu thập các
đối tượng multimedia và đưa chúng đến người dùng, một trong số các phương tiện đầu
tiên được dùng dến là đĩa từ và đĩa quang. Ngày nay, Internet cũng như các giao thức
khác như TCP/IP, NetBIOS, các mạng Lan đang trở thành các phương tiện để truyền
bá dữ liệu multimedia . Khả năng mơ tả phong phú cũng như khả năng đồ họa của các
web browser cùng với các tính năng đang được tiếp tục tăng cường như hoạt họa, âm
thanh và Video khiến các web browser đang trở thành một phương tiện mới để mang
lại các dữ liệu multimedia cho người dùng[5]
Các cơng nghệ chủ yêu liên quan đến multimedia bao gồm:
• Kỹ thuật nén.
• Video Servers.
• Các kỹ thuật về mạng (internet, tokenring, ethernet, ATM …vv).
• Các cơng nghệ truyền dữ liệu.
• Các cơng nghệ về cáp truyền dẫn.
• Cơng nghệ xác thực.
• Các cơng nghệ về CSDL.
8
Một CSDL là tập hợp của các dữ liệu cĩ liên quan đến nhau. Một hệ quản trị CSDL
(DBMS) là hệ thống phần mềm trợ giúp cho các quá trình khai báo, xây dựng và thao
tác với CSDL phục vụ cho các ứng dụng khác nhau. CSDL multimedia bao gồm thêm
các kiểu dữ liệu khác như:
• Văn bản.
• Hình ảnh.
• Âm thanh.
• Video.
• Hoạt hình.
Các kiểu dữ liệu khác này địi hỏi phải cĩ các phương thức đặc biệt nhằm mục đích tối
ưu hĩa cho việc lưu trữ, truy cập, chỉ số hố và khai thác. Một MDBMS phải cung cấp
một mơi trường thích hợp để quản lý và sử dụng CSDL multimedia.
Một MDBMS cần phải đảm bảo các tính năng cơ bản của một DBMS, ngồi ra nĩ cịn
phải cĩ các tính năng khác như:
• Tích hợp các phương tiện khác (Media Intergration).
• Khả năng sắp xếp và mơ tả thơng tin.
• Khả năng khai thác dữ liệu..
• Khả năng lưu trữ lớn.
• Giao diện multimedia.
• Hỗ trợ truy vấn tương tác multimedia.
Thơng thường các đối tượng riêng lẻ của một hình ảnh hoặc một video frame sẽ cĩ một
vài mối liên hệ bộ phận với các đối tượng khác. Các mối liên hệ này đưa đến một số
các ràng buộc trong quá trình tìm kiếm các đối tượng trong CSDL multimedia. Căn cứ
trên cơ sở này việc triển khai các ứng dụng multimedia trên nền các hệ quản trị CSDL
hướng đối tượng sẽ thuận lợi hơn so với các RDMBS hiện thời[1].
9
Mục tiêu chính của bản luận văn này nhằm nghiên cứu và tìm hiểu một số vấn đền cơ
bản của một MDBMS:
• Tổng quan về cơ sử dữ liệu đa phương tiện
• Các yêu cầu của một MDBMS cũng như kiến trúc, thiết kế và truy vấn đối với
một MDBMS.
Luận văn này được bố cục thành 5 phần chính:
• Chương I: Giới thiệu chung về CSDL multimedia.
• Chương II: Cơ sở dữ liệu multimedia.
• Chương III: Hệ quản trị cơ sở dữ liệu multimedia – Yêu cầu và các vấn đề
• Chương IV: Xây dựng hệ thống bán hàng qua mạng.
• Kết luận
10
CHƯƠNG 1
GIỚI THIỆU CHUNG VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
Dữ liệu multimedia được chia thành hai lớp là các dữ liệu liên tục và các dữ liệu khơng
liên tục. Các dữ liệu liên tục bao gồm các dữ liệu âm thanh, video thay đổi theo thời
gian. Các dữ liệu khơng liên tục là các dữ liệu khơng phục thuộc vào thời gian, các loại
dữ liệu đặc trưng cho dạng này là các dữ liệu văn bản (cĩ hoặc khơng cĩ định dạng),
hình ảnh tĩnh và các đối tượng đồ họa. Các kiểu dữ liệu thơng thường của một CSDL
multimedia bao gồm:
• Dữ liệu văn bản (cĩ hoặc khơng cĩ định dạng).
• Đồ họa: là các bản vẽ, minh họa được mã hĩa như các tệp postscript.
• Hình ảnh: là các hình ảnh được mã hĩa sử dụng các dạng thức chuẩn như là
JPEG hoặc MPEG.
• Các hoạt hình.
• Âm thanh.
• Video.
Các đặc tính chung của dữ liệu multimedia bao gồm:
• Thiếu cấu trúc: Các dữ liệu multimedia cĩ khuynh hướng phi cấu trúc vì vậy
các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hố, tìm kiếm nội dung, truy
vấn dữ liệu thường là khơng áp dụng được.
• Tính tạm thời: Một vài kiểu dữ liệu multimedia như là Video, âm thanh và hoạt
hình đều phụ thuộc vào yếu tố thời gian liên quan mật thiết đến việc lưu trữ,
thao tác và mơ tả chúng.
• Cĩ dung lượng lớn: các dữ liệu video và âm thanh thường địi hỏi các thiết bị
lưu trữ lớn.
11
• Các ứng dụng hỗ trợ: các dữ liệu phi chuần cĩ thể địi hỏi các quy trình xử lý
phức tạp như việc sử dụng các thuật tốn nén dữ liệu đối với các ứng dụng
CSDL multimedia.
1.1 Các kiểu truyền thơng và multimedia
Truyền thơng đề cập đến các kiểu thơng tin hoặc các kiểu biểu diễn thơng tin, ví dụ
như dữ liệu vần chữ cái, hình ảnh, âm thanh, truyền hình. Cĩ nhiều cách phân lớp
truyền thơng. Những cách phân loại chung được dựa trên những dạng vật lý và những
mối quan hệ truyền thơng với thời gian. Ta phân lớp truyền thơng dựa trên việc cĩ hay
khơng cĩ chiều thời gian. Ngầm định này hướng tới hai lớp truyền thơng tĩnh và động
(hoặc tính liên tục về thời gian).
Truyền thơng tĩnh khơng bao hàm yếu tố thời gian, các nội dung và nghĩa của chúng
khơng phụ thuộc vào thời gian được biểu diễn. Truyền thơng tĩnh bao gồm các dữ liệu
vần chữ cái, các đồ thị và các ảnh tĩnh.
Truyền thơng động bao hàm yếu tố thời gian, các nghĩa và tính chính xác của chúng
phụ thuộc vào loại được biểu diễn. Truyền thơng động gồm các hoạt hình, âm thanh và
video. Các truyền thơng này cĩ bản chất khoảng thống nhất hoặc tốc độ riêng của
chúng. Chẳng hạn, để truyền cảm giác chuyển động nhịp nhàng video phải thực hiện
25 hình mỗi giây (hoặc 30 hình phụ thuộc vào hệ thống video đang sử dụng). Tương
tự, khi chúng ta phát lại một lời nhắn hoặc đoạn nhạc đã được ghi âm, chỉ cĩ một loại
thể hiện là thích hợp. Việc phát lại ở chế độ nhanh hơn hoặc chậm hơn sẽ làm méo
nghĩa hoặc chất lượng âm thanh. Vì những truyền thơng này phải được phát liên tục ở
tốc độ cố định mà chúng thường được gọi là truyền thơng liên tục. Chúng cũng cịn
được gọi truyền thơng đẳng thời vì mối quan hệ cố định giữa mỗi đơn vị truyền thơng
và thời gian.
Truyền thơng đề cập đến một bộ sưu tập các kiểu truyền thơng đã sử dụng cùng nhau.
Điều đĩ cĩ nghĩa là ít nhất cĩ kiểu truyền thơng dữ liệu là khơng theo ký tự chữ (nghĩa
12
là ít nhất cĩ một kiểu truyền thơng là ảnh, âm thanh hoặc truyền hình). Ở đây,
“multimedia” được sử dụng như một tính từ vì vậy chúng ta sẽ nĩi một cách đặc trưng
là thơng tin multimedia, dữ liệu multimedia, hệ thống multimedia, liên lạc multimedia,
ứng dụng multimedia,... Dữ liệu multimedia chính là sự biểu diễn về các loại truyền
thơng multimedia mà máy tính cĩ thể đọc được. Thơng tin multimedia là thơng tin đã
truyền bằng các kiểu truyền thơng multimedia. Đơi khi, thơng tin multimedia và dữ
liệu multimedia được sử dụng cĩ thể thay cho nhau.
Đơi khi chúng ta sử dụng thuật ngữ multimedia hay truyền thơng và đối tượng nhằm
chỉ một thực thể tự trị nào đĩ trong một MIRS mà cĩ thể được truy vấn, truy xuất và
được trình diễn. Thuật ngữ “đối tượng” cĩ thể là chưa xác định thích hợp theo nghĩa
hướng đối tượng (0bject Oriented). Ngữ cảnh sẽ làm nĩ rõ ràng hơn dù cho nĩ được sử
dụng trong một ý nghĩa chung hoặc trong cách tiếp cận hướng đối tượng[10].
1.1.1. Cơ sở dữ liệu và các DBMS
Trong thư viện, CSDL và các DBMS đơi khi được sử dụng thay thế nhau. ở đây CSDL
hiểu như một bộ sưu tập hoặc một kho dữ liệu hoặc nhiều mục truyền thơng. Chúng ta
sử dụng các DBMS như một hệ thống thực thể để quản lý CSDL.
1.1.2. Truy tìm thơng tin tài liệu văn bản
Hệ thống truy tìm thơng tin tự động hố (IR) được phát triển để giúp quản lý một khối
lượng với các tài liệu khoa học đã được tạo lập từ những năm 1940. Chức năng chính
của một hệ thống IR là lưu trữ và quản lý một số rất lớn các tài liệu văn bản theo cách
sao cho các tài liệu thích hợp với việc sử dụng các truy vấn để truy tìm nhanh. Chú ý
rằng việc truy tìm thơng tin tự động của các từ cấu tạo bằng chữ đầu của những từ khác
là nhằm vào việc truy tìm các tài liệu văn bản, mặc dù thuật ngữ đầy đủ là truy tìm
thơng tin cĩ thể hiểu là truy tìm một loại thơng tin nào đĩ.
13
1.1.3. Truy xuất và chỉ số hố multimedia
Các DBMS truy xuất các khoản mục dựa trên số liệu cĩ cấu trúc khi sử dụng kết nối
chính xác. IR cũng được gọi là truy xuất dựa trên văn bản. Việc truy xuất dựa vào nội
dung đề cập đến việc truy xuất dựa trên những nét đặc trưng truyền thống hiện nay như
là màu sắc, hình thù thay cho lời giải thích văn bản về khoản mục truyền thơng đĩ.
Việc truy xuất dựa trên nội dung là chuẩn dựa trên sự đồng dạng thay vì một kết nối
chính xác giữa một truy vấn và một tập các khoản mục dữ liệu.
MIRS đề cập đến một hệ thống cơ sở cung cấp việc truy xuất thơng tin multimedia khi
sử dụng một tổ hợp DBMS, IR và các kỹ thuật truy xuất dựa trên nội dung. Trong một
MIRS, một vài vấn đề như phiên bản và điều khiển an tồn cĩ thể khơng thực hiện
được đầy đủ. Một MIRS đủ bản lĩnh ra đời được gọi là MDBMS.
1.1.4. Trích rút đặc trưng, biểu diễn nội dung và chỉ số hố
Trong các MIRS, một trong những vấn đề quan trọng nhất là trích rút đặc trưng hoặc
biểu diễn nơ ̣i dung (cái gì là những nét đặc trưng hoặc nội dung chính trong một khoản
mục multimedia). Trích rút đặc trưng cĩ thể là quá trình tự động hay bán tự động.
Trong một vài tài liệu truy xuất dựa vào nội dung, trích rút đặc trưng cũng được gọi là
chỉ số hố. Sau đây, chúng ta theo quy ước chung. Khi mà thuật ngữ “chỉ số” được sử
dụng như một danh từ, điều đĩ cĩ nghĩa là đề cập tới cấu trúc dữ liệu hoặc việc tổ chức
những đặc trưng đã được trích rút để nghiên cứu cĩ hiệu quả và truy xuất.
1.2 Sự cần thiết đối với MIRS
Sự cần thiết đối với MIRS cĩ thể được giải thích bằng ba yếu tố sau:
Trước hết, dữ liệu multimedia đang được dùng ngày càng nhiều và đang được chú ý.
Để sử dụng thơng tin đĩ (chứa trong dữ liệu đĩ), địi hỏi cĩ một hệ thống truy xuất và
chỉ số hố hiệu quả và cĩ hiệu lực. Thứ hai, dữ liệu multimedia cĩ những đặc tính và
những yêu cầu đặc biệt mà lại khác nhau đáng kể từ số liệu bảng chữ cái. Bởi vậy,
14
DBMS truyền thống khơng thích hợp cho việc xử lý dữ liệu multimedia. Thứ ba, mặc
dù các kỹ thuật IR cĩ thể giúp chúng ta trong việc truy xuất multimedia nhưng chỉ một
mình chúng thì chưa đủ để xử lý dữ liệu multimedia một cách cĩ hiệu quả[10].
1.2.1. Sự phát triển về dữ liệu multimedia và các đặc trưng của nĩ
Hiện nay chúng ta đang tập trung khai phá thơng tin multimedia. Ví dụ, một số lượng
lớn hình ảnh và video đang được tạo lập và lưu trữ trên internet. Nhiều hoạ sỹ và bức
tranh trong nhiều kiểu in ra là đang được chuyển sang dạng kỹ thuật số cho dễ xử lý,
phân phối và bảo tồn. Các bức tranh từ các bản tin trên vơ tuyến và trên báo cũng được
chuyển sang dạng kỹ thuật số để dễ bảo trì và bảo tồn. Một số lớn các hình ảnh y tế
đang được tập trung hàng ngày và các vệ tinh đang được sản xuất nhiều hơn. Khuynh
hướng này cĩ ý định tiếp tục nâng cấp việc lưu trữ và các cơng nghệ kỹ thuật số. Việc
lập ra một chỗ chứa đối với lượng lớn thơng tin multimedia ngày càng tăng như vậy
cịn được ít sử dụng. Điều này sẽ khơng thể sử dụng đầy đủ thơng tin multimedia này
trừ khi nĩ được tổ chức để truy xuất nhanh theo yêu cầu.
Khơng chỉ là đang tăng về số lượng dữ liệu đang được lưu trữ, mà cịn cả các kiểu dữ
liệu và các đặc trưng của chúng là khác nhau từ dữ liệu ký tự chữ.
Cĩ những đặc trưng chính của dữ liệu multimedia như sau:
• Dữ liệu multimedia, nhất là âm thanh và video, là dữ liệu cĩ số lượng lớn. Ví
dụ, một video 10’ trung bình chiếm 1,5 GB chưa nén.
• Âm thanh và video cĩ chiều thời gian và chúng khi biểu diễn sẽ chiếm tỷ lệ cố
định để hoạt động cĩ hiệu quả như đã yêu cầu
• Âm thanh số, ảnh và video được trình diễn theo một loạt giá trị đơn cá thể và
thiếu cấu trúc ngữ nghĩa rõ ràng cho máy tính để tự động hố nhận biết nội dung
• Nhiều ứng dụng multimedia địi hỏi việc biểu diễn đồng thời các kiểu truyền
thơng đa năng theo cách kết hợp khơng gian và thời gian
15
• Ý nghĩa của dữ liệu multimedia đơi khi rất mờ và cĩ tính chủ quan. Ví dụ, mỗi
người cĩ cách giải thích cùng 1 bức tranh theo cách khác nhau hồn tồn riêng
• Dữ liệu multimedia là giàu về thơng tin, nhiều tham số được địi hỏi mới trình
diễn đủ nội dung của nĩ.
1.2.2. Các DBMS và vai trị của chúng trong việc xử lý dữ liệu
multimedia
Các DBMS ngày nay được xây dựng khá tốt và được sử dụng rộng rãi đối với dữ liệu
cĩ cấu trúc. Các DBMS trội nhất là các hệ quản trị dữ liệu quan hệ (RDBMS). Trong
RDBMS, thơng tin dược tổ chức thành bảng hoặc các quan hệ. Các dịng của bảng
tương ứng với các khoản mục thơng tin hoặc các record, trong khi đĩ các cột tương
ứng với các thuộc tính. Ngơn ngữ truy vấn cĩ cấu trúc (SQL) được sử dụng để tạo ra
các bảng như thế và để chèn và truy xuất thơng tin từ các bảng đĩ[11].
Chúng ta dùng một ví dụ đơn giản dể minh hoạ cách sử dụng SQL để tạo lập một bảng
và chèn, truy xuất thơng tin từ đĩ. Giả sử chúng ta muốn lập một bảng chứa các bản
ghi về sinh viên bao gồm số hiệu sinh viên, tên và địa chỉ. Ta cĩ lệnh sau:
Create table STUDENT(
stu# integer,
name char(20),
address char(100));
Khi chúng ta muốn chèn các bản ghi về sinh viên vào bảng, chúng ta sử dụng lệnh chèn
SQL như sau:
Insert into STUDENT values(10,"Lew, Tom","2 Main St.,
Churchill, australia");
Lệnh trên sẽ chèn một dịng vào bảng STuDeNT
16
Thơng tin trong bảng được truy xuất khi sử dụng câu lệnh SELECT của SQL. Ví dụ,
nếu muốn truy xuất tên của sinh viên với sinh viên số 32, ta sử dụng lệnh truy vấn sau:
Select Name
From STUDENT
Where Stu#=32
Các thuộc tính trong RDBMS đã cố định kiểu và độ rộng. Trong ví dụ trên, thuộc tính
Stu# là kiểu integer với độ dài cố định là 32 bit. Như vậy, RDBMS là thích hợp để xử
lý dữ liệu số và dịng ký tự ngắn.
Để hỗ trợ cho các trường cĩ giá trị lớn trong RDBMS, một khái niệm được gọi là đối
tượng rộng hoặc nhị phân (BLOB) sẽ được giới thiệu. Một BLOB là một xâu bit lớn
các độ dài biến. Ví dụ, nếu ta muốn lưu bức tranh của sinh viên trong bản ghi ở bảng
STUDENT trên, chúng ta cĩ thể tạo ra một bảng khi sử dụng lệnh sau:
Create table STUDENT(
Stu# integer,
Name char(20),
address char(100),
Picture BLOB);
Các BLOB bình thường chỉ là xâu bit và hoạt động bằng việc so sánh chứ khơng mang
chúng ra ngồi. Đĩ là vì RDBMS khơng biết nội dung hoặc ngữ nghĩa của một BLOB.
Tất cả BLOB hiểu như một khối dữ liệu.
Một dạng khác của các DBMS là hệ thống quản trị CSDL hướng đối tượng
(OODBMS). Các OODBMS kết nối các khả năng của cơ sơ dữ liệu (như lưu trữ và
tìm kiếm) và các đặc trưng hướng đối tượng (tĩm lược, sự thừa kế, tính đồng nhất đối
tượng). Một phương pháp tiếp cận chung là kết nối các đặc điểm hướng đối tượng với
cơ sở dữ liệu quan hệ. Hệ thống đã được kết nối thì được gọi là một hệ thống cơ sở dữ
17
liệu đối tượng quan hệ. Trong một hệ thống như vậy, các đối tượng được xác định một
cách thích hợp trong hướng đối tượng. Trong đĩ mỗi đối tượng chứa các đặc tính hoặc
thuộc tính và các phương pháp hoặc các hàm được sử dụng để chế tác ra các đặc tính
khác. Ví dụ, chúng ta cĩ thể định nghĩa một loại ảnh sau:
Create type IMAGE(
Private
Size integer,
Resolution integer,
Content float[ ],
publlic
...
);
Sau đĩ khai báo các tranh bởi kiểu IMAGE cĩ thể được sử dụng trong một bảng
như sau:
Create table STUDENT(
Stu# integer,
Name char(20),
Address char(100)
Picture IMAGE);
Điểm khác biệt chính giữa BLOB và các đối tượng là đối tượng thì được định rõ một
cách thích đáng, bao gồm các đặc tính và cho phép chúng cĩ tác dụng, trong khi đĩ thì
BLOB thì khơng.
Các khái niệm về các BLOB và các đối tượng là một bước gần với xử lý dữ liệu
multimedia . Nhưng các BLOB được sử dụng chỉ để lưu dữ liệu cĩ khối lượng lớn.
Trong khi các đối tượng chứa vài thuộc tính đơn giản, nhiều chức năng hơn nên được
18
phát triển để xử lý việc truy xuất multimedia dựa vào nội dung. Một vài các khả năng
được yêu cầu như sau:
• Các cơng cụ, tự động hố hoặc bán tự động trích rút các nội dung và các đặc
trưng trong dữ liệu multimedia ;
• Các cấu trúc chỉ số hố đa chiều, để điều khiển các vector multimedia
• Các độ đo tương đồng, nhằm truy xuất multimedia thay vì kết nối một cách
chính xác
• Lưu trữ các hệ thống phụ, thiết kế lại nhằm đáp ứng các yêu cầu của băng tần
cao với cỡ lớn, thoả mãn những địi hỏi theo kiểu thời gian thực
• Giao diện sử dụng, được thiết kế cho phép các câu hỏi đa dạng trong nhiều kiểu
truyền thơng đa dạng và cung cấp các trình diễn multimedia
1.2.3. Hệ thống IR và vai trị của nĩ trong việc truy xuất multimedia
Ngồi các DBMS, cĩ loại hệ thơ ́ng quản lý thơng tin khác tập trung vào việc truy xuất
tài liệu văn bản. Loại hệ thống này được gọi là hệ thống truy xuất thơng tin (IR).
Kỹ nghệ IR khá quan trọng trong hệ thống quản lý thơng tin multimedia vì hai lý do
chính. Một là chúng tồn tại một lượng lớn các văn bản trong nhiều dạng tổ chức, ví dụ
như các thư viện. Văn bản là một nguơ ̀n thơng tin quan trọng trong bất kỳ một tổ chức
nào. Để sử dụng các thơng tin đã được lưu trữ trong các tài liệu này, cần cĩ một hệ
thống IR hiệu quả. Hai là, văn bản cĩ thể được sử dụng để chú giải các truyền thơng
khác như âm thanh, hình ảnh, video. Thơng thường thì các kỹ nghệ IR cĩ thể dược sử
dụng cho việc phu ̣c hồi thơng tin đa truyền thơng. Tuy nhiên, việc sử dụng chỉ để xử lý
dữ liệu truyền thơng phải tuân theo các giới hạn sau:
• Việc chú giải nhìn chung phải làm bằng tay và tiêu tốn thời gian
• Văn bản chú giải chưa đầy đủ và cịn mang tính chủ quan
• Các kỹ nghệ IR khơng thể điều khiển các câu hỏi từ văn bản khác (như âm
thanh và ảnh).
19
• Một vài đặc tính của multimedia như bố cục hình ảnh và các dạng đối tượng là
khác nhau, nếu khơng thì cũng chỉ là cùng mơ tả một văn bản.
1.2.4. Cách tiếp cận tích hợp việc truy xuất và chỉ số hố thơng tin
multimedia
Từ thảo luận trên chúng ta cĩ thể thấy rằng các DBMS và IR khơng thể đáp ứng đầy đủ
các yêu cầu về chỉ số hố và truy xuất multimedia, vì vậy cần cĩ các cơng nghệ mới
để vận dụng những đặc trưng riêng của multimedia... Tuy vậy, vẫn nhận thấy rằng các
DBMS và IR vẫn đĩng vai trị quan trọng trong các MDBMS. Các phần của dữ liệu
multimedia như ngày và tác giả tạo lập của tài liệu multimedia là cĩ cấu trúc. Dữ liệu
cĩ kết cấu này cĩ thể được điều khiển bằng các kỹ nghệ DBMS. Văn bản chú giải vẫn
là phương pháp hiệu lực trong việc ghi lại nội dung.
To ́m lại, một cách tiếp cận tích hợp tổ hợp các DBMS với IR, và các kỹ thuật đặc tả để
xử lý dữ liệu multimedia được địi hỏi để phát triển MIRS hiệu quả và cĩ hiệu lực.
1.3 Tổng quan về MIRS
Các mục thơng tin trong cơ sơ dữ liệu đã được xử lý trước để rút ra các đặc trưng và
nội dung ngữ nghĩa, được chỉ rõ dựa trên các đặc trưng và ngữ nghĩa này. Trong suốt
quá trình phục hồi thơng tin, một câu hỏi của người sử dụng được xử lý và đặc điểm
chính được rút ra. Các đặc trưng này sau đĩ được chuẩn bị cùng với các đặc trưng hoặc
chủ thị của mỗi mục thơng tin trong cơ sở dữ liệu. Các đặc trưng của mục thơng tin là
hầu hết đều tương đồng để các câu hỏi được gọi ra trước người sử dụng
20
Hình 1.1 : Mơ ̣t mẫu truy xuất thơng tin tổng quát
Cĩ rất nhiều ấn bản đuợc viết theo mẫu trên trên. Ví dụ, Các mục thơng tin cĩ thể
được kết nối bất kỳ với các loại truyền thơng. Làm thế nào để rút ra được những đặc
trưng từ các tin tức truyền thơng này? Phải lưu và xây dựng được các đặc trưng này
như thế nào để việc truy tìm cĩ hiệu quả? Phải đo độ “ tương đồng” như thế nào giữa
hai tin tức truyền thơng? Cần phải làm gì để giao diện sử dụng cĩ thể đảm nhận được
những câu hỏi phức tạp, rối rắm, linh hoạt? Phải so sánh như như thế nào về việc biểu
diễn các quá trình truy tìm giữa các MIRS khác nhau? Làm thế nào để đáp ứng các
yêu cầu tạm thời trong suốt quá trình truyền và biểu diễn dữ liệu multimedia?
1.4 Các ứng dụng nĩi chung và khả năng mong đợi của MIRS
MIRS được cho rằng hiệu quả và linh hoạt. Khả năng của nĩ được mimh hoạ trên các
dạng câu hỏi mà chúng cĩ thể hỗ trợ. Các kiểu câu hỏi mong đợi cĩ dạng sau:
• Câu hỏi dựa trên metadata: Đây là câu hỏi chỉ ra những thuộc tính thơng thường
của các mục cơ sở dữ liệu như tên tác giả và ngày tạo lập. Mơ ̣t Ví dụ là câu hỏi
21
theo yêu cầu trên video (VOD) cĩ thể là “liệt kê tên các phim được sản xuất
vào năm 1997”. Loại này được vận dụng bằng DBMS
• Các câu hỏi dựa trên chú giải: Đây là câu hỏi chỉ ra các mơ tả dạng văn bản
trong nội dung của cơ sở dữ liệu. Các câu hỏi đều ở trong từ khố hoặc tronng
phần văn bản miễn phí và việc truy tìm dựa trên sự tưong đồng giữa câu hỏi và
phần chú giải. Ví dụ, câu hỏi cĩ thể là “Chỉ ra phân đoạn quay video khi diễn
viên nam đang đạp xe đạp”. Loại câu hỏi giả định này được chú giải thích đáng
và xử lý bởi kỹ nghệ IR
• Câu hỏi dựa trên mẫu dữ liệu hoặc tính năng: Đây là câu hỏi chỉ ra thơng tin
dạng thống kê, như: âm thanh, mầu, độ mịn. Một ví dụ: “Chỉ ra ảnh video với
sự phân bổ màu như._. THIS” Để trả lời dang câu hỏi nay, thơng tin liệt kê về mục
cơ sở dữ liệu nên được sưu tập trước và lưu trữ
Câu hỏi ví dụ
Đây là câu hỏi trong các đối tượng đa truyền thơng như hinh ảnh, phác thảo, đoạn âm
thanh. Ví dụ:” chỉ ra 1 bộ phim và các cảnh tương tự như Bức tranh này”. Loại câu
hỏi này cĩ thể bị làm rối lên bởi mối liên hệ về khơng gian và thời gian giữa các đối
tượng
Các câu hỏi ứng dụng riêng
Các câu hỏi ứng dụng riêng cĩ rất nhiều loại. Ví dụ, câu hỏi dựa trên thơng tin chi tiêt
và cụ thể như kích cỡ 1 đối tượng và quá trình già hố của 1 người.
Các MIRS được mong mỏi cĩ thể đưa ra nhiều loại câu hỏi khác nhau, do đĩ cĩ ứng
dụng rộng rãi, bao gồm:
• Thuốc. Một bác sĩ đưa ra ảnh chụp sĩng siêu âm mới và muốn tìm lại ảnh với
mức độ cĩ thể so sánh được của sự phình tâm thất trái từ một ảnh chụp siêu âm
cơ sở
22
• Bảo mật. Một cảnh sát đưa ra hệ thống với một bức tranh vẽ mặt người và muốn
phục hồi lại những hình ảnh khác vào hồ sơ hiện thời của những người giống
với bức tranh này từ cơ sở thơng tin bảo mật
• Giáo dục. Một sinh viên quét chụp một tranh động vật và muốn truy tìm tất cả
các thơng tin (bao gồm âm thanh, hình ảnh, văn bản mơ tả). Tiếp theo, một sinh
viên khác thêm âm thanh cho con vật và muốn khơi phục lại bức tranh và thơng
tin mơ tả loại động vật này
• Báo chí. Một báo cáo viên viết một bài báo về một người và muốn truy tìm bức
tranh của người đĩ và các thơng tin tổng hợp đã xuất hiện trên các báo và tivi
20 năm trước
• Giải trí. Một quan sát viên muốn truy tìm một đoạn băng tương tự với những gì
mà anh ta đã xem trên một cơ sơ dữ liệu video lớn hơn
• Đăng ký nhãn hiệu. Một cán bộ gia cơng một nhãn hiệu đăng ký nào đĩ muốn
quyết đinh xem đã cĩ một cái nhãn hiệu nào trước đĩ giống như vậy đã được
đăng ký chưa. Để làm điều này, anh ta cần một cơ sở dữ liệu về nhãn hiệu để so
sánh các nhãn hiệu giống nhau nhất hiện cĩ để làm ra một nhãn hiệu hồn tồn
mới
Cuối cùng, các MIRS sẽ tập trung vào chính thơng tin thay thế các loại truyền thơng
và việc miêu tả chúng cĩ thể được sắp xếp hoặc dịch ra từ loại truyền thơng này đến
loại truyền thơng khác. Ví dụ, một video tài liệu cần phải được sử dụng video, hình
ảnh, văn từ, âm thanh, lời nĩi và những thứ tương tự như vậy. Vì vậy phương tiện dị
tìm phải kết nối các câu hỏi (dữ liệu) với các mục cơ sở dữ liệu.
Các loại truyền thơng khác nhau cần các kỹ nghệ phục hồi và cách biểu thị khác nhau.
Các kỹ nghệ khác nhau được sử dụng cho từng loại truyền thơng khác nhau. Người sử
dụng cĩ thể thấy thích những thơng tin xác đáng mà bất chấp sự khác nhau về các
loại truyền thơng. Vấn đề là làm thế nào để tích hợp được các loại kỹ nghệ khác nhau
để tuy tìm thơng tin cần tìm trong việc trả lời các câu hỏi của người sử dụng. Cĩ rất
23
nhiều các ấn phẩm được viết để giải quyết vấn đề này, như ghi rõ câu hỏi và xử lý,
khoản phụ cấp thêm tương xứng, ghép các miêu tả đối tượng.
Để việc truy tìm cĩ hiệu quả, cần cĩ một cấu trúc các khoản mục hợp lý. Bởi vì các
vector đặc tính đều đa dạng về kích cỡ và việc truy tìm các khoản mục trong các
MIRS dựa trên sự tương động thay cho việc kết nơ ́i chính xác, cấu trúc mục lục được
sử dung trong các DBMS khơng thích hợp với các MIRS.
Khuynh hướng của các yêu cầu bao gồm hệ số trễ và độ giật, gọi là chất lượng dịch
vụ (QoS), câ ̀n cĩ trong việc truyền và mơ tả dữ liệu truyền thơng.
Trong các DBMS, tiến hành chính liên quan đến hiệu quả (thời gian trả lời câu hỏi).
Nĩ rất quan trọng bởi kích cỡ lớn của multimedia. Ngồi ra, hiệu quả truy tìm cũng rất
quan trọng (khả năng truy tìm các mục thích hợp và khả năng loại bỏ các mục khơng
cần đến). Bởi các MIRS truy tìm các mục chọn dựa trên cơ sở đo sự tương đồng, sử
dụng luật tương ứng thay thế cho kết nối chính xác. Trừ khi nĩ trở nên quá khĩ đối với
việc thiết kế các độ đo tương đồng thì cần xác định một cách chính xác bằng ĩc phán
đốn của con người, giống như một vài khoản mục được hệ thống xác định là thích hợp
nhưng người dùng lại cho là khơng thich hợp và một số mục thích hợp lại khơng được
truy xuất.
24
CHƯƠNG 2
CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (Multimedia Database)
Khi thiết kế một hệ thống CSDL multimedia mơ tả các loại dữ liệu multimedia khác
nhau, chúng ta bắt buộc phải đối diện với một số câu hỏi quan trọng được đặt ra về
cách thức tổ chức hệ trống như:
• Việc tổ chức về mặt nội dung đối với dữ liệu của các loại dữ liệu
multimedia.
• Việc lưu trữ vật lý của các dữ liệu này trên các thiết bị lưu trữ như thế
nào.
Để trả lời cho các câu hỏi này, trước tiên chúng ta xem xét tới khía cạnh tổ chức nội
dung
25
2.1 Kiến trúc cho việc tổ chức nội dung
Ở đây chúng ta xem xét tới 3 kiến trúc áp dụng cho việc tổ chức nội dung của một hệ
thống CSDL multimedia
2.4.1 Nguyên lý tự trị
Nguyên lý này đề cập tới việc chúng ta nhĩm tất cả các dữ liệu ảnh, dữ liệu video và tất
cả các dữ liệu văn bản và chỉ số hĩa chúng theo nguyên tắc tối đa hĩa hiệu suất của tất
cả các loại truy nhập đối với các loại dữ liệu mà chúng ta dự định. Nguyên lý này đảm
bảo rằng với mỗi loại dữ liệu (ảnh, video, văn bản) chúng đều được tổ chức với một
cách thức đặc trưng phù hợp với mỗi loại dữ liệu này[18].
Hình 2.1: Mơ tả nguyên lý tự trị
26
2.4.2 Nguyên lý đồng nhất
Một nguyên lý kiến trúc khác mà chúng ta cĩ thể lựa chọn là nguyên lý đồng nhất,
nguyên lý này giúp chúng ta tìm được một cấu trúc tĩm tắt chung cho tất cả các loại dữ
liệu. Cấu trúc này cĩ thể được dùng trong việc chỉ số hĩa tất cả các loại dữ liệu qua đĩ
tạo ra một “chỉ số thống nhất” mà chúng ta cĩ thể dùng để truy cập tới các đối tượng
khác nhau. Hay nĩi một cách khác là chúng ta cĩ thể trình bầy tất cả các đối tượng
khác nhau( ảnh, video, âm thanh, văn bản) trong một cấu trúc dữ liệu duy nhất và qua
đĩ phát triển các thuật tốn để truy vấn cấu trúc dữ liệu này[18].
Hình 2.2: Mơ tả nguyên lý đồng nhất
27
2.4.3 Nguyên lý lai ghép
Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý đã trình bầy ở trên.
Kết quả của nguyên lý này là một kiểu dữ liệu nào đĩ sử dụng chỉ số (index) riêng của
chúng, trong khi đĩ các kiểu dữ liệu khác sẽ sử dụng một chỉ số (Index) “thống nhất”.
Loại dữ liệu nào sử dụng kiểu chỉ số nào sẽ phụ thuộc vào các đặc tính khác nhau sẽ
được nĩi đến ở phần sau[18].
Hình 2.3: Mơ tả nguyên lý lai ghép
Cả ba loại nguyên lý trên đều cĩ những ưu điểm và nhược điểm riêng của mình. Kiến
trúc dựa trên nguyên lý tự trị địi hỏi việc tạo ra các thuật tốn và cấu trúc dữ liệu của
mỗi kiểu dữ liệu, ngồi ra nĩ cũng địi hỏi các kỹ thuật hỗ trợ cho việc liên kết chéo
giữa các cấu trúc dữ liệu khác nhau này. Các cơng việc này địi hỏi tính phức tạp cao
và địi hỏi một lượng thời gian lớn cho việc phát triển. Bên cạnh các nhược điểm trên,
việc xây dựng các cấu trúc được đặc biệt hĩa tối ưu cho việc truy xuất dến từng loại dữ
28
liệu khác nhau, CSDL multimedia được tổ chức theo nguyên lý này thường đem lại
hiệu quả cao trong việc xử lý tìm kiếm. Đối với các ngân hàng dữ liệu đã được xây
dựng sẵn, nơi mà các thuật tốn và các cấu trúc dữ liệu đã được sử dụng cĩ hiệu quả thì
việc áp dụng nguyên lý tự trị là mơ hình kiến trúc thích hợp nhất. Các kỹ thuật hướng
đối tượng chính là cơng cụ đắc lực nhất hỗ trợ cho việc triển khai theo nguyên lý này
bằng cách xem mỗi loại dữ liệu nguồn là một đối tượng mà các phương thức của nĩ cĩ
thể truy cập được từ một CSDL multimedia tổng thể.
Trái ngược với nguyên lý tự trị, nguyên lý đồng nhất địi hỏi chúng ta phải tìm ra được
một cấu trúc dữ liệu chung mà cĩ thể dùng để lưu trữ các thơng tin về nội dung của
hình ảnh, video, văn bản, âm thanh và các loại dữ liệu khác. Điều này địi hỏi chúng ta
phải phân tích nội dung của mỗi kiểu dữ liệu và tĩm tắt được phần chung của chúng,
qua đĩ xây dựng một bộ chỉ số dựa trên các yếu tố chung đã được xác định này. Ưu
điểm nổi bật của nguyên lý đồng nhất là dễ dàng triển khai và các thuật tốn thường
được thực hiện rất nhanh. Nhược điểm chính của nguyên lý này là các sự chú giải phải
được tạo ra theo một cách riêng nào đĩ, thường là được tạo ra một cách thủ cơng hoặc
là tự động, việc tạo ra các chú giải một cách thủ cơng thường đỏi hịi nhiều về mặt thời
gian cũng như chi phí, mặt khác trong quá trình tạo các chú giải này thường sẩy ra sự
mất mát thơng tin nếu ngơn ngữ dùng để chú giải khơng trình bầy hết được các khía
cạnh của nội dung. Cĩ thể đưa ra đây một số ví dụ như ngơn ngữ chú giải nội dung của
hình ảnh cĩ thể làm mất các thơng tin về bề mặt của một điểm ảnh (pixel) hoặc một
nhĩm điểm ảnh. Tương tự như vậy ngơn ngữ chú giải nội dung của âm thanh cĩ thể
làm mất các thơng tin về biên độ, tần số của tín hiệu tại một thời điểm nào đĩ.
Nguyên lý lai tạo tập hợp được các ưu điểm của cả hai nguyên lý nêu trên, đồng thời
giảm thiểu được một số các nhược điểm của chúng. Giả sử chúng ta muốn tạo ra một
CSDL multimedia bao gồm các kiểu dữ liệu M1,…….,Mn, chúng ta bắt đầu bằng việc
phân chia tập này thành 2 phần:
29
• Phần 1: bao gồm các loại dữ liệu kế thừa từ các nguồn dữ liệu cĩ sẵn, tồn tại sẵn
các chỉ số và các thuật tốn để thao tác với chỉ số. Với việc bố trí này chúng ta
đã tận dụng được lợi thế của các chỉ số và mã nguồn sẵn cĩ.
• Phần 2: bao gồm các dữ liệu khơng được kế thừa từ bất kỳ nguồn nào và do đĩ
khơng cĩ sẵn các chỉ số của mình (điều này đồng nghĩa với việc là cũng khơng
cĩ bất kỳ thuật tốn nào để cĩ thể thao tác với tập chỉ số). Trong trường hợp này
việc tiếp cận xây dựng hệ thống theo nguyên lý đồng nhất là cách thức thích hợp
nhất ngay cả khi là cách tiếp cận này cĩ thể nẩy sinh ra việc gây mất mát các
thơng tin vật lý chi tiết.
Sau khi đã tiến hành xong việc phân chia, chúng ta bắt đầu tiến hành việc xây dựng các
thuật tốn cần thiết để kết hợp các nguồn dữ liệu khác nhau lại bằng việc sử dụng các
tập chỉ sổ riêng của chúng. Cách tiếp cận này giúp chúng ta thừa kế được tối đa các tài
nguyên cĩ sẵn, đồng thời giảm thiểu được các cơng việc phải thực hiện thêm bởi vì các
tệp chỉ số riêng cĩ sẵn đối với mỗi loại dữ liệu đã được tận dụng. Giả sử, một người
dùng muốn đưa ra một câu hỏi “ Hãy tìm tất cả các hình ảnh và các đọan video mà
trong đĩ ơng chủ của dối tượng A cĩ mặt và trao đổi với đối tượng B”. Câu hỏi này
bao gồm một sự kết hợp giữa các tệp chỉ số của các loại dữ liệu khác nhau, chúng sẽ
truy cập đến CSDL hình ảnh (thơng qua tệp chỉ số của dữ liệu hình ảnh), đến CSDL âm
thanh (thơng qua tệp chỉ số âm thanh) và đến một CSDL quan hệ (thơng qua tệp chỉ số
quan hệ), câu hỏi này cĩ thể được diễn tả như sau:
SELECT Name, Image, Audio
From Employee E, Image I, Audio A
Where E.Name= “A” AND
I contains E.boss and
A contains E.boss AND
A CONTAINS B
30
2.2 Tổ chức dữ liệu multimedia dựa trên nguyên lý đồng nhất.
Xét ví dụ sau:
• Bức ảnh photo1.gif cĩ sự xuất hiện của đối tượng A, đối tượng B và một đối
tượng chưa được xác định được chụp tại thành phố C thuộc nước D vào ngày
10/01/1990.
• Đoạn video video1.mpg cĩ hình ảnh của đối tượng A đưa cho đối tượng B một
chiếc vali (trong frames 50-100). Đoạn video này thu được từ sự theo dõi nhà
của đối tượng B tại thành phố E thuộc nước F vào tháng 1- 1991.
• Văn bản B.txt cĩ chứa các thơng tin chi tiết về dối tượng B được thu thập từ dữ
liệu của cơ quan an ninh.
Bản thân mỗi đối tượng trên cũng đã nĩi lên phần nào nội dung của từng đối tượng cụ
thể (hình ảnh, video, văn bản), tuy nhiên thơng tin đưa ra ở đây chỉ nĩi lên nội dung về
mặt ngữ nghĩa hơn là đề cập đến các tính chất cụ thể của mỗi loại đối tượng, các tính
chất loại này được gọi là các đặc trưng bậc thấp (lower-level). Một cách tiếp cận hiệu
quả nhất đối với CSDL multimedia và đã được sử dụng rộng rãi trong thực tế là sử
dụng các đối tượng được phát biểu ở trên như là siêu dữ liệu (metadata).
Theo trên, giả sử chúng ta cĩ một tập các đối tượng media o1,…..,on chúng ta kết hợp
một vài metadata md(o1) với mỗi đối tượng media o1 (định dạng chính xác của
metadata này sẽ được trình bầy sau), tương tự như vậy các metadata kết hợp với các
đối tượng media 01,….0n tương ứng sẽ là md(o1),……,md(on), Chúng ta sẽ tiến hành
việc chỉ số hĩa các metadata này với một cách thức nhằm cung cấp các phương thức
triển khai hiệu quả đối với các yêu cầu truy cập từ phía người dùng.
Cĩ thể rõ ràng thấy rằng, sự thành cơng của phương pháp này phụ thuộc cơ bản vào
việc chúng ta đảm bảo được rằng với mỗi đối tượng media 0i thì metadata tương ứng
của nĩ md(oi) là cơ đọng và phản ánh đúng chỉ những gì mà người dùng yêu cầu[18].
Với một số lượng tối thiểu các metadata được dùng rõ ràng là chúng ta sẽ dễ dàng hơn
trong việc chỉ số hĩa cũng như là thực hiện các thao tác khai thác dữ liệu, tuy nhiên
31
bên cạnh đĩ nếu số lượng metadata sử dụng ít thì cĩ thể người sử dụng sẽ phải mất thời
gian hơn trong việc thiết lập các câu hỏi của mình. Cĩ thể lấy trường hợp sau làm ví
dụ:
• Người dùng: hãy tìm cho tơi tất cả các đoạn video hoặc ảnh chụp mà đối tượng
A và đối tượng B (xem phần trên) trao đổi với nhau một gĩi hành lý.
• Hệ thống: Khơng tìm được (mặc dù hệ thống đã cĩ đoạn video ghi lại đối tượng
A và đối tượng B trao đổi với nhau một chiếc vali nhưng hệ thống vẫn trả lời là
khơng tìm thấy vì nĩ khơng hiểu rằng một chiếc vali cũng cĩ thể coi là một gĩi
hành lý).
• Người dùng: hãy tìm cho tơi tất cả các đoạn video hoặc ảnh chụp mà đối tượng
A và đối tượng B (xem phần trên) trao đổi với nhau một vật gì đĩ.
• Hệ thống: tìm thấy. frames 50-100 của đoạn video video1.mpg thỏa mãn yêu
cầu của bạn.
Mặc dù cĩ một vài nhược điểm như sử dụng metadata khơng biểu diễn hết được các
khía cạnh của đối tượng media trong CSDL nhưng cách tiếp cận dựa trên nguyên lý
đồng nhất cĩ một số ưu điểm nổi trội sau:
• Metadata thường được lưu trữ dưới dạng các cấu trúc cĩ liên quan đến tính chất
quan hệ hoặc hướng đối tượng và cĩ thể truy vấn một cách dễ dàng thơng qua
việc mở rộng các ngơn ngữ (chẳng hạn như SQL).
• Việc viết mã để thao tác với metadata thường là dễ dàng.
• Việc viết các chương trình để tạo ra metadata là đơn giản đối với các lập trình
viên cĩ năng lực
Chúng ta đã xem xét đến nội dung của dữ liệu media dưới các dạng khác nhau, một câu
hỏi đặt ra ở đây là đâu là phần chung nhất của các loại dữ liệu này? Mục đích của
chúng ta là tìm kiếm một cấu trúc chung nhất cho tất cả các loại dữ liệu mà qua nĩ ta
cĩ thể thể hiện được nội dung của các loại dữ liệu đĩ. Tĩm tắt media là một cấu trúc
32
tốn học cho phép diễn đạt nội dung của các media này, sự tĩm tắt media cĩ thể được
triển khai thơng qua một cấu trúc dữ liệu duy nhất.
2.3 Cấu trúc tĩm tắt media
Cấu trúc media tĩm tắt được định nghĩa như sau:
Một cấu trúc media tĩm tắt là một tập gồm 8 tuple (S, fe, ATTR, λ, R, F, Var1, Var2)
Trong đĩ
• S là một tập các đối tượng gọi là các trạng thái.
• Fe là một tập các đối tượng gọi là các đặc trưng.
• ATTR là một tập các đối tượng gọi là các giá trị thuộc tính.
• λ: S--> 2fe là một ánh xạ từ các trạng thái sang tập các đặc trưng.
• R là một tập các quan hệ trên fei x ATTRj x S với i,j ≥ 0.
• F là một tập các quan hệ của S.
• Var1 là một tập các đối tượng gọi là các biến, thuộc S
• Var2 là một tập các biến, thuộc fe.
• Một trạng thái là đoạn (chunk) nhỏ nhất của dữ liệu media mà ta mong muốn.
Ví dụ như trong một CSDL hình ảnh, mỗi ảnh cĩ thể được xem như là một
trạng thái. Nếu quan điểm này được chấp nhận, chúng ta sẽ coi như tất cả các
ảnh như là các đối tượng đơn lẻ cơ bản và tất cả các đặc tính của nĩ sẽ được
quan tâm và khi đĩ chúng ta sẽ khơng quan tâm đến các đặc tính đơn lẻ như là
các đặc tính của từng điểm ảnh. Trong trường họp dữ liệu video, một trạng
thái cĩ thể được xem là một chuỗi liên tiếp các frame cĩ dạng (10 x i, 10 x
(i+1)) thể hiện một đoạn gồm 10 frame bắt đầu từ frame cĩ số thứ tự chia hết
cho 10.
• Một đặc trưng là bất kỳ đối tượng nào trong một trạng thái mà nĩ sẽ được quan
tâm. Một đặc trưng cĩ thể gao gồm cả các đối tượng và các phạm vi của nĩ.
Ví dụ như chúng ta xem xét một bức ảnh gồm 3 đối tượng A, B và một đối
33
tượng chưa được nhận biết thì các đặc trưng được quan tâm đến ở đây là A, B
và đối tượng C nào đĩ. Tương tự như vậy nếu chúng ta phân tích đoạn video
từ frame 50-100 thì các đặc trưng được quan tâm ở đây là A, B và cái vali.
Các đặc trưng xuất hiện trong một trạng thái cĩ thể cĩ các thuộc tính của
mình, ví dụ như đối tượng A bước ra khỏi chiếc xe ơtơ của mình thì các thuộc
tính của chiếc xe ơ tơ (loại xe, mầu sắc, biển số) cũng cần phải được ghi nhận.
Tương tự như vậy, một đối tượng media cũng cĩ thể cĩ một vài thuộc tính cần
được quan tâm như ngày, thời gian và địa điểm chụp bức ảnh đĩ.
• λ là một ánh xạ đặc trưng rút gọn cho phép ta biết đặc trưng nào xuất hiện
trong những trạng thái nào. λ cĩ thể là một GUI cho phép người sử dụng
tương tác nhằm mục đích nhận biết được nội dung của một đối tượng media.
• R là một tập các quan hệ trên fei x ATTRj x S các quan hệ này phụ thuộc vào
trạng thái. Ví dụ nếu xem xét một bức ảnh như photo1.gif thì ở đây cĩ thể cĩ
một quan hệ phụ thuộc vào trạng thái gọi là left.of bao gồm một bộ ba cĩ dạng
(đối tượng A, đối tượng B, photo1.gif). tương tự như vậy chúng ta cũng cĩ thể
cĩ một quan hệ khác gọi là background bao gồm một cặp cĩ dạng (photo1.gif,
White_House).
• F cĩ thể chứa các liên kết kết hợp 2 trạng thái chẳng hạn như liên kết cĩ trước,
nếu chúng ta cĩ 2 bức ảnh (photo1.gif, photo2.gif) mà giữa chúng tồn tại liên
kết cĩ trước thì khi đĩ cĩ nghĩa là bức ảnh 1 được chụp trước bức ảnh 2 và
tiếp tục như vậy[18].
Để nắm rõ hơn, chúng ta xem xét một số ví dụ áp dụng trên một số loại đối tượng
media sau
2.4.1 Dữ liệu ảnh như là một tĩm tắt media.
Giả sử chúng ta xem một CSDL hình ảnh đơn giản gồm cĩ 7 bức ảnh, CSDL này sẽ
tương ứng với media trừu tượng sau:
34
• Tập các trạng thái bao gồm (pic1.gif,……….,pic7.gif).
• Tập các đặc trưng bao gồm tên của các đối tượng xuất hiện trong các bức ảnh
tương ứng là Bob, Jim, Bill, Charlic và Ed.
• Ánh xạ thu gọn λ cho chúng ta biết với mỗi trạng thái cĩ những đặc trưng nào
xuất hiện trong nĩ. Bảng sau sẽ mơ tả cho vấn đề này
Trạng thái Đặc trưng
Pic1.gif Bob.Jim
Pic2.gif Jim
Pic3.gif Bob
Pic4.gif Bill
Pic5.gif Charlie
Pic6.gif Ed, Bill
Pic7.gif Ed
Bảng 2.1: Liên hệ giữa đặc trưng và trạng thái cho hình ảnh
Một điểm cần chú ý ở đây là chúng ta dùng bảng trên để mơ tả cho λ nhưng cách thức
chỉ số hố mà chúng ta sử dụng cĩ thể khác đi.
• Tập các quan hệ chỉ chứa 2 quan hệ: một quan hệ phụ thuộc vào trạng thái gọi là
left_of và một quan hệ khơng phụ thuộc vào trạng thái gọi là father.
• Tập các quan hệ nội tại cĩ thể trống
2.4.2 Dữ liệu video như là một tĩm tắt media.
• Tập các trạng thái bao gồm 5 frames video từ frame 1 đến frame 5.
• Tập các đặc trưng bao gồm Jane Shady, Denis Dopeman, ngơi nhà của
Dopeman và chiếc valy.
35
• Ánh xạ rút gọn λ được mơ tả ở bảng sau
State Feature
Frame1 Dopemanhouse,briefcase,JaneShady
Frame2 Dopemanhouse,briefcase,JaneShady,DenisDopeman
Frame3 Dopemanhouse,briefcase,JaneShady,DenisDopeman
Frame4 Dopemanhouse_briefcase,JaneShady,DenisDopeman
Frame5 Dopemanhouse,JaneShady
Bảng 2.2: Liên hệ giữa đặc trưng và trạng thái cho video
Cũng giống như trường hợp áp dụng đối với CSDL hình ảnh, định dạng cụ thể
của ánh xạ λ cĩ thể khác đi để tối ưu hố cho quá trình chỉ số hố và khai thác.
• Chúng ta cĩ thể cĩ một số quan hệ phụ thuộc vào trạng thái sau:
o Quan hệ cĩ (have) là một quan hệ phụ thuộc vào trạng thái xác định
chiếc valy (đối tượng) xuất hiện cùng với nhân vật nào ở trong trạng
thái nào? Quan hệ này cĩ được mơ tả như sau:
Person Object State
JaneShady Briefcase 1
JaneShady briefcase 2
JaneShady briefcase 3
DenisDopeman briefcase 4
Bảng 2.3: Quan hệ Have
o Quan hệ vợ chồng (spouse) là một quan hệ phụ thuộc vào trạng thái
chỉ ra tên vợ (hoặc chồng) của một đối tượng nào đĩ. Quan hệ này cĩ
thể được mơ tả như sau
36
Person Spouse
JaneShady PeterShady
JaneShady PeterShady
DenisDopeman DebraDopewoman
Bảng 2.4: Quan hệ vợ- chồng
• Ở đây cĩ thể chỉ cĩ một quan hệ nội tại của trạng thái gọi là before (s1,s2)
chỉ ra rằng trạng thái s1 cĩ trước trạng thái s2.
Cũng tương tự như trên, chúng ta cĩ thể dễ dàng thấy rằng các kiểu media khác nhau
chằng hạn như dữ liệu âm thanh hoặc dữ liệu văn bản cĩ thể được mơ tả như là một
trường hợp của kiểu media tĩm tắt tổng quát. Với cấu trúc đơn giản đề cập ở trên, một
CSDL Multimedia là một tập bao gồm các media tĩm tắt.
2.4.3 Định nghĩa về một CSDL Multimedia đơn giản
Một CSDL Multimedia đơn giản là một tập hữu hạn M của các media tĩm tắt.
Ví dụ, một CSDL Multimedia đơn giản cĩ thể chứa tệp vidoe video1.mpg và một tệp
ảnh photo1.gif, trong trường hợp này CSDL cĩ chứa hai trường hợp của media tĩm tắt.
Tuy nhiên một CSDL Multimedia đơn giản tỏ ra quá đơn giản và kém hiệu quả nếu xét
thêm một số khía cạnh. Ví dụ, một media tĩm tắt cĩ thể liệt kê “nhà thờ” là một đặc
trưng, tuy nhiên khi chúng ta tìm kiếm với đặc trưng là “thánh đường” thì cĩ thể sẽ
khơng tìm thấy nhà thờ đĩ vì hệ thống khơng thể hiểu được rằng nhà thờ và thành
đường là tương tự nhau. Các hạn chế về mặt từ đồng nghĩa này cũng thường rất hay
xẩy ra đối với CSDL văn bản. Một vấn đề nữa mà chúng ta cũng cần phải quan tâm là
người dùng thường hay tìm kiếm các đối tượng cĩ chứa một hoặc nhiều các đặc trưng
khác nhau và một thực tế là mặc dù sau một số lần chỉnh sửa lại câu hỏi của mình một
37
cách hồn chỉnh thì các kết quả trả về tương ứng với câu hỏi vẫn chưa chính xác với
những gì người dùng thực sự mong muốn, điều này được thể hiện rõ nhất trong trường
hợp chúng ta tìm kiến trên web sử dụng các cơng cụ tìm kiếm như Google hoặc
AltaVista.
Ngược lại, ở đây cũng tồn tại các trường hợp khi người dùng muốn mở rộng khả năng
tìm kiếm (tìm kiếm một cách chính xác hơn bằng cách khai bào câu hỏi rõ ràng hơn)
thì cĩ thể sẽ khơng thu được kết quả nào, trong khi đĩ nếu đơn giản hố bớt câu hỏi thì
lại tìm được các thơng tin mình mong muốn.
Cuối cùng, khi người dùng đưa ra câu hỏi cĩ dạng “ hãy tìm tất cả các hình ảnh mà
Jane Shady và Denis Dopeman cĩ mặt tại địa điểm A”, nếu kết quả tìm kiếm trả về là
trống thì người dùng cĩ thể suy nghĩ là “địa điểm A cĩ thể tương tự như địa điểm B”
và sửa lại câu hỏi bằng cách thay thê việc tìm kiếm tại địa điểm A bằng việc tìm kiếm
tại địa điểm B, điều này dẫn đến việc chỉnh sửa lại câu hỏi bằng cách thay thế một
hằng số cụ thể này bằng một hằng số khác. Các ví dụ trên đưa đến việc thúc đẩy việc
tìm ra một cấu trúc khác để xác định CSDL Multimedia hỗ trợ được các vấn dề về ngữ
nghĩa cũng như kế thừa được mối quan hệ giữa các đặc trưng.
2.4.4 Định nghĩa về một CSDL Multimedia cĩ cấu trúc
Một CSDL Multimedia cĩ cấu trúc là một tập gồm cĩ 5 thuộc tinh
({M1,…..,Mn),≡,≤,inh,subst) trong đĩ:
• là một media tĩm tắt.
• ≡ là một quan hệ tương đưong trên .
• ≤ là một thứ tự bộ phận trên tập của các lớp tương đương trên F.
38
• inh: giả sử cho biết Như vậy inh là
một ánh xạ kết hợp với mỗi đặc trưng f một tập các đặc trưng “bên dưới f y
theo ≤ thứ tự trên đặc trưng.
• Subst là một ánh xạ từ đến
Để hiểu rõ hơn, chúng ta xem xét ví dụ sau:
Một CSDL Multimedia cĩ chứa 3 loại media trừu tượng là hình ảnh, âm thanh và video
được liệt kê dưới đây
Media Object Part_frame Feature_s)
image Photo1.gif _ Church,durnstein,danube,subrahmanian
image Photo2.gif _ Cathedral,melk,subrahmanian
image Photo3.gif _ Church,st.paul,rome
Video Video1.mpg 1-5 Church,durnstein,stream
Video Video1.mpg 6-10 stream
Audio Audio1.wav 1-20 St.peters,tiber,rome
Bảng 2.5
• Tập các đặc trưng F cĩ chứa: church, durnstein, danube, subrahmanian,
cathedral, melk, st. paul. Rome. Stream. Restaurant, st.peters, tiber.
• ≡ cho biết :
o Church ≡ cathedral.
o River ≡ Stream
39
• Quan hệ ≤ cho biết
Hình 2.4
Cĩ nghĩa là
[tiber] ≤ [river], [danube] ≤ [river].
[st.paul] ≤ [church], [st.peter] ≤ [church].
Cách định nghĩa trên tuy cung cấp đầy đủ hơn các thơng tin hữu ích cho việc tìm kiếm
và trình bầy cấu trúc đơn giản của một hệ CSDL Multimedia cĩ cấu trúc nhưng nĩ vẫn
chưa cung cấp được một cấu trúc chỉ số hố mà hệ thống CSDL Multimedia dùng để tổ
chức và lưu trữ dữ liệu. Trước khi đưa ra một cấu trúc chỉ số hố thích hợp, chúng ta sẽ
được ra một ngơn ngữ truy vấn đơn giản dùng để truy vấn dữ liệu Multimedia. Ở đây
chúng ta trình bầy ngơn ngữ truy vấn trước vì chúng ta chỉ cĩ được một cấu trúc chỉ số
hố cĩ hiệu quả khi mà chúng ta đã tối ưu được các kiểu truy vấn mà người sử dụng
mong muốn .
2.4 Ngơn ngữ truy vấn khai thác dư liệu multimedia
Trong phần này, chúng ta sẽ trình bầy một ngơn ngữ truy vấn đơn giản được xây dựng
dựa trên SQL dùng để khai thác dữ liệu Multimedia. Chúng ta đã chỉ ra được rằng một
media tĩm tắt cĩ thể được dùng để mơ tả các loại dữ liệu media khác nhau sử dụng
kiến trúc mơ tả đồng nhất. Việc mở rộng ngơn ngữ truy vấn SQL sử dụng cho việc truy
vấn dữ liệu được xây dựng bởi kiến trúc mơ tả đồng nhất sẽ là tiền đề để chúng ta tiếp
tục mở rộng ngơn ngữ truy vấn dùng cho việc khai thác các dữ liệu media được xây
dụng theo kiến trúc lai ghép
40
2.4.1 Truy vấn SMDSs (mơ tả đồng nhất)
Các hàm cơ bản của SMDSs bao gồm:
• FindType(Obj): hàm này sử dụng đối tượng media Obj làm đầu vào và sẽ trả về
kiểu của đối tượng, ví dụ:
o FindType(image1.gif) = gif.
o FindType(movie1.mpg) = mpg.
• FindObjWithFeature(f): hàm này sử dụng đặc trưng f là giá trị đầu vào và trả về
một tập tất cả các loại đối tượng media mà cĩ chứa đặc trưng f, ví dụ
o .
o
• FindObjWithFeatureAttr(f,a,v): hàm này sử dụng đặc trưng f, một thuộc tính tên
a kết hợp với đặc trưng này và một giá trị v là đầu vào. Giá trị trả về sẽ là tất cả
các đối tượng o cĩ chứa đặc trưng và giá trị của thuộc tính a trong đối tượng o là
v. Ví dụ:
o : câu hỏi này địi hỏi tìm
tất cả các đối tượng media mà cĩ sự xuất hiện của Jane Shady trong chiếc
áo mầu blue.
o câu hỏi này địi hỏi tìm tất cả
các đối tượng media mà một con voi cĩ mang một cái nơ mầu đỏ xuất
hiện.
• FindFeaturesInObj(Obj): câu hỏi này địi hỏi phải tìm tất cả các đặc trưng cĩ
mặt trong một đối tượng media đã cho. Kết quả trả về là một tập bao gồm tất cả
các đặc trưng. Ví dụ:
o câu hỏi này yêu cầu trả về tất cả các đặc
trưng cĩ trong file ảnh im1.gif.
41
o câu hỏi này yêu cầu trả về tất cả các
đặc trưng cĩ trong 5 frame đầu tiên của file video video1.mpg.
• FindFeatureandAttrinObj(Obj): hàm này cũng cĩ chức năng tương tự như hàm
trước ngoại trừ việc nĩ trả về một quan hệ cĩ schema như sau: (Feature,
Attribute,Value) trong đĩ cặp 3 (f,a,v) xuất hiện trong quan hệ đầu ra nếu thuộc
tính a của đặc trưng f được xác định và cĩ giá trị là v. Ví dụ:
o cĩ thể trả về kết quả được mơ tả ở bảng
sau
Feature Attribute Value
John age 32
John address 32 PicoLane.Mclean.VA 22050.
Mary age 46
Mary address 16 ShawRoad.Dumfries.VA 2290s.
Mary employer XYZCorp.
Mary boss David
Bảng 2.6
SMDS-SQL mở rộng của chúng ta sẽ bao gồm tất cả các câu lệnh chuẩn của SQL cĩ
bổ sung thêm một số đặc trưng của dữ liệu Multimedia vào SQL (bổ sung thêm vào
Select, From, Where)
• Tuyên bố Select cĩ thể chứa thực thể media. Một thực thể media được định
nghĩa như sau:
o Nếu m là một đối tượng media liên tục, i và j là 2 số nguyên khi đĩ m
: [i,j] là một thực thể media thể hiện một tập tất cả các frame của đối
tượng media m nằm trong (và chỉ trong) khoảng i và j.
o Nếu m khơng phải là một đối tượng media liên tục thì khi đĩ m là một
thực thể media.
42
o Nếu m là một thực thể media và a là một thuộc tính của m thì khi dĩ
m.a là một thực thể media.
• Tuyên bố From cĩ thể cĩ các thực thể theo mẫu sau: (media) (source) (M), cĩ
nghĩa là chỉ cĩ các đối tượng media kết hợp với tên của kiểu media và tên của
dữ liệu nguồn được xem xét dến khi thực hiện câu hỏi và M là một biến được
xếp loại trên các đối tượng media đĩ.
• Tuyên bố Where cho phép cĩ các biểu thức cĩ dạng term In func.call. Trong đĩ:
o Term cĩ thể là một biến (trong trường hợp này được sắp xếp trên kiểu trả
về của func.call) hoặc là một đối tượng cĩ kiểu đầu ra giống như
func.call.
o Func.call kà một trong 5 hàm đã nêu ra ở trên.
Chúng ta cũng xem xét một vài ví dụ
• Tìm tất cả các đối tượng ảnh hoặc video cĩ chứa cả Jane Shady và Denis
Dopeman.
SELECT M
Select M
FROM smds source M
WHERE (FindType(M)= Video OR FindType(M)=Image
AND
M IN FindObjWithFeatureand(Jane Shady) And
M IN FindObjWithFeatureand(Denis Dopeman)
• Tìm tất cả các ảnh và video mà đối tượng Jane Shady mặc áo vét mầu tím
SELECT M
FROM smds source M
WHERE FindType(M)=Video OR FindType(M)=Image
AND
M IN FindObjWithFeatureandAttr(Jane
Shady,suit,purple)
• Tìm tất cả các ảnh cĩ chứa cả Jane Shady và Denis Dopeman và Jane đứng bên
trái Denis
43
SELECT M
FROM smds source M
WHERE FindType(M)=Image AND
M IN FindObjWithFeature(Denis Dopeman) AND
M IN FindObjWithFeature(Jane Shady) AND
Left (jane Shady,Denis Dopeman.M)
Ở đây cĩ một chú ý là quan hệ left được sử dụng ở trên là một quan hệ media
tĩm tắt của CSDL hình ảnh
• Tìm tất cả các ảnh cĩ Jane Shady cùng với đối tượng xuất hiện trong đoạn
Video cùng với Denis Hopeman. Khác với câu hỏi trước, câu hỏi này địi hỏi
phải cĩ các thao tác kết hợp giữa các loại dữ liệu khác nhau. Để thực hiện được
câu hỏi này, chúng ta phải sử dụng các biến mở rộng như là Person, biến này
được dùng để tham chiếu đến đối tượng chưa xác định được danh tính trong
đoạn băng video.
2.4.2 Truy vấn dữ liệu multimedia mơ tả dưới kiến trúc lai tạo.
Trong phần trước, chúng ta đã trình bày ngơn ngữ SMDS-SQL như là một mơ hình để
._.
Các file đính kèm theo tài liệu này:
- LA3022.pdf