Ứng dụng công nghệ tin học để xây dựng mô hình quản lý dữ liệu đất

Tài liệu Ứng dụng công nghệ tin học để xây dựng mô hình quản lý dữ liệu đất: ... Ebook Ứng dụng công nghệ tin học để xây dựng mô hình quản lý dữ liệu đất

doc90 trang | Chia sẻ: huyen82 | Lượt xem: 1863 | Lượt tải: 1download
Tóm tắt tài liệu Ứng dụng công nghệ tin học để xây dựng mô hình quản lý dữ liệu đất, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Bé gi¸o dôc vµ ®µo t¹o tr­êng ®¹i häc n«ng nghiÖp hµ néi ----------eêf---------- HOµNG L£ H¦êNG ỨNG DỤNG CÔNG NGHỆ TIN HỌC ĐỂ XÂY DỰNG MÔ HÌNH QUẢN LÝ DỮ LIỆU ĐẤT LuËn v¨n th¹c sÜ n«ng nghiÖp Chuyªn ngµnh : Qu¶n lý ®Êt ®ai M· sè : 60.62.16 Ng­êi h­íng dÉn khoa häc: ts. NguyÔn DUY B×NH Hµ Néi - 2009 LỜI CAM ĐOAN Tôi xin cam đoan rằng, số liệu và kết quả nghiên cứu trong luận văn này là trung thực và chưa được sử dụng để bảo vệ một công trình nghiên cứu hay học vị nào. Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận văn đều được chỉ rõ nguồn gốc. Tác giả luận văn Hoàng Lê Hường LỜI CẢM ƠN Để có được kết quả nghiên cứu này, ngoài sự cố gắng và nỗ lực của bản thân, tôi đã nhận được sự giúp đỡ từ nhiều các đơn vị và cá nhân. Tôi xin ghi nhân và bày tỏ lòng biết ơn tới những tập thể, cá nhân đã dành cho tôi sự giúp đỡ quý báu đó. Đầu tiên, tôi xin bày tỏ lòng kính trọng và biết ơn sâu sắc sự giúp đỡ nhiệt tình của TS.Nguyễn Duy Bình, người đã trực tiếp hướng dẫn tôi thực hiện đề tài này. Tôi xin chân thành cảm ơn thầy Nguyễn Hữu Thành; thầy Hoàng Văn Mùa cùng các thầy cô trong Bộ môn Khoa học đất và Bộ môn Tài nguyên nước, Khoa Tài nguyên và Môi trường đã giúp đỡ tôi trong suốt quá trình thực hiện đề tài. Tôi xin chân thành cảm ơn những ý kiến đóng góp của các thầy cô trong Khoa Tài Nguyên và Môi trường và các thầy cô trong Viện Đào tạo Sau đại học. Tôi xin chân thành cảm ơn các đồng chí lãnh đạo, nhân viên Trung tâm kỹ thuật Tài nguyên và Môi trường Phú Thọ đã tạo điều kiện về thời gian và cung cấp số liệu giúp tôi thực hiện đề tài này. Và cuối cùng, tôi xin cảm ơn sự cổ vũ, động viên và giúp đỡ của gia đình, bạn bè trong quá trình học tập và thực hiện luận văn. Hà Nội, ngày tháng năm 2009 Tác giả luận văn Hoàng Lê Hường MỤC LỤC Trang DANH MỤC CHỮ VIẾT TẮT VÀ KÝ HIỆU TT Chữ viết tắt Chữ viết đấy đủ 1 AEZ Agro-Ecological Zoning (Khu vực nông nghiệp - sinh thái) 2 AGL Land and Water Development Division (Bộ phận phát triển tài nguyên đất và nước) 3 CGIS Canada Geographic Information System (Hệ thống thông tin địa lý Canada) 4 CNTT Công nghệ thông tin 5 CSDL Cơ sở dữ liệu 6 ESRI Environmental Systems Research Institute (Viện nghiên cứu hệ thống môi trường) 7 FAO Food and Agriculture Organization of the United Nations (Tổ chức nông lương thế giới) 8 FOLES Forest land Evaluation System (Phần mềm đánh giá đất lâm nghiệp) 9 GIS Geographic Information System (Hệ thống thông tin địa lý) 10 GPS Global Positioning System (Hệ thống định vị toàn cầu) 11 ISSS International Society of Soil Science (Hội khoa học đất quốc tế) 12 LRIS Land Resource Information Systems (Hệ thống thông tin tài nguyên đất) 13 MCDS Multi-criteria decision-support systems (Hệ thống hỗ trợ ra quyết định đa mục tiêu) 14 SOTER Global soil and terrain database (Cơ sở dữ liệu đất và địa hình toàn cầu) 15 SQL Structured Query Language (ngôn ngữ truy vấn cấu trúc) 16 UNEP United Nations Environment Programme (Chương trình Môi trường Liên hợp quốc) 17 UNESCO United Nations Educational Scientific and Cultural Organization (Tổ chức Khoa học Giáo dục và Văn hóa Liên hiệp quốc) 18 VILIS VietNam Land Information System (Hệ thống thông tin đất đai Việt Nam) 19 WAICENT World Agriculture Information Centre (Trung tâm Thông tin Nông nghiệp thế giới) DANH MỤC HÌNH Tên hình Trang Hình 2.1 - Đất và các thành phần cơ bản 6 Hình 2.2 - Cấu tạo phẫu diện đất vùng đồi núi 8 Hình 2.3 - Cấu tạo phẫu diện đất lúa nước 8 Hình 2.4 - Cấu trúc cơ sở dữ liệu về thông tin đất và nước 14 Hình 2.5 - Hệ thống luồng thông tin trong AEZ 14 Hình 2.6 - Mô hình dữ liệu thuộc tính của SOTER 18 Hình 2.7 - Cấu trúc cơ sở dữ liệu thuộc tính SOTER và các điểm dữ liệu 18 Hình 2.8 - Thiết kế tổng thể chức năng phần mềm VILIS 20 Hình 2.9 - Công nghệ ArcGIS của hãng ESRI(Mỹ) 21 Hình 2.10 - Giải pháp công nghệ của phần mềm VILIS 2.0 21 Hình 2.11- Mô hình GIS trong chương trình FOLES 22 Hình 2.12 - Giao diện chung của chương trình FOLES 23 Hình 2.13 - Cơ sở trí thức trong GIS 26 Hình 2.14 - Phép chiếu bản đồ 28 Hình 2.15 - Bảng dữ liệu của một mô hình dữ liệu vật lý 38 Hình 2.16 - Cây nhị phân (Binary tree) 39 Hình 2.17 - Màn hình đơn giản để ghi nhận hoạt động lên CSDL 41 Hình 2.18 - Kết quả của hoạt động ghi nhận 41 Hình 3.1 - Cấu trúc cơ sở dữ liệu hệ thống thông tin đất 46 Hình 4.1 - Biểu đồ phân cấp chức năng 60 Hình 4.2 - Biểu đồ luồng dữ liệu mức ngữ cảnh 61 Hình 4.3 - Mối quan hệ của các bảng dữ liệu (1- ∞: quan hệ dạng 1- nhiều) 63 Hình 4.4 - Cấu trúc mô hình quản lý dữ liệu đất 65 Hình 4.5 - Nội dung các chương trình thành phần (modules) 66 Hình 4.6 - Nội dung bản giao diện chính 66 Hình 4.7 - Giao diện khởi động chương trình 68 Hình 4.8 - Giao diện sử dụng chương trình 69 Hình 4.9 - Cửa sổ yêu cầu lựa chọn chế độ làm việc 70 Hình 4.10 - Các chức năng tại menu “He Thong” 70 Hình 4.11 - Các chức năng trên menu “Chuc Nang” 71 Hình 4.12 - Các chức năng xuất dữ liệu tại menu “Quan ly du lieu” 71 Hình 4.13 – Kết quả của chức năng “Tim Kiem Thong Tin” 72 Hình 4.14 - Các chức năng trên menu “Huong Dan” 72 Hình 4.15 - Kết quả của chức năng “Tro Giup” 73 Hình 4.16 - Giới thiệu chương trình 73 Hình 4.17 - Các chức năng của thanh công cụ 74 Hình 4.18 - Cửa sổ chức năng đăng nhập hệ thống 75 Hình 4.19 - Chức năng quản trị của hệ thống 75 Hình 4.20 - Chức năng quản lý thành viên 76 Hình 4.21 - Chức năng “Cap Nhap Thong Tin” 76 Hình 4.22 - Cửa sổ cập nhập thông tin 77 1. PHẦN MỞ ĐẦU 1.1. Đặt vấn đề Đối với mỗi ngành nghề, mỗi lĩnh vực hoạt động của xã hội thì mỗi con người có cách định nghĩa riêng về “đất”. Với các nhà địa chất thì nó là sản phẩm của quá trình địa chất, địa mạo. Đối với các nhà kinh tế thì đất cũng là một nguồn vốn đầu tư cùng với tư bản và lao động sẽ được khai thác nhằm mang lại lợi nhuận tạo sự phát triển. Đối với nhà nông thì đất là tư liệu sản xuất để tạo ra lương thực thực phẩm. Và đối với phần lớn mọi người thì đất đơn giản là khoảng không cho mọi hoạt động được thể hiện trong nhiều dạng sử dụng đất khác nhau. Có thể tổng hợp lại trong ngữ cảnh hiện nay thì đất là tất cả các vật được gắn liền với bề mặt trái đất cả những vùng bị nước bao phủ, đất bao gồm vô số các tính chất vật lý, hoá học trừu tượng, các quyền được sử dụng đất như được xây dựng trên bề mặt đất, quyền khai thác, sử dụng nước ngầm và khoáng sản… Như vậy, đất có vai trò vô cùng quan trọng đối với cuộc sống sinh hoạt và sản xuất của toàn xã hội. Như Bernard Binns đã nói “Đất là nguồn tài nguyên có giá trị nhất của nhân loại. Nó bao gồm mọi ý nghĩa của sự sống, thiếu đất loài người không thể tồn tại. Mọi sự tồn tại và tiến triển của loài người đều diễn ra trên mặt đất. Nguồn tài nguyên quý báu này sẽ không bao giờ bị kiệt quệ hay bị phá hủy một khi mọi người và tất cả các quốc gia thấy hết giá trị của nó. Nguồn tài nguyên đất đã được tích lũy hàng triệu năm đang bị sử dụng một cách phung phí trong một vài thập niên gần đây. Sự phung phí này đang và sẽ ở mức ngày càng gia tăng một khi chưa có các biện pháp xác đáng để ngăn chặn chúng” Và trong những năm gần đây, đất đai đã trở thành một trong những vấn đề tranh chấp nóng bỏng giữa các quốc gia, các tổ chức và cả những cá nhân. Chính vì vậy, việc quản lý và sử dụng đất một cách chặt chẽ, rõ ràng và cẩn thận đã trở thành vấn đề lớn toàn cầu. Điều này dẫn đến việc phải đánh giá lại các yêu cầu về thông tin đất và các chương trình, chiến lược nhằm giải quyết các vấn đề trên. Bởi “Sự hiểu biết chính xác về các nguồn tài nguyên, sự mô tả, thể hiện và lưu trữ chúng là yếu tố cần thiết trước hết để sử dụng và bảo vệ các tài nguyên đó một cách hợp lý” – Bernard Binns. Tuy nhiên, để quản lý tốt các thông tin đất với các dữ liệu không gian dưới dạng cơ sở dữ liệu là công việc hết sức khó khăn nếu thực hiện bằng các phương pháp thủ công trên các tài liệu và bản đồ giấy. Từ những năm 50 thế kỷ XX, con người bắt đầu cuộc cách mạng khoa học kỹ thuật lần thứ hai có bản chất là quá trình tin học hoá, nội dung là sử dụng “công nghệ thông tin” để thay thế một phần lao động trí óc, để trợ giúp phần điều khiển bằng trí tuệ của con người. Công nghệ thông tin là ngành sử dụng máy tính và phần mềm máy tính để chuyển đổi, thu thập, lưu trữ, bảo vệ, xử lý, truyền và cung cấp thông tin. Do đó, càng ngày càng có nhiều các nhà hoạch định chính sách sử dụng đất, các nhà quy hoạch, các nhà quản lý địa chính và các cơ quan, cá nhân khác cần kết hợp các vấn đề thông tin đất và các dữ liệu không gian dưới dạng cơ sở dữ liệu. Cơ sở dữ liệu được hiểu theo cách định nghĩa kiểu kĩ thuật thì nó là một tập hợp thông tin có cấu trúc. Thuật ngữ này thường dùng trong công nghệ thông tin và nó thường được hiểu rõ hơn dưới dạng một tập hợp liên kết các dữ liệu, thường đủ lớn để lưu trên một thiết bị lưu trữ như đĩa hay băng. Dữ liệu này được duy trì dưới dạng một tập hợp các tập tin trong hệ điều hành hay được lưu trữ trong các hệ quản trị cơ sở dữ liệu. Một số ưu điểm mà CSDL mang lại là: giảm sự trùng lặp thông tin xuống mức thấp nhất; do đó đảm bảo thông tin có tính nhất quán và toàn vẹn dữ liệu; đảm bảo dữ liệu có thể được truy - xuất theo nhiều cách khác nhau; nhiều người có thể sử dụng chung một cơ sở dữ liệu. Các giải pháp phần mềm được áp dụng hiện nay trong công tác xây dựng cơ sở dữ liệu phục vụ quản lý đất đai rất phong phú và đa dạng như: Arcview, ArcGIS, Mapinfo, Vilis … Mỗi phần mềm này đều có những ưu - nhược điểm riêng trong công tác quản lý dữ liệu đất đai, đặc biệt là đối với một quốc gia đang phát triển như Việt Nam bởi nhữn hạn chế về cơ sở kỹ thuật, về nguồn nhân lực… Với mong muốn được tìm hiểu thêm ứng dụng của công nghệ thông tin trong công tác quản lý dữ liệu đất, tôi tiến hành nghiên cứu và thực hiện đề tài: “Ứng dụng công nghệ tin học để xây dựng mô hình quản lý dữ liệu đất” với sự hướng dẫn của TS.Nguyễn Duy Bình. 1.2. Mục đích và yêu cầu của đề tài 1.2.1. Mục đích nghiên cứu - Nghiên cứu khả năng ứng dụng công nghệ tin học trong quản lý dữ liệu đất; - Xây dựng ứng dụng công nghệ GIS và cơ sở dữ liệu trong công tác quản lý dữ liệu tài nguyên đất. 1.2.2. Yêu cầu của đề tài - Điều tra các công nghệ thông tin (GIS, Database, Web…) đã được sử dụng để quản lý dữ liệu đất và các tiêu chí xây dựng cơ sở dữ liệu đất; - Xây dựng ứng dụng mẫu về quản lý dữ liệu đất; - Thu thập, điều tra tài liệu, số liệu, tài liệu, và bản đồ có liên quan. 1.3. Đối tượng và phạm vi nghiên cứu 1.3.1. Đối tượng nghiên cứu Hệ thống cơ sở dữ liệu đất bao gồm: + Dữ liệu chung; + Dữ liệu không gian; + Dữ liệu thuộc tính. 1.3.2. Phạm vi nghiên cứu Qua quá trình tìm hiểu và thu thập số liệu, phạm vi nghiên cứu của đề tài được xác định là huyện Thanh Ba – tỉnh Phú Thọ. 1.4. Ý nghĩa khoa học và thực tiễn của đề tài 1.4.1. Ý nghĩa khoa học - Đề xuất tiêu chí về công nghệ đối với công tác quản lý dữ liệu đất và các tiêu chí xây dựng mô hình quản lý dữ liệu đất; - Xây dựng mô hình ứng dụng công nghệ tin học để quản lý dữ liệu đất. 1.4.2. Ý nghĩa thực tiễn - Góp phần xây dựng bộ tiêu chí về công nghệ quản lý dữ liệu đất; - Xây dựng mô hình ứng dụng công nghệ tin học để quản lý dữ liệu đất cho huyện Thanh Ba - tỉnh Phú Thọ; - Mô hình quản lý dữ liệu đất sẽ giúp Bộ môn Thổ Nhưỡng – Khoa Tài nguyên và Môi trường quản lý dữ liệu một cách có hệ thống và đáp ứng được những yêu cầu về dữ liệu hiện nay. 2. TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU 2.1. Cơ sở lý luận về đất và dữ liệu đất 2.1.1. Tổng quan về đất 2.1.1.1. Khái niệm Trên mặt địa cầu có chỗ là một khối rắn chắc, có chỗ là bãi cát mênh mông hoang mạc, có chỗ cây cối mọc xanh tươi bát ngát. Loài người gọi vùng thứ nhất là đá (nham thạch), vùng thứ hai là sa mạc và vùng thứ ba là thổ nhưỡng. Như vậy thổ nhưỡng là đất mặt tơi xốp của vỏ lục địa, có độ dầy khác nhau. Nguồn gốc của đất là từ các loại "đá mẹ” nằm trong thiên nhiên lâu đời bị phá huỷ dần dần dưới tác dụng của yếu tố lý học, hoá học và sinh học. Tiêu chuẩn cơ bản để phân biệt giữa "đá mẹ" và đất là độ phì nhiêu, nếu chưa có độ phì nhiêu, thực vật thượng đẳng chưa sống được. Do yêu cầu sử dụng đất khác nhau, loài người đã dùng các phương pháp nghiên cứu đất khác nhau và lích luỹ được rất nhiều kiến thức về đất. Nhưng cũng có các nhận thức khác nhau về đất. Thí dụ đối với các công trình xây dựng nhà cửa, đường sá, thuỷ lợi thì đất chỉ là nguyên liệu chịu lực cho nên các cán bộ thuỷ lợi và xây dựng thường coi đất là một loại nguyên liệu, chỉ quan tâm đến các tính chất vật lý và cơ lý của đất. Còn trong sản xuất nông nghiệp đất là cơ sở sinh sống và phát triển cây trồng. 2.1.1.2. Nguồn gốc và thành phần cơ bản của đất Các loại đá nằm trong thiên nhiên chịu tác dụng lý học, hoá học và sinh học dần dần bị phá huỷ thành một sản phẩm được gọi là mẫu chất. Trong mẫu chất mới chỉ có các nguyên tố hoá học chứa trong đá mẹ sinh ra nó, còn thiếu một số thành phần quan trọng như chất hữu cơ, đạm, nước... vì thế thực vật thượng đẳng chịu sống được. Trải qua một thời gian dài nhờ tác dụng của sinh vật tích luỹ được chất hữu cơ và đạm, thực vật thượng đẳng sống được, có nghĩa là đã hình thành thổ nhưỡng. Như vậy có thể nói nguồn gốc ban đầu của đất là từ đá mẹ. Thí dụ ở nước ta có đất nâu đỏ trên đá bazan, đất nâu đỏ trên đá vôi, đất vàng đỏ trên phiến thạch sét hoặc đá biến chất như phiến thạch Mica, Gơnai... Chất rắn Đất Các loài sinh vật Khe hở giữa các hạt Chất hữu cơ Chất vô cơ Không khí Nước Không khí Nước Chất vô cơ Chất hữu cơ Dù là đất nông nghiệp, đất lâm nghiệp, đất đồng cỏ, thậm chí đất hoang đều gồm có các thành phần cơ bản sau đây: Hình 2.1 - Đất và các thành phần cơ bản Trong đó: - Chất vô cơ do đá phá huy tạo thành chiếm 95% trọng lượng hay 38% thể tích của chất rắn. - Chất hữu cơ do xác sinh vật phân huỷ chiếm dưới 5% trọng lượng hoặc 12% thể tích chất rắn. - Không khí một phần từ khí quyển nhập vào (O2+ N2) hoặc do đất sinh ra (CO2 và hơi nước). - Nước chủ yếu do từ ngoài nhập vào, vì có hoà tan nhiều chất cho nên nước trong đất thực chất là dung dịch đất. - Sinh vật trong đất có nhiều loài như côn trùng, giun, nguyên sinh động vật, các loài tảo và một số lượng rất lớn vi sinh vật. Những thành phần trên có thể rất khác nhau về tỷ lệ phối hợp. Thí dụ trong đất than bùn hàm lượng chất hữu cơ có thể tới 70-80%. Ngược lại trong đất cát, hoặc đất xói mòn trơ sỏi đá không có thực bì che phủ thì hàm lượng chất hữu cơ chỉ có mấy phần nghìn mà thôi. Không khí và nước trong đất cũng thay đổi rất nhiều bởi vì hai thành phần này tồn tại trong các khe hở của đất, nó không những phụ thuộc độ chặt, độ xốp mà còn phụ thuộc độ ẩm của đất. Cả hai thành phần này cộng lại có thể chiếm trên 50% thể tích đất.[04] 2.1.1.3. Hình thái đất [07] Hình thái thể hiện ở phẫu diện đất, nói cách khác hình thái đất là phẫu diện đất. Phẫu diện đất là mặt cắt thẳng đứng từ trên mặt đất xuống dưới sâu. Quan sát phẫu diện đất, từ trên mặt xuống dưới sâu thường có các tầng đất khác nhau về: màu sắc, thành phần cơ giới, độ chặt, độ xốp, mức độ đá lẫn, sự phân bố rễ cây trồng, độ ẩm... Tầng đất là những lớp đất nằm song song hay gần song song với bề mặt đất, các tầng đất được phân biệt với nhau bởi các dấu hiệu có thể quan sát, đo đếm tại thực địa hoặc thông qua phân tích trong phòng. Tầng đất trong phẫu diện là kết quả của một hay một số quá trình hình thành hoặc biến đổi diễn ra trong đất, vì vậy tầng đất thường được gọi là tầng phát sinh. Như vậy, nghiên cứu phẫu diện đất giúp ta chẩn đoán được quá trình phát sinh đất. Tầng phát sinh là cơ sở để tiến hành phân loại đất theo phát sinh, tầng phát sinh được định lượng các tính chất gọi là tầng chẩn đoán trong phân loại đất theo phương pháp định lượng. V.V Ðôcutraép là người đầu tiên dùng các ký tự là chữ cái in hoa ký hiệu cho các tầng đất, theo ông từ trên mặt xuống dưới sâu có 3 tầng cơ bản là A, B, C. Tầng A là lớp đất trên vùng (còn gọi là tầng mặt, tầng canh tác), đây là tầng tích luỹ chất hữu cơ và mùn, đồng thời tầng A cũng là tầng rửa trôi, tuỳ mức độ nghiên cứu mà tầng A được chia thành Aoo, Ao (tầng thảm mục), A1, A2, A3. Tầng B là tầng tích tụ các chất rửa trôi từ tầng A xuống, có thể được chia thành B1, B2, B3. Tầng C là tầng mẫu chất nằm ngay trên đá mẹ phát sinh ra đất. Hiện nay, các nhà khoa học đất đề nghị bổ sung thêm một số tầng đất. Theo Soil Taxonomy và FAO-UNESCO, trong phẫu diện có các tầng lần lượt từ trên xuống dưới như sau: tầng O, tầng H, các loại tầng A, tầng E, các loại tầng B và tầng C (một phẫu diện đất không nhất thiết phải đủ tầng đất nêu trên). Dưới đây là cấu tạo 2 phẫu diện đất điển hình tại Việt Nam A B C + Vùng đồi núi: Phẫu diện điển hình có 3 tầng cơ bản là A, B, C (Ðá mẹ ký hiệu là C ,Tầng B thường có độ dày lớn nhất) Chú ý: Ðộ dày từ mặt xuống tới đá mẹ được gọi là độ dày đất, còn quen gọi là độ dày tầng đất Hình 2.2 - Cấu tạo phẫu diện đất vùng đồi núi ACC B G D P + Vùng đồng bằng: Ðiển hình là phẫu diện đất lúa nước AC: Tầng canh tác (còn gọi là tầng A), tầng này càng dày, đất càng tốt P: Tầng đế cày: nằm ngay dưới tầng canh tác B: Tầng tích tụ có màu loang lổ đỏ vàng, tầng này tích tụ các chất rửa trôi từ trên xuống, ngoài ra còn tích tụ một số chất từ nước ngầm đem lên, nên tầng B đất đồng bằng có tích tụ 2 chiều. G: Tầng glay có màu xanh xám hoặc xám xanh Hình 2.3 - Cấu tạo phẫu diện đất lúa nước 2.1.2. Dữ liệu đất Các thành phần cấu thành của CSDL tài nguyên đất nói chung bao gồm: Thông tin về hệ thống quy chiếu; Thông tin về hệ toạ độ, độ cao Nhà nước; Thông tin về hệ thống bản đồ địa hình cơ bản; Thông tin về đường biên giới và địa giới hành chính; Thông tin về mô hình độ cao địa hình; Thông tin về các loại đất phân theo tính chất đất; Thông tin về các loại sử dụng đất phân theo hiện trạng sử dụng; Thông tin về bản đồ thửa đất - bao gồm nhà cửa, tài sản trên đất; Thông tin về chủ sử dụng đất; và thông tin về các dữ liệu có liên quan khác. Như vậy, dữ liệu đất là một thành phần trong hệ thống CSDL tài nguyên đất. Dữ liệu về đất cũng gồm rất nhiều các thành phần riêng như là vị trí đất, nguồn gốc hình thành, các tính chất hóa học, sinh học, vật lý, … CSDL đất nói riêng cũng tương tự như nhiêu CSDL khác, được phân loại theo dạng thông tin gồm: CSDL không gian (đồ họa) và CSDL thuộc tính (văn bản). CSDL đất phân loại theo nguồn thông tin gồm: Thông tin đầu vào như dữ liệu bản đồ (thu thập từ bản đồ trên giấy, bản đồ số, số liệu đo mặt đất, số liệu đo ảnh hàng không, vũ trụ …); dữ liệu thuộc tính (thu thập từ nội dung bản đồ cũ, điều tra thực địa, sổ sách tài liệu, hồ sơ, số liệu điều tra cơ bản); Thông tin đầu ra phục vụ yêu cầu quản lý của các cơ quan nhà nước; của ngành Tài nguyên và môi trường, các ngành khác và phục vụ cho nhu cầu sinh hoạt của người dân. 2.2. Ứng dụng công nghệ thông tin trong quản lý dữ liệu đất 2.2.1. Khái niệm chung về công nghệ thông tin Từ những năm 50 – thế kỷ XX con người bắt đầu cuộc cách mạng khoa học kỹ thuật lần thứ hai có bản chất là quá trình tin học hoá nội dung là sử dụng “công nghệ thông tin” để thay thế một phần lao động trí óc, để trợ giúp phần điều khiển bằng trí tuệ của con người. Công nghệ thông tin (CNTT) là tập hợp các ngành khoa học kỹ thuật nhầm giải quyết vấn đề thu nhận thông tin, quản lý thông tin, xử lý thông tin, truyền thông tin và cung cấp thông tin. Để giải quyết những vấn đề này, người ta đã tập trung vào các nội dung sau đây: Xác định hệ thống thông tin: các thể loại thông tin, yêu cầu về chất lượng, các chuẩn thông tin ...; Xác định hệ thống phần cứng và phần mềm hệ thống, xây dựng tổ chức cho toàn hệ thống; Thu nhận thông tin: sử dụng kỹ thuật đo đạc để lấy số liệu, tổ chức hệ thống thống kê số liệu thông qua bộ máy quản lý của ngành, tổ chức hệ thống cập nhật dữ liệu; Quản lý thông tin, xây dựng hệ thống cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu, xử lý thông tin, phân tích và tổng hợp hệ thống thông tin, giải các bài toán ứng dụng chuyên ngành; Truyền thông tin: xây dựng hệ thống đường truyền thông tin, giải pháp truyền thông tin trên mạng, hệ quản trị mạng thông tin, bảo vệ an toàn trên đường truyền thông tin, bảo mật thông tin, cung cấp thông tin, xây dựng giao diện với người sử dụng, hiển thị thông theo nhu cầu, tổ chức mạng dịch vụ thông tin … 2.2.2. Khái niệm về quản lý dữ liệu Quản lý dữ liệu là quá trình chăm sóc, bảo trì các dữ liệu. Nó bao gồm một loạt các hoạt động từ khi nhập dữ liệu vào hệ thống, kiểm tra, sắp xếp và phân loại dữ liệu. Dữ liệu có thể được lưu trữ một cách an toàn, hạn chế thấp nhất gặp phải những sự cố kỹ thuật gây phá hỏng thiết bị, hoặc do sự cạnh tranh không lành mạnh của con người, hay do thời gian gây ra. Quản lý dữ liệu không cho phép những cá nhân xâm phạm bản quyền có thể thay đổi nội dung của dữ liệu. Khuôn dạng dữ liệu cho phép có khả năng phân tích và xử lý dữ liệu để tạo ra sản phẩm khi có các yêu cầu về thông tin. 2.2.3. Một số ứng dụng CNTT trong quản lý dữ liệu đất và đất đai 2.2.3.1. Trên thế giới [19], [20], [21] Trên thế giới có rất nhiều các quốc gia, các tổ chức, các cơ quan đã đưa CNTT để xây dựng và quản lý dữ liệu đất nói riêng và đất đai nói chung. Tổ chức nông lương thế giới FAO chính là tổ chức có những ứng dụng lớn nhất về công nghệ thông tin trong quản lý tài nguyên. Trong thời gian ba thập kỷ qua, Bộ phận phát triển tài nguyên đất và nước (Land and Water Development Division - AGL) của FAO đã dẫn đầu về phát triển và ứng dụng máy tính dựa trên phân tích dữ liệu và hệ thống thông tin để hỗ trợ các quyết định về các vấn đề đất nông nghiệp, quy hoạch và quản lý tài nguyên nước. Các hệ thống thông tin đất và nước đã được thiết lập, có ba dạng hệ thống thông tin trong AGL là: Hệ thống đánh giá tài nguyên đất đai; Hệ thống đánh giá tài nguyên nước; Hệ thống quản lý thủy lợi. Trọng tâm của các hệ thống thông tin đất là các phương pháp và công cụ để đánh giá các tiềm năng, nguồn lực về đất và đất đai trên toàn cầu, hay cho từng quốc gia, khu vực. Hệ thống thông tin tài nguyên nước thì quan tâm tới các hệ thống thuỷ lợi, việc quản lý và sử dụng nước với các mức độ canh tác ở từng khu vực và đánh giá tài nguyên nước của mỗi quốc gia. Các công cụ tích hợp hệ thống gồm năm nhóm chủ yếu sau: Công cụ về Cơ sở dữ liệu: Bao gồm các vỏ chương trình cơ sở dữ liệu (database program shells) để tạo cơ sở dữ liệu đất, địa hình, nước, khí hậu, mùa vụ và sử dụng đất; cũng có thể một số cơ sở dữ liệu đã được tạo ra bằng cách sử dụng các chương trình. Công cụ mô hình. - Các mô hình tăng trưởng cây trồng, và dự đoán cả năng suất tiềm năng và năng suất thực. - Các mô hình về các dự toán rủi ro mất đất và đánh giá suy thoái đất đai. - Các mô hình cân bằng nước, yêu cầu nước tưới tiêu mùa vụ và các yêu cầu về thủy lợi - Các mô hình cân bằng dinh dưỡng cho cây trồng và các yêu cầu Các công cụ hỗ trợ ra quyết định: Có hai loại Hệ thống các công cụ chuyên biệt để hỗ trợ cho việc đánh giá đất dựa trên các thông tin và kiến thức sẵn có. Hệ thống hỗ trợ ra quyết định đa mục tiêu (Multi-criteria decision-support systems - MCDS) để phân tích tối ưu kịch bản sử dụng đất đai và nước. Các công cụ MCDS tương tác tạo so sánh về các điều kiện sử dụng đất và nước. Từ đó tìm thấy một hiệu quả và có thể chấp nhận được sự cân bằng giữa các yêu cầu của các bên liên quan trong tài nguyên đất và nước. Các tài liệu và các ấn phẩm AGL có một trung tâm tài liệu thu thập và duy trì hai loại tài liệu: Tài liệu hướng dẫn kỹ thuật của FAO và ngoài FAO (thông tin quốc gia, tài liệu chuyên biệt); Bộ sưu tập hàng ngàn bản đồ đã được sử dụng trong biên soạn Bản đồ thế giới đất của FAO-UNESCO, và tiếp tục được làm phong phú với bản đồ mới. Công cụ truyền thông đa phương tiện AGL sử dụng cơ sở Internet và Intranet để phổ biến các thông tin theo Trung tâm Thông tin Nông nghiệp thế giới (World Agriculture Information Centre - WAICENT) và hệ thống thành viên phổ biến thông tin của FAO. Bằng cách này, AGL đạt các mục tiêu tiếp cận khán giả hiệu quả hơn, giảm chi phí trong tất cả các giai đoạn tiếp nhận, xử lý và phổ biến thông tin về tài nguyên đất và nước. a) Hệ thống AEZ/LRIS (the AEZ/LRIS system) Các phương pháp nông nghiệp-sinh thái (Agro-Ecological Zone - AEZ) của FAO là hệ thống chính trong đánh giá tài nguyên đất và đất đai. Phương pháp AEZ bắt đầu phát triển vào năm 1975, AEZ được sử dụng như một công cụ đánh giá tài nguyên đất tốt nhất cho việc lập kế hoạch, quản lý và kiểm tra định lượng nguồn tài nguyên. Trong cơ sở dữ liệu AEZ, các loại dữ liệu địa lý tham chiếu được tích hợp lại, những dữ liệu đó có thể bao gồm các dữ liệu về địa hình; giới hành chính; đường giao thông, các thị trấn; sông ngòi; địa chất; đất; xói mòn; mưa; nhiệt độ và độ ẩm; chế độ sử dụng đất; che phủ rừng; dân số… AEZ được sử dụng trong việc đánh giá các ứng dụng khác, bao gồm: - Kiểm kê tài nguyên đất - Đánh giá tài nguyên đất phù hợp với sản xuất bao gồm cả lâm nghiệp và sản xuất chăn nuôi - Quy hoạch sử dụng tài nguyên đất - Đánh giá thoái hoá đất, hỗ trợ khả năng đánh giá và sử dụng đất mô hình tối ưu Cấu trúc cơ sở dữ liệu của AEZ Cấu trúc cơ sở dữ liệu của hệ thống được thể hiện cụ thể như trong hình 2.4. Đó là một cấu trúc dữ liệu khép kín từ người sử dụng đến mô hình nhờ các công cụ chức năng và từ mô hình đến người sử dụng thông qua việc truyền đạt thông tin. Hình 2.4 - Cấu trúc cơ sở dữ liệu về thông tin đất và nước Hình 2.5 - Hệ thống luồng thông tin trong AEZ b) Các công cụ của AEZ/LRIS Các công cụ đã được phát triển và ứng dụng trong AEZ/LRIS. Các công cụ bao gồm cơ sở dữ liệu và các công cụ phần mềm. Một mô tả về các công cụ chính như sau: GAEZ (Global agro-ecological zones 2000) Mô tả: Tài liệu về phương pháp và cơ sở dữ liệu toàn cầu để đánh giá năng lực sản xuất của đất dựa trên các tài nguyên đất, địa hình và đặc điểm khí hậu, áp dụng cho toàn cầu. Đối tượng: mô hình mô phỏng sự thay đổi khí hậu và sự phát triển cây trồng; các trường đại học và các viện nghiên cứu giáo dục, các nhà quản lý môi trường; người nghiên cứu về nông nghiệp, an ninh lương thực, thay đổi khí hậu toàn cầu. Chức năng: Cung cấp một kho chứa toàn cầu về khí hậu; đất và điều kiện địa hình; đánh giá tiềm năng đất đai và các nguồn lực hạn chế ; khả năng sản xuất cho hơn 250 các kết hợp của cây trồng và cấp quản lý. Nội dung dữ liệu: Đất toàn cầu và khó khăn do địa hình đối với sản xuất nông nghiệp. Dữ liệu khí hậu tham số trên toàn cầu. Tiềm năng sản xuất của đất theo từng quốc gia. Tính phù hợp cho từng mùa vụ theo mỗi quốc gia. Hơn 100 bản đồ và bảng biểu tương ứng với các báo cáo và yêu cầu của GIS (IDRISI/ARC/INFO). Phần mềm cơ sở dữ liệu: Hầu hết các bản đồ đều ở định dạng *.bnm và có thể xem được trên màn hình. Tất cả các bảng thì đều trong EXCEL. Tất cả các bản đồ cũng tương thích với các định dạng Arc/INFO và IDRISI. CSDL đất và địa hình toàn cầu (The Global soil and terrain database – SOTER) SOTER là một sáng kiến của ISSS, các phương pháp tiếp cận trong đó đã được thông qua tại Đại hội của lần thứ 13 của Hội Khoa học đất thế giới vào năm 1986. Theo một dự án của UNEP, phương pháp SOTER đã được phát triển trong sự hợp tác chặt chẽ với Trung tâm Nghiên cứu Tài nguyên đất của Canada (Land Resources Research Centre of Canada), FAO và ISSS. Sau khi thử nghiệm ban đầu ở ba khu vực, bao gồm năm quốc gia liên quan (Argentina, Brazil, Uruguay, Hoa Kỳ, Canada), các phương pháp đã được xác nhận bởi các nhóm làm việc của ISSS trên các loại đất thế giới và cơ sở dữ liệu địa hình số. Chương trình cơ sở dữ liệu số về đất và địa hình (SOTER) cung cấp một trật tự sắp xếp các nguồn tài nguyên tự nhiên trong các dữ liệu theo cách mà các dữ liệu có thể truy cập dễ dàng, kết hợp và phân tích từ các quan điểm về khả năng sử dụng và sản xuất, liên quan đến các yêu cầu thực phẩm, tác động môi trường và bảo tồn. Cơ bản trong phương pháp tiếp cận SOTER là lập bản đồ các khu vực riêng biệt, thường lặp đi lặp lại khuôn mẫu của dạng đất (landform), hình thái đất, độ dốc, nguồn gốc hình thành đất và các vật liệu đất tại quy mô 1:1 triệu (đơn vị SOTER). Mỗi đơn vị SOTER được liên kết thông qua hệ thống thông tin địa lý với một cơ sở dữ liệu trên máy tính có chứa tất cả các thuộc tính sẵn có về vị trí, dạng đất và địa hình, loại đất, khí hậu, thực vật và sử dụng đất. Vì vậy, mỗi loại thông tin hay mỗi sự kết hợp của các thuộc tính có thể được hiển thị dạng không gian như là một lớp riêng biệt hay trong dạng bảng. Khái niệm SOTER đã được phát triển chủ yếu cho các ứng dụng ở quy mô quốc gia và nhiều bản đồ SOTER của các quốc gia đã được thực hiện như tại U-ru-goay (1:1.000.000), Kenya (1:1.000.000, đất Khảo sát Kenya, 1995), Hung-ga-ri (1:500.000) , Jordan và Syria (1:500.000). Và một số quốc gia khác đang áp dụng phương pháp này bao gồm Bolivia, Etiopia, Argentina, Găm-bi-a và Mi-an-ma; hơn nữa, có một số đề xuất mở rộng các ứng dụng này trên nhiều quốc gia khác. Vào đầu những năm 1990, FAO công nhận việc cập nhật nhanh chóng đất Bản đồ đất thế giới cũng có thể là khả thi nếu lựa chọn quy mô bản đồ là 1:5.000.000. Cùng với UNEP, FAO đã bắt đầu tài trợ các quốc gia để cập nhật bản đồ đất ở tỷ lệ 1:5.000.000 tại Mỹ Latin và Bắc Châu Á. Đồng thời, FAO kiểm tra các phương pháp tiếp cận địa lý - SOTER ở khu vực Châu Á (Van Lynden, 1994), Châu Phi (Eschweiler, 1993), Mỹ Latin (Wen, 1993), Liên Xô cũ và Mông Cổ (Stolbovoy, 1996). Ở quy mô 1:1.000.000, cơ sở dữ liệu SOTER trên thế giới chứa một số lớp thông tin. Còn ở quy mô 1:5.000.000 thì một số thông tin đặc biệt về địa hình được giảm bớt. Những ứng dụng của SOTER - Hiện tại SOTER đang xây dựng một cơ sở dữ liệu tài nguyên đất cho từng khu vực, sau đó các cơ sở dữ liệu cá nhân sẽ được kết hợp vào một cơ sở dữ liệu toàn cầu. - Thông qua các hoạt động cơ bản của dự án SOTER cũng như dự định vào sự thành lập cơ sở dữ liệu đất và địa hình ở các quốc gia và khu vực, việc thành lập dựa trên sự giống nhau về nguyên tắc và thủ tục, để tạo điều kiện thuận lợi hơn nữa cho việc trao đổi các thông tin tài nguyên đất đai và nền tảng thành lập tổ chức cho một cơ sở dữ liệu toàn cầu. Cấu trúc cơ sở dữ liệu của SOTER SOTER cung cấp một trật tự sắp xếp các nguồn tài nguyên thiên nhiên thông qua các dữ liệu lập bản đồ của các khu vực đặc biệt, thường lặp đi lặp lại các khuôn mẫu của hình dạng đất đai, hình thái học, độ dốc, nguồn gốc vật liệu và đất. Hình 2.6 - Mô hình dữ liệu thuộc tính của SOTER Hình 2.7 - Cấu trúc cơ sở dữ liệu thuộc tính SOTER và các điểm dữ liệu (1:M = mối quan hệ 1-nhiều; M:1 = mối quan hệ._. nhiều -1) 2.2.3.2. Tại Việt Nam a) Hệ thống thông tin đất đai Việt Nam (VietNam Land Information System – VILIS) [11] Nguồn gốc xuất sứ của phần mềm: Để tăng cường ứng dụng công nghệ thông tin, công nghệ GIS trong công tác quản lý đất đai, năm 2000, Bộ Tài nguyên và Môi trường đã giao cho Viện Nghiên cứu Địa chính thực hiện đề tài nghiên cứu khoa học cấp Nhà nước “Xây dựng mô hình cơ sở dữ liệu đất đai cấp tỉnh” với chủ nhiệm đề tài là TS.Lê Minh, đề tài được nghiệm thu với sản phẩm chính là phần mềm hệ thống thông tin đất đai đa mục tiêu VILIS. Năm 2005, Bộ Tài nguyên và Môi trường đã chính thức giao cho Trung tâm Viễn Thám tiếp tục thực hiện hoàn thiện, nâng cấp và triển khai áp dụng phần mềm VILIS trong lĩnh vực quản lý đất đai. Tên chính thức của phần mềm là VietNam Land Information System – VILIS. Chức năng cơ bản của phần mềm VILIS VILIS là một phần mềm hệ thống thông tin đất đai đa mục tiêu, cung cấp đầy đủ những công cụ, chức năng để thực hiện các công tác nghiệp vụ chuyên môn của công tác quản lý đất đai. VILIS là một phần mềm bao gồm nhiều mô đun, mỗi mô đun bao gồm các chức năng hỗ trợ một nội dung của công tác quản lý nhà nước về đất đai: - Mô đun quản lý cơ sở toán học của bản đồ, hệ thống lưới toạ độ - độ cao các cấp, mốc địa giới hành chính - Mô đun quản lý cơ sở dữ liệu đất đai: bản đồ địa chính, hồ sơ địa chính, bản đồ trực ảnh, bản vẽ kỹ thuật… - Mô đun Đăng ký đất đai: quản lý hồ sơ, bản đồ địa chính và kê khai đăng ký, in GCNQSDĐ, cập nhật và quản lý biến động đất đai - Mô đun Hỗ trợ thống kê, kiểm kê đất đai, thành lập bản đồ hiện trạng sử dụng đất từ bản đồ địa chính - Mô đun quản lý hệ thống tài nguyên đất đai - Mô đun hiển thị, tra cứu và phân phối thông tin đất đai, giao dịch đất đai trên mạng internet/intranet theo giao diện Web Hình 2.8 - Thiết kế tổng thể chức năng phần mềm VILIS Giải pháp kỹ thuật về công nghệ nền VILIS xây dựng dựa trên hai công nghệ nền cơ bản: Công nghệ GIS và công nghệ Hệ quản trị cơ sở dữ liệu quan hệ(RDBMS). Hệ quản trị cơ sở dữ liệu: - Phần mềm hệ quản trị cơ sở dữ liệu chạy trên các máy tính đơn lẻ: FoxPro, Access. - Các phần mềm quản trị cơ sở dữ liệu lớn: Microsoft SQL, Oracle, DB2 và phần mềm nguồn mở MySQL, PostgreSQL. VILIS đưa ra các giải pháp mềm dẻo cho phép tận dụng tối ưu các ưu thế của các hệ quản trị cơ sở dữ liệu trên: - Phiên bản cấp xã, phường: Sử dụng Access - Phiên bản cấp quận huyện: Sử dụng MySQL, MS SQL Enterprise - Phiên bản cấp tỉnh, thành phố: Sử dụng Oracle hoặc MS SQL Hệ thống thông tin địa lý(GIS): VILIS đã lựa chọn giải pháp công nghệ ArcGIS của hãng ESRI làm công nghệ GIS nền để phát triển các ứng dụng. Hình 2.9 - Công nghệ ArcGIS của hãng ESRI(Mỹ) Môi trường lập trình ứng dụng: - Phiên bản VILIS 1.0 được phát triển bằng ngôn ngữ lập trình Visual Basic 6.0 môi trường phát triển sự dụng bộ thư viện đồ hoạ MapObject của hãng ESRI. - Phiên bản VILIS 2.0 được phát triển trong môi trường Dot Net, bằng ngôn ngữ lập trình C# môi trường phát triển sử dụng bộ thư viện đồ hoạ MapObject của hãng ESRI hoặc bộ thư viện ArcObject trong môi trường ArcGIS hoặc ArcEngine của ESRI. Hình 2.10 - Giải pháp công nghệ của phần mềm VILIS 2.0 b) Phần mềm đánh giá đất lâm nghiệp FOLES Phần mềm đánh giá đất lâm nghiệp (Forest land Evaluation System - FOLES) được xây dựng dựa trên phương pháp đánh giá lập địa và kết quả của đề tài “Phân hạng đất trồng rừng sản xuất một số loài cây chủ yếu ở các vùng trọng điểm” ,2006- 2009, do Trung tâm nghiên cứu Sinh thái và Môi trường rừng - Viện KH Lâm Nghiệp Việt Nam thực hiện từ yêu cầu của Bộ Nông nghiệp & PTNT Phần mềm FOLES nhằm tự động hóa quá trình phân hạng đất. Phần mềm được phát triển trên nền ArcEngine có khả năng chạy độc lập. FOLES có 3 chức năng chính: đánh giá tiềm năng đất lâm nghiệp, đánh giá thích hợp cây trồng, phân hạng đất vi mô, dự đoán năng suất và phân tích hiệu quả kinh tế. Qua đánh giá và thử nghiệm tại một số địa bàn lâm nghiệp, phần mềm cho kết quả chính xác, dễ sử dụng, có khả năng chạy ổn định trên các máy cấu hình thấp Pentium II trở lên. Công nghệ -Về thư viện GIS, sử dụng ArcEngine phần mềm này cung cấp bộ thư viện đầy đủ nhất về các thuật toán GIS, cho phép tạo phần mềm đóng gói chạy độc lập. -Về ngôn ngữ lập trình, sử dụng MicroSoft.NET. Hình 2.11- Mô hình GIS trong chương trình FOLES Cấu trúc Phần mềm FOLES gồm 4 modules -Module định nghĩa các tiêu chí đánh giá: module này là một hệ thống mở cho phép người dùng tự định nghĩa các tiêu chí sử dụng cho việc đánh giá. Các tiêu chí sau khi khai báo sẽ được đưa vào 1 CSDL cho phép trao đổi và sử dụng chung. -Module thư viện cây trồng: cho phép người dùng định nghĩa đặc điểm thích hợp cây trồng với các điều kiện khí hậu và đất đai -Module nhập dữ liệu và tính toán: cho phép đọc dữ liệu dạng GIS vào phần mềm, chuẩn hóa dữ liệu, tiến hành chồng ghép bản đồ -Module tạo kết quả: tạo bản đồ thành quả, báo cáo thành quả, dự đoán năng suất, thích hợp cây trồng Hình 2.12 - Giao diện chung của chương trình FOLES Ngoài ra FOLES có thêm một số module phụ: i) phân cấp quản lý người dùng, tùy theo từng đối tượng mà phân quyền truy cập đến các chức năng cụ thể, đơn giản hóa việc sử dụng với người sử dụng đầu cuối; ii) quản lý CSDL giúp tổ chức hệ thống dữ liệu một cách khoa học theo từng vùng địa lý, tạo thuận lợi cho lưu trữ và truy cập dữ liệu; iii) module Trợ giúp: giải thích các khái niệm về thổ nhưỡng, sinh thái cây trồng, hệ thống cho điểm trong chương trình, giúp người dùng hiểu được cơ sở khoa học của quá trình phân hạng đất. 2.3. Tổng quan về hệ thống thông tin địa lý – GIS Hệ thống thông tin địa lý (Geographic information system – GIS) còn được hiểu như là một hệ thống về các thông tin mang tính chất địa lý (geographical information system), là một hệ thống thông tin để thu thập, lưu trữ, phân tích, quản lý và trao đổi dữ liệu liên quan đến không gian. 2.3.1. Khái niệm về GIS Đã có nhiều định nghĩa khác nhau về GIS, nhưng nói chung hiện nay đã thống nhất quan niệm chung là “GIS là một hệ thống kết hợp giữa con người và hệ thống máy tính cùng các thiết bị ngoại vi để lưu trữ, xử lý, phân tích, hiển thị các thông tin địa lý để phục vụ một mục đích nghiên cứu, quản lý nhất định”. GIS được sử dụng nhằm xử lý đồng bộ các lớp thông tin không gian (bản đồ) gắn với các thông tin thuộc tính, phục vụ nghiên cứu, quy hoạch và quản lý các hoạt động theo lãnh thổ. Xét dưới góc độ là công cụ, GIS dùng để thu thập, lưu trữ, biến đổi, hiển thị các thông tin không gian nhằm thực hiện các mục đích cụ thể. Xét dưới góc độ là phần mềm, GIS làm việc với các thông tin không gian, phi không gian, thiết lập quan hệ không gian giữa các đối tượng. Có thể nói các chức năng phân tích không gian đã tạo ra diện mạo riêng cho GIS. Xét dưới góc độ ứng dụng trong quản lý nhà nước, GIS có thể được hiểu như là một công nghệ xử lý các dữ liệu có toạ độ để biến chúng thành các thông tin trợ giúp quyết định phục vụ các nhà quản lý.   Xét dưới góc độ hệ thống, GIS là hệ thống gồm các hợp phần: Phần cứng, Phần mềm, Cơ sở dữ liệu và Cơ sở tri thức chuyên gia. 2.3.2. Cấu trúc và dữ liệu của GIS 2.3.2.1. Cấu trúc GIS Phần cứng Bao gồm hệ thống máy tính và các thiết bị ngoại vi có khả năng thực hiện các chức năng nhập thông tin (Input), xuất thông tin (Output) và xử lý thông tin của phần mềm. Hệ thống này gồm có máy chủ (server), máy khách (client), máy quét (scanner), máy in (printer) được liên kết với nhau trong mạng LAN hay Internet Phần mềm Đi kèm với hệ thống thiết bị trong GIS ở trên là một hệ phần mềm có tối thiểu 4 nhóm chức năng sau đây: - Nhập thông tin không gian và thuộc tính từ các nguồn khác nhau. - Lưu trữ, điều chỉnh, cập nhật và tổ chức các thông tin không gian và thuộc tính. - Phân tích biến đổi thông tin trong cơ sở dữ liệu nhằm giải quyết các bài toán tối ưu và mô hình mô phỏng không gian - thời gian. - Hiển thị và trình bày thông tin dưới các dạng khác nhau, với các biện pháp khác nhau. Phần mềm được phân thành ba lớp: hệ điều hành, các chương trình tiện ích đặc biệt và các chương trình ứng dụng. Cơ sở dữ liệu (CSDL) GIS phải bao gồm một cơ  sở dữ liệu chứa các thông tin không gian (thông tin địa lý: cặp tọa độ x,y trong hệ tọa độ phẳng hoặc địa lý) và các thông tin thuộc tính liên kết chặt chẽ với nhau và được tổ chức theo một ý đồ chuyên ngành nhất định. Thời gian được mô tả như một kiểu thuộc tính đặc biệt. Quan hệ  được biểu diễn thông qua thông tin không gian và/hoặc thuộc tính Cơ sở tri thức  Cấu trúc của Cơ sở tri thức trong GIS được thể hiện như sau Hình 2.13 - Cơ sở trí thức trong GIS 2.3.2.2. Dữ liệu của GIS Dữ liệu trong hệ thống thông tin địa lý GIS là các dữ liệu địa lý nhằm phản ảnh thế giới thực, cần trả lời được các câu hỏi: - Cái gì? (dữ liệu thuộc tính); - Ở đâu? (dữ liệu không gian); - Khi nào? (thời gian); - Tương tác với các đối tượng khác ra sao? (quan hệ). Một đối tượng của dữ liệu địa lý được coi là đã xác định khi có thông tin về các lĩnh vực trên. Đặc điểm quan trọng trong tổ chức dữ liệu của GIS là: dữ liệu không gian (bản đồ) và dữ liệu thuộc tính được lưu trữ trong cùng một cơ sở dữ liệu (CSDL) và có quan hệ chặt chẽ với nhau. Dữ liệu không gian có hai dạng cấu trúc: Cấu trúc raster có thể hiểu đơn giản là một “ảnh” chứa các thông tin về một chuyên đề. Ảnh raster mô phỏng bề mặt trái đất và các đối tượng trên đó bằng một lưới (đều hoặc không đều) gồm các hàng và cột. Những phần tử nhỏ này gọi là những pixel hay cell. Giá trị của pixel là thuộc tính của đối tượng. Kích thước pixel càng nhỏ thì đối tượng càng được mô tả chính xác. Một mặt phẳng chứa đầy các pixel tạo thành raster; Cấu trúc vector mô tả vị trí và phạm vi của các đối tượng không gian bằng tọa độ cùng các kết hợp hình học gồm nút, cạnh, mặt và quan hệ giữa chúng. Về mặt hình học, các đối tượng được phân biệt thành 3 dạng: đối tượng dạng điểm (point), đối tượng dạng đường (line) và đối tượng dạng vùng (region hay polygon). Dữ liệu thuộc tính dùng để mô tả đặc điểm của đối tượng. Dữ liệu thuộc tính có thể là định tính hoặc định lượng. Về nguyên tắc, số lượng các thuộc tính của một đối tượng là không có giới hạn. Để quản lý dữ liệu thuộc tính của các đối tượng địa lý trong CSDL, GIS đã sử dụng phương pháp gán các giá trị thuộc tính cho các đối tượng thông qua các bảng số liệu. Mỗi bản ghi đặc trưng cho một đối tượng địa lý, mỗi cột của bảng tương ứng với một kiểu thuộc tính của đối tượng đó. Dữ liệu chung bao gồm các thông tin về hệ quy chiếu và tỷ lệ bản đồ. Hệ quy chiếu (Projection): Khoảng cách giữa các điểm, diện tích, hình dạng các khu vực trên trái đất khi biểu thị lên mặt phẳng không tránh khỏi sự biến dạng, hay nói cách khác có sai số. Để biểu thị bề mặt Elipxoid lên mặt phẳng người ta sử dụng phép chiếu bản đồ. Phép chiếu bản đồ xác định sự tương ứng giữa bề mặt Elipxoid và mặt phẳng có nghĩa là mỗi điểm trên bề mặt Elipxoid quay có toạ độ φ,λ tương ứng với một điểm duy nhất trên mặt phẳng với toạ độ vuông góc X,Y. Lưới kinh vĩ độ (hoặc các đường toạ độ khác xây dựng trong những phép chiếu nhất định gọi là lưới chiếu bản đồ), lưới chiếu bản đồ đó là cơ sở toán học để phân bố chính xác các yếu tố nội dung bản đồ. Quan hệ phụ thuộc giữa toạ độ một điểm trên mặt đất và toạ độ vuông góc của điểm đó trên bản đồ được biểu thị bằng công thức : x= f1(φ,λ); y = f2 (φ,λ) Hình 2.14 - Phép chiếu bản đồ Tỷ lệ bản đồ (Scale): chỉ mức độ thu nhỏ của bản đồ so với thực tế. Cần phải có một tỷ lệ bản đồ thích hợp và thống nhất cho các đối tượng địa lý trong một CSDL GIS. Tùy theo quy mô, tính chất của bản đồ để chọn tỷ lệ thích hợp. 2.3.3. Chức năng của GIS Nhập dữ liệu Quản lý dữ liệu Sửa đổi và phân tích dữ liệu không gian Sửa đổi  và phân tích dữ liệu phi không gian Tích hợp dữ liệu phi không gian và thuộc tính Đây là các chức năng quan trọng nhất của GIS, để phân biệt với các các hệ khác, nhất là các hệ vẽ bản đồ tự động và các hệ CAD (Computer-Added Design-thiết kế bằng máy tính) là những hệ cũng làm việc với bản đồ số trên máy tính - Chiết xuất thông tin: tách, lọc các thông tin quan tâm trong tập dữ liệu; - Nhóm các thông tin theo một tiêu chuẩn nhất định; - Đo đạc: xác định nhanh các thông số hình học của đối tượng được thể hiện như diện tích, độ dài, vị trí….; - Chồng ghép bản đồ - Các phép tính toán lân cận (quan hệ không gian): lọc, phân tích vùng đệm, phân tích xu thế, tính toán độ dốc, hướng phơi, phân chia lưu vực, chiết xuất dòng chảy; - Các phép nội suy: từ điểm, từ đường; - Dựng mô hình 3 chiều và phân tích trên mô hình 3 chiều (3D): tạo lát cắt, phân tích tầm nhìn….; - Tính toán mạng để tìm khoảng cách, đường đi. Xuất bản 2.3.4. Ứng dụng của GIS Cơ sở dữ liệu địa lý được tạo và quản lý bằng GIS cho phép các ứng dụng đa ngành có thể được thực hiện trên cùng một nền dữ liệu thống nhất. Do vậy, kỹ thuật GIS hiện nay được ứng dụng phổ biến trong nhiều lĩnh vực, được xem là "công cụ hỗ trợ quyết định (decision - making support tool). 2.3.4.1. Các bài toán ứng dụng của công nghệ GIS a) Tính toán theo các mô hình để tạo ra thông tin mới Ví dụ: + Bản đồ thích nghi cây trồng được tính toán dựa trên việc chồng xếp có trọng số các thông tin: bản đồ thổ nhưỡng, bản đồ độ dốc. + Bản đồ hiện trạng rừng hai thời kỳ được chồng xếp để có bản đồ về biến động rừng giữa hai thời kỳ. b) Các bài toán mô phỏng Theo các mô hình lý thuyết (mang tính giả định), GIS còn có ứng dụng trong các bài toán mô phỏng như các ví dụ sau - Với một chiều cao đập cho trước, GIS có thể mô phỏng được mức, lượng, diện tích nước ngập; - Với các chiều rộng mở đường khác nhau trên bản đồ hiện trạng sử dụng đất, GIS cho phép mô phỏng các phương án mở đường và tiền đền bù. c) Các ứng dụng có liên quan đến mô hình số độ cao - Như tính toán phạm vi quan sát từ điểm phục vụ cho các yêu cầu quân sự hoặc đặt trạm ăng ten viễn thông (điện thoại di động); - Các thông số của địa hình được xác định như độ cao, độ dốc còn phục vụ cho công tác qui hoạch (ví dụ phân cấp phòng hộ đầu nguồn) và các khoa học trái đất (địa mạo, địa lý). d) Các phân tích mạng Để giải quyết các bài toán tìm đường ngắn nhất hay thời gian thích hợp để bật tắt đèn xanh đèn đỏ trong giao thông đô thị. e) Các phân tích khoảng cách   Có thể ứng dụng tìm đặt vị trí (allocation) như trạm xe buýt, trạm xăng, siêu thị hay trường học một cách hiệu quả nhất. 2.3.4.2. Một số lĩnh vực được ứng dụng chủ yếu trên thế giới Từ những bài toán cơ bản trên, công nghệ GIS đã mang lại rất nhiều ứng dụng hữu ích cho cuộc sống trong mọi lĩnh vực. a) Nghiên cứu quản lý tài nguyên thiên nhiên và môi trường Quản trị rừng (theo dõi sự thay đổi, phân loại...); Quản trị đường di cư và đời sống động vật hoang dã; Quản lý và quy hoạch đồng bằng ngập lũ, lưu vực song; Bảo tồn đất ướt; Phân tích các biến động khí hậu, thuỷ văn; Phân tích các tác động môi trường (EIA); Nghiên cứu tình trạng xói mòn đất; Quản trị sở hữu ruộng đất; Quản lý chất lượng nước; Quản lý, đánh giá và theo dõi dịch bệnh; Xây dựng bản đổ và thống kê chất lượng thổ nhường; Quy hoạch và đánh giá sử dụng đất đai. b) Nghiên cứu điều kiện tự nhiên kinh tế - xã hội Quản lý dân số; Quản trị mạng lưới giao thông (thuỷ - bộ); Quản lý mạng lưới y tế, giáo dục; Điều tra và quản lý hệ thống cơ sở hạ tầng. c) Nghiên cứu hỗ trợ các chương trình quy hoạch phát triển Đánh giá khả năng thích nghi cây trồng, vật nuôi và động vật hoang dã; Định hướng và xác định các vùng phát triển tối ưu trong sản xuất nông nghiệp; Hỗ trợ quy hoạch và quản lý các vùng bảo tồn thiên nhiên; Đánh giá khả năng và định hướng quy hoạch đô thị, khu công nghiệp; Hỗ trợ bố trí mạng lưới y tế, giáo dục. d) Sản xuất nông nghiệp và phát triển nông Trong nghiên cứu sản xuất nông nghiệp và phát triển nông thôn, các lĩnh vực ứng dụng của kỹ thuật GIS rất rộng rãi. Do vậy, GIS trở thành công cụ đắc dụng cho việc quản lý và tổ chức sản xuất nông nghiệp - nông thôn trên các vùng lãnh thổ. Thổ nhường: Xây dựng các bản đồ đất và đơn tính đất; Đặc trưng hoá các lớp phủ thổ nhường Trồng trọt: Khả năng thích nghi các loại cây trồng; Sự thay đổi của việc sử dụng đất; Xây dựng các đề xuất về sử dụng đất; Khả năng bền vững của sản xuất nông nghiệp Nông - Lâm kết hợp; Theo dõi mạng lưới khuyến nông; Khảo sát nghiên cứu dịch - bệnh cây trồng (côn trùng và cỏ dại); Suy đoán hay nội suy các ứng dụng kỹ thuật Quy hoạch thuỷ văn và tưới tiêu: Xác định hệ thống tưới tiêu; Lập thời biểu tưới nước; Tính toán sự xói mòn/ bồi lắng trong hồ chứa nước; Nghiên cứu đánh giá ngập lũ Kinh tế nông nghiệp: Điều tra dân số / nông hộ; Thống kê; Khảo sát kỹ thuật canh tác; Xu thế thị trường của cây trồng; Nguồn nông sản hàng hoá Phân tích khí hậu: Hạn hán; Các yếu tố thời tiết; Thống kê Mô hình hoá nông nghiệp; Ước lượng / tiên đoán năng suất cây trồng Chăn nuôi gia súc / gia cầm: Thống kê; Phân bố; Khảo sát và theo dõi diễn biến, dự báo dịch bệnh Các ứng dụng trên có thể coi là “cổ điển” và đã được áp dụng thành công. Ngày nay GIS đang phát triển mạnh theo hướng tổ hợp, phát triển GIS lớn,liên kết mạng, ứng dụng thành quả của các ngành khoa học khác vào GIS, như ứng dụng trí tuệ nhân tạo, lý thuyết mờ vào trong việc xử lý dữ liệu GIS, tích hợp GIS với các thông tin chuyên đề để hình thành hệ thông tin giải quyết một vấn đề cụ thể cũng như trợ giúp ra quyết định, nhất là trong quản lý lãnh thổ. 2.3.5. Lợi ích và hạn chế của việc sử dụng kỹ thuật GIS Kỹ thuật GIS là một công nghệ ứng dụng các tiến bộ của khoa học máy tính do đó việc sử dụng GIS trong các mục tiêu nghiên cứu so với các phương tiện cổ điển có thể mang lại những hiệu quả cao do: Là cách tiết kiệm chi phí và thời gian nhất trong việc lưu trữ số liệu, Có thể thu thập số liệu với số lượng lớn, Số liệu lưu trữ có thể được cập nhật hoá một cách dễ dàng, Chất lượng số liệu được quản lý, xử lý và hiệu chỉnh tốt, Dễ dàng truy cập, phân tích số liệu từ nhiều nguổn và nhiều loại khác nhau, Tổng hợp một lần được nhiều loại số liệu khác nhau để phân tích và tạo ra nhanh chóng một lớp số liệu tổng hợp mới. Tuy nhiên, có những trở ngại xuất hiện trong quá trình sử dụng kỹ thuật GIS, những trở ngại này đặc biệt quan trọng là cần được cân nhắc thận trọng trong quá trình phát triển GIS tại các nước kém và đang phát triển như Việt Nam, đó là: Chi phí và những vấn đề kỹ thuật đòi hỏi trong việc chuẩn bị lại các số liệu thô hiện có, nhằm có thể chuyển từ bản đổ dạng giấy truyền thống sang dạng kỹ thuật số trên máy tính (thông qua việc số hoá, quét ảnh...) Đòi hỏi nhiều kiến thức của các kỹ thuật cơ bản về máy tính, và yêu cầu lớn về nguồn tài chính ban đầu. Chi phí của việc mua sắm và lắp đặt thiết bị và phần mềm GIS khá cao. Trong một số lĩnh vực ứng dụng, hiệu quả tài chánh thu lại thấp. Đặc biệt trong nông nghiệp, GIS có 3 điểm thuận lợi chính khi được so sánh với cách quản lý bản đổ bằng tay trước đây: Chúng là một công cụ khá mạnh trong việc lưu trữ và diễn đạt các số liệu đặc biệt là các bản đổ. Chúng có thể cho ra những kết quả dưới những dạng khác nhau như các bản đổ, biểu bản, và các biểu đổ thống kê,.. Chúng là một công cụ đắc lực cho các nhà khoa học đặc biệt về lãnh vực nghiên cứu hệ thống canh tác, đánh giá đất đai, khả năng thích nghi của các kiểu sử dụng đất, quản lý và xử lý các bản đồ giai thửa trong quản lý đất đai,.. Nó giúp cho các nhà làm khoa học đó khả năng phân tích các nguyên nhân và những ảnh hưởng và kiểm chứng những biến đổi trong hệ thống sinh thái cũng như khả năng thích ứng của việc thay đổi một chính sách đối với người dân. 2.4. Tổng quan về hệ thống cơ sở dữ liệu 2.4.1. Khái niệm về cơ sở dữ liệu và hệ thống cơ sở dữ liệu Cơ sở dữ liệu (viết tắt CSDL; tiếng Anh là database - DB) được hiểu theo cách định nghĩa kiểu kĩ thuật thì nó là một tập hợp thông tin có cấu trúc. Tuy nhiên, thuật ngữ này thường dùng trong công nghệ thông tin và nó thường được hiểu rõ hơn dưới dạng một tập hợp liên kết các dữ liệu, thường đủ lớn để lưu trên một thiết bị lưu trữ như đĩa hay băng. Dữ liệu này được duy trì dưới dạng một tập hợp các tập tin trong hệ điều hành hay được lưu trữ trong các hệ quản trị cơ sở dữ liệu. Một số ưu diểm mà CSDL mang lại: - Giảm sự trùng lặp thông tin xuống mức thấp nhất. Do đó đảm bảo thông tin có tính nhất quán và toàn vẹn dữ liệu - đảm bảo dữ liệu có thẻ được truy suất theo nhiều cách khác nhau - nhiều người có thể sủ dụng một cơ sở dữ liệu Hệ quản trị cơ sở dữ liệu (tiếng Anh: Database Management System - DBMS) là phần mềm hay hệ thống được thiết kế để quản trị một cơ sở dữ liệu. Cụ thể, các chương trình thuộc loại này hỗ trợ khả năng lưu trữ, sửa chữa, xóa và tìm kiếm thông tin trong một CSDL. Có rất nhiều loại hệ quản trị CSDL khác nhau, từ phần mềm nhỏ chạy trên máy tính cá nhân cho đến những hệ quản trị phức tạp chạy trên một hoặc nhiều siêu máy tính. Tuy nhiên, đa số hệ quản trị CSDL trên thị trường đều có một đặc điểm chung là sử dụng ngôn ngữ truy vấn theo cấu trúc mà tiếng Anh gọi là Structured Query Language (SQL). Các hệ quản trị CSDL phổ biến được nhiều người biết đến là MySQL, Oracle, PostgreSQL, SQL Server, DB2, Infomix, v.v.. Phần lớn các hệ quản trị CSDL kể trên hoạt động tốt trên nhiều hệ điều hành khác nhau như Linux, Unix và MacOS ngoại trừ SQL Server của Microsoft chỉ chạy trên hệ điều hành Windows. 2.4.2. Phân loại dữ liệu 2.4.2.1. Dữ liệu dạng phẳng (Flat file) Dữ liệu dạng phẳng là một chuỗi dữ liệu hai chiều được tổ chức theo hàng và cột tương tự như một bảng tính (spreadsheet). Đây là dạng đơn giản nhất trong quản lý CSDL. Tất cả các dữ liệu của một loại đối tượng được lưu trữ trong một file hay một bảng riêng. Quản lý CSDL dạng phẳng thường có giá thành thấp và dễ dàng sử dụng, nhưng sự phức tạp của dữ liệu thực tế đòi hỏi cần phải có thêm khả năng để có thể cung ứng dữ liệu. Trong một hệ thống lưu trữ dữ liệu dạng phẳng, mỗi hàng đại diện cho một đối tượng (observation), rất đơn giản. Mỗi cột thì chứa các dữ liệu cùng loại. 2.4.2.2. Dữ liệu dạng cây (Hierarchical) Trong cấu trúc dữ liệu dạng cây, mối quan hệ một - nhiều giữa nhiều tập dữ liệu được hình thức hóa vào trong thiết kế cơ sở dữ liệu. Thiết kế này thuận lợi trong những trường hợp có nhiều mẫu sản phẩm trong một lần thí nghiệm - dạng quan hệ 1-nhiều, nhưng có khó khăn với những trường hợp khác như là quan hệ nhiều-nhiều. Dạng dữ liệu này ít được sử dụng hơn dữ liệu dạng phẳng hay dữ liệu quan hệ. Trong cơ sở dữ liệu dạng cây, những phần tử dữ liệu có thể được thấy như là một nhánh cây đảo ngược. Dữ liệu dạng cây khi thiết lập có thể được lưu trữ trong một hệ quản lý CSDL quan hệ, và hệ quản lý CSDL quan hệ thường linh hoạt hơn, do đó hệ quản lý CSDL dạng cây thường rất hiếm được sử dụng 2.4.2.3. Dữ liệu dạng mạng lưới (Network) Trong mô hình dữ liệu dạng mạng, mối quan hệ phức hợp giữa các đối tượng trong cùng một lớp được quản lý dễ dàng hơn. Hệ thống Hypertext (như là mạng toàn cầu - World Wide Web - www) là một điển hình của phương thức quản lý dữ liệu này. Hệ quản lý CSDL dạng mạng lưới không phải là phổ biến, nhưng nó thích hợp trong một số trường hợp, nhất là trường hợp có khối lượng các mối quan hệ dữ liệu rất phức tạp. Dữ liệu dạng mạng có thể được lưu trữ trong một hệ quản lý CSDL. Bảng kết nối (join table) là cần thiết để xử lý mối quan hệ nhiều-nhiều. 2.4.2.4. Dữ liệu dạng đối tượng (Object oriented) Dữ liệu dạng đối tượng bắt đầu được ứng dụng từ những năm 90 của thế kỷ XX. Đây tuy là dạng dữ liệu tương đối phức tạp nhưng nó có khả năng thao tác nhiều dữ liệu cho nhiều mục đích khác nhau, và có khả năng sử dụng rộng rãi. Một số đặc tính của CSDL dạng đối tượng bao gồm: + Khả năng bao trùm (Encapsulation): Lập trình hướng đối tượng tập trung vào đối tượng với sự kết hợp giữa dữ liệu và mã nguồn. Trong các đối tượng có chứa các dữ liệu mà cho biết nó phải làm gì, nghĩa là các đối tượng có chứa các phương thức hoạt động. Đó chính là khả năng bao trùm. + Tính kế thừa (Inheritance): Tính kế thừa là khả năng định nghĩa một lớp đối tượng dựa trên một hoặc nhiều lớp đối tượng khác đã được định nghĩa trước đó. Lớp kế thừa thừa hưởng đầy đủ những tính chất được định nghĩa trong lớp cơ sở. Do đó nó cũng có thể đóng vai trò như là lớp cơ sở cho những lớp kế thừa tiếp theo. + Khả năng trao đổi thông điệp (Message Passing): Một chương trình hướng đối tượng giao tiếp với các đối tượng thông qua các thông điệp (Message), và các đối tượng có thể trao đổi thông điệp cho nhau. + Tính đa năng (Polymorphism): cho phép một chương trình sau khi đã biên dịch có thể có nhiều diễn biến xảy ra là một trong những thể hiện của tính đa hình – tính muôn màu muôn vẻ – của chương trình hướng đối tượng, một thông điệp được gởi đi (gởi đến đối tượng) mà không cần biết đối tượng nhận thuộc lớp nào. 2.4.2.5. Dữ liệu quan hệ (Relational data) Trong mô hình quan hệ, dữ liệu được lưu trong một hoặc nhiều bảng biểu, và các bảng biểu có liên quan với nhau, có nghĩa là, chúng có thể tham gia cùng với nhau, dựa trên các yếu tố dữ liệu trong những bảng biểu. Điều này cho phép lưu trữ dữ liệu với nhiều thành phần của một loại thông tin liên quan đến một đối tượng (mối quan hệ 1-nhiều). Cách này có hiệu quả trong việc lưu trữ dữ liệu lớn, phức tạp, bởi nó cung cấp khả năng kết hợp dữ liệu một cách linh hoạt. Hiện nay, được sử dụng phổ biến nhất trong chương trình quản lý CSDL là dữ liệu dạng quan hệ. Cách thức tương tác phổ biến nhất với hệ quản lý CSDL quan hệ là Ngôn ngữ truy vấn cấu trúc SQL. SQL cung cấp một cách thức mạnh mẽ và linh động cho việc bổ sung và thay đổi dữ liệu trong một hệ thống relational. 2.4.2.6. Ngôn ngữ đánh dấu mở rộng (XML - eXtensible Markup Language) Ngôn ngữ đánh dấu mở rộng - XML - được phát triển như là một định dạng truyền dữ liệu, và ngày càng trở lên phổ biến trong việc truyền dữ liệu trên Internet. Các sản phẩm quản lý CSDL hiện nay cũng đã bắt đầu sử dụng XML như định dạng lưu trữ dữ liệu. Nhưng chưa chắc chắn rằng nó có thể thay thế hoàn toàn cho các định dạng lưu trữ dữ liệu truyền thống hay không, nhất là trong các hệ thống quản lý dữ liệu dạng quan hệ. Các nhà cung cấp đang thêm các khả năng cho XML để nó hoàn thiện và được chấp nhận nhiều hơn. 2.4.3. Mô hình và cấu trúc dữ liệu 2.4.3.1. Mô hình dữ liệu Mô hình dữ liệu (data module) của một hệ thống quản lý dữ liệu là cấu trúc của các bảng (tables) và các cột (fields) để lưu trữ kết quả dữ liệu. Quá trình tạo ra mô hình dữ liệu chặt chẽ và hợp lý là một trong bước quan trọng trong quá trình xây dựng một hệ thống CSDL có hiệu quả và thành công. Mô hình vật lý dữ liệu (physical data model, Hình 2.15) diễn tả chi tiết và chính xác dữ liệu sẽ được tích trữ như thế nào, nó bao gồm cả tên, loại dữ liệu, và kích cỡ cho tất cả các cột ở trong mỗi bảng, và các quan hệ (relationships) liên kết các bảng với nhau (cột khóa nối kết các bảng). Hình 2.15 - Bảng dữ liệu của một mô hình dữ liệu vật lý 2.4.3.2. Cấu trúc dữ liệu Trong khoa học máy tính, cấu trúc dữ liệu là một cách lưu dữ liệu trong máy tính sao cho nó có thể được sử dụng một cách hiệu quả. Thông thường, một cấu trúc dữ liệu được chọn cẩn thận sẽ cho phép thực hiện thuật toán hiệu quả hơn. Việc chọn cấu trúc dữ liệu thường bắt đầu từ chọn một cấu trúc dữ liệu trừu tượng. Một cấu trúc dữ liệu được thiết kế tốt cho phép thực hiện nhiều phép toán, sử dụng càng ít tài nguyên, thời gian xử lý và không gian bộ nhớ càng tốt. Các cấu trúc dữ liệu được triển khai bằng cách sử dụng các kiểu dữ liệu, các tham chiếu và các phép toán trên đó được cung cấp bởi một ngôn ngữ lập trình. Mỗi loại cấu trúc dữ liệu phù hợp với một vài loại ứng dụng khác nhau, một số cấu trúc dữ liệu dành cho những công việc đặc biệt. Ví dụ, các Binary-tree đặc biệt phù hợp trong việc thiết kế cơ sở dữ liệu. Hình 2.16 - Cây nhị phân (Binary tree) Vì cấu trúc dữ liệu có tính chất quyết định đối với các chương trình chuyên nghiệp nên có rất nhiều hỗ trợ về cấu trúc dữ liệu trong các thư viện chuẩn của các ngôn ngữ lập trình hiện đại, ví dụ thư viện mẫu chuẩn của C++, Java API, và Microsoft .NET Framework. 2.4.4. Tính bảo mật Tính chủ quyền của dữ liệu. - Thể hiện ở phương diện an toàn dữ liệu. - Khả năng biểu diễn mối liên hệ của dữ liệu và tính chính xác dữ liệu. - Người khai thác cơ sở dữ liệu phải cập nhật cho CSDL những thông tin mới nhất. Tính bảo mật và quyền khai thác thông tin của người sử dụng. - Do ưu điểm CSDL có thể cho nhiều người khai thác đồng thời. nên cần phải có một cơ chết bảo mật phân quyền khai thác CSDL. - Các hệ điều hành nhiều người sử dụng hay cục bộ đều cung cấp cơ chế này. Tranh chấp dữ liệu - Khi nhiều người cùng truy nhập CSDL với các mục đích khác nhau rất có thể sẽ xảy ra hiện tượng tranh chấp dữ liệu. - Cần có cơ chế ưu tiên khi truy cập CSDL, ví dụ admin(người quản trị hệ thống) luôn có thể truy cập cơ sở dữ liệu. - Cấp quyền ưu tiên cho từng người khai thác. Đảm bảo an toàn dữ liệu khi có sự cố. - Khi CSDL nhiều và được quản lý tập trung, khả năng rủi ro mất dữ liệu rất cao. Các nguyên nhân chính là mất điện đột ngột hoặc hỏng thiết bị lưu trữ. - Hiện tại có một số hệ điều hành đã có cơ chế tự động sao lưu ổ cứng và sửa lỗi khi có sự cố xảy ra. Tuy nhiên, ta nên sao lưu dự phòng cho dữ liệu đề phòng trường hợp xấu xảy ra. Quyền truy cập và phân quyền Phần lớn các phần mềm quản lý CSDL đều cung cấp hệ thống để hạn chế số lượng người sử dụng và phân quyền cho người sử dụng. Việc tiến hành công việc bảo mật và phân quyền sử dụng sẽ dễ dàng khi sử dụng hệ thống client-server hơn là khi sử dụng hệ thống riêng biệt. Như vậy nếu muốn độ an toàn cao thì hãy chọn SQL Server hay Oracle và để Access vào vị trí chọn lựa cuối cùng. Ghi nhận hoạt động quản trị Một điều rất quan trọng nhằm bảo đảm chất lượng của CSDL là việc ghi nhận mọi hoạt động làm thay đổi CSDL, kể cả thời gian, nguời thực hiện và tại sao phải thực hiện hoạt động đó. Một hệ thống đơn giản ._.

Các file đính kèm theo tài liệu này:

  • docCHQL09025.doc
Tài liệu liên quan