Bài giảng Phân tích dữ liệu (Chuẩn kiến thức)

PHÂN TÍCH DỮ LIỆU 1. KHÁI NIỆM GIS được phân biệt với các loại hệ thống thông tin khác nhờ vào chức năng phân tích dữ liệu, đặc biệt là các chức năng phân tích không gian. Các chức năng này sử dụng dữ liệu không gian và dữ liệu thuộc tính của cơ sở dữ liệu GIS để trả lời cho các vấn đề đặt ra trong thế giới thực. Do tính chất phức tạp của các câu hỏi có thể đặt ra, các phép phân tích không gian có thể là chồng lớp số học hoặc luận lý đơn giản cho đến các phân tích mô hình phứ

pdf75 trang | Chia sẻ: huongnhu95 | Lượt xem: 649 | Lượt tải: 0download
Tóm tắt tài liệu Bài giảng Phân tích dữ liệu (Chuẩn kiến thức), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
c tạp. 1. KHÁI NIỆM Để có thể thực hiện các phân tích dữ liệu một cách hiệu quả đòi hỏi dữ liệu phải được lưu trữ, tổ chức, sắp xếp hợp lý. Dữ liệu thường được tổ chức thành các lớp dữ liệu. Mỗi lớp dữ liệu thường bao gồm tập hợp các đối tượng địa lý liên quan với nhau và thường được tổ chức theo chủ đề, cùng kiểu biểu diễn. Vd Lớp dữ liệu giao thông gồm đường sắt, đường bộ Lớp dữ liệu thủy văn gồm sông, suối, hồ... 1. KHÁI NIỆM Phân tích dữ liệu có thể được nhóm vào 3 nhóm chức năng chính - Phân tích dữ liệu không gian - Phân tích dữ liệu thuộc tính - Phân tích kết hợp dữ liệu không gian và dữ liệu thuộc tính 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.1. CHUYỂN ĐỔI ĐỊNH DẠNG DỮ LIỆU Có rất nhiều hệ GIS khác nhau và thường mỗi hệ GIS lưu dữ liệu theo một định dạng dữ liệu riêng biệt. Để sử dụng dữ liệu tạo ra từ 1 hệ thống thông tin khác hoặc ngay cả 1 hệ GIS khác cũng cần phải chuyển đổi định dạng dữ liệu sang cấu trúc dữ liệu và dạng tập tin phù hợp với hệ GIS đang sử dụng. Quá trình chuyển đổi có thể rất nhanh hoặc dễ dàng trong trường hợp không đòi hỏi xử lý phức tạp. VD tập tin raster số được nhập vào hệ raster GIS có thể không đòi hỏi định dạng lại, chỉ cần thay đổi 1 số thông số mô tả như tên, nguồn gốc, kích thước 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.1. CHUYỂN ĐỔI ĐỊNH DẠNG DỮ LIỆU Quá trình chuyển đổi có thể tốn thời gian và chi phí nếu dữ liệu không ở định dạng thích hợp với hệ GIS. VD như chuyển thông tin được số hóa bằng phần mềm vẽ thiết kế CAD vào GIS. Kỹ thuật viên vẽ CAD thường chỉ chú ý đến biểu diễn các đối tượng cho đúng màu sắc và vị trí mà không quan tâm đến việc biểu diễn các đối tượng như những phần tử đồ học độc lập. VD một mảnh đất nằm gần sông thường được biểu diễn như là 1 phần ranh giới của nhà và ranh giới của sông Do vậy khi chuyển dữ liệu CAD vào GIS thường gặp những tình huống như vùng không đóng kín, các đường không gặp nhau như vậy tốn nhiều thời gian để biên tập dữ liệu. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.1. CHUYỂN ĐỔI ĐỊNH DẠNG DỮ LIỆU Quá trình chuyển đổi dữ liệu vector sang raster được gọi là raster hóa và quá trình ngược lại gọi là vector hóa. Quá trình raster hóa gồm 3 bước - Bước 1 – xây dựng 1 lưới raster với kích thước ô hay pixel xác định chồng phủ lên trên khu vực thể hiện của dữ liệu vector và chỉ định giá trị zero cho tất cả pixel. - Bước 2 – thay đổi giá trị của các pixel tương ứng tới các điểm, đường hoặc ranh giới vùng. - Bước 3 – điền các pixel nằm bên trong vùng với giá trị vùng. Sai số từ quá trình raster hóa thường liên quan đến thuật toán thiết kế, kích thước của pixel, và mức độ phức tạp của ranh giới. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.2. CHUYỂN ĐỔI HÌNH HỌC - Chuyển đổi hình học từ bản đồ đến bản đồ - chuyển đổi 1 bản đồ số hóa từ bàn số hóa có tọa độ của các phần tử hình học đo theo đơn vị inch hoặc cm thành các phần tử hình học có tọa độ theo hệ tọa độ chiếu quy định. - Chuyển đổi hình học từ ảnh đến bản đồ - áp dụng đối với dữ liệu thu thập từ vệ tinh và ảnh quét, chuyển đổi tọa độ ảnh dạng hàng – cột sang tọa độ chiếu quy định. Chuyển đổi hình học còn được gọi là địa tham chiếu. Là quá trình sử dụng tập các điểm không chế và các phương trình chuyển đổi để đăng ký bản đồ số hóa, ảnh quét, ảnh vệ tinh theo 1 hệ thống tọa độ chiếu quy định. Sai số RME – Root Mean Square Error được sử dụng để đo lường chất lượng của kết quả chuyển đổi hình học. RME đo lường sự khác biệt giữa vị trí thực và vị trí ước đoán của các điểm khống chế. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.2. CHUYỂN ĐỔI HÌNH HỌC a. Các phương pháp chuyển đổi Các phương pháp chuyển đổi được phân biệt bởi đặc tính hình học được bảo toàn và bởi những thay đổi cho phép. - Chuyển đổi tương tự hay chuyển đổi Helmert cho phép xoay hình chữ nhật, bảo toàn hình dáng nhưng không bảo toàn kích thước. - Chuyển đổi Affine cho phép biến dạng góc của hình chữ nhật nhưng bảo toàn tính song song của các đường. Được sử dụng trong chuyển đổi từ bản đồ đến bản đồ, hoặc ảnh đến bản đồ. - Chuyển đổi Projective cho phép biến dạng cả về góc lẫn độ dài, cho phép hình chữ nhật biến thành hình 4 cạnh thẳng bất kỳ. Được sử dụng để chuyển đổi ảnh hàng không do có những dịch chuyển phần tử ảnh do sự khác biệt của địa hình. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.2. CHUYỂN ĐỔI HÌNH HỌC b. Chuyển đổi Affine Cho phép đối tượng – ví dụ 1 hình chữ nhật xoay, dịch chuyển, làm nghiêng và thay đổi tỷ lệ không giống nhau trên 2 trục tọa độ x, y trong khi vẫn đảm bảo tính song song của các đường trong hình chữ nhật - Phép xoay – xoay trục x và trục y của đối tượng quanh gốc. - Phép dịch chuyển – dịch chuyển tuyến tính tọa độ của đối tượng đến 1 vị trí mới. - Phép nghiêng – cho phép các trục không vuông gốc với nhau, làm thay đổi hình dáng của hình chữ nhật. - Phép rút tỷ lệ - cho phép làm thay đổi tỷ lệ bằng cách mở rộng hay thu nhỏ theo chiều x hoặc chiều y. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.2. CHUYỂN ĐỔI HÌNH HỌC b. Chuyển đổi Affine Chuyển đổi Affine được thể hiện qua phương trình đa thức bậc 1. u = ax + by + c v = dx + ey + f Trong đó x, y – tọa độ nhập được cho u, v – tọa độ xuất được xác định a, b, c, d, e, f – các hệ số chuyển đổi 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.2. CHUYỂN ĐỔI HÌNH HỌC b. Chuyển đổi Affine Các bước chuyển đổi Affine: - Bước 1 – xác định tọa độ x, y và tọa độ u, v của các điểm khống chế chọn lọc - Bước 2 – áp dụng chuyển đổi affine đến các điểm khống chế chọn lọc và xem xét sai số RMS. Nếu sai số RMS cao hơn ngưỡng quy định, chọn tập các điểm khống chế khác và quay lại bước đầu tiên. Nếu sai số RMS được chấp nhận, sáu hệ số chuyển đổi được xác định. - Bước 3 – sử dụng các hệ số ước đoán và phương trình chuyển đổi để tính toán tọa độ mới u, v của các phần tử bản đồ trong bản đồ số hóa hoặc các pixel trong ảnh. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.2. CHUYỂN ĐỔI HÌNH HỌC c. Các điểm khống chế Các điểm khống chế đóng vai trò chính trong việc xác định độ đúng của chuyển đổi Affine. Các điểm khống chế thường được chọn sao cho chúng phân bố đều khắp phạm vi của bản đồ số hóa và thường được chọn tại những vị trí có thể nhìn thấy và xác định chính xác tọa độ. Chuyển đổi Affine đòi hỏi tối thiểu 3 điểm khống chế để xác định 6 hệ số chuyển đổi, nhưng thường 4 hoặc nhiều hơn được sử dụng để kiểm tra sai số và giải theo phương pháp số bình phương nhỏ nhất. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.2. CHUYỂN ĐỔI HÌNH HỌC d. Sai số RMS Sai số RMS đo đạc sự khác biệt giữa vị trí của 1 điểm khống chế trên bản đồ số và vị trí được cho là tọa độ thực của chúng. Sự khác biệt này dẫn đến tọa độ tính được cho các điểm kiểm tra u’, v’ không hoàn toàn trùng khớp với tọa độ u, v đã xác định của chúng. Sai số cho 1 điểm kiểm tra được tính bởi công thức .. Sai số RMS được tính như sai số trung bình từ tất cả các điểm khống chế Để đảm bảo độ đúng của chuyển đổi, sai số RMS phải nằm trong ngưỡng sai số quy định. Nếu sai số vượt quá ngưỡng quy định thì phải chọn lại tập các điểm khống chế mới. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.3. CHUYỂN ĐỔI GIỮA CÁC PHÉP CHIẾU Chiếu bản đồ là quá trình chuyển đổi vị trí trên bề mặt cong trái đất với tọa độ trắc địa thành tọa độ phẳng. Các phép chiếu được phân loại theo thuộc tính được bảo toàn hoặc theo mô hình hình học. Nguồn dữ liệu GIS rất đa dạng và có thể ở các phép chiếu khác nhau. Để tiện cho việc quản lý, các lớp dữ liệu được dùng trong 1 hệ GIS cần được biểu diễn theo cùng 1 hệ thống tọa độ chung. Các phần mềm GIS thường cho phép chuyển dữ liệu từ 1 số hệ lưới chiếu này sang một số hệ lưới chiếu khác. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.4. KHỚP ĐỐI TƯỢNG Về lý thuyết, dữ liệu GIS đòi hỏi cùng 1 đối tượng xuất hiện trên các bản đồ khác nhau phải trùng khít khi chồng lớp với nhau. Nhưng trong thực tế, các đối tượng có thể không trùng lên nhau 1 cách chính xác do các sai số phát sinh trong quá trình thành lập. Trong trường hợp này, phương pháp khớp đối tượng được sử dụng để làm trùng khít tọa độ các đối tượng tương ứng trong các lớp dữ liệu khác nhau. Thông thường, các đối tượng trên bản đồ có độ chính xác cao, ví dụ như bản đồ địa hình, được sử dụng làm chuẩn. Các đối tượng trên các bản đồ khác phải được biên tập, điều chỉnh cho phù hợp với đối tượng được sử dụng làm chuẩn. Quá trình này được thực hiện thủ công với sự trợ giúp của các công cụ biên tập không gian có trong hệ GIS. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.5. GHÉP BIÊN Một khu vực thường được đo đạc và thể hiện bằng 1 tập hợp các bản đồ. Các mảnh bản đồ này cần được gắn lại với nhau để thể hiện toàn khu vực. Vấn đề phát sinh là các đường nên gặp nhau tại các cạnh của mảnh bản đồ nhưng lại không gặp nhau. Sai số có thể do sai số của bản đồ gốc, khác biệt ngày tháng thành lập bản đồ, co giãn của bản đồ giấy không đồng bộ, sai số của bản đồ số hóa Do vậy, hầu hết các hệ GIS hỗ trợ các chức năng giúp hiệu chỉnh tự động sự khác biệt xảy ra tại các rìa của mảnh bản đồ. Đây là quá trình không đơn giản do mỗi sự khác biệt tại biên, 1 quyết định phải được thực hiện để làm cho 1 hoặc cả 2 đường phải dịch chuyển. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.6. SOẠN THẢO ĐỒ HỌA Chức năng soạn thảo trong GIS nhằm giúp thực hiện các chức năng thêm, xóa hoặc thay đổi vị trí của đối tượng. Trong trường hợp số hóa các đối tượng trên bản đồ có thể xảy ra trường hợp các đường được số hóa ngắn đi vài milimet và không tiếp xúc đối tượng. Trong trường hợp này, các phần mềm cho phép sử dụng các phương pháp bắt điểm – snap to point hoặc bắt đường để hiệu chỉnh sai số này. Bắt điểm là phương pháp được ứng dụng trong biên tập các yếu tố hình học nhằm gắn kết các đối tượng hình học lại với nhau. Khi chế độ bắt điểm được thực hiện, vẽ 1 điểm thường có 1 vòng tròn với bán kính bằng khoảng cách bắt dính xuất hiện. Nếu có 1 điểm cần bắt dính nằm trong vòng tròn thì điểm sẽ được vẽ dịch chuyển về trùng với điểm đó. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.7. LÀM THƯA TỌA ĐỘ Trong quá trình số hóa sử dụng chế độ đường có thể dãn đến số tọa độ nhập vào nhiều hơn cần thiết để biểu diễn 1 đường. Để giúp làm giảm số liệu tọa độ được lưu trữ trong hệ GIS, chức năng làm thưa tọa độ được sử dụng. Thuật toán Douglas - Peucker là 1 thuật toán nổi tiếng được sử dụng để làm thưa độ. Thuật toán xử lý từng đường trên cơ sở 1 ngưỡng khoảng cách d đã định. Thuật toán bắt đầu bằng cách nối kết các điểm đầu và cuối tạo thành đường khuynh hướng. Sau đó, độ lệch của các điểm đỉnh so với đường khuynh hướng được tính toán. Nếu tất cả các điểm có độ lệch nhỏ hơn giá trị d đã cho, tất cả các điểm đỉnh sẽ bị loại và như vậy đường đã làm thưa tọa độ là đường nối nút đầu và nút cuối. Nếu có những điểm có độ lệch lớn hơn d thì điểm với độ lệch lớn nhất sẽ được chọn như là điểm ngắt để tách đường khuynh hướng ra 2 đường con. Quá trình tính toán ở trên lại áp dụng cho từng đường con cho đến khi tất cả các đường con nếu có đều được xử lý. 2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN 2.7. LÀM THƯA TỌA ĐỘ Trình tự xử lý làm thưa tọa độ sử dụng thuật toán Douglas - Peucker 3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH Phân tích dữ liệu thuộc tính bao gồm các chức năng soạn thảo, kiểm tra và phân tích dữ liệu thuộc tính. Nhiều hoạt động phân tích trong GIS có thể được thực hiện chỉ với dữ liệu thuộc tính. Ví dụ, trong 1 hệ GIS nền vector, diện tích, chu vi, loại sử dụng đất và thuộc tính liên quan khác của các vùng thường được lưu trữ trong các bảng thuộc tính. Để tạo 1 bảng diện tích sử dụng của 1 loại sử dụng đất cụ thể nào đó, dữ liệu có thể rút ra từ bảng thuộc tính mà không cần quan tâm đến dữ liệu không gian. Trong hệ GIS nền raster, dữ liệu thuộc tính gắn liền với dữ liệu không gian. Trong khi các hệ thống GIS nền vector dữ liệu thuộc tính được lưu tách biệt dữ liệu không gian và thường được lưu trong hệ cơ sở dữ liệu tách biệt. Cấu trúc này cho phép người sử dụng thao tác với số lượng lớn các mẫu tin dữ liệu thuộc tính trong quá trình biên tập hoặc phân tích. 3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH 3.1. SOẠN THẢO THUỘC TÍNH Chức năng này cho phép dữ liệu thuộc tính được lấy ra, kiểm tra và thay đổi. Trong đó, các thuộc tính mới có thể thêm vào hoặc các thuộc tính cũ có thể bỏ đi; hai bảng dữ liệu thuộc tính có thể liên kết bằng cách nối bảng hoặc tạo liên hệ thông qua các trường dữ liệu chung. Người sử dụng có thể thay đổi thủ công dữ liệu thuộc tính của từng mẫu tin hoặc có thể thực hiện thay đổi đồng thời nhiều mẫu tin thông qua việc áp dụng các hàm toán học, các hàm thống kê lên trên các mẫu tin với sự trợ giúp của các công cụ hoặc chức năng có sẵn trong phần mềm GIS. - Các hàm toán học gồm cộng, trừ, nhân, lũy thừa, căn, và các hàm lượng giác. - Các hàm thống kê gồm tổng, cực đại, cực tiểu, trung bình và độ lệch chuẩn.  Tính toán thống kê, mô tả Thống kê mô tả có tác dụng tóm lược dữ liệu thuộc tính. Thống kê làm giảm độ phức tạp từ rất nhiều giá trị riêng lẻ về một vài con số có ý nghĩa để mô tả tập hợp các địa vật riêng rẽ. Các con số thống kê mô tả được quy vào hai nhóm: đo xu hướng trung tâm và đo xu hướng phân tán.  Xu hướng trung tâm mô tả trung tâm của phân bố dữ liệu thuộc tính. Các số đo thông thường gồm có: trị trung bình, trung vị, và số đông (mode). 3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH  Xu hướng trung tâm - Trị trung bình - được tính bằng cách cộng lại các giá trị thuộc tính của từng địa vật rồi đem chia cho số các địa vật. - Trung vị - nếu ta xếp các giá trị thuộc tính theo thứ tự tăng dần hoặc giảm dần, thì trung vị đứng ở vị trí chính giữa trong phân phối (điều này áp dụng được cho trường hợp số giá trị là lẻ). Đối với phân phối có số giá trị là chẵn, thì trung vị bằng trung bình cộng hai giá trị đứng giữa. - Số đông là số thường xảy ra nhất trong một phân phối. Dĩ nhiên, có những loại phân phối không có số đông nếu không có giá trị nào lặp lại. 3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH  Xu hướng trung tâm - Ví dụ Các giá trị thuộc tính: 24, 25, 30, 39, 40, 45, 45, 45, 45, 45, 48, 50, 50, 55, 58, 60, 61, 65, 65, 65, 70, 72, 75, 200, 205 Trị trung bình 63,28 Trung vị 50 Số đông 45 3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH  Độ phân tán - xét đến độ rải rác của dữ liệu thuộc tính. Các số đo của nó (bao gồm phạm vi, phương sai, và độ lệch chuẩn) mô tả mức độ mà các giá trị thuộc tính biến đổi quanh giá trị trung tâm của phân bố. Nếu độ đo phân tán là nhỏ, thì các giá trị tụm lại và số đo xu hướng trung tâm đã mô tả tốt phân phối đang xét. - Số đếm và tần số - là những đại lượng cơ bản để tóm lược dữ liệu. Số đếm chỉ là đặc trưng về lượng. Tần số là số lần mà một trường thuộc tính nhận một giá trị cụ thể nào đó. Một phân bố tần số, thường được cho dưới dạng histogram, mô tả hình dạng (hay cấu trúc) của dữ liệu thuộc tính bằng cách lập bảng các tần suất của từng giá trị (hoặc một khoảng các giá trị). 3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH - Phạm vi là khoảng cách giữa các giá trị thuộc tính nhỏ nhất và lớn nhất. Để tìm được nó, chỉ cần trừ giá trị lớn nhất đi giá trị nhỏ nhất. Nó là số đo đơn giản nhất về độ phân tán, nhưng dễ bị ảnh hưởng bởi các điểm biệt lập (các điểm dị thường khác hẳn những giá trị thuộc tính còn lại). - Phương sai là tổng bình phương độ lệch giữa các giá trị trong phân phối với trị trung bình chia cho số đếm. - Độ lệch chuẩn là căn bậc hai của phương sai. Cũng như phương sai, nó mô tả sự phân tán xung quanh trị trung bình. Độ lệch chuẩn càng nhỏ thì các giá trị càng sát gần với số đo xu hướng trung tâm. 3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH - Ví dụ Các giá trị thuộc tính: 24, 25, 30, 39, 40, 45, 45, 45, 45, 45, 48, 50, 50, 55, 58, 60, 61, 65, 65, 65, 70, 72, 75, 200, 205 Số đếm 25 Phạm vi 205 – 24 = 181 Phương sai 1866,4416 Độ lệch chuẩn 43,2023 3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH 3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH 3.2. TRUY VẤN THUỘC TÍNH Cho phép truy tìm mẫu tin trong cơ sở dữ liệu thuộc tính thõa mãn điều kiện truy tìm đưa ra bởi người sử dụng. Các chức năng truy vấn có thể giới hạn ở những chức năng tìm kiếm đơn giản như truy vấn thuộc tính của 1 mẫu tin đã chọn hoặc tìm kiếm 1 mẫu tin thỏa mãn 1 điều kiện đặt ra sử dụng các hàm toán tử =, ≤, ≥, Trong hoạt động truy vấn thuộc tính, một số trường hợp cũng sử dụng các toán tử luận lý như AND, OR, NOR, XOR, NOT. Các toán tử này được dùng để kiểm tra xem 1 điều kiện cụ thể nào đó có đạt được hay không. 3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH 3.2. TRUY VẤN THUỘC TÍNH Kết quả của các toán tử luận lý được thực hiện theo quy tắc sau 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN Sức mạnh của GIS là khả năng phân tích kết hợp dữ liệu không gian và thuộc tính. Chức năng này khiến GIS khác với các phần mềm đồ họa, vẽ kỹ thuật, phần mềm quản lý dữ liệu cổ điển. Phân tích kết hợp dữ liệu không gian và thuộc tính có thể được xếp thành 4 nhóm chức năng chính - Lựa chọn và đo đạc - Chức năng chồng lớp - Chức năng lân cận - Chức năng liên thông 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.1. LỰA CHỌN VÀ ĐO ĐẠC  Truy vấn thuộc tính Lựa chọn theo thuộc tính. Ở ví dụ này, các nhà hàng được chọn theo giá rẻ (PRICE = ‘$’). Những kết quả được hiển thị trên cả bản đồ lẫn bảng thuộc tính (các dòng tô màu da cam). 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.1. LỰA CHỌN VÀ ĐO ĐẠC  Truy vấn không gian Nếu như các truy vấn thuộc tính thực hiện lựa chọn địa vật bằng cách sắp xếp các bản ghi trong một file dữ liệu, thì lựa chọn không gian lại chọn lựa những địa vật từ giao diện bản đồ. Trong đa số các trường hợp, cách làm này lựa chọn trong lớp bản đồ thứ nhất những địa vật nào nằm trong hoặc tiếp xúc với cạnh của những địa vật vùng thuộc lớp thứ hai (hoặc một vùng được người dùng trực tiếp vẽ nên). 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.1. LỰA CHỌN VÀ ĐO ĐẠC  Truy vấn không gian Lựa chọn không gian. Chỉ những nhà hàng nào rơi vào trong đa giác màu xanh lam mới được chọn 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.1. LỰA CHỌN VÀ ĐO ĐẠC  Truy vấn không gian kết hợp thuộc tính Truy vấn không gian kết hợp truy vấn thuộc tính. Ở ví dụ này, các nhà hàng rơi vào trong những đa giác xanh lam, đồng thời giá rẻ (PRICE = $) được đánh dấu màu da cam 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.1. LỰA CHỌN VÀ ĐO ĐẠC  Đo khoảng cách Hầu hết các chương trình GIS, cả raster lẫn vector, đều có nút chức năng thước kẻ để đo khoảng cách trên bản đồ.  Đo diện tích/chu vi Nhiều hệ vector tự động phát sinh những số đo diện tích và chu vi của các địa vật vùng rồi lưu những giá trị này vào các trường định sẵn. Các hệ thống không có chức năng tự động này thì cung cấp cho người dùng cách nhập vào diện tích và chu vi rồi lưu kết quả vào các trường được người dùng định sẵn. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.1. LỰA CHỌN VÀ ĐO ĐẠC  Đo diện tích/chu vi Việc tính diện tích và chu vi được thực hiện theo cách khác trong hệ raster. Để tính diện tích, chỉ cần đơn giản là cộng lại được số các điểm ảnh với một thuộc tính định trước rồi đem nhân số này với diện tích của mỗi điểm ảnh. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP Các chức năng chồng lớp số học và logic là 1 bộ phận quan trọng trong các phần mềm GIS. 4.2.1. Chồng lớp dữ liệu vector  Chồng lớp số học Chồng lớp số học gồm các phép toán như cộng, trừ, nhân, chia từng giá trị trong lớp dữ liệu 1 với giá trị tại vị trí tương ứng trong lớp dữ liệu thứ 2. Quá trình chồng lớp dữ liệu vector thường phức tạp hơn dữ liệu raster. Các vùng trên bản đồ được thể hiện bằng các đa giác với hình dạng và kích thước bất kỳ và do vậy ranh giới của cùng 1 vùng trên các lớp dữ liệu thường không trùng khớp. Để thực hiện một phép toán số học trên 2 lớp dữ liệu nền vector, đòi hỏi phải xác định giao giữa các đa giác trên 2 lớp dữ liệu và tạo nên các đa giác mới trên lớp dữ liệu xuất. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.1. Chồng lớp dữ liệu vector  Chồng lớp số học 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.1. Chồng lớp dữ liệu vector  Chồng lớp logic Chồng lớp logic liên quan đến việc tìm ra những vùng thỏa mản hoặc không thỏa mãn một số điều kiện đặt ra. Ví dụ như tìm vùng thích hợp để bố trí khu nghỉ dưỡng. Những vùng như thế phải thỏa mãn các điều kiện như vùng gần bãi biển, có rừng xung quanh, gần thị trấn ít người Nếu dữ liệu về thực vật, dân số, địa hình.. được thể hiện như là các lớp dữ liệu trong GIS thì hoạt động chồng lớp logic có thể được sử dụng để nhận biết những vị trí thỏa mãn các điều kiện trên. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.1. Chồng lớp dữ liệu vector  Chồng lớp logic Xếp chồng vector chủ yếu là chồng xếp các đa giác ở lớp này lên các đa giác ở lớp khác, nhưng cũng có thể được dùng để chồng xếp các địa vật điểm hoặc đường lên các lớp đa giác. Đôi khi còn được gọi là chồng xếp tô-pô hay chồng xếp logic, nó phức tạp hơn cả về khái niệm lẫn toán học so với xếp chồng raster. Có ba loại phép toán xếp chồng vector: - Vùng trên vùng – hai lớp vùng được chồng lên nhau tạo ra các vùng mới - Điểm trong vùng – lớp điểm được chồng lên lớp vùng - Đường trên vùng – lớp đường được chồng lớp vùng 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.1. Chồng lớp dữ liệu vector  Chồng lớp logic - Vùng trên vùng – hai lớp vùng được chồng lên nhau tạo ra các vùng mới. Những vùng mới này có thể chứa một số, hoặc tất cả thuộc tính của những vùng được tạo. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.1. Chồng lớp dữ liệu vector  Chồng lớp logic Có vài loại xếp chồng vùng trên vùng, gồm giao (A và B), hội (A hoặc B), và cắt bớt (A trừ B). Những toán tử Boole này áp dụng được cả với bảng thuộc tính lẫn về địa lý.  Phép giao - tính phần giao hình học của tất cả những vùng trong các lớp dữ liệu đầu vào. Chỉ những vùng nào có chung phần diện tích địa lý mới được giữ nguyên ở lớp đầu ra. lớp đa giác mới có thể giữ các dữ liệu thuộc tính của các vùng trong các lớp đầu vào. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.1. Chồng lớp dữ liệu vector  Chồng lớp logic  Phép hội - hợp các vùng của các lớp vùng đầu vào. Tất cả vùng trong các lớp đầu vào đều có mặt ở lớp đa giác đầu ra. Lớp đầu ra có thể chứa dữ liệu thuộc tính kết hợp của các lớp đầu vào. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.1. Chồng lớp dữ liệu vector  Chồng lớp logic  Phép trừ xóa bỏ những vùng (hoặc phần vùng) nào đó trong lớp đa giác đầu vào, mà bị chồng lên những vùng của một lớp khác (lớp để trừ). 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.1. Chồng lớp dữ liệu vector  Chồng lớp logic - Điểm trên vùng – là thao tác thực hiện trong trường hợp một lớp các địa vật điểm được xếp chồng lên một lớp các địa vật vùng. Hai lớp bản đồ này tạo ra một lớp địa vật điểm bao gồm các thuộc tính từ những vùng của lớp dữ liệu đầu vào. Việc chuyển các thuộc tính dựa theo vị trí địa lý của chúng được gọi là kết nối không gian. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.1. Chồng lớp dữ liệu vector  Chồng lớp logic - Điểm trên vùng 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.1. Chồng lớp dữ liệu vector  Chồng lớp logic - Đường trên vùng – các đường được xếp chồng lên trên vùng. Dạng kết nối không gian này hoặc là bổ sung các thuộc tính đa giác cho các địa vật đường lọt vào bên trong chúng, hoặc đếm và tổng hợp các dữ liệu thuộc tính của đường rồi bổ sung vào file dữ liệu của lớp vùng. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.2. Chồng lớp dữ liệu raster Xếp chồng raster là cách đặt chồng lên nhau ít nhất là hai lớp raster đầu vào để tạo nên một lớp đầu ra. Từng ô của lớp đầu ra được tính từ các điểm ảnh tương ứng thuộc các lớp đầu vào. Để làm điều này, các lớp bản đồ phải khớp nhau hoàn toàn; chúng phải có cùng độ phân giải điểm ảnh và cùng phạm vi không gian. Khi đã được tiền xử lý rồi thì phép xếp chồng raster rất linh hoạt, hiệu quả, nhanh chóng, và cho ta nhiều khả năng xếp chồng hơn so với thao tác xếp chồng trên các lớp vector. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.2. Chồng lớp dữ liệu raster VD. Thực hiện các bài toán cộng, trừ, cực đại, cực tiểu, trung bình trên 2 lớp dữ liệu raster sau 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.2. CHỨC NĂNG CHỒNG LỚP 4.2.2. Chồng lớp dữ liệu raster Xếp chồng raster bằng cách dùng các lớp 1 và 2, tất cả các dạng xếp chồng đều có thể 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.3. CHỨC NĂNG LÂN CẬN Chức năng lân cận đánh giá những đặc tính của vùng xung quanh một vị trí được chọn nào đó. Ví dụ đếm số nhà nằm trong bán kính 5km của 1 trạm cứu hỏa. Vùng lân cận có thể là hình vuông, hình chữ nhật, hình tròn hoặc ở hình dạng bất kỳ ví dụ trường hợp vùng lân cận là vùng hành chính. Vùng lân cận cũng có thể do người sử dụng vạch ra hoặc vùng lân cận cũng có thể được tạo ra bởi những chức năng khác. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.3. CHỨC NĂNG LÂN CẬN a. Tạo vùng đệm Chức năng này nhằm tạo ra các vùng bao quanh địa vật. Những “Vùng đệm” này thường được dựa theo các khoảng cách thẳng cụ thể tính đến địa vật được xét. Vùng đệm, cả đối với hệ raster và vector, được tạo nên quanh những địa vật điểm, đường, hoặc đa giác. Những vùng đệm này được lưu vào một lớp đầu ra có kiểu địa vật vùng. Khi đã hoàn thành, các lớp vùng đệm được dùng để xác định xem những địa vật nào (ở các lớp khác) tồn tại bên trong hoặc bên ngoài vùng đệm (truy vấn không gian), để thực hiện xếp chồng, hoặc để đo diện tích của vùng đệm. Đó là phép toán lân cận thông dụng nhất. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.3. CHỨC NĂNG LÂN CẬN a. Tạo vùng đệm Tạo vùng đệm quanh một địa vật dạng đường đã chọn 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.3. CHỨC NĂNG LÂN CẬN b. Chức năng về địa hình Mô hình độ cao số - Digital Elevation Model DEM - là sự thể hiện số của bề mặt địa hình. Nó cũng được biết đến một cách rộng rãi như mô hình địa hình số. Một DEM được thể hiện bởi 1 lưới raster của các ô vuông. Dữ liệu độ cao được sử dụng để tạo DEM. DEM có thể được sử dụng để: Xác định các thuộc tính của địa hình, ví dụ độ cao của địa hình tại 1 điểm chọn, độ dốc, hướng dốc, bóng núi Tìm các yếu tố trên địa hình như lưu vực nước, mạng thoát nước 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.3. CHỨC NĂNG LÂN CẬN b. Chức năng về địa hình  Độ dốc thể hiện độ nghiêng của bề mặt đất. Đó là mức thay đổi về độ cao dọc theo một chiều dài định sẵn.  Hướng dốc là hướng la bàn (Đông/Tây/Nam/Bắc) mà mặt dốc hướng đến. Tính từ phương Bắc, góc phương vị thường đo theo chiều kim đồng hồ từ 0 đến 360 độ.  Bóng núi, là hiệu ứng chiếu sáng nhằm phỏng theo ánh mặt trời chiếu vào những ngọn núi và thung lũng. Có những nơi sẽ được chiếu sáng và những nơi khuất dưới bóng. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.3. CHỨC NĂNG LÂN CẬN b. Chức năng về địa hình Mô hình DEM tạo nên các lớp độ dốc, phương vị, và bóng núi 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.3. CHỨC NĂNG LÂN CẬN c. Vùng Thiessen Vùng Thiessen định nghĩa vùng ảnh hưởng riêng biệt xung quanh mỗi điểm trong tập các điểm. Phương pháp này thường được sử dụng trong phân tích dữ liệu mưa. Nó là phương pháp cung cấp thông tin cho các vị trí thiếu dữ liệu quan sát trên cơ sở sử dụng thông tin từ các điểm được xem là cung cấp thông tin tốt nhất. Vùng Thiessen được xây dựng dựa vào tập các điểm sao cho ranh giới của vùng tạo ra có đặc tính là các điểm trên đường ranh giới cách đều điểm lân cận. Nói cách khác, mỗi vị trí trong vùng nằm gần điểm mà vùng chứa hơn là các điểm khác trong tập dữ liệu điểm. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.3. CHỨC NĂNG LÂN CẬN c. Vùng Thiessen 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.3. CHỨC NĂNG LÂN CẬN c. Vùng Thiessen Vùng Thiessen được sử dụng để tiên đoán giá trị của các điểm lân cận từ 1 điểm quan sát đơn. Hạn chế: - Sự phân chia vùng nghiên cứu thành các vùng Thiessen hoàn toàn phụ thuộc vào vị trí của các điểm quan sát. Do vậy phương pháp này có thể tạo ra các vùng với hình dáng không liên quan gì đến hiện tượng quan sát được thể hiện. - Trong mỗi vùng Thiessen, tất cả các điểm đều có cùng giá trị, đều này cũng không phù hợp thực tế là các điểm gần với điểm quan sát sẽ có giá trị gần giống điểm quan sát hơn là các điểm ở xa điểm quan sát. 4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH VÀ DỮ LIỆU KHÔNG GIAN 4.3. CHỨC NĂNG LÂN CẬN d. Phép nội suy Phép nội suy là quá trình dự báo các giá trị chưa biết từ các giá trị đã biết ở các điểm lân cận. Vì việc đo đạc tại tất cả vị trí trong khu vực nghiên cứu là bất khả thi do hạn chế về tiền bạc, thời gian, điều kiện tự

Các file đính kèm theo tài liệu này:

  • pdfbai_giang_phan_tich_du_lieu_chuan_kien_thuc.pdf