PHÂN TÍCH DỮ LIỆU
1. KHÁI NIỆM
GIS được phân biệt với các loại hệ thống thông tin khác nhờ vào
chức năng phân tích dữ liệu, đặc biệt là các chức năng phân tích không
gian.
Các chức năng này sử dụng dữ liệu không gian và dữ liệu thuộc tính
của cơ sở dữ liệu GIS để trả lời cho các vấn đề đặt ra trong thế giới
thực.
Do tính chất phức tạp của các câu hỏi có thể đặt ra, các phép phân
tích không gian có thể là chồng lớp số học hoặc luận lý đơn giản cho
đến các phân tích mô hình phứ
75 trang |
Chia sẻ: huongnhu95 | Lượt xem: 649 | Lượt tải: 0
Tóm tắt tài liệu Bài giảng Phân tích dữ liệu (Chuẩn kiến thức), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
c tạp.
1. KHÁI NIỆM
Để có thể thực hiện các phân tích dữ liệu một cách hiệu quả đòi hỏi
dữ liệu phải được lưu trữ, tổ chức, sắp xếp hợp lý. Dữ liệu thường được
tổ chức thành các lớp dữ liệu.
Mỗi lớp dữ liệu thường bao gồm tập hợp các đối tượng địa lý liên
quan với nhau và thường được tổ chức theo chủ đề, cùng kiểu biểu
diễn.
Vd Lớp dữ liệu giao thông gồm đường sắt, đường bộ
Lớp dữ liệu thủy văn gồm sông, suối, hồ...
1. KHÁI NIỆM
Phân tích dữ liệu có thể được nhóm vào 3 nhóm chức năng chính
- Phân tích dữ liệu không gian
- Phân tích dữ liệu thuộc tính
- Phân tích kết hợp dữ liệu không gian và dữ liệu thuộc tính
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.1. CHUYỂN ĐỔI ĐỊNH DẠNG DỮ LIỆU
Có rất nhiều hệ GIS khác nhau và thường mỗi hệ GIS lưu dữ liệu
theo một định dạng dữ liệu riêng biệt. Để sử dụng dữ liệu tạo ra từ 1 hệ
thống thông tin khác hoặc ngay cả 1 hệ GIS khác cũng cần phải chuyển
đổi định dạng dữ liệu sang cấu trúc dữ liệu và dạng tập tin phù hợp với
hệ GIS đang sử dụng.
Quá trình chuyển đổi có thể rất nhanh hoặc dễ dàng trong trường
hợp không đòi hỏi xử lý phức tạp. VD tập tin raster số được nhập vào
hệ raster GIS có thể không đòi hỏi định dạng lại, chỉ cần thay đổi 1 số
thông số mô tả như tên, nguồn gốc, kích thước
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.1. CHUYỂN ĐỔI ĐỊNH DẠNG DỮ LIỆU
Quá trình chuyển đổi có thể tốn thời gian và chi phí nếu dữ liệu không ở
định dạng thích hợp với hệ GIS.
VD như chuyển thông tin được số hóa bằng phần mềm vẽ thiết kế CAD
vào GIS. Kỹ thuật viên vẽ CAD thường chỉ chú ý đến biểu diễn các đối tượng
cho đúng màu sắc và vị trí mà không quan tâm đến việc biểu diễn các đối
tượng như những phần tử đồ học độc lập. VD một mảnh đất nằm gần sông
thường được biểu diễn như là 1 phần ranh giới của nhà và ranh giới của
sông
Do vậy khi chuyển dữ liệu CAD vào GIS thường gặp những tình huống
như vùng không đóng kín, các đường không gặp nhau như vậy tốn nhiều
thời gian để biên tập dữ liệu.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.1. CHUYỂN ĐỔI ĐỊNH DẠNG DỮ LIỆU
Quá trình chuyển đổi dữ liệu vector sang raster được gọi là raster hóa và
quá trình ngược lại gọi là vector hóa.
Quá trình raster hóa gồm 3 bước
- Bước 1 – xây dựng 1 lưới raster với kích thước ô hay pixel xác định chồng
phủ lên trên khu vực thể hiện của dữ liệu vector và chỉ định giá trị zero cho tất
cả pixel.
- Bước 2 – thay đổi giá trị của các pixel tương ứng tới các điểm, đường hoặc
ranh giới vùng.
- Bước 3 – điền các pixel nằm bên trong vùng với giá trị vùng.
Sai số từ quá trình raster hóa thường liên quan đến thuật toán thiết kế, kích
thước của pixel, và mức độ phức tạp của ranh giới.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.2. CHUYỂN ĐỔI HÌNH HỌC
- Chuyển đổi hình học từ bản đồ đến bản đồ - chuyển đổi 1 bản đồ số hóa
từ bàn số hóa có tọa độ của các phần tử hình học đo theo đơn vị inch hoặc cm
thành các phần tử hình học có tọa độ theo hệ tọa độ chiếu quy định.
- Chuyển đổi hình học từ ảnh đến bản đồ - áp dụng đối với dữ liệu thu
thập từ vệ tinh và ảnh quét, chuyển đổi tọa độ ảnh dạng hàng – cột sang tọa độ
chiếu quy định.
Chuyển đổi hình học còn được gọi là địa tham chiếu. Là quá trình sử dụng
tập các điểm không chế và các phương trình chuyển đổi để đăng ký bản đồ số
hóa, ảnh quét, ảnh vệ tinh theo 1 hệ thống tọa độ chiếu quy định.
Sai số RME – Root Mean Square Error được sử dụng để đo lường chất
lượng của kết quả chuyển đổi hình học. RME đo lường sự khác biệt giữa vị trí
thực và vị trí ước đoán của các điểm khống chế.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.2. CHUYỂN ĐỔI HÌNH HỌC
a. Các phương pháp chuyển đổi
Các phương pháp chuyển đổi được phân biệt bởi đặc tính hình học
được bảo toàn và bởi những thay đổi cho phép.
- Chuyển đổi tương tự hay chuyển đổi Helmert cho phép xoay hình
chữ nhật, bảo toàn hình dáng nhưng không bảo toàn kích thước.
- Chuyển đổi Affine cho phép biến dạng góc của hình chữ nhật nhưng
bảo toàn tính song song của các đường. Được sử dụng trong chuyển đổi
từ bản đồ đến bản đồ, hoặc ảnh đến bản đồ.
- Chuyển đổi Projective cho phép biến dạng cả về góc lẫn độ dài, cho
phép hình chữ nhật biến thành hình 4 cạnh thẳng bất kỳ. Được sử dụng
để chuyển đổi ảnh hàng không do có những dịch chuyển phần tử ảnh do
sự khác biệt của địa hình.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.2. CHUYỂN ĐỔI HÌNH HỌC
b. Chuyển đổi Affine
Cho phép đối tượng – ví dụ 1 hình chữ nhật xoay, dịch chuyển, làm
nghiêng và thay đổi tỷ lệ không giống nhau trên 2 trục tọa độ x, y trong
khi vẫn đảm bảo tính song song của các đường trong hình chữ nhật
- Phép xoay – xoay trục x và trục y của đối tượng quanh gốc.
- Phép dịch chuyển – dịch chuyển tuyến tính tọa độ của đối tượng
đến 1 vị trí mới.
- Phép nghiêng – cho phép các trục không vuông gốc với nhau, làm
thay đổi hình dáng của hình chữ nhật.
- Phép rút tỷ lệ - cho phép làm thay đổi tỷ lệ bằng cách mở rộng hay
thu nhỏ theo chiều x hoặc chiều y.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.2. CHUYỂN ĐỔI HÌNH HỌC
b. Chuyển đổi Affine
Chuyển đổi Affine được thể hiện qua phương trình đa thức bậc 1.
u = ax + by + c
v = dx + ey + f
Trong đó x, y – tọa độ nhập được cho
u, v – tọa độ xuất được xác định
a, b, c, d, e, f – các hệ số chuyển đổi
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.2. CHUYỂN ĐỔI HÌNH HỌC
b. Chuyển đổi Affine
Các bước chuyển đổi Affine:
- Bước 1 – xác định tọa độ x, y và tọa độ u, v của các điểm khống chế
chọn lọc
- Bước 2 – áp dụng chuyển đổi affine đến các điểm khống chế chọn
lọc và xem xét sai số RMS. Nếu sai số RMS cao hơn ngưỡng quy định,
chọn tập các điểm khống chế khác và quay lại bước đầu tiên. Nếu sai số
RMS được chấp nhận, sáu hệ số chuyển đổi được xác định.
- Bước 3 – sử dụng các hệ số ước đoán và phương trình chuyển đổi để
tính toán tọa độ mới u, v của các phần tử bản đồ trong bản đồ số hóa
hoặc các pixel trong ảnh.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.2. CHUYỂN ĐỔI HÌNH HỌC
c. Các điểm khống chế
Các điểm khống chế đóng vai trò chính trong việc xác định độ đúng
của chuyển đổi Affine.
Các điểm khống chế thường được chọn sao cho chúng phân bố đều
khắp phạm vi của bản đồ số hóa và thường được chọn tại những vị trí
có thể nhìn thấy và xác định chính xác tọa độ.
Chuyển đổi Affine đòi hỏi tối thiểu 3 điểm khống chế để xác định 6
hệ số chuyển đổi, nhưng thường 4 hoặc nhiều hơn được sử dụng để
kiểm tra sai số và giải theo phương pháp số bình phương nhỏ nhất.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.2. CHUYỂN ĐỔI HÌNH HỌC
d. Sai số RMS
Sai số RMS đo đạc sự khác biệt giữa vị trí của 1 điểm khống chế
trên bản đồ số và vị trí được cho là tọa độ thực của chúng. Sự khác biệt
này dẫn đến tọa độ tính được cho các điểm kiểm tra u’, v’ không hoàn
toàn trùng khớp với tọa độ u, v đã xác định của chúng.
Sai số cho 1 điểm kiểm tra được tính bởi công thức ..
Sai số RMS được tính như sai số trung bình từ tất cả các điểm khống
chế
Để đảm bảo độ đúng của chuyển đổi, sai số RMS phải nằm trong
ngưỡng sai số quy định. Nếu sai số vượt quá ngưỡng quy định thì phải
chọn lại tập các điểm khống chế mới.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.3. CHUYỂN ĐỔI GIỮA CÁC PHÉP CHIẾU
Chiếu bản đồ là quá trình chuyển đổi vị trí trên bề mặt cong trái đất
với tọa độ trắc địa thành tọa độ phẳng.
Các phép chiếu được phân loại theo thuộc tính được bảo toàn hoặc
theo mô hình hình học.
Nguồn dữ liệu GIS rất đa dạng và có thể ở các phép chiếu khác
nhau. Để tiện cho việc quản lý, các lớp dữ liệu được dùng trong 1 hệ
GIS cần được biểu diễn theo cùng 1 hệ thống tọa độ chung.
Các phần mềm GIS thường cho phép chuyển dữ liệu từ 1 số hệ lưới
chiếu này sang một số hệ lưới chiếu khác.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.4. KHỚP ĐỐI TƯỢNG
Về lý thuyết, dữ liệu GIS đòi hỏi cùng 1 đối tượng xuất hiện trên các
bản đồ khác nhau phải trùng khít khi chồng lớp với nhau. Nhưng trong
thực tế, các đối tượng có thể không trùng lên nhau 1 cách chính xác do
các sai số phát sinh trong quá trình thành lập.
Trong trường hợp này, phương pháp khớp đối tượng được sử dụng
để làm trùng khít tọa độ các đối tượng tương ứng trong các lớp dữ liệu
khác nhau.
Thông thường, các đối tượng trên bản đồ có độ chính xác cao, ví dụ
như bản đồ địa hình, được sử dụng làm chuẩn. Các đối tượng trên các
bản đồ khác phải được biên tập, điều chỉnh cho phù hợp với đối tượng
được sử dụng làm chuẩn. Quá trình này được thực hiện thủ công với sự
trợ giúp của các công cụ biên tập không gian có trong hệ GIS.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.5. GHÉP BIÊN
Một khu vực thường được đo đạc và thể hiện bằng 1 tập hợp các bản
đồ. Các mảnh bản đồ này cần được gắn lại với nhau để thể hiện toàn
khu vực.
Vấn đề phát sinh là các đường nên gặp nhau tại các cạnh của mảnh
bản đồ nhưng lại không gặp nhau. Sai số có thể do sai số của bản đồ
gốc, khác biệt ngày tháng thành lập bản đồ, co giãn của bản đồ giấy
không đồng bộ, sai số của bản đồ số hóa
Do vậy, hầu hết các hệ GIS hỗ trợ các chức năng giúp hiệu chỉnh tự
động sự khác biệt xảy ra tại các rìa của mảnh bản đồ.
Đây là quá trình không đơn giản do mỗi sự khác biệt tại biên, 1
quyết định phải được thực hiện để làm cho 1 hoặc cả 2 đường phải dịch
chuyển.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.6. SOẠN THẢO ĐỒ HỌA
Chức năng soạn thảo trong GIS nhằm giúp thực hiện các chức năng
thêm, xóa hoặc thay đổi vị trí của đối tượng.
Trong trường hợp số hóa các đối tượng trên bản đồ có thể xảy ra
trường hợp các đường được số hóa ngắn đi vài milimet và không tiếp
xúc đối tượng.
Trong trường hợp này, các phần mềm cho phép sử dụng các phương
pháp bắt điểm – snap to point hoặc bắt đường để hiệu chỉnh sai số này.
Bắt điểm là phương pháp được ứng dụng trong biên tập các yếu tố
hình học nhằm gắn kết các đối tượng hình học lại với nhau.
Khi chế độ bắt điểm được thực hiện, vẽ 1 điểm thường có 1 vòng
tròn với bán kính bằng khoảng cách bắt dính xuất hiện. Nếu có 1 điểm
cần bắt dính nằm trong vòng tròn thì điểm sẽ được vẽ dịch chuyển về
trùng với điểm đó.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.7. LÀM THƯA TỌA ĐỘ
Trong quá trình số hóa sử dụng chế độ đường có thể dãn đến số tọa độ nhập vào
nhiều hơn cần thiết để biểu diễn 1 đường.
Để giúp làm giảm số liệu tọa độ được lưu trữ trong hệ GIS, chức năng làm thưa
tọa độ được sử dụng.
Thuật toán Douglas - Peucker là 1 thuật toán nổi tiếng được sử dụng để làm thưa
độ. Thuật toán xử lý từng đường trên cơ sở 1 ngưỡng khoảng cách d đã định.
Thuật toán bắt đầu bằng cách nối kết các điểm đầu và cuối tạo thành đường
khuynh hướng.
Sau đó, độ lệch của các điểm đỉnh so với đường khuynh hướng được tính toán.
Nếu tất cả các điểm có độ lệch nhỏ hơn giá trị d đã cho, tất cả các điểm đỉnh sẽ bị
loại và như vậy đường đã làm thưa tọa độ là đường nối nút đầu và nút cuối.
Nếu có những điểm có độ lệch lớn hơn d thì điểm với độ lệch lớn nhất sẽ được
chọn như là điểm ngắt để tách đường khuynh hướng ra 2 đường con.
Quá trình tính toán ở trên lại áp dụng cho từng đường con cho đến khi tất cả các
đường con nếu có đều được xử lý.
2. PHÂN TÍCH DỮ LIỆU KHÔNG GIAN
2.7. LÀM THƯA TỌA ĐỘ
Trình tự xử lý làm thưa
tọa độ sử dụng thuật toán
Douglas - Peucker
3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH
Phân tích dữ liệu thuộc tính bao gồm các chức năng soạn thảo, kiểm
tra và phân tích dữ liệu thuộc tính. Nhiều hoạt động phân tích trong GIS
có thể được thực hiện chỉ với dữ liệu thuộc tính.
Ví dụ, trong 1 hệ GIS nền vector, diện tích, chu vi, loại sử dụng đất
và thuộc tính liên quan khác của các vùng thường được lưu trữ trong
các bảng thuộc tính. Để tạo 1 bảng diện tích sử dụng của 1 loại sử dụng
đất cụ thể nào đó, dữ liệu có thể rút ra từ bảng thuộc tính mà không cần
quan tâm đến dữ liệu không gian.
Trong hệ GIS nền raster, dữ liệu thuộc tính gắn liền với dữ liệu
không gian. Trong khi các hệ thống GIS nền vector dữ liệu thuộc tính
được lưu tách biệt dữ liệu không gian và thường được lưu trong hệ cơ
sở dữ liệu tách biệt. Cấu trúc này cho phép người sử dụng thao tác với
số lượng lớn các mẫu tin dữ liệu thuộc tính trong quá trình biên tập
hoặc phân tích.
3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH
3.1. SOẠN THẢO THUỘC TÍNH
Chức năng này cho phép dữ liệu thuộc tính được lấy ra, kiểm tra và
thay đổi. Trong đó, các thuộc tính mới có thể thêm vào hoặc các thuộc
tính cũ có thể bỏ đi; hai bảng dữ liệu thuộc tính có thể liên kết bằng
cách nối bảng hoặc tạo liên hệ thông qua các trường dữ liệu chung.
Người sử dụng có thể thay đổi thủ công dữ liệu thuộc tính của từng
mẫu tin hoặc có thể thực hiện thay đổi đồng thời nhiều mẫu tin thông
qua việc áp dụng các hàm toán học, các hàm thống kê lên trên các mẫu
tin với sự trợ giúp của các công cụ hoặc chức năng có sẵn trong phần
mềm GIS.
- Các hàm toán học gồm cộng, trừ, nhân, lũy thừa, căn, và các hàm
lượng giác.
- Các hàm thống kê gồm tổng, cực đại, cực tiểu, trung bình và độ lệch
chuẩn.
Tính toán thống kê, mô tả
Thống kê mô tả có tác dụng tóm lược dữ liệu thuộc tính. Thống kê
làm giảm độ phức tạp từ rất nhiều giá trị riêng lẻ về một vài con số có ý
nghĩa để mô tả tập hợp các địa vật riêng rẽ. Các con số thống kê mô tả
được quy vào hai nhóm: đo xu hướng trung tâm và đo xu hướng phân
tán.
Xu hướng trung tâm mô tả trung tâm của phân bố dữ liệu thuộc
tính. Các số đo thông thường gồm có: trị trung bình, trung vị, và số
đông (mode).
3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH
Xu hướng trung tâm
- Trị trung bình - được tính bằng cách cộng lại các giá trị thuộc tính
của từng địa vật rồi đem chia cho số các địa vật.
- Trung vị - nếu ta xếp các giá trị thuộc tính theo thứ tự tăng dần hoặc
giảm dần, thì trung vị đứng ở vị trí chính giữa trong phân phối (điều
này áp dụng được cho trường hợp số giá trị là lẻ). Đối với phân phối có
số giá trị là chẵn, thì trung vị bằng trung bình cộng hai giá trị đứng
giữa.
- Số đông là số thường xảy ra nhất trong một phân phối. Dĩ nhiên, có
những loại phân phối không có số đông nếu không có giá trị nào lặp lại.
3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH
Xu hướng trung tâm
- Ví dụ
Các giá trị thuộc tính: 24, 25, 30, 39, 40, 45, 45, 45, 45, 45, 48, 50, 50,
55, 58, 60, 61, 65, 65, 65, 70, 72, 75, 200, 205
Trị trung bình 63,28
Trung vị 50
Số đông 45
3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH
Độ phân tán - xét đến độ rải rác của dữ liệu thuộc tính. Các số đo của nó
(bao gồm phạm vi, phương sai, và độ lệch chuẩn) mô tả mức độ mà các giá trị
thuộc tính biến đổi quanh giá trị trung tâm của phân bố. Nếu độ đo phân tán là
nhỏ, thì các giá trị tụm lại và số đo xu hướng trung tâm đã mô tả tốt phân phối
đang xét.
- Số đếm và tần số - là những đại lượng cơ bản để tóm lược dữ liệu. Số đếm
chỉ là đặc trưng về lượng. Tần số là số lần mà một trường thuộc tính nhận một
giá trị cụ thể nào đó. Một phân bố tần số, thường được cho dưới dạng
histogram, mô tả hình dạng (hay cấu trúc) của dữ liệu thuộc tính bằng cách lập
bảng các tần suất của từng giá trị (hoặc một khoảng các giá trị).
3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH
- Phạm vi là khoảng cách giữa các giá trị thuộc tính nhỏ nhất và lớn
nhất. Để tìm được nó, chỉ cần trừ giá trị lớn nhất đi giá trị nhỏ nhất. Nó
là số đo đơn giản nhất về độ phân tán, nhưng dễ bị ảnh hưởng bởi các
điểm biệt lập (các điểm dị thường khác hẳn những giá trị thuộc tính còn
lại).
- Phương sai là tổng bình phương độ lệch giữa các giá trị trong phân
phối với trị trung bình chia cho số đếm.
- Độ lệch chuẩn là căn bậc hai của phương sai. Cũng như phương
sai, nó mô tả sự phân tán xung quanh trị trung bình. Độ lệch chuẩn càng
nhỏ thì các giá trị càng sát gần với số đo xu hướng trung tâm.
3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH
- Ví dụ
Các giá trị thuộc tính: 24, 25, 30, 39, 40, 45, 45, 45, 45, 45, 48, 50, 50,
55, 58, 60, 61, 65, 65, 65, 70, 72, 75, 200, 205
Số đếm 25
Phạm vi 205 – 24 = 181
Phương sai 1866,4416
Độ lệch chuẩn 43,2023
3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH
3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH
3.2. TRUY VẤN THUỘC TÍNH
Cho phép truy tìm mẫu tin trong cơ sở dữ liệu thuộc tính thõa mãn
điều kiện truy tìm đưa ra bởi người sử dụng.
Các chức năng truy vấn có thể giới hạn ở những chức năng tìm kiếm
đơn giản như truy vấn thuộc tính của 1 mẫu tin đã chọn hoặc tìm kiếm 1
mẫu tin thỏa mãn 1 điều kiện đặt ra sử dụng các hàm toán tử =, ≤, ≥,
Trong hoạt động truy vấn thuộc tính, một số trường hợp cũng sử
dụng các toán tử luận lý như AND, OR, NOR, XOR, NOT. Các toán tử
này được dùng để kiểm tra xem 1 điều kiện cụ thể nào đó có đạt được
hay không.
3. PHÂN TÍCH DỮ LIỆU THUỘC TÍNH
3.2. TRUY VẤN THUỘC TÍNH
Kết quả của các toán tử luận lý được thực hiện theo quy tắc sau
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
Sức mạnh của GIS là khả năng phân tích kết hợp dữ liệu không gian
và thuộc tính. Chức năng này khiến GIS khác với các phần mềm đồ
họa, vẽ kỹ thuật, phần mềm quản lý dữ liệu cổ điển.
Phân tích kết hợp dữ liệu không gian và thuộc tính có thể được xếp
thành 4 nhóm chức năng chính
- Lựa chọn và đo đạc
- Chức năng chồng lớp
- Chức năng lân cận
- Chức năng liên thông
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.1. LỰA CHỌN VÀ ĐO ĐẠC
Truy vấn thuộc tính
Lựa chọn theo thuộc tính.
Ở ví dụ này, các nhà hàng
được chọn theo giá rẻ
(PRICE = ‘$’). Những kết
quả được hiển thị trên cả
bản đồ lẫn bảng thuộc tính
(các dòng tô màu da cam).
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.1. LỰA CHỌN VÀ ĐO ĐẠC
Truy vấn không gian
Nếu như các truy vấn thuộc tính thực hiện lựa chọn địa vật bằng
cách sắp xếp các bản ghi trong một file dữ liệu, thì lựa chọn không gian
lại chọn lựa những địa vật từ giao diện bản đồ.
Trong đa số các trường hợp, cách làm này lựa chọn trong lớp bản đồ
thứ nhất những địa vật nào nằm trong hoặc tiếp xúc với cạnh của những
địa vật vùng thuộc lớp thứ hai (hoặc một vùng được người dùng trực
tiếp vẽ nên).
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.1. LỰA CHỌN VÀ ĐO ĐẠC
Truy vấn không gian
Lựa chọn không gian. Chỉ
những nhà hàng nào rơi
vào trong đa giác màu
xanh lam mới được chọn
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.1. LỰA CHỌN VÀ ĐO ĐẠC
Truy vấn không gian kết hợp thuộc tính
Truy vấn không gian kết
hợp truy vấn thuộc tính. Ở
ví dụ này, các nhà hàng
rơi vào trong những đa
giác xanh lam, đồng thời
giá rẻ (PRICE = $) được
đánh dấu màu da cam
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.1. LỰA CHỌN VÀ ĐO ĐẠC
Đo khoảng cách
Hầu hết các chương trình GIS, cả raster lẫn vector, đều có nút chức
năng thước kẻ để đo khoảng cách trên bản đồ.
Đo diện tích/chu vi
Nhiều hệ vector tự động phát sinh những số đo diện tích và chu vi
của các địa vật vùng rồi lưu những giá trị này vào các trường định sẵn.
Các hệ thống không có chức năng tự động này thì cung cấp cho người
dùng cách nhập vào diện tích và chu vi rồi lưu kết quả vào các trường
được người dùng định sẵn.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.1. LỰA CHỌN VÀ ĐO ĐẠC
Đo diện tích/chu vi
Việc tính diện tích và chu vi được thực hiện theo cách khác trong hệ
raster. Để tính diện tích, chỉ cần đơn giản là cộng lại được số các điểm
ảnh với một thuộc tính định trước rồi đem nhân số này với diện tích của
mỗi điểm ảnh.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
Các chức năng chồng lớp số học và logic là 1 bộ phận quan trọng trong
các phần mềm GIS.
4.2.1. Chồng lớp dữ liệu vector
Chồng lớp số học
Chồng lớp số học gồm các phép toán như cộng, trừ, nhân, chia từng giá trị
trong lớp dữ liệu 1 với giá trị tại vị trí tương ứng trong lớp dữ liệu thứ 2.
Quá trình chồng lớp dữ liệu vector thường phức tạp hơn dữ liệu raster. Các
vùng trên bản đồ được thể hiện bằng các đa giác với hình dạng và kích thước
bất kỳ và do vậy ranh giới của cùng 1 vùng trên các lớp dữ liệu thường không
trùng khớp.
Để thực hiện một phép toán số học trên 2 lớp dữ liệu nền vector, đòi hỏi
phải xác định giao giữa các đa giác trên 2 lớp dữ liệu và tạo nên các đa giác
mới trên lớp dữ liệu xuất.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.1. Chồng lớp dữ liệu vector
Chồng lớp số học
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.1. Chồng lớp dữ liệu vector
Chồng lớp logic
Chồng lớp logic liên quan đến việc tìm ra những vùng thỏa mản
hoặc không thỏa mãn một số điều kiện đặt ra.
Ví dụ như tìm vùng thích hợp để bố trí khu nghỉ dưỡng.
Những vùng như thế phải thỏa mãn các điều kiện như vùng gần bãi
biển, có rừng xung quanh, gần thị trấn ít người
Nếu dữ liệu về thực vật, dân số, địa hình.. được thể hiện như là các
lớp dữ liệu trong GIS thì hoạt động chồng lớp logic có thể được sử
dụng để nhận biết những vị trí thỏa mãn các điều kiện trên.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.1. Chồng lớp dữ liệu vector
Chồng lớp logic
Xếp chồng vector chủ yếu là chồng xếp các đa giác ở lớp này lên
các đa giác ở lớp khác, nhưng cũng có thể được dùng để chồng xếp các
địa vật điểm hoặc đường lên các lớp đa giác. Đôi khi còn được gọi là
chồng xếp tô-pô hay chồng xếp logic, nó phức tạp hơn cả về khái niệm
lẫn toán học so với xếp chồng raster. Có ba loại phép toán xếp chồng
vector:
- Vùng trên vùng – hai lớp vùng được chồng lên nhau tạo ra các vùng
mới
- Điểm trong vùng – lớp điểm được chồng lên lớp vùng
- Đường trên vùng – lớp đường được chồng lớp vùng
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.1. Chồng lớp dữ liệu vector
Chồng lớp logic
- Vùng trên vùng – hai lớp vùng được chồng lên nhau tạo ra các vùng
mới. Những vùng mới này có thể chứa một số, hoặc tất cả thuộc tính
của những vùng được tạo.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.1. Chồng lớp dữ liệu vector
Chồng lớp logic
Có vài loại xếp chồng vùng trên vùng, gồm giao (A và B), hội (A hoặc B),
và cắt bớt (A trừ B). Những toán tử Boole này áp dụng được cả với bảng
thuộc tính lẫn về địa lý.
Phép giao - tính phần giao hình học của tất cả những vùng trong các lớp
dữ liệu đầu vào. Chỉ những vùng nào có chung phần diện tích địa lý mới được
giữ nguyên ở lớp đầu ra. lớp đa giác mới có thể giữ các dữ liệu thuộc tính của
các vùng trong các lớp đầu vào.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.1. Chồng lớp dữ liệu vector
Chồng lớp logic
Phép hội - hợp các vùng của các lớp vùng đầu vào. Tất cả vùng
trong các lớp đầu vào đều có mặt ở lớp đa giác đầu ra. Lớp đầu ra có
thể chứa dữ liệu thuộc tính kết hợp của các lớp đầu vào.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.1. Chồng lớp dữ liệu vector
Chồng lớp logic
Phép trừ xóa bỏ những vùng (hoặc phần vùng) nào đó trong lớp đa
giác đầu vào, mà bị chồng lên những vùng của một lớp khác (lớp để
trừ).
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.1. Chồng lớp dữ liệu vector
Chồng lớp logic
- Điểm trên vùng – là thao tác thực hiện trong trường hợp một lớp các
địa vật điểm được xếp chồng lên một lớp các địa vật vùng. Hai lớp bản
đồ này tạo ra một lớp địa vật điểm bao gồm các thuộc tính từ những
vùng của lớp dữ liệu đầu vào.
Việc chuyển các thuộc tính dựa theo vị trí địa lý của chúng được gọi
là kết nối không gian.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.1. Chồng lớp dữ liệu vector
Chồng lớp logic
- Điểm trên vùng
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.1. Chồng lớp dữ liệu vector
Chồng lớp logic
- Đường trên vùng – các đường được xếp chồng lên trên vùng. Dạng
kết nối không gian này hoặc là bổ sung các thuộc tính đa giác cho các
địa vật đường lọt vào bên trong chúng, hoặc đếm và tổng hợp các dữ
liệu thuộc tính của đường rồi bổ sung vào file dữ liệu của lớp vùng.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.2. Chồng lớp dữ liệu raster
Xếp chồng raster là cách đặt chồng lên nhau ít nhất là hai lớp raster
đầu vào để tạo nên một lớp đầu ra.
Từng ô của lớp đầu ra được tính từ các điểm ảnh tương ứng thuộc
các lớp đầu vào. Để làm điều này, các lớp bản đồ phải khớp nhau hoàn
toàn; chúng phải có cùng độ phân giải điểm ảnh và cùng phạm vi không
gian.
Khi đã được tiền xử lý rồi thì phép xếp chồng raster rất linh hoạt,
hiệu quả, nhanh chóng, và cho ta nhiều khả năng xếp chồng hơn so với
thao tác xếp chồng trên các lớp vector.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.2. Chồng lớp dữ liệu raster
VD. Thực hiện các bài toán cộng, trừ, cực đại, cực tiểu, trung
bình trên 2 lớp dữ liệu raster sau
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.2. CHỨC NĂNG CHỒNG LỚP
4.2.2. Chồng lớp dữ liệu raster
Xếp chồng raster bằng
cách dùng các lớp 1
và 2, tất cả các dạng
xếp chồng đều có thể
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.3. CHỨC NĂNG LÂN CẬN
Chức năng lân cận đánh giá những đặc tính của vùng xung quanh
một vị trí được chọn nào đó. Ví dụ đếm số nhà nằm trong bán kính 5km
của 1 trạm cứu hỏa.
Vùng lân cận có thể là hình vuông, hình chữ nhật, hình tròn hoặc ở
hình dạng bất kỳ ví dụ trường hợp vùng lân cận là vùng hành chính.
Vùng lân cận cũng có thể do người sử dụng vạch ra hoặc vùng lân cận
cũng có thể được tạo ra bởi những chức năng khác.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.3. CHỨC NĂNG LÂN CẬN
a. Tạo vùng đệm
Chức năng này nhằm tạo ra các vùng bao quanh địa vật.
Những “Vùng đệm” này thường được dựa theo các khoảng cách
thẳng cụ thể tính đến địa vật được xét.
Vùng đệm, cả đối với hệ raster và vector, được tạo nên quanh những
địa vật điểm, đường, hoặc đa giác.
Những vùng đệm này được lưu vào một lớp đầu ra có kiểu địa vật
vùng.
Khi đã hoàn thành, các lớp vùng đệm được dùng để xác định xem
những địa vật nào (ở các lớp khác) tồn tại bên trong hoặc bên ngoài
vùng đệm (truy vấn không gian), để thực hiện xếp chồng, hoặc để đo
diện tích của vùng đệm. Đó là phép toán lân cận thông dụng nhất.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.3. CHỨC NĂNG LÂN CẬN
a. Tạo vùng đệm
Tạo vùng đệm quanh một địa vật dạng đường đã chọn
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.3. CHỨC NĂNG LÂN CẬN
b. Chức năng về địa hình
Mô hình độ cao số - Digital Elevation Model DEM - là sự thể hiện
số của bề mặt địa hình. Nó cũng được biết đến một cách rộng rãi như
mô hình địa hình số.
Một DEM được thể hiện bởi 1 lưới raster của các ô vuông.
Dữ liệu độ cao được sử dụng để tạo DEM.
DEM có thể được sử dụng để:
Xác định các thuộc tính của địa hình, ví dụ độ cao của địa hình tại 1
điểm chọn, độ dốc, hướng dốc, bóng núi
Tìm các yếu tố trên địa hình như lưu vực nước, mạng thoát nước
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.3. CHỨC NĂNG LÂN CẬN
b. Chức năng về địa hình
Độ dốc thể hiện độ nghiêng của bề mặt đất. Đó là mức thay đổi về
độ cao dọc theo một chiều dài định sẵn.
Hướng dốc là hướng la bàn (Đông/Tây/Nam/Bắc) mà mặt dốc
hướng đến. Tính từ phương Bắc, góc phương vị thường đo theo chiều
kim đồng hồ từ 0 đến 360 độ.
Bóng núi, là hiệu ứng chiếu sáng nhằm phỏng theo ánh mặt trời
chiếu vào những ngọn núi và thung lũng. Có những nơi sẽ được chiếu
sáng và những nơi khuất dưới bóng.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.3. CHỨC NĂNG LÂN CẬN
b. Chức năng về địa hình
Mô hình DEM tạo nên các lớp độ dốc, phương vị, và bóng núi
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.3. CHỨC NĂNG LÂN CẬN
c. Vùng Thiessen
Vùng Thiessen định nghĩa vùng ảnh hưởng riêng biệt xung quanh
mỗi điểm trong tập các điểm. Phương pháp này thường được sử dụng
trong phân tích dữ liệu mưa. Nó là phương pháp cung cấp thông tin cho
các vị trí thiếu dữ liệu quan sát trên cơ sở sử dụng thông tin từ các điểm
được xem là cung cấp thông tin tốt nhất.
Vùng Thiessen được xây dựng dựa vào tập các điểm sao cho ranh
giới của vùng tạo ra có đặc tính là các điểm trên đường ranh giới cách
đều điểm lân cận. Nói cách khác, mỗi vị trí trong vùng nằm gần điểm
mà vùng chứa hơn là các điểm khác trong tập dữ liệu điểm.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.3. CHỨC NĂNG LÂN CẬN
c. Vùng Thiessen
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.3. CHỨC NĂNG LÂN CẬN
c. Vùng Thiessen
Vùng Thiessen được sử dụng để tiên đoán giá trị của các điểm lân
cận từ 1 điểm quan sát đơn.
Hạn chế:
- Sự phân chia vùng nghiên cứu thành các vùng Thiessen hoàn toàn
phụ thuộc vào vị trí của các điểm quan sát. Do vậy phương pháp này có
thể tạo ra các vùng với hình dáng không liên quan gì đến hiện tượng
quan sát được thể hiện.
- Trong mỗi vùng Thiessen, tất cả các điểm đều có cùng giá trị, đều
này cũng không phù hợp thực tế là các điểm gần với điểm quan sát sẽ
có giá trị gần giống điểm quan sát hơn là các điểm ở xa điểm quan sát.
4. PHÂN TÍCH KẾT HỢP DỮ LIỆU THUỘC TÍNH
VÀ DỮ LIỆU KHÔNG GIAN
4.3. CHỨC NĂNG LÂN CẬN
d. Phép nội suy
Phép nội suy là quá trình dự báo các giá trị chưa biết từ các giá trị đã biết ở
các điểm lân cận.
Vì việc đo đạc tại tất cả vị trí trong khu vực nghiên cứu là bất khả thi do
hạn chế về tiền bạc, thời gian, điều kiện tự
Các file đính kèm theo tài liệu này:
- bai_giang_phan_tich_du_lieu_chuan_kien_thuc.pdf