Lời cảm ơn
Sau hai năm học tập ở khoa Công nghệ thông tin trường đại học Bách Khoa Hà Nội em đã thu hoạch được những kiến thức nhất định. Đợt thực tập này em được phân công vào nhóm thực tập do thầy Tô Văn Nam phụ trách. Em được thầy giao cho đề tài nghiên cứu việc thiết kế Webside và ứng dụng thiết kế chương trình quản lý văn bản pháp luật. Mở đầu cho bài thực tập tốt nghiệp này, em xin gửi lời cảm ơn tới các thầy cô giáo trong khoa và đặc biệt là tới thầy giáo Tô Văn Nam là người trực tiếp h
55 trang |
Chia sẻ: huyen82 | Lượt xem: 1297 | Lượt tải: 0
Tóm tắt tài liệu Nghiên cứu việc thiết kế Webside và ứng dụng thiết kế chương trình quản lý văn bản pháp luật, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ướng dẫn em thực hiện bài thực tập tốt nghiệp này và đã cho em những chỉ dẫn quý giá. Thiếu sự giúp đỡ của thầy em không có được kết quả như ngày hôm nay. Tuy nhiên do khả năng có hạn và thời gian chuẩn bị còn hạn chế, nên đề tài không tránh khỏi những nhầm lẫn, thiếu sót về mọi mặt. Em mong nhận được sự đóng góp ý kiến của các thầy cô cũng như của bạn bè để bài thực tập tốt nghiệp này được hoàn thiện hơn. Được như vậy em xin chân thành cám ơn
Phần 1
Cơ sở lý thuyết
Chương 1
Tổng quan về internet
I. Công nghệ internet
1. Internet và xuất xứ của nó
Internet là một mạng máy tính nối hàng triệu máy tính với nhau trên phạm vi toàn cầu. Internet có lịch sử rất ngắn, nó có nguồn gốc từ một dự án của Bộ Quốc Phòng Mỹ có tên là ARPANET vào năm 1969, dự án nhằm thực nghiệm xây dựng một mạng nối các trung tâm nghiên cứu khoa học và quân sự với nhau. Đến năm 1970 đã có thêm hai mạng: Store-and-forwarrd và ALOHAnet, đến năm 1972 hai mạng này đã được kết nối với ARPANET. Cũng trong năm 1972 Ray Tomlinson phát minh ra chương trình thư tín điện tử E-mail. Chương trình này đã nhanh chóng được ứng dụng rộng rãi để gửi các thông điệp trên mạng phân tán.
Kết nối quốc tế đầu tiên vào ARPANET từ University College of London (Anh) và Royal Radar Establishment (Na Uy) được thực hiện vào năm 1973. Thành công vang dội của ARPANET đã làm nó nhanh chóng được phát triển, thu hút hầu hết các trường đại học tại Mỹ. Do đó tới năm 1983 nó đã được tách thành hai mạng riêng: MILNET tích hợp với mạng dữ liệu quốc phòng (Defense Data Network) dành cho các địa điểm quân sự và ARPANET dành cho các địa điểm phi quân sự.
Sau một thời gian hoạt động, do một số lý do kỹ thuật và chính trị, kế hoạch sử dụng mạng ARPANET không thu được kết quả như mong muốn.
Vì vậy Hội đồng khoa học quốc gia Mỹ (National Science Foundation) đã quyết định xây dựng một mạng riêng NSFNET liên kết các trung tâm tính toán lớn và các trường đại học vào năm 1986. Mạng này phát triển hết sức nhanh chóng, không ngừng được nâng cấp và mở rộng liên kết tới hàng loạt các doanh nghiệp, các cơ sở nghiên cứu và đào tạo của nhiều nước khác nhau.
Cũng từ đó thuật ngữ Internet ra đời. Dần dần kỹ thuật xây dựng mạng ARPANET đã được thừa nhận bởi tổ chức NSF, kỹ thuật này được sử dụng để dựng mạng lớn hơn với mục đích liên kết các trung tâm nghiên cứu lớn của nước Mỹ. Người ta đã nối các siêu máy tính (Supercomputer)thuộc các vùng khác nhau bằng đường điện thoại có tốc độ cao. Tiếp theo là sự mở rộng mạng này đến các trường đại học.
2. Cách thức truyền thông trên Internet
Trong những năm 60 và 70, nhiều công nghệ mạng máy tính đã ra đời nhưng mỗi kiểu lại dựa trên các phần cứng riêng biệt. Một trong những kiểu này được gọi là mạng cục bộ (Local Area Networks - LAN), nối các máy tính với nhau trong phạm vi hẹp bằng dây dẫn và một thiết bị được cài đặt trong mỗi máy. Các mạng lớn hơn được gọi là mạng diện rộng (Wide Area Networks - WAN), nối nhiều máy tính với nhau trong phạm vi rộng thông qua một hệ thống dây truyền dẫn kiểu như trong các hệ thống điện thoại.
Mặc dù LAN và WAN đã cho phép chia sẻ thông tin trong các tổ chức một cách dễ dàng hơn nhưng chúng vẫn bị hạn chế chỉ trong từng mạng riêng rẽ Mỗi một công nghệ mạng có một cách thức truyền tin riêng dựa trên thiết kế phần cứng của nó. Hầu hết các LAN và WAN là không tương thích với nhau.
Internet được thiết kế để liên kết các kiểu mạng khác nhau và cho phép thông tin được lưu thông một cách tự do giữa những người sử dụng mà không cần biết họ sử dụng loại máy nào và kiểu mạng gì. Để làm được điều đó cần phải có thêm các máy tính đặc biệt được gọi là các bộ định tuyến (Router) nối các LAN và các WAN với các kiểu khác nhau lại với nhau. Các máy tính được nối với nhau như vậy cần phải có chung một giao thức (Protocol) tức là một tập hợp các luật dùng chung qui định về cách thức truyền tin.
Với sự phát triển mạng như hiện nay thì có rất nhiều giao thức chuẩn ra đời nhằm đáp ứng nhu cầu phát triển. Các chuẩn giao thức được sử dụng rộng rãi nhất hiện nay như giao thức TCP/IP, giao thức SNA của IBM, OSIISDN, X.25 hoặc giao thức LAN to LAN netBIOS. Giao thức được sử dụng rộng rãi nhất hiện nay trên mạng là TCP/IP. Giao thức này cho phép dữ liệu được gửi dưới dạng các “gói “ (packet) thông tin nhỏ. Nó chứa hai thành phần, Internet Protocol (IP) và Transmission Control Protocol (TCP).
Giao thức TCP/IP đảm bảo sự thông suốt việc trao đổi thông tin giữa các máy tính. Internet hiện nay đang liên kết hàng ngàn máy tính thuộc các công ty, cơ quan nhà nước, các trung tâm nghiên cứu khoa học, trường đại học, không phân biệt khoảng cách địa lý trên toàn thế giới. Đó là ngân hàng dữ liệu khổng lồ của nhân loại.
Một số mạng máy tính bao gồm một máy tính trung tâm (còn gọi là máy chủ) và nhiều máy trạm khác nối với nó. Các mạng khác kể cả Internet có quy mô lớn bao gồm nhiều máy chủ cho phép bất kỳ một mạng máy tính nào trong mạng đều có thể kết nối với các máy khác để trao đổi thông tin.
Một máy tính khi được kết nối với Internet sẽ là một trong số hàng chục triệu thành viên của mạng khổng lồ này. Vì vậy Internet là mạng máy tính lớn nhất thế giới hay nó là mạng của các mạng.
3. Các dịch vụ trên Internet
Internet là công nghệ thông tin liên lạc mới, nó tác động sâu sắc vào xã hội, vào cuộc sống ở mức độ khá bao quát. Nó giúp chúng ta vào một thế giới có tầm nhìn rộng lớn và chúng ta có thể làm mọi thứ như: viết thư, đọc báo, xem bản tin, giải trí, tra cứu và hiện nay các công ty có thể kinh doanh thông qua Internet. Dưới đây chỉ là một số dịch vụ trên Internet:
Thư điện tử (E-mail): Dịch vụ E-mail có thể dùng để trao đổi thông tin giữa các cá nhân với nhau, các cá nhân với tổ chức và giữa các tổ chức với nhau. Dịch vụ này còn cho phép tự động gửi nội dung thông tin đến từng địa chỉ hoặc tự động gửi đến tất cả các địa chỉ cần gửi theo danh sách địa chỉ cho trước (gọi là mailing list). Nội dung thông tin gửi đi dùng trong thư điện tử không chỉ có văn bản (text) mà còn có thể ghép thêm (attack) các văn bản đã được định dạng, graphic, sound, video. Các dạng thông tin này có thể hoà trộn, kết hợp với nhau thành một tài liệu phức tạp. Lợi ích chính dịch vụ thư điện tử là thông tin gửi đi nhanh và rẻ.
WWW (World Wide Web): Đây là khái niệm mà người dùng Internet quan tâm nhiều nhất hiện nay. Web là một công cụ, hay đúng hơn là một dịch vụ của Internet, Web chứa thông tin bao gồm văn bản, hình ảnh, âm thanh và thậm chí cả video được kết hợp với nhau... Web cho phép chúng ta chui vào mọi ngõ ngách trên Internet, là những điểm chứa CSDL gọi là Website. Nhờ có Web nên dù không phải là chuyên gia, mọi người có thể sử dụng Internet một cách dễ dàng. Phần mềm sử dụng để xem Web gọi là trình duyệt (Browser). Một trong những trình duyệt thông thường hiện nay là Navigator của Netcape, tiếp đó là Internet Explorer của Microsoft.
Dịch vụ truyền file (FTP - File Transfer Protocol): là dịch vụ dùng để trao đổi các tệp tin từ máy chủ xuông các máy cá nhân và ngược lại.
Gropher: Dịch vụ này hoạt động như viện Menu đủ loại. Thông tin hệ thống Menu phân cấp giúp người sử dụng từng bước xác định được những thông tin cần thiết để đi tới vị trí cần đến. Dịch vụ này có thể sử dụng để tìm kiếm thông tin trên các FTPSite.
Chương 2
Lập trình trên WWW - Ngôn ngữ HTML
(HyperText Makeup Language)
1. Giới thiệu ngôn ngữ HTML
HTML là ngôn ngữ chuẩn để tạo lập các tài liệu cho WWW. HTML được sử dụng trong các chương trình duyệt Web, Ví dụ như MS Internet Explorer, Nescape Navigator. Một tài liệu HTML là một tệp văn bản chứa các phần tử mà các chương trình duyệt sẽ sử dụng để hiện các văn bản, các đối tượng Multimedia, và các siêu liên kết. Người sử dụng có thể dùng chuột để chọn các văn bản được format như một siêu liên kết trong các tài liệu này. Sau khi liên kết này được chọn, tài liệu mà nó trỏ tới sẽ được nạp vào máy và hiện lên màn hình.
Một phần tử là một đơn vị cơ sở của HTML. Nó bao gồm một thẻ khởi đầu (start-tag), một thẻ kết thúc (end-tag), và các ký tự dữ liệu được đặt trong các thẻ này. Một thẻ bắt đầu bằng một dấu nhỏ hơn (). Thẻ kết thúc phải có thêm một dấu sổ chéo (/) ngay trước tên thẻ. Có một số thẻ phẩi luôn luôn kết thúc bằng một thẻ phù hợp, còn một số khác lại cho phép bỏ qua thẻ kết thúc nếu kết quả là rõ ràng và không có sự mập mờ nào cả.
HTML không mô tả trang tài liệu theo như một số ngôn ngữ máy tính khác. Có những ngôn ngữ mô tả từng phần tử đồ hoạ và vị trí của nó trên trang tài liệu, bao gồm font chữ, kích cỡ... Ngược lại HTML lại không đưa ra bất cứ mô tả nào về font, hình ảnh đồ hoạ và chỗ để đặt chúng. HTML chỉ “gán thẻ” cho nội dung tập tin với những thuộc tính nào đó mà sau đó chúng được xác định bởi chương trình duyệt để xem tập tin này. Điều này giống như người đánh dấu bằng tay một số đoạn trên văn bản tài liệu để chỉ cho người thư kí biết những việc cần thiết như: "chỗ này in đậm", "chỗ này in nghiêng"...
Ví dụ: các thẻ về kích thước chữ
các thẻ về kiểu chữ
.
HTML gán thẻ cho kiểu chữ, chèn file ảnh đồ hoạ, âm thanh, video vào văn bản tạo ra mối liên kết và hình thức gọi là siêu văn bản (Hypertext). Siêu văn bản là đặc tính quan trọng nhất của HTML. Điều này có nghiã là một văn bản hay đồ hoạ bất kỳ chỗ nào cũng có thể liên kết với một tài liệu khác.
2. Đặc điểm ngôn ngữ HTML
HTML được thiết kế ra để dùng cho Web : trong phần lớn các chương trình xử lý văn bản khá rắc rối trong một số tiểu tiết -ví dụ như chọn font - HTML, được thiết kế để dùng trên mọi kiểu máy tính. Nó được thiết kế vừa để dễ vận chuyển trên internet, vừa thích hợp với các loại máy tính.
HTML là một chuẩn mở:ngoài các thẻ trong bộ chuẩn, HTML có thể được mở rộng bằng nhiều cách như : Mở rộng thêm các thẻ HTML, sử dụng Javascript, VBScript và các ngôn ngữ lập trình khác. . .
HTML dễ đọc, dễ hiểu, có chứa các liên kết và hỗ trợ Multimedia.
HTML là ngôn ngữ thông dịch : đây được coi là nhược điểm của ngôn ngữ bởi vì nó sẽ làm giảm tốc độ thực hiện các ứng dụng khác trên Web đồng thời nó khó đảm bảo tính an toàn, bảo mật.
3. Phương pháp thiết kế một trang Web
Khi nói đến xây dựng một trang Web cũng đồng nghĩa với việc xây dựng một trang chủ. Theo quan niệm chung, trang chủ là một trang Web chứa liên kết đến một hay nhiều trang khác và thường là trang cung cấp thông tin tổng quát nhất cho người xem. Vì vậy việc thiết kế trang Web không chỉ là thiết kế một trang HTML đơn lẻ, mà còn là thiết kế các mối liên kết tới các tài liệu trong HTML khác ( chưa kể đến việc phải xây dựng nhiều trang Web liên kết với nhau)
Để xây dựng trang Web với các kết nối trước tiên chúng ta nên xác định xem thiết kế nội dung gì, cho ai xem và môi trường thể hiện Web. Thông thường có các bước sau:
• Xác định chủ đề
• Xác định nội dung
• Thiết kế sơ đồ hoạt động
• Thiết kế sơ đồ giao diện với người xem của trang chủ.
• Thiết kế và xây dựng chi tiết
Chi tiết các bước:
Xác định chủ đề: Xác định chủ đề trang Web là bước đầu tiên giúp cho việc định hướng cho các thao tác thiết kế và xây dựng sau này không đi chệch mục tiêu. Chủ đề của trang Web tuy quan trọng song cũng dễ xác định bởi vì nó hoàn toàn dựa vào mục đích thiết kế trang Web đó.
Xác định nội dung: Xác định nội dung trang Web là bước quan trọng nhất. Nó cho phép ta hình dung được công việc sẽ phải làm tiếp theo và xây dựng quy mô trang chủ, qua đó quy định khuôn khổ công tác thiết kế giao diện và xây dựng trang HTML. Khi xác định nội dung cần nhận rõ những điểm chính yếu phải giới thiệu trên trang Web. Những thông tin sẽ giới thiệu phải phân loại theo hai tiêu chí: tính kế thừa và mức độ quan trọng. Việc xây dựng nội dung cũng phải được định trước phong cách khác nhau: trang nghiêm hay hài hước cứng rắn hay mềm mại.
Thiết kế sơ đồ hoạt động: Sơ đồ hoạt động là mô hình sắp xếp các nội dung (được xác định ở bước trên) trong bước này ta sẽ sắp xếp các thông tin cần giới thiệu theo thứ tự ưu tiên như đã xác định. Công việc sắp xếp bao gồm thứ tự Trên - Dưới, Trước - Sau, thông tin nào cần được nêu rõ trong một trang Web thành một phần riêng, thông tin nào có thể mô tả ngay trên trang chủ.
+ Thiết kế giao diện với người xem: Sơ đồ giao diện với người xemlà sơ đồ khái quát của những gì mà người đến thăm trang chủ của chúng ta sẽ thấy. Giao diện với người xem được thiết kế theo sơ đồ này. Yêu cầu của giao diện là nêu bật được chủ đề chính, bố trí các liên kết sao cho hợp lý, phân bố mạng thông tin, đồ hoạ sao cho cân đối.
Thiết kế và xây dựng chi tiết : công tác thiết kế và xây dựng chi tiết là phần việc đồ sộ nhất khi xây dựng trang Web. Nó cũng là phần việc đưa ra kết quả cuối cùng, vì vậy có thể nói đây là công tác quan trọng nhất. Trong công tác thiết kế xây dựng chi tiết, việc lựa chọn các hình ảnh(để minh hoạ, để làm liên kết)là quan trọng. Đây chính là cái sẽ gây ấn tượng mạnh nhất đến người xem. Vì vậy thiết kế và lựa chọn hình ảnh cực kỳ quan trọng
4. Lập trình trang Web động
Khi duyệt các trang Web trên máy, chúng ta thấy rằng các trang Web làm việc một cách thực sự sinh động, có thể trao đổi thông tin, dịch vụ mua hàng... với các form nhập dữ liệu và nhận dữ liệu trở về sau khi bấm nút Submit, chúng ta có thể bấm vào từng phần trong một bức tranh với các liên kết khác nhau, các con số hiển thị các lần truy cập vào từng trang Web và đặc biệt hơn còn có dịch vụ để truy cập dữ liệu, tìm kiếm thông tin theo một tiêu chuẩn nào đó. . . Để làm được điều đó người ta xây dựng các CSDL trên Web Server để lấy thông tin đưa tới từ trình duyệt, sau đó xử lý và trả lại kết quả cho trình duyệt. Tuy nhiên do bản thân Web Server lại không có khả năng làm việc với CSDL vì vậy phải có một chương trình thực thi được khả năng xử lý thông tin và làm việc được với Web Server. Chương trình này đóng vai trò như một cổng giao tiếp giữa Web Server và trình duyệt
Đặc điểm nổi bật của chương trình này là tính đơn giản, bất cứ một người sử dụng nào cũng có thể tạo ra một chương trình giao tiếp đơn giản mà không cần phải có nhiều kinh nghiệm trong lập trình và khả năng thiết kế. Một chương trình giao tiếp được gọi là kịch bản, chỉ khi nào cần một trang Web động thực sự với các tính năng hoàn hảo thì chúng ta mới phải nắm vững các kỹ thuật lập trình này.
Ngày nay các chương trình giao tiếp đóng một vai trò rất lớn trong Web Server, các chương trình giao tiếp chạy chung trên một Web Server có thể giao tiếp được với nhau để tăng khả năng hoạt động của chúng. Với mô hình này, Web Server có thể gọi một chương trình giao tiếp trong khi dữ liệu của người sử dụng cũng được đưa trực tiếp cho chương trình, sau khi xử lý xong Web Server sẽ gửi kết quả xử lý của chương trình cho trình duyệt. Chương trình giao tiếp thật đơn giản ở chỗ chỉ có một vài kiểu vào ra đơn giản và một số luật cụ thể cộng với các kỹ thuật đặc trưng của mô hình.
Khi trình duyệt yêu cầu một trang Web sử dụng chương trình giao tiếp trên Web Server, Web Server truyền thông tin vừa nhận được từ gói tin HTTP yêu cầu của trình duyệt cho chương trình giao tiếp xử lý. Chương trình giao tiếp sau khi xử lý thông tin được yêu cầu nó sẽ trả lại kết quả cho Web Server, Server sẽ định khuôn dạng gói tin theo chuẩn HTTP và truyền trực tiếp cho trình duyệt Web mà không phải thông qua Web Server, cách này làm tốc độ tải trang Web sẽ nhanh hơn.
Trước khi gửi dữ liệu cho Web Server, có thể trình duyệt cũng tiền xử lý dữ liệu trước khi gửi dữ liệu nhằm giảm bớt gánh nặng cho Server. Những ngôn ngữ có khả năng chạy trên trình duyệt gọi là front - end (VBScript, JavaScript...)
5. Xây dựng chương trình giao tiếp
Một chương trình giao tiếp thường có các bước thi hành sau:
Khởi tạo: Truy cập để lấy các thông tin của hệ thống, lấy trong biến môi trường của UNIX hoặc các hệ thống của Window (file *. ini, *. reg). Sau đó nó sẽ nhận thông tin do Web Server gửi đến.
Xử lý: quá trình này xử lý thông tin nhận được trên một CSDL
Trả kết quả: Sau khi xử lý xong, chương trình gửi lại kết quả cho Web Server. Chương trình kết thúc sau khi trả hết kết quả cho Server.
Có rất nhiều ngôn ngữ được sử dụng để xây dựng chương trình giao tiếp trên các hệ điều hành hiện nay như UNIX, Maintosh, WindowNT, Window 9x... Tuy nhiên chọn một ngôn ngữ để xây dựng chương trình giao tiếp ta nên căn cứ vào các tiêu chuẩn sau:
Có nhiều câu lệnh thao tác với xâu văn bản
Khả năng làm việc với các thư viện và các phần mềm ứng dụng khác
Khả năng truy cập được vào các biến môi trường của chương trình
Các biến môi trường của chương trình giao tiếp (Enviroment variables) các biến môi trường của chương trình giao tiếp bao gồm các biến chứa thông tin về máy chủ, máy khách, người sử dụng và một số thông tin phụ. . Dưới đây là liệt kê một số biến chính sau:
Content - Length: Số byte dữ liệu do gửi đến cho CGI trong STDIN
Content - Type : Kiểu dữ liệu
Logon - User : Tên user login vào mạng
Query - String : Xâu câu hỏi
Gateway - Interface: Cung cấp phiên bản của giao diện
CGI trên Web Server, dạng thức : CGI/ ví dụ CGI/1. 1
Remote - Addr: Địa chỉ IP của máy Client có yêu cầu
Remote - Host : tên máy yêu cầu
Request - Method : Phương thức yêu cầu POST/GET
URL : Uniform Resource Locator
Truy cập Form nhập dữ liệu : trình duyệt cho phép nhập dữ liệu và chọn các kiểu thông tin trên Form, khi nhập xong dữ liệu người sử dụng bấm Submit để gửi thông tin cho Web Server, Web Server có nhiệm vụ truyền các thông tin này cho chương trình giao tiếp tương ứng.
6. Các phương pháp xây dựng chương trình giao tiếp
Có rất nhiều phương pháp nhằm mở rộng Web Server tuy nhiên mô hình hoạt động của chúng đều hoàn toàn tuân theo mô hình vừa trình bày.
CGI (Common Gateway Interface) theo phương pháp CGI thì chương trình ứng dụng CGI này như là một chương trình thực hiện được. Mỗi khi có yêu cầu thực hiện CGI từ khách hàng thì máy chủ đều tạo ra một tiến trình (process) cho chương trình đó và Web Server sẽ truyền thông tin của trình duyệt cho chương trình thông qua các biến môi trường. Như vậy số lượng tiến trình làm việc song song trên máy chủ chính bằng số yêu cầu của khách hàng. Như vậy chương trình CGI sẽ chiếm rất nhiều tài nguyên của hệ thống làm cho chương trình chạy chậm và giảm hiệu quả đồng thời khả năng tương thích với người sử dụng cũng bị hạn chế do việc hỗ trợ ngôn ngữ.
ISAPI (Internet Server Application Programming Interface): Với các chương trình viết theo phương pháp ISAPI thực chất là một thư viện liên kết động được xây dựng sẵn trong hệ điều hành Window. Phương pháp này khắc phục được mặt hạn chế của CGI ở chỗ khi có một yêu cầu mới thì máy chủ không taọ ra một tiến trình mới mà đọc thư viện tại cùng một không gian địa chỉ với Web Server xử lý các yêu cầu khác. Tức là thư viện này được dùng chung cho mọi tiến trình, mỗi khi được gọi vào bộ nhớ thư viện có khả năng phục vụ cho nhiều tiến trình cùng một lúc. Như vậy chương trình sẽ chiếm ít tài nguyên hệ thống làm tăng hiệu lực phục vụ nhiều tiến trình đồng thời. Tuy nhiên yếu điểm của phương pháp này là phải xây dựng một thư viện liên kết động, điều này không phải là dễ. Và phương pháp này chỉ áp dụng trên hệ điều hành Window.
ASP (Active Server Pages): là một môi trường giúp ta sử dụng các ngôn ngữ đặc tả để tạo ra các chương trình giao tiếp cho tính năng động, tương tác và có tính hiệu quả cao cho Web Server. Các ngôn ngữ có thể sử dụng được là VBScript hoặc JavaScript. Ưu điểm nổi bật của ASP là nó hỗ trợ ngay các ngôn ngữ đặc tả được ứng dụng trong các trang HTML. Tức là trong một file bao gồm cả các thẻ chuẩn HTML đồng thời chứa các câu lệnh của ASP. Khi có một khách hàng yêu cầu một file có chứa chương trình ASP, ASP sẽ đọc nội dung file nếu gặp các thẻ chuẩn của HTML nó sẽ không xử lý nhưng nếu gặp nó các dòng lệnh của ngôn ngữ đặc tả thì nó sẽ xử lý. Sau quá trình xử lý nó sẽ trộn các kết quả vừa xử lý và các dòng lệnh HTML chuẩn để gửi về cho chương trình duyệt như một file HTML bình thường mà bất kỳ một trình duyệt nào cũng hiểu được. Tuy rằng các câu lệnh ASP giống như một ngôn ngữ lập trình nhưng tính cấu trúc của nó lại không cao. Một ưu điểm nổi bật của ASP là nó đã tích hợp sẵn các phương thức truy cập CSDL và ngôn ngữ SQL trong chương trình. Như vậy đối với người lập trình chỉ cần am hiểu các ngôn ngữ đặc tả thông thường và các khái niệm làm việc với CSDL đều có thể tạo ra được các ứng dụng tốt. Một đặc điểm khác của ASP có thể tích hợp các ngôn ngữ mạnh khác như Java, và cả chương trình CGI trong đó.
Chương 3
Cơ sở dữ liệu và cách truy xuất cơ sở dữ liệu
1. Khái niệm
Cơ sở dữ liệu là một lĩnh vực rất quan trọng của công nghệ thông tin mà nếu thiếu nó nhiều vấn đề đặt ra sẽ khó giải quyết được. Cơ sở dữ liệu được định nghĩa là kho thông tin về một chủ đề, được tổ chức hợp lý để dễ dàng quản lý và truy tìm. Bất kỳ kho thông tin nào đáp ứng được yêu cầu này đều có thể coi là một cơ sở dữ liệu.
2. Quản trị cơ sở dữ liệu là gì ?
Chương trình quản trị cơ sở dữ liệu là một chương trình ứng dụng trên máy tính các công cụ để truy tìm, sửa chữa, xoá và chèn thêm dữ liệu. Các chương trình này cũng có thể dùng để tạo lập một cơ sở dữ liệu và tạo ra các báo cáo, thống kê. Các chương trình quản trị cơ sở dữ liệu liên quan khá thông dụng hiện nay tại Việt Nam là Foxpro, Access cho ứng dụng nhỏ, MSSQL và Oracle cho ứng dụng vừa và lớn.
Quản trị cơ sở dữ liệu quan hệ là một cách quản lý cơ sở dữ liệu trong đó dữ liệu được lưu trữ trong các bảng dữ liệu hai chiều gồm các cột và các hàng, có thể liên quan với nhau nếu các bảng đó có một cột hoặc một trường chung nhau.
Hệ quản trị cơ sở dữ liệu là một quá trình xử lý xoay quanh các vấn đề sau đây:
+ Lưu trữ dữ liệu
+ Truy nhập dữ liệu
+ Bảo đảm tính toàn vẹn của dữ liệu
Ba vấn đề chính ở trên có mối quan hệ mật thiết, phụ thuộc lẫn nhau và chúng được liệt kê theo thứ tự thực hiện mỗi ứng dụng.
Mô hình cơ sở dữ liệu quan hệ (Relationship Database Management System - RDMS) được xây dựng làm đơn giản hoá quá trình lưu và đọc dữ liệu RDMS cung cấp khả năng giao tiếp tốt với dữ liệu và giúp người lập trình tự do trong lĩnh vực quản lý truy cập cơ sở dữ liệu Sau đây là các bước xây dựng một cơ sở dữ liệu theo mô hình cơ sở dữ liệu quan hệ:
+ Tổ chức dữ liệu theo table
+ Xác định các mối quan hệ giữa các table
+ Tạo tập tin cơ sở dữ liệu và định nghĩa cấu trúc của các table trong cơ sở dữ liệu.
+ Lưu dữ liệu
Hai bước đầu là hai bước thiết kế cơ sở dữ liệu và đây là hai bước cực kỳ quan trọng. Nếu được thiết kế tốt, các khía cạnh khác sẽ được giải quyết dễ dàng hơn; ngược lại việc khai thác cơ sở dữ liệu sẽ không hiệu quả và chương trình sẽ có những lỗi rất khó phát hiện.
Các bước chính khi tiến hành thiết kế một cơ sở dữ liệu:
Xác định dữ liệu cần trong ứng dụng
Xác định nguồn gốc dữ liệu
Tổ chức dữ liệu thành các table
Tiêu chuẩn hoá dữ liệu và các mối quan hệ giữa chúng
Xác định cách sử dụng các bảng
3. Chuẩn ODBC (Open Database Connectivity)
Trong mỗi hệ thống thông tin cách lưu trữ dữ liệu rất riêng biệt, thay đổi từ các file đơn giản đến cơ sở dữ liệu có quan hệ và cấu trúcYêu cầu đặt ra là phải tích hợp các hệ thống lưu trữ đó trong một môi trường mới.
Microsoft đã giải quyết vấn đề đó bằng chuẩn ODBC (Open Database Connectivity). Phát triển ODBC, Microsoft muốn cung cấp một giao diện lập trình của các ứng dụng (Application Programming Interface - API) duy nhất có thể sử dụng để truy nhập dữ liệu trên nhiều hệ quản lý cơ sở dữ liệu khác nhauODBC có hai ưu điểm tận dụng được là:
ODBC cung cấp một giao diện duy nhất để truy cập đến nhiều cơ sở dữ liệu khác nhau, nhờ đó giảm bớt thời gian nghiên cứu cơ sở dữ liệu mới cho ác nhà lập trình và phát triển
ODBC cho phép phát triển ứng dụng Client độc lập với Server
4. Cấu trúc của ODBC
Cấu trúc của ODBC gồm có bốn thành phần chính sau:
Application
Driver
Driver
Data source
Application (ứng dụng): là giao diện người sử dụnglàm việc với cơ sở dữ liệu. Chúng sử dụng API với ODBC để xây dựng mối liên kết đến cơ sở dữ liệu và ứng dụng các câu lệnh SQL để điều khiển dữ liệu.
Driver Manager(trình quản lý điều khiển): là trung gian giữa ứng dụng và trình điều khiển xác định được cần đến để truy cập từng loại cơ sở dữ liệu. Chúng ta hiểu rằng ứng dụng không đòi hỏi một mối liên kết đến trình điều khiển, thay vì đó nó đòi hỏi truy cập đến một thứ hợp lý hơn được gọi là
Data Source. Trình điều khiển kết nối nó với một trình điều khiển vật lý và cơ sở dữ liệu.
Driver(trình điều khiển): Trình điều khiển thực sự bổ sung ODBC API cho một hệ thống quản lý cơ sở dữ liệu đặc biệt. Nó xây dựng mối liên hệ đến Server, chịu sự điều khiển của các query SQL và trả về tập kết quả hay thông báo lỗi cho ứng dụng.
Data Source( Nguồn dữ liệu ): Nguồn dữ liệu là thành ngữ được Microsoft sử dụng để mô tả sự liên kết của hệ quản trị cơ sở dữ liệu. Hệ điều hành từ xa và mạng được yêu cầu để truy nhập cơ sở dữ liệu riêng nào đó.
5. Cấp độ tương thích
Chuẩn ODBC không cung cấp một chuẩn duy nhất cho các trình điều khiển, nó phân các trình điều khiển tương thích thành hai loại:
+ Loại hỗ trợ cho ODBC API
+ Loại hỗ trợ cho SQL
6. Cấu hình ODBC
ODBC được bổ sung như là một chuỗi các file có thể thi hành được các thư viện liên kết động (Dynamic Link Libary) và các file cấu hình INI như sau:
ODBC Administrator( ODBC ADM. EXE): đây là chương trình thuộc nhóm Control Panel cho phép chúng ta cài đặt các trình điều khiển ODBC mới và định nghĩa Data Source mới. Chi tiết về các tự động hoá đã được cài đặt nằm trong ODBCINST. INI, còn chi tiết về Data Source nằm ở ODBC. INI
Driver Manager(ODBC. DLL): trình quản lý điều khiển chịu trách nhiệm kết nối Data Source đến các trình điều khiển ODBC khác nhau và các khởi động kích hoạt khác.
Driver : Các trình điều khiển tự chúng bao gồm một hay nhiều thư viện liên kết động cũng như hỗ trợ các file INI, tuỳ thuộc vào các trình bổ sung cho các nhà cung cấp.
Trước khi truy cập một cơ sở dữ liệu thông qua ODBC chúng ta phải định nghĩa Data Source để cho ODBC biết làm sao để xây dựng mối liên kết cho chúng khi yêu cầu. Có thể sử dụng một trong hai cách sau:
Tên Data Source
Tên cơ sở dữ liệu.
Mô tả về cơ sở dữ liệu có thể có hoặc không
Khi truy xuất cơ sở dữ liệu bằng ASP chúng ta sẽ sử dụng phương pháp thứ nhất tức là sử dụng ODBC Administrator để định nghĩa một Data Source
Chương 4
ASP và việc xây dựng các ứng dụng trên Web
1. Khái niệm ASP (Active Server Page)
ASP là môi trường kịch bản trên máy chủ (Server - Side Scripting Enviroment
ASP ( active server page )
Giới thiệu về ASP: Microsoft Active Server Page là một ứng dụng giúp ta áp dụng các ngôn ngữ Script để tạo những ưngs dụng động, có tính bảo mật cao và làm tăng khả năng giao tiếp của chương trình ứng dụng. Các đoạn chương trình nhỏ được gọi là Script sẽ được nhúng vào các trang của ASP phục vụ cho việc đóng mở và thao tác với dữ liệu cũng như điều khiển các trang Web tương tác với người dùng như thế nào. Một khái niệm sau đây liên quan đến ASP
Script: là một dãy các lệnh đặc tả (Script). Một Sript có thể :
Gán một giá trị cho một biến. Một biến là một tên xác định để lưư giữ dữ liệu, như một giá trị.
Chỉ thị cho Web Server gửi trả lại cho trình duyệt một giá trị nào đó, như giá trị cho một biến. Một chỉ thị trả cho trình duyệt một giá trị là một biểu thức đầu ra( output expression).
Tổ hợp của các lệnh được đặt trong các thủ tục. Một số thủ tục là tên gọi tuần tự của các lệnh và khai báo cho phép hoạt động như một ngôn ngữ( unit)
Ngôn ngữ Script (Script language): là ngôn ngữ trung gian giữa HTML và ngôn ngữ lập trình JAva, C++, Visual Basic. HTML nói chung được sử dụng để tạo và kết nối các trang text. Còn ngôn ngữ lập trình được sử dụng để đưa ra dẫy các lệnh phức tạp cho máy tính. Ngôn ngữ Scripting nằm giữa chúng mặc dù chức năng của nó giống ngôn ngữ lập trình hơn là các trang HTML đơn giản. Sự khác nhau cơ bản giữa ngôn ngữ Scripting và ngôn ngữ lập trình là các nguyên tắc của nó ít cứng nhắc và ít rắc rối khó hiểu hơn. Do vậy, các đoạn chương trình script gọn nhẹ có thể lồng ngay vào các trang Web.
Công cụ đặc tả (Scripting engine): Để chạy được các loại chương trình Script thì phải có máy Script engine. Máy này có nhiệm vụ đọc mã nguồn của chương trình và thực hiện các câu lệnh đó. Mỗi ngôn ngữ Script có một loại máy Script riêng. VD: VBScript engine cho loại chương trình VBScript, JavScript engine cho JavaScript.
Có hai ngôn ngữ Script mà ASP hỗ trợ chính là Visual Basic Script và Java Script. Ngôn ngữ được ASP hỗ trợ mặc định là VBScript nên khi muốn dùng ngôn ngữ Script mặc định là Java Script chẳng hạn thì phải có dòng khai báo sau:
ASP cung cấp một môi trường chình cho các công cụ đặc tả và phân tích các script trong một file.ASP để các công cụ này xử lý. ASP còn cho phép viết hoàn chỉnh các thủ tục để phát triển Web bằng nhiều ngôn ngữ Script mà trình duyệt có thể hiểu được tất cả. Trên thực tế, vài ngôn ngữ Script được sử dụng trong một file và nó được thực hiện bằng cách định nghĩa ngôn ngữ Script trong một trang của HTML tại nơi bắt đầu thủ tục Script.
ASP xây dựng các file ở khắp nơi với phần đuôi mở rộng là .asp. File .asp là một file text và có thể bao gồm các sự kết hợp sau:
Text
Các trang của HTML
Các câu lệnh của Script
2. Mô tả của asp
Cách hoạt động của mô hình ASP được mô tả tóm tắt qua 3 bước sau:
Một ASP bắt đầu chạy khi trình duyệt yêu cầu một file .asp cho Web Server.
File .asp đó được nạp vào bộ nhớ và thực hiện ( tại máy chủ). Các đoạn chương trình Script trong file .asp đó có thể là mở dữ liệu, thao tác với dữ liệu để lấy những thông tin mà người dùng cần đến. Trong giai đoạn này, file .asp đó cũng xác định xem là đoạn script nào chạy trên máy người sử dụng.
Sau khi thực hiện xong thì kết quả thực hiện của file .asp đó sẽ được trả về cho Web Server Browser của người sủ dụng dưới dạng trang Web tĩnh.
Cú pháp của ASP: ASP không phải là ngôn ngữ Scripting mà thực ra nó cung cấp một môi trường để xử lý các Script có trong trang HTML. Sau đây là một số quy tắc và cú pháp của ASP.
Phân định ranh giới(Delimiter): Các trang của HTML được phân định với text dựa vào các phân định ranh giới. Một phân định ranh giới là một ký tự hay các thứ tự đánh._.
Các file đính kèm theo tài liệu này:
- 28811.doc