Tìm hiểu về Hệ gợi ý và ứng dụng của nó trong website thương mại điện tử

Tài liệu Tìm hiểu về Hệ gợi ý và ứng dụng của nó trong website thương mại điện tử: LỜI CẢM ƠN Trước tiên, chúng em xin bày tỏ lòng biết ơn sâu sắc tới ThS. Hoàng Thị Hà – Bộ Môn Công nghệ phần mềm, Khoa Công nghệ thông tin, Đại học Nông Nghiệp Hà Nội - người đã hướng dẫn, tạo mọi điều kiện tốt nhất để chúng em hoàn thành luận văn này. Chúng em xin đặc biệt gửi lời cảm ơn tới ThS. Nguyễn Đức Quỳnh –người đã tận tình chỉ bảo, giúp đỡ, cung cấp những tài liệu quan trọng giúp đỡ chúng em rất nhiều trong quá trình xây dựng và hoàn thành đề tài này. Chúng xin chân thành cảm ... Ebook Tìm hiểu về Hệ gợi ý và ứng dụng của nó trong website thương mại điện tử

doc29 trang | Chia sẻ: huyen82 | Lượt xem: 1869 | Lượt tải: 5download
Tóm tắt tài liệu Tìm hiểu về Hệ gợi ý và ứng dụng của nó trong website thương mại điện tử, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ơn các thầy giáo, cô giáo trong khoa Công nghệ thông tin trường Đại học Nông Nghiệp Hà Nội cùng các thầy giáo, cô giáo đã tham gia giảng dạy tận tình, truyền đạt cho chúng em những kiến thức khoa học và kinh nghiệm quý báu trong thời gian chúng em học tập và nghiên cứu tại trường. Chúng em cũng xin chân thành cảm ơn tới bạn bè trong lớp K50THB trường Đại học Nông nghiệp Hà Nội, người thân trong gia đình đã luôn luôn động viên, ủng hộ và giúp đỡ, tạo điều kiện tốt nhất cho chúng em trong quá trình học tập và nghiên cứu Hà Nội, ngày 25 tháng 04 năm 2009 Người thực hiện MỤC LỤC Phần I. TÌM HIỂU VỀ HỆ GỢI Ý VÀ ỨNG DỤNG CỦA NÓ TRONG WEBSITE THƯƠNG MẠI ĐIỆN TỬ 1. Tổng quan về hệ gợi ý và thương mại điện tử 1.1. Đặt vấn đề : Trong thời kì hiện nay, Internet đang phát triển nhanh chóng trên khắp thế giới, trong tất cả các lĩnh vực thương mại, chính trị, quân sự… Những ứng dụng của nó trong đời sống ngày càng trở nên quan trọng và bức thiết hơn. Một trong những tác dụng lớn của Internet trong thập kỉ vừa qua là Thương Mại điện tử. Thương mại điện tử ra đời mở ra một kỉ nguyên mới trong thời kì thương mại trên Internet Có nhiều khái niệm về thương mại điện tử (TMĐT), nhưng hiểu một cách tổng quát, TMĐT là việc tiến hành một phần hay toàn bộ hoạt động thương mại bằng những phương tiện điện tử. TMĐT vẫn mang bản chất như các hoạt động thương mại truyền thống. Tuy nhiên, thông qua các phương tiện điện tử mới, các hoạt động thương mại được thực hiện nhanh hơn, hiệu quả hơn, giúp tiết kiệm chi phí và mở rộng không gian kinh doanh. TMĐT càng được biết tới như một phương thức kinh doanh hiệu quả từ khi Internet hình thành và phát triển. Chính vì vậy, nhiều người hiểu TMĐT theo nghĩa cụ thể hơn là giao dịch thương mại, mua sắm qua Internet và mạng (ví dụ mạng Intranet của doanh nghiệp). Lợi ích lớn nhất mà TMĐT đem lại chính là sự tiết kiệm chi phí, giảm rủi ro và tạo thuận lợi cho các bên giao dịch. Giao dịch bằng phương tiện điện tử nhanh hơn so với giao dịch truyền thống, ví dụ gửi fax hay thư điện tử thì nội dung thông tin đến tay người nhận nhanh hơn gửi thư. Các giao dịch qua Internet có chi phí rất rẻ, một doanh nghiệp có thể gửi thư tiếp thị, chào hàng đến hàng loạt khách hàng chỉ với chi phí giống như gửi cho một khách hàng. Với TMĐT, các bên có thể tiến hành giao dịch khi ở cách xa nhau, giữa thành phố với nông thôn, từ nước này sang nước kia, hay nói cách khác là không bị giới hạn bởi không gian địa lý. Điều này cho phép các doanh nghiệp tiết kiệm chi phí đi lại, thời gian gặp mặt trong khi mua bán. Với người tiêu dùng, họ có thể ngồi tại nhà để đặt hàng, mua sắm nhiều loại hàng hóa, dịch vụ thật nhanh chóng. Một trong những lợi thế lớn nhất của thương mại điện tử chính là khả năng cung cấp cho khách hàng mối liên hệ linh hoạt và mang tính cá nhân hóa. Một số website thương mại điện tử hiện nay thường không đáp ứng được nhu cầu này của người sử dụng. Khách hàng khi đăng nhập hệ thống muốn có được những thông tin tương đối chính xác về sản phẩm mà họ cần mua. Lượng sản phẩm quá lớn, khiến cho người sử dụng không nhận được những thông tin cần thiết khi họ sử dụng công cụ tìm kiếm sản phẩm. Phải duyệt qua tất cả các kết quả của quá tìm kiếm các sản phẩm là công việc mệt mỏi đối với người dùng. Đây là hiện tượng “tràn ngập thông tin” ( information overload ) mà người sử dụng thường gặp phải khi khai thác các hệ thống thương mại điện tử. Có ba nguyên nhân có thể đưa đến vấn đề “tràn ngập thông tin” này: Thứ nhất, một số người sử dụng có thể không thực sự am hiểu về lĩnh vực của sản phẩm (mà anh ta đang tìm kiếm). Khi đưa ra yêu cầu tìm kiếm, nếu người sử dụng diễn đạt (thông qua giao diện người dùng – GUI – của hệ thống) không đầy đủ hoặc không chính xác các nhu cầu và sở thích đối với sản phẩm cần tìm, thì tập kết quả trả về sẽ chứa đựng rất nhiều các sản phẩm không phù hợp, trong khi lại bỏ qua một số sản phẩm khác phù hợp với yêu cầu của người sử dụng đó. Thứ hai, các nhu cầu và sở thích mà người sử dụng nêu ra tại thời điểm yêu cầu thường chỉ là tập con (chưa đầy đủ) của các nhu cầu và mong muốn thực sự của người dùng đó. Tại thời điểm yêu cầu, những người sử dụng thường không thích phải liệt kê (chỉ định) quá nhiều các tiêu chí tìm kiếm. Đồng thời, những người thiết kế hệ thống cũng luôn có xu hướng tránh làm bực mình người sử dụng với quá nhiều các khai báo tìm kiếm ban đầu. Thứ ba, người sử dụng thường ít được hỗ trợ (hoặc chỉ được hỗ trợ sơ sài) trong việc lọc bỏ tránh khỏi phải cân nhắc các sản phẩm không phù hợp, trong việc đánh giá các sản phẩm, và trong việc so sánh giữa các sản phẩm để chọn ra những sản phẩm phù hợp nhất. Nhiều hệ thống website thương mại chỉ đơn thuần trả về tập kết quả đối với một câu hỏi tìm kiếm, và bỏ mặc người sử dụng tự mình phải cân nhắc và đánh giá các lựa chọn trong tập kết quả. Trong thực tế, người sử dụng thường gặp khó khăn trong những quyết định lựa chọn sản phẩm khi phải đồng thời tính đến nhiều thuộc tính của sản phẩm đó; bởi vì họ phải đồng thời cân nhắc: Các thỏa hiệp (trade-offs) đối với các giá trị khác nhau của các thuộc tính sản phẩm, Các sản phẩm khác nhau được trả về trong tập kết quả. Trên quan điểm của người sử dụng luôn có xu hướng muốn tìm được các sản phẩm và dịch vụ thích hợp nhất đối với nhu cầu và sở thích của bản thân, nhưng mất càng ít thời gian tìm kiếm càng tốt, và với các thao tác càng đơn giản càng tốt. Trên quan điểm của những người thiết kế hệ thống và những nhà cung cấp dịch vụ, vấn đề đặt ra là làm sao xây dựng được các chiến lược kinh doanh và các giải pháp kỹ thuật thích hợp cho việc cung cấp các sản phẩm và dịch vụ đến cho các khách hàng tiềm năng. Các chiến lược kinh doanh tốt sẽ giúp mang lại hiệu quả đầu tư và tăng lợi nhuận. Hai mục tiêu này (của người sử dụng và của nhà cung cấp dịch vụ) có thể đạt được bằng cách cung cấp các hỗ trợ cho người sử dụng trong việc ra quyết định. 1.2. Hệ gợi ý là gì?: Hệ gợi ý (recommender systems) là một dạng của hệ hỗ trợ ra quyết định, cung cấp giải pháp mang tính cá nhân hóa mà không phải trải qua quá trình tìm kiếm phức tạp. Hệ gợi ý học từ khách hàng và gợi ý các sản phẩm tốt nhất trong số các sản phẩm phù hợp. Sự phát triển nhanh chóng của thương mại điện tử, sự bùng nổ thông tin khiến cho việc tìm kiếm sản phẩm thích hợp để mua của khách hàng sẽ khó khăn hơn. Hiện nay, việc áp dụng hệ gợi ý vào các website thương mại điện tử là điều tất yếu nhằm tiết kiệm thời gian, công sức và chi phí cho khách hàng, giúp họ tìm ra sản phẩm ưng ý nhất để mua. Hệ gợi ý sử dụng các tri thức về sản phẩm, các tri thức của chuyên gia hay tri thức khai phá học được từ hành vi của người tiêu dùng để đưa ra các gợi ý về sản phẩm mà họ thích trong hàng ngàn hàng vạn sản phẩm có trong hệ thống. Các website thương mại điện tử, ví dụ như sách, phim, nhạc, báo,… sử dụng hệ thống gợi ý để cung cấp các thông tin giúp cho người sử dụng quyết định sẽ lựa chọn sản phẩm nào. Các sản phẩm được gợi ý dựa trên số lượng sản phẩm đó đã được bán, dựa trên các thông tin cá nhân của người sử dụng, dựa trên sự phân tích hành vi mua hàng trước đó của người sử dụng để đưa ra các dự đoán về hành vi mua hàng trong tương lai của chính khách hàng đó. Các dạng gợi ý bao gồm: gợi ý các sản phẩm tới người tiêu dùng, các thông tin sản phẩm mang tính cá nhân hóa, tổng kết các ý kiến cộng đồng, và cung cấp các chia sẻ, các phê bình, đánh giá mang tính cộng đồng liên quan tới yêu cầu, mục đích của người sử dụng đó. Để xây dựng hệ gợi ý trong lĩnh vực thương mại điện tử, chúng ta sử dụng các ý kiến đánh giá của khách hàng làm cơ sở để phân loại các sản phẩm tương tự nhau. Khi một khách hàng ghé thăm hệ thống, họ muốn tìm kiếm các sản phẩm thỏa mãn những yêu cầu mong muốn. Khi đó hệ thống sẽ cung cấp giao diện tương tác để khách hàng có thể nhập vào các yêu cầu tìm kiếm. Căn cứ vào các yêu cầu ấy hệ thống sẽ tiến hành tìm kiếm các sản phẩm phù hợp nhất. Bên cạnh đó, trên cơ sở các nhận xét đánh giá của những khách hàng trước đó hệ thống sẽ đưa ra các gợi ý cho khách hàng này. Các gợi ý có thể bao gồm về thông tin về các sản phẩm tương tự nhất với sản phẩm mà họ đang cần tìm kiếm, các sản phẩm có giá rẻ hơn nhưng có cùng chất lượng... 2. Các phương pháp gợi ý: 2.1 Gợi ý dựa trên thông tin nhân khẩu học Là phương pháp sử dụng dữ liệu nhân khẩu học của người sử dụng để xác định mối quan hệ giữa người sử dụng và sản phẩm, phân thành nhiều nhóm người sử dụng khác nhau, các thành viên trong mỗi nhóm có cùng đặc điểm về nhân khẩu học. Dữ liệu về nhân khẩu học có thể là dữ liệu hồ sơ ( như tên, số điện thoại…), dữ liệu địa lý (như zip code, nước,…), dữ liệu về tình trạng cá nhân (như giới tính, tuổi), các dữ liệu về thể hiện sự ưa thích cá nhân (như phong cách sống,…) và các dữ liệu đăng ký (đăng ký chào và bán hàng,..)… Một nhóm người có cùng đặc điểm về nhân khẩu học sẽ được hệ thống gợi ý cùng một tập sản phẩm. Gợi ý dựa trên thông tin nhân khẩu học có tác dụng tốt với các sản phẩm mới. Tuy nhiên phương pháp này có hạn chế đối với những người sử dụng mới, khi thông tin nhân khẩu lọc của họ chưa có được đầy đủ. Tuy nhiên, phương pháp gợi ý trên thông tin nhân khẩu học đòi hỏi yêu cầu về dữ liệu nhân khẩu học của người sử dụng. Trong khi các thông tin này lại tương đối nhạy cảm với người sử dụng, dữ liệu loại này thường không chính xác và đầy đủ. 2.2 Gợi ý dựa trên nội dung: Là phương pháp sử dụng mô tả của sản phẩm để suy luận độ phù hợp của chúng tới người sử dụng. Mỗi người sử dụng được mô hình thông qua một hồ sơ. Hệ thống sẽ sử dụng hồ sơ của người sử dụng để đoán trước sản phẩm đó có phù hợp với họ hay không. Gợi ý dựa trên nội dung có thể đưa ra những sản phẩm mới nhất tới người sử dụng thông qua việc mô tả nội dung của sản phẩm với các yêu cầu người sử dụng. Tuy nhiên, hạn chế của phương pháp này là việc quản lý những người sử dụng mới. Đối với những người sử dụng này, hệ thống đòi hỏi phải có đầy đủ thông tin về các lĩnh vực họ quan tâm và ưa thích để xây dựng các tập phân loại có chất lượng tốt. 2.3 Gợi ý dựa trên hàm tiện ích Phương pháp này dựa trên lý thuyết ra quyết định sử dụng hàm tiện ích. Giả sử hàm tiện ích của người sử dụng được cho trước, khi lựa chọn một trong hai quyết định nào đó thì người sử dụng sẽ lựa chọn quyết định nào có giá trị tiện ích cao hơn. Hệ thống gợi ý dựa trên sự tiện ích xây dựng các hàm tiện ích tương ứng với sự quan trọng của các thuộc tính có ích, phục vụ cho việc đưa ra các gợi ý. Gợi ý dựa trên hàm tiện ích không phải xây dựng tiểu sử của người sử dụng nên không gặp phải vấn đề về sản phẩm mới và người sử dụng mới. Hạn chế lớn nhất trong trường hợp số lượng các thuộc tính được bao hàm trong hàm tiện ích là quá lớn thì cách tiếp cận này là không thực tế chế lớn nhất của cách tiếp cận gợi ý dựa trên tiện ích là phải xây dụng hàm tiện ích cho mỗi cá thể một cách chính xác. Việc xây dựng hàm chức năng thường hoàn thành trong một hoàn cảnh rõ ràng. 2.4 Gợi ý dựa trên cơ sở tri thức Sử dụng miền tri thức rõ ràng, có liên quan tới mối quan hệ giữa yêu cầu của người dùng và sản phẩm cụ thể. Ban đầu người ta đưa ra 3 dạng tri thức: tri thức về danh mục (tri thức về sản phẩm được gợi ý), tri thức người sử dụng ( tri thức về các yêu cầu của người sử dụng ), tri thức về các chức năng ( tri thức để ánh xạ các yêu cầu của người sử dụng tới các sản phẩm thoả mãn các yêu cầu đó). Phương pháp này không dựa trên tiểu sử người sử dụng nên không gặp phải khó khăn về sản phẩm mới và người dùng mới. Gợi ý trên cơ sở tri thức có khả năng suy diễn, khả năng suy diễn phụ thuộc vào độ phù hợp của yêu cầu người sử dụng với các thuộc tính của sản phẩm. Mọi hệ thống dựa trên cơ sở tri thức đều là mối quan hệ thu nhận tri thức. Thực tế, chất lượng của các phương án gợi ý tùy thuộc vào độ chính xác của cơ sở tri thức. Đây cũng là hạn chế lớn nhất của phương pháp này 2.5 Gợi ý dựa trên lọc cộng tác Quá trình lọc cộng tác là hướng tiếp cận thông dụng nhất hiện nay. Hướng tiếp cận lọc cộng tác tập hợp các đánh giá của người sử dụng (cả dứt khoát và không dứt khoát) đối với một sản phẩm và sử dụng chúng để phân nhóm người dùng thành các nhóm có cùng chung sự đánh giá. Hệ thống sử dụng lọc cộng tác dự đoán mối quan tâm của người dùng đối với một sản phẩm dựa trên các đánh giá của những người sử dụng khác trong cùng nhóm phân loại với họ. Khác với các kĩ thuật lọc thông tin khác, kĩ thuật lọc cộng tác không khai thác dữ liệu mô tả sản phẩm (hoặc là văn bản, hoặc là đặc điểm). Mục tiêu chính của lọc cộng tác là tìm ra những người sử dụng có chung sở thích. Tuy nhiên, Lọc cộng tác cũng gặp vấn đề như đánh giá sớm, đánh giá không chính xác và rải rác của các người dùng. Sản phẩm mới không thể được gợi ý tới người sử dụng cho đến khi có một số lượng các đánh giá phù hợp với các sản phẩm này. Vấn đề đánh giá rải rác xảy ra khi một số ít người cùng đánh giá một số sản phẩm. 2.6 Gợi ý Lai Là phương pháp sử dụng cách kết hợp hai hay nhiều phương pháp gợi ý trên cùng một hệ thống. Mỗi phương pháp gợi ý có những thế mạnh và hạn chế riêng. Vì vậy để hệ thống đạt hiệu quả cao trong quá trình sử dụng, việc “lai ‘ các phương pháp gợi ý là giải pháp tối ưu nhất để giảm hạn chế tới mức thấp nhất. Phương pháp lọc cộng tác thường được sử dụng để ‘ lai ’ với một số phương pháp khác. Tuy nhiên, việc kết hợp giữa các phương pháp gợi ý gặp nhiều khó khăn khi thực hiện. 2.7 So sánh giữa các phương pháp gợi ý: Phương pháp gợi ý Ưu điểm Nhược điểm Lọc cộng tác Chất lượng tăng theo thời gian Không cần tri thức miền Vấn đề người sử dụng mới Vấn đề sản phẩm mới Phụ thuộc vào dữ liệu lịch sử Tính ổn định và mềm dẻo Lọc dựa trên nội dung Chất lượng cải thiện theo thời gian Không cần tri thức miền Vấn đề người sử dụng mới Phụ thuộc vào dữ liệu lịch sử Tính ổn đinh và tính mềm dẻo Lọc theo nhân khẩu học Không cần tập hợp danh sách đánh giá từ người dùng Chất lượng cải thiện theo thời gian Phải tập hợp thông tin nhân khẩu học Phụ thuộc vào dữ liệu lịch sử Tính ổn định và tính mềm dẻo Lọc dựa trên hàm tiện ích có thể sử dụng các đặc điểm không thuộc sản phẩm Người dùng cần nhập hàm tiện ích Khó thực hiện Lọc dựa trên cơ sở tri thức Yêu cầu người sử dụng ở mức thấp Không bao hàm vấn đề khởi đầu Cần phải thu nhận tri thức Chất lượng gợi ý phụ thuộc vào tri thức Hệ thống gợi ý sử dụng lọc cộng tác phụ thuộc vào các đánh giá chồng nhau của người sử dụng . Khi không gian đánh giá thưa thớt (một sản phẩm có rất ít người đánh giá) thì phương pháp này gặp nhiều khó khăn. Phương pháp gợi ý dựa trên lọc cộng tác không thể đưa ra các gợi ý cho những người dùng chưa từng đánh giá một sản phẩm nào đó. Một vấn đề khác trong hệ thống gợi ý sử dụng lọc cộng tác là vấn đề người sử dụng mới bởi vì các gợi ý chỉ được đưa ra khi mà hệ thống so sánh các đánh giá của người sử dụng này với các đánh giá của những người sử dụng khác. Do đó người sử dụng mới, với một số ít các đánh giá sẽ không được phân nhóm một cách chính xác. Vấn đề sản phẩm mới cũng là một hạn chế của phương pháp lọc cộng tác. Tương tự như vấn đề người sử dụng mới, các sản phẩm mới sẽ không có đủ các đánh giá để hệ thống có thể phân loại và gợi ý tới người dùng được. Phương pháp gợi ý dựa trên lọc cộng tác được sử dụng rộng rãi hiện nay và rất thành công. Một lợi thế lớn của phương pháp này chính là hệ thống không cần phải dựa trên các đặc điểm, đặc tính của sản phẩm để đưa ra các gợi ý. Thêm nữa, phương pháp này có thể đưa ra các gợi ý tình cờ vì các gợi ý được đưa ra không cần phải dựa vào nội dung của sản phẩm. Phương pháp gợi ý dựa trên thông tin nhân khẩu học không gặp phải vấn đề người sử dụng mới do không đòi hỏi một danh sách các đánh giá từ người sử dụng. Nhưng thay vào đó là vấn đề thu thập thông tin nhân khẩu học của người sử dụng. Với tính chất nhạy cảm về tính riêng tư, các thông tin này càng khó để thu thập được chính xác. Phương pháp gợi ý dựa trên nội dung gặp vấn đề “khởi động” vì hệ thống cần phải tập hợp đủ các đánh giá để có thể phân loại một cách chính xác. Cũng giống như phương pháp lọc cộng tác, phương pháp gợi ý dựa trên nội dung cũng gặp phải vấn đề giới hạn các đặc điểm của sản phẩm có liên quan tới mục tiêu gợi ý. Phương pháp gợi ý dựa trên hàm tiện ích và cơ sở tri thức không gặp phải vấn đề thưa thớt dữ liệu và “khởi động”. Kĩ thuật lọc dựa trên tiện ích đòi hỏi hệ thống cần phải các hàm tiện ích hoàn chỉnh đối với tất cả các đặc điểm của đối tượng đamg xem xét. Một lợi ích của hướng tiếp cận này là có thể liên kết nhiều nhân tố ngoài những đặc điểm chính của sản phẩm, ví dụ như thời gian vận chuyển, điều kiện bảo hành. Tuy nhiên sự linh hoạt này cũng có một số nhược điểm. Người sử dụng cần phải xây dựng hàm ưu tiên hoàn chỉnh và cần phải đánh giá sự quan trọng của các đặc tính của sản phẩm. Thông thuờng, công việc này là khó khăn và mất nhiều công sức. Hệ gợi ý dựa trên cơ sở tri thức có hạn chế là cần phải có “thu nhận tri thức”. Ngoài hạn chế đó, hệ gợi ý dựa trên cơ sở tri thức có một số lợi thế. Phương pháp này có thể đưa ra các gợi ý “sâu”, ít phụ thuộc vào người sử dụng hơn phương pháp dựa trên tiện ích, không gặp phải vấn đề “khởi động” (gây ra các gợi ý có chất lượng thấp). Phương pháp gợi ý dựa trên nội dung cũng gặp phải vấn đề “khởi động” do phải thu thập đủ các đánh giá để xây dựng phân lớp. Cũng giống như phương pháp lọc cộng tác, kĩ thuật lọc dựa trên nội dung cũng giới hạn các đặc điểm có liên quan tới sản phẩm gợi ý. Cho tới nay, có rất nhiều hướng tiếp cận khác nhau để xây dựng hệ gợi ý. Trong các phương pháp đó thì hai phương pháp gợi ý dựa trên nội dung và lọc cộng tác được sử dụng rộng rãi nhất. Các ứng dụng của hướng tiếp cận gợi ý dựa trên nội dung được giới hạn trong một số ít lĩnh vực như gợi ý các bài viết mới trên web. Phương pháp gợi ý dựa trên lọc cộng tác được sử dụng rộng rãi hơn, trong hầu hết các ứng dụng gợi ý. 3. Ứng dụng của hệ gợi ý trong thương mại điện tử Ngày nay, các website thương mại điện tử lưu trữ và chào bán số lượng rất lớn các sản phẩm với nhiều chủng loại và các đặc điểm khác nhau. Các website thương mại luôn luôn mong muốn phát triển số lượng khách hàng, đa dạng hóa các loại sản phẩm để đáp ứng được nhu cầu mua sắm của nhiều loại khách hàng, do vậy số lượng sản phẩm và loại sản phẩm được trưng bày trong website ngày càng tăng và sẽ làm hạn chế khả năng giao tiếp chọn sản phẩm của khách hàng, khách hàng phải duyệt qua nhiều liên kết, sàng lọc nhiều thông tin mới có thể tìm được sản phẩm mong muốn. Vậy làm sao hỗ trợ khách hàng trong công việc lựa chọn sản phẩm mua sắm? Cụ thể, những sản phẩm nào nên được đề xuất tiếp theo các sản phẩm đã được khách hàng đánh giá hoặc chọn trong giỏ hàng? Nên đề xuất bao nhiêu sản phẩm là tốt nhất cho khách hàng? Hệ gợi ý được hình thành và phát triển không nằm ngoài mục đích hạn chế những điểm yếu này của thương mại điện tử. Một website thương mại điện tử được tích hợp hệ gợi ý sẽ có những tính năng sau: - Tư vấn hoàn toàn tự động các sản phẩm đến cho mỗi khách hàng dựa theo lịch sử và sở thích của khách hàng, mỗi khách hàng có danh sách kết quả tư vấn riêng biệt nhau. - Giới thiệu các sản phẩm có độ tương tự với sản phẩm đang xét để cho khách hàng tìm hiểu và so sánh. - Giới thiệu cho khách hàng các mặt hàng được bán chạy nhất, các mặt hàng được đánh giá cao nhất, đồng thời dựa vào các kết quả này mà nhà quản trị có thể nhìn thấy được các mặt hàng đang “hot” để đầu tư và đạt được doanh số bán cao. - Tư vấn được cho khách hàng mới. - Đáp ứng được cho các web thương mại mà có bán nhiều chủng loại hàng hóa. … PHẦN II. XÂY DỰNG WEBSITE THƯƠNG MẠI ĐIỆN TỬ 2.1. Phân tích và thiết kế hệ thống 2.1.1 Khảo sát hệ thống: Hệ thống bán điện thoại di động có sử dụng hệ gợi ý hoạt động theo nguyên tắc sau: Để có được hàng hóa ở đây là điện thoại thì ban đầu người quản trị hệ thống phải nhập hàng từ nhà sản xuất rồi phân loại sản phẩm ra thành các hãng điện thoại khác nhau. Mục đích chính của website là giới thiệu sản phẩm tới khách hàng và bán được sản phẩm nên yêu cầu của trang website là phải giới thiệu được sản phẩm tới khách hàng và thu hút khách hàng mua sản phẩm này. Để thu hút được khách hàng thì website phải là lơi thân thiện dễ sử dụng và có các gợi ý để khách hàng lựa chọn sản phẩm. Do vậy trang website phải có yêu cầu như sau: * Về phía ban quản trị: - Ban quản trị có trách nhiệm cập nhật thông tin sản phẩm. Có nghĩa là liên hệ với nhà sản xuất để cập nhật những sản phẩm mới về… Cập nhật thông tin khách hàng. - Ban quản trị có được những sản phẩm và sử thuật toán để đưa ra các gợi ý như lọc cộng tác, gợi ý trên nền sản phẩm có có một hệ gợi ý được tích hợp vào trong website để khách hàng nhanh chóng tìm cho mình một sản phẩm tốt và mình ưa thích qua website. - Ngoài ra ban quản trị có thể xem báo cáo, hóa đơn giao bán hàng cho khách hàng. Trả lời góp ý của khách hàng cho hệ thống bán hàng của mình. Như vậy, qua khảo sát hệ thống phải có chức năng sau: quản trị hệ thống, quản trị sản phẩm, quản lý khách hàng, báo cáo tổng hợp. * Về phía khách hàng: - Khách hàng sau khi ghé thăm website phải có một số thông tin về sản phẩm mà mình quan tâm như chi tiết về sản phẩm và giá cả của sản phẩm. Vì website là có sử dụng hệ gợi ý nên khách hàng phải tận dụng hệ gợi ý đó để tìm cho mình một sản phẩm phù hợp với yêu cầu và sở thích của mình một cách nhanh chóng. Mặt khác phải hỗ trợ khách hàng tìm kiếm sản phẩm mà khách hàng cần qua công cụ tìm kiếm sản phẩm. - Sau khi khách hàng đã tìm hiểu thông tin về sản phẩm đã lựa chọn sản phẩm mà phù hợp và ưa thích thông qua các kỹ thuật gợi ý của website. Để mua được hàng thì khách hàng bắt buộc phải có tài khoản để có tài khoản thì khách hàng phải đăng ký một tài khoản cho mình với một số thông tin về mình. Nếu khách hàng có tài khoản rồi thì chỉ cần đăng nhập với tài khoản của mình vào để mua hàng. - Sau khi đăng nhập mỗi thành viên của website có một giỏ hàng và khách hàng dùng giỏ hàng này để mua hàng. Khách hàng sẽ mua hàng trực tiếp qua website sau khi mua hàng xong thì sản phẩm mà khách hàng đã mua sẽ được đưa vào giỏ hàng của khách hàng đó, từ đó ban quản trị của website sẽ biết được khách hàng đó đã mua những sản phẩm gì, sau đó liên hệ với khách hàng để giao sản phẩm cho khách hàng một cách nhanh chóng. 2.1.2. Phân tích và thiết kế hệ thống: 2.1.2.1 Biểu đồ phân cấp chức năng: 2.1.2.2. Biểu đò luồng dữ liệu mức ngữ cảnh: 2.1.2.3. Biểu đồ luồng dữ liệu mức đỉnh: - Biểu đồ luồng dữ liệu mức chi tiết đặt hàng: - Biểu đồ luồng dữ liệu mức chi tiết quản lý sản phẩm: - Biểu đồ luồng dữ liệu mức chi tiết quản lý khách hàng: Thiết kế cơ sở dữ liệu: 2.2. Xây dựng website Website được xây dựng bằng ngôn ngữ vb.net và asp.net kết nối tới hệ quản trị cơ sở dữ liệu SQL sever 2000. Giao diện website : Trang chủ Trang admin: Phần III: TÍCH HỢP HỆ GỢI Ý VÀO THƯƠNG MẠI ĐIỆN TỬ Cách tiếp cận lọc cộng tác trên nền sản phẩm nghiên cứu về tập hợp các sản phẩm mà khách hàng có đánh giá và tính toán chúng tương tự nhau như thế nào với sản phẩm đích i và sau đó lựa chọn k sản phẩm tương tự nhất {i1,i2,…,ik}. Cùng thời điểm đó độ tương tự tương ứng của chúng {si1,si2,…,sik} cũng được tính toán. Việc tính toán sự tương tự này là dựa vào các cặp sản phẩm đồng được đánh giá, một khi những sản phẩm tương tự nhất được tìm thấy, sự dự đoán được tính toán bằng việc lấy trọng số trung bình của những đánh giá của các khách hàng trên các sản phẩm tương tự này. Phương pháp này cho chất lượng gợi ý tốt và đồng thời giải quyết được vấn đề thưa thớt và mở rộng hệ thống . 3.1 Hệ gợi ý dựa trên lọc cộng tác Phương pháp lọc cộng tác (CF – Collaborative filtering) là quá trình lọc hoặc đánh giá sản phẩm thông qua ý kiến của nhiều người. Kĩ thuật lọc cộng tác mang đến một số lượng lớn các ý kiến của cộng đồng người dùng có mối quan hệ với nhau trên web, hỗ trợ lọc dữ liệu có chất lượng. 3.1.1. Tổng quan về quá trình lọc cộng tác Mục tiêu của giải thuật lọc cộng tác là đưa ra các gợi ý về sản phẩm mới hoặc các dự đoán về lợi ích của một sản phẩm nào đó cho một người sử dụng cụ thể trên cơ sở đánh giá sản phẩm thông qua ý kiến của rất nhiều người. Giả sử ta có một danh sách U gồm có m người sử dụng U={u1, u2,…., um} và danh sách n sản phẩm I={i1, i2,…, in}. Mỗi người sử dụng ui sẽ có một danh sách các sản phẩm Iui mà người sử dụng đó đã thể hiện ý kiến của mình. Ý kiến của người dùng có thể được đưa ra một cách rõ ràng như điểm đánh giá hoặc là ở khía cạnh ẩn như thông tin mua hàng, bằng cách phân tích log, khai phá các siêu liên kết…Chú ý rằng Iui Є I , Iui có thể là tập rỗng. Tồn tại một người sử dụng ua Є U, gọi là người sử dụng tích cực. Giải thuật gợi ý lọc cộng tác sẽ tìm các sản phẩm có khả năng xảy ra nhất theo hai dạng 1. Dự đoán. Dự đoán giá trị Pa, j đại diện cho khả năng có thể xảy ra của sản phẩm ij Iua đối với người sử dụng tích cực ua. Giá trị dự đoán này cùng nằm trong một khoảng (ví dụ từ 1 đến 5) tương ứng với giá trị đánh giá của người sử dụng ua. Gợi ý. Gợi ý một danh sách N sản phẩm, Ir Є I, mà người sử dụng tích cực sẽ thích nhất. Chú ý rằng danh sách gợi ý phải là các sản phẩm mà người sử dụng tích cực đó chưa mua, tức là Ir ∩ Iua = Φ Hình sau thể hiện quá trình xử lý của lọc cộng tác. Ma trận đánh giá A cấp m x n là ma trận quan hệ giữa m người sử dụng thuộc tập người sử dụng U với n sản phẩm thuộc tập sản phẩm I. Mỗi phần tử của ma trận ai, j trong ma trận A tương ứng với số điểm đánh giá của người sử dụng thứ i với sản phẩm thứ j. Mỗi đánh giá đơn lẻ có giá trị nằm trong khoảng nhất định, trong đó nếu ai, j = 0 có nghĩa là người sử dụng thứ i không có đánh giá sản phẩm thứ j. Giải thuật lọc cộng tác dựa trên ghi nhớ Giải thuật này tối ưu hóa hoàn toàn dữ liệu người dùng – sản phẩm để sinh ra các dự đoán. Các hệ thống này sử dụng kĩ thuật thống kê để tìm ra các tập người sử dụng, được gọi là các “hàng xóm”. Những người sử dụng trong cùng một tập hợp có các đánh giá lịch sử khớp với người sử dụng đang xét. Một khi những người sử dụng “hàng xóm” đã được xác định, hệ thống có thể sử dụng những giải thuật khác nhau để liên kết những người sử dụng này để sinh ra các dự đoán hoặc Top – N gợi ý cho người sử dụng tích cực. Kĩ thuật này còn được gọi là láng giềng gần nhất hoặc lọc cộng tác dựa trên người dùng. Giải thuật lọc cộng tác dựa trên mô hình Các giải thuật lọc cộng tác dựa trên mô hình cung cấp các gợi ý về sản phẩm bằng các phát triển mô hình đánh giá của người sử dụng. Các giải thuật trong nhóm phân loại này sử dụng hướng tiếp cận thống kê và tính toán giá trị dự đoán mong đợi khi biết trước đánh giá của người sử dụng đó với sản phẩm tương ứng. Mô hình này xây dựng quá trình được thực hiện qua các giải thuật học máy khác nhau như mạng Bayes, gộp nhóm, và hướng tiếp cận dựa trên luật. Mô hình mạng Bayes đưa ra mô hình thống kê cho vấn đề lọc cộng tác. Mô hình gộp nhóm sử dụng phân loại và làm việc với các nhóm người sử dụng tương tự nhau trong cùng một lớp và ước lượng xác suất người sử dụng riêng lẻ trong lớp C, và từ đó tính toán xác suất đánh giá. Hướng tiếp cận dựa trên luật áp dụng các luật liên kết để tìm ra sự liên kết giữa các sản phẩm đã được mua và từ đó sinh ra các gợi ý dựa trên độ lớn của liên kết giữa các sản phẩm này. 3.1.2. Các khó khăn và thách thức của giải thuật lọc cộng tác dựa trên người dùng Các hệ thống sử dụng giải thuật lọc cộng tác dựa trên người dùng đã từng rất thành công, nhưng gặp một số thách thức trong quá trình mở rộng, các thách thức đó là : - Sự thưa thớt: trong thực tế, nhiều hệ thống tư vấn thương mại được sử dụng để ước lượng những tập sản phẩm lớn, trong những hệ thống này, thậm chí khách hàng có thể có mua dưới 1% tổng lượng sản phẩm (amazone.com: 1% của 2 triệu sách là 20,000 sách). Tương ứng, một hệ thống tư vấn dựa vào những giải thuật láng giềng gần nhất có thể không tư vấn được bất kỳ những sản phẩm nào cho một khách hàng, hoặc tư vấn một kết quả có độ chính xác thấp. - Tính chuyển đổi mở rộng: các giải thuật láng giềng gần nhất yêu cầu tính toán lớn với cả số lượng khách hàng và số lượng sản phẩm. Với hàng triệu những khách hàng và những sản phẩm, một hệ thống tư vấn chạy những giải thuật hiện hữu sẽ chịu đựng những vấn đề về chuyển đổi, mở rộng nghiêm túc. Điểm yếu của giải thuật láng giềng gần nhất cho cơ sở dữ liêu lớn và thưa sẽ dẫn chúng ta sử dụng các giải thuật gợi ý khác. Hướng tiếp cận giải quyết vấn đề thưa dữ liệu sử dụng các tác tử lọc bán thông minh trong hệ thống. Các tác tử này ước lượng và đánh giá mỗi sản phẩm sử dụng đặc điểm cú pháp. Thông qua tập các đánh giá này, chất lượng gợi ý được cải thiện và có độ chính xác tăng lên. Giải pháp sử dụng tác nhân lọc cũng gặp phải khó khăn khi xảy ra thưa thớt các đánh giá, mối quan hệ nghèo nàn giữa những người sử dụng. Để khắc phục vấn đề này ta sử dụng hướng tiếp cận chỉ mục ngữ nghĩa tiềm ẩn (Latent Semantic Indexing – LSI) để tính toán độ tương tự giữa người sử dụng và sản phẩm để giảm bớt số chiều không gian. Kỹ thuật chỉ mục ngữ nghĩa tiềm ẩn giả thiết rằng có vài cấu trúc tiềm ẩn trong những mẫu có các từ đồng thời xuất hiện, thông qua các tập hợp và các phép thử tài liệu để mô hình hóa những phần phụ thuộc giữa các từ và tài liệu. LSI dùng kỹ thuật phân tích giá trị riêng (SVD-singular value decomposition) để giảm bớt kích thước ma trận thuật ngữ-tài liệu, không gian N-chiều sẽ được giảm bớt xuống một không gian K chiều, K<<N, không gian mới này được gọi là không gian khái niệm. Tất cả các từ N và các tài liệu M có thể được đại diện là những vectơ trong không gian giảm chiều K. Các tài liệu với những mẫu từ tương tự sẽ gần nhau dù chúng không chia sẻ những từ chung, điều này cho thấy rằng kỹ thuật chỉ mục ngữ nghĩa tiềm ẩn có thể phát hiện ra những mối quan hệ ngữ nghĩa học tiềm tàng giữa những tài liệu. Ví dụ, chỉ mục ngữ nghĩa tiềm ẩn sẽ thấy được “laptop” và “portable” xuất hiện nhiều trong cùng ngữ cảnh và có vectơ tương tự. 3.2. Hệ gợi ý lọc cộng tác dựa trên nền sản phẩm Hướng tiếp cận gợi ý dựa trên nền sản phẩm sẽ xem xét tập các sản phẩm mà người sử dụng đã đán._.

Các file đính kèm theo tài liệu này:

  • doc26. baocao.doc
Tài liệu liên quan