Tạp chí Khoa học Yersin, T. 2, S. 1 (2017)

Cỡ chữ:  Nhỏ  Vừa  Lớn

COOC-CFI: THUẬT TOÁN HIỆU QUẢ KHAI THÁC TẬP PHỔ BIẾN ĐÓNG TRÊN DỮ LIỆU GIAO DỊCH

Phan Thành Huấn

Tóm tắt


Khai thác luật kết hợp là một trong những kỹ thuật quan trọng và được nghiên cứu nhiều trong khai thác dữ liệu. Khai thác tập phổ biến đóng là một trong những vấn đề cơ bản trong khai thác luật kết hợp. Hầu hết các thuật toán sinh không gian tìm kiếm dựa trên tập mục thỏa ngưỡng phổ biến tối thiểu và không dùng lại cho lần khai thác tiếp theo. Để khắc phục vấn đề này, chúng tôi đề xuất một cách tiếp cận mới để tìm tập phổ biến đóng trên dữ liệu giao dịch dùng cấu trúc dữ liệu lưu trữ dạng bit và tập chỉ mục chứa tập mục đồng xuất hiện để chiếu tính nhanh tập phổ biến đóng. Sau cùng, chúng tôi trình bày kết quả thực nghiệm, cho thấy thuật toán đề xuất tốt hơn so với các thuật toán hiện hành.


Toàn văn: PDF