Vào ngày 23/04/2024, tại Đại học Bách khoa Hà Nội đã tổ chức Lễ bảo vệ luận án Tiến sĩ cho Nghiên cứu sinh Võ Đức Quang, sinh năm 1987, Giảng viên, Viện Kỹ thuật và Công nghệ - Trường Đại học Vinh.
Tên luận án: Cải tiến thuật toán phân lớp cho dữ liệu không cân bằng và ứng dụng trong dự đoán đồng tác giả.
Ngành: Hệ thống thông tin
Người hướng dẫn khoa học: PGS.TS. Trần Đình Khang - Trường CNTT và Truyền thông, Đại học Bách Khoa Hà Nội
Với mục tiêu cải tiến các thuật toán phân lớp hiệu quả cho dữ liệu không cân bằng và ứng dụng trong bài toán dự đoán đồng tác giả, luận án đưa đến hai đóng góp chính:
- Xây dựng thuật toán cải tiến dựa trên AdaBoost có tên Im.AdaBoost.WSVM cho bài toán phân lớp với dữ liệu không cân bằng và ứng dụng trong dự đoán đồng tác giả. Cụ thể hai cải tiến gồm: (i) phương pháp khởi tạo tập các trọng số lỗi thích nghi với tỷ lệ không cân bằng của tập dữ liệu; (ii) phương pháp tính toán trọng số độ tin cậy của các bộ phân lớp thành viên trong AdaBoost nhạy cảm đối với tổng lỗi gây ra trên các mẫu nhãn dương.
- Đề xuất một thuật toán điều chỉnh trọng số mờ thích nghi dựa trên FSVM-CIL gọi là AFW-CIL cho bài toán phân lớp với dữ liệu không cân bằng và ứng dụng trong dự đoán đồng tác giả. Cụ thể hai cải tiến gồm: (i) xây dựng một hàm thuộc mờ mới cho các mẫu dữ liệu dựa trên khoảng cách từ mỗi mẫu đến tâm của cả lớp thiểu số và lớp đa số; (ii) đề xuất phương pháp điều chỉnh thích nghi trọng số mờ của các mẫu nhạy cảm được định vị dựa trên các cặp Tomek link trong không gian lề phân lớp SVM hoặc mẫu là nhiễu.
Các thuật toán đề xuất được thử nghiệm trên các bộ dữ liệu từ UCI và các bộ dữ liệu đồng tác giả tự xây dựng có sự đa dạng về kích thước mẫu và tỷ lệ không cân bằng. Các kết quả thử nghiệm chỉ ra rằng các thuật toán đề xuất phù hợp cho phân lớp với bộ dữ liệu không cân bằng.
Nội dung kết quả nghiên cứu của luận án đã được nghiên cứu sinh công bố trong 5 bài báo khoa học, bao gồm: 01 bài báo tạp chí ISI Q1, 01 bài báo tạp chí Scopus, 02 bài báo hội nghị quốc tế, 01 bài báo hội nghị quốc gia.
Một số hình ảnh của buổi bảo vệ: