NGHIÊN CỨU XÂY DỰNG TIẾN TRÌNH PHÂN LOẠI TÌNH CẢM TRÊN TIẾNG VIỆT

Đậu Mạnh Hoàn

Tóm tắt


Phân loại văn bản là quá trình phân tích nội dung văn bản và sau đó đưa ra quyết  định văn bản đó có thể thuộc về một nhóm, nhiều nhóm hoặc không thuộc vào nhóm tài liệu văn bản nào được định nghĩa trước. Phân loại tình cảm là một dạng đặc biệt của phân loại văn bản, trong đó một tài liệu được phân loại để dự đoán tình cảm tự động phân cực (tích cực hay tiêu cực). Trên thế giới đã có nhiều nghiên cứu có hiệu quả về vấn đề này, đặc biệt là trên các tài liệu văn bản bằng tiếng Anh. Tuy nhiên, rất ít nghiên cứu về tài liệu văn bản tiếng Việt. Hơn nữa, các kết quả nghiên cứu và ứng dụng vẫn còn hạn chế một phần do các đặc điểm đặc trưng của ngôn ngữ tiếng Việt trong cấu trúc từ, câu và có nhiều từ đa nghĩa trong nhiều bối cảnh khác nhau. Trong bài viết này, tác giả tiến hành xây dựng một mô hình tiến trình nhằm phục vụ quá trình phân loại tình cảm trên tiếng Việt và đề xuất kỹ thuật lựa chọn đặc trưng cho tiến trình đó.




TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ

Địa chỉ: Trường Đại học Quảng Bình, 312 Lý Thường Kiệt, Phường Bắc Lý, Thành phố Đồng Hới, Tỉnh Quảng Bình 
ĐT: 0232.3822010 - Fax: 0232.3821054