Gán nhãn từ loại – Part-Of-Speech (POS) Tagging là một trong những bài toán cơ bản của xử lý ngôn ngữ tự nhiên. Nhiệm vụ của bài toán là xây dựng một mô hình gán nhãn từ loại để sao cho từ một câu đầu vào, ta phải thu được chuỗi đầu ra với các từ đã được gán nhãn từ loại tương ứng. Trong lĩnh vực xử lý ngôn ngữ tự nhiên, gán nhãn từ loại là pha cơ bản và quan trọng được sử dụng phục vụ cho các ứng dụng khác như: Phân tích cú pháp, Phân tích ngữ nghĩa, Dịch máy,… Theo [1], tiếng việt là ngôn ngữ phổ biến thứ 12 trên thế giới và là ngôn ngữ chính được sử dụng tại Việt Nam với trên 85% dân số trong cả nước và gần 3 triệu Việt kiều ở nước ngoài. Sự đa dạng và phong phú của ngữ pháp tiếng Việt bản chất xuất phát từ đặc trưng cấu tạo của ngôn ngữ. Ở Việt Nam đã có một số nghiên cứu về bài toán gán nhãn từ loại tuy nhiên độ chính xác vẫn còn thấp hơn một số nghiên cứu trên các ngôn ngữ thông dụng khác như tiếng Anh, tiếng Trung, bên cạnh một số đặc trưng ngôn ngữ cho bài toán này cũng chưa được phân tích kỹ.

Title: Kết hợp mô hình cực đại entropy và học luật chuyển đổi cho bài toán gán nhãn từ loại : Luận văn ThS. Công nghệ thông tin: 60 48 01 01
Authors: Lê, Anh Cường, người hướng dẫn
Nguyễn, Ngọc Khương
Issue Date: 2014
Publisher: ĐHCN
Abstract: 59 tr. + CD-ROM + Tóm tắt
Luận văn ThS. Khoa học máy tính – Trường Đại học Công nghệ. Đại học Quốc gia Hà Nội,2014
URI: http://repository.vnu.edu.vn/handle/VNU_123/43565
Appears in Collections: UET – Master Theses

Leave a Reply

Your email address will not be published. Required fields are marked *

Name *
Email *
Website

Bitnami