Mô tả vắn tắt học phần

1. Tên học phần:

Xử lý ngôn ngữ tự nhiên

2. Ngôn ngữ giảng dạy:

Tiếng Việt

3. Mã học phần:

M01369

4. Bộ môn phụ trách giảng dạy:

CNTK - Khoa Công nghệ thông tin kinh doanh

5. Trình độ:

Thạc sĩ

6. Số tín chỉ:

3

7. Phân bổ thời gian:

  • Đối với hoạt động trên lớp:
  • Lý thuyết: 45 tiết
  • Làm việc nhóm, thảo luận:
  • Đối với hoạt động tại phòng máy tính, phòng mô phỏng, …:
  • Thực hành, làm việc nhóm, thảo luận
  • Tự nghiên cứu, tự học: 105 tiết
  • Đồ án, Đề án, Dự án
  • Thực tập

8. Tính chất học phần:

Dữ liệu đang cập nhật...

9. Ngành áp dụng:

Tất cả các ngành

10. Điều kiện tiên quyết:

Không có môn học bắt buộc phải hoàn thành trước học phần này

11. Mục tiêu học phần:

Trang bị cho sinh viên những kiến thức căn bản về tính toán ngôn ngữ (Computational linguistics) và những kiến thức chuyên về các quy trình xử lý ngôn ngữ tự nhiên (natural language processing). Đồng thời cung cấp cho sinh viên những thư viện hỗ trợ cho việc xử lý ngôn ngữ tự nhiên./ Equip students with basic knowledge of computational linguistics and specialized knowledge of natural language processing processes. It also provides students with libraries that support natural language processing.

12. Mô tả vắn tắt nội dung học phần:

Cung cấp những kiến thức căn bản về quy trình xử lý ngôn ngữ tự nhiên (natural language processing) bao gồm: thu thập dữ liệu, làm sạch dữ liệu, trích xuất các đặc trưng, xây dựng mô hình xử lý, Học viên sẽ được cung cấp các kiến thức về các thư viện cần thiết để tự thu thập và xây dựng bộ dữ liệu từ nguồn Internet như các trang tin tức, Wikipedia, các mạng xã hội như Twitter, Facebook, Youtube, các trang thương mại điện tử như Shopee, Tiki. Ở các bước làm sạch và trích xuất dữ liệu thì ngoài các bước chung thì học viên còn được giới thiệu những bước được áp dụng riêng cho dữ liệu Tiếng Việt. Về mô hình xử lý thi học viên sẽ được cung cấp các kiến thức cơ bản về Học Máy và Học Sâu để có thể giải quyết các bài toán cơ bản như phân loại, phân cụm, tóm tắt văn bản, dịch máy. Học viên sẽ được thực hành sử dụng ngôn ngữ Python trên máy ảo Google Colab trong khóa học. Vào cuối khóa học viên có khả năng tự thu thập và xây dựng bộ dữ liệu tiếng Anh hoặc tiếng Việt cho các bài toán xử lý ngôn ngữ tự nhiên và biết cách phát triển mô hình Học Máy và Học Sâu để giải quyết các bài toán này.