Mô tả vắn tắt học phần
1. Tên học phần:
2. Ngôn ngữ giảng dạy:
3. Mã học phần:
4. Bộ môn phụ trách giảng dạy:
5. Trình độ:
6. Số tín chỉ:
7. Phân bổ thời gian:
- Đối với hoạt động trên lớp:
- Lý thuyết: 45 tiết
- Làm việc nhóm, thảo luận:
- Đối với hoạt động tại phòng máy tính, phòng mô phỏng, …:
- Thực hành, làm việc nhóm, thảo luận
- Tự nghiên cứu, tự học: 105 tiết
- Đồ án, Đề án, Dự án
- Thực tập
8. Tính chất học phần:
9. Ngành áp dụng:
Tất cả các ngành
10. Điều kiện tiên quyết:
11. Mục tiêu học phần:
12. Mô tả vắn tắt nội dung học phần:
Cung cấp những kiến thức căn bản về quy trình xử lý ngôn ngữ tự nhiên (natural language processing) bao gồm: thu thập dữ liệu, làm sạch dữ liệu, trích xuất các đặc trưng, xây dựng mô hình xử lý, Học viên sẽ được cung cấp các kiến thức về các thư viện cần thiết để tự thu thập và xây dựng bộ dữ liệu từ nguồn Internet như các trang tin tức, Wikipedia, các mạng xã hội như Twitter, Facebook, Youtube, các trang thương mại điện tử như Shopee, Tiki. Ở các bước làm sạch và trích xuất dữ liệu thì ngoài các bước chung thì học viên còn được giới thiệu những bước được áp dụng riêng cho dữ liệu Tiếng Việt. Về mô hình xử lý thi học viên sẽ được cung cấp các kiến thức cơ bản về Học Máy và Học Sâu để có thể giải quyết các bài toán cơ bản như phân loại, phân cụm, tóm tắt văn bản, dịch máy. Học viên sẽ được thực hành sử dụng ngôn ngữ Python trên máy ảo Google Colab trong khóa học. Vào cuối khóa học viên có khả năng tự thu thập và xây dựng bộ dữ liệu tiếng Anh hoặc tiếng Việt cho các bài toán xử lý ngôn ngữ tự nhiên và biết cách phát triển mô hình Học Máy và Học Sâu để giải quyết các bài toán này.