Trợ lý đối thoại Rasa (2): Hỗ trợ tiếng Trung
Ngày cập nhật: 10/04/2024 | Lượt đọc: 13718 | Số từ: 1913 | Phân loại: AI
Tìm kiếm
Sau khi cài đặt Rasa, mặc định hệ thống không hỗ trợ ngôn ngữ tiếng Trung. Nếu bạn muốn xây dựng một trợ lý ảo có khả năng hiểu và phản hồi bằng tiếng Trung, bạn cần phải cấu hình lại một số phần trong pipeline của nó.
Trên thực tế, các ví dụ về pipeline cho Rasa thường rất khác nhau. Không trực tiếp thử nghiệm thì khó có thể biết được cái nào tốt hơn hay phù hợp hơn với nhu cầu của mình. Vì vậy, hãy bắt đầu từ một cấu hình đơn giản nhất mà vẫn chạy được. Một gợi ý là sử dụng pipeline tiếng Trung được đề xuất trong cuốn sách “Rasa Thực chiến: Xây dựng trợ lý đối thoại mở nguồn”. Trong đó có ví dụ về NLU (Natural Language Understanding) dành cho robot y tế. Tuy nhiên, ví dụ này chỉ bao gồm phần nhận diện ý định và thực thể, chưa có phần xử lý câu trả lời.
Hiệu quả đạt được
:
|
|
Ý định tạm biệt (goodbye
):
|
|
Hai trường hợp trên là hoàn toàn mong đợi, cho thấy hệ thống đã hỗ trợ tiếng Trung. Khi còn ở chế độ mặc định là tiếng Anh, nếu nhập tiếng Trung thì sẽ không có phản hồi.
Điều khiến tôi bất ngờ là khả năng nhận diện ý định phủ nhận (deny
):
|
|
Tôi chưa từng đưa từ “拒绝” (từ chối) vào dữ liệu huấn luyện, nhưng hệ thống vẫn nhận diện chính xác. Có vẻ như mô hình ngôn ngữ tiếng Trung đã được áp dụng, nhưng vẫn chưa rõ là thành phần nào trong pipeline đảm trách điều này. Tôi sẽ tìm hiểu kỹ hơn sau.
Tuy nhiên, vẫn còn một số điểm chưa hài lòng:
|
|
Thực ra, ý định đúng nên là greet
, nhưng hệ thống lại nhận thành affirm
. Dù vậy, đây vẫn là kết quả chấp nhận được với mức độ chính xác cơ bản.
Hỗ trợ phản hồi tiếng Trung
Các bước trước chỉ giúp hệ thống hiểu được tiếng Trung, nhưng chưa hỗ trợ phản hồi bằng tiếng Trung. Bạn cần thêm nội dung tiếng Trung vào tệp domain.yml
như sau:
|
|
Huấn luyện lại mô hình đầy đủ
Vì trước đó bạn chỉ huấn luyện NLU, chưa bao gồm logic phản hồi, nên cần huấn luyện lại toàn bộ mô hình. Lưu ý không thêm tham số nlu
:
|
|
Thông tin log:
|
|
Kích thước file tăng lên:
|
|
Khởi động lại Rasa shell
Tiếp tục khởi động shell Rasa để kiểm tra:
|
|
Kiểm tra giao tiếp tiếng Trung
|
|
Hiện tại, hệ thống đã hỗ trợ đầy đủ cả tiếng Trung!
Lỗi khi huấn luyện NLU
Nếu gặp lỗi:
rasa.engine.exceptions.GraphSchemaValidationException: Component ‘JiebaTokenizer’ requires the following packages which are currently not installed: jieba.
Giải pháp:
|
|
Nếu gặp lỗi:
rasa.engine.exceptions.GraphSchemaValidationException: Component ‘LanguageModelFeaturizer’ requires the following packages which are currently not installed: transformers.
Giải pháp:
|
|
Cách khắc phục không truy cập được HuggingFace
Ở Việt Nam, đôi khi bạn sẽ không thể tải mô hình từ HuggingFace. Tham khảo hướng dẫn này để khắc phục:
Tài liệu
Danh sách bài viết liên quan
📖 Hướng dẫn Rasa đối thoại bằng tiếng Trung