📖 Hướng dẫn Lọc TB
Lọc TB (Term Base) là tính năng giúp phân nhóm cho text Gốc CN,
nhằm hỗ trợ trong việc lọc ra Term Base – các thuật ngữ game.
Khi nào dùng
- Khi cần lọc TB cho game mới (kết hợp với xử lý Text Trùng).
- Khi cần lọc TB cho game cũ (game chưa có TB).
Cách dùng
-
Input: Sheet hiện hành chứa:
- Cột A: Gốc CN
-
Cột B: Dịch (không phụ thuộc ngôn ngữ, có thể để trống,
dùng để tham khảo khi lọc)
-
Đứng tại sheet hiện hành, mở
HinFast → Lọc TB → Lọc TB, nhấn Bắt Đầu.
-
Output: Sheet hiện hành với cấu trúc:
- Cột A: Gốc CN
- Cột B: Dịch (hoặc trống nếu đầu vào trống)
- Cột C: Phân Nhóm
Giải thích
-
Sau khi chạy tính năng Lọc TB, sẽ xuất hiện cột C – Phân Nhóm
của cột A.
-
Nhóm được phân theo thứ tự ưu tiên từ 1 → 17.
Mỗi dòng chỉ thuộc 1 nhóm;
khi đã thuộc nhóm ưu tiên cao hơn thì
không thể thuộc các nhóm còn lại,
dù có thỏa điều kiện.
-
Khi không thuộc các nhóm từ 1–15,
nếu chứa một số từ đặc biệt
(ví dụ: "离开", "前往", "进入", "退出")
thì sẽ được đưa vào Blacklist.
Danh sách này có khả năng cao không dùng làm TB.
-
Tất cả các dòng không thuộc nhóm 1–16
sẽ được đưa vào Whitelist.
Đây là danh sách có khả năng cao được dùng làm TB,
tuy nhiên vẫn cần lọc lại.
Lưu ý
-
Khi không có ô nào thỏa tiêu chí của một nhóm,
thì trong cột C – Phân Nhóm sẽ không có nhóm đó.
-
Nhóm Ngoặc vuông / Ngoặc tròn / Ngoặc nhọn
cần tách riêng ra để chạy tính năng Tách Ngoặc.
-
Nhóm cấp bậc, lượng từ, phân cách cần lọc lại thủ công.
-
Có những nhóm khả năng cao không dùng làm TB:
1 ký tự, dài > 20 ký tự, số, code, dấu câu.
-
Tóm lại: cần lướt lại từng nhóm, xóa bỏ các dòng không phải TB,
giữ lại các dòng TB.
Nên làm theo thứ tự từ 1 → 17.
-
Trong quá trình xử lý, có thể
chạy lại tính năng Lọc TB
để kết quả gọn và dễ nhìn hơn.
-
Kết quả cuối cùng cần được kiểm tra kỹ
trước khi quyết định sử dụng.
← Quay lại danh sách tính năng