TÍNH NĂNG


Công cụ hỗ trợ convert truyện là một nền tảng chuyển ngữ từ một ngôn ngữ A sang một ngôn ngữ B với mục đích là học tập và làm việc:


1. Quản lý, lưu trữ dữ liệu văn bản cá nhân.


Những dữ liệu văn bản cá nhân này có thể là các bộ truyện, đoạn văn bản của một loại ngôn ngữ bất kỳ (tiếng Trung, tiếng Hàn, tiếng Nhật,...) do người dùng đăng tải lên tạm gọi là DỮ LIỆU NGUỒN.


2. Tích hợp thuật toán xử lý dữ liệu,  convert DỮ LIỆU NGUỒN sang một ngôn ngữ bất kỳ (tiếng Anh, tiếng Việt,...) tạm gọi là DỮ LIỆU ĐÍCH bằng BỘ DỮ LIỆU CONVERT do người dùng tự xây dựng theo nguyên tắc của hệ thống.


Xem giới thiệu, hướng dẫn xây dựng BỘ DỮ LIỆU CONVERT trong phần Hướng Dẫn.


3. Tính năng convert là một tập hợp các thuật toán xử lý để chuyển ngữ văn bản từ một NGÔN NGỮ A sang một NGÔN NGỮ B:


      - Convert theo dạng văn xuôi: thay thế cụm từ NGÔN NGỮ A sang cụm từ NGÔN NGỮ B (CỤM TỪ MỚI định dạng VIETPHRASE). Theo mặc định CỤM TỪ MỚI của người dùng sẽ sử dụng cùng với của hệ thống. Điều này giúp người mới bắt đầu convert có dữ liệu để tham khảo. Ưu tiên thay thế cụm từ của người dùng trước.


      - Convert theo dạng cấu trúc Luật Nhân (sắp xếp, thay đổi vị trí của các NHÂN trong một câu).


          + NHÂN: là một tập hợp các cụm từ có cùng dạng từ loại, vị trí, chức năng của NGÔN NGỮ A trong một câu với ký tự đại diện tương ứng với mỗi NHÂN.


          + Qua quá trình phân tích, NHÂN tạm được phân loại thành:


             NHÂN 1: CỤM TỪ TÊN CHUNG: tập hợp các cụm từ chỉ tên người, đại từ nhân xưng, địa danh, con vật, đồ vật. NHÂN 1 được chia thành CỤM TỪ TÊN CHUNG CỔ ĐẠI, CỤM TỪ TÊN CHUNG HIỆN ĐẠI, CỤM TỪ TÊN RIÊNG TRONG TRUYỆN.


             NHÂN 2: CỤM TỪ CHỮ SỐ: tập hợp các cụm từ chỉ chữ số. Mặc định CỤM TỪ CHỮ SỐ của người dùng sẽ sử dụng cùng với cả của hệ thống, nhưng sẽ ưu tiên cụm từ của người dùng trước. Dữ liệu CỤM TỪ CHỮ SỐ của hệ thống đã có sẵn từ số 2 đến số 9999, điều này giúp người dùng không phải thêm dữ liệu nhiều.


             NHÂN 3: CỤM TỪ CHỈ MÀU SẮC


             NHÂN 4: CỤM TỪ CHỈ VỊ TRÍ


             NHÂN 5: CỤM TỪ CHỈ TÍNH CHẤT:


             NHÂN 6: CỤM TỪ CHỈ HÀNH ĐỘNG:


          + Một câu có thể chứa một hoặc nhiều NHÂN.


          + Một câu có thể chứa một hoặc nhiều loại NHÂN.


      - Thay thế cụm từ của NGÔN NGỮ A bị sai.


      - Thay thế cụm từ chứa NHÂN của NGÔN NGỮ A gây nhầm lẫn, xung đột thuật toán convert.CÁC TÍNH NĂNG GIÚP CÁC CONVERTER TIẾT KIỆM THỜI GIAN, CÔNG SỨC, LƯU TRỮ DỮ LIỆU, TĂNG TỐC CONVERT
- Thuật toán Luật Nhân
- CỤM TỪ CHỮ SỐ: với các số từ 2 -> 9999 được tạo tự động (xem hướng dẫn)
- Tự động tìm và thêm các cụm từ name với quy tắc HỌ ghép với CHỨC DANH như Trương đạo hữu, Lý chưởng môn (xem hướng dẫn)
- Tự động tìm và thêm các cụm từ name theo quy tắc chữ 老 ghép với HỌ và chữ 姓 ghép với HỌ và HỌ ghép với chữ 姓 như 姓韩: họ Hàn, 韩姓: họ Hàn, 王姓: họ Vương, 老张: lão Trương,老叶: lão Diệp
- Trong đoạn văn gốc có thể chứa nhiều cụm từ có cùng nghĩa (theo cá nhân admin, mong nhận được góp ý) như:
+ 如此, 如此的, 这么, 这么的, 这样, 这样的, 这般, 这般的: những cụm từ này được dịch là "như vậy". Với những cụm từ này, ta thay thế tất cả các cụm từ trên thành 这么 (chỉ dùng một loại).
+ 那么, 那样, 那般, 那般的, 那么之, 那么的, 那样的: những cụm từ này được dịch là "như thế". Tương tự với những cụm từ này, ta thay thế tất cả các cụm từ trên thành 那么 (chỉ dùng một loại).
NEWS
[2022-06-04]
- Tìm và ghép NHÂN cụm từ tên chung tự động:
+ Bảng từ đơn chỉ con vật ghép với từ 血 (máu): 猪血: máu lợn, 鸭血: máu vịt...
[2022-05-29]
- Tìm và ghép NHÂN cụm từ chỉ vị trí tự động
[2022-05-28]
- Tự động convert mục lục sang tiếng Việt (trước đây mục lục được tự động convert sang Hán Việt)
[2022-04-18]
- Đưa tính năng tự động tìm và ghép tên nhân vật trong truyện vào sử dụng với tất cả người dùng (trước chỉ dùng cho 1 số người)
- Tính năng này dần dần sẽ tìm được càng nhiều tên nhân vật trong truyện
[2022-03-13]
- Xây dựng tính năng tự động tìm và ghép NHÂN cụm từ chỉ tính chất
[2022-03-06]
- Xây dựng tính năng tự động tìm và ghép tên nhân vật trong truyện (đang trong giai đoạn thử nghiệm).
[2021-09-26]
- Thay đổi giao diện trang dịch văn bản.
- Giao diện mới giống như giao diện đọc truyện có:
+ Dịch trực tiếp từ google
+ Người dùng có thể thêm tên riêng, tên nhân vật tạm thời trong đoạn văn bản
+ Chỉnh sửa tiếng Trung theo từng đoạn văn bản
+ Tính năng tra từ điển và tham khảo vietphrase tạm thời bị loại bỏ vì chưa biết bố trí thế nào cho hợp lý.
- Xem video: Video
[2021-09-19]
- Đưa vào thử nghiệm NHÂN CỤM TỪ CHỮ SỐ Latin (từ 0->9999)
- Tương tự như CỤM TỪ CHỮ SỐ
- Một chữ số Latin (0,1,2..) bất kỳ là một từ, cụm từ trong NHÂN Cụm từ chữ số
[2021-09-18]
- Rất tiếc về tính năng tra từ điển online ngay trên giao diện thêm/sửa/xóa cụm từ
- Hệ thống đã làm xong nhưng không thể publish
- Xem video: Video

[2021-09-13][THÊM/SỬA/XÓA BỘ DỮ LIỆU CONVERT]
- Thêm một tiện ích nhỏ giúp giảm bớt thao tác khi thêm mới cụm từ
- Trước đây người dùng phải bôi đen từ, cụm từ -> sao chép từ, cụm từ tiếng Trung -> dán vào ô văn bản tiếng Trung (name_cn)
- Từ bây giờ người dùng chỉ cần bôi đen từ, cụm từ tiếng Trung, những từ, cụm từ này sẽ tự động nhập vào ô văn bản tiếng Trung (name_cn) và tự động chuyển thành các ký tự đại diện tương ứng (nếu có)
- Hệ thống đang nghiên cứu chế độ tra từ khi bôi đen từ hoặc cụm từ. Hy vọng sẽ cập nhật sớm.
[2021-09-12]
- Thêm tính năng bình luận bằng Facebook cho từng truyện
- Chưa dùng nên không biết có bị lỗi không!
[2021-09-04]
- Sửa lại một số code, tránh request nhiều vào server (giúp dành nhiều tài nguyên cho việc convert, tăng tốc độ convert)
[2021-09-02]
- Sửa lại trang quản lý BỘ DỮ LIỆU CONVERT (upload/download/backup) cho người dùng đăng nhập
- Các bạn có thể tải và sao lưu dữ liệu convert, dùng dữ liệu của các bạn để convert
[2021-08-31]
- Sửa lỗi khi converter SỬ DỤNG CHUNG BỘ DỮ LIỆU CỦA HỆ THỐNG
- Bộ dữ liệu Name (tên nhân vật) trong từng truyện của hệ thống đã không được sử dụng.
[2021-08-31]
- Bổ sung tính năng lưu lại danh sách truyện người dùng vừa xem (ở cuối trang chủ)
[2021-08-28]
- Sửa lỗi hiển thị dấu nháy "
- Một số nội dung hiển thị chuỗi ký tự " (đây là dấu nháy ")
- Sửa thành cặp dấu “ ” để hiển thị đoạn văn bản in nghiêng.
[2021-08-22]
- Bổ sung tính năng thống kê lượt đọc, convert thực tế
- Mỗi lượt đọc, convert trong mỗi chương đạt 1 phút, tính là 1 lượt đọc
[2021-08-19]
- Sửa lỗi dịch Luật Nhân: có 2 lỗi mà hôm nay hệ thống mới phát hiện ra. 2 lỗi này chắc là có từ ngày 2021-08-05, khi mà hệ thống cập nhật thuật toán convert.
- Thứ nhất: Khi đọc một số truyện các bạn sẽ thấy tên nhân vật bị thay đổi thành một tên khác.
- Thứ hai:
+ Hệ thống luôn cập nhật dữ liệu (thêm, sửa, xóa) vào những cụm từ NHÂN (tên chung, tên nhân vật, hành động...) và cụm từ chứa cấu trúc Luật Nhân.
+ Để bạn đọc luôn được đọc bản convert với dữ liệu mới nhất.
+ Nhưng những dữ liệu của hệ thống thêm chỉ lưu vào dữ liệu của hệ thống mà không lưu vào dữ liệu dành cho người dùng không đăng nhập.
+ Nên trong khoảng thời gian gần đây, truyện chỉ được convert với dữ liệu cũ mà thiếu dữ liệu cập nhật.
- Trong quá trình phát triển công cụ (hệ thống sẽ luôn cập nhật), sẽ xảy ra những lỗi mà khó có thể phát hiện ngay.
- Vì vậy nếu quá trình sử dụng, nếu có lỗi nào xảy ra, các bạn vui lòng chụp ảnh màn hình và gửi vào email converttruyen@gmail.com
- Hệ thống sẽ cố gắng sửa trong thời gian sớm nhất.
- Rất mong sự ủng hộ của các bạn.
[2021-08-15]
- Hệ thống đã xóa tổng cộng 62.631 truyện với tiêu chí trùng tên và trùng tác giả từ các nguồn truyện khác nhau.
- Khi truy cập vào link truyện bị xóa, hệ thống sẽ gợi ý tìm kiếm truyện từ các nguồn khác.
[2021-08-11]
- Hệ thống xóa 56289 truyện trùng với tiêu chí trùng tên và trùng tác giả trên các nguồn truyện
- Còn rất nhiều truyện có tên và tác giả khác nhau nhưng trùng nội dung chưa lọc được.
[2021-08-06]
- Sửa lại tên Hán Việt của một số truyện (khi mà cập nhật Hán Việt 1 nghĩa)
- Điều này có thể sẽ ảnh hưởng đến link một số truyện.
[2021-08-05]
- Rà soát, lọc tinh gọn lại code, tăng tốc độ convert.
[2021-08-04]
- Bổ sung thêm danh sách truyện từ 2 nguồn 80txt.net và wutuxs.com
[2021-07-01]
- Bổ sung hiển thị hình ảnh cho các truyện từ nguồn uukanshu.com
[2021-06-30]
- Kết thúc ngày cuối tháng 6 bằng hiển thị thêm mục giới thiệu trong từng truyện.
- Vì phần giới thiệu truyện được convert trực tiếp nên sẽ ảnh hưởng phần nào tới tốc độ tải trang. Mong các bạn thông cảm!.
[2021-06-27]
- Thêm tìm kiếm truyện theo tác giả bằng cách click vào tên tác giả
- Tìm kiếm truyện theo tác giả là tìm kiếm gần như tuyệt đối (tên tác giả phải nhập đầy đủ)
[2021-06-19]
- Tính năng tìm kiếm được update
- Tăng tốc độ tìm kiếm
- Tìm kiếm truyện là tìm kiếm tương đối (từ khóa tìm kiếm có thể có trong tên truyện hoặc tên tác giả)
- Thời gian tìm kiếm khoảng trên dưới 2 giây tùy vào kết quả được tìm kiếm và lượng request từ người dùng
- Thời gian tìm kiếm không phải thời gian tải trang
- Thống kế thời gian tìm, kết quả tìm, số trang, nguồn trang, tên tác giả kèm tên truyện
- Phân trang nếu có nhiều kết quả được tìm thấy
- Thông báo nếu không tìm thấy kết quả phù hợp
- Trước đây tính năng tìm kiếm rất chậm, chỉ có 1 trang và chỉ hiển thị 30 kết quả, chỉ có tên truyện. Sorry các bạn!
[2021-06-16]
- Bổ sung chức năng chuyển chữ hoa, chữ thường trong FORM THÊM SỬA XÓA DỮ LIỆU TỪ ĐIỂN
[2021-06-09]
- Hệ thống bổ sung thêm hơn 30.000 tên riêng, tên nhân vật
- Hy vọng chất lượng bản convert của những truyện chưa được thêm name sẽ tốt hơn khi được convert bằng thuật toán Luật Nhân
[2021-05-23]
- Thêm chức năng Dịch nhanh đoạn văn bản vào website
- Chức năng này vẫn đang trong quá trình hoàn thiện
- Trước đây đã có chức năng dịch nhanh nhưng bị tạm thời gỡ bỏ

[2021-05-05]
- Trong phần tự động tìm và thêm CỤM TỪ TÊN CHUNG
- Trước đây đã thêm các cụm từ theo quy tắc HỌ ghép với CHỨC DANH vào CỤM TỪ TÊN CHUNG (xem Hướng dẫn)
- Hôm nay bổ sung thêm các cụm từ theo quy tắc chữ 老 ghép với HỌ và chữ 姓 ghép với HỌ và HỌ ghép với chữ 姓
- VD: 姓韩: họ Hàn, 韩姓: họ Hàn, 王姓: họ Vương, 老张: lão Trương,老叶: lão Diệp
- Việc thêm các cụm từ theo quy tắc giúp converter không phải tìm và lưu các cụm từ tương tự như vậy -> tiết kiệm công sức -> thời gian -> lưu trữ dữ liệu

[2021-04-27]
- Sửa lỗi ngắt dòng trong nội dung chương truyện
- Nội dung một số chương không theo quy tắc chung của nguồn truyện, dẫn đến nội dung chương truyện không được ngắt dòng. Nội dung khó đọc và so sánh giữa câu tiếng Việt và tiếng Trung
- Đây là một phần trong việc cần làm để nội dung convert trông dễ đọc hơn.
[2021-04-21]
- Bảng CỤM TỪ CHỨA CẤU TRÚC THAY ĐỔI VỊ TRÍ (LUẬT NHÂN) có khoảng 21.000 dòng
- Hệ thống đã xóa những dòng bị thừa trong bảng CỤM TỪ CHỨA CẤU TRÚC THAY ĐỔI VỊ TRÍ (tức CỤM TỪ LUẬT NHÂN)
- Những dòng bị thừa là những dòng chứa những cụm từ đã được phân loại là NHÂN trong bảng CỤM TỪ TÊN CHUNG, CỤM TỪ TÊN CHUNG HIỆN ĐẠI, CỤM TỪ CHỮ SỐ và 1 số bảng được phân loại khác
- Sau khi xóa những cụm từ bị thừa, bảng CỤM TỪ CHỨA CẤU TRÚC THAY ĐỔI VỊ TRÍ còn khoảng 15.300 dòng
- Tốc độ convert sẽ được cải thiện hơn.

- Tương tự hệ thống cũng xóa những dòng thừa trong CỤM TỪ CŨ (là những cụm từ vietphrase sưu tầm trên mạng) và CỤM TỪ MỚI (là những cụm từ vietphrase của hệ thống)
- Sau một thời gian phân loại cụm từ sẽ thực hiện tiến trình dọn rá�