Tìm kiếm bằng sáng chế dựa trên tương đồng ngữ nghĩa

Năm xuất bản

2023

Nhan đề tạp chí

ISSN

Nhan đề tập

Nhà xuất bản

Trường Đại học Nguyễn Tất Thành

Tóm tắt

Tìm kiếm dựa trên từ khóa là một công cụ tìm kiếm phổ biến, cổ điển và còn nhiều hạn chế. Trong khi đó, tìm kiếm bằng ngữ nghĩa có thể hiểu được chủ đề hay ý nghĩa cụ thể của từng đoạn và câu văn. Hai kĩ thuật chính trong tìm kiếm ngữ nghĩa gồm: tìm kiếm vectơ (vector search) và xử lí ngôn ngữ tự nhiên (Natural Language Processing) cho tài liệu bằng sáng chế tiếng Anh. Nguồn dữ liệu được lấy từ trang web USPTO thuộc về chính phủ Mĩ. Điểm mới của nghiên cứu là tìm được những tài liệu gần nghĩa với tài liệu cho trước, tốc độ tìm kiếm nhanh và chính xác hơn. Kết quả đạt được ban đầu của nghiên cứu tỏ ra hiệu quả so với các phương pháp tìm kiếm đồng nghĩa khác thể hiện ở tốc độ tìm kiếm chỉ tốn 0,3775 giây để tìm ra 10 bằng sáng chế có độ tương đồng cao nhất trong kho dữ liệu gồm 694 bằng sáng chế. Nghiên cứu này đã đưa ra phương pháp tìm kiếm mới để giải quyết vấn đề tìm kiếm bằng sáng chế tương đồng vì tránh đăng kí trùng ý tưởng của tác giả và bảo hộ quyền sở hữu và quyền thương mại.

Mô tả

8 tr.

Từ khóa chủ đề

Tìm kiếm vectơ, Tìm kiếm bằng sáng chế, Tìm kiếm ngữ nghĩa, Chuyển đổi câu, Xử lý ngôn ngữ tự nhiên, Bảo hộ quyền sở hữu

Trích dẫn

Trường Đại học Nguyễn Tất Thành. (2023). Tạp chí Khoa học và công nghệ - Đại học Nguyễn Tất Thành [Journal of Science and Technology - NTTU], Tập 6, Số 3. ISSN 2615-9015.