Mô hình chủ đề

Trong học máyxử lý ngôn ngữ tự nhiên, một mô hình chủ đề là một dạng mô hình thống kê dùng để khám phá các tóm tắt "chủ đề" xảy ra trong một tập dữ liệu. Mô hình hóa chủ đề là một công cụ thường xuyên sử dụng để khám phá các cấu trúc ngữ nghĩa tiềm ẩn trong văn bản. Theo trực giác, cho trước một tài liệu về một chủ đề nào đó, một người có thể kỳ vọng những từ đặc trưng xuất hiện trong tài liệu theo tần số nhiều hay ít: "chó" và "xương" thường xuất hiện trong các tài liệu nói về chó, "mèo" và "meo" thường xuất hiện trong tài liệu nói về mèo, và những từ như "là" và "con" thường xuất hiện như nhau ở các tài liệu.

Xem thêm

Tham khảo

Đọc thêm

  • Steyvers, Mark; Griffiths, Tom (2007). “Probabilistic Topic Models”. Trong Landauer, T.; McNamara, D; Dennis, S.; và đồng nghiệp (biên tập). Handbook of Latent Semantic Analysis (PDF). Psychology Press. ISBN 978-0-8058-5418-3. Bản gốc (PDF) lưu trữ ngày 24 tháng 6 năm 2013.
  • Blei, D.M.; Lafferty, J.D. (2009). “Topic Models” (PDF). Bản gốc (PDF) lưu trữ ngày 24 tháng 11 năm 2019.
  • Blei, D.; Lafferty, J. (2007). “A correlated topic model of Science”. Annals of Applied Statistics. 1 (1): 17–35. arXiv:0708.3601. doi:10.1214/07-AOAS114.

Liên kết ngoài

  • Mimno, David. “Topic modeling bibliography”.
  • Brett, Megan R. “Topic Modeling: A Basic Introduction”. Journal of Digital Humanities.
  • x
  • t
  • s
Thuật ngữ chung
Khai thác văn bản
Tóm tắt tự động
Dịch tự động
Nhận dạng tự động
và thu thập dữ liệu
Mô hình chủ đề
Xem xét với
sự trợ giúp máy tính
Giao diện người dùng
ngôn ngữ tự nhiên
Bài viết này vẫn còn sơ khai. Bạn có thể giúp Wikipedia mở rộng nội dung để bài được hoàn chỉnh hơn.
  • x
  • t
  • s