Mô hình hệ thống khai thác dữ liệu phi cấu trúc hỗ trợ khách hàng ra quyết định mua hàng trực tuyến
##plugins.themes.academic_pro.article.main##
Author
-
Lê Triệu TuấnTrường Đại học Công nghệ Thông tin và Truyền thông – Đại học Thái NguyênPhạm Minh HoànTrường Đại học Kinh tế Quốc dân
Từ khóa:
Tóm tắt
Những dạng dữ liệu phi cấu trúc được khách hàng để lại trên không gian mạng hiện nay ngày càng trở nên quan trọng đối với các doanh nghiệp kinh doanh trực tuyến. Dữ liệu đó là những bình luận dưới dạng văn bản, ẩn chứa trong đó là cảm xúc của khách hàng liên quan tới chất lượng của các sản phẩm mà họ quan tâm. Nghiên cứu này đề xuất một mô hình kiến trúc hệ thống hỗ trợ khách hàng ra quyết định mua hàng trực tuyến dựa trên phương pháp khai thác dữ liệu phi cấu trúc. Dữ liệu nghiên cứu được thu thập trên các trang thương mại điện tử lớn của Việt Nam, sau đó được phân loại thành tích cực hoặc tiêu cực bởi các mô hình của phương pháp học máy có giám sát. Sau khi thử nghiệm và đánh giá, chúng tôi đã lựa chọn mô hình Support Vector Machine (SVM) có độ chính xác cao nhất để làm mô hình thực nghiệm. Nghiên cứu có giá trị tham khảo cho các nhà nghiên cứu trong lĩnh vực thương mại điện tử và các lĩnh vực khác của kinh doanh và quản lý.
Tài liệu tham khảo
-
[1] Mudambi, S. and D. Schuff, “What Makes a Helpful Online Review? A Study of Customer Reviews on Amazon.com”, MIS Quarterly, 34, 2010, 185-200.
[2] Sharma, D.K., et al., “E-Commerce product comparison portal for classification of customer data based on data mining”, Materials Today: Proceedings, 51, 2022, 166-171.
[3] Al-Shamri, M.Y.H., “User profiling approaches for demographic recommender systems”, Knowledge-Based Systems, 100, 2016, 175-187.
[4] Xu, J., Y. Zhang, and D. Miao, “Three-way confusion matrix for classification: A measure driven view”, Information Sciences, 505, 2020, 772-794.
[5] Pazzani, M.J. and D. Billsus, Content-based recommendation systems, in The adaptive web, Springer, 2007, 325-341.
[6] Patra, B.G., et al., “A content-based literature recommendation system for datasets to improve data reusability – A case study on Gene Expression Omnibus (GEO) datasets”, Journal of Biomedical Informatics, 104, 2020, 1-14.
[7] Afoudi, Y., M. Lazaar, and M. Al Achhab, “Impact of Feature selection on content-based recommendation system”, International Conference on Wireless Technologies, Embedded and Intelligent Systems (WITS), 2019, 1-6.
[8] Aljunid, M.F. and M. Dh, “An Efficient Deep Learning Approach for Collaborative Filtering Recommender System”, Procedia Computer Science, 171, 2020, 829-836.
[9] Ghasemi, N. and S. Momtazi, “Neural text similarity of user reviews for improving collaborative filtering recommender systems”, Electronic Commerce Research and Applications, 45, 2021, 101019.
[10] Zhang, F., et al., “Graph embedding-based approach for detecting group shilling attacks in collaborative recommender systems”, Knowledge-Based Systems, 199(7), 2020, 105984.
[11] Yussupova, N., et al., “Models and Methods for Quality Management Based on Artificial Intelligence Applications”, Acta Polytechnica Hungarica, 13(3), 2016, 45-60.
[12] Nguyễn Đặng Lập Bằng, Nguyễn Văn Hồ, & Hồ Trung Thành, “Mô hình khai phá ý kiến và phân tích cảm xúc khách hàng trực tuyến trong ngành thực phẩm”, Tạp chí Khoa học Đại học Mở Thành phố Hồ Chí Minh, 16(1), 2020, 64-78.
[13] Duyen, N.T., N.X. Bach, and T.M. Phuong, “An empirical study on sentiment analysis for Vietnamese”, in 2014 International Conference on Advanced Technologies for Communications (ATC 2014), 2014, IEEE.
[14] Thái Kim Phụng, Nguyễn An Tế, & Trần Thị Thu Hà, “Tiếp cận phương pháp học máy trong khai thác ý kiến khách hàng trực tuyến”, Tạp chí Nghiên cứu Kinh tế và Kinh doanh Châu Á, 30(10), 2019, 27-41.
[15] Bang, T.S., C. Haruechaiyasak, and V. Sornlertlamvanich, “Vietnamese sentiment analysis based on term feature selection approach”, in 10th International Conference on Knowledge Information and Creativity Support Systems (KICSS 2015), 2015.
[16] Darley, W., Blankson, C., & Luethge, D., “Toward an Integrated Framework for Online Consumer Behavior and Decision Making Process: A Review”, Psychology and Marketing, 27(2), 2010, 94-116.
[17] Shugan, S.M., “The Cost Of Thinking”, Journal of Consumer Research, 7(2), 1980, 99-111.
[18] Payne, J.W.J.P.b., “Contingent decision behavior”, Psychological Bulletin, 92(2), 1982, 382-402.
[19] Häubl, G. and V.J.M.s. Trifts, “Consumer decision making in online shopping environments: The effects of interactive decision aids”, Marketing Science, 19(1), 2000, 4-21.
[20] Bhargave, R., A. Chakravarti, and A. Guha, “Two-Stage Decisions Increase Preference for Hedonic Options”, Organizational Behavior and Human Decision Processes, 130, 2015, 123-135.
[21] Yang, L., M. Xu, and L. Xing, “Exploring the core factors of online purchase decisions by building an E-Commerce network evolution model”, Journal of Retailing and Consumer Services, 64, 2022, 102784.
[22] Kart, Ö., A. Kut, and V. Radevski, “Decision Support System For A Customer Relationship Management Case Study”, International Journal of Informatics and Communication Technology (IJ-ICT), 3, 2014, 88-96.
[23] Bharati, P. and A.J.D.s.s. Chaudhury, “An empirical investigation of decision-making satisfaction in web-based decision support systems”, Decision Support System, 37(2), 2004, 187-197.
[24] Manivannan, S., “Application of Decision Support System in E-commerce”, Communications of the IBIMA, 15, 2008, 156-169.
[25] Kasper, G.M., “A Theory of Decision Support System Design for User Calibration”, Information Systems Research, 7(2), 1996, 215-232.
[26] Chandra, Y., S. Karya, and M. Hendrawaty, “Decision Support Systems for Customer to Buy Products with an Integration of Reviews and Comments from Marketplace E-Commerce Sites in Indonesia: A Proposed Model”, International Journal on Advanced Science, Engineering and Information Technology, 9(4), 2019, 1171-1176.
[27] Jain, S., A. de Buitléir, and E. Fallon, “A Review of Unstructured Data Analysis and Parsing Methods”, IEEE International Conference on Emerging Smart Computing and Informatics (IEEE – ESCI 2020), Web of Science Journal Publication, 2020.
[28] He, P., et al., “An Evaluation Study on Log Parsing and Its Use in Log Mining”, in 2016 46th Annual IEEE/IFIP International Conference on Dependable Systems and Networks (DSN),
[29] Inmon, W.H. and D. Linstedt, 4 - Unstructured Data, in Data Architecture: a Primer for the Data Scientist, W.H. Inmon and D. Linstedt, Editors, Morgan Kaufmann: Boston, 2015, 63-70.
[30] Alzate, M., M. Arce-Urriza, and J., “Cebollada, Mining the text of online consumer reviews to analyze brand image and brand positioning”, Journal of Retailing and Consumer Services, 67(1), 2022, 102989.
[31] Dahiya, A., N. Gautam, and P. Gautam, “Data Mining Methods and Techniques for Online Customer Review Analysis: A Literature Review”, Journal of System and Management Sciences, 11(3), 2021, 1-26.
[32] Chen, J., et al., “Big data challenge: A data management perspective”, Frontiers of Computer Science, 7, 2013, 157-164.
[33] Liu, B., Web data mining: exploring hyperlinks, contents, and usage data, Springer, 1, 2011.
[34] Archak, N., A. Ghose, and P. Ipeirotis, Deriving the Pricing Power of Product Features by Mining Consumer Reviews, NET Institute, Working Papers, 57, 2007.
[35] Decker, R. and M.J.I.J.o.R.i.M. Trusov, “Estimating aggregate consumer preferences from online product reviews”, International Journal of Research in Marketing, 27(4), 2010, 293-307.
[36] Cai, Y., et al., “A deep recommendation model of cross-grained sentiments of user reviews and ratings”, Information Processing & Management, 59(2), 2022, 102842.
[37] Li, M., et al., “Helpfulness of Online Product Reviews as Seen by Consumers: Source and Content Features”, International Journal of Electronic Commerce, 17, 2013, 101-136.
[38] Tirunillai, S. and G. Tellis, “Does Online Chatter Really Matter? Dynamics of User-Generated Content and Stock Performance”, Marketing Science, 31(2), 2011, 198-215.
[39] Floyd, K., et al., “How Online Product Reviews Affect Retail Sales: A Meta-analysis”, Journal of Retailing, 90(2), 2014, 217-232.
[40] East, R., K. Hammond, and W. Lomax, “Measuring the impact of positive and negative word of mouth on brand purchase probability”, International Journal of Research in Marketing, 25(3), 2008, 215-224.
[41] Lutfullaeva, M., et al., “Optimization of Sentiment Analysis Methods for classifying text comments of bank customers”, IFAC-PapersOnLine, 51(32), 2018, 55-60.
[42] Morinaga, S., et al., “Mining product reputations on the Web”, Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining, 2002, 341-349.
[43] Cruz, F.L., et al., “Building layered, multilingual sentiment lexicons at synset and lemma levels”, Expert Systems with Applications, 41(13), 2014, 5984-5994.
[44] Bakshi, R.K., et al., “Opinion mining and sentiment analysis”, 2016 3rd international conference on computing for sustainable global development (INDIACom), IEEE, 2016.
[45] Gensler, S., et al., “Listen to Your Customers: Insights into Brand Image Using Online Consumer-Generated Product Reviews”, International Journal of Electronic Commerce, 20, 2016, 112-141.
[46] Heilig, L., R. Stahlbock, and S. Voss, From Digitalization to Data-Driven Decision Making in Container Terminals, Handbook of Terminal Planning, Springer, 2019, 125-154.
[47] Arroyo-Fernández, I., Méndez-Cruz, C.-F., Sierra, G., Torres-Moreno, J.-M., & Sidorov, G., “Unsupervised sentence representations as word information series: Revisiting TF–IDF”, Computer Speech & Language, 56, 2019, 107-129.
[48] Lê Triệu Tuấn & Đàm Thị Phương Thảo, “Phương pháp phân loại dữ liệu bình luận của khách hàng trực tuyến Việt Nam dựa vào học máy có giám sát”, Khoa học & Công nghệ, 58(1), 2022, 49-52.
[49] Anh, V., “Underthesea document”, Under the sea, 2018, [Online] Available: https://underthesea.readthedocs.io, 02/10/2022.
[50] Arroyo-Fernández, I., Méndez-Cruz, C.-F., Sierra, G., Torres-Moreno, J.-M., & Sidorov, G., “Unsupervised sentence representations as word information series: Revisiting TF–IDF”, Computer Speech & Language, 56, 2019, 107-129.
[51] Kulkarni, A., D. Chong, and F.A. Batarseh, 5 - Foundations of data imbalance and solutions for a data democracy, in Data Democracy, F.A. Batarseh and R. Yang, Editors, Academic Press, 2020, 83-106.
[52] Sharma, D. K., Lohana, S., Arora, S., Dixit, A., Tiwari, M., & Tiwari, T., “E-Commerce product comparison portal for classification of customer data based on data mining”, Materials Today: Proceedings, 51, 2022, 166-171.