Trong hơn một thập kỷ qua, Việt Nam là một trong các quốc gia có tốc độ tăng trưởng về sử dụng Internet, dịch vụ viễn thông và mạng xã hội nhanh nhất trong khu vực và Châu Á. Tính đến hiện tại, Việt Nam có khoảng 69 triệu người dùng Internet, chiếm hơn 70% dân số, và hầu hết người dùng tham gia ít nhất một trong những mạng xã hội và dịch vụ trực tuyến như Facebook, Tiktok, Instagram, Youtube, Zalo. Trong đó, có khoảng 50 triệu tài khoản người dùng Facebook hoạt động mỗi tháng. Cùng với làn sóng số hoá và chuyển đổi số mạnh mẽ, không chỉ các lĩnh thương mại, quảng cáo mà các dịch vụ truyền thống như ngân hàng, bảo hiểm, bán lẻ, giáo dục, y tế, v.v. cũng đã xem giao tiếp trực tuyến là kênh giao dịch quan trọng với người dùng và khách hàng.
Nhận diện chân dung khách hàng trong thời đại số
Ngày nay các ứng dụng, dịch vụ online ở các lĩnh vực kinh doanh khác nhau hoạt động và phát triển một cách vừa cạnh tranh và vừa cộng sinh. Giao dịch mua bán theo hình thức hoàn toàn trực tuyến hoặc theo hình thức online-to-offline (O2O) xuất phát từ các kênh Facebook, Tiktok, Youtube, Zalo, v.v. đã trở nên hết sức phổ biến. Hành trình của khách hàng từ điểm tiếp xúc đầu tiên cho đến lúc thực hiện giao dịch không còn đơn thuần diễn ra trong địa phận riêng của mỗi doanh nghiệp mà có thể đi xuyên qua các ứng dụng, dịch vụ thuộc các lĩnh vực khác nhau. Vì thế, mỗi doanh nghiệp dù vẫn sở hữu dữ liệu riêng về hồ sơ, hoạt động của người dùng và khách hàng, họ có thể không còn sở hữu toàn bộ dữ liệu về hành trình và phễu khách hàng như theo cách marketing truyền thống trước đây. Điều này ngăn trở mỗi doanh nghiệp nắm bắt đầy đủ những chỉ dấu, những thông tin về hoạt động, hành vi của người dùng để từ đó có thể xây dựng trọn vẹn chân dung và thực sự hiểu rõ khách hàng của mình. Sự kết nối, chia sẻ dữ liệu giữa các dịch vụ, doanh nghiệp gặp nhiều khó khăn do đặc thù kinh doanh khác nhau cũng như thiếu sự liên kết về mặt công nghệ. Thêm vào đó, dù một số lĩnh vực kinh doanh còn dư địa để mở rộng khách hàng, nhiều lĩnh vực đã gần mức bão hoà và việc cạnh tranh nhằm thu hút và giữ chân khách hàng ngày càng trở nên khốc liệt.
Trong bối cảnh đó, nhiều doanh nghiệp đã nhận thức rõ những vấn đề bức thiết xoay quanh thị trường, người dùng và khách hàng. Những câu hỏi cốt tử với mỗi doanh nghiệp vốn không mới giờ đây được đặt lại ở một mức độ cấp thiết và kỳ vọng cao hơn. Đó là làm sao để nhận diện, định vị và mở rộng tập khách hàng tiềm năng một cách hiệu quả? Làm sao để xây dựng được đầy đủ chân dung khách hàng? Làm sao hiểu rõ tính chất, sở thích, và nhu cầu của mỗi khách hàng? Làm sao để hiểu được hành vi và phản ứng của khách hàng trong một phân khúc hoặc lĩnh vực kinh doanh cụ thể nào đó? Làm sao để khuyến nghị những mặt hàng, dịch vụ, nội dung mà khách hàng quan tâm và có thể phát sinh giao dịch? Làm sao để đánh giá hiệu quả giá trị vòng đời của khách hàng? Hay làm sao để giữ chân khách hàng lâu dài? .v.v. Tuy vậy, hầu hết các doanh nghiệp gặp khó khăn khi thực thi do thiếu khuyết dữ liệu về khách hàng; do không kết nối được dữ liệu từ các điểm tiếp xúc trên hành trình khách hàng; do không thể hợp nhất và khai thác được từ đa nguồn dữ liệu mà đặc biệt là nguồn dữ liệu mở của các dịch vụ mạng xã hội; do thiếu nguồn lực và năng lực tổ chức và xử lý dữ liệu lớn; và trên thực tế nhiều doanh nghiệp ngoài lĩnh vực công nghệ thông tin thiếu nguồn lực con người cùng khả năng tổ chức nghiên cứu, phát triển các giải pháp phân tích dữ liệu để giải quyết các vấn đề cốt lõi ở trên.
Nghiên cứu khoa học để hiểu khách hàng – một cách tiếp cận mới
Nhận diện được tiềm năng, cơ hội triển khai ứng dụng thực tế, dự án Nghiên cứu và phát triển nền tảng tự động phân tích và hiểu khách hàng ứng dụng trong bán lẻ, thương mại điện tử và quảng cáo trực tuyến – do Quỹ Đổi mới sáng tạo Vingroup (VinIF) thuộc Viện Nghiên cứu Dữ liệu lớn (Bigdata Institute), Tập đoàn Vingroup tài trợ với tổng kinh phí 10 tỷ đồng – đặt mục tiêu nghiên cứu, phát triển các giải pháp công nghệ phân tích dữ liệu lớn nhằm giải quyết các vấn đề bức thiết xoay quanh thị trường, người dùng và khách hàng nói trên tại các doanh nghiệp. Đến nay, dự án đã hoàn thành đầy đủ mục tiêu và các nội dung nghiên cứu và đã được Quỹ VinIF đánh giá, nghiệm thu thành công.
Nhóm dự án đã nghiên cứu, phát triển và đóng gói thành công hai sản phẩm công nghệ chủ lực gồm DSMiner và DSWatcher với các tính năng quan trọng nhằm trả lời những câu hỏi và giải quyết những vấn đề trọng tâm về khách hàng và thị trường đề cập ở trên. Cụ thể hơn, dự án đã hợp nhất được nhiều nguồn dữ liệu lớn từ dữ liệu doanh nghiệp ở nhiều lĩnh vực (ngân hàng, bảo hiểm, viễn thông, bán lẻ, thương mại điện tử, v.v.) cho đến dữ liệu mở từ mạng xã hội. Các tính năng phân tích dữ liệu nâng cao giúp suy diễn những thông tin thiếu khuyết, làm giàu hồ sơ khách hàng để từ đó có thể xây dựng đầy đủ hơn chân dung của mỗi khách hàng. Dựa trên thông tin nhân khẩu học đã được làm giàu và dữ liệu hành vi được kết nối từ các điểm tiếp xúc trên hành trình khách hàng, hệ thống có thể phân đoạn khách hàng; phát hiện mối quan tâm và ý định mua sắm; gợi ý sản phẩm kế tiếp; gợi ý bán kèm, bán chéo, bán gia tăng, v.v. Các giải pháp công nghệ hướng đến giải quyết các vấn đề trên toàn bộ hành trình bao gồm trước, trong và sau khi giao dịch của khách hàng. Cụ thể, hệ thống trang bị các tính năng làm giàu và mở rộng tập khách hàng tiềm năng; phân tích và ước lượng giá trị vòng đời (liên quan đến lợi nhuận) của khách hàng; và xa hơn là phân tích những ý kiến phản hồi cũng như khả năng rời dịch vụ của khách hàng. Về mặt thị trường, hệ thống cho phép phân tích quan điểm của người dùng, khách hàng; nghiên cứu thị trường của đối thủ cạnh tranh; và thậm chí đo đạc và quản lý thương hiệu trực tuyến.
Các giải pháp và sản phẩm công nghệ (DSMiner, DSWatcher) của dự án đã được triển khai ứng dụng thí điểm ở hơn 30 tổ chức, doanh nghiệp thuộc nhiều lĩnh vực như ngân hàng, bảo hiểm, viễn thông, giáo dục, bán lẻ, thương mại điện tử, v.v. Kết quả thí điểm cho thấy sự hiệu quả của các giải pháp trong việc nâng cao trải nghiệm quản lý khách hàng cũng như thúc đẩy hiệu quả kinh doanh dựa trên việc phân tích và hiểu rõ hơn về khách hàng. Tại mỗi đơn vị, dự án triển khai theo mô hình phù hợp với tính chất của lĩnh vực kinh doanh cũng như đảm bảo tối đa việc bảo vệ tính riêng tư của dữ liệu và an toàn thông tin khách hàng của doanh nghiệp.
Dữ liệu và tổ chức dữ liệu
Nếu như khách hàng là trung tâm của các bài toán kinh doanh, thì dữ liệu là cơ sở cho sự thấu hiểu được chân dung, nhu cầu của họ. Như đã trình bày ở trên, dự án hướng tới thu thập, xử lý và phân tích một cách đầy đủ nhất bức tranh tổng thể về dữ liệu liên quan tới các điểm tiếp xúc trên hành trình trải nghiệm của từng khách hàng từ đa nguồn dữ liệu đảm bảo các yếu tố về tính tin cậy và bảo mật. Cụ thể, hai nguồn dữ liệu chính được xem xét bao gồm: dữ liệu nguồn mở mạng xã hội và dữ liệu vận hành doanh nghiệp. Việc khai thác dữ liệu nội tại đặc thù của doanh nghiệp giúp định hình thói quen, sở thích và hành vi của từng khách hàng trong giai đoạn “trong” và “sau” khi phát sinh giao dịch. Trong khi đó, việc khai thác dữ liệu nguồn mở mạng xã hội bên cạnh tạo ra khả năng hỗ trợ đánh giá, xác định được tập khách hàng tiềm năng trong giai đoạn “trước khi” phát sinh giao dịch, mà còn có khả năng làm giàu các thông tin bổ trợ phục vụ cho các tác vụ phân tích chuyên sâu về khách hàng ở những giai đoạn sau.
Để khai thác được những nguồn dữ liệu này một cách hiệu quả, dữ liệu được tổ chức theo hai nhóm mô hình chính. Một là mô hình dữ liệu thông tin khách hàng, bao gồm thông tin nhân khẩu được khách hàng khai báo như tuổi, giới tính, nghề nghiệp, tình trạng hôn nhân, thông tin về nhóm của khách hàng trong dữ liệu doanh nghiệp như VIP, nhóm phổ thông, v.v.; các dữ liệu này sẽ qua các bước làm sạch, chuẩn hóa, tích hợp từ nhiều nguồn dữ liệu khác nhau sau khi được kiểm chứng sử dụng nhiều phương pháp hệ thống như kiểm tra chéo, lựa chọn theo các nguồn tin cậy. Những phần dữ liệu thiếu khuyết về thông tin khách hàng có thể được đoán nhận, suy diễn thông qua các mô hình phân tích dữ liệu được trình bày trong phần tiếp theo. Hai là mô hình dữ liệu hành vi khách hàng, bao gồm thông tin mang tính thời gian được hình thành từ quá trình tương tác của khách hàng với các dịch vụ, nội dung, sản phẩm của doanh nghiệp, cùng với các tín hiệu hành vi tương tác khác được thu thập từ các nguồn mở mạng xã hội.
Vấn đề đặt ra tiếp theo là làm thế nào để phân tích, dự đoán trên nhiều quy mô, mức độ? Giải pháp mà dự án đưa ra là việc xây dựng một nền tảng hạ tầng dữ liệu lớn theo kiến trúc hồ dữ liệu. Đây là kiến trúc phổ biến được nhiều công ty, tổ chức lớn trên thế giới và Việt Nam triển khai như Amazon, Microsoft, Viettel, Mobifone, v.v. Ưu điểm của kiến trúc này là tạo nên một kho dữ liệu cả thô lẫn tinh với quy mô lớn kết hợp sự linh hoạt trong tích hợp và khai thác các công nghệ tiên tiến về thu thập (Apache Kafka), xử lý (HDFS, Elastic search), phân tích và thuật toán học máy chạy trên trên mô hình phân tán (Apache Spark, Tensorflow) cũng như các công cụ hỗ trợ sinh báo cáo kinh doanh thông minh (Kibana) hay giám sát bảo mật (Apache Knox, Apache Ranger).
Phân tích dữ liệu và hiểu khách hàng
Đích đến của mọi mô hình kinh doanh là tạo ra lợi nhuận thông qua việc cung cấp những dịch vụ, sản phẩm tốt nhất, phù hợp nhất với nhu cầu của khách hàng (Spiegel và cộng sự, 2016). Vậy như thế nào là phù hợp? Câu trả lời cho câu hỏi ngắn gọn như vậy có thể được làm rõ thông qua việc trả lời các câu hỏi ở mức độ chi tiết hơn như: Khách hàng là ai? Khách hàng có sở thích gì, quan tâm gì? Khách hàng đang cần gì? Khách hàng cảm nhận thế nào về sản phẩm, dịch vụ? Khách hàng có khả năng rời dịch vụ không? v.v. Đây chính là vấn đề trọng tâm đặt ra cho mục tiêu phân tích và hiểu khách hàng. Thay vì chỉ giải quyết từng vấn đề riêng lẻ, giải pháp của dự án tiếp cận một cách đồng bộ toàn bộ các vấn đề đó đặt trong một góc nhìn tổng quan về các điểm tiếp xúc và hành vi tương tác xuyên suốt hành trình trải nghiệm của khách hàng. Cụ thể, giải pháp được đề xuất là kết quả của việc nghiên cứu, giải quyết mười bài toán phân tích chi tiết.
Với mục tiêu nhận diện chân dung và nhu cầu của khách hàng trong giai đoạn “trước” khi có tương tác với các dịch vụ của doanh nghiệp. Ba vấn đề chính được xem xét gồm: vấn đề thứ 1 là dự đoán thông tin nhân khẩu học dựa trên hành vi khách hàng; vấn đề thứ 2 là phân đoạn khách hàng dựa trên thông tin nhân khẩu học và hành vi tiêu dùng; vấn đề thứ 3 là dự đoán và phát hiện ý định của khách hàng dựa trên hành vi mạng xã hội. Trong đó, vấn đề đầu tiên xây dựng khả năng suy diễn thông tin nhân khẩu học, chỉ số hồ sơ khách hàng dựa trên nhận dạng những đặc điểm khác biệt trong hành vi của khách hàng đã phát sinh khi tương tác với các dịch vụ mạng xã hội, các hệ thống, ứng dụng. Tương tự, vấn đề thứ hai khai thác thông tin về nhân khẩu học (tuổi, giới tính, tình trạng hôn nhân, v.v.), hoặc hành vi, thói quen tiêu dùng (định mức, tần suất tiêu dùng, v.v.) phục vụ mục tiêu gom các tập khách hàng có các đặc điểm tương tự nhau thành nhóm nhỏ giúp định vị chân dung, phân khúc khách hàng (He và cộng sự, 2010). Đặt giả thiết rằng khách hàng sẽ sử dụng mạng xã hội như một kênh bày tỏ suy nghĩ và sở thích cá nhân, vấn đề thứ ba là tập trung phân loại các nội dung mà họ đã tạo ra hoặc tương tác trong khi sử dụng mạng xã hội (Jang và cộng sự, 2020). Điều này có ý nghĩa rất quan trọng trong việc xác định mong muốn, ý định hoặc chủ đề mà họ đang quan tâm. Nói một cách khác, đây chính là bài toán tìm kiếm khách hàng tiềm năng.
Tiếp đó, các vấn đề liên quan tới việc hiểu ý định và sở thích của khách hàng “trong” khi tương tác với các hệ thống được nghiên cứu, đánh giá bao gồm: vấn đề thứ 4 là gợi ý sản phẩm kế tiếp dựa trên chuỗi hành vi của khách hàng; vấn đề thứ 5 là gợi ý sản phẩm bán kèm, bán chéo; vấn đề số sáu là phân tích giỏ hàng. Đối với vấn đề thứ 4, đây là bài toán ứng dụng với mục tiêu thay đổi cách thức bán, tiếp thị sản phẩm “bị động” – khách hàng tự tìm kiếm sản phẩm mong muốn, sang cách thức “chủ động” – giới thiệu cho khách hàng sản phẩm họ có thể mua. Dựa trên việc mô hình hóa lịch sử hành vi tương tác của khách hàng trong quá khứ, mô hình đưa ra sự gợi ý sản phẩm mà họ có khả năng quan tâm cao trong lần giao dịch tiếp theo (Le và cộng sự, 2019). Tương tự vậy, vấn đề thứ 5 dựa trên quan sát rằng mỗi một phiên giao dịch thương mại điện tử, bán lẻ, khách hàng thường có xu hướng mua một vài sản phẩm cùng lúc. Vậy cơ sở của việc mua cùng này là gì? Phân tích định lượng cho thấy rằng ngoài ảnh hưởng bởi sở thích cá nhân, các sản phẩm được mua kèm, mua đồng thời do chúng có các mối quan hệ nội tại mang tính tự nhiên như tính chất tương hỗ hoặc kết hợp (Tarus và cộng sự, 2018); ví dụ, điện thoại thường được mua kèm với ốp lưng và miếng bảo vệ màn hình. Với cùng mục tiêu, vấn đề thứ 6 hướng tới phân tích tính chất kết hợp (Deng và cộng sự, 2015], đồng xuất hiện của hai sản phẩm trong các giao dịch của khách hàng. Những sự kết hợp phổ biến và có độ tin cậy cao có thể sử dụng để phục vụ bài toán gợi ý sản phẩm kế tiếp cho khách hàng khi biết rằng họ đã chọn hay mua một vài sản phẩm trước đó.
Cuối cùng, nhằm đánh giá những phản hồi và khả năng rời dịch vụ của khách hàng ở giai đoạn “sau” khi phát sinh giao dịch, dự án tập trung vào các vấn đề: vấn đề thứ 7 – phân tích mức độ hài lòng của khách hàng; vấn đề thứ 8 – phân tích quan điểm của khách hàng;vấn đề thứ 9 – phân tích giá trị vòng đời của khách hàng và vấn đề thứ 10 – phân tích khả năng rời dịch vụ của khách hàng. Đối với vấn đề số 7, dựa trên thông tin phản hồi của khách hàng, giải pháp hướng tới khai thác các mẫu ngữ nghĩa trong nội dung phản hồi nhằm xác định được mức độ hài lòng/không hài lòng của khách hàng sử dụng phương pháp PhoBERT (Nguyen và cộng sự, 2020). Cũng như vậy, vấn đề số 8 phân tích sâu hơn quan điểm, thái độ của khách hàng theo mức độ từng khía cạnh, dịch vụ. Việc thấu hiểu suy nghĩ của khách hàng giúp đưa ra những chiến lược phù hợp, kịp thời trong việc chăm sóc khách hàng. Trong khi đó, vấn đề thứ 9 hướng tới việc phân tích, dự đoán tiềm năng tiêu dùng của một khách hàng thông qua dự đoán số lượng và giá trị giao dịch của một khách hàng trong tuần, tháng sắp tới dựa trên lịch sử tiêu dùng trong quá khứ của họ (Wen và cộng sự, 2018). Biết được tiềm năng của khách hàng sẽ giúp điều chỉnh các chiến lược gợi ý, phân phối sản phẩm. Vấn đề số 10 cuối cùng tập trung đánh giá khả năng một khách hàng không tiếp tục sử dụng sản phẩm, dịch vụ nào đó của doanh nghiệp. Cơ sở giải quyết bài toán là việc phân tích các dữ liệu về hành vi tương tác (tần suất, thói quen) hoặc mức độ hài lòng, quan điểm của khách hàng trên những dịch vụ, sản phẩm đã sử dụng trong quá khứ (Ahmad và cộng sự, 2019).
Các mô hình tạo ra từ việc giải quyết các bài toán trên đều cho kết quả khả quan trên nhiều quy mô dữ liệu. Đây chính là các thành phần phân tích cơ sở và sẽ được tích hợp và các sản phẩm công nghệ DSMiner và DSWatcher sẽ mô tả rõ hơn sau đây.
Các sản phẩm công nghệ
Với mục tiêu triển khai đánh giá các giải pháp phân tích và hiểu khách hàng một cách linh hoạt trên nhiều lĩnh vực thực tiễn, dự án tiến hành đóng gói thành công hai sản phẩm công nghệ là DSMiner và DSWatcher. Định hướng này cũng phù hợp với mục tiêu chính của dự án là mong muốn mang khả năng phân tích dữ liệu và hiểu khách hàng phục vụ các bài toán kinh doanh thực tế tại các doanh nghiệp.
Đầu tiên, DSMiner – hệ thống phân tích và thấu hiểu khách hàng – là sản phẩm đóng gói các mô hình tự động phân tích hành vi, thói quen của khách hàng dựa trên các kỹ thuật xử lý dữ liệu lớn, các phương pháp học máy thống kê và học sâu tiên tiến. DSMiner cung cấp một giải pháp toàn diện cho các doanh nghiệp trong bản đồ hành trình khách hàng (customer journey), đồng hành trong các bài toán trải nghiệm khách hàng với doanh nghiệp từ sự tương tác đầu tiên và trong mối quan hệ dài hạn. Với DSMiner, doanh nghiệp có thể xây dựng các phiên bản hướng miền, hướng lĩnh vực cụ thể, tích hợp dữ liệu của khách hàng và bên thứ ba cũng như bổ sung các tính năng, chức năng chuyên biệt.
DSWatcher là giải pháp tự động thu thập và phân tích tín hiệu dữ liệu của người dùng/khách hàng từ nhiều nguồn dữ liệu khác nhau như mạng xã hội, diễn đàn, blog, báo chí, Youtube, v.v. Từ đó, DSWatcher giúp doanh nghiệp hiểu được phản ứng của thị trường, hiểu được ý định của khách hàng, đánh giá hiệu quả chiến dịch truyền thông, quản lý thương hiệu cũng như phân tích và cảnh báo sớm khủng hoảng truyền thông. Với DSWatcher, có thể xây dựng các phiên bản hướng miền, hướng lĩnh vực cụ thể, tích hợp dữ liệu của khách hàng và bên thứ ba cũng như bổ sung các tính năng, chức năng chuyên biệt.
Ngay từ những ngày đầu triển khai, dự án đã đặt mục tiêu cao trong việc tiếp cận trực tiếp hoặc gián tiếp các đơn vị, doanh nghiệp là khách hàng tiềm năng. Một mặt dự án đánh giá hiệu quả các mô hình phân tích và công nghệ đã nghiên cứu nghiên cứu, phát triển, mặt khác dự án xem xét khả năng mở rộng và chuyển giao, thương mại hóa của hai sản phẩm đã đóng gói DSMiner và DSWatcher. Với định hướng trên, dự án đã tiếp xúc gần 70 doanh nghiệp là đối tác tiềm năng thuộc các lĩnh vực khác nhau như ngân hàng, bảo hiểm, giáo dục, viễn thông, bán lẻ, thương mại điện tử, v.v., và đã triển khai ứng dụng thử nghiệm thực tế với hơn 40 doanh nghiệp, đơn vị trong đó. Song song với nhiệm vụ phân tích và hiểu dữ liệu khách hàng, dự án đã đề xuất phương thức triển khai thực tế để đảm bảo an ninh, an toàn dữ liệu tại các doanh nghiệp. Các phản hồi tích cực thông qua các kết quả triển khai thử nghiệm tại các đối tác này cho thấy tính hiệu quả và tiềm năng ứng dụng của giải pháp phân tích và hiểu khách hàng mà dự án nghiên cứu, xây dựng trong việc triển khai, giải quyết các bài toán kinh doanh thực tế.
Tác giả: PGS.TS. Phan Xuân Hiếu, TS. Trần Mai Vũ, TS. Lê Đức Trọng, TS. Lê Hoàng Quỳnh – Trường ĐH Công nghệ, ĐHQG Hà Nội.
Biên tập: Quỹ đổi mới sáng tạo Vingroup (VinIF).
Tài liệu tham khảo
1. [He et al., 2010] He, X., Cai, D., Shao, Y., Bao, H., & Han, J. (2010). Laplacian regularized gaussian mixture model for data clustering. IEEE Transactions on Knowledge and Data Engineering, 23(9), 1406-1418.
2. [Deng et al., 2015] Deng, L., & Lou, Y. (2015). Improvement and research of FP-growth algorithm based on distributed spark. In 2015 International Conference on Cloud Computing and Big Data (CCBD) (pp. 105-108).
3. [Spiegel et al., 2016] Spiegel, O., Abbassi, P., Zylka, M.P., Schlagwein, D., Fischbach, K., & Schoder, D. (2016). Business model development, founders’ social capital and the success of early stage internet start‐ups: a mixed‐method study. Information Systems Journal, 26, 421 – 449.
4. [Tarus et al., 2018] Tarus, J. K., Niu, Z., & Mustafa, G. (2018). Knowledge-based recommendation: a review of ontology-based recommender systems for e-learning. Artificial intelligence review, 50(1), 21-48
5. [Wen et al., 2018] Wen, Y. T., Yeh, P. W., Tsai, T. H., Peng, W. C., & Shuai, H. H. (2018, February). Customer purchase behavior prediction from payment datasets. In Proceedings of the Eleventh ACM International Conference on Web Search and Data Mining (pp. 628-636).
6. [Ahmad et al., 2019] Ahmad, A. K., Jafar, A., & Aljoumaa, K. (2019). Customer churn prediction in telecom using machine learning in big data platforms. Journal of Big Data, 6(1), 1-24.
7. [Le et al., 2019] Le, D. T., Lauw, H. W., & Fang, Y. (2019). Correlation-sensitive next-basket recommendation. In Proceedings of the 28th International Joint Conference on Artificial Intelligence (pp. 2808-2814).
8. [Jang et al., 2020] Jang, B., Kim, M., Harerimana, G., Kang, S. U., & Kim, J. W. (2020). Bi-LSTM model to increase accuracy in text classification: Combining Word2vec CNN and attention mechanism. Applied Sciences, 10(17), 5841.
9. [Nguyen et al., 2020] Nguyen, D. Q., & Nguyen, A. T. (2020, November). PhoBERT: Pre-trained language models for Vietnamese. In Findings of the Association for Computational Linguistics: EMNLP 2020 (pp. 1037-1042).