Đánh giá mô hình dự báo – Galit Shmueli, Marko Sarstedt, Joseph F. Hair, Jun-Hwa Cheah, Hiram Ting, Santha Vaithilingam, & Christian M. Ringle

Trong nghiên cứu hàn lâm và quản trị tiếp thị, một mô hình có khả năng “giải thích” hoàn hảo dữ liệu trong quá khứ chưa chắc đã “dự báo” chính xác kết quả thực tế trong tương lai. Để vượt qua điểm mù nguy hiểm này, bài viết dưới đây sẽ cung cấp cho bạn hướng dẫn toàn diện về PLSpredict – tiêu chuẩn vàng giúp đánh giá sức mạnh dự báo ngoài mẫu (out-of-sample) của mô hình phương trình cấu trúc PLS-SEM. Từ nền tảng lý thuyết, quy trình thiết lập hệ thống cho đến các diễn giải quản trị thực tiễn, đây chính là cẩm nang bắt buộc phải có để các nhà nghiên cứu bảo vệ tính chặt chẽ và giá trị thực chứng cho công trình khoa học của mình.

Đánh giá mô hình dự báo - Galit Shmueli, Marko Sarstedt, Joseph F. Hair, Jun-Hwa Cheah, Hiram Ting, Santha Vaithilingam, & Christian M. Ringle

1. Tổng Quan & Lý Thuyết Nền Tảng (Overview & Theoretical Foundations)

1.1 Thông tin định danh bài báo

  • Tiêu đề gốc: Predictive model assessment in PLS-SEM: guidelines for using PLSpredict
  • Tiêu đề tiếng Việt: Đánh giá mô hình dự báo trong PLS-SEM: Hướng dẫn sử dụng PLSpredict
  • Tác giả: Galit Shmueli, Marko Sarstedt, Joseph F. Hair, Jun-Hwa Cheah, Hiram Ting, Santha Vaithilingam và Christian M. Ringle
  • Tạp chí: European Journal of Marketing (2019)

1.2 Tóm Tắt Khái Quát (Abstract)

  • Mục đích: Bình phương tối thiểu riêng phần (PLS) là phương pháp “dự báo – nhân quả”, giúp vượt qua sự phân đôi rõ ràng giữa giải thích và dự báo trong mô hình phương trình cấu trúc (SEM). PLSpredict được đề xuất để đánh giá tính chính xác của dự báo ở cấp độ trường hợp (case-level) trên một biến quan sát hoặc một cấu trúc, dựa trên mẫu giữ lại (holdout sample).
  • Kết quả: Bài báo nâng cấp quy trình PLSpredict, cung cấp hướng dẫn chi tiết về cách sử dụng, đồng thời khẳng định đây là cách tiếp cận hữu ích, đơn giản và bắt buộc phải có để đánh giá khả năng dự báo ngoài mẫu (out-of-sample) của các mô hình đường dẫn PLS. Các nhà nghiên cứu khoa học được khuyến cáo nên thường xuyên xem xét việc đánh giá sức mạnh dự báo của mô hình.
  • Hạn chế & Ý nghĩa: Bài viết đặt nền móng vững chắc, cung cấp tiêu chuẩn diễn giải kết quả PLS-SEM để bảo vệ tính chặt chẽ của các nghiên cứu tiếp thị. Đồng thời, nghiên cứu gợi mở hướng đi trong tương lai về việc phát triển thêm các tiêu chuẩn so sánh (benchmarks) và đối chiếu thực nghiệm giữa các cách tiếp cận tiền đề sớm nhất (earliest antecedent) và tiền đề trực tiếp (direct antecedent).

1.3 Bối cảnh thực tiễn & Khoảng trống nghiên cứu

  • Lịch sử cho thấy, các nhà nghiên cứu tiếp thị thường tập trung vào mô hình hóa giải thích nhằm kiểm tra hệ số nhân quả có ý nghĩa và đúng hướng giả thuyết hay không, thay vì kiểm tra khả năng dự báo các trường hợp mới của mô hình. Điều này đi ngược lại với thực tế quản trị, nơi khả năng dự đoán chính xác kết quả của các hành động marketing đóng vai trò then chốt (Steenkamp và Baumgartner, 2000).
  • Sự khác biệt với CB-SEM: Trái ngược với SEM dựa trên hiệp phương sai (CB-SEM) vốn chỉ thiết kế cho mục đích giải thích, PLS-SEM là phương pháp “dự báo-nhân quả”. Tuy nhiên, một nghịch lý xảy ra là người dùng PLS-SEM lại gần như hoàn toàn dựa vào các thước đo giải thích như hệ số xác định R² (chỉ đánh giá sự phù hợp trong mẫu – in-sample fit) hoặc Q² (sử dụng thủ tục blindfolding – kết hợp giữa dự báo trong mẫu và ngoài mẫu).
  • Thủ tục blindfolding chỉ loại bỏ các điểm dữ liệu đơn lẻ chứ không phải toàn bộ một trường hợp, sau đó thay thế bằng giá trị trung bình để tính toán lại. Do đó, nó không chỉ ra rõ ràng mô hình có thực sự thể hiện sức mạnh dự báo hay không.
  • Việc một mô hình có độ phù hợp tốt trong bối cảnh giải thích không đồng nghĩa với việc nó hoạt động tốt trong dự báo ngoài mẫu. Một mô hình được tối ưu hóa quá mức cho tập dữ liệu hiện tại có thể hoạt động rất kém trong thực tế (Shmueli, 2010). PLSpredict được sinh ra để giải quyết triệt để khoảng trống này.

1.4 Hệ thống Lý thuyết nền tảng (Theoretical Foundations)

  • Cách tiếp cận Nhân quả – Dự đoán (Causal-predictive approach): Dựa trên nền tảng của Jöreskog và Wold (1982), PLS-SEM tối đa hóa phương sai được giải thích của các biến nội sinh được nhúng trong một mô hình nền tảng lý thuyết tốt, đồng thời tạo ra các dự báo ngoài mẫu độ chính xác cao.
  • Lý thuyết Giải thích và Dự đoán (Explanation and prediction theory): Theo Hofman và cộng sự (2017) và Gregor (2006), quá trình giải thích dựa trên dự báo bao hàm cả việc hiểu nguyên nhân nền tảng, thiết lập mô tả cấu trúc lý thuyết và khả năng đưa ra các dự báo có thể kiểm chứng đối với các quan sát mới.
Đánh giá mô hình dự báo - Galit Shmueli, Marko Sarstedt, Joseph F. Hair, Jun-Hwa Cheah, Hiram Ting, Santha Vaithilingam, & Christian M. Ringle

2. Khái Niệm Hóa và Cấu Trúc Khái Niệm (Conceptualization)

Khái niệm cốt lõi trong tài liệu này là sức mạnh dự đoán ngoài mẫu (out-of-sample predictive power) thông qua quy trình PLSpredict do Shmueli và cộng sự (2016) phát triển. Quá trình đánh giá mô hình dự đoán PLS-SEM phụ thuộc chặt chẽ vào việc tách biệt hai thành phần dữ liệu riêng biệt:

  • Mẫu huấn luyện (Training sample): Dữ liệu (một phần của tổng mẫu) được dùng để ước lượng các tham số của mô hình (bao gồm hệ số đường dẫn, trọng số chỉ báo, hệ số tải).
  • Mẫu giữ lại (Holdout sample): Phần dữ liệu còn lại tuyệt đối không được dùng để ước lượng mô hình, đóng vai trò làm thước đo kiểm chứng khách quan. PLSpredict sử dụng các giá trị của biến độc lập trong mẫu này để dự báo biến phụ thuộc. Sự chênh lệch lớn giữa sai số trong mẫu (in-sample) và sai số ngoài mẫu (out-of-sample) cảnh báo hiện tượng quá khớp (over-fitting), dẫn đến khả năng ứng dụng thực tiễn thấp.

3. Quy Trình Cấu Hình PLSpredict & Các Chỉ Số Đo Lường (Scale & Assessment Process)

Để thực hiện đánh giá mô hình dự đoán PLS-SEM, các nhà nghiên cứu cần tuân thủ quy trình kỹ thuật nghiêm ngặt thay vì phát triển thang đo theo cách truyền thống. Yêu cầu tiên quyết là mô hình đo lường phải đạt các chuẩn mực về độ tin cậy và tính hợp lệ (Cronbach’s alpha, AVE, HTMT) trước khi khởi chạy PLSpredict.

3.1 Thiết lập cấu hình hệ thống

  • Chọn số lượng phân nhóm (Folds – k): Khái niệm cốt lõi là xác thực chéo k-fold (k-fold cross-validation), chia toàn bộ dữ liệu thành k nhóm có kích thước bằng nhau. Quy trình sẽ dùng k-1 phần làm mẫu huấn luyện để dự báo phần còn lại (mẫu holdout). Quá trình này lặp lại k lần sao cho mỗi phần đều được dùng làm mẫu holdout đúng một lần. Khuyến nghị thiết lập k=10 theo tiêu chuẩn của các nghiên cứu dự báo, miễn là kích thước mẫu của mỗi fold vẫn đáp ứng yêu cầu kích thước mẫu tối thiểu của mô hình.
  • Chọn số lần lặp lại (Repetitions – r): Đặt r=1 nếu muốn mô phỏng dự báo từ một mô hình duy nhất trên toàn bộ dữ liệu (cách mô hình sẽ thực sự được dùng trong thực tế). Đặt r=10 nếu mục tiêu là tăng độ chính xác của dự đoán bằng cách lấy trung bình các dự báo từ nhiều mô hình được ước lượng, tránh các giải pháp bất thường do phân chia dữ liệu ngẫu nhiên.

3.2 Các chỉ số đo lường sai số dự báo (Prediction Metrics)

Các nhà nghiên cứu cần nắm vững ý nghĩa toán học của 3 chỉ số cốt lõi sau để đánh giá mức độ sai số giữa giá trị thực tế và giá trị dự báo:

  • MAE (Mean Absolute Error – Sai số tuyệt đối trung bình): Đo lường độ lớn trung bình của sai số mà không xét đến hướng (âm hay dương), với tất cả các sai lệch có trọng số bằng nhau. Giá trị này phụ thuộc vào thang đo của biến.
  • MAPE (Mean Absolute Percentage Error – Sai số phần trăm tuyệt đối trung bình): Biểu thị sai số theo tỷ lệ phần trăm (độc lập với thang đo). Tuy nhiên, hạn chế lớn nhất là không xác định được khi biến có giá trị 0 (gây lỗi phép chia cho 0), do đó không thể dùng ở cấp độ điểm tổng hợp (composite scores) vì các điểm này thường tiệm cận 0.
  • RMSE (Root Mean Squared Error – Căn bậc hai sai số toàn phương trung bình): Bình phương sai số trước khi lấy trung bình nên sẽ phạt nặng các sai số lớn. Đây là tiêu chuẩn “mặc định” ưu tiên trong mô hình dự báo. Tuy nhiên, nếu phân phối sai số bị bất đối xứng cao (highly non-symmetric), MAE mới là lựa chọn chuẩn xác và dễ diễn giải hơn.
Đánh giá mô hình dự báo - Galit Shmueli, Marko Sarstedt, Joseph F. Hair, Jun-Hwa Cheah, Hiram Ting, Santha Vaithilingam, & Christian M. Ringle

4. Thang Đo Lường Chính Thức (Measurement Scale)

Dưới đây là thang đo thực nghiệm được bài báo trích xuất từ mô hình ý định mua chuyến du lịch trực tuyến của Amaro và Duarte (2015). Thang đo sử dụng Likert 7 điểm, đã trải qua quá trình tiền kiểm tra (pre-test) kỹ lưỡng.

Biến (Construct)Mã (Item)Tiếng Anh (Original Text)Tiếng Việt (Vietnamese Translation)
Thái độ (Attitude)attOnline journey shopping is a good ideaMua chuyến đi trực tuyến là một ý tưởng hay
Tính truyền thông (Communicability)comm1I have heard about people booking journeys online many times.Tôi từng nghe nhiều người đặt chuyến đi trực tuyến
comm2Many friends have purchased journeys online.Nhiều bạn bè đã mua chuyến đi trực tuyến
comm3It is common for people to purchase journeys online.Mọi người mua chuyến đi trực tuyến là chuyện phổ biến
Sự thuận tiện (Convenience)conv1Purchasing journeys online makes me less dependent of opening hours.Giúp tôi ít phụ thuộc vào giờ mở cửa
conv2Purchasing journeys online has easy payment procedures.Quy trình thanh toán dễ dàng
conv3Purchasing journeys online is more convenient than regular shopping, as I can do it anytime and anywhere.Thuận tiện hơn vì có thể mua bất cứ lúc nào, ở đâu
Tiết kiệm thời gian (Time saving)ts1Purchasing journeys online enables me to complete my shopping quickly.Hoàn thành việc mua sắm nhanh chóng
ts2I can save time by purchasing journeys online.Tôi có thể tiết kiệm thời gian
ts3Purchasing travel online takes less time than purchasing them at travel agencies.Tốn ít thời gian hơn so với mua ở đại lý
Lợi ích tài chính (Financial advantages)fa1I save money by purchasing journeys online.Tôi tiết kiệm tiền
fa2Online journey shopping provides more discounts than offline travel purchasing.Cung cấp nhiều giảm giá hơn
fa3Generally, travel websites offer tourism products at cheaper prices.Nhìn chung các trang web có giá rẻ hơn
Đa dạng sản phẩm (Product variety)pv1There is a larger choice of travel products available when purchasing online.Lựa chọn lớn hơn
pv2The Internet allows me to purchase travel services that are not available offline.Internet cho phép mua dịch vụ không có ở cửa hàng vật lý
pv3I can design a custom-made trip by purchasing a journey online.Tôi có thể thiết kế chuyến đi tùy chỉnh
Sự thú vị (Enjoyment)enjoy1Purchasing journeys online is more exciting than purchasing them offline.Thú vị hơn mua offline
enjoy2I enjoy purchasing journeys online more than purchasing them offline.Tôi tận hưởng việc mua trực tuyến hơn
Niềm tin (Trust)trust1The chance of having a technical failure during an online transaction is quite small.Cơ hội lỗi kỹ thuật rất nhỏ
trust2I believe most e-commerce travel websites will do their outmost to benefit customers.Tôi tin hầu hết web du lịch sẽ mang lại lợi ích cao nhất cho khách hàng
trust3I believe online travel sites are trustworthy.Tôi tin các trang web đáng tin cậy
trust4Internet shopping is reliable.Mua sắm internet là đáng tin cậy
trust5Internet shopping can be trusted and there are no uncertainties.Mua sắm internet có thể tin tưởng và không có sự không chắc chắn
Ý định mua (Intention to purchase)ipto1If you were to purchase journeys the probability that you will purchase them online is high.Khả năng tôi mua trực tuyến là cao
ipto2I expect to purchase journeys online in the near futureTôi mong đợi mua chuyến đi trực tuyến trong tương lai gần

5. Mạng Lưới Quan Hệ Lý Thuyết (Nomological Network)

Được xây dựng dựa trên nền tảng của Thuyết Hành động Hợp lý (Theory of Reasoned Action – Ajzen và Fishbein, 1980), cấu trúc mô hình áp dụng trong bài nghiên cứu định hình mạng lưới như sau:

  • Tiền tố (Antecedents): Bao gồm 5 cấu trúc định hình lợi thế tương đối của việc mua sắm du lịch trực tuyến: Sự thuận tiện (CONV), Tiết kiệm thời gian (TS), Lợi ích tài chính (FA), Đa dạng sản phẩm (PV), và Sự thú vị (ENJOY).
  • Biến trung gian (Mediators): Niềm tin (TRUST), Tính truyền thông (COMM), và Thái độ (ATT) đóng vai trò chuyển tiếp tác động từ các tiền đề sơ khởi.
  • Hậu tố (Consequences): Mô hình tác động đến kết quả cuối cùng – cấu trúc mục tiêu cốt lõi là Ý định mua chuyến đi trực tuyến (IPTO).

6. Thực Chứng Nghiên Cứu: Mô Hình Ý Định Mua Chuyến Du Lịch (Empirical Example)

Để minh họa, bài báo tiến hành thu thập dữ liệu qua khảo sát trực tuyến và áp dụng quy trình PLSpredict nhằm đánh giá sức mạnh dự báo.

6.1 Thiết kế nghiên cứu & Đặc điểm nhân khẩu học

Nghiên cứu thu thập dữ liệu từ người mua chuyến đi trực tuyến tại Malaysia. Từ 385 phản hồi ban đầu, nhóm tác giả đã loại bỏ 35 mẫu do trả lời theo đường thẳng (straight-lining), giữ lại 350 phản hồi hợp lệ để phân tích.

Bảng Thống Kê Nhân Khẩu Học (Demographics Table):

Biến nhân khẩu họcDanh mụcTần suấtTỷ lệ (%)
Giới tínhNam14340.9
Nữ20759.1
Dân tộcMalay22163.1
Hoa8624.6
Ấn205.7
Khác236.6
Độ tuổi21-30 tuổi19254.9
31-40 tuổi12034.3
41-50 tuổi277.7
51-60 tuổi113.1
Thu nhập (RM)Dưới 3,00015343.7
3,001 – 4,0006919.7
4,001 – 5,000318.9
5,001 – 6,000329.1
Trên 6,0016518.6
Tần suất muaHàng năm23065.7
Nửa năm6819.4
Hàng quý3510.0
Hàng tháng174.9
Mục đíchChuyến đi gia đình23366.6
Bạn bè6618.9
Công tác339.4
Tuần trăng mật185.1

6.2 Phân tích dữ liệu và So sánh mô hình

  • Trước tiên, mô hình đo lường được xác nhận đạt chuẩn: hệ số tải > 0.708, AVE > 0.5, độ tin cậy > 0.7 và tỷ lệ HTMT < 0.85 (khẳng định giá trị phân biệt). Hệ số VIF < 3.3 cho thấy không có vấn đề cộng tuyến. Tiếp theo, PLSpredict được chạy với 10 folds và 1 repetition.
  • Kết quả dự báo: Phân phối sai số không bất đối xứng cao nên RMSE được sử dụng làm thước đo. Kết quả cho thấy PLS-SEM mang lại sai số RMSE thấp hơn cho tất cả các biến quan sát so với Mô hình hồi quy tuyến tính ngây thơ (LM). Ví dụ: ipto1 của PLS-SEM là 0.983 so với 0.986 của LM; comm1 là 0.896 so với 0.928 của LM. Điều này khẳng định vững chắc rằng mô hình có sức mạnh dự báo cao.
  • So sánh mô hình (Model Comparison): Bài báo tiến hành so sánh Mô hình gốc (Model 1) với hai mô hình thay thế: Mô hình 2 (đơn giản hóa – chỉ ATT tác động trực tiếp đến IPTO) và Mô hình 3 (phức tạp hóa – thêm nhiều biến tác động trực tiếp đến ATT). Dựa trên sai số RMSE ngoài mẫu của điểm số cấu trúc tiềm ẩn, Mô hình 2 (đơn giản nhất) có hiệu suất dự báo xuất sắc nhất đối với biến mục tiêu IPTO (0.177) so với Model 1 (0.321) và Model 3 (0.367). Điều này chứng minh luận điểm của Myung (2000): việc thêm biến để tăng R² có thể xác định các mô hình giả (spurious patterns) trong mẫu hiện tại, gây quá khớp và làm hỏng khả năng dự báo thực tế trên bộ dữ liệu mới.
Đánh giá mô hình dự báo - Galit Shmueli, Marko Sarstedt, Joseph F. Hair, Jun-Hwa Cheah, Hiram Ting, Santha Vaithilingam, & Christian M. Ringle

7. Hướng Dẫn Ứng Dụng Nghiên Cứu (Academic Implications)

Để đánh giá mô hình dự đoán PLS-SEM một cách chuẩn xác, nghiên cứu sinh cần áp dụng bộ quy tắc quyết định (decision rules) theo từng bước sau, tập trung chủ yếu vào biến nội sinh mục tiêu (target construct):

  • Kiểm tra tiêu chuẩn cơ bản (Q²_predict): Phải đảm bảo giá trị này cho tất cả các chỉ báo lớn hơn 0. Nếu Q²_predict ≤ 0, điều đó cho thấy sai số dự báo của PLS-SEM còn kém hơn cả mức trung bình ngây thơ nhất (naïve benchmark) của mẫu huấn luyện, và mô hình thiếu sức mạnh dự báo.
  • Chọn chỉ số đo lường: Kiểm tra biểu đồ phân phối sai số. Sử dụng RMSE làm mặc định, nhưng nếu biểu đồ phân phối bị lệch, bất đối xứng nghiêm trọng, hãy chuyển sang dùng MAE.
  • So sánh với Mô hình Tuyến tính chuẩn (Linear Model – LM):
    • Năng lực dự báo cao: Mức sai số (RMSE/MAE) của PLS-SEM < LM trên tất cả các chỉ báo.
    • Năng lực dự báo trung bình: PLS-SEM < LM trên đa số các chỉ báo.
    • Năng lực dự báo thấp: PLS-SEM < LM trên thiểu số các chỉ báo.
    • Thiếu năng lực dự báo: Không có chỉ báo nào PLS-SEM < LM.
  • Xử lý biến kém chất lượng (Resolving problems): Nếu phát hiện biến có khả năng dự báo thấp, cần phân tích lại phân phối dữ liệu (ví dụ dữ liệu hình chữ U), rà soát kỹ các dữ liệu ngoại lai (outliers) hoặc kiểm tra các hệ số tải trước khi quyết định loại bỏ biến đó. Việc xóa biến phải luôn đi kèm với việc đánh giá lại chất lượng toàn cục của mô hình đo lường.

8. Ứng Dụng Quản Trị Doanh Nghiệp (Managerial Implications)

  • Dưới góc độ quản trị, sức mạnh của một chiến lược marketing phụ thuộc vào khả năng dự báo kết quả của các hành động can thiệp. Việc phân tích chỉ dựa trên khả năng giải thích lý thuyết sẽ gây rủi ro lớn khi áp dụng vào thế giới thực.
  • Tối ưu hóa nguồn lực qua mô hình tinh gọn: Phân tích thực chứng đã nghiên cứu cho thấy Mô hình 2 (đơn giản nhất) mang lại khả năng dự báo (RMSE) tốt nhất. Giám đốc điều hành không nên sa đà vào các mô hình quá phức tạp. Sự phức tạp có thể tăng khả năng giải thích dữ liệu cũ (R²) nhưng lại dễ bị “nhiễu” và thất bại khi đối mặt với tập khách hàng mới. Các mô hình tiết kiệm biến (parsimonious) thường có khả năng khái quát hóa cao hơn.
  • Kiểm định thực tế trước khi ra quyết định: Việc tách biệt mẫu thông qua PLSpredict ở cấp độ tổng hợp (composite) giúp doanh nghiệp đo lường chính xác xem liệu yếu tố “Niềm tin” hay “Giá cả” có thực sự định hướng được hành vi mua hàng ở phân khúc khách hàng hoàn toàn mới hay không. Điều này đóng vai trò như một bài test rủi ro trước khi doanh nghiệp rót ngân sách vào các chiến dịch truyền thông diện rộng.

9. Các Câu Hỏi Thường Gặp (FAQ)

Tại sao không dùng hệ số xác định (R²) để đánh giá mô hình dự đoán PLS-SEM?

Chỉ số R² chỉ phản ánh mức độ phù hợp giải thích trong mẫu (in-sample fit). Nó sử dụng cùng một bộ dữ liệu để vừa ước lượng tham số vừa đo lường độ khít, do đó nó bị định kiến (biased) và không thể cung cấp bằng chứng về việc mô hình sẽ hoạt động hiệu quả trên các quan sát hoàn toàn mới (out-of-sample).

Sự khác biệt cốt lõi giữa Q² (blindfolding) và Q²_predict (PLSpredict) là gì?

Blindfolding chỉ loại bỏ các điểm dữ liệu đơn lẻ (single data points) không đại diện cho một quan sát hoàn chỉnh và thay thế bằng giá trị trung bình để tính toán. Phương pháp này pha trộn giữa dữ liệu trong mẫu và ngoài mẫu. Ngược lại, PLSpredict phân tách hoàn toàn độc lập một nhóm các trường hợp hoàn chỉnh (case-level holdout samples) để đảm bảo quy trình thử nghiệm không hề bị rò rỉ dữ liệu học.

Khi nào nên sử dụng thống kê sai số MAE thay vì RMSE trong PLSpredict?

Theo mặc định, RMSE được ưu tiên. Tuy nhiên, nên sử dụng MAE khi biểu đồ phân phối sai số dự đoán bị bất đối xứng cao (highly non-symmetric). RMSE phạt nặng các sai số lớn do cơ chế bình phương, dẫn đến kết quả đánh giá quá bi quan nếu tập dữ liệu bị lệch hay chứa nhiều điểm ngoại lai. Ngược lại, MAE gán trọng số đều cho mọi sai số, giúp đánh giá khách quan hơn trong trường hợp này.

10. Chú Thích Nghiên Cứu (Research Notes)

Nhà nghiên cứu cần lưu ý các vấn đề kỹ thuật chuyên sâu sau khi thiết lập đánh giá mô hình dự đoán PLS-SEM:

  • Quy trình holdout sample của thuật toán PLSpredict hoàn toàn khác biệt với phương pháp jackknifing (vốn dùng để ước tính độ chệch và phương sai của một thống kê).
  • So sánh mô hình dự báo thường đi trước đánh giá mô hình đo lường; trong nghiên cứu này, nó được sử dụng như một phép kiểm tra tính mạnh mẽ (robustness checks) để xác định độ ổn định của lý thuyết gốc.
  • Phần mềm SmartPLS 3 đã triển khai PLSpredict dựa trên cách tiếp cận Tiền đề sớm nhất (Earliest Antecedent – EA). EA coi các biến trung gian chỉ là biến can thiệp và dự báo dựa trên các tiền đề ngoại sinh ban đầu. Hướng nghiên cứu tương lai cần đối chiếu EA với phương pháp Tiền đề trực tiếp (Direct Antecedents – DA), trong đó DA coi các biến trung gian như cấu trúc ngoại sinh hoàn toàn và bỏ qua các tiền đề phía trước.

11. Tài Liệu Tham Khảo (References)

Danh mục tài liệu này bao gồm các công trình nền tảng và nghiên cứu ứng dụng thực chứng được trích dẫn để xây dựng khung đánh giá:

  • Ajzen, I. and Fishbein, M. (1980), Understanding Attitudes and Predicting Social Behavior, Prentice Hall.
  • Ali, F., Rasoolimanesh, S.M., Sarstedt, M., Ringle, C.M. and Ryu, K. (2018), “An assessment of the use of partial least squares structural equation modeling (PLS-SEM) in hospitality research”, Int. Journal of Contemporary Hospitality Management, 30(1), 514-538 .
  • Amaro, S. and Duarte, P. (2015), “An integrative model of consumers’ intentions to purchase travel online”, Tourism Management, 46, 64-79 . (Ghi chú: Bài báo liệt kê hơn 40 tài liệu tham khảo theo chuẩn định dạng học thuật từ các tác giả như Bentler, Bigné, Burnham, Cameron, Cepeda Carrión, Chica, Chin, Danks, Diamantopoulos, Evermann, Felipe, Franke, Fuchs, Geisser, Geweke, Gregor, Hair, Henseler, Hofman, Homburg, Jöreskog, Kim, Kock, Lehmann, Lohmöller, McQuarrie, Makridakis, Mooi, Musa, Myung, Nau, Oliveira, Pontius, Rasoolimanesh, Reibstein, Rigdon, Ringle, Saayman, Salzberger, Sarstedt, Schwarz, Sethi, Sharma, Shmueli, Steenkamp, Stone, Streukens, Svensson, Teo, Tofallis, Vanwinckelen, Willmott, Witten, Wold . Để giữ tập trung nội dung cốt lõi, tôi đã trích dẫn đầy đủ khung sườn của danh sách này đúng như nguyên bản).

Phụ lục (Appendix)

Các biến quan sát (Measurement items)

  1. Thái độ (ATT): Mua chuyến đi trực tuyến là một ý tưởng hay (att) .
  2. Tính truyền thông (COMM): Tôi từng nghe nhiều người đặt chuyến đi trực tuyến (comm1); Nhiều bạn bè đã mua chuyến đi trực tuyến (comm2); Mọi người mua chuyến đi trực tuyến là chuyện phổ biến (comm3) .
  3. Sự thuận tiện (CONV): Giúp tôi ít phụ thuộc vào giờ mở cửa (conv1); Quy trình thanh toán dễ dàng (conv2); Thuận tiện hơn vì có thể mua bất cứ lúc nào, ở đâu (conv3) .
  4. Tiết kiệm thời gian (TS): Hoàn thành việc mua sắm nhanh chóng (ts1); Tôi có thể tiết kiệm thời gian (ts2); Tốn ít thời gian hơn so với mua ở đại lý (ts3) .
  5. Lợi ích tài chính (FA): Tôi tiết kiệm tiền (fa1); Cung cấp nhiều giảm giá hơn (fa2); Nhìn chung các trang web có giá rẻ hơn (fa3) .
  6. Đa dạng sản phẩm (PV): Lựa chọn lớn hơn (pv1); Internet cho phép mua dịch vụ không có ở cửa hàng vật lý (pv2); Tôi có thể thiết kế chuyến đi tùy chỉnh (pv3) .
  7. Sự thú vị (ENJOY): Thú vị hơn mua offline (enjoy1); Tôi tận hưởng việc mua trực tuyến hơn (enjoy2) .
  8. Niềm tin (TRUST): Cơ hội lỗi kỹ thuật rất nhỏ (trust1); Tôi tin hầu hết web du lịch sẽ mang lại lợi ích cao nhất cho khách hàng (trust2); Tôi tin các trang web đáng tin cậy (trust3); Mua sắm internet là đáng tin cậy (trust4); Mua sắm internet có thể tin tưởng và không có sự không chắc chắn (trust5) .
  9. Ý định mua chuyến đi trực tuyến (IPTO): Khả năng tôi mua trực tuyến là cao (ipto1); Tôi mong đợi mua chuyến đi trực tuyến trong tương lai gần (ipto2) .

Thông tin nhân khẩu học mẫu (Table AI)

  • Giới tính: Nam (40.9%), Nữ (59.1%).
  • Dân tộc: Malay (63.1%), Hoa (24.6%), Ấn (5.7%), Khác (6.6%).
  • Độ tuổi: 21-30 (54.9%), 31-40 (34.3%), 41-50 (7.7%), 51-60 (3.1%).
  • Thu nhập: Dưới RM 3,000 (43.7%), RM3,001-RM4,000 (19.7%), RM4,001-RM5,000 (8.9%), RM5,001-RM6,000 (9.1%), trên RM6,001 (18.6%).
  • Tần suất mua: Hàng năm (65.7%), Nửa năm (19.4%), Hàng quý (10.0%), Hàng tháng (4.9%).
  • Mục đích mua: Chuyến đi gia đình (66.6%), Công tác (9.4%), Tuần trăng mật (5.1%), Chuyến đi cùng bạn bè (18.9%).

(Tham khảo đầy đủ hơn 40 công trình gốc từ các học giả như Bentler, Bigné, Burnham, Cameron, Cepeda Carrión, Chica, Chin, Danks, Diamantopoulos, Evermann, Gregor, Hair, Henseler, Hofman, Jöreskog, Lohmöller, Myung, Rigdon, Sarstedt, Wold… như đã liệt kê chi tiết trong ấn bản chính thức của bài báo).

12. Lời kêu gọi hành động (CTA)

Đánh giá mô hình dự đoán PLS-SEM bằng PLSpredict không chỉ là một công đoạn kỹ thuật thống kê, mà là “bài kiểm tra sinh tử” quyết định giá trị thực tiễn của mọi công trình nghiên cứu. Để thấu hiểu toàn diện về cơ sở toán học và làm chủ quy trình đánh giá mô hình dự báo ngoài mẫu, các nhà nghiên cứu cần trực tiếp tiếp cận tài liệu gốc do các Giáo sư đầu ngành biên soạn. Việc hiểu và ứng dụng chính xác hướng dẫn này sẽ nâng cao tính thực tiễn và độ uy tín học thuật (Topical Authority) cho bài báo khoa học của bạn.

Shmueli, G., Sarstedt, M., Hair, J. F., Cheah, J.-H., Ting, H., Vaithilingam, S., & Ringle, C. M. (2019). Predictive model assessment in PLS-SEM: guidelines for using PLSpredict. European Journal of Marketing, 53(11), 2322-2347.

Lên đầu trang