Lựa Chọn Mô Hình PLS Dựa Trên Tiêu Chí Thông Tin – Pratyush Nidhi Sharma

Khám phá các mô hình thay thế hợp lý về mặt lý thuyết để giải thích hiện tượng đang nghiên cứu là một bước quan trọng trong việc thúc đẩy kiến thức khoa học. Bài viết này ủng hộ việc lựa chọn mô hình PLS trong các nghiên cứu hệ thống thông tin (IS) và đề xuất sử dụng các tiêu chí bắt nguồn từ lý thuyết thông tin. Các tiêu chí này cho phép các nhà nghiên cứu so sánh các mô hình thay thế và chọn ra một cấu trúc tối giản nhưng vẫn phù hợp với dữ liệu.

Tuy nhiên, thực tiễn nghiên cứu IS trước đây cho thấy, việc sử dụng các tiêu chí này — mặc dù phổ biến trong lĩnh vực kinh tế lượng và SEM dựa trên hiệp phương sai (CB-SEM) — vẫn chưa được áp dụng chuẩn xác vào hệ thống PLS. Thông qua kỹ thuật mô phỏng Monte Carlo, nghiên cứu so sánh hiệu suất của nhiều tiêu chí dưới các điều kiện đa dạng (kích thước mẫu, kích thước hiệu ứng, mô hình tải). Kết quả khẳng định: Không thể đạt được việc lựa chọn mô hình phù hợp nếu chỉ dựa vào các tiêu chí PLS truyền thống (R², Adjusted R², GoF và Q²). Thay vào đó, tiêu chí thông tin Bayesian (BIC) và tiêu chí Geweke-Meese (GM) cần được ưu tiên sử dụng. Để tối ưu hóa, bài báo vạch ra quy trình 5 bước nhằm phân định rõ vai trò của lựa chọn mô hình và suy luận thống kê.

Lựa Chọn Mô Hình PLS Dựa Trên Tiêu Chí Thông Tin - Pratyush Nidhi Sharma, Marko Sarstedt, Galit Shmueli, Kevin H. Kim, Kai Oliver Thiele

Nội dung bài viết

1. Tổng Quan & Lý Thuyết Nền Tảng (Overview & Theoretical Foundations)

1.1 Thông tin định danh bài báo

Tiêu đề gốc: PLS-Based Model Selection: The Role of Alternative Explanations in Information Systems Research
Tiêu đề tiếng Việt: Lựa Chọn Mô Hình PLS Dựa Trên Tiêu Chí Thông Tin: Vai Trò Của Các Giải Thích Thay Thế Trong Nghiên Cứu Hệ Thống Thông Tin
Tác giả: Pratyush Nidhi Sharma, Marko Sarstedt, Galit Shmueli, Kevin H. Kim, Kai Oliver Thiele
Tạp chí: Journal of the Association for Information Systems (2019)

1.2 Bối cảnh thực tiễn & Khoảng trống nghiên cứu

Trong nghiên cứu hàn lâm và thực tiễn, chúng ta thường xây dựng các mô hình để giải thích một hiện tượng phức tạp. Tuy nhiên, nhiều nhà nghiên cứu hệ thống thông tin (IS) và marketing chỉ tập trung kiểm định một mô hình duy nhất (Ruling Theory) thay vì đưa ra các giải thích thay thế (Alternative Explanations). Các tiêu chí đánh giá truyền thống như R², GoF hay Q² luôn tăng lên khi mô hình phức tạp hơn. Điều này dẫn đến sai lầm nghiêm trọng là chọn sai mô hình (overfitting) – mô hình chỉ đúng với dữ liệu mẫu hiện tại nhưng mất khả năng tổng quát hóa trên tập dữ liệu khác.

Hermann Wold, cha đẻ của phương pháp PLS, từng nhấn mạnh rằng xây dựng mô hình là một “quá trình tiến hóa” (evolutionary process) đòi hỏi phải so sánh các lựa chọn thay thế. Tuy nhiên, tình trạng lạm dụng chỉ số p-value (p-value hacking) và thói quen chỉ báo cáo kết quả của mô hình có lợi nhất đã làm xói mòn tính khách quan khoa học, tạo ra lỗ hổng lớn về phương pháp luận trong cộng đồng nghiên cứu IS.

1.3 Hệ thống Lý thuyết nền tảng (Theoretical Foundations)

Nghiên cứu này được xây dựng trên nền tảng của Lý thuyết Thông tin (Information Theory) và Triết học Khoa học (Philosophy of Science).

Nguyên tắc cốt lõi là Lưỡi dao Ockham (Occam’s razor): Mô hình tốt nhất là mô hình cân bằng hoàn hảo giữa sự phù hợp dữ liệu (Goodness-of-fit) và sự tối giản (Parsimony). Sự cân bằng này còn được gọi là sự đánh đổi giữa Độ chệch và Phương sai (Bias-Variance Tradeoff).

Lý thuyết Thông tin sử dụng khoảng cách Kullback-Leibler (KL) để đo lường khoảng cách từ một mô hình ứng viên đến mô hình thực tế (True model) chưa biết. Dựa trên lý thuyết này, các tiêu chí được chia làm hai nhóm: Nhất quán tiệm cận (Asymptotically consistent – khả năng chọn đúng mô hình thực khi cỡ mẫu tăng, ví dụ BIC, GM) và Hiệu quả tiệm cận (Asymptotically efficient – khả năng giảm thiểu sai số dự báo, ví dụ AIC, FPE).

1.4 Sự phân mảnh lý thuyết và Vai trò của So sánh mô hình (Theory Fragmentation & Role of Model Comparison)

Các hệ thống kỹ thuật-xã hội vốn dĩ rất phức tạp do các tương tác nhân quả đan xen (Lauenroth, 2003). Các mô hình chỉ là sự tính toán xấp xỉ bằng cách trừu tượng hóa các chi tiết. Sự tồn tại của nhiều lăng kính lý thuyết tạo ra nguy cơ phân mảnh lĩnh vực do “tình cảm ruột thịt” của nhà nghiên cứu đối với một mô hình cụ thể (Chamberlin, 1890; Grover, 2013).

Vai trò của quy trình khoa học là vượt qua thành kiến này bằng cách xác định mô hình xấp xỉ tốt nhất (Purcell, 1992). Như Popper (1959) đã lập luận, việc xem xét các cách giải thích thay thế là một bước bắt buộc trước khi cố gắng “chứng minh sự sai lầm” (falsification) của bất kỳ lý thuyết nào. Việc so sánh mô hình giúp xây dựng cầu nối giữa các luồng nghiên cứu song song, ví dụ như cách Venkatesh và cộng sự (2003) đã so sánh các mô hình thay thế để xây dựng nên thuyết UTAUT.

2. Khái Niệm Hóa và Cấu Trúc Khái Niệm (Conceptualization)

Trong bối cảnh bài báo phương pháp luận này, khái niệm trọng tâm chính là quy trình Lựa chọn mô hình (Model Selection).

Định nghĩa: Lựa chọn mô hình là quá trình so sánh nhiều mô hình ứng viên (được biện luận từ lý thuyết) trên cùng một tập dữ liệu, nhằm tìm ra mô hình giải thích hiện tượng với độ chính xác và tính tối giản cao nhất. Lựa chọn mô hình ưu việt hơn phương pháp Kiểm định Giả thuyết Không (Null Hypothesis Testing) bởi vì nó không yêu cầu các mô hình phải lồng nhau (nested), cũng không bắt buộc phải có một mô hình “sự thật tuyệt đối” tồn tại.
Phân tích cấu trúc: Việc lựa chọn mô hình PLS được đánh giá qua sự đánh đổi giữa Bias (Độ chệch – do thiếu biến) và Variance (Phương sai – do thừa biến). Quy trình này bắt buộc phải tách biệt bước “chọn mô hình” (Model Selection) và bước “suy luận thống kê” (Statistical Inference). Suy luận thống kê chỉ nên được tiến hành trên mô hình đã được xác định là tối ưu nhất.

3. Quy Trình Phát Triển Thang Đo (Scale Development Process)

Thay vì phát triển thang đo Likert thông thường, các tác giả đã sử dụng phương pháp Mô phỏng Monte Carlo (Monte Carlo Simulation) với 27,000 trường hợp (300 lần lặp lại cho 90 điều kiện thử nghiệm) để kiểm tra hiệu suất của các tiêu chí toán học khác nhau.

Quy trình được thực hiện trên 3 kịch bản cốt lõi phản ánh thực tế nghiên cứu khám phá:

Case 1: Mô hình gốc sinh ra dữ liệu có mặt trong danh sách mô hình ứng viên (Tình huống lý tưởng nhất).
Case 2: Mô hình gốc bị loại bỏ khỏi danh sách (Tình huống nhà nghiên cứu bị thiếu sót lý thuyết, không bao gồm mô hình tạo ra dữ liệu vào tập so sánh).
Case 3: Thiếu một biến số ngầm ẩn (Latent variable) trong quá trình thu thập dữ liệu (Đây là kịch bản thực tế và phổ biến nhất, khi nhà nghiên cứu không thể thu thập đủ 100% các biến chi phối hiện tượng).

Dữ liệu được thao tác qua nhiều kích thước mẫu (N = 50, 100, 150, 200, 250, và 500) và độ mạnh của hiệu ứng (Effect size từ 0.1 đến 0.5) cùng các cấu trúc tải (loading patterns) với Phương sai trích xuất trung bình (AVE) ở mức Cao (0.9), Trung bình (0.8) và Thấp (0.7).

4. Thang Đo Lường Chính Thức (Measurement Scale) – Công Cụ Đánh Giá

Dưới đây là các “thang đo” (Tiêu chí thông tin) được dùng để so sánh thay thế cho R². Điểm khác biệt lớn nhất là trong mô hình PLS, quy trình ước lượng không dựa trên Maximum Likelihood. Do đó, việc tính toán bắt buộc phải được chuyển đổi dựa trên tổng bình phương sai số ($inline$SS_{error}$inline$) thu được từ mô hình.

(Công thức tính $inline$SS_{error}$inline$ cho phần mềm phân tích PLS: $inline$SS_{error} = (1 – R^2)(N – 1)$inline$, trong đó N là cỡ mẫu. $inline$MS_{error}$inline$ là trung bình bình phương sai số của mô hình bão hòa – Saturated model).

Tên tiêu chí gốc (Tiếng Anh)	Bản dịch (Tiếng Việt)	Công thức (Formula)	Ý nghĩa thực tiễn
Akaike Information Criterion (AIC)	Tiêu chí thông tin Akaike	$$n \left[ \log\left(\frac{SS_{error_k}}{n}\right) + \frac{2p_k}{n} \right]$$	Ước lượng khoảng cách KL đến mô hình thực. Ưu tiên các mô hình có giá trị AIC thấp nhất.
Corrected AIC (AICc)	Tiêu chí AIC hiệu chỉnh	$$n \left[ \log\left(\frac{SS_{error_k}}{n}\right) + \frac{n+p_k}{n-p_k-2} \right]$$	Sửa lỗi “overfit” (chọn mô hình quá phức tạp) của AIC khi kích thước mẫu nhỏ.
Bayesian Information Criterion (BIC)	Tiêu chí thông tin Bayes	$$n \left[ \log\left(\frac{SS_{error_k}}{n}\right) + \frac{p_k \log(n)}{n} \right]$$	Hình phạt (Penalty) cho độ phức tạp cao hơn AIC. Cực kỳ chính xác trong lựa chọn mô hình PLS.
Geweke-Meese Criterion (GM)	Tiêu chí Geweke-Meese	$$\left(\frac{SS_{error_k}}{MS_{error}}\right) + p_k \log(n)$$	Điều chỉnh Mallow’s $inline$C_p$inline$ bằng hình phạt mạnh tay hơn. Hiệu suất chọn trúng mô hình tốt nhất đạt >97%.
Hannan-Quinn Criterion (HQ)	Tiêu chí Hannan-Quinn	$$n \left[ \log\left(\frac{SS_{error_k}}{n}\right) + \frac{2p_k \log(\log(n))}{n} \right]$$	Điều chỉnh hiệu suất mẫu nhỏ của BIC bằng cách sử dụng thuật ngữ hình phạt mạnh hơn.

(Lưu ý: n là cỡ mẫu, inlinep_kinline là số lượng biến độc lập dự báo biến mục tiêu cộng thêm 1, inlineSS_{error_k}inline là phần dư của mô hình thứ k).

5. Mạng Lưới Quan Hệ Lý Thuyết (Nomological Network)

Trong phương pháp luận này, mạng lưới quan hệ được thể hiện qua tác động nhân quả của việc định chuẩn tiêu chí:

Tiền tố (Antecedents): Việc sử dụng các tiêu chí truyền thống của PLS (như R², GoF) chịu tác động bởi tư duy muốn tối đa hóa phương sai giải thích. Chỉ số R² đo lường cả “sự phù hợp với tín hiệu thực” (Fit to signal) và “sự phù hợp với độ nhiễu” (Fit to noise). Sự gia tăng cơ học số lượng đường dẫn (Paths) sẽ làm tăng các chỉ số này một cách giả tạo do mô hình cố gắng hấp thụ các sai số ngẫu nhiên.
Hậu tố (Consequences): Nếu sử dụng R², kết quả (Hậu tố) là thu được một mô hình quá khớp (Overfitting), triệt tiêu khả năng tổng quát hóa (Generalizability). Ngược lại, nếu thực hiện lựa chọn mô hình PLS bằng tiêu chí nhất quán (BIC, GM), hậu quả logic là xác định được mô hình tối giản, mang lại khả năng tái tạo khoa học và dự báo ngoài mẫu (Out-of-sample prediction) cực kỳ cao.

6. Các Phát Hiện Chính & Hướng Dẫn Ứng Dụng Nghiên Cứu (Key Findings & Academic Implications)

6.1 Các phát hiện cốt lõi từ nghiên cứu (Key Findings)

Nhiệm vụ của nghiên cứu khoa học là mô tả các quá trình kỹ thuật xã hội với độ trung thực và tính kinh tế. Mọi mô hình đều là sự đơn giản hóa của thực tế và không thể phản ánh thực tế một cách toàn vẹn (Burnham & Anderson, 2002). Lợi thế duy nhất mà một mô hình có so với thực tế chính là sự đơn giản của nó (Shugan, 2002).

Từ phân tích Monte Carlo, kết quả chỉ ra sự thật đáng báo động:

Cần tuyệt đối tránh thực tiễn lựa chọn mô hình bằng R², Adjusted R², GoF và Q² vì chúng thể hiện xu hướng thiên vị đối với các mô hình bão hòa (chứa quá nhiều biến) hoặc chọn sai mô hình cấu trúc. Thống kê cho thấy chỉ số GoF hoạt động tệ nhất với tỷ lệ chọn đúng chỉ khoảng 4%. Chỉ số R² cũng chỉ đạt tỷ lệ thành công 30% và luôn ưu ái các mô hình phức tạp. Tệ hơn, hiệu suất của R² còn suy giảm đáng kể khi cỡ mẫu tăng lên.
Người dùng PLS hưởng lợi lớn từ việc sử dụng các tiêu chí lựa chọn mô hình nhất quán tiệm cận (asymptotically consistent model selection criteria).
GM là tiêu chí hoạt động tốt nhất với tỷ lệ thành công tổng thể trong việc lựa chọn một mô hình tối giản nhưng phù hợp lên tới hơn 97% trên tất cả các điều kiện thử nghiệm, theo sát là BIC với tỷ lệ trên 95%.

6.2 Hướng dẫn quy trình ứng dụng 5 bước (Academic Implications)

Để giải quyết bài toán trên, các tác giả đề xuất quy trình 5 bước chuẩn mực. Đóng vai trò là người hướng dẫn khoa học, tôi yêu cầu các bạn áp dụng quy trình này vào thiết kế nghiên cứu của mình:

Bước 1: Phát triển một tập hợp các mô hình đường dẫn (path models) hợp lý về mặt lý thuyết và có thể quản lý được.
Bước 2: Thu thập dữ liệu theo khung lấy mẫu đã định.
Bước 3: Đánh giá mô hình đo lường (Measurement model assessment) được thực hiện cho tất cả các mô hình đã xác định ở Bước 1. Đảm bảo độ tin cậy và giá trị hội tụ/phân biệt. Quan trọng: Phải sử dụng cùng một phương pháp xử lý dữ liệu bị thiếu (missing value treatments) cho tất cả các mô hình ứng viên.
Bước 4: Chọn một mô hình duy nhất dựa trên các tiêu chí lựa chọn mô hình PLS (Sử dụng BIC hoặc GM, mô hình có điểm số nhỏ nhất là mô hình tối ưu). Nếu các mô hình có điểm số xấp xỉ nhau, nhà nghiên cứu phải thừa nhận sự không chắc chắn (model selection uncertainty).
Bước 5: Khả năng giải thích và dự đoán của mô hình đã chọn được đo chuẩn (benchmarked), và lúc này suy luận thống kê (Bootstrapping, p-value) mới được áp dụng cho các đường dẫn cấu trúc để kiểm định giả thuyết.

7. Ứng Dụng Quản Trị Doanh Nghiệp (Managerial Implications)

Trong thực tế doanh nghiệp, các Data Analyst và Marketer thường xuyên thiết lập các thuật toán dự đoán hành vi khách hàng. Nếu các bạn chỉ “nhồi” thật nhiều biến (Tuổi, Giới tính, Thu nhập, Tương tác Facebook, Lịch sử website…) vào mô hình chỉ để ép R² tăng cao, mô hình đó sẽ thất bại thảm hại khi tung ra thị trường thực tế (áp dụng trên tập khách hàng mới). Việc tuân thủ triết lý chọn mô hình tối giản thông qua các tiêu chí phạt độ phức tạp (như BIC/GM) sẽ giúp doanh nghiệp:

Tiết kiệm chi phí vận hành và khảo sát do không phải thu thập dữ liệu rác.
Chỉ giữ lại những biến số thực sự chi phối hành vi người dùng cốt lõi.
Ra quyết định marketing sắc bén, ổn định và mang lại hiệu quả ROI cao hơn nhờ dự báo ngoài mẫu chính xác.

8. Kết Luận Từ Tác Giả (Conclusion)

Mục tiêu tổng thể của báo cáo này là thiết lập chuẩn mực cho thực tiễn lựa chọn mô hình PLS nhằm tạo ra các lý thuyết có khả năng khái quát hóa cao, thay vì những lý thuyết chắp vá cục bộ. Khái niệm lựa chọn mô hình là một khối xây dựng nền tảng của tiến bộ khoa học (Lakatos, 1970; Meehl, 1990), nhất quán với mưu cầu về suy luận mạnh mẽ (strong inference) (Platt, 1964).

Bởi vì các mô hình không thể phản ánh toàn bộ sự thật (Burnham & Anderson, 2002), nhiệm vụ của nhà khoa học là xấp xỉ các cơ chế tạo ra dữ liệu (MacCallum, 2003) thông qua các tiêu chí mạnh mẽ như BIC và GM. Dù không phải là giải pháp toàn năng (panacea), chúng cung cấp một la bàn thực nghiệm chính xác để đưa ra quyết định lựa chọn mô hình sáng suốt trong môi trường nghiên cứu khám phá, đưa kỷ luật phân tích PLS sánh ngang với các chuẩn mực khắt khe của kinh tế lượng hiện đại.

9. Các Câu Hỏi Thường Gặp (FAQ)

Liệu tiêu chí lựa chọn mô hình (BIC/GM) có thay thế được việc kiểm định p-value không?

Hoàn toàn không. Lựa chọn mô hình (Model Selection) và Suy luận thống kê (Statistical Inference) là hai bước tách biệt. Bạn dùng BIC/GM để chọn ra cấu trúc mô hình tối ưu nhất trước (Bước 4), sau đó mới dùng Bootstrap để lấy p-value xem các đường dẫn trong mô hình tối ưu đó có ý nghĩa thống kê hay không (Bước 5). Giá trị tiêu chí thông tin độc lập hoàn toàn với việc đường dẫn đó có p-value bao nhiêu.

Việc sử dụng PLS-SEM khác gì so với CB-SEM trong bối cảnh chọn mô hình này?

CB-SEM (như AMOS) thường so sánh các mô hình lồng nhau (Nested models) dựa trên Maximum Likelihood. PLS-SEM không dựa trên Likelihood truyền thống mà dùng bình phương tối thiểu lặp (Iterative least squares). Điểm đột phá của bài báo là đã điều chỉnh công thức toán học tính Tiêu chí thông tin dựa trên tổng sai số bình phương (inlineSS_{error}inline) để áp dụng chuẩn xác cho hệ thống thuật toán của PLS-SEM.

Có phải lúc nào mô hình có BIC thấp nhất cũng là mô hình chứa “sự thật” tuyệt đối?

Không. Khung triết học khoa học hiểu rằng “Sự thật” (True model) hiếm khi tồn tại trong thực tế dữ liệu. Tiêu chí BIC hay GM chỉ đóng vai trò tìm ra sự cân bằng xuất sắc nhất giữa tín hiệu (Signal) và độ nhiễu (Noise). Nó xác nhận một sự thật tiệm cận và tối giản nhất chứ không đại diện cho chân lý tuyệt đối. Nguyên lý ở đây là “Garbage in, garbage out” – nếu tất cả mô hình bạn đưa vào so sánh đều sai lý thuyết trầm trọng, BIC vẫn sẽ chọn ra mô hình ít tệ nhất trong tập hợp đó.

Tôi có thể sử dụng BIC và GM để so sánh các mô hình trên các tệp dữ liệu khác nhau hoặc có biến phụ thuộc khác nhau không?

Tuyệt đối không. Các tiêu chí lựa chọn mô hình chỉ hợp lệ khi so sánh các mô hình được phân tích trên chính xác cùng một tập dữ liệu (N mẫu giống nhau, phương pháp xử lý missing data giống hệt nhau). Đồng thời, chúng cũng yêu cầu biến mục tiêu (target endogenous construct) của các mô hình phải là một. Bạn không thể dùng BIC để so sánh mô hình A dự báo “Sự hài lòng” với mô hình B dự báo “Lòng trung thành”.

10. Tài Liệu Tham Khảo (References)

Addas, S. (2010). A call for engaging context in HCI/MIS research with examples from the area of technology interruptions. AIS Transactions on Human-Computer Interaction, 2(4), 178-196.

Aguirre-Urreta, M. I., & Marakas, G. M. (2012). Revisiting bias due to construct misspecification: Different results from considering coefficients in standardizes form. MIS Quarterly, 36(1), 123-138.

Akaike, H. (1970). Statistical predictor identification. Annals of the Institute of Statistical Mathematics, 22(1), 203-217.

Akaike, H. (1973). Information theory and an extension of the maximum likelihood principle. Trong B. N. Petrov & F. Csáki (Eds.), Selected papers of Hirotugu Akaike (tr. 199-213). New York, NY: Springer.

Aho, K., Derryberry, D., & Peterson, T. (2014). Model selection for ecologists: The worldviews of AIC and BIC. Ecology, 95(3), 631-636.

11. Lời kêu gọi hành động (CTA)

Để làm chủ kỹ thuật định lượng này, nắm bắt toàn vẹn phương pháp tính toán inlineSS_{error}inline cũng như xem chi tiết bảng kết quả giả lập thuật toán Monte Carlo, tôi đặc biệt khuyên các bạn học giả và nghiên cứu sinh nên tải và đọc trực tiếp tài liệu học thuật nguyên bản. Hãy bổ sung ngay kỹ thuật này vào chương Phương pháp nghiên cứu của bạn để bài luận đạt chuẩn quốc tế!

Sharma, P. N., Sarstedt, M., Shmueli, G., Kim, K. H., & Thiele, K. O. (2019). PLS-based model selection: The role of alternative explanations in information systems research. Journal of the Association for Information Systems, 20(4), 346-397.

Nguyễn Thanh Phương

Giảng viên Nguyễn Thanh Phương là chuyên gia chuyên sâu về Nghiên cứu khoa học, Ứng dụng AI, Digital Marketing và Quản trị bản thân. Với kinh nghiệm giảng dạy thực chiến, tác giả trực tiếp hướng dẫn ứng dụng phương pháp luận và phân tích dữ liệu chuyên sâu cho người học nên được sinh viên gọi là Thầy giáo quốc dân. Mọi nội dung chia sẻ đều tuân thủ nguyên tắc khách quan, thực chứng và mang giá trị ứng dụng cao, hướng tới mục tiêu cốt lõi: “Làm bạn tốt hơn!