Phân Tích Mô Hình Phương Trình Cấu Trúc Dựa Trên Thành Phần: Kết Nối PLSPM & GSCA – Hwang et al. (2019)

Trong kỷ nguyên phân tích dữ liệu phức tạp, Mô hình phương trình cấu trúc (SEM) đã trở thành “xương sống” cho các nghiên cứu định lượng chuyên sâu. Bài viết dưới đây mang đến một góc nhìn toàn diện, phân tích và đối chiếu tài liệu nghiên cứu gốc “A concept analysis of methodological research on composite-based structural equation modeling: bridging PLSPM and GSCA”. Bằng cách bóc tách các nền tảng lý thuyết, đặc tả mô hình, và ứng dụng thực tiễn, bài viết sẽ đóng vai trò như một chiếc cầu nối vững chắc, giúp các nhà nghiên cứu khoa học và quản trị gia hiểu rõ cách ứng dụng linh hoạt hai phương pháp cốt lõi: PLSPM và GSCA.

Nội dung bài viết

1. Tổng Quan & Lý Thuyết Nền Tảng (Overview & Theoretical Foundations)

1.1 Thông tin định danh bài báo

Tiêu đề gốc: A concept analysis of methodological research on composite-based structural equation modeling: bridging PLSPM and GSCA
Tiêu đề tiếng Việt: Phân tích khái niệm về nghiên cứu phương pháp luận đối với mô hình phương trình cấu trúc dựa trên thành phần: kết nối PLSPM và GSCA
Tác giả: Heungsun Hwang, Marko Sarstedt, Jun Hwa Cheah, Christian M. Ringle
Tạp chí: Behaviormetrika (2019)

1.2 Giới thiệu & Bối cảnh thực tiễn (Introduction & Research Gap)

Mô hình phương trình cấu trúc (SEM) đã trở thành một công cụ tiêu chuẩn để phân tích các mối quan hệ tương hỗ phức tạp giữa các biến quan sát và biến tiềm ẩn (Kaplan 2002). Hai cách tiếp cận khác biệt đã được đề xuất: SEM dựa trên yếu tố (factor-based SEM) và mô hình phương trình cấu trúc dựa trên thành phần (composite-based SEM).

Trong thập kỷ qua, các phương pháp như Mô hình đường dẫn bình phương tối thiểu một phần (PLSPM) và Phân tích thành phần cấu trúc tổng quát (GSCA) đã đạt được sự phổ biến mạnh mẽ trong khoa học xã hội, y học, và kỹ thuật. Tuy nhiên, mạng lưới kiến thức về PLSPM và GSCA lại khá phân mảnh, các nhà nghiên cứu làm việc trong các “kho chứa” (silos) biệt lập. Khoảng trống nghiên cứu ở đây là thiếu một góc nhìn tổng thể về mối quan hệ ngữ nghĩa giữa các chủ đề chính, cũng như chưa có sự kết nối nền tảng giữa hai luồng phương pháp luận này.

1.3 Hệ thống Lý thuyết nền tảng (Theoretical Foundations)

Nghiên cứu này dựa trên nền tảng của thống kê đa biến truyền thống (multivariate statistical techniques).

SEM dựa trên yếu tố: Chịu ảnh hưởng bởi truyền thống đo lường tâm lý học, giả định mỗi biến tiềm ẩn tồn tại như một thực thể độc lập và là nguồn gốc duy nhất gây ra mối liên hệ giữa các biến quan sát.
Mô hình phương trình cấu trúc dựa trên thành phần: Đại diện cho một biến tiềm ẩn bằng một thành phần được tính trọng số (weighted composite) của các biến quan sát, xem nó là sự tổng hợp mang tính tất định (deterministic aggregation) của các chỉ báo.

2. Khái Niệm Hóa và Cấu Trúc Khái Niệm (Conceptualization)

Khái niệm cốt lõi của bài báo là sự phân tách và đối chiếu cấu trúc mô hình giữa hai phương pháp. PLSPM và GSCA chia sẻ mục tiêu phân tích nhưng khác biệt ở cách thiết lập.

2.1 Đặc tả mô hình (Model specification)

Cả PLSPM và GSCA đều liên quan đến hai mô hình phụ:

Mô hình đo lường (Measurement/Outer models): Xác định mối quan hệ giữa biến quan sát (z) và biến tiềm ẩn (γ). Cả hai phương pháp dự tính mô hình đo lường sau:
z = Cγ + ε (1)
(Trong đó C là ma trận hệ số tải, ε là phần dư của chỉ báo).
Riêng PLSPM cân nhắc thêm mô hình đo lường nguyên nhân (formative):
γ = Hz + θ (2)
(Trong đó H là ma trận trọng số chỉ báo, θ là phần dư của biến tiềm ẩn).
Mô hình cấu trúc (Structural/Inner model): Thể hiện mối quan hệ giữa các biến tiềm ẩn, được biểu diễn chung dưới dạng:
γ = Bγ + ζ (3)
Sự khác biệt cốt lõi: GSCA có thêm mô hình quan hệ có trọng số γ = Wz (4). Từ đó, GSCA tích hợp tất cả thành một công thức thống nhất (mô hình RAM mở rộng): Vz = AWz + e (5). Ngược lại, PLSPM không kết hợp các mô hình phụ thành một phương trình duy nhất.

3. Quy Trình Phát Triển Thang Đo và Phương Pháp Lượng Giá (Scale Development Process & Methodology)

3.1 Ước lượng mô hình (Model estimation)

Sự khác biệt trong đặc tả dẫn đến cách tiếp cận ước lượng khác nhau:

Thuật toán PLSPM: Ước lượng để giảm thiểu phương sai phần dư. Nó thực hiện tuần tự hai giai đoạn: (1) Tính điểm số biến tiềm ẩn bằng trọng số tương quan (Chế độ A) hoặc trọng số hồi quy (Chế độ B); (2) Sử dụng hồi quy OLS để ước lượng hệ số tải ngoài, trọng số ngoài, hệ số đường dẫn và R². Đây là phương pháp thông tin giới hạn (limited-information), có tính mạnh mẽ (robust) trước các đặc tả sai.
Thuật toán GSCA: Sử dụng thuật toán lặp bình phương tối thiểu xen kẽ (ALS). GSCA tìm cách giảm thiểu tổng tất cả các bình phương phần dư trong một giai đoạn duy nhất. Đây là phương pháp đầy đủ thông tin (full-information), hiệu quả cao khi mô hình được đặc tả đúng.
Mở rộng mô phỏng lỗi: Cả hai đã phát triển thuật toán PLSc (dùng hệ số ρA theo phương trình 8) và GSCA_M để tính đến các sai số đo lường, cho phép mô hình phương trình cấu trúc dựa trên thành phần mô phỏng kết quả tương đương SEM dựa trên yếu tố.

3.2 Phương pháp luận và Dữ liệu phân tích (Methodology & Data)

Thay vì khảo sát người dùng, nghiên cứu này sử dụng phương pháp định lượng văn bản (Scientometrics) qua phần mềm Leximancer. Dữ liệu bao gồm 108 bài báo xuất bản từ 1979 đến 2017, được chia làm hai giai đoạn (1979-2013 và 2014-2017) để phân tích sự dịch chuyển của các khái niệm.

4. Thang Đo Lường Chính Thức và Đánh Giá Kết Quả (Measurement Scale & Results Evaluation)

4.1 Đánh giá kết quả (Results evaluation)

Sự khác biệt trong ước lượng kéo theo các tiêu chí đánh giá riêng biệt, được tóm tắt qua Bảng 1 trong nghiên cứu gốc:

Cấp độ Đánh giá	Chỉ tiêu PLSPM	Chỉ tiêu GSCA
Mô hình đo lường / Cục bộ	Kiểm tra ý nghĩa, độ tin cậy, giá trị hội tụ/phân biệt.	Độ tin cậy của thành phần, chỉ số FIT_M.
Mô hình cấu trúc / Cục bộ	Khả năng giải thích (R²), sức mạnh dự đoán (PLSpredict), kiểm tra ý nghĩa.	Khả năng giải thích (R²) và chỉ số FIT_S.
Tổng thể / Toàn cầu	Không khuyến khích dùng GFI/SRMR.	Độ phù hợp tổng thể (FIT, AFIT, GFI, SRMR).
So sánh mô hình	So sánh khả năng dự đoán (Predictive model comparisons).	Không áp dụng phổ biến như PLSPM.

4.2 Kết quả phân tích chủ đề (Results)

Phân tích văn bản trích xuất ra các chủ đề (Themes) cấu thành nên bộ “thang đo khái niệm” trong hệ sinh thái SEM:

Chủ đề Tiềm ẩn (Latent): Nổi trội nhất, chứa các khái niệm Cấu trúc (Constructs), mô hình đo lường nguyên nhân (Formative) / phản ánh (Reflective). Giai đoạn 1979-2013 tập trung phân biệt Formative vs Reflective, nhưng giai đoạn sau cho thấy sự mờ nhạt của ranh giới này.
Chủ đề Phân tích (Analysis) & Tác động (Effects): Chuyển dịch từ việc nghiên cứu tác động tương tác (interaction effects) sang các mô hình phức tạp hơn như tác động trung gian (mediation) và mô hình phân cấp.
Chủ đề Giá trị (Value): Xuất hiện mạnh từ 2014-2017 với các khái niệm gắn liền thực tiễn như Khách hàng (Customer), Sự hài lòng (Satisfaction).

5. Mạng Lưới Quan Hệ Lý Thuyết (Nomological Network)

Tiền tố (Antecedents – Thiết lập đầu vào): Bản chất của dữ liệu (chuỗi thời gian, bảng, dữ liệu chéo) và tính chất khái niệm (đa hướng hay đơn hướng) sẽ tác động đến quyết định chọn PLSPM hay GSCA.
Hậu tố (Consequences – Đầu ra nghiên cứu): Khi một mô hình phương trình cấu trúc dựa trên thành phần được chạy thành công, nó không chỉ giải thích mối quan hệ cấu trúc (Explanatory Power) mà còn tạo ra Sức mạnh dự đoán (Predictive Power), trực tiếp phục vụ cho việc ra quyết định.

6. Hướng Dẫn Ứng Dụng Nghiên Cứu và Thảo Luận (Academic Implications & Discussion)

Từ phần Thảo luận (Discussion) của bài gốc, với tư cách là người hướng dẫn, tôi đề xuất các hướng nghiên cứu sau cho các luận án/bài báo khoa học của bạn:

Khắc phục tính nội sinh (Endogeneity): Trong tương lai, việc sử dụng GSCA hoặc PLSPM bắt buộc phải tích hợp các phương tiện xử lý tính nội sinh (ví dụ: dùng biến công cụ – instrumental variable) để đảm bảo độ tin cậy của hệ số đường dẫn.
Mô hình đa cấp và Dữ liệu bảng (Multilevel & Panel Data): Mở rộng khả năng của mô hình để phân tích sự thay đổi theo thời gian, thay vì chỉ nghiên cứu cắt ngang.
Đồng bộ hóa khái niệm: Khi viết bài, hãy ngưng tranh luận cực đoan giữa “reflective” và “formative”. Hãy tập trung vào việc bạn đang dùng “yếu tố” (factor) hay “thành phần” (composite) để đại diện cho biến số.

7. Ứng Dụng Quản Trị Doanh Nghiệp (Managerial Implications)

Dự báo chính xác hành vi khách hàng: Thông qua các chủ đề mới nổi như “Value” và “Satisfaction”, doanh nghiệp có thể áp dụng thuật toán PLSpredict để dự báo điểm hài lòng của khách hàng mới, thay vì chỉ giải thích dữ liệu quá khứ.
Tùy biến chỉ số hiệu suất (KPI): Các chỉ số KPI tổng thể thường là một “tổ hợp thành phần” (composites) của nhiều phòng ban. GSCA cho phép tạo ra các điểm số thành phần chính xác, giúp nhà quản trị phân bổ trọng số hợp lý cho từng bộ phận thay vì cào bằng.

8. Các Câu Hỏi Thường Gặp (FAQ)

Phương trình (5) trong GSCA mang lại lợi thế toán học nào so với PLSPM?

Việc kết hợp tất cả các ma trận thành phương trình Vz = AWz + e cho phép GSCA tối ưu hóa toàn cục (Global Optimization). Điều này giúp nhà nghiên cứu dễ dàng thiết lập các ràng buộc tham số (ví dụ: buộc hai đường dẫn phải bằng nhau) – điều mà thuật toán lặp từng phần của PLSPM khó thực hiện được.

Việc loại bỏ đánh giá độ phù hợp (Goodness-of-fit / GoF) trong PLSPM có làm giảm tính khoa học?

Không. Các học giả hiện đại nhấn mạnh mô hình phương trình cấu trúc dựa trên thành phần (đặc biệt là PLSPM) tuân theo mô hình nhân quả-dự đoán (causal-predictive paradigm). Do đó, đánh giá sức mạnh dự đoán ngoài mẫu (out-of-sample) quan trọng và thực tế hơn là cố gắng khớp ma trận hiệp phương sai.

PLSc và GSCA_M đóng vai trò gì trong các bài báo yêu cầu đối chiếu với CB-SEM?

Chúng là “cầu nối” (bridging). Nếu tạp chí yêu cầu kết quả mô phỏng theo mô hình yếu tố chung, nhưng dữ liệu của bạn có cỡ mẫu nhỏ hoặc bị phân phối lệch, việc sử dụng PLSc (với hệ số ρA) giúp loại bỏ độ chệch (bias) của thuật toán thành phần truyền thống.

9. Tài Liệu Tham Khảo (References)

Aguirre-Urreta MI, Rönkkö M, Marakas GM (2016) Omission of causal indicators: consequences and implications for measurement. Meas: Interdiscip Res Perspect 14(3):75-97.

Ali F, Rasoolimanesh SM, Sarstedt M, Ringle CM, Ryu K (2018) An assessment of the use of partial least squares structural equation modeling (PLS-SEM) in hospitality research. Int J Contemp Hosp Manag 30(1):514-538.

Bentler PM, Huang W (2014) On components, latent variables, PLS and simple methods: reactions to Rigdon’s rethinking of PLS. Long Range Plan 47(3):138-145.

Chin WW, Marcolin BL, Newsted PR (2003) A partial least squares latent variable modeling approach for measuring interaction effects… Inf Syst Res 14(2):189-217.

Dijkstra TK, Henseler J (2015) Consistent partial least squares path modeling. MIS Quart 39(2):297-316.

Hair JF, Hult GTM, Ringle CM, Sarstedt M (2017b) A primer on partial least squares structural equation modeling (PLS-SEM), 2nd edn. Sage, Thousand Oaks.

Henseler J, Ringle CM, Sarstedt M (2015) A new criterion for assessing discriminant validity in variance-based structural equation modeling. J Acad Mark Sci 43(1):115-135.

Hwang H, Takane Y (2004) Generalized structured component analysis. Psychometrika 69(1):81-99.

Hwang H, Takane Y (2014) Generalized structured component analysis: A component-based approach to structural equation modeling. Chapman and Hall/CRC, Boca Raton.

Lohmöller J-B (1989) Latent variable path modeling with partial least squares. Springer, Berlin.

Rigdon EE, Sarstedt M, Ringle CM (2017) On comparing results from CB-SEM and PLS-SEM. Five perspectives and five recommendations. Marketing ZFP 39(3):4-16.

Sarstedt M, Hair JF, Ringle CM, Thiele KO, Gudergan SP (2016) Estimation issues with PLS and CBSEM: where the bias lies! J Bus Res 69(10):3998-4010.

Shmueli G, Sarstedt M, Hair JF, Cheah J-H, Ting H, Vaithilingam S, Ringle CM (2019) Predictive model assessment in PLS-SEM: guidelines for using PLSpredict. Eur J Market (forthcoming).

Tenenhaus M (2008) Component-based structural equation modelling. Total Qual Manag 19(7-8):871-886.

Wold HOA (1982) Soft modeling: the basic design and some extensions. In: Jöreskog KG, Wold HOA (eds) Systems under indirect observation, part II. North Holland.

10. Lời kêu gọi hành động

Nghiên cứu về phương pháp luận không bao giờ dừng lại ở mặt lý thuyết mà luôn hướng tới ứng dụng thực chứng mạnh mẽ. Để thực sự làm chủ cách thiết lập phương trình cấu trúc toán học và các hệ số tải trọng lực, tôi khuyến khích bạn tải về toàn văn tài liệu và đối chiếu trực tiếp với phần mềm tính toán của mình.

Hwang, H., Sarstedt, M., Cheah, J. H., & Ringle, C. M. (2019). A concept analysis of methodological research on composite-based structural equation modeling: bridging PLSPM and GSCA.