Quy trình phát triển thang đo: Mô hình Churchill (1979)

Quy trình phát triển thang đo (Scale Development Process) theo mô hình Churchill (1979) là một khuôn mẫu chuẩn mực gồm 8 bước nhằm xây dựng các công cụ đo lường đa biến cho các cấu trúc marketing trừu tượng. Vấn đề cốt lõi mà mô hình giải quyết là sự thiếu tin cậy và giá trị của các thang đo đơn biến hoặc tự phát. Giải pháp là tuân thủ quy trình lặp từ xác định miền khái niệm, tạo mẫu hỏi, thu thập dữ liệu, đến kiểm định độ tin cậy và độ giá trị.

Nội dung bài viết

1. Tổng quan và giới thiệu bài báo

1.1 Thông tin định danh bài báo

Để đảm bảo tính chuẩn xác trong trích dẫn học thuật, dưới đây là thông tin gốc của tài liệu:

Tiêu đề gốc: A Paradigm for Developing Better Measures of Marketing Constructs
Tiêu đề tiếng Việt: Một mô hình mẫu nhằm phát triển các thước đo tốt hơn cho các cấu trúc Marketing
Tác giả: Gilbert A. Churchill, Jr.
Nguồn: Journal of Marketing Research, Vol. 16, No. 1 (Tháng 2, 1979), tr. 64-73.

1.2 Vấn đề nghiên cứu

Một yếu tố then chốt trong sự phát triển của hệ thống kiến thức nền tảng trong marketing, cũng như để cải thiện thực tiễn marketing, là việc phát triển các thước đo tốt hơn cho các biến số mà các nhà tiếp thị làm việc cùng. Bài viết này phác thảo một phương pháp tiếp cận để đạt được mục tiêu này và minh họa các phần của phương pháp đó thông qua một thước đo về sự hài lòng trong công việc.

1.3 Thực trạng chất lượng thước đo (GIGO)

Trong một bài viết trên tờ Journal of Marketing (1978), Jacoby đã chỉ trích gay gắt:

“Điều đáng kinh ngạc hơn cả số lượng tuyệt đối các thước đo của chúng ta là sự dễ dàng mà chúng được đề xuất và thái độ chấp nhận thiếu phê phán đối với chúng… Hầu hết các thước đo của chúng ta chỉ được coi là thước đo bởi vì ai đó nói như vậy.”

Các nhà tiếp thị dường như đang vận hành theo quy trình GIGO – Rác vào, Rác ra (Garbage In, Garbage Out). Nếu công cụ thu thập dữ liệu không hợp lệ ngay từ đầu, thì mọi phân tích thống kê phức tạp sau đó đều vô nghĩa.

2. Cơ sở lý thuyết về đo lường

2.1 Mô hình Điểm số thực và Sai số

Về mặt kỹ thuật, quá trình đo lường liên quan đến “các quy tắc gán các con số cho các đối tượng để đại diện cho lượng của các thuộc tính” (Nunnally, 1967).

Mối quan hệ giữa điểm quan sát và điểm thực được biểu diễn như sau:

X_O = X_T + X_S + X_R

Trong đó:

X_O: Giá trị quan sát được (Observed score).
X_T: Giá trị thực (True score).
X_S: Sai số hệ thống (Systematic error) – Ví dụ: đặc điểm cá nhân ổn định của người trả lời.
X_R: Sai số ngẫu nhiên (Random error) – Ví dụ: tâm trạng thoáng qua, sự mệt mỏi.

2.2 Định nghĩa Độ giá trị và Độ tin cậy

Độ giá trị (Validity): Thước đo có giá trị khi X_O = X_T, tức là sự khác biệt trong điểm số quan sát phản ánh đúng sự khác biệt của đặc điểm cần đo.
Độ tin cậy (Reliability): Thước đo đáng tin cậy khi các phép đo lặp lại cho kết quả giống nhau (X_R = 0).

Nguyên tắc cốt lõi: Độ tin cậy là điều kiện cần, nhưng chưa đủ cho độ giá trị.

3. Quy trình 8 bước phát triển thang đo (The Churchill Paradigm)

Dưới đây là bảng tổng hợp quy trình chuẩn mực được Churchill đề xuất cho các thước đo đa biến (multi-item measures):

Bước	Tên Bước (Tiếng Anh)	Nội Dung Thực Hiện	Kỹ Thuật/Công Cụ Gợi Ý
1	Specify domain of construct	Xác định miền nội dung của khái niệm.	Tìm kiếm tài liệu (Literature search).
2	Generate sample of items	Tạo tập hợp các biến quan sát (items).	Khảo sát kinh nghiệm, Thảo luận nhóm (Focus groups).
3	Collect data	Thu thập dữ liệu lần 1 (Sơ bộ).	Khảo sát mẫu nhỏ.
4	Purify measure	Lọc và tinh chỉnh thang đo.	Hệ số Alpha, Phân tích nhân tố (Factor Analysis).
5	Collect data	Thu thập dữ liệu lần 2 (Chính thức).	Khảo sát mẫu lớn.
6	Assess reliability	Đánh giá độ tin cậy.	Hệ số Alpha, Độ tin cậy chia đôi (Split-half).
7	Assess validity	Đánh giá độ giá trị.	Ma trận MTMM, Độ giá trị tiêu chí (Criterion validity).
8	Develop norms	Xây dựng các định mức.	Tính trung bình, độ lệch chuẩn.

4. Phân tích chi tiết các bước cốt lõi

4.1. Xác định miền khái niệm & Tạo mẫu hỏi (Bước 1 & 2)

Bước đầu tiên và quan trọng nhất là xác định chính xác khái niệm bao gồm những gì và không bao gồm những gì. Đặc biệt đối với các cấu trúc tâm lý, hành vi phức tạp (chẳng hạn như khi xây dựng thang đo đánh giá hiệu quả của các can thiệp từ lý thuyết thúc đẩy (Nudge Theory)), việc giới hạn đúng miền khái niệm sẽ giúp tránh đo lường nhầm sang các động cơ ép buộc hoặc các chính sách tài chính khác. Sau đó, sử dụng các phương pháp như phỏng vấn chuyên gia, thảo luận nhóm để tạo ra danh sách các câu hỏi bao phủ toàn bộ miền khái niệm đó.

Lưu ý: Cần loại bỏ các câu hỏi “kép” (double-barreled) và cân bằng các câu khẳng định tích cực/tiêu cực.

4.2. Tinh chỉnh thang đo (Bước 4)

Đây là bước sàng lọc quan trọng nhất để loại bỏ các biến “rác”.

Hệ số Cronbach’s Alpha: Phải được tính toán đầu tiên. Các biến có tương quan biến-tổng (item-to-total correlation) thấp cần bị loại bỏ.
Phân tích nhân tố (Factor Analysis): Nên thực hiện sau khi đã lọc sơ bộ bằng Alpha để tránh việc rác tạo ra các chiều giả tạo. Đồng thời, nhà nghiên cứu cũng nên rà soát tính chuẩn của bộ dữ liệu thông qua đồ thị Q-Q Plot trước khi chạy phân tích để đảm bảo các thuật toán trích xuất nhân tố hoạt động chính xác.
Quy trình lặp: Nếu Alpha chưa đạt chuẩn, phải quay lại bước tạo câu hỏi hoặc lọc lại biến.

4.3. Kiểm định Độ giá trị (Bước 7)

Chỉ tin cậy thôi là chưa đủ, thang đo phải đo đúng cái cần đo.

Ma trận Đa đặc điểm – Đa phương pháp (MTMM Matrix): Churchill khuyến nghị sử dụng công cụ này để kiểm tra độ giá trị hội tụ (các cách đo khác nhau của cùng 1 biến phải tương quan cao) và độ giá trị phân biệt (biến này phải khác biệt với biến kia).

5. Mạng lưới quan hệ lý thuyết (Nomological Network)

Để khẳng định độ giá trị cấu trúc (Construct Validity), Churchill đề xuất đặt khái niệm vào một mạng lưới quan hệ lý thuyết:

Mối quan hệ với các biến khác: Thang đo mới phát triển phải hoạt động đúng như dự đoán của lý thuyết. Ví dụ: Nếu lý thuyết nói “Sự hài lòng” dẫn đến “Lòng trung thành”, thì thang đo “Sự hài lòng” bạn mới phát triển phải có tương quan dương mạnh với “Lòng trung thành”.
Kiểm chứng: Nếu mối quan hệ này không xuất hiện, có thể do thang đo sai, hoặc lý thuyết sai.

6. Hướng dẫn ứng dụng nghiên cứu (Academic Implications)

Đối với các nghiên cứu sinh, giảng viên và nhà nghiên cứu hàn lâm, việc áp dụng bài báo Churchill (1979) đòi hỏi sự tuân thủ nghiêm ngặt các nguyên tắc sau:

Tuyệt đối không dùng thang đo đơn biến (Single-item measures):
Trừ các biến nhân khẩu học đơn giản (tuổi, giới tính), các cấu trúc marketing trừu tượng (thái độ, nhận thức, niềm tin) bắt buộc phải dùng thang đo đa biến (Multi-item). Điều này giúp trung hòa sai số ngẫu nhiên của từng câu hỏi lẻ và tăng độ tin cậy tổng thể.
Báo cáo hệ số Alpha là chưa đủ:
Rất nhiều luận văn hiện nay chỉ dừng lại ở Cronbach’s Alpha. Theo chuẩn Churchill, bạn bắt buộc phải thực hiện Phân tích nhân tố (EFA/CFA) để kiểm tra tính đơn hướng (Unidimensionality) và thực hiện các kiểm định độ giá trị (Validity) như độ giá trị hội tụ và phân biệt.
Quy trình lọc biến (Purification) phải mạnh tay:
Hãy dũng cảm loại bỏ các biến quan sát có hệ số tải nhân tố thấp hoặc tương quan biến-tổng thấp ngay từ bước Pilot test. Chất lượng của thang đo quan trọng hơn số lượng câu hỏi. Một thang đo ngắn nhưng tinh gọn và chính xác có giá trị hơn một thang đo dài nhưng chứa nhiều “rác”.

7. Ứng dụng quản trị doanh nghiệp (Managerial Implications)

Mặc dù đây là một bài báo học thuật kinh điển, nhưng ý nghĩa thực tiễn của nó đối với các nhà quản trị doanh nghiệp là rất lớn, đặc biệt trong bối cảnh dữ liệu lớn (Big Data) hiện nay:

Ra quyết định dựa trên “Dữ liệu sạch” (Data Integrity):
Nếu doanh nghiệp thiết kế bảng câu hỏi khảo sát khách hàng một cách cẩu thả (câu hỏi mơ hồ, dẫn dắt), dữ liệu thu về sẽ là vô nghĩa (GIGO). Tuân thủ quy trình Churchill giúp đảm bảo dữ liệu đầu vào phản ánh đúng thực tế, từ đó các quyết định chiến lược mới chính xác.
Chuẩn hóa các chỉ số KPI nội bộ:
Khi đo lường các khái niệm trừu tượng như “Sự hài lòng của nhân viên”, “Văn hóa doanh nghiệp” hay “Sức mạnh thương hiệu”, doanh nghiệp nên xây dựng bộ tiêu chí (items) cố định và đã được kiểm định (validates scales). Tránh việc mỗi năm thay đổi câu hỏi một lần khiến không thể so sánh dữ liệu qua các thời kỳ.
Đánh giá đúng năng lực đối tác nghiên cứu thị trường:
Khi thuê các agency làm nghiên cứu thị trường, nhà quản trị có kiến thức về Churchill (1979) có thể chất vấn về quy trình kiểm soát chất lượng dữ liệu của họ: “Các anh chị kiểm định độ tin cậy và độ giá trị của bảng hỏi như thế nào?”. Điều này giúp chọn lọc được các đối tác uy tín.

8. Các câu hỏi thường gặp (FAQ)

Tại sao Cronbach’s Alpha cao nhưng thang đo vẫn có thể kém chất lượng?

Cronbach’s Alpha chỉ đo lường độ tin cậy (tính nhất quán nội tại). Một thang đo có thể rất nhất quán (Alpha > 0.9) nhưng lại đo sai vấn đề (thiếu độ giá trị – Validity). Ví dụ, bạn dùng thước dây rất tốt (tin cậy) để đo cân nặng (sai giá trị). Do đó, cần kết hợp cả Reliability và Validity.

Khi nào nên sử dụng phân tích nhân tố (Factor Analysis) trong quy trình này?

Theo Churchill, phân tích nhân tố nên được thực hiện ở Bước 4 (Purify measure) để xác định số chiều của khái niệm và loại bỏ các biến không phù hợp trước khi thu thập dữ liệu chính thức.

Sự khác biệt lớn nhất giữa mô hình Churchill (1979) và các cách làm cũ là gì?

Sự khác biệt nằm ở “mô hình lặp” (iterative paradigm). Churchill không xem việc tạo thang đo là việc làm một lần (one-off), mà là một quá trình thử sai, tinh chỉnh, thu thập lại dữ liệu cho đến khi đạt chuẩn.

9. Kết luận

Bài báo của Churchill (1979) không chỉ là một hướng dẫn kỹ thuật mà là một tuyên ngôn về sự nghiêm túc trong nghiên cứu khoa học.

Đối với giới học thuật: Nó đặt ra tiêu chuẩn vàng cho việc phát triển lý thuyết.
Đối với thực tiễn: Nó cảnh báo về nguy cơ của việc ra quyết định dựa trên những công cụ đo lường sai lệch.

Việc hiểu và áp dụng đúng quy trình này là bước đầu tiên để chuyển từ việc “đếm sỏi” sang việc thực sự đo lường trí thông minh của thị trường.

10. Tài liệu tham khảo (References)

Danh sách đầy đủ các tài liệu tham khảo gốc được trích dẫn trong bài báo:

Bartels, Robert. “Can Marketing Be a Science?,” Journal of Marketing, 15 (January 1951), 319-28.
Bohrnstedt, George W. “Reliability and Validity Assessment in Attitude Measurement,” in Gene F. Summers, ed., Attitude Measurement. Chicago: Rand McNally and Company, 1970, 80-99.
Buzzell, Robert D. “Is Marketing a Science,” Harvard Business Review, 41 (January-February 1963), 32-48.
Calder, Bobby J. “Focus Groups and the Nature of Qualitative Marketing Research,” Journal of Marketing Research, 14 (August 1977), 353-64.
Campbell, Donald R. and Donald W. Fiske. “Convergent and Discriminant Validation by the Multitrait-Multimethod Matrix,” Psychological Bulletin, 56 (1959), 81-105.
Campbell, John P. “Psychometric Theory,” in Marvin D. Dunette, ed., Handbook of Industrial and Organizational Psychology. Chicago: Rand McNally, Inc., 1976, 185-222.
Churchill, Gilbert A., Jr., Neil M. Ford, and Orville C. Walker, Jr. “Measuring the Satisfaction of Industrial Salesmen,” Journal of Marketing Research, 11 (August 1974), 254-60.
Converse, Paul D. “The Development of a Science in Marketing,” Journal of Marketing, 10 (July 1945), 14-23.
Cronbach, L. J. “Coefficient Alpha and the Internal Structure of Tests,” Psychometrika, 16 (1951), 297-334.
Czepeil, John A., Larry J. Rosenberg, and Adebayo Akerale. “Perspectives on Consumer Satisfaction,” in Ronald C. Curhan, ed., 1974 Combined Proceedings. Chicago: American Marketing Association, 1974, 119-23.
Flanagan, J. “The Critical Incident Technique,” Psychological Bulletin, 51 (1954), 327-58.
Ford, Neil M., Orville C. Walker, Jr. and Gilbert A. Churchill, Jr. “Expectation-Specific Measures of the Intersender Conflict and Role Ambiguity Experienced by Industrial Salesmen,” Journal of Business Research, 3 (April 1975), 95-112.
Gardner, Burleigh B. “Attitude Research Lacks System to Help It Make Sense,” Marketing News, 11 (May 5, 1978), 1+.
Ghiselli, Edwin E. Theory of Psychological Measurement. New York: McGraw-Hill Book Company, 1964.
Heeler, Roger M. and Michael L. Ray. “Measure Validation in Marketing,” Journal of Marketing Research, 9 (November 1972), 361-70.
Howard, John A. and Jagdish N. Sheth. The Theory of Buyer Behavior. New York: John Wiley & Sons, Inc., 1969.
Hunt, Shelby D. “The Nature and Scope of Marketing,” Journal of Marketing, 40 (July 1976), 17-28.
Jacoby, Jacob. “Consumer Research: A State of the Art Review,” Journal of Marketing, 42 (April 1978), 87-96.
Kerlinger, Fred N. Foundations of Behavioral Research, 2nd ed. New York: Holt, Rinehart, Winston, Inc., 1973.
Kollat, David T., James F. Engel, and Roger D. Blackwell. “Current Problems in Consumer Behavior Research,” Journal of Marketing Research 7 (August 1970), 327-32.
Ley, Philip. Quantitative Aspects of Psychological Assessment. London: Gerald Duckworth and Company, Ltd., 1972.
Nunnally, Jum C. Psychometric Theory. New York: McGraw-Hill Book Company, 1967.
Schwab, D. P. and L. L. Cummings, “Theories of Performance and Satisfaction: A Review,” Industrial Relations, 9 (1970), 408-30.
Selltiz, Claire, Lawrence S. Wrightsman, and Stuart W. Cook. Research Methods in Social Relations, 3rd ed. New York: Holt, Rinehart, and Winston, 1976.
Torgerson, Warren S. Theory and Methods of Scaling. New York: John Wiley & Sons, Inc., 1958.
Tryon, Robert C. “Reliability and Behavior Domain Validity: Reformulation and Historical Critique,” Psychological Bulletin, 54 (May 1957), 229-49.

Tải tài liệu gốc để phục vụ nghiên cứu: Để nắm bắt chi tiết số liệu thống kê và quy trình kiểm định thang đo, bạn nên tham khảo trực tiếp file PDF gốc.

Churchill, G. A., Jr. (1979). A paradigm for developing better measures of marketing constructs. Journal of Marketing Research, 16(1), 64–73.