Thống kê tần số (Frequency Statistics) là một trong những kỹ thuật thống kê mô tả cơ bản và được sử dụng nhiều nhất trong SPSS. Phương pháp này giúp nhà nghiên cứu xác định số lượng và tỷ lệ phần trăm của các giá trị xuất hiện trong một biến, từ đó mô tả đặc điểm phân bố dữ liệu một cách trực quan và dễ hiểu.
Thống kê tần số thường được áp dụng cho các biến định tính (như giới tính, nghề nghiệp, khu vực sinh sống…) và cũng có thể sử dụng cho biến định lượng rời rạc (như độ tuổi nhóm, mức thu nhập theo khoảng).
1. Mục đích sử dụng
Thống kê tần số giúp nhà nghiên cứu có cái nhìn tổng quát về đặc điểm của mẫu nghiên cứu thông qua các tiêu chí như giới tính, độ tuổi, nghề nghiệp, nơi cư trú,… Kết quả được trình bày dưới dạng bảng tần số, thể hiện số lượng và tỷ lệ phần trăm của từng giá trị, từ đó cho thấy cơ cấu mẫu nghiêng về nhóm đối tượng nào.
Ví dụ, với biến Giới tính gồm Nam và Nữ, thống kê tần số cho biết trong 150 người trả lời có 45 người là Nam (30%) và 105 người là Nữ (70%). Các kết quả này giúp người nghiên cứu nhanh chóng nắm bắt đặc điểm chung của đối tượng khảo sát.
Quan trọng hơn, thống kê tần số được sử dụng để đánh giá mức độ phù hợp của mẫu nghiên cứu so với mục tiêu ban đầu. Nếu đối tượng thu thập dữ liệu không đúng với nhóm nghiên cứu mong muốn, chẳng hạn nghiên cứu hành vi mua hàng của nữ giới nhưng mẫu lại chủ yếu là nam, hoặc nghiên cứu giới trẻ nhưng phần lớn đáp viên trên 45 tuổi, thì mẫu dữ liệu sẽ không đáp ứng mục đích nghiên cứu và cần được xem xét điều chỉnh trước khi phân tích sâu hơn.
2. Thống kê mô tả tần số trên SPSS 26
Chúng ta sẽ thực hiện thống kê tần số trên SPSS cho một tập dữ liệu gồm các biến thông tin cá nhân như giới tính, độ tuổi.... bằng cách vào Analyze > Descriptive Statistics > Frequencies…
Tại cửa sổ Frequencies, bạn chọn các biến cần thực hiện thống kê tần số ở danh sách bên trái và chuyển sang ô Variable(s) ở bên phải. Trong ví dụ minh họa này, tác giả sử dụng các biến định tính thuộc nhóm thông tin cá nhân để thực hành, tuy nhiên người dùng hoàn toàn có thể áp dụng tương tự cho các biến khác tùy theo mục đích phân tích.
Chẳng hạn, trong trường hợp muốn xem tỷ lệ đáp viên lựa chọn các mức 1, 2, 3, 4, 5 của thang đo Likert 5 mức, bạn chỉ cần đưa các biến câu hỏi tương ứng vào mục Variable(s) để SPSS tiến hành thống kê tần số và xuất kết quả chi tiết.
Sau khi đưa các biến cần thống kê tần số vào mục Variable(s), ở phía bên phải cửa sổ sẽ xuất hiện các tùy chọn gồm Statistics, Charts, Format, Style và Bootstrap. Đây là những công cụ hỗ trợ giúp người nghiên cứu mô tả và trình bày dữ liệu chi tiết hơn. Trong đó, hai tùy chọn được sử dụng phổ biến nhất là Statistics và Charts.
Tại mục Statistics, SPSS cho phép người dùng lựa chọn các chỉ số thống kê mô tả cơ bản như giá trị trung bình (Mean), trung vị (Median), độ lệch chuẩn (Standard Deviation),… Ngoài ra, SPSS còn cung cấp hai chỉ số quan trọng phản ánh đặc điểm phân phối dữ liệu là Skewness và Kurtosis, giúp đánh giá mức độ lệch và độ nhọn của phân phối.
Tùy theo mục đích phân tích và loại kết quả mong muốn, người dùng có thể lựa chọn tích vào các chỉ số thống kê phù hợp. Trong ví dụ này, tác giả chỉ thực hiện mô tả cơ bản đặc điểm mẫu nghiên cứu nên giữ nguyên các thiết lập mặc định của SPSS và không chọn thêm bất kỳ thông số nào. Sau đó, nhấn Continue để quay lại cửa sổ Frequencies ban đầu.
Tiếp theo là tùy chọn Charts, cho phép SPSS tạo các biểu đồ mô tả cơ cấu của những biến được đưa vào thống kê tần số. Trong mục này, SPSS hỗ trợ nhiều dạng biểu đồ khác nhau như Bar charts (biểu đồ cột), Pie charts (biểu đồ tròn) và Histograms (biểu đồ phân phối tần suất).
Khi lựa chọn Bar charts hoặc Pie charts, mục Chart Values phía dưới sẽ được kích hoạt, cho phép người dùng chọn cách hiển thị kết quả theo Frequencies (số lượng đáp viên) hoặc Percentages (tỷ lệ phần trăm). Trong trường hợp thống kê tần số cho các biến thông tin cá nhân, tác giả lựa chọn Pie charts kết hợp với Chart Values = Percentages nhằm thể hiện rõ cơ cấu tỷ lệ của mẫu nghiên cứu.
Sau khi thiết lập xong, nhấn Continue để quay lại cửa sổ ban đầu, sau đó nhấn OK để SPSS xuất kết quả thống kê ra cửa sổ Output.
Bảng đầu tiên cần quan tâm trong kết quả xuất ra là bảng Statistics. Bảng này cung cấp các thông tin tổng quát về biến được đưa vào phân tích thống kê. Trong đó, Valid thể hiện số quan sát hợp lệ, tức số đáp viên có trả lời câu hỏi, còn Missing cho biết số quan sát bị thiếu dữ liệu, tương ứng với số đáp viên không đưa ra câu trả lời.
Khi xuất hiện giá trị Missing, người nghiên cứu cần kiểm tra lại nguyên nhân phát sinh. Các giá trị thiếu này có thể xuất phát từ đặc điểm của câu hỏi (ví dụ câu hỏi không bắt buộc trả lời) hoặc do sai sót trong quá trình nhập liệu. Việc xác định đúng nguyên nhân sẽ giúp lựa chọn phương án xử lý dữ liệu phù hợp, đảm bảo chất lượng cho các phân tích tiếp theo.
Tiếp theo trong phần kết quả là bảng tần số và biểu đồ minh họa tương ứng cho từng biến được đưa vào phân tích. Mỗi biến khi thực hiện thống kê tần số sẽ được SPSS xuất ra một bảng riêng, kèm theo biểu đồ trực quan. Ví dụ, với biến Độ tuổi, bảng tần số sẽ phản ánh rõ cơ cấu các nhóm tuổi trong mẫu nghiên cứu.
Ý nghĩa các cột thông tin trong bảng tần số như sau:
- Frequency: Thể hiện số lượng quan sát của từng nhóm giá trị. Chẳng hạn, có 81 người thuộc nhóm từ 18–25 tuổi, 134 người thuộc nhóm từ 26–35 tuổi,…
- Percent: Cho biết tỷ lệ phần trăm của từng nhóm trên tổng số quan sát. Ví dụ, nhóm 18–25 tuổi chiếm 23,1%, nhóm 26–35 tuổi chiếm 38,3%,…
- Valid Percent: Tỷ lệ phần trăm được tính trên các giá trị hợp lệ, sau khi đã loại trừ các quan sát bị thiếu. Trong trường hợp dữ liệu không có giá trị Missing, cột Valid Percent sẽ trùng với cột Percent.
- Cumulative Percent: Tỷ lệ phần trăm tích lũy của các giá trị hợp lệ, được cộng dồn lần lượt cho đến khi đạt 100%. Ví dụ, nhóm 18–25 tuổi chiếm 23,1%; cộng dồn nhóm 18–25 tuổi và 26–35 tuổi sẽ đạt 61,4%,…
Trong tổng số 350 đáp viên tham gia khảo sát, có 81 người thuộc nhóm tuổi từ 18–25, chiếm 23,1%; 134 người trong độ tuổi 26–35, chiếm 38,3%; 89 người thuộc nhóm 36–45 tuổi, chiếm 25,4%; và 46 người trên 45 tuổi, tương ứng 13,1%.
Kết quả này cho thấy lực lượng nhân sự của công ty chủ yếu tập trung ở nhóm tuổi dưới 45, trong đó nhóm 26–35 tuổi chiếm tỷ trọng cao nhất. Đây được xem là giai đoạn lao động tối ưu, phản ánh sự kết hợp hài hòa giữa đội ngũ lao động trẻ giàu nhiệt huyết và nhóm lao động đã tích lũy được nhiều kinh nghiệm thực tiễn trong công việc.
Kết luận
Thông qua hướng dẫn thống kê tần số frequency trong SPSS, dịch vụ SPSS DVS hy vọng đã giúp bạn nắm rõ ý nghĩa, cách thực hiện và cách đọc kết quả thống kê một cách chính xác và hiệu quả. Đây là bước phân tích nền tảng nhưng vô cùng quan trọng, giúp nhà nghiên cứu hiểu rõ đặc điểm mẫu, kiểm soát chất lượng dữ liệu và đảm bảo tính phù hợp của nghiên cứu trước khi tiếp tục các phân tích chuyên sâu hơn. Việc thực hiện đúng và diễn giải hợp lý thống kê tần số sẽ góp phần nâng cao độ tin cậy và giá trị khoa học của toàn bộ nghiên cứu.








