Phân tích thống kê mô tả, đây là một phân tích chủ chốt mà bất cứ bài nghiên cứu khoa học nào về định lượng điều sử dụng, đối với những người đã quen về thống kê thì việc phân tích thông kê mô tả là bình thường, nhìn nó có vẽ đơn giản và không đóng góp gì cho kết quả nghiên cứu khoa học. Thật ra nếu chúng ta đủ ” kiến thức” thì khi nhìn vào thống kê mô tả chúng ta sẽ biết được nhiều thứ, không đơn giản phân tích thống kê mô tả chỉ để cho vui, cho đủ các bước trong phân tích thống kê hay ước lượng.
Phân tích thống kê mô tả là gì ?
Một thống kê mô tả (trong danh từ đếm cảm giác) là một thống kê tóm tắt rằng số lượng mô tả hoặc tóm tắt các tính năng từ một tập hợp các thông tin , trong khi thống kê mô tả (trong danh từ không đếm được cảm giác) là quá trình sử dụng và phân tích những thống kê. Thống kê mô tả được phân biệt với thống kê suy luận (hoặc thống kê quy nạp) bởi mục đích của nó là tóm tắt một mẫu , thay vì sử dụng dữ liệu để tìm hiểu về dân sốmẫu dữ liệu được cho là đại diện. Điều này thường có nghĩa là thống kê mô tả, không giống như thống kê suy luận, không được phát triển trên cơ sở lý thuyết xác suất và thường là thống kê không tham số . Ngay cả khi phân tích dữ liệu rút ra kết luận chính bằng cách sử dụng số liệu thống kê suy luận, số liệu thống kê mô tả thường được trình bày. Ví dụ, trong các báo cáo về các đối tượng của con người, thông thường có một bảng đưa ra kích thước mẫu tổng thể , cỡ mẫu trong các nhóm nhỏ quan trọng (ví dụ: đối với từng nhóm điều trị hoặc nhóm phơi nhiễm) và các đặc điểm nhân khẩu học hoặc lâm sàng như trung bìnhtuổi tác, tỷ lệ đối tượng của mỗi giới tính, tỷ lệ đối tượng mắc bệnh đồng mắc có liên quan , v.v.
Một số biện pháp thường được sử dụng để mô tả một tập dữ liệu là các biện pháp của xu hướng trung tâm và các biện pháp biến đổi hoặc phân tán . Các biện pháp của xu hướng trung tâm bao gồm giá trị trung bình , trung vị và chế độ , trong khi các biện pháp biến thiên bao gồm độ lệch chuẩn (hoặc phương sai ), giá trị tối thiểu và tối đa của các biến, kurtosis và độ lệch .
Các chỉ tiêu phân tích thông dụng
Phân tích đơn biến liên quan đến việc mô tả phân phối của một biến duy nhất, bao gồm xu hướng trung tâm của nó (bao gồm giá trị trung bình , trung vị và mode ) và phân tán (bao gồm phạm vi và các phần tư của tập dữ liệu và các biện pháp lan truyền như phương sai và độ lệch chuẩn ). Hình dạng của phân phối cũng có thể được mô tả thông qua các chỉ số như skewness và kurtosis . Các đặc điểm của phân phối biến cũng có thể được mô tả ở định dạng đồ họa hoặc dạng bảng, bao gồm biểu đồ và hiển thị thân và lá.
Kết quả chạy thống kê mô tả trên các phần mềm thông dụng
Chúng ta sẽ chạy ra kết quả phân tích thống kê mô tả trên các phần mềm phân tích thống kê chuyên dụng như: SPSS, STATA, EVEWS …
SPSS:
Descriptive Statistics |
||||||
N | Minimum | Maximum | Mean | Std. Deviation | ||
Statistic | Statistic | Statistic | Statistic | Std. Error | Statistic | |
LnGDP | 400 | 5.5563 | 15.1409 | 10.031576 | .0776649 | 1.5532973 |
LnK | 400 | -.6968 | 10.5827 | 4.923737 | .1026362 | 2.0527238 |
LnL | 400 | -4.2032 | 15.0049 | 5.771514 | .1530821 | 3.0616425 |
Valid N (listwise) | 400 |
STATA:
EVIEWS:
Còn rất nhiều phần mềm có thể phân tích thống kê mô tả, nhưng ở trên đây chúng tôi chỉ dùng 3 phần mêm phân tích thông dụng nhất; Ngoài ra chúng ta có thể sử dụng nhiều phần mềm miễn phí cũng có thể phân tích thống kê mô tả dễ dàng.
Các chỉ tiêu thống kê mô tả gồm có các mục chính: OBS, Mean, SD, Min, Max, Phân vị, Đọ nhọn, Độ Nghiêng … Đây là 5 mục tiêu phân tích chính mà chúng ta cần phân tích, còn những chỉ tiêu khác nếu thích thì các bạn phân tích thêm, riêng chúng tôi khuyên chúng ta cần tập trung nhiều hơn về kết quả nghiên cứu.
Phân tích các chỉ tiêu thống kê
Lượng quan sát
Đây là số lượng quan sát trong mẫu nghiên cứu, trong một quan sát có thể có những lượng quan sát khác nhau, hay còn gọi là dữ liệu khuyết. Tuỳ từng mục đích mà có cách sử lý khác nhau.
Giá trị trung bình
Giá trị trung bình là bình quân toán học đơn giản của một tập hợp gồm hai hoặc nhiều số. Giá trị trung bình của một tập hợp số đã cho có thể được tính theo nhiều cách, gồm có phương pháp trung bình số học sử dụng tổng các số trong chuỗi và phương pháp trung bình hình học. Tuy nhiên, tất cả các phương pháp chính để tính giá trị trung bình đơn giản của một chuỗi số bình thường đều tạo ra kết quả xấp xỉ bằng nhau.
Sai số chuẩn
Độ lệch chuẩn là một phép đo lường trong thống kê và trong tài chính được áp dụng cho tỉ lệ hoàn vốn hàng năm của một khoản đầu tư, để làm sáng tỏ những sự biến động trong lịch sử khoản đầu tư đó.
Độ lệch chuẩn của một cổ phiếu càng lớn, hay phương sai giữa giá cổ phiếu và giá trị trung bình càng lớn, cho thấy phạm vi giá giao động càng rộng. Ví dụ, một cổ phiếu bất ổn có độ lệch chuẩn cao, trong khi độ lệch chuẩn của một cổ phiếu blue-chip ổn định thường khá thấp.
Độ lệch chuẩn được tính là căn bậc hai của phương sai, được tính bằng cách xác định sự chênh lệch giữa mỗi điểm dữ liệu so với giá trị trung bình. Nếu một điểm dữ liệu nằm xa giá trị trung bình, điểm đó có độ lệch cao trong tập dữ liệu, dữ liệu càng có độ dàn trải rộng thì độ lệch chuẩn càng cao.
Giá trị nhỏ nhất
Đây là nhỏ trị nhỏ nhất, đây là chỉ số nghe thì đơn giản, nhưng thật sự rất quan trọng, chỉ số này cho biết quan sát của chúng ta thu thập có chính xác hay không? Như ví dụ trên, ta có LnK và LnL là âm, ta có lao động và vốn thì không thể nào âm được, nhưng may mắn là dữ liệu của chúng ta đã Ln nên có thể âm khi a < 1.
Giá trị lớn nhất
Đây là giá trị lớn nhất, Nó cũng quan trọng không kém, ví dụ như ta có một biến về tỉ lệ phần trăm, vì thế nên nó không thể nào >100% được.
Trên đây, là chúng ta phân tích thống kê mô tả theo cách chuẩn mực nhất, nếu các bạn có những sáng kiến mới có thể áp dụng vào nghiên cứu định lượng.