ước tính cỡ mẫu cho hồi quy, trên thực tế có nhiều bài hướng dẫn về cỡ mẫu cho kiểm định t-test, anova, hay Chi2 test … nhưng ít có thông tin về cỡ mẫu cho mô hình hồi quy; Trong bài viết này chúng tôi sẽ hướng dẫn các bạn ước tính cỡ mẫu cho phương pháp hồi quy, các bước này được thực hiện đơn giản trên phần mềm thống kê R.
I. ƯỚC TÍNH CỠ MẪU
1.1 Ước tính cỡ mẫu phù hợp
Trong nghiên cứu khoa học thì cỡ mẫu càng nhiều càng tốt, nhưng có tính nghịch đó là chi phí sẽ rất cao, Thực hiện nghiên cứu khoa học thì kèm theo đó là chi phí, bởi vậy chúng ta phải cân đối chi phí với cỡ mẫu, làm cho cho cỡ mẫu có độ tin cậy mà đồng thời chi phí thực hiện là thấp nhất.
Ước tính cỡ mẫu lớn
Kích thước mẫu lớn hơn thường dẫn đến tăng độ chính xác khi ước tính các tham số chưa biết. Ví dụ, nếu chúng ta muốn biết tỷ lệ của một loài cá nhất định bị nhiễm mầm bệnh, chúng ta thường có ước tính chính xác hơn về tỷ lệ này nếu chúng ta lấy mẫu và kiểm tra 200 chứ không phải 100 con. Một số sự kiện cơ bản của thống kê toán học mô tả hiện tượng này, bao gồm định luật về số lượng lớn và định lý giới hạn trung tâm .
Trong một số tình huống, việc tăng độ chính xác cho kích thước mẫu lớn hơn là tối thiểu hoặc thậm chí không tồn tại. Điều này có thể xuất phát từ sự hiện diện của các lỗi hệ thống hoặc sự phụ thuộc mạnh mẽ vào dữ liệu hoặc nếu dữ liệu tuân theo phân phối có đuôi nặng.
Cỡ mẫu có thể được đánh giá bằng chất lượng của các ước tính kết quả. Ví dụ: nếu một tỷ lệ đang được ước tính, người ta có thể muốn có khoảng tin cậy 95% rộng hơn 0,06 đơn vị. Ngoài ra, cỡ mẫu có thể được đánh giá dựa trên sức mạnh của kiểm tra giả thuyết. Ví dụ: nếu chúng ta so sánh sự hỗ trợ cho một ứng cử viên chính trị nào đó giữa phụ nữ với sự hỗ trợ cho ứng cử viên đó ở nam giới, chúng ta có thể muốn có 80% sức mạnh để phát hiện sự khác biệt về mức hỗ trợ 0,04 đơn vị.
1.2 Xác định cỡ mẫu
Xác định cỡ mẫu là hành động chọn số lượng quan sát hoặc sao chép để đưa vào mẫu thống kê . Cỡ mẫu là một tính năng quan trọng của bất kỳ nghiên cứu thực nghiệm nào trong đó mục tiêu là đưa ra những suy luận về dân số từ một mẫu. Trong thực tế, cỡ mẫu được sử dụng trong một nghiên cứu thường được xác định dựa trên chi phí, thời gian hoặc sự thuận tiện của việc thu thập dữ liệu và nhu cầu của nó để cung cấp đủ sức mạnh thống kê . Trong các nghiên cứu phức tạp có thể có một số cỡ mẫu khác nhau: ví dụ, trong một khảo sát phân tầng sẽ có các kích cỡ khác nhau cho mỗi tầng. Trong một cuộc điều tra dân số, dữ liệu được tìm kiếm cho toàn bộ dân số, do đó cỡ mẫu dự định bằng với dân số. Trong thiết kế thí nghiệm , trong đó một nghiên cứu có thể được chia thành các nhóm điều trị khác nhau , có thể có các cỡ mẫu khác nhau cho mỗi nhóm.
Cỡ mẫu có thể được chọn theo nhiều cách:
- Sử dụng kinh nghiệm – các mẫu nhỏ, mặc dù đôi khi không thể tránh khỏi, có thể dẫn đến khoảng tin cậy rộng và nguy cơ sai sót trong kiểm tra giả thuyết thống kê .
- Sử dụng phương sai mục tiêu cho một ước tính được lấy từ mẫu cuối cùng thu được, nghĩa là nếu cần độ
- Chính xác cao (khoảng tin cậy hẹp) thì điều này có nghĩa là phương sai mục tiêu thấp của công cụ ước tính.
- Sử dụng mục tiêu cho sức mạnh của kiểm tra thống kê sẽ được áp dụng khi mẫu được thu thập.
- Sử dụng mức độ tin cậy, nghĩa là mức độ tin cậy cần thiết càng lớn thì cỡ mẫu càng lớn (đưa ra yêu cầu độ chính xác không đổi).
II VÀI KHÁI NIỆM LIÊN QUAN
2.1 Effect size (Hiệu ứng)
Trong thống kê , kích thước hiệu ứng là thước đo định lượng về độ lớn của một hiện tượng . Nó có thể đề cập đến giá trị của một thống kê được tính toán từ một mẫu dữ liệu , giá trị của một tham số của dân số thống kê giả thuyết hoặc phương trình vận hành cách thống kê hoặc tham số dẫn đến giá trị kích thước hiệu ứng. Ví dụ về kích thước hiệu ứng bao gồm các mối tương quan giữa hai biến, các hồi quy hệ số trong một hồi quy, các trung bình chênh lệch, hoặc nguy cơ của một sự kiện đặc biệt (ví dụ như nhồi máu cơ tim) xảy ra. Hiệu ứng kích thước bổ sungkiểm tra giả thuyết thống kê và đóng vai trò quan trọng trong phân tích công suất , lập kế hoạch cỡ mẫu và trong phân tích tổng hợp .
Kích thước hiệu ứng là một thành phần thiết yếu khi đánh giá sức mạnh của yêu cầu thống kê và nó là mục đầu tiên (độ lớn) trong tiêu chí MAGIC . Các độ lệch chuẩn của mức độ ảnh hưởng là cực kỳ quan trọng, vì nó chỉ ra bao nhiêu sự không chắc chắn được bao gồm trong đo lường. Độ lệch chuẩn quá lớn sẽ làm cho phép đo gần như vô nghĩa. Trong phân tích tổng hợp, trong đó mục đích là kết hợp nhiều kích thước hiệu ứng, độ không đảm bảo về kích thước hiệu ứng được sử dụng để cân nhắc kích thước hiệu ứng, do đó các nghiên cứu lớn được coi là quan trọng hơn các nghiên cứu nhỏ. Độ không đảm bảo về kích thước hiệu ứng được tính khác nhau cho từng loại kích thước hiệu ứng, nhưng nhìn chung chỉ yêu cầu biết kích thước mẫu của nghiên cứu ( N) hoặc số lượng quan sát ( n ) trong mỗi nhóm.
Báo cáo kích thước hiệu ứng hoặc ước tính của chúng (ước tính hiệu ứng [EE] , ước tính hiệu quả) được coi là thông lệ tốt khi trình bày kết quả nghiên cứu thực nghiệm trong nhiều lĩnh vực. Báo cáo về kích thước hiệu ứng tạo điều kiện cho việc giải thích tầm quan trọng của kết quả nghiên cứu, trái ngược với ý nghĩa thống kê của nó .Kích thước hiệu ứng đặc biệt nổi bật trong khoa học xã hội và trong nghiên cứu y học (trong đó kích thước của hiệu quả điều trị là quan trọng).
Công thức tính Cohen’s f2 có hồi quy bội
Cohen’s f2 = R2 / ( 1-R2)
2.2 Power (độ nhạy)
Power là độ nhạy của nghiên cứu thông thường ta dùng là 90%. Và trong ví dụ này thì chúng tôi vẫn dùng là 90%.
3. Thực hành ước tính cỡ mẫu cho phương pháp hồi quy
3.1 Nghiên cứu trước
Chúng ta dùng một (hay nhiều) nghiên cứu trước để tham khảo chỉ số R2
Chúng ta có một kết quả nghiên cứu như sau:
Từ nghiên cứu trên ta chỉ lấy :
- R2= 0.3
- u=9
- Power = 0.9
3.2 Ước tính Cohen’s f2
f2 = 0.3 /( 1-0.3) = 0.4285
3.3 Ước tính cỡ mẫu thông qua kiểm định F
##
## Multiple regression power calculation
##
## u = 9
## v = 62.25466
## f2 = 0.4285714
## sig.level = 0.01
## power = 0.9
Từ kết quả này ta có cỡ mẫu (n)
n = u + v + 1 = 9 + 63 + 1 = 73
IV Kết luận ước tính cỡ mẫu
Để có một nghiên cứu mới với độ tin cậy là 1% và độ nhạy của nghiên cứu là 90%, chúng ta phải sử dụng ÍT NHẤT là 73 quan sát để mô hình nghiên cứu có độ tin cậy thống kê.
Ước tính cỡ mẫu và việc làm quan trọng và được thực hiện đầu tiên trong các nghiên cứu khoa học, nhằm đảm bảo tính cân bằng giữa kinh tế và khoa học.