Berapa Sebenarnya Sampel yang "Cukup"?

Pertanyaan ini selalu muncul di ruang bimbingan. Seorang mahasiswa datang dengan proposal penelitian, lalu bertanya dengan nada penuh harap, “Bu, kalau saya pakai 100 responden, cukup tidak ya?” Pertanyaan yang tampak sederhana, tetapi jawabannya tidak pernah bisa diberikan dalam satu kalimat.

Menentukan ukuran sampel bukan soal menebak angka yang terdengar “aman.” Ada logika di baliknya, dan logika itu berakar pada satu prinsip: sampel adalah sekumpulan observasi yang dipilih dari populasi untuk memperkirakan parameter dengan tingkat presisi dan keyakinan tertentu. Definisi ini terdengar teknis, tetapi maknanya praktis. Setiap angka yang kita ambil dari lapangan akan dipakai untuk menarik kesimpulan tentang populasi yang jauh lebih besar. Maka jumlahnya tidak boleh asal.

Ketika Populasi Tidak Diketahui Pastinya

Ada situasi di mana peneliti tidak tahu persis berapa besar populasinya, atau populasinya begitu besar sehingga dianggap tak terhingga. Contohnya, ketika seseorang ingin meneliti perilaku pengguna marketplace di Indonesia, atau opini publik tentang pembayaran digital. Untuk kasus seperti ini, ada dua jenis rumus yang lazim digunakan, tergantung pada jenis datanya.

Bila data yang diukur bersifat kontinu (misalnya rata-rata pengeluaran bulanan, durasi penggunaan aplikasi, atau skor kepuasan), rumusnya adalah:

n = (Z² × σ²) / E²

Di mana n adalah ukuran sampel yang dibutuhkan, Z adalah nilai Z untuk tingkat kepercayaan yang diinginkan, σ (sigma) adalah standar deviasi populasi, dan E adalah margin of error atau tingkat presisi yang ditetapkan. Standar deviasi menggambarkan seberapa beragam data di populasi. Bila tidak diketahui, peneliti dapat memakai estimasi dari pilot study atau menggunakan nilai konservatif.

Bila data bersifat diskret atau berupa proporsi (misalnya berapa persen konsumen yang lebih memilih dompet digital tertentu), rumusnya:

n = (Z² × p × (1-p)) / E²

Di mana p adalah estimasi proporsi atribut yang ingin diteliti, dengan nilai antara 0 dan 1. Bila estimasi awal tersedia, gunakan. Bila tidak, p = 0.5 menjadi pilihan aman karena menghasilkan ukuran sampel maksimum.

Nilai Z sendiri ditentukan oleh tingkat kepercayaan yang diinginkan peneliti:

Tingkat Kepercayaan (1 − α)	Nilai Z
90%	1.645
95%	1.96
99%	2.576

Semakin tinggi tingkat kepercayaan yang ditetapkan, semakin besar pula ukuran sampel yang dibutuhkan.

Ketika Populasi Sudah Diketahui

Situasi berbeda muncul ketika peneliti tahu persis berapa anggota populasinya. Misalnya, mahasiswa aktif satu program studi di satu angkatan, karyawan satu perusahaan, atau anggota satu komunitas. Untuk kasus seperti ini, rumus tadi perlu disesuaikan dengan Finite Population Correction (FPC).

Kapan koreksi ini diperlukan? Aturan praktisnya: ketika ukuran sampel yang dihitung melebihi 5% dari total populasi (n/N > 0.05). Tanpa koreksi ini, peneliti cenderung mengambil sampel yang lebih besar dari yang sebenarnya diperlukan, dan ini berarti pemborosan waktu serta biaya.

Untuk data kontinu, rumusnya menjadi:

n = [(Z² × σ²) / E²] × [N / (N − 1 + (Z² × σ²) / E²)]

Untuk data diskret atau proporsi:

n = [(Z² × p × (1-p)) / E²] × [N / (N − 1 + (Z² × p × (1-p)) / E²)]

Di mana N adalah ukuran populasi yang sudah diketahui. Hasilnya, ukuran sampel akhir biasanya lebih kecil dibandingkan jika populasi diperlakukan sebagai tak terhingga.

Beberapa Pegangan Praktis

Di luar rumus, ada beberapa hal yang sering luput dari perhatian mahasiswa.

Pertama, tujuan penelitian harus didefinisikan dengan jelas sejak awal: parameter apa yang ingin diestimasi, berapa tingkat kepercayaan yang ditetapkan, dan berapa margin of error yang dapat diterima. Ketiganya saling mempengaruhi. Margin of error yang lebih kecil menuntut sampel yang lebih besar. Tingkat kepercayaan yang lebih tinggi juga menuntut hal serupa. Begitu pula bila variabilitas data tinggi, baik dalam bentuk standar deviasi yang besar maupun proporsi yang mendekati 0.5.

Kedua, estimasi parameter sebaiknya tidak ditebak-tebak. Pilot study atau data dari penelitian terdahulu menjadi sumber yang lebih dapat dipertanggungjawabkan.

Ketiga, perhitungan ideal sering bertabrakan dengan kenyataan lapangan. Tingkat non-response selalu ada, maka sampel yang ditargetkan perlu sedikit dilebihkan sebagai antisipasi.

Keempat, asumsi pengambilan sampel acak dan kualitas data harus dipastikan. Ukuran sampel yang besar pun tidak menyelamatkan penelitian dari bias sampling.

Terakhir, hasil perhitungan dibulatkan ke atas. Sampel tidak bisa berbentuk pecahan.

Kembali ke Ruang Bimbingan

Pertanyaan mahasiswa di awal tulisan ini, “Bu, 100 responden cukup tidak ya?” sebenarnya bukan pertanyaan tentang angka, melainkan tentang justifikasi. Penelitian yang baik tidak diukur dari berapa banyak responden yang berhasil dikumpulkan, melainkan dari apakah jumlah itu cukup untuk menghasilkan estimasi yang valid dan dapat digeneralisasi, dengan tetap mempertimbangkan waktu, biaya, dan kelayakan lapangan. Setiap angka harus bisa dijelaskan dari mana asalnya.

Mendokumentasikan asumsi dan perhitungan secara terbuka adalah bagian dari kejujuran akademik. Pembaca, penguji, atau reviewer jurnal berhak tahu bagaimana peneliti sampai pada angka tersebut. Di situlah letak perbedaan antara sampel yang sekadar memenuhi kuota dan sampel yang dipertanggungjawabkan.

Berapa Sebenarnya Sampel yang “Cukup”?