Memilih Label yang Tepat: 25 Variasi Skala Likert untuk Kuesioner Riset Kuantitatif

Pernahkah Anda mengisi kuesioner penelitian, lalu berhenti sejenak di sebuah pertanyaan karena pilihan jawabannya terasa janggal? Misalnya, ditanya seberapa sering berolahraga dengan opsi “sangat setuju” sampai “sangat tidak setuju”. Anda pasti bingung. Bukan karena pertanyaannya sulit, melainkan karena label jawabannya tidak cocok dengan apa yang ditanyakan.

Inilah salah satu kesalahan kecil yang sering luput dari perhatian peneliti pemula. Skala Likert kerap dianggap sebagai satu format tunggal, padahal ia adalah keluarga besar dengan banyak variasi. Renis Likert, psikolog yang memperkenalkannya pada tahun 1932, sebenarnya merancang skala ini sebagai instrumen yang fleksibel. Pilihan jawaban harus disesuaikan dengan konstruk yang hendak diukur, bukan dipaksakan satu pola untuk semua pertanyaan.

Sebuah infografis menarik baru-baru ini merangkum 25 variasi label skala Likert yang lazim digunakan dalam riset kuantitatif. Semua menggunakan format lima titik (dari skor 0 hingga 4), tetapi dengan label yang berbeda mengikuti konteks pertanyaan. Mari kita kelompokkan dan telusuri bersama.

Kelompok 1: Skala untuk Mengukur Sikap dan Persepsi

1. Acceptability (“unacceptable” hingga “acceptable”) cocok untuk menilai penerimaan terhadap suatu kebijakan atau praktik. Dalam riset kebijakan publik, label ini bisa dipakai untuk mengukur penerimaan masyarakat terhadap kenaikan pajak rokok atau pembatasan kendaraan pribadi di pusat kota.

2. Agreement (“strongly disagree” hingga “strongly agree”) paling sering dipakai untuk mengukur persepsi atau opini. Label ini cocok untuk konstruk seperti komitmen organisasi. Allen dan Meyer (1990), misalnya, memakai skala agreement untuk item seperti “Saya merasa terikat secara emosional dengan organisasi ini.” Responden diminta menilai sejauh mana pernyataan itu menggambarkan dirinya.

3. Attitude (“very negative” hingga “very positive”) menangkap valensi sikap. Riset perilaku konsumen sering memakai label ini, contohnya mengukur sikap konsumen terhadap iklan layanan publik tentang vaksinasi.

4. Liking (“strongly dislike” hingga “strongly like”) mengukur preferensi personal terhadap suatu objek. Dalam riset pemasaran, label ini dipakai untuk mengukur kesukaan konsumen terhadap desain kemasan baru sebelum diluncurkan ke pasar.

5. Support (“strongly oppose” hingga “strongly support”) mengukur dukungan terhadap kebijakan atau gagasan. Liking dan support sering tertukar penggunaannya, padahal “menyukai” dan “mendukung” adalah dua hal berbeda. Seseorang bisa saja tidak menyukai kebijakan work from office (WFO) penuh, tetapi tetap mendukungnya karena alasan kolaborasi tim. Riset employee voice memanfaatkan distingsi ini untuk memahami dinamika sikap karyawan terhadap perubahan kebijakan.

Kelompok 2: Skala untuk Mengukur Pengalaman dan Kondisi Internal

6. Comfort (“very uncomfortable” hingga “very comfortable”) berguna dalam riset ergonomi atau pengalaman pengguna. Studi tentang hot-desking di perusahaan teknologi, misalnya, mengukur tingkat kenyamanan karyawan ketika tidak memiliki meja tetap. Hasilnya kerap mengejutkan: karyawan muda lebih nyaman dengan sistem ini dibanding karyawan senior.

7. Confidence (“not confident at all” hingga “extremely confident”) sering dipakai dalam riset pendidikan dan psikologi kerja. Bandura (1997) memakai pendekatan serupa untuk mengukur self-efficacy, misalnya keyakinan mahasiswa dalam menyelesaikan tugas statistik. Dalam konteks HRM, label ini berguna untuk mengukur efikasi karyawan dalam menggunakan sistem ERP baru pasca-pelatihan.

8. Motivation (“not motivated at all” hingga “extremely motivated”) menjadi konstruk klasik dalam Perilaku Organisasi. Riset intrinsic motivation dari Deci dan Ryan (2000) memakai label ini untuk mengukur dorongan internal karyawan dalam menyelesaikan pekerjaan tanpa imbalan eksternal.

9. Satisfaction (“very dissatisfied” hingga “very satisfied”) menjadi salah satu konstruk paling banyak diteliti dalam HRM. Spector (1985) memakai label satisfaction dengan dimensi yang spesifik: kepuasan terhadap gaji, promosi, supervisi, dan rekan kerja. Dalam riset pemasaran, label ini juga jadi tulang punggung pengukuran kepuasan pelanggan.

10. Stress level (“no stress” hingga “extreme stress”) mengukur intensitas tekanan yang dirasakan. Riset Cohen, Kamarck, dan Mermelstein (1983) tentang Perceived Stress Scale menjadi rujukan klasik di sini. Dalam dunia kerja, label ini sering dipakai untuk memetakan tingkat stres perawat di unit gawat darurat atau guru honorer di daerah terpencil.

11. Trust (“do not trust at all” hingga “completely trust”) menyentuh dimensi relasional. Riset Mayer, Davis, dan Schoorman (1995) tentang organizational trust menggunakan label ini untuk mengukur kepercayaan bawahan terhadap atasan langsung. Pemilihan label ini krusial, sebab “puas”, “termotivasi”, dan “percaya” adalah tiga konsep berbeda meski sering dianggap berkaitan.

Kelompok 3: Skala untuk Mengukur Penilaian Objek atau Kejadian

12. Effectiveness (“not effective at all” hingga “extremely effective”) sering dipakai dalam riset kebijakan dan intervensi. Evaluasi program pelatihan karyawan, misalnya, menanyakan sejauh mana materi pelatihan efektif meningkatkan kinerja. Riset Kirkpatrick (1994) tentang evaluasi pelatihan empat tingkat banyak memanfaatkan label ini di tingkat reaksi dan pembelajaran.

13. Performance menarik karena menggunakan rentang komparatif: “much worse” hingga “much better”, dengan “no change” sebagai titik tengah. Skala ini cocok untuk mengukur perubahan sebelum-sesudah, bukan kondisi statis. Riset eksperimen kuasi tentang dampak intervensi mindfulness pada produktivitas karyawan menggunakan label ini untuk membandingkan kondisi pra- dan pasca-intervensi.

14. Quality (“very poor” hingga “excellent”) menjadi tulang punggung riset kualitas layanan. Parasuraman, Zeithaml, dan Berry (1988) dalam SERVQUAL memakai pendekatan ini untuk mengukur kualitas layanan perbankan, restoran, hingga rumah sakit.

15. Reliability (“very unreliable” hingga “very reliable”) cocok untuk evaluasi produk teknologi, misalnya menilai keandalan sistem cloud yang dipakai di kantor. Label ini juga relevan dalam riset supplier evaluation untuk menilai konsistensi pemasok dalam rantai pasok.

16. Safety (“very unsafe” hingga “very safe”) relevan dalam riset occupational health and safety. Studi tentang persepsi keselamatan kerja di tambang batu bara, misalnya, menggunakan label ini untuk memetakan area kerja yang dianggap berisiko oleh pekerja.

17. Usefulness (“not useful at all” hingga “extremely useful”) menjadi salah satu komponen utama dalam Technology Acceptance Model (Davis, 1989) untuk mengukur persepsi kebermanfaatan teknologi baru. Dalam HRM, label ini sering dipakai untuk mengevaluasi sistem HRIS yang baru diimplementasikan.

Kelompok 4: Skala untuk Mengukur Frekuensi dan Probabilitas

18. Frequency (“never” hingga “always”) mengukur seberapa sering, bukan seberapa setuju. Riset organizational citizenship behavior (OCB) Podsakoff dkk. (1990) memakai label ini untuk menanyakan seberapa sering karyawan menolong rekan kerja tanpa diminta. Kesalahan umum yang sering terjadi: peneliti memakai label “agreement” untuk pertanyaan OCB, padahal pertanyaannya bersifat perilaku (“Saya membantu rekan kerja yang kelebihan beban”) yang lebih tepat diukur dengan frekuensi.

19. Likelihood (“very unlikely” hingga “very likely”) mengukur probabilitas terjadinya sesuatu. Dalam riset turnover intention, Mobley (1977) menggunakan pendekatan likelihood untuk mengukur kemungkinan karyawan keluar dalam enam bulan ke depan. Label ini juga sering dipakai dalam riset niat beli (purchase intention) di pemasaran.

Kelompok 5: Skala untuk Mengukur Tingkat Pengetahuan dan Pemahaman

20. Familiarity (“not familiar at all” hingga “extremely familiar”) cocok untuk mengukur pengenalan konsumen terhadap merek baru sebelum kampanye pemasaran dilakukan. Dalam riset employer branding, label ini juga dipakai untuk mengukur seberapa kenal lulusan baru terhadap perusahaan tertentu sebagai calon tempat bekerja.

21. Knowledge (“no knowledge” hingga “expert knowledge”) mengukur penguasaan responden terhadap topik tertentu. Riset tentang literasi keuangan memakai label ini untuk mengukur pemahaman konsep dasar seperti bunga majemuk dan inflasi. Dalam HRM, label ini berguna untuk training needs analysis, mengukur level pengetahuan karyawan sebelum pelatihan dirancang.

Kelompok 6: Skala untuk Mengukur Evaluasi Materi atau Tugas

22. Clarity (“very unclear” hingga “very clear”) sering dipakai dalam riset pendidikan untuk menilai kejelasan instruksi atau materi ajar. Dalam HRM, label ini bisa dipakai untuk mengevaluasi kejelasan deskripsi pekerjaan (job description) bagi karyawan baru.

23. Difficulty (“very easy” hingga “very difficult”) berguna untuk evaluasi modul pembelajaran daring, mengukur tingkat kesulitan materi. Hasilnya menjadi dasar revisi modul. Dalam dunia kerja, label ini juga dipakai untuk menilai tingkat kesulitan tugas dalam analisis beban kerja (workload analysis).

24. Importance (“not important at all” hingga “extremely important”) berguna ketika peneliti ingin memahami prioritas responden. Riset compensation and benefits, misalnya, meminta karyawan menilai tingkat kepentingan berbagai komponen tunjangan: asuransi kesehatan, dana pensiun, cuti berbayar, hingga fleksibilitas jam kerja. Hasilnya membantu HR merancang paket benefit yang sesuai preferensi karyawan.

25. Expectations (“far below expectations” hingga “far above expectations”) cocok untuk riset kepuasan pelanggan dengan kerangka expectancy-disconfirmation. Oliver (1980) menggunakan pendekatan ini untuk menjelaskan mengapa pelanggan dengan ekspektasi rendah justru sering lebih puas dibanding pelanggan dengan ekspektasi tinggi. Dalam HRM, label ini bisa dipakai untuk mengukur kesesuaian antara ekspektasi karyawan baru dengan realitas pekerjaan setelah tiga bulan bekerja, atau yang dikenal sebagai psychological contract fulfillment.

Mengapa Pemilihan Label Ini Penting?

Kembali ke ilustrasi awal: kuesioner yang menanyakan frekuensi olahraga dengan label “setuju-tidak setuju” akan menghasilkan data yang tidak valid secara konstruk. Responden mungkin tetap menjawab, tetapi jawaban itu tidak mencerminkan apa yang ingin diukur peneliti. Ini bukan sekadar soal estetika kuesioner, melainkan soal validitas instrumen.

Joseph Hair dan koleganya dalam Multivariate Data Analysis (2019) menekankan bahwa kesesuaian antara konstruk dan skala pengukuran adalah fondasi content validity. Salah memilih label berarti membangun rumah riset di atas pasir. Analisis statistik secanggih apa pun tidak akan menyelamatkan data yang sejak awal tidak valid.

Bagi peneliti, mahasiswa yang sedang menyusun skripsi, atau praktisi yang merancang survei internal, infografis 25 variasi label ini bisa menjadi rujukan praktis. Namun, perlu diingat bahwa daftar tersebut bukan menu lengkap. Ada juga skala dengan jumlah titik berbeda (4, 6, 7, atau bahkan 11 titik), skala bipolar dengan dua kutub berlawanan, hingga skala visual seperti semantic differential. Pemilihan format dan jumlah titik juga membawa konsekuensi metodologis tersendiri, terutama terkait netralitas tengah dan sensitivitas pengukuran.

Kuesioner yang baik bukan hanya soal pertanyaan yang tepat, tetapi juga pilihan jawaban yang sesuai. Sebelum menyebar instrumen, luangkan waktu untuk mencocokkan setiap pertanyaan dengan label yang paling representatif. Tanyakan pada diri sendiri: apakah saya ingin mengukur sikap, frekuensi, kemungkinan, atau pengalaman? Jawaban atas pertanyaan inilah yang menentukan label mana yang harus dipakai.

Riset kuantitatif yang baik dimulai dari instrumen yang presisi. Dan presisi itu, kadang, hanya berjarak satu pilihan label.