Published on
13 January 2011

Salah satu aspek yang paling penting untuk menggambarkan distribusi data
adalah nilai pusat data pengamatan (Central Tendency). Setiap pengukuran
aritmatika yang ditujukan untuk menggambarkan suatu nilai yang mewakili nilai
pusat atau nilai sentral dari suatu gugus data (himpunan pengamatan) dikenal
sebagai ukuran pemusatan data (tendensi sentral). Terdapat tiga
ukuran pemusatan data yang sering digunakan, yaitu:
- Mean (Rata-rata hitung/rata-rata aritmetika)
- Median
- Mode
Pada artikel ini akan di bahas mengenai pengertian beberapa ukuran
pemusatan data yang dilengkapi dengan contoh perhitungan, baik untuk data
tunggal ataupun data yang sudah dikelompokkan dalam tabel distribusi frekuensi.
Selain ukuran statistik di atas, akan dibahas juga mengenai beberapa ukuran
statistik lainnya, seperti Rata-rata Ukur (Geometric Mean),
Rata-rata Harmonik (H) serta beberapa karakteristik penting yang perlu
dipahami untuk ukuran tendensi sentral yang baik serta bagaimana memilih atau
menggunakan nilai tendensi sentral yang tepat.
(1) Mean (arithmetic mean)
Rata-rata hitung atau arithmetic mean atau sering disebut dengan
istilah mean saja merupakan metode yang paling banyak digunakan untuk
menggambarkan ukuran tendensi sentral. Mean dihitung dengan menjumlahkan semua
nilai data pengamatan kemudian dibagi dengan banyaknya data. Definisi tersebut
dapat di nyatakan dengan persamaan berikut:
Sampel:
Populasi:
Keterangan:
∑ = lambang penjumlahan semua gugus data pengamatan
n = banyaknya sampel data N = banyaknya data populasi
=
nilai rata-rata sampel μ = nilai rata-rata populasi Mean dilambangkan
dengan
(dibaca
"x-bar") jika kumpulan data ini merupakan contoh
(sampel) dari populasi, sedangkan jika semua data berasal dari populasi,
mean dilambangkan dengan μ (huruf kecil Yunani mu).
Sampel statistik biasanya dilambangkan dengan huruf
Inggris,
,
sementara parameter-parameter populasi biasanya dilambangkan dengan huruf
Yunani, misalnya μ
a. Rata-rata
hitung (Mean) untuk data tunggal
Contoh 1:
Hitunglah nilai rata-rata dari nilai ujian
matematika kelas 3 SMU berikut ini: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9
Jawab:
Nilai rata-rata dari data yang sudah dikelompokkan
bisa dihitung dengan menggunakan formula berikut:
Keterangan: ∑ = lambang penjumlahan semua gugus data pengamatan fi
= frekuensi data ke-i n = banyaknya sampel data
=
nilai rata-rata sampel
Contoh 2:
Berapa rata-rata hitung pada tabel frekuensi
berikut:
|
xi
|
fi
|
|
70
|
5
|
|
69
|
6
|
|
45
|
3
|
|
80
|
1
|
|
56
|
1
|
Catatan: Tabel frekuensi pada tabel di atas merupakan tabel
frekuensi untuk data tunggal, bukan tabel frekuensi dari data yang sudah
dikelompokkan berdasarkan selang/kelas tertentu.
Jawab:
|
xi
|
fi
|
fixi
|
|
70
|
5
|
350
|
|
69
|
6
|
414
|
|
45
|
3
|
135
|
|
80
|
1
|
80
|
|
56
|
1
|
56
|
|
Jumlah
|
16
|
1035
|
b. Mean dari
data distribusi Frekuensi atau dari gabungan:
Distribusi Frekuensi: Rata-rata hitung dari data yang sudah disusun dalam bentuk
tabel distribusi frekuensi dapat ditentukan dengan menggunakan formula yang
sama dengan formula untuk menghitung nilai rata-rata dari data yang sudah
dikelompokkan, yaitu: 
Keterangan:
∑ = lambang penjumlahan semua gugus data pengamatan
fi = frekuensi data ke-i
=
nilai rata-rata sampel
Contoh 3:
Tabel berikut ini adalah nilai ujian statistik 80
mahasiswa yang sudah disusun dalam tabel frekuensi. Berbeda dengan contoh 2,
pada contoh ke-3 ini, tabel distribusi frekuensi dibuat dari data yang sudah
dikelompokkan berdasarkan selang/kelas tertentu (banyak kelas = 7 dan panjang
kelas = 10).
|
Kelas ke-
|
Nilai
Ujian
|
fi
|
|
1
|
31 - 40
|
2
|
|
2
|
41 - 50
|
3
|
|
3
|
51 - 60
|
5
|
|
4
|
61 - 70
|
13
|
|
5
|
71 - 80
|
24
|
|
6
|
81 - 90
|
21
|
|
7
|
91 - 100
|
12
|
|
Jumlah
|
80
|
Jawab:
Buat daftar tabel berikut, tentukan nilai
pewakilnya (xi) dan hitung fixi.
|
Kelas ke-
|
Nilai
Ujian
|
fi
|
xi
|
fixi
|
|
1
|
31 - 40
|
2
|
35.5
|
71.0
|
|
2
|
41 - 50
|
3
|
45.5
|
136.5
|
|
3
|
51 - 60
|
5
|
55.5
|
277.5
|
|
4
|
61 - 70
|
13
|
65.5
|
851.5
|
|
5
|
71 - 80
|
24
|
75.5
|
1812.0
|
|
6
|
81 - 90
|
21
|
85.5
|
1795.5
|
|
7
|
91 - 100
|
12
|
95.5
|
1146.0
|
|
Jumlah
|
80
|
6090.0
|
Catatan: Pendekatan perhitungan nilai rata-rata hitung dengan
menggunakan distribusi frekuensi kurang akurat dibandingkan dengan cara
perhitungan rata-rata hitung dengan menggunakan data aktualnya. Pendekatan ini
seharusnya hanya digunakan apabila tidak memungkinkan untuk menghitung nilai
rata-rata hitung dari sumber data aslinya.
Rata-rata gabungan (disebut juga grand mean,
pooled mean, atau rata-rata umum) adalah cara yang tepat untuk
menggabungkan rata-rata hitung dari beberapa sampel.
Contoh 4:
Tiga sub sampel masing-masing berukuran 10, 6, 8
dan rata-ratanya 145, 118, dan 162. Berapa rata-ratanya?
Jawab:
(2) Median
Median dari n pengukuran atau pengamatan x1,
x2 ,..., xn adalah nilai pengamatan yang terletak di
tengah gugus data setelah data tersebut diurutkan. Apabila banyaknya pengamatan
(n) ganjil, median terletak tepat ditengah gugus data, sedangkan bila n
genap, median diperoleh dengan cara interpolasi yaitu rata-rata dari dua data
yang berada di tengah gugus data. Dengan demikian, median membagi himpunan
pengamatan menjadi dua bagian yang sama besar, 50% dari pengamatan terletak di
bawah median dan 50% lagi terletak di atas median. Median sering dilambangkan
dengan
(dibaca "x-tilde") apabila sumber datanya berasal
dari sampel
(dibaca "μ-tilde") untuk median populasi. Median
tidak dipengaruhi oleh nilai-nilai aktual dari pengamatan melainkan pada posisi
mereka. Prosedur untuk menentukan nilai median, pertama urutkan data terlebih
dahulu, kemudian ikuti salah satu prosedur berikut ini:
- Banyak data ganjil → mediannya adalah nilai yang berada tepat di tengah gugus data
- Banyak data genap → mediannya adalah rata-rata dari dua nilai data yang berada di tengah gugus data
a. Median
data tunggal:
Untuk menentukan median dari data tunggal, terlebih
dulu kita harus mengetahui letak/posisi median tersebut. Posisi median dapat
ditentukan dengan menggunakan formula berikut:
dimana n = banyaknya data pengamatan.
Median apabila n ganjil:
Contoh 5:
Hitunglah median dari nilai ujian matematika kelas
3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10
Jawab:
- data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10
- setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9; 10
- banyaknya data (n) = 11
- posisi Me = ½(11+1) = 6
- jadi Median = 7 (data yang terletak pada urutan ke-6)
|
Nilai
Ujian
|
2
|
4
|
5
|
6
|
6
|
7
|
7
|
7
|
8
|
9
|
10
|
|
Urutan
data ke-
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
|
↑
|
Median apabila n genap:
Contoh 6:
Hitunglah median dari nilai ujian matematika kelas
3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9
Jawab:
- data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9
- setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9
- banyaknya data (n) = 10
- posisi Me = ½(10+1) = 5.5
- Data tengahnya: 6 dan 7
- jadi Median = ½ (6+7) = 6.5 (rata-rata dari 2 data yang terletak pada urutan ke-5 dan ke-6)
|
Nilai
Ujian
|
2
|
4
|
5
|
6
|
6
|
7
|
7
|
7
|
8
|
9
|
||||||||
|
Urutan
data ke-
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||||||||
|
↑
|
||||||||||||||||||
b. Median
dalam distribusi frekuensi:
Formula untuk menentukan median dari tabel
distribusi frekuensi adalah sebagai berikut:

b = batas
bawah kelas median dari kelas selang yang mengandung unsur atau memuat nilai
median
p = panjang
kelas median
n = ukuran
sampel/banyak data
f =
frekuensi kelas median
F = Jumlah
semua frekuensi dengan tanda kelas lebih kecil dari kelas median (∑fi)
Contoh 7:
Tentukan nilai median dari tabel distribusi
frekuensi pada Contoh 3 di atas!
Jawab:
|
Kelas ke-
|
Nilai
Ujian
|
fi
|
fkum
|
|
|
1
|
31 - 40
|
2
|
2
|
|
|
2
|
41 - 50
|
3
|
5
|
|
|
3
|
51 - 60
|
5
|
10
|
|
|
4
|
61 - 70
|
13
|
23
|
|
|
5
|
71 - 80
|
24
|
47
|
←letak
kelas median
|
|
6
|
81 - 90
|
21
|
68
|
|
|
7
|
91 - 100
|
12
|
80
|
|
|
8
|
Jumlah
|
80
|
- Letak kelas median: Setengah dari seluruh data = 40, terletak pada kelas ke-5 (nilai ujian 71-80)
- b = 70.5, p = 10
- n = 80, f = 24
- f = 24 (frekuensi kelas median)
- F = 2 + 3 + 5 + 13 = 23
(3) Mode
Mode adalah data yang paling sering muncul/terjadi.
Untuk menentukan modus, pertama susun data dalam urutan meningkat atau
sebaliknya, kemudian hitung frekuensinya. Nilai yang frekuensinya paling besar
(sering muncul) adalah modus. Modus digunakan baik untuk tipe data numerik atau
pun data kategoris. Modus tidak dipengaruhi oleh nilai ekstrem. Beberapa
kemungkinan tentang modus suatu gugus data:
- Apabila pada sekumpulan data terdapat dua mode, maka gugus data tersebut dikatakan bimodal.
- Apabila pada sekumpulan data terdapat lebih dari dua mode, maka gugus data tersebut dikatakan multimodal.
- Apabila pada sekumpulan data tidak terdapat mode, maka gugus data tersebut dikatakan tidak mempunyai modus.
Meskipun suatu gugus data mungkin saja tidak
memiliki modus, namun pada suatu distribusi data kontinyu, modus dapat
ditentukan secara analitis.
- Untuk gugus data yang distribusinya simetris, nilai mean, median dan modus semuanya sama.
- Untuk distribusi miring ke kiri (negatively skewed): mean < median < modus
- untuk distribusi miring ke kanan (positively skewed): terjadi hal yang sebaliknya, yaitu mean > median > modus.

Hubungan antara ketiga ukuran tendensi sentral
untuk data yang tidak berdistribusi normal, namun hampir simetris dapat
didekati dengan menggunakan rumus empiris berikut:
Mean - Mode = 3 (Mean - Median)
a. Modus
Data Tunggal:
Contoh 8:
Berapa modus dari nilai ujian matematika kelas 3
SMU berikut ini:
- 2, 4, 5, 6, 6, 7, 7, 7, 8, 9
- 2, 4, 6, 6, 6, 7, 7, 7, 8, 9
- 2, 4, 6, 6, 6, 7, 8, 8, 8, 9
- 2, 4, 5, 5, 6, 7, 7, 8, 8, 9
- 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
Jawab:
- 2, 4, 5, 6, 6, 7, 7, 7, 8, 9→ Nilai yang sering muncul adalah angka 7 (frekuensi terbanyak = 3), sehingga Modus (M) = 7
- 2, 4, 6, 6, 6, 7, 7, 7, 8, 9 → Nilai yang sering muncul adalah angka 6 dan 7 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 7. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Karena ke-2 mode tersebut nilainya berurutan, mode sering dihitung dengan menghitung nilai rata-rata keduanya, ½ (6+7) = 6.5.
- 2, 4, 6, 6, 6, 7, 8, 8, 8, 9 → Nilai yang sering muncul adalah angka 6 dan 8 (masing-masing muncul 3 kali), sehingga Modusnya ada dua, yaitu 6 dan 8. Gugus data tersebut dikatakan bimodal karena mempunyai dua modus. Nilai mode tunggal tidak dapat dihitung karena ke-2 mode tersebut tidak berurutan.
- 2, 4, 5, 5, 6, 7, 7, 8, 8, 9 → Nilai yang sering muncul adalah angka 5, 6 dan 7 (masing-masing muncul 2 kali), sehingga Modusnya ada tiga, yaitu 5, 6 dan 7. Gugus data tersebut dikatakan multimodal karena modusnya lebih dari dua.
- 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 → Pada gugus data tersebut, semua frekuensi data sama, masing-masing muncul satu kali, sehingga gugus data tersebut dikatakan tidak mempunyai modusnya
b. Mode
dalam Distribusi Frekuensi:
dimana:
Mo = modal =
kelas yang memuat modus
b = batas
bawah kelas modal
p = panjang
kelas modal
bmo
= frekuensi dari kelas yang memuat modus (yang nilainya tertinggi)
b1= bmo
– bmo-1 = frekuensi kelas modal – frekuensi kelas sebelumnya
b2 = bmo
– bmo+1 = frekuensi kelas modal – frekuensi kelas sesudahnya
Contoh 9:
Tentukan nilai median dari tabel distribusi
frekuensi pada Contoh 3 di atas!
Jawab:
|
Kelas ke-
|
Nilai
Ujian
|
fi
|
|
|
1
|
31 - 40
|
2
|
|
|
2
|
41 - 50
|
3
|
|
|
3
|
51 - 60
|
5
|
|
|
4
|
61 - 70
|
13
|
|
|
→ b1 = (24
– 13) = 11
|
|||
|
5
|
71 - 80
|
24
|
← kelas
modal (frekuensinya paling besar)
|
|
→ b2 =(24
– 21) =3
|
|||
|
6
|
81 - 90
|
21
|
|
|
7
|
91 - 100
|
12
|
|
|
8
|
Jumlah
|
80
|
- Kelas modul =kelas ke-5
- b = 71-0.5 = 70.5
- b1 = 24 -13 = 11
- b2 = 24 – 21 = 3
- p = 10
Selain tiga ukuran tendensi sentral di atas (mean,
median, dan mode), terdapat ukuran tendensi sentral lainnya, yaitu rata-rata
ukur (Geometric Mean) dan rata-rata harmonis (Harmonic Mean)
(4)
Rata-rata Ukur (Geometric Mean)
Untuk gugus data positif x1, x2,
…, xn, rata-rata geometrik adalah akar ke-n dari hasil perkalian
unsur-unsur datanya. Secara matematis dapat dinyatakan dengan formula berikut:
Dimana: U = rata-rata ukur (rata-rata geometrik) n
= banyaknya sampel Π = Huruf kapital π (pi) yang menyatakan jumlah dari hasil
kali unsur-unsur data. Rata-rata geometrik sering digunakan dalam bisnis dan
ekonomi untuk menghitung rata-rata tingkat perubahan, rata-rata tingkat
pertumbuhan, atau rasio rata-rata untuk data berurutan tetap atau hampir tetap
atau untuk rata-rata kenaikan dalam bentuk persentase.
a. Rata-rata
ukur untuk data tunggal
Contoh 10:
Berapakah rata-rata ukur dari data 2, 4, 8?
Jawab:
atau:
b.
Distribusi Frekuensi:
xi = tanda
kelas (nilai tengah)
fi =
frekuensi yang sesuai dengan xi
Contoh 11:
Tentukan rata-rata ukur dari tabel distribusi
frekuensi pada Contoh 3 di atas!
Jawab
|
Kelas ke-
|
Nilai
Ujian
|
fi
|
xi
|
log xi
|
fi.log xi
|
|
1
|
31 - 40
|
2
|
35.5
|
1.5502
|
3.1005
|
|
2
|
41 - 50
|
3
|
45.5
|
1.6580
|
4.9740
|
|
3
|
51 - 60
|
5
|
55.5
|
1.7443
|
8.7215
|
|
4
|
61 - 70
|
13
|
65.5
|
1.8162
|
23.6111
|
|
5
|
71 - 80
|
24
|
75.5
|
1.8779
|
45.0707
|
|
6
|
81 - 90
|
21
|
85.5
|
1.9320
|
40.5713
|
|
7
|
91 - 100
|
12
|
95.5
|
1.9800
|
23.7600
|
|
8
|
Jumlah
|
80
|
149.8091
|
(5)
Rata-rata Harmonik (H)
Rata-rata harmonik dari suatu kumpulan data x1,
x2, …, xn adalah kebalikan dari nilai rata-rata hitung
(aritmetik mean). Secara matematis dapat dinyatakan dengan formula berikut:

Secara umum, rata-rata harmonic jarang digunakan.
Rata-rata ini hanya digunakan untuk data yang bersifat khusus.
Misalnya,rata-rata harmonik sering digunakan sebagai ukuran tendensi sentral
untuk kumpulan data yang menunjukkan adanya laju perubahan, seperti kecepatan.
a. Rata-rata
harmonic untuk data tunggal
Contoh 12:
Si A bepergian pulang pergi. Waktu pergi ia
mengendarai kendaraan dengan kecepatan 10 km/jam, sedangkan waktu kembalinya 20
km/jam. Berapakah rata-rata kecepatan pulang pergi?
Jawab:
Apabila kita menghitungnya dengan menggunakan rumus
jarak dan kecepatan, tentu hasilnya 13.5 km/jam! Apabila kita gunakan
perhitungan rata-rata hitung, hasilnya tidak tepat!
Pada kasus ini, lebih tepat menggunakan rata-rata
harmonik:

b. Rata-rata
Harmonik untuk Distribusi Frekuensi:

Contoh 13:
Berapa rata-rata Harmonik dari tabel distribusi
frekuensi pada Contoh 3 di atas!
Jawab:
|
Kelas ke-
|
Nilai
Ujian
|
fi
|
xi
|
fi/xi
|
|
1
|
31 - 40
|
2
|
35.5
|
0.0563
|
|
2
|
41 - 50
|
3
|
45.5
|
0.0659
|
|
3
|
51 - 60
|
5
|
55.5
|
0.0901
|
|
4
|
61 - 70
|
13
|
65.5
|
0.1985
|
|
5
|
71 - 80
|
24
|
75.5
|
0.3179
|
|
6
|
81 - 90
|
21
|
85.5
|
0.2456
|
|
7
|
91 - 100
|
12
|
95.5
|
0.1257
|
|
8
|
Jumlah
|
80
|
1.1000
|

Perbandingan
Ketiga Rata-rata (Mean):
Karakteristik
penting untuk ukuran tendensi sentral yang baik
Ukuran nilai pusat/tendensi sentral (average)
merupakan nilai pewakil dari suatu distribusi data, sehingga harus memiliki
sifat-sifat berikut:
- Harus mempertimbangkan semua gugus data
- Tidak boleh terpengaruh oleh nilai-nilai ekstrim.
- Harus stabil dari sampel ke sampel.
- Harus mampu digunakan untuk analisis statistik lebih lanjut.
Dari beberapa ukuran nilai pusat, Mean hampir
memenuhi semua persyaratan tersebut, kecuali syarat pada point kedua, rata-rata
dipengaruhi oleh nilai ekstrem. Sebagai contoh, jika item adalah 2; 4; 5; 6; 6;
6; 7; 7; 8; 9 maka mean, median dan modus semua bernilai sama, yaitu 6. Jika
nilai terakhir adalah 90 bukan 9, rata-rata akan menjadi 14.10, sedangkan
median dan modus tidak berubah. Meskipun dalam hal ini median dan modus lebih
baik, namun tidak memenuhi persyaratan lainnya. Oleh karena itu Mean merupakan
ukuran nilai pusat yang terbaik dan sering digunakan dalam analisis statistik.
Kapan kita
menggunakan nilai tendensi sentral yang berbeda?
Nilai ukuran pusat yang tepat untuk digunakan
tergantung pada sifat data, sifat distribusi frekuensi dan tujuan. Jika data
bersifat kualitatif, hanya modus yang dapat digunakan. Sebagai contoh, apabila
kita tertarik untuk mengetahui jenis tanah yang khas di suatu lokasi, atau pola
tanam di suatu daerah, kita hanya dapat menggunakan modus. Di sisi lain, jika
data bersifat kuantitatif, kita dapat menggunakan salah satu dari ukuran nilai
pusat tersebut, mean atau median atau modus. Meskipun pada jenis data
kuantitatif kita dapat menggunakan ketiga ukuran tendensi sentral, namun kita
harus mempertimbangkan sifat distribusi frekuensi dari gugus data tersebut.
- Bila distribusi frekuensi data tidak normal (tidak simetris), median atau modus merupakan ukuran pusat yang tepat.
- Apabila terdapat nilai-nilai ekstrim, baik kecil atau besar, lebih tepat menggunakan median atau modus.
- Apabila distribusi data normal (simetris), semua ukuran nilai pusat, baik mean, median, atau modus dapat digunakan. Namun, mean lebih sering digunakan dibanding yang lainnya karena lebih memenuhi persyaratan untuk ukuran pusat yang baik.
- Ketika kita berhadapan dengan laju, kecepatan dan harga lebih tepat menggunakan rata-rata harmonik.
- Jika kita tertarik pada perubahan relatif, seperti dalam kasus pertumbuhan bakteri, pembelahan sel dan sebagainya, rata-rata geometrik adalah rata-rata yang paling tepat.
Referensi:
- Mario Triola. 2004. Elementary Statistics. 9th Edition. Pearson Education.
- Stephen Bernstein and Ruth Bernstein. 1999. Elements of Statistics I: Descriptive Statistics and Probability. The McGraw-Hill Companies, Inc
- Web:
- Statistical dispersion: http://en.wikipedia.org/wiki/Statistical_dispersion
- Indian Agricultural Statistics Research Institute: http://www.iasri.res.in/
Tidak ada komentar:
Posting Komentar