Teorema Central Limit

Compiled by: Suprapto van Plaosan

Topik

    • Nilai rata-rata
    • Simpangan baku
    • Median
    • Modus
    • Q1, Q2, Q3, IQR

Rata-rata

Nilai rata-rata sampel dilambangkan sebagai $\bar{x}$ yang didefinisikan sebagai jumlah seluruh nilai sampel dibagi jumlah sampel:

$${\displaystyle ={\frac {x_{1}+x_{2}+\cdots +x_{n}}{n}}}={\frac {\sum _{i=1}^{n}x_{i}}{n}}$$

Misalnya kita ambil contoh data hasil titrasi empat mahasiswa (A, B, C, dan D) sebagaimana tercantum dalam buku Statistics and Chemometrics for Analytical Chemistry (James Miller (Author), Jane C Miller) Tabel 1.1 halaman 3.

A B C D
Student
r1 10.08 9.88 10.19 10.04
r2 10.11 10.14 9.79 9.98
r3 10.09 10.02 9.69 10.02
r4 10.10 9.80 10.05 9.97
r5 10.12 10.21 9.78 10.04

Eksplorasi data dari hasil titrasi keempat mahasiswa tersebut adalah sebagai berikut

A B C D
count 5.000000 5.000000 5.000000 5.000000
mean 10.100000 10.010000 9.900000 10.010000
std 0.015811 0.171756 0.210476 0.033166
min 10.080000 9.800000 9.690000 9.970000
25% 10.090000 9.880000 9.780000 9.980000
50% 10.100000 10.020000 9.790000 10.020000
75% 10.110000 10.140000 10.050000 10.040000
max 10.120000 10.210000 10.190000 10.040000

Nilai rata-rata dari data titrasi keempat mahasiswa adalah sebagai berikut

Nama Rata-rata
0 A 10.10
1 B 10.01
2 C 9.90
3 D 10.01

Simpangan Baku

Simpangan baku merupakan akar selisih kwadrat antara nilai pengukuran dengan nilai rata-rata dibagi jumlah sampel dikurangi 1

$$s=\sqrt{\frac{1}{N-1}\sum_{i=1}^N(x_i-\bar{x})^2}$$

Simpangan baku menunjukkan sebaran nilai pengukuran terhadap nilai rata-rata.

Nilai $s$ kecil berarti data cukup presisi

Nama Simpangan Baku
0 A 0.014142
1 B 0.153623
2 C 0.188255
3 D 0.029665

Gambar di bawah ini menunjukkan sebaran hasil pengukuran ke-empat mahasiswa

Dari Gambar terlihat bahwa hasil pengukuran mahasiswa D mempunya sebaran yang mendekati nilai acuan. Namun realtif susah untuk menafsirkan hasil dari Mahasiswa A, B, dan C.

Grafik nilai rata-rata dan simpangan baku dari hasil masing-masing mahasiswa memberikan deskripsi yang lebih bagus mengenai performa keempat mahasiswa.

Dari Grafik terlihat Mahasiswa B dan D mempunya hasil yang akurat.

Akurat: nilai hasil pengukuran mendekati nilai sebenarnya.

Namun simpangan baku Mahasiswa B jauh lebih besar daripada Mahasiswa D. Presisi data Mahasiswa B lebih jelek daripada Mahasiswa A dan D.

s << --- Presisi >>

s >> --- Presisi <<

Dari Grafik rata-rata dan simpangan baku disimpulkan:

  • Mahasiswa A, tidak akurat tapi presisi
  • Mahasiswa B, akurat tapi tidak presisi
  • Mahasiswa C, tidak akurat dan tidak presisi
  • Mahasiswa D, akurat tapi presisi

Median

Mahasiswa D selanjutnya diminta mengukur lagi dengan jumlah replikasi 10 kali. Hasil yang didapatkan adalah sebagai berikut:

Hasil titrasi [0.51 0.51 0.51 0.5  0.51 0.49 0.52 0.53 0.5  0.47]

Data dengan urutan dari kecil ke besar adalah sebagai berikut:

[0.47 0.49 0.5  0.5  0.51 0.51 0.51 0.51 0.52 0.53]

Median dihitung dari data dengan posisi $(n+1)/2$

(10+1)/2 = 5.5

Nilai Median 0.51

Quartil 1 (Q1)

Nilai Q1 0.5

Quartil 2 (Q2) = Median

Nilai Q2 0.51

Quartil 3 (Q3)

Nilai Q3 0.51

Interquartile (IQR)

IQR merupakan selisih antara Q3 dengan Q1:

$$IQR = (Q3 - Q1)$$
Nilai IQR 0.01

Minimal

Nilai minimal adalah Q1 - 1,5 * IQR

Nilai Minimal 0.485

Maksimal

Nilai maksimal adalah Q1 + 1,5 * IQR

Nilai maksimal 0.525

Pencilan (Outliers)

Pencilan adalah data yang lebih kecil dari nilai minimal atau lebih besar dari nilai maksimal.

Lebih kecil dari nilai minimal [0.47]

Lebih besar dari nilai maksimal [0.53]

Boxplot