Sample, Populasi, Sampling

Compiled by: Suprapto van Plaosan

Topik

  • Perbedaan Sampel vs Populasi
  • Pengantar Teknik Sampling:
    • Random Sampling
    • Random Blok Sampling

Statistics

noun [ U ] US /stəˈtɪs·tɪks/

the science of using information discovered from collecting, organizing, and studying numbers

Statistik

Statistik adalah disiplin ilmu yang berkaitan dengan

  • pengumpulan,
  • pengaturan,
  • analisis,
  • prediksi, dan
  • presentasi

data. Statistik berhubungan dengan semua aspek dari data, termasuk perencanaan untuk mendapatkan data dalam hal rancangan survei dan penelitian/percobaan. https://en.wikipedia.org/wiki/Statistics#cite_note-ox-1

Filsafat Statistik

Statistik menyelidiki dan mengembangkan metode khusus untuk mengevaluasi hipotesis berdasarkan fakta empiris. Metode tersebut disebut statistik yang menghubungkan fakta dan hipotesis dari jenis tertentu:

  • fakta empiris harus dikodifikasi dan disusun menjadi kumpulan data, dan
  • hipotesis harus dirumuskan dalam bentuk distribusi probabilitas atas kumpulan data yang mungkin. Dipublikasikan Tue Aug 19, 2014

Filsafat statistik berkaitan dengan dasar dan interpretasi yang tepat dari metode statistik, masukannya, dan hasilnya. Karena statistik diandalkan di hampir semua penelitian ilmiah empiris, yang berfungsi untuk mendukung dan mengkomunikasikan temuan-temuan ilmiah, filsafat statistik adalah kunci penting filsafat ilmu. Ini berdampak pada penilaian filosofis metode ilmiah, dan pada perdebatan tentang status epistemik dan ontologis teori ilmiah.

Data memberikan informasi tentang sampel. Sampel ini biasanya adalah perwakilan dari populasi yang diteliti. Populasi adalah sekelompok entitas yang memiliki karakteristik tertentu. Misalnya: penduduk jawa timur, guru sma surabaya dst. Karakter dari populasi disebut sebagai parameter. Karakteristik dari sampel disebut sebagai statistik. Data tentang sampel dimaksudkan, baik

Parameter adalah ukuran yang menggambarkan keseluruhan populasi.

Statistik adalah ukuran yang menggambarkan sampel.

Statistik dapat digunakan untuk membuat generalisasi ilmiah tentang parameter populasi

Populasi

  • nilai rata-rata, $\mu$
  • simpangan baku, $\sigma$

Sampel

  • nilai rata-rata, $\bar{x}$
  • simpangan baku, $s$
unix Populasi Populasi Rata-Rata Rata-Rata Populasi->Rata-Rata Simpangan Baku Simpangan Baku Populasi->Simpangan Baku 𝜇 𝜇 Rata-Rata->𝜇 𝜎 𝜎 Simpangan Baku->𝜎 Sampel Sampel Rata-rata Rata-rata Sampel->Rata-rata Simpangan baku Simpangan baku Sampel->Simpangan baku 𝑥¯ 𝑥¯ Rata-rata->𝑥¯ s s Simpangan baku->s

Jadi, penting untuk mempelajari bagaimana mendefinisikan suatu populasi, bagaimana memilih sampel dalam populasi dan bagaimana mengumpulkan data mengenai sampel.

  • Sampel adalah objek yang dideskripsikan oleh data.
  • Variabel adalah karakteristik suatu sampel.

Sampel yang merupakan sebagian kecil dari populasi dianalisis untuk mendapatkan parameter dari populasi yang diwakilinya. Contoh di bawah ini adalah data tinggi dan berat badan mahasiswa laki-laki dan perempuan dengan jumlah data 10.000. Bila kita asumsikan bahwa data tersebut adalah data tinggi dan berat badan mahasiswa di suatu universitas, maka bisa kita anggap data tersebut merupakan populasi. Karena data populasi kita ketahui kita bisa membandingkan statistik dari sampel yang kita sampling dari populasi dan parameter dari populasi tersebut.

Berikut adalah bebrapa informasi mengenai populasi yang kita pelajari.

Analisis statistik deskriptif memberikan kita informasi mengenai variabel jumlah data, nilai rata-rata, nilai standa deviasi, nilai minimal, maksimal, Q1,Q2 dan Q3 untuk populasi kita. Sebagaimana nampak dalam Tabel di bawah ini.

Gender Height Weight BMI Grup-BMI
0 Male 1.875714 109.720985 31.185761 Obesitas
1 Male 1.747060 73.622732 24.121044 Normal
2 Male 1.882397 96.497550 27.232906 Gemuk
3 Male 1.821967 99.809504 30.067059 Obesitas
4 Male 1.774998 93.598619 29.708033 Gemuk
5 Male 1.708227 69.042216 23.660492 Normal
6 Male 1.747141 83.428219 27.331095 Gemuk
7 Male 1.736052 76.190352 25.279843 Gemuk
8 Male 1.702281 79.800187 27.538561 Gemuk
9 Male 1.611795 70.941642 27.307482 Gemuk
Gender Height Weight BMI Grup-BMI
9990 Female 1.604759 64.077173 24.881901 Normal
9991 Female 1.590972 46.653553 18.431467 Kurus
9992 Female 1.576777 62.909437 25.303190 Gemuk
9993 Female 1.524773 44.310238 19.058718 Normal
9994 Female 1.501096 50.135381 22.249879 Normal
9995 Female 1.680785 62.041159 21.961166 Normal
9996 Female 1.703506 77.504315 26.707835 Gemuk
9997 Female 1.622247 58.275377 22.143748 Normal
9998 Female 1.753470 74.322166 24.172512 Normal
9999 Female 1.573384 51.550324 20.823898 Normal

Kita lihat berapa jumlah masing-masing mahasiswa laki-laki dan mahasiswa perempuan.

Height Weight BMI Grup-BMI
Gender
Female 5000 5000 5000 5000
Male 5000 5000 5000 5000

Diketahui bahwa masing-masing ada 5.000 mahasiwa laki-laki dan 5.000 mahasiswa perempuan.

Sebaran data tinggi badan dan berat badanuntuk 10.000 data kita adalah sebagaimana Gambar di bawah ini.

Terlihat bahwa, baik berat badan maupun tinggi badan mengelompok pada dua nilai yang berbeda. Bila data-data tersebut ditampilkan dalam bentuk histogram dari berat badan dan tinggi badan berdasar gender akan nampak sebagaimana Gambar di bawah ini.

Secara umum, tinggi badan dan berat badan perempuan lebih kecil nilai rata-ratanya daripada mahasiswa laki-laki.

Sampling Acak

Setiap anggota dan kumpulan anggota dalam populasi memiliki kesempatan yang sama untuk disertakan dalam sampel. Sampel acak biasanya cukup representatif karena mereka tidak subjektif ke anggota tertentu.

Pengambilan sampel sebanyak 100 dari 10.000 populasi awal akan mengahasilakn histogram sebagai berikut.

Gender Height Weight BMI Grup-BMI
3720 Male 1.875721 94.509506 26.862034 Gemuk
5680 Female 1.620137 63.689189 24.264000 Normal
1861 Male 1.806286 92.076142 28.221107 Gemuk
2994 Male 1.831174 93.952560 28.018788 Gemuk
1270 Male 1.733711 86.359554 28.731398 Gemuk
2469 Male 1.608613 62.662643 24.216171 Normal
5414 Female 1.567322 57.509705 23.411265 Normal
5763 Female 1.602008 64.053984 24.958411 Normal
7327 Female 1.573995 60.221433 24.307739 Normal
2575 Male 1.737646 83.528356 27.663755 Gemuk
Gender Height Weight BMI Grup-BMI
9964 Female 1.593304 54.613572 21.513121 Normal
838 Male 1.791553 89.169087 27.781470 Gemuk
7660 Female 1.584666 58.796319 23.413948 Normal
294 Male 1.636400 76.706672 28.645357 Gemuk
1860 Male 1.699688 72.770767 25.189455 Gemuk
2294 Male 1.811468 90.152531 27.473654 Gemuk
1450 Male 1.727266 87.956716 29.481561 Gemuk
5156 Female 1.585139 54.568637 21.717417 Normal
5572 Female 1.600815 59.710512 23.300667 Normal
12 Male 1.645065 75.807679 28.012199 Gemuk

Histogram 100 sampel masih menggambarkan bawha nilai rata-rata tinggi badan laki-laki dan perempuan berada pada nilai yang berbeda sebagaimana pada populasi. Namun, karena jumlah data yang kecil, distribusinya tidak nampak bagus sebagaimana distribusi populasi.

Ketika jumlah sampel kita naikan menjadi 1000, kurva histogram yang diperoleh adalah sebagi berikut:

Dari kurva histogram terlihat bahwa, semakin besar jumlah sampel diambil akan membuat sampel lebih representatif dan dapat mewakili populasi dengan lebih bagus.

Kita akan bandingkan nilai rata-rata dan standar deviasi untuk sampel 100, sampel 1000 dan populasi dalam diagram batang di bawah ini.

100 1000 10000
Gender
Female 1.619122 1.623943 1.618203
Male 1.773148 1.753927 1.753269
100 1000 10000
Gender
Female 0.065989 0.070911 0.068486
Male 0.070571 0.072551 0.072729

Sampling Acak Berkelompok (Random Block Sampling)

Pada random block sampling, populasi dibagi berdasar kelompok tertentu, misalnya gender. Masing-masing kelompok kemudian diambil sampelnya dengan proporsi tertentu. setiap individu dalam kelompok yang sama mendapatkan peluang yang sama untuk diambil sebagai sampel. Misalnya, kita melakukan sampling sebanyak 500 sampel dengan pengelompokan 250 dari mahasiswa perempuan dan 250 data tinggi badan dari mahasiswa laki-laki.

Pengambilan sampel sebanyak 500 dari masing-masing 5000 populasi mahasiswa laki-laki dan 500 sampel dari 5000 populasi mahasiswa perempuan akan mengahasilakn histogram sebagai berikut.

Gender Height Weight BMI Grup-BMI
7642 Female 1.760820 75.585462 24.378583 Normal
9793 Female 1.707379 78.105357 26.792990 Gemuk
9187 Female 1.671917 72.991067 26.112005 Gemuk
5728 Female 1.755630 76.595542 24.850636 Normal
8769 Female 1.731599 81.114097 27.052137 Gemuk
8944 Female 1.712943 76.336269 26.016262 Gemuk
8788 Female 1.644101 66.913850 24.754774 Normal
6920 Female 1.666251 68.702063 24.745071 Normal
5437 Female 1.746495 69.712436 22.854709 Normal
7314 Female 1.533659 52.175432 22.182389 Normal
Gender Height Weight BMI Grup-BMI
4377 Male 1.603297 69.828099 27.164536 Gemuk
3399 Male 1.681322 80.097697 28.334682 Gemuk
1241 Male 1.791783 84.127654 26.204020 Gemuk
4101 Male 1.743200 83.592347 27.508820 Gemuk
4554 Male 1.736965 80.878853 26.807286 Gemuk
4719 Male 1.721536 81.548622 27.515943 Gemuk
1994 Male 1.625884 68.551955 25.932289 Gemuk
2632 Male 1.641511 61.640641 22.875982 Normal
3073 Male 1.754433 93.901756 30.507035 Obesitas
4081 Male 1.652078 80.876179 29.631897 Gemuk
Height Weight BMI
count 1000.000000 1000.000000 1000.000000
mean 1.688521 73.633701 25.533596
std 0.098654 14.587092 2.669837
min 1.413558 38.837353 16.622618
25% 1.615308 62.335586 23.619034
50% 1.687919 73.941007 25.828487
75% 1.760265 84.830690 27.579658
max 1.996983 115.979317 31.799222
count mean std min 25% 50% 75% max
Gender
Female 500.0 1.621017 0.069980 1.413558 1.574442 1.620546 1.668968 1.789542
Male 500.0 1.756026 0.073861 1.508268 1.711502 1.756462 1.807104 1.996983

Dari kurva histogram terlihat bahwa, semakin besar jumlah sampel diambil akan membuat sampel lebih representatif dan dapat mewakili populasi dengan lebih bagus.

Kita akan bandingkan nilai rata-rata dan standar deviasi untuk sampel 100, sampel 1000 dan populasi dalam diagram batang di bawah ini.

Populasi RBS
Gender
Female 1.618203 1.621017
Male 1.753269 1.756026
RBS Populasi
Gender
Female 0.069980 0.068486
Male 0.073861 0.072729

Teknik Sampling Sampel Padatan