Sample, Populasi, Sampling
Statistik
Statistik adalah disiplin ilmu yang berkaitan dengan
data. Statistik berhubungan dengan semua aspek dari data, termasuk perencanaan untuk mendapatkan data dalam hal rancangan survei dan penelitian/percobaan. https://en.wikipedia.org/wiki/Statistics#cite_note-ox-1
Filsafat Statistik
Statistik menyelidiki dan mengembangkan metode khusus untuk mengevaluasi hipotesis berdasarkan fakta empiris. Metode tersebut disebut statistik yang menghubungkan fakta dan hipotesis dari jenis tertentu:
Filsafat statistik berkaitan dengan dasar dan interpretasi yang tepat dari metode statistik, masukannya, dan hasilnya. Karena statistik diandalkan di hampir semua penelitian ilmiah empiris, yang berfungsi untuk mendukung dan mengkomunikasikan temuan-temuan ilmiah, filsafat statistik adalah kunci penting filsafat ilmu. Ini berdampak pada penilaian filosofis metode ilmiah, dan pada perdebatan tentang status epistemik dan ontologis teori ilmiah.
Data memberikan informasi tentang sampel. Sampel ini biasanya adalah perwakilan dari populasi yang diteliti. Populasi adalah sekelompok entitas yang memiliki karakteristik tertentu. Misalnya: penduduk jawa timur, guru sma surabaya dst. Karakter dari populasi disebut sebagai parameter. Karakteristik dari sampel disebut sebagai statistik. Data tentang sampel dimaksudkan, baik
Parameter adalah ukuran yang menggambarkan keseluruhan populasi.
Statistik adalah ukuran yang menggambarkan sampel.
Statistik dapat digunakan untuk membuat generalisasi ilmiah tentang parameter populasi
Jadi, penting untuk mempelajari bagaimana mendefinisikan suatu populasi, bagaimana memilih sampel dalam populasi dan bagaimana mengumpulkan data mengenai sampel.
Sampel yang merupakan sebagian kecil dari populasi dianalisis untuk mendapatkan parameter dari populasi yang diwakilinya. Contoh di bawah ini adalah data tinggi dan berat badan mahasiswa laki-laki dan perempuan dengan jumlah data 10.000. Bila kita asumsikan bahwa data tersebut adalah data tinggi dan berat badan mahasiswa di suatu universitas, maka bisa kita anggap data tersebut merupakan populasi. Karena data populasi kita ketahui kita bisa membandingkan statistik dari sampel yang kita sampling dari populasi dan parameter dari populasi tersebut.
Berikut adalah bebrapa informasi mengenai populasi yang kita pelajari.
Analisis statistik deskriptif memberikan kita informasi mengenai variabel jumlah data, nilai rata-rata, nilai standa deviasi, nilai minimal, maksimal, Q1,Q2 dan Q3 untuk populasi kita. Sebagaimana nampak dalam Tabel di bawah ini.
Kita lihat berapa jumlah masing-masing mahasiswa laki-laki dan mahasiswa perempuan.
Diketahui bahwa masing-masing ada 5.000 mahasiwa laki-laki dan 5.000 mahasiswa perempuan.
Sebaran data tinggi badan dan berat badanuntuk 10.000 data kita adalah sebagaimana Gambar di bawah ini.
Terlihat bahwa, baik berat badan maupun tinggi badan mengelompok pada dua nilai yang berbeda. Bila data-data tersebut ditampilkan dalam bentuk histogram dari berat badan dan tinggi badan berdasar gender akan nampak sebagaimana Gambar di bawah ini.
Secara umum, tinggi badan dan berat badan perempuan lebih kecil nilai rata-ratanya daripada mahasiswa laki-laki.
Setiap anggota dan kumpulan anggota dalam populasi memiliki kesempatan yang sama untuk disertakan dalam sampel. Sampel acak biasanya cukup representatif karena mereka tidak subjektif ke anggota tertentu.
Pengambilan sampel sebanyak 100 dari 10.000 populasi awal akan mengahasilakn histogram sebagai berikut.
Histogram 100 sampel masih menggambarkan bawha nilai rata-rata tinggi badan laki-laki dan perempuan berada pada nilai yang berbeda sebagaimana pada populasi. Namun, karena jumlah data yang kecil, distribusinya tidak nampak bagus sebagaimana distribusi populasi.
Ketika jumlah sampel kita naikan menjadi 1000, kurva histogram yang diperoleh adalah sebagi berikut:
Dari kurva histogram terlihat bahwa, semakin besar jumlah sampel diambil akan membuat sampel lebih representatif dan dapat mewakili populasi dengan lebih bagus.
Kita akan bandingkan nilai rata-rata dan standar deviasi untuk sampel 100, sampel 1000 dan populasi dalam diagram batang di bawah ini.
Pada random block sampling, populasi dibagi berdasar kelompok tertentu, misalnya gender. Masing-masing kelompok kemudian diambil sampelnya dengan proporsi tertentu. setiap individu dalam kelompok yang sama mendapatkan peluang yang sama untuk diambil sebagai sampel. Misalnya, kita melakukan sampling sebanyak 500 sampel dengan pengelompokan 250 dari mahasiswa perempuan dan 250 data tinggi badan dari mahasiswa laki-laki.
Pengambilan sampel sebanyak 500 dari masing-masing 5000 populasi mahasiswa laki-laki dan 500 sampel dari 5000 populasi mahasiswa perempuan akan mengahasilakn histogram sebagai berikut.
Dari kurva histogram terlihat bahwa, semakin besar jumlah sampel diambil akan membuat sampel lebih representatif dan dapat mewakili populasi dengan lebih bagus.
Kita akan bandingkan nilai rata-rata dan standar deviasi untuk sampel 100, sampel 1000 dan populasi dalam diagram batang di bawah ini.