Metode Penarikan Contoh-I (Teori)
Buku Referensi :Cochran,W.G. Johon Wiley & Sons, Inc 1977.
Sampling Techniques
Murthy,M.N, Sampling Theory and Methods, Statistical Publishing Society 1977
Singh,D.et all, Theory and Analysis of Sample Survey Design, Wiley Eastern Limited 1986
1
2
Baca (untuk minggu 1 dan 2):
Cochran Bab 1, 2
Murthy Bab 1, 2
Singh.D Bab 1
3
Proses Sampling
Tentukan target populasi
Pilih sampling frame
Tentukan metoda sampling yang akan digunakan
(probability atau non-probability)
Rencanakan prosedur pemilihan
Unit sampling
Tentukan ukuran sampel
Pilih sampling unit
Pelaksanaan di lapangan1
2
3
4
5
6
7
POPULASI, SAMPEL, DAN SAMPLING 2. diteliti
1. Teknik sampling
3. generalisasi
4
POPULASI SAMPEL
Konsep Dasar
• Populasi• Karakteristik dari sampel• Sampel dan sampel statistik• Statistik seperti apa yang bisa dipercaya• Sampel yang Representative
5
Populasi
• Populasi adalah seluruh koleksi dari object yang akan di teliti
• Object bisa berupa manusia, binatang, tanaman dll
• Besarnya populasi biasanya sangat besar (manusia) bisa juga sangat kecil (penelitian tentang panda)
• Penelitian tentang keseluruhan populasi disebut sensus.
6
Karakteristik Sampel• Biasanya kita tertarik pada karakteristik tertentu dari
object (sampel). Misalnya Berat badan, gender, race, status perkawinan, umur
dll.• Data dari karakteristik ini dapat diperoleh dengan
cara:• Mengukur (berat badan)• Menghitung• Bertanya (status perkawinan)• Mengobservasi (warna mata)• Computing (Misalnya BMI)
7
Parameter dari Populasi• Summaries dari data populasi disebut
parameter. Contoh: Besarnya populasi (N), rata-rata populasi (µ), variance dari populasi (σ2), standard deviasi dari populasi (σ), dan proporsi (р).
• Hanya ada satu nilai yang benar (true value) untuk setiap parameter populasi.
• True values biasanya unknown dan diestimasi.
8
Contoh
• Berapa rata-rata (mean) body mass index dari penduduk berusia 60 ke atas. Hal ini bisa diperoleh dengan cara mengukur berat dan tinggi badan penduduk usia 60 tahun keatas.
• Berapa proporsi dari anak usia sekolah dasar yang menderita myopic.
9
Parameter vs Statistik
data populasi
parameterpengolahan/
analisis
data sampel
statistikpengolahan/
analisis
Parameter tidak pernah diketahui, yang kita ketahui adalah statistik. Statistik merupakan
estimasi bagi parameter.
Tentang Sampel
• Sampel adalah subset dari objek yang diambil dari target populasi
• Ukuran sampel biasanya di catat dengan huruf n• n biasanya lebih kecil dari besarnya populasi N• Sangat penting untuk menghitung besarnya n
sebelum sampel diambil.
11
Statistik Sampel• Summaries dari data yang berasal dari sampel
disebut statistik. Contoh: banyaknya sampel (n), rata-rata sampel (x-bar), varians dari sampel (s2), standard deviasi (s), proporsi sampel (p-cap).
• Sampel bisa diambil beberapa kali dari populasi, dan dengan sampel yang berbeda akan menghasilkan statistik yang berbeda.
12
Contoh
• Dua set sampel bisa diambil dari target populasi yaitu penduduk yang berusia diatas 60 tahun. Rata-rata dari BMI penduduk usia diatas 60 tahun untuk kedua set tsb nilainya akan sangat berdekatan tetapi hampir tidak mungkin nilai tersebut benar-benar sama.
13
Diskriptif Vs Inferensial• Secara umum statistik bisa dikategorikan
menjadi 2 cabang yaitu:1.Statistik diskriptif menerangkan:
1. Tendensi titik pusat (mean, median, mode)2. Sebaran data (dari kecil ke besar)3. Distribusi yaitu bentuk dari sebaran (symmetrical, skewed, bell-
shaped, flat, peaked)
2.Statistik inferens, menggunakan statstik sampel untuk:1. Mengestimasi parameter populasi2. Membandingkan perbedaan signifikan antara dua atau lebih populasi
3. Test hubungan antara variabel untuk membuat prediksi.
14
StatistikPopulasi
Sampel
Sampling Estimasi/inferens
Tingkat Keyakinan
Ilmu ProbabilityStatistik Deskriptif
vs Statistik Inferens
Deskriptif
Contoh Deskriptif
16
17
18
Contoh Inferens
19
20
21
Sebaran Penarikan Contoh
populasi
ambil contoh berukuran nambil contoh
berukuran nambil contoh berukuran n
ambil contoh berukuran n
1x 2x 3x kxRata-rata sampel adalah random variabel yang juga
memiliki sebaran tertentu. Sampel yang berbeda dari populasi yang sama bisa memiliki rata-rata yang berbeda.
Sebaran Penarikan Contoh
x1, x2, …, xn dari populasi yang
menyebar N(, 2)
x
sx
menyebar N(, 2/n)
menyebar t-studentdb=n-
1
Graph: Target population
• Population: mean = , standard deviation =
Pro
babi
lity
dens
ity (p
opul
atio
n)
Scores-4.0 -2.0 0.0 2.0 4.0
0.00
0.20
0.40
Graph: Sample
• Sample: mean = x, standard deviation = s
Pro
babi
lity
dens
ity (s
ampl
e)
Scores-4.0 -2.0 0.0 2.0 4.0
0.00
0.20
0.40
Graph: Means from many samples
• However we could get many different samples with different sample means from the population.
Pro
babi
lity
dens
ity (s
ampl
e)
Scores-4.0 -2.0 0.0 2.0 4.0
0.00
0.20
0.40
Graph: Distribution of sample means
• This gives us a sampling distribution of sample means:
Pro
babi
lity
dens
ity (m
eans
)
Sample means-4.0 -2.0 0.0 2.0 4.0
0.00
0.20
0.40
Statistik Inferens
• Pertanyaan:– Seberapa baik statistik sampel digunakan untuk
membuat inferens pada parameter populasi ?– Apakah statistik sampel bisa dipercaya
?????????
28
Apakah Statistik bisa dipercaya ?
29
There are 3 kinds of lies:
“LIES, DAMNED LIES, and STATISTICS”
Mark Twain, American Writer(1835 – 1910)
Statistics don’t lie, but human does
Manusia yang membuat bad statistics• Secara sengaja:
– Memanipulasi data– Keuntungan pribadi
• Secara tidak sengaja: - Pengumpulan data yang tidak tepat - Kuesioner yang tidak berkualitas - Sampel yang tidak representatif - lainnya
30
Metoda Pengumpulan data yang tidak tepat• Misalnya kita ingin mengetahui seberapa banyak orang yang
mempraktekkan kebersihan pribadi untuk menghindari terkena H1N1 flu. Pertanyaan yang dilakukan adalah “Bisakah saya lihat tangan anda untuk mengetahui tangan tersebut dicuci atau tidak setelah keluar dari toilet”
• Tidak akan ada yang mau menjawab survey tersebut. Option yang bisa dilakukan adalah observasi, atau anonimous survey.
31
Kuesioner yang kurang berkualitas• Pertanyaan dalam kuesioner (Leading
question):• Dengan begitu banyaknya pengangguran, menurut anda
pemerintah sudah cukup berusaha untuk menolong rakyat pada keadaan krisis ekonomi sekarang ini?
• Pertanyaan bisa di rephrase:• Menurut anda apakah pemerintah sudah melakukan yang
terbaik untuk menolong masyarakat pada krisis ekonomi saat ini ?
32
Sampel yang Tidak Representatif
• Penelitian siswa SMU: Seorang siswa SMU mengadakan penelitian tentang bagaimana
siswa di sekolah di daerah berangkat ke sekolah. Pilihan pertanyaannya adalah dengan cara: berjalan kaki, bersepeda, bus sekolah, MRT dll. Siswa tsb menginterview teman2nya.
Masalah : Siswa tersebut berasal dari sekolah kaya yang kesekolahnya setiap hari menggunakan mobil mewah. Hasilnya sudah bisa diduga sangat bias.
33
Sampel yang representatif
• Sampel sebesar n diambil dari N populasi. Pertanyaannya apakah statistik dari sampel merupakan representatif yang baik dari parameter populasi ?
• Tergantung dari:– Bagaimana sampel diambil. Random sampel mungkin
representatif yang baik.– Besarnya sampel yang diambil. Sampel yang besar lebih
baik dari sampel yang kecil, dan juga variabilitinya akan menjadi lebih kecil.
34
35
KetepatanBiaya
Sampling
36
Sampling Errors
Total Population
Sampling Frame Error
Random Sampling Error
Sampling Frame Planned Sample
Non-Response Error
Respondents(actual sample)
37
Teknik pengumpulan data
Pengumpulan Data
Sensus (populasi) Sampling (sampel)
Probabilita Non-Probabilita
38
Probability Sampling - Setiap elemen dalam populasi yang diteliti memiliki suatu probabilitas untuk terpilih sebagai sampel
Non-Probability Sampling Suatu cara pemilihan memilih unit sampling berdasarkan pertimbangan subyektif, seperti penilaian pribadi atau kenyamanan.
Classification of Sampling Methods
SamplingMethods
ProbabilitySamples
SimpleRandomCluster
Systematic Stratified
Non-probability
QuotaJudgment
Convenience Snowball
JUMLAH SAMPEL
1. Seberapa besarkah jumlah sampel yang
dinyatakan memenuhi syarat untuk penelitian
?
2. Apa saja yang harus dipertimbangkan dalam
menentukan jumlah sampel ?
40
Pertimbangan Penentuan ukuran sampel
1. Heterogenitas dari populasi2. Tingkat presisi yang dikehendaki3. Tipe sampling design yang digunakan4. Ketersediaan Sumber daya5. Tingkat ketelitian dalam analisis
• Tingkat presisi yang dikehendaki
– Secara teknis mengacu pada standard error. Tapi lebih mudah diilustrasikan dengan confidence interval.
– Pernyataan “rata2 populasi ada di antara 2-4” lebih presisi dibandingkan “rata2 populasi ada di antara 1-5”.
– Rumus standard error /√(N), sampel perlu diperbesar agar standard error-nya mengecil.
– Law of diminishing return, setelah terus2an, dibutuhkan jumlah N yang sangat besar agar standard error bisa turun.
• N = 100 s = 5• N = 400 s = 2.5• N = 2500 s = 1• N = 10000 s = 0.5
– Sample size 2000-3000 sebenarnya standard error-nya sudah cukup kecil dan menambah jumlah sampel lagi “is not worth the additional cost”.
Sampling design
Misalnya tanpa menambah jumlah sampel presisi sampel bisa ditingkatkan dengan menggunakan stratified random sampling dan bukan simple random sampling, tapi cluster sampling perlu lebih banyak sampel.
Resources availability
BESARnya SAMPELKuantitatif : dapat ditaksir dengan akurat, berdasar
analisis yang akan dilakukan, presisi estimasi yang diinginkan, kesalahan random yang masih bisa ditoleransi, power statistik yang diharapkan
Kualitatif :• Ukuran sampel cukup besar jika peneliti
telah puas bahwa data yang diperoleh cukup mewakili dimensi yang diteliti.
BESARnya SAMPEL
Tergantung pada :• Pertimbangan representative
– Adanya sumber-sumber yang dapat digunakan untuk menentukan batas maksimal dari besarnya sampel.
• Pertimbangan analisis– Kebutuhan rencana analisis yang menentukan
batas minimal besar sampel.
47
References
1. Malcolm Rosier, 2000. Survey Design and Analysis Services Pty Ltd.2. Unknown, (?) Sampling and Sample Size Determination3. Widya Setiabudi Sumadinata (?). Teknik Sampling4. Moataza Mahmoud Abdel Wahab (?). Sampling technique and Sample
size.High Institute of Public Health, University of Alexandria5. Basic Terms and Concepts of Statistics you must know. YouTube.
48
49