Statistika adalah ilmu yang mempelajari
bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan
mempresentasikan data, Singkatnya, statistika adalah ilmu yang berkenaan dengan
data. Istilah 'statistika' berbeda dengan 'statistik'. Statistika merupakan
ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi, atau
hasil penerapan algoritma statistika pada suatu data. Dari kumpulan data,
statistika dapat digunakan untuk menyimpulkan atau mendeskripsikan data; ini
dinamakan statistika deskriptif.
Variabel: adalah suatu sifat atau fenomena yang
menunjukan sesuatu yang dapat diamati dan nilainya berbeda-beda
Sesuatu dikatakan variabel, jika:
- Mempunyai nama
- Dapat diamati atau diukur
- Nilainya berbeda-beda
- Memiliki definisi verbal
- Ada kelompok penggolongan atau satuan
Macam - macam Variabel
- Variabel Tergantung/ Akibat / Terpengaruh/ Dependen → variabel yang dipengaruhi oleh variabel lain
- Variabel Bebas/ Sebab/ mempengaruhi/ Independen →variabel yang mempengaruhi variabel lain
Dalam statistika, populasi adalah
sekumpulan data yang mempunyai karakteristik yang sama dan menjadi objek inferensi,
Sampel merupakan bagian dari populasi
yang ingin diteliti; dipandang sebagai suatu pendugaan terhadap populasi, namun
bukan populasi itu sendiri. Sampel dianggap sebagai perwakilan dari populasi
yang hasilnya mewakili keseluruhan gejala yang diamati. ukuran dan keragaman sampel
menjadi penentu baik tidaknya sampel yang diambil.
Terdapat dua cara pengambilan sampel, yaitu:
·
Acak (random)/probabilita dan
·
Tidak acak (non-random)/non-probabilita
Statistik Parametrik, yaitu ilmu
statistik yang mempertimbangkan jenis sebaran atau distribusi data, yaitu
apakah data menyebar secara normal atau tidak. Dengan kata lain, data yang akan
dianalisis menggunakan statistik parametrik harus memenuhi asumsi normalitas.
Pada umumnya, jika data tidak menyebar normal, maka data seharusnya dikerjakan
dengan metode statistik non-parametrik, atau setidak-tidaknya dilakukan
transformasi terlebih dahulu agar data mengikuti sebaran normal, sehingga bisa
dikerjakan dengan statistik parametrik.
Contoh metode statistik parametrik :
a. Uji-z (1 atau 2 sampel)
b. Uji-t (1 atau 2 sampel)
c. Korelasi pearson,
d. Perancangan percobaan (one or two-way anova
parametrik), dll.
Ciri-ciri statistik parametrik :
- Data dengan skala interval dan rasio
- Data menyebar/berdistribusi normal
Keunggulan dan
kelemahan statistik parametrik :
Keunggulan :
1. Syarat syarat parameter dari suatu populasi yang
menjadi sampel biasanya tidak diuji dan dianggap memenuhi syarat, pengukuran
terhadap data dilakukan dengan kuat.
2. Observasi bebas satu sama lain dan ditarik dari
populasi yang berdistribusi normal serta memiliki varian yang homogen.
Kelemahan :
1. Populasi harus memiliki varian yang sama.
2. Variabel-variabel yang diteliti harus dapat
diukur setidaknya dalam skala interval.
3.Dalam analisis varian ditambahkan persyaratan
rata-rata dari populasi harus normal dan bervarian sama, dan harus merupakan
kombinasi linear dari efek-efek yang ditimbulkan.
Statistik Non-Parametrik adalah test
yang modelnya tidak menetapkan syarat-syaratnya yang mengenai
parameter-parameter populasi yang merupakan induk sampel penelitiannya.
Oleh karena itu observasi-observasi independent dan variabel yang diteliti pada
dasarnya memiliki kontinuitas. Uji metode non parametrik atau bebas sebaran
adalah prosedur pengujian hipotesa yang tidak mengasumsikan pengetahuan apapun
mengenai sebaran populasi yang mendasarinya kecuali selama itu kontinu.
Pendeknya: Statistik Non-Parametrik adalah yaitu statistik
bebas sebaran (tidak mensyaratkan bentuk sebaran parameter populasi, baik
normal atau tidak). Selain itu, statistik non-parametrik biasanya menggunakan
skala pengukuran sosial, yakni nominal dan ordinal yang umumnya tidak
berdistribusi normal.
Keunggulan :
1.
Tidak membutuhkan asumsi normalitas.
2.
Secara umum metode statistik non-parametrik lebih
mudah dikerjakan dan lebih mudah dimengerti jika dibandingkan dengan statistik
parametrik karena ststistika non-parametrik tidak membutuhkan perhitungan
matematik yang rumit seperti halnya statistik parametrik.
3.
Statistik non-parametrik dapat digantikan data
numerik (nominal) dengan jenjang (ordinal).
4.
Kadang-kadang pada statistik non-parametrik tidak
dibutuhkan urutan atau jenjang secara formal karena sering dijumpai hasil
pengamatan yang dinyatakan dalam data kualitatif.
5.
Pengujian hipotesis pada statistik non-parametrik
dilakukan secara langsung pada pengamatan yang nyata.
6.
Walaupun pada statistik non-parametrik tidak
terikat pada distribusi normal populasi, tetapi dapat digunakan pada populasi
berdistribusi normal.
Kelemahan :
1. Statistik non-parametrik terkadang mengabaikan
beberapa informasi tertentu.
2. Hasil pengujian hipotesis dengan statistik
non-parametrik tidak setajam statistik parametrik.
Hasil statistik non-parametrik tidak dapat
diekstrapolasikan ke populasi studi seperti pada statistik parametrik. Hal ini
dikarenakan statistik non-parametrik mendekati eksperimen dengan sampel kecil
dan umumnya membandingkan dua kelompok tertentu.
Dalam implementasi, penggunaan
prosedur yang tepat merupakam tujuan dari peneliti. Beberapa parameter yang
dapat digunakan sebagai dasar dalam penggunaan statistik non parametrik adalah:
1. Hipotesa yang diuji tidak
melibatkan parameter populasi.
2. Skala yang digunakan lebih lemah
dari skala prosedur parametrik.
3. Asumsi-asumsi parametrik tidak
terpenuhi.
Statistik
inferensial
adalah teknik analisis data yang digunakan untuk menentukan sejauh mana
kesamaan antara hasil yang diperoleh dari suatu sampel dengan hasil yang akan
didapat pada populasi secara keseluruhan. Jadi statistik inferensial membantu
peneliti untuk mencari tahu apakah hasil yang diperoleh dari suatu sampel dapat
digeneralisasi pada populasi.Sejalan dengan pengertian statistik
inferensial menurut Creswell, Muhammad Nisfiannoor berpendapat bahwa statistik
inferensial adalah metode yang berhubungan dengan analisis data pada sampel
untuk digunakan untuk penggeneralisasian pada populasi. Penggunaan statistic inferensial
didasarkan pada peluang (probability) dan sampel yang dipilih secara acak
(random).
Uji normalitas berguna untuk
menentukan data yang telah dikumpulkan berdistribusi normal atau diambil dari
populasi normal. Metode klasik dalam pengujian normalitas suatu data tidak
begitu rumit. Berdasarkan pengalaman empiris beberapa pakar statistik, data
yang banyaknya lebih dari 30 angka (n > 30), maka sudah dapat diasumsikan
berdistribusi normal. Biasa dikatakan sebagai sampel besar.
Namun untuk memberikan kepastian, data yang
dimiliki berdistribusi normal atau tidak, sebaiknya digunakan uji statistik
normalitas. Karena belum tentu data yang lebih dari 30 bisa dipastikan
berdistribusi normal, demikian sebaliknya data yang banyaknya kurang dari 30
belum tentu tidak berdistribusi normal, untuk itu perlu suatu pembuktian. uji
statistik normalitas yang dapat digunakan diantaranya Chi-Square, Kolmogorov
Smirnov, Lilliefors, Shapiro Wilk.
Pengujian
homogenitas
adalah pengujian mengenai sama tidaknya variansi-variansi dua buah distribusi
atau lebih. Uji homogenitas yang akan dibahas dalam tulisan ini adalah Uji
Homogenitas Variansi dan Uji Bartlett. Uji homogenitas dilakukan untuk
mengetahui apakah data dalam variabel X dan Y bersifat homogen atau tidak.
Z-SKOR Digunakan untuk mengetahui lebih detail dimana posisi suatu skor dalam suatu distribusi. Posisi dalam suatu distribusi itu sendiri ditunjukan dengan simbol +/- yang menunjukan bahwa kalau positif berada di atas mean dan kalo negatif menandakan sebaliknya. Z-score juga memberi tahu berapa jarak skor itu sendiri dengan mean.
Rumus mengubah satu data menjadi z-skor : (x-µ) / s
Contohnya :
Suatu kumpulan data memiliki rata-rata 76. Data
tersebut memiliki s sebesar 3. Tentukan z-score untuk data bernilai 82 dan 73!
Cara menentukannya, kita harus melihat jarak antara
rata-rata dengan skor. Kita ambil data pertama contohnya 82.
Rumusnya adalah : x-µ = 82-76 = +6
Setelah mengetahui jaraknya, kita harus melihat
berapa s yang dimiliki oleh data tersebut. Karena dalam soal ini, s bernilai 3,
berarti +6 dibagi dengan 3 dan menghasilkan +2. Berarti z-score untuk nilai 82
adalah +2.
Sedangkan kalau untuk 73, jaraknya menjadi : x-µ =
73-76 = -3
Setelah itu langkahnya sama dengan atas dan
menjadikan z-score untuk nilai 73 adalah -1.
Hubungan antara z-score dengan grafik distribusi :
Formula z-skor
Setelah kita mengetahui bagaimana caranya mengubah
suatu data menjadi z-skor, sekarang kita melihat bagaimana caranya mengubah
z-skor menjadi data. Kita menggunakan rumus : x = µ + zs
Penggunaan z-skor dalam standard distribusi :
- Ukuran atau bentuk grafik
Ukuran atau bentuk grafik dari z-skor dengan suatu
distribusi akan selalu sama
- Mean
Dalam z-skor, meannya selalu memiliki nilai 0.
- Standard deviasi
Dalam z-skor, jarak antara satu skor dengan skor
lainnya pasti hanya satu.
Standar distribusi
Terdiri
dari skor yang telah berubah untuk menciptakan nilai-nilai yang telah
ditentukan. Salah satu keuntungan dari standar distribusi ialah kita bisa
membandingkan skor yang berbeda atau individu yang berbeda meskipun mereka
datang dari distribusi yang sangat berbeda.
Contohnya : ada seorang anak yang memiliki dua
nilai berbeda di dua bidang studi kuliah. dua-duanya memiliki data µ dan s.
Dengan begitu, kita bisa menentukan dimana skor nilai anak tersebut di kedua
bidang tersebut. Setelah kita dapat melihat letaknya, kita bisa membandingkan
kedua hal tersebut. Namun suatu hal yang harus diingat, kita tidak bisa
membandingkan skor yang diperoleh anak tersebut. Kita cuma bisa membandingkan
mean dan standar deviasinya karena di dua bidang studi kuliah tersebut
sama-sama memiliki mean dan standar deviasi yg sama.
Menghitung z-skor untuk sampel
Seperti yang telah dikatakan di bab sebelumnya,
perbedaan yang diperoleh dari perhitungan populasi dan sampel hanya masalah
simbol yang mewakilinya.
Untuk menghitung z-skor, kita bisa menggunakan
rumus : (x-M) / s
Apabila ingin menghitung nilai x dari z-skor kita
menggunakan rumus = M + zs
Standar distribusi sampel
- Grafik sampel z-skor sama dengan grafik sampel yang asli
- Sampel z-skor memiliki M=0
- Sampel z-skor memiliki s=1
Dalam statistik
inferensial, z-skor memberikan metode objektif untuk menentukan seberapa
baik nilai tertentu mewakili penduduknya. A
z-skor mendekati 0 menunjukkan bahwa skor dekat dengan mean populasi dan karena
itu repesentative. A z-score di luar 2 menunjukkan bahwa skor ekstrim dan
terasa berbeda dengan nilai lain dalam distribusi.
Dalam bahasan statistika istilah tingkat signifikansi (significance
level) dan tingkat kepercayaan (confidence level) dan sering digunakan.
Tingkat signifikansi (α) menunjukkan probabilitas atau peluang kesalahan yang
ditetapkan peneliti dalam mengambil keputusan untuk menolak atau mendukung
hipotesis nol, atau dapat diartikan juga sebagai tingkat kesalahan atau tingkat
kekeliruan yang ditolerir oleh peneliti, yang diakibatkan oleh kemungkinan
adanya kesalahan dalam pengambilan sampel (sampling error).
Tingkat signifikansi dinyatakan dalam persen dan
dilambngkan dengan α. Misalnya, ditetapkan tingkat signifikansi α = 5% atau α =
10%. Artinya, keputusan peneliti untuk menolak atau mendukung hipotesis nol
memiliki probabilitas kesalahan sebesar 5% atau 10%. Dalam beberapa program
statistik berbasis komputer, tingkat signifikansi selalu disertakan dan ditulis
sebagai Sig. (= significance), atau dalam program komputer lainnya ditulis
ρ-value. Nilai Sig atau ρ – value, seperti telah diuraikan di atas, adalah
nilai probabilitas kesalahan yang dihitung atau menunjukkan tingkat
probabilitas kesalahan yang sebenarnya. Tingkat kesalahan ini digunakan sebagai
dasar untuk mengambil keputusan dalam pengujian hipotesis.
Sementara tingkat
kepercayaan pada dasarnya menunjukkan tingkat keterpercayaan sejauhmana
statistik sampel dapat mengestimasi dengan benar parameter populasi dan/atau
sejauhmana pengambilan keputusan mengenai hasil uji hipotesis nol diyakini
kebenarannya. Dalam statistika, tingkat kepercayaan nilainya berkisar antara 0
sampai 100% dan dilambangkan oleh 1 – α. Secara konvensional, para peneliti
dalam ilmu-ilmu sosial sering menetapkan tingkat kepercayaan berkisar antara
95% – 99%. Jika dikatakan tingkat kepercayaan yang digunakan adalah 95%, ini
berarti tingkat kepastian statistik sampel mengestimasi dengan benar parameter
populasi adalah 95%, atau tingkat keyakinan untuk menolak atau mendukung
hipotesis nol dengan benar adalah 95%.
Tidak ada komentar:
Posting Komentar