Minggu, 25 Agustus 2013

Statistika dan Metode - metode nya




Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data, Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Istilah 'statistika' berbeda dengan 'statistik'. Statistika merupakan ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi, atau hasil penerapan algoritma statistika pada suatu data. Dari kumpulan data, statistika dapat digunakan untuk menyimpulkan atau mendeskripsikan data; ini dinamakan statistika deskriptif.



Variabel: adalah suatu sifat atau fenomena yang menunjukan sesuatu yang dapat diamati dan nilainya berbeda-beda

Sesuatu dikatakan variabel, jika:

  • Mempunyai nama
  • Dapat diamati atau diukur
  • Nilainya berbeda-beda
  • Memiliki definisi verbal
  • Ada kelompok penggolongan atau satuan



Macam - macam Variabel

  • Variabel Tergantung/ Akibat / Terpengaruh/ Dependen → variabel yang dipengaruhi oleh variabel lain
  • Variabel Bebas/ Sebab/ mempengaruhi/ Independen →variabel yang mempengaruhi variabel lain

Dalam statistika, populasi adalah sekumpulan data yang mempunyai karakteristik yang sama dan menjadi objek inferensi,



Sampel merupakan bagian dari populasi yang ingin diteliti; dipandang sebagai suatu pendugaan terhadap populasi, namun bukan populasi itu sendiri. Sampel dianggap sebagai perwakilan dari populasi yang hasilnya mewakili keseluruhan gejala yang diamati. ukuran dan keragaman sampel menjadi penentu baik tidaknya sampel yang diambil.



Terdapat dua cara pengambilan sampel, yaitu:

·         Acak (random)/probabilita dan

·         Tidak acak (non-random)/non-probabilita



Statistik Parametrik, yaitu ilmu statistik yang mempertimbangkan jenis sebaran atau distribusi data, yaitu apakah data menyebar secara normal atau tidak. Dengan kata lain, data yang akan dianalisis menggunakan statistik parametrik harus memenuhi asumsi normalitas. Pada umumnya, jika data tidak menyebar normal, maka data seharusnya dikerjakan dengan metode statistik non-parametrik, atau setidak-tidaknya dilakukan transformasi terlebih dahulu agar data mengikuti sebaran normal, sehingga bisa dikerjakan dengan statistik parametrik. 


Contoh metode statistik parametrik :

a. Uji-z (1 atau 2 sampel)

b. Uji-t (1 atau 2 sampel)

c. Korelasi pearson,

d. Perancangan percobaan (one or two-way anova parametrik), dll.


Ciri-ciri statistik parametrik :

- Data dengan skala interval dan rasio

- Data menyebar/berdistribusi normal



Keunggulan dan kelemahan statistik parametrik : 

Keunggulan :

1. Syarat syarat parameter dari suatu populasi yang menjadi sampel biasanya tidak diuji dan dianggap memenuhi syarat, pengukuran terhadap data dilakukan dengan kuat.

2. Observasi bebas satu sama lain dan ditarik dari populasi yang berdistribusi normal serta memiliki varian yang homogen.



Kelemahan :

1. Populasi harus memiliki varian yang sama.

2. Variabel-variabel yang diteliti harus dapat diukur setidaknya dalam skala interval.

3.Dalam analisis varian ditambahkan persyaratan rata-rata dari populasi harus normal dan bervarian sama, dan harus merupakan kombinasi linear dari efek-efek yang ditimbulkan.



Statistik Non-Parametrik adalah test yang modelnya tidak menetapkan syarat-syaratnya yang mengenai parameter-parameter populasi yang merupakan induk  sampel penelitiannya. Oleh karena itu observasi-observasi independent dan variabel yang diteliti pada dasarnya memiliki kontinuitas. Uji metode non parametrik atau bebas sebaran adalah prosedur pengujian hipotesa yang tidak mengasumsikan pengetahuan apapun mengenai sebaran populasi yang mendasarinya kecuali selama itu kontinu.

Pendeknya: Statistik Non-Parametrik adalah yaitu statistik bebas sebaran (tidak mensyaratkan bentuk sebaran parameter populasi, baik normal atau tidak). Selain itu, statistik non-parametrik biasanya menggunakan skala pengukuran sosial, yakni nominal dan ordinal yang umumnya tidak berdistribusi normal. 



Keunggulan :

1. Tidak membutuhkan asumsi normalitas.

2. Secara umum metode statistik non-parametrik lebih mudah dikerjakan dan lebih mudah dimengerti jika dibandingkan dengan statistik parametrik  karena ststistika non-parametrik tidak membutuhkan perhitungan matematik yang rumit seperti halnya statistik parametrik.

3. Statistik non-parametrik dapat digantikan data numerik (nominal) dengan jenjang (ordinal).

4. Kadang-kadang pada statistik non-parametrik tidak dibutuhkan urutan atau jenjang secara formal karena sering dijumpai hasil pengamatan yang dinyatakan dalam data kualitatif.

5. Pengujian hipotesis pada statistik non-parametrik dilakukan secara langsung pada pengamatan yang nyata.

6. Walaupun pada statistik non-parametrik tidak terikat pada distribusi normal populasi, tetapi dapat digunakan pada populasi berdistribusi normal.



Kelemahan :

1.  Statistik non-parametrik terkadang mengabaikan beberapa informasi tertentu.

2. Hasil pengujian hipotesis dengan statistik non-parametrik tidak setajam statistik parametrik.



Hasil statistik non-parametrik tidak dapat diekstrapolasikan ke populasi studi seperti pada statistik parametrik. Hal ini dikarenakan statistik non-parametrik mendekati eksperimen dengan sampel kecil dan umumnya membandingkan dua kelompok tertentu.




Dalam implementasi, penggunaan prosedur yang tepat merupakam tujuan dari peneliti. Beberapa parameter yang dapat digunakan sebagai dasar dalam penggunaan statistik non parametrik adalah:

1. Hipotesa yang diuji tidak melibatkan parameter populasi. 

2. Skala yang digunakan lebih lemah dari skala prosedur parametrik. 

3. Asumsi-asumsi parametrik tidak terpenuhi.



Statistik inferensial adalah teknik analisis data yang digunakan untuk menentukan sejauh mana kesamaan antara hasil yang diperoleh dari suatu sampel dengan hasil yang akan didapat pada populasi secara keseluruhan. Jadi statistik inferensial membantu peneliti untuk mencari tahu apakah hasil yang diperoleh dari suatu sampel dapat digeneralisasi pada populasi.Sejalan dengan pengertian statistik inferensial menurut Creswell, Muhammad Nisfiannoor berpendapat bahwa statistik inferensial adalah metode yang berhubungan dengan analisis data pada sampel untuk digunakan untuk penggeneralisasian pada populasi. Penggunaan statistic inferensial didasarkan pada peluang (probability) dan sampel yang dipilih secara acak (random).



Uji normalitas berguna untuk menentukan data yang telah dikumpulkan berdistribusi normal atau diambil dari populasi normal. Metode klasik dalam pengujian normalitas suatu data tidak begitu rumit. Berdasarkan pengalaman empiris beberapa pakar statistik, data yang banyaknya lebih dari 30 angka (n > 30), maka sudah dapat diasumsikan berdistribusi normal. Biasa dikatakan sebagai sampel besar.



Namun untuk memberikan kepastian, data yang dimiliki berdistribusi normal atau tidak, sebaiknya digunakan uji statistik normalitas. Karena belum tentu data yang lebih dari 30 bisa dipastikan berdistribusi normal, demikian sebaliknya data yang banyaknya kurang dari 30 belum tentu tidak berdistribusi normal, untuk itu perlu suatu pembuktian. uji statistik normalitas yang dapat digunakan diantaranya Chi-Square, Kolmogorov Smirnov, Lilliefors, Shapiro Wilk.



Pengujian homogenitas adalah pengujian mengenai sama tidaknya variansi-variansi dua buah distribusi atau lebih. Uji homogenitas yang akan dibahas dalam tulisan ini adalah Uji Homogenitas Variansi dan Uji Bartlett. Uji homogenitas dilakukan untuk mengetahui apakah data dalam variabel X dan Y bersifat homogen atau tidak.



Z-SKOR Digunakan untuk mengetahui lebih detail dimana posisi suatu skor dalam suatu distribusi. Posisi dalam suatu distribusi itu sendiri ditunjukan dengan simbol +/- yang menunjukan bahwa kalau positif berada di atas mean dan kalo negatif menandakan sebaliknya. Z-score juga memberi tahu berapa jarak skor itu sendiri dengan mean.

Rumus mengubah satu data menjadi z-skor : (x-µ) / s



Contohnya :

Suatu kumpulan data memiliki rata-rata 76. Data tersebut memiliki s sebesar 3. Tentukan z-score untuk data bernilai 82 dan 73!

Cara menentukannya, kita harus melihat jarak antara rata-rata dengan skor. Kita ambil data pertama contohnya 82.

Rumusnya adalah : x-µ = 82-76 = +6

Setelah mengetahui jaraknya, kita harus melihat berapa s yang dimiliki oleh data tersebut. Karena dalam soal ini, s bernilai 3, berarti +6 dibagi dengan 3 dan menghasilkan +2. Berarti z-score untuk nilai 82 adalah +2.

Sedangkan kalau untuk 73, jaraknya menjadi : x-µ = 73-76 = -3

Setelah itu langkahnya sama dengan atas dan menjadikan z-score untuk nilai 73 adalah -1.




Hubungan antara z-score dengan grafik distribusi :

Formula z-skor

Setelah kita mengetahui bagaimana caranya mengubah suatu data menjadi z-skor, sekarang kita melihat bagaimana caranya mengubah z-skor menjadi data. Kita menggunakan rumus : x = µ + zs

Penggunaan z-skor dalam standard distribusi :

  1. Ukuran atau bentuk grafik

Ukuran atau bentuk grafik dari z-skor dengan suatu distribusi akan selalu sama

  1. Mean

Dalam z-skor, meannya selalu memiliki nilai 0.

  1. Standard deviasi

Dalam z-skor, jarak antara satu skor dengan skor lainnya pasti hanya satu.



Standar distribusi Terdiri dari skor yang telah berubah untuk menciptakan nilai-nilai yang telah ditentukan. Salah satu keuntungan dari standar distribusi ialah kita bisa membandingkan skor yang berbeda atau individu yang berbeda meskipun mereka datang dari distribusi yang sangat berbeda.

Contohnya : ada seorang anak yang memiliki dua nilai berbeda di dua bidang studi kuliah. dua-duanya memiliki data µ dan s. Dengan begitu, kita bisa menentukan dimana skor nilai anak tersebut di kedua bidang tersebut. Setelah kita dapat melihat letaknya, kita bisa membandingkan kedua hal tersebut. Namun suatu hal yang harus diingat, kita tidak bisa membandingkan skor yang diperoleh anak tersebut. Kita cuma bisa membandingkan mean dan standar deviasinya karena di dua bidang studi kuliah tersebut sama-sama memiliki mean dan standar deviasi yg sama.



Menghitung z-skor untuk sampel

Seperti yang telah dikatakan di bab sebelumnya, perbedaan yang diperoleh dari perhitungan populasi dan sampel hanya masalah simbol yang mewakilinya.

Untuk menghitung z-skor, kita bisa menggunakan rumus : (x-M) / s

Apabila ingin menghitung nilai x dari z-skor kita menggunakan rumus = M + zs

Standar distribusi sampel

  1. Grafik sampel z-skor sama dengan grafik sampel yang asli
  2. Sampel z-skor memiliki M=0
  3. Sampel z-skor memiliki s=1





Dalam statistik inferensial, z-skor memberikan metode objektif untuk menentukan seberapa baik nilai tertentu mewakili penduduknya. A z-skor mendekati 0 menunjukkan bahwa skor dekat dengan mean populasi dan karena itu repesentative. A z-score di luar 2 menunjukkan bahwa skor ekstrim dan terasa berbeda dengan nilai lain dalam distribusi.



Dalam bahasan statistika istilah tingkat signifikansi (significance level) dan tingkat kepercayaan (confidence level) dan sering digunakan. Tingkat signifikansi (α) menunjukkan probabilitas atau peluang kesalahan yang ditetapkan peneliti dalam mengambil keputusan untuk menolak atau mendukung hipotesis nol, atau dapat diartikan juga sebagai tingkat kesalahan atau tingkat kekeliruan yang ditolerir oleh peneliti, yang diakibatkan oleh kemungkinan adanya kesalahan dalam pengambilan sampel (sampling error).



Tingkat signifikansi dinyatakan dalam persen dan dilambngkan dengan α. Misalnya, ditetapkan tingkat signifikansi α = 5% atau α = 10%. Artinya, keputusan peneliti untuk menolak atau mendukung hipotesis nol memiliki probabilitas kesalahan sebesar 5% atau 10%. Dalam beberapa program statistik berbasis komputer, tingkat signifikansi selalu disertakan dan ditulis sebagai Sig. (= significance), atau dalam program komputer lainnya ditulis ρ-value. Nilai Sig atau ρ – value, seperti telah diuraikan di atas, adalah nilai probabilitas kesalahan yang dihitung atau menunjukkan tingkat probabilitas kesalahan yang sebenarnya. Tingkat kesalahan ini digunakan sebagai dasar untuk mengambil keputusan dalam pengujian hipotesis.



Sementara tingkat kepercayaan pada dasarnya menunjukkan tingkat keterpercayaan sejauhmana statistik sampel dapat mengestimasi dengan benar parameter populasi dan/atau sejauhmana pengambilan keputusan mengenai hasil uji hipotesis nol diyakini kebenarannya. Dalam statistika, tingkat kepercayaan nilainya berkisar antara 0 sampai 100% dan dilambangkan oleh 1 – α. Secara konvensional, para peneliti dalam ilmu-ilmu sosial sering menetapkan tingkat kepercayaan berkisar antara 95% – 99%. Jika dikatakan tingkat kepercayaan yang digunakan adalah 95%, ini berarti tingkat kepastian statistik sampel mengestimasi dengan benar parameter populasi adalah 95%, atau tingkat keyakinan untuk menolak atau mendukung hipotesis nol dengan benar adalah 95%.


Tidak ada komentar:

Posting Komentar