Selasa, 29 April 2014

BAB 9 Analisis Regresi dan analisis korelasi

BAB 9

Analisis Regresi dan analisis korelasi

Pengertian : Analisis regresi merupakan salah satu analisis yang bertujuan untuk mengetahui pengaruh suatu variabel terhadap variabel lain. Dalam analisis regresi, variabel yang mempengaruhi disebut Independent Variable (variabel bebas) dan variabel yang dipengaruhi disebut Dependent Variable (variabel terikat). Jika dalam persamaan regresi hanya terdapat satu variabel bebas dan satu variabel terikat, maka disebut sebagai persamaan regresi sederhana, sedangkan jika variabel bebasnya lebih dari satu, maka disebut sebagai persamaan regresi berganda.

Analisis Korelasi merupakan suatu analisis untuk mengetahui tingkat keeratan hubungan antara dua variabel. Tingkat hubungan tersebut dapat dibagi menjadi tiga kriteria, yaitu mempunyai hubungan positif, mempunyai hubungan negatif dan tidak mempunyai hubungan.
Analisis Regresi Sederhana : digunakan untuk mengetahui pengaruh dari variabel bebas terhadap variabel terikat atau dengan kata lain untuk mengetahui seberapa jauh perubahan variabel bebas dalam mempengaruhi variabel terikat. Dalam analisis regresi sederhana, pengaruh satu variabel bebas terhadap variabel terikat dapat dibuat persamaan sebagai berikut : 
Y = a + b X
 Keterangan :Y : Variabel terikat (Dependent Variable); 
                      X : Variabel bebas (Independent Variable);
                       a : Konstanta; dan
                      b : Koefisien Regresi.
 Untuk mencari persamaan garis regresi dapat digunakan berbagai pendekatan (rumus), sehingga nilai konstanta (a) dan nilai koefisien regresi (b) dapat dicari dengan metode sebagai berikut :
a = [(ΣY . ΣX2) – (ΣX . ΣXY)] / [(N . ΣX2) – (ΣX)2] atau a = (ΣY/N) – b (ΣX/N)
b = [N(ΣXY) – (ΣX . ΣY)] / [(N . ΣX2) – (ΣX)2]

Contoh :
Berdasarkan hasil pengambilan sampel secara acak tentang pengaruh lamanya belajar (X) terhadap nilai ujian (Y) adalah sebagai berikut :
(nilai ujian)
X (lama belajar)
X 2
XY
40
4
16
160
60
6
36
360
50
7
49
350
70
10
100
700
90
13
169
1.170
ΣY = 310
ΣX = 40
ΣX2 = 370
ΣXY = 2.740
Dengan menggunakan rumus di atas, nilai a dan b akan diperoleh sebagai berikut :
a = [(ΣY . ΣX2) – (ΣX . ΣXY)] / [(N . ΣX2) – (ΣX)2]
a = [(310 . 370) – (40 . 2.740)] / [(5 . 370) – 402] = 20,4

b = [N(ΣXY) – (ΣX . ΣY)] / [(N . ΣX2) – (ΣX)2]
b = [(5 . 2.740) – (40 . 310] / [(5 . 370) – 402] = 5,4

Sehingga persamaan regresi sederhana adalah Y = 20,4 + 5,2 X
Berdasarkan hasil penghitungan dan persamaan regresi sederhana tersebut di atas, maka dapat diketahui bahwa : 
1) Lamanya belajar mempunyai pengaruh positif (koefisien regresi (b) = 5,2) terhadap nilai ujian, artinya jika semakin lama dalam belajar maka akan semakin baik atau tinggi nilai ujiannya; 
2) Nilai konstanta adalah sebesar 20,4, artinya jika tidak belajar atau lama belajar sama dengan nol, maka nilai ujian adalah sebesar 20,4 dengan asumsi variabel-variabel lain yang dapat mempengaruhi dianggap tetap.
Analisis Korelasi (r) : digunakan untuk mengukur tinggi redahnya derajat hubungan antar variabel yang diteliti. Tinggi rendahnya derajat keeratan tersebut dapat dilihat dari koefisien korelasinya. Koefisien korelasi yang mendekati angka + 1 berarti terjadi hubungan positif yang erat, bila mendekati angka – 1 berarti terjadi hubungan negatif yang erat. Sedangkan koefisien korelasi mendekati angka 0 (nol) berarti hubungan kedua variabel adalah lemah atau tidak erat. Dengan demikian nilai koefisien korelasi adalah – 1 ≤ r ≤ + 1. Untuk koefisien korelasi sama dengan – 1 atau + 1 berarti hubungan kedua variabel adalah sangat erat atau sangat sempurna dan hal ini sangat jarang terjadi dalam data riil. Untuk mencari nilai koefisen korelasi (r) dapat digunakan rumus sebagai berikut : r = [(N . ΣXY) – (ΣX . ΣY)] / √{[(N . ΣX2) – (ΣX)2] . [(N . ΣY2) – (ΣY)2]}

Contoh :
Sampel yang diambil secara acak dari 5 mahasiswa, didapat data nilai Statistik dan Matematika sebagai berikut :
Sampel
X (statistik)
Y (matematika)
XY
X2
Y2
1
2
3
6
4
9
2
5
4
20
25
16
3
3
4
12
9
16
4
7
8
56
49
64
5
8
9
72
64
81
Jumlah
25
28
166
151
186
r = [(N . ΣXY) – (ΣX . ΣY)] / √{[(N . ΣX2) – (ΣX)2] . [(N . ΣY2) – (ΣY)2]}
r = [(5 . 166) – (25 . 28) / √{[(5 . 151) – (25)2] . [(5 . 186) – (28)2]} = 0,94

Nilai koefisien korelasi sebesar 0,94 atau 94 % menggambarkan bahwa antara nilai statistik dan matematika mempunyai hubungan positif dan hubungannya erat, yaitu jika mahasiswa mempunyai nilai statistiknya baik maka nilai matematikanya juga akan baik dan sebaliknya jika nilai statistik jelek maka nilai matematikanya juga jelek.

Senin, 28 April 2014


 Tugas Statistika BAB 8
Analisis Varians


        Analisis varians (analysis of variance, ANOVA) adalah suatu metode analisis statistika yang termasuk ke dalam cabang statistika inferensi.. Dalam literatur Indonesia metode ini dikenal dengan berbagai nama lain, seperti analisis ragam, sidik ragam, dan analisis variansi. Ia merupakan pengembangan dari masalah behrens-Fisher, sehingga uji-F juga dipakai dalam pengambilan keputusan. Analisis varians pertama kali diperkenalkan oleh Sir Ronald fisher, bapak statistika modern. Dalam praktik, analisis varians dapat merupakan uji hipotesis(lebih sering dipakai) maupun pendugaan (estimation, khususnya di bidang genetika terapan).

Secara umum, analisis varians menguji dua varians (atau ragam) berdasarkan hipotesis nol bahwa kedua varians itu sama. Varians pertama adalah varians antarcontoh (among samples) dan varians kedua adalah varians di dalam masing-masing contoh (within samples). Dengan ide semacam ini, analisis varians dengan dua contoh akan memberikan hasil yang sama dengan uji-t untuk dua rata rata (mean).
Supaya sahih (valid) dalam menafsirkan hasilnya, analisis varians menggantungkan diri pada empat asumsi yang harus dipenuhi dalam perancangan percobaan:
  1. Data berdistribusi normal, karena pengujiannya menggunakan uji F-Snedecor
  2. Varians atau ragamnya homogen, dikenal sebagai homoskedastisitas, karena hanya digunakan satu penduga (estimate) untuk varians dalam contoh
  3. Masing-masing contoh saling bebas, yang harus dapat diatur dengan perancangan percobaan yang tepat
  4. Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah).
Analisis varians relatif mudah dimodifikasi dan dapat dikembangkan untuk berbagai bentuk percobaan yang lebih rumit. Selain itu, analisis ini juga masih memiliki keterkaitan dengan analisis regresi. Akibatnya, penggunaannya sangat luas di berbagai bidang, mulai dari eksperimen laboratorium hingga eksperimen periklanan, psikologi, dan kemasyarakatan.
BAB 7
Pengujian Hipotesis 
 
 
 
 
Hipotesis statistik 
Sebuah pernyataan tentang parameter yang menjelaskan sebuah populasi (bukan sampel).
Statistik 
Angka yang dihitung dari sekumpulan sampel.
Hipotesis nol (H0
Sebuah hipotesis yang berlawanan dengan teori yang akan dibuktikan.
Hipitesis alternatif (H1) atau Hipotesis kerja (Ha)
Sebuah hipotesis (kadang gabungan) yang berhubungan dengan teori yang akan dibuktikan.
Tes Statistik 
Sebuah prosedur dimana masukannya adalah sampel dan hasilnya adalah hipotesis.
Daerah penerimaan 
Nilai dari tes statistik yang menggagalkan untuk penolakan hipotesis nol.
Daerah penolakan 
Nilai dari tes statistik untuk penolakan hipotesis nol.
Kekuatan Statistik (1 − β)
Probabilitas kebenaran pada saat menolak hipotesis nol.
Tingkat signifikan test (α)
Probabilitas kesalahan pada saat menolak hipotesis nol.
Nilai P (P-value)
Probabilitas, mengasumsikan hipotesis nol benar.

Interpretasi

Jika nilai p lebih kecil dari tingkat signifikan test yang diharapkan, maka hipotesis nol bisa di tolak. Jika nilai p tidak lebih kecil dari tingkat signifikan test yang diharapkan bisa disimpulkan bahwa tidak cukup bukti untuk menolak hipotesa nol, dan bisa disimpulkan bahwa hipotesa alternatiflah yang benar.

Prosedur Uji Hipotesis

  1. Tentukan parameter yang akan diuji
  2. Tentukan Hipotesis nol (H0)
  3. Tentukan hipootesis alternatif (H1)
  4. Tentukan (α)
  5. Pilih statistik yang tepat
  6. Tentukan daerah penolakan
  7. Hitung statistik uji
  8. Putuskan apakah Hipotesis nol (H0) ditolak atau tidak

Contoh Uji Hipotesis

Seorang yang dituduh pencuri dihadapkan kepada seorang hakim. Seorang hakim akan menganggap orang tersebut tidak bersalah, sampai kesalahannya bisa dibuktikan. Seorang jaksa akan berusaha membuktikan kesalahan orang tersebut.
Dalam kasus ini, Hipotesis nol (H0) adalah: "Orang tersebut tidak bersalah", dan Hipotesis alternatif (H1) adalah : "Orang tersebut bersalah". Hipotesis alternatif (H1) inilah yang akan dibuktikan.
Ada dua kondisi yang mungkin terjadi terhadap orang tersebut:
  1. Orang tersebut tidak bersalah.
  2. Orang tersebut bersalah.
Dan ada dua keputusan yang bisa diambil hakim
  1. Melepaskan orang tersebut.
  2. Memenjarakan orang tersebut.

Hipotesis nol (H0) benar
(Orang tersebut tidak bersalah)
Hipotesis alternatif (H1) benar
(Orang tersebut bersalah)
Menerima hipotesis nol
(Orang tersebut dibebaskan)
Keputusan yang benar Keputusan yang salah
(Kesalahan Tipe II)
Menolak hipotesis nol
(Orang tersebut dipenjara)
Keputusan yang salah
(Kesalahan Tipe I)
Keputusan yang benar.
Dalam kasus ini, ada dua kemungkinan kesalahan yang dilakukan hakim
  1. Memenjarakan orang yang benar (Kesalahan Tipe I)
  2. Melepaskan orang yang bersalah (Kesalahan Tipe II)

Rumus

Ada banyak jenis uji hipotesis yang dikenal. Tabel berikut menjelaskan rumus untuk masing-masing uji hipotesis tersebut.
Nama Rumus Asumsi / Catatan
Satu sampel z-test
(En=One-sample z-test)
z=\frac{\overline{x}-\mu_0}{\sigma}\sqrt n (Populasi normal atau n > 30) dan σ diketahui.
(z adalah jarak dari rata-rata sehubungan dengan simpangan baku rata-rata). Untuk distribusi non-normal memungkinkan untuk dihitung proporsi terkecil dalam sebuah populasi yang berada di dalam k simpangan baku untuk setiap k.
Dua sampel z-test
(En=Two-sample z-test)
z=\frac{(\overline{x}_1 - \overline{x}_2) - d_0}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} Populasi normal dan observasi independen dan σ1 dn σ2 diketahui
Satu sampel t-test
(En=One-sample t-test)
t=\frac{\overline{x}-\mu_0} {( s / \sqrt{n} )} ,
df=n-1 \
(Populasi normal atau n > 30) dan \sigma tidak diketahui
Pasangan t-test
(En=Paired t-test)
t=\frac{\overline{d}-d_0} { ( s_d / \sqrt{n} ) } ,
df=n-1 \
(Populasi normal dari perbedaan atau n > 30) dan \sigma tidak diktahui
Dua sampel t-test digabung
(En=Two-sample pooled t-test)
varians yang sama
t=\frac{(\overline{x}_1 - \overline{x}_2) - d_0}{s_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}},
s_p^2=\frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2},
df=n_1 + n_2 - 2 \ [4]
(Populasi normal atau n1 + n2 > 40) dan observasi independen dan σ1 = σ2 idak diketahui
Dua sampel t-test terpisah
(En=Two-sample unpooled t-test)
varians tidak sama
t=\frac{(\overline{x}_1 - \overline{x}_2) - d_0}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}},
df = \frac{\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2} {\frac{\left(\frac{s_1^2}{n_1}\right)^2}{n_1-1} + \frac{\left(\frac{s_2^2}{n_2}\right)^2}{n_2-1}} [4]
(Populasi normal atau n1 + n2 > 40) dan observasi independen dan kedua σ1 ≠ σ2 diketahui
Satu proporsi z-test
(En=One-proportion z-test)
z=\frac{\hat{p} - p_0}{\sqrt{p_0 (1-p_0)}}\sqrt n n .p0 > 10 dan n (1 − p0) > 10.
Dua proporsi z-test
(En=Two-proportion z-test)
H_0\colon p_1=p_2 digabungkan
z=\frac{(\hat{p}_1 - \hat{p}_2)}{\sqrt{\hat{p}(1 - \hat{p})(\frac{1}{n_1} + \frac{1}{n_2})}} \hat{p}=\frac{x_1 + x_2}{n_1 + n_2} n1 p1 > 5 dan n1(1 − p1) > 5 dan n2 p2 > 5 dan n2(1 − p2) > 5 dan observasi independen.
Dua proporsi z-test
(En=Two-proportion z-test) |d_0|>0 tidak digabung
z=\frac{(\hat{p}_1 - \hat{p}_2) - d_0}{\sqrt{\frac{\hat{p}_1(1 - \hat{p}_1)}{n_1} + \frac{\hat{p}_2(1 - \hat{p}_2)}{n_2}}} n1 p1 > 5 dan n1(1 − p1) > 5 dan n2 p2 > 5 dan n2(1 − p2) > 5 dan observasi independen.
Chi-squared test untuk varians \chi^2=(n-1)\frac{s^2}{\sigma^2_0} Populasi normal
Chi-squared test untuk goodness of fit \chi^2=\sum^k\frac{(observed-expected)^2}{expected} df = k - 1 - # parameter terestimasi • Semua jumlah yang diharapkan paling tidak 5.[5]
• Semua jumlah yang diharapkan > 1 dan tidak lebih dari 20% dari jumlah yang diharapkan lebih kecil dari 5[6]
Dua sampel F test untuk persamaan varians
(En=Two-sample F test for equality of variances)
F=\frac{s_1^2}{s_2^2} Populasi normal
Diurutkan s_1^2 > s_2^2 dan H0 ditolak jika F > F(\alpha/2,n_1-1,n_2-1)[7]
Definisi simbol:
  • \alpha, probabilitas melakukan kesalahan tipe I (menolak hipotesis nol pada saat hipotesis nol benar)
  • n = Jumlah sampel
  • n_1 = Jumlah sampel 1
  • n_2 = Jumlah sampel 2
  • \overline{x} = Rata-rata sampel
  • \mu_0 = Dugaan rata-rata populasi
  • \mu_1 = Rata-rata populasi 1
  • \mu_2 = Rata-rata populasi 2
  • \sigma = Simpangan baku populasi
  • \sigma^2 = Varians populasi
  • s = Simpangan baku sampel
  • \sum^k = Penjumlahan(dari angka sejumlak k)
  • \hat{p} = x/n = Proporsi sampel, (kecuali ditentukan sebelumnya)
  • p_0 = Dugaan proporsi populasi
  • p_1 = proporsi 1
  • p_2 = proporsi 2
  • d_p = Dugaan perbedaan proporsi
  • \min\{n_1,n_2\} = minimum of n1 and n2
  • x_1 = n_1 p_1
  • x_2 = n_2 p_2
  • F = F statistik

Referensi

  1. ^ R. A. Fisher (1925). Statistical Methods for Research Workers, Edinburgh: Oliver and Boyd, 1925, p.43.
  2. ^ Cramer, Duncan; Dennis Howitt (2004). The Sage Dictionary of Statistics. hlm. 76. ISBN 076194138X.
  3. ^ Lehmann, E.L.; Romano, Joseph P. (2005). Testing Statistical Hypotheses (ed. 3E). New York: Springer. ISBN 0387988645.
  4. ^ a b NIST handbook: Two-Sample t-Test for Equal Means
  5. ^ Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences., McGraw Hill, 1960, page 350.
  6. ^ Weiss, Neil A. (1999). Introductory Statistics (ed. 5th). hlm. 802. ISBN 0-201-59877-9.
  7. ^ NIST handbook: F-Test for Equality of Two Standard Deviations (Testing standard deviations the same as testing variances)