atika

Selasa, 29 April 2014

BAB 9 Analisis Regresi dan analisis korelasi

BAB 9

Analisis Regresi dan analisis korelasi

Pengertian : Analisis regresi merupakan salah satu analisis yang bertujuan untuk mengetahui pengaruh suatu variabel terhadap variabel lain. Dalam analisis regresi, variabel yang mempengaruhi disebut Independent Variable (variabel bebas) dan variabel yang dipengaruhi disebut Dependent Variable (variabel terikat). Jika dalam persamaan regresi hanya terdapat satu variabel bebas dan satu variabel terikat, maka disebut sebagai persamaan regresi sederhana, sedangkan jika variabel bebasnya lebih dari satu, maka disebut sebagai persamaan regresi berganda.

Analisis Korelasi merupakan suatu analisis untuk mengetahui tingkat keeratan hubungan antara dua variabel. Tingkat hubungan tersebut dapat dibagi menjadi tiga kriteria, yaitu mempunyai hubungan positif, mempunyai hubungan negatif dan tidak mempunyai hubungan.
Analisis Regresi Sederhana : digunakan untuk mengetahui pengaruh dari variabel bebas terhadap variabel terikat atau dengan kata lain untuk mengetahui seberapa jauh perubahan variabel bebas dalam mempengaruhi variabel terikat. Dalam analisis regresi sederhana, pengaruh satu variabel bebas terhadap variabel terikat dapat dibuat persamaan sebagai berikut :

Y = a + b X

Keterangan :Y : Variabel terikat (Dependent Variable);

X : Variabel bebas (Independent Variable);

a : Konstanta; dan

b : Koefisien Regresi.

Untuk mencari persamaan garis regresi dapat digunakan berbagai pendekatan (rumus), sehingga nilai konstanta (a) dan nilai koefisien regresi (b) dapat dicari dengan metode sebagai berikut :
a = [(ΣY . ΣX2) – (ΣX . ΣXY)] / [(N . ΣX2) – (ΣX)2] atau a = (ΣY/N) – b (ΣX/N)
b = [N(ΣXY) – (ΣX . ΣY)] / [(N . ΣX2) – (ΣX)2]

Contoh :
Berdasarkan hasil pengambilan sampel secara acak tentang pengaruh lamanya belajar (X) terhadap nilai ujian (Y) adalah sebagai berikut :

(nilai ujian)	X (lama belajar)	X ²	XY
40	4	16	160
60	6	36	360
50	7	49	350
70	10	100	700
90	13	169	1.170
ΣY = 310	ΣX = 40	ΣX² = 370	ΣXY = 2.740

Dengan menggunakan rumus di atas, nilai a dan b akan diperoleh sebagai berikut :
a = [(ΣY . ΣX2) – (ΣX . ΣXY)] / [(N . ΣX2) – (ΣX)2]
a = [(310 . 370) – (40 . 2.740)] / [(5 . 370) – 402] = 20,4

b = [N(ΣXY) – (ΣX . ΣY)] / [(N . ΣX2) – (ΣX)2]
b = [(5 . 2.740) – (40 . 310] / [(5 . 370) – 402] = 5,4

Sehingga persamaan regresi sederhana adalah Y = 20,4 + 5,2 X
Berdasarkan hasil penghitungan dan persamaan regresi sederhana tersebut di atas, maka dapat diketahui bahwa :

1) Lamanya belajar mempunyai pengaruh positif (koefisien regresi (b) = 5,2) terhadap nilai ujian, artinya jika semakin lama dalam belajar maka akan semakin baik atau tinggi nilai ujiannya;

2) Nilai konstanta adalah sebesar 20,4, artinya jika tidak belajar atau lama belajar sama dengan nol, maka nilai ujian adalah sebesar 20,4 dengan asumsi variabel-variabel lain yang dapat mempengaruhi dianggap tetap.

Analisis Korelasi (r) : digunakan untuk mengukur tinggi redahnya derajat hubungan antar variabel yang diteliti. Tinggi rendahnya derajat keeratan tersebut dapat dilihat dari koefisien korelasinya. Koefisien korelasi yang mendekati angka + 1 berarti terjadi hubungan positif yang erat, bila mendekati angka – 1 berarti terjadi hubungan negatif yang erat. Sedangkan koefisien korelasi mendekati angka 0 (nol) berarti hubungan kedua variabel adalah lemah atau tidak erat. Dengan demikian nilai koefisien korelasi adalah – 1 ≤ r ≤ + 1. Untuk koefisien korelasi sama dengan – 1 atau + 1 berarti hubungan kedua variabel adalah sangat erat atau sangat sempurna dan hal ini sangat jarang terjadi dalam data riil. Untuk mencari nilai koefisen korelasi (r) dapat digunakan rumus sebagai berikut : r = [(N . ΣXY) – (ΣX . ΣY)] / √{[(N . ΣX2) – (ΣX)2] . [(N . ΣY2) – (ΣY)2]}

Contoh :
Sampel yang diambil secara acak dari 5 mahasiswa, didapat data nilai Statistik dan Matematika sebagai berikut :

Sampel	X (statistik)	Y (matematika)	XY	X²	Y²
1	2	3	6	4	9
2	5	4	20	25	16
3	3	4	12	9	16
4	7	8	56	49	64
5	8	9	72	64	81
Jumlah	25	28	166	151	186

r = [(N . ΣXY) – (ΣX . ΣY)] / √{[(N . ΣX2) – (ΣX)2] . [(N . ΣY2) – (ΣY)2]}
r = [(5 . 166) – (25 . 28) / √{[(5 . 151) – (25)2] . [(5 . 186) – (28)2]} = 0,94

Nilai koefisien korelasi sebesar 0,94 atau 94 % menggambarkan bahwa antara nilai statistik dan matematika mempunyai hubungan positif dan hubungannya erat, yaitu jika mahasiswa mempunyai nilai statistiknya baik maka nilai matematikanya juga akan baik dan sebaliknya jika nilai statistik jelek maka nilai matematikanya juga jelek.

Senin, 28 April 2014

Tugas Statistika BAB 8

Analisis Varians

Analisis varians (analysis of variance, ANOVA) adalah suatu metode analisis statistika yang termasuk ke dalam cabang statistika inferensi.. Dalam literatur Indonesia metode ini dikenal dengan berbagai nama lain, seperti analisis ragam, sidik ragam, dan analisis variansi. Ia merupakan pengembangan dari masalah behrens-Fisher, sehingga uji-F juga dipakai dalam pengambilan keputusan. Analisis varians pertama kali diperkenalkan oleh Sir Ronald fisher, bapak statistika modern. Dalam praktik, analisis varians dapat merupakan uji hipotesis(lebih sering dipakai) maupun pendugaan (estimation, khususnya di bidang genetika terapan).

Secara umum, analisis varians menguji dua varians (atau ragam) berdasarkan hipotesis nol bahwa kedua varians itu sama. Varians pertama adalah varians antarcontoh (among samples) dan varians kedua adalah varians di dalam masing-masing contoh (within samples). Dengan ide semacam ini, analisis varians dengan dua contoh akan memberikan hasil yang sama dengan uji-t untuk dua rata rata (mean).
Supaya sahih (valid) dalam menafsirkan hasilnya, analisis varians menggantungkan diri pada empat asumsi yang harus dipenuhi dalam perancangan percobaan:

Data berdistribusi normal, karena pengujiannya menggunakan uji F-Snedecor
Varians atau ragamnya homogen, dikenal sebagai homoskedastisitas, karena hanya digunakan satu penduga (estimate) untuk varians dalam contoh
Masing-masing contoh saling bebas, yang harus dapat diatur dengan perancangan percobaan yang tepat
Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah).

Analisis varians relatif mudah dimodifikasi dan dapat dikembangkan untuk berbagai bentuk percobaan yang lebih rumit. Selain itu, analisis ini juga masih memiliki keterkaitan dengan analisis regresi. Akibatnya, penggunaannya sangat luas di berbagai bidang, mulai dari eksperimen laboratorium hingga eksperimen periklanan, psikologi, dan kemasyarakatan.

BAB 7
Pengujian Hipotesis




Hipotesis statistik: Sebuah pernyataan tentang parameter yang menjelaskan sebuah populasi (bukan sampel).
Statistik: Angka yang dihitung dari sekumpulan sampel.
Hipotesis nol (H₀): Sebuah hipotesis yang berlawanan dengan teori yang akan dibuktikan.
Hipitesis alternatif (H₁) atau Hipotesis kerja (Ha): Sebuah hipotesis (kadang gabungan) yang berhubungan dengan teori yang akan dibuktikan.
Tes Statistik: Sebuah prosedur dimana masukannya adalah sampel dan hasilnya adalah hipotesis.
Daerah penerimaan: Nilai dari tes statistik yang menggagalkan untuk penolakan hipotesis nol.
Daerah penolakan: Nilai dari tes statistik untuk penolakan hipotesis nol.
Kekuatan Statistik (1 − β): Probabilitas kebenaran pada saat menolak hipotesis nol.
Tingkat signifikan test (α): Probabilitas kesalahan pada saat menolak hipotesis nol.
Nilai P (P-value): Probabilitas, mengasumsikan hipotesis nol benar.

Interpretasi

Jika nilai p lebih kecil dari tingkat signifikan test yang diharapkan, maka hipotesis nol bisa di tolak. Jika nilai p tidak lebih kecil dari tingkat signifikan test yang diharapkan bisa disimpulkan bahwa tidak cukup bukti untuk menolak hipotesa nol, dan bisa disimpulkan bahwa hipotesa alternatiflah yang benar.

Prosedur Uji Hipotesis

Tentukan parameter yang akan diuji
Tentukan Hipotesis nol (H₀)
Tentukan hipootesis alternatif (H₁)
Tentukan (α)
Pilih statistik yang tepat
Tentukan daerah penolakan
Hitung statistik uji
Putuskan apakah Hipotesis nol (H₀) ditolak atau tidak

Contoh Uji Hipotesis

Seorang yang dituduh pencuri dihadapkan kepada seorang hakim. Seorang hakim akan menganggap orang tersebut tidak bersalah, sampai kesalahannya bisa dibuktikan. Seorang jaksa akan berusaha membuktikan kesalahan orang tersebut.
Dalam kasus ini, Hipotesis nol (H₀) adalah: "Orang tersebut tidak bersalah", dan Hipotesis alternatif (H₁) adalah : "Orang tersebut bersalah". Hipotesis alternatif (H₁) inilah yang akan dibuktikan.
Ada dua kondisi yang mungkin terjadi terhadap orang tersebut:

Orang tersebut tidak bersalah.
Orang tersebut bersalah.

Dan ada dua keputusan yang bisa diambil hakim

Melepaskan orang tersebut.
Memenjarakan orang tersebut.

	Hipotesis nol (H₀) benar (Orang tersebut tidak bersalah)	Hipotesis alternatif (H₁) benar (Orang tersebut bersalah)
Menerima hipotesis nol (Orang tersebut dibebaskan)	Keputusan yang benar	Keputusan yang salah (Kesalahan Tipe II)
Menolak hipotesis nol (Orang tersebut dipenjara)	Keputusan yang salah (Kesalahan Tipe I)	Keputusan yang benar.

Dalam kasus ini, ada dua kemungkinan kesalahan yang dilakukan hakim

Memenjarakan orang yang benar (Kesalahan Tipe I)
Melepaskan orang yang bersalah (Kesalahan Tipe II)

Rumus

Ada banyak jenis uji hipotesis yang dikenal. Tabel berikut menjelaskan rumus untuk masing-masing uji hipotesis tersebut.

Nama

Rumus

Asumsi / Catatan

Satu sampel z-test
(En=One-sample z-test)

z=\frac{\overline{x}-\mu_0}{\sigma}\sqrt n

(Populasi normal atau n > 30) dan σ diketahui.
(z adalah jarak dari rata-rata sehubungan dengan simpangan baku rata-rata). Untuk distribusi non-normal memungkinkan untuk dihitung proporsi terkecil dalam sebuah populasi yang berada di dalam k simpangan baku untuk setiap k.

Dua sampel z-test
(En=Two-sample z-test)

z=\frac{(\overline{x}_1 - \overline{x}_2) - d_0}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}

Populasi normal dan observasi independen dan σ₁ dn σ₂ diketahui

Satu sampel t-test
(En=One-sample t-test)

t=\frac{\overline{x}-\mu_0} {( s / \sqrt{n} )} ,

df=n-1 \

(Populasi normal atau n > 30) dan

\sigma

tidak diketahui

Pasangan t-test
(En=Paired t-test)

t=\frac{\overline{d}-d_0} { ( s_d / \sqrt{n} ) } ,

df=n-1 \

(Populasi normal dari perbedaan atau n > 30) dan

\sigma

tidak diktahui

Dua sampel t-test digabung
(En=Two-sample pooled t-test)
varians yang sama

t=\frac{(\overline{x}_1 - \overline{x}_2) - d_0}{s_p\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}},

s_p^2=\frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2},

df=n_1 + n_2 - 2 \

^[4]

(Populasi normal atau n₁ + n₂ > 40) dan observasi independen dan σ₁ = σ₂ idak diketahui

Dua sampel t-test terpisah
(En=Two-sample unpooled t-test)
varians tidak sama

t=\frac{(\overline{x}_1 - \overline{x}_2) - d_0}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}},

df = \frac{\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2} {\frac{\left(\frac{s_1^2}{n_1}\right)^2}{n_1-1} + \frac{\left(\frac{s_2^2}{n_2}\right)^2}{n_2-1}}

^[4]

(Populasi normal atau n₁ + n₂ > 40) dan observasi independen dan kedua σ₁ ≠ σ₂ diketahui

Satu proporsi z-test
(En=One-proportion z-test)

z=\frac{\hat{p} - p_0}{\sqrt{p_0 (1-p_0)}}\sqrt n

n ^.p₀ > 10 dan n (1 − p₀) > 10.

Dua proporsi z-test
(En=Two-proportion z-test)

H_0\colon p_1=p_2

digabungkan

z=\frac{(\hat{p}_1 - \hat{p}_2)}{\sqrt{\hat{p}(1 - \hat{p})(\frac{1}{n_1} + \frac{1}{n_2})}}

\hat{p}=\frac{x_1 + x_2}{n_1 + n_2}

n₁ p₁ > 5 dan n₁(1 − p₁) > 5 dan n₂ p₂ > 5 dan n₂(1 − p₂) > 5 dan observasi independen.

Dua proporsi z-test
(En=Two-proportion z-test)

|d_0|>0

tidak digabung

z=\frac{(\hat{p}_1 - \hat{p}_2) - d_0}{\sqrt{\frac{\hat{p}_1(1 - \hat{p}_1)}{n_1} + \frac{\hat{p}_2(1 - \hat{p}_2)}{n_2}}}

n₁ p₁ > 5 dan n₁(1 − p₁) > 5 dan n₂ p₂ > 5 dan n₂(1 − p₂) > 5 dan observasi independen.

Chi-squared test untuk varians

\chi^2=(n-1)\frac{s^2}{\sigma^2_0}

Populasi normal

Chi-squared test untuk goodness of fit

\chi^2=\sum^k\frac{(observed-expected)^2}{expected}

df = k - 1 - # parameter terestimasi • Semua jumlah yang diharapkan paling tidak 5.^[5]
• Semua jumlah yang diharapkan > 1 dan tidak lebih dari 20% dari jumlah yang diharapkan lebih kecil dari 5^[6]

Dua sampel F test untuk persamaan varians
(En=Two-sample F test for equality of variances)

F=\frac{s_1^2}{s_2^2}

Populasi normal
Diurutkan

s_1^2

s_2^2

dan H₀ ditolak jika

F > F(\alpha/2,n_1-1,n_2-1)

^[7]

Definisi simbol:

$\alpha$ , probabilitas melakukan kesalahan tipe I (menolak hipotesis nol pada saat hipotesis nol benar)
$n$ = Jumlah sampel
$n_1$ = Jumlah sampel 1
$n_2$ = Jumlah sampel 2
$\overline{x}$ = Rata-rata sampel
$\mu_0$ = Dugaan rata-rata populasi
$\mu_1$ = Rata-rata populasi 1
$\mu_2$ = Rata-rata populasi 2
$\sigma$ = Simpangan baku populasi
$\sigma^2$ = Varians populasi
$s$ = Simpangan baku sampel
$\sum^k$ = Penjumlahan(dari angka sejumlak k)

$s^2$ = Variacs sampel
$s_1$ = Simpangan baku sampe 1
$s_2$ = Simpangan baku sampe 2
$t$ = t statistik
$df$ = derajat kebebasan (En=Degree of freedom)
$\overline{d}$ = Rata-rata perbedaan sampel
$d_0$ = Dugaan rata-rata perbedaan populasi
$s_d$ = Simpangan baku perbedaan
$\chi^2$ = Chi-squared statistik

$\hat{p}$ = x/n = Proporsi sampel, (kecuali ditentukan sebelumnya)
$p_0$ = Dugaan proporsi populasi
$p_1$ = proporsi 1
$p_2$ = proporsi 2
$d_p$ = Dugaan perbedaan proporsi
$\min\{n_1,n_2\}$ = minimum of n₁ and n₂
$x_1 = n_1 p_1$
$x_2 = n_2 p_2$
$F$ = F statistik

Referensi

^ R. A. Fisher (1925). Statistical Methods for Research Workers, Edinburgh: Oliver and Boyd, 1925, p.43.
^ Cramer, Duncan; Dennis Howitt (2004). The Sage Dictionary of Statistics. hlm. 76. ISBN 076194138X.
^ Lehmann, E.L.; Romano, Joseph P. (2005). Testing Statistical Hypotheses (ed. 3E). New York: Springer. ISBN 0387988645.
^ ^a ^b NIST handbook: Two-Sample t-Test for Equal Means
^ Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences., McGraw Hill, 1960, page 350.
^ Weiss, Neil A. (1999). Introductory Statistics (ed. 5th). hlm. 802. ISBN 0-201-59877-9.
^ NIST handbook: F-Test for Equality of Two Standard Deviations (Testing standard deviations the same as testing variances)