B Bilişim Teknolojileri için İşletme İstatistiği Yrd. Doç. Dr. Halil İbrahim CEBECİ İLİŞKİSEL VERİ ANALİZİ • İki veya daha fazla değişkenin birbiri ile ilişkisi aşağıdaki teknikler vasıtasıyla sorgulanabilir. KONTENJANS TABLOSU • Kontenjans tabloları ve serpilme (saçılım) diyagramları en çok tercih edilen görsel ilişkisel analiz yöntemleridir. Kontenjans tablosundan ilişkilerinin incelenmesi istenen iki değişken (faktör, kriter) satır ve sütunlara yerleştirilerek tablolaştırılır SERPİLME DİYAGRAMI • İki değişken arasındaki ilişkinin gücü ve yönünün görsel gösterimi SERPİLME DİYAGRAMI DOĞRUSAL İLİŞKİ ÖLÇÜTLERİ • Kovaryans: İki değişkenin birlikte ne kadar değiştiğini gösteren ölçüttür • (+) Kovaryans Her iki değişken aynı yönde değişiyor. • (-) Kovaryans Her iki değişken ters yönde değişiyor. • (0 a yakın) Kovaryans Değişkenlerin birbiri ile alakası yok. DOĞRUSAL İLİŞKİ ÖLÇÜTLERİ Korelasyon Katsayısı: Kovaryans değerinin 0 ila ∓ 1 arasında ölçeklendirilmiş halidir. +1 ve -1 değerlerine yaklaşıldıkça ilişkinin derecesi yükselir. (𝑟 ile gösterilir) r İlişki 0,00 – 0,25 Çok Zayıf 0,26 – 0,49 Zayıf 0,50 – 0,69 Orta 0,70 – 0,89 Yüksek 0,90 – 1,00 Çok Yüksek DOĞRUSAL İLİŞKİ ÖLÇÜTLERİ • Sakarya Üniversitesi bünyesinde yürütülen teknik bir yüksek lisans programındaki seçmeli dersler ve bu derslerdeki seçen en yüksek notlu 5 öğrencinin aldıkları final notları aşağıdaki tabloda verilmiştir. Derslerdeki başarı düzeyleri arasındaki ilişkiyi sorgulayınız. Karar Destek Zeki Öğrenci Sistemleri Sistemler 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 76 64 65 79 66 73 60 63 64 62 74 66 79 67 62 75 67 66 81 65 74 59 62 61 66 75 62 82 71 63 Sistem Analizi Girişimcilik İstatistik 90 95 93 92 87 85 86 87 87 82 84 86 94 87 88 92 90 80 98 94 76 78 91 82 71 86 87 70 88 90 74 62 62 83 68 70 59 67 65 63 75 64 80 64 62 Olasılık Yöneylem Araştırması Üretim Planlama 74 66 66 77 62 73 59 59 62 66 77 69 75 71 66 92 100 97 92 88 90 82 76 86 71 73 75 85 94 93 78 86 90 98 75 72 100 79 75 74 89 98 73 75 82 DOĞRUSAL İLİŞKİ ÖLÇÜTLERİ • Tablodan da görüleceği üzere yüksek ilişki olarak isimlendirebileceğimiz, 5 farklı ikili durum mevcuttur. Bunun dışında daha düşük dereceli ilişkilerde mevcuttur.( Örneğin Olasılık ile İstatistik arasında (0,57)). Bazı değişkenler arasında ilişkinin varlığından söz etmek ise mümkün değildir. (Girişimcilik ve Karar Destek Sistemleri (0,01)) Karar Destek Sistemleri Zeki Sistemler Sistem Analizi Girişimcilik İstatistik Olasılık Yöneylem Araştırması Üretim Planlama Karar Destek Sistemleri 1,00 0,95 0,38 0,01 0,90 0,95 -0,29 -0,18 Zeki Sistemler Sistem Analizi Girişimcilik İstatistik 1,00 -0,14 0,22 0,82 0,86 0,27 -0,27 1,00 -0,32 -0,46 -0,29 -0,83 0,41 1,00 -0,23 -0,12 -0,38 -0,34 1,00 0,57 0,08 0,10 Olasılık Yöneylem Araştırması Üretim Planlama 1,00 0,21 0,27 1,00 0,63 1,00 DOĞRUSAL REGRESYON • Regresyon Analizinde, değişkenler arasındaki ilişkiyi fonksiyonel olarak açıklamak ve bu ilişkiyi bir modelle tanımlayabilmek amaçlanmaktadır. • Bir bağımlı değişkeni etkileyen sadece tek bir bağımsız değişken varsa bu durumda «Doğrusal Regresyon Analizi» uygulanır. 𝑦 = 𝛽0 + 𝛽1 𝑥 + • 1 değerinin işareti doğrusal ilişkinin yönü ile ilgilidir. DOĞRUSAL REGRESYON • Bir regresyon modelinin ilişkiyi açıklama derecesi R belirlilik (Determinasyon) katsayısı ile değerlendirilir. • Bir regresyon modelinin kullanılabilirliği iki farklı hipotez testi ile kontrol edilir. – Belirlilik katsayısının önemliliği – Regresyon denklemi katsayılarının önemliliği DOĞRUSAL REGRESYON • Bir süpermarketin stoklarında bir üründen 450 adet kalmıştır. Market bu üründen bir kez daha getirmeyecektir. Bu yüzden büyün ürünleri bulundukları ayda satmak istemektedir. Bu bağlamda geçmiş dönem verilerinden 450 adet ürün satmaya uygun fiyatı belirlemeyi amaçlamaktadır. Geçmiş dönem verileri aşağıdaki gibi ise, ürünün fiyatı ne olmalıdır. Dönem Talep Fiyat Dönem Talep Fiyat 1 2 3 4 5 6 7 8 9 10 408 416 416 360 404 368 396 388 388 392 51 46 48 57 53 54 54 51 58 55 11 12 13 14 15 16 17 18 19 20 368 392 400 388 404 416 400 392 384 408 57 48 48 58 52 47 51 56 57 53 DOĞRUSAL REGRESYON 𝑦 = 547,493 − 2,905𝑥 450 = 547,493 − 2,905𝑥 𝑥 = 33,56 ÇOKLU REGRESYON ANALİZİ • Doğrusal regresyonda anlatılan her durum geçerlidir. • Sadece tek bir bağımlı değişkene etkiyen birden fazla bağımsız değişken mevcuttur. AMAN DİKKAT • Kontenjans tabloları ve serpilme diyagramları sadece iki değişken durumunda uygundur. • Serpilme diyagramında çizilen noktalar arasında, noktaların uzaklıklarının karelerini minimize edecek şekilde çizilen doğru basit regresyon denklemini verir. • Çok değişkenle regresyon analizleri daha açıklayıcı olmakla beraber, model geçerliliğine zarar verme ihtimali ve hesaplama zorlukları dikkate alınarak, değişken sayısının sınırlanması uygun bir tercih olabilir.