PANEL Temel İstatistik Kavramları ve Uygulamalar Danışman Öğr. Üyesi: Prof.Dr. Güldal KIRKALI Dr.Öznur BİLEN Dr.Yılmaz ÖZALP DEÜTF Biyokimya AD Sunum Planı TEMEL KAVRAMLAR Değişkenler - Nicel / Nitel Değişken - Sürekli / Süreksiz Değişken - Bağımsız / Bağımlı Değişken Değişkenlerin ölçümü - Nominal / Ordinal / Sayısal Ölçüm Değişkenlerin dağılım özelliği Sunum Planı TANIMLAYICI İSTATİSTİK Merkezi eğilim ölçütleri - Ortalama, ortanca, mod, geometrik ortalama Yayılma ölçütleri - Değer aralığı, standart sapma ve varyans, varyasyon katsayısı ANALİTİK İSTATİSTİK Güven aralığı Güç analizi ve örneklem büyüklüğünün saptanması Hipotez testleri Sunum Planı ÖLÇÜM DEĞERLERİNİN KARŞILAŞTIRILMASI Parametrik yöntemler Parametrik olmayan yöntemler SAYIM DEĞERLERİNİN KARŞILAŞTIRILMASI Ki-kare testi McNemar Değişkenler Değişken, neden ve sonuçların araştırma düzeneğinde gösterilme biçimidir. Değişkenler ölçümler ya da gruplarla gösterilir. DEĞİŞKEN HBsAg Boy uzunluğu Kan şekeri ÖLÇÜM GRUP DNA pg/ml Olumsuz/olumlu cm Kısa / uzun mg/dl Normal /diyabetik Değişkenler Nicel (Kantitatif) Değişken Değişik derecelerde az ya da çok değerler alabilen değişkendir. Normal dağılım Parametrik/Non Parametrik Örn: Yaş, ağırlık, zeka seviyesi vb. Nitel (Kalitatif) Değişken Binominal/ poisson dağılım Nonparametrik test Cinsiyet, medeni durum, göz rengi, din, milliyet vb. Değişkenler Süreksiz Değişken Miktar yönünden değişiklik yerine tür yönünden değişiklik gösterir. Nitel değişkenlerin hemen hepsi süreksiz değişkendir. Örn: Cinsiyet, medeni durum vb. Sürekli Değişken 2 ayrı ölçüm arası kuramsal olarak sonsuz parçaya bölünebilir. Örn: Yaş, uzunluk ve ağırlık gibi Değişkenler Bağımsız Değişken Sonucu (hastalığı) olumlu yada olumsuz etkileyen ve etken (risk faktörü) olduğu düşünülen değişkenlere denir. Bağımsız Değişkenler Yaş Cins Meslek Ev ortam koşulları Sigara Değişkenler Bağımlı Değişken Etkenlerden olumlu ya da olumsuz etkilendiği düşünülen ve sonuç olan değişkenlere denir. Bağımsız Değişkenler Yaş Cins Sigara Ev ortam koşulları Meslek Bağımlı Değişken Astım Değişkenlerin Ölçümü Analize başlamadan önce ilk yapılacak şey, değişkenlerin nasıl ölçüldüğünün belirlenmesidir. Değişkenlerin Ölçümü Ölçüm düzeyleri arasında bir sıralama ya da uzaklık yakınlık gibi belirli bir mesafe yoksa nominal ölçüm Ölçüm düzeyleri arasında bir sıralama var ama düzeyler arasında mesafeler belli değilse ordinal ölçüm Ölçüm düzeyleri arasında hem sıralama hem de belirli bir mesafe varsa sayısal ölçüm Ölçüm düzeyleri : değişkenlerin alabileceği değerler Değişkenlerin Ölçümü NOMİNAL ÖLÇÜM Sağlıklı denekler --------› 0 Tip I DM Tip II DM ---------› 1 ---------› 2 İki düzeyli, yani yalnızca iki değer alabilen nominal değişkenlere dikotom değişken adı verilir. Örn. Cinsiyet Değişkenlerin Ölçümü ORDİNAL ÖLÇÜM Evre 1, evre 2, evre 3, evre 4 ----› 1, 2, 3, 4 ya da 1, 3, 6, 9 Sıralama (+) Örn. evre 4, evre 3’ten daha kötüdür. Aradaki mesafe belli değil. Örn. “ Evre 2 evre 1’den ne kadar ileri ise evre 4 de evre 3’ den o kadar ileridir. ″ denemez. Değişkenlerin Ölçümü SAYISAL ÖLÇÜM Belirlenmiş kodlar yerine gerçek rakamlar Örn. Çocuk sayısı (sayımla belirtilen), yaş (ölçümle belirtilen) Sınıflandırılarak ordinal değişkenlere dönüştürülebilir. Değişkenlerin Dağılım Özelliği İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir. Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır. Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir. Değişkenlerin Dağılım Özelliği Binom Dağılımı: Tam olarak ortak özellik göstermeseler de 2 grupta sınıflandırılırlar. Örn. Erkek ve kadınlar, hasta olan ve olmayanlar.. Poisson Dağılımı: Ender ve rastlantısal olgulara yönelik bir dağılım. Örn. Belirli alanda bakteri dağılımı, motosiklet kazası sonucu kafa travması, multipl skleroz, fenilketonüri… Normal Dağılım: Değişkenlerin Dağılım Özelliği BİNOM DAĞILIMI POİSSON DAĞILIMI • Sık görülür • Ender görülür • “ n ″ küçüktür • “ n ″ büyüktür • İki olasılık vardır (p, q) • Tek olasılık vardır (p) • Bağımlıdır ( pq=1.00 ) • Bağımsızdır Değişkenlerin Dağılım Özelliği NORMAL DAĞILIM • Çan eğrisi biçimindedir. • Sonsuzdur. • Simetriktir. f r e k a n s • Orta noktası özelliklidir. • Bir birim alan kapsar. Ölçüm değerleri Normal Dağılım Normal dağılım simetrik olduğu için, normal dağılım gösteren değişkenlerin ortalama, ortanca ve modları eşittir. Örneklem büyüklüğü arttıkça, deneklerin dağılımı ve ortalamanın örneklem dağılımı normal dağılıma yaklaşır. Bu nedenle parametrik testlerde 30 sayısı aranır. Normal Dağılım Evrenden elde edilen verinin dağılımı S _ X Örnekten elde edilen verinin dağılımı Evrenden alınan her bir örnekte yapılan ölçümlerle elde edilen verinin de evren dağılımında olduğu gibi çan eğrisi olarak ortaya çıkması beklenir. _ Her bir örneğin dağılımının ortalamaları ye karşılık gelen X ve standart sapmaları ya karşılık gelen S ile gösterilir. Normal Dağılım ND’da ortalamaya ‘0’ standart sapmaya ‘1’ verilerek elde edilir. z , ölçüm değerlerinin her birinin ortalamadan uzaklığını gösterir. 0.1359 0.3413 0.3413 0.1359 -2 -1 0 +1 +2 -2 -1 0 +1 +2 z xx S z 0.9544 Standart normal dağılım Ortalamanın iki yanında yer alan (+) ve (-) 1 S çizgilerinin her biri dağılımı oluşturan bireylerin % 34.13 ’ ünü sınırlar. Normal Dağılım Kalp atış hızı dağılımı: X: 68 atımdk, S: 10 Atım hızı 58dk olan bireyin atımı xx z S 58 68 -1 0 100 z -2 +1 +2 +3.2 Örnek atım hızlarının ortalamaya göre yeri 58 – 68 10 =-1 Ortalamadan 1 S uzakta eksenin solunda, ND’nin içinde Atım hızı 100dk olan bireyin atımı ise ortalamadan 3.2 standart sapma uzakta, eksenin sağında, ND’nin dış ucundadır Normal Dağılım Önce standart sapmaya dayanarak çizgi ölçeği oluşturulmuş ve bu çizgilerin sınırladığı alanda kalan ölçüm değeri yüzdeleri elde edilmiş. Şimdi bu sonuçtan geriye doğru giderek; uygun ve kullanışlı bir yüzde alarak bunu sınırlayan çizgilere ulaşmaya çalışalım. % 95 Normal Dağılım +2 -2 z -1.96 +1.96 0.9500 z çizelgesi sınır değerleri ND eğrisinde yerleşen verinin ortalamanın çevresinde yer alan yüzde doksan beşi normal dağılıma uyar, bunun dışında kalanlar uç değerlerdir. Uç değerler artı ve eksi yönde %2.5 ’ ten, % 5 ‘ i oluşturur. Öyleyse değerlerin % 95 ‘ i normaldir; 2.5 ‘ i yüksek, 2.5 ‘ i düşük olmak üzere % 5 ‘ i ise normal dışıdır. Normal Dağılım Normal dağılıma göre anlamlılık sınırları z 1.96 ise ölçüm değeri normal dağılımı sınırlayan çizgilerin ortalamaya göre iç tarafındadır; fark anlamlı değildir, ölçüm değeri ortalamayla aynı gruptadır. z 1.96 ise ölçüm değeri normal dağılımı sınırlayan çizgilerin ortalamaya göre dış tarafındadır; fark anlamlıdır, ölçüm değeri ortalamayla ayrı gruptadır. Normal Dağılım Standart sapma yerine, onun örnek büyüklüğüne göre uyarlanmış karşılığı olan standart hata kullanılmalıdır. Standart Hata Sx S n z değerini de yeniden ve örnek büyüklüğünü dikkate alarak yazmak gerekir. Yeni yazım z’yi kuramsal bakıştan biraz daha örnek gerçeğine ve günlük kullanıma taşıyacaktır: xx z Sx Normal Dağılım ND ölçütü olarak kullanılan z değeri t ve değerlerine eşittir. zt t çözümlemesinde kullanılan anlamlılık sınırı da 1.96 dır; ki-kare (2) çözümlemesinde kullanılan anlamlılık sınırı ise 3.84 tür. z değeri evrende ölçüm yapıldığı varsayılarak kullanılır. t değeri ise örnek üzerinde ölçüm yapıldığında ve parametrik koşulların varlığında gündeme gelir. Örnek verisi sayım ile değerlendirildiğinde devreye giren değer ise olmalıdır. Normal Dağılım ÇÖZÜMLEMENİN YÖNÜ İki yönlü çözümleme: "Fark anlamlı mıdır ?" Değerin ortalamadan büyük ya da küçük oluşu önem taşımaz. Tek yönlü çözümleme: Tıpta eşik değer sık kullanılan bir kavramdır. Bu nedenle incelenen değerin büyük mü yoksa küçük mü olduğu önem kazanabilir. “Fark anlamlı ölçüde büyük (ya da küçük) mü ?“ Normal dağılım eğrisinin bir yönü kullanılır. ÇÖZÜMLEMENİN YÖNÜ % 95 ölçütünün korunması amaçlanmıştır. z doğrusunu artık ; 1.96 yerine 1.645 ’ ten keser. Çözümlemenin ‘anlamlı’ olma olasılığı artmıştır. Tek yönlü çözümlemede z çizelgesi P- değeri (İstatistiksel Önemlilik) Elde edilen çözümleme sonucu bulunan z değeri, sınırların dışında (% 5 ‘lik alan içinde) ise iki değerin aynı evrenden olma olasılığını gösteren p değeri % 5’in altında demektir. Çalışma grupları arasındaki farkın tamamen şansa bağlı olarak ortaya çıkma olasılığı P değerinin kendisinin verilmesi (p=0.60, p=0.06) veya < 0.05, 0.01, 0.001 TANIMLAYICI İSTATİSTİK Tanımlayıcı İstatistik Tanımlayıcı istatistikler verilerin grafiksel olarak özetlenmesidir. sayısal ya da Çalışmada veriler toplandıktan sonra, bunların - Merkezi eğilimleri (verilerin nerede toplandığını gösterir) - Yayılımları araştırılır Merkezi Eğilim Ölçütleri Ortalama (mean) ( X ¯ ) (en sık): Aritmetik ortalamadır. Sayısal değişkenler için kullanılır. Aşırı uç değerlerden etkilenir. X=xi / n Ortanca (median): Küçükten büyüğe doğru sıralandığında tam ortadaki deneğin değeri. Ordinal değişkenler için kullanılır. Aşırı uç değerlerden etkilenmez. medyan = (n/2)+(n+2/2) / 2 Merkezi Eğilim Ölçütleri Tepe değeri (Mod): Değişkenler içinde en fazla görülen değer. Geometrik ortalama: Denek sayısı n → Denek değerlerinin çarpımının n ’ inci kökü. Logaritmik dağılım gösteren veriler için kullanılır. G.O = n (x1) (x2) (x3).........xn Merkezi Eğilim Ölçütleri Ne zaman hangi eğilim ölçütünü kullanalım? 1. Değişken ordinal mi / sayısal mı 2. Değişkenlerin dağılımı simetrik mi çarpık mı Simetrik dağılan sayısal veriler → Ortalama Ordinal/simetrik olmayan sayısal veriler → Ortanca Logaritmik veriler → Geometrik ortalama Yayılma Ölçütleri Farklı grupların merkezi eğilim ölçütleri aynı olduğu halde, gruplar birbirlerinden çok farklı olabilir. (1.grup ölçüm değerleri: 9, 10, 11 ve 2.grup: 1, 10, 19) Bu nedenle merkezi eğilim ölçütleri yanında, yayılma ölçütleri de çok önemlidir. Yayılma (Değer aralığı, range); En büyük değer ile en küçük değer arasındaki farktır. Örn. Min. = 3.8 / Max. = 8.8 ise Yayılma (w) = 5 Yayılma Ölçütleri Standart Sapma (s veya ) Dağılımın yaygınlığını gösteren en önemli ölçüdür. Her bir değerin ortalamadan olan uzaklığını gösterir. S= (x x) n 1 Varyans (S2) Standart sapmanın karesidir. İki yöntem arasındaki belirsizlikte anlamlı farklılığın belirlenmesinde iki yöntemin varyansının karşılaştırıldığı; F değeri kullanılır. 2 Yayılma Ölçütleri Levene testi (F testi) Varyansların homojenliğinin değerlendirilmesinde kullanılır. 2 S1 F 2 S2 Hesaplanan F değeri, tablodaki F değeri ile karşılaştırılır. Hesaplanan F değeri > tablodaki F değeri p < 0.05, varyanslar eşit değildir. Yayılma Ölçütleri Standart Hata Bir örnekten elde edilen ortalamanın gerçek evren ortalamasından olan sapmasıdır. Çok sayıda örnek içeren bir dağılımın ortalamasının standart sapmasıdır. Sx S n Varyasyon Katsayısı; Standart sapmanın ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir. CV= ( S / X ) x 100 . ANALİTİK İSTATİSTİK Güven Aralığı Örnekten yola çıkarak evrendeki veriyi kestirmek Alt ve üst sınırı vardır. GA % 90, %95 ve %99 olabilir. x ( z / n ) Güven Aralığı Ortalaması 40.0 ve standart hatası 1.36 olan (n42, S8.8) bir dağılımda güven aralıkları: %95 GA X (1.96) S X 40.0 (1.96) 1.36 37.33 x 42.67 %99 GA X (2.576) S X 40.0 (2.576) 1.36 36.5 x 43.5 Güven Aralığı Sıklıkla yapılan bir yanlışta, örnekte bulunan ölçüm değerlerinin, belirtilen olasılıkla gösterilen sınırlar içinde yer aldığı düşünülür ! Örnek için “incelenen örnekte değerlerin % 95’i 37.33 ile 42.67 arasındadır” denir. İşlemin gerçek amacı, incelenen örnekten yararlanarak evrendeki veriyi kestirmeye çalışmaktır. Bu örnekte elde edilen gerçek sonuç “örneğin içinden geldiği evrenin ortalaması yüzde doksan beş olasılıkla 37.33 ile 42.67 arasındadır” biçiminde yorumlanmalıdır ! Güven Aralığı Güven aralığı örneğin büyüklüğünden ve homojenliğinden çok etkilenir. Örnek büyüklüğü ve homojenliği arttıkça güven aralığı daralır. Standart hata örnek büyüklüğü ile küçüleceğinden, örnek büyüdükçe çarpım küçüleceğinden, güven aralığı daralacaktır. Güven Aralığı Örnekteki güven aralığına bakınca, elde edilen değerin dar olması nedeniyle seçilen örneğin yeterince büyük ve homojen olduğu kanısına varılır. Geniş bir güven aralığı (sözgelimi yukarıdaki ortalama için %95 olasılıkta 17.33 ile 62.67) seçilen örneğin büyüklüğünün yeterli olmadığını, aynı araştırma daha büyük bir örnekle yinelenirse elde edilecek sonucun daha güvenilir olacağını gösterir. Güven Aralığı KULLANILDIĞI YERLER • Ortalama • Oran (prevelans, sensitivite, spesifisite) • Göreli risk • Odds ratio • Korelasyon • İki ortalama arasındaki fark • İki oran arasındaki fark Güven Aralığı ÜSTÜNLÜKLERİ • İstatistik testin verdiği bilgiyi ve örnek büyüklüğü ile ilgili bilgiyi de verir. • Geniş GA riskin değişkenliğini ve çalışma grubunun küçük olduğunu gösterir • Dar GA riskin az değişken olduğunu ve çalışma grubunun büyük olduğunu gösterir Güç Analizi Varolan anlamlı sonucu belirleme yeteneği ! Belirli bir örnek büyüklüğü ile çalışıldığında, belli bir etkinin yaratacağı gerçek değişimin istatistiksel olarak anlamlı bulunma olasılığıdır. Klinik çalışmalarda, iki sağaltım yöntemi arasında oluşabilecek en küçük farkı ölçebilmek için örnek büyüklüğünün belirlenmesinde kullanılır. Güç Analizi Hipotez Testleri Araştırmanın istatistiksel çözümlemelerine hipotez kurarak başlanır. H0 = Farksızlık hipotezi (iki değer arasındaki farkın anlamlı bulunmadığı) H1 = Alternatif hipotez (iki değer arasındaki farkın anlamlı bulunduğu) Güç Analizi Hipotez Testleri Tek yönlü hipotez - İzmir’deki 2 yaş çocuklarının kalori alımı Van’dakinden fazladır. Çift yönlü hipotez - İzmir’deki 2 yaş çocuklarının kalori alımı Van’dakinden farklıdır. Hipotez Testleri Tek yönlü hipotezde önemlilik bulunması daha kolaydır. Medikal araştırmalarda sonuçla ilgili bir öngörü olsa bile beklenmeyen sonuçlar ortaya çıkabileceğinden çift yönlü hipotez tercih edilir. Güç Analizi Hipotez Testleri • İki değer arasında fark olduğu kanıtlanmak isteniyorsa önce aralarında fark bulunmadığının kanıtlanmaya çalışılması gerekir. • Ho (farksızlık) hipotezi temel alınır ve doğruluğu kanıtlanmaya çalışılır. Kanıtlanamazsa H1 hipotezi doğru kabul edilir. Güç Analizi Hipotez Testleri Hata olabilir mi? • Tibia kırığı olan hastalarda, kırığı olmayanlara göre eritrosit sayısı aynı düzeyde iken farklı olduğu sonucuna varabiliriz Böylece “yanlış olumlu” bir söylemde bulunulmuş olur. (Tip I Hata) • Tibia kırığı olan hastalarda, kırığı olmayanlara göre eritrositler farklı düzeyde iken aynı düzeyde olduğu sonucuna varabiliriz. Böylece “yanlış olumsuz” söylemde bulunulmuş olur.(Tip II Hata) Güç Analizi GERÇEK DURUM Ho Doğru Tip 1 hata (a) Gerçek pozitif (1-b) gerçek negatif (1 – a) tip II hata (b) KARAR Ho Red Ho Yanlış Ho kabul GÜÇ testin, anlamlı farkı bulma olasılığı % 80 Anlamlı farkı bulamama Güç Analizi Güç = 1 - Tip II hata Güç Analizi: Belirli bir büyüklükteki etkiyi (farkı) saptayacak örnek büyüklüğünün belirlenmesi PARAMETRİK ÖNEMLİLİK TESTLERİ İstatistiksel önemlilik testleri, ….farkın veya ilişkinin rastlantısal mı yoksa gerçek mi olduğuna karar vermede yardımcıdır. Örnekten elde edilen değerin evrendeki değerden farklı olup olmadığını, İncelenen iki grup arasında fark olup olmadığını, İki değişken arasında ilişki olup olmadığını, Elde edilen dağılımın teorik bir dağılıma uyup uymadığını inceler. Hangi koşulda hangi test? Belirleyici olan özellikler; Verinin ölçüm biçimi (Niteliksel/Ölçüm) Gruplardaki kişi sayısı <30 veya >30 Grupların bağımlılık durumu Bağımlı / bağımsız Veri tipi ölçümle elde edilen Her bir gruptaki sayı 30 ve üzeri Dağılım özelliği Normal Varyanslar Homojen Parametrik testler PARAMETRİK TESTLER Eğer bir testte ortalama, varyans, oran gibi ölçütler kullanılıyorsa (niceliksel veri) PARAMETRİK OLMAYAN TESTLER Testte sıralama, sayma, işaretleme gibi işlemler yapılıyorsa (niteliksel veri) Parametrik testler parametrik olmayanlardan daha güçlü testlerdir Her parametrik teste karşı bir de nonparametrik test vardır BAŞLICA İSTATİSTİKSEL TESTLER PARAMETRİK TESTLER NONPARAMETRİK TESTLER Evren ortalaması önemlilik testi İşaret testi İki ortalama arası farkın önem testi Mann Whitney U testi İki eş arası farkın önem testi (Paired-Samples t test) Wilcoxon Eşleştirilmiş iki örnek testi İki yüzde arası farkın önem testi Ki-Kare testi Tek yönlü Varyans Analizi (ANOVA) Kruskal Wallis Varyans analizi Parametrik testlerden hangi test? Ölçüm Karşılaştırılacak gruplar Bağımsız Bağımlı Karşılaştırılacak grup sayısı 2 3+ Karşılaştırılacak grup sayısı 2 3+ N<30 Mann Whitney U N> 30 t testi N<30 ise Kruskal Wallis Varyans analizi N> 30 Varyans analizi N<30 Wilcoxon testi N> 30 bağımlı gruplarda t testi Tekrarlı ölçümlerde Varyans analizi t testi (t test, Student’s t test) t testi tek grup ortalaması iki grup ortalaması t testi tek grup ortalaması (t test for one group) (Evren ortalaması önem testi) t testi tek grup ortalaması Grup ortalamasının bilinen bir evren ortalamasından farklı olup olmadığı t testi tek grup ortalaması 5 yaş altı 39 çocuğun hemoglobin düzeyleri ortalaması 10.4±1.6g/dl bulunmuştur. Bu ortalamanın DSÖ’nün bu yaş grubu için öngördüğü 11.0 g/dl değerinden farklı olup olmadığı belirlenmek isteniyor t testi tek grup ortalaması X - t =------------- S n t testi tek grup ortalaması 10.4 – 11.0 t =------------=-2.187 1.6 39 SD 0.05 . ........................................ 29 2.045..........2.756...........3.659 30 2.042..........2.750...........3.646 40 2.021...........2.704..........3.551 60 2.000...........2.660..........3.460 SD:Serbestlik derecesi 0.01 0.001 t testi tek grup ortalaması t =-2.187 SD=38 p<0.05 Yorum: Araştırma grubundaki çocukların Hb düzeyleri DSÖ’nün önerdiğinden istatistiksel olarak anlamlı düzeyde daha düşüktür (p<0.05). SPSS analyze compare means one sample T test t =-2.157 SD=38 p=0.037 One-Sample Test Test Value = 11.0 hemoglobin t -4.867 df Sig. (2-tailed) 31 .000 Mean Difference -1.113 95% Confidence Interval of the Difference Lower Upper -1.579 -.646 t testi iki grup ortalaması İki grup ortalaması arasında anlamlı fark olup olmadığı t testi iki grup ortalaması bağımsız gruplarda bağımlı gruplarda t testi iki grup ortalaması bağımsız gruplarda (t test for two independent groups) t testi 5 yaş altı 39 çocuğun hemoglobin düzeyleri ortalaması 10.4±1.6g/dl bulunmuştu. Sosyoekonomik düzeyi daha yüksek olan bir bölgedeki aynı yaş grubu 39 çocuğun hemoglobin düzeyleri değerlendirildiğinde 11.4±1.2g/dl olduğu bulunuyor. İki grubun hemoglobin ortalamaları arasındaki farkın anlamlı olup olmadığı belirlenmek isteniyor t testi bağımsız gruplarda X1 – X2 t =------------- S X1 - X2 t testi bağımsız gruplarda S X1 - X (ortalamalar farkının standart hatası) varyanslar homojenortak varyans homojen değil grup varyansları t testi bağımsız gruplarda 10.4 – 11.4 t =------------=-2.492 0,321 SD 0.05 . ........................................ 29 2.045..........2.756...........3.659 30 2.042..........2.750...........3.646 40 2.021...........2.704..........3.551 60 2.000...........2.660...........3.460 120 1.980...........2.617...........3.373 SD:Serbestlik derecesi 0.01 0.001 t testi bağımsız gruplarda t =-2.492 SD=76 p<0.05 Yorum: Hb düzeyleri açısından 1. ve 2. gruplar arasından istatistiksel olarak anlamlı fark vardır. İkinci grubun Hb düzeyi daha yüksektir (p<0.05). SPSS analyze compare means independent samples T test t =-2.965 SD=76 p=0.004 Independent Samples Test Levene's Test for Equality of Variances F hemoglobin Equal variances assumed Equal variances not assumed .164 Sig. .687 t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Upper Lower -5.781 64 .000 -1.739 .3008 -2.3400 -1.1380 -5.760 62.038 .000 -1.739 .3019 -2.3425 -1.1355 t testi iki grup ortalaması bağımlı gruplarda (paired t test/ matched groups t test) t testi 5 yaş altı 39 çocuğun hemoglobin düzeyleri ortalaması 10.4±1.6g/dl bulunmuştu. Bu çocuklara 6 ay demir tedavisi uygulandıktan sonra hemoglobin düzeyleri değerlendirildiğinde 11.4±1.2g/dl olduğu bulunuyor. Tedavi öncesi ve sonrasında hemoglobin ortalamaları arasındaki farkın anlamlı olup olmadığı belirlenmek isteniyor t testi bağımlı gruplarda d t = ----- Sd S S d = ----- n t testi bağımlı gruplarda 1.85 S d =----=0.39 39 -0.95 t =-----=-3.167 0.39 SD 0.05 0.01 0.001 . ........................................ 29 2.045..........2.756...........3.659 30 2.042..........2.750...........3.646 40 2.021...........2.704..........3.551 60 2.000...........2.660...........3.460 120 1.980...........2.617...........3.373 t testi bağımlı gruplarda t=-3.167 Yorum: SD=38 p<0.01 Verilen tedavi sonucu çocukların Hgb düzeylerinde istatistiksel olarak anlamlı artış saptanmıştır (p<0.01) SPSS analyze compare means paired samples T test t=-3.214 SD=38 p=0.003 Paired Samples Test Paired Differences Mean Pair 1 HEM 1 HEM 2 -.819 Std. Deviation .7986 Std. Error Mean .1412 95% Confidence Interval of the Difference Lower Upper -1.107 -.531 t -5.800 df 31 Sig. (2-tailed) .000 Varyans analizi (analysis of variance/ANOVA) İkiden fazla grup ortalaması arasında fark olup olmadığı Varyans analizi bağımsız gruplarda tek yönlü Varyans analizi bağımsız gruplarda tek yönlü varyans analizi (one-way ANOVA) Varyans analizi 5 yaş altı çocuklarda ekonomik durumun hemoglobin düzeyine etkisi değerlendirilmek isteniyor. İyi,orta ve kötü ekonomik durumdaki çocukların (her bir grupta 32 çocuk) hemoglobin düzeyleri ortalaması sırasıyla 11.3±1.3g/dl/, 10.8±1.6g/dl/ ve 10.2±1.6g/dl olarak bulunuyor. Üç farklı ekonomik düzeydeki çocukların hemoglobin ortalamaları arasındaki farkın anlamlı olup olmadığı belirlenmek isteniyor SPSS analyze compare means one-way ANOVA F= 4.380 SD=93 p=0.015 Varyans analizi bağımsız gruplarda F= 4.380 SD=93 p=0.015 Anlamlılık hangi gruptan kaynaklanıyor? Bonferroni analizi Ekonomik durum kötü orta iyi p orta iyi kötü iyi kötü orta 0.205 0.013 0.205 0.846 0.013 0.846 UYGULAMALAR SPSS’te uygulamalar ‘evren ortalaması önemlilik testi’ Total kolesterol düzeyi ortalaması 200 mg/dl den farklı mıdır? Yorum; araştırma grubunun ortalama kolesterol düzeyi, 200 mg/dl’den istatistiksel olarak anlamlı düzeyde daha düşüktür (p<0.001) Bağımsız gruplarda t testi Yorum; Erkeklerle kadınlar arasında ortalama kolesterol düzeyleri açısından istatistiksel olarak anlamlı fark yoktur (p=0.92) Bağımlı gruplarda t testi Yorum; ikinci ölçülen mide asitlik düzeyi birinciye göre istatistiksel olarak anlamlı düzeyde daha düşüktür (p=0.013) PARAMETRİK OLMAYAN ÖNEMLİLİK TESTLERİ Bir araştırma grubunu oluşturan 12 erkek, 14 kadının ağırlıkları ölçülmüş ve ortalama ağırlıklar sırasıyla, 74.21±12.60 (E) ; 79.07±13.89 (K) Erkek ve kadınların ağırlıkları arasında anlamlı fark olup olmadığı belirlenmek isteniyor. MANN-WHİTNEY U TESTİ Bağımsız gruplarda t testi SPSS analyze nonparametric tests 2 independent samples Bir araştırma grubunu oluşturan 12 kişinin altı ay ara ile ağırlıkları ölçülmüş ve ortalama ağırlıklar sırasıyla, 74.21±12.60 (önceki) ; 77.07±14.36 (sonraki) bulunmuştur. Araştırma grubunun iki farklı dönemdeki ağırlıkları arasında anlamlı fark olup olmadığı belirlenmek isteniyor. WİLCOXON İŞARETLİ SIRALAR TESTİ (Wilcoxon signed ranks) Bağımlı gruplarda t testi SPSS analyze nonparametric tests 2 related samples Bağımsız üç grup ortalaması 5 yaş altı çocuklarda ekonomik durumlarının hemoglobin düzeyine etkisi değerlendirilmek isteniyor. İyi,orta ve kötü ekonomik durumdaki çocukların (herbir grupta 12 çocuk) hemoglobin düzeyleri ortalaması 11.3±1.3 , 10.8±1.6 , 10.2±1.6 g/dL olarak bulunuyor. Hemoglobin ortalamaları arasında fark olup olmadığı belirlenmek isteniyor. KRUSKAL –WALLİS VARYANS ANALİZİ VARYANS ANALİZİ SPSS analyze nonparametric tests K indepentent samples 5 yaş altı 12 çocuğun tedavi öncesi,tedavinin 2. ve 6. aylarında Hb düzeyleri değerlendirilmek isteniyor. Hemoglobin düzeyleri ortalaması sırasıyla 10.2±1.6 g/dL, 10.8±1.6 g/dL, 11.3±1.3 g/dL, olarak bulunuyor. Aralıklarla yapılan bu üç ölçüm arasında fark olup olmadığı belirlenmek isteniyor. FRİEDMAN VARYANS ANALİZİ Bağımlı gruplarda varyans analiz SPSS analyze nonparametric tests K related samples Kİ –KARE TESTİ (chi-squared test) Dört gözlü düzenlerde Mc-Nemar Eğimde Ki-kare Çok gözlü düzenlerde Dört gözlü düzenlerde Ki-kare testi (chi-squared test for a 2 tables) Genetik delesyon ile metastaz ilişkisi METASTAZ Genetik Delesyon sayı % sayı % sayı % Var 16 64.0 9 36.0 25 100 Yok 8 27.6 21 72.4 29 100 Toplam 24 44.4 30 55.6 54 100 VAR χ2 TOPLAM YOK gözlenen beklenen beklenen 2 Örneğe göre bu değerlendirme “delesyon olanlarla olmayanlar arasında metastaz gelişimi açısından gözlenen fark anlamlıdır (²= 7.24, SD=1 , p<0.05)” biçiminde belirtilir. SD 0.05 1 3.84…………………….6.64……………………………………10.83 2 5.99.............9.21.......................13.82 3 7.82............11.35......................16.2 4 9.49............13.28......................18.47 5 11.07...........15.09......................20.52 SD:Serbestlik derecesi 0.02 0.01 0.005 0.001 SPSS analyze descriptive statistics crosstabs Ki-Kare (Yates) (Yates’ continuity correction) 2Yates gözlenen beklenen 0.5 2 beklenen Yates düzeltmesinin kullanılması ile ² değeri 7.24’ten 5.82’ye düşmüş, yeni anlamlılık değeri ise p=0.016 olarak bulunmuştur. Fisher’in Kesin Testi (Fisher’s Exact Test) n<20 20 <n < 40 ve beklenen değerlerden en az bir tanesi beşin altında Bağımlı gruplarda Ki-Kare testi McNemar (McNemar test) Kan şekeri üzerine etkisini araştırmak için 100 diyabetik hastaya yeni bir diüretiğin verildiğini ve önce ve 3 ay sonra açlık kan şekeri (AKŞ) ölçüldüğünü varsayalım. Tedavi sonrası AKŞ<120 Tedavi öncesi AKŞ≥120 Toplam AKŞ<120 a=20 b=40 60 AKŞ≥120 c=10 d=30 40 Toplam 30 70 100 [ (b – c) – 1 ]2 2McNemar = ___________________ b + c McNemar testi kişiler ya da tanısal yöntemler arasındaki uyumu test etmek içinde kullanılır. İki patolog, 100 akciğer biyopsi preperatını, diğerinden habersiz olarak ‘benign ya da malign’ olarak rapor ediyor. Ne derecede uyumlu olduklarını test edilmek isteniyor. Dr.Ahmet Malign Benign Toplam Dr.Ali Malign a=72 b=8 80 Benign c=5 d=15 20 Toplam 77 23 100 SPSS analyze descriptive statistics crosstabs statistics UYGULAMALAR Evinde ve kurum içinde yaşayan yaşlılarda asemptomatik bakteriüri görülme sıklığı belirleniyor. Evinde yaşayan grupta % 18.9 kurumda yaşayanlarda ise % 32.2 bulunuyor. Oran değerlendirilmiş (%) Dört gözlü düzenlerde Ki-kare 20-39 yaş grubu 22 erkekte total kolesterol ortalama ve standart sapması 191.97±42.69, 24 kadında ise 187.35 ±39.97 bulunuyor. Bağımsız grup, < 30, ortalama Mann Whitney U testi 30 yaş üstü grupta (255 kişi) 1997 yılında obezite prevalansı %32.5 bulunuyor. 5 yıl sonra aynı grup obezite açısından yeniden aynı kriterlerle değerlendiriliyor ve %39.6 olduğu belirleniyor. Bağımlı grup, sonuçlar oran olarak verilmiş McNemar Ellişer kişiden oluşan iki gruba okuma yazma farklı iki yöntemle öğretilmiş.Birinci grup okuma yazmayı 73 günde ikinci yöntemle öğrenen grup ise 78 günde öğrenmiştir. Bu iki grupta standart sapma sırasıyla 9 ve 11 gündür. İki yöntem arasında fark var mıdır? Bağımsız gruplar, > 30 Bağımsız gruplarda t testi 60 kişide LIPC-480 genotiplerinin koroner kalp hastalıklarına etkisinin değerlendirildiği bir çalışmada, LIPC-480’nin 3 farklı genotipinde (LIPC-480 TT, LIPC-480 CT, LIPC-480 CC) trigliserid düzeyi ortalamaları sırasıyla 152±73.0 mg/dL, 151±107.0 mg/dL ,138±74.9 mg/dL bulunuyor. Bağımsız 3 grup, ortalama Kruskal Wallis Varyans analizi Bir okulun birinci, ikinci ve üçüncü sınıf öğrencilerinin hemoglobin düzeyleri ölçülüyor. Sınıflarda sırasıyla 70,62 ve 56 öğrenci vardır. Üç sınıftaki öğrencilerin ortalama hemoglobin değerleri ve standart sapmaları belirleniyor. 3 grup, > 30, ortalama Varyans Analizi Gebeliği sırasında sigara içmeyen annelerin (15 anne) bebeklerin doğum ağırlıkları 4.13±0.92 kg, sigara içen annelerin (14 anne) bebeklerin doğum ağırlıkları ise 3.62 ±0.58 kg bulunuyor. Bağımsız gruplar, < 30, ortalama Mann Whitney U testi Uyku sorunu olan 25 hastaya uyku ilacı veriliyor ve ilaç verilmeden önce ve ilaç kullanımının birinci ayında ortalama günlük uyku süreleri belirleniyor. Başlangıçta 4.08±0.48 saat olan uyku süresi bir ay sonra 6.66±0.82 saat bulunuyor. Bağımlı gruplar, < 30, ortalama Wilcoxon işaretli sıralar testi 43 kişilik bir hipertansiyon hasta grubunda bir antihipertansif ilacın etkinliği araştırılıyor. İlaç vermeden önce ölçülen sistolik tansiyon ortalaması 172.5 mmHg, ilaç verildikten 2 saat sonra yeniden ölçülen sistolik tansiyon ortalaması ise 154.0 mmHg’dır. Bağımlı gruplar, > 30, ortalama Bağımlı gruplarda t testi Uyku sorunu olan 44 hastaya yeni çıkan ve uykuyu süre olarak uzattığı iddia edilen bir ilaç başlanmış. Ancak ilacın gerçekten etkin olup olmadığını saptamak amacıyla ilaçsız ve ilaçlı olarak uyku süreleri ölçülmüş. İlacın uyku süresini değiştirip değiştirmediğini hangi testle analiz edersiniz? Açıklayınız. Bağımlı gruplar, > 30 Bağımlı gruplarda t testi TEŞEKKÜRLER…