t testi

advertisement
PANEL
Temel İstatistik Kavramları ve
Uygulamalar
Danışman Öğr. Üyesi: Prof.Dr. Güldal KIRKALI
Dr.Öznur BİLEN
Dr.Yılmaz ÖZALP
DEÜTF Biyokimya AD
Sunum Planı
TEMEL KAVRAMLAR
 Değişkenler
- Nicel / Nitel Değişken
- Sürekli / Süreksiz Değişken
- Bağımsız / Bağımlı Değişken
 Değişkenlerin ölçümü
- Nominal / Ordinal / Sayısal Ölçüm
 Değişkenlerin dağılım özelliği
Sunum Planı
TANIMLAYICI İSTATİSTİK
 Merkezi eğilim ölçütleri
- Ortalama, ortanca, mod, geometrik ortalama
 Yayılma ölçütleri
- Değer aralığı, standart sapma ve varyans, varyasyon katsayısı
ANALİTİK İSTATİSTİK
 Güven aralığı
 Güç analizi ve örneklem büyüklüğünün saptanması
 Hipotez testleri
Sunum Planı
ÖLÇÜM DEĞERLERİNİN KARŞILAŞTIRILMASI
 Parametrik yöntemler
 Parametrik olmayan yöntemler
SAYIM DEĞERLERİNİN KARŞILAŞTIRILMASI
 Ki-kare testi
 McNemar
Değişkenler
 Değişken, neden ve sonuçların araştırma düzeneğinde
gösterilme biçimidir.
 Değişkenler ölçümler ya da gruplarla gösterilir.
DEĞİŞKEN
HBsAg
Boy uzunluğu
Kan şekeri
ÖLÇÜM
GRUP
DNA pg/ml
Olumsuz/olumlu
cm
Kısa / uzun
mg/dl
Normal /diyabetik
Değişkenler
 Nicel (Kantitatif) Değişken
Değişik derecelerde az ya da çok değerler alabilen değişkendir.
Normal dağılım
Parametrik/Non Parametrik
Örn: Yaş, ağırlık, zeka seviyesi vb.

Nitel (Kalitatif) Değişken
Binominal/ poisson dağılım
Nonparametrik test
Cinsiyet, medeni durum, göz rengi, din, milliyet vb.
Değişkenler
 Süreksiz Değişken
Miktar yönünden değişiklik yerine tür yönünden değişiklik gösterir.
Nitel değişkenlerin hemen hepsi süreksiz değişkendir.
Örn: Cinsiyet, medeni durum vb.
 Sürekli Değişken
2 ayrı ölçüm arası kuramsal olarak sonsuz parçaya bölünebilir.
Örn: Yaş, uzunluk ve ağırlık gibi
Değişkenler
 Bağımsız Değişken
Sonucu (hastalığı) olumlu yada olumsuz etkileyen ve
etken (risk faktörü) olduğu düşünülen değişkenlere
denir.
Bağımsız Değişkenler
Yaş
Cins
Meslek
Ev ortam koşulları
Sigara
Değişkenler
 Bağımlı Değişken
Etkenlerden olumlu ya da olumsuz etkilendiği düşünülen
ve sonuç olan değişkenlere denir.
Bağımsız Değişkenler
Yaş
Cins
Sigara
Ev ortam koşulları
Meslek
Bağımlı Değişken
Astım
Değişkenlerin Ölçümü
 Analize başlamadan önce ilk yapılacak şey,
değişkenlerin nasıl ölçüldüğünün
belirlenmesidir.
Değişkenlerin Ölçümü
 Ölçüm düzeyleri arasında bir sıralama ya da uzaklık yakınlık gibi
belirli bir mesafe yoksa nominal ölçüm
 Ölçüm düzeyleri arasında bir sıralama var ama düzeyler arasında
mesafeler belli değilse ordinal ölçüm
 Ölçüm düzeyleri arasında hem sıralama hem de belirli bir mesafe
varsa sayısal ölçüm
Ölçüm düzeyleri : değişkenlerin alabileceği değerler
Değişkenlerin Ölçümü
NOMİNAL ÖLÇÜM
 Sağlıklı denekler --------› 0
Tip I DM
Tip II DM
---------› 1
---------› 2
 İki düzeyli, yani yalnızca iki değer alabilen nominal değişkenlere
dikotom değişken adı verilir. Örn. Cinsiyet
Değişkenlerin Ölçümü
ORDİNAL ÖLÇÜM
 Evre 1, evre 2, evre 3, evre 4 ----› 1, 2, 3, 4 ya da 1, 3, 6, 9
 Sıralama (+)
Örn. evre 4, evre 3’ten daha kötüdür.
 Aradaki mesafe belli değil.
Örn. “ Evre 2 evre 1’den ne kadar ileri ise evre 4 de evre 3’
den o kadar ileridir. ″ denemez.
Değişkenlerin Ölçümü
SAYISAL ÖLÇÜM
 Belirlenmiş kodlar yerine gerçek rakamlar
 Örn. Çocuk sayısı (sayımla belirtilen), yaş (ölçümle belirtilen)
 Sınıflandırılarak ordinal değişkenlere dönüştürülebilir.
Değişkenlerin Dağılım Özelliği
 İstatistik analiz yapılırken, dağılımın özelliği çok
önemlidir.
 Çünkü farklı dağılım gösteren verilere uygulanacak
tanımlayıcı ve analitik istatistik yöntemleri de
farklıdır.
 Parametrik testlerin uygulanabilmesi için, dağılımın
normal ya da normale yakın olması gerekir.
Değişkenlerin Dağılım Özelliği
 Binom Dağılımı:
Tam olarak ortak özellik göstermeseler de 2 grupta
sınıflandırılırlar.
Örn. Erkek ve kadınlar, hasta olan ve olmayanlar..
 Poisson Dağılımı:
Ender ve rastlantısal olgulara yönelik bir dağılım.
Örn. Belirli alanda bakteri dağılımı, motosiklet kazası
sonucu kafa travması, multipl skleroz, fenilketonüri…
 Normal Dağılım:
Değişkenlerin Dağılım Özelliği
 BİNOM DAĞILIMI
 POİSSON DAĞILIMI
• Sık görülür
• Ender görülür
• “ n ″ küçüktür
• “ n ″ büyüktür
• İki olasılık vardır (p, q)
• Tek olasılık vardır (p)
• Bağımlıdır ( pq=1.00 )
• Bağımsızdır
Değişkenlerin Dağılım Özelliği
 NORMAL DAĞILIM
• Çan eğrisi biçimindedir.
• Sonsuzdur.
• Simetriktir.
f
r
e
k
a
n
s
• Orta noktası özelliklidir.
• Bir birim alan kapsar.
Ölçüm değerleri
Normal Dağılım
 Normal dağılım simetrik olduğu için, normal dağılım
gösteren değişkenlerin ortalama, ortanca ve modları
eşittir.
 Örneklem büyüklüğü arttıkça, deneklerin dağılımı ve
ortalamanın örneklem dağılımı normal dağılıma yaklaşır. Bu
nedenle parametrik testlerde 30 sayısı aranır.
Normal Dağılım


Evrenden elde edilen verinin dağılımı
S
_
X
Örnekten elde edilen verinin dağılımı
 Evrenden alınan her bir örnekte yapılan ölçümlerle elde edilen verinin de evren dağılımında
olduğu gibi çan eğrisi olarak ortaya çıkması beklenir.
_
 Her bir örneğin dağılımının ortalamaları  ye karşılık gelen X ve standart sapmaları  ya
karşılık gelen S ile gösterilir.
Normal Dağılım
 ND’da ortalamaya ‘0’ standart
sapmaya ‘1’ verilerek elde edilir.
 z , ölçüm değerlerinin her birinin
ortalamadan uzaklığını gösterir.
0.1359
0.3413
0.3413
0.1359
-2
-1
0
+1
+2
-2
-1
0
+1
+2
z
xx
S
z
0.9544
Standart normal dağılım
 Ortalamanın iki yanında yer alan
(+) ve (-) 1 S çizgilerinin her biri
dağılımı oluşturan bireylerin % 34.13 ’
ünü sınırlar.
Normal Dağılım
 Kalp atış hızı dağılımı:
X: 68 atımdk, S: 10
 Atım hızı 58dk olan bireyin atımı
xx
z
S
58
68
-1
0
100
z
-2
+1
+2 +3.2
Örnek atım hızlarının ortalamaya göre yeri
58 – 68
10
=-1
Ortalamadan 1 S uzakta
eksenin solunda, ND’nin içinde
 Atım hızı 100dk olan bireyin atımı ise
ortalamadan 3.2 standart sapma uzakta,
eksenin sağında, ND’nin dış ucundadır
Normal Dağılım
 Önce standart sapmaya dayanarak çizgi ölçeği oluşturulmuş
ve bu çizgilerin sınırladığı alanda kalan ölçüm değeri
yüzdeleri elde edilmiş.
 Şimdi bu sonuçtan geriye doğru giderek; uygun ve kullanışlı
bir yüzde alarak bunu sınırlayan çizgilere ulaşmaya
çalışalım.
 % 95
Normal Dağılım
+2
-2
z
-1.96
+1.96
0.9500
z çizelgesi sınır değerleri
 ND eğrisinde yerleşen verinin ortalamanın çevresinde yer alan yüzde doksan beşi normal
dağılıma uyar, bunun dışında kalanlar uç değerlerdir.
 Uç değerler artı ve eksi yönde %2.5 ’ ten, % 5 ‘ i oluşturur. Öyleyse değerlerin % 95 ‘ i
normaldir; 2.5 ‘ i yüksek, 2.5 ‘ i düşük olmak üzere % 5 ‘ i ise normal dışıdır.
Normal Dağılım
Normal dağılıma göre anlamlılık sınırları
 z  1.96 ise ölçüm değeri normal dağılımı sınırlayan çizgilerin ortalamaya göre iç tarafındadır;
fark anlamlı değildir, ölçüm değeri ortalamayla aynı gruptadır.
 z  1.96 ise ölçüm değeri normal dağılımı sınırlayan çizgilerin ortalamaya göre dış tarafındadır;
fark anlamlıdır, ölçüm değeri ortalamayla ayrı gruptadır.
Normal Dağılım
 Standart sapma yerine, onun örnek büyüklüğüne göre uyarlanmış
karşılığı olan standart hata kullanılmalıdır.
 Standart Hata
 Sx 
S
n
 z değerini de yeniden ve örnek büyüklüğünü dikkate alarak
yazmak gerekir. Yeni yazım z’yi kuramsal bakıştan biraz daha
örnek gerçeğine ve günlük kullanıma taşıyacaktır:
xx
z
Sx
Normal Dağılım
 ND ölçütü olarak kullanılan z değeri t ve  değerlerine eşittir.
zt
 t çözümlemesinde kullanılan anlamlılık sınırı da 1.96 dır; ki-kare
(2) çözümlemesinde kullanılan anlamlılık sınırı ise 3.84 tür.
 z değeri evrende ölçüm yapıldığı varsayılarak kullanılır.
 t değeri ise örnek üzerinde ölçüm yapıldığında ve parametrik
koşulların varlığında gündeme gelir.
 Örnek verisi sayım ile değerlendirildiğinde devreye giren değer
ise  olmalıdır.
Normal Dağılım
ÇÖZÜMLEMENİN YÖNÜ
 İki yönlü çözümleme:
"Fark anlamlı mıdır ?"
Değerin ortalamadan büyük ya da küçük oluşu önem taşımaz.
 Tek yönlü çözümleme:
Tıpta eşik değer sık kullanılan bir kavramdır. Bu nedenle incelenen
değerin büyük mü yoksa küçük mü olduğu önem kazanabilir.
“Fark anlamlı ölçüde büyük (ya da küçük) mü ?“
Normal dağılım eğrisinin bir yönü kullanılır.
ÇÖZÜMLEMENİN YÖNÜ
 % 95 ölçütünün korunması
amaçlanmıştır.
 z doğrusunu artık ;
1.96 yerine 1.645 ’ ten keser.
 Çözümlemenin ‘anlamlı’ olma
olasılığı artmıştır.
Tek yönlü çözümlemede z çizelgesi
P- değeri (İstatistiksel Önemlilik)
 Elde edilen çözümleme sonucu bulunan z değeri, sınırların
dışında (% 5 ‘lik alan içinde) ise iki değerin aynı evrenden
olma olasılığını gösteren p değeri % 5’in altında demektir.
 Çalışma grupları arasındaki farkın tamamen şansa bağlı
olarak ortaya çıkma olasılığı
 P değerinin kendisinin verilmesi (p=0.60, p=0.06)
veya < 0.05, 0.01, 0.001
TANIMLAYICI İSTATİSTİK
Tanımlayıcı İstatistik
 Tanımlayıcı istatistikler verilerin
grafiksel olarak özetlenmesidir.
sayısal
ya
da
 Çalışmada veriler toplandıktan sonra, bunların
- Merkezi eğilimleri (verilerin nerede toplandığını gösterir)
- Yayılımları araştırılır
Merkezi Eğilim Ölçütleri
 Ortalama (mean) ( X
¯ ) (en sık):
Aritmetik ortalamadır.
Sayısal değişkenler için kullanılır.
Aşırı uç değerlerden etkilenir.
X=xi / n
 Ortanca (median):
Küçükten büyüğe doğru sıralandığında tam ortadaki deneğin değeri.
Ordinal değişkenler için kullanılır.
Aşırı uç değerlerden etkilenmez.
medyan = (n/2)+(n+2/2) / 2
Merkezi Eğilim Ölçütleri
Tepe değeri (Mod):
Değişkenler içinde en fazla görülen değer.
 Geometrik ortalama:
Denek sayısı n → Denek değerlerinin çarpımının
n ’ inci kökü.
Logaritmik dağılım gösteren veriler için kullanılır.
G.O =
n
 (x1) (x2) (x3).........xn
Merkezi Eğilim Ölçütleri
 Ne zaman hangi eğilim ölçütünü kullanalım?
1. Değişken ordinal mi / sayısal mı
2. Değişkenlerin dağılımı simetrik mi çarpık mı
Simetrik dağılan sayısal veriler → Ortalama
Ordinal/simetrik olmayan sayısal veriler → Ortanca
Logaritmik veriler → Geometrik ortalama
Yayılma Ölçütleri
 Farklı grupların merkezi eğilim ölçütleri aynı olduğu
halde, gruplar birbirlerinden çok farklı olabilir.
(1.grup ölçüm değerleri: 9, 10, 11 ve 2.grup: 1, 10, 19)
 Bu nedenle merkezi eğilim ölçütleri yanında, yayılma
ölçütleri de çok önemlidir.
 Yayılma (Değer aralığı, range);
En büyük değer ile en küçük değer arasındaki farktır.
Örn. Min. = 3.8 / Max. = 8.8
ise
Yayılma (w) = 5
Yayılma Ölçütleri
 Standart Sapma (s veya )
Dağılımın yaygınlığını gösteren en önemli ölçüdür.
Her bir değerin ortalamadan olan uzaklığını gösterir.
S=
 (x  x)
n 1
 Varyans (S2)
Standart sapmanın karesidir.
İki yöntem arasındaki belirsizlikte anlamlı farklılığın
belirlenmesinde iki yöntemin varyansının karşılaştırıldığı;
F değeri kullanılır.
2
Yayılma Ölçütleri
Levene testi (F testi)
 Varyansların homojenliğinin değerlendirilmesinde kullanılır.
2
S1
F
2
S2
 Hesaplanan F değeri, tablodaki F değeri ile karşılaştırılır.
 Hesaplanan F değeri > tablodaki F değeri

p < 0.05, varyanslar eşit değildir.
Yayılma Ölçütleri
 Standart Hata
Bir örnekten elde edilen ortalamanın gerçek evren
ortalamasından olan sapmasıdır.
Çok sayıda örnek içeren bir dağılımın ortalamasının
standart sapmasıdır.
 Sx 
S
n
 Varyasyon Katsayısı;
Standart sapmanın ortalamaya göre yüzde kaçlık bir
değişim gösterdiğini belirtir.
CV= ( S / X ) x 100
.
ANALİTİK İSTATİSTİK
Güven Aralığı
 Örnekten yola çıkarak evrendeki veriyi kestirmek
 Alt ve üst sınırı vardır.
 GA % 90, %95 ve %99 olabilir.
x  ( z  / n )
Güven Aralığı
 Ortalaması 40.0 ve standart hatası 1.36 olan (n42, S8.8)
bir dağılımda güven aralıkları:
 %95 GA  X  (1.96) S
X
 40.0  (1.96) 1.36
 37.33  x  42.67
 %99 GA  X  (2.576) S X
 40.0  (2.576) 1.36
 36.5  x  43.5
Güven Aralığı
 Sıklıkla yapılan bir yanlışta, örnekte bulunan ölçüm
değerlerinin, belirtilen olasılıkla gösterilen sınırlar içinde
yer aldığı düşünülür !
 Örnek için “incelenen örnekte değerlerin % 95’i 37.33 ile
42.67 arasındadır” denir.
 İşlemin gerçek amacı, incelenen örnekten yararlanarak
evrendeki veriyi kestirmeye çalışmaktır.
 Bu örnekte elde edilen gerçek sonuç “örneğin içinden
geldiği evrenin ortalaması yüzde doksan beş olasılıkla 37.33
ile 42.67 arasındadır” biçiminde yorumlanmalıdır !
Güven Aralığı
 Güven aralığı örneğin büyüklüğünden ve homojenliğinden
çok etkilenir.
 Örnek büyüklüğü ve homojenliği arttıkça güven aralığı
daralır.
 Standart hata örnek büyüklüğü ile küçüleceğinden, örnek
büyüdükçe çarpım küçüleceğinden, güven aralığı
daralacaktır.
Güven Aralığı
 Örnekteki güven aralığına bakınca, elde edilen değerin dar
olması nedeniyle seçilen örneğin yeterince büyük ve
homojen olduğu kanısına varılır.
 Geniş bir güven aralığı (sözgelimi yukarıdaki ortalama için
%95 olasılıkta 17.33 ile 62.67) seçilen örneğin
büyüklüğünün yeterli olmadığını, aynı araştırma daha büyük
bir örnekle yinelenirse elde edilecek sonucun daha güvenilir
olacağını gösterir.
Güven Aralığı
 KULLANILDIĞI YERLER
• Ortalama
• Oran (prevelans, sensitivite, spesifisite)
• Göreli risk
• Odds ratio
• Korelasyon
• İki ortalama arasındaki fark
• İki oran arasındaki fark
Güven Aralığı
 ÜSTÜNLÜKLERİ
• İstatistik testin verdiği bilgiyi ve örnek büyüklüğü ile ilgili bilgiyi
de verir.
• Geniş GA riskin değişkenliğini ve çalışma grubunun küçük
olduğunu gösterir
• Dar GA riskin az değişken olduğunu ve çalışma grubunun büyük
olduğunu gösterir
Güç Analizi
 Varolan anlamlı sonucu belirleme yeteneği !
 Belirli bir örnek büyüklüğü ile çalışıldığında, belli bir
etkinin yaratacağı gerçek değişimin istatistiksel
olarak anlamlı bulunma olasılığıdır.
 Klinik çalışmalarda,
iki sağaltım yöntemi arasında oluşabilecek en küçük
farkı ölçebilmek için örnek büyüklüğünün
belirlenmesinde kullanılır.
Güç Analizi
Hipotez Testleri
 Araştırmanın istatistiksel çözümlemelerine
hipotez kurarak başlanır.
 H0 = Farksızlık hipotezi
(iki değer arasındaki farkın anlamlı bulunmadığı)
H1 = Alternatif hipotez
(iki değer arasındaki farkın anlamlı bulunduğu)
Güç Analizi
Hipotez Testleri
 Tek yönlü hipotez
- İzmir’deki 2 yaş çocuklarının kalori alımı
Van’dakinden fazladır.
 Çift yönlü hipotez
- İzmir’deki 2 yaş çocuklarının kalori alımı
Van’dakinden farklıdır.
Hipotez Testleri
 Tek yönlü hipotezde önemlilik bulunması daha kolaydır.
 Medikal araştırmalarda sonuçla ilgili bir öngörü olsa
bile beklenmeyen sonuçlar ortaya çıkabileceğinden
çift yönlü hipotez tercih edilir.
Güç Analizi
 Hipotez Testleri
•
İki değer arasında fark olduğu kanıtlanmak
isteniyorsa önce aralarında fark bulunmadığının
kanıtlanmaya çalışılması gerekir.
• Ho (farksızlık) hipotezi temel alınır ve doğruluğu
kanıtlanmaya çalışılır. Kanıtlanamazsa H1 hipotezi
doğru kabul edilir.
Güç Analizi
 Hipotez Testleri
Hata olabilir mi?
• Tibia kırığı olan hastalarda, kırığı olmayanlara göre eritrosit
sayısı aynı düzeyde iken farklı olduğu sonucuna varabiliriz
Böylece “yanlış olumlu” bir söylemde bulunulmuş olur. (Tip I Hata)
• Tibia kırığı olan hastalarda, kırığı olmayanlara göre eritrositler
farklı düzeyde iken aynı düzeyde olduğu sonucuna varabiliriz.
Böylece “yanlış olumsuz” söylemde bulunulmuş olur.(Tip II Hata)
Güç Analizi
GERÇEK DURUM
Ho Doğru
Tip 1 hata
(a)
Gerçek pozitif
(1-b)
gerçek negatif
(1 – a)
tip II hata
(b)
KARAR
Ho Red
Ho Yanlış
Ho kabul
GÜÇ
testin, anlamlı farkı
bulma olasılığı
% 80
Anlamlı farkı
bulamama
Güç Analizi
 Güç = 1 - Tip II hata
 Güç Analizi: Belirli bir büyüklükteki etkiyi
(farkı) saptayacak örnek büyüklüğünün
belirlenmesi
PARAMETRİK ÖNEMLİLİK
TESTLERİ
İstatistiksel önemlilik testleri,
….farkın veya ilişkinin rastlantısal mı yoksa gerçek
mi olduğuna karar vermede yardımcıdır.
Örnekten elde edilen değerin evrendeki
değerden farklı olup olmadığını,
İncelenen iki grup arasında fark olup
olmadığını,
İki değişken arasında ilişki olup olmadığını,
Elde edilen dağılımın teorik bir dağılıma uyup
uymadığını inceler.
Hangi koşulda hangi test?
Belirleyici olan özellikler;
 Verinin ölçüm biçimi
 (Niteliksel/Ölçüm)
 Gruplardaki kişi sayısı
 <30 veya >30
 Grupların bağımlılık durumu
 Bağımlı / bağımsız
Veri tipi
ölçümle elde edilen
Her bir gruptaki sayı
30 ve üzeri
Dağılım özelliği
Normal
Varyanslar
Homojen
Parametrik
testler
PARAMETRİK TESTLER
Eğer bir testte ortalama, varyans, oran gibi ölçütler
kullanılıyorsa (niceliksel veri)
PARAMETRİK OLMAYAN TESTLER
Testte sıralama, sayma, işaretleme gibi işlemler
yapılıyorsa (niteliksel veri)
 Parametrik testler parametrik olmayanlardan daha
güçlü testlerdir
 Her parametrik teste karşı bir de nonparametrik
test vardır
BAŞLICA İSTATİSTİKSEL TESTLER
 PARAMETRİK TESTLER
 NONPARAMETRİK TESTLER
 Evren ortalaması önemlilik testi
 İşaret testi
 İki ortalama arası farkın önem
testi
 Mann Whitney U testi
 İki eş arası farkın önem testi
(Paired-Samples t test)
 Wilcoxon Eşleştirilmiş iki örnek
testi
 İki yüzde arası farkın önem testi
 Ki-Kare testi
 Tek yönlü Varyans Analizi
(ANOVA)
 Kruskal Wallis Varyans analizi
Parametrik
testlerden
hangi test?
Ölçüm
Karşılaştırılacak
gruplar
Bağımsız
Bağımlı
Karşılaştırılacak grup
sayısı
2
3+
Karşılaştırılacak grup
sayısı
2
3+
N<30 Mann Whitney U
N> 30 t testi
N<30 ise Kruskal
Wallis Varyans analizi
N> 30 Varyans analizi
N<30 Wilcoxon testi
N> 30 bağımlı gruplarda
t testi
Tekrarlı ölçümlerde
Varyans analizi
t testi
(t test,
Student’s t test)
t testi
 tek grup ortalaması
 iki grup ortalaması
t testi
tek grup ortalaması
(t test for one group)
(Evren ortalaması önem testi)
t testi
tek grup ortalaması
Grup ortalamasının bilinen
bir evren ortalamasından
farklı olup olmadığı
t testi
tek grup ortalaması
5 yaş altı 39 çocuğun hemoglobin düzeyleri
ortalaması 10.4±1.6g/dl bulunmuştur. Bu
ortalamanın DSÖ’nün bu yaş grubu için öngördüğü
11.0 g/dl değerinden farklı olup olmadığı
belirlenmek isteniyor
t testi
tek grup ortalaması
X - 
t =-------------
S  n
t testi
tek grup ortalaması
10.4 – 11.0
t =------------=-2.187
1.6   39

SD
0.05
.
........................................
29
2.045..........2.756...........3.659
30
2.042..........2.750...........3.646
40
2.021...........2.704..........3.551
60
2.000...........2.660..........3.460
SD:Serbestlik derecesi
0.01
0.001
t testi
tek grup ortalaması
t =-2.187
SD=38
p<0.05
Yorum: Araştırma grubundaki çocukların
Hb düzeyleri DSÖ’nün önerdiğinden
istatistiksel olarak anlamlı düzeyde daha
düşüktür (p<0.05).
SPSS
analyze
compare means
one sample T test
t =-2.157 SD=38
p=0.037
One-Sample Test
Test Value = 11.0
hemoglobin
t
-4.867
df
Sig. (2-tailed)
31
.000
Mean
Difference
-1.113
95% Confidence
Interval of the
Difference
Lower
Upper
-1.579
-.646
t testi
iki grup ortalaması
İki grup ortalaması
arasında anlamlı fark
olup olmadığı
t testi
iki grup ortalaması

bağımsız gruplarda

bağımlı gruplarda
t testi
iki grup ortalaması
bağımsız gruplarda
(t test for two
independent groups)
t testi
 5 yaş altı 39 çocuğun hemoglobin düzeyleri ortalaması
10.4±1.6g/dl bulunmuştu.
 Sosyoekonomik düzeyi daha yüksek olan bir bölgedeki
aynı yaş grubu 39 çocuğun hemoglobin düzeyleri
değerlendirildiğinde 11.4±1.2g/dl olduğu bulunuyor.
 İki grubun hemoglobin ortalamaları arasındaki farkın
anlamlı olup olmadığı belirlenmek isteniyor
t testi
bağımsız gruplarda
X1 – X2
t =-------------
S
X1 - X2
t testi
bağımsız gruplarda
S
X1 - X
(ortalamalar farkının standart hatası)
varyanslar
homojenortak varyans
homojen değil  grup
varyansları
t testi
bağımsız gruplarda
10.4 – 11.4
t =------------=-2.492
0,321

SD
0.05
.
........................................
29
2.045..........2.756...........3.659
30
2.042..........2.750...........3.646
40
2.021...........2.704..........3.551
60
2.000...........2.660...........3.460
120
1.980...........2.617...........3.373
SD:Serbestlik derecesi
0.01
0.001
t testi
bağımsız gruplarda
t =-2.492
SD=76
p<0.05
Yorum: Hb düzeyleri açısından 1. ve 2.
gruplar arasından istatistiksel olarak
anlamlı fark vardır. İkinci grubun Hb
düzeyi daha yüksektir (p<0.05).
SPSS
analyze
compare means
independent samples
T test
t =-2.965 SD=76 p=0.004
Independent Samples Test
Levene's Test for
Equality of Variances
F
hemoglobin Equal variances
assumed
Equal variances
not assumed
.164
Sig.
.687
t-test for Equality of Means
t
df
Sig. (2-tailed)
Mean
Difference
Std. Error
Difference
95% Confidence
Interval of the
Difference
Upper
Lower
-5.781
64
.000
-1.739
.3008
-2.3400
-1.1380
-5.760
62.038
.000
-1.739
.3019
-2.3425
-1.1355
t testi
iki grup ortalaması
bağımlı gruplarda
(paired t test/
matched groups t test)
t testi
 5 yaş altı 39 çocuğun hemoglobin düzeyleri ortalaması
10.4±1.6g/dl bulunmuştu.
 Bu çocuklara 6 ay demir tedavisi uygulandıktan sonra
hemoglobin düzeyleri değerlendirildiğinde 11.4±1.2g/dl
olduğu bulunuyor.
 Tedavi öncesi ve sonrasında hemoglobin ortalamaları
arasındaki farkın anlamlı olup olmadığı belirlenmek
isteniyor
t testi
bağımlı gruplarda
d
t = -----
Sd
S
S
d
= -----
n
t testi
bağımlı gruplarda
1.85
S
d
=----=0.39
39
-0.95
t =-----=-3.167
0.39

SD
0.05
0.01
0.001
.
........................................
29
2.045..........2.756...........3.659
30
2.042..........2.750...........3.646
40
2.021...........2.704..........3.551
60
2.000...........2.660...........3.460
120
1.980...........2.617...........3.373
t testi
bağımlı gruplarda
t=-3.167
Yorum:
SD=38 p<0.01
Verilen tedavi sonucu çocukların Hgb
düzeylerinde istatistiksel olarak anlamlı artış
saptanmıştır (p<0.01)
SPSS
analyze
compare means
paired samples
T test
t=-3.214 SD=38
p=0.003
Paired Samples Test
Paired Differences
Mean
Pair
1
HEM 1 HEM 2
-.819
Std.
Deviation
.7986
Std. Error
Mean
.1412
95% Confidence
Interval of the
Difference
Lower
Upper
-1.107
-.531
t
-5.800
df
31
Sig. (2-tailed)
.000
Varyans analizi
(analysis of variance/ANOVA)
İkiden fazla grup
ortalaması arasında
fark olup olmadığı
Varyans analizi

bağımsız gruplarda
tek yönlü
Varyans analizi
bağımsız gruplarda
tek yönlü varyans analizi
(one-way ANOVA)
Varyans analizi
5 yaş altı çocuklarda ekonomik durumun hemoglobin
düzeyine etkisi değerlendirilmek isteniyor.
 İyi,orta ve kötü ekonomik durumdaki çocukların (her
bir grupta 32 çocuk) hemoglobin düzeyleri ortalaması
sırasıyla 11.3±1.3g/dl/, 10.8±1.6g/dl/ ve 10.2±1.6g/dl
olarak bulunuyor.
 Üç farklı ekonomik düzeydeki çocukların hemoglobin
ortalamaları arasındaki farkın anlamlı olup olmadığı
belirlenmek isteniyor
SPSS
analyze
compare means
one-way ANOVA
F= 4.380 SD=93 p=0.015
Varyans analizi
bağımsız gruplarda
F= 4.380 SD=93 p=0.015
Anlamlılık hangi
gruptan kaynaklanıyor?
Bonferroni analizi
Ekonomik
durum
kötü
orta
iyi
p
orta
iyi
kötü
iyi
kötü
orta
0.205
0.013
0.205
0.846
0.013
0.846
UYGULAMALAR
SPSS’te uygulamalar
‘evren ortalaması önemlilik testi’
Total kolesterol düzeyi ortalaması 200 mg/dl den
farklı mıdır?
Yorum; araştırma grubunun ortalama kolesterol düzeyi, 200 mg/dl’den
istatistiksel olarak anlamlı düzeyde daha düşüktür (p<0.001)
Bağımsız gruplarda t testi
Yorum; Erkeklerle kadınlar arasında ortalama kolesterol düzeyleri
açısından istatistiksel olarak anlamlı fark yoktur (p=0.92)
Bağımlı gruplarda t testi
Yorum; ikinci ölçülen mide asitlik düzeyi birinciye göre
istatistiksel olarak anlamlı düzeyde daha düşüktür (p=0.013)
PARAMETRİK OLMAYAN
ÖNEMLİLİK
TESTLERİ
 Bir araştırma grubunu oluşturan 12 erkek, 14 kadının
ağırlıkları ölçülmüş ve ortalama ağırlıklar sırasıyla,
 74.21±12.60 (E) ; 79.07±13.89 (K)
 Erkek ve kadınların ağırlıkları arasında anlamlı fark
olup olmadığı belirlenmek isteniyor.
MANN-WHİTNEY U
TESTİ
Bağımsız gruplarda t testi
SPSS
analyze
nonparametric tests
2 independent samples
 Bir araştırma grubunu oluşturan 12 kişinin altı ay ara
ile ağırlıkları ölçülmüş ve ortalama ağırlıklar sırasıyla,
 74.21±12.60 (önceki) ; 77.07±14.36 (sonraki)
bulunmuştur.
 Araştırma grubunun iki farklı dönemdeki ağırlıkları
arasında anlamlı fark olup olmadığı belirlenmek
isteniyor.
WİLCOXON İŞARETLİ
SIRALAR TESTİ
(Wilcoxon signed ranks)
Bağımlı gruplarda t testi
SPSS
analyze
nonparametric tests
2 related samples
Bağımsız üç grup
ortalaması
 5 yaş altı çocuklarda ekonomik durumlarının hemoglobin
düzeyine etkisi değerlendirilmek isteniyor.
 İyi,orta ve kötü ekonomik durumdaki çocukların
(herbir grupta 12 çocuk) hemoglobin düzeyleri
ortalaması 11.3±1.3 , 10.8±1.6 , 10.2±1.6 g/dL olarak
bulunuyor.
 Hemoglobin ortalamaları arasında fark olup olmadığı
belirlenmek isteniyor.
KRUSKAL –WALLİS
VARYANS ANALİZİ
VARYANS ANALİZİ
SPSS
analyze
nonparametric tests
K indepentent samples
 5 yaş altı 12 çocuğun tedavi öncesi,tedavinin 2. ve
6. aylarında Hb düzeyleri değerlendirilmek
isteniyor.
 Hemoglobin düzeyleri ortalaması sırasıyla 10.2±1.6
g/dL, 10.8±1.6 g/dL, 11.3±1.3 g/dL, olarak
bulunuyor.
 Aralıklarla yapılan bu üç ölçüm arasında fark olup
olmadığı belirlenmek isteniyor.
FRİEDMAN VARYANS
ANALİZİ
Bağımlı gruplarda varyans analiz
SPSS
analyze
nonparametric tests
K related samples
Kİ –KARE TESTİ
(chi-squared test)
Dört gözlü düzenlerde
Mc-Nemar
Eğimde Ki-kare
Çok gözlü düzenlerde
Dört gözlü düzenlerde
Ki-kare testi
(chi-squared test for a 2 tables)
Genetik delesyon ile metastaz ilişkisi
METASTAZ
Genetik
Delesyon
sayı
%
sayı
%
sayı
%
Var
16
64.0
9
36.0
25
100
Yok
8
27.6
21
72.4
29
100
Toplam
24
44.4
30
55.6
54
100
VAR
χ2  
TOPLAM
YOK
gözlenen
 beklenen 
beklenen
2
 Örneğe göre bu değerlendirme “delesyon olanlarla olmayanlar arasında
metastaz gelişimi açısından gözlenen fark anlamlıdır (²= 7.24, SD=1 ,
p<0.05)” biçiminde belirtilir.

SD
0.05
1
3.84…………………….6.64……………………………………10.83
2
5.99.............9.21.......................13.82
3
7.82............11.35......................16.2
4
9.49............13.28......................18.47
5
11.07...........15.09......................20.52
SD:Serbestlik derecesi
0.02
0.01
0.005
0.001
SPSS
analyze
descriptive statistics
crosstabs
Ki-Kare (Yates) (Yates’ continuity correction)
 2Yates  
 gözlenen  beklenen  0.5
2
beklenen
Yates düzeltmesinin kullanılması ile ² değeri 7.24’ten 5.82’ye
düşmüş, yeni anlamlılık değeri ise p=0.016 olarak bulunmuştur.
Fisher’in Kesin Testi (Fisher’s Exact
Test)
n<20
20 <n < 40 ve beklenen değerlerden en az bir
tanesi beşin altında
Bağımlı gruplarda Ki-Kare testi
McNemar
 (McNemar test)
Kan şekeri üzerine etkisini araştırmak için 100 diyabetik hastaya
yeni bir diüretiğin verildiğini ve önce ve 3 ay sonra açlık kan şekeri
(AKŞ) ölçüldüğünü varsayalım.
Tedavi sonrası
AKŞ<120
Tedavi
öncesi
AKŞ≥120
Toplam
AKŞ<120
a=20
b=40
60
AKŞ≥120
c=10
d=30
40
Toplam
30
70
100
[ (b – c) – 1 ]2
2McNemar = ___________________
b + c
 McNemar testi kişiler ya da tanısal yöntemler arasındaki
uyumu test etmek içinde kullanılır.
 İki patolog, 100 akciğer biyopsi preperatını, diğerinden habersiz
olarak ‘benign ya da malign’ olarak rapor ediyor. Ne derecede uyumlu
olduklarını test edilmek isteniyor.
Dr.Ahmet
Malign
Benign
Toplam
Dr.Ali
Malign
a=72
b=8
80
Benign
c=5
d=15
20
Toplam
77
23
100
SPSS
analyze
descriptive statistics
crosstabs
statistics
UYGULAMALAR
 Evinde ve kurum içinde yaşayan yaşlılarda asemptomatik
bakteriüri görülme sıklığı belirleniyor. Evinde yaşayan grupta %
18.9 kurumda yaşayanlarda ise % 32.2 bulunuyor.
 Oran değerlendirilmiş (%)
 Dört gözlü düzenlerde Ki-kare
 20-39 yaş grubu 22 erkekte total kolesterol ortalama ve standart
sapması 191.97±42.69, 24 kadında ise 187.35 ±39.97 bulunuyor.
 Bağımsız grup, < 30, ortalama
 Mann Whitney U testi
 30 yaş üstü grupta (255 kişi) 1997 yılında obezite prevalansı
%32.5 bulunuyor. 5 yıl sonra aynı grup obezite açısından yeniden
aynı kriterlerle değerlendiriliyor ve %39.6 olduğu belirleniyor.
 Bağımlı grup, sonuçlar oran olarak verilmiş
 McNemar
 Ellişer kişiden oluşan iki gruba okuma yazma farklı iki yöntemle
öğretilmiş.Birinci grup okuma yazmayı 73 günde ikinci yöntemle
öğrenen grup ise 78 günde öğrenmiştir. Bu iki grupta standart
sapma sırasıyla 9 ve 11 gündür. İki yöntem arasında fark var
mıdır?
 Bağımsız gruplar, > 30
 Bağımsız gruplarda t testi
 60 kişide LIPC-480 genotiplerinin koroner kalp hastalıklarına
etkisinin değerlendirildiği bir çalışmada, LIPC-480’nin 3 farklı
genotipinde (LIPC-480 TT, LIPC-480 CT, LIPC-480 CC) trigliserid
düzeyi ortalamaları sırasıyla 152±73.0 mg/dL, 151±107.0 mg/dL
,138±74.9 mg/dL bulunuyor.
 Bağımsız 3 grup, ortalama
 Kruskal Wallis Varyans analizi
 Bir okulun birinci, ikinci ve üçüncü sınıf öğrencilerinin hemoglobin
düzeyleri ölçülüyor. Sınıflarda sırasıyla 70,62 ve 56 öğrenci
vardır. Üç sınıftaki öğrencilerin ortalama hemoglobin değerleri ve
standart sapmaları belirleniyor.
 3 grup, > 30, ortalama
 Varyans Analizi
 Gebeliği sırasında sigara içmeyen annelerin (15 anne) bebeklerin
doğum ağırlıkları 4.13±0.92 kg, sigara içen annelerin (14 anne)
bebeklerin doğum ağırlıkları ise 3.62 ±0.58 kg bulunuyor.
 Bağımsız gruplar, < 30, ortalama
 Mann Whitney U testi
 Uyku sorunu olan 25 hastaya uyku ilacı veriliyor ve ilaç verilmeden
önce ve ilaç kullanımının birinci ayında ortalama günlük uyku
süreleri belirleniyor. Başlangıçta 4.08±0.48 saat olan uyku süresi
bir ay sonra 6.66±0.82 saat bulunuyor.
 Bağımlı gruplar, < 30, ortalama
 Wilcoxon işaretli sıralar testi
 43 kişilik bir hipertansiyon hasta grubunda bir antihipertansif
ilacın etkinliği araştırılıyor. İlaç vermeden önce ölçülen sistolik
tansiyon ortalaması 172.5 mmHg, ilaç verildikten 2 saat sonra
yeniden ölçülen sistolik tansiyon ortalaması ise 154.0 mmHg’dır.
 Bağımlı gruplar, > 30, ortalama
 Bağımlı gruplarda t testi
 Uyku sorunu olan 44 hastaya yeni çıkan ve uykuyu süre olarak
uzattığı iddia edilen bir ilaç başlanmış. Ancak ilacın gerçekten
etkin olup olmadığını saptamak amacıyla ilaçsız ve ilaçlı olarak
uyku süreleri ölçülmüş. İlacın uyku süresini değiştirip
değiştirmediğini hangi testle analiz edersiniz? Açıklayınız.
 Bağımlı gruplar, > 30
 Bağımlı gruplarda t testi
TEŞEKKÜRLER…
Download