Ölçme Ders Notları
I- TEMEL KAVRAMLAR
1.1 Ölçmenin Temelleri
Ölçme ve değerlendirme konusuna nereden
başlanacağına, “neden ölçme yaparız?” sorusuna cevap vererek
ulaşabiliriz. Çünkü amacımızın ya da ölçme işlemimizin gerekçesi
ölçmeyi nasıl yaptığımızdan da önemlidir. En azından ilk önce
yanıtlanması gereken soru budur.
Yukarıdaki soruya birçok yanıt vermek mümkün
olmakla birlikte temel yanıtlardan birisi çevremizdeki çoğu şeyin
değişmesi olacaktır. Yani değişme olmasaydı ya da her şey sabit
olsaydı ölçme yapmaya ihtiyacımız olmazdı. En azından sürekli olarak
ölçme yapmazdık. Bir kez ölçme yaptıktan sonra bu işlemi başka zaman
veya yerde tekrarlamamıza gerek kalmazdı. Çünkü değişme olmadığı
için ölçme sonucu aynı kalacaktır. Değişme olmaması ölçme işlemini
gereksiz kılacaktı.
Açıklamalar ışığına ölçme değişmeleri ortaya
koyma veya değişkenlerin değişen değerlerini belirlemek amacıyla
yapılır diyebiliriz. Yani “niye ölçeriz?” sorusuna değişme olduğu
için; “neyi ölçeriz?” sorusuna da değişkenleri cevabını vermek
mümkündür. Bu durumda değişkenler üzerinde durulması, değişken
kavramının tanımlanması gerekmektedir.
Değişken: Birkaç tanım vermek mümkündür.
En az iki değer alan veya bir durumdan diğerine farklılık gösteren,
çeşitli değerler alabilen -insana, olaylara, eşyaya ait niteliklere-
özelliklere denir. Yani, durumdan duruma, yerden yere,
zamandan zamana farklılaşan özelliklerin tümüne değişken adı
verilebilir. Ör: Boy uzunluğu, ağırlık, hava sıcaklığı, matematik
yeteneği vb.
Çevremizdeki çoğu şeyin değişmesine rağmen
sabit olan özelliklere de rastlamaktayız. Bir durumdan diğerine
değişmeyen veya ikiden az değer alan özelliklere sabit denir.
Ör. Maddenin özgül ağırlığı, pi sayısı vb.
Bir özellik ya değişkendir ya da sabittir.
Değişkenlik ya da sabitlik nesnelerin özellikleri ile ilgilidir.
Örneğin soğuk ve nem oranı hava nesnesinin iki özelliğini;
çalışkanlık ve boy uzunluğu insanın iki özelliğini göstermektedir.
Değişkenler belli ölçütlere göre sınıflanabilirler. Bu
sınıflamalardan bazıları tablo 1’de görünmektedir.
Tablo 1’de görülen değişkenlerden nicel
değişkenler sayılarla ifade edilebilirken nitel değişkenler,
sıfatlarla veya sembollerle ifade edilir. Nitel değişkenler
sayılarla gösterildiğinde sayılar işlemsel anlamını yitirir.
Sembollere, simgelere dönüşür. Özelliklere sayıların karşı
getirilmesi, matematiğin kural ve işlemlerinin uygulanması
sayesinde, özelliklerin büyüklükleri ve aralarındaki ilişkileri
görmeye imkân sağlar. Değişkenlerin nitel veya nicel olması onlara
uygulanacak işlemlerle ilişkilidir ve bu işlemlerin sınırını
belirler.
Sürekli değişkenlerin ele alınacak iki değeri
arasında her zaman yeni bir değer bulunabilir. Yani iki değeri
arasında sonsuz sayıda değerler alabilir. Uzunluk, ağırlık bu tür
değişkenlere örnek olarak verilebilir. Örneğin uzunluk santimetre,
milimetre, mikron vb. daha küçük birimlere bölünerek ölçülebilir.
Kesikli değişkenler ise iki değeri arasında birkaç değer alabilir
ama sonsuz sayıda değer alamaz. Bu nedenle süreksizdir. Bu tür
değişkenlere sıfatlar, semboller veya doğal sayılar karşılık
getirilebilir. Sürekli değişkenin değerleri listelenemezken kesikli
değişkenin değerleri listelenebilir. Liste sonlu sayıdadır.
Tablo 1. Değişkenler bazı ölçütlere göre
sınıflanması
Ölçütler |
Değişken türü |
Tanım |
Örnekler |
Değişkenin alacağı değer |
1.Nicel Değişken |
Sayılarla ifade edilebilen
özelliklerdir. |
Boy uzunluğu, ağırlık |
2.Nitel Değişken |
Sıfatlarla veya sembollerle ifade
edilebilen özelliklerdir. Bu tür değişkenler sayılarla
gösterildiğinde sayılar işlemsel anlamını yitirir.
Sembollere simgelere dönüşür. |
Medeni durum, Mezun olunan okul
türü |
|
3. Sürekli Değişken |
Matematiksel olarak herhangi iki
değeri arasında bir başka değeri bulunabilen değişkenlere
sürekli değişken denir. Başka bir deyişle sürekli değişkenin
iki değeri arası sürekli bölünebilir. |
Uzunluk, ağırlık, reel sayılar
sistemi |
|
4. Süreksiz Değişken (Kesikli
Değişken) |
Değişken, farklı iki değeri
arasında başka bir veya birkaç değer dışında değer
alamıyorsa, süreksizdir. Bu tür değişkenlere sıfatlar,
semboller veya doğal sayılar karşılık getirilebilir. |
Cinsiyet (Kadın-Erkek), diploma
derecesi (pekiyi, iyi, orta, zayıf) vb. Tavla zarında
gelebilecek sayılar kesiklidir. |
|
Araştırmanın amacı |
5. Bağımsız Değişken
(Etkileyen değişken) |
Aldığı veya alacağı değerler
başka değişken(ler)e bağlı olmadan değerler alabilen
değişkenlerdir. |
Örnekler:
1-Derse karşı Tutum 2-Şişmanlık |
6.Bağımlı Değişken (Etkilenen
Değişken) |
Başka bir değişkene bağlı olarak
değerler alabilen değişkenlerdir. |
1-Başarı 2-Elbise beden numarası |
|
7.Ara Değişken (Katalizör) |
Bağımsız değişkenlerin bağımlı
değişkenler üzerindeki etkilerini artıran veya azaltan
değişkenlerdir. |
Tutum-Başarı değişkenleri
arasındaki ilişkide öğretmen davranışlarının niteliği ara
değişken olabilir. |
Değişkenler araştırmanın amacına göre bağımlı
ya da bağımsız değişkenler olarak sınıflanabilir. Doğası gereği
kendi başına bağımlı ya da bağımsız bir değişken yoktur. Yani
araştırmacının amacına bağlı olarak bir araştırmada bağımlı değişken
olan bir özellik başka bir araştırmada bağımsız değişken ya da ara
değişken olabilir. Örneğin, bir araştırmacı tarih dersine karşı
tutumun tarih başarısını etkileyip etkilemediğini araştırdığında
bağımlı değişkenimiz tarih başarısı iken, bağımsız değişkenimiz
tarih dersine karşı tutumdur. Ancak aynı araştırmacı tarih dersine
çalışmak için ayrılan sürenin tarih başarısını etkileyip
etkilemediğini araştırırken, tarih dersine karşı tutumu derse
çalışılan süreyi artıran ve azaltan bir ara değişken olarak
düşünebilir. Veya yine aynı araştırmacı bir başa çalışmasında tarih
öğretmeninin öğrencileri ile sürdürdüğü iletişim biçiminin,
öğrencilerin tarih dersine karşı tutumu nasıl etkilediğini
araştırabilir. Görüldüğü gibi tutum, birinci araştırmada tutum
bağımsız; ikinci araştırmada ara ve üçüncü araştırmada bağımlı
değişken olarak işleme alınmaktadır. Bu nedenle değişkenleri
bağımlı, bağımsız ve ara değişken olarak sınıflamak istediğimizde
araştırmacının amacını dikkate almak zorunluluğumuz vardır.
1.2 Eğitim ve Ölçme-Değerlendirmeye
İlişkin Temel Tanımlar
Aslında her eğitim felsefesine göre farklı
eğitim tanımları vermek mümkündür. Eğitimin
“Bireyin davranışında kendi yaşantıları yoluyla ve kasıtlı olarak
istendik değişim meydana getirme süreci” tanımı yaygın kabul
gören bir tanımdır.
Buradaki kavramları biraz açacak olursak, kendi
yaşantısı kavramı yaparak yaşayarak öğrenmeye; kasıtlı kavramı
öğrenme ortamını öğretilecek davranışa göre ayarlamaya (öğretim
durumlarına); istendik değişim kavramı önceden belirlenmiş hedef ve
davranışlara işaret etmektedir.
Ölçmenin Önemi
Ölçme ve değerlendirmenin eğitimdeki önemi
günlük yaşamda ve genel olarak bilimlerdeki öneminin bir
yansımasıdır. Örneğin hava durumunu belirlemek için bilgi toplamaz
isek günlük yaşamda nasıl giyineceğimize karar veremez, sık sık hava
durumu konusunda yanılarak hasta olurduk. Bilimler içinde en
duyarlı, en hatasız ölçme yapan bilimlere daha fazla güven vardır.
Bilimler gelişmişliğini ölçme ve değerlendirme yöntemlerindeki
gelişmişlik derecesine borçludurlar. Bu açıklamalar ışığında sosyal
bilimlerdeki ölçme ile fizik bilimlerindeki ölçmeler arasında,
ölçtükleri niteliklerden ve ölçme ve değerlendirmede kullandıkları
araç ve yöntemlerden kaynaklanan farklılıklar bulunmaktadır.
DEĞERLENDİRME (DÖNÜT-DÜZELTME)
Şekil 1. Sistem Yaklaşımında Ölçme ve
Değerlendirmenin Yeri
Şekil 1’den de anlaşılacağı üzere değerlendirme sistemin her
basamağında kullanılmaktadır. Ayrıca değerlendirmenin
değerlendirmesinden de söz etmek gerekir. Tabii ki değerlendirme
yapabilme için ölçme yapmak gereklidir. Değerlendirmede kullanılan
ölçütler ve değerlendirme yöntemleri ile değerlendirmeye konu olan
bilgiyi toplama amacıyla kullanılan ölçme araçları ve yöntemlerinin
de değerlendirilmesi gerekmektedir.
Şemalardan anlaşılacağı üzere eğitim sistemini nasıl bir şema
ile gösterirsek gösterelim o şemada ölçme ve değerlendirmeye mutlaka
yer verme zorunluluğu vardır. Çünkü ölçme ve değerlendirme eğitim
sisteminin temel ve vazgeçilmez öğelerinden biridir.
Ölçmenin Tanımı: “Nitelikleri nicelemek;
gözlem sonuçlarını sayısallaştırmak; bir niceliğin gözlenip, gözlem
sonuçlarını sayı veya semboller ile gösterilmesi” tanımlarından
herhangi birisi kullanılabilir. Ölçme bir gözlemdir. Bir betimleme
işidir. Bu tanımlar dışında tanımlar da yapmak mümkündür.
“Özellikler kümesiyle sayı veya semboller kümesini eşleme işidir”
veya “ampirik küme ile formal küme arasında bir bağıntıdır” gibi
tanımlar örnek verilebilir.
f
Şekil 2. Ölçmenin kuramsal tanımı
Ampirik küme ölçülecek niteliklerin kümesini,
formal küme ölçülen nitelikleri göstermek amacıyla kullanılan sayı
veya sembol kümesini gösterir.
Özellikler Kümesi
İşlemler Kümesi
(Tanım Kümesi)
(Değer Kümesi)
Örnek Ulaşılacak davranışlar
Ulaşılan Davranışlar
(Sınav Başarısı)
(Sınav Notu)
Ölçüm: Özelliklerle ilgili değerlerin
her birine, tek tek gözlem sonuçlarına ölçüm denir.
Ölçmenin Özel Anlamı: Bireyler hakkında
bilgi toplamaktır.
Ölçme Türleri
1)Doğrudan (Temel/Dolaysız) Ölçme:
Herhangi bir niteliği başka nitelikle ilişkilendirmeden gözlemek
doğrudan ölçme olarak adlandırılır. (Boy sırasına koyma, Terazi ile
tartma, metre ile ölçme)
2)Dolaylı (Göstergeyle) Ölçme: Herhangi
bir değişkene ait niteliği başka değişkenler veya araçların
niteliğinden faydalanarak ölçmektir.(termometre ile ısı ölçme veya
yaylı kantarla ağırlık ölçme: birinci durumda civanın genleşmesi
yardımıyla ısı hakkında fikir sahibi olurken, ikinci durumda yayın
uzamasına bağlı olarak ağırlık hakkında bir şeyler söyleyebiliriz.)
3)Türetilmiş Ölçme: İki ayrı ölçülen
nitelik üzerinde yapılan işlemler yardımıyla yeni bir ölçme sonucuna
ulaşmadır. (Örneğin Hız=km/saat (yol / zaman) veya Yoğunluk =
Kütle/hacim gibi)
Ölçmede birimler
Ölçme işleminde doğal ve yapay (tanımlanmış)
birimlerin olduğundan söz edilebilir. Örneğin, bir işyerinde çalışan
işçilerin sayısını bulmak için birim olarak işyerinde çalışan tek
bir işçiyi almak doğru olacaktır ve bu ölçmenin doğal birimi olduğu
söylenebilir. Ancak, uzunluk, ağırlık, zaman gibi bazı değişkenlerle
ilgili birimler tanımlanmış (yapay) birimlerdir. Örneğin, metre ve
kilogram üzerinde anlaşılmış veya tanımlanmış birimlerdendir.
Birimlerin tanımlanmış olmasının bir sakıncası yoktur ve birçok
doğal birimden daha güvenilir ölçme sonuçları elde edilebilir. Zaten
birçok birimi tanımlama gereği de üzerinde anlaşmaya varılamayan
veya tartışmalara neden olan doğal birimler nedeniyle ortaya
çıkmıştır.
Birimlerde aranan üç özellik vardır. Bunlar;
eşitlik (ölçeğin her bölmesinin –metredeki her santimetrelerin-
birbirine eşit olmasıdır), genellik (birimlerin herkes
tarafından aynı anlamda kullanılması veya birimlerin çoğunluk
tarafından kabul edilmesidir) ve amaca uygunluk (ölçülecek
özelliği ölçmeye uygunluk veya bu özelliği en iyi şekilde
yansıtabilmektir) olarak ifade edilebilir.
Ölçmede Araçların Rolü
1-Ölçme sonuçlarının duyarlığını ve
güvenirliğini dolayısıyla kesinliğini artırır. Ölçme sonuçlarına
karışan hata miktarının azalmasını sağlar.,
2-Duyu organlarımızla ölçme yapamadığımız
durumları gözlememizi kolaylaştırır. Böylece duyu organlarını
kullanamadığımız durumlarda da ölçme yapma imkanı buluruz.
3-Herkesin kabul ettiği, üzerinde
anlaştığı standart ölçme sonuçları elde etmemize olanak sağlar.
Ölçek: Ölçme aracı, ölçme birimi veya
ölçme sonuçlarının formal nitelikleri olarak tanımlanmaktadır.
Ölçekleme: Eğitim ve psikolojide ölçek
veya ölçme aracı geliştirme olarak tanımlanabilir.
Ölçmede Kullanılan Ölçek Türleri
1)Adlandırma (Sınıflama) Ölçeği: Farklı
ve benzer tarafların gözlendiğinde kullanılan ölçek türüdür.
Adlandırma = kodlama; öğrencilere numara verme, illere plaka
numarası verme, futbolculara sırt numarası verme vb. gibi yapılan
işlemlere verilen addır. Sınıflama = bir özelliği dikkate alma; bir
özelliğe sahip olanlar, sahip olmayanlar veya bir dereceye kadar
sahip olanları belirlerken kullanılabilir. Bu ölçeklere sözde ölçek
de denir. Bazı ölçmecilerce birimleri ve başlangıç noktaları değişir
dense de birimleri ve başlangıç noktaları yoktur. Çünkü birimdeki
değişme birim de aranan niteliklere uymamaktadır. Farklılıkları
birim cinsinden belirleyemeyiz. Ölçmenin basit, ilkel bir türüdür.
Ölçme sonuçları sembol, sayı veya sıfatlara dönüştürülür.
Matematiksel işlem yapılmaz. İstatistiksel olarak frekans tablosu
yapılabilir ve mod (tepe değer =en çok tekrar eden ölçüm)
bulunabilir. İlk olarak bu ölçeklerin yansıma özelliği vardır: yani
farklı iki objeye “a” kodu verilmişse a=a’dır. İkinci olarak bu
ölçeklerin simetri özelliği vardır: yani aynı kümede bir objeye “a”
diğerine “b” kodu verilmişse ve a=b ise b=a’dır. Üçüncü olarak bu
ölçeklerin geçişme özelliği vardır: yani a=b ve b=c ise a=c’dir.
2)Sıralama Ölçeği: Belirli bir nitelik
bakımından büyükten küçüğe ya da küçükten büyüğe sıraya koyma
işidir. Bu sıraya uygun sayı veya sembol kullanılırsa sıralama
ölçümleri yapılabilir. Kullanılan sayılar sıra sayılarıdır. Bu
ölçekler büyüklük küçüklük bağıntısı ve bu bağıntının özelliklerini
sağlar. Sıralama ölçeklerinin de birim ve başlangıç noktası olmadığı
söylenebilir. Yani büyüklükler hakkında farklılığın ne kadar olduğu
yönünde bilgi sahibi olamayız. Öğrencilerin elde ettiği test ham
puanları sıralama ölçeğindedir. Bu ölçeklerin birinci özelliği
ters simetridir: yani a<b ise b>a’dır ya da b<a değildir. İkinci
özellik geçişmedir: yani a<b ve b<c ise a<c’dir. Bu ölçeklerle
adlandırma, sınıflama ve büyüklük küçüklük karşılaştırması
yapılabilir. Ancak büyüklükteki farklara ilişkin işlemler yapılamaz.
İstatistiksel olarak frekans tablosu, mod, medyan (ortanca) ve
yüzdelikler hesaplanabilir. İlişki ölçülerinden sıra farkları
korelasyonu bulunabilir.
3)Eşit Aralık Ölçeği: Birimi ve izafi
(tanımlı, yapay, göreceli, göreli) bir sıfır noktası vardır.
Gerçekte “
4)Oran Ölçeği: Başlangıç noktası gerçek
(mutlak) sıfırdır. Eşit bir birimi vardır. Bu ölçeklerle elde edilen
verilerde her türlü matematiksel ve istatistiksel işlemler
yapılabilir.
Gerçek (mutlak) ve yapay (bağıl-görece)
sıfır için örnek
1. Durum
X
Y
Yukarıdaki şekillerde birinci (küçük) doğruya
X, ikinci (büyük) doğruya Y dersek Y=2X olur.
2. Durum
X
Y
1. Durumdaki uzunlukların başlangıç noktalarını
50 cm’ye çekersek Y=2X işlemi geçerliğini yitirir. Yani ikinci
şekilde, tanımlı sıfır noktasının gerçek sıfırı göstermemesi
nedeniyle Y=2X işlemi artık kullanılmaz olur. Bu nedenle ikinci
durumda Y≠2X’tir. Buna benzer olarak üst (nitelikli) ölçeklerden alt
(niteliği düşük) ölçeklere geçiş yapıldığı her seferinde üst
ölçekteki bilgi ve işlem zenginliği kaybedilerek, alt ölçekteki
işlem ve bilgilerle yetinmek zorunda kalınır.
Tablo 2 kullanılan ölçek türüne göre elde
edilen gözlem sonuçlarının anlamlarını, gözlem sonuçları üzerinde
yapılabilecek işlemleri ve dolaylı olarak da nasıl
yorumlanacaklarını görmemize yardımcı olabilir.
Tablo 3’te ölçme işleminde kullanılan
ölçeklerle ilgili özet bilgiler yer almaktadır. Tablo 3 ile ilgili
açıklanması gereken iki önemli nokta vardır. Bunlar;
Tablo 2. Ölçeklerle elde edilen bilgilerin
anlamlılıkları
|
Ölçeğin yapısal özellikleri |
Elde edilecek Olan ölçülerin
anlamlılık dereceleri |
||||
Ölçek tipi |
Başlangıç noktası |
Birimi (Aralığı) |
Nitelik gösterme gücü |
Nicelik gösterme gücü |
||
|
|
|
|
Sıra |
Fark |
Oran |
Sınıflama |
Yok |
Yok |
Var |
- |
- |
- |
Sıralama |
Değişken |
Değişken |
Var |
Var |
- |
- |
E. Aralıklı |
Keyfi |
Keyfi |
Var |
Var |
Var |
- |
Oranlı |
Mutlak |
Mutlak |
Var |
Var |
Var |
Var |
1.Ölçekler yukarıdan aşağıya en basitinden en
karmaşığına bir sıra göstermektedir (Basitlik ve karmaşıklık, elde
edilen ölçümlerin bize verdiği bilgi, bu bilgilerin güvenirliği ve
ölçümler üzerinde yapılabilecek işlemlerin çokluğuna dayalı olarak
belirlenmektedir).
2.Karmaşık ölçekler basit ölçeklere
dönüştürülebilirler. ( Aksi çoğu zaman -test standart puanlarını
elde etme dışında- mümkün değildir.)
Davranışların ölçülmesi, ya o davranışların ya
da o davranışlar sonunda ortaya çıkan ürünün veya ikisinin birden
gözlenmesi şeklinde gerçekleşir.
Tablo 3. Ölçek türleri özet tablosu
ÖLÇEKLER |
TEMEL İŞLEMLER |
ÖRNEKLER |
İST. TEKNİKLER |
SINIFLAMA (ADLANDIRMA) |
Farklılık ya da Benzerliği belirlemek |
-kişileri saç ve ten rengine göre
sarışın esmer diye gruplama -evlere kapı numarası, sokaklara sokak
adı verme |
-frekans -tepe değer (mod) -yüzde |
SIRALAMA |
Azı – çoğu veya küçüğü-büyüğü
belirlemek |
-kitapları kalınlık sırasına göre dizme -öğrencileri boy veya başarı sırasına
koyma |
-ortanca (medyan) -yüzdelik -sıra farkları korelasyon katsayısı |
(EŞİT) ARALIK |
Farkları belirlemek |
-termometreyle sıcaklık ölçme -kullanılan takvimler -standartlaştırılmış test puanları |
-ortalama -standart sapma -Pearson Moment Çarpımları korelasyon
katsayısı |
ORAN ÖLÇEĞİ |
Oranları belirlemek |
-hacim, uzunluk, ağırlık vb. ölçüleri |
-matematiksel ve istatistiksel her
türlü işlem. |
Amaç istendik davranışların ölçülmesi ise en
geçerli ölçme o davranışların gerçek hayat şartlarında gözlenmesiyle
olur. Ürüne bakılarak ölçme de ise gerçek koşullar altında ortaya
çıkan ürünlere bakılarak yapılmalıdır. Ancak davranışların gerçek
hayatta gözlenmesi çoğunlukla güçtür. Bu nedenle gerçek hayat
durumuna mümkün olduğunca benzetilmiş ortamlar altında ölçme
yapılmaktadır. Ölçme sonuçlarının ölçme yapılan ortamın gerçek hayat
şartlarına benzerliği ölçüsünde geçerli olduğu söylenebilir.
Diğer bir yol, gerçek hayat durumunu anlatarak
böyle bir durumda kişiye ne yapacağını sormaktır. Bu sayıltıya göre
okulda geliştirilecek ve ölçülecek davranışların çoğu bilgi, tutum
ve duygulara dönüşür. O halde bazı davranışlar yerine onların
dayandığı bilgi, beceri ve tutumları gözleyip ölçeriz. Bu işlemler
sırasında gözlenen bilgi, beceri ve tutumların gerçek durumda
davranışa dönüşeceği varsayılır.
Hangi yaklaşımla veya varsayımlarla yapılırsa
yapılsın ölçme şu üç aşamadan geçer; 1) Ölçülecek özelliğin
kararlaştırılması ve tanımlanması 2) Ölçülecek özelliğin ortaya
çıkarılmasını ve gözlenmesini sağlayacak işlemlerin belirtilmesi
3)Gözlem sonuçlarının derece veya miktar olarak ifade edilmesi.
Değerlendirme: Ölçme sonuçlarını bir
ölçüt veya ölçütlerle karşılaştırarak karara varma, ölçme
sonuçlarını yargılama ya da karar verme olarak tanımlanabilir.
Değerlendirmenin Özel Anlamı: Bireyler
hakkında toplanan bilgiyi ölçütlerle karşılaştırarak bireyler
hakkında karar verme, yargıda bulunma sürecidir.
Test: Sınav, seçmeli testler, sınama,
deneme, kontrol, yoklama anlamlarına gelir. Bu kelime kullanılırken
hangi anlamda kullanıldığı açıklanmalıdır.
Sınav: Birden çok testin
kullanılabildiği (yetenek, tutum, başarı vb.) çeşitli özellikleri
ölçme sürecini vurgular. Test ise belli özellikleri ölçmek için
kullanılan ve onu alan herkes için aynı olan sorulardan ya da
işlerden oluşan ölçme aracıdır. Sınavın kapsamı geniş, testin
kapsamı dardır.
Bölüm Testi
1. Aşağıdakilerden hangisi ölçmenin
eğitimde kullanılma amacıdır?
A) Değerlendirmeye temel oluşturması*
B) Kolay ve nesnel puanlamayı sağlamsı
C) Maliyeti azaltarak kullanışlığı artırması
D) Bireyleri başarıya göre sıralaması
E) Davranışa sahip olanla olmayanı ayırması
2. Ölçmede araç kullanmanın faydasını
aşağıdakilerden hangisi en iyi açıklar?
A) Puanlamayı kolaylaştırır.
B)
Kapsam geçerliğini artırır.
C)
Tesadüfî hataları kontrol eder.
D)
Yorumlamaya olanak verir.
E)
Gözlemi duyarlı hale getirir.*
3. Aşağıdakilerden hangisi temel (doğrudan)
ölçmedir?
A)
Bir daktilo yazısındaki hataları saymak*
B)
Başarı testi ile öğrenci başarısını ölçmek
C)
Yaylı kantar ile ağırlık ölçmek
D)
Bir zekâ testi ile zekâ yaşını hesaplamak
E)
Termometreyle havanın ısısını ölçmek
4. Aşağıdakilerden hangisinde birimlerde
bulunması gereken özellikler tam ve doğru olarak verilmiştir?
A)
Geçerlik, doğruluk, duyarlık
B)
Geçerlik, güvenirlik, tutarlık
C)
Hatasızlık, iç-tutarlık, yeterlik
D)
Eşitlik, genellik ve uygunluk*
E)
Genellik, kullanışlılık, niteliklilik
****
“Daktilo kursuna giden Özge’nin yeterlik
belgesi almaya hak kazanmak için 100 üzerinden en az 50 puan alması
gerekiyordu. Özge 70 puan aldı ve yeterlik belgesini kazandı.”
Aşağıdaki 3 soruyu yukarıdaki ifadeye göre
cevaplandırınız.
5. “50 puan” neyi gösterir?
A)
Güvenirlik B) Ölçme
C) Değerlendirme
D) Ölçüt*
E) Geçerlik
6. “70 puan” neyi gösterir?
A)
Güvenirlik B)
Ölçme* C) Değerlendirme
D) Ölçüt
E) Geçerlik
7. “Yeterlik belgesini kazanması” neyi
gösterir?
A)
Güvenirlik B) Ölçme
C) Değerlendirme* D)
Ölçüt
E) Geçerlik
****
8. Bir sınavda çıkan soruların tamamını doğru
cevaplandıran bir öğrencinin tam puan alması ile ilgili olarak
aşağıdakilerden hangisi kesinlikle söylenebilir?
A)
Öğrenci sınıfında üst sıralarda yer alabilir.*
B)
Öğrenci dersteki konuların hepsini bilmektedir.
C)
Sınavın güvenirliği çok düşük çıkacaktır.
D)
Sınıfın çoğunluğu bu sınavda başarılı olmuştır.
E)
Sınavın kapsam geçerliği düşüktür.
9. Aşağıdaki ölçme sonuçlarının hangisinde
doğal birim yoktur?
A) Veli 5 çift ayakkabı aldı.
B)
Ceren’in boyu 1,68 metredir.*
C)
Fatma sorulardan 28’ini doğru cevapladı.
D)
Bu lokantada 7 garson var.
E)
Galeride satılmayan 3 araba kaldı.
10. Aşağıdakilerden hangisi bir dolaylı
ölçmedir?
A)
Giyimine bakarak kişinin sevdiği rengi belirlemek
B)
Öğrencilerin kitaplarından ciltlenmiş olanlarını seçmek.
C)
Ders kitabını sınıfa getirmeyen öğrencileri saymak
D)
Öğrencilerin akademik benlik tasarımlarını ölçmek *
E)
Sınıftaki esmer ve sarışın öğrencileri belirlemek.
11. Bir üniversitenin Spor Bilimleri bölümüne
öğrenci seçme sınavında öğrencilerin 10 saniyede kaç metre
koştukları belirlenerek puan verilmektedir. Öğrencilere puan vermek
için yapılan ölçme işlemi hangi ölçektedir?
A)
Adlandırma B) Sınıflama
C) Sıralama
D) Eşit Aralıklı
E) Oranlı*
12. Değişken kavramını aşağıdakilerden hangisi
daha iyi açıklar?
A)Gözlenen özellikler
B)Etkisi araştırılan nitelikler
C)Bir sonucu ulaştıran nitelik
D)Etkilenme düzeyi araştırılan nitelikler
A)Aldığı değerler farklılaşan nitelikler*
13. Eğitimde hangi ölçek türünde
ölçme yapılamaz?
A)
Sıralama
B)
Aralık
C)
Oran*
D)
Sınıflama
E)
Adlandırma
|
II-
ÖLÇME ARACINDA
ARANAN NİTELİKLER
Ölçme aracında üç özelliğin yeterli düzeyde
bulunması istenir. Bunlar kısaca aşağıda tanımlanmıştır.
1-Güvenirlik: Ölçme aracının hatalardan
arınık olma derecesi, ölçtüğü şeyi tutarlı ölçebilme derecesi.
2-Geçerlik: Ölçme aracının kullanış
amacına hizmet etme derecesi, Ölçtüğü şeyi, diğer değişkenleri
karıştırmadan ölçebilme derecesi.
3-Kullanışlılık: Ölçme aracının
hazırlama, uygulama, puanlama ve tüm bu süreçlerde ekonomiklik
derecesi olarak adlandırılabilir.
Gerçek Puan Kuramı Temel Denklemi: X= T + E
(Denklem 1)
X: Gözlenen puan
T: Gerçek Puan
E: Ölçemeye Karışan Hata Puanı
Örnek bir öğrenci 20 soruluk bir testten 17
puan almış olsun. Bu 17 puanı gözlenen puandır. Ancak öğrencinin
sahip olduğu bilgi düzeyi ile 14 puan alabileceğini varsayalım. Bu
14 puan gerçek puandır. Öğrencinin gerçek performansını ya da
başarısını yansıtan puandır. Öğrenci geriye kalan 3 puanı da kopya
çekerek ve şansla kazanmıştır. İşte bu 3 puana, ya da gözlenen
puanla gerçek puan arasındaki farka hata puanı diyebiliriz. X
bilinir, çünkü gözlenen puandır. T hipotetiktir (teoriktir),
bilinemez. E eğer yönü ve miktarı belli ise bilinebilir. Ancak
tesadüfî ise yönü ve miktarı bilinemez. Dolaylı yollardan
hesaplanır.
Hiçbir ölçme hatasız değildir. Hemen her
ölçmeye milyarda bir oranında da olsa hata karışır. Hataların
çeşitli kaynakları vardır. Hatalar: Ölçmeci, ölçme aracı, ölçme
yöntemi, ölçme ortamı veya ölçülen kişiden gelebilir.
2.1 Hata Türleri
1-Sabit Hatalar: Her ölçme sonucuna aynı
miktarda ve aynı yönde karışan; her ölçme sonucu için aynı yönde
etkili olan ve her bir ölçmede miktarı değişmeyen hatalardır. (Ör:
Her öğrenciye 10 puan fazla verilmesi veya bir soruyu bütün sınıfın
doğru cevaplandırması sabit hatalardandır.)
2-Sistematik Hatalar: Ölçme sonuçlarına
belirli bir kurala göre karışan ve yönü ile miktarı tespit
edilebilen hatalara sistematik hatalar denir. Çoğunlukla her bir
ölçme için sabit olmayan, puanlayıcı yanlılığını yansıtan
hatalardır. (Ör: Matematik ya da Fen dersinde öğrencilerin güzel
yazı yazma, düzen vb.ne puan verme veya sadece erkek / kız
öğrencilere fazladan puan verme sistematik hatalardandır.)
3-Random (tesadüfî, gelişigüzel, rasgele)
Hatalar: Kaynağı, yönü ve miktarı bilinmeyen, ölçme sonuçlarına
tesadüfen karışan hatalardır. Bu tür hatalar ölçme sonuçlarına
nerede, ne zaman, nasıl, ne kadar karıştı tespit edilemezler. (Ör:
Sınav koşullarının öğrencilere etkisi, öğretmenin puanlama
dikkatsizliği gibi etkenlerden ölçmelere karışan hatalar bu
türdendir.) Ancak bu tür hataların ortalamasının sıfıra yaklaştığı
ve normal dağıldığı kabul edilir.
Ölçmede asıl ilgilenilen hata türü tesadüfî
hatalardır. Sabit hatalar standart sapma ve varyansa etki etmezler.
Sistematik ve sabit hatalar kontrol edilebilirler. Ölçme sonuçlarına
hangi yönde ve hangi miktarda karıştığı tespit edilerek ölçme
sonuçlarından çıkarılabilirler. Böylece de ölçme sonuçları
hatalardan arındırılmış olur. Dolayısıyla sabit ve sistematik
hataların ölçme sonuçlarının güvenirliğine etkileri azaltılabilir
veya tamamen ortadan kaldırılabilir. Bu nedenle güvenirlik söz
konusu olduğunda ölçmecileri asıl ilgilendiren hata türü olarak
tesadüfî hatalara vurgu yapılır. Ancak random hataları kontrol etme
imkânı yok gibidir. Bu nedenle yapılabilecek en doğru işlem random
hataları azaltmak için gerekli önlemeleri alabilmektir.
Ölçme aracının duyarlığı hataları azaltır.
Ölçmecinin yeterli oluşu, ölçme aracının iyi kullanılması,
puanlamanın objektifliği, ölçme yapılan ortamın amaca uygunluğu ve
ölçülen kişinin performansını yansıtacak durumda olması hataları
azaltır.
2.2 Güvenirlik
Genel anlamda tutarlık ve duyarlık demektir.
İki veya daha fazla ölçümün birbirini tutması veya yapılan
ölçümlerin duyarlı olmasıdır. Pozitif bilimlerde
aynı şartları sağlamak mümkün olabildiği için bu yöntem iyi sonuçlar
verir. Eğitim ve psikolojide aynı şartları sağlamanın zorluğu farklı
yöntemler geliştirilmesini zorunlu kılmıştır. Geçerlik ve
güvenirliği belirleme tekniklerinde en çok kullanılan istatistik
tekniklerden biri korelasyon katsayısıdır. Aşağıda, korelâsyonun
alabileceği tipik değerlerle ilgili grafiklerden üçü verilemeye
çalışılmıştır.
Korelâsyon katsayısı –1 ile 1 arasında değerler
alır. Değer 1’e yakınsa pozitif korelasyon vardır. Değişkenler aynı
yönde değişiyor anlamına gelir. Yani değişken değerlerinden biri
artarken diğeri de artıyorsa pozitif korelasyon olur. Bu durumda,
değişkenlere ait değerler eksenlerin birleştiği köşeden karşı köşeye
yönelen bir elips içinde gösterilebilir (1. gösterim örneğindeki
gibi). Eğer değişkenlerin değerleri, eksenlerin birleştiği köşeden
karşı köşeye yönelen düz bir doğru üzerinde gösterilirse bu durumda
mükemmel olumlu ilişkiden söz edilir. Değer –1’e yaklaşıyorsa
negatif korelasyon vardır. Değişken değerlerinden biri azalırken
diğeri artıyorsa negatif ilişki vardır. Bu tür ilişkiye ters yönde
ilişki de denir. Bu durumda değişkenlere ait değerler dikey eksenden
yatay eksene doğru yönelen bir elips içinde gösterilebilir (2.
gösterim örneğindeki gibi). Değişkenlere ait değerler dikey eksenden
yatay eksene yönelen bir doğru üzerinde gösterilebilirse bu durumda
mükemmel olumsuz ilişkiden söz edilir. Korelasyon değeri 0’a yakınsa
iki değişken arasında ilişki olmadığı söylenir. Değişkenlerin
değerleri bir daire, bir kare bazı zamanlar ise dikdörtgen
içerisinde gösterilebilir. (3. gösterim örneğindeki gibi).
Korelasyon grafiksel olarak gösterildiği gibi
istenirse değer olarak da hesaplanabilir. Grafik teknik sayesinde
korelasyonun yönü ve gücü hakkında fikir sahibi olsak da yorum
yapmakta zorlanılacak durumlar da mümkündür. Denklem 2 korelasyon
değerinin nasıl elde edildiğini göstermektedir. Bu formüle
korelasyon için ham puan formülü adı da verilir. Eğer istenirse bu
formül kullanarak korelasyon değeri elde edilir ve yorumlanır. Elde
edilen korelasyonun gücü sorulduğunda mutlak değer 1’e yakınlığına
bakılır. Özel olarak yön belirtilirse hesaplanan korelasyonun
işaretine bakılır. Korelasyon Formülü
|
Korelasyon güvenirlik ve geçerlik katsayısı
olarak kullanılırken pozitif ve bire yakın olmasına dikkat edilir.
Yani pozitif ve bire yakın korelasyon varsa geçerlik ve güvenirlik
olduğu söylenebilir. Güvenirlikte 0,70 üstü; geçerlikte ise 0,30
üstü korelasyon var ise kısmen de olsa geçerlikten ve güvenirlikten
söz edilebilir.
1. Test |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
|
|
|
|
|
|
|
x |
|
x |
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
x |
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
x |
|
|
|
|
|
|
|
|
|
|
X |
|
|
x |
x |
|
|
|
|
|
|
|
|
x |
|
X |
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2. Test |
|
||
1. Gösterim |
|
(Pozitif Yüksek Korelasyon) |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1. Test |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
X |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
X |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
X |
x |
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2. Test |
||
2. Gösterim |
|
(Negatif Yüksek Korelasyon) |
|
|
1. Test |
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
x |
x |
|
|
x |
|
|
|
|
|
|
|
|
|
x |
|
|
x |
|
x |
x |
|
|
|
|
|
|
x |
x |
|
|
x |
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
x |
x |
x |
x |
|
|
|
|
|
|
x |
|
x |
|
x |
|
|
|
|
x |
x |
|
|
|
|
x |
|
x |
|
|
x |
x |
x |
x |
x |
|
|
|
|
|
|
x |
|
x |
|
|
|
|
x |
x |
|
|
|
|
|
|
x |
|
|
x |
x |
x |
|
|
|
|
|
|
|
|
|
x |
|
x |
|
|
|
x |
|
x |
|
|
|
|
|
|
|
X |
|
|
x |
|
x |
x |
|
|
|
|
|
|
|
|
|
x |
|
x |
x |
x |
|
x |
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3. Gösterim |
|
|
|
|
|
|
|
|
|
|
|
2. Test |
||
|
|
(Sıfıra Yakı Düşük Korelasyon) |
|
|
Güvenirlik bir korelasyon
olmasına rağmen 0 ile 1 arasında değişir. Varyanslardan hareket
ettiğinden – (negatif) değer almaz. Çok ender olarak 1’in üstünde
veya negatif çıkar. Aynı şekilde herhangi bir ölçme sonuçlarının tam
güvenilir ya da sıfır güvenirlikte olması beklenmez. Eğer
ölçmelerimiz tam güvenilir olsaydı güvenirliğin tanımından
ölçmelerimizde hata olmazdı, bu durumda güvenirliğin (korelasyonun)
değeri 1 olurdu; eğer ölçmelerimiz sıfır güvenirlikte olsaydı,
ölçümlerin hepsi hata ölçüsü anlamına gelirdi; bu durumda da
güvenirliğin (korelasyonun) değeri 0 olurdu.
Geçerlikte ise ölçülmek istenen değişkenle zıt
yönlü bir değişken ölçülebilir. Örneğin bir dersten hoşlanmamak
(olumsuz tutum) ile o dersteki başarı negatif yönlü korelasyon
verebilir. Bu nedenle güvenirlik 0 ile 1 arasında değer almasına
rağmen geçerlik -1 ile +1 arasında değerler alır. Geçerlik ve
güvenirliğin alabileceği değerlerin sınırlarını aşağıdaki gibi
göstermek kalıcılığı açısından yararlı olabilir.
0 ≤ rxx ≤ +1
(Güvenirliğin sınırları)
-1 ≤ rxy ≤ +1
(Geçerliğin sınırları)
Güvenirliği Belirleme Yollarından Bazıları:
1-Test Tekrar Test Güvenirliği: Aynı
testi aynı gruba iki kez uygulama yoluyla elde edilen güvenirlik
katsayısıdır. İki uygulamadan elde edilen puanlar arasındaki
korelasyon katsayısıdır. İki uygulama arasından belirli bir zaman
geçmelidir. Aradan geçen zaman cevaplayıcıların ölçülen özellik
bakımından değişmeyecekleri, aynı zamanda ilk uygulamada verdikleri
cevabı hatırlamayacakları bir süre olmalıdır. Bu güvenirlik
katsayısına Kararlılık Katsayısı da denir.
2-Paralel Test Güvenirliği: Test-tekrar
test yönteminin dezavantajını gidermek amacındadır. En az iki
eşdeğer form geliştirilir. İki test madde sayısı, niteliği ve
ölçtükleri davranışlar bakımından denk olmalıdır. İki test aynı
öğrenci grubuna uygulanır. İki testten elde edilen cevaplayıcı
puanları arasında korelasyon katsayısı hesaplanır. Uygulama aynı
öğrenci grubuna aynı zamanda yapılırsa hem karalılık anlamında
güvenirlik hem de formların eşdeğerliği hakkında bilgi verir.
3-İki Yarı Güvenirliği: Tek uygulama
gerektirdiğinden çok kullanılır. Test iki eşdeğer yarıya bölünür
(Yarısından veya tek-çift sorular). Öğrencilerin bu iki yarılardan
elde ettikleri puanlar arasında korelasyon elde edilerek testin bir
yarısı için güvenirlik bulunur. Bu korelasyon kullanılarak testin
tümü için güvenirlik hesap edilir. Testin tümü için güvenirlik
katsayısının formülü şöyledir.
(Denklem 3)
Bu yöntemin kullanılmasında tek boyutlu; aynı niteliği ölçen
maddelerden oluşan bir test olmasına özen gösterilir. Aksi durumda
yorumlamada sıkıntı yaratacağından kullanılmaz.
4-KR-20 Güvenirliği: Bu formül için
madde güçlük indeksi (p) bilinmelidir. İkinci olarak testteki her
bir maddenin aynı değişkeni ölçtüğü yani testin ölçmek istediği
niteliği ölçtüğü sayıltısı vardır. Formül madde güçlüklerini ve
madde sayısını dikkate alarak hesaplanan bir güvenirlik
katsayısıdır.
(Denklem 4)
K: Madde sayısı
p: Maddeyi doğru cevaplandıranların tüm
cevaplayıcılara oranı
q: Maddeyi yanlış cevaplandıranların tüm
cevaplayıcılara oranı
: Tüm testin varyansı
5-KR-21 Güvenirliği: Testteki maddelerin
eşit ya da yakın güçlükte olduğu varsayılıyorsa ve madde
istatistikleri (güçlükleri veya varyansları = pq) bulunmamışsa test
puanları ortalaması ve varyansı kullanılarak KR-21 güvenirlik
katsayısı hesaplanabilir. Maddelerin eşit güçlükte varsayılmasından
dolayı KR-21 genellikler KR-20’den küçük çıkar.
(Denklem 5)
Eğer maddeler güçlük bakımından oldukça farklı ise yani
birbirine yakın veya eşit değilse bu formül güvenirliğin en alt
sınırını verir. Bu durumda elde edilen güvenirlik katsayısı yeterli
görülüyorsa (.75’in üstünde ise) testin güvenilir olduğunu söylemek
mümkündür.
KR-20 ve KR-21 formülleri sadece 1-0
puanlamasında kullanılır. Eğer puanlama farklı ise bu formül
kullanılmaz. Cronbach alfa güvenirlik katsayısı kullanılır.
6- Cronbach alfa: Maddeler (sorular)
1-0’dan farklı puanlandığı zaman veya bir testin alt testleri varsa
bu tür testlerin güvenirliğini KR-20’nin özel bir hali olan Cronbach
Alfa tekniği ile hesaplarız. KR-20’den farkı eğer testin alt
testleri var ise madde varyansları toplamı yerine alt test
varyansları toplamı alınır. 1-0’dan farklı puanlandığında KR-20’de
olduğu gibi madde varyansları kullanılır.
(Denklem 6)
å
: Madde varyansları toplamı veya alt test varyansları toplamı
7-Puanlayıcı Güvenirliği: Cevap
kâğıtlarına birden fazla puanlayıcının verdiği puanlar arsındaki
korelasyondur. Puanlayıcıların yansızlığı ve uyumu hakkında bilgi
verir. Daha çok yazılı sınavlar, sözlü sınavlar, performans testleri
gibi durumlarda kullanılır.
8-Puanlama Güvenirliği: Bir
puanlayıcının bir sınav kağıdına farklı zamanlarda (en az iki kez)
verdiği puanlar arasındaki korelasyondur. Puanlayıcının kararlılığı
ve yansızlığı hakkında fikir verebilir. Daha çok yazılı sınavlarda,
ödev-projelerde ve kısmen de kısa cevaplı testlerde kullanılabilir.
Tablo 4. Güvenirlik Belirleme Tekniklerine
İlişkin Özet Bilgiler
Güvenirlik Katsayısı Tipi |
Anlamı |
Gereken form
sayısı |
Uygulama
sayısı |
Hata varyansı
kaynağı |
KUDER-RICHARSON KR - 20 ve KR
- 21 |
İç tutarlık |
Bir |
Bir |
Kapsam örneklemi
ve heterojenliği |
CRONBACH ALFA |
İç tutarlık |
Bir |
Bir |
Kapsam örneklemi
ve heterojenliği |
İKİ YARI |
İç tutarlık |
Bir |
Bir |
Kapsam örneklemi |
TEST-TEKRAR TEST |
Kararlılık |
Bir |
İki |
Zaman örneklemi |
PARALEL FORMLAR Birlikte uygulama |
Tutarlık |
İki |
Bir |
Kapsam örneklemi |
PARALEL FORMLAR Aralıklı uygulama |
Tutarlık |
İki |
İki |
Zaman ve kapsam |
PUANLAYICI |
Tutarlık |
Bir |
Bir |
Puanlayıcılar |
PUANLAMA |
Kararlık |
Bir |
Bir |
Puanlama |
Açıklanan güvenirlik belirleme tekniklerine
ilişkin özet bilgiler tablo 4’te verilmektedir. Tablo 4
güvenirliklerin hangi anlama geldiği, kullanılması gereken form
sayısı, uygulama sayısı ve hesaplanan güvenirlik değerlerine karışan
hata kaynaklarını göstermektedir.
Güvenirliği Artırma Yolları
1-Soru sayısını artırmak güvenirliği
artırır. Güvenirlikle soru sayısı arasında matematiksel bir ilişki
vardır. Soru sayısı arttıkça duyarlı ölçme yapılacağı için
güvenirlik de artar. Ancak soru sayısını bir noktadan sonra
artırmanın getirişi çok fazla değildir. Bu ilişki aşağıdaki şekilde
görülebilir. Güvenirliği tam (1) yapabilmek için eklenecek soru
sayısı sonsuzdur. Monoton artan bir fonksiyondur. Bir noktadan sonra
eklenecek soru sayısı ile artacak güvenirlik miktarı önemsiz bir
düzeye gelir. Bunu bir örnekle açıklayacak olursak madde sayısı 4
güvenirliği 10 olan bir teste sürekli soru ekleme durumunda
güvenirlik artış miktarı şöyle olacaktır.
Aşağıdaki şekilde örüldüğü gibi bir
noktadan sonra meydana gelen güvenirlik artışı eklenen soru sayısı
karşısında değmeyecek bir miktardır. Soru sayısı ile güvenirlik
ilişkisi kapsamında ne kadar soru eklenince istenilen güvenirliği
elde edeceğimizi gösteren formül vardır. Bu formül aşağıdaki
gibidir.
rn =
(Denklem 7)
formülde geçen terimlerin açıklamaları
şöyledir.
rs=Soru eklenecek testin
(eldeki testin) güvenirliği
rn=Testin soru eklendikten
sonra beklenen güvenirliği (istenen güvenirlik)
n=Testin kaç kat uzatılacağı
Örnek: Güvenirliği 0.75 olan 10 soruluk bir testin güvenirliğini
.90'a çıkarmak için ne kadar soru ekleyeceğimizi bulmak için formülü
uygularsak (bkz. Örnek çalışmalar) n @ 3 çıkar. Buradan n*k yoluyla;
3*10 = 30 bulunur. Bu durumda test 30 soru olduğunda güvenirliğin
0.90 olacağı anlaşılmaktadır. Yani güvenirliği 0.90’a çıkarmak için
teste 20 soru daha eklemek gerekmektedir.
Tablo 5. Madde sayısı ve Güvenirlik
İlişkisi
Soru
Sayısı |
K |
Güvenirlik |
Artan Güvenirlik Artışı |
4 |
0.10 |
- |
8 |
0.18- |
0.08 |
16 |
0.30 |
0.12 |
32 |
0.46 |
0.16 |
64 |
0.63 |
0.17 |
128 |
0.77 |
0.14 |
256 |
0.89 |
0.12 |
512 |
0.94 |
0.05 |
1024 |
0.97 |
0.03 |
∞ |
1.00 |
0.03 |
Şekil 5. Madde sayısına göre
güvenirlik
2-Soruların açık, anlaşılır ve
cevaplanabilir olması güvenirliği artırır. 3-Öğrencilerin
güdülenmesi güvenirliği artırır.
4-Sınav süresinin yeterli olması
güvenirliği artırır.
5 -Testin orta güçlükte olması (çok kolay
veya çok zor olmaması) güvenirliği artırır.
6-Testin objektif puanlanması güvenirliği
artırır.
7-Ölçme işleminin tüm basamaklarında
gerekli titizlik ve dikkati göstermek güvenirliği artırır.
9-Duyarlığı yüksek araç ve yöntem kullanmak güvenirliği artırır.
10-Ölçme sonuçlarının elde edilen
duyarlıkta kaydedilmesi güvenirliği artırır.
2.3 Ölçmenin Standart Hatası
Ölçmelerin tutarlığı ile güvenirlikten sonraki
ikinci yaklaşım hataların büyüklüğünü belirlemektir. Tek bir gözleme
bakılarak hata konusunda bir şey söylenemez. Aynı kişiye ait birden
fazla ölçme yapılmalıdır. Bu ölçmeler bir dağılım gösterir. Bu
dağılımın ortalaması kişinin gerçek puanının tahminidir. Yani gerçek
puana en yakın puandır. Bu dağılımın standart kayması ölçmenin
standart hatası olarak adlandırılır.
Ancak bireylerle ilgili tekrarlı ölçmeler
yapmak zaman alıcıdır. Bu nedenle çok sayıda kişiye test uygulamak,
bu testten elde edilen puanların standart kaymasını ve güvenirliğini
kullanmak yoluyla bireylerin puanlarına karışan hata (ölçmenin
standart hatası) hesaplanabilir. Bu yolla hesaplanan ölçmenin
standart hatası formülü aşağıdaki gibidir:
(Denklem 8)
Sx=Testin standart sapması
rxx’= Testin güvenirliği
Standart hata grubun değişirliğinden az etkilenir. Güvenirlik
ise grubun değişirliğine bağlıdır. Bu nedenle bazen güvenirlik
yerine kullanılması önerilmiştir. Özellikle testteki puanların ve
puanlar arasındaki farkların güvenirliği ile ilgili yargılar için
çok kullanışlıdır. (Ör: Güvenirliği .64 olan ve standart kayması
5.03 olan testten bir öğrencinin 48 puan aldığını varsayalım. Geçme
notu 50 olsun. Bu durumda öğrenci sınıfını geçmeli midir? Nasıl
karar vereceğiz? Kararı, standart hatayı hesaplayıp öğrencinin
puanına ekleme ve çıkarma yapma yoluyla öğrencinin puan aralığını
bulduktan sonra vermek yararlıdır. Bu test için ölçmenin standart
hatasını hesaplayacak olursak ilgili formülden 3,02 olarak elde
edilir. Bu puanı öğrencinin puanına ekleyip çıkarınca öğrencinin
puanı 44,98 – 51,02 arasında olacaktır. Öğrencinin puanı 50 geçme
notunu kapsadığından geçer not vermek doğru olur.
Güvenirlik İçin Örnek Çalışmalar:
Tablo 6. Test-Tekrar Test Veya Paralel
Test Güvenirliği İçin Veriler
|
||||||
|
1.Uyg.(X) |
2.Uyg.(Y) |
X2 |
Y2 |
XY |
|
1 |
30 |
33 |
900 |
1089 |
990 |
|
2 |
32 |
32 |
1024 |
1024 |
1024 |
|
3 |
33 |
34 |
1089 |
1156 |
1122 |
|
4 |
35 |
36 |
1225 |
1296 |
1260 |
|
5 |
37 |
37 |
1369 |
1369 |
1369 |
|
6 |
38 |
42 |
1444 |
1764 |
1596 |
|
7 |
40 |
39 |
1600 |
1521 |
1560 |
|
8 |
39 |
44 |
1521 |
1936 |
1716 |
|
9 |
44 |
41 |
1936 |
1681 |
1804 |
|
10 |
34 |
36 |
1156 |
1296 |
1224 |
|
Toplam |
362 |
374 |
13264 |
14132 |
13665 |
|
T2 |
131044 |
139876 |
|
|
|
|
TX*TY |
135388 |
|
|
|
|
|
r= |
0,83 |
Testim güvenirliği |
||||
kkök r |
0,91 |
Maksimum geçerlik değeri |
Bu sonuçlara göre 10 soruluk testimizin orta
güvenirlikte olduğu söylenebilir.
Diğer güvenirlik hesapları da ilgili tekniğin
gerekli işlemleri yerine getirilerek korelasyon formülünden
faydalanılarak yapılmıştır.
Aşağıda 10 soruya 10 kişinin
verdiği cevaplara dayanarak elde edilen madde puanları matrisi
görülmektedir. Bu matrisi kullanarak güvenirlik tekniklerinden uygun
olanlar için güvenirlik değerleri ve bir ölçüte göre maksimum
geçerlikleri hesaplanmıştır. Benzer örnekler üzerinde çalışılabilir.
Tablo 7 Yarıya bölme, KR-20 ve KR-21
Güvenirlik Analizleri için 10 Maddeye İlişkin Veriler
|
|
|
|||||||||
Kişiler |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Puan |
A |
0 |
1 |
1 |
0 |
1 |
1 |
0 |
0 |
0 |
1 |
5 |
B |
1 |
1 |
1 |
0 |
1 |
1 |
0 |
1 |
1 |
0 |
7 |
C |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
0 |
0 |
8 |
D |
1 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
4 |
E |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
0 |
1 |
9 |
F |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
3 |
G |
0 |
1 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
0 |
4 |
H |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
10 |
I |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
1 |
1 |
3 |
J |
0 |
1 |
1 |
1 |
1 |
0 |
0 |
1 |
1 |
0 |
6 |
DS |
5 |
9 |
9 |
4 |
7 |
6 |
3 |
6 |
5 |
5 |
59 |
p |
0,50 |
0,90 |
0,90 |
0,40 |
0,70 |
0,60 |
0,30 |
0,60 |
0,50 |
0,50 |
|
q |
0,50 |
0,10 |
0,10 |
0,60 |
0,30 |
0,40 |
0,70 |
0,40 |
0,50 |
0,50 |
|
p*q |
0,25 |
0,09 |
0,09 |
0,24 |
0,21 |
0,24 |
0,21 |
0,24 |
0,25 |
0,25 |
2,07 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Testin tümü için |
Ort |
S2
|
S |
||
|
|
|
|
|
5,90 |
6,32 |
2,51 |
||||
TEK SORULAR |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
3 |
5 |
7 |
9 |
Puan |
|
|
|
|
|
A |
0 |
1 |
1 |
0 |
0 |
2 |
|
|
|
|
|
B |
1 |
1 |
1 |
0 |
1 |
4 |
|
|
|
|
|
C |
1 |
1 |
1 |
1 |
0 |
4 |
|
|
|
|
|
D |
1 |
1 |
0 |
0 |
0 |
2 |
|
|
|
|
|
E |
1 |
1 |
1 |
1 |
0 |
4 |
|
|
|
|
|
F |
0 |
1 |
0 |
0 |
1 |
2 |
|
|
|
|
|
G |
0 |
1 |
0 |
0 |
0 |
1 |
|
|
|
|
|
H |
1 |
1 |
1 |
1 |
1 |
5 |
|
|
|
|
|
I |
0 |
0 |
1 |
0 |
1 |
2 |
|
|
|
|
|
J |
0 |
1 |
1 |
0 |
1 |
3 |
T2 |
|
S2 |
|
|
Toplam |
5 |
9 |
7 |
3 |
5 |
29 |
841 |
|
1,66 |
|
|
ÇİFT SORULAR |
|
|
|
|
|
|
|
|
|
||
|
2 |
4 |
6 |
8 |
10 |
Puan |
|
|
|
|
|
A |
1 |
0 |
1 |
0 |
1 |
3 |
|
|
|
|
|
B |
1 |
0 |
1 |
1 |
0 |
3 |
|
|
|
|
|
C |
1 |
1 |
1 |
1 |
0 |
4 |
|
|
|
|
|
D |
1 |
0 |
0 |
0 |
1 |
2 |
|
|
|
|
|
E |
1 |
1 |
1 |
1 |
1 |
5 |
|
|
|
|
|
F |
1 |
0 |
0 |
0 |
0 |
1 |
|
|
|
|
|
G |
1 |
0 |
1 |
1 |
0 |
3 |
|
|
|
|
|
H |
1 |
1 |
1 |
1 |
1 |
5 |
|
|
|
|
|
I |
0 |
0 |
0 |
0 |
1 |
1 |
|
|
|
|
|
J |
1 |
1 |
0 |
1 |
0 |
3 |
T2 |
TX*TY |
S2 |
|
|
Toplam |
9 |
4 |
6 |
6 |
5 |
30 |
900 |
900 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
KORELASYON |
|
|
|
|
|
|
|
|
|
|
|
|
X 2 |
Y2 |
X*Y |
|
|
|
|
|
|
|
|
1 |
4 |
9 |
6 |
|
|
|
|
|
|
|
|
2 |
16 |
9 |
12 |
|
|
|
|
|
|
|
|
3 |
16 |
16 |
16 |
|
|
|
|
|
|
|
|
4 |
4 |
4 |
4 |
|
|
|
|
|
|
|
|
5 |
16 |
25 |
20 |
|
|
|
|
|
|
|
|
6 |
4 |
1 |
2 |
|
|
|
|
|
|
|
|
7 |
1 |
9 |
3 |
|
|
|
|
|
|
|
|
8 |
25 |
25 |
25 |
|
|
|
|
|
|
|
|
9 |
4 |
1 |
2 |
|
|
|
|
|
|||
10 |
9 |
9 |
9 |
|
|
|
|
|
|||
Toplam |
99 |
108 |
99 |
|
|
|
|
|
r= |
0,79 |
SBr= |
0,88 |
Kkök r |
0,94 |
|
|
KR-20 |
0,75 |
kkök r |
0,86 |
|
|
KR-21 |
0,69 |
kkök r |
0,83 |
Sadece yarılardan birinin güvenirliği, iki yarı
arasındaki korelasyon
Testin tümü için güvenirlik, Spearman-Brown
düzeltme formülü sonucu.
Testin alabileceği Maksimum ölçüt geçerlik
değeridir.
Madde güçlükleri ve sayısı dikkate alınarak
hesaplanan iç tutarlık değeridir.
Testin alabileceği Maksimum ölçüt geçerlik
değeridir.
Madde güçlükleri eşit varsayılarak hesaplanan
iç tutarlık değeridir.
Testin alabileceği Maksimum ölçüt geçerlik
değeridir.
Yukarıda 0,75 bulunan KR-20 güvenirliğini
0,90’a çıkarmak için teste kaç madde eklememiz gerektiğini aşağıdaki
gibi bir işlem süreciyle bulabiliriz.
rn =
ve 3x10=30 olacaktır. 10 maddelik
testimize 30 soru daha ekleyip 40 soruya çıkarırsak güvenirliğini de
0,90 değerine çıkarabiliriz.
1-0 puanlamadan farklı durumlarda kullanılan iç
tutarlık katsayısı Cronbach Alfa güvenirliği için aşağıdaki örnek
verilmiştir. Görüldüğü gibi 8 soruluk testin güvenirliği yetersiz
bulunmuştur.
Tablo 8. Cronbach Alfa Güvenirlik Analizi
için 8 Maddeye ait Veriler
|
|
|
|
|
|
|
|
|
|
|
M1 |
M2 |
M3 |
M4 |
M5 |
M6 |
M7 |
M8 |
Puan |
K8 |
4 |
4 |
5 |
5 |
5 |
4 |
5 |
4 |
36 |
K1 |
4 |
3 |
5 |
2 |
4 |
5 |
3 |
5 |
31 |
K4 |
2 |
4 |
4 |
3 |
5 |
3 |
5 |
5 |
31 |
K6 |
5 |
3 |
2 |
2 |
4 |
3 |
5 |
5 |
29 |
K7 |
3 |
3 |
4 |
2 |
5 |
4 |
3 |
3 |
27 |
K2 |
5 |
3 |
4 |
2 |
1 |
3 |
4 |
4 |
26 |
K3 |
3 |
1 |
2 |
3 |
4 |
3 |
2 |
5 |
23 |
K5 |
1 |
3 |
3 |
4 |
3 |
2 |
2 |
2 |
20 |
S2 |
1,98 |
0,86 |
1,41 |
1,27 |
1,84 |
0,84 |
1,70 |
1,27 |
223 |
|
|
|
|
Madde varyansları
toplamı |
11,16 |
|
|||
Alfg |
0,64 |
Cronbach alfa güvenirliği |
Tüm test için |
|
|
||||
kkök |
0,80 |
Maksimum ölçüt geçerliği |
Ort |
S2 |
s |
|
|||
|
|
|
|
|
|
27,88 |
25,27 |
5,03 |
|
2.4 Geçerlik
Bir ölçme aracının sadece o araçla
ölçülmek istenen değişkeni ölçme, başka değişkenlerle karıştırmama
veya amaca hizmet etme derecesidir. Testin sahip olması gereken en
önemli niteliktir. Buna göre geçerlik, genel anlamda, bir ölçme
aracının ya da ölçme yönteminin ölçmeyi amaçladığı özelliği, başka
herhangi bir özellikle karıştırmadan, doğru
olarak ölçebilme derecesi olarak tanımlanabilir.
Başka bir tanım ise geçerliği, maddenin/testin bilenle bilmeyeni
veya bir davranışa sahip olanla olmayanı ayırma derecesi olarak
ifade eder. Bu tanım eğitimde kullanılan araçların geçerliğini
belirlemede, madde analizlerinde çok kullanılır. Bu terim, testlerin
sağladığı sonuçların kullanılma amaçlan için geçerli olup
olmadığını, geçerli oluş derecesini ve gerçekliğini belirtmektedir.
Bir ölçme aracının geçerliği yüksek ise
güvenirliği de yüksektir. Bunun tersi doğru değildir. Güvenirliği
yüksek olan testin geçerliği düşük olabilir.
Geçerlikte iki önemli soru vardır.
l)Ölçme aracı hangi amaç ya da amaçlar için kullanılabilir. 2)Ölçme
aracı bu amaç veya amaçlara ne derece de hizmet edebilir, uygundur?
Bir testin geçerliği bir derece
sorunudur. Ya hep ya hiç sorunu değil. Hatalardan tamamen kurtulmak
mümkün değil ancak minimum yapmaya çalışmak gerekir.
Geçerliği birden fazla yolla tanımlamak mümkündür. Tek bir
tanım vermek yerine kullanış amacına uygun olduğuna ilişkin kanıtlar
bulmak daha doğrudur. Çok bilinen geçerlik türleri kısaca şöyle
özetlenebilir.
1-Kapsam Geçerliği:
Ölçülmek istenen kapsamla geçerliği araştırılan testin ölçtüğü
kapsamın örtüşme derecesidir. Bir ölçme aracının ölçülmek istenen
davranışları (özellikleri) ne derece kapsadığının belirlenmesidir.
Kapsam geçerliğinin belirlenmesi için ölçme konusu olan özelliklerin
ya da davranışların önceden belirlenmesi gerekir.
Eğitimde hedefler geneldir,
gözlenemezler. Oysa ölçülecek nitelik ya da davranış doğrudan ya da
dolayı olarak gözlenebilmelidir. Bu nedenle hedefler verine
davranışlar ölçme konusu yapılır.
Ör: Hedef 1; "Ölçmeyle ilgili belli başlı
kavramların bilgisi." Geneldir. Gözlenemez.
Davranış 1; Güvenirlik kavramının
tanımını yazma, söyleme veya verilen seçenekler arasından
işaretleme. Özeldir. Gözlenebilir.
Kapsam Geçerliğini Belirleme Yolları
İki temel yol olduğu söylenebilir.
Birincisi akli (rasyonel), ikincisi istatistikî yoldur.
1-a- Belirtke Tablosu Hazırlamak.
Belirtke tablosu, sütun başlarında hedefler, satır başlarında
konular ve hücrelerde hedefler ve konularla ilgili davranışların
numara ya da sayılarla gösterildiği tablodur. Yani davranışların
konu ve hedeflere göre dağılımını gösteren çizelgelerdir.
Tablo 9. Örnek Belirtke Tablou Tablosu. |
|||||||
Konular |
Bilgi |
Kavrama |
Uygulama |
Analiz |
Sentez |
Değerlendirme |
Toplam (%) |
1.Ölçmenin Temel Kavramları |
4 |
3 |
2 |
2 |
1 |
4 |
16 (%33) |
2. Ölçme Aracının Nitelikleri |
3 |
5 |
8 |
3 |
2 |
3 |
24 (%50) |
3.Yazılı Yoklamalar |
- |
3 |
1 |
2 |
1 |
1 |
8 (%17) |
Toplam (%) |
7 (%15) |
11 (%23) |
11 (%23) |
7 (%15) |
4 (%7) |
8 (% 17) |
48 (% 100) |
Örnek belirtke tablosunda (Tablo
9)görüldüğü gibi davranışların konu ve hedeflere göre dağılımı
belirlenir. Sınav sorularının bu dağılımı ne derece yansıttığı
incelenir. Bu inceleme sonucunda kapsam geçerliği olup olmadığına
karar verilir. Eğer sorular bu dağılıma uygun olarak ölçme
yapıyorsa, yani davranışları konu ve hedef ağırlıklarını da göz
önünde bulundurmak koşuluyla yeterince kapsıyorsa kapsam
geçerliğinden söz edilir.
1-b-Uzman kanısına başvurma:
Sorular uzmanlara gösterilerek ilgili davranışları ne derecede
ölçtüğünü belirlemeleri istenir. Bu amaçla "evet, hayır"lı,
davranışlarla "ilgili, ilgisiz" veya davranışları "ölçüyor,
ölçmüyor" gibi cevapların verilebileceği ölçekler kullanıldığı gibi
soruların davranışları ölçme düzeyini gösteren 3 ya da 5'li likert
tipi ölçekler de kullanılabilir. Elde edilen sonuçlar yüzde-frekans
veya korelasyon katsayısı hesap edilerek değerlendirilebilir. Bu
tekniğe Bir uzmanın soruları belirtke tablosuyla
karşılaştırma tekniği de denebilir. Bu teknik
belirtke tablosu hazırlamanın devamı olan bir tekniktir. Bu tekniğin
yukarıdaki teknikten tek farkı hazırlanan belirtke tablosunu
hazırlayan kişinin değil bağımsız bir uzmanın incelemesidir.
2-Tekrarlı Teşt Geliştirme: İki
farklı uzman grubunun aynı kapsamı ölçen iki test geliştirmesi ve
bunları öğrencilere uygulama sonucu elde edilen puanlar arasındaki
korelâsyonun hesaplanmasıdır.
Özet olarak kapsam geçerliğini, sağlamak
için uzman kişiye danışma, belirtke tablosunu dikkate alma ve
konu hedef ağırlığına bakmak gerekir. Kapsam geçerliği için
kullanacağımız testin nitelikleri kullanma amaç ve durumlarıyla
mümkün olduğunca eşlenmelidir. Kapsam geçerliği alan uzmanlarının
testle ilgili görüşleri olarak kabul edilebilir.
Örnek: Dört işlemle ilgili bir test
hazırlayalım. Testin amacı öğrencilerin dört işlemle ilgili
becerilerini ölçmektir. Ancak testi hazırlarken çıkarma işlemiyle
ilgili sorular yazmazsak kapsam geçerliği düşecektir. Çıkarma
işleminin yanı sıra bölme işlemi ile ilgili soruları da yazmayı
ihmal edersek kapsam geçerliği daha da düşecektir. Aynı örneği şu
şekilde de inceleyebiliriz. Dört işlem becerisi ile ilgili
davranışların ağırlıkları (çarpma, bölme, çıkarma ve toplama
işlemlerinin ağırlıkları) farklı olsun. Bu konuların ağırlığını
belirlemede, çözülen örnek sayısı, harcanan ders saati kitapta
ayrılan sayfa sayısı ve esas olarak belirtke tablosundaki
davranışların sayısı olacaktır. Kullanılacak testte bu ağırlıkla
dengeli olacak şekilde soru yoksa kapsam geçerliği düşük olur.
Durum1
Durum 2
Durum 3
|
|
|
Örnek: Aşağıdaki şekillerin hangisinde
testin kapsamıyla kullanıcının kapsamı en iyi şekilde eşleşmiştir?
(A: Ölçülecek davranışları; B: test kapsamı)
Şekil 6. Kapsam geçerliğiyle ilgili bazı
muhtemel görünümler
Durum 1’de testin kapsamıyla kullanıcı
kapsamı az bir alanda çakışmaktadır. Dairelerin kesiştiği alan çok
dar olduğundan testi kullanmak çok anlamlı olmaz. Bu test ölçülecek
nitelik yada davranışlara ilişkin çok az-bilgi sağlar.
Durum 3'de terstin, kapsamı kullanıcı
kapsamı içinde yer almaktaysa da iyi bir ölçüm olmayacağı bellidir.
Test kullanıcının ölçmeyi amaçladığı özellik ya da davranışları
ölçmede sınırlı kalmaktadır. Boşluk ancak başka testler kullanılarak
doldurulur. Çoğunlukla birden fazla test kullanılmasının önerilmesi,
tek bir testin istenen kapsamı ölçmede sınırlı olmasındandır.
Durum 2'de kullanıcının kapsamı ile
testin kapsamı tam olarak eşleşmiyorsa da testin kapsamı
uygulayıcının kapsamım diğerlerine göre daha çok karşılamaktadır.
Burada tekrar vurgulanabilir ki, kapsam
geçerliği, bir bütün olarak testin ve testteki her bir maddenin
maksada ne derece hizmet ettiğidir. Birincisi, testteki tüm
maddelerin ölçülecek konuyu (içeriği) ve davranışları ne derece
temsil ettiği; ikincisi, testteki her bir maddenin ölçülecek
davranışı ne derece ölçtüğüne bağlıdır. İstenmeyen değişkenlerin
ölçülmesi de kapsam geçerliğini düşürür. Örneğin, "beşle altının
çarpımının ikiye bölünmesinden iki çıkarılmasıyla elde edilen sayı
kaçtır?" ifadesine sözel yetenek karşır. Matematik becerisi ölçeme
amaçlanırken başka bir niteliği ölçtüğümüz için kapsam geçerliği
düşmüş olur. Yani kapsamda sözel yetenek becerisi ve bizim böyle bir
değişkeni ölçme amacımız olmadığı halde bu değişken ölçmeye
karışarak hem amacımızdan uzaklaşmamızı hem de kapsam geçerliğinin
düşmesine neden olur.
2-Ölçüte Dayalı Geçerlik (Ölçüt
Geçerliği): Test puanlarıyla ölçüt yada
ölçütler arasındaki korelasyon katsayısıdır. Ölçütler genelde "dış
ölçüt”tür. Elde ettiğimiz geçerlik ise bir ölçüte göre
geçerliktir. Geçerlik katsayısı ölçüt alınan puanlara göre
değişecektir. Bu nedenle öncelikle doğru ölçüt bulmak gerekir. Yani
geçerliği araştırılan konuyla ilgili bir ölçüt olmalıdır. Aynı
zamanda ölçütün geçerliği ve güvenirliği yüksek olmalıdır. Ölçüt
geçerliği ölçütün elde edildiği zamana göre ikiye ayrılarak
incelenir.
a-Yordama Geçerliği:
Ölçüt puanların yordayıcı (geçerliği araştırılan) puanlardan sonra
elde edilmesi durumundaki geçerliktir, Bu geçerlik türünde yordayıcı
puanları daha sonraki bir performansı yordamak (kestirmek-tahmin
etmek) amacıyla kullanılır. Eğer iyi yorduyorsa (yani yordayıcı ve
ölçüt puanlar arasındaki ilişki yüksekse) yordama geçerliğinden söz
edilir. Yordama bir tahmindir. Ancak her tahmin bir yordama
değildir. Bir tahminin yordama olabilmesi için geleceğe dönük olması
belli bilgiler temelinde bazı teknikler kullanılarak yapılması
gerekir. Yordama işinde (geçerliğinde) kullanılan istatistiksel
teknik regresyondur.
Yordama geçerliğinde en önemli sorun
uygun bir ölçüt, bulmaktır. İyi bir ölçüt şu özelliklere sahip
olmalıdır. 1-Ölçüt öncelikle yordanmaya çalışılan değişkenle
ilişkili olmalıdır. (Örneğin müzik yeteneğini ölçen bir araçla
kişinin okuduğunu anlama yeteneğini yordayamazsınız.) 2-Ölçüt
güvenilir olmalıdır. Ölçüte ilişkin puanlar ne kadar çok hata
içerirse yordama geçerliği o derecede düşük olacaktır. 3-Ölçüt
geçerli olmalıdır. Zaten geçerlik çalışması bir aracın amaca
uygunluk derecesini ortaya koyma çalışmasıdır. Bu nedenle amaca
uygunluğu kanıtlanmamış ya da amaca uygun olmadığı bilinen bir
ölçütle bu çalışma başarısız olur. 4-Kolay ve pratik olmalıdır. Elde
edilmesi ve uygulanması kolay ve pratik olmalıdır.
b)Uyum (Uygunluk) Geçerliği:
Ölçüt puanların yordayıcı puanlarla aynı zamanda veya daha önce elde
edilmesi durumunda, ölçüt ile yordayıcı arasındaki korelasyon
katsayısına uyum geçerliği adı verilir. Uyum geçerliğine hâlihazır
geçerlik, mevcut durum geçerliği, eş-zaman geçerliği ve uygunluk
geçerliği de denilmektedir. Yordama geçerliğinden farkı; testin
ölçülmek istenen davranış veya özellikleri hangi düzeyde
ölçebileceğini belirlemektir. Yordamada ise kestirme vardır.
Özellikle testin amacı tanı koymak ise uyum (eş-zaman) geçerliğine
başvurmak yararlıdır. Örneğin üniversite sınavı ile üniversite
başarısı; işe giriş sınavı ile iş performansı arasındaki korelasyon
katsayıları yordama geçerliği olurken; üniversite giriş sınavı ile
ortaöğretim başarı puanı (ölçüt olarak) veya matematik dersi
başarısı ile aynı zamanda elde edilen matematik yeteneği testi
puanları arasındaki korelasyon katsayıları uyum geçerliği olur.
Bir testin bir ölçüte göre geçerliği bu
testin güvenirliğinin karekökünden büyük olamaz.
Ölçüt geçerliğini yordayıcı ve ölçütün
güvenirlikleri, yordayıcı ve ölçütün birbirine etkisi
(bağımlı-bağımsız olması), grubun homojenliği ve puanların ranjı
(genişliği) etkiler.
3-Yapı Geçerliği:
Bireylerde var olduğu kabul edilen özelliklere psikolojide yapı
denir. "Zeka, tutum, ilgi, kaygı, depresyon, atılganlık,
içedönüklük, dışa dönüklük, güvensizlik vb." gibi kişilik
özellikleri psikolojik yapıya örnek olarak verilebilir. Yapı,
birbiriyle ilişkili olan öğeler ya da öğelerin oluşturduğu
örüntü olarak tanımlanır. Bu yapılar hipotetiktir (teoriktir,
kuramsaldır). Yani var oldukları kabul edilir. Doğrudan
ispatlanamaz. Ancak gözlemlerle varlıkları hissedilir. Örneğin
günlük dilde "zeki adam" dediğimizde bunu ispatlayanlayız. Yani
zekânın varlığını ispatlamaya kalkmayız. O kişinin bizim kabul
ettiğimiz bir yapıyla ilgili davranışları gösterdiğini düşünürüz.
Yapı geçerliği bir araçla ölçülmek
istenen yapının o araçla ortaya konulma derecesi olarak
tanımlanabilir.
Yapı geçerliği, yapının tanımlanmasındaki
doğruluğa, yapıdan çıkarsanan gözlenebilir davranışların yapıyla
ilgili olmasına, davranışların yapının tamamını (kapsamını) temsil
etmesine, gözlenebilir davranışları ölçmek için yazılan maddelerin
(soruların) onları ölçebilme derecesine bağlıdır.
4-Görünüş Geçerliği:
Bir testin ne ölçtüğü ile ilgili değil ne ölçüyor göründüğü ile
ilgilidir. Testin ölçülmek istenen değişkeni ölçüyor görünmesidir.
Bu çalışma testin tamamı için "olduğu kadar maddeler için de
yapılır. Yani maddelerde ölçülmek istenen davranışı ölçüyor
görünmelidir. Örneğin "14/4 işlemi sonucunda kalan kaç olur." ile
"On dört'ü dörde böldüğümüzde kalan kaç çıkar." Soruları matematik
davranışını aynı geçerlik düzeyinde ölçüyor görünmemektedir.
Birincisi daha iyi bir matematik sorusu gibi görünmektedir.
Geçerliği Artırmanın Yollan
1-Her ölçme aracının geçerliği o araçtaki
maddelerin teker teker geçerliğine bağlıdır. Her soru araçla
ölçülmek istenen davranışların en az birini ölçmek zorundadır.
2-Aracın kapsamı geçerliği etkiler. Hem
çok dar hem de çok geniş bir kapsam geçerliği
düşürür.
.
3-Test güvenirliğini artıran tüm etmenler
geçerliği artırır.
4-Cevaplamaya verilen süre
(cevaplanamayan soruların kapsamı daraltmasından dolayı) geçerliği
etkiler.
5-Puanlama yanlılıkları geçerliğin
etkiler.
6-Ölçüt puanların geçerlik ve
güvenilirlikleri geçerliği etkiler.
7-Ölçme aracının güçlüğü ve grubun
yetenek düzeyi geçerliği etkiler. Örneğin okul birincisi, ikincisi
seçilecekse zor bir sınav yapılabilir. Kolay bir sınav yapılırsa
araç amaca hizmet etmeyeceğinden geçerlik düşük olacaktır.
8-Soruların yıllarca değiştirilmeden
kullanılması geçerliği düşürür.
9-Soruların sınavdan önce açıklanması
geçerliği düşürür.
10-Kopya çekilmesi geçerliği düşürür.
11-Testin kullanım sayısı geçerliği
etkiler. Her kullanımın geçerliği bir miktar düşürdüğü söylenebilir.
12-Testin kullanış amacı ve uygulama
gurubu geçerliği etkiler.
Güvenirlik Ve Geçerlik Arasındaki
Temel İlişkiler
1-Test aracının en önemli özelliği
geçerli olmasıdır.
2-Bir ölçme aracının geçerliği yüksek ise
güvenirliği de yüksektir. Tersi doğru değildir.
3-Güvenirliği yüksek bir testin geçerliği
düşük olabilir.
4-Güvenirlik geçerlik için önkoşuldur
ancak yeterli koşul değildir.
5-Bir arcın ölçüt geçerliği o aracın
güvenirliğinin karekökünden büyük olamaz.
; (Denklem 10)
Formülde max. rxy geçerliği, rxx,
güvenirliği göstermektedir..
2.5 Kullanışlılık
Araçların hazırlanış, uygulanış ve
puanlanış bakımından ekonomik ve kolay olması aynı zamanda
sınırlılıklarının az olması anlamına gelmektedir. Şu alt başlıklar
altında incelenebilir:
1-Ekonomiklik: Araç, öğretmen, yönetim,
öğrenci vb. için ekonomik olmalıdır.
2-Hazırlama süresinin azlığı: Aracı
geliştirmenin ne kadar zaman aldığı ile ilgilidir. Diğer koşullar
eşit olduğunda en kısa zamanda hazırlanan testler tercih
edilmelidir.
3-Uygulama süresinin azlığı: Aracın
kullanışlılığı, verdiği puanın önemine oranla uygulama gerektirdiği
zaman azaldıkça artar.
4-Hazırlayıcı ve uygulayıcının
niteliklerine bağlı olarak sınırlı olması: Araçların hazırlanması ve
uygulanması özel beceriler gerektiriyorsa kullanışlılığı azalır.
5-Cevaplayıcının niteliklerine bağlılık:
Cevaplayıcıların niteliklerine uygun araçlar kullanışlıdır.
6-Uygulama kolaylıklarına bağlılık: Sayfa
düzeni, baskı kalitesi vb. özellikler uygulamayı kolaylaştırır.
Araçları kullanışlı yapar.
7-Puanlama kolaylığına bağlılık: Objektif
olarak ve çabuk puanlanan araçlar kullanışlıdır.
8-Yorumlama kolaylığına bağlılık: Elde
edilen puanlar anlamlı biçimde yorumlanamaz ise değerlendirme ve
karar verme de kullanılamaz. Araç yorumlamaya yardımcı, yorumlamayı
kolaylaştırıcı ve yorumda hatayı azaltıcı ise kullanışlıdır.
Bölüm Testi
1. Aşağıdakilerden hangisi bir testin
geçerliğinin artmasını sağlayamaz?
A)
Soruların öğrenci düzeyinin altında olması*
B) Öğrencilerin sınavdan önce güdülenmesi
C) Soruların açık ve anlaşılır olarak yazılması
D) Sınav ortamının rahatsız edici uyarıcılardan
arıtılması
E) Soruları puanlarken dikkatli davranılması
2. Aşağıdakilerin hangisi bir testin
kullanışlılığını kesinlikle düşürür?
A)
Soruların yazılmasının fazla zaman almaması
B)
Sınavı uygulama maliyetinin az olması
C)
Soruları puanlamanın uzun zaman alması*
D)
Fazla soru yazma gereğinin olmaması
E)
Sınav kâğıdını çoğaltmanın kısa zaman alması
3. Derste görülen üç konunun ikisinden soru
yazılmadığı durumda hangi geçerlik türü düşer?
A)
Yordama
B) Uygunluk C) Yapı
D) Kapsam* E) Görünüş
4. Bir testten elde edilen puanlara
tesadüfi hataların karışmaması veya az karışması testin hangi
özelliği ile ilgilidir?
A)
Güvenirlik*
B)
Geçerlik
C)
uyumluluk
D)
kullanışlılık
E)
nesnellik
5. Aşağıdakilerden hangisi güvenirlik kavramını
açıklamada kullanılamaz?
A)
Ölçme sonuçlarına karışan hataların azlığı
B)
Farklı uygulama puanlarının birbirini tutması
C)
Maddeler arası ilişkilerin yüksek olması
D)
Aracın her uygulamada kararlı sonuçlar vermesi
E)
Aracın ölçülmek istenen değişkeni ölçebilmesi*
6. Aşağıdakilerden hangisi bir testin
güvenirliğini artırmaz?
A)
Sorularda bilimsel ve dilsel hata olmaması
B)
Puanlamanın yansız olarak yapılması
C)
Soru sayısının belli bir oranda artırılması
D)
Verilen puanların dikkatli kaydedilmesi
E)
Oldukça fazla sınav süresi vermek*
7. Bir testin ölçtüğü kapsamdan yeni sorular
yazarak soru sayısını artırmak öncelikle testin hangi
özelliğini etkiler?
A)
Güvenirlik* B) Geçerlik
C) Objektiflik D) Kullanışlılık
E) Genellenebilirlik
8. I- Hazırlama
süresinin kısalığı
II-
Maliyetinin düşük olması
III- Kolaylıkla uygulanabilir olması
IV-Puanlamanın az zaman alması
Yukarıda verilen açıklamalar bir ölçme aracının
hangi özelliğiyle ilişkilidir?
A)
Kullanışlılık* B) Geçerlik
C) Kolaylık D)
Güvenirlik E) Kapsamlılık
9. Aşağıdakilerden hangisi kapsam
geçerliğinin en iyi açıklar?
A) Testin yordama gücünün yüksekliği
B) Testin kolay uygulanabilirliği
C) Maddelerin açık anlaşılır yazılması
D) Soruların konulara dengeli dağılması*
E) Testin yansız puanlanabilmesi
10.
I-Sabit
II-Sistematik III-Tesadüfî
Yukarıdaki hata türlerinden hangileri
kontrol altında tutulamaz?
A) I –
B) II
C) III*
D) I – III
E) II – III
11. Aşağıdakilerden hangisi ölçme araçlarının
güvenirliği ile doğrudan ilgili değildir?
A)
Aracın duyarlığının yüksekliği
B)
Her konudan sorular sorulması*
C)
Soruların dikkatli puanlanması
D)
Puanların dikkatli kaydedilmesi
E)
Yansız puanlama yapılması
12. Aşağıdakilerden hangisinin olması durumunda
ölçme araçlarının geçerliği düşer?
A)
Soruların konuları yeterince örneklemesi.
B)
Ölçme sonuçlarına karışan hataların azalması
C)
Öğrencilerin doğru cevapları birbiriden alması*
D)
Sınav kağıtlarının iki kez puanlanması
E)
Cevaplamayla ilgili bir yönergenin verilmesi
13. Bir okuldaki matematik öğretmenleri iki
gruba ayrılarak aynı davranışları ölçen iki test geliştirmişler ve
bu iki testi bir hafta arayla aynı öğrencilere uygulamışlardır.
Uygulama sonucunda iki uygulamadan elde edilen puanlar arasındaki
korelasyon 0,91 bulunmuştur. Bu korelasyon katsayısı aşağıdakilerden
hangisinin yorumlamada kullanılabilir?
A)
Testlerin objektif puanlanabildiğini
B)
İki testinde geçerliğini
C)
Test puanlarına karışan hata miktarını
D)
Testlerden hangisinin daha zor olduğunu
E)
Testlerin ne kadar güvenilir olduğunu*
14. Aşağıdakilerden hangisi öncelikle bir
testin güvenirliğini artırır?
A) Soruların öğrencileri birbirinden
ayırması
B)
Aracın gelecekteki başarıyı yordayabilmesi
C)
Amaçlanan değişkenin ölçülmesi
D)
Konularla dengeli sayıda soru yazılması
E)
Puanlamanın bir anahtarla yapılması*
15. Geçerliği en çok etkileyen hata türü
hangisidir?
A)
Tesadüfî
B) Sabit
C) Sistematik*
D) Standart E) Yanlı
|
IIII – EĞİTİM ÖĞRETİM SÜRECİNDE
KULLANILAN ÖLÇME ARAÇLARI
3.1 Test Planı (Test Geliştirme)
Bir sınavın amacını belirleme adımından
not verme adımına kadar olan süreci kapsayan işlemleri içerir.
Aşamalar şunlardır.
1-Testin amacını belirlemek:
Testle hangi değişkenlerin/özelliklerin ölçüleceği (örneğin
matematik yeteneği, matematik başarısı, matematiğe karşı tutum gibi)
sonuçların hangi değerlendirme türü için kullanılacağı
(öğrenme eksikleri, hazırbulunuşluk düzeyi vb.) ve sonuçlar üzerinde
hangi işlemlerin yapılacağını belirleme işlemlerini kapsar.
2-Ölçülecek nitelikleri saptamak:
Bu adımda ölçme işleminin hangi düzeyde ve hangi konulardaki
özelliklerin ölçüleceğini belirlemek söz konusudur. Bu adıma
ölçülecek kapsamı ve bu kapsamdaki davranışları belirlemek söz
konusudur diyebiliriz. Örneğin matematik başarısını ölçeceksek
kaçıncı sınıf ve hangi konular olduğuna karar vermek ve hatta bu
konularda hangi kazanımların yoklanacağı belirlenmelidir. Bu kararda
testin amacı etkili olacaktır.
3-Soruları Yazmak:
Belirlenen davranışlara uygun, belirtke tablosunda bulunan
davranışlar için sorular yazılır ve soruların sayısı konu ağırlığına
bağlı olarak ayarlanır. Bu aşamada bir anlamda kullanılacak test
türüne (yazılı, sözlü, seçmeli gibi) ve soru tipine de karar
verilmiş olur.
4-Soruları gözden geçirmek / düzeltmek:
Sorular yazıldıktan sonra, bilimsel bilgilere uygunluk, dil
hataları, anlaşılırlık ve ölçülmek istenen davranışı yoklama
yönlerinden incelenerek deneme uygulaması yapılmadan önce gerekli
düzeltmeler yapılır.
5-Deneme formunu hazırlamak:
Sorular düzenlendikten sonra test uygulama formu haline getirilir.
Bu forma deneme formu adı verilir. Deneme formu test hazırlama
kurallarına uygun olarak oluşturulmalıdır. Deneme formu uygulaması
için genellikle esas ölçme yapılacak gruba benzeyen veya heterojen
bir grup seçilir.
6-Deneme uygulamasını yapmak:
Testin ve test maddelerinin sayısal özelliklerini belirlemek
amacıyla yapılır. İşleyen ve işlemeyen maddeleri belirlemeye
çalışılır.
7-Puanlama yapmak:
Deneme uygulaması yapıldıktan sonra cevaplayıcıların cevapları için
puanlama yapılır. Puanlama 1-0 veya sorular için uygun görülen bir
şekilde yapılabilir.
8-Test ve madde istatistiklerini
hesaplamak: Puanlama yapıldıktan sonra cevaplayıcı
sayısı ve testin amacına uygun tekniklerle test ve madde
istatistikleri hesaplanır.
9-Madde seçmek: Elde
edilen test ve madde istatistiklerine bağlı olarak hangi maddelerin
seçileceğine, hangi maddelerde ne tür düzeltmeler yapılacağına,
nihai testin hangi maddelerden oluşturulacağına karar verilir.
10-Nihai (esas) testi oluşturmak:
Deneme uygulaması sonucunda seçilen maddelerin istatistiksel
özellikleri nihai testin sayısal özellikleri hakkında bilgi verici
olabilir. Bu bilgilere göre nihai test amaca hizmet edecek nitelikte
ise seçilen maddelerle nihai test formunu test formu oluşturma
özelliklerine uygun olarak oluşturmak mümkündür.
11-Uygulama: Nihai
test oluşturulduktan sonra asıl gruba bu testi uygulama aşamasına
geçilebilir. Bu aşamada da madde ve test istatistiklerini belirleme,
önceden kestirilen özelliklere ne ölçüde uyduğunu belirlemek söz
konusu olabilir.
Eğitimde yapılan süreçlerin birçoğunda
öğrenciler hakkında bilgi toplama amacı vardır. Bu amaçla çeşitli
yollardan ve araçlardan faydalanılabilir. Ölçme araçları yardımıyla
öğrenciler üzerinde yapılan ölçme işlemleri aşağıdaki amaçları
kapsayabilir.
1) Başarı ya da performansın yordanması
2) Öğrenme eksik veya yanlışlarının ortaya
çıkarılması,
3) Öğrenci ihtiyaçlarını belirlemek
4) Öğrencilerin performans ya da başarısını
değerlendirmek
5) Öğrencileri yönlendirmek veya onlara
rehberlik yapmak
3.2 Birey Hakkında Bilgi Toplama Yolları
Bireyler hakkında bilgi toplamanın çeşitli
yolları vardır. Bunlar genel olarak ikiye ayrılır.
1-Test dışı teknikler: Gözlem, vak’a
kayıtları, kontrol listeleri, dereceleme ölçekleri, biyografi,
otobiyografi vb. yöntemler.
2-Test teknikleri: Öğrencileri yeri ve
zamanı önceden belirlenmiş sınama durumları içine sokarak
tepkilerini almak amacıyla geliştirilen araçlar kullanarak bilgi
toplamaktır. Örnek olarak zekâ, başarı, yetenek vb. testleri
verilebilir.
Testlerle yapılacak değerlendirmelerde, yer ve zaman herkes
için aynı olduğundan bireyleri birbiriyle kıyaslamak daha objektif
görülebilir. Çünkü test koşulları herkes için aynıdır, eşittir.
Farklı değişkenlerin etkisinin minimuma indiği kabul edilir.
Test uygulaması birey hakkında bilgi toplama
yollarından birisidir. Test kelimesi sınama, yoklama anlamındadır.
Türkiye’de ise sınav anlamında, özellikle çoktan seçmeli sınav
anlamında kullanılır..
Psikolojik testler sınıflandırılırken bazı ölçütler
kullanılır. Bu ölçütler çerçevesinde birçok testin hangi kategoriye
alınacağı şüphelidir. Birçok testin sınıflanması binişiklik
gösterir. Yani testlerin çoğu aynı zamanda birden çok sınıflamanın
içine girebilmektedir. Sınıflamaları tek başına doğru ya da yanlış
diye belirlemek mümkün değildir. İşe yarayıp yaramadıklarına
bakılır. Sınıflama belirli ölçütlere göre yapıldığından çeşitli
sınıflamalara rastlanmaktadır. Aşağıda bazı ölçütlere göre testlerin
nasıl sınıflanabileceğine ilişkin kısa bilgiler bulunmaktadır.
A – Davranışların Doğası Bakımından
1 – Maksimum Yerlik Testleri
Bireyin belli bir işi, belli bir durumda, ne derece iyi ya da
doğru yapabildiğini belirlemede kullanılır. Bireyin zihinsel,
duyuşsal, devinişsel ya da akademik yetenekleri hakkında bilgi
toplamak amacı ile hazırlanan araçlardır.
a)
Zeka Testleri: Kişinin takvim yaşı ile
zihinsel gelişimi arasındaki uyumu ölçen testlerdir. Çocukları için
öğrenme gücünü, yetenekler içinse karşılaşılan zihinsel sorunlarla
başa çıkabilme yeteneğini ölçer. Bazı ölçmecilerce 3 grupta
incelenir.
1. Genel Yetenek Testleri;
Belirli düzeylerde genel zihin yeteneklerini ölçer. Doğuştan
getirildiğine, çevre etkisiyle çok az değiştiğine inanılan zihin
gücünü ölçer. Genellikle kişinin ileride, kendisine olanak
verildiğinde, belirli bir şeyi ne kadar öğrenebileceğini veya
yapabileceğini yordamada, öğrenme gücünü (neyi ne kadar
öğrenebileceğini) ölçmede kullanılır.
2. Özel Yetenek Testleri;
Sınırlı ve dar bir alandaki zihin gücünü ölçer. Örneğin, müzik,
resim ve sanat dalarlında bireyin sahip olduğu özel zihin
yeteneklerini ölçen testler bunlar arasındadır.
3. Farklı yetenek testleri:
Dil yeteneği, soyut kavrama yeteneği, mekanik kavrama yeteneği gibi
farklı zihin yeteneklerini ölçen testlerdir.
b) Başarı Testleri: Kişinin eğitim süreci içinde veya
belirli çevre koşulları altında ne kadar öğrendiğini ölçen
testlerdir. Bu testler, bireylerin geçmişte ne kadar öğrendiğini
ortaya çıkarmak için kullanılabilir. Esas olarak bireyin ileride ne
kadar öğrenebileceğinin değil geçmişte ne kadar öğrendiğinin
belirlenmesinde kullanılır. Üç tür başarı testi yaygın kullanılır.
1.Erişi testleri;
amaçlanan davranışlardan hangilerinin ne ölçüde
öğrenildiğini/kazanıldığını ölçmeyi amaçlar.
2. İzleme testleri;
amaçlanan davranıştan her birinin ne ölçüde kazanıldığını ve hangi
düzeyde öğrenme eksik ve güçlükleriyle karşılaşıldığını belirlemeyi
amaçlar.
3. Hazırbulunuşluk (düzey
belirleme) testleri: Bir ders ya da kursa başlamadan önce
öğrenenlerin sahip olması gereken kazanım veya davranışlardan ne
kadarına sahip olduklarını belirlemek amacıyla kullanılan
testlerdir.
2 – Kişilik Testleri
Yansıtıcı türden ve kişisel yoruma açık olan bu
test grubunda amaç; danışanın psikolojik danışma yardımı almasını
gerektirecek bir kişilik bozukluğunun olup olmadığını anlamaktır.
Bireyin psikolojik ihtiyaç ve değerlerini, normal ve normal olmayan
kişilik özelliklerini görmemize yardımcı olur.
a) Projektif kişilik testleri:
Açık olmayan uyarıcılara karşı bireyin gösterdiği kişisel ve
sübjektif tepkilere dayanır. Projektif (yansıtma) testlerde
resimler, mürekkep lekeleri, tamamlanmamış cümleler kullanılır.
b) Kişilik envanterleri:
Bireylerin psikolojik ihtiyaç ve değerlerini ölçer. Bunun yanında
bireylerin normal ve normal olmayan kişilik yönlerini belirlemeye de
yardımcı olur.
c. Uyum envanterleri: Bireyin çevresine
veya çevresindeki insanlara uyum düzeyin belirlemek üzere
geliştirilmiştir.
d. İlgi envanterleri: Bireylerin hoşlandıklarını ve
hoşlanmadıklarını tanıyarak ileride doyum sağlayacağı alanları
meslek olarak seçmelerine yardımcı olmak amacı ile kullanılan ölçme
araçlarıdır.
B – Puanlama Biçim Bakımından
1 – Objektif Testler
Herkesin puanlayabileceği, anahtarı daha önceden belirlenmiş
testlerdir. Çoktan seçmeli, doğru-yanlış ve eşleştirmeli testler
objektif testler için örnek oluşturabilir.
2 – Subjektif Testler
Puanın, puanlayıcının öznel kanı ve yargısından
etkilendiği testlerdir. Sözlü ve yazılı testler bu türden testlere
örnek verilebilir.
C – Testi Hazıryalan Kişiler Açısından
1 – Öğretmen Yapımı Testler
Öğrencilerin veya öğrenenlerin öğrenme düzeyini
belirlemek için, sınıf atmosferi gibi faktörleri göz önüne alarak
öğretmenlerin kendi sınıf veya okulları için hazırladıkları
testlerdir. Sınıf öğretmeninin sınıftaki öğretimin etkililiğini
ölçmek ya da artırmak için geliştirdiği testlerdir.
2 – Standart Testler
Belli bir alanda öğretilenlerin tümünü diğer
değişkenlerden arınık olarak ölçmeyi amaçlayan testlerdir. Daha
kapsamlı bir kullanış için uzmanlarca hazırlanır. İçerik, puanlama,
yönergeler ve yorumlama özgülleşmiştir.
Unutulmamalıdır ki, başka ölçütler kullanarak testleri farklı
şekilde gruplamak da mümkündür.
3.3 Değerlendirmede Kullanılan Ölçme
Araçları
|
Yazılı Yoklamalar
Tanım: Cevaplayıcının
sorulan soruların cevaplarını düşünüp hatırlayarak ve hatırladığı
cevabı organize edip yazılı olarak sunduğu sınav türüdür. Kâğıt
kalem veya essay tipi sınavlar da denir. Yazılı sınavlar kişinin
özgün ve yaratıcı düşünce gücünü, yazılı anlatım becerisini, belli
konulardaki görüşünü, ilgisini ve tutumunu ölçmede
kullanışlıdır. Yazılı sınavı uygulamaları farklı
şekillerde yapılabilir.
Bunlar;
1-Klasik yazılılar:
Tanıma uygun olarak, günümüzde birçok öğretmenin uyguladığı sınav
tarzıdır.
2-Tercihli sınavlar:
Sınav soruları arasında tercihli sorular varsa bu tür sınavlara
tercihli sınavlar denmektedir. Tercihli sınavlar birkaç biçimde
uygulanabilir. Örneğin, sorular konulara göre gruplandırılarak her
gruptan belirli sayıda soru seçilip cevaplandırılması istenebilir;
belirli soruları zorunlu tutarak yanında seçimlik sorular verilerek
belirli sayıda da seçimlik sorunun cevaplandırılması istenebilir ya
da tüm sorular verilerek bunlardan seçilecek belirli sayıda sorunun
cevaplandırılması istenebilir.
Yazılı yoklamalarda kullanılan çeşitli
soru tipleri vardır. Bunlar;
a-Sınırlı cevap soruları (Kısa cevap
gerektiren sorular): Cevapları çoğunlukla sınırlı
veya kısa olan sorulardır. Verilecek cevabın niteliğine, uzunluğuna
ve örgütlenmesine ilişkin bazı sınırlamalar getirilir (Listeleyin,
tanımlayın, nedenlerini sıralayın gibi).
b-Serbest cevap soruları (Uzun cevap
gerektiren sorular veya açık uçlu sorular):
Cevapları sınırlı olmayan, kompozisyon tipi sorulardır. Cevabın
içerik, nitelik ve uzunluğunu belirlemede cevaplayıcıya belli
ölçülerde özgürlük verilir (Yaratıcı düşünme gücü, bilgiyi örgütleme
yeteneği, düşüncelerin iç tutarlığını ve dış tutarlığını
değerlendirme gücü gibi özelliklerin ölçülmesinde
kullanılabilirler). Bu tip sorulardan az sayıda sorulabildiğinden
kapsam geçerliğini düşürücü etkileri vardır. Ancak, kompozisyon
becerileri, sentez ve değerlendirme basamağındaki davranışlar,
yaratıcılık ve özgünlük gibi değişkenler ölçüleceği zaman zorunlu
olarak kullanılması gereken sorulardır.
c-Zorunlu cevaplı sorular:
Bütün cevaplayıcılar tarafından cevap verilmesi zorunlu olan
sorulardır.
d-Seçimlik sorular:
Cevaplandırılması cevaplayıcıların seçimine bırakılan sorulardır.
Bazı durumlarda verilen bütün sorular arasından belirlenen kadarının
cevaplandırılması istenir. Bazı durumlarda da zorunlu
cevaplandırılacak soruların yanında seçimlik sorularda verilerek,
zorunlu sorular yanında seçimlik sorulardan belirlenen kadarının
seçilip cevaplandırılması istenir.
Yazılı sınavların özellikleri
1-Öğrenciler cevaplarını belirli bir
sürede yazmak zorunda olduklarından çok sayıda soru sorulamaz.
Bu nedenle kapsam geçerliği düşüktür. Kapsam geçerliği önemli
olduğu durumlarda yazılı sınav uygulamak doğru olmaz.
2-Yazma hızı öğrenciler arasında farklı
olduğundan "yazı yazma hızı" gibi bir değişken ölçülecek değişkene
karışarak geçerliği düşürebilir.
3- Soru sayısı az ve soruları yazma
zamanı kısa olduğundan hazırlanması kolaydır.
4-Puanlama süresi zaman aldığından
özellikle çok sayıda cevaplayıcının olduğu durumlarda, puanlayıcının
kâğıtları okumaya zamanı azsa veya sonuçların çabuk bildirilmesi
gerekiyorsa yazılı sınavların kullanışlılığı düşer.
5-Özellikle serbest cevaplı sorularda
kesin doğru, kesin yanlış ayrımı zor olduğundan kâğıdın okunması ve
puanlanması zaman alır. Bu durum yansız puanlama yapmayı da
zorlaştırır. Aynı zamanda öğrencileri birbiriyle karşılaştırmak da
zorlaşır. Bu nedenle güvenirlik düşer.
6-Öğrenciler cevaplarını düşünüp
hatırlayarak yazdıklarından, bazı ölçmecilerce yazılı
yoklamaların davranışları daha geçerli ölçtüğü iddia edilmektedir.
7-Puanlama güvenirliği düşüktür.
8-Analiz, sentez ve değerlendirme gibi
üst düzey basamaklardaki davranışların ölçülmesine uygundur.
9-Cevaplamada özgürlük bulunduğundan,
cevaplayıcılar cevapları ve soruları isteyerek veya istemeden başka
tarafa çekerlerse bu durum puanlama farklılıklarına, dolayısıyla
güvenirliğin düşmesine yol açar.
10-Şans başarısı yoktur. Bu durum
güvenirliği dolaysıyla geçerliği artırır.
11-Soruların güçlüğü, testin geçerliği ve
güvenirliği önceden kestirilemez.
12-Anlatımın duru, yazının güzel, kâğıdın
düzenli olması ve kompozisyon yeteneği puanlama yanlılıklarına neden
olarak güvenirliği düşürür. Aynı zamanda bu değişkenler ölçülecek
değişkene karışarak geçerliği de düşürür.
13-Soruların belirginliği ve
anlaşılırlığı azaldıkça öğrenciler tarafından istenilen yere çekilme
olasılığı artar.
14-Yazılı sınav soruları şişirme yolla
cevaplamaya elverişlidir.
Yazılı Sınav Hazırlarken Dikkat
Edilmesi Gereken Noktalar:
1-Sorular açık, anlaşılır olmalı;
cevaplayıcılar farklı şekilde algılanmamalı.
2-Mümkünse veya amaca uygunsa açık uçlu
sorular yerine kısa cevap gerektiren sorular sorulmalı.
3-Sorular birbirinden bağımsız olarak
cevaplandırılabilmeli. Her biri belirli bir davranışlar zincirini
yoklamalı.
4-Soru ders kitabından veya bilinen bir
kaynaktan olduğu gibi alınmamalı (Ezberi yoklar ve geçerliği
düşürür).
5-Sorularda ifade ve yazım hataları
bulunmamalıdır. Bu hatalar soruların yanlış anlaşılmasına sebep
olabilir. "Adamın, eskiden ne yaptığı ile ilgili bir kaygısı yoktu"
ile "Adamın eskiden, ne yaptığı ile ilgili bir kaygısı yoktu" farklı
anlamlarda cümlelerdir.
6-Gereğinden çok soru yazılmalıdır.
Böylece sorular incelenerek düzeltilir ve uygun sorular seçilir.
Yazılı sınavlarının puanlanmasında
değişik tekniklerden yararlanılabilir.
Yazılı Sınavlarını Puanlama Teknikleri
1-Genel İzlenimle Puanlama: Puanlayıcının
cevaplayıcının kâğıdını baştan sona okunduktan sonra genel
izlenimine göre bir puan vermesidir. Özellikle kompozisyon kâğıtları
genelde böyle puanlanır. Bu tekniğin puanlama güvenirliği düşüktür.
2-Sınıflama: Cevaplayıcıların kâğıtlarına
hızlıca göz atılarak "iyi, orta, zayıf” gibi sınıflara ayrılması ve
daha sonra bu sınıflardaki kağıtların puanlanmasıdır. İstenirse bu
sınıflar da kendi içinde yeniden sınıflandırılabilir. Genel izlenime
göre puanlama güvenirliği yüksektir ancak yine de puanlama
güvenirliğinin düşük olduğu söylenebilir.
3-Sıralama: Tüm cevaplayıcıların
kâğıtları puanlayıcı tarafından birbiriyle karşılaştırılarak en
iyiden en zayıfa doğru sıraya konur. Bütün kâğıtlar bu şekilde
sıralandıktan sonra en iyi kâğıda en yüksek not, diğerlerine de buna
göre azalan puanlar verilir. Puanlar ilk iki yöntemden daha
güvenilirdir ancak yeterli puanlama güvenirliği olduğu söylenemez.
4-Anahtarla Puanlama: Cevaplayıcılardan
beklenen cevaplar listelenir. Bu listeye cevap anahtarı denir. Sonra
bu listedeki cevaplara göre puanlama cetveli oluşturulur. Puanlama
cetveli ve cevap anahtarı kullanılarak yapılan puanlamaya anahtarla
puanlama denir. Puanlar diğer puanlama tekniklerine göre daha
güvenilirdir yani daha az hatalıdır.
Puanlamada Dikkat Edilecek Noktalar
1-Ölçme konusu olmayan etkenlere puan
verilmemelidir (Yazı güzelliği, anlatım gücü vb).
2-Cevaplayıcıyı tanımaktan ileri gelen
puanlama yanlılığını önlemek için isimler kapatılmalıdır.
3-Bir sorunun iyi cevaplanmış olması
diğer sorulara verilecek puanı etkileyebileceğinden puanlama
soru-soru yapılmalı. Her kâğıtta aynı soru okunmalı ve
puanlanmalıdır.
4-İyi bir öğrenciden sonra orta bir
öğrenci zayıf, zayıf bir öğrenciden sonra ise aksine iyi
görünebilir. Bu etkiyi gidermek için kâğıtlar sınıflandırılabilir.
5-Mümkünse birden fazla puanlayıcı
kullanılmalıdır.
6-Yorgunluk ve dikkat eksikliği
başladığına okuma ve puanlama bırakılmalıdır
7-Anahtarla puanlama imkânı
yaratılmalıdır.
|
Sınıflama Gerektiren Testler
Tanım:
Cevaplayıcılardan soruları / ifadeleri / maddeleri belli ölçüt(ler)e
göre sınıflamasının istendiği sınav türleridir. En çok uygulananı
(bilineni) doğru yanlış testleridir. Bu testlerde sorular
doğru-yanlış önermeler olarak verilir. Cevaplayıcılar
önermeleri/ifadeleri doğru-yanlış olarak sınıflar. İki seçenekli
çoktan seçmeli testlere benzerler.
Madde Tipleri:
1-Doğru-yanlış önermelerden oluşan madde tipleri. 2-Önermeyi yanlış
yapan ifadeyi işaretleten madde tipleri. 3-Önermelerin yanlış
kısmını düzelttiren madde tipleri (Yanlış önermelerin doğrusunu
yazması istenir). 4-İkiden fazla sınıflama gerektiren madde tipler.
Aslında bu madde tipleri doğru-yanlış testlerindeki şans başarısının
azaltmak amacıyla geliştirilmiştir. Bu nedenle madde tipleri olarak
almak yerine doğru-yanlış testlerinde şans başarısını azaltmada
alınacak önlemler olarak kabul edilebilir.
Özellikleri:
1- Cevaplar bir harf veya işaretle
verildiğinden puanlama hem kolaydır hem objektiftir.
2-Cevaplama zamanı hemen hemen ifadeleri
okumaya ayrıldığından (yani yazmaya ayrılan zaman az olduğundan) çok
sayıda soru sorulabilir. Kapsam geçerliği yüksektir.
3-Madde yapısı basit olmasına rağmen
uygulama basamağına kadar çeşitli düzeylerde davranışları
ölçebildiği söylenir.
4-Sınavda cevaplama işlemi, ölçülen bilgi
veya yeteneğin dışında bir zorluk getirmez. Bu nedenle ilköğretimin
alt basamaklarında da uygulanabilir.
5-Şans başarısı vardır ve diğer seçmeli
testlere göre en yüksek şans başarısına sahiptir
6-Öğrenme eksiklerini belirleme ve tanı
koymaya elverişli değildir (Örneğin yanlış olarak verilmiş bir
ifadeyi yanlış diye işaretleyen bir öğrencinin ifadenin doğrusunu
bilip bilmediğinin kanıtı yoktur).
7-Bazı maddelerin yanlış olarak verilmesi
test yapısı için zorunlu fakat eğitim açısından sakıncalıdır.
Eğitimde yanlış cümleleri vermek ve onu vurgulamak öğrenme açısından
sakıncalıdır. Önemli olan doğru olanı vurgulamak ve onun
öğrenilmesini sağlamaktır.
8-İfade mutlaka doğru ya da yanlış
olmalıdır. Oysa bazı özelliklerin ölçülmesinde kesin doğru ya da
kesin yanlış yargılar geliştirmek zordur. Bu güçlük doğru yanlış
testi uygulayanları sadece bilgi basamağındaki davranışları ölçmeye
yöneltir.
9-Sorulan hazırlamak ve puanlamak
kolaydır.
10-Yazı güzelliği, düzen gibi değişkenler
işe karışmadığından geçerlik yüksektir.
Soru Yazarken Dikkat Edilecek Noktalar
1-Her madde bir davranışı yoklamalıdır
(her ifadede bir ana fikir bulunmalıdır). Örneğin: "Güvenirlik madde
sayısından etkilenmez."
2-Her madde kesinlikle doğru ya da yanlış
olmalıdır. Cevaplayıcıların ifadenin doğruluğu ve yanlışlığı
hakkında karar verebilmesi için gerekli minimum bilgi verilmelidir.
İfadelerde (birçok, birkaç, bazen vb.) belgisiz sıfatlardan
kaçınmalıdır.
3-Önermenin doğru-yanlış olduğunu açığa
vuracak ipuçlarından sakınılmalıdır.
4-Bir maddede birden fazla yanlış ya da
doğru fikir bulunmamalıdır. Bu durumda madde kolaylaşır. Bunun
yerine ifade iki madde haline getirilmelidir.
5-Doğru-yanlış ifadelerin uzunlukları
birbirine yakın olmalıdır.
6-Doğru-yanlış maddelerin sayıları
birbirine yakın olmalıdır.
7-Doğru-yanlış maddeler testlere belirli
bir örüntü halinde yerleştirilmemelidir (İki doğru, bir yanlış vb.
gibi).
8-Bir maddenin yanlışlığı önemsiz veya
aldatıcı bir noktada olmamalıdır.
Örneğin, "Fransız ihtilali 1879 tarihinde
gerçekleşmiştir." Bu tip maddeler dikkati ölçtüğünden geçerliği
düşürür.
9-Her madde mümkün olduğunca kısa ve açık
yazılmalıdır. Gereksiz ayrıntılarla
şişirilmemelidir. Ana fikrin doğruluğuna etkisi olmayan, edebi olsun
diye açıklığı kaybedilen
maddeler iyi madde değildir.
10-Çift olumsuzlama kullanılmamalıdır.
İfadenin anlaşılmasını zorlaştırır. Bunlardan kurtulmanın yolu
cümleyi olumlu ifade etmektir. Örnek:"Geçerliğin düşüklüğü testin
güvenilir olmaması değildir."
11-Doğru bir önermeden yanlış bir önerme
elde etmek için cümlenin fiilinin olumsuz hale getirme yoluna
gidilmemelidir. Böyle maddelerde "me, ma" olumsuzluk ekleri gözden
kaçabilir. Üstelik böyle maddelerin yanlış olduğu, zorla yanlış hale
getirildiği anlaşılabilir.
12-Maddelerdeki ifadeler bilinen bir
kaynaktan alınmamalıdır.
13-Kanı ifadeleri bir kaynağa yâda
otoriteye dayandırılarak verilmelidir.
14-Birbiriyle ilgili maddeler
örgütlenerek sunulmalıdır. Örneğin: "Aşağıda doğru yanlış maddeleri
ile ilgili olarak verilen ifadeleri okuyarak karşılarına doğru ise
'D', yanlış ise 'Y' harfi koyunuz.
—Puanlama nesneldir.
—Geniş kapsamda soru sormaya
elverişlidir.
—Sentez ve değerlendirme basamağında
davranış ölçmek için çok kullanılır.)
|
Ödev Ve Projeler
Tanım: Öğrencilerin
soru veya konuları ders dışında kendi çabalarıyla çözmesi /
araştırması; bir inceleme yaparak sonucunu rapor halinde
yazabilmesi; bir konuyu derinlemesine araştırması; araştırma,
bağımsız çalışma, yaratıcı düşünme, farklı kaynaklar kullanabilme,
yardım alma becerilerinin geliştirilmesi; uygulama ve üst düzeydeki
davranışların geliştirilmesi ve ölçülmesi vb. amacıyla kullanılan
araçlardır.
Ödevler-projeler bazı ölçmecilerce bir
ölçme yöntemi olarak kabul edilmez. Ancak ödev ve projelerdeki
başarı genel başarının önemli bir yönünü yansıtır ve tanımdaki
amaçlar eğitimin amaçları arasındadır. Bazı ölçmeciler ise
yukarıdaki görüşün aksine ödev ve proje uygulamaları sonucunda sınav
kaygısından uzak, gerçeğe daha yakın bir davranış ölçüsünün elde
edileceğini savunur. Bu görüşte de gerçek payı vardır. Ancak bu
uygulamalar gözetimden uzak yapıldığından puanların geçerliği
şüphelidir. Ödev öğrencinin kendisi tarafından yapılmamış olabilir.
Bu tür uygulamalar iyi bir ölçme yöntemi olmasa da iyi bir kendi
kendine öğrenme yöntemidir. Puan verilmediği zaman yeterli etkiyi
gösterememe riskini önlemek için puan verilmeli ama sakıncalarından
dolayı nota katılacak ağırlığı düşük olmalıdır.
Türleri:
1-Bireyse ödev veya projeler.
2-Grup ödevleri veya projeleri
Uygulama Şekilleri:
1-Herkese aynı konu ya da sorunun
verilmesi,
2-Kişilere veya gruplara farklı konu ya
da soruların verilmesi.
Özellikleri
1-Tanımda sayılan becerilerin
geliştirilmesi ve ölçülmesi amaçlarına uygundur. Bu amaçların
ölçülmesi ve geliştirilmesi için faydalı hatta zorunludur.
2-Özellikle grup ödevleri görev bilgiyi
paylaşma, görev alma, yardımlaşma-dayanışma, sorumluluk alma,
eleştiri ve özeleştiri yapma, empatik düşünme, hesap verme vb.
davranışların geliştirilmesi ve ölçülmesi için uygundur.
3-Ödev-projelerin öğrencilerin kendileri
tarafından yapılıp yapılmadığının kontrolü zordur.
Bu nedenle önlemler alarak kullanmak,
kontrolü sağlamak yararlı olabilir.
4-Verilen puanların geçerliği düşüktür.
5-Puanlama güvenirliği düşüktür. Öğretmen
kanıları işe diğer sınav türlerinde daha fazla karışmaktadır. Bu
yönüyle yazılı sınavlara benzer.
6-Öğrencilere verilen konu veya soruların
güçlüklerin ayarlamak zordur. Bu nedenle verilen puanlarla
öğrencileri karşılaştırmak da zordur.
7-Derste öğrenilen-öğretilen
davranışların ölçülmesi için uygun bir yöntem değildir.
Uygulamada Dikkat Edilecek Noktalar
1-Her öğrenciye ya da gruba farklı konu
veya soruların verilmesi amaca daha fazla hizmet edebilir.
2-Ödev veya projeler öğrencilerin
ilgilerine göre dağıtılırsa veya kendilerinin seçmelerine izin
verilirse beklenen faydanın sağlanma olasılığı artar.
3-Verilen konular öğrencilerin üstesinden
kalkabilecekleri bir güçlükte olmalıdır.
4-İnceleme/araştırma amacıyla
yararlanabilecek muhtemel kaynaklar ve bulunabilecekleri yerler
belirtilmelidir.
5-Konunun kapsamı açıkça belirtilmeli,
sınırlan çizilmelidir.
6-Puanlama bir anahtara göre
yapılmalıdır. Bu nedenle bir anahtar hazırlanmalıdır.
|
Kısa Cevaplı Testler
Tanım: Bir kelime, bir rakam, bir cümle
veya kısa bir liste ile cevaplandırılabilecek sorulardan oluşan,
cevaplayıcının cevabı düşünüp hatırlayarak yazılı olarak
sunduğu ölçme araçlarına kısa cevaplı testler denir.
Cevapların düşünüp hatırlanması ve yazılması bakımından
yazılı sınavlara; puanlama kolaylığı ve objektifliği bakımından
çoktan seçmeli testlere benzer.
Soru Türleri:
1-Soru Kipinde Sorular: Madde soru
cümlesi biçimindedir. “Kim, nasıl, niçin, nerede vb.” soru kipleri
ile biten cümlelerden oluşur.
ÖR: “Bir ölçme aracında aranması gereken en
önemli nitelik hangisidir?”
2-Eksik Cümle Tipinde (Boşluk Doldurmalı)
Sorular: Öğrencilerden ifadelerde, cümlelerde veya paragraflarda
bırakılan boşluk ya da boşluklara uyan kelimeyi veya cümleyi
(kelimeler veya cümleleri, sayıları vb.) yazması beklenen sınav
türüdür.
ÖR: “Ölçek türlerinden, .... .... her işlemi
yapmaya uygundur.” Cümledeki boşluğa uygun kavramı yazınız.
3-Tanımlamayı Gerektiren Sorular: Bu tip
sorularda bir kavramın tanımı, bir tanımı belirten kavram veya bir
olgunun belirgin özelliklerinin yazılması istenir.
ÖR: “Random (tesadüfî) hatayı tanımlayınız.”
4-Tanımayı Gerektiren Sorular: Bu tip
sorularda bir bilginin, kavramın, tanımın, özelliklerin veya işlem
basamaklarının tanınması istenir.
ÖR: “Bu çalışmada, testin tanımlanan yapıya
uygun, soruların birbiriyle ve test puanlarıyla ilişkilerinin yüksek
olup olmadığına bakılmıştır.”
Yukarıda yapılan çalışmada çalışılan geçerlik
türleri nelerdir?
Özellikler:
1-Cevaplayıcı cevabını düşünüp bularak yazmak
zorundadır. Şans başarısı olmadığından güvenirlik yükselir.
2-Cevaplayıcı istediği cevabı verme özgürlüğüne
sahiptir ancak yazılı sınav sorularına verilen cevaplarda olduğu
gibi şişirme yapamaz.
3-Uygulama ve analiz düzeyine kadar davranışlar
yoklanabilir. Bu nedenle kullanışlıdır.
4-Her eğitim düzeyine uygun düşen sınav
tipidir. Her yaştaki öğrenciye uygulanabilir. Bu sebeple
kullanışlıdır.
5-Puanlama göreceli kolaydır ama tamamen
objektif (nesnel) olmayabilir. Kullanışlıdır ve kısmen de
güvenilirdir.
6-Çok soru sorulabileceğinden kapsam geçerliği
yazılı yoklamalardan yüksektir.
7-Cevaplar kısa ve belirgin olduğundan puanlama
güvenirliği yazılı yoklamalara göre yüksektir. Bu sebeple güvenirlik
artar.
8-Fikirleri kompoze etme, yazı güzelliği,
kâğıdın düzeni gibi etkenler ölçmeye daha az karışacağından
geçerliği yazılı yoklamalardan yüksektir.
9-Soruları hazırlama ve puanlama kolaydır. Bu
nedenle kullanışlıdır.
10-Şans başarısı yoktur. Bu nedenle güvenirlik
artar.
11-Testi tekrar kullanma imkânı ayrı bir cevap
kâğıdı kullanılarak yaratılabilir. Bu durumda kullanışlılık artar.
12-Sorularda şekil, harita ve grafiklerden
faydalanılabilir. Bu sebeple testin kullanışlılığı yükselir.
Soru Yazarken Dikkat Edilecek Noktalar:
1-Yoklanmak istenen davranış önemli bir
davranış olmalıdır. Kıyıda köşede kalmış bilgiler yoklanmamalıdır.
2-Maddenin cevaplanabilmesi, bu madde ile
yoklanan davranışın beklenen derecede öğrenilmiş olmasını
gerektirmeli ve sadece buna bağlı olmalıdır.
3-Cevaplayıcıların cevabı bulabilmesi için
gerekli bilgiler eksiksiz verilmiş olmalı, cevaplama için gereksiz
ve şaşırtıcı bilgiler bulunmamalıdır.
4-Cevaplayıcıların cevabı bulmalarına yardımcı
olabilecek ipuçları bulunmamalıdır.
5-Maddenin tek ve kesin doğru cevabı olmalıdır.
Birden fazla cevap var ise ayrı puanlanmalıdır.
6-Madde açık, seçik ve kolay anlaşılır bir
ifadeyle sunulmalıdır.
7-Eksik cümle (Boşluklu) maddelerinde, eksik
olanın ne olduğu açıkça anlaşılmalıdır. Boş bırakılan yer/ler
belirsizliğe yol açmamalıdır.
8-Maddeyi oluşturan cümle cevaplayıcıların
bildiği bir kaynaktan aynen alınmamalıdır.
9-Testte yer alan maddeler birbirini
cevaplandırmayı kolaylaştırıcı veya zorlaştırıcı olmamalıdır.
Maddeler birbirinden bağımsız olmalıdır.
10-Her bir madde ile sadece bir davranış
yoklanmalıdır.
11-Eksik cümle maddelerinde bırakılan boşluklar
aynı boyutta olmalıdır.
12-Eksik cümle maddelerinde bırakılan boşluk
sayısı tercihen bir, en fazla iki olmalıdır.
13-Cevap yeri olarak bırakılan boşluklar
cevaplamayı ve puanlamayı kolaylaştıracak biçimde düzenlenmelidir.
14-Cevap yerleri aynı boyutta, tek tip
olmalıdır.
|
Sözlü Sınavlar
Tanım: Soruların sözlü olarak sorulup,
cevaplayıcının cevaplarını düşünüp hatırlayarak sözlü olarak sunduğu
sınav türleridir. Sözlü yoklamalar da denir. Birçok soru tipi
kullanılabilir. Uygulanmasında çeşitlilik görünmekte belirli
standartlardan uzak sınavlardır. Bu nedenle sınav türlerini
sınıflamak zor olmaktadır.
Kullanıldığı alanlar:
1-Okul öncesi ve ilköğretimin ilk yıllarında
yararlanılmalıdır.
2-Konuşma becerileri, sözlü anlatım gücü gibi
özellikleri ölçmede kullanılabilir.
3-Müzik alanındaki becerileri ölçmede de
kullanılabilir.
4-Yabancı dil konuşma becerisini belirlemede
kullanılır.
Özellikleri:
1-Sorular ve cevaplar sözlü olarak sunulur.
2-Cevaplayıcı cevabını düşünüp
bulmak zorundadır. Şans başarısı olmaması güvenirliği artırır.
3-Cevaplayıcının cevabında belirsiz kalan
noktaların deşilmesi yoluyla bilginin derinlemesine ve genişlemesine
ölçülmesi mümkündür.
4-Soruların hazırlanması diğer sınavlara göre
daha kolaydır ve daha az zaman alır. Bu nedenlerle kullanışlılığı
yükselir.
5-Sınav yapanla cevaplayıcı arasında diğer
sınavlara göre daha fazla etkileşim vardır. Sınav
yapanın sınav anındaki durumu öğrenciyi etkilediğinden geçerliği ve
güvenirliği düşüktür.
6-Cevaplayıcının cevaplama anındaki durumu (ses
tonu, cevaplama tarzı, duruşu vb.) puanlayıcıyı olumlu ya da olumsuz
etkileyerek puanlama güvenirliğini düşürür.
7-Sözlü sınavlar bireyseldir. Her öğrenciye
ayrı soru sorulur. Soruların kapsamı ve güçlükleri farklı
olacağından puanların karşılaştırılabilirliği, güvenirliği ve
geçerliği düşer.
8-Cevaplama, sorudan hemen sonra yapıldığından
öğrencinin düşünme ve cevabını gözden geçirme şansı çoğunlukla
yoktur. Bu durum geçerliği ve güvenirliği düşürür.
9-Az soru sorulduğundan kapsam geçerliği
düşüktür.
10-Her cevaplayıcıya ayrı soru sorma
zorunluluğu vardır. Bu sebeple kullanışlı değildir.
11-Cevapların doğruluk derecesini puanlayıcı
belirler. Bu da puanlama güçlüğü ve yanlılığını getirir. Bu da
güvenirliği düşürür.
12-Sınav yapan sevmediklerine kasıtlı
davranabilir. Güvenirlik düşer.
Aksak Yanları:
1-Bir sorunun ancak bir cevaplayıcıya
sorulması; cevap yanlış da olsa başka cevaplayıcıya sorulamaması,
2-Az sayıda soru sorulmasının güvenirliği ve
geçerliği düşürmesi,
3-Puanlama güvenirliğinin genelde düşük olması,
4-Özellikle ölçülmediği durumlarda konuşma
diline hâkimiyet, sözlü anlatım gücü gibi değişkenlerin ölçülecek
değişkene karışarak geçerliği düşürmesi,
5-Cevaplayıcıya fazla zaman verilmemesi,
6-Soruyu soranla cevaplayıcının etkileşim
içinde olması,
7-Heyecan-sıkılma-korku gibi etmenlerle soruyu
soranın ses tonu-jest ve mimikleri veya cevaplayıcıya karşı
takındığı tavrın geçerliği düşürmesi olarak sayılabilir.
Çoktan Seçmeli Testler
|
Tanım: Cevaplayıcının cevabını, (sorunun
doğru cevabı olasılığı olan) birtakım seçenekler arasından seçerek
vermesini gerektiren sorulardan oluşan testlerdir. Doğru yanlış
testleri seçenek sayısı iki olan çoktan seçmeli test olarak kabul
edilir. Seçmeli testlerde sorulara madde denir. Madde, testin
puanlanabilen en küçük birimidir.
Bir madde, kök ve seçeneklerden oluşur.
Kök sorunun sorulduğu ve çözüm için gerekli bilgilerin
verildiği kısımdır. Seçenekler ise öğrenci için olası
cevaplardır. Doğru seçeneğe doğru cevap, yanlış seçeneklere
ise çeldirici adı verilir. Çeldiriciler, madde ile ölçülmek
istenen davranışa sahip olmayanların veya doğru cevabı bilmeyenlerin
aklını çelmek, onları yanıltmak amacıyla yazılmış, doğru olmayan
seçeneklerdir.
Madde Türleri:
1Doğru Cevaba Göre:
a)Doğru cevabı kesin ve bir tane olan
maddeler: Maddenin seçeneklerinden sadece biri doğru diğerleri
kesinlikle yanlış olan maddelerdir. Sıkça kullanılan madde
tiplerindendir.
b)Anahtarlanmış cevabı en doğru olan
maddeler: Seçeneklerin tümü kısmen doğru olan fakat biri
diğerlerinden daha doğru olan madde tipidir. Bu tip maddelerle daha
ileri düzey davranışlar daha kolay ölçülebilir. Bu tip maddelerde
çeldiriciler doğru cevaba yakındır.
c)Bileşik cevap gerektiren maddeler:
Bir maddenin birden fazla doğru cevabı olduğunda kullanılan madde
türüdür. Bu tip maddeler çok kullanışlıdır. Hem ileri düzey
davranışların ölçülmesinde hem de seçenek bulma zorlaştığında
kullanılabilir.
d)Doğru cevabı gizli maddeler:
Çoktan seçmeli maddelerin en zayıf yönlerinden biri, kişinin doğru
cevabı bilmediği halde verilen seçenekler arasında onu gördüğünde
tanımasıdır. Bazı hatırlamaların bilgiyi akla getirmesi veya
davranışın gerektirdiği işlem ve düşünceden farklı bir yolla akla
getirmeyi önlemek için maddenin cevabı gizlenir.
2-Madde Köküne Göre:
a)Kökü soru kipinde olan maddeler:
Madde kökü soru kelimeleri ile ifade edilmektedir.
b)Kökü eksik cümle tipinde olan
maddeler: Kökte bir harf, kelime, sembol veya cümle yazılmayarak
boş bırakılır. Verilmesi gereken cevabın, yani bu boşluğa yazılması
gereken cevabın, cevaplayıcının verilenler arasından seçmesi
istenir. Bırakılacak boşluğun o soru ile ölçülmek istenen davranışı
yoklayıcı nitelikte olması gerekir.
c)Kökü olumsuz maddeler: Madde
kökünün olumsuz olarak ifade edildiği madde türüdür. Olumsuz madde
bir sorunun birkaç doğru cevabı bulunduğu durumlarda kullanılır.
Olumsuz madde olumlu maddeler içinde yer aldığında olumlu madde gibi
görülebilir. Bu nedenle olumsuz ifadenin koyu, altı çizili vb.
yazılması yoluyla olumsuzluğa dikkat çekerek, dikkatsizlikten
kaynaklanacak hataların önüne geçilir.
3-Maddelerin Gruplanışına Göre:
a)Ortak köklü maddeler: Bir paragraf, bir
tablo, bir grafik veya harita gibi bir materyalden iki ya da daha
fazla sorunun sorulduğu maddelerdir. Bu tip maddeler, okuduğunu
anlama, sayılar arasındaki ilişkiler ve bilginin
ötelenmesi(transferi)ni içeren davranışların yoklanmasında çok
kullanılır. Bu tip maddeleri yazarken dikkate alınacak en önemli
noktalar, soruların madde kökündeki bilgiye dayalı olması ve
birbirinden bağımsız olması olarak düşünülebilir. Soruların bağımsız
olmasının sağlanmadığı sık sık görülür. Bu şans başarısını artıran
bir hatadır. Ortak köke dayalı olarak sorulan madde sayısı çok
olmamalıdır. Bu durumda soruların bağımsızlığını sağlamak zorlaşır.
Sorulacak soru sayısı konusundan bir kural olmamasına rağmen beşi
geçmemesi önerilir.
b)Ortak seçenekli maddeler: Bazı
hallerde birden çok davranışın yoklanmasında aynı seçeneklerin
kullanılması gerekebilir. Böyle durumda seçenekler başa yazılır.
Madde köklerindeki sorular bu seçeneklere göre cevaplandırılır. Bu
tip maddelere ortak seçenekli maddeler denir. Bu tip maddeler
yazma-okuma zamanı ve basılı kâğıt miktarında ekonomi sağlar.-Bu tip
maddeleri yazarken seçenek sayısı ile soru sayısının eşit
tutulmamasında yarar vardır. Bu durumda sonuncu sorunun cevabı
geriye kalan seçenek olacaktır. Genel olarak soru sayısının seçenek
sayısından az olması veya bir seçeneğin doğru cevap olarak birden
fazla kullanılması önerilir.
Özellikleri:
1 -Doğru cevap maddenin içinde verilir.
Diğer sınav türlerinde böyle bir durum yoktur. Doğru cevabın madde
içinde verilmesi, ölçülen davranışa yeterince sahip olmayanların
doğru cevabı görünce tanımalarını sağladığından; bazı uzmanlar,
çoktan seçmeli soruların ileri düzeydeki karmaşık davranışları
ölçmede yetersiz kaldığını ileri sürerler. Yapılandırılmış
olduklarından özellikle yaratıcılık gibi davranışları ölçemezler. Bu
durum kullanışlılığı azaltır.
2-Sınav süresinin önemli bir kısmı
maddeyi okumaya ve doğru cevabı bulmaya ayrılır. Yazma süresi az
olduğundan çok soru sorulabilir. Bu durum kapsam geçerliğini ve
dolaylı olarak güvenirliği artırır.
3-Yazı güzelliği, kompozisyon yeteneği
gibi değişkenler işe karışmadığından geçerliği yüksektir.
4-Puanlama objektif ve kolaydır. Objektif
puanlama, bir puanlayıcının cevap kâğıtlarını farklı zamanlarda ve
farklı puanlayıcıların da farklı zamanlarda aynı cevap kâğıtlarını
okumaları durumunda puanların değişmemesidir. Çoktan seçmeli
testlerde cevaplayıcının cevabı ve doğru cevap okuyan kişiye göre
değişmez. Bu nedenle puanlama güvenirliği tamdır.
5-Şans başarısı vardır. Bu durum
güvenirliği düşürür. Ancak seçenek sayısının çokluğu şans başarısını
azaltır. Bu nedenle az seçenek yerine çok seçenek yazmak güvenirliği
artırır. Ancak zorlama yazılan seçenekler yazmak bu amaca hizmet
edemez.
6-Her ne kadar bazı ölçmeciler aksini
iddia etse de çoktan seçmeli testlerle ileri düzey davranışların
ölçülmesi zordur. Özellikle sentez basamağındaki davranışlar
ölçülemez.
7-Uygulanması kolaydır. Bu nedenle,
eğitim basamaklarının çoğunda (basit madde formu kullanmak şartıyla
ilköğretim 3. sınıftan itibaren) uygulanabilir. İlköğretimdeki
kullanımlarında ayrı cevap kâğıdı kullanılmaması önerilir
(Dikkatsizliğin getireceği hataları önlemek amacıyla).
8-Hazırlanması zordur. Soru yazma
tekniklerinin bilinmesi ve deneyimi gerektirir. Kullanışlık düşer.
9-Geniş gruplara uygulanabilir ve makine
ile puanlanabilir. Kullanışlık yükselir.
10-Cevaplama sadece işaret ile
yapılmaktadır. Bu uygulama zamanını kısaltır. Uygulama zamanının
kısa oluşu cevaplayıcının dikkatinin dağılmadan cevaplamayı
tamamlamasına olanak verir.
11-Önceden saptanan özelliklerde sınav
yapılması mümkündür. İstatistiksel temellere dayanır. Bu temeller,
üzerinde çok çalışılmış, formülleri geliştirilmiş ilkelerdir.
Maddelerle testin bütününü birbirine bağlayan istatistiksel
eşitlikler kurulmuştur. Bu eşitlikler sayesinde maddeleri önceden
deneyerek test puanlarının ortalaması, değişkenliği, güvenirliği vb.
yaklaşık olarak hesaplanabilir.
12-Özelliklerinin çoğu geçerliği,
güvenirliği ve kullanışlılığı artırıcı yöndedir.
13-Çoktan seçmeli testlerde okuduğunun
anlama ve okuma hızı gibi bir değişken de işe karışır. Yeterli zaman
verilerek bu değişkenlerin etkisi giderilebilir.
14-Maddeler açık, yalın ve anlaşılır bir
dille yazılmalıdır. (İstisnası okuduğunu anlama ve hız testlerinde
mümkündür.)
Soru Yazmada Dikkat Edilecek Noktalar
1-Madde bir davranışı yoklamalı ve
yoklayacağı davranışa sahip olanların doğru cevabı verebilmeleri
için gerekli bilgileri kapsamalıdır.
2 Madde kökü olabildiğince açık-seçik
ifade edilmiş olmalıdır. Kök hiçbir yoruma meydan vermeyecek
açıklıkta yazılmalıdır. Bu durum maddenin güvenirliğini
düşürür. Soruyu zorlaştırmak için kökte belirsizlikler
bırakılmamalı veya şaşırtma yoluna gidilmemelidir. Soru
zorlaştırılacaksa seçenekler doğru cevaba yakınlaştırılmalıdır.
3-Madde kökünde gereksiz ifade ve
açıklamalardan (anlaşılırlığa katkısı olmayan kelimelerden)
kaçınılmalıdır. Madde kökünde ölçülecek davranışı ortaya koyan
ifadeler bulunmalıdır.
4-Madde kökünde seçeneklerden herhangi
birine ipucu veren ifadeler kullanılmamalıdır.
5-Seçeneklerde tekrar eden kelimeler
madde köküne alınmalı ve tekrar edilmemelidir. Yani seçenekler
mümkün olduğunca kısa olmalıdır.
6-Her test maddesi diğerlerinden bağımsız
cevaplandırılacak şekilde yazılmalıdır.
7-Madde noktalama ve yazım kurallarına
uygun yazılmalıdır.
8-Seçeneklerin uzunlukları birbirine
yakın olmalıdır. Seçenekler ifade tarzı ve kapsam bakımından
birbirine yakın olmalıdır.
9-Çeldiricilerin doğru cevaba yakınlığı
maddenin düşünülen güçlüğüne paralel olmalıdır.
10-"Yukarıdakilerin hepsi" seçeneği
dikkatle kullanılmalıdır. Seçeneklerin birbirine çok yakın olduğu
hallerde kullanılabilir. Seçeneklerden birinin yanlışlığının açık
olması (bu durumda yukarıdakilerin hepsi seçeneği elenir) veya
seçeneklerden birinin doğru olduğunun görülmesi (bu durumda diğer
seçenekler elenir) hallerinde güvenirliği düşürücü etki yapar.
11-"Yukarıdakilerin hiçbiri" seçeneği de
dikkatli kullanılmalıdır. Bu seçenek doğru cevap olarak
kullanılmamalıdır. Doğru cevap olarak kullanılırsa, cevaplayıcının
davranışa sahip olup olmadığı anlaşılamaz. Kesin bir doğru
cevabı olan maddelerde çeldirici olarak kullanılabilir.
12-Birçok madde türünde "Yukarıdakilerin
hepsi" ve "yukarıdakilerin hiçbiri" aynı madde içinde seçenek olarak
kullanılmamalıdır. Kullanılırsa ikisi birden elenir. Mantıksal
olarak ikisinin aynı anda doğru olması mümkün değildir.
13-Seçenekler arasında büyüklük sırası
varsa bunlar sıralı olarak verilmelidir.
14-Seçenek sayısı uygulama yapılan
cevaplayıcıların düzeyine uygun olmalı, ilköğretim ikinci sınıfta
uygulanırsa (ki önerilmez) iki seçenekli, ilköğretim 3, 4, 5 üç
seçenekli, 6, 7, 8 dört seçenekli ve ortaöğretimle yüksek öğretimde
beş seçenekli testler kullanılabilir.
15-Seçenekler birbirinden bağımsız
olmalı, biri diğerini içermemeli, ipucu olmamalıdır.
Böyle bir zorunluluk varsa bileşik cevap
gerektiren soru tipi kullanılmalıdır.
16-Testteki tüm maddelerin seçenek
sayıları aynı olmalıdır.
17-İyi bir test maddesinin madde kökü
okunduğunda seçeneklere bakılmaksızın davranışa sahip olan
cevaplayıcı doğru cevabı verebilmelidir.
18-Çeldirici bulmada güçlük çekildiğinde
madde formu değiştirilmelidir.
19-Doğru cevaplar test içine belli bir
örüntüde yerleştirilmemelidir. Maddelerin doğru cevaplarının yeri
belirli bir düzene bağlı olmamalıdır.
20-Doğru cevaplar seçeneklere yaklaşık
olarak eşit dağıtılmalıdır.
21-Olumsuz maddeler olumlu algılanma
riskine karşı, olumsuzluk ifadesinin altını çizme, koyu yazma vb.
yoluyla belirginleştirilmelidir.
22-Maddeler arasında ve madde kökü ile
seçenekler arasında belirli bir boşluk bırakılmalıdır.
23-Ortak köklü ve ortak seçenekli
maddeler başlangıç ve bitimlerinde diğer sorularla karıştırılmaması
için çizgi ile ayrılabilir. Ayrıca bu tip soruların ortak olan kök
ve seçenekler ile aynı sayfada olması dikkatin dağılmasını
önleyebilir.
24-Testin ilk sorularının kolay olması
cevaplayıcıyı güdüler.
25-Yazı büyüklüğü uygulanan kişilerin
düzeyine uygun olmalıdır.
26-Aynı seçeneğe art arda çok sayıda
doğru cevap getirilmemelidir.
27-Maddelerdeki ifadeler bilinen bir
kaynaktan olduğu gibi alınmamalıdır.
28-Her test maddesi önemli bir davranışı
yoklamalıdır.
29-Çeldiriciler davranışa sahip
olmayanları yanıltmalı fakat sahip olanları yanıltmamalıdır.
30-Birbirinin zıddı olan seçeneklerin
kullanılmaması gerekir.
Puanlama
a) 1-0 puanlaması, b)Maddelerin kolaylık
ve zorluğuna göre puan vermek, c)Maddelerin ölçtüğü yeteneğe göre
puan vermek, d)Madde seçeneklerine doğruluk derecesine göre ağırlık
vererek puanlamak.
Bütün ölçme araçlarında uyulması gereken kurallar
1-Sorular açık ve anlaşılır olmalıdır.
2-Sorularda bilimsel hata bulunmamalıdır.
3-Sorularda dil ve anlatım bozukluğu olmamalıdır.
4-Soruların cevaplandırılması için herkese aynı süre
verilmelidir.
5-Cevaplamayla ilgili ve gerektiği durumlarda puanlama ile
ilgili bir yönerge verilmelidir.
6-Sorular birbirinden bağımsız olarak cevaplandırılabilecek
bir yapıda olmalıdır. Bir sorunun doğru ya da yanlış
cevaplandırılması başka bir sorunun doğru ya da yanlış
cevaplandırılmasını etkilememelidir.
7-Her soru önemli bir davranışı yoklamalı, önemsiz ayrıntılar
üzerinde durulmamalıdır.
8-Soruların kökünde davranışa sahip olmayan cevaplayıcıları
doğru cevaba götürecek ipuçları verilmemelidir.
9-Aksi gerekmedikçe her soru bir davranışı yoklamalıdır.
|
Dereceleme Ölçekleri (Rubric’ler)
Dereceleme ölçekleri performans değerlendirmede öğrencileri
puanlama amacı ile kullanılan ölçme araçlarından biridir. Dereceleme
ölçekleri, performansı tanımlayan ve herhangi bir çalışmanın
puanlanması için geliştirilmiş ölçütleri içeren bir araçtır.
Dereceleme ölçekleri, bir ölçme veya etkinliğin tamamının ya da
bölümlerinin nasıl puanlanacağının ana hatlarıyla gösterilmesidir.
Başka bir tanımıyla dereceleme ölçekleri; kabul edilebilir ya da
edilemez performans sınırlarının öğretmen ve öğrenciler için açıkça
belirtildiği kriter grubu ölçeğidir. En kullanışlı
dereceleme ölçekleri ölçme ve değerlendirme yapacak kişinin kendi
yaptığı dereceleme ölçeğidir. Derecemle ölçekleri bir ölçme
sürecinin tamamının ya da bölümlerinin nasıl puanlanacağını ana
hatlarıyla gösterebilir. Öğrenciden beklenen performansın tüm
boyutlarını dikkate alarak puanlama yapmak amacı ile kullanılırlar.
Dereceleme ölçekleri, öğrencinin bir kavrama ilişkin bilgisini, bir
ürünü belirlenen ölçütlere uygun olarak ortaya koyma becerisini,
verilen bir görevi yapma sürecinde uyulması gereken aşamalı adımları
yerine getirmedeki ustalığını veya verilen bir ödevi yapmadaki
yeterlik düzeyini belirlemede kullanılabilirler. Dereceleme
ölçekleri kullanılırken, öğrencilerden beklenen performansların iyi
tanımlanması veya sınırlarının iyi çizilmesi gereklidir. Bu amaçla
öğrencilerden beklenen performans belli kategoriye ayrılabilir ve
her kategorideki ölçütler ayrıntılı olarak belirlenebilir.
Dereceleme ölçeklerinin bütüncül (holistic) ve analitik
(analytical) olmak üzere iki biçimi vardır. Bütüncül dereceleme
ölçekleriyle performansın genel sürecinin veya ürünün bir bütün
olarak (parçalarını dikkate almadan) puanlaması, analitik dereceleme
ölçekleriyle önce performansın genel sürecinin veya ürünün
parçalarının ayrı ayrı puanlaması ve sonra da bu kısmî puanların
toplanarak toplam puana ulaşılması söz konusudur. Analitik
dereceleme ölçeklerini kullananlar öğrencilerin verdiği bütün
cevapları incelemeli ve belirlenmiş ölçütlere göre puanlamalıdır.
Böylece yanlılığın az olması beklenebilir. Analitik dereceleme
ölçekleri üründen çok süreçle ilgilenmektedir. Bu nedenle öğrenme
eksikliği ya da davranış bozukluğu olan öğrencilerde kullanılması
iyi sonuç vermeyebilir. Bütüncül dereceleme ölçekleri öğrencinin
cevabı bütüncül olarak değerlendirileceği zaman kullanılır. Bütüncül
dereceleme ölçekleri süreçten çok ürünle ilgilenir. Bütüncül
dereceleme ölçekleri puanlama ölçütleri bir problemin çözümünün
önemli bölümleriyle ilgili olmalıdır. Uygun durumlarda farklı
açılardan (biri süreç, diğeri ürün) değerlendirmeye olanak
tanıdıklarından dolayı analitik ve bütüncül dereceleme ölçekleri
birlikte kullanılabilirler.
Dereceleme ölçekleri yazılı sınavların puanlanmasında kullanılan
anahtarlara ya da ürün ve süreç değerlendirilmesi için kullanılan
gözlem ölçekleriyle kontrol listelerine benzer. Dereceleme
ölçeklerinde her bir kazanım veya davranış için kriterlerin
mükemmelden kötüye kadar derecelenmesi söz konusudur ve her derece
için performans ölçütlerinin ayrıntılı tanımlanması gerekir.
Dereceleme ölçeklerini kullanma nedenleri
1-İyi bir ürünün nasıl olacağı konusunda öğretmen ve öğrenci için
açık ve anlaşılır bir tanım verir.
2-Öğrencilerin üstlendikleri görevlerde, görevleri yerine
getirmede, ortaya koydukları ürünlerde ve bunların
değerlendirilmesinde daha fazla sorumluluk duymalarını veya
almalarını sağlar.
3-Öğretmenin öğrenci çalışmalarını veya ürünlerini
değerlendirmelerini kolaylaştırır.
4-Öğrencilere, kendi performanslarını değerlendirebilecekleri
ölçütler sağlar.
5-İyi ürün veya performansla ilgili ölçütlerin velilere
bildirilmesi, çocuklarına yardımcı olmak isteyen velilere kolaylık
sağlayabilir.
Dereceleme Ölçekleri Geliştirme Aşamaları
1-Ölçeğin amacını belirleme: Ölçekle elde edilen sonuçların ne
amaçla kullanılacağı belirlenmelidir.
2-Değerlendirilecek öğeleri belirleme: Ürün veya görevlerde
nelere puan verileceği belirlenmelidir. Ölçekle ölçülmeye çalışılan
davranışlar, ürünler ya da becerilerin anahtarı oluşturulur.
3-Yeterlik düzeylerine karar verme: Ürün veya görevlerde
değerlendirilecek öğelerin gerçekleşme düzeylerine göre nasıl
puanlanacağı belirlenmelidir. Ölçülecek davranış, ürün, görev ya da
becerinin yeterlik düzeyleri ile ilgili ölçütler belirlenir. Örneğin
en düşük düzey için “yetersiz veya 1 puan”; orta düzey için “kısmen
yeterli veya 2 puan”; yüksek düzeydeki performans için “yeterli veya
3 puan” gibi kısa ölçütler yazılabildiği gibi değerlendirilecek
öğeler ve yeterlik düzeyleri ile ilgili ayrıntılı açıklamalar da
yapılabilir. Burada önemli olan düzeyler arasında ölçütleri iyi
ayırt edebilmektir. Hangi becerilerin alt, orta veya üst düzeyde
olduğunu gerekiyorsa uzmanlardan fikir alarak belirlemek gerekir.
4-Ölçeğin hazırlanması: Yukarıdaki aşamalardan sonra ölçek taslak
olarak hazırlanır. Gözden geçirme ve düzeltmeler yapıldıktan sonra
öğrencileri değerlendirmede kullanılabilir. Ölçeği kullanma
sürecinde karşılaşılan sorunlara göre ölçek yetkinleştirilmelidir.
Bölüm Testi
****Uyarı! 1 ve 3. soruları aşağıdaki
seçeneklere göre yapınız.
I-
Ortak seçenekli madde
II
Birleşik cevap gerektiren madde*
III
Kökü olumsuz madde
VI-
Cevabı en doğru olan madde
V-Eksik köklü madde
1. Verilenlerden hangileri sorunun birden fazla
cevabı olduğunda kullanılır?
A)I-II
B)I-III
C)I-VI
D)I-V
E)II-IV*
2. Verilenlerden hangileri sorunun birden fazla
cevabı olduğunda kullanılamaz.
A)I-II-III B)I-II-IV
C)I-II-V
D)I-III-V*
E)II-III-IV
3. Sorunun kesin doğru cevabının olmadığı ya
da soruya verilen cevapların doğruluk derecesi bakımından
birbirinden farklı olduğu durumda hangi çoktan seçmeli madde tipinin
kullanılması uygundur?
A)I
B)II
C)III
D)IV*
E)V
4. Birleşik cevap gerektiren madde tipi
aşağıdaki durumların hangisinde kullanılmalıdır?
A) Birden fazla doğru cevap olduğunda*
B)
Seçenek bulmada güçlük çekildiğinde
C)
İleri düzey davranışların ölçülmesinde
D)
Orta güçlükte sınavın hazırlanmasında
E)
Eğitim sisteminin alt kademelerinde
5. Çoktan seçmeli test maddelerinde sorunun
cevabı ya da doğru olmayan seçeneklere ne ad verilir?
A)
Madde kökü
B)
Madde şıkkı
C)
Olası cevap
D)
Gizli cevap
E)
Çeldirirci*
6. Aşağıdakilerden hangisi çoktan seçmeli madde
türlerinden biri değildir?
A)
Ortak seçenekli maddeler
B)
Kökü eksik cümle olan maddeler
C)
Kesin ve biricik cevabı olan maddeler
D)
Kesin cevabı olmayan maddeler*
E)
Ortak köklü maddeler
7. Bir testin puanlanabilen en küçük
birimine ne ad verilir?
A)
Madde *
B) Doğru cevap
C) Çeldirici D) Olası
cevap E) Doğru seçenek
8. Aşağıdakilerden hangisi çoktan seçmeli ve
doğru yanlış testlerinin ortak bir özelliği değildir?
A)
Kapsam geçerliğini sağlayabilme.
B)
Çok soru sorulabilmesi.
C)
Şans başarısının eşitliği.*
D)
Objektif puanlanma.
E)
Kısa zamanda uygulanma.
9. Çoktan seçmeli test maddesi yazarken
aşağıdaki kurallardan hangisine dikkat etmek gerekmez?
A)
Cevabı bulmak için gerekli bilgi verilmeli
B)
Kökte gereksiz ipuçları verilmemeli
C)
Maddede dil ve bilimsel hatalar olmamalı
D)
Seçeneklerin uzunlukları birbirine yakın olmalı
E)
Soruya göre çeldirici sayısı değişmelidir.*
10. Puanlama açısından aşağıdaki ölçme araç ve
yöntemlerinden hangisi en kullanışsız olanıdır?
A)
Çoktan seçmeli testler
B)
Doğru-yanlış testleri
C)
Yazılı yoklamalar*
D)
Sözlü yoklamalar
E)
Kısa cevaplı testler
11. Aşağıdakilerden hangisi doğru-yanlış ve
çoktan seçmeli testlerde güvenirliği düşüren en önemli
özelliktir?
A)
Kapsam geçerliğinin düşüklüğü
B)
Soruların sayısının sınırlılığı
C)
Şans başarısının etkili olması*
D)
Kapsam geçerliğinin yüksekliği
E)
Okuma hızının işe karışması
12. Aşağıdakilerden hangisi doğru-yanlış
testlerinin olumsuz özelliklerinden biridir?
A)
Puanlamanın objektifliği
B)
Kolay ve çabuk hazırlanması
C)
Şans başarısının yüksekliği*
D)
Kapsam geçerliğinin düşüklüğü
E)
Tüm eğitim düzeylerinde kullanılabilmesi
13. Aşağıdakilerden hangisi kısa cevaplı
testlerin güvenirlik ve geçerliğini artırmaz?
A)
Çok soru sorulması
B)
Objektif puanlama yapılması
C)
Kısa zamanda uygulama yapılması*
D)
Şans başarısının hiç olmaması
E)
Kısa cevaplar gerektirmesi
14. Ödev ve projeler için aşağıdakilerden
hangisi yanlıştır?
A)
Derste öğrenilen davranışların ölçülmesi için en uygun değildir.
B)
Öğrenciyi tanıma puanlama yanlılıklarına sebep olabilir.
C)
Öğrencilere verilen puanların güvenirliği düşüktür.
D)
Ödev ve projeler zorlaştıkça öğrencilerin güdüleri artar.*
E)
Kimin tarafından hazırlandığı kolay anlaşılmaz
15. Aşağıdakilerden hangisi ölçme aracında
aranan nitelikler yönünden en zayıf olandır?
A)
Çoktan seçmeli testler
B)
Yazılı yoklamalar
C)
Sözlü yoklamalar*
D)
Ödev ve projeler
E)
Doğru – yanlış testleri
16. Aşağıdaki ölçme araçlarında hangisi 70
kişilik bir sınıf için en kullanışlı olanıdır?
A)
Kısa cevaplı testler
B)
Çoktan seçmeli testler*
C)
Sözlü sınavlar
D)
Yazılı yoklamalar
E)
Ödev ve projeler
17. Aşağıdakilerden hangisi sözlü sınavlar için
doğru değildir?
A)
Çok soru sorulmadığından geçerlik düşer.
B)
Cevaplayıcının düşünme süresi kısıtlı olabilir.
C)
Konuşma becerileri kazanılan puanları etkileyebilir.
D)
Puanlama anında yapıldığında güvenirliği yüksektir.*
E)
Bazı öğrencilere daha önce sorulan sorular gelebilir.
18. Yazılı yoklamalarda güvenirliği düşüren
en önemli etken hangisidir?
A)
Cevapların uzun verilmesi
B)
Anahtarla puanlama yapılması
C)
Yazılı anlatım becerilerinin işe karışması
D)
Puanlamanın zaman alması
E)
Yansız puanlamanın zorluğu*
19.
I- Puanlamanın zor olması
II-
Soru sayısının az olması
III- İleri düzey davranışları ölçebilmesi
IV-
Hazırlanmasının kolaylığı
V-
Şans başarısının olmaması
Yukarıdaki ifadelerin hangilerinde yazılı
yoklamaların diğer sınavlara göre en zayıf yönleri doğru
olarak verilmiştir?
A)
I ve II*
B) II ve III C) III ve
IV D) I, II ve III
E) II, IV ve V
20. Aşağıdakilerden hangisi eğitimde kullanılan
ölçme araçlarının hepsinde de soru yazımında dikkat edilmesi gereken
ortak bir nokta değildir?
A)
Dil ve anlatım bozukluğu olmamalı
B)
Sorular bağımsız olarak cevaplanabilmeli
C)
Seçeneklerin uzunlukları aynı olmalı*
D)
Her soru önemli bir davranışı yoklamalı
E)
Sorularda bilimsel hata bulunmamalı
21. I- Üst düzey davranışların yoklanması
II-
Hazırlama açısından kullanışlı olması
III- Kapsam geçerliğinin yüksek olması
IV-
Puanlama hatasının az olması
V-
Genel izlenimle puanlanması
Yukarıda verilen özelliklerden hangileri çoktan seçmeli, kısa
cevaplı ve doğru-yanlış sınavlarının diğer ölçme araçlarına göre
önemli üstünlükleri arasındadır?
A) I ve V
B) III ve IV C) II, III ve IV
D) III, IV * E)IV-V
|
IV- ÖLÇME SONUÇLARI ÜZERİNDE YAPILAN İSTATİSTİKSEL İŞLEMLER
4.1 Temel Kavramlar
İstatistik :
1- Sayısal bilgi (Veri)
2- Bilimin Teknolojisi: Verilerin toplanması, işlenmesi,
analizi ve yorumlanması için kullanılan teknikleri içeren bilim
dalı. İki başlık altında inclenebilir.
a)Betimsel İstatistik: Bir grubu bazı özellikleri bakımından
betimleme, gurupla ilgili bilgileri özetleme vb. amacıyla yapılan
istatistiktir. Evren veya örneklem üzerinde çalışılabilir.
b)Vardamsal İstatistik: Gözlenen durumdan gözlenemeyen
durumların kestirilmesi amacıyla kullanılan istatistiktir.
Örneklemeden evrene genellemeler yapıldığı durumlara vurgu yapar.
İstatistikte Amaç: Özellikler evren
hakkında bilgi edinmektir ya da evreni betimlemektir.
Dolaylı Yaklaşım
Örneklem Evren
Örnekleme
Dolaysız
Parametre
İstatistik
Yaklaşım
Betimleme
Anlam Çıkarma
Kestirme
Şekil 7. İstatistiksel süreç
1.Dolaysız Yaklaşım: Evrene ulaşmak
olanaklı ise evren parametreleri hesaplanır. Anlamlandırılır.
2.Dolaylı Yaklaşım: Evrene ulaşmak
olanaklı veya pratik değilse, örnekleme yapma, istatistikleri
hesaplama, evren parametrelerini kestirme ve anlamlandırma olarak
özetlenebilir. Örneklem evreni ne kadar iyi temsil ederse,
istatistiklerden evren parametreleri o derece iyi kestirilir.
Evren: Araştırma alanına giren birey,
obje, özellik vb. tümüdür.
Örneklem: Evreni temsil eden, belirli
bir teknikle seçilmiş örneklerden oluşan birey, obje, özellikler
gurubudur.
Evren ve Örneklem: Ölçme sonuçlarıdır. Örneğin ÖSS
sonuçları dediğimizde evren, herhangi bir dershaneye gidenlerin ÖSS
puanları örneklemdir. Belirli bir özellikler kümesinin evren mi
yoksa örneklem mi olduğu araştırma problemine bağlı olarak
değişebilir. Bir araştırma problemi için evren olan grup, başka bir
araştırma problemi için örneklem olarak alınabilir.
4.2 Verilerin Düzenlenmesi
Bireyler ya da gruplar üzerinde yapılan gözlem sonuçları
işlenmeden önce kolay yorumlanamazlar. Ölçme sonuçlarını yorumlamak,
özetlemek, betimlemek veya karşılaştırma yapmaya uygun hale getirmek
için yapılması gereken ilk işlem verileri düzenlemektir. Gözlem veya
ölçme sonuçlarına, yani işlenmemiş verilere ham veri denir.
Üzerinde matematiksel ve istatistiksel hiçbir işlem yapılmayan
verilere ham veri adı verilir. Verileri düzenlemede kullanılan işlem
basamakları aşağıdaki gibi gösterilebilir.
1-Verileri büyükten küçüğe ya da küçükten büyüğe sıraya
koymak
2-Frekans tablosunu oluşturmak
3-Verileri gruplamak
4-Verileri uygun grafiklerden biriyle göstermek.
Verileri düzenlemekle ilgili aşamaları örnek üzerinden devam
ettirmek faydalı olabilir. Öncelikle veri toplamamız, gözlem
yapmamız gerekir. Tablo 11 50 öğrenciye uygulanan 10 soruluk testten
elde edilen sonuçları göstermektedir. Bu sonuçlar görüldüğü gibi
sadece öğrenciler hakkında bilgi vermekte ve bu bilgileri
yorumlamak, uygulama grubu hakkında fikir yürütmek zor
görünmektedir. Bunun için öncelikle elimizdeki verileri düzenlememiz
gerekir.
Tablo 11. 50 Öğrencinin 10 soruluk testte aldığı puanlar
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
1-Verileri Sıralamak
Bu adımda elimizdeki verileri büyükten küçüğe veya küçükten
büyüğe sıralamak gereklidir. Tablo 12’de 50 öğrenciye
ait veriler (tablo 11) sıralanmış olarak görünmektedir.
Tablo 12. 50 Öğrencinin 10 soruluk testte aldığı sırlanmış
puanlar
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
Öğrenci |
Puan |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
Verileri sıralamak bize fazla bir yorum şansı vermemekle
beraber sonraki adımlar için büyük kolaylık getirir. Sıralanmış
veriler, en büyük ve en küçük değeri hemen görmemizi, verilerin
değişim aralığını hesaplamamızı sağlayabilir.
2-Frekans Tablosu Oluşturmak
Frekans sıklık demektir. İstatistikteki anlamı ise bir
gözlemin verinin tekrar sayısı veya bir verinin kaç kez gözlendiğini
gösteren sayı olarak tanımlanabilir. Kısaca verilerin gözlenme
sıklığı da denilebilir. Tablo 13’de 50 öğrenciye ait verilerin
frekans tablosu görünmektedir.
Tablo 13. Frekans Tablosu
Xi (Puanlar) |
f (frekans) |
tf |
% |
t % |
1 2 3 4 5 6 7 8 9 10 |
2 3 4 5 6 7 8 7 5 3 |
2 5 9 14 20 27 35 42 47 50 |
4 6 8 10 12 14 16 14 10 6 |
4 10 18 28 40 54 70 84 94 100 |
|
50 |
|
100 |
|
Frekans tablosunun özellikleri
1 )Özel bir gruplamadır. Grup aralığı 1
kabul edilir. Yaptığımız işlem 1 den 40 kadar her değerin kaç kez
tekrar ettiğini bulmaktır. Ancak tekrarı (frekansı) sıfır olan
değerleri yazmayız. Bu nedenle sabit bir aralığı dikkate almadığımız
söylenebilir.
2)En çok tekrar eden değer ya da
değerleri gösterir.
3)Tablodan faydalanarak puan dağılımının
grafiği çizilebilir. Puanların dağılımı hakkında bilgi verir.
4)Herhangi bir kişinin yeri konusunda
bilgi verir. Frekans bir verinin tekrar sayısı hakkında, toplamlı
frekans ise bir puanın (kişinin) yeri hakkında bilgi verir. % bir
verinin toplam veri içindeki yüzdesini, yığılmalı yüzde ise %'lik
dilimler içindeki yerini (sırasını) verir.
Frekans ve yüzde hacim, tekrar ve alan
çağrıştırırken, yığılmalı frekans ve yüzde sıra çağrıştırmaktadır.
Frekans tablosunun ilk sütunu gözlenen puanları (bireylerin
sınavdan aldıkları puanları) göstermektedir. Gözlenme olasılığı
olduğu halde gözlenmeyen puan bu tabloda gösterilmez. Çünkü
gözlenmeyen puanın frekansı sıfır olduğundan yapılacak hesaplamalara
önemli bir etkisi olmayacaktır. Örneğin sıfır (0) puan gözlenme
olasılığı olan ama gözlenmediği için bu tabloda gösterilmeyen
puandır.
Tablonun ikinci sütununu frekanslar oluşturur. Frekans sütunu
bir puanın kaç kez gözlendiğini ya da aynı puandan kaç tane olduğunu
göstermektedir. Frekans sütununun son satırı toplam gözlem sayısına
denk olmalıdır.
Tablonun üçüncü sütunu yığılmalı frekansları göstermektedir.
Yığılmalı frekans sütununa toplamlı frekans sütunu da denmektedir.
Yığılmalı frekans bir puanın kendi frekansı ile kendinden küçük
puanların frekansları toplamıdır. Yığılmalı frekans sütunu bize
puanların sırasını verir. Bunun anlamı yığılmalı frekans bize
bireyin grup içindeki yerini söyler.
Örneğin 6 puan alan bir birey sınıfta kaç kişiden başarılı veya
başarısızdır sorularının cevabını yığılmalı frekans sütunundan
görebiliriz. 6 puan alan bireyin sınıftaki kaç kişiden daha başarılı
olduğunu görmek için 6 puandan bir küçük değerin yığılmalı
frekansına bakarız. Bu durumda 6 puan alan birey 20 kişiden daha
başarılı görünmektedir. 6 puan alan bireyin kaç kişiden daha
başarısız olduğunu belirlemek için ise 6 puanın yığılmalı frekansını
toplam frekanstan çıkarmak gereklidir. Bu durumda 6 puan alan
bireyin yığılmalı frekansı 27, topla frekans 50 ve 50 – 27 = 23
olduğundan, 6 puan alan birey sınıftaki 23 kişiden daha başarısızdır
diyebiliriz.
Tablonun dördüncü sütunu yüzdeleri göstermektedir. Yüzde sütununa
bağıl frekans sütunu da denmektedir. Bir gözlemin % sütunundaki
değeri o gözlemin frekans sayısının tüm gözlemelere oranını 100 ile
çarparak elde edilebilir. Örneğin 3 puanı 4 kez gözlenmiştir, yani
frekansı 4’tür. 3 puanının tüm gözlemlere oranı 4 / 50 = 0,08’dir.
Bu değeri 100 ile çarparsak 8 değerine ulaşırız. Yüzde sütunu
frekans sütununa benzer, Frekans sütunun verdiği bilgiyi % cinsinden
verir.
Tablonun beşinci sütunu yığılmalı ya da toplamlı yüzde sütunudur.
Yığılmalı yüzde, bir gözlemin kendi yüzdesi ile kendinden küçük
gözlemlerin yüzdeleri toplamından oluşur. Yığılmalı frekans
sütununun verdiği bilgiyi yüzde cinsinden verir. Yani bireyin grup
içindeki yerini yüzde cinsinden verir. Zaten yığılmalı yüzdeler,
yığılmalı frekansların yüzdeleridir.
Örneğin, altı puan alan bireyin sınıfın yüzde kaçından daha
başarılı veya başarısız olduğu sorularının cevabı yığılmalı yüzde
sütunundadır. 6 puan alan bireyin sınıfın yüzde kaçından daha
başarılı olduğunu bulmak için6 puandan bir küçük değerin yığılmalı
yüzdesine bakarız. 6 puandan küçük değer 5 puandır ve yığılmalı
yüzde değeri 40’tır. Demek ki 6 puan alan birey sınıfın yüzde
40’ından daha başarılıdır. 6 puan alan bireyin kaç kişiden başarısız
olduğunu bulmak için, 6 puan alan bireyin yığılmalı yüzde değerini
100’den çıkarmak gerekir. Bu durumda 6 puan alan bireyin yığılmalı
yüzde değeri 54 ve 100 – 54 = 46 olduğuna göre, 6 puan alan birey
sınıfın yüzde 46’sından daha başarısızdır.
Frekans tablosunda dikkat edilmesi gereken durumlardan biri de,
frekansların toplamıyla yığılmalı frekansların son satırı;
yüzdelerin toplamıyla yığılmalı yüzdelerin son satırı birbirine eşit
veya çok yakın çıkmasıdır. Bazen hesaplanan yüzdeleri yuvarlamadan
dolayı bu değerler arasında çok küçük farklılıklar çıkabilir. Bu
farklılığın yuvarlamalardan geldiğinden emin olmak gerekir.
Verileri düzenlemenin üçüncü adımı verilerin
gruplandırılmasıdır.
3-Verileri Gruplama
Verileri gruplama, verileri eşit
aralıklarla düzenleyerek ve bu aralıklara düşen frekansları
saptayarak özetleme işlemidir. Verileri gruplamanın temel gerekçesi
şöyle açıklanabilir. Veriler çok geniş bir aralıkta (ranjda)
dağıldığında frekans tablosundan yorum yapılması zorlaşır. Bu
zorluğu gidermenin yollarından biri verileri gruplamaktır. Ayrıca
verileri gruplamak istatistiğin gruplarla ilgilenme mantığına da
uygundur. Verileri gruplamak üç adımda gerçekleşen bir işlemdir.
1. adım, grup sayısını belirlemek: Keyfidir. Araştırmacı
karar verir. Verilere uygun, bilgi kaybını en aza indirecek şekilde
saptanmalıdır. En büyük-en küçük veriye ve toplam frekansa bakılarak
karar verilir. Tek sayı olması yararlıdır. Eğitimde 5-7 grup
oluşturmak yaygındır.
2.adım grup aralık katsayısını hesaplamak: Grup aralıklarının
eşit olması sağlayacak bir sayı elde etme işidir. Eşit olmayan
aralıklarla da gruplama yapılabilir. Ancak bu durumda veri analizi
yapılamaz. Grupların genişliği grup aralık katsayısı denilen sayı
ile saptanır. Bu katsayı şöyle hesaplanır:
a=(Xeb-Xek)/bgs
a: grup aralık katsayısı: gereğinden
küçük (grup sayısı artacağından gruplama anlamsız olur) ve büyük
(bilgi kaybı fazla olacağından) olmamalı.
Xeb: Gözlenen en büyük değer (en büyük
ölçüm-veri)
Xek: Gözlenen en küçük değer (en küçük
ölçüm-veri)
bgs: belirlenen grup sayısı
3. adım, grupları oluşturmak:
Grup sayısı ve gurup aralıkları dikkate alınarak grupları oluşturma
basamağıdır. Grupları oluştururken aşağıdaki koşulların sağlanmasına
dikkat edilmelidir.
Grupları oluştururken sağlanması
gereken koşullar:
1.Grup aralıklarının eşit olması
gereklidir.: gruplar arası karşılaştırma, grupları
sürekli hale gştirme, verilerin tamamını temsil edecek
istatistiklerin hesaplanabilmesi için gereklidir.
2.Verilerin birden çok gruba
girmemesigereklidir. her verinin temsil edilmesinin
sağlanması, frekans hesabında hatanın önlenmesi ve verilerin hangi
gruba ait olduğunun tartışılmaması için gereklidir. Bir veri yalnız
bir grupta olmalı.
3.İlk veri ilk grupta son veri son
grupta olmalıdır.
Verileri grupladığımızda, istatistikleri
ve analizleri gruplar üzerinden yürüttüğümüz için verilerle ilgili
bilgi kaybı olur. Ancak işleri kolaylaştırması bakımından bir miktar
bilgi kaybını göze alırız. Kurallara uyulursa bilgi kaybı az olur.
Tablo 14. Gruplanmış veriler
Gruplar |
Kesikli Grup Aralıkları |
Sürekli Grup Aralıkları |
Grup Orta Noktaları
|
Frekanslar |
Toplamlı Frekanslar |
Yüzde |
Toplamlı Yüzde |
(X0) |
(f) |
(tf) |
(%) |
(t%) |
|||
1. Grup |
0 – 2 |
-0,50 – 2,5 |
1 |
5 |
5 |
10 |
10 |
2. Grup |
3 – 5 |
2,5 – 5,5 |
4 |
15 |
20 |
30 |
40 |
3. Grup |
6 – 8 |
5,5 – 8,5 |
7 |
22 |
42 |
44 |
84 |
4. Grup |
9 – 11 |
8,5 – 11,5 |
10 |
8 |
50 |
16 |
100 |
Gözlem sonuçları ve kesikli grup
aralıkları doğal sayılarla ifade edilmişlerdir. Kesikli (süreksiz)
sayılar üzerinde bölme işlemi yapılamadığından grup aralıkları
sürekli hale getirilir. Kesikli grup aralıklarının sürekli grup
aralıklarına çevirme, grup aralıklarının başlangıç ve bitim
değerlerini yarımşar puan sağa ve sola kaydırılarak yapılır.
Verileri sürekli hale getirirken,
verilerin ifade ettiği değişkenin sürekli sayılarla ifade edilip
edilmeyeceği dikkate alınmalıdır. Ölçülen değişken yetenek, başarı
veya tutum ise sürekli kabul edilebilir. Ama sınıf mevcudu, illerin
nüfusları kesiklidir. Veriler sürekli olarak kabul edilmesi mümkün
değilse sürekli hale getirme işlemi yapılmamalıdır. Kesikli grup
aralıklarının ifade ettiği bilgilerle yetinilmelidir.
Grup orta noktaları(Xo); grupları temsil amacıyla hesaplanır. Grubun
başlangıç değeri ve bitiş değerinin toplamının ikiye bölünmesi ile
elde edilir.
Xo1=(0+2)/2= 1 veya Xo1=(-0,50
+2,5)/2= 1 vb.
4- Verileri grafikle gösterme
Grafik: bir değişkene veya birbiriyle ilgili değişkenlere ait
verilerin şekille gösterilmesidir. Ölçme sonuçlarının özetlenmesi ve
düzenlenmelinde başvurulan yollardan biridir. Göze hitap
ettiklerinden tablolardan daha kolay anlaşılır ve yorumlanır.
Veriler farklı ölçeklerden elde edildiğinden farklı grafiklerle
gösterilirler. Yani verileri elde ettiğimiz ölçeğe göre grafik
kullanılır.
Şekil 8. Çubuk Grafiği
|
1)Sütun Grafiği:
Verilerin dikdörtgensel bölgelerle gösterildiği grafiklerdir.
Kesikli değişkenler için kullanılana_çubuk_grafiği sürekli veriler
için kullanılana histogram denir.
a) Çubuk grafiği
*Kesikli değişken için kullanılır.
*Adlandırma (sınıflama_veya sıralama
ölçeklerimle elde edilmiş veriler) için kullanılır.
*Frekansların sayılabildiği veya
frekansların toplam frekansa oranının hesaplanabildiği durumlar için
kullanılır.
*Değişkenler eksenlere anlamayı
kolaylaştıracak biçimde yerleştirilir.
*Grupların (sınıflarını başlangıç ve
bitişleri çakışmaz.
Şekil 9. Histogram
|
*Frekanslar alanla ifade edilmektedir.
Her çubuğun alanı o grubun frekansını, çubukların alan toplamları da
toplam frekansı verir.
*Frekans yerine yüzdeler de
kullanılabilir.
Histogram:
*Çubuk grafiğe benzer ancak çubuk
grafiğinin aksine sürekli grup aralıkları ile çizilir. *Sürekli olan
ya sa sürekli hale getirilebilen gruplandırılmış veriler için
kullanılır. Başka deyişle sürekli grup aralıkları, sürekli olan ya
da sürekli hale getirilebilen değişkenler için kullanılır.
*Genellikle gruplar yatay,
frekanslar-yüzdeler düşey eksende gösterilmektedir
*Aralıklar sürekli olduğundan grup
başlangıç ve bitişlerinde boşluk bırakılmaz.
Şekil 10 Çizgi grafiği
|
*Frekanslar veya yüzdeler alanla temsil
edilirler, her çubuğun alanı o grubun frekansını; çubukların alan
toplamı toplam frekansı verir.
2)Çizgi Grafiği:
Gruplanmış verilerde grup orta noktalarının, gruplandırılmamış
verilerde frekans alanlarının uç noktalarının birleştirilmesiyle
elde edilen, kırık çizgilerden oluşmuş grafik türüdür. Sadece
gruplandırılmış verileri değil, veriler sürekli olmak koşuluyla her
türlü frekans dağılımını göstermek amacıyla kullanılabilir.
*Gruplanmış verilerde grup orta noktaları
dikkate alınarak çizilir.
*Frekans ve yüzdeler için çizilebilir.
*Gruplandırılmış veriler için çizginin
altında kalan alan (gruplandırılmamış veriler için doğru
parçalarının uzunlukları toplamı) toplam frekansı verir.
*Yığılmalı frekans tablosunu göstermede
de kullanılabilir.
Şekil 11. Frekans Poligonu
|
3) Frekans Poligonu (çokgeni): Süreklileştirilmiş
verilerde ilk değerle son değerin X ekseniyle birleştirilmesi sonucu
elde edilir.
*Sürekli veriler için çizilir.
*Yüzde ve frekanslar için çizilebilir.
*Frekans çok geninin alanı toplam frekansa eşittir.
*Gözlemlerin dağılımını alanlarla göstermeye yarar.
4)Pasta Grafiği: Verilere ait frekans veya yüzdelerin
dairenin parçalarıyla (açılarla) gösterilmesine dayanan tekniktir.
*Hem sürekli hem de süreksiz değişkenleri göstermede
kullanıldığına rastlanmaktadır.
Şekil 12 Pasta grafiği
|
*Her bir daire parçası gözlemlerin frekans veya yüzdesini,
daire parçalarının toplamı toplam frekansı (yüzdeyi) verir.
Verileri sıralama, gruplandırma ve
grafikle gösterme veriler hakkında genel bilgiler verir. Bu
işlemeler verilerin tümü hakkında bir bilgi vermez. Verilerin
yorumlanabilmesi için daha ileri düzeyde işlemlere gerek vardır.
Verilerin bütününe ait özellikleri belirtecek bilgilere ihtiyaç
vardır. Bunlardan biri merkezi yığılım (eğilim) ölçüleri, diğeri de
değişme ölçüleridir.
4.3 Merkezi Eğilim Ölçüleri
Ortanca
Ortanca aşağıdaki yöntemlerin hangisi
kullanılarak bulunursa bulunsun her biri için verileri tam ortadan
ikiye ayıran değer olarak tanımlanabilir. Ortancanın hesap edilmesi
için aşağıdaki aşamalı işlemleri yapmak gerekir.
a)Ölçümler büyüklük sırasına konur (Eğer
veriler sıralı verilmiş ise bu işlem adımı geçilir).
b)n+1/2 yardımıyla ortancanın dağılımdaki
sırası belirlenir.
c)Duruma göre aşağıdaki formüllerden biri
kullanılarak ortanca hesaplanır.
1-Veri sayısı tekse (yani ölçüm sayısı 3, 5, 7
gibi tek sayı ise) ortanca n+1/2 formülü ile bulunur.
Örnek: 1, 7, 13, 16, 19, 22, 24, 27, 26 gibi
değerler verildiğinde (n+1)/2 = (9+1)/2 = 5 bulunur ki bu değer
ortancanın sırasını verecektir. Sağdan ve soldan sayıldığında veri
grubu için ortancanın 19 değerine (gözlemine) karşılık geldiği
söylenebilir.
2-Veri sayısı çift ise ortancanın sırası
belirlendikten sonra Xa + (Xb-Xa)/2 formülü kullanılarak ortancayı
hesaplamak doğru olacaktır. Burada Xa çift sayıda olan gözlemi ikiye
ayırdıktan sonra elde edilen ilk grubun son değeri, Xb ise ikinci
grubun ilk değeridir.
Örnek 1: 5, 7, 8, 10, 14, 16, 17, 18
verilerini ikiye bölüyoruz.
Xa Xb olur.
Ortancayı hesaplarsak 10 + (14-10) / 2= 12 elde
ederiz.
Dikkatli bakıldığında ortancanın denk geldiği aralığın
sağında ve solunda bulunan değerlerin ortalaması alındığında
ortancanın bulunabildiği görülecektir.
3-Tekrarlı verilerde: Bir veri grubunda ortanca
tekrarlı verilere rastlıyorsa herhangi birini alamayız.
Bunun yerine o değerin gerçek sınırlarını düşünürüz. Örneğin
ortanca bir veri grubunda 20 değerine rastlasın ve 20 değerinin 3
kez tekrarladığını (frekansının 3 olduğunu) kabul edelim. Bu durumda
ortancayı 20 alamıyoruz. Bu durumda 20 değerlerinin 20’nin gerçek
sınırları içinde eşit olarak dağıldığı kabul edilir. Örneğimiz için
19,5 ve 20,5 aralığında bu üç değerin bulunduğu kabul edilecektir.
Yani 19,5 ve 20,5 aralığını 3 eşit parçaya böleceğiz. Eğer ortanca
değerimiz üç kez tekrar eden sayılardan birincisine denk geliyorsa
formül Xaltsınır + (1/frekans) olacaktır. Formüle göre çözersek
ortancamız 19,5 + (1/3) = 19,83 gibi bir değer alır. Eğer ikinci
tekrar eden değere denk gelseydi 20,16 ya yakın bir değer olacaktı.
Aynı tekniği kullanarak Tablo 13’de verilen 50 kişiye ait
örnek veriler için ortancayı hesaplamak mümkündür. (50+1)/2 = 25,5.
sıra ortancayı vermektedir. Bu sırada yer alan değer 6 gözlemidir ve
7 kez gözlenmiştir. Ortanca bu 6 gözlemden 5. sıradakine
gelmektedir. Yukarıdaki formülü uyguladığımızda 5,5 + (5/7) = 6,21
değerini (yaklaşık olarak) buluruz. Verilerimiz için ortancanın bu
olduğunu söyleyebiliriz.
4-Gruplanmış verilerde aşağıdaki işlemler
gerçekleştirilir.
a)Yığılmalı frekans hesap edilir.
b)n/2 bulunur.
c)Yığılmalı frekanslar sütununun bir ucundan
başlanarak n/2’nin olduğu gruba kadar frekanslar sayılır.
d)n/2 değerinin rastladığı grup (aralık)
bulunur.
e)Aralığın frekansa bölünmesi gerçekleştirilir.
Bu işlemler yapıldıktan sonra elde edilenler aşağıdaki
formüle yerleştirilir.
Formüldeki simgelerin anlamları şöyledir;
L:Ortancanın içine rastladığı aralığın alt
sınırı
Tfa:
“
“
“
aralıktan önceki (düşük puanlı gruplardaki) toplamlı frekans
Fb:
“
“
“
aralıktaki ölçüm sayısı (gözlenen frekans)
a: aralık katsayısı
Formül Tablo 14’te verilen gruplanmış verilere uygulanırsa
n/2= 25 çıkacaktır. 25. verinin 3. grupta olduğu görülmektedir. Bu
sonuçlara göre formül aşağıdaki gibi uygulanabilir.
Ortanca = 5,5 + ((25–20)/22)x3 = 6,18 olarak
elde edilir.
Mod
Ölçümlerde en çok tekrar eden değere mod denir.
Kaba bir ölçüdür. Ortalamanın ve ortancanın hesap edilmediği
durumlarda kullanılır.
Özellikleri:
1-Gözlenen frekanslar birbirine eşit ise mod
olmaz yani dağılım modsuzdur.
2-Ardışık iki veya daha çok ölçüm birbirine
eşit sayıda ve diğer ölçümlerden daha çok tekrar etmişse bu durumda
mod ardışık ölçümlerin orta noktasıdır.
3-Ardışık olmayan iki ya da daha çok ölçüm eşit
sayıda ve diğer ölçümlerden daha çok tekrar etmiş ise bu durumda
dağılım çok modludur.
4-Gruplanmış verilerde frekansı en çok olan
aralığın orta noktası mod olarak alınır. Bunun dışında üsteki
açıklamalar gruplanmış veriler içinde geçerlidir.
5-Sadece bir değer diğerlerinden fazla tekrar
etmişse dağılım tek modludur.
6-Eğer 2 değer diğer değerlerden fazla tekrar
etmiş (gözlenmiş) ve eşit sayıda tekrar etmiş ise bu durumda dağılım
çift modludur.
Örnek verilerimiz için mod Tablo 14’e göre en
çok (8 kez) gözlenen 7 değeridir. Bu durumda dağılımın tek modlu
olduğu söylenebilir. Tablo 14 incelendiğinde gruplanmış veriler için
frekansı en yüksek olan grubun 3. grup olduğu ve grup orta
noktasının da 7 olduğu görülecektir. Yani gruplanmış veriler için de
ortanca 7 bulunmuştur.
Aritmetik Ortalama
Ölçümlerin (verilerin) ağırlık merkezidir.
Verilerin toplamının veri sayısına bölümü olarak da tanımlanabilir.
En çok kullanılan yığılma ölçüsüdür.
Özellikleri:
1-Örneklemeden örnekleme en az değişme gösteren
dolayısıyla en kararlı yığılma ölçüsüdür.
2-Verilerin hemen hepsini kullanır.
3-Birçok istatistiksel işlem için uygundur.
4-Evren ya da örneklemden hesap edilebilir.
5-Verilerin aritmetik ortalamadan farkları 0’a
eşittir.
6-Aritmetik ortalama alanları dengeleyen bir
noktadır.
7-Veri sayısı az ise uç değerlerden etkilenir.
Bu aritmetik ortalamanın verilerin ağırlık merkezi olmasından
kaynaklanır.
Düzenlenmemiş verilerden hesap edilmesi:
; Eğer veri sayısı (30’dan)az ise Payda N-1 alınır.
Örnek verilerimiz için ortalama düzenlenmemiş
verilerde
bulunur.
Ortalamanın frekans tablosundan hesap edilmesi
durumunda formül değişir ancak ortalama değeri değişmez. Frekans
tablosundan ortalama değerini veren formül aşağıdaki gibidir.
Düzenlenmemiş verilerden farkı gözlemleri gözlem sayısıyla
çarpmaktır.
Gruplanmış verilerde ise hem formül hem de
ortalamanın değeri değişmektedir. Çünkü gözlem değeri olarak artık
veriler değil grup orta noktaları ile gruptaki frekans kullanılmaya
başlanır. Yani X yerine grup orta noktaları frekans yerine de
gruptaki ölçüm sayısı (frekans) alındığı için bilgi kaybı olur.
Ortalama düzenlenmemiş verilerden duruma göre düşük veya yüksek bir
değer çıkabilir. Ancak yine de çok büyük bir fark çıkmaması
beklenir. Çok büyük bir fark çıkarsa hesaplamada ya da gruplama da
bir hata yapıldığına işarettir.
Gruplanmış verilerde ortalamanın hesabı
aşağıdaki formülle yapılabilir.
Örnek verilerimiz için aritmetik ortalama;
olarak bulunur. Grup sayısı yeterli olarak alındığından
gruplanmış verilerde hiçbir önemli bir bilgi kaybı ortaya
çıkmamıştır. Genellikle gruplanmamış veriler ile gruplanmış verilere
ait sonuçlar birbirini tutmaktadır veya birbirine çok yakındır.
Ortanca, Mod ve Ortalamanın
Karşılaştırılması:
1-Ortalama, ortanca ve moda göre daha fazla
bilgiye dayanır. Ortalama hesaplanırken verilerin tümü işleme
katılır. Ortancada yarısı, modda ise biri ya da birkaçı işleme
katılmaktadır. Verilerin tümünü dikkate alması ortalamayı daha
istikrarlı ve daha güvenilir yapar. Örneğin bir evrenden random
olarak seçilecek örneklemlerde ortalama diğerlerine göre daha
istikrarlı daha yakın değerler verecektir.
2-Ortalamanın değeri ölçümlerin değerine
bağlıdır. Uç değerler ortalamayı etkiler. Ortalama uç değerler doğru
çekilir. Dizideki ölçümlerin birinin değeri değişirse ortalamanın
değeri de değişir. Ortanca ve mod ise uç değerlerden daha az
etkilenir. Dizinin tam ortasındaki değer değişmeden ortanca,
ölçümlerin dağılış biçimi (frekansları) değişmeden de modun değeri
değişmez.
3-Ortalama diğer matematik işlemler için de
uygundur. Diğer yandan ortanca ve mod merkezi eğilim ölçüsü olmanın
dışında pek fazla kullanılmaz.
4-Herhangi bir durumda hangi merkezi eğilim
ölçüsünün kullanılacağı, incelemeye ya da cevabı aranan soruya
bağlıdır. Genel bir kural olarak birden fazla eğilim ölçüsü
kullanılabilecekse bunlardan en fazla ölçüm kullanılarak hesaplanan
(en fazla bilgi içeren) ve diğer işlemlere de elverişli olan
seçilir.
5-Kullanımda tercih sırası ortalama, ortanca ve
mod şeklindedir.
6-Uç değerlerin olması durumunda uygun olan
ortancadır.
7-Mod ortalama ve ortancanın hesaplanamadığı
durumlarda ve en çok tekrarlayan ölçümü belirlemenin önemli olduğu
durumlarda kullanılır.
4.4 Dağılım Ölçüleri
Merkezi eğilim ölçüsü bir gruptaki verilerin
etrafında toplanma eğilimi gösterdiği bir değerdir. Bu değer veri
grubunun bir özelliğini gösterir. Veri grubunu bir yönüyle betimler.
Verilerin hangi değer etrafında yığıldıklarını bilmek
önemlidir ancak verileri betimlemeye yetmeyebilir. Çünkü verilerin
birbirinden ne kadar uzaklaştıkları, yayılmalarının nasıl olduğu da
önemlidir. Ölçme sonuçları birbirine eşit olsaydı, veriler arasında
farklılaşma olmazdı. Değişimden söz edilmezdi. Ölçme sonuçlarının
yayılması bu değişimin bir sonucudur.
Bir grup verideki değişmelerin ölçüsü “değişme, yayılma veya
dağılma” ölçüleri olarak adlandırılır.
Verileri sadece merkezi eğilim ölçüleri ile betimleyemeyiz.
Çünkü aynı merkezi eğilim ölçüsü değerine sahip olduğu halde değişik
şekillerde dağılan veriler vardır. Aşağıda ortancası ve ortalaması
eşit olan 3 veri grubunun dağılımlarının farklılaştığı
görülmektedir.
F
f
f
3
3
3
2
3
2
1
1
1
2 4 6
8 10
X
2 4 6
8 10
X
2 4 6
8 10
X
Şekil 13. Ortalamaları ve ortancaları eşit,
değişim ölçüleri farklı dağılımlar
Yukarıdaki dağılımlar incelendiğinde
ortalamaları ve ortancalarının 3 olduğu görülür. Buna rağmen
dağılımları oldukça farklıdır. Merkezi eğilim ölçüleri
incelendiğinde benzer grup veya aynı grup denilebilecekken
dağılımları incelendiğinde farklı gruplar olduğu görülmektedir.
Dolayısıyla verilerin değişim ölçülerini bilmeden onları betimlemek
bilgi yetersizliğinden dolayı hata yapmamıza neden olabilir. Sadece
merkezi eğilim ölçülerinden hareketle verileri betimlemek onlar
arasıdaki farkları görmemizi engeller.
Ranj
En büyük ölçme (gözlem) sonucu ile en küçük
ölçme sonucu arasındaki farka ranj denir.
Ranj = Xeb - Xek
Örnek verilerimiz için ranj= 10 -1 =9 olarak
bulunacaktır.
Sadece veri grubundaki iki değere bağlı
olduğundan verilerin dağılımı hakkında fazla bilgi vermez. Çok
kullanışlı bir dağılım ölçüsü değildir. Merkeze yığılma ölçüsü
olarak modun kullanıldığı veri gruplarında dağılım ölçüsü olarak
kullanılır.
Yüzdelikler ve Çeyrekler
Ortanca sıraya konulmuş verilerin tam ortasını gösteren (bir
yer gösteren) değer olarak merkezi yığılma ölçüsüdür. Sıraya
konulmuş verilerde tam ortayı gösteren ölçme sonucu yanında başka
sıradakilerde dikkate alınabilir. Örneğin verilerin % 25’ini sağında
% 75’ini solunda bırakan değere ihtiyaç olabilir. Bir dağılımda bir
verinin yerini gösteren ölçüler yüzdeliklerdir. Buna göre ortanca
bir yüzdelik ve merkeze yığılma ölçüsüdür ancak diğer yüzdelikler
yer bildirmekle birlikte merkezi eğilim ölçüsü değildir.
Yüzdelik: Bir dağılımda belirli bir verinin yerini gösteren
ölçülerdir.
P bir yüzde olmak üzere p. Yüzdelik küçükten büyüğe
sıralanmış veriler için ölçme sonuçlarının p kadarından büyük, (1-p)
kadarından küçük ölçme sonucudur.
p. yüzdelik ölçme sonuçlarının % p’sini solunda, % (1-p)’sini
sağında bırakan değerdir. P. Yüzdeliği Yp olarak
gösterirsek, ortanca Y50 olarak gösterilebilir.
Bir dağılıma ait p. Yüzdelik aşağıdaki gibi gösterilebilir.
.
P (1-p)
Şekil 14. Yüzdeliğin Grafiksel Gösterimi
formülü p. Yüzdeliği verir.
Eleman sayısı az olduğunda yüzdeliğe başvurulmaz. Fazla veri
varsa ve gruplanmış veriler için yüzdelik hesabı yapılır.
Yp’nin hesabı gruplanmış veriler için ortancanın
hesaplanmasında kullanılan formülün özel bir haliyle yapılır.
Formülde sadece simgeler değişir. Anlamları neredeyse aynıdır.
Ap: p. Yüzdeliğin bulunduğu aralığın alt sınırı
p: Değeri hesaplanacak yüzdelik
tfa : p. Yüzdeliğe kadar olan
toplamlı frekans
fp : p. Yüzdeliğin bulunduğu grubun
frekansı
a : Grup aralık katsayısı
Yüzdelikleri hesaplama işi 3 adımda gerçekleştirilir.
1-
Verilerin sıralanması.
2-
formülü yardımıyla Yp’nin (p. Yüzdeliğin) kaçıncı veri
olduğunu saptamak
3-
Gruplanmış veriler için kullanılan formülü işe
koşmak.
Örnek 1: 2, 3, 5, 6, 8, 10, 11, 13, 14, 15
şeklinde sıralanmış verilerimiz olsun. Bu veriler ait 20. yüzdeliği
hesaplayacak olursak
Birinci adım: Verileri sıralayacağız. (sıralı
verilmiş durumda)
İkinci adım:
yardımıyla Y20 nin kaçıncı veriye
rastladığını bulacağız.
=
İkinci sıradaki verimiz Y20’dir.
Değeri ise 3’tür.
Çeyrek Kayma
Üçüncü ve birinci çeyreğin farkının yarısıdır.
Q=
Veriler simetrik dağılmışsa 3. çeyrek
ortancanın çeyrek kayma (Q) kadar sağında; birinci çeyrek de
ortancanın Q kadar solundadır.
Y25 Xort
Y75 Şekil 15. Çeyrek sapmanın
Grafiksel Gösterimi |
Çeyrek kaymada ölçme sonuçlarından sınırlı
sayıda veriye dayandığından çok kullanışlı ve bilgi verici değildir.
Ortancanın merkezi eğilim ölçüsü olarak kullanıldığı durumlarda
dağılım ölçüsü olarak kullanılabilir.
Varyans
Ölçme sonuçlarının aritmetik ortalamadan
farklarının karelerinin aritmetik ortalamasına varyans denir.
Verilerin ortalamadan uzaklıklarının bir ölçüsüdür. Bir değişim
ölçüsüdür. Grubun değişkenliğini diğer gruplarla karşılaştırmada ve
yorumlamada kullanılabilir. Genel formülü şöyledir;
bu formülü örnek verilerimize uyguladığımızda
varyans 5,90 çıkmaktadır.
Varyans tekrarlı ölçümlerden hesap edilirken
formül değişir ancak sonuç değişmez. Tekrarlı verilerdeki formül
aşağıdaki gibidir.
Bunun dışında varyansın ortalamayı hesap etmeden
ham puanlardan hesap etme formülü vardır. Aslında bütün ölçüler ham
puanlardan hesap edilebilir. Ham puanlardan varyansı hesap etme
formülü;
Gruplanmış verilerde ise hem formül hem de
sonuç değişir. Gruplanmış veriler için varyans formülü ve örnek
veriler için sonucu aşağıda verilmiştir.
Burada kullanılacak ortalama gruplanmış
verilerden hesaplanan ortalamadır. Formüldeki X0 ise grup
orta noktalarıdır. Örnek veriler için sonuç 6,70 olarak bulunur.
Gruplanmamış verilerden daha yüksek bir varyans bulunmuştur. Ancak
bu değerlerin çık farklı olmadıkları da söylenebilir.
Varyansın büyüklüğü arttıkça puanlar arasındaki fark artar.
Bu durumda grup heterojendir denir. Varyans azaldıkça puanlar
arasındaki farklar da azalır. Bu durumda da grup homojendir denir.
Ancak büyüklüğü ve küçüklüğü için nesnel bir sınır yoktur. Varyans
büyüdükçe örneğin bir test puanlarını ele aldığımızda testin ayırt
edici olduğu söylenebilir. Yani test davranışlara sahip olanlarla
olamayanları ayırıyor denir. Varyansın büyük ya da küçük olarak
yorumlanabilmesi için nesnel bir sınır olmadığından en doğru işlem
bir grubun varyansını başka grup(lar)la karşılaştırmaktır.
Buna göre varyansı büyük olan grup heterojen,
basık veya değişkenliği büyük olarak; varyansı küçük olan grup ise
homojen, sivri veya benzeşik (değişkenliği küçük-az) olarak
yorumlanabilir.
Standart Kayma (Sapma)
Veri grubunda merkezi yığılım ölçüsü olarak
ortalama kullanılmışsa dağılım ölçüsü olarak kullanılır. Verilerin
aritmetik ortalamadan ne kadar uzaklaştığının ortalama bir ölçüsünü
verir. Ölçme sonuçlarının aritmetik ortalamadan farklarının
karelerinin aritmetik ortalamasının karekökü olarak tanımlanabilir.
Yani varyans değerinin karaköküdür.
Örnek verilerimizdeki ham veriler için standart
sapma 2,43; gruplanmış veriler için 2,59 olarak bulunmuştur.
Standart sapma ölçme sonuçlarının aritmetik
ortalamaya göre yayılmalarının bir ölçüsünü verir. Standart kayma
(ve varyans) ile dağılımın sivriliği ve basıklığı arasında bir
ilişki vardır. Ölçme sonuçları ortalamaya yaklaştıkça farklar
küçülür uzaklaştıkça büyür. Farkların küçülmesi dağılımın
sivrileşmesine, büyümesi basıklaşmasına yol açar. Yani dağılım
sivrileştikçe standart sapma küçülür, dağılım basıklaştıkça standart
sapma büyür.
Standart sapma dağılımın birimi olarak kabul edilir. Bu
nedenle varyantsan daha çok kullanılır.
Standart sapma da varyans gibi yorumlanır. Standart sapma da
ancak bir başka grupla karşılaştırıldığında anlamlı olur. Kendi
başına büyük ya da küçük diye yorumlamak mümkün değildir. Standart
sapması büyük olan grup heterojen, basık veya değişkenliği fazla
olarak; standart sapması küçük olan grup ise homojen, sivri veya
benzeşik (değişkenliği küçük-az) olarak yorumlanabilir.
Bağıl Değişim Katsayısı
Standart kayma ortalamaya bağlı olarak
hesaplandığından belirli sınırlılıklar taşır. En önemlisi de
ortalamaya göre yanlılık göstermesidir. Bu nedenle her iki dağılımı
da içeren iyi bir dağılım ölçüsü olarak bağıl değişim katsayısı
hesaplanabilir. Bağıl değişim katsayısı standart sapmanın aritmetik
ortalamaya göre değeri olarak tanımlanabilir. Formülü;
BDK=standart sapma / ortalama x 100
olarak gösterilir.
Bu formülden elde edilen sonuçlar hem birden
fazla grubun değişkenliğini karşılaştırmada hem de bir grubun
değişkenliğini yorumlama da kullanılabilir.
Eğer bir grubun;
-bağıl değişim katsayısı 25’den büyükse (V>25)
dağılım basık, heterojen, farklı,
-bağıl değişim katsayısı 20 ile 25 arasında ise
(20<V<25) dağılım normal, simetrik,
-bağıl değişim katsayısı 20’den küçükse (V<20)
dağılım sivri, homojen, benzeşik denir.
Örnek veriler için BDK = 40,61 bulunmuştur
(gruplanmış veriler için 43,28). Bu durumda dağılımın basık olduğu,
varyans ve standart sapmanın büyük olduğu ve veriler arasındaki
farkların fazla olduğu söylenebilir.
Birçok durumda varyans veya standart sapmaya
bakarak grubun homojen mi yoksa heterojen mi olduğunu yorumlamak
yanıltıcı sonuçlara götürebilir. Bu nedenle grupları homojenlik
heterojenlik bakımlarından karşılaştırmada hesaplamanın mümkün
olduğu her durumda bağıl değişim katsayısını kullanılması
önerilebilir.
Çarpıklık (Kayışıklık)
Ortalama, Ortanca ve moda bakarak çarpıklığın
olup olmadığı, eğer varsa yönü hakkında yorumlar yapabiliriz. Ancak
çarpıklığın büyüklüğü hakkında bir şey diyemeyiz. İki dağılımın
çarpıklığını bu ölçülerle karşılaştırmak güç olur.
Tanım: Verilerin simetrik dağılıp dağılmadığını
görmemizi (yorumlamamızı) sağlayan değişim ölçüsüdür.
1- basit olarak şu formülle bulunabilir.
Bu basit bir formüldür. Çarpıklık hakkında fikir
sahibi olmamızı sağlar. Ancak çarpıklığın tam değeri değildir.
Çarpıklığın en doğru değeri aşağıdaki formülle elde edilir.
2-
Eğer frekanslı veriler varsa
şeklinde kullanılır.
3-Gruplanmış veriler söz konusu ise
şeklindeki formülü kullanırız.
4-Dağılımın merkezi eğilim ölçüsü olarak
ortanca kullanılmışsa ÇK çeyrekler yardımıyla elde edilir.
- Formül Çarpıklığın kaba bir ölçüsüdür.
- formül çarpıklığın doğru değerini verir.
- formül gruplanmış veriler için çarpıklığın
hesabında kullanılır.
- formül merkezi eğilim ölçüsü ortanca
alındığında, özellikle çarpık dağılımlarda ve kategorik
verilerde kullanılır.
Çarpıklık Katsayısı Aşağıdaki gibi yorumlanır.
A)
ise katsayı pozitif, dağılım sağa(sağı) çarpık, sağa(sağı –
pozitif) kayışlıdır.
B)
ise Kayışıklılık(çarpıklık 0 civarında, dağılım
simetrik
C)
ise katsayı negatif, dağılım sola(sola) çarpık,
sola(solu – negatif) kayışlıdır
Yukarıdaki formüller yardımıyla hesaplanan
bütün çarpıklık katsayıları birbirinden farklı olacaktır. Değerleri
farklı olmasına rağmen hepsi doğrudur. Tercih değişkenin yapısı ve
kullanıcıya kalmıştır.
Basıklık (Yayvanlık) Katsayısı
Standart kayma ve varyans büyüdükçe dağılımın
sivrileştiğini, büyüdükçe dağılımın basıklaştığını biliyoruz. Ancak
bunlar bize basıklıkla ilgili bir ölçü vermez. Bir dağılımın
basıklığının (yayvanlığının) veya sivriliğinin ölçüsü basıklık
katsayısı adını alır.
Genel formülü;
Bs = BK =
Basıklık katsayısı değeri için aşağıdaki
durumlar söz konusudur.
a)
BK < 0 ise dağılım normalden basık, yayvan ve
veriler hetorojendir.
b)
BK = 0 ise dağılımın basıklığı normal dağılım
kadardır.
c)
BK > 0 ise dağılım normalden sivridir ve veriler
homojendir.
Aşağıda merkezi eğilim ve değişme ölçülerine
bağlı olarak karşılaşabilecek tipik dağılımlarla ilgili örnekler
verilmiştir.
Aiağıdaki dağılımların en basığı, en heterojeni
modsuz dağılımdır. Çift modlu dağılımlarda ise, ölçülen değişken
yönünden düzeyleri birbirinden çok farklı iki gruba ait sonuçların
grafiksel yapısı görülmektedir. Solu çarpık dağılımlarda ortalama
düşük değerler alabilmesine rağmen grup genelde başarılı kabul
edilir. Tersine, sağa çarpık dağılımlarda ise ortalama yüksek değer
almasına rağmen grup genellikle başarısız kabul edilir.
Normal dağılımlarda: ortalama = ortanca = mod
Sağa çarpık dağılımlarda: ortalama > ortanca >
mod
Sola çarpık dağılımlarda: mod >ortanca > mod
ilişkileri vardır.
|
Çift modlu
dağılım Sağı çarpık
(pozitif kayışlı) dağılım Solu çarpık
(negatif kayışlı) dağılım Modsuz dağılım |
Şekil 16. Tipik dağılımlardan örnekler
Standart Puanlar
Z Puanı: Normal dağılıma sahip bir ölçme kümesi
ortalaması 0,00 ve standart kayması 1 olan dönüşüme tabi
tutulabilir. Bu dönüştürmeden elde edilen yeni dağılıma Standart
Normal Dağılım ya da Birim Normal Dağılım denir. Birim normal
dağılım istatistiksel işlemlerde ve çeşitli karşılaştırmalarda
kolaylık sağlar. Aşağıda birim normal dağılım grafiği görülmektedir.
|
Şekil 17. Birim (standart) Normal dağılım
Standart Puan: Verilerin ortalamadan
farklarının standart sapmaya bölümü standart puan veya Z puanı
olarak adlandırılır.
evrende veya
örneklemde kullanılan formüldür.
Bu dönüştürmeyle ölçme sonuçları birbiriyle
karşılaştırılabilir. Z puanlarının, dağılımların ortalaması 0,00’a
getirildiğinden mutlak olmayan, izafi bir başlangıç noktası vardır.
Diğer yandan standart puanlar elde edilirken, bir ölçme kümesinde
sabit bir değer olan standart sapmaya bölme işlemiyle birim
cinsinden ifade edilmiş olurlar. Bu nedenle standart puanların bir
birimi vardır ve standart puanlar eşit aralıklı ölçektedir. Z
puanlarına eşit aralıklı ölçeklerdeki tüm işlemler yapılabilir.
Z puanlarının 2 temel işlevi olduğu söylenebilir. Öncelikle
bir bireyin grup içindeki yerini gösterir. Örneğin z puanı 2 olan
bir bireyin şekil 17’deki değerlerden hareketle grubun % kaçından
daha başarılı veya daha başarısız olduğu belirlenebilir. Buna göre
Z = 2 için başarılı olma olasılığı = (50+34+13,5) = 97,5
olur.
Yapılan işlem bireyin z puanının solunda kalan alanı
toplamaktır. Birim normal dağılım ortalamaya (0’a) göre simetrik
olduğundan eksi sonsuzdan sıfıra kadar olan alan 50 (+) 0 ile 1
arasındaki alan 34 (+) 1 ile 2 arasındaki alan 13,5 = 97,5
olmaktadır. Buna göre birey grubun % 97,5’undan daha başarılı
olmuştur. Bu değeri 100’den çıkarırsak bireyin grubun % kaçından
başarısız olduğunu bulabiliriz. 100 – 97,5 = 2,5’tur. Yani birey
grubun % 2,5’ğundan başarısız olmuştur.
Z puanının ikinci işlevi farklı gruplardaki bireyleri
birbiriyle karşılaştırmaktır. Sıralama ölçeğinde elde edilen ham
puanlarda farkların görünememesi nedeniyle karşılaştırma mümkün
olamadığından, farklı gruplardaki bireyler standart puanlar elde
edildikten sonra, yani puanlar eşit aralığa dönüştürüldükten sonra
karşılaştırılır. Böyle bir karşılaştırma da z standart puanı büyük
olan bireyler başarılı; z standart puanı küçük olan bireyler
başarısız kabul edilir. Yani en başarılı birey z standart puanı en
büyük olandır.
Z puanı elde edildikten sonra, bu standart
puanların ortalaması ve birimi (standart sapması) değişen çeşitli
standart puanlara dönüştürülmesi mümkündür. Temel standart puan z
puanıdır. Örneğin T standart puanları ortalaması 50, standart
sapması 10 olan standart bir puan türüdür. İstenirse bu doğrusal
dönüştürme kullanılarak başka standart puanlar da elde edilebilir. Z
değerlerinin T değerlerinde dönüşümü şöyledir.
T puanı z puanının eksi değerlerinden (eksi değerler bazı
durumlarda işlemleri güçleştirdiğinden) kurtulmak için hesaplanan
bir standart puandır. Dolayısıyla T puanı da bir standart puandır ve
z puanıyla aynı işlevlere sahiptir. Ayrıca z puanı nasıl
yorumlanıyorsa aynı şekilde yorumlanır. Yani t puanı en büyük olan
birey en başarılı kabul edilir.
Norm
Belli bir gruptaki kişiler için ortamla veya
tipik kabul edilen değere, ölçüt veya kural olarak kabul edilen
ölçüye norm denir. Ölçme sonuçları belli bir yaş grubu veya belirli
özellikleri bakımından benzer olan bir gruptan elde edilir (kadın
veya erkeklerden, 3. sınıflardan, 12 yaşındaki çocuklardan vb.). Bu
özellikler ölçülen değişkeni bir ölçüde etkilediğinden ve bazen de
yorumlanmalarını kolaylaştırdığından elde edilen değerler bunlara
göre yorumlanırsa daha anlamlı olur. Bu nedenle normlar sık
başvurulan ölçütlerdendir. Normlar ölçülen değişkene göre değişir.
Beklenen ya da olması gereken bir değeri değil, ortalama bir değeri
gösterir. Sınıf, yaş cinsiyet, bölge, ülke vb. normlar vardır. En
çok kullanılan normlar standartlaştırılmış normlardır. Çünkü
karşılaştırmayı kolaylaştırır. Standart norm oluşturmak için
standart puan kullanılır. Standart puanlar ham puanların ortalaması
başlangıç noktası, standart sapması da birim kabul edilerek elde
edilen z puanlarıdır.
Bu formülde değerlerin başlangıç noktası 0,
birimi ise 1 olan bir dağılıma dönüşür. Bu durumda puanlar sıralı
ölçekten eşit aralık ölçeğine dönüşmüş olur. Eksi değerler de
olduğundan işlem zorluklarından kurtulmak için T standart puanına
çevrilebilir.
Örnek soru ve çözümler
sınıflar |
|
s |
1 |
12 |
3 |
2 |
11 |
3 |
3 |
10 |
4 |
4 |
9 |
2 |
5 |
8 |
5 |
Sağdaki tabloda 5 sınıfa uygulanan 20 soruluk
testten elde edilen istatistikler görünmektedir. Aşağıdaki soruları
bu tabloya göre cevaplayınız.
1-Sınıflarda 15 doğru yapan bireyler
karşılaştırılmak istenmektedir. Sınıfların her birinde 15 puan alan
bireylerden hangisi diğerlerine göre daha başarılı olmuştur?
2- Sınıflarda 15 puan alan bireylerden hangi
sınıftaki birey en başarısızdır?
3-Hangi sınıf en homojendir?
4-Hangi sınıf en heterojendir?
5-3 numaralı sınıfta 15 puan alan bireyin T
puanı kaçtır?
6-4 numaralı sınıfta 15 puan alan öğrenci
grubun % kaçından daha başarılıdır?
7-En simetrik dağılım gösteren grup hangisidir?
Cevaplar:
İlk iki soru z puanlarının hesaplanmasını
gerektirmektedir. Buna göre sınıfların z standart puan formülü
kullanılmalıdır.
Z değerlerini büyükten küçüğe sıraya koyarsak Z1
< Z3 < Z2 < Z5 < Z4
1-Hesaplanan z değerlerine göre en büyük z
değerine 4. sınıfta 15 puan alan birey sahip olduğundan en başarılı
birey 4. sınıftaki öğrencidir.
2. En başarısız birey z değeri en küçük olan 1.
sınıftaki öğrencidir.
Üçüncü ve dördüncü sorular için bağıl değişim
katsayılarının hesaplanması gereklidir.
3-En homojen grup bağıl değişim katsayısı en
küçük olan grup olacağına göre 4 numaralı sınıf en homojen, benzeşik
ve sivri gruptur.
4-En heterojen grup bağıl değişim katsayısı en
büyük olan grup olacağına göre 5 numaralı grup en heterojen, en
farklı ve en basık gruptur.
5-T3 = Z3 x 10 + 50 =
(1,25) x 10 + 50 = 62,5 tur.
6- Z4 = 3 olduğuna göre;
Tablo 17 deki standart normal dağılım
alanlarının toplamı = 50 + 34 + 13,5 + 2 = 99,5
olacaktır. Bu da 4 numaralı sınıfta 15 puan alan öğrencinin
sınıftaki bireylerin % 99,5’undan başarılı olduğunu gösterir.
Sınıftaki en başarılı öğrencilerden biri olduğu söylenebilir.
7-Simetriklik elimizdeki verilere göre bağıl
değişim katsayısından anlaşılmalıdır. Buna göre bağıl değişim
katsayısı 20 ile 25 arasında olan dağılım simetriktir. Buna göre 4
numaralı sınıfın en simetrik dağılım olduğu görünmektedir. 1
numaralı sınıfında belirli bir düzeyde simetrik olduğu söylenebilir.
4.6 Madde Analizi
Madde analizi, bir testteki maddelerin iyi
işleyip işlemediğini ortaya koymak amacıyla uygulanan bir tekniktir.
Çeşitli yolları vardır. En çok kullanılanı Henrysson ve alt-üst grup
yöntemidir. Henryson yöntemi özellikle gözlem sayısının ve madde
sayısının çok olduğu durumlarda yorucu olmaktadır. Bu durumda alt –
üst grup tekniği ile elde edilen madde analizi sonuçları ile
Hneryson analizi sonuçlarının birbirine yakınlaştığı söylenebilir.
Bu tekniklerden alt üst grup tekniği ile yapılan madde analizi
üzerinde durulacaktır.
Madde Güçlüğü: Maddeye doğru cevap
verenlerin maddeyi cevaplayan tüm cevaplayıcılara oranı olarak
tanımlanır. O ile 1 arasında değerler alır. 1’e yaklaştıkça madde
kolaylaşır. O’a yaklaştıkça madde zorlaşır. Orta güçlükteki madde
iyi maddedir. Alt üst grup tekniğinde aşağıdaki formülle hesaplanır.
: Maddenin güçlük indeksi
n(d,ü): Maddeyi üst grupta doğru cevaplandıranların
sayısı
n(d,a): Maddeyi alt grupta doğru cevaplandıranların
sayısı
N: Üst ve alt gruptaki toplam öğrenci sayısı
Madde Varyansı ve Standart Sapması: İki çıktısı
olan dağılımlarda varyans ilgilenile olayın olasılığı ile diğer
olasılıkların çarpımıdır. Bir maddede ilgilenilen olayı doğru
cevaplandırılması olarak ele alabiliriz. Yanlış seçenekleri
işaretlemek ise diğer olayların olasılıklarıdır. Madde varyansı
aşağıdaki formülle hesaplanır.
Maddenin varyansı
Maddenin güçlük indeksi
Madde varyansı ve standart sapması madde güçlük
indeksine bağlıdır. Madde güçlük indeksinin 0 ya da 1'e eşit olduğu
durumlarda madde varyansı 0 değerini alır. Mdde güçlük indeksi 0.50
olan maddelerin madde varyansları en yüksek değeri alır. Bu sebeple,
güçlük indeksi 0.50 değerini alan maddelerin en ayırıcı maddeler
olduğu söylenebilir.
Madde Geçerliği: Bir maddenin bilenle
bilmeyeni, bir davranışa sahip olanla olmayanı ortaya koyabilme
işlevine denir. -1 ile +1 arasında değerler alır. Eğer değeri eksi
ise ölçülmek istenen değişkenin zıttı bir değişkeni ölçtüğü, sıfır
ile 0,20 arasında geçersiz bir madde olduğu, 0,20 – 0,30 aralığında
düzeltilmesi gereken bir madde olduğu ve 0,30’u aşıp 1’e yaklaştıkça
geçerliği artan bir madde olduğu söylenebilir.
Madde ayırıcılık gücü indeksi
n(d,ü): Maddeyi üst grupta doğru cevaplandıranların
sayısı
n(d,a): Maddeyi alt grupta doğru cevaplandıranların
sayısı
n: üst ya da alt gruptan herhangi birisinde yer alan
birey sayısı.
ÖRNEK
Aşağıda 30 soruluk bir test maddesine cevap
veren gruptan ikiyüz öğrencinin cevap dağılımı görülmektedir. Bu
dağılıma göre 20. sorunun güçlük ve ayırt edicilik değerlerinin
hesaplayalım.
Soru no: 20 |
A |
B* |
C |
D |
E |
Boş |
Er |
Toplam |
Üst grup |
5 |
70 |
5 |
10 |
5 |
5 |
- |
100 |
Alt grup |
20 |
30 |
15 |
20 |
10 |
5 |
- |
100 |
Toplam |
25 |
100 |
20 |
30 |
15 |
10 |
- |
200 |
Madde Güçlüğünün Hesabı
Madde güçlük hesabında hem alt grupta maddeye
doğru cevap verenleri hem de üst grupta maddeye doğru cevap
verenleri dikkate alıyoruz. İki gruptan doğru cevap verenlerin
sayısını tüm cevaplayıcı sayısına oranlıyoruz. Böylece maddenin
gruba zor mu yoksa kolay mı geldiğini anlıyoruz.
Elde edilen madde güçlük değerine göre 20.
madde orta güçlükte bir maddedir. Grubun hemen yarısı civarında
öğrenci doğru cevap vermiş, diğer yarısı ise doğru cevap
verememiştir.
Madde Geçerliği Hesabı
Maddenin bilenle bilmeyeni ayırması olarak
tanımlanmıştı. Bunun için maddeye üst gruptan doğru cevap verenlerle
alt gruptan doğru cevap verenler arasındaki fark büyüdükçe madde
geçerli hale gelecektir. Aksi durumda madde geçerli olmayacaktır.
Elde edilen madde geçerlik değerine göre
maddenin yeterince geçerli olduğu, maddenin sorunun cevabını bilenle
bilmeyeni ayırabildiğini söyleyebiliriz. Bu anlamda madde bilenle
bilmeyeni ayırabilmektedir.
Aynı zamanda iki hesaptaki sonuçlar birbirini
desteklemektedir. Madde orta güçlükte olduğu zaman genellikle
maddenin ayırıcı olması beklenebilir. 20. madde de bu beklentiye
uygun bir sonuç vermiştir.
Bölüm Testi
1. Bir soruya 22 kişi doğru, 10 kişi yanlış
yanıt vermiş ve 8 kişi de boş bırakmıştır. Bu sorunun güçlük düzeyi
(p) nedir?
A)
0,40 B) 0,45
C) 0,50
D) 0,55*
E) 0,60
2. Bir sorunun güçlük düzeyi (P) 0,90
bulunmuştur. Bu soru için aşağıdakilerden hangisi söylenebilir?
A)
Soru sınıfın % 90’ı tarafından yanlış cevaplandırılmıştır.
B)
Sınıfın yarısından azı soruyu yanlış cevaplandırmıştır.
C)
Sınıfın % 10’u soruyu boş bırakmıştır.
D)
Sınıfın % 90’i soruyu şansla cevaplamıştır.
E)
Sınıfın % 90’i soruyu doğru cevaplamıştır.*
3. Standart puanların en önemli faydası
nedir?
A)
Farklı bireyleri karşılaştırmayı kolaylaştırır*
B)
Ölçme sonuçlarına karışan hataları azaltır.
C)
Değerlendirmelerin nasıl yapılacağını belirler.
D)
Ölçme sonuçlarının güvenirliğini gösterir.
E)
Puan dağılımının normalliğinin kontrol etmeyi sağlar.
4. Ölçme sonuçları üzerinde istatistiksel işlem
yapmanın en önemli faydası nedir?
A)
Değerlendirmeler için ölçütler vermesi
B)
Grubu daha iyi tanıma fırsatı vermesi*
C)
Öğrenme eksiklik ve yanlışlarını belirlemesi.
D)
Puanlamayı kolaylaştırması
E)
Ölçme sonuçlarına karışan hataları azaltması
5. Puan dağılımlarının grafikle gösterilmesinin
gerekçesi aşağıdakilerden hangisidir?
A)
Başarının daha iyi yorumlanması*
B)
Başarılı öğrencilerin belirlenmesi
C)
Öğrenme eksikliklerinin saptanması
D)
Öğretmenin değerlendirilmesi
E)
Eğitim programının değerlendirilmesi
6. Aşağıdakilerden hangisi/hangileri ham
puanların standart puanlara çevrilmesinin gerekçesi olabilir?
I-
Not vermeyi kolaylaştırır.
II-
Yorumlamayı kolaylaştırır.
III- Puanları karşılaştırmayı sağlar.
IV-
Güvenirliği artırır.
A)
I
B) II ve III* C) I ve III
D) III ve IV E) I ve IV
7. Bir aracın geçerlik çalışması aynı
değişkeni ölçtüğü bilinen bir araçtan elde edilen puanların
korelasyonu ile kanıtlanmaya çalışılmış ve sıfır (0) civarında
korelasyon bulunmuştur. Bu durumda aracın geçerliği hakkında
aşağıdakilerden hangisi en doğru olur?
A)
Araç ölçmek istediği değişkeni ölçmektedir.
B)
Araç ölçmek istediği değişkeni yetersiz ölçmektedir.
C)
Araç ölçmek istediği değişkenin tam zıddı bir değişkeni ölçmektedir.
D)
Aracın hangi değişkeni ölçtüğünü bilemeyiz.
E)
Araç ölçmek istediği değişkeni ölçememektedir.*
8. Bir ölçme aracı iki gruba uygulanmıştır.
Grupların ortalamaları aynı olmasına rağmen ikinci grubun standart
sapması birinci grubun standart sapmasının iki katı bulunmuştur.
Aşağıdakilerin hangisi ikinci grup için kesinlikle
söylenebilir?
A)
İkinci grubun varyansı birinci grubun varyansına eşittir.
B)
İkinci grubun puan dağılımı birinci gruba göre homojendir.
C)
İkinci grubun ortancası birinci grubun ortancasına eşittir
D)
İkinci grubun puan dağılımı birinci gruba göre hetorejendir.*
E)
İkinci gurup birinci gruba göre daha başarılıdır.
9. Bir ölçme aracının hesaplanan KR-20
güvenirlik katsayısı 0,95 bulunmuştur. Buna göre aşağıdakilerden
hangisi kesinlikle söylenebilir.
A)
Aracın güvenirliği yeterli değildir.
B)
Araç ikinci uygulamada kararlı sonuçlar verir.
C)
Araçta bulunan sorular arasında ilişki yüksektir.*
D)
Araç aynı değişkeni ölçen başka araçla tutarlı sonuç verir.
E)
Araç güvenilir olmamasına fakat geçerli olabilir.
|
V. DEĞERLENDİRME
(SINAMA DURUMLARI)
Ölçme sonuçlarını bir ölçütle karşılaştırıp karar verme
sürecidir. Eğitimde bu öğrenci başarısını, öğrenme hızını, öğrenme
güçlüklerini belirlemede kullanılabilir. Değerlendirmede üç öğe
olduğu açıkça anlaşılmaktadır.
1-Ölçme=Gözlem sonuçlarıdır. Ölçme sonuçları
değerlendirme değildir.
2-Ölçüt=Amaca göre değişir. Geçerli, güvenilir
ve kullanışlı olmalıdır.
3-Karar=Ölçüte ve karar verene göre değişir.
Öğrencide gözlemeye karar verdiğimiz
doğrudan ve dolaylı davranışları onun kazanıp kazanmadığını,
kazandıysa ne ölçüde kazandığını, kazanmadıysa niçin kazanamadığını,
kazanması için eğitim durumlarında nelerin yapılması gerektiğini
belirleme değerlendirmenin kapsamı içindedir; çünkü değerlendirme,
ölçme sonuçlarını bir ölçüte vurup, yargıya varma süreci olarak
tanımlanabilir.
Eğitimde değerlendirme, sürecin tamamında
yapılmaktadır. En belirgin ve bilinenleri;
1-Hazır bulunuşluluk yada düzey belirleme
amacıyla,
2-Öğrenme eksiklerini saptamak
amacıyla=biçimlendirmeye yönelik,
3-Öğrenci başarısını saptamak amacıyla=değer
biçmeye yönelik; not verme,
4-Öğretimin etkililiği hakkında bir karar
vermek amacıyla,
5-Öğretim programının sağlamlığı hakkında karar
vermek amacıyla,
6-Öğretmen ve diğer eğitim görevlilileri
hakkında karar vermek amacıyla,
7-Değerlendirme yöntem ve ölçütleri hakkında
karar vermek amacıyla,
8-Sistem hakkında karar vermek vb. amacıyla
yapılan değerlendirmeler ve bunlara eklenebilecek olanlardan söz
edilebilir. Gözden kaçmaması gereken değerlendirme hangi amaç için
yapılırsa yapılsın sistemin onarılması anlamını kapsamaktadır.
Değerlendirme Çeşitleri:
Değerlendirme ölçüte bağlı olarak ikiye
ayrılır.
1-Mutlak (Ölçüt Dayanaklı)
Değerlendirme (Ör; hedef-davranışlara göre yapılan
değerlendirme): Ölçüt ölçme işleminden önce belirlenmiştir. Örneğin
programın hedef-davranışları veya kazanımlarının % 60 gibi.
Bir sistem ya da yetişeğin hedeflerini gerçekleştirme derecesine
bakılarak yapılan değerlendirmedir. Bu tür değerlendirmede ölçüt
hedeflerdir. Hedef dayanaklı değerlendirme de denir. Sistem ve
yetişeğin etkinliğini değerlendirmede işe koşulmalıdır. Ayrıca ünite
ve hedef analizlerinde, sıkı aşamalılık ilişkisi bulunduğu
derslerde, yarım, eksik öğrenmelerin hayati tehlike doğurduğu
kurslarda ve bir alana belli bir beceri, bilgi üzerindeki kişilerin
alınacağı durumlarda bu değerlendirme türüne başvurulabilir.
Öğrenciler mutlak ölçütlere göre
değerlendirildiklerinde Mutlak Başarı Yüzdesi hesaplanır. Bu formül
aşağıdaki gibidir.
|
MBY= Mutlak başarı yüzdesi
Xb = Öğrencinin (Bireyin)
puanı
Xmak = Testten alınabilecek en
yüksek puan
2-Bağıl Değerlendirme (Ör; Sınıf
ortalamasına göre yapılan değerlendirme): Ölçüt sonradan ölçme
yapılan gruba bağlı olarak elde ediliyor ve değişiyorsa bağıl
değerlendirme yapılmış olur. Bir grup içinde bireyleri
birbiriyle karşılaştırmak, sıralamak ve bir okul sistemine ya da
kursa alınacakları seçmek için işe koşulan değerlendirme türüdür. Bu
tür değerlendirme aşamalılık ilişkilerinin sıkı olmadığı derslerde,
öğrenci başarısını belirlemede de işe koşulabilir. Sistemi ya da
yetişeği değerlendirmede ise yeterli değildir.
Değerlendirme amaca bağlı olarak üçe ayrılır:
1)Tanımaya yerleştirmeye yönelik
değerlendirme (hazırbulunuşluk testleri veya seviye tespit
sınavları): Ders ya da kursa başlamadan önce ön koşul davranışlardan
ne kadarına sahip olunduğunu belirlemek amacıyla yapılan
değerlendirmelerdir (örneğin; İngilizce kur sınavları). Bu
sınavlardaki değerlendirme mutlaktır.
2)Biçimlendirmeye yönelik değerlendirme
(izleme testleri): Ders ya da kurs sürecinde öğrenme eksik veya
yanlışlarını belirlemek amacıyla yapıla değerlendirmelerdir
(örneğin, konu testleri, quizler, dershane tarama testleri, yaprak
testler gibi). Bu sınavlardaki değerlendirme mutlaktır.
3)Değer biçmeye yönelik değerlendirme (sonuç
değerlendirme, başarı testleri):Ders ya da kurs bitiminde
öğrencilerin kazandırılması planlanan davranışlardan veya
kazanımlardan ne kadarını kazandığını belirleme işidir (final
sınavları; sertifikalar; yeterlik belgeleri gibi).Öğrencilerin
erişilerini belirleme amacıyla kullanılır. Bu sınavlardaki
değerlendirmeler genlikle bağıldır ancak mutlak değerlendirmeler de
yapılabilir.
Alternatif değerlendirme teknikleri
Öğrenci Ürün Dosyası (portfolyo):
Öğrencilerin
öğrenme alanı (ünite), öğretim dönemi veya öğretim yılı boyunca
yaptıkları çalışmaların belirlenmiş ölçütlere göre organize edilmiş
bir koleksiyonu olan öğrenci ürün (seçki) dosyaları, öğrencinin
öğrenme alanlarında yaptığı çalışmaların sistematik, amaçlı ve
anlamlı bir bütünü olarak tanımlanabilir. Öğrenci ürün dosyalarının
kullanım amacına göre içeriği de değişir. Öğrenci ürün dosyaları
sergileme, değerlendirme ve yönlendirme amaçlı kullanılabilir.
Öğrenci ürün dosyası öğrencilerin çalışmalarını, harcadıkları
çabayı ve gelişmelerini gösterebilir. Öğrencinin çalışmalarını,
çabalarını ve gelişimini, velisinin, öğretmenlerinin ve diğer
ilgililerin izlemesini kolaylaştırır.
Öğrenci ürün dosyasının amaçları:
1-Öğrencinin öz disiplin ve sorumluluk bilincini geliştirir
2-Öğrencilere kendini değerlendirme becerisi kazandırır.
3-Ürün değerlendirme araçlarının yanında süreç (performans)
değerlendirme araçlarının da kullanılmasına olanak tanır.
4-Öğrencinin gelişimini izleyebilme olanağı sağlar.
5-Öğrencinin gelecekteki öğrenmelerine yol gösterir.
6-Öğrencilerin yeteneklerini sergilemelerine ve ilgi alanlarını
geliştirmelerine fırsat verir.
7-Öğrencilere arkadaşlarının gelişimlerini izleme ve
değerlendirme şansı verir.
8-Grup çalışmalarına katılımı ve öğrencilerin birbirlerine
yardımcı olmalarını kolaylaştırır.
9-Öğrencilerin çalışmalarını kendilerinin ve arkadaşlarının
değerlendirmelerine olanak vererek öğrencinin değerlendirme sürecine
aktif katılımını sağlar.
10-Öğretmene öğrenciyi tüm yönleriyle (bilgi, beceri, ilgi,
kişilik vb.) tanıma olanağı verir.
11-Aile ve öğrenci arasında iletişim güçlendirir.
12-Öğrencini bir bütün olarak görülmesi ve değerlendirilmesi
amacına hizmet eder.
Öğrenci Ürün Dosyasını Oluşturmada Kullanılacak Teknikler
1-Öğrencinin yaptığı en iyi çalışma
2-Öğrencinin yeni öğrenmeleri ile ilgili çalışmalar
3-Öğrencinin sevmediği çalışmalardan örnekler
4-Öğrencinin sevdiği ve övündüğü çalışmalardan örnekler
5-Öğretmenin, öğrencinin, akranların (grup çalışmasında) ve
velinin seçtiği çalışmalar
Ürün Dosyası Oluşturma Sürecinin Temel Aşamaları
1-Öğretimin genel hedefleri ve kazanımları belirlenir.
2-Öğrencilerle birlikte, öğrencilerin kazanması istenen
kazanımlara veya davranışlara karar verilir.
3-Öğrenci ürün dosyasının ne olduğu, hangi amaçlarla oluşturulduğu
ve nasıl oluşturulduğu öğrencilere açıklanır.
4-Öğrencilere ürün dosyalarını oluşturmada rehber olması
açısından örnek bir ürün dosyası gösterilir.
5-Ürün dosyalarına hangi çalışmaların (ödevler, resimler, video
ve bant ses kayıtları, çeşitli sınavların sonuçları, projeler,
çeşitli ölçme araçlarından elde edilen sonuçlar, mektuplar,
öğrencinin yazıları, günlükler vb.) ne amaçlarla alınacağı
belirtilir.
6-Ürün dosyasındaki çalışmaların hangi ölçütlere göre nasıl
değerlendirileceği öğrencilerle birlikte belirlenerek, bu ölçütler
bir yönergeyle karara bağlanır ve bu yönerge öğrencilere dağıtılır.
7-Ürün dosyasına öğrencilerin süreç değerlendirme araçlarından ve
ürün değerlendirme araçlarından elde ettikleri sonuçlar eklenir.
Aynı zamanda öğrenciyi tüm yönleriyle (kişilik, yetenek, ilgi vb.)
tanımamızı sağlayacak belge ve bilgiler de ürün dosyasına alınır.
8-Ürün dosyası değerlendirilerek öğrencilere dönüt (geri bildirim)
sağlanır. Öğrencilerin güçlü ve zayıf yönleri belirlenir.
Gerekiyorsa tümel bir değerlendirme yapılarak öğrencilere not
verilebilir.
Tablo 10. Geleneksel - ürün dosyası değerlendirme
karşılaştırması
Geleneksel Değerlendirme |
Ürün Dosyası Değerlendirme |
·
Öğrencinin yeteneği, tutumu,
bilgisi vb. tek bir zamanda ölçülür ·
Öğrenci ölçütlerden habersizdir
Değerlendirmeyi öğretmen yapar ·
Öğrenciler içinde bulundukları
öğrenci grubuna göre değerlendirilir ·
Öğrenciye değerlendirme konusunda
aktiflik ve sorumluluk vermez, ·
Değerlendirmeler öğrenme
sürecinde bağımsız olarak yapılır |
·
Öğrencinin yeteneği, tutumu,
bilgisi vb. süreç içinde ölçülür ·
Öğrenci ölçütlerden haberdardır
ve değerlendirme sürecinde aktifitr ·
Öğrencilerin bireysel olarak
değerlendirilmesi söz konusudur, ·
Öğrenci aktiftir, sorumluluk
verilir ve sorumluluk almayı öğrenir. ·
Öğrenme ve değerlendirme süreci
bir bütün olarak görülür. |
1-Öz değerlendirme (kendini değerlendirme)
Belli
bir konuda bireyin kendini değerlendirmesine öz değerlendirme denir.
Öz değerlendirme, bireylerin yeteneklerini
kendilerinin keşfetmelerine yardımcı olan bir yaklaşımdır. Öz
değerlendirme, öğrencilerin okulda yaptıkları çalışmaları, nasıl
düşündüklerini ve nasıl yaptıklarını değerlendirmelerini gerektirir.
Öz değerlendirme, öğrencilerin güçlü ve zayıf yönlerini tanımalarına
yardım eder. Performansının düzeyi hakkında karar vermek için
kişisel ya da kişiler arası ölçüt koymada öğrencilere fırsatlar
sunar. Öz değerlendirme öğrencilerin güdülenme düzeylerinin
yükselmesine yol açar. Öğrencilerin değişik durumlarda
davranışlarını kontrol altına almalarını sağlar.
Öz değerlendirmenin olumlu ve olumsuz yönleri vardır. İnsanların
genellikle kendi performanslarını değerlendirirken yanlı davranma
olasılıkları göz ardı edilmemelidir. Öz değerlendirme, ilk başlarda
öğrencilerin deneyimsizliği nedeniyle yanılgılara neden olabilir.
Öğrenciler deneyim kazandıkça daha doğru kararlar alacaklardır.
|
2-Akran Değerlendirme
Akran değerlendirme sınıf içinde öğrenciler
tarafından yapılan çalışmayla ilgili olarak öğrencilerin bir birini
değerlendirmesi anlamına gelmektedir. Öğrencilerin değerlendirme
sürecine sokulması onların kendi yaptıkları işler için yargılarını
geliştirme amacı gütmektedir. Öğrencilerin değerlendirme
işlemlerinde başarılı olabilmeleri için eğitim almaya ihtiyaçları
olabilir. Bu amaçla değerlendirme ölçütleri öğrencilerle
tartışılarak kararlaştırılabilir. Değerlendirmelerin nasıl
yapılacağına ilişkin öğrencilere geri bildirim verilebilir.
Akran değerlendirme, öğrenmeyle yakından
ilişkilidir. Akran değerlendirme, yaşam boyu öğrenmenin önemi, biliş
bilgisi, öğrenmede öğrenci sorumluluğu üzerine odaklanmayı içerir.
Yaşam boyu öğrenme, bireylerin yalnızca bağımsız çalışmalarını
değil, aynı zamanda kendi performans ve gelişimlerini
değerlendirmelerini zorunlu kılar. Değerlendirme süreci ile
ilgilenmek, öğrencinin öğrenmeye yaklaşımı, öğrencinin kendi güç ve
zayıflıkları ve becerileri hakkında değerlendirme yapmasını sağlar.
Akran değerlendirmesinde ortaya çıkan anahtar
soru, öğrencilerin verdiği notların geçerli olup olmayacağıdır. Bu
soruya en kolay cevabı bulabilmek için öğrencilerin birbirlerine
verdikleri notlar ile öğretmenin öğrencilere verdiği notlar
arasındaki ilişkiye bakılabilir.
Akran değerlendirmesinin kişiler arası
ilişkiler ve akademik kendine güven üzerinde olumsuz etkileri
olabilir. Bir öğrencinin yazısını arkadaşlarının değerlendirmesine
sunmak riskli olabilir, ancak rekabet körüklenmez ve işbirliği
ortamı yaratılırsa öğrenciler yararlı eleştiriler getirebilirler.
Öğrencilerin akranlarını değerlendirmede yapıcı olmaları, onları
değerlendirmede doğru ölçütler kullanmalarına bağlıdır. Bu
ölçütlerden oluşan akran değerlendirme ölçekleri hazırlanarak
öğrencilerin kullanması için verilebilir.
Not
Öğrenci hakkında varılan değer yargısıdır.
Değerlendirmedir.
Not verirken onun etkili ve amaçlara uygun
olması için şunlara dikkat etmek yararlıdır.
1-Not başarılı öğrencinin motivasyonunu
artırır, başarısız olanın düşürür. Bu nedenle notlar öğrencinin
başarısız olduğu değil, başarılı olduğu alanlar vurgulamalıdır.
2-Notlar öğretimin niteliği hakkında bilgi
verir. Bu nedenle notlara bakarak öğretmenler kendilerini
değerlendirebilirler.
3-Notlar okul yöneticilerine, diğer yetkililere
ve velilere de bilgi verir. Bu nedenle geçerli, güvenilir ve gerçeği
yansıtan bir ölçüte dayanmalıdır. Notlar ölçme araçlarının geçerliği
ve güvenirliği de dikkate alınarak verilmelidir. Uygun ve hatasız
bir ölçüt kullanılırsa notlar gerçeğe daha yakın olur.
Not Vermede Ölçütler
1-Öğretmen Kanısı: Yeteri kadar güvenilir ve
geçerli bir ölçüt değildir. Dayanak öğretmenlerin kendi bilgi,
beceri, duygu ve düşünce çerçevesidir. Öğretmenden öğretmene
değişir.
2-Öğrencinin Yeteneği: Yeteneğin ölçülmesi bazı
alanlarda yapılabilmekte bazı alanlarda ise yapılamamaktadır.
Yapıldığı alanlarda ise geçerliği ve güvenirliği tartışmalıdır. Pek
güvenilir ve geçerli bir ölçüt değildir. Nota yansıtmak, ölçüt almak
yerine öğrencilerin yönlendirilmesinde kullanılmalıdır.
3-Öğrencinin Gösterdiği Gelişme: Erişi de
denir. Dersin başında sahip olunan davranışlarla dersin sonunda
sahip olunanlar arasındaki farktır. Gelişmenin ölçüt alınması doğru
değildir. Çünkü her öğrencinin başlangıç davranışları aynı
olmadığından aradaki farkı belirlemek çoğunlukla mümkün olmaz. Hazır
bulunuşluk testleri uygulama yoluyla bunları belirleme imkanı olsa
da pek sağlıklı bir yol değildir. Hatalar içermektedir.
4-Sınıfın Ortalama Başarısı: Bazı ülkelerde
çokça kullanılır. Bu ölçütte sınıf ortalaması orta noktaya denk
getirilir. Diğer başarı düzeyleri de buna göre iyi, pekiyi vb. gibi
belirlenir. Öğrenme ortamı, öğretmen ve diğer etkenlerin öğrencilere
veya öğrenmeye etkisi aynı olduğu için savunulabilir. Ancak bu
yaklaşımda programın hedef-davranışları dikkate alınmaz. Bu yaklaşım
davranışları yeterince kazanamayanlara diploma verme, buna karşılık
davranışların çoğuna sahip olan birçok öğrencinin sınıfta kalmasına
sebep olabilir. Eğitim sisteminin çelişkili sonuçlar vermesine neden
olur. Bu yaklaşımında geçersiz ve güvenilmez olduğu sonucuna
varılır.
5-Hedef ve Davranışlar: Ölçüt kazandırılması
hedeflenen davranışlardır. Davranışların asgarisine sahip olan
öğrenciler minimum geçer not alır. Bu yaklaşımda notlar öğretmen,
öğrenme ortamı vb. dış etkenlerden etkilenir. Bu etkilerden gelen
başarısızlık sebepleri notlara yansır. Bu durum olumsuz
taraflarıdır. Bu yöntem özellikle ön-şart ilişkilerin yüksek olduğu
matematik, fizik, laboratuar ve atölye derslerinde kullanılabilir.
Bölüm Testi
1. Aşağıdakilerden hangisi değer biçmeye
yönelik değerlendirme değildir?
A)
Vize sınavı
B)
Final Sınavı*
C)
Bütünleme sınavı
D)
Üniversite seçme sınavı
E)
Ünite sınavı
2. Aşağıdakilerden hangisi değerlendirme ile
ilgili değildir?
A)
Bir yargılama ve karar verme işidir.
B)
İki özelliğin karşılaştırılmasına dayanır.*
C)
Ölçümlerden bir anlam çıkarmadır.
D)
Davranış derecesini belirleme işidir.
E)
Bir değer yargısına varmaktır.
3. Aşağıdakilerden hangisi
tanıma-yerleştirmeye yönelik değerlendirme için yapılır?
A)
Öğrencileri cinsiyetine göre ayırmak
B)
Öğrencilerin hazır-bulunuşluk düzeyini belirlemek
C)
Ünite bitiminde yazılı yoklama yapmak*
D)
Dönem sonunda bitirme sınavları yapmak
E)
Öğrencileri boy ve ağırlıklarına göre ayırmak
4. Bir öğretmen ham puanı sınıf ortalamasının
2 standart sapma üstünde olan öğrencilere “pekiyi” notu vermiştir.
Bu değerlendirmede ölçüt nedir?
A)
Sınıfın ortalama başarısı*
B)
Öğrencinin gelişim farkı
C)
Dersin hedef davranışları
D)
Öğretmenin kanısı
E)
Testin ortalama güçlüğü
5. Aşağıdakilerden hangisi sınıfın ortalama
başarısı ölçüt alınarak yapılan değerlendirmenin olumlu bir yönüdür?
A)
Öğrencileri çalışmaya yönlendirmesi*
B)
Daha adil bir değerlendirme yapması
C)
Ölçme hatalarından etkilenmemesi
D)
Daha kullanışlı olması
E)
Öğrencilerde kaygıyı düşürmesi
6. Eğitim sisteminde değerlendirmenin önemini
aşağıdakilerden hangisi daha iyi açıklar?
A)
Sistemin kendini yenilemesine katkı sağlar.*
B)
Girdilerdeki eksikliği kontrol eder.
C)
Süreçte olan aksaklıkları saptar.
D)
Çıktıların hedeflerle tutarlılığını denetler.
E)
Öğrencilerin başarısı hakkında bilgi verir.
7. Aşağıdakilerden hangisi bir değerlendirme
türü değildir?
A)
Programın sağlamlığını denemek
B)
Öğretim yönteminin etkililiğine bakmak
C)
Öğrencilerin başarısını izlemek
D)
Öğretilenlerdeki eksiklikleri saptamak
E)
Ölçme aracının güvenirliğini belirlemek*
8. “Bir öğretmen sınav sonunda Ahmet’e 64
puan ve buna dayalı olarak 6 notu vermiştir.” İfadesi için
aşağıdakilerden hangisi söylenebilir?
A)
64 karar, 6 yargı
B)
64 ve 6 ölçme sonucu
C)
64 ve 6 değerlendirme sonucu
D)
64 ölçme sonucu, 6 karar*
E)
64 yargı, 6 değerlendirme
9. “Öğrencileri bütün yönleriyle tanıma; öğrencilerin bireysel
gelişimlerini izleme; öğrencilerin yeteneklerini belirleme;
öğrenciler hakkında toplanan bilgiyi onların yönlendirilmesinde
kullanma; öğrencilere kendi ürünlerini değerlendirme imkanı verme”
gibi amaçlara hizmet eden değerlendirme aşağıdakilerden hangisidir?
A) Dereceleme ölçekleri
B) Ürün dosyaları*
C) Ödevler
D)Projeler
E)Yazılı sınavlar
KAYNAKÇA
Ölçme ve Değerlendirme bölümü
oluşturulurken
aşağıdaki kaynaklardan
yararlanılmıştır.
Cemal YILDIRIM |
Eğitimde Ölçme ve
Değerlendirme |
ÖSYM Yayınları |
Ankara: 1999 |
Çiğdem KAĞITÇIBAŞI |
İnsan ve İnsanlar |
Evrim Basın, yayım, dağıtım |
İstanbul, 1988 |
D. Ali ÖZÇELİK |
Ölçme ve Değerlendirme |
ÖSYM Yayınları |
Ankara: 1992 |
Halil TEKİN |
Eğitimde Ölçme ve
Değerlendirme |
Yargı Yayınları |
Ankara: 1993 |
Harry Grover TUTTLE |
Rubrics |
||
Hüseyin ÖNCÜ |
Eğitimde Ölçme ve
Değerlendirme |
YAYSAN A.Ş. |
Ankara: 1999 |
İbrahim Ethem ÖZGÜVEN |
Psikolojik Testler |
PDREM Yay. |
Ankara, 1998 |
M. Fuat TURGUT |
Eğitimde Ölçme ve
Değerlendirme Metotları |
Saydam Matbaa |
Ankara: 1992 |
MİLLİ EĞİTİM BAKANLIĞI |
http://ttkb.meb.gov.tr/ogretmen/ İlköğretim Programları ve
Öğretim Materyalleri |
|
Ankara, 2004 |
Ömer BEYDOĞAN |
Okullarda Ölçme ve
Değerlendirme |
A.Ü. KKEF yayınları |
Erzurum: 1998 |
Özcan DEMİREL |
Planlamadan Değerlendirmeye
Öğretme Sanatı |
PEGEMA |
Ankara: 2004 |
Terri L WENZLAFF,
Jennifer J. FAGER,
Marta J. COLEMAN |
What is a Rubric? Do
Practitioners and the Literature Agree? |
||
Yaşar BAYKUL |
Eğitimde ve Psikolojide Ölçme |
ÖSYM yayınları |
Ankara: 2000 |
Yaşar BAYKUL |
İstatistik: Metotlar ve
Uygulamalar |
Anı Yayınları |
Ankara, 1999 |
Yaşar BAYKUL, Selahattin
GELBAL Hülya KELECİOĞLU |
Eğitimde Ölçme ve
Değerlendirme |
MEB Yayınları |
Ankara: 2001 |
Veysel SÖZNMEZ |
Öğretmen El Kitabı |
PEGEM Yayınları |
Ankara, 1994 |
DENEME 1
1. Bir testin güvenirliğini aşağıdakilerden
hangisi daha iyi açıklar?
a) Test bir çok durumda kullanılmaya uygundur
b) Testin başka bir testle korelasyonu yüksektir
c) Test bireylerin başarısını az hata ile ölçebilir
d) Test şans başarısını azaltmada kullanılabilir
e) Test konu kapsamını ölçebilecek niteliktedir
2.
1. Bir davranışa sahip olanla olmayanı ayırabilme düzeyi
2. Ölçmelere karışan ortalama hata miktarı
3. Gözlemlerin hatalardan arınıklık derecesi
4. Ölçme aracının amaca uygunluk derecesi
5. Ölçme sonuçlarının bir ölçütle karşılaştırılması
Yukarıdakilerden hangileri geçerliği tanımlamada
kullanılabilir?
a) 2-3
b) 1-4
c) 2-4
d) 2-5
e) 3-5
***3 ve 4. soruları
aşağıdaki tabloya göre cevaplayınız.
|
I. TEST |
2. TEST |
3. TEST |
4. TEST |
5. TEST |
Güvenirlik |
0,77 |
0,65 |
0,99 |
0,50 |
0,45 |
Geçerlik |
0,77 |
0,60 |
0,30 |
0,40 |
-0,15 |
3. Geçerlik güvenirlik arasındaki ilişkilere
bağlı olarak yukarıdaki testlerin hangisinde güvenirlik katsayısı
yanlış hesaplanmıştır?
a) 1
b) 2
c) 3
d) 4
e) 5
4. Yukarıdaki testlerden hangisini kullanmak
daha doğru olur?
a) 1
b) 2
c) 3
d) 4
e) 5
5. Bir dershane, on gün önce öğrencilerinin
Ö.S.S deneme sınavından aldığı puanlarla Ö.S.S. sınavından aldığı
puanlar arasındaki ilişkiyi araştırmaktadır. Elde edilecek sonuç
deneme sınavının hangi özelliğini gösterir?
a) İç Tutarlığını
b) Standart Hatasını
c) Yordama Geçerliği
d) Kararlılık Düzeyi
e) Yapı Geçerliği
6. Bir puan dağılımı hakkında özet bilgiler
veren tipik değerlere ne ad verilir?
a) Merkezi eğilim ölçüleri
b) Değişim ölçüleri
c) Sabit ölçüler
d) Dağılım ölçüleri
e) Saçılım ölçüleri
7. Bir testin kolay mı yoksa zor mu olduğunu
belirlemek için aşağıdaki katsayılardan hangisini hesaplamak
gerekir?
a) Basıklık
b) Regresyon
c) Korelasyon
d) Değişim
e) Çarpıklık
8. Bir testte 40 soru sorulmuş ve standart
sapması 5, ortalaması 20 bulunmuştur. Bu sınavdan 30 alan bir
öğrencinin T puanı kaçtır?
a)
40
b) 50
c) 60
d) 70
e) 80
9. Uygulanan bir matematik testi sonucunda
bütün sınıf başarılı olmuştur. Bu durumda aşağıdakilerden hangisini
kesinlikle söyleyemeyiz?
a) Testteki maddeler ayırt edicidir
b) Testteki maddeler kapsamı iyi örneklemiştir
c) Testteki maddeler çok kolaydır
d) Öğrenciler matematik başarısı bakımından benzeşiktir
e) Öğrenciler ölçülecek davranışları kavramıştır
***10-12 soruları aşağıdaki dağılımlara göre
cevaplayınız.
10. Yukarıdaki dağılımların hangisinde merkezi
eğilim ölçüsü olarak ortancayı kullanmak doğru olur?
a) 1
b) 2
c) 3
d) 4
e) 5
11. Yukarıdaki dağılımların hangisinde birden
fazla mod vardır?
a) 1
b) 2
c) 3
d) 4
e) 5
12. Yukarıdaki dağılımların en basık olanı hangisidir?
a) 1
b) 2
c) 3
d) 4
e) 5
13. Aşağıdakilerden hangisi kısa cevaplı
testlerin özelliklerinden biri değildir?
a) Puanlama kolaydır
b) Bilgi düzeyi davranışları ölçer
c) Cevaplar şişirilebilir
d) Her eğitim düzeyine uygundur
e) Çeşitli yetenek alanına uygundur
14. Aşağıdakilerden hangisi eşit aralık ölçeğinde elde
edilmiştir?
a) Günlük görüşülen hasta sayısı
b) Ayakkabı numarası
c) Sahadaki takım sayısı
d) Öğrenim görülen fakülte
e) Standartlaştırılmış başarı puanı
***15-16. soruları aşağıdaki tabloya göre
yanıtlayınız.
S
Sınıf 1
50
15
Sınıf 2
40
5
Sınıf 3
50
10
Sınıf 4
60
15
Sınıf 5
70
10
15. Yukarıdaki tabloya göre öğrencilerin
başarıları arasındaki farklar hangi sınıfta daha büyüktür?
a) 1
b)2
c) 3
d) 4
e)5
16. Yukarıdaki tabloya göre hangi sınıftaki öğrenciler
birbirlerine daha yakın not almışlardır?
a) 1
b)2
c) 3
d) 4
e)5
17.Aşağıdakilerden hangisi sınıflı ölçekler için
kullanılabilecek istatistiksel tekniklerden biridir?
a) Ortalama
b) Korelasyon
c) Varyans
d) Ortanca
e) Mod
18. Aşağıdakilerden hangisi değerlendirme ile
ilgili değildir?
a) Bir yargılama ve karar verme işidir.
b) İki özelliğin karşılaştırılmasına dayanır.
c) Ölçümlerden bir anlam çıkarmadır.
d) Davranış derecesini belirleme işidir.
e) Bir değer yargısına varmaktır.
19. Aşağıdakilerden hangisi bir yargıya varmak
amacıyla yapılmaz?
a) Programın sağlamlığını denemek
b) Öğretim yönteminin etkililiğine bakmak
c) Öğrencilerin başarısına karar vermek
d) Öğretilenlerdeki eksiklikleri saptamak
e) Ölçme aracının güvenirliğini belirlemek
20. Aşağıdaki önermelerden hangisi yanlıştır?
a) Güvenirlik arttıkça hata azalır.
b) Güvenirlik +1 ile –1 arasında değer alır.
c) Madde sayısı arttıkça güvenirlik artar.
d) Güvenirlik geçerlik için ön şarttır.
e) Tutarlık güvenirliğin anlamlarındandır.
DENEME 2
1- Öğrencilerin derste öğrenemedikleri konuları
saptayıp, konularla ilgili, yeni etkinlikleri yapmaya olanak
tanıyan sınav türlerine genel olarak ne isimi verilir?
A) Zeka Testleri
B) Performans Testleri
C) Başarı Testleri
D) İzleme Testleri
E) Seçme Testleri
2- Sınav planını aşağıdakilerden hangisi
daha iyi açıklar?
A)Öğrencilerin sınava gireceği koşulları
belirleme
B)Öğrencilere sorulacak soruları belirleme ve
yazma
C)İstenilir özelliklere sahip bir ölçme aracı
elde etme süreci
D)Uygulanmış bir testin geçerli olan
maddelerini seçme
E)Seçenekleri iyi işlemeyen maddeleri
seçeneklerini düzeltme
3- Aşağıdakilerden hangisinde ölçme işlemi
yoktur?
A)Bir sınıftaki öğrencileri sarışın, esmer ve
kumral diye gruplamak
B)Bir ceket üzerindeki kol düğmelerini saymak
C)Bir otobüsün iki durak arasını kaç dakikada
aldığını belirlemek
D)Bir sınıftaki kız ve erkek öğrencilerin
sayılarını saptamak
E)İyi bir bilgisayar almak için minimum donanım
özelliklerini belirlemek
4- Bir dersane öğrencilerine deneme sınavı
uygulanmış ve ÖSS’de öğrencilerinin bu sınavdan alacağı puanlara
yakın puan alacağını iddia etmiştir. Dersanenin
iddiasının gerçekleşmesi deneme sınavının en çok hangi
özelliğine bağlıdır?
A) İç tutarlığına
B) Yapı geçerliğine
C) Objektifliğine
D) Yordama geçerliğine
E) Duyarlığına
5- Aşağıdakilerden hangisi testtin
güvenirliğini artırmayı sağlamaz?
A)Ölçülecek her davranışla ilgili soru
sorulması
B)Soruların çok beğenilen bir kitaptan alınması
C)Öğrencilere gereğinden fazla süre verilmemesi
D)Testin tümünün çok zor sorulardan
oluşturulması
E)Sınav koşullarının motivasyonu düşürecek
etkilerden arındırılması
6- Aşağıdakilerden hangisi portfolya (dosya)
değerlendirmenin öğrenciye sağladığı avantajlardan biri değildir?
A)Öğrencilerin yaratıcılıklarını geliştirmede
etkilidir
B)Öğrencilere sorumluluk almayı öğretir
C)Öğrencinin kendi değerlendirmesine katılımını
sağlar
D)Öğrencilere hangi arkadaşlarından daha fazla
bilgi sahibi olduğunu gösterir
E)Öğrenciler bir sınavla değil süreç içinde
değerlendirilir.
7- Aşağıdakilerden hangisi bir değerlendirme
işlemi değildir?
A)Doktorun muayene ettiği kişinin hasta
olduğunu belirlemesi
B)Yönünü kaybetmiş birinin kutup yıldızına
bakarak yönünü belirlemesi
C)Türkçe öğretmenin ders kitabını inceleyerek
yetersiz bulması
D)Öğretmenin geliştirdiği testin güvenirlik
değerine yüksek demesi
E)Bir kişinin bir numara büyük ayakkabı almaya
karar vermesi
8- Doğru yanlış testlerinin eğtim bilim
açısından uygun olmayan en önemli özelliği nedir?
A)Seçenek sayısının az olması
B)Yanlışı vurgulaması
C)Alt eğitim sevilerine uygun olmaması
D)Çoktan seçmeli testlere benzemesi
E)Üst düzey davranışları yoklayamaması
9-Çoktan seçmeli testlerde seçenek sayısını
azaltmanın temel gerekçesi ne olmalıdır?
A)Şans başarısını artırmak
B)Puanlama hatasını azaltmak
C)Soruları zorlaştırmak
D)Alt eğitim kademelerinde kullanmak
E)Soruları kolaylaştırmak
10- I. Sınıflama ölçekleri
II. Sıralama ölçekleri
III. Eşit aralıklı ölçekler
IV. Oranlı ölçekler
Öğretimde kullanılan ölçek
türleri hangisidir?
A)I ve II
B)II ve III
C)I, II ve III
D)II, III ve IV
E)III ve IV
11- Nesneler
arasındaki nitelik farklarının miktarını gösteren ölçek türüne ne ad
verilir?
A)Sınıflama
B)Sıralama
C)Eşit aralıklı
D)Oranlı
E)Adlandırma
12- Aşağıdakilerden hangisi güvenirliğin
tanımlarından biri değildir?
A)Bir ölçme aracının ölçme sonuçlarına hata
karıştırmadan ölçme yapabilmesi
B)Özelliği ölçülen varlık veya olayların bu
özelliğinde bir değişme olmadıkça, onları hep aynı sıraya koyan
ölçüler vermesi
C)Bir ölçme aracının, ölçmesi amaçlanan
özelliği başka değişkenlerle karıştırmadan ölçmesi
D)Bir ölçme aracının ölçtüğü özelliği ne derece
bir kararlılıkla yansıtabildiği
E)Aynı bireyler üzerinde yapılan bir niteliğe
ait ölçümlerin benzer şartlarda tekrar elde edilebilirliği
13-Ortalaması eşit iki gruptan birincinin bağıl
değişim katsayısı 30, ikincinin 15’dir. Bu bilgilere dayanarak iki
grubun st. sapması için aşağıdakilerden hangisini söyleyebiliriz?
A) Birinci grubun st. sapması ikinci grubun st.
sapmasından büyüktür.
B) Birinci grubun st. sapması ikinci grubun st.
sapmasına eşittir.
C) Birinci grubun st. sapması ikinci grubun st.
sapmasından küçüktür.
D) Grup st. sapmalarını karşılaştırmak için
yeterli bilgi yoktur.
E) İkinci grubun st. sapması birinci grup st.
sapmasının iki katıdır.
14- Bir gruba Türkçe ve Matematik testi
uygulanıyor. Gruptaki bireyler bu testlerden elde
ettikleri z puanlarına göre sıraya konuluyor. Ardından grubun t
puanları hesaplanıyor ve t puanlarına göre sıralama yapılıyor. Bu
iki sıralama arasındaki korelasyon katsayısı için aşağıdakilerden
hangisi doğru olur?
A)Negatif olur
B)Negatif mükemmel olur
C)Sıfır olur
D)Pozitif olur
E)Pozitif mükemmel olur
15-
Dersler |
Ortalama |
St. sapma |
Not |
Türkçe |
80 |
10 |
90 |
Matematik |
50 |
5 |
55 |
Fen |
60 |
15 |
75 |
Yukarıdaki tabloda, bir öğrencinin Türkçe,
Matematik ve Fen derslerine ait sınav notları ve bu sınavların
ortalamaları ile standart sapmaları görünmektedir. Bu bilgilere göre
öğrencinin üç dersteki başarısı hakkında varılacak hangi karar doğru
olur?
A) Öğrenci en yüksek başarıyı Matematik
dersinde göstermiştir.
B)Öğrenci en yüksek başarıyı Türkçe dersinde
göstermiştir.
C)Öğrenci en yüksek başarıyı Fen dersinde
göstermiştir.
D) Öğrenci her üç derste de aynı düzeyde
başarılı olmuştur.
E)Verilen bilgiler karşılaştırma yapmak için
yeterli değildir.
***16-18 soruları tabloya göre cevaplayınız
Gruplar |
A |
B* |
C |
D |
E |
Toplam |
Üst Grup Alt Grup |
20 20 |
30 20 |
20 20 |
20 25 |
10 15 |
100 100 |
Toplam |
40 |
50 |
40 |
45 |
25 |
200 |
*B doğru cevap olduğuna göre
16- Sorunun güçlük indeksi kaçtır?
A) 0.60
B) 0.50
C) 0.30
D) 0.25
E) 0.20
17- Sorunun ayırıcılık gücü indeksi kaçtır?
A) 0.10
B) 0.20
C) 0.30
D) 0.40
E) 0.50
18- Bu soruda yapılması gereken en önemli
işlem ne olmalıdır?
A)A ve C seçenekleri doğru cevaba
yakınlaştırılmalıdır.
B)Doğru cevap alt gruptan çok öğrenci çektiği
için değiştirilmelidir.
C)Zor bir soru olduğundan kolaylaştırılmalıdır.
D)D çeldiricisi alt gruptan çok öğrenci
çektiğinden değiştirilmelidir.
E)Maddenin geçerliğini artırmak gereklidir.
DENEME 3
1.Bir okul müdürü, kayıt yaptırmak için
başvuran öğrencileri iyi, orta, zayıf diye üç gruba ayırıp, buradan
elde edeceği sonuçlara göre öğrencileri uygun şubelere yerleştirmek
istemektedir. Buna göre amaca en iyi hizmet edecek test türü
hangisidir?
A) Zeka Testi
B) Hazır bulunuşluk Testi
C) Kişilik Testi
D) Başarı Testi
E) İzleme Testi
2.Test palanında madde seçme işleminde önceki
ve sonraki aşamaları aşağıdakilerden hangisinde doğru verilmiştir.
A)Önceki: Maddelerin düzeltilmesi
Sonraki: Deneme formunun oluşturulması
B)Önceki: Ölçülecek davranışların belirlenmesi
Sonraki: Asıl test formunun oluşturulması
C) Önceki: Deneme
uygulamasının yapılması
Sonraki: Asıl test formunun oluşturulması
D) Önceki: Sınav türüne ve
soru tipine karar verme
Sonraki: Deneme uygulamasını yapma
E) Önceki: Madde
analizlerini yapma
Sonraki: Asıl test formunu oluşturma
3.
I. Ayşe’nin boy uzunluğu
II. Ayşe matematik sınavından 65 puan alarak
geçmiştir
III. Ayşe voleybol takımına seçilecek boy
uzunluğuna sahiptir
IV. Ayşe ÖSS’ de 250 puan almıştır
V. Ayşe’nin puanı sınıfını geçmeye yetmemiştir.
Yukarıdaki
ifadelerin hangilerinde ölçme işlemi vardır?
A) I-IV
B) I-V
C) II-IV
D) II-III
E) III-V
4.Bir ölçme aracı göz önüne alınmasa;
kazandırılmak istenen davranışların konu ve hedeflere göre
dağılımını gösteren belirtke tablosunun en önemli yararı
nedir?
A)Güvenirliği yüksek bir test oluşturmak için
sormamız gereken soru sayısını gösterir
B)Kapsam geçerliğini belirlemeye veya sağlamaya
dayanak oluşturur
C)Özellikle kazandırılacak kritik davranışları
belirlememizi kolaylaştırır
D)Hangi konuya ne kadar zaman ayıracağımıza
çabuk karar vermemizi sağlar
E))Her konuda kazandırılacak davranışlara
açıkça görmemizi sağlar
5.Aşağıdakilerden hangisi bir öğretmenin yazılı
sınav sonuçlarının güvenirliğini artırmak için alabileceği önlemler
arasında değildir?
A)Tanıdık öğrencilere daha hoş görüsüz
davranarak düşük puan vermek
B) Cevaplara verdiği puanları dikkatli toplayıp
kaydetmek
C) önceden hangi cevaplara ne kadar puan
vereceğini belirlemek
D) Birkaç gün sonra kağıtlara yeniden puanlamak
E) aynı konuda uzman en az bir kişiye daha
puanlama yaptırmak
6.Portfolyo (dosya) değerlendirmenin bir sınıf
öğretmenine sağlayacağı avantajların en önemlisi nedir?
A)Bir öğrencinin tüm yönleri ile gelişimini
izleme fırsatı vermesi
B)Öğrencinin sevdiği ve sevmediği dersleri
görmemizi sağlaması
C)Öğrencinin yetenekli olduğu alanları açığa
çıkarması
D)Öğrencilerin psikolojik sorunlarını tespit
etmeyi olanaklı kılması
E)Öğrencilerin arkadaşları hakkındaki
düşüncelerini açıklayabilmeleri
7.Ciddi bir lokanta ilginç bir uygulama
başlatarak kravat takmayan müşterileri lokantaya almamaktadır. Bu
uygulama açısından kravat için aşağıdaki nitelemelerin hangisi doğru
olur?
A) Ölçüttür
B) Kuraldır C)
Geçerliktir D) Değer Yargısıdır E)
Değerlendirmedir
8.Aşağıdakilerden hangisi kısa cevaplı
sınavların yazılı sınavlardan en üstün yönüdür?
A)Geniş bir kapsamı ölçmesi
B)Şans başarısının olmaması
C)Cevapların sınırlı olması
D)Soruların objektif puanlanması
E)Daha kullanışlı olması
9.Aşağıdakilerden hangisi çoktan seçmeli test
maddelerinden soru köküne göre maddedir?
A)Soru kipinde
B)Tek bir cevabı olan
C)Ortak köklü
D)Ortak seçenekli
E)Birleşik cevap gerektiren
10.
Bir çoktan seçmeli teste verilen doğru cevaplar, o testi alan grubun
ortalaması ve standart sapması dikkate alınarak tekrar
hesaplanmıştır. Bu şekilde elde edilen puanlara standart
puanlar denir. Standart puanlar hangi ölçek niteliğindedir?
A)Sınıflama
B)Sıralama C)Eşit aralıklı
D)Oranlı
E)Adlandırma
11. Çoktan seçmeli bir testin
maddelerinin herkes tarafından aynı biçimde anlaşılmaması, bu
testin hangi niteliğini düşürür?
A)Güvenirliğini
B)Kapsam geçerliğini
C)Yapı geçerliğini
D)Kullanışlılığını
E)Uygunluk geçerliğini
12. 100 metreyi, yarışa katılanlar arasından
ilk 5’e girerek tamamlayanlar okul takımına seçilecektir. Bu seçme
işlemi, aşağıdaki ifadelerden hangisini açıklamak için iyi bir
örnektir?
A)Bağıl değerlendirme
B)Mutlak değerlendirme
C)Temel ölçme
D)Dolaylı ölçme
E)Ölçüt dayanaklı ölçme
**13-15. soruları aşağıdaki tabloya göre
cevaplayınız.
9. SORU |
D |
Y |
T |
Üst grup |
30 |
20 |
50 |
Alt grup |
20 |
30 |
50 |
T |
50 |
50 |
100 |
13. Sorunun güçlük indeksi kaçtır?
A) 0,35
B)0,45
C)0,50
D)0,55
E)0,60
14. Sorunun ayırıcılık indeksi kaçtır?
A) 0,20
B)0,40
C)0,50
D)0,60
E)0,80
15. Bu madde için aşağıdaki yorumlardan hangisi
daha doğrudur?
A) Madde orta güçlükte ve ayırıcılığı
yeterlidir.
B) Madde orta güçlükte ama ayırıcılığı
sıfırdır.
C) Amacına hizmet edemeyen zor bir maddedir.
D) Madde orta güçlükte fakat düzeltilmelidir.
E) Madde hem zor hem de ayırıcılığı yüksektir.
**50 soruluk bir test 5 ayrı sınıfa uygulanmış
ve aşağıdaki istatistikler elde edilmiştir.
|
Ortalama |
Mod |
Ortanca |
St. sapma |
1. sınıf |
35 |
45 |
40 |
4 |
2. sınıf |
35 |
30 |
32 |
5 |
3. sınıf |
35 |
15 |
20 |
7 |
4. sınıf |
35 |
40 |
37 |
8 |
5. sınıf |
35 |
35 |
35 |
6 |
16.Tabloya göre hangi sınıfın puan dağılımı
simetriktir?
A) 1
B) 2
C) 3 D)
4 E) 5
17.Tabloya göre en yüksek öğrenme düzeyi hangi
sınıfta gerçekleşmiştir?
A) 1
B) 2
C) 3 D)
4 E) 5
18.Tabloya göre en düşük öğrenme düzeyi hangi
sınıfta gerçekleşmiştir?
A) 1
B) 2
C) 3 D)
4 E) 5
1- Öğrencilerin derste öğrenemedikleri konuları
saptayıp, konularla ilgili, yeni etkinlikleri yapmaya olanak tanıyan
sınav türlerine genel olarak ne isimi verilir?
A) Zeka Testleri
B) Performans Testleri
C) Başarı Testleri
D) İzleme Testleri
E) Seçme Testleri
2- Sınav planını aşağıdakilerden hangisi
daha iyi açıklar?
A)Öğrencilerin sınava gireceği koşulları
belirleme
B)Öğrencilere sorulacak soruları belirleme ve
yazma
C)İstenilir özelliklere sahip bir ölçme
aracı elde etme süreci
D)Uygulanmış bir testin geçerli olan
maddelerini seçme
E)Seçenekleri iyi işlemeyen maddeleri
seçeneklerini düzeltme
3- Aşağıdakilerden hangisinde ölçme işlemi
yoktur?
A)Bir sınıftaki öğrencileri sarışın, esmer ve
kumral diye gruplamak
B)Bir ceket üzerindeki kol düğmelerini saymak
C)Bir otobüsün iki durak arasını kaç dakikada
aldığını belirlemek
D)Bir sınıftaki kız ve erkek öğrencilerin
sayılarını saptamak
E)İyi bir bilgisayar almak için minimum
donanım özelliklerini belirlemek
4- Bir dersane öğrencilerine deneme sınavı
uygulanmış ve ÖSS’de öğrencilerinin bu sınavdan alacağı puanlara
yakın puan alacağını iddia etmiştir. Dersanenin
iddiasının gerçekleşmesi deneme sınavının en çok hangi
özelliğine bağlıdır?
A) İç tutarlığına
B) Yapı geçerliğine
C) Objektifliğine
D) Yordama geçerliğine
E) Duyarlığına
5- Aşağıdakilerden hangisi testtin
güvenirliğini artırmayı sağlamaz?
A)Ölçülecek her davranışla ilgili soru
sorulması
B)Soruların çok beğenilen bir kitaptan
alınması
C)Öğrencilere gereğinden fazla süre verilmemesi
D)Testin tümünün çok zor sorulardan
oluşturulması
E)Sınav koşullarının motivasyonu düşürecek
etkilerden arındırılması
6- Aşağıdakilerden hangisi portfolya (dosya)
değerlendirmenin öğrenciye sağladığı avantajlardan biri değildir?
A)Öğrencilerin yaratıcılıklarını geliştirmede
etkilidir
B)Öğrencilere sorumluluk almayı öğretir
C)Öğrencinin kendi değerlendirmesine katılımını
sağlar
D)Öğrencilere hangi arkadaşlarından daha
fazla bilgi sahibi olduğunu gösterir
E)Öğrenciler bir sınavla değil süreç içinde
değerlendirilir.
7- Aşağıdakilerden hangisi bir değerlendirme
işlemi değildir?
A)Doktorun muayene ettiği kişinin hasta
olduğunu belirlemesi
B)Yönünü kaybetmiş birinin kutup yıldızına
bakarak yönünü belirlemesi
C)Türkçe öğretmenin ders kitabını inceleyerek
yetersiz bulması
D)Öğretmenin geliştirdiği testin güvenirlik
değerine yüksek demesi
E)Bir kişinin bir numara büyük ayakkabı
almaya karar vermesi
8- Doğru yanlış testlerinin eğtim bilim
açısından uygun olmayan en önemli özelliği nedir?
A)Seçenek sayısının az olması
B)Yanlışı vurgulaması
C)Alt eğitim sevilerine uygun olmaması
D)Çoktan seçmeli testlere benzemesi
E)Üst düzey davranışları yoklayamaması
9-Çoktan seçmeli testlerde seçenek sayısını
azaltmanın temel gerekçesi ne olmalıdır?
A)Şans başarısını artırmak
B)Puanlama hatasını azaltmak
C)Soruları zorlaştırmak
D)Alt eğitim kademelerinde kullanmak
E)Soruları kolaylaştırmak
10- I. Sınıflama ölçekleri
II. Sıralama ölçekleri
III. Eşit aralıklı ölçekler
IV. Oranlı ölçekler
Öğretimde kullanılan ölçek
türleri hangisidir?
A)I ve II
B)II ve III
C)I, II ve III
D)II, III ve IV
E)III ve IV
11- Nesneler arasındaki
nitelik farklarının miktarını gösteren ölçek türüne ne ad verilir?
A)Sınıflama
B)Sıralama
C)Eşit aralıklı
D)Oranlı
E)Adlandırma
12- Aşağıdakilerden hangisi güvenirliğin
tanımlarından biri değildir?
A)Bir ölçme aracının ölçme sonuçlarına hata
karıştırmadan ölçme yapabilmesi
B)Özelliği ölçülen varlık veya olayların bu
özelliğinde bir değişme olmadıkça, onları hep aynı sıraya koyan
ölçüler vermesi
C)Bir ölçme aracının, ölçmesi amaçlanan
özelliği başka değişkenlerle karıştırmadan ölçmesi
D)Bir ölçme aracının ölçtüğü özelliği ne derece
bir kararlılıkla yansıtabildiği
E)Aynı bireyler üzerinde yapılan bir niteliğe
ait ölçümlerin benzer şartlarda tekrar elde edilebilirliği
13-Ortalaması eşit iki gruptan birincinin bağıl
değişim katsayısı 30, ikincinin 15’dir. Bu bilgilere dayanarak iki
grubun st. sapması için aşağıdakilerden hangisini söyleyebiliriz?
A) Birinci grubun st. sapması ikinci
grubun st. sapmasından büyüktür.
B) Birinci grubun st. sapması ikinci grubun st.
sapmasına eşittir.
C) Birinci grubun st. sapması ikinci grubun st.
sapmasından küçüktür.
D) Grup st. sapmalarını karşılaştırmak için
yeterli bilgi yoktur.
E) İkinci grubun st. sapması birinci grup st.
sapmasının iki katıdır.
14- Bir gruba Türkçe ve Matematik testi
uygulanıyor. Gruptaki bireyler bu testlerden elde
ettikleri z puanlarına göre sıraya konuluyor. Ardından grubun t
puanları hesaplanıyor ve t puanlarına göre sıralama yapılıyor. Bu
iki sıralama arasındaki korelasyon katsayısı için aşağıdakilerden
hangisi doğru olur?
A)Negatif olur
B)Negatif mükemmel olur
C)Sıfır olur
D)Pozitif olur
E)Pozitif mükemmel olur
15-
Dersler |
Ortalama |
St. sapma |
Not |
Türkçe |
80 |
10 |
90 |
Matematik |
50 |
5 |
55 |
Fen |
60 |
15 |
75 |
Yukarıdaki tabloda, bir öğrencinin Türkçe,
Matematik ve Fen derslerine ait sınav notları ve bu sınavların
ortalamaları ile standart sapmaları görünmektedir. Bu bilgilere göre
öğrencinin üç dersteki başarısı hakkında varılacak hangi karar doğru
olur?
A) Öğrenci en yüksek başarıyı Matematik
dersinde göstermiştir.
B)Öğrenci en yüksek başarıyı Türkçe dersinde
göstermiştir.
C)Öğrenci en yüksek başarıyı Fen dersinde
göstermiştir.
D) Öğrenci her üç derste de aynı düzeyde
başarılı olmuştur.
E)Verilen bilgiler karşılaştırma yapmak için
yeterli değildir.
***16-18 soruları tabloya göre cevaplayınız
Gruplar |
A |
B* |
C |
D |
E |
Toplam |
Üst Grup Alt Grup |
20 20 |
30 20 |
20 20 |
20 25 |
10 15 |
100 100 |
Toplam |
40 |
50 |
40 |
45 |
25 |
200 |
*B doğru cevap olduğuna göre
16- Sorunun güçlük indeksi kaçtır?
A) 0.60
B) 0.50
C) 0.30
D) 0.25
E) 0.20
17- Sorunun ayırıcılık gücü indeksi kaçtır?
A) 0.10
B) 0.20
C) 0.30
D) 0.40
E) 0.50
18- Bu soruda yapılması gereken en önemli
işlem ne olmalıdır?
A)A ve C seçenekleri doğru cevaba
yakınlaştırılmalıdır.
B)Doğru cevap alt gruptan çok öğrenci çektiği
için değiştirilmelidir.
C)Zor bir soru olduğundan kolaylaştırılmalıdır.
D)D çeldiricisi alt gruptan çok öğrenci
çektiğinden değiştirilmelidir.
E)Maddenin geçerliğini artırmak
gereklidir.