Ölçme Ders Notları

I- TEMEL KAVRAMLAR

1.1 Ölçmenin Temelleri

Ölçme ve değerlendirme konusuna nereden başlanacağına, “neden ölçme yaparız?” sorusuna cevap vererek ulaşabiliriz. Çünkü amacımızın ya da ölçme işlemimizin gerekçesi ölçmeyi nasıl yaptığımızdan da önemlidir. En azından ilk önce yanıtlanması gereken soru budur.

Yukarıdaki soruya birçok yanıt vermek mümkün olmakla birlikte temel yanıtlardan birisi çevremizdeki çoğu şeyin değişmesi olacaktır. Yani değişme olmasaydı ya da her şey sabit olsaydı ölçme yapmaya ihtiyacımız olmazdı. En azından sürekli olarak ölçme yapmazdık. Bir kez ölçme yaptıktan sonra bu işlemi başka zaman veya yerde tekrarlamamıza gerek kalmazdı. Çünkü değişme olmadığı için ölçme sonucu aynı kalacaktır. Değişme olmaması ölçme işlemini gereksiz kılacaktı.

Açıklamalar ışığına ölçme değişmeleri ortaya koyma veya değişkenlerin değişen değerlerini belirlemek amacıyla yapılır diyebiliriz. Yani “niye ölçeriz?” sorusuna değişme olduğu için; “neyi ölçeriz?” sorusuna da değişkenleri cevabını vermek mümkündür. Bu durumda değişkenler üzerinde durulması, değişken kavramının tanımlanması gerekmektedir.

Değişken: Birkaç tanım vermek mümkündür. En az iki değer alan veya bir durumdan diğerine farklılık gösteren, çeşitli değerler alabilen -insana, olaylara, eşyaya ait niteliklere- özelliklere denir. Yani, durumdan duruma, yerden yere, zamandan zamana farklılaşan özelliklerin tümüne değişken adı verilebilir. Ör: Boy uzunluğu, ağırlık, hava sıcaklığı, matematik yeteneği vb.

Çevremizdeki çoğu şeyin değişmesine rağmen sabit olan özelliklere de rastlamaktayız. Bir durumdan diğerine değişmeyen veya ikiden az değer alan özelliklere sabit denir. Ör. Maddenin özgül ağırlığı, pi sayısı vb.

Bir özellik ya değişkendir ya da sabittir. Değişkenlik ya da sabitlik nesnelerin özellikleri ile ilgilidir. Örneğin soğuk ve nem oranı hava nesnesinin iki özelliğini; çalışkanlık ve boy uzunluğu insanın iki özelliğini göstermektedir. Değişkenler belli ölçütlere göre sınıflanabilirler. Bu sınıflamalardan bazıları tablo 1’de görünmektedir.

Tablo 1’de görülen değişkenlerden nicel değişkenler sayılarla ifade edilebilirken nitel değişkenler, sıfatlarla veya sembollerle ifade edilir. Nitel değişkenler sayılarla gösterildiğinde sayılar işlemsel anlamını yitirir. Sembollere, simgelere dönüşür. Özelliklere sayıların karşı getirilmesi, matematiğin kural ve işlemlerinin uygulanması sayesinde, özelliklerin büyüklükleri ve aralarındaki ilişkileri görmeye imkân sağlar. Değişkenlerin nitel veya nicel olması onlara uygulanacak işlemlerle ilişkilidir ve bu işlemlerin sınırını belirler.

Sürekli değişkenlerin ele alınacak iki değeri arasında her zaman yeni bir değer bulunabilir. Yani iki değeri arasında sonsuz sayıda değerler alabilir. Uzunluk, ağırlık bu tür değişkenlere örnek olarak verilebilir. Örneğin uzunluk santimetre, milimetre, mikron vb. daha küçük birimlere bölünerek ölçülebilir. Kesikli değişkenler ise iki değeri arasında birkaç değer alabilir ama sonsuz sayıda değer alamaz. Bu nedenle süreksizdir. Bu tür değişkenlere sıfatlar, semboller veya doğal sayılar karşılık getirilebilir. Sürekli değişkenin değerleri listelenemezken kesikli değişkenin değerleri listelenebilir. Liste sonlu sayıdadır.

Tablo 1. Değişkenler bazı ölçütlere göre sınıflanması

Ölçütler	Değişken türü	Tanım	Örnekler
Değişkenin alacağı değer	1.Nicel Değişken	Sayılarla ifade edilebilen özelliklerdir.	Boy uzunluğu, ağırlık
	2.Nitel Değişken	Sıfatlarla veya sembollerle ifade edilebilen özelliklerdir. Bu tür değişkenler sayılarla gösterildiğinde sayılar işlemsel anlamını yitirir. Sembollere simgelere dönüşür.	Medeni durum, Mezun olunan okul türü
	3. Sürekli Değişken	Matematiksel olarak herhangi iki değeri arasında bir başka değeri bulunabilen değişkenlere sürekli değişken denir. Başka bir deyişle sürekli değişkenin iki değeri arası sürekli bölünebilir.	Uzunluk, ağırlık, reel sayılar sistemi
	4. Süreksiz Değişken (Kesikli Değişken)	Değişken, farklı iki değeri arasında başka bir veya birkaç değer dışında değer alamıyorsa, süreksizdir. Bu tür değişkenlere sıfatlar, semboller veya doğal sayılar karşılık getirilebilir.	Cinsiyet (Kadın-Erkek), diploma derecesi (pekiyi, iyi, orta, zayıf) vb. Tavla zarında gelebilecek sayılar kesiklidir.
Araştırmanın amacı	5. Bağımsız Değişken (Etkileyen değişken)	Aldığı veya alacağı değerler başka değişken(ler)e bağlı olmadan değerler alabilen değişkenlerdir.	Örnekler: 1-Derse karşı Tutum 2-Şişmanlık
	6.Bağımlı Değişken (Etkilenen Değişken)	Başka bir değişkene bağlı olarak değerler alabilen değişkenlerdir.	1-Başarı 2-Elbise beden numarası
	7.Ara Değişken (Katalizör)	Bağımsız değişkenlerin bağımlı değişkenler üzerindeki etkilerini artıran veya azaltan değişkenlerdir.	Tutum-Başarı değişkenleri arasındaki ilişkide öğretmen davranışlarının niteliği ara değişken olabilir.

Değişkenler araştırmanın amacına göre bağımlı ya da bağımsız değişkenler olarak sınıflanabilir. Doğası gereği kendi başına bağımlı ya da bağımsız bir değişken yoktur. Yani araştırmacının amacına bağlı olarak bir araştırmada bağımlı değişken olan bir özellik başka bir araştırmada bağımsız değişken ya da ara değişken olabilir. Örneğin, bir araştırmacı tarih dersine karşı tutumun tarih başarısını etkileyip etkilemediğini araştırdığında bağımlı değişkenimiz tarih başarısı iken, bağımsız değişkenimiz tarih dersine karşı tutumdur. Ancak aynı araştırmacı tarih dersine çalışmak için ayrılan sürenin tarih başarısını etkileyip etkilemediğini araştırırken, tarih dersine karşı tutumu derse çalışılan süreyi artıran ve azaltan bir ara değişken olarak düşünebilir. Veya yine aynı araştırmacı bir başa çalışmasında tarih öğretmeninin öğrencileri ile sürdürdüğü iletişim biçiminin, öğrencilerin tarih dersine karşı tutumu nasıl etkilediğini araştırabilir. Görüldüğü gibi tutum, birinci araştırmada tutum bağımsız; ikinci araştırmada ara ve üçüncü araştırmada bağımlı değişken olarak işleme alınmaktadır. Bu nedenle değişkenleri bağımlı, bağımsız ve ara değişken olarak sınıflamak istediğimizde araştırmacının amacını dikkate almak zorunluluğumuz vardır.

1.2 Eğitim ve Ölçme-Değerlendirmeye İlişkin Temel Tanımlar

Aslında her eğitim felsefesine göre farklı eğitim tanımları vermek mümkündür. Eğitimin “Bireyin davranışında kendi yaşantıları yoluyla ve kasıtlı olarak istendik değişim meydana getirme süreci” tanımı yaygın kabul gören bir tanımdır.

Buradaki kavramları biraz açacak olursak, kendi yaşantısı kavramı yaparak yaşayarak öğrenmeye; kasıtlı kavramı öğrenme ortamını öğretilecek davranışa göre ayarlamaya (öğretim durumlarına); istendik değişim kavramı önceden belirlenmiş hedef ve davranışlara işaret etmektedir.

Ölçmenin Önemi

Ölçme ve değerlendirmenin eğitimdeki önemi günlük yaşamda ve genel olarak bilimlerdeki öneminin bir yansımasıdır. Örneğin hava durumunu belirlemek için bilgi toplamaz isek günlük yaşamda nasıl giyineceğimize karar veremez, sık sık hava durumu konusunda yanılarak hasta olurduk. Bilimler içinde en duyarlı, en hatasız ölçme yapan bilimlere daha fazla güven vardır. Bilimler gelişmişliğini ölçme ve değerlendirme yöntemlerindeki gelişmişlik derecesine borçludurlar. Bu açıklamalar ışığında sosyal bilimlerdeki ölçme ile fizik bilimlerindeki ölçmeler arasında, ölçtükleri niteliklerden ve ölçme ve değerlendirmede kullandıkları araç ve yöntemlerden kaynaklanan farklılıklar bulunmaktadır.

DEĞERLENDİRME (DÖNÜT-DÜZELTME)

Şekil 1. Sistem Yaklaşımında Ölçme ve Değerlendirmenin Yeri

Şekil 1’den de anlaşılacağı üzere değerlendirme sistemin her basamağında kullanılmaktadır. Ayrıca değerlendirmenin değerlendirmesinden de söz etmek gerekir. Tabii ki değerlendirme yapabilme için ölçme yapmak gereklidir. Değerlendirmede kullanılan ölçütler ve değerlendirme yöntemleri ile değerlendirmeye konu olan bilgiyi toplama amacıyla kullanılan ölçme araçları ve yöntemlerinin de değerlendirilmesi gerekmektedir.

Şemalardan anlaşılacağı üzere eğitim sistemini nasıl bir şema ile gösterirsek gösterelim o şemada ölçme ve değerlendirmeye mutlaka yer verme zorunluluğu vardır. Çünkü ölçme ve değerlendirme eğitim sisteminin temel ve vazgeçilmez öğelerinden biridir.

Ölçmenin Tanımı: “Nitelikleri nicelemek; gözlem sonuçlarını sayısallaştırmak; bir niceliğin gözlenip, gözlem sonuçlarını sayı veya semboller ile gösterilmesi” tanımlarından herhangi birisi kullanılabilir. Ölçme bir gözlemdir. Bir betimleme işidir. Bu tanımlar dışında tanımlar da yapmak mümkündür. “Özellikler kümesiyle sayı veya semboller kümesini eşleme işidir” veya “ampirik küme ile formal küme arasında bir bağıntıdır” gibi tanımlar örnek verilebilir.

Şekil 2. Ölçmenin kuramsal tanımı

Ampirik küme ölçülecek niteliklerin kümesini, formal küme ölçülen nitelikleri göstermek amacıyla kullanılan sayı veya sembol kümesini gösterir.

Özellikler Kümesi İşlemler Kümesi

(Tanım Kümesi) (Değer Kümesi)

Örnek Ulaşılacak davranışlar Ulaşılan Davranışlar

(Sınav Başarısı) (Sınav Notu)

Ölçüm: Özelliklerle ilgili değerlerin her birine, tek tek gözlem sonuçlarına ölçüm denir.

Ölçmenin Özel Anlamı: Bireyler hakkında bilgi toplamaktır.

Ölçme Türleri

1)Doğrudan (Temel/Dolaysız) Ölçme: Herhangi bir niteliği başka nitelikle ilişkilendirmeden gözlemek doğrudan ölçme olarak adlandırılır. (Boy sırasına koyma, Terazi ile tartma, metre ile ölçme)

2)Dolaylı (Göstergeyle) Ölçme: Herhangi bir değişkene ait niteliği başka değişkenler veya araçların niteliğinden faydalanarak ölçmektir.(termometre ile ısı ölçme veya yaylı kantarla ağırlık ölçme: birinci durumda civanın genleşmesi yardımıyla ısı hakkında fikir sahibi olurken, ikinci durumda yayın uzamasına bağlı olarak ağırlık hakkında bir şeyler söyleyebiliriz.)

3)Türetilmiş Ölçme: İki ayrı ölçülen nitelik üzerinde yapılan işlemler yardımıyla yeni bir ölçme sonucuna ulaşmadır. (Örneğin Hız=km/saat (yol / zaman) veya Yoğunluk = Kütle/hacim gibi)

Ölçmede birimler

Ölçme işleminde doğal ve yapay (tanımlanmış) birimlerin olduğundan söz edilebilir. Örneğin, bir işyerinde çalışan işçilerin sayısını bulmak için birim olarak işyerinde çalışan tek bir işçiyi almak doğru olacaktır ve bu ölçmenin doğal birimi olduğu söylenebilir. Ancak, uzunluk, ağırlık, zaman gibi bazı değişkenlerle ilgili birimler tanımlanmış (yapay) birimlerdir. Örneğin, metre ve kilogram üzerinde anlaşılmış veya tanımlanmış birimlerdendir. Birimlerin tanımlanmış olmasının bir sakıncası yoktur ve birçok doğal birimden daha güvenilir ölçme sonuçları elde edilebilir. Zaten birçok birimi tanımlama gereği de üzerinde anlaşmaya varılamayan veya tartışmalara neden olan doğal birimler nedeniyle ortaya çıkmıştır.

Birimlerde aranan üç özellik vardır. Bunlar; eşitlik (ölçeğin her bölmesinin –metredeki her santimetrelerin- birbirine eşit olmasıdır), genellik (birimlerin herkes tarafından aynı anlamda kullanılması veya birimlerin çoğunluk tarafından kabul edilmesidir) ve amaca uygunluk (ölçülecek özelliği ölçmeye uygunluk veya bu özelliği en iyi şekilde yansıtabilmektir) olarak ifade edilebilir.

Ölçmede Araçların Rolü

1-Ölçme sonuçlarının duyarlığını ve güvenirliğini dolayısıyla kesinliğini artırır. Ölçme sonuçlarına karışan hata miktarının azalmasını sağlar.,

2-Duyu organlarımızla ölçme yapamadığımız durumları gözlememizi kolaylaştırır. Böylece duyu organlarını kullanamadığımız durumlarda da ölçme yapma imkanı buluruz.

3-Herkesin kabul ettiği, üzerinde anlaştığı standart ölçme sonuçları elde etmemize olanak sağlar.

Ölçek: Ölçme aracı, ölçme birimi veya ölçme sonuçlarının formal nitelikleri olarak tanımlanmaktadır.

Ölçekleme: Eğitim ve psikolojide ölçek veya ölçme aracı geliştirme olarak tanımlanabilir.

Ölçmede Kullanılan Ölçek Türleri

1)Adlandırma (Sınıflama) Ölçeği: Farklı ve benzer tarafların gözlendiğinde kullanılan ölçek türüdür. Adlandırma = kodlama; öğrencilere numara verme, illere plaka numarası verme, futbolculara sırt numarası verme vb. gibi yapılan işlemlere verilen addır. Sınıflama = bir özelliği dikkate alma; bir özelliğe sahip olanlar, sahip olmayanlar veya bir dereceye kadar sahip olanları belirlerken kullanılabilir. Bu ölçeklere sözde ölçek de denir. Bazı ölçmecilerce birimleri ve başlangıç noktaları değişir dense de birimleri ve başlangıç noktaları yoktur. Çünkü birimdeki değişme birim de aranan niteliklere uymamaktadır. Farklılıkları birim cinsinden belirleyemeyiz. Ölçmenin basit, ilkel bir türüdür. Ölçme sonuçları sembol, sayı veya sıfatlara dönüştürülür. Matematiksel işlem yapılmaz. İstatistiksel olarak frekans tablosu yapılabilir ve mod (tepe değer =en çok tekrar eden ölçüm) bulunabilir. İlk olarak bu ölçeklerin yansıma özelliği vardır: yani farklı iki objeye “a” kodu verilmişse a=a’dır. İkinci olarak bu ölçeklerin simetri özelliği vardır: yani aynı kümede bir objeye “a” diğerine “b” kodu verilmişse ve a=b ise b=a’dır. Üçüncü olarak bu ölçeklerin geçişme özelliği vardır: yani a=b ve b=c ise a=c’dir.

2)Sıralama Ölçeği: Belirli bir nitelik bakımından büyükten küçüğe ya da küçükten büyüğe sıraya koyma işidir. Bu sıraya uygun sayı veya sembol kullanılırsa sıralama ölçümleri yapılabilir. Kullanılan sayılar sıra sayılarıdır. Bu ölçekler büyüklük küçüklük bağıntısı ve bu bağıntının özelliklerini sağlar. Sıralama ölçeklerinin de birim ve başlangıç noktası olmadığı söylenebilir. Yani büyüklükler hakkında farklılığın ne kadar olduğu yönünde bilgi sahibi olamayız. Öğrencilerin elde ettiği test ham puanları sıralama ölçeğindedir. Bu ölçeklerin birinci özelliği ters simetridir: yani a<b ise b>a’dır ya da b<a değildir. İkinci özellik geçişmedir: yani a<b ve b<c ise a<c’dir. Bu ölçeklerle adlandırma, sınıflama ve büyüklük küçüklük karşılaştırması yapılabilir. Ancak büyüklükteki farklara ilişkin işlemler yapılamaz. İstatistiksel olarak frekans tablosu, mod, medyan (ortanca) ve yüzdelikler hesaplanabilir. İlişki ölçülerinden sıra farkları korelasyonu bulunabilir.

3)Eşit Aralık Ölçeği: Birimi ve izafi (tanımlı, yapay, göreceli, göreli) bir sıfır noktası vardır. Gerçekte “0” noktası matematikte yokluk anlamındadır. Yani bir ölçüm sonucunda 0 değeri elde etmek ölçtüğümüz değişkenin hiç olmadığı noktadır. Uzunluk 0 dediğimizde uzunluk yoktur. Aralık ölçeğinde ise başlangıç noktası ölçme yapan kişiye, bir araçtan diğerine veya bir uygulamadan diğerine değişir. Eşit aralık ölçeklerinde “0” noktası görelidir. Örneğin sıcaklık ölçeğinden ^oC ve Fahreheit bu tür ölçeklerdendir. Bunların sıfır noktaları görece (bağıl) sıfırdır. Yani aslında bu ölçeklerdeki “0” noktaları ölçülen özellik olarak sıcaklığın olmadığı bir miktarı göstermez. Yapay bir başlangıç noktasına işaret ederler. Ancak birimler arasındaki miktar eşittir. Sıralama ölçeğimde birimler arasındaki miktarı belirleyemezken aralık ölçeğinde belirleyebiliriz. Bu nedenle eşit aralık ölçeği adı da verilmektedir. Öğrencilerin testlerden aldıkları standart test puanları aralık ölçeğindedir. Eğitim ve psikolojideki ölçme araçları ve genelde sosyal bilimlerdeki ölçme araçlarının büyük çoğunluğu aralık ölçeğinde ölçeklerdir. Eşit aralık ölçeklerinde doğrusal dönüştürme yapılabilir. Yani gözlem sonuçları matematiksel işlemlerle yine eşit aralıklı fakat başlangıç noktası farklı ölçme sonuçlarına dönüştürülebilir. T ve z puanları bu yolla elde edilir. T= a+bx denklemi ile gösterilebilir. Burada “a” başlangıç (sıfır noktası) “b” ise birimdir (standart kaymadır). Z puanı= (X-X_ortalama)/standart sapma denlemiyle; t puanı = z.10+50 denklemiyle elde edilebilir. Bu ölçeklerde ortalama, standart sapma, korelasyon vb istatistik işlemler yapılabilir. Farkların miktarı belirlenebilir. Sadece çarpma, bölme diğer bir deyişle oran işlemleri yapılamaz.

4)Oran Ölçeği: Başlangıç noktası gerçek (mutlak) sıfırdır. Eşit bir birimi vardır. Bu ölçeklerle elde edilen verilerde her türlü matematiksel ve istatistiksel işlemler yapılabilir.

Gerçek (mutlak) ve yapay (bağıl-görece) sıfır için örnek

1. Durum

X Y

0 cm 200 cm 0 cm 400 cm

Yukarıdaki şekillerde birinci (küçük) doğruya X, ikinci (büyük) doğruya Y dersek Y=2X olur.

2. Durum

X Y

50 cm 250 cm 50 cm 450 cm

1. Durumdaki uzunlukların başlangıç noktalarını 50 cm’ye çekersek Y=2X işlemi geçerliğini yitirir. Yani ikinci şekilde, tanımlı sıfır noktasının gerçek sıfırı göstermemesi nedeniyle Y=2X işlemi artık kullanılmaz olur. Bu nedenle ikinci durumda Y≠2X’tir. Buna benzer olarak üst (nitelikli) ölçeklerden alt (niteliği düşük) ölçeklere geçiş yapıldığı her seferinde üst ölçekteki bilgi ve işlem zenginliği kaybedilerek, alt ölçekteki işlem ve bilgilerle yetinmek zorunda kalınır.

Tablo 2 kullanılan ölçek türüne göre elde edilen gözlem sonuçlarının anlamlarını, gözlem sonuçları üzerinde yapılabilecek işlemleri ve dolaylı olarak da nasıl yorumlanacaklarını görmemize yardımcı olabilir.

Tablo 3’te ölçme işleminde kullanılan ölçeklerle ilgili özet bilgiler yer almaktadır. Tablo 3 ile ilgili açıklanması gereken iki önemli nokta vardır. Bunlar;

Tablo 2. Ölçeklerle elde edilen bilgilerin anlamlılıkları

	Ölçeğin yapısal özellikleri		Elde edilecek Olan ölçülerin anlamlılık dereceleri
Ölçek tipi	Başlangıç noktası	Birimi (Aralığı)	Nitelik gösterme gücü	Nicelik gösterme gücü
				Sıra	Fark	Oran
Sınıflama	Yok	Yok	Var	-	-	-
Sıralama	Değişken	Değişken	Var	Var	-	-
E. Aralıklı	Keyfi	Keyfi	Var	Var	Var	-
Oranlı	Mutlak	Mutlak	Var	Var	Var	Var

1.Ölçekler yukarıdan aşağıya en basitinden en karmaşığına bir sıra göstermektedir (Basitlik ve karmaşıklık, elde edilen ölçümlerin bize verdiği bilgi, bu bilgilerin güvenirliği ve ölçümler üzerinde yapılabilecek işlemlerin çokluğuna dayalı olarak belirlenmektedir).

2.Karmaşık ölçekler basit ölçeklere dönüştürülebilirler. ( Aksi çoğu zaman -test standart puanlarını elde etme dışında- mümkün değildir.)

Davranışların ölçülmesi, ya o davranışların ya da o davranışlar sonunda ortaya çıkan ürünün veya ikisinin birden gözlenmesi şeklinde gerçekleşir.

Tablo 3. Ölçek türleri özet tablosu

ÖLÇEKLER	TEMEL İŞLEMLER	ÖRNEKLER	İST. TEKNİKLER
SINIFLAMA (ADLANDIRMA)	Farklılık ya da Benzerliği belirlemek	-kişileri saç ve ten rengine göre sarışın esmer diye gruplama -evlere kapı numarası, sokaklara sokak adı verme	-frekans -tepe değer (mod) -yüzde
SIRALAMA	Azı – çoğu veya küçüğü-büyüğü belirlemek	-kitapları kalınlık sırasına göre dizme -öğrencileri boy veya başarı sırasına koyma	-ortanca (medyan) -yüzdelik -sıra farkları korelasyon katsayısı
(EŞİT) ARALIK	Farkları belirlemek	-termometreyle sıcaklık ölçme -kullanılan takvimler -standartlaştırılmış test puanları	-ortalama -standart sapma -Pearson Moment Çarpımları korelasyon katsayısı
ORAN ÖLÇEĞİ	Oranları belirlemek	-hacim, uzunluk, ağırlık vb. ölçüleri	-matematiksel ve istatistiksel her türlü işlem.

Amaç istendik davranışların ölçülmesi ise en geçerli ölçme o davranışların gerçek hayat şartlarında gözlenmesiyle olur. Ürüne bakılarak ölçme de ise gerçek koşullar altında ortaya çıkan ürünlere bakılarak yapılmalıdır. Ancak davranışların gerçek hayatta gözlenmesi çoğunlukla güçtür. Bu nedenle gerçek hayat durumuna mümkün olduğunca benzetilmiş ortamlar altında ölçme yapılmaktadır. Ölçme sonuçlarının ölçme yapılan ortamın gerçek hayat şartlarına benzerliği ölçüsünde geçerli olduğu söylenebilir.

Diğer bir yol, gerçek hayat durumunu anlatarak böyle bir durumda kişiye ne yapacağını sormaktır. Bu sayıltıya göre okulda geliştirilecek ve ölçülecek davranışların çoğu bilgi, tutum ve duygulara dönüşür. O halde bazı davranışlar yerine onların dayandığı bilgi, beceri ve tutumları gözleyip ölçeriz. Bu işlemler sırasında gözlenen bilgi, beceri ve tutumların gerçek durumda davranışa dönüşeceği varsayılır.

Hangi yaklaşımla veya varsayımlarla yapılırsa yapılsın ölçme şu üç aşamadan geçer; 1) Ölçülecek özelliğin kararlaştırılması ve tanımlanması 2) Ölçülecek özelliğin ortaya çıkarılmasını ve gözlenmesini sağlayacak işlemlerin belirtilmesi 3)Gözlem sonuçlarının derece veya miktar olarak ifade edilmesi.

Değerlendirme: Ölçme sonuçlarını bir ölçüt veya ölçütlerle karşılaştırarak karara varma, ölçme sonuçlarını yargılama ya da karar verme olarak tanımlanabilir.

Değerlendirmenin Özel Anlamı: Bireyler hakkında toplanan bilgiyi ölçütlerle karşılaştırarak bireyler hakkında karar verme, yargıda bulunma sürecidir.

Test: Sınav, seçmeli testler, sınama, deneme, kontrol, yoklama anlamlarına gelir. Bu kelime kullanılırken hangi anlamda kullanıldığı açıklanmalıdır.

Sınav: Birden çok testin kullanılabildiği (yetenek, tutum, başarı vb.) çeşitli özellikleri ölçme sürecini vurgular. Test ise belli özellikleri ölçmek için kullanılan ve onu alan herkes için aynı olan sorulardan ya da işlerden oluşan ölçme aracıdır. Sınavın kapsamı geniş, testin kapsamı dardır.

Bölüm Testi

1. Aşağıdakilerden hangisi ölçmenin eğitimde kullanılma amacıdır?

A) Değerlendirmeye temel oluşturması*

B) Kolay ve nesnel puanlamayı sağlamsı

C) Maliyeti azaltarak kullanışlığı artırması

D) Bireyleri başarıya göre sıralaması

E) Davranışa sahip olanla olmayanı ayırması

2. Ölçmede araç kullanmanın faydasını aşağıdakilerden hangisi en iyi açıklar?

A) Puanlamayı kolaylaştırır.

B) Kapsam geçerliğini artırır.

C) Tesadüfî hataları kontrol eder.

D) Yorumlamaya olanak verir.

E) Gözlemi duyarlı hale getirir.*

3. Aşağıdakilerden hangisi temel (doğrudan) ölçmedir?

A) Bir daktilo yazısındaki hataları saymak*

B) Başarı testi ile öğrenci başarısını ölçmek

C) Yaylı kantar ile ağırlık ölçmek

D) Bir zekâ testi ile zekâ yaşını hesaplamak

E) Termometreyle havanın ısısını ölçmek

4. Aşağıdakilerden hangisinde birimlerde bulunması gereken özellikler tam ve doğru olarak verilmiştir?

A) Geçerlik, doğruluk, duyarlık

B) Geçerlik, güvenirlik, tutarlık

C) Hatasızlık, iç-tutarlık, yeterlik

D) Eşitlik, genellik ve uygunluk*

E) Genellik, kullanışlılık, niteliklilik

****

“Daktilo kursuna giden Özge’nin yeterlik belgesi almaya hak kazanmak için 100 üzerinden en az 50 puan alması gerekiyordu. Özge 70 puan aldı ve yeterlik belgesini kazandı.”

Aşağıdaki 3 soruyu yukarıdaki ifadeye göre cevaplandırınız.

5. “50 puan” neyi gösterir?

A) Güvenirlik B) Ölçme C) Değerlendirme D) Ölçüt* E) Geçerlik

6. “70 puan” neyi gösterir?

A) Güvenirlik B) Ölçme* C) Değerlendirme D) Ölçüt E) Geçerlik

7. “Yeterlik belgesini kazanması” neyi gösterir?

A) Güvenirlik B) Ölçme C) Değerlendirme* D) Ölçüt E) Geçerlik

****

8. Bir sınavda çıkan soruların tamamını doğru cevaplandıran bir öğrencinin tam puan alması ile ilgili olarak aşağıdakilerden hangisi kesinlikle söylenebilir?

A) Öğrenci sınıfında üst sıralarda yer alabilir.*

B) Öğrenci dersteki konuların hepsini bilmektedir.

C) Sınavın güvenirliği çok düşük çıkacaktır.

D) Sınıfın çoğunluğu bu sınavda başarılı olmuştır.

E) Sınavın kapsam geçerliği düşüktür.

9. Aşağıdaki ölçme sonuçlarının hangisinde doğal birim yoktur?

A) Veli 5 çift ayakkabı aldı.

B) Ceren’in boyu 1,68 metredir.*

C) Fatma sorulardan 28’ini doğru cevapladı.

D) Bu lokantada 7 garson var.

E) Galeride satılmayan 3 araba kaldı.

10. Aşağıdakilerden hangisi bir dolaylı ölçmedir?

A) Giyimine bakarak kişinin sevdiği rengi belirlemek

B) Öğrencilerin kitaplarından ciltlenmiş olanlarını seçmek.

C) Ders kitabını sınıfa getirmeyen öğrencileri saymak

D) Öğrencilerin akademik benlik tasarımlarını ölçmek *

E) Sınıftaki esmer ve sarışın öğrencileri belirlemek.

11. Bir üniversitenin Spor Bilimleri bölümüne öğrenci seçme sınavında öğrencilerin 10 saniyede kaç metre koştukları belirlenerek puan verilmektedir. Öğrencilere puan vermek için yapılan ölçme işlemi hangi ölçektedir?

A) Adlandırma B) Sınıflama C) Sıralama D) Eşit Aralıklı E) Oranlı*

12. Değişken kavramını aşağıdakilerden hangisi daha iyi açıklar?

A)Gözlenen özellikler B)Etkisi araştırılan nitelikler

C)Bir sonucu ulaştıran nitelik D)Etkilenme düzeyi araştırılan nitelikler

A)Aldığı değerler farklılaşan nitelikler*

13. Eğitimde hangi ölçek türünde ölçme yapılamaz?

A) Sıralama

B) Aralık

C) Oran*

D) Sınıflama

E) Adlandırma

II- ÖLÇME ARACINDA

ARANAN NİTELİKLER

Ölçme aracında üç özelliğin yeterli düzeyde bulunması istenir. Bunlar kısaca aşağıda tanımlanmıştır.

1-Güvenirlik: Ölçme aracının hatalardan arınık olma derecesi, ölçtüğü şeyi tutarlı ölçebilme derecesi.

2-Geçerlik: Ölçme aracının kullanış amacına hizmet etme derecesi, Ölçtüğü şeyi, diğer değişkenleri karıştırmadan ölçebilme derecesi.

3-Kullanışlılık: Ölçme aracının hazırlama, uygulama, puanlama ve tüm bu süreçlerde ekonomiklik derecesi olarak adlandırılabilir.

Gerçek Puan Kuramı Temel Denklemi: X= T + E (Denklem 1)

X: Gözlenen puan T: Gerçek Puan E: Ölçemeye Karışan Hata Puanı

Örnek bir öğrenci 20 soruluk bir testten 17 puan almış olsun. Bu 17 puanı gözlenen puandır. Ancak öğrencinin sahip olduğu bilgi düzeyi ile 14 puan alabileceğini varsayalım. Bu 14 puan gerçek puandır. Öğrencinin gerçek performansını ya da başarısını yansıtan puandır. Öğrenci geriye kalan 3 puanı da kopya çekerek ve şansla kazanmıştır. İşte bu 3 puana, ya da gözlenen puanla gerçek puan arasındaki farka hata puanı diyebiliriz. X bilinir, çünkü gözlenen puandır. T hipotetiktir (teoriktir), bilinemez. E eğer yönü ve miktarı belli ise bilinebilir. Ancak tesadüfî ise yönü ve miktarı bilinemez. Dolaylı yollardan hesaplanır.

Hiçbir ölçme hatasız değildir. Hemen her ölçmeye milyarda bir oranında da olsa hata karışır. Hataların çeşitli kaynakları vardır. Hatalar: Ölçmeci, ölçme aracı, ölçme yöntemi, ölçme ortamı veya ölçülen kişiden gelebilir.

2.1 Hata Türleri

1-Sabit Hatalar: Her ölçme sonucuna aynı miktarda ve aynı yönde karışan; her ölçme sonucu için aynı yönde etkili olan ve her bir ölçmede miktarı değişmeyen hatalardır. (Ör: Her öğrenciye 10 puan fazla verilmesi veya bir soruyu bütün sınıfın doğru cevaplandırması sabit hatalardandır.)

2-Sistematik Hatalar: Ölçme sonuçlarına belirli bir kurala göre karışan ve yönü ile miktarı tespit edilebilen hatalara sistematik hatalar denir. Çoğunlukla her bir ölçme için sabit olmayan, puanlayıcı yanlılığını yansıtan hatalardır. (Ör: Matematik ya da Fen dersinde öğrencilerin güzel yazı yazma, düzen vb.ne puan verme veya sadece erkek / kız öğrencilere fazladan puan verme sistematik hatalardandır.)

3-Random (tesadüfî, gelişigüzel, rasgele) Hatalar: Kaynağı, yönü ve miktarı bilinmeyen, ölçme sonuçlarına tesadüfen karışan hatalardır. Bu tür hatalar ölçme sonuçlarına nerede, ne zaman, nasıl, ne kadar karıştı tespit edilemezler. (Ör: Sınav koşullarının öğrencilere etkisi, öğretmenin puanlama dikkatsizliği gibi etkenlerden ölçmelere karışan hatalar bu türdendir.) Ancak bu tür hataların ortalamasının sıfıra yaklaştığı ve normal dağıldığı kabul edilir.

Ölçmede asıl ilgilenilen hata türü tesadüfî hatalardır. Sabit hatalar standart sapma ve varyansa etki etmezler. Sistematik ve sabit hatalar kontrol edilebilirler. Ölçme sonuçlarına hangi yönde ve hangi miktarda karıştığı tespit edilerek ölçme sonuçlarından çıkarılabilirler. Böylece de ölçme sonuçları hatalardan arındırılmış olur. Dolayısıyla sabit ve sistematik hataların ölçme sonuçlarının güvenirliğine etkileri azaltılabilir veya tamamen ortadan kaldırılabilir. Bu nedenle güvenirlik söz konusu olduğunda ölçmecileri asıl ilgilendiren hata türü olarak tesadüfî hatalara vurgu yapılır. Ancak random hataları kontrol etme imkânı yok gibidir. Bu nedenle yapılabilecek en doğru işlem random hataları azaltmak için gerekli önlemeleri alabilmektir.

Ölçme aracının duyarlığı hataları azaltır. Ölçmecinin yeterli oluşu, ölçme aracının iyi kullanılması, puanlamanın objektifliği, ölçme yapılan ortamın amaca uygunluğu ve ölçülen kişinin performansını yansıtacak durumda olması hataları azaltır.

2.2 Güvenirlik

Genel anlamda tutarlık ve duyarlık demektir. İki veya daha fazla ölçümün birbirini tutması veya yapılan ölçümlerin duyarlı olmasıdır. Pozitif bilimlerde aynı şartları sağlamak mümkün olabildiği için bu yöntem iyi sonuçlar verir. Eğitim ve psikolojide aynı şartları sağlamanın zorluğu farklı yöntemler geliştirilmesini zorunlu kılmıştır. Geçerlik ve güvenirliği belirleme tekniklerinde en çok kullanılan istatistik tekniklerden biri korelasyon katsayısıdır. Aşağıda, korelâsyonun alabileceği tipik değerlerle ilgili grafiklerden üçü verilemeye çalışılmıştır.

Korelâsyon katsayısı –1 ile 1 arasında değerler alır. Değer 1’e yakınsa pozitif korelasyon vardır. Değişkenler aynı yönde değişiyor anlamına gelir. Yani değişken değerlerinden biri artarken diğeri de artıyorsa pozitif korelasyon olur. Bu durumda, değişkenlere ait değerler eksenlerin birleştiği köşeden karşı köşeye yönelen bir elips içinde gösterilebilir (1. gösterim örneğindeki gibi). Eğer değişkenlerin değerleri, eksenlerin birleştiği köşeden karşı köşeye yönelen düz bir doğru üzerinde gösterilirse bu durumda mükemmel olumlu ilişkiden söz edilir. Değer –1’e yaklaşıyorsa negatif korelasyon vardır. Değişken değerlerinden biri azalırken diğeri artıyorsa negatif ilişki vardır. Bu tür ilişkiye ters yönde ilişki de denir. Bu durumda değişkenlere ait değerler dikey eksenden yatay eksene doğru yönelen bir elips içinde gösterilebilir (2. gösterim örneğindeki gibi). Değişkenlere ait değerler dikey eksenden yatay eksene yönelen bir doğru üzerinde gösterilebilirse bu durumda mükemmel olumsuz ilişkiden söz edilir. Korelasyon değeri 0’a yakınsa iki değişken arasında ilişki olmadığı söylenir. Değişkenlerin değerleri bir daire, bir kare bazı zamanlar ise dikdörtgen içerisinde gösterilebilir. (3. gösterim örneğindeki gibi).

Korelasyon grafiksel olarak gösterildiği gibi istenirse değer olarak da hesaplanabilir. Grafik teknik sayesinde korelasyonun yönü ve gücü hakkında fikir sahibi olsak da yorum yapmakta zorlanılacak durumlar da mümkündür. Denklem 2 korelasyon değerinin nasıl elde edildiğini göstermektedir. Bu formüle korelasyon için ham puan formülü adı da verilir. Eğer istenirse bu formül kullanarak korelasyon değeri elde edilir ve yorumlanır. Elde edilen korelasyonun gücü sorulduğunda mutlak değer 1’e yakınlığına bakılır. Özel olarak yön belirtilirse hesaplanan korelasyonun işaretine bakılır. Korelasyon Formülü

Korelasyon güvenirlik ve geçerlik katsayısı olarak kullanılırken pozitif ve bire yakın olmasına dikkat edilir. Yani pozitif ve bire yakın korelasyon varsa geçerlik ve güvenirlik olduğu söylenebilir. Güvenirlikte 0,70 üstü; geçerlikte ise 0,30 üstü korelasyon var ise kısmen de olsa geçerlikten ve güvenirlikten söz edilebilir.

1. Test

2. Test

1. Gösterim

(Pozitif Yüksek Korelasyon)

1. Test

2. Test

2. Gösterim

(Negatif Yüksek Korelasyon)

1. Test

3. Gösterim

2. Test

(Sıfıra Yakı Düşük Korelasyon)

Güvenirlik bir korelasyon olmasına rağmen 0 ile 1 arasında değişir. Varyanslardan hareket ettiğinden – (negatif) değer almaz. Çok ender olarak 1’in üstünde veya negatif çıkar. Aynı şekilde herhangi bir ölçme sonuçlarının tam güvenilir ya da sıfır güvenirlikte olması beklenmez. Eğer ölçmelerimiz tam güvenilir olsaydı güvenirliğin tanımından ölçmelerimizde hata olmazdı, bu durumda güvenirliğin (korelasyonun) değeri 1 olurdu; eğer ölçmelerimiz sıfır güvenirlikte olsaydı, ölçümlerin hepsi hata ölçüsü anlamına gelirdi; bu durumda da güvenirliğin (korelasyonun) değeri 0 olurdu.

Geçerlikte ise ölçülmek istenen değişkenle zıt yönlü bir değişken ölçülebilir. Örneğin bir dersten hoşlanmamak (olumsuz tutum) ile o dersteki başarı negatif yönlü korelasyon verebilir. Bu nedenle güvenirlik 0 ile 1 arasında değer almasına rağmen geçerlik -1 ile +1 arasında değerler alır. Geçerlik ve güvenirliğin alabileceği değerlerin sınırlarını aşağıdaki gibi göstermek kalıcılığı açısından yararlı olabilir.

0 ≤ r_xx≤ +1 (Güvenirliğin sınırları)

-1 ≤ r_xy≤ +1 (Geçerliğin sınırları)

Güvenirliği Belirleme Yollarından Bazıları:

1-Test Tekrar Test Güvenirliği: Aynı testi aynı gruba iki kez uygulama yoluyla elde edilen güvenirlik katsayısıdır. İki uygulamadan elde edilen puanlar arasındaki korelasyon katsayısıdır. İki uygulama arasından belirli bir zaman geçmelidir. Aradan geçen zaman cevaplayıcıların ölçülen özellik bakımından değişmeyecekleri, aynı zamanda ilk uygulamada verdikleri cevabı hatırlamayacakları bir süre olmalıdır. Bu güvenirlik katsayısına Kararlılık Katsayısı da denir.

2-Paralel Test Güvenirliği: Test-tekrar test yönteminin dezavantajını gidermek amacındadır. En az iki eşdeğer form geliştirilir. İki test madde sayısı, niteliği ve ölçtükleri davranışlar bakımından denk olmalıdır. İki test aynı öğrenci grubuna uygulanır. İki testten elde edilen cevaplayıcı puanları arasında korelasyon katsayısı hesaplanır. Uygulama aynı öğrenci grubuna aynı zamanda yapılırsa hem karalılık anlamında güvenirlik hem de formların eşdeğerliği hakkında bilgi verir.

3-İki Yarı Güvenirliği: Tek uygulama gerektirdiğinden çok kullanılır. Test iki eşdeğer yarıya bölünür (Yarısından veya tek-çift sorular). Öğrencilerin bu iki yarılardan elde ettikleri puanlar arasında korelasyon elde edilerek testin bir yarısı için güvenirlik bulunur. Bu korelasyon kullanılarak testin tümü için güvenirlik hesap edilir. Testin tümü için güvenirlik katsayısının formülü şöyledir.

(Denklem 3)

Bu yöntemin kullanılmasında tek boyutlu; aynı niteliği ölçen maddelerden oluşan bir test olmasına özen gösterilir. Aksi durumda yorumlamada sıkıntı yaratacağından kullanılmaz.

4-KR-20 Güvenirliği: Bu formül için madde güçlük indeksi (p) bilinmelidir. İkinci olarak testteki her bir maddenin aynı değişkeni ölçtüğü yani testin ölçmek istediği niteliği ölçtüğü sayıltısı vardır. Formül madde güçlüklerini ve madde sayısını dikkate alarak hesaplanan bir güvenirlik katsayısıdır.

(Denklem 4)

K: Madde sayısı

p: Maddeyi doğru cevaplandıranların tüm cevaplayıcılara oranı

q: Maddeyi yanlış cevaplandıranların tüm cevaplayıcılara oranı

: Tüm testin varyansı

5-KR-21 Güvenirliği: Testteki maddelerin eşit ya da yakın güçlükte olduğu varsayılıyorsa ve madde istatistikleri (güçlükleri veya varyansları = pq) bulunmamışsa test puanları ortalaması ve varyansı kullanılarak KR-21 güvenirlik katsayısı hesaplanabilir. Maddelerin eşit güçlükte varsayılmasından dolayı KR-21 genellikler KR-20’den küçük çıkar.

(Denklem 5)

Eğer maddeler güçlük bakımından oldukça farklı ise yani birbirine yakın veya eşit değilse bu formül güvenirliğin en alt sınırını verir. Bu durumda elde edilen güvenirlik katsayısı yeterli görülüyorsa (.75’in üstünde ise) testin güvenilir olduğunu söylemek mümkündür.

KR-20 ve KR-21 formülleri sadece 1-0 puanlamasında kullanılır. Eğer puanlama farklı ise bu formül kullanılmaz. Cronbach alfa güvenirlik katsayısı kullanılır.

6- Cronbach alfa: Maddeler (sorular) 1-0’dan farklı puanlandığı zaman veya bir testin alt testleri varsa bu tür testlerin güvenirliğini KR-20’nin özel bir hali olan Cronbach Alfa tekniği ile hesaplarız. KR-20’den farkı eğer testin alt testleri var ise madde varyansları toplamı yerine alt test varyansları toplamı alınır. 1-0’dan farklı puanlandığında KR-20’de olduğu gibi madde varyansları kullanılır.

(Denklem 6)

å : Madde varyansları toplamı veya alt test varyansları toplamı

7-Puanlayıcı Güvenirliği: Cevap kâğıtlarına birden fazla puanlayıcının verdiği puanlar arsındaki korelasyondur. Puanlayıcıların yansızlığı ve uyumu hakkında bilgi verir. Daha çok yazılı sınavlar, sözlü sınavlar, performans testleri gibi durumlarda kullanılır.

8-Puanlama Güvenirliği: Bir puanlayıcının bir sınav kağıdına farklı zamanlarda (en az iki kez) verdiği puanlar arasındaki korelasyondur. Puanlayıcının kararlılığı ve yansızlığı hakkında fikir verebilir. Daha çok yazılı sınavlarda, ödev-projelerde ve kısmen de kısa cevaplı testlerde kullanılabilir.

Tablo 4. Güvenirlik Belirleme Tekniklerine İlişkin Özet Bilgiler

Güvenirlik Katsayısı Tipi	Anlamı	Gereken form sayısı	Uygulama sayısı	Hata varyansı kaynağı
KUDER-RICHARSON KR - 20 ve KR - 21	İç tutarlık	Bir	Bir	Kapsam örneklemi ve heterojenliği
CRONBACH ALFA	İç tutarlık	Bir	Bir	Kapsam örneklemi ve heterojenliği
İKİ YARI	İç tutarlık	Bir	Bir	Kapsam örneklemi
TEST-TEKRAR TEST	Kararlılık	Bir	İki	Zaman örneklemi
PARALEL FORMLAR Birlikte uygulama	Tutarlık	İki	Bir	Kapsam örneklemi
PARALEL FORMLAR Aralıklı uygulama	Tutarlık	İki	İki	Zaman ve kapsam
PUANLAYICI	Tutarlık	Bir	Bir	Puanlayıcılar
PUANLAMA	Kararlık	Bir	Bir	Puanlama

Açıklanan güvenirlik belirleme tekniklerine ilişkin özet bilgiler tablo 4’te verilmektedir. Tablo 4 güvenirliklerin hangi anlama geldiği, kullanılması gereken form sayısı, uygulama sayısı ve hesaplanan güvenirlik değerlerine karışan hata kaynaklarını göstermektedir.

Güvenirliği Artırma Yolları

1-Soru sayısını artırmak güvenirliği artırır. Güvenirlikle soru sayısı arasında matematiksel bir ilişki vardır. Soru sayısı arttıkça duyarlı ölçme yapılacağı için güvenirlik de artar. Ancak soru sayısını bir noktadan sonra artırmanın getirişi çok fazla değildir. Bu ilişki aşağıdaki şekilde görülebilir. Güvenirliği tam (1) yapabilmek için eklenecek soru sayısı sonsuzdur. Monoton artan bir fonksiyondur. Bir noktadan sonra eklenecek soru sayısı ile artacak güvenirlik miktarı önemsiz bir düzeye gelir. Bunu bir örnekle açıklayacak olursak madde sayısı 4 güvenirliği 10 olan bir teste sürekli soru ekleme durumunda güvenirlik artış miktarı şöyle olacaktır.

Aşağıdaki şekilde örüldüğü gibi bir noktadan sonra meydana gelen güvenirlik artışı eklenen soru sayısı karşısında değmeyecek bir miktardır. Soru sayısı ile güvenirlik ilişkisi kapsamında ne kadar soru eklenince istenilen güvenirliği elde edeceğimizi gösteren formül vardır. Bu formül aşağıdaki gibidir.

r_n = (Denklem 7)

formülde geçen terimlerin açıklamaları şöyledir.

r_s=Soru eklenecek testin (eldeki testin) güvenirliği

r_n=Testin soru eklendikten sonra beklenen güvenirliği (istenen güvenirlik)

n=Testin kaç kat uzatılacağı

Örnek: Güvenirliği 0.75 olan 10 soruluk bir testin güvenirliğini .90'a çıkarmak için ne kadar soru ekleyeceğimizi bulmak için formülü uygularsak (bkz. Örnek çalışmalar) n @ 3 çıkar. Buradan n*k yoluyla; 3*10 = 30 bulunur. Bu durumda test 30 soru olduğunda güvenirliğin 0.90 olacağı anlaşılmaktadır. Yani güvenirliği 0.90’a çıkarmak için teste 20 soru daha eklemek gerekmektedir.

Tablo 5. Madde sayısı ve Güvenirlik İlişkisi

Soru Sayısı

K	Güvenirlik	Artan Güvenirlik Artışı
4	0.10	-
8	0.18-	0.08
16	0.30	0.12
32	0.46	0.16
64	0.63	0.17
128	0.77	0.14
256	0.89	0.12
512	0.94	0.05
1024	0.97	0.03
∞	1.00	0.03

Şekil 5. Madde sayısına göre güvenirlik

2-Soruların açık, anlaşılır ve cevaplanabilir olması güvenirliği artırır. 3-Öğrencilerin güdülenmesi güvenirliği artırır.

4-Sınav süresinin yeterli olması güvenirliği artırır.

5 -Testin orta güçlükte olması (çok kolay veya çok zor olmaması) güvenirliği artırır.

6-Testin objektif puanlanması güvenirliği artırır.

7-Ölçme işleminin tüm basamaklarında gerekli titizlik ve dikkati göstermek güvenirliği artırır. 9-Duyarlığı yüksek araç ve yöntem kullanmak güvenirliği artırır.

10-Ölçme sonuçlarının elde edilen duyarlıkta kaydedilmesi güvenirliği artırır.

2.3 Ölçmenin Standart Hatası

Ölçmelerin tutarlığı ile güvenirlikten sonraki ikinci yaklaşım hataların büyüklüğünü belirlemektir. Tek bir gözleme bakılarak hata konusunda bir şey söylenemez. Aynı kişiye ait birden fazla ölçme yapılmalıdır. Bu ölçmeler bir dağılım gösterir. Bu dağılımın ortalaması kişinin gerçek puanının tahminidir. Yani gerçek puana en yakın puandır. Bu dağılımın standart kayması ölçmenin standart hatası olarak adlandırılır.

Ancak bireylerle ilgili tekrarlı ölçmeler yapmak zaman alıcıdır. Bu nedenle çok sayıda kişiye test uygulamak, bu testten elde edilen puanların standart kaymasını ve güvenirliğini kullanmak yoluyla bireylerin puanlarına karışan hata (ölçmenin standart hatası) hesaplanabilir. Bu yolla hesaplanan ölçmenin standart hatası formülü aşağıdaki gibidir:

(Denklem 8)

S_x=Testin standart sapması

r_xx’= Testin güvenirliği

Standart hata grubun değişirliğinden az etkilenir. Güvenirlik ise grubun değişirliğine bağlıdır. Bu nedenle bazen güvenirlik yerine kullanılması önerilmiştir. Özellikle testteki puanların ve puanlar arasındaki farkların güvenirliği ile ilgili yargılar için çok kullanışlıdır. (Ör: Güvenirliği .64 olan ve standart kayması 5.03 olan testten bir öğrencinin 48 puan aldığını varsayalım. Geçme notu 50 olsun. Bu durumda öğrenci sınıfını geçmeli midir? Nasıl karar vereceğiz? Kararı, standart hatayı hesaplayıp öğrencinin puanına ekleme ve çıkarma yapma yoluyla öğrencinin puan aralığını bulduktan sonra vermek yararlıdır. Bu test için ölçmenin standart hatasını hesaplayacak olursak ilgili formülden 3,02 olarak elde edilir. Bu puanı öğrencinin puanına ekleyip çıkarınca öğrencinin puanı 44,98 – 51,02 arasında olacaktır. Öğrencinin puanı 50 geçme notunu kapsadığından geçer not vermek doğru olur.

Güvenirlik İçin Örnek Çalışmalar:

Tablo 6. Test-Tekrar Test Veya Paralel Test Güvenirliği İçin Veriler


	1.Uyg.(X)	2.Uyg.(Y)	X²	Y²	XY
1	30	33	900	1089	990
2	32	32	1024	1024	1024
3	33	34	1089	1156	1122
4	35	36	1225	1296	1260
5	37	37	1369	1369	1369
6	38	42	1444	1764	1596
7	40	39	1600	1521	1560
8	39	44	1521	1936	1716
9	44	41	1936	1681	1804
10	34	36	1156	1296	1224
Toplam	362	374	13264	14132	13665
T²	131044	139876
*TXTY**	135388
r=	0,83	Testim güvenirliği
kkök r	0,91	Maksimum geçerlik değeri

Bu sonuçlara göre 10 soruluk testimizin orta güvenirlikte olduğu söylenebilir.

Diğer güvenirlik hesapları da ilgili tekniğin gerekli işlemleri yerine getirilerek korelasyon formülünden faydalanılarak yapılmıştır.

Aşağıda 10 soruya 10 kişinin verdiği cevaplara dayanarak elde edilen madde puanları matrisi görülmektedir. Bu matrisi kullanarak güvenirlik tekniklerinden uygun olanlar için güvenirlik değerleri ve bir ölçüte göre maksimum geçerlikleri hesaplanmıştır. Benzer örnekler üzerinde çalışılabilir.

Tablo 7 Yarıya bölme, KR-20 ve KR-21 Güvenirlik Analizleri için 10 Maddeye İlişkin Veriler


Kişiler	1	2	3	4	5	6	7	8	9	10	Puan
A	0	1	1	0	1	1	0	0	0	1	5
B	1	1	1	0	1	1	0	1	1	0	7
C	1	1	1	1	1	1	1	1	0	0	8
D	1	1	1	0	0	0	0	0	0	1	4
E	1	1	1	1	1	1	1	1	0	1	9
F	0	1	1	0	0	0	0	0	1	0	3
G	0	1	1	0	0	1	0	1	0	0	4
H	1	1	1	1	1	1	1	1	1	1	10
I	0	0	0	0	1	0	0	0	1	1	3
J	0	1	1	1	1	0	0	1	1	0	6
DS	5	9	9	4	7	6	3	6	5	5	59
p	0,50	0,90	0,90	0,40	0,70	0,60	0,30	0,60	0,50	0,50
q	0,50	0,10	0,10	0,60	0,30	0,40	0,70	0,40	0,50	0,50
*pq**	0,25	0,09	0,09	0,24	0,21	0,24	0,21	0,24	0,25	0,25	2,07

						Testin tümü için			Ort	S²	S
									5,90	6,32	2,51
TEK SORULAR
	1	3	5	7	9	Puan
A	0	1	1	0	0	2
B	1	1	1	0	1	4
C	1	1	1	1	0	4
D	1	1	0	0	0	2
E	1	1	1	1	0	4
F	0	1	0	0	1	2
G	0	1	0	0	0	1
H	1	1	1	1	1	5
I	0	0	1	0	1	2
J	0	1	1	0	1	3	T²		S²
Toplam	5	9	7	3	5	29	841		1,66
ÇİFT SORULAR
	2	4	6	8	10	Puan
A	1	0	1	0	1	3
B	1	0	1	1	0	3
C	1	1	1	1	0	4
D	1	0	0	0	1	2
E	1	1	1	1	1	5
F	1	0	0	0	0	1
G	1	0	1	1	0	3
H	1	1	1	1	1	5
I	0	0	0	0	1	1
J	1	1	0	1	0	3	T²	*TXTY**	S²
Toplam	9	4	6	6	5	30	900	900	2

KORELASYON
	X ²	Y²	*XY**
1	4	9	6
2	16	9	12
3	16	16	16
4	4	4	4
5	16	25	20
6	4	1	2
7	1	9	3
8	25	25	25
9	4	1	2
10	9	9	9
Toplam	99	108	99

r=	0,79
SBr=	0,88
Kkök r	0,94

KR-20	0,75
kkök r	0,86

KR-21	0,69
kkök r	0,83

Sadece yarılardan birinin güvenirliği, iki yarı arasındaki korelasyon

Testin tümü için güvenirlik, Spearman-Brown düzeltme formülü sonucu.

Testin alabileceği Maksimum ölçüt geçerlik değeridir.

Madde güçlükleri ve sayısı dikkate alınarak hesaplanan iç tutarlık değeridir.

Testin alabileceği Maksimum ölçüt geçerlik değeridir.

Madde güçlükleri eşit varsayılarak hesaplanan iç tutarlık değeridir.

Testin alabileceği Maksimum ölçüt geçerlik değeridir.

Yukarıda 0,75 bulunan KR-20 güvenirliğini 0,90’a çıkarmak için teste kaç madde eklememiz gerektiğini aşağıdaki gibi bir işlem süreciyle bulabiliriz.

r_n = ve 3x10=30 olacaktır. 10 maddelik testimize 30 soru daha ekleyip 40 soruya çıkarırsak güvenirliğini de 0,90 değerine çıkarabiliriz.

1-0 puanlamadan farklı durumlarda kullanılan iç tutarlık katsayısı Cronbach Alfa güvenirliği için aşağıdaki örnek verilmiştir. Görüldüğü gibi 8 soruluk testin güvenirliği yetersiz bulunmuştur.

Tablo 8. Cronbach Alfa Güvenirlik Analizi için 8 Maddeye ait Veriler


	M1	M2	M3	M4	M5	M6	M7	M8	Puan
K8	4	4	5	5	5	4	5	4	36
K1	4	3	5	2	4	5	3	5	31
K4	2	4	4	3	5	3	5	5	31
K6	5	3	2	2	4	3	5	5	29
K7	3	3	4	2	5	4	3	3	27
K2	5	3	4	2	1	3	4	4	26
K3	3	1	2	3	4	3	2	5	23
K5	1	3	3	4	3	2	2	2	20
S²	1,98	0,86	1,41	1,27	1,84	0,84	1,70	1,27	223
				Madde varyansları toplamı				11,16
Alfg	0,64	Cronbach alfa güvenirliği				Tüm test için
kkök	0,80	Maksimum ölçüt geçerliği				Ort	S²	s
						27,88	25,27	5,03

2.4 Geçerlik

Bir ölçme aracının sadece o araçla ölçülmek istenen değişkeni ölçme, başka değişkenlerle karıştırmama veya amaca hizmet etme derecesidir. Testin sahip olması gereken en önemli niteliktir. Buna göre geçerlik, genel anlamda, bir ölçme aracının ya da ölçme yönteminin ölçmeyi amaçladığı özelliği, başka herhangi bir özellikle karıştırmadan, doğru olarak ölçebilme derecesi olarak tanımlanabilir. Başka bir tanım ise geçerliği, maddenin/testin bilenle bilmeyeni veya bir davranışa sahip olanla olmayanı ayırma derecesi olarak ifade eder. Bu tanım eğitimde kullanılan araçların geçerliğini belirlemede, madde analizlerinde çok kullanılır. Bu terim, testlerin sağladığı sonuçların kullanılma amaçlan için geçerli olup olmadığını, geçerli oluş derecesini ve gerçekliğini belirtmektedir.

Bir ölçme aracının geçerliği yüksek ise güvenirliği de yüksektir. Bunun tersi doğru değildir. Güvenirliği yüksek olan testin geçerliği düşük olabilir.

Geçerlikte iki önemli soru vardır. l)Ölçme aracı hangi amaç ya da amaçlar için kullanılabilir. 2)Ölçme aracı bu amaç veya amaçlara ne derece de hizmet edebilir, uygundur?

Bir testin geçerliği bir derece sorunudur. Ya hep ya hiç sorunu değil. Hatalardan tamamen kurtulmak mümkün değil ancak minimum yapmaya çalışmak gerekir.

Geçerliği birden fazla yolla tanımlamak mümkündür. Tek bir tanım vermek yerine kullanış amacına uygun olduğuna ilişkin kanıtlar bulmak daha doğrudur. Çok bilinen geçerlik türleri kısaca şöyle özetlenebilir.

1-Kapsam Geçerliği: Ölçülmek istenen kapsamla geçerliği araştırılan testin ölçtüğü kapsamın örtüşme derecesidir. Bir ölçme aracının ölçülmek istenen davranışları (özellikleri) ne derece kapsadığının belirlenmesidir. Kapsam geçerliğinin belirlenmesi için ölçme konusu olan özelliklerin ya da davranışların önceden belirlenmesi gerekir.

Eğitimde hedefler geneldir, gözlenemezler. Oysa ölçülecek nitelik ya da davranış doğrudan ya da dolayı olarak gözlenebilmelidir. Bu nedenle hedefler verine davranışlar ölçme konusu yapılır.

Ör: Hedef 1; "Ölçmeyle ilgili belli başlı kavramların bilgisi." Geneldir. Gözlenemez.

Davranış 1; Güvenirlik kavramının tanımını yazma, söyleme veya verilen seçenekler arasından işaretleme. Özeldir. Gözlenebilir.

Kapsam Geçerliğini Belirleme Yolları

İki temel yol olduğu söylenebilir. Birincisi akli (rasyonel), ikincisi istatistikî yoldur.

1-a- Belirtke Tablosu Hazırlamak. Belirtke tablosu, sütun başlarında hedefler, satır başlarında konular ve hücrelerde hedefler ve konularla ilgili davranışların numara ya da sayılarla gösterildiği tablodur. Yani davranışların konu ve hedeflere göre dağılımını gösteren çizelgelerdir.

Tablo 9. Örnek Belirtke Tablou Tablosu.
Hedef-dav. Konular	Bilgi	Kavrama	Uygulama	Analiz	Sentez	Değerlendirme	Toplam (%)
1.Ölçmenin Temel Kavramları	4	3	2	2	1	4	16 (%33)
2. Ölçme Aracının Nitelikleri	3	5	8	3	2	3	24 (%50)
3.Yazılı Yoklamalar	-	3	1	2	1	1	8 (%17)
Toplam (%)	7 (%15)	11 (%23)	11 (%23)	7 (%15)	4 (%7)	8 (% 17)	48 (% 100)

Örnek belirtke tablosunda (Tablo 9)görüldüğü gibi davranışların konu ve hedeflere göre dağılımı belirlenir. Sınav sorularının bu dağılımı ne derece yansıttığı incelenir. Bu inceleme sonucunda kapsam geçerliği olup olmadığına karar verilir. Eğer sorular bu dağılıma uygun olarak ölçme yapıyorsa, yani davranışları konu ve hedef ağırlıklarını da göz önünde bulundurmak koşuluyla yeterince kapsıyorsa kapsam geçerliğinden söz edilir.

1-b-Uzman kanısına başvurma: Sorular uzmanlara gösterilerek ilgili davranışları ne derecede ölçtüğünü belirlemeleri istenir. Bu amaçla "evet, hayır"lı, davranışlarla "ilgili, ilgisiz" veya davranışları "ölçüyor, ölçmüyor" gibi cevapların verilebileceği ölçekler kullanıldığı gibi soruların davranışları ölçme düzeyini gösteren 3 ya da 5'li likert tipi ölçekler de kullanılabilir. Elde edilen sonuçlar yüzde-frekans veya korelasyon katsayısı hesap edilerek değerlendirilebilir. Bu tekniğe Bir uzmanın soruları belirtke tablosuyla karşılaştırma tekniği de denebilir. Bu teknik belirtke tablosu hazırlamanın devamı olan bir tekniktir. Bu tekniğin yukarıdaki teknikten tek farkı hazırlanan belirtke tablosunu hazırlayan kişinin değil bağımsız bir uzmanın incelemesidir.

2-Tekrarlı Teşt Geliştirme: İki farklı uzman grubunun aynı kapsamı ölçen iki test geliştirmesi ve bunları öğrencilere uygulama sonucu elde edilen puanlar arasındaki korelâsyonun hesaplanmasıdır.

Özet olarak kapsam geçerliğini, sağlamak için uzman kişiye danışma, belirtke tablosunu dikkate alma ve konu hedef ağırlığına bakmak gerekir. Kapsam geçerliği için kullanacağımız testin nitelikleri kullanma amaç ve durumlarıyla mümkün olduğunca eşlenmelidir. Kapsam geçerliği alan uzmanlarının testle ilgili görüşleri olarak kabul edilebilir.

Örnek: Dört işlemle ilgili bir test hazırlayalım. Testin amacı öğrencilerin dört işlemle ilgili becerilerini ölçmektir. Ancak testi hazırlarken çıkarma işlemiyle ilgili sorular yazmazsak kapsam geçerliği düşecektir. Çıkarma işleminin yanı sıra bölme işlemi ile ilgili soruları da yazmayı ihmal edersek kapsam geçerliği daha da düşecektir. Aynı örneği şu şekilde de inceleyebiliriz. Dört işlem becerisi ile ilgili davranışların ağırlıkları (çarpma, bölme, çıkarma ve toplama işlemlerinin ağırlıkları) farklı olsun. Bu konuların ağırlığını belirlemede, çözülen örnek sayısı, harcanan ders saati kitapta ayrılan sayfa sayısı ve esas olarak belirtke tablosundaki davranışların sayısı olacaktır. Kullanılacak testte bu ağırlıkla dengeli olacak şekilde soru yoksa kapsam geçerliği düşük olur.

Durum1 Durum 2 Durum 3

Örnek: Aşağıdaki şekillerin hangisinde testin kapsamıyla kullanıcının kapsamı en iyi şekilde eşleşmiştir? (A: Ölçülecek davranışları; B: test kapsamı)

Şekil 6. Kapsam geçerliğiyle ilgili bazı muhtemel görünümler

Durum 1’de testin kapsamıyla kullanıcı kapsamı az bir alanda çakışmaktadır. Dairelerin kesiştiği alan çok dar olduğundan testi kullanmak çok anlamlı olmaz. Bu test ölçülecek nitelik yada davranışlara ilişkin çok az-bilgi sağlar.

Durum 3'de terstin, kapsamı kullanıcı kapsamı içinde yer almaktaysa da iyi bir ölçüm olmayacağı bellidir. Test kullanıcının ölçmeyi amaçladığı özellik ya da davranışları ölçmede sınırlı kalmaktadır. Boşluk ancak başka testler kullanılarak doldurulur. Çoğunlukla birden fazla test kullanılmasının önerilmesi, tek bir testin istenen kapsamı ölçmede sınırlı olmasındandır.

Durum 2'de kullanıcının kapsamı ile testin kapsamı tam olarak eşleşmiyorsa da testin kapsamı uygulayıcının kapsamım diğerlerine göre daha çok karşılamaktadır.

Burada tekrar vurgulanabilir ki, kapsam geçerliği, bir bütün olarak testin ve testteki her bir maddenin maksada ne derece hizmet ettiğidir. Birincisi, testteki tüm maddelerin ölçülecek konuyu (içeriği) ve davranışları ne derece temsil ettiği; ikincisi, testteki her bir maddenin ölçülecek davranışı ne derece ölçtüğüne bağlıdır. İstenmeyen değişkenlerin ölçülmesi de kapsam geçerliğini düşürür. Örneğin, "beşle altının çarpımının ikiye bölünmesinden iki çıkarılmasıyla elde edilen sayı kaçtır?" ifadesine sözel yetenek karşır. Matematik becerisi ölçeme amaçlanırken başka bir niteliği ölçtüğümüz için kapsam geçerliği düşmüş olur. Yani kapsamda sözel yetenek becerisi ve bizim böyle bir değişkeni ölçme amacımız olmadığı halde bu değişken ölçmeye karışarak hem amacımızdan uzaklaşmamızı hem de kapsam geçerliğinin düşmesine neden olur.

2-Ölçüte Dayalı Geçerlik (Ölçüt Geçerliği): Test puanlarıyla ölçüt yada ölçütler arasındaki korelasyon katsayısıdır. Ölçütler genelde "dış ölçüt”tür. Elde ettiğimiz geçerlik ise bir ölçüte göre geçerliktir. Geçerlik katsayısı ölçüt alınan puanlara göre değişecektir. Bu nedenle öncelikle doğru ölçüt bulmak gerekir. Yani geçerliği araştırılan konuyla ilgili bir ölçüt olmalıdır. Aynı zamanda ölçütün geçerliği ve güvenirliği yüksek olmalıdır. Ölçüt geçerliği ölçütün elde edildiği zamana göre ikiye ayrılarak incelenir.

a-Yordama Geçerliği: Ölçüt puanların yordayıcı (geçerliği araştırılan) puanlardan sonra elde edilmesi durumundaki geçerliktir, Bu geçerlik türünde yordayıcı puanları daha sonraki bir performansı yordamak (kestirmek-tahmin etmek) amacıyla kullanılır. Eğer iyi yorduyorsa (yani yordayıcı ve ölçüt puanlar arasındaki ilişki yüksekse) yordama geçerliğinden söz edilir. Yordama bir tahmindir. Ancak her tahmin bir yordama değildir. Bir tahminin yordama olabilmesi için geleceğe dönük olması belli bilgiler temelinde bazı teknikler kullanılarak yapılması gerekir. Yordama işinde (geçerliğinde) kullanılan istatistiksel teknik regresyondur.

Yordama geçerliğinde en önemli sorun uygun bir ölçüt, bulmaktır. İyi bir ölçüt şu özelliklere sahip olmalıdır. 1-Ölçüt öncelikle yordanmaya çalışılan değişkenle ilişkili olmalıdır. (Örneğin müzik yeteneğini ölçen bir araçla kişinin okuduğunu anlama yeteneğini yordayamazsınız.) 2-Ölçüt güvenilir olmalıdır. Ölçüte ilişkin puanlar ne kadar çok hata içerirse yordama geçerliği o derecede düşük olacaktır. 3-Ölçüt geçerli olmalıdır. Zaten geçerlik çalışması bir aracın amaca uygunluk derecesini ortaya koyma çalışmasıdır. Bu nedenle amaca uygunluğu kanıtlanmamış ya da amaca uygun olmadığı bilinen bir ölçütle bu çalışma başarısız olur. 4-Kolay ve pratik olmalıdır. Elde edilmesi ve uygulanması kolay ve pratik olmalıdır.

b)Uyum (Uygunluk) Geçerliği: Ölçüt puanların yordayıcı puanlarla aynı zamanda veya daha önce elde edilmesi durumunda, ölçüt ile yordayıcı arasındaki korelasyon katsayısına uyum geçerliği adı verilir. Uyum geçerliğine hâlihazır geçerlik, mevcut durum geçerliği, eş-zaman geçerliği ve uygunluk geçerliği de denilmektedir. Yordama geçerliğinden farkı; testin ölçülmek istenen davranış veya özellikleri hangi düzeyde ölçebileceğini belirlemektir. Yordamada ise kestirme vardır. Özellikle testin amacı tanı koymak ise uyum (eş-zaman) geçerliğine başvurmak yararlıdır. Örneğin üniversite sınavı ile üniversite başarısı; işe giriş sınavı ile iş performansı arasındaki korelasyon katsayıları yordama geçerliği olurken; üniversite giriş sınavı ile ortaöğretim başarı puanı (ölçüt olarak) veya matematik dersi başarısı ile aynı zamanda elde edilen matematik yeteneği testi puanları arasındaki korelasyon katsayıları uyum geçerliği olur.

Bir testin bir ölçüte göre geçerliği bu testin güvenirliğinin karekökünden büyük olamaz.

Ölçüt geçerliğini yordayıcı ve ölçütün güvenirlikleri, yordayıcı ve ölçütün birbirine etkisi (bağımlı-bağımsız olması), grubun homojenliği ve puanların ranjı (genişliği) etkiler.

3-Yapı Geçerliği: Bireylerde var olduğu kabul edilen özelliklere psikolojide yapı denir. "Zeka, tutum, ilgi, kaygı, depresyon, atılganlık, içedönüklük, dışa dönüklük, güvensizlik vb." gibi kişilik özellikleri psikolojik yapıya örnek olarak verilebilir. Yapı, birbiriyle ilişkili olan öğeler ya da öğelerin oluşturduğu örüntü olarak tanımlanır. Bu yapılar hipotetiktir (teoriktir, kuramsaldır). Yani var oldukları kabul edilir. Doğrudan ispatlanamaz. Ancak gözlemlerle varlıkları hissedilir. Örneğin günlük dilde "zeki adam" dediğimizde bunu ispatlayanlayız. Yani zekânın varlığını ispatlamaya kalkmayız. O kişinin bizim kabul ettiğimiz bir yapıyla ilgili davranışları gösterdiğini düşünürüz.

Yapı geçerliği bir araçla ölçülmek istenen yapının o araçla ortaya konulma derecesi olarak tanımlanabilir.

Yapı geçerliği, yapının tanımlanmasındaki doğruluğa, yapıdan çıkarsanan gözlenebilir davranışların yapıyla ilgili olmasına, davranışların yapının tamamını (kapsamını) temsil etmesine, gözlenebilir davranışları ölçmek için yazılan maddelerin (soruların) onları ölçebilme derecesine bağlıdır.

4-Görünüş Geçerliği: Bir testin ne ölçtüğü ile ilgili değil ne ölçüyor göründüğü ile ilgilidir. Testin ölçülmek istenen değişkeni ölçüyor görünmesidir. Bu çalışma testin tamamı için "olduğu kadar maddeler için de yapılır. Yani maddelerde ölçülmek istenen davranışı ölçüyor görünmelidir. Örneğin "14/4 işlemi sonucunda kalan kaç olur." ile "On dört'ü dörde böldüğümüzde kalan kaç çıkar." Soruları matematik davranışını aynı geçerlik düzeyinde ölçüyor görünmemektedir. Birincisi daha iyi bir matematik sorusu gibi görünmektedir.

Geçerliği Artırmanın Yollan

1-Her ölçme aracının geçerliği o araçtaki maddelerin teker teker geçerliğine bağlıdır. Her soru araçla ölçülmek istenen davranışların en az birini ölçmek zorundadır.

2-Aracın kapsamı geçerliği etkiler. Hem çok dar hem de çok geniş bir kapsam geçerliği
düşürür. .

3-Test güvenirliğini artıran tüm etmenler geçerliği artırır.

4-Cevaplamaya verilen süre (cevaplanamayan soruların kapsamı daraltmasından dolayı) geçerliği etkiler.

5-Puanlama yanlılıkları geçerliğin etkiler.

6-Ölçüt puanların geçerlik ve güvenilirlikleri geçerliği etkiler.

7-Ölçme aracının güçlüğü ve grubun yetenek düzeyi geçerliği etkiler. Örneğin okul birincisi, ikincisi seçilecekse zor bir sınav yapılabilir. Kolay bir sınav yapılırsa araç amaca hizmet etmeyeceğinden geçerlik düşük olacaktır.

8-Soruların yıllarca değiştirilmeden kullanılması geçerliği düşürür.

9-Soruların sınavdan önce açıklanması geçerliği düşürür.

10-Kopya çekilmesi geçerliği düşürür.

11-Testin kullanım sayısı geçerliği etkiler. Her kullanımın geçerliği bir miktar düşürdüğü söylenebilir.

12-Testin kullanış amacı ve uygulama gurubu geçerliği etkiler.

Güvenirlik Ve Geçerlik Arasındaki Temel İlişkiler

1-Test aracının en önemli özelliği geçerli olmasıdır.

2-Bir ölçme aracının geçerliği yüksek ise güvenirliği de yüksektir. Tersi doğru değildir.

3-Güvenirliği yüksek bir testin geçerliği düşük olabilir.

4-Güvenirlik geçerlik için önkoşuldur ancak yeterli koşul değildir.

5-Bir arcın ölçüt geçerliği o aracın güvenirliğinin karekökünden büyük olamaz.

; (Denklem 10)

Formülde max. r_xy geçerliği, r_xx^,güvenirliği göstermektedir..

2.5 Kullanışlılık

Araçların hazırlanış, uygulanış ve puanlanış bakımından ekonomik ve kolay olması aynı zamanda sınırlılıklarının az olması anlamına gelmektedir. Şu alt başlıklar altında incelenebilir:

1-Ekonomiklik: Araç, öğretmen, yönetim, öğrenci vb. için ekonomik olmalıdır.

2-Hazırlama süresinin azlığı: Aracı geliştirmenin ne kadar zaman aldığı ile ilgilidir. Diğer koşullar eşit olduğunda en kısa zamanda hazırlanan testler tercih edilmelidir.

3-Uygulama süresinin azlığı: Aracın kullanışlılığı, verdiği puanın önemine oranla uygulama gerektirdiği zaman azaldıkça artar.

4-Hazırlayıcı ve uygulayıcının niteliklerine bağlı olarak sınırlı olması: Araçların hazırlanması ve uygulanması özel beceriler gerektiriyorsa kullanışlılığı azalır.

5-Cevaplayıcının niteliklerine bağlılık: Cevaplayıcıların niteliklerine uygun araçlar kullanışlıdır.

6-Uygulama kolaylıklarına bağlılık: Sayfa düzeni, baskı kalitesi vb. özellikler uygulamayı kolaylaştırır. Araçları kullanışlı yapar.

7-Puanlama kolaylığına bağlılık: Objektif olarak ve çabuk puanlanan araçlar kullanışlıdır.

8-Yorumlama kolaylığına bağlılık: Elde edilen puanlar anlamlı biçimde yorumlanamaz ise değerlendirme ve karar verme de kullanılamaz. Araç yorumlamaya yardımcı, yorumlamayı kolaylaştırıcı ve yorumda hatayı azaltıcı ise kullanışlıdır.

Bölüm Testi

1. Aşağıdakilerden hangisi bir testin geçerliğinin artmasını sağlayamaz?

A) Soruların öğrenci düzeyinin altında olması*

B) Öğrencilerin sınavdan önce güdülenmesi

C) Soruların açık ve anlaşılır olarak yazılması

D) Sınav ortamının rahatsız edici uyarıcılardan arıtılması

E) Soruları puanlarken dikkatli davranılması

2. Aşağıdakilerin hangisi bir testin kullanışlılığını kesinlikle düşürür?

A) Soruların yazılmasının fazla zaman almaması

B) Sınavı uygulama maliyetinin az olması

C) Soruları puanlamanın uzun zaman alması*

D) Fazla soru yazma gereğinin olmaması

E) Sınav kâğıdını çoğaltmanın kısa zaman alması

3. Derste görülen üç konunun ikisinden soru yazılmadığı durumda hangi geçerlik türü düşer?

A) Yordama B) Uygunluk C) Yapı D) Kapsam* E) Görünüş

4. Bir testten elde edilen puanlara tesadüfi hataların karışmaması veya az karışması testin hangi özelliği ile ilgilidir?

A) Güvenirlik*

B) Geçerlik

C) uyumluluk

D) kullanışlılık

E) nesnellik

5. Aşağıdakilerden hangisi güvenirlik kavramını açıklamada kullanılamaz?

A) Ölçme sonuçlarına karışan hataların azlığı

B) Farklı uygulama puanlarının birbirini tutması

C) Maddeler arası ilişkilerin yüksek olması

D) Aracın her uygulamada kararlı sonuçlar vermesi

E) Aracın ölçülmek istenen değişkeni ölçebilmesi*

6. Aşağıdakilerden hangisi bir testin güvenirliğini artırmaz?

A) Sorularda bilimsel ve dilsel hata olmaması

B) Puanlamanın yansız olarak yapılması

C) Soru sayısının belli bir oranda artırılması

D) Verilen puanların dikkatli kaydedilmesi

E) Oldukça fazla sınav süresi vermek*

7. Bir testin ölçtüğü kapsamdan yeni sorular yazarak soru sayısını artırmak öncelikle testin hangi özelliğini etkiler?

A) Güvenirlik* B) Geçerlik C) Objektiflik D) Kullanışlılık E) Genellenebilirlik

8. I- Hazırlama süresinin kısalığı

II- Maliyetinin düşük olması

III- Kolaylıkla uygulanabilir olması

IV-Puanlamanın az zaman alması

Yukarıda verilen açıklamalar bir ölçme aracının hangi özelliğiyle ilişkilidir?

A) Kullanışlılık* B) Geçerlik C) Kolaylık D) Güvenirlik E) Kapsamlılık

9. Aşağıdakilerden hangisi kapsam geçerliğinin en iyi açıklar?

A) Testin yordama gücünün yüksekliği

B) Testin kolay uygulanabilirliği

C) Maddelerin açık anlaşılır yazılması

D) Soruların konulara dengeli dağılması*

E) Testin yansız puanlanabilmesi

10. I-Sabit II-Sistematik III-Tesadüfî

Yukarıdaki hata türlerinden hangileri kontrol altında tutulamaz?

A) I –

B) II

C) III*

D) I – III

E) II – III

11. Aşağıdakilerden hangisi ölçme araçlarının güvenirliği ile doğrudan ilgili değildir?

A) Aracın duyarlığının yüksekliği

B) Her konudan sorular sorulması*

C) Soruların dikkatli puanlanması

D) Puanların dikkatli kaydedilmesi

E) Yansız puanlama yapılması

12. Aşağıdakilerden hangisinin olması durumunda ölçme araçlarının geçerliği düşer?

A) Soruların konuları yeterince örneklemesi.

B) Ölçme sonuçlarına karışan hataların azalması

C) Öğrencilerin doğru cevapları birbiriden alması*

D) Sınav kağıtlarının iki kez puanlanması

E) Cevaplamayla ilgili bir yönergenin verilmesi

13. Bir okuldaki matematik öğretmenleri iki gruba ayrılarak aynı davranışları ölçen iki test geliştirmişler ve bu iki testi bir hafta arayla aynı öğrencilere uygulamışlardır. Uygulama sonucunda iki uygulamadan elde edilen puanlar arasındaki korelasyon 0,91 bulunmuştur. Bu korelasyon katsayısı aşağıdakilerden hangisinin yorumlamada kullanılabilir?

A) Testlerin objektif puanlanabildiğini

B) İki testinde geçerliğini

C) Test puanlarına karışan hata miktarını

D) Testlerden hangisinin daha zor olduğunu

E) Testlerin ne kadar güvenilir olduğunu*

14. Aşağıdakilerden hangisi öncelikle bir testin güvenirliğini artırır?

A) Soruların öğrencileri birbirinden ayırması

B) Aracın gelecekteki başarıyı yordayabilmesi

C) Amaçlanan değişkenin ölçülmesi

D) Konularla dengeli sayıda soru yazılması

E) Puanlamanın bir anahtarla yapılması*

15. Geçerliği en çok etkileyen hata türü hangisidir?

A) Tesadüfî B) Sabit C) Sistematik* D) Standart E) Yanlı

16.Yapılan bir sınavda, sınav sorularının bilinen bir kaynaktan alınmış olması sınavın hangi özelliğini düşürür?

A) Kullanışlık

B) Kararlık

C) Tutarlık

D) Geçerlik*

E) Güvenirlik

IIII – EĞİTİM ÖĞRETİM SÜRECİNDE KULLANILAN ÖLÇME ARAÇLARI

3.1 Test Planı (Test Geliştirme)

Bir sınavın amacını belirleme adımından not verme adımına kadar olan süreci kapsayan işlemleri içerir. Aşamalar şunlardır.

1-Testin amacını belirlemek: Testle hangi değişkenlerin/özelliklerin ölçüleceği (örneğin matematik yeteneği, matematik başarısı, matematiğe karşı tutum gibi) sonuçların hangi değerlendirme türü için kullanılacağı (öğrenme eksikleri, hazırbulunuşluk düzeyi vb.) ve sonuçlar üzerinde hangi işlemlerin yapılacağını belirleme işlemlerini kapsar.

2-Ölçülecek nitelikleri saptamak: Bu adımda ölçme işleminin hangi düzeyde ve hangi konulardaki özelliklerin ölçüleceğini belirlemek söz konusudur. Bu adıma ölçülecek kapsamı ve bu kapsamdaki davranışları belirlemek söz konusudur diyebiliriz. Örneğin matematik başarısını ölçeceksek kaçıncı sınıf ve hangi konular olduğuna karar vermek ve hatta bu konularda hangi kazanımların yoklanacağı belirlenmelidir. Bu kararda testin amacı etkili olacaktır.

3-Soruları Yazmak: Belirlenen davranışlara uygun, belirtke tablosunda bulunan davranışlar için sorular yazılır ve soruların sayısı konu ağırlığına bağlı olarak ayarlanır. Bu aşamada bir anlamda kullanılacak test türüne (yazılı, sözlü, seçmeli gibi) ve soru tipine de karar verilmiş olur.

4-Soruları gözden geçirmek / düzeltmek: Sorular yazıldıktan sonra, bilimsel bilgilere uygunluk, dil hataları, anlaşılırlık ve ölçülmek istenen davranışı yoklama yönlerinden incelenerek deneme uygulaması yapılmadan önce gerekli düzeltmeler yapılır.

5-Deneme formunu hazırlamak: Sorular düzenlendikten sonra test uygulama formu haline getirilir. Bu forma deneme formu adı verilir. Deneme formu test hazırlama kurallarına uygun olarak oluşturulmalıdır. Deneme formu uygulaması için genellikle esas ölçme yapılacak gruba benzeyen veya heterojen bir grup seçilir.

6-Deneme uygulamasını yapmak: Testin ve test maddelerinin sayısal özelliklerini belirlemek amacıyla yapılır. İşleyen ve işlemeyen maddeleri belirlemeye çalışılır.

7-Puanlama yapmak: Deneme uygulaması yapıldıktan sonra cevaplayıcıların cevapları için puanlama yapılır. Puanlama 1-0 veya sorular için uygun görülen bir şekilde yapılabilir.

8-Test ve madde istatistiklerini hesaplamak: Puanlama yapıldıktan sonra cevaplayıcı sayısı ve testin amacına uygun tekniklerle test ve madde istatistikleri hesaplanır.

9-Madde seçmek: Elde edilen test ve madde istatistiklerine bağlı olarak hangi maddelerin seçileceğine, hangi maddelerde ne tür düzeltmeler yapılacağına, nihai testin hangi maddelerden oluşturulacağına karar verilir.

10-Nihai (esas) testi oluşturmak: Deneme uygulaması sonucunda seçilen maddelerin istatistiksel özellikleri nihai testin sayısal özellikleri hakkında bilgi verici olabilir. Bu bilgilere göre nihai test amaca hizmet edecek nitelikte ise seçilen maddelerle nihai test formunu test formu oluşturma özelliklerine uygun olarak oluşturmak mümkündür.

11-Uygulama: Nihai test oluşturulduktan sonra asıl gruba bu testi uygulama aşamasına geçilebilir. Bu aşamada da madde ve test istatistiklerini belirleme, önceden kestirilen özelliklere ne ölçüde uyduğunu belirlemek söz konusu olabilir.

Eğitimde yapılan süreçlerin birçoğunda öğrenciler hakkında bilgi toplama amacı vardır. Bu amaçla çeşitli yollardan ve araçlardan faydalanılabilir. Ölçme araçları yardımıyla öğrenciler üzerinde yapılan ölçme işlemleri aşağıdaki amaçları kapsayabilir.

1) Başarı ya da performansın yordanması

2) Öğrenme eksik veya yanlışlarının ortaya çıkarılması,

3) Öğrenci ihtiyaçlarını belirlemek

4) Öğrencilerin performans ya da başarısını değerlendirmek

5) Öğrencileri yönlendirmek veya onlara rehberlik yapmak

3.2 Birey Hakkında Bilgi Toplama Yolları

Bireyler hakkında bilgi toplamanın çeşitli yolları vardır. Bunlar genel olarak ikiye ayrılır.

1-Test dışı teknikler: Gözlem, vak’a kayıtları, kontrol listeleri, dereceleme ölçekleri, biyografi, otobiyografi vb. yöntemler.

2-Test teknikleri: Öğrencileri yeri ve zamanı önceden belirlenmiş sınama durumları içine sokarak tepkilerini almak amacıyla geliştirilen araçlar kullanarak bilgi toplamaktır. Örnek olarak zekâ, başarı, yetenek vb. testleri verilebilir.

Testlerle yapılacak değerlendirmelerde, yer ve zaman herkes için aynı olduğundan bireyleri birbiriyle kıyaslamak daha objektif görülebilir. Çünkü test koşulları herkes için aynıdır, eşittir. Farklı değişkenlerin etkisinin minimuma indiği kabul edilir.

Test uygulaması birey hakkında bilgi toplama yollarından birisidir. Test kelimesi sınama, yoklama anlamındadır. Türkiye’de ise sınav anlamında, özellikle çoktan seçmeli sınav anlamında kullanılır..

Psikolojik testler sınıflandırılırken bazı ölçütler kullanılır. Bu ölçütler çerçevesinde birçok testin hangi kategoriye alınacağı şüphelidir. Birçok testin sınıflanması binişiklik gösterir. Yani testlerin çoğu aynı zamanda birden çok sınıflamanın içine girebilmektedir. Sınıflamaları tek başına doğru ya da yanlış diye belirlemek mümkün değildir. İşe yarayıp yaramadıklarına bakılır. Sınıflama belirli ölçütlere göre yapıldığından çeşitli sınıflamalara rastlanmaktadır. Aşağıda bazı ölçütlere göre testlerin nasıl sınıflanabileceğine ilişkin kısa bilgiler bulunmaktadır.

A – Davranışların Doğası Bakımından

1 – Maksimum Yerlik Testleri

Bireyin belli bir işi, belli bir durumda, ne derece iyi ya da doğru yapabildiğini belirlemede kullanılır. Bireyin zihinsel, duyuşsal, devinişsel ya da akademik yetenekleri hakkında bilgi toplamak amacı ile hazırlanan araçlardır.

a) Zeka Testleri: Kişinin takvim yaşı ile zihinsel gelişimi arasındaki uyumu ölçen testlerdir. Çocukları için öğrenme gücünü, yetenekler içinse karşılaşılan zihinsel sorunlarla başa çıkabilme yeteneğini ölçer. Bazı ölçmecilerce 3 grupta incelenir.

1. Genel Yetenek Testleri; Belirli düzeylerde genel zihin yeteneklerini ölçer. Doğuştan getirildiğine, çevre etkisiyle çok az değiştiğine inanılan zihin gücünü ölçer. Genellikle kişinin ileride, kendisine olanak verildiğinde, belirli bir şeyi ne kadar öğrenebileceğini veya yapabileceğini yordamada, öğrenme gücünü (neyi ne kadar öğrenebileceğini) ölçmede kullanılır.

2. Özel Yetenek Testleri; Sınırlı ve dar bir alandaki zihin gücünü ölçer. Örneğin, müzik, resim ve sanat dalarlında bireyin sahip olduğu özel zihin yeteneklerini ölçen testler bunlar arasındadır.

3. Farklı yetenek testleri: Dil yeteneği, soyut kavrama yeteneği, mekanik kavrama yeteneği gibi farklı zihin yeteneklerini ölçen testlerdir.

b) Başarı Testleri: Kişinin eğitim süreci içinde veya belirli çevre koşulları altında ne kadar öğrendiğini ölçen testlerdir. Bu testler, bireylerin geçmişte ne kadar öğrendiğini ortaya çıkarmak için kullanılabilir. Esas olarak bireyin ileride ne kadar öğrenebileceğinin değil geçmişte ne kadar öğrendiğinin belirlenmesinde kullanılır. Üç tür başarı testi yaygın kullanılır.

1.Erişi testleri; amaçlanan davranışlardan hangilerinin ne ölçüde öğrenildiğini/kazanıldığını ölçmeyi amaçlar.

2. İzleme testleri; amaçlanan davranıştan her birinin ne ölçüde kazanıldığını ve hangi düzeyde öğrenme eksik ve güçlükleriyle karşılaşıldığını belirlemeyi amaçlar.

3. Hazırbulunuşluk (düzey belirleme) testleri: Bir ders ya da kursa başlamadan önce öğrenenlerin sahip olması gereken kazanım veya davranışlardan ne kadarına sahip olduklarını belirlemek amacıyla kullanılan testlerdir.

2 – Kişilik Testleri

Yansıtıcı türden ve kişisel yoruma açık olan bu test grubunda amaç; danışanın psikolojik danışma yardımı almasını gerektirecek bir kişilik bozukluğunun olup olmadığını anlamaktır. Bireyin psikolojik ihtiyaç ve değerlerini, normal ve normal olmayan kişilik özelliklerini görmemize yardımcı olur.

a) Projektif kişilik testleri: Açık olmayan uyarıcılara karşı bireyin gösterdiği kişisel ve sübjektif tepkilere dayanır. Projektif (yansıtma) testlerde resimler, mürekkep lekeleri, tamamlanmamış cümleler kullanılır.

b) Kişilik envanterleri: Bireylerin psikolojik ihtiyaç ve değerlerini ölçer. Bunun yanında bireylerin normal ve normal olmayan kişilik yönlerini belirlemeye de yardımcı olur.

c. Uyum envanterleri: Bireyin çevresine veya çevresindeki insanlara uyum düzeyin belirlemek üzere geliştirilmiştir.

d. İlgi envanterleri: Bireylerin hoşlandıklarını ve hoşlanmadıklarını tanıyarak ileride doyum sağlayacağı alanları meslek olarak seçmelerine yardımcı olmak amacı ile kullanılan ölçme araçlarıdır.

B – Puanlama Biçim Bakımından

1 – Objektif Testler

Herkesin puanlayabileceği, anahtarı daha önceden belirlenmiş testlerdir. Çoktan seçmeli, doğru-yanlış ve eşleştirmeli testler objektif testler için örnek oluşturabilir.

2 – Subjektif Testler

Puanın, puanlayıcının öznel kanı ve yargısından etkilendiği testlerdir. Sözlü ve yazılı testler bu türden testlere örnek verilebilir.

C – Testi Hazıryalan Kişiler Açısından

1 – Öğretmen Yapımı Testler

Öğrencilerin veya öğrenenlerin öğrenme düzeyini belirlemek için, sınıf atmosferi gibi faktörleri göz önüne alarak öğretmenlerin kendi sınıf veya okulları için hazırladıkları testlerdir. Sınıf öğretmeninin sınıftaki öğretimin etkililiğini ölçmek ya da artırmak için geliştirdiği testlerdir.

2 – Standart Testler

Belli bir alanda öğretilenlerin tümünü diğer değişkenlerden arınık olarak ölçmeyi amaçlayan testlerdir. Daha kapsamlı bir kullanış için uzmanlarca hazırlanır. İçerik, puanlama, yönergeler ve yorumlama özgülleşmiştir.

Unutulmamalıdır ki, başka ölçütler kullanarak testleri farklı şekilde gruplamak da mümkündür.

3.3 Değerlendirmede Kullanılan Ölçme Araçları

Yazılı Yoklamalar

Tanım: Cevaplayıcının sorulan soruların cevaplarını düşünüp hatırlayarak ve hatırladığı cevabı organize edip yazılı olarak sunduğu sınav türüdür. Kâğıt kalem veya essay tipi sınavlar da denir. Yazılı sınavlar kişinin özgün ve yaratıcı düşünce gücünü, yazılı anlatım becerisini, belli konulardaki görüşünü, ilgisini ve tutumunu ölçmede kullanışlıdır. Yazılı sınavı uygulamaları farklı şekillerde yapılabilir.

Bunlar;

1-Klasik yazılılar: Tanıma uygun olarak, günümüzde birçok öğretmenin uyguladığı sınav tarzıdır.

2-Tercihli sınavlar: Sınav soruları arasında tercihli sorular varsa bu tür sınavlara tercihli sınavlar denmektedir. Tercihli sınavlar birkaç biçimde uygulanabilir. Örneğin, sorular konulara göre gruplandırılarak her gruptan belirli sayıda soru seçilip cevaplandırılması istenebilir; belirli soruları zorunlu tutarak yanında seçimlik sorular verilerek belirli sayıda da seçimlik sorunun cevaplandırılması istenebilir ya da tüm sorular verilerek bunlardan seçilecek belirli sayıda sorunun cevaplandırılması istenebilir.

Yazılı yoklamalarda kullanılan çeşitli soru tipleri vardır. Bunlar;

a-Sınırlı cevap soruları (Kısa cevap gerektiren sorular): Cevapları çoğunlukla sınırlı veya kısa olan sorulardır. Verilecek cevabın niteliğine, uzunluğuna ve örgütlenmesine ilişkin bazı sınırlamalar getirilir (Listeleyin, tanımlayın, nedenlerini sıralayın gibi).

b-Serbest cevap soruları (Uzun cevap gerektiren sorular veya açık uçlu sorular): Cevapları sınırlı olmayan, kompozisyon tipi sorulardır. Cevabın içerik, nitelik ve uzunluğunu belirlemede cevaplayıcıya belli ölçülerde özgürlük verilir (Yaratıcı düşünme gücü, bilgiyi örgütleme yeteneği, düşüncelerin iç tutarlığını ve dış tutarlığını değerlendirme gücü gibi özelliklerin ölçülmesinde kullanılabilirler). Bu tip sorulardan az sayıda sorulabildiğinden kapsam geçerliğini düşürücü etkileri vardır. Ancak, kompozisyon becerileri, sentez ve değerlendirme basamağındaki davranışlar, yaratıcılık ve özgünlük gibi değişkenler ölçüleceği zaman zorunlu olarak kullanılması gereken sorulardır.

c-Zorunlu cevaplı sorular: Bütün cevaplayıcılar tarafından cevap verilmesi zorunlu olan sorulardır.

d-Seçimlik sorular: Cevaplandırılması cevaplayıcıların seçimine bırakılan sorulardır. Bazı durumlarda verilen bütün sorular arasından belirlenen kadarının cevaplandırılması istenir. Bazı durumlarda da zorunlu cevaplandırılacak soruların yanında seçimlik sorularda verilerek, zorunlu sorular yanında seçimlik sorulardan belirlenen kadarının seçilip cevaplandırılması istenir.

Yazılı sınavların özellikleri

1-Öğrenciler cevaplarını belirli bir sürede yazmak zorunda olduklarından çok sayıda soru sorulamaz. Bu nedenle kapsam geçerliği düşüktür. Kapsam geçerliği önemli olduğu durumlarda yazılı sınav uygulamak doğru olmaz.

2-Yazma hızı öğrenciler arasında farklı olduğundan "yazı yazma hızı" gibi bir değişken ölçülecek değişkene karışarak geçerliği düşürebilir.

3- Soru sayısı az ve soruları yazma zamanı kısa olduğundan hazırlanması kolaydır.

4-Puanlama süresi zaman aldığından özellikle çok sayıda cevaplayıcının olduğu durumlarda, puanlayıcının kâğıtları okumaya zamanı azsa veya sonuçların çabuk bildirilmesi gerekiyorsa yazılı sınavların kullanışlılığı düşer.

5-Özellikle serbest cevaplı sorularda kesin doğru, kesin yanlış ayrımı zor olduğundan kâğıdın okunması ve puanlanması zaman alır. Bu durum yansız puanlama yapmayı da zorlaştırır. Aynı zamanda öğrencileri birbiriyle karşılaştırmak da zorlaşır. Bu nedenle güvenirlik düşer.

6-Öğrenciler cevaplarını düşünüp hatırlayarak yazdıklarından, bazı ölçmecilerce yazılı yoklamaların davranışları daha geçerli ölçtüğü iddia edilmektedir.

7-Puanlama güvenirliği düşüktür.

8-Analiz, sentez ve değerlendirme gibi üst düzey basamaklardaki davranışların ölçülmesine uygundur.

9-Cevaplamada özgürlük bulunduğundan, cevaplayıcılar cevapları ve soruları isteyerek veya istemeden başka tarafa çekerlerse bu durum puanlama farklılıklarına, dolayısıyla güvenirliğin düşmesine yol açar.

10-Şans başarısı yoktur. Bu durum güvenirliği dolaysıyla geçerliği artırır.

11-Soruların güçlüğü, testin geçerliği ve güvenirliği önceden kestirilemez.

12-Anlatımın duru, yazının güzel, kâğıdın düzenli olması ve kompozisyon yeteneği puanlama yanlılıklarına neden olarak güvenirliği düşürür. Aynı zamanda bu değişkenler ölçülecek değişkene karışarak geçerliği de düşürür.

13-Soruların belirginliği ve anlaşılırlığı azaldıkça öğrenciler tarafından istenilen yere çekilme olasılığı artar.

14-Yazılı sınav soruları şişirme yolla cevaplamaya elverişlidir.

Yazılı Sınav Hazırlarken Dikkat Edilmesi Gereken Noktalar:

1-Sorular açık, anlaşılır olmalı; cevaplayıcılar farklı şekilde algılanmamalı.

2-Mümkünse veya amaca uygunsa açık uçlu sorular yerine kısa cevap gerektiren sorular sorulmalı.

3-Sorular birbirinden bağımsız olarak cevaplandırılabilmeli. Her biri belirli bir davranışlar zincirini yoklamalı.

4-Soru ders kitabından veya bilinen bir kaynaktan olduğu gibi alınmamalı (Ezberi yoklar ve geçerliği düşürür).

5-Sorularda ifade ve yazım hataları bulunmamalıdır. Bu hatalar soruların yanlış anlaşılmasına sebep olabilir. "Adamın, eskiden ne yaptığı ile ilgili bir kaygısı yoktu" ile "Adamın eskiden, ne yaptığı ile ilgili bir kaygısı yoktu" farklı anlamlarda cümlelerdir.

6-Gereğinden çok soru yazılmalıdır. Böylece sorular incelenerek düzeltilir ve uygun sorular seçilir.

Yazılı sınavlarının puanlanmasında değişik tekniklerden yararlanılabilir.

Yazılı Sınavlarını Puanlama Teknikleri

1-Genel İzlenimle Puanlama: Puanlayıcının cevaplayıcının kâğıdını baştan sona okunduktan sonra genel izlenimine göre bir puan vermesidir. Özellikle kompozisyon kâğıtları genelde böyle puanlanır. Bu tekniğin puanlama güvenirliği düşüktür.

2-Sınıflama: Cevaplayıcıların kâğıtlarına hızlıca göz atılarak "iyi, orta, zayıf” gibi sınıflara ayrılması ve daha sonra bu sınıflardaki kağıtların puanlanmasıdır. İstenirse bu sınıflar da kendi içinde yeniden sınıflandırılabilir. Genel izlenime göre puanlama güvenirliği yüksektir ancak yine de puanlama güvenirliğinin düşük olduğu söylenebilir.

3-Sıralama: Tüm cevaplayıcıların kâğıtları puanlayıcı tarafından birbiriyle karşılaştırılarak en iyiden en zayıfa doğru sıraya konur. Bütün kâğıtlar bu şekilde sıralandıktan sonra en iyi kâğıda en yüksek not, diğerlerine de buna göre azalan puanlar verilir. Puanlar ilk iki yöntemden daha güvenilirdir ancak yeterli puanlama güvenirliği olduğu söylenemez.

4-Anahtarla Puanlama: Cevaplayıcılardan beklenen cevaplar listelenir. Bu listeye cevap anahtarı denir. Sonra bu listedeki cevaplara göre puanlama cetveli oluşturulur. Puanlama cetveli ve cevap anahtarı kullanılarak yapılan puanlamaya anahtarla puanlama denir. Puanlar diğer puanlama tekniklerine göre daha güvenilirdir yani daha az hatalıdır.

Puanlamada Dikkat Edilecek Noktalar

1-Ölçme konusu olmayan etkenlere puan verilmemelidir (Yazı güzelliği, anlatım gücü vb).

2-Cevaplayıcıyı tanımaktan ileri gelen puanlama yanlılığını önlemek için isimler kapatılmalıdır.

3-Bir sorunun iyi cevaplanmış olması diğer sorulara verilecek puanı etkileyebileceğinden puanlama soru-soru yapılmalı. Her kâğıtta aynı soru okunmalı ve puanlanmalıdır.

4-İyi bir öğrenciden sonra orta bir öğrenci zayıf, zayıf bir öğrenciden sonra ise aksine iyi görünebilir. Bu etkiyi gidermek için kâğıtlar sınıflandırılabilir.

5-Mümkünse birden fazla puanlayıcı kullanılmalıdır.

6-Yorgunluk ve dikkat eksikliği başladığına okuma ve puanlama bırakılmalıdır

7-Anahtarla puanlama imkânı yaratılmalıdır.

Sınıflama Gerektiren Testler

Tanım: Cevaplayıcılardan soruları / ifadeleri / maddeleri belli ölçüt(ler)e göre sınıflamasının istendiği sınav türleridir. En çok uygulananı (bilineni) doğru yanlış testleridir. Bu testlerde sorular doğru-yanlış önermeler olarak verilir. Cevaplayıcılar önermeleri/ifadeleri doğru-yanlış olarak sınıflar. İki seçenekli çoktan seçmeli testlere benzerler.

Madde Tipleri: 1-Doğru-yanlış önermelerden oluşan madde tipleri. 2-Önermeyi yanlış yapan ifadeyi işaretleten madde tipleri. 3-Önermelerin yanlış kısmını düzelttiren madde tipleri (Yanlış önermelerin doğrusunu yazması istenir). 4-İkiden fazla sınıflama gerektiren madde tipler. Aslında bu madde tipleri doğru-yanlış testlerindeki şans başarısının azaltmak amacıyla geliştirilmiştir. Bu nedenle madde tipleri olarak almak yerine doğru-yanlış testlerinde şans başarısını azaltmada alınacak önlemler olarak kabul edilebilir.

Özellikleri:

1- Cevaplar bir harf veya işaretle verildiğinden puanlama hem kolaydır hem objektiftir.

2-Cevaplama zamanı hemen hemen ifadeleri okumaya ayrıldığından (yani yazmaya ayrılan zaman az olduğundan) çok sayıda soru sorulabilir. Kapsam geçerliği yüksektir.

3-Madde yapısı basit olmasına rağmen uygulama basamağına kadar çeşitli düzeylerde davranışları ölçebildiği söylenir.

4-Sınavda cevaplama işlemi, ölçülen bilgi veya yeteneğin dışında bir zorluk getirmez. Bu nedenle ilköğretimin alt basamaklarında da uygulanabilir.

5-Şans başarısı vardır ve diğer seçmeli testlere göre en yüksek şans başarısına sahiptir

6-Öğrenme eksiklerini belirleme ve tanı koymaya elverişli değildir (Örneğin yanlış olarak verilmiş bir ifadeyi yanlış diye işaretleyen bir öğrencinin ifadenin doğrusunu bilip bilmediğinin kanıtı yoktur).

7-Bazı maddelerin yanlış olarak verilmesi test yapısı için zorunlu fakat eğitim açısından sakıncalıdır. Eğitimde yanlış cümleleri vermek ve onu vurgulamak öğrenme açısından sakıncalıdır. Önemli olan doğru olanı vurgulamak ve onun öğrenilmesini sağlamaktır.

8-İfade mutlaka doğru ya da yanlış olmalıdır. Oysa bazı özelliklerin ölçülmesinde kesin doğru ya da kesin yanlış yargılar geliştirmek zordur. Bu güçlük doğru yanlış testi uygulayanları sadece bilgi basamağındaki davranışları ölçmeye yöneltir.

9-Sorulan hazırlamak ve puanlamak kolaydır.

10-Yazı güzelliği, düzen gibi değişkenler işe karışmadığından geçerlik yüksektir.

Soru Yazarken Dikkat Edilecek Noktalar

1-Her madde bir davranışı yoklamalıdır (her ifadede bir ana fikir bulunmalıdır). Örneğin: "Güvenirlik madde sayısından etkilenmez."

2-Her madde kesinlikle doğru ya da yanlış olmalıdır. Cevaplayıcıların ifadenin doğruluğu ve yanlışlığı hakkında karar verebilmesi için gerekli minimum bilgi verilmelidir. İfadelerde (birçok, birkaç, bazen vb.) belgisiz sıfatlardan kaçınmalıdır.

3-Önermenin doğru-yanlış olduğunu açığa vuracak ipuçlarından sakınılmalıdır.

4-Bir maddede birden fazla yanlış ya da doğru fikir bulunmamalıdır. Bu durumda madde kolaylaşır. Bunun yerine ifade iki madde haline getirilmelidir.

5-Doğru-yanlış ifadelerin uzunlukları birbirine yakın olmalıdır.

6-Doğru-yanlış maddelerin sayıları birbirine yakın olmalıdır.

7-Doğru-yanlış maddeler testlere belirli bir örüntü halinde yerleştirilmemelidir (İki doğru, bir yanlış vb. gibi).

8-Bir maddenin yanlışlığı önemsiz veya aldatıcı bir noktada olmamalıdır.

Örneğin, "Fransız ihtilali 1879 tarihinde gerçekleşmiştir." Bu tip maddeler dikkati ölçtüğünden geçerliği düşürür.

9-Her madde mümkün olduğunca kısa ve açık yazılmalıdır. Gereksiz ayrıntılarla
şişirilmemelidir. Ana fikrin doğruluğuna etkisi olmayan, edebi olsun diye açıklığı kaybedilen
maddeler iyi madde değildir.

10-Çift olumsuzlama kullanılmamalıdır. İfadenin anlaşılmasını zorlaştırır. Bunlardan kurtulmanın yolu cümleyi olumlu ifade etmektir. Örnek:"Geçerliğin düşüklüğü testin güvenilir olmaması değildir."

11-Doğru bir önermeden yanlış bir önerme elde etmek için cümlenin fiilinin olumsuz hale getirme yoluna gidilmemelidir. Böyle maddelerde "me, ma" olumsuzluk ekleri gözden kaçabilir. Üstelik böyle maddelerin yanlış olduğu, zorla yanlış hale getirildiği anlaşılabilir.

12-Maddelerdeki ifadeler bilinen bir kaynaktan alınmamalıdır.

13-Kanı ifadeleri bir kaynağa yâda otoriteye dayandırılarak verilmelidir.

14-Birbiriyle ilgili maddeler örgütlenerek sunulmalıdır. Örneğin: "Aşağıda doğru yanlış maddeleri ile ilgili olarak verilen ifadeleri okuyarak karşılarına doğru ise 'D', yanlış ise 'Y' harfi koyunuz.

—Puanlama nesneldir.

—Geniş kapsamda soru sormaya elverişlidir.

—Sentez ve değerlendirme basamağında davranış ölçmek için çok kullanılır.)

Ödev Ve Projeler

Tanım: Öğrencilerin soru veya konuları ders dışında kendi çabalarıyla çözmesi / araştırması; bir inceleme yaparak sonucunu rapor halinde yazabilmesi; bir konuyu derinlemesine araştırması; araştırma, bağımsız çalışma, yaratıcı düşünme, farklı kaynaklar kullanabilme, yardım alma becerilerinin geliştirilmesi; uygulama ve üst düzeydeki davranışların geliştirilmesi ve ölçülmesi vb. amacıyla kullanılan araçlardır.

Ödevler-projeler bazı ölçmecilerce bir ölçme yöntemi olarak kabul edilmez. Ancak ödev ve projelerdeki başarı genel başarının önemli bir yönünü yansıtır ve tanımdaki amaçlar eğitimin amaçları arasındadır. Bazı ölçmeciler ise yukarıdaki görüşün aksine ödev ve proje uygulamaları sonucunda sınav kaygısından uzak, gerçeğe daha yakın bir davranış ölçüsünün elde edileceğini savunur. Bu görüşte de gerçek payı vardır. Ancak bu uygulamalar gözetimden uzak yapıldığından puanların geçerliği şüphelidir. Ödev öğrencinin kendisi tarafından yapılmamış olabilir. Bu tür uygulamalar iyi bir ölçme yöntemi olmasa da iyi bir kendi kendine öğrenme yöntemidir. Puan verilmediği zaman yeterli etkiyi gösterememe riskini önlemek için puan verilmeli ama sakıncalarından dolayı nota katılacak ağırlığı düşük olmalıdır.

Türleri:

1-Bireyse ödev veya projeler.

2-Grup ödevleri veya projeleri

Uygulama Şekilleri:

1-Herkese aynı konu ya da sorunun verilmesi,

2-Kişilere veya gruplara farklı konu ya da soruların verilmesi.

Özellikleri

1-Tanımda sayılan becerilerin geliştirilmesi ve ölçülmesi amaçlarına uygundur. Bu amaçların ölçülmesi ve geliştirilmesi için faydalı hatta zorunludur.

2-Özellikle grup ödevleri görev bilgiyi paylaşma, görev alma, yardımlaşma-dayanışma, sorumluluk alma, eleştiri ve özeleştiri yapma, empatik düşünme, hesap verme vb. davranışların geliştirilmesi ve ölçülmesi için uygundur.

3-Ödev-projelerin öğrencilerin kendileri tarafından yapılıp yapılmadığının kontrolü zordur.

Bu nedenle önlemler alarak kullanmak, kontrolü sağlamak yararlı olabilir.

4-Verilen puanların geçerliği düşüktür.

5-Puanlama güvenirliği düşüktür. Öğretmen kanıları işe diğer sınav türlerinde daha fazla karışmaktadır. Bu yönüyle yazılı sınavlara benzer.

6-Öğrencilere verilen konu veya soruların güçlüklerin ayarlamak zordur. Bu nedenle verilen puanlarla öğrencileri karşılaştırmak da zordur.

7-Derste öğrenilen-öğretilen davranışların ölçülmesi için uygun bir yöntem değildir.

Uygulamada Dikkat Edilecek Noktalar

1-Her öğrenciye ya da gruba farklı konu veya soruların verilmesi amaca daha fazla hizmet edebilir.

2-Ödev veya projeler öğrencilerin ilgilerine göre dağıtılırsa veya kendilerinin seçmelerine izin verilirse beklenen faydanın sağlanma olasılığı artar.

3-Verilen konular öğrencilerin üstesinden kalkabilecekleri bir güçlükte olmalıdır.

4-İnceleme/araştırma amacıyla yararlanabilecek muhtemel kaynaklar ve bulunabilecekleri yerler belirtilmelidir.

5-Konunun kapsamı açıkça belirtilmeli, sınırlan çizilmelidir.

6-Puanlama bir anahtara göre yapılmalıdır. Bu nedenle bir anahtar hazırlanmalıdır.

Kısa Cevaplı Testler

Tanım: Bir kelime, bir rakam, bir cümle veya kısa bir liste ile cevaplandırılabilecek sorulardan oluşan, cevaplayıcının cevabı düşünüp hatırlayarak yazılı olarak sunduğu ölçme araçlarına kısa cevaplı testler denir.

Cevapların düşünüp hatırlanması ve yazılması bakımından yazılı sınavlara; puanlama kolaylığı ve objektifliği bakımından çoktan seçmeli testlere benzer.

Soru Türleri:

1-Soru Kipinde Sorular: Madde soru cümlesi biçimindedir. “Kim, nasıl, niçin, nerede vb.” soru kipleri ile biten cümlelerden oluşur.

ÖR: “Bir ölçme aracında aranması gereken en önemli nitelik hangisidir?”

2-Eksik Cümle Tipinde (Boşluk Doldurmalı) Sorular: Öğrencilerden ifadelerde, cümlelerde veya paragraflarda bırakılan boşluk ya da boşluklara uyan kelimeyi veya cümleyi (kelimeler veya cümleleri, sayıları vb.) yazması beklenen sınav türüdür.

ÖR: “Ölçek türlerinden, .... .... her işlemi yapmaya uygundur.” Cümledeki boşluğa uygun kavramı yazınız.

3-Tanımlamayı Gerektiren Sorular: Bu tip sorularda bir kavramın tanımı, bir tanımı belirten kavram veya bir olgunun belirgin özelliklerinin yazılması istenir.

ÖR: “Random (tesadüfî) hatayı tanımlayınız.”

4-Tanımayı Gerektiren Sorular: Bu tip sorularda bir bilginin, kavramın, tanımın, özelliklerin veya işlem basamaklarının tanınması istenir.

ÖR: “Bu çalışmada, testin tanımlanan yapıya uygun, soruların birbiriyle ve test puanlarıyla ilişkilerinin yüksek olup olmadığına bakılmıştır.”

Yukarıda yapılan çalışmada çalışılan geçerlik türleri nelerdir?

Özellikler:

1-Cevaplayıcı cevabını düşünüp bularak yazmak zorundadır. Şans başarısı olmadığından güvenirlik yükselir.

2-Cevaplayıcı istediği cevabı verme özgürlüğüne sahiptir ancak yazılı sınav sorularına verilen cevaplarda olduğu gibi şişirme yapamaz.

3-Uygulama ve analiz düzeyine kadar davranışlar yoklanabilir. Bu nedenle kullanışlıdır.

4-Her eğitim düzeyine uygun düşen sınav tipidir. Her yaştaki öğrenciye uygulanabilir. Bu sebeple kullanışlıdır.

5-Puanlama göreceli kolaydır ama tamamen objektif (nesnel) olmayabilir. Kullanışlıdır ve kısmen de güvenilirdir.

6-Çok soru sorulabileceğinden kapsam geçerliği yazılı yoklamalardan yüksektir.

7-Cevaplar kısa ve belirgin olduğundan puanlama güvenirliği yazılı yoklamalara göre yüksektir. Bu sebeple güvenirlik artar.

8-Fikirleri kompoze etme, yazı güzelliği, kâğıdın düzeni gibi etkenler ölçmeye daha az karışacağından geçerliği yazılı yoklamalardan yüksektir.

9-Soruları hazırlama ve puanlama kolaydır. Bu nedenle kullanışlıdır.

10-Şans başarısı yoktur. Bu nedenle güvenirlik artar.

11-Testi tekrar kullanma imkânı ayrı bir cevap kâğıdı kullanılarak yaratılabilir. Bu durumda kullanışlılık artar.

12-Sorularda şekil, harita ve grafiklerden faydalanılabilir. Bu sebeple testin kullanışlılığı yükselir.

Soru Yazarken Dikkat Edilecek Noktalar:

1-Yoklanmak istenen davranış önemli bir davranış olmalıdır. Kıyıda köşede kalmış bilgiler yoklanmamalıdır.

2-Maddenin cevaplanabilmesi, bu madde ile yoklanan davranışın beklenen derecede öğrenilmiş olmasını gerektirmeli ve sadece buna bağlı olmalıdır.

3-Cevaplayıcıların cevabı bulabilmesi için gerekli bilgiler eksiksiz verilmiş olmalı, cevaplama için gereksiz ve şaşırtıcı bilgiler bulunmamalıdır.

4-Cevaplayıcıların cevabı bulmalarına yardımcı olabilecek ipuçları bulunmamalıdır.

5-Maddenin tek ve kesin doğru cevabı olmalıdır. Birden fazla cevap var ise ayrı puanlanmalıdır.

6-Madde açık, seçik ve kolay anlaşılır bir ifadeyle sunulmalıdır.

7-Eksik cümle (Boşluklu) maddelerinde, eksik olanın ne olduğu açıkça anlaşılmalıdır. Boş bırakılan yer/ler belirsizliğe yol açmamalıdır.

8-Maddeyi oluşturan cümle cevaplayıcıların bildiği bir kaynaktan aynen alınmamalıdır.

9-Testte yer alan maddeler birbirini cevaplandırmayı kolaylaştırıcı veya zorlaştırıcı olmamalıdır. Maddeler birbirinden bağımsız olmalıdır.

10-Her bir madde ile sadece bir davranış yoklanmalıdır.

11-Eksik cümle maddelerinde bırakılan boşluklar aynı boyutta olmalıdır.

12-Eksik cümle maddelerinde bırakılan boşluk sayısı tercihen bir, en fazla iki olmalıdır.

13-Cevap yeri olarak bırakılan boşluklar cevaplamayı ve puanlamayı kolaylaştıracak biçimde düzenlenmelidir.

14-Cevap yerleri aynı boyutta, tek tip olmalıdır.

Sözlü Sınavlar

Tanım: Soruların sözlü olarak sorulup, cevaplayıcının cevaplarını düşünüp hatırlayarak sözlü olarak sunduğu sınav türleridir. Sözlü yoklamalar da denir. Birçok soru tipi kullanılabilir. Uygulanmasında çeşitlilik görünmekte belirli standartlardan uzak sınavlardır. Bu nedenle sınav türlerini sınıflamak zor olmaktadır.

Kullanıldığı alanlar:

1-Okul öncesi ve ilköğretimin ilk yıllarında yararlanılmalıdır.

2-Konuşma becerileri, sözlü anlatım gücü gibi özellikleri ölçmede kullanılabilir.

3-Müzik alanındaki becerileri ölçmede de kullanılabilir.

4-Yabancı dil konuşma becerisini belirlemede kullanılır.

Özellikleri:

1-Sorular ve cevaplar sözlü olarak sunulur.

2-Cevaplayıcı cevabını düşünüp bulmak zorundadır. Şans başarısı olmaması güvenirliği artırır.

3-Cevaplayıcının cevabında belirsiz kalan noktaların deşilmesi yoluyla bilginin derinlemesine ve genişlemesine ölçülmesi mümkündür.

4-Soruların hazırlanması diğer sınavlara göre daha kolaydır ve daha az zaman alır. Bu nedenlerle kullanışlılığı yükselir.

5-Sınav yapanla cevaplayıcı arasında diğer sınavlara göre daha fazla etkileşim vardır. Sınav yapanın sınav anındaki durumu öğrenciyi etkilediğinden geçerliği ve güvenirliği düşüktür.

6-Cevaplayıcının cevaplama anındaki durumu (ses tonu, cevaplama tarzı, duruşu vb.) puanlayıcıyı olumlu ya da olumsuz etkileyerek puanlama güvenirliğini düşürür.

7-Sözlü sınavlar bireyseldir. Her öğrenciye ayrı soru sorulur. Soruların kapsamı ve güçlükleri farklı olacağından puanların karşılaştırılabilirliği, güvenirliği ve geçerliği düşer.

8-Cevaplama, sorudan hemen sonra yapıldığından öğrencinin düşünme ve cevabını gözden geçirme şansı çoğunlukla yoktur. Bu durum geçerliği ve güvenirliği düşürür.

9-Az soru sorulduğundan kapsam geçerliği düşüktür.

10-Her cevaplayıcıya ayrı soru sorma zorunluluğu vardır. Bu sebeple kullanışlı değildir.

11-Cevapların doğruluk derecesini puanlayıcı belirler. Bu da puanlama güçlüğü ve yanlılığını getirir. Bu da güvenirliği düşürür.

12-Sınav yapan sevmediklerine kasıtlı davranabilir. Güvenirlik düşer.

Aksak Yanları:

1-Bir sorunun ancak bir cevaplayıcıya sorulması; cevap yanlış da olsa başka cevaplayıcıya sorulamaması,

2-Az sayıda soru sorulmasının güvenirliği ve geçerliği düşürmesi,

3-Puanlama güvenirliğinin genelde düşük olması,

4-Özellikle ölçülmediği durumlarda konuşma diline hâkimiyet, sözlü anlatım gücü gibi değişkenlerin ölçülecek değişkene karışarak geçerliği düşürmesi,

5-Cevaplayıcıya fazla zaman verilmemesi,

6-Soruyu soranla cevaplayıcının etkileşim içinde olması,

7-Heyecan-sıkılma-korku gibi etmenlerle soruyu soranın ses tonu-jest ve mimikleri veya cevaplayıcıya karşı takındığı tavrın geçerliği düşürmesi olarak sayılabilir.

Çoktan Seçmeli Testler

Tanım: Cevaplayıcının cevabını, (sorunun doğru cevabı olasılığı olan) birtakım seçenekler arasından seçerek vermesini gerektiren sorulardan oluşan testlerdir. Doğru yanlış testleri seçenek sayısı iki olan çoktan seçmeli test olarak kabul edilir. Seçmeli testlerde sorulara madde denir. Madde, testin puanlanabilen en küçük birimidir.

Bir madde, kök ve seçeneklerden oluşur. Kök sorunun sorulduğu ve çözüm için gerekli bilgilerin verildiği kısımdır. Seçenekler ise öğrenci için olası cevaplardır. Doğru seçeneğe doğru cevap, yanlış seçeneklere ise çeldirici adı verilir. Çeldiriciler, madde ile ölçülmek istenen davranışa sahip olmayanların veya doğru cevabı bilmeyenlerin aklını çelmek, onları yanıltmak amacıyla yazılmış, doğru olmayan seçeneklerdir.

Madde Türleri:

1Doğru Cevaba Göre:

a)Doğru cevabı kesin ve bir tane olan maddeler: Maddenin seçeneklerinden sadece biri doğru diğerleri kesinlikle yanlış olan maddelerdir. Sıkça kullanılan madde tiplerindendir.

b)Anahtarlanmış cevabı en doğru olan maddeler: Seçeneklerin tümü kısmen doğru olan fakat biri diğerlerinden daha doğru olan madde tipidir. Bu tip maddelerle daha ileri düzey davranışlar daha kolay ölçülebilir. Bu tip maddelerde çeldiriciler doğru cevaba yakındır.

c)Bileşik cevap gerektiren maddeler: Bir maddenin birden fazla doğru cevabı olduğunda kullanılan madde türüdür. Bu tip maddeler çok kullanışlıdır. Hem ileri düzey davranışların ölçülmesinde hem de seçenek bulma zorlaştığında kullanılabilir.

d)Doğru cevabı gizli maddeler: Çoktan seçmeli maddelerin en zayıf yönlerinden biri, kişinin doğru cevabı bilmediği halde verilen seçenekler arasında onu gördüğünde tanımasıdır. Bazı hatırlamaların bilgiyi akla getirmesi veya davranışın gerektirdiği işlem ve düşünceden farklı bir yolla akla getirmeyi önlemek için maddenin cevabı gizlenir.

2-Madde Köküne Göre:

a)Kökü soru kipinde olan maddeler: Madde kökü soru kelimeleri ile ifade edilmektedir.

b)Kökü eksik cümle tipinde olan maddeler: Kökte bir harf, kelime, sembol veya cümle yazılmayarak boş bırakılır. Verilmesi gereken cevabın, yani bu boşluğa yazılması gereken cevabın, cevaplayıcının verilenler arasından seçmesi istenir. Bırakılacak boşluğun o soru ile ölçülmek istenen davranışı yoklayıcı nitelikte olması gerekir.

c)Kökü olumsuz maddeler: Madde kökünün olumsuz olarak ifade edildiği madde türüdür. Olumsuz madde bir sorunun birkaç doğru cevabı bulunduğu durumlarda kullanılır. Olumsuz madde olumlu maddeler içinde yer aldığında olumlu madde gibi görülebilir. Bu nedenle olumsuz ifadenin koyu, altı çizili vb. yazılması yoluyla olumsuzluğa dikkat çekerek, dikkatsizlikten kaynaklanacak hataların önüne geçilir.

3-Maddelerin Gruplanışına Göre:

a)Ortak köklü maddeler: Bir paragraf, bir tablo, bir grafik veya harita gibi bir materyalden iki ya da daha fazla sorunun sorulduğu maddelerdir. Bu tip maddeler, okuduğunu anlama, sayılar arasındaki ilişkiler ve bilginin ötelenmesi(transferi)ni içeren davranışların yoklanmasında çok kullanılır. Bu tip maddeleri yazarken dikkate alınacak en önemli noktalar, soruların madde kökündeki bilgiye dayalı olması ve birbirinden bağımsız olması olarak düşünülebilir. Soruların bağımsız olmasının sağlanmadığı sık sık görülür. Bu şans başarısını artıran bir hatadır. Ortak köke dayalı olarak sorulan madde sayısı çok olmamalıdır. Bu durumda soruların bağımsızlığını sağlamak zorlaşır. Sorulacak soru sayısı konusundan bir kural olmamasına rağmen beşi geçmemesi önerilir.

b)Ortak seçenekli maddeler: Bazı hallerde birden çok davranışın yoklanmasında aynı seçeneklerin kullanılması gerekebilir. Böyle durumda seçenekler başa yazılır. Madde köklerindeki sorular bu seçeneklere göre cevaplandırılır. Bu tip maddelere ortak seçenekli maddeler denir. Bu tip maddeler yazma-okuma zamanı ve basılı kâğıt miktarında ekonomi sağlar.-Bu tip maddeleri yazarken seçenek sayısı ile soru sayısının eşit tutulmamasında yarar vardır. Bu durumda sonuncu sorunun cevabı geriye kalan seçenek olacaktır. Genel olarak soru sayısının seçenek sayısından az olması veya bir seçeneğin doğru cevap olarak birden fazla kullanılması önerilir.

Özellikleri:

1 -Doğru cevap maddenin içinde verilir. Diğer sınav türlerinde böyle bir durum yoktur. Doğru cevabın madde içinde verilmesi, ölçülen davranışa yeterince sahip olmayanların doğru cevabı görünce tanımalarını sağladığından; bazı uzmanlar, çoktan seçmeli soruların ileri düzeydeki karmaşık davranışları ölçmede yetersiz kaldığını ileri sürerler. Yapılandırılmış olduklarından özellikle yaratıcılık gibi davranışları ölçemezler. Bu durum kullanışlılığı azaltır.

2-Sınav süresinin önemli bir kısmı maddeyi okumaya ve doğru cevabı bulmaya ayrılır. Yazma süresi az olduğundan çok soru sorulabilir. Bu durum kapsam geçerliğini ve dolaylı olarak güvenirliği artırır.

3-Yazı güzelliği, kompozisyon yeteneği gibi değişkenler işe karışmadığından geçerliği yüksektir.

4-Puanlama objektif ve kolaydır. Objektif puanlama, bir puanlayıcının cevap kâğıtlarını farklı zamanlarda ve farklı puanlayıcıların da farklı zamanlarda aynı cevap kâğıtlarını okumaları durumunda puanların değişmemesidir. Çoktan seçmeli testlerde cevaplayıcının cevabı ve doğru cevap okuyan kişiye göre değişmez. Bu nedenle puanlama güvenirliği tamdır.

5-Şans başarısı vardır. Bu durum güvenirliği düşürür. Ancak seçenek sayısının çokluğu şans başarısını azaltır. Bu nedenle az seçenek yerine çok seçenek yazmak güvenirliği artırır. Ancak zorlama yazılan seçenekler yazmak bu amaca hizmet edemez.

6-Her ne kadar bazı ölçmeciler aksini iddia etse de çoktan seçmeli testlerle ileri düzey davranışların ölçülmesi zordur. Özellikle sentez basamağındaki davranışlar ölçülemez.

7-Uygulanması kolaydır. Bu nedenle, eğitim basamaklarının çoğunda (basit madde formu kullanmak şartıyla ilköğretim 3. sınıftan itibaren) uygulanabilir. İlköğretimdeki kullanımlarında ayrı cevap kâğıdı kullanılmaması önerilir (Dikkatsizliğin getireceği hataları önlemek amacıyla).

8-Hazırlanması zordur. Soru yazma tekniklerinin bilinmesi ve deneyimi gerektirir. Kullanışlık düşer.

9-Geniş gruplara uygulanabilir ve makine ile puanlanabilir. Kullanışlık yükselir.

10-Cevaplama sadece işaret ile yapılmaktadır. Bu uygulama zamanını kısaltır. Uygulama zamanının kısa oluşu cevaplayıcının dikkatinin dağılmadan cevaplamayı tamamlamasına olanak verir.

11-Önceden saptanan özelliklerde sınav yapılması mümkündür. İstatistiksel temellere dayanır. Bu temeller, üzerinde çok çalışılmış, formülleri geliştirilmiş ilkelerdir. Maddelerle testin bütününü birbirine bağlayan istatistiksel eşitlikler kurulmuştur. Bu eşitlikler sayesinde maddeleri önceden deneyerek test puanlarının ortalaması, değişkenliği, güvenirliği vb. yaklaşık olarak hesaplanabilir.

12-Özelliklerinin çoğu geçerliği, güvenirliği ve kullanışlılığı artırıcı yöndedir.

13-Çoktan seçmeli testlerde okuduğunun anlama ve okuma hızı gibi bir değişken de işe karışır. Yeterli zaman verilerek bu değişkenlerin etkisi giderilebilir.

14-Maddeler açık, yalın ve anlaşılır bir dille yazılmalıdır. (İstisnası okuduğunu anlama ve hız testlerinde mümkündür.)

Soru Yazmada Dikkat Edilecek Noktalar

1-Madde bir davranışı yoklamalı ve yoklayacağı davranışa sahip olanların doğru cevabı verebilmeleri için gerekli bilgileri kapsamalıdır.

2 Madde kökü olabildiğince açık-seçik ifade edilmiş olmalıdır. Kök hiçbir yoruma meydan vermeyecek açıklıkta yazılmalıdır. Bu durum maddenin güvenirliğini düşürür. Soruyu zorlaştırmak için kökte belirsizlikler bırakılmamalı veya şaşırtma yoluna gidilmemelidir. Soru zorlaştırılacaksa seçenekler doğru cevaba yakınlaştırılmalıdır.

3-Madde kökünde gereksiz ifade ve açıklamalardan (anlaşılırlığa katkısı olmayan kelimelerden) kaçınılmalıdır. Madde kökünde ölçülecek davranışı ortaya koyan ifadeler bulunmalıdır.

4-Madde kökünde seçeneklerden herhangi birine ipucu veren ifadeler kullanılmamalıdır.

5-Seçeneklerde tekrar eden kelimeler madde köküne alınmalı ve tekrar edilmemelidir. Yani seçenekler mümkün olduğunca kısa olmalıdır.

6-Her test maddesi diğerlerinden bağımsız cevaplandırılacak şekilde yazılmalıdır.

7-Madde noktalama ve yazım kurallarına uygun yazılmalıdır.

8-Seçeneklerin uzunlukları birbirine yakın olmalıdır. Seçenekler ifade tarzı ve kapsam bakımından birbirine yakın olmalıdır.

9-Çeldiricilerin doğru cevaba yakınlığı maddenin düşünülen güçlüğüne paralel olmalıdır.

10-"Yukarıdakilerin hepsi" seçeneği dikkatle kullanılmalıdır. Seçeneklerin birbirine çok yakın olduğu hallerde kullanılabilir. Seçeneklerden birinin yanlışlığının açık olması (bu durumda yukarıdakilerin hepsi seçeneği elenir) veya seçeneklerden birinin doğru olduğunun görülmesi (bu durumda diğer seçenekler elenir) hallerinde güvenirliği düşürücü etki yapar.

11-"Yukarıdakilerin hiçbiri" seçeneği de dikkatli kullanılmalıdır. Bu seçenek doğru cevap olarak kullanılmamalıdır. Doğru cevap olarak kullanılırsa, cevaplayıcının davranışa sahip olup olmadığı anlaşılamaz. Kesin bir doğru cevabı olan maddelerde çeldirici olarak kullanılabilir.

12-Birçok madde türünde "Yukarıdakilerin hepsi" ve "yukarıdakilerin hiçbiri" aynı madde içinde seçenek olarak kullanılmamalıdır. Kullanılırsa ikisi birden elenir. Mantıksal olarak ikisinin aynı anda doğru olması mümkün değildir.

13-Seçenekler arasında büyüklük sırası varsa bunlar sıralı olarak verilmelidir.

14-Seçenek sayısı uygulama yapılan cevaplayıcıların düzeyine uygun olmalı, ilköğretim ikinci sınıfta uygulanırsa (ki önerilmez) iki seçenekli, ilköğretim 3, 4, 5 üç seçenekli, 6, 7, 8 dört seçenekli ve ortaöğretimle yüksek öğretimde beş seçenekli testler kullanılabilir.

15-Seçenekler birbirinden bağımsız olmalı, biri diğerini içermemeli, ipucu olmamalıdır.

Böyle bir zorunluluk varsa bileşik cevap gerektiren soru tipi kullanılmalıdır.

16-Testteki tüm maddelerin seçenek sayıları aynı olmalıdır.

17-İyi bir test maddesinin madde kökü okunduğunda seçeneklere bakılmaksızın davranışa sahip olan cevaplayıcı doğru cevabı verebilmelidir.

18-Çeldirici bulmada güçlük çekildiğinde madde formu değiştirilmelidir.

19-Doğru cevaplar test içine belli bir örüntüde yerleştirilmemelidir. Maddelerin doğru cevaplarının yeri belirli bir düzene bağlı olmamalıdır.

20-Doğru cevaplar seçeneklere yaklaşık olarak eşit dağıtılmalıdır.

21-Olumsuz maddeler olumlu algılanma riskine karşı, olumsuzluk ifadesinin altını çizme, koyu yazma vb. yoluyla belirginleştirilmelidir.

22-Maddeler arasında ve madde kökü ile seçenekler arasında belirli bir boşluk bırakılmalıdır.

23-Ortak köklü ve ortak seçenekli maddeler başlangıç ve bitimlerinde diğer sorularla karıştırılmaması için çizgi ile ayrılabilir. Ayrıca bu tip soruların ortak olan kök ve seçenekler ile aynı sayfada olması dikkatin dağılmasını önleyebilir.

24-Testin ilk sorularının kolay olması cevaplayıcıyı güdüler.

25-Yazı büyüklüğü uygulanan kişilerin düzeyine uygun olmalıdır.

26-Aynı seçeneğe art arda çok sayıda doğru cevap getirilmemelidir.

27-Maddelerdeki ifadeler bilinen bir kaynaktan olduğu gibi alınmamalıdır.

28-Her test maddesi önemli bir davranışı yoklamalıdır.

29-Çeldiriciler davranışa sahip olmayanları yanıltmalı fakat sahip olanları yanıltmamalıdır.

30-Birbirinin zıddı olan seçeneklerin kullanılmaması gerekir.

Puanlama

a) 1-0 puanlaması, b)Maddelerin kolaylık ve zorluğuna göre puan vermek, c)Maddelerin ölçtüğü yeteneğe göre puan vermek, d)Madde seçeneklerine doğruluk derecesine göre ağırlık vererek puanlamak.

Bütün ölçme araçlarında uyulması gereken kurallar

1-Sorular açık ve anlaşılır olmalıdır.

2-Sorularda bilimsel hata bulunmamalıdır.

3-Sorularda dil ve anlatım bozukluğu olmamalıdır.

4-Soruların cevaplandırılması için herkese aynı süre verilmelidir.

5-Cevaplamayla ilgili ve gerektiği durumlarda puanlama ile ilgili bir yönerge verilmelidir.

6-Sorular birbirinden bağımsız olarak cevaplandırılabilecek bir yapıda olmalıdır. Bir sorunun doğru ya da yanlış cevaplandırılması başka bir sorunun doğru ya da yanlış cevaplandırılmasını etkilememelidir.

7-Her soru önemli bir davranışı yoklamalı, önemsiz ayrıntılar üzerinde durulmamalıdır.

8-Soruların kökünde davranışa sahip olmayan cevaplayıcıları doğru cevaba götürecek ipuçları verilmemelidir.

9-Aksi gerekmedikçe her soru bir davranışı yoklamalıdır.

Dereceleme Ölçekleri (Rubric’ler)

Dereceleme ölçekleri performans değerlendirmede öğrencileri puanlama amacı ile kullanılan ölçme araçlarından biridir. Dereceleme ölçekleri, performansı tanımlayan ve herhangi bir çalışmanın puanlanması için geliştirilmiş ölçütleri içeren bir araçtır. Dereceleme ölçekleri, bir ölçme veya etkinliğin tamamının ya da bölümlerinin nasıl puanlanacağının ana hatlarıyla gösterilmesidir. Başka bir tanımıyla dereceleme ölçekleri; kabul edilebilir ya da edilemez performans sınırlarının öğretmen ve öğrenciler için açıkça belirtildiği kriter grubu ölçeğidir. En kullanışlı dereceleme ölçekleri ölçme ve değerlendirme yapacak kişinin kendi yaptığı dereceleme ölçeğidir. Derecemle ölçekleri bir ölçme sürecinin tamamının ya da bölümlerinin nasıl puanlanacağını ana hatlarıyla gösterebilir. Öğrenciden beklenen performansın tüm boyutlarını dikkate alarak puanlama yapmak amacı ile kullanılırlar. Dereceleme ölçekleri, öğrencinin bir kavrama ilişkin bilgisini, bir ürünü belirlenen ölçütlere uygun olarak ortaya koyma becerisini, verilen bir görevi yapma sürecinde uyulması gereken aşamalı adımları yerine getirmedeki ustalığını veya verilen bir ödevi yapmadaki yeterlik düzeyini belirlemede kullanılabilirler. Dereceleme ölçekleri kullanılırken, öğrencilerden beklenen performansların iyi tanımlanması veya sınırlarının iyi çizilmesi gereklidir. Bu amaçla öğrencilerden beklenen performans belli kategoriye ayrılabilir ve her kategorideki ölçütler ayrıntılı olarak belirlenebilir.

Dereceleme ölçeklerinin bütüncül (holistic) ve analitik (analytical) olmak üzere iki biçimi vardır. Bütüncül dereceleme ölçekleriyle performansın genel sürecinin veya ürünün bir bütün olarak (parçalarını dikkate almadan) puanlaması, analitik dereceleme ölçekleriyle önce performansın genel sürecinin veya ürünün parçalarının ayrı ayrı puanlaması ve sonra da bu kısmî puanların toplanarak toplam puana ulaşılması söz konusudur. Analitik dereceleme ölçeklerini kullananlar öğrencilerin verdiği bütün cevapları incelemeli ve belirlenmiş ölçütlere göre puanlamalıdır. Böylece yanlılığın az olması beklenebilir. Analitik dereceleme ölçekleri üründen çok süreçle ilgilenmektedir. Bu nedenle öğrenme eksikliği ya da davranış bozukluğu olan öğrencilerde kullanılması iyi sonuç vermeyebilir. Bütüncül dereceleme ölçekleri öğrencinin cevabı bütüncül olarak değerlendirileceği zaman kullanılır. Bütüncül dereceleme ölçekleri süreçten çok ürünle ilgilenir. Bütüncül dereceleme ölçekleri puanlama ölçütleri bir problemin çözümünün önemli bölümleriyle ilgili olmalıdır. Uygun durumlarda farklı açılardan (biri süreç, diğeri ürün) değerlendirmeye olanak tanıdıklarından dolayı analitik ve bütüncül dereceleme ölçekleri birlikte kullanılabilirler.

Dereceleme ölçekleri yazılı sınavların puanlanmasında kullanılan anahtarlara ya da ürün ve süreç değerlendirilmesi için kullanılan gözlem ölçekleriyle kontrol listelerine benzer. Dereceleme ölçeklerinde her bir kazanım veya davranış için kriterlerin mükemmelden kötüye kadar derecelenmesi söz konusudur ve her derece için performans ölçütlerinin ayrıntılı tanımlanması gerekir.

Dereceleme ölçeklerini kullanma nedenleri

1-İyi bir ürünün nasıl olacağı konusunda öğretmen ve öğrenci için açık ve anlaşılır bir tanım verir.

2-Öğrencilerin üstlendikleri görevlerde, görevleri yerine getirmede, ortaya koydukları ürünlerde ve bunların değerlendirilmesinde daha fazla sorumluluk duymalarını veya almalarını sağlar.

3-Öğretmenin öğrenci çalışmalarını veya ürünlerini değerlendirmelerini kolaylaştırır.

4-Öğrencilere, kendi performanslarını değerlendirebilecekleri ölçütler sağlar.

5-İyi ürün veya performansla ilgili ölçütlerin velilere bildirilmesi, çocuklarına yardımcı olmak isteyen velilere kolaylık sağlayabilir.

Dereceleme Ölçekleri Geliştirme Aşamaları

1-Ölçeğin amacını belirleme: Ölçekle elde edilen sonuçların ne amaçla kullanılacağı belirlenmelidir.

2-Değerlendirilecek öğeleri belirleme: Ürün veya görevlerde nelere puan verileceği belirlenmelidir. Ölçekle ölçülmeye çalışılan davranışlar, ürünler ya da becerilerin anahtarı oluşturulur.
3-Yeterlik düzeylerine karar verme: Ürün veya görevlerde değerlendirilecek öğelerin gerçekleşme düzeylerine göre nasıl puanlanacağı belirlenmelidir. Ölçülecek davranış, ürün, görev ya da becerinin yeterlik düzeyleri ile ilgili ölçütler belirlenir. Örneğin en düşük düzey için “yetersiz veya 1 puan”; orta düzey için “kısmen yeterli veya 2 puan”; yüksek düzeydeki performans için “yeterli veya 3 puan” gibi kısa ölçütler yazılabildiği gibi değerlendirilecek öğeler ve yeterlik düzeyleri ile ilgili ayrıntılı açıklamalar da yapılabilir. Burada önemli olan düzeyler arasında ölçütleri iyi ayırt edebilmektir. Hangi becerilerin alt, orta veya üst düzeyde olduğunu gerekiyorsa uzmanlardan fikir alarak belirlemek gerekir.

4-Ölçeğin hazırlanması: Yukarıdaki aşamalardan sonra ölçek taslak olarak hazırlanır. Gözden geçirme ve düzeltmeler yapıldıktan sonra öğrencileri değerlendirmede kullanılabilir. Ölçeği kullanma sürecinde karşılaşılan sorunlara göre ölçek yetkinleştirilmelidir.

Bölüm Testi

****Uyarı! 1 ve 3. soruları aşağıdaki seçeneklere göre yapınız.

I- Ortak seçenekli madde

II Birleşik cevap gerektiren madde*

III Kökü olumsuz madde

VI- Cevabı en doğru olan madde

V-Eksik köklü madde

1. Verilenlerden hangileri sorunun birden fazla cevabı olduğunda kullanılır?

A)I-II B)I-III C)I-VI D)I-V E)II-IV*

2. Verilenlerden hangileri sorunun birden fazla cevabı olduğunda kullanılamaz.

A)I-II-III B)I-II-IV C)I-II-V D)I-III-V* E)II-III-IV

3. Sorunun kesin doğru cevabının olmadığı ya da soruya verilen cevapların doğruluk derecesi bakımından birbirinden farklı olduğu durumda hangi çoktan seçmeli madde tipinin kullanılması uygundur?

A)I B)II C)III D)IV* E)V

4. Birleşik cevap gerektiren madde tipi aşağıdaki durumların hangisinde kullanılmalıdır?

A) Birden fazla doğru cevap olduğunda*

B) Seçenek bulmada güçlük çekildiğinde

C) İleri düzey davranışların ölçülmesinde

D) Orta güçlükte sınavın hazırlanmasında

E) Eğitim sisteminin alt kademelerinde

5. Çoktan seçmeli test maddelerinde sorunun cevabı ya da doğru olmayan seçeneklere ne ad verilir?

A) Madde kökü

B) Madde şıkkı

C) Olası cevap

D) Gizli cevap

E) Çeldirirci*

6. Aşağıdakilerden hangisi çoktan seçmeli madde türlerinden biri değildir?

A) Ortak seçenekli maddeler

B) Kökü eksik cümle olan maddeler

C) Kesin ve biricik cevabı olan maddeler

D) Kesin cevabı olmayan maddeler*

E) Ortak köklü maddeler

7. Bir testin puanlanabilen en küçük birimine ne ad verilir?

A) Madde * B) Doğru cevap C) Çeldirici D) Olası cevap E) Doğru seçenek

8. Aşağıdakilerden hangisi çoktan seçmeli ve doğru yanlış testlerinin ortak bir özelliği değildir?

A) Kapsam geçerliğini sağlayabilme.

B) Çok soru sorulabilmesi.

C) Şans başarısının eşitliği.*

D) Objektif puanlanma.

E) Kısa zamanda uygulanma.

9. Çoktan seçmeli test maddesi yazarken aşağıdaki kurallardan hangisine dikkat etmek gerekmez?

A) Cevabı bulmak için gerekli bilgi verilmeli

B) Kökte gereksiz ipuçları verilmemeli

C) Maddede dil ve bilimsel hatalar olmamalı

D) Seçeneklerin uzunlukları birbirine yakın olmalı

E) Soruya göre çeldirici sayısı değişmelidir.*

10. Puanlama açısından aşağıdaki ölçme araç ve yöntemlerinden hangisi en kullanışsız olanıdır?

A) Çoktan seçmeli testler

B) Doğru-yanlış testleri

C) Yazılı yoklamalar*

D) Sözlü yoklamalar

E) Kısa cevaplı testler

11. Aşağıdakilerden hangisi doğru-yanlış ve çoktan seçmeli testlerde güvenirliği düşüren en önemli özelliktir?

A) Kapsam geçerliğinin düşüklüğü

B) Soruların sayısının sınırlılığı

C) Şans başarısının etkili olması*

D) Kapsam geçerliğinin yüksekliği

E) Okuma hızının işe karışması

12. Aşağıdakilerden hangisi doğru-yanlış testlerinin olumsuz özelliklerinden biridir?

A) Puanlamanın objektifliği

B) Kolay ve çabuk hazırlanması

C) Şans başarısının yüksekliği*

D) Kapsam geçerliğinin düşüklüğü

E) Tüm eğitim düzeylerinde kullanılabilmesi

13. Aşağıdakilerden hangisi kısa cevaplı testlerin güvenirlik ve geçerliğini artırmaz?

A) Çok soru sorulması

B) Objektif puanlama yapılması

C) Kısa zamanda uygulama yapılması*

D) Şans başarısının hiç olmaması

E) Kısa cevaplar gerektirmesi

14. Ödev ve projeler için aşağıdakilerden hangisi yanlıştır?

A) Derste öğrenilen davranışların ölçülmesi için en uygun değildir.

B) Öğrenciyi tanıma puanlama yanlılıklarına sebep olabilir.

C) Öğrencilere verilen puanların güvenirliği düşüktür.

D) Ödev ve projeler zorlaştıkça öğrencilerin güdüleri artar.*

E) Kimin tarafından hazırlandığı kolay anlaşılmaz

15. Aşağıdakilerden hangisi ölçme aracında aranan nitelikler yönünden en zayıf olandır?

A) Çoktan seçmeli testler

B) Yazılı yoklamalar

C) Sözlü yoklamalar*

D) Ödev ve projeler

E) Doğru – yanlış testleri

16. Aşağıdaki ölçme araçlarında hangisi 70 kişilik bir sınıf için en kullanışlı olanıdır?

A) Kısa cevaplı testler

B) Çoktan seçmeli testler*

C) Sözlü sınavlar

D) Yazılı yoklamalar

E) Ödev ve projeler

17. Aşağıdakilerden hangisi sözlü sınavlar için doğru değildir?

A) Çok soru sorulmadığından geçerlik düşer.

B) Cevaplayıcının düşünme süresi kısıtlı olabilir.

C) Konuşma becerileri kazanılan puanları etkileyebilir.

D) Puanlama anında yapıldığında güvenirliği yüksektir.*

E) Bazı öğrencilere daha önce sorulan sorular gelebilir.

18. Yazılı yoklamalarda güvenirliği düşüren en önemli etken hangisidir?

A) Cevapların uzun verilmesi

B) Anahtarla puanlama yapılması

C) Yazılı anlatım becerilerinin işe karışması

D) Puanlamanın zaman alması

E) Yansız puanlamanın zorluğu*

19. I- Puanlamanın zor olması

II- Soru sayısının az olması

III- İleri düzey davranışları ölçebilmesi

IV- Hazırlanmasının kolaylığı

V- Şans başarısının olmaması

Yukarıdaki ifadelerin hangilerinde yazılı yoklamaların diğer sınavlara göre en zayıf yönleri doğru olarak verilmiştir?

A) I ve II* B) II ve III C) III ve IV D) I, II ve III E) II, IV ve V

20. Aşağıdakilerden hangisi eğitimde kullanılan ölçme araçlarının hepsinde de soru yazımında dikkat edilmesi gereken ortak bir nokta değildir?

A) Dil ve anlatım bozukluğu olmamalı

B) Sorular bağımsız olarak cevaplanabilmeli

C) Seçeneklerin uzunlukları aynı olmalı*

D) Her soru önemli bir davranışı yoklamalı

E) Sorularda bilimsel hata bulunmamalı

21. I- Üst düzey davranışların yoklanması

II- Hazırlama açısından kullanışlı olması

III- Kapsam geçerliğinin yüksek olması

IV- Puanlama hatasının az olması

V- Genel izlenimle puanlanması

Yukarıda verilen özelliklerden hangileri çoktan seçmeli, kısa cevaplı ve doğru-yanlış sınavlarının diğer ölçme araçlarına göre önemli üstünlükleri arasındadır?

A) I ve V B) III ve IV C) II, III ve IV D) III, IV * E)IV-V

IV- ÖLÇME SONUÇLARI ÜZERİNDE YAPILAN İSTATİSTİKSEL İŞLEMLER

4.1 Temel Kavramlar

İstatistik : 1- Sayısal bilgi (Veri)

2- Bilimin Teknolojisi: Verilerin toplanması, işlenmesi, analizi ve yorumlanması için kullanılan teknikleri içeren bilim dalı. İki başlık altında inclenebilir.

a)Betimsel İstatistik: Bir grubu bazı özellikleri bakımından betimleme, gurupla ilgili bilgileri özetleme vb. amacıyla yapılan istatistiktir. Evren veya örneklem üzerinde çalışılabilir.

b)Vardamsal İstatistik: Gözlenen durumdan gözlenemeyen durumların kestirilmesi amacıyla kullanılan istatistiktir. Örneklemeden evrene genellemeler yapıldığı durumlara vurgu yapar.

İstatistikte Amaç: Özellikler evren hakkında bilgi edinmektir ya da evreni betimlemektir.

Dolaylı Yaklaşım

Örneklem

Evren

Örnekleme

Dolaysız

Parametre İstatistik

Yaklaşım

Betimleme Anlam Çıkarma Kestirme

Şekil 7. İstatistiksel süreç

1.Dolaysız Yaklaşım: Evrene ulaşmak olanaklı ise evren parametreleri hesaplanır. Anlamlandırılır.

2.Dolaylı Yaklaşım: Evrene ulaşmak olanaklı veya pratik değilse, örnekleme yapma, istatistikleri hesaplama, evren parametrelerini kestirme ve anlamlandırma olarak özetlenebilir. Örneklem evreni ne kadar iyi temsil ederse, istatistiklerden evren parametreleri o derece iyi kestirilir.

Evren: Araştırma alanına giren birey, obje, özellik vb. tümüdür.

Örneklem: Evreni temsil eden, belirli bir teknikle seçilmiş örneklerden oluşan birey, obje, özellikler gurubudur.

Evren ve Örneklem: Ölçme sonuçlarıdır. Örneğin ÖSS sonuçları dediğimizde evren, herhangi bir dershaneye gidenlerin ÖSS puanları örneklemdir. Belirli bir özellikler kümesinin evren mi yoksa örneklem mi olduğu araştırma problemine bağlı olarak değişebilir. Bir araştırma problemi için evren olan grup, başka bir araştırma problemi için örneklem olarak alınabilir.

4.2 Verilerin Düzenlenmesi

Bireyler ya da gruplar üzerinde yapılan gözlem sonuçları işlenmeden önce kolay yorumlanamazlar. Ölçme sonuçlarını yorumlamak, özetlemek, betimlemek veya karşılaştırma yapmaya uygun hale getirmek için yapılması gereken ilk işlem verileri düzenlemektir. Gözlem veya ölçme sonuçlarına, yani işlenmemiş verilere ham veri denir. Üzerinde matematiksel ve istatistiksel hiçbir işlem yapılmayan verilere ham veri adı verilir. Verileri düzenlemede kullanılan işlem basamakları aşağıdaki gibi gösterilebilir.

1-Verileri büyükten küçüğe ya da küçükten büyüğe sıraya koymak

2-Frekans tablosunu oluşturmak

3-Verileri gruplamak

4-Verileri uygun grafiklerden biriyle göstermek.

Verileri düzenlemekle ilgili aşamaları örnek üzerinden devam ettirmek faydalı olabilir. Öncelikle veri toplamamız, gözlem yapmamız gerekir. Tablo 11 50 öğrenciye uygulanan 10 soruluk testten elde edilen sonuçları göstermektedir. Bu sonuçlar görüldüğü gibi sadece öğrenciler hakkında bilgi vermekte ve bu bilgileri yorumlamak, uygulama grubu hakkında fikir yürütmek zor görünmektedir. Bunun için öncelikle elimizdeki verileri düzenlememiz gerekir.

Tablo 11. 50 Öğrencinin 10 soruluk testte aldığı puanlar

Öğrenci

Puan

Öğrenci

Puan

Öğrenci

Puan

Öğrenci

Puan

Öğrenci

Puan

1
2
3
4
5
6
7
8
9
10

6
6
3
3
4
2
4
6
7
7

11
12
13
14
15
16
17
18
19
20

8
1
5
7
3
10
5
5
2
7

21
22
23
24
25
26
27
28
29
30

6
7
8
10
7
8
7
10
8
8

31
32
33
34
35
36
37
38
39
40

9
5
4
1
7
6
9
2
3
6

41
42
43
44
45
46
47
48
49
50

5
4
9
6
9
9
8
5
4
8

1-Verileri Sıralamak

Bu adımda elimizdeki verileri büyükten küçüğe veya küçükten büyüğe sıralamak gereklidir. Tablo 12’de 50 öğrenciye ait veriler (tablo 11) sıralanmış olarak görünmektedir.

Tablo 12. 50 Öğrencinin 10 soruluk testte aldığı sırlanmış puanlar

Öğrenci

Puan

Öğrenci

Puan

Öğrenci

Puan

Öğrenci

Puan

Öğrenci

Puan

1
2
3
4
5
6
7
8
9
10

1
1
2
2
2
3
3
3
3
4

11
12
13
14
15
16
17
18
19
20

4
4
4
4
5
5
5
5
5
5

21
22
23
24
25
26
27
28
29
30

6
6
6
6
6
6
6
7
7
7

31
32
33
34
35
36
37
38
39
40

7
7
7
7
7
8
8
8
8
8

41
42
43
44
45
46
47
48
49
50

8
8
9
9
9
9
9
10
10
10

Verileri sıralamak bize fazla bir yorum şansı vermemekle beraber sonraki adımlar için büyük kolaylık getirir. Sıralanmış veriler, en büyük ve en küçük değeri hemen görmemizi, verilerin değişim aralığını hesaplamamızı sağlayabilir.

2-Frekans Tablosu Oluşturmak

Frekans sıklık demektir. İstatistikteki anlamı ise bir gözlemin verinin tekrar sayısı veya bir verinin kaç kez gözlendiğini gösteren sayı olarak tanımlanabilir. Kısaca verilerin gözlenme sıklığı da denilebilir. Tablo 13’de 50 öğrenciye ait verilerin frekans tablosu görünmektedir.

Tablo 13. Frekans Tablosu

X_i (Puanlar)

f (frekans)

t %

100

Frekans tablosunun özellikleri

1 )Özel bir gruplamadır. Grup aralığı 1 kabul edilir. Yaptığımız işlem 1 den 40 kadar her değerin kaç kez tekrar ettiğini bulmaktır. Ancak tekrarı (frekansı) sıfır olan değerleri yazmayız. Bu nedenle sabit bir aralığı dikkate almadığımız söylenebilir.

2)En çok tekrar eden değer ya da değerleri gösterir.

3)Tablodan faydalanarak puan dağılımının grafiği çizilebilir. Puanların dağılımı hakkında bilgi verir.

4)Herhangi bir kişinin yeri konusunda bilgi verir. Frekans bir verinin tekrar sayısı hakkında, toplamlı frekans ise bir puanın (kişinin) yeri hakkında bilgi verir. % bir verinin toplam veri içindeki yüzdesini, yığılmalı yüzde ise %'lik dilimler içindeki yerini (sırasını) verir.

Frekans ve yüzde hacim, tekrar ve alan çağrıştırırken, yığılmalı frekans ve yüzde sıra çağrıştırmaktadır.

Frekans tablosunun ilk sütunu gözlenen puanları (bireylerin sınavdan aldıkları puanları) göstermektedir. Gözlenme olasılığı olduğu halde gözlenmeyen puan bu tabloda gösterilmez. Çünkü gözlenmeyen puanın frekansı sıfır olduğundan yapılacak hesaplamalara önemli bir etkisi olmayacaktır. Örneğin sıfır (0) puan gözlenme olasılığı olan ama gözlenmediği için bu tabloda gösterilmeyen puandır.

Tablonun ikinci sütununu frekanslar oluşturur. Frekans sütunu bir puanın kaç kez gözlendiğini ya da aynı puandan kaç tane olduğunu göstermektedir. Frekans sütununun son satırı toplam gözlem sayısına denk olmalıdır.

Tablonun üçüncü sütunu yığılmalı frekansları göstermektedir. Yığılmalı frekans sütununa toplamlı frekans sütunu da denmektedir. Yığılmalı frekans bir puanın kendi frekansı ile kendinden küçük puanların frekansları toplamıdır. Yığılmalı frekans sütunu bize puanların sırasını verir. Bunun anlamı yığılmalı frekans bize bireyin grup içindeki yerini söyler.

Örneğin 6 puan alan bir birey sınıfta kaç kişiden başarılı veya başarısızdır sorularının cevabını yığılmalı frekans sütunundan görebiliriz. 6 puan alan bireyin sınıftaki kaç kişiden daha başarılı olduğunu görmek için 6 puandan bir küçük değerin yığılmalı frekansına bakarız. Bu durumda 6 puan alan birey 20 kişiden daha başarılı görünmektedir. 6 puan alan bireyin kaç kişiden daha başarısız olduğunu belirlemek için ise 6 puanın yığılmalı frekansını toplam frekanstan çıkarmak gereklidir. Bu durumda 6 puan alan bireyin yığılmalı frekansı 27, topla frekans 50 ve 50 – 27 = 23 olduğundan, 6 puan alan birey sınıftaki 23 kişiden daha başarısızdır diyebiliriz.

Tablonun dördüncü sütunu yüzdeleri göstermektedir. Yüzde sütununa bağıl frekans sütunu da denmektedir. Bir gözlemin % sütunundaki değeri o gözlemin frekans sayısının tüm gözlemelere oranını 100 ile çarparak elde edilebilir. Örneğin 3 puanı 4 kez gözlenmiştir, yani frekansı 4’tür. 3 puanının tüm gözlemlere oranı 4 / 50 = 0,08’dir. Bu değeri 100 ile çarparsak 8 değerine ulaşırız. Yüzde sütunu frekans sütununa benzer, Frekans sütunun verdiği bilgiyi % cinsinden verir.

Tablonun beşinci sütunu yığılmalı ya da toplamlı yüzde sütunudur. Yığılmalı yüzde, bir gözlemin kendi yüzdesi ile kendinden küçük gözlemlerin yüzdeleri toplamından oluşur. Yığılmalı frekans sütununun verdiği bilgiyi yüzde cinsinden verir. Yani bireyin grup içindeki yerini yüzde cinsinden verir. Zaten yığılmalı yüzdeler, yığılmalı frekansların yüzdeleridir.

Örneğin, altı puan alan bireyin sınıfın yüzde kaçından daha başarılı veya başarısız olduğu sorularının cevabı yığılmalı yüzde sütunundadır. 6 puan alan bireyin sınıfın yüzde kaçından daha başarılı olduğunu bulmak için6 puandan bir küçük değerin yığılmalı yüzdesine bakarız. 6 puandan küçük değer 5 puandır ve yığılmalı yüzde değeri 40’tır. Demek ki 6 puan alan birey sınıfın yüzde 40’ından daha başarılıdır. 6 puan alan bireyin kaç kişiden başarısız olduğunu bulmak için, 6 puan alan bireyin yığılmalı yüzde değerini 100’den çıkarmak gerekir. Bu durumda 6 puan alan bireyin yığılmalı yüzde değeri 54 ve 100 – 54 = 46 olduğuna göre, 6 puan alan birey sınıfın yüzde 46’sından daha başarısızdır.

Frekans tablosunda dikkat edilmesi gereken durumlardan biri de, frekansların toplamıyla yığılmalı frekansların son satırı; yüzdelerin toplamıyla yığılmalı yüzdelerin son satırı birbirine eşit veya çok yakın çıkmasıdır. Bazen hesaplanan yüzdeleri yuvarlamadan dolayı bu değerler arasında çok küçük farklılıklar çıkabilir. Bu farklılığın yuvarlamalardan geldiğinden emin olmak gerekir.

Verileri düzenlemenin üçüncü adımı verilerin gruplandırılmasıdır.

3-Verileri Gruplama

Verileri gruplama, verileri eşit aralıklarla düzenleyerek ve bu aralıklara düşen frekansları saptayarak özetleme işlemidir. Verileri gruplamanın temel gerekçesi şöyle açıklanabilir. Veriler çok geniş bir aralıkta (ranjda) dağıldığında frekans tablosundan yorum yapılması zorlaşır. Bu zorluğu gidermenin yollarından biri verileri gruplamaktır. Ayrıca verileri gruplamak istatistiğin gruplarla ilgilenme mantığına da uygundur. Verileri gruplamak üç adımda gerçekleşen bir işlemdir.

1. adım, grup sayısını belirlemek: Keyfidir. Araştırmacı karar verir. Verilere uygun, bilgi kaybını en aza indirecek şekilde saptanmalıdır. En büyük-en küçük veriye ve toplam frekansa bakılarak karar verilir. Tek sayı olması yararlıdır. Eğitimde 5-7 grup oluşturmak yaygındır.

2.adım grup aralık katsayısını hesaplamak: Grup aralıklarının eşit olması sağlayacak bir sayı elde etme işidir. Eşit olmayan aralıklarla da gruplama yapılabilir. Ancak bu durumda veri analizi yapılamaz. Grupların genişliği grup aralık katsayısı denilen sayı ile saptanır. Bu katsayı şöyle hesaplanır:

a=(Xeb-Xek)/bgs

a: grup aralık katsayısı: gereğinden küçük (grup sayısı artacağından gruplama anlamsız olur) ve büyük (bilgi kaybı fazla olacağından) olmamalı.

Xeb: Gözlenen en büyük değer (en büyük ölçüm-veri)

Xek: Gözlenen en küçük değer (en küçük ölçüm-veri)

bgs: belirlenen grup sayısı

3. adım, grupları oluşturmak: Grup sayısı ve gurup aralıkları dikkate alınarak grupları oluşturma basamağıdır. Grupları oluştururken aşağıdaki koşulların sağlanmasına dikkat edilmelidir.

Grupları oluştururken sağlanması gereken koşullar:

1.Grup aralıklarının eşit olması gereklidir.: gruplar arası karşılaştırma, grupları sürekli hale gştirme, verilerin tamamını temsil edecek istatistiklerin hesaplanabilmesi için gereklidir.

2.Verilerin birden çok gruba girmemesigereklidir. her verinin temsil edilmesinin sağlanması, frekans hesabında hatanın önlenmesi ve verilerin hangi gruba ait olduğunun tartışılmaması için gereklidir. Bir veri yalnız bir grupta olmalı.

3.İlk veri ilk grupta son veri son grupta olmalıdır.

Verileri grupladığımızda, istatistikleri ve analizleri gruplar üzerinden yürüttüğümüz için verilerle ilgili bilgi kaybı olur. Ancak işleri kolaylaştırması bakımından bir miktar bilgi kaybını göze alırız. Kurallara uyulursa bilgi kaybı az olur.

Tablo 14. Gruplanmış veriler

Gruplar	Kesikli Grup Aralıkları	Sürekli Grup Aralıkları	Grup Orta Noktaları	Frekanslar	Toplamlı Frekanslar	Yüzde	Toplamlı Yüzde
Gruplar	Kesikli Grup Aralıkları	Sürekli Grup Aralıkları	(X₀)	(f)	(t_f)	(%)	(t_%)
1. Grup	0 – 2	-0,50 – 2,5	1	5	5	10	10
2. Grup	3 – 5	2,5 – 5,5	4	15	20	30	40
3. Grup	6 – 8	5,5 – 8,5	7	22	42	44	84
4. Grup	9 – 11	8,5 – 11,5	10	8	50	16	100

Gözlem sonuçları ve kesikli grup aralıkları doğal sayılarla ifade edilmişlerdir. Kesikli (süreksiz) sayılar üzerinde bölme işlemi yapılamadığından grup aralıkları sürekli hale getirilir. Kesikli grup aralıklarının sürekli grup aralıklarına çevirme, grup aralıklarının başlangıç ve bitim değerlerini yarımşar puan sağa ve sola kaydırılarak yapılır.

Verileri sürekli hale getirirken, verilerin ifade ettiği değişkenin sürekli sayılarla ifade edilip edilmeyeceği dikkate alınmalıdır. Ölçülen değişken yetenek, başarı veya tutum ise sürekli kabul edilebilir. Ama sınıf mevcudu, illerin nüfusları kesiklidir. Veriler sürekli olarak kabul edilmesi mümkün değilse sürekli hale getirme işlemi yapılmamalıdır. Kesikli grup aralıklarının ifade ettiği bilgilerle yetinilmelidir.

Grup orta noktaları(Xo); grupları temsil amacıyla hesaplanır. Grubun başlangıç değeri ve bitiş değerinin toplamının ikiye bölünmesi ile elde edilir.

Xo₁=(0+2)/2= 1 veya Xo₁=(-0,50 +2,5)/2= 1 vb.

4- Verileri grafikle gösterme

Grafik: bir değişkene veya birbiriyle ilgili değişkenlere ait verilerin şekille gösterilmesidir. Ölçme sonuçlarının özetlenmesi ve düzenlenmelinde başvurulan yollardan biridir. Göze hitap ettiklerinden tablolardan daha kolay anlaşılır ve yorumlanır. Veriler farklı ölçeklerden elde edildiğinden farklı grafiklerle gösterilirler. Yani verileri elde ettiğimiz ölçeğe göre grafik kullanılır.

Şekil 8. Çubuk Grafiği

1)Sütun Grafiği: Verilerin dikdörtgensel bölgelerle gösterildiği grafiklerdir. Kesikli değişkenler için kullanılana_çubuk_grafiği sürekli veriler için kullanılana histogram denir.

a) Çubuk grafiği

*Kesikli değişken için kullanılır.

*Adlandırma (sınıflama_veya sıralama ölçeklerimle elde edilmiş veriler) için kullanılır.

*Frekansların sayılabildiği veya frekansların toplam frekansa oranının hesaplanabildiği durumlar için kullanılır.

*Değişkenler eksenlere anlamayı kolaylaştıracak biçimde yerleştirilir.

*Grupların (sınıflarını başlangıç ve bitişleri çakışmaz.

Şekil 9. Histogram

*Frekanslar alanla ifade edilmektedir. Her çubuğun alanı o grubun frekansını, çubukların alan toplamları da toplam frekansı verir.

*Frekans yerine yüzdeler de kullanılabilir.

Histogram:

*Çubuk grafiğe benzer ancak çubuk grafiğinin aksine sürekli grup aralıkları ile çizilir. *Sürekli olan ya sa sürekli hale getirilebilen gruplandırılmış veriler için kullanılır. Başka deyişle sürekli grup aralıkları, sürekli olan ya da sürekli hale getirilebilen değişkenler için kullanılır.

*Genellikle gruplar yatay, frekanslar-yüzdeler düşey eksende gösterilmektedir

*Aralıklar sürekli olduğundan grup başlangıç ve bitişlerinde boşluk bırakılmaz.

Şekil 10 Çizgi grafiği

*Frekanslar veya yüzdeler alanla temsil edilirler, her çubuğun alanı o grubun frekansını; çubukların alan toplamı toplam frekansı verir.

2)Çizgi Grafiği: Gruplanmış verilerde grup orta noktalarının, gruplandırılmamış verilerde frekans alanlarının uç noktalarının birleştirilmesiyle elde edilen, kırık çizgilerden oluşmuş grafik türüdür. Sadece gruplandırılmış verileri değil, veriler sürekli olmak koşuluyla her türlü frekans dağılımını göstermek amacıyla kullanılabilir.

*Gruplanmış verilerde grup orta noktaları dikkate alınarak çizilir.

*Frekans ve yüzdeler için çizilebilir.

*Gruplandırılmış veriler için çizginin altında kalan alan (gruplandırılmamış veriler için doğru parçalarının uzunlukları toplamı) toplam frekansı verir.

*Yığılmalı frekans tablosunu göstermede de kullanılabilir.

Şekil 11. Frekans Poligonu

3) Frekans Poligonu (çokgeni): Süreklileştirilmiş verilerde ilk değerle son değerin X ekseniyle birleştirilmesi sonucu elde edilir.

*Sürekli veriler için çizilir.

*Yüzde ve frekanslar için çizilebilir.

*Frekans çok geninin alanı toplam frekansa eşittir.

*Gözlemlerin dağılımını alanlarla göstermeye yarar.

4)Pasta Grafiği: Verilere ait frekans veya yüzdelerin dairenin parçalarıyla (açılarla) gösterilmesine dayanan tekniktir.

*Hem sürekli hem de süreksiz değişkenleri göstermede kullanıldığına rastlanmaktadır.

Şekil 12 Pasta grafiği

*Her bir daire parçası gözlemlerin frekans veya yüzdesini, daire parçalarının toplamı toplam frekansı (yüzdeyi) verir.

Verileri sıralama, gruplandırma ve grafikle gösterme veriler hakkında genel bilgiler verir. Bu işlemeler verilerin tümü hakkında bir bilgi vermez. Verilerin yorumlanabilmesi için daha ileri düzeyde işlemlere gerek vardır. Verilerin bütününe ait özellikleri belirtecek bilgilere ihtiyaç vardır. Bunlardan biri merkezi yığılım (eğilim) ölçüleri, diğeri de değişme ölçüleridir.

4.3 Merkezi Eğilim Ölçüleri

Ortanca

Ortanca aşağıdaki yöntemlerin hangisi kullanılarak bulunursa bulunsun her biri için verileri tam ortadan ikiye ayıran değer olarak tanımlanabilir. Ortancanın hesap edilmesi için aşağıdaki aşamalı işlemleri yapmak gerekir.

a)Ölçümler büyüklük sırasına konur (Eğer veriler sıralı verilmiş ise bu işlem adımı geçilir).

b)n+1/2 yardımıyla ortancanın dağılımdaki sırası belirlenir.

c)Duruma göre aşağıdaki formüllerden biri kullanılarak ortanca hesaplanır.

1-Veri sayısı tekse (yani ölçüm sayısı 3, 5, 7 gibi tek sayı ise) ortanca n+1/2 formülü ile bulunur.

Örnek: 1, 7, 13, 16, 19, 22, 24, 27, 26 gibi değerler verildiğinde (n+1)/2 = (9+1)/2 = 5 bulunur ki bu değer ortancanın sırasını verecektir. Sağdan ve soldan sayıldığında veri grubu için ortancanın 19 değerine (gözlemine) karşılık geldiği söylenebilir.

2-Veri sayısı çift ise ortancanın sırası belirlendikten sonra Xa + (Xb-Xa)/2 formülü kullanılarak ortancayı hesaplamak doğru olacaktır. Burada Xa çift sayıda olan gözlemi ikiye ayırdıktan sonra elde edilen ilk grubun son değeri, Xb ise ikinci grubun ilk değeridir.

Örnek 1: 5, 7, 8, 10, 14, 16, 17, 18 verilerini ikiye bölüyoruz.

Xa Xb olur.

Ortancayı hesaplarsak 10 + (14-10) / 2= 12 elde ederiz.

Dikkatli bakıldığında ortancanın denk geldiği aralığın sağında ve solunda bulunan değerlerin ortalaması alındığında ortancanın bulunabildiği görülecektir.

3-Tekrarlı verilerde: Bir veri grubunda ortanca tekrarlı verilere rastlıyorsa herhangi birini alamayız. Bunun yerine o değerin gerçek sınırlarını düşünürüz. Örneğin ortanca bir veri grubunda 20 değerine rastlasın ve 20 değerinin 3 kez tekrarladığını (frekansının 3 olduğunu) kabul edelim. Bu durumda ortancayı 20 alamıyoruz. Bu durumda 20 değerlerinin 20’nin gerçek sınırları içinde eşit olarak dağıldığı kabul edilir. Örneğimiz için 19,5 ve 20,5 aralığında bu üç değerin bulunduğu kabul edilecektir. Yani 19,5 ve 20,5 aralığını 3 eşit parçaya böleceğiz. Eğer ortanca değerimiz üç kez tekrar eden sayılardan birincisine denk geliyorsa formül Xaltsınır + (1/frekans) olacaktır. Formüle göre çözersek ortancamız 19,5 + (1/3) = 19,83 gibi bir değer alır. Eğer ikinci tekrar eden değere denk gelseydi 20,16 ya yakın bir değer olacaktı.

Aynı tekniği kullanarak Tablo 13’de verilen 50 kişiye ait örnek veriler için ortancayı hesaplamak mümkündür. (50+1)/2 = 25,5. sıra ortancayı vermektedir. Bu sırada yer alan değer 6 gözlemidir ve 7 kez gözlenmiştir. Ortanca bu 6 gözlemden 5. sıradakine gelmektedir. Yukarıdaki formülü uyguladığımızda 5,5 + (5/7) = 6,21 değerini (yaklaşık olarak) buluruz. Verilerimiz için ortancanın bu olduğunu söyleyebiliriz.

4-Gruplanmış verilerde aşağıdaki işlemler gerçekleştirilir.

a)Yığılmalı frekans hesap edilir.

b)n/2 bulunur.

c)Yığılmalı frekanslar sütununun bir ucundan başlanarak n/2’nin olduğu gruba kadar frekanslar sayılır.

d)n/2 değerinin rastladığı grup (aralık) bulunur.

e)Aralığın frekansa bölünmesi gerçekleştirilir.

Bu işlemler yapıldıktan sonra elde edilenler aşağıdaki formüle yerleştirilir.

Formüldeki simgelerin anlamları şöyledir;

L:Ortancanın içine rastladığı aralığın alt sınırı

T_fa: “ “ “ aralıktan önceki (düşük puanlı gruplardaki) toplamlı frekans

F_b: “ “ “ aralıktaki ölçüm sayısı (gözlenen frekans)

a: aralık katsayısı

Formül Tablo 14’te verilen gruplanmış verilere uygulanırsa n/2= 25 çıkacaktır. 25. verinin 3. grupta olduğu görülmektedir. Bu sonuçlara göre formül aşağıdaki gibi uygulanabilir.

Ortanca = 5,5 + ((25–20)/22)x3 = 6,18 olarak elde edilir.

Mod

Ölçümlerde en çok tekrar eden değere mod denir. Kaba bir ölçüdür. Ortalamanın ve ortancanın hesap edilmediği durumlarda kullanılır.

Özellikleri:

1-Gözlenen frekanslar birbirine eşit ise mod olmaz yani dağılım modsuzdur.

2-Ardışık iki veya daha çok ölçüm birbirine eşit sayıda ve diğer ölçümlerden daha çok tekrar etmişse bu durumda mod ardışık ölçümlerin orta noktasıdır.

3-Ardışık olmayan iki ya da daha çok ölçüm eşit sayıda ve diğer ölçümlerden daha çok tekrar etmiş ise bu durumda dağılım çok modludur.

4-Gruplanmış verilerde frekansı en çok olan aralığın orta noktası mod olarak alınır. Bunun dışında üsteki açıklamalar gruplanmış veriler içinde geçerlidir.

5-Sadece bir değer diğerlerinden fazla tekrar etmişse dağılım tek modludur.

6-Eğer 2 değer diğer değerlerden fazla tekrar etmiş (gözlenmiş) ve eşit sayıda tekrar etmiş ise bu durumda dağılım çift modludur.

Örnek verilerimiz için mod Tablo 14’e göre en çok (8 kez) gözlenen 7 değeridir. Bu durumda dağılımın tek modlu olduğu söylenebilir. Tablo 14 incelendiğinde gruplanmış veriler için frekansı en yüksek olan grubun 3. grup olduğu ve grup orta noktasının da 7 olduğu görülecektir. Yani gruplanmış veriler için de ortanca 7 bulunmuştur.

Aritmetik Ortalama

Ölçümlerin (verilerin) ağırlık merkezidir. Verilerin toplamının veri sayısına bölümü olarak da tanımlanabilir. En çok kullanılan yığılma ölçüsüdür.

Özellikleri:

1-Örneklemeden örnekleme en az değişme gösteren dolayısıyla en kararlı yığılma ölçüsüdür.

2-Verilerin hemen hepsini kullanır.

3-Birçok istatistiksel işlem için uygundur.

4-Evren ya da örneklemden hesap edilebilir.

5-Verilerin aritmetik ortalamadan farkları 0’a eşittir.

6-Aritmetik ortalama alanları dengeleyen bir noktadır.

7-Veri sayısı az ise uç değerlerden etkilenir. Bu aritmetik ortalamanın verilerin ağırlık merkezi olmasından kaynaklanır.

Düzenlenmemiş verilerden hesap edilmesi:

; Eğer veri sayısı (30’dan)az ise Payda N-1 alınır.

Örnek verilerimiz için ortalama düzenlenmemiş verilerde

bulunur.

Ortalamanın frekans tablosundan hesap edilmesi durumunda formül değişir ancak ortalama değeri değişmez. Frekans tablosundan ortalama değerini veren formül aşağıdaki gibidir. Düzenlenmemiş verilerden farkı gözlemleri gözlem sayısıyla çarpmaktır.

Gruplanmış verilerde ise hem formül hem de ortalamanın değeri değişmektedir. Çünkü gözlem değeri olarak artık veriler değil grup orta noktaları ile gruptaki frekans kullanılmaya başlanır. Yani X yerine grup orta noktaları frekans yerine de gruptaki ölçüm sayısı (frekans) alındığı için bilgi kaybı olur. Ortalama düzenlenmemiş verilerden duruma göre düşük veya yüksek bir değer çıkabilir. Ancak yine de çok büyük bir fark çıkmaması beklenir. Çok büyük bir fark çıkarsa hesaplamada ya da gruplama da bir hata yapıldığına işarettir.

Gruplanmış verilerde ortalamanın hesabı aşağıdaki formülle yapılabilir.

Örnek verilerimiz için aritmetik ortalama;

olarak bulunur. Grup sayısı yeterli olarak alındığından gruplanmış verilerde hiçbir önemli bir bilgi kaybı ortaya çıkmamıştır. Genellikle gruplanmamış veriler ile gruplanmış verilere ait sonuçlar birbirini tutmaktadır veya birbirine çok yakındır.

Ortanca, Mod ve Ortalamanın Karşılaştırılması:

1-Ortalama, ortanca ve moda göre daha fazla bilgiye dayanır. Ortalama hesaplanırken verilerin tümü işleme katılır. Ortancada yarısı, modda ise biri ya da birkaçı işleme katılmaktadır. Verilerin tümünü dikkate alması ortalamayı daha istikrarlı ve daha güvenilir yapar. Örneğin bir evrenden random olarak seçilecek örneklemlerde ortalama diğerlerine göre daha istikrarlı daha yakın değerler verecektir.

2-Ortalamanın değeri ölçümlerin değerine bağlıdır. Uç değerler ortalamayı etkiler. Ortalama uç değerler doğru çekilir. Dizideki ölçümlerin birinin değeri değişirse ortalamanın değeri de değişir. Ortanca ve mod ise uç değerlerden daha az etkilenir. Dizinin tam ortasındaki değer değişmeden ortanca, ölçümlerin dağılış biçimi (frekansları) değişmeden de modun değeri değişmez.

3-Ortalama diğer matematik işlemler için de uygundur. Diğer yandan ortanca ve mod merkezi eğilim ölçüsü olmanın dışında pek fazla kullanılmaz.

4-Herhangi bir durumda hangi merkezi eğilim ölçüsünün kullanılacağı, incelemeye ya da cevabı aranan soruya bağlıdır. Genel bir kural olarak birden fazla eğilim ölçüsü kullanılabilecekse bunlardan en fazla ölçüm kullanılarak hesaplanan (en fazla bilgi içeren) ve diğer işlemlere de elverişli olan seçilir.

5-Kullanımda tercih sırası ortalama, ortanca ve mod şeklindedir.

6-Uç değerlerin olması durumunda uygun olan ortancadır.

7-Mod ortalama ve ortancanın hesaplanamadığı durumlarda ve en çok tekrarlayan ölçümü belirlemenin önemli olduğu durumlarda kullanılır.

4.4 Dağılım Ölçüleri

Merkezi eğilim ölçüsü bir gruptaki verilerin etrafında toplanma eğilimi gösterdiği bir değerdir. Bu değer veri grubunun bir özelliğini gösterir. Veri grubunu bir yönüyle betimler.

Verilerin hangi değer etrafında yığıldıklarını bilmek önemlidir ancak verileri betimlemeye yetmeyebilir. Çünkü verilerin birbirinden ne kadar uzaklaştıkları, yayılmalarının nasıl olduğu da önemlidir. Ölçme sonuçları birbirine eşit olsaydı, veriler arasında farklılaşma olmazdı. Değişimden söz edilmezdi. Ölçme sonuçlarının yayılması bu değişimin bir sonucudur.

Bir grup verideki değişmelerin ölçüsü “değişme, yayılma veya dağılma” ölçüleri olarak adlandırılır.

Verileri sadece merkezi eğilim ölçüleri ile betimleyemeyiz. Çünkü aynı merkezi eğilim ölçüsü değerine sahip olduğu halde değişik şekillerde dağılan veriler vardır. Aşağıda ortancası ve ortalaması eşit olan 3 veri grubunun dağılımlarının farklılaştığı görülmektedir.

F f f

3 3 3

2 3 2

1 1 1

2 4 6 8 10 X 2 4 6 8 10 X 2 4 6 8 10 X

Şekil 13. Ortalamaları ve ortancaları eşit, değişim ölçüleri farklı dağılımlar

Yukarıdaki dağılımlar incelendiğinde ortalamaları ve ortancalarının 3 olduğu görülür. Buna rağmen dağılımları oldukça farklıdır. Merkezi eğilim ölçüleri incelendiğinde benzer grup veya aynı grup denilebilecekken dağılımları incelendiğinde farklı gruplar olduğu görülmektedir. Dolayısıyla verilerin değişim ölçülerini bilmeden onları betimlemek bilgi yetersizliğinden dolayı hata yapmamıza neden olabilir. Sadece merkezi eğilim ölçülerinden hareketle verileri betimlemek onlar arasıdaki farkları görmemizi engeller.

Ranj

En büyük ölçme (gözlem) sonucu ile en küçük ölçme sonucu arasındaki farka ranj denir.

Ranj = X_eb - X_ek

Örnek verilerimiz için ranj= 10 -1 =9 olarak bulunacaktır.

Sadece veri grubundaki iki değere bağlı olduğundan verilerin dağılımı hakkında fazla bilgi vermez. Çok kullanışlı bir dağılım ölçüsü değildir. Merkeze yığılma ölçüsü olarak modun kullanıldığı veri gruplarında dağılım ölçüsü olarak kullanılır.

Yüzdelikler ve Çeyrekler

Ortanca sıraya konulmuş verilerin tam ortasını gösteren (bir yer gösteren) değer olarak merkezi yığılma ölçüsüdür. Sıraya konulmuş verilerde tam ortayı gösteren ölçme sonucu yanında başka sıradakilerde dikkate alınabilir. Örneğin verilerin % 25’ini sağında % 75’ini solunda bırakan değere ihtiyaç olabilir. Bir dağılımda bir verinin yerini gösteren ölçüler yüzdeliklerdir. Buna göre ortanca bir yüzdelik ve merkeze yığılma ölçüsüdür ancak diğer yüzdelikler yer bildirmekle birlikte merkezi eğilim ölçüsü değildir.

Yüzdelik: Bir dağılımda belirli bir verinin yerini gösteren ölçülerdir.

P bir yüzde olmak üzere p. Yüzdelik küçükten büyüğe sıralanmış veriler için ölçme sonuçlarının p kadarından büyük, (1-p) kadarından küçük ölçme sonucudur.

p. yüzdelik ölçme sonuçlarının % p’sini solunda, % (1-p)’sini sağında bırakan değerdir. P. Yüzdeliği Y_p olarak gösterirsek, ortanca Y₅₀ olarak gösterilebilir.

Bir dağılıma ait p. Yüzdelik aşağıdaki gibi gösterilebilir.

P (1-p)

Şekil 14. Yüzdeliğin Grafiksel Gösterimi

formülü p. Yüzdeliği verir.

Eleman sayısı az olduğunda yüzdeliğe başvurulmaz. Fazla veri varsa ve gruplanmış veriler için yüzdelik hesabı yapılır.

Yp’nin hesabı gruplanmış veriler için ortancanın hesaplanmasında kullanılan formülün özel bir haliyle yapılır. Formülde sadece simgeler değişir. Anlamları neredeyse aynıdır.

Ap: p. Yüzdeliğin bulunduğu aralığın alt sınırı

p: Değeri hesaplanacak yüzdelik

t_fa : p. Yüzdeliğe kadar olan toplamlı frekans

f_{p : p.}Yüzdeliğin bulunduğu grubun frekansı

a : Grup aralık katsayısı

Yüzdelikleri hesaplama işi 3 adımda gerçekleştirilir.

1- Verilerin sıralanması.

2- formülü yardımıyla Yp’nin (p. Yüzdeliğin) kaçıncı veri olduğunu saptamak

3- Gruplanmış veriler için kullanılan formülü işe koşmak.

Örnek 1: 2, 3, 5, 6, 8, 10, 11, 13, 14, 15 şeklinde sıralanmış verilerimiz olsun. Bu veriler ait 20. yüzdeliği hesaplayacak olursak

Birinci adım: Verileri sıralayacağız. (sıralı verilmiş durumda)

İkinci adım: yardımıyla Y₂₀ nin kaçıncı veriye rastladığını bulacağız.

= İkinci sıradaki verimiz Y₂₀’dir. Değeri ise 3’tür.

Çeyrek Kayma

Üçüncü ve birinci çeyreğin farkının yarısıdır.

Veriler simetrik dağılmışsa 3. çeyrek ortancanın çeyrek kayma (Q) kadar sağında; birinci çeyrek de ortancanın Q kadar solundadır.

Y25 Xort Y75

Şekil 15. Çeyrek sapmanın Grafiksel Gösterimi

Çeyrek kaymada ölçme sonuçlarından sınırlı sayıda veriye dayandığından çok kullanışlı ve bilgi verici değildir. Ortancanın merkezi eğilim ölçüsü olarak kullanıldığı durumlarda dağılım ölçüsü olarak kullanılabilir.

Varyans

Ölçme sonuçlarının aritmetik ortalamadan farklarının karelerinin aritmetik ortalamasına varyans denir. Verilerin ortalamadan uzaklıklarının bir ölçüsüdür. Bir değişim ölçüsüdür. Grubun değişkenliğini diğer gruplarla karşılaştırmada ve yorumlamada kullanılabilir. Genel formülü şöyledir;

bu formülü örnek verilerimize uyguladığımızda varyans 5,90 çıkmaktadır.

Varyans tekrarlı ölçümlerden hesap edilirken formül değişir ancak sonuç değişmez. Tekrarlı verilerdeki formül aşağıdaki gibidir.

Bunun dışında varyansın ortalamayı hesap etmeden ham puanlardan hesap etme formülü vardır. Aslında bütün ölçüler ham puanlardan hesap edilebilir. Ham puanlardan varyansı hesap etme formülü;

Gruplanmış verilerde ise hem formül hem de sonuç değişir. Gruplanmış veriler için varyans formülü ve örnek veriler için sonucu aşağıda verilmiştir.

Burada kullanılacak ortalama gruplanmış verilerden hesaplanan ortalamadır. Formüldeki X₀ ise grup orta noktalarıdır. Örnek veriler için sonuç 6,70 olarak bulunur. Gruplanmamış verilerden daha yüksek bir varyans bulunmuştur. Ancak bu değerlerin çık farklı olmadıkları da söylenebilir.

Varyansın büyüklüğü arttıkça puanlar arasındaki fark artar. Bu durumda grup heterojendir denir. Varyans azaldıkça puanlar arasındaki farklar da azalır. Bu durumda da grup homojendir denir. Ancak büyüklüğü ve küçüklüğü için nesnel bir sınır yoktur. Varyans büyüdükçe örneğin bir test puanlarını ele aldığımızda testin ayırt edici olduğu söylenebilir. Yani test davranışlara sahip olanlarla olamayanları ayırıyor denir. Varyansın büyük ya da küçük olarak yorumlanabilmesi için nesnel bir sınır olmadığından en doğru işlem bir grubun varyansını başka grup(lar)la karşılaştırmaktır.

Buna göre varyansı büyük olan grup heterojen, basık veya değişkenliği büyük olarak; varyansı küçük olan grup ise homojen, sivri veya benzeşik (değişkenliği küçük-az) olarak yorumlanabilir.

Standart Kayma (Sapma)

Veri grubunda merkezi yığılım ölçüsü olarak ortalama kullanılmışsa dağılım ölçüsü olarak kullanılır. Verilerin aritmetik ortalamadan ne kadar uzaklaştığının ortalama bir ölçüsünü verir. Ölçme sonuçlarının aritmetik ortalamadan farklarının karelerinin aritmetik ortalamasının karekökü olarak tanımlanabilir. Yani varyans değerinin karaköküdür.

Örnek verilerimizdeki ham veriler için standart sapma 2,43; gruplanmış veriler için 2,59 olarak bulunmuştur.

Standart sapma ölçme sonuçlarının aritmetik ortalamaya göre yayılmalarının bir ölçüsünü verir. Standart kayma (ve varyans) ile dağılımın sivriliği ve basıklığı arasında bir ilişki vardır. Ölçme sonuçları ortalamaya yaklaştıkça farklar küçülür uzaklaştıkça büyür. Farkların küçülmesi dağılımın sivrileşmesine, büyümesi basıklaşmasına yol açar. Yani dağılım sivrileştikçe standart sapma küçülür, dağılım basıklaştıkça standart sapma büyür.

Standart sapma dağılımın birimi olarak kabul edilir. Bu nedenle varyantsan daha çok kullanılır.

Standart sapma da varyans gibi yorumlanır. Standart sapma da ancak bir başka grupla karşılaştırıldığında anlamlı olur. Kendi başına büyük ya da küçük diye yorumlamak mümkün değildir. Standart sapması büyük olan grup heterojen, basık veya değişkenliği fazla olarak; standart sapması küçük olan grup ise homojen, sivri veya benzeşik (değişkenliği küçük-az) olarak yorumlanabilir.

Bağıl Değişim Katsayısı

Standart kayma ortalamaya bağlı olarak hesaplandığından belirli sınırlılıklar taşır. En önemlisi de ortalamaya göre yanlılık göstermesidir. Bu nedenle her iki dağılımı da içeren iyi bir dağılım ölçüsü olarak bağıl değişim katsayısı hesaplanabilir. Bağıl değişim katsayısı standart sapmanın aritmetik ortalamaya göre değeri olarak tanımlanabilir. Formülü;

BDK=standart sapma / ortalama x 100

olarak gösterilir.

Bu formülden elde edilen sonuçlar hem birden fazla grubun değişkenliğini karşılaştırmada hem de bir grubun değişkenliğini yorumlama da kullanılabilir.

Eğer bir grubun;

-bağıl değişim katsayısı 25’den büyükse (V>25) dağılım basık, heterojen, farklı,

-bağıl değişim katsayısı 20 ile 25 arasında ise (20<V<25) dağılım normal, simetrik,

-bağıl değişim katsayısı 20’den küçükse (V<20) dağılım sivri, homojen, benzeşik denir.

Örnek veriler için BDK = 40,61 bulunmuştur (gruplanmış veriler için 43,28). Bu durumda dağılımın basık olduğu, varyans ve standart sapmanın büyük olduğu ve veriler arasındaki farkların fazla olduğu söylenebilir.

Birçok durumda varyans veya standart sapmaya bakarak grubun homojen mi yoksa heterojen mi olduğunu yorumlamak yanıltıcı sonuçlara götürebilir. Bu nedenle grupları homojenlik heterojenlik bakımlarından karşılaştırmada hesaplamanın mümkün olduğu her durumda bağıl değişim katsayısını kullanılması önerilebilir.

Çarpıklık (Kayışıklık)

Ortalama, Ortanca ve moda bakarak çarpıklığın olup olmadığı, eğer varsa yönü hakkında yorumlar yapabiliriz. Ancak çarpıklığın büyüklüğü hakkında bir şey diyemeyiz. İki dağılımın çarpıklığını bu ölçülerle karşılaştırmak güç olur.

Tanım: Verilerin simetrik dağılıp dağılmadığını görmemizi (yorumlamamızı) sağlayan değişim ölçüsüdür.

1- basit olarak şu formülle bulunabilir.

Bu basit bir formüldür. Çarpıklık hakkında fikir sahibi olmamızı sağlar. Ancak çarpıklığın tam değeri değildir. Çarpıklığın en doğru değeri aşağıdaki formülle elde edilir.

2- Eğer frekanslı veriler varsa şeklinde kullanılır.

3-Gruplanmış veriler söz konusu ise

şeklindeki formülü kullanırız.

4-Dağılımın merkezi eğilim ölçüsü olarak ortanca kullanılmışsa ÇK çeyrekler yardımıyla elde edilir.

Formül Çarpıklığın kaba bir ölçüsüdür.
formül çarpıklığın doğru değerini verir.
formül gruplanmış veriler için çarpıklığın hesabında kullanılır.
formül merkezi eğilim ölçüsü ortanca alındığında, özellikle çarpık dağılımlarda ve kategorik verilerde kullanılır.

Çarpıklık Katsayısı Aşağıdaki gibi yorumlanır.

A) ise katsayı pozitif, dağılım sağa(sağı) çarpık, sağa(sağı – pozitif) kayışlıdır.

B) ise Kayışıklılık(çarpıklık 0 civarında, dağılım simetrik

C) ise katsayı negatif, dağılım sola(sola) çarpık, sola(solu – negatif) kayışlıdır

Yukarıdaki formüller yardımıyla hesaplanan bütün çarpıklık katsayıları birbirinden farklı olacaktır. Değerleri farklı olmasına rağmen hepsi doğrudur. Tercih değişkenin yapısı ve kullanıcıya kalmıştır.

Basıklık (Yayvanlık) Katsayısı

Standart kayma ve varyans büyüdükçe dağılımın sivrileştiğini, büyüdükçe dağılımın basıklaştığını biliyoruz. Ancak bunlar bize basıklıkla ilgili bir ölçü vermez. Bir dağılımın basıklığının (yayvanlığının) veya sivriliğinin ölçüsü basıklık katsayısı adını alır.

Genel formülü;

Bs = BK =

Basıklık katsayısı değeri için aşağıdaki durumlar söz konusudur.

a) BK < 0 ise dağılım normalden basık, yayvan ve veriler hetorojendir.

b) BK = 0 ise dağılımın basıklığı normal dağılım kadardır.

c) BK > 0 ise dağılım normalden sivridir ve veriler homojendir.

Aşağıda merkezi eğilim ve değişme ölçülerine bağlı olarak karşılaşabilecek tipik dağılımlarla ilgili örnekler verilmiştir.

Aiağıdaki dağılımların en basığı, en heterojeni modsuz dağılımdır. Çift modlu dağılımlarda ise, ölçülen değişken yönünden düzeyleri birbirinden çok farklı iki gruba ait sonuçların grafiksel yapısı görülmektedir. Solu çarpık dağılımlarda ortalama düşük değerler alabilmesine rağmen grup genelde başarılı kabul edilir. Tersine, sağa çarpık dağılımlarda ise ortalama yüksek değer almasına rağmen grup genellikle başarısız kabul edilir.

Normal dağılımlarda: ortalama = ortanca = mod

Sağa çarpık dağılımlarda: ortalama > ortanca > mod

Sola çarpık dağılımlarda: mod >ortanca > mod ilişkileri vardır.

Çift modlu dağılım

Sağı çarpık (pozitif kayışlı) dağılım

Solu çarpık (negatif kayışlı) dağılım

Modsuz dağılım

Şekil 16. Tipik dağılımlardan örnekler

Standart Puanlar

Z Puanı: Normal dağılıma sahip bir ölçme kümesi ortalaması 0,00 ve standart kayması 1 olan dönüşüme tabi tutulabilir. Bu dönüştürmeden elde edilen yeni dağılıma Standart Normal Dağılım ya da Birim Normal Dağılım denir. Birim normal dağılım istatistiksel işlemlerde ve çeşitli karşılaştırmalarda kolaylık sağlar. Aşağıda birim normal dağılım grafiği görülmektedir.

Şekil 17. Birim (standart) Normal dağılım

Standart Puan: Verilerin ortalamadan farklarının standart sapmaya bölümü standart puan veya Z puanı olarak adlandırılır.

evrende veya örneklemde kullanılan formüldür.

Bu dönüştürmeyle ölçme sonuçları birbiriyle karşılaştırılabilir. Z puanlarının, dağılımların ortalaması 0,00’a getirildiğinden mutlak olmayan, izafi bir başlangıç noktası vardır. Diğer yandan standart puanlar elde edilirken, bir ölçme kümesinde sabit bir değer olan standart sapmaya bölme işlemiyle birim cinsinden ifade edilmiş olurlar. Bu nedenle standart puanların bir birimi vardır ve standart puanlar eşit aralıklı ölçektedir. Z puanlarına eşit aralıklı ölçeklerdeki tüm işlemler yapılabilir.

Z puanlarının 2 temel işlevi olduğu söylenebilir. Öncelikle bir bireyin grup içindeki yerini gösterir. Örneğin z puanı 2 olan bir bireyin şekil 17’deki değerlerden hareketle grubun % kaçından daha başarılı veya daha başarısız olduğu belirlenebilir. Buna göre

Z = 2 için başarılı olma olasılığı = (50+34+13,5) = 97,5 olur.

Yapılan işlem bireyin z puanının solunda kalan alanı toplamaktır. Birim normal dağılım ortalamaya (0’a) göre simetrik olduğundan eksi sonsuzdan sıfıra kadar olan alan 50 (+) 0 ile 1 arasındaki alan 34 (+) 1 ile 2 arasındaki alan 13,5 = 97,5 olmaktadır. Buna göre birey grubun % 97,5’undan daha başarılı olmuştur. Bu değeri 100’den çıkarırsak bireyin grubun % kaçından başarısız olduğunu bulabiliriz. 100 – 97,5 = 2,5’tur. Yani birey grubun % 2,5’ğundan başarısız olmuştur.

Z puanının ikinci işlevi farklı gruplardaki bireyleri birbiriyle karşılaştırmaktır. Sıralama ölçeğinde elde edilen ham puanlarda farkların görünememesi nedeniyle karşılaştırma mümkün olamadığından, farklı gruplardaki bireyler standart puanlar elde edildikten sonra, yani puanlar eşit aralığa dönüştürüldükten sonra karşılaştırılır. Böyle bir karşılaştırma da z standart puanı büyük olan bireyler başarılı; z standart puanı küçük olan bireyler başarısız kabul edilir. Yani en başarılı birey z standart puanı en büyük olandır.

Z puanı elde edildikten sonra, bu standart puanların ortalaması ve birimi (standart sapması) değişen çeşitli standart puanlara dönüştürülmesi mümkündür. Temel standart puan z puanıdır. Örneğin T standart puanları ortalaması 50, standart sapması 10 olan standart bir puan türüdür. İstenirse bu doğrusal dönüştürme kullanılarak başka standart puanlar da elde edilebilir. Z değerlerinin T değerlerinde dönüşümü şöyledir.

T puanı z puanının eksi değerlerinden (eksi değerler bazı durumlarda işlemleri güçleştirdiğinden) kurtulmak için hesaplanan bir standart puandır. Dolayısıyla T puanı da bir standart puandır ve z puanıyla aynı işlevlere sahiptir. Ayrıca z puanı nasıl yorumlanıyorsa aynı şekilde yorumlanır. Yani t puanı en büyük olan birey en başarılı kabul edilir.

Norm

Belli bir gruptaki kişiler için ortamla veya tipik kabul edilen değere, ölçüt veya kural olarak kabul edilen ölçüye norm denir. Ölçme sonuçları belli bir yaş grubu veya belirli özellikleri bakımından benzer olan bir gruptan elde edilir (kadın veya erkeklerden, 3. sınıflardan, 12 yaşındaki çocuklardan vb.). Bu özellikler ölçülen değişkeni bir ölçüde etkilediğinden ve bazen de yorumlanmalarını kolaylaştırdığından elde edilen değerler bunlara göre yorumlanırsa daha anlamlı olur. Bu nedenle normlar sık başvurulan ölçütlerdendir. Normlar ölçülen değişkene göre değişir. Beklenen ya da olması gereken bir değeri değil, ortalama bir değeri gösterir. Sınıf, yaş cinsiyet, bölge, ülke vb. normlar vardır. En çok kullanılan normlar standartlaştırılmış normlardır. Çünkü karşılaştırmayı kolaylaştırır. Standart norm oluşturmak için standart puan kullanılır. Standart puanlar ham puanların ortalaması başlangıç noktası, standart sapması da birim kabul edilerek elde edilen z puanlarıdır.

Bu formülde değerlerin başlangıç noktası 0, birimi ise 1 olan bir dağılıma dönüşür. Bu durumda puanlar sıralı ölçekten eşit aralık ölçeğine dönüşmüş olur. Eksi değerler de olduğundan işlem zorluklarından kurtulmak için T standart puanına çevrilebilir.

Örnek soru ve çözümler

sınıflar		s
1	12	3
2	11	3
3	10	4
4	9	2
5	8	5

Sağdaki tabloda 5 sınıfa uygulanan 20 soruluk testten elde edilen istatistikler görünmektedir. Aşağıdaki soruları bu tabloya göre cevaplayınız.

1-Sınıflarda 15 doğru yapan bireyler karşılaştırılmak istenmektedir. Sınıfların her birinde 15 puan alan bireylerden hangisi diğerlerine göre daha başarılı olmuştur?

2- Sınıflarda 15 puan alan bireylerden hangi sınıftaki birey en başarısızdır?

3-Hangi sınıf en homojendir?

4-Hangi sınıf en heterojendir?

5-3 numaralı sınıfta 15 puan alan bireyin T puanı kaçtır?

6-4 numaralı sınıfta 15 puan alan öğrenci grubun % kaçından daha başarılıdır?

7-En simetrik dağılım gösteren grup hangisidir?

Cevaplar:

İlk iki soru z puanlarının hesaplanmasını gerektirmektedir. Buna göre sınıfların z standart puan formülü kullanılmalıdır.

Z değerlerini büyükten küçüğe sıraya koyarsak Z₁ < Z₃ < Z₂ < Z₅< Z₄

1-Hesaplanan z değerlerine göre en büyük z değerine 4. sınıfta 15 puan alan birey sahip olduğundan en başarılı birey 4. sınıftaki öğrencidir.

2. En başarısız birey z değeri en küçük olan 1. sınıftaki öğrencidir.

Üçüncü ve dördüncü sorular için bağıl değişim katsayılarının hesaplanması gereklidir.

3-En homojen grup bağıl değişim katsayısı en küçük olan grup olacağına göre 4 numaralı sınıf en homojen, benzeşik ve sivri gruptur.

4-En heterojen grup bağıl değişim katsayısı en büyük olan grup olacağına göre 5 numaralı grup en heterojen, en farklı ve en basık gruptur.

5-T₃ = Z₃ x 10 + 50 = (1,25) x 10 + 50 = 62,5 tur.

6- Z₄= 3 olduğuna göre;

Tablo 17 deki standart normal dağılım alanlarının toplamı = 50 + 34 + 13,5 + 2 = 99,5 olacaktır. Bu da 4 numaralı sınıfta 15 puan alan öğrencinin sınıftaki bireylerin % 99,5’undan başarılı olduğunu gösterir. Sınıftaki en başarılı öğrencilerden biri olduğu söylenebilir.

7-Simetriklik elimizdeki verilere göre bağıl değişim katsayısından anlaşılmalıdır. Buna göre bağıl değişim katsayısı 20 ile 25 arasında olan dağılım simetriktir. Buna göre 4 numaralı sınıfın en simetrik dağılım olduğu görünmektedir. 1 numaralı sınıfında belirli bir düzeyde simetrik olduğu söylenebilir.

4.6 Madde Analizi

Madde analizi, bir testteki maddelerin iyi işleyip işlemediğini ortaya koymak amacıyla uygulanan bir tekniktir. Çeşitli yolları vardır. En çok kullanılanı Henrysson ve alt-üst grup yöntemidir. Henryson yöntemi özellikle gözlem sayısının ve madde sayısının çok olduğu durumlarda yorucu olmaktadır. Bu durumda alt – üst grup tekniği ile elde edilen madde analizi sonuçları ile Hneryson analizi sonuçlarının birbirine yakınlaştığı söylenebilir. Bu tekniklerden alt üst grup tekniği ile yapılan madde analizi üzerinde durulacaktır.

Madde Güçlüğü: Maddeye doğru cevap verenlerin maddeyi cevaplayan tüm cevaplayıcılara oranı olarak tanımlanır. O ile 1 arasında değerler alır. 1’e yaklaştıkça madde kolaylaşır. O’a yaklaştıkça madde zorlaşır. Orta güçlükteki madde iyi maddedir. Alt üst grup tekniğinde aşağıdaki formülle hesaplanır.

: Maddenin güçlük indeksi

n(d,ü): Maddeyi üst grupta doğru cevaplandıranların sayısı

n(d,a): Maddeyi alt grupta doğru cevaplandıranların sayısı

N: Üst ve alt gruptaki toplam öğrenci sayısı

Madde Varyansı ve Standart Sapması: İki çıktısı olan dağılımlarda varyans ilgilenile olayın olasılığı ile diğer olasılıkların çarpımıdır. Bir maddede ilgilenilen olayı doğru cevaplandırılması olarak ele alabiliriz. Yanlış seçenekleri işaretlemek ise diğer olayların olasılıklarıdır. Madde varyansı aşağıdaki formülle hesaplanır.

Maddenin varyansı

Maddenin güçlük indeksi

Madde varyansı ve standart sapması madde güçlük indeksine bağlıdır. Madde güçlük indeksinin 0 ya da 1'e eşit olduğu durumlarda madde varyansı 0 değerini alır. Mdde güçlük indeksi 0.50 olan maddelerin madde varyansları en yüksek değeri alır. Bu sebeple, güçlük indeksi 0.50 değerini alan maddelerin en ayırıcı maddeler olduğu söylenebilir.

Madde Geçerliği: Bir maddenin bilenle bilmeyeni, bir davranışa sahip olanla olmayanı ortaya koyabilme işlevine denir. -1 ile +1 arasında değerler alır. Eğer değeri eksi ise ölçülmek istenen değişkenin zıttı bir değişkeni ölçtüğü, sıfır ile 0,20 arasında geçersiz bir madde olduğu, 0,20 – 0,30 aralığında düzeltilmesi gereken bir madde olduğu ve 0,30’u aşıp 1’e yaklaştıkça geçerliği artan bir madde olduğu söylenebilir.

Madde ayırıcılık gücü indeksi

n(d,ü): Maddeyi üst grupta doğru cevaplandıranların sayısı

n(d,a): Maddeyi alt grupta doğru cevaplandıranların sayısı

n: üst ya da alt gruptan herhangi birisinde yer alan birey sayısı.

ÖRNEK

Aşağıda 30 soruluk bir test maddesine cevap veren gruptan ikiyüz öğrencinin cevap dağılımı görülmektedir. Bu dağılıma göre 20. sorunun güçlük ve ayırt edicilik değerlerinin hesaplayalım.

Soru no: 20	A	B*	C	D	E	Boş	Er	Toplam
Üst grup	5	70	5	10	5	5	-	100
Alt grup	20	30	15	20	10	5	-	100
Toplam	25	100	20	30	15	10	-	200

Madde Güçlüğünün Hesabı

Madde güçlük hesabında hem alt grupta maddeye doğru cevap verenleri hem de üst grupta maddeye doğru cevap verenleri dikkate alıyoruz. İki gruptan doğru cevap verenlerin sayısını tüm cevaplayıcı sayısına oranlıyoruz. Böylece maddenin gruba zor mu yoksa kolay mı geldiğini anlıyoruz.

Elde edilen madde güçlük değerine göre 20. madde orta güçlükte bir maddedir. Grubun hemen yarısı civarında öğrenci doğru cevap vermiş, diğer yarısı ise doğru cevap verememiştir.

Madde Geçerliği Hesabı

Maddenin bilenle bilmeyeni ayırması olarak tanımlanmıştı. Bunun için maddeye üst gruptan doğru cevap verenlerle alt gruptan doğru cevap verenler arasındaki fark büyüdükçe madde geçerli hale gelecektir. Aksi durumda madde geçerli olmayacaktır.

Elde edilen madde geçerlik değerine göre maddenin yeterince geçerli olduğu, maddenin sorunun cevabını bilenle bilmeyeni ayırabildiğini söyleyebiliriz. Bu anlamda madde bilenle bilmeyeni ayırabilmektedir.

Aynı zamanda iki hesaptaki sonuçlar birbirini desteklemektedir. Madde orta güçlükte olduğu zaman genellikle maddenin ayırıcı olması beklenebilir. 20. madde de bu beklentiye uygun bir sonuç vermiştir.

Bölüm Testi

1. Bir soruya 22 kişi doğru, 10 kişi yanlış yanıt vermiş ve 8 kişi de boş bırakmıştır. Bu sorunun güçlük düzeyi (p) nedir?

A) 0,40 B) 0,45 C) 0,50 D) 0,55* E) 0,60

2. Bir sorunun güçlük düzeyi (P) 0,90 bulunmuştur. Bu soru için aşağıdakilerden hangisi söylenebilir?

A) Soru sınıfın % 90’ı tarafından yanlış cevaplandırılmıştır.

B) Sınıfın yarısından azı soruyu yanlış cevaplandırmıştır.

C) Sınıfın % 10’u soruyu boş bırakmıştır.

D) Sınıfın % 90’i soruyu şansla cevaplamıştır.

E) Sınıfın % 90’i soruyu doğru cevaplamıştır.*

3. Standart puanların en önemli faydası nedir?

A) Farklı bireyleri karşılaştırmayı kolaylaştırır*

B) Ölçme sonuçlarına karışan hataları azaltır.

C) Değerlendirmelerin nasıl yapılacağını belirler.

D) Ölçme sonuçlarının güvenirliğini gösterir.

E) Puan dağılımının normalliğinin kontrol etmeyi sağlar.

4. Ölçme sonuçları üzerinde istatistiksel işlem yapmanın en önemli faydası nedir?

A) Değerlendirmeler için ölçütler vermesi

B) Grubu daha iyi tanıma fırsatı vermesi*

C) Öğrenme eksiklik ve yanlışlarını belirlemesi.

D) Puanlamayı kolaylaştırması

E) Ölçme sonuçlarına karışan hataları azaltması

5. Puan dağılımlarının grafikle gösterilmesinin gerekçesi aşağıdakilerden hangisidir?

A) Başarının daha iyi yorumlanması*

B) Başarılı öğrencilerin belirlenmesi

C) Öğrenme eksikliklerinin saptanması

D) Öğretmenin değerlendirilmesi

E) Eğitim programının değerlendirilmesi

6. Aşağıdakilerden hangisi/hangileri ham puanların standart puanlara çevrilmesinin gerekçesi olabilir?

I- Not vermeyi kolaylaştırır.

II- Yorumlamayı kolaylaştırır.

III- Puanları karşılaştırmayı sağlar.

IV- Güvenirliği artırır.

A) I B) II ve III* C) I ve III D) III ve IV E) I ve IV

7. Bir aracın geçerlik çalışması aynı değişkeni ölçtüğü bilinen bir araçtan elde edilen puanların korelasyonu ile kanıtlanmaya çalışılmış ve sıfır (0) civarında korelasyon bulunmuştur. Bu durumda aracın geçerliği hakkında aşağıdakilerden hangisi en doğru olur?

A) Araç ölçmek istediği değişkeni ölçmektedir.

B) Araç ölçmek istediği değişkeni yetersiz ölçmektedir.

C) Araç ölçmek istediği değişkenin tam zıddı bir değişkeni ölçmektedir.

D) Aracın hangi değişkeni ölçtüğünü bilemeyiz.

E) Araç ölçmek istediği değişkeni ölçememektedir.*

8. Bir ölçme aracı iki gruba uygulanmıştır. Grupların ortalamaları aynı olmasına rağmen ikinci grubun standart sapması birinci grubun standart sapmasının iki katı bulunmuştur. Aşağıdakilerin hangisi ikinci grup için kesinlikle söylenebilir?

A) İkinci grubun varyansı birinci grubun varyansına eşittir.

B) İkinci grubun puan dağılımı birinci gruba göre homojendir.

C) İkinci grubun ortancası birinci grubun ortancasına eşittir

D) İkinci grubun puan dağılımı birinci gruba göre hetorejendir.*

E) İkinci gurup birinci gruba göre daha başarılıdır.

9. Bir ölçme aracının hesaplanan KR-20 güvenirlik katsayısı 0,95 bulunmuştur. Buna göre aşağıdakilerden hangisi kesinlikle söylenebilir.

A) Aracın güvenirliği yeterli değildir.

B) Araç ikinci uygulamada kararlı sonuçlar verir.

C) Araçta bulunan sorular arasında ilişki yüksektir.*

D) Araç aynı değişkeni ölçen başka araçla tutarlı sonuç verir.

E) Araç güvenilir olmamasına fakat geçerli olabilir.

V. DEĞERLENDİRME

(SINAMA DURUMLARI)

Ölçme sonuçlarını bir ölçütle karşılaştırıp karar verme sürecidir. Eğitimde bu öğrenci başarısını, öğrenme hızını, öğrenme güçlüklerini belirlemede kullanılabilir. Değerlendirmede üç öğe olduğu açıkça anlaşılmaktadır.

1-Ölçme=Gözlem sonuçlarıdır. Ölçme sonuçları değerlendirme değildir.

2-Ölçüt=Amaca göre değişir. Geçerli, güvenilir ve kullanışlı olmalıdır.

3-Karar=Ölçüte ve karar verene göre değişir.

Öğrencide gözlemeye karar verdiğimiz doğrudan ve dolaylı davranışları onun kazanıp kazanmadığını, kazandıysa ne ölçüde kazandığını, kazanmadıysa niçin kazanamadığını, kazanması için eğitim durumlarında nelerin yapılması gerektiğini belirleme değerlendirmenin kapsamı içindedir; çünkü değerlendirme, ölçme sonuçlarını bir ölçüte vurup, yargıya varma süreci olarak tanımlanabilir.

Eğitimde değerlendirme, sürecin tamamında yapılmaktadır. En belirgin ve bilinenleri;

1-Hazır bulunuşluluk yada düzey belirleme amacıyla,

2-Öğrenme eksiklerini saptamak amacıyla=biçimlendirmeye yönelik,

3-Öğrenci başarısını saptamak amacıyla=değer biçmeye yönelik; not verme,

4-Öğretimin etkililiği hakkında bir karar vermek amacıyla,

5-Öğretim programının sağlamlığı hakkında karar vermek amacıyla,

6-Öğretmen ve diğer eğitim görevlilileri hakkında karar vermek amacıyla,

7-Değerlendirme yöntem ve ölçütleri hakkında karar vermek amacıyla,

8-Sistem hakkında karar vermek vb. amacıyla yapılan değerlendirmeler ve bunlara eklenebilecek olanlardan söz edilebilir. Gözden kaçmaması gereken değerlendirme hangi amaç için yapılırsa yapılsın sistemin onarılması anlamını kapsamaktadır.

Değerlendirme Çeşitleri:

Değerlendirme ölçüte bağlı olarak ikiye ayrılır.

1-Mutlak (Ölçüt Dayanaklı) Değerlendirme (Ör; hedef-davranışlara göre yapılan değerlendirme): Ölçüt ölçme işleminden önce belirlenmiştir. Örneğin programın hedef-davranışları veya kazanımlarının % 60 gibi. Bir sistem ya da yetişeğin hedeflerini gerçekleştirme derecesine bakılarak yapılan değerlendirmedir. Bu tür değerlendirmede ölçüt hedeflerdir. Hedef dayanaklı değerlendirme de denir. Sistem ve yetişeğin etkinliğini değerlendirmede işe koşulmalıdır. Ayrıca ünite ve hedef analizlerinde, sıkı aşamalılık ilişkisi bulunduğu derslerde, yarım, eksik öğrenmelerin hayati tehlike doğurduğu kurslarda ve bir alana belli bir beceri, bilgi üzerindeki kişilerin alınacağı durumlarda bu değerlendirme türüne başvurulabilir.

Öğrenciler mutlak ölçütlere göre değerlendirildiklerinde Mutlak Başarı Yüzdesi hesaplanır. Bu formül aşağıdaki gibidir.

MBY= Mutlak başarı yüzdesi

X_b = Öğrencinin (Bireyin) puanı

X_mak = Testten alınabilecek en yüksek puan

2-Bağıl Değerlendirme (Ör; Sınıf ortalamasına göre yapılan değerlendirme): Ölçüt sonradan ölçme yapılan gruba bağlı olarak elde ediliyor ve değişiyorsa bağıl değerlendirme yapılmış olur. Bir grup içinde bireyleri birbiriyle karşılaştırmak, sıralamak ve bir okul sistemine ya da kursa alınacakları seçmek için işe koşulan değerlendirme türüdür. Bu tür değerlendirme aşamalılık ilişkilerinin sıkı olmadığı derslerde, öğrenci başarısını belirlemede de işe koşulabilir. Sistemi ya da yetişeği değerlendirmede ise yeterli değildir.

Değerlendirme amaca bağlı olarak üçe ayrılır:

1)Tanımaya yerleştirmeye yönelik değerlendirme (hazırbulunuşluk testleri veya seviye tespit sınavları): Ders ya da kursa başlamadan önce ön koşul davranışlardan ne kadarına sahip olunduğunu belirlemek amacıyla yapılan değerlendirmelerdir (örneğin; İngilizce kur sınavları). Bu sınavlardaki değerlendirme mutlaktır.

2)Biçimlendirmeye yönelik değerlendirme (izleme testleri): Ders ya da kurs sürecinde öğrenme eksik veya yanlışlarını belirlemek amacıyla yapıla değerlendirmelerdir (örneğin, konu testleri, quizler, dershane tarama testleri, yaprak testler gibi). Bu sınavlardaki değerlendirme mutlaktır.

3)Değer biçmeye yönelik değerlendirme (sonuç değerlendirme, başarı testleri):Ders ya da kurs bitiminde öğrencilerin kazandırılması planlanan davranışlardan veya kazanımlardan ne kadarını kazandığını belirleme işidir (final sınavları; sertifikalar; yeterlik belgeleri gibi).Öğrencilerin erişilerini belirleme amacıyla kullanılır. Bu sınavlardaki değerlendirmeler genlikle bağıldır ancak mutlak değerlendirmeler de yapılabilir.

Alternatif değerlendirme teknikleri

Öğrenci Ürün Dosyası (portfolyo):

Öğrencilerin öğrenme alanı (ünite), öğretim dönemi veya öğretim yılı boyunca yaptıkları çalışmaların belirlenmiş ölçütlere göre organize edilmiş bir koleksiyonu olan öğrenci ürün (seçki) dosyaları, öğrencinin öğrenme alanlarında yaptığı çalışmaların sistematik, amaçlı ve anlamlı bir bütünü olarak tanımlanabilir. Öğrenci ürün dosyalarının kullanım amacına göre içeriği de değişir. Öğrenci ürün dosyaları sergileme, değerlendirme ve yönlendirme amaçlı kullanılabilir.

Öğrenci ürün dosyası öğrencilerin çalışmalarını, harcadıkları çabayı ve gelişmelerini gösterebilir. Öğrencinin çalışmalarını, çabalarını ve gelişimini, velisinin, öğretmenlerinin ve diğer ilgililerin izlemesini kolaylaştırır.

Öğrenci ürün dosyasının amaçları:

1-Öğrencinin öz disiplin ve sorumluluk bilincini geliştirir

2-Öğrencilere kendini değerlendirme becerisi kazandırır.

3-Ürün değerlendirme araçlarının yanında süreç (performans) değerlendirme araçlarının da kullanılmasına olanak tanır.

4-Öğrencinin gelişimini izleyebilme olanağı sağlar.

5-Öğrencinin gelecekteki öğrenmelerine yol gösterir.

6-Öğrencilerin yeteneklerini sergilemelerine ve ilgi alanlarını geliştirmelerine fırsat verir.

7-Öğrencilere arkadaşlarının gelişimlerini izleme ve değerlendirme şansı verir.

8-Grup çalışmalarına katılımı ve öğrencilerin birbirlerine yardımcı olmalarını kolaylaştırır.

9-Öğrencilerin çalışmalarını kendilerinin ve arkadaşlarının değerlendirmelerine olanak vererek öğrencinin değerlendirme sürecine aktif katılımını sağlar.

10-Öğretmene öğrenciyi tüm yönleriyle (bilgi, beceri, ilgi, kişilik vb.) tanıma olanağı verir.

11-Aile ve öğrenci arasında iletişim güçlendirir.

12-Öğrencini bir bütün olarak görülmesi ve değerlendirilmesi amacına hizmet eder.

Öğrenci Ürün Dosyasını Oluşturmada Kullanılacak Teknikler

1-Öğrencinin yaptığı en iyi çalışma
2-Öğrencinin yeni öğrenmeleri ile ilgili çalışmalar
3-Öğrencinin sevmediği çalışmalardan örnekler
4-Öğrencinin sevdiği ve övündüğü çalışmalardan örnekler

5-Öğretmenin, öğrencinin, akranların (grup çalışmasında) ve velinin seçtiği çalışmalar

Ürün Dosyası Oluşturma Sürecinin Temel Aşamaları

1-Öğretimin genel hedefleri ve kazanımları belirlenir.

2-Öğrencilerle birlikte, öğrencilerin kazanması istenen kazanımlara veya davranışlara karar verilir.
3-Öğrenci ürün dosyasının ne olduğu, hangi amaçlarla oluşturulduğu ve nasıl oluşturulduğu öğrencilere açıklanır.

4-Öğrencilere ürün dosyalarını oluşturmada rehber olması açısından örnek bir ürün dosyası gösterilir.

5-Ürün dosyalarına hangi çalışmaların (ödevler, resimler, video ve bant ses kayıtları, çeşitli sınavların sonuçları, projeler, çeşitli ölçme araçlarından elde edilen sonuçlar, mektuplar, öğrencinin yazıları, günlükler vb.) ne amaçlarla alınacağı belirtilir.
6-Ürün dosyasındaki çalışmaların hangi ölçütlere göre nasıl değerlendirileceği öğrencilerle birlikte belirlenerek, bu ölçütler bir yönergeyle karara bağlanır ve bu yönerge öğrencilere dağıtılır.

7-Ürün dosyasına öğrencilerin süreç değerlendirme araçlarından ve ürün değerlendirme araçlarından elde ettikleri sonuçlar eklenir. Aynı zamanda öğrenciyi tüm yönleriyle (kişilik, yetenek, ilgi vb.) tanımamızı sağlayacak belge ve bilgiler de ürün dosyasına alınır.
8-Ürün dosyası değerlendirilerek öğrencilere dönüt (geri bildirim) sağlanır. Öğrencilerin güçlü ve zayıf yönleri belirlenir. Gerekiyorsa tümel bir değerlendirme yapılarak öğrencilere not verilebilir.

Tablo 10. Geleneksel - ürün dosyası değerlendirme karşılaştırması

Geleneksel Değerlendirme

Ürün Dosyası Değerlendirme

· Öğrencinin yeteneği, tutumu, bilgisi vb. tek bir zamanda ölçülür

· Öğrenci ölçütlerden habersizdir Değerlendirmeyi öğretmen yapar

· Öğrenciler içinde bulundukları öğrenci grubuna göre değerlendirilir

· Öğrenciye değerlendirme konusunda aktiflik ve sorumluluk vermez,

· Değerlendirmeler öğrenme sürecinde bağımsız olarak yapılır

· Öğrencinin yeteneği, tutumu, bilgisi vb. süreç içinde ölçülür

· Öğrenci ölçütlerden haberdardır ve değerlendirme sürecinde aktifitr

· Öğrencilerin bireysel olarak değerlendirilmesi söz konusudur,

· Öğrenci aktiftir, sorumluluk verilir ve sorumluluk almayı öğrenir.

· Öğrenme ve değerlendirme süreci bir bütün olarak görülür.

1-Öz değerlendirme (kendini değerlendirme)

Belli bir konuda bireyin kendini değerlendirmesine öz değerlendirme denir. Öz değerlendirme, bireylerin yeteneklerini kendilerinin keşfetmelerine yardımcı olan bir yaklaşımdır. Öz değerlendirme, öğrencilerin okulda yaptıkları çalışmaları, nasıl düşündüklerini ve nasıl yaptıklarını değerlendirmelerini gerektirir. Öz değerlendirme, öğrencilerin güçlü ve zayıf yönlerini tanımalarına yardım eder. Performansının düzeyi hakkında karar vermek için kişisel ya da kişiler arası ölçüt koymada öğrencilere fırsatlar sunar. Öz değerlendirme öğrencilerin güdülenme düzeylerinin yükselmesine yol açar. Öğrencilerin değişik durumlarda davranışlarını kontrol altına almalarını sağlar.

Öz değerlendirmenin olumlu ve olumsuz yönleri vardır. İnsanların genellikle kendi performanslarını değerlendirirken yanlı davranma olasılıkları göz ardı edilmemelidir. Öz değerlendirme, ilk başlarda öğrencilerin deneyimsizliği nedeniyle yanılgılara neden olabilir. Öğrenciler deneyim kazandıkça daha doğru kararlar alacaklardır.

2-Akran Değerlendirme

Akran değerlendirme sınıf içinde öğrenciler tarafından yapılan çalışmayla ilgili olarak öğrencilerin bir birini değerlendirmesi anlamına gelmektedir. Öğrencilerin değerlendirme sürecine sokulması onların kendi yaptıkları işler için yargılarını geliştirme amacı gütmektedir. Öğrencilerin değerlendirme işlemlerinde başarılı olabilmeleri için eğitim almaya ihtiyaçları olabilir. Bu amaçla değerlendirme ölçütleri öğrencilerle tartışılarak kararlaştırılabilir. Değerlendirmelerin nasıl yapılacağına ilişkin öğrencilere geri bildirim verilebilir.

Akran değerlendirme, öğrenmeyle yakından ilişkilidir. Akran değerlendirme, yaşam boyu öğrenmenin önemi, biliş bilgisi, öğrenmede öğrenci sorumluluğu üzerine odaklanmayı içerir. Yaşam boyu öğrenme, bireylerin yalnızca bağımsız çalışmalarını değil, aynı zamanda kendi performans ve gelişimlerini değerlendirmelerini zorunlu kılar. Değerlendirme süreci ile ilgilenmek, öğrencinin öğrenmeye yaklaşımı, öğrencinin kendi güç ve zayıflıkları ve becerileri hakkında değerlendirme yapmasını sağlar.

Akran değerlendirmesinde ortaya çıkan anahtar soru, öğrencilerin verdiği notların geçerli olup olmayacağıdır. Bu soruya en kolay cevabı bulabilmek için öğrencilerin birbirlerine verdikleri notlar ile öğretmenin öğrencilere verdiği notlar arasındaki ilişkiye bakılabilir.

Akran değerlendirmesinin kişiler arası ilişkiler ve akademik kendine güven üzerinde olumsuz etkileri olabilir. Bir öğrencinin yazısını arkadaşlarının değerlendirmesine sunmak riskli olabilir, ancak rekabet körüklenmez ve işbirliği ortamı yaratılırsa öğrenciler yararlı eleştiriler getirebilirler. Öğrencilerin akranlarını değerlendirmede yapıcı olmaları, onları değerlendirmede doğru ölçütler kullanmalarına bağlıdır. Bu ölçütlerden oluşan akran değerlendirme ölçekleri hazırlanarak öğrencilerin kullanması için verilebilir.

Not

Öğrenci hakkında varılan değer yargısıdır. Değerlendirmedir.

Not verirken onun etkili ve amaçlara uygun olması için şunlara dikkat etmek yararlıdır.

1-Not başarılı öğrencinin motivasyonunu artırır, başarısız olanın düşürür. Bu nedenle notlar öğrencinin başarısız olduğu değil, başarılı olduğu alanlar vurgulamalıdır.

2-Notlar öğretimin niteliği hakkında bilgi verir. Bu nedenle notlara bakarak öğretmenler kendilerini değerlendirebilirler.

3-Notlar okul yöneticilerine, diğer yetkililere ve velilere de bilgi verir. Bu nedenle geçerli, güvenilir ve gerçeği yansıtan bir ölçüte dayanmalıdır. Notlar ölçme araçlarının geçerliği ve güvenirliği de dikkate alınarak verilmelidir. Uygun ve hatasız bir ölçüt kullanılırsa notlar gerçeğe daha yakın olur.

Not Vermede Ölçütler

1-Öğretmen Kanısı: Yeteri kadar güvenilir ve geçerli bir ölçüt değildir. Dayanak öğretmenlerin kendi bilgi, beceri, duygu ve düşünce çerçevesidir. Öğretmenden öğretmene değişir.

2-Öğrencinin Yeteneği: Yeteneğin ölçülmesi bazı alanlarda yapılabilmekte bazı alanlarda ise yapılamamaktadır. Yapıldığı alanlarda ise geçerliği ve güvenirliği tartışmalıdır. Pek güvenilir ve geçerli bir ölçüt değildir. Nota yansıtmak, ölçüt almak yerine öğrencilerin yönlendirilmesinde kullanılmalıdır.

3-Öğrencinin Gösterdiği Gelişme: Erişi de denir. Dersin başında sahip olunan davranışlarla dersin sonunda sahip olunanlar arasındaki farktır. Gelişmenin ölçüt alınması doğru değildir. Çünkü her öğrencinin başlangıç davranışları aynı olmadığından aradaki farkı belirlemek çoğunlukla mümkün olmaz. Hazır bulunuşluk testleri uygulama yoluyla bunları belirleme imkanı olsa da pek sağlıklı bir yol değildir. Hatalar içermektedir.

4-Sınıfın Ortalama Başarısı: Bazı ülkelerde çokça kullanılır. Bu ölçütte sınıf ortalaması orta noktaya denk getirilir. Diğer başarı düzeyleri de buna göre iyi, pekiyi vb. gibi belirlenir. Öğrenme ortamı, öğretmen ve diğer etkenlerin öğrencilere veya öğrenmeye etkisi aynı olduğu için savunulabilir. Ancak bu yaklaşımda programın hedef-davranışları dikkate alınmaz. Bu yaklaşım davranışları yeterince kazanamayanlara diploma verme, buna karşılık davranışların çoğuna sahip olan birçok öğrencinin sınıfta kalmasına sebep olabilir. Eğitim sisteminin çelişkili sonuçlar vermesine neden olur. Bu yaklaşımında geçersiz ve güvenilmez olduğu sonucuna varılır.

5-Hedef ve Davranışlar: Ölçüt kazandırılması hedeflenen davranışlardır. Davranışların asgarisine sahip olan öğrenciler minimum geçer not alır. Bu yaklaşımda notlar öğretmen, öğrenme ortamı vb. dış etkenlerden etkilenir. Bu etkilerden gelen başarısızlık sebepleri notlara yansır. Bu durum olumsuz taraflarıdır. Bu yöntem özellikle ön-şart ilişkilerin yüksek olduğu matematik, fizik, laboratuar ve atölye derslerinde kullanılabilir.

Bölüm Testi

1. Aşağıdakilerden hangisi değer biçmeye yönelik değerlendirme değildir?

A) Vize sınavı

B) Final Sınavı*

C) Bütünleme sınavı

D) Üniversite seçme sınavı

E) Ünite sınavı

2. Aşağıdakilerden hangisi değerlendirme ile ilgili değildir?

A) Bir yargılama ve karar verme işidir.

B) İki özelliğin karşılaştırılmasına dayanır.*

C) Ölçümlerden bir anlam çıkarmadır.

D) Davranış derecesini belirleme işidir.

E) Bir değer yargısına varmaktır.

3. Aşağıdakilerden hangisi tanıma-yerleştirmeye yönelik değerlendirme için yapılır?

A) Öğrencileri cinsiyetine göre ayırmak

B) Öğrencilerin hazır-bulunuşluk düzeyini belirlemek

C) Ünite bitiminde yazılı yoklama yapmak*

D) Dönem sonunda bitirme sınavları yapmak

E) Öğrencileri boy ve ağırlıklarına göre ayırmak

4. Bir öğretmen ham puanı sınıf ortalamasının 2 standart sapma üstünde olan öğrencilere “pekiyi” notu vermiştir. Bu değerlendirmede ölçüt nedir?

A) Sınıfın ortalama başarısı*

B) Öğrencinin gelişim farkı

C) Dersin hedef davranışları

D) Öğretmenin kanısı

E) Testin ortalama güçlüğü

5. Aşağıdakilerden hangisi sınıfın ortalama başarısı ölçüt alınarak yapılan değerlendirmenin olumlu bir yönüdür?

A) Öğrencileri çalışmaya yönlendirmesi*

B) Daha adil bir değerlendirme yapması

C) Ölçme hatalarından etkilenmemesi

D) Daha kullanışlı olması

E) Öğrencilerde kaygıyı düşürmesi

6. Eğitim sisteminde değerlendirmenin önemini aşağıdakilerden hangisi daha iyi açıklar?

A) Sistemin kendini yenilemesine katkı sağlar.*

B) Girdilerdeki eksikliği kontrol eder.

C) Süreçte olan aksaklıkları saptar.

D) Çıktıların hedeflerle tutarlılığını denetler.

E) Öğrencilerin başarısı hakkında bilgi verir.

7. Aşağıdakilerden hangisi bir değerlendirme türü değildir?

A) Programın sağlamlığını denemek

B) Öğretim yönteminin etkililiğine bakmak

C) Öğrencilerin başarısını izlemek

D) Öğretilenlerdeki eksiklikleri saptamak

E) Ölçme aracının güvenirliğini belirlemek*

8. “Bir öğretmen sınav sonunda Ahmet’e 64 puan ve buna dayalı olarak 6 notu vermiştir.” İfadesi için aşağıdakilerden hangisi söylenebilir?

A) 64 karar, 6 yargı

B) 64 ve 6 ölçme sonucu

C) 64 ve 6 değerlendirme sonucu

D) 64 ölçme sonucu, 6 karar*

E) 64 yargı, 6 değerlendirme

9. “Öğrencileri bütün yönleriyle tanıma; öğrencilerin bireysel gelişimlerini izleme; öğrencilerin yeteneklerini belirleme; öğrenciler hakkında toplanan bilgiyi onların yönlendirilmesinde kullanma; öğrencilere kendi ürünlerini değerlendirme imkanı verme” gibi amaçlara hizmet eden değerlendirme aşağıdakilerden hangisidir?

A) Dereceleme ölçekleri B) Ürün dosyaları*

C) Ödevler D)Projeler E)Yazılı sınavlar

KAYNAKÇA

Ölçme ve Değerlendirme bölümü oluşturulurken

aşağıdaki kaynaklardan yararlanılmıştır.

Cemal YILDIRIM	Eğitimde Ölçme ve Değerlendirme	ÖSYM Yayınları	Ankara: 1999
Çiğdem KAĞITÇIBAŞI	İnsan ve İnsanlar	Evrim Basın, yayım, dağıtım	İstanbul, 1988
D. Ali ÖZÇELİK	Ölçme ve Değerlendirme	ÖSYM Yayınları	Ankara: 1992
Halil TEKİN	Eğitimde Ölçme ve Değerlendirme	Yargı Yayınları	Ankara: 1993
Harry Grover TUTTLE	Rubrics	Multimedia Schools	Jan/Feb96, Vol. 3 Issue 1, p30, 4p, 2c
Hüseyin ÖNCÜ	Eğitimde Ölçme ve Değerlendirme	YAYSAN A.Ş.	Ankara: 1999
İbrahim Ethem ÖZGÜVEN	Psikolojik Testler	PDREM Yay.	Ankara, 1998
M. Fuat TURGUT	Eğitimde Ölçme ve Değerlendirme Metotları	Saydam Matbaa	Ankara: 1992
MİLLİ EĞİTİM BAKANLIĞI	http://ttkb.meb.gov.tr/ogretmen/ İlköğretim Programları ve Öğretim Materyalleri		Ankara, 2004
Ömer BEYDOĞAN	Okullarda Ölçme ve Değerlendirme	A.Ü. KKEF yayınları	Erzurum: 1998
Özcan DEMİREL	Planlamadan Değerlendirmeye Öğretme Sanatı	PEGEMA	Ankara: 2004
Terri L WENZLAFF, Jennifer J. FAGER, Marta J. COLEMAN	*What is a Rubric? Do Practitioners and the Literature Agree?*	Contemporary Education	Summer99, Vol. 70 Issue 4, p41, 6p, 1 chart
Yaşar BAYKUL	Eğitimde ve Psikolojide Ölçme	ÖSYM yayınları	Ankara: 2000
Yaşar BAYKUL	İstatistik: Metotlar ve Uygulamalar	Anı Yayınları	Ankara, 1999
Yaşar BAYKUL, Selahattin GELBAL Hülya KELECİOĞLU	Eğitimde Ölçme ve Değerlendirme	MEB Yayınları	Ankara: 2001
Veysel SÖZNMEZ	Öğretmen El Kitabı	PEGEM Yayınları	Ankara, 1994

DENEME 1

1. Bir testin güvenirliğini aşağıdakilerden hangisi daha iyi açıklar?

a) Test bir çok durumda kullanılmaya uygundur

b) Testin başka bir testle korelasyonu yüksektir

c) Test bireylerin başarısını az hata ile ölçebilir

d) Test şans başarısını azaltmada kullanılabilir

e) Test konu kapsamını ölçebilecek niteliktedir

2. 1. Bir davranışa sahip olanla olmayanı ayırabilme düzeyi

2. Ölçmelere karışan ortalama hata miktarı

3. Gözlemlerin hatalardan arınıklık derecesi

4. Ölçme aracının amaca uygunluk derecesi

5. Ölçme sonuçlarının bir ölçütle karşılaştırılması

Yukarıdakilerden hangileri geçerliği tanımlamada kullanılabilir?

a) 2-3 b) 1-4 c) 2-4 d) 2-5 e) 3-5

***3 ve 4. soruları aşağıdaki tabloya göre cevaplayınız.

	I. TEST	2. TEST	3. TEST	4. TEST	5. TEST
Güvenirlik	0,77	0,65	0,99	0,50	0,45
Geçerlik	0,77	0,60	0,30	0,40	-0,15

3. Geçerlik güvenirlik arasındaki ilişkilere bağlı olarak yukarıdaki testlerin hangisinde güvenirlik katsayısı yanlış hesaplanmıştır?

a) 1 b) 2 c) 3 d) 4 e) 5

4. Yukarıdaki testlerden hangisini kullanmak daha doğru olur?

a) 1 b) 2 c) 3 d) 4 e) 5

5. Bir dershane, on gün önce öğrencilerinin Ö.S.S deneme sınavından aldığı puanlarla Ö.S.S. sınavından aldığı puanlar arasındaki ilişkiyi araştırmaktadır. Elde edilecek sonuç deneme sınavının hangi özelliğini gösterir?

a) İç Tutarlığını b) Standart Hatasını c) Yordama Geçerliği

d) Kararlılık Düzeyi e) Yapı Geçerliği

6. Bir puan dağılımı hakkında özet bilgiler veren tipik değerlere ne ad verilir?

a) Merkezi eğilim ölçüleri

b) Değişim ölçüleri

c) Sabit ölçüler

d) Dağılım ölçüleri

e) Saçılım ölçüleri

7. Bir testin kolay mı yoksa zor mu olduğunu belirlemek için aşağıdaki katsayılardan hangisini hesaplamak gerekir?

a) Basıklık b) Regresyon c) Korelasyon

d) Değişim e) Çarpıklık

8. Bir testte 40 soru sorulmuş ve standart sapması 5, ortalaması 20 bulunmuştur. Bu sınavdan 30 alan bir öğrencinin T puanı kaçtır?

a) 40 b) 50 c) 60 d) 70 e) 80

9. Uygulanan bir matematik testi sonucunda bütün sınıf başarılı olmuştur. Bu durumda aşağıdakilerden hangisini kesinlikle söyleyemeyiz?

a) Testteki maddeler ayırt edicidir

b) Testteki maddeler kapsamı iyi örneklemiştir

c) Testteki maddeler çok kolaydır

d) Öğrenciler matematik başarısı bakımından benzeşiktir

e) Öğrenciler ölçülecek davranışları kavramıştır

***10-12 soruları aşağıdaki dağılımlara göre cevaplayınız.

10. Yukarıdaki dağılımların hangisinde merkezi eğilim ölçüsü olarak ortancayı kullanmak doğru olur?

a) 1 b) 2 c) 3 d) 4 e) 5

11. Yukarıdaki dağılımların hangisinde birden fazla mod vardır?

a) 1 b) 2 c) 3 d) 4 e) 5

12. Yukarıdaki dağılımların en basık olanı hangisidir?

a) 1 b) 2 c) 3 d) 4 e) 5

13. Aşağıdakilerden hangisi kısa cevaplı testlerin özelliklerinden biri değildir?

a) Puanlama kolaydır

b) Bilgi düzeyi davranışları ölçer

c) Cevaplar şişirilebilir

d) Her eğitim düzeyine uygundur

e) Çeşitli yetenek alanına uygundur

14. Aşağıdakilerden hangisi eşit aralık ölçeğinde elde edilmiştir?

a) Günlük görüşülen hasta sayısı

b) Ayakkabı numarası

c) Sahadaki takım sayısı

d) Öğrenim görülen fakülte

e) Standartlaştırılmış başarı puanı

***15-16. soruları aşağıdaki tabloya göre yanıtlayınız.

Sınıf 1 50 15

Sınıf 2 40 5

Sınıf 3 50 10

Sınıf 4 60 15

Sınıf 5 70 10

15. Yukarıdaki tabloya göre öğrencilerin başarıları arasındaki farklar hangi sınıfta daha büyüktür?

a) 1 b)2 c) 3 d) 4 e)5

16. Yukarıdaki tabloya göre hangi sınıftaki öğrenciler birbirlerine daha yakın not almışlardır?

a) 1 b)2 c) 3 d) 4 e)5

17.Aşağıdakilerden hangisi sınıflı ölçekler için kullanılabilecek istatistiksel tekniklerden biridir?

a) Ortalama b) Korelasyon c) Varyans

d) Ortanca e) Mod

18. Aşağıdakilerden hangisi değerlendirme ile ilgili değildir?

a) Bir yargılama ve karar verme işidir.

b) İki özelliğin karşılaştırılmasına dayanır.

c) Ölçümlerden bir anlam çıkarmadır.

d) Davranış derecesini belirleme işidir.

e) Bir değer yargısına varmaktır.

19. Aşağıdakilerden hangisi bir yargıya varmak amacıyla yapılmaz?

a) Programın sağlamlığını denemek

b) Öğretim yönteminin etkililiğine bakmak

c) Öğrencilerin başarısına karar vermek

d) Öğretilenlerdeki eksiklikleri saptamak

e) Ölçme aracının güvenirliğini belirlemek

20. Aşağıdaki önermelerden hangisi yanlıştır?

a) Güvenirlik arttıkça hata azalır.

b) Güvenirlik +1 ile –1 arasında değer alır.

c) Madde sayısı arttıkça güvenirlik artar.

d) Güvenirlik geçerlik için ön şarttır.

e) Tutarlık güvenirliğin anlamlarındandır.

DENEME 2

1- Öğrencilerin derste öğrenemedikleri konuları saptayıp, konularla ilgili, yeni etkinlikleri yapmaya olanak tanıyan sınav türlerine genel olarak ne isimi verilir?

A) Zeka Testleri

B) Performans Testleri

C) Başarı Testleri

D) İzleme Testleri

E) Seçme Testleri

2- Sınav planını aşağıdakilerden hangisi daha iyi açıklar?

A)Öğrencilerin sınava gireceği koşulları belirleme

B)Öğrencilere sorulacak soruları belirleme ve yazma

C)İstenilir özelliklere sahip bir ölçme aracı elde etme süreci

D)Uygulanmış bir testin geçerli olan maddelerini seçme

E)Seçenekleri iyi işlemeyen maddeleri seçeneklerini düzeltme

3- Aşağıdakilerden hangisinde ölçme işlemi yoktur?

A)Bir sınıftaki öğrencileri sarışın, esmer ve kumral diye gruplamak

B)Bir ceket üzerindeki kol düğmelerini saymak

C)Bir otobüsün iki durak arasını kaç dakikada aldığını belirlemek

D)Bir sınıftaki kız ve erkek öğrencilerin sayılarını saptamak

E)İyi bir bilgisayar almak için minimum donanım özelliklerini belirlemek

4- Bir dersane öğrencilerine deneme sınavı uygulanmış ve ÖSS’de öğrencilerinin bu sınavdan alacağı puanlara yakın puan alacağını iddia etmiştir. Dersanenin iddiasının gerçekleşmesi deneme sınavının en çok hangi özelliğine bağlıdır?

A) İç tutarlığına

B) Yapı geçerliğine

C) Objektifliğine

D) Yordama geçerliğine

E) Duyarlığına

5- Aşağıdakilerden hangisi testtin güvenirliğini artırmayı sağlamaz?

A)Ölçülecek her davranışla ilgili soru sorulması

B)Soruların çok beğenilen bir kitaptan alınması

C)Öğrencilere gereğinden fazla süre verilmemesi

D)Testin tümünün çok zor sorulardan oluşturulması

E)Sınav koşullarının motivasyonu düşürecek etkilerden arındırılması

6- Aşağıdakilerden hangisi portfolya (dosya) değerlendirmenin öğrenciye sağladığı avantajlardan biri değildir?

A)Öğrencilerin yaratıcılıklarını geliştirmede etkilidir

B)Öğrencilere sorumluluk almayı öğretir

C)Öğrencinin kendi değerlendirmesine katılımını sağlar

D)Öğrencilere hangi arkadaşlarından daha fazla bilgi sahibi olduğunu gösterir

E)Öğrenciler bir sınavla değil süreç içinde değerlendirilir.

7- Aşağıdakilerden hangisi bir değerlendirme işlemi değildir?

A)Doktorun muayene ettiği kişinin hasta olduğunu belirlemesi

B)Yönünü kaybetmiş birinin kutup yıldızına bakarak yönünü belirlemesi

C)Türkçe öğretmenin ders kitabını inceleyerek yetersiz bulması

D)Öğretmenin geliştirdiği testin güvenirlik değerine yüksek demesi

E)Bir kişinin bir numara büyük ayakkabı almaya karar vermesi

8- Doğru yanlış testlerinin eğtim bilim açısından uygun olmayan en önemli özelliği nedir?

A)Seçenek sayısının az olması

B)Yanlışı vurgulaması

C)Alt eğitim sevilerine uygun olmaması

D)Çoktan seçmeli testlere benzemesi

E)Üst düzey davranışları yoklayamaması

9-Çoktan seçmeli testlerde seçenek sayısını azaltmanın temel gerekçesi ne olmalıdır?

A)Şans başarısını artırmak

B)Puanlama hatasını azaltmak

C)Soruları zorlaştırmak

D)Alt eğitim kademelerinde kullanmak

E)Soruları kolaylaştırmak

10- I. Sınıflama ölçekleri

II. Sıralama ölçekleri

III. Eşit aralıklı ölçekler

IV. Oranlı ölçekler

Öğretimde kullanılan ölçek türleri hangisidir?

A)I ve II

B)II ve III

C)I, II ve III

D)II, III ve IV

E)III ve IV

11- Nesneler arasındaki nitelik farklarının miktarını gösteren ölçek türüne ne ad verilir?

A)Sınıflama

B)Sıralama

C)Eşit aralıklı

D)Oranlı

E)Adlandırma

12- Aşağıdakilerden hangisi güvenirliğin tanımlarından biri değildir?

A)Bir ölçme aracının ölçme sonuçlarına hata karıştırmadan ölçme yapabilmesi

B)Özelliği ölçülen varlık veya olayların bu özelliğinde bir değişme olmadıkça, onları hep aynı sıraya koyan ölçüler vermesi

C)Bir ölçme aracının, ölçmesi amaçlanan özelliği başka değişkenlerle karıştırmadan ölçmesi

D)Bir ölçme aracının ölçtüğü özelliği ne derece bir kararlılıkla yansıtabildiği

E)Aynı bireyler üzerinde yapılan bir niteliğe ait ölçümlerin benzer şartlarda tekrar elde edilebilirliği

13-Ortalaması eşit iki gruptan birincinin bağıl değişim katsayısı 30, ikincinin 15’dir. Bu bilgilere dayanarak iki grubun st. sapması için aşağıdakilerden hangisini söyleyebiliriz?

A) Birinci grubun st. sapması ikinci grubun st. sapmasından büyüktür.

B) Birinci grubun st. sapması ikinci grubun st. sapmasına eşittir.

C) Birinci grubun st. sapması ikinci grubun st. sapmasından küçüktür.

D) Grup st. sapmalarını karşılaştırmak için yeterli bilgi yoktur.

E) İkinci grubun st. sapması birinci grup st. sapmasının iki katıdır.

14- Bir gruba Türkçe ve Matematik testi uygulanıyor. Gruptaki bireyler bu testlerden elde ettikleri z puanlarına göre sıraya konuluyor. Ardından grubun t puanları hesaplanıyor ve t puanlarına göre sıralama yapılıyor. Bu iki sıralama arasındaki korelasyon katsayısı için aşağıdakilerden hangisi doğru olur?

A)Negatif olur

B)Negatif mükemmel olur

C)Sıfır olur

D)Pozitif olur

E)Pozitif mükemmel olur

15-

Dersler	Ortalama	St. sapma	Not
Türkçe	80	10	90
Matematik	50	5	55
Fen	60	15	75

Yukarıdaki tabloda, bir öğrencinin Türkçe, Matematik ve Fen derslerine ait sınav notları ve bu sınavların ortalamaları ile standart sapmaları görünmektedir. Bu bilgilere göre öğrencinin üç dersteki başarısı hakkında varılacak hangi karar doğru olur?

A) Öğrenci en yüksek başarıyı Matematik dersinde göstermiştir.

B)Öğrenci en yüksek başarıyı Türkçe dersinde göstermiştir.

C)Öğrenci en yüksek başarıyı Fen dersinde göstermiştir.

D) Öğrenci her üç derste de aynı düzeyde başarılı olmuştur.

E)Verilen bilgiler karşılaştırma yapmak için yeterli değildir.

***16-18 soruları tabloya göre cevaplayınız

Gruplar

Toplam

Üst Grup

Alt Grup

100

Toplam

200

*B doğru cevap olduğuna göre

16- Sorunun güçlük indeksi kaçtır?

A) 0.60

B) 0.50

C) 0.30

D) 0.25

E) 0.20

17- Sorunun ayırıcılık gücü indeksi kaçtır?

A) 0.10

B) 0.20

C) 0.30

D) 0.40

E) 0.50

18- Bu soruda yapılması gereken en önemli işlem ne olmalıdır?

A)A ve C seçenekleri doğru cevaba yakınlaştırılmalıdır.

B)Doğru cevap alt gruptan çok öğrenci çektiği için değiştirilmelidir.

C)Zor bir soru olduğundan kolaylaştırılmalıdır.

D)D çeldiricisi alt gruptan çok öğrenci çektiğinden değiştirilmelidir.

E)Maddenin geçerliğini artırmak gereklidir.

DENEME 3

1.Bir okul müdürü, kayıt yaptırmak için başvuran öğrencileri iyi, orta, zayıf diye üç gruba ayırıp, buradan elde edeceği sonuçlara göre öğrencileri uygun şubelere yerleştirmek istemektedir. Buna göre amaca en iyi hizmet edecek test türü hangisidir?

A) Zeka Testi

B) Hazır bulunuşluk Testi

C) Kişilik Testi

D) Başarı Testi

E) İzleme Testi

2.Test palanında madde seçme işleminde önceki ve sonraki aşamaları aşağıdakilerden hangisinde doğru verilmiştir.

A)Önceki: Maddelerin düzeltilmesi

Sonraki: Deneme formunun oluşturulması

B)Önceki: Ölçülecek davranışların belirlenmesi

Sonraki: Asıl test formunun oluşturulması

C) Önceki: Deneme uygulamasının yapılması

Sonraki: Asıl test formunun oluşturulması

D) Önceki: Sınav türüne ve soru tipine karar verme

Sonraki: Deneme uygulamasını yapma

E) Önceki: Madde analizlerini yapma

Sonraki: Asıl test formunu oluşturma

I. Ayşe’nin boy uzunluğu 175 cm bulunmuştur.

II. Ayşe matematik sınavından 65 puan alarak geçmiştir

III. Ayşe voleybol takımına seçilecek boy uzunluğuna sahiptir

IV. Ayşe ÖSS’ de 250 puan almıştır

V. Ayşe’nin puanı sınıfını geçmeye yetmemiştir.

Yukarıdaki ifadelerin hangilerinde ölçme işlemi vardır?

A) I-IV B) I-V C) II-IV D) II-III E) III-V

4.Bir ölçme aracı göz önüne alınmasa; kazandırılmak istenen davranışların konu ve hedeflere göre dağılımını gösteren belirtke tablosunun en önemli yararı nedir?

A)Güvenirliği yüksek bir test oluşturmak için sormamız gereken soru sayısını gösterir

B)Kapsam geçerliğini belirlemeye veya sağlamaya dayanak oluşturur

C)Özellikle kazandırılacak kritik davranışları belirlememizi kolaylaştırır

D)Hangi konuya ne kadar zaman ayıracağımıza çabuk karar vermemizi sağlar

E))Her konuda kazandırılacak davranışlara açıkça görmemizi sağlar

5.Aşağıdakilerden hangisi bir öğretmenin yazılı sınav sonuçlarının güvenirliğini artırmak için alabileceği önlemler arasında değildir?

A)Tanıdık öğrencilere daha hoş görüsüz davranarak düşük puan vermek

B) Cevaplara verdiği puanları dikkatli toplayıp kaydetmek

C) önceden hangi cevaplara ne kadar puan vereceğini belirlemek

D) Birkaç gün sonra kağıtlara yeniden puanlamak

E) aynı konuda uzman en az bir kişiye daha puanlama yaptırmak

6.Portfolyo (dosya) değerlendirmenin bir sınıf öğretmenine sağlayacağı avantajların en önemlisi nedir?

A)Bir öğrencinin tüm yönleri ile gelişimini izleme fırsatı vermesi

B)Öğrencinin sevdiği ve sevmediği dersleri görmemizi sağlaması

C)Öğrencinin yetenekli olduğu alanları açığa çıkarması

D)Öğrencilerin psikolojik sorunlarını tespit etmeyi olanaklı kılması

E)Öğrencilerin arkadaşları hakkındaki düşüncelerini açıklayabilmeleri

7.Ciddi bir lokanta ilginç bir uygulama başlatarak kravat takmayan müşterileri lokantaya almamaktadır. Bu uygulama açısından kravat için aşağıdaki nitelemelerin hangisi doğru olur?

A) Ölçüttür B) Kuraldır C) Geçerliktir D) Değer Yargısıdır E) Değerlendirmedir

8.Aşağıdakilerden hangisi kısa cevaplı sınavların yazılı sınavlardan en üstün yönüdür?

A)Geniş bir kapsamı ölçmesi

B)Şans başarısının olmaması

C)Cevapların sınırlı olması

D)Soruların objektif puanlanması

E)Daha kullanışlı olması

9.Aşağıdakilerden hangisi çoktan seçmeli test maddelerinden soru köküne göre maddedir?

A)Soru kipinde

B)Tek bir cevabı olan

C)Ortak köklü

D)Ortak seçenekli

E)Birleşik cevap gerektiren

10. Bir çoktan seçmeli teste verilen doğru cevaplar, o testi alan grubun ortalaması ve standart sapması dikkate alınarak tekrar hesaplanmıştır. Bu şekilde elde edilen puanlara standart puanlar denir. Standart puanlar hangi ölçek niteliğindedir?

A)Sınıflama B)Sıralama C)Eşit aralıklı

D)Oranlı E)Adlandırma

11. Çoktan seçmeli bir testin maddelerinin herkes tarafından aynı biçimde anlaşılmaması, bu testin hangi niteliğini düşürür?

A)Güvenirliğini

B)Kapsam geçerliğini

C)Yapı geçerliğini

D)Kullanışlılığını

E)Uygunluk geçerliğini

12. 100 metreyi, yarışa katılanlar arasından ilk 5’e girerek tamamlayanlar okul takımına seçilecektir. Bu seçme işlemi, aşağıdaki ifadelerden hangisini açıklamak için iyi bir örnektir?

A)Bağıl değerlendirme

B)Mutlak değerlendirme

C)Temel ölçme

D)Dolaylı ölçme

E)Ölçüt dayanaklı ölçme

**13-15. soruları aşağıdaki tabloya göre cevaplayınız.

9. SORU	D	Y	T
Üst grup	30	20	50
Alt grup	20	30	50
T	50	50	100

13. Sorunun güçlük indeksi kaçtır?

A) 0,35 B)0,45 C)0,50

D)0,55 E)0,60

14. Sorunun ayırıcılık indeksi kaçtır?

A) 0,20 B)0,40 C)0,50

D)0,60 E)0,80

15. Bu madde için aşağıdaki yorumlardan hangisi daha doğrudur?

A) Madde orta güçlükte ve ayırıcılığı yeterlidir.

B) Madde orta güçlükte ama ayırıcılığı sıfırdır.

C) Amacına hizmet edemeyen zor bir maddedir.

D) Madde orta güçlükte fakat düzeltilmelidir.

E) Madde hem zor hem de ayırıcılığı yüksektir.

**50 soruluk bir test 5 ayrı sınıfa uygulanmış ve aşağıdaki istatistikler elde edilmiştir.

	Ortalama	Mod	Ortanca	St. sapma
1. sınıf	35	45	40	4
2. sınıf	35	30	32	5
3. sınıf	35	15	20	7
4. sınıf	35	40	37	8
5. sınıf	35	35	35	6

16.Tabloya göre hangi sınıfın puan dağılımı simetriktir?

A) 1 B) 2 C) 3 D) 4 E) 5

17.Tabloya göre en yüksek öğrenme düzeyi hangi sınıfta gerçekleşmiştir?

A) 1 B) 2 C) 3 D) 4 E) 5

18.Tabloya göre en düşük öğrenme düzeyi hangi sınıfta gerçekleşmiştir?