Güvenilirlik ve geçerlilik arasındaki 4 farklılık (bilimde)

Nisan 4, 2024

Dilsel dilde çok benzer anlamları olduğu için, bilimi ve özellikle psikometriyi konuştuğumuzda güvenilirlik ve geçerlilik kavramlarını karıştırmak kolaydır.

Bu metinle, güvenilirlik ve geçerlilik arasındaki büyük farklılıklar . Umarım bu olağan şüpheyi netleştirmekte fayda vardır.

İlgili makale: "Psikometri: insan zihnini verilerle çalışmak"

Güvenilirlik nedir?

Psikometride "güvenilirlik" kavramı bir enstrümanın doğruluğunu ifade eder ; Spesifik olarak, güvenilirlik katsayıları bu araçla alınan önlemlerin tutarlılığını ve stabilitesini bize bildirir.

Bir enstrümanın güvenilirliği ne kadar büyük olursa, belirli özellikleri ölçmek için kullanıldığında ortaya çıkacak rastgele ve öngörülemeyen hataların miktarı o kadar düşük olur. Güvenilirlik öngörülebilir hataları, yani deneysel kontrollere tabi olanları içermez.

Klasik test teorisine göre, güvenilirlik, gerçek puanlarla açıklanan varyansın oranıdır. Böylece, bir testteki doğrudan puan, rastgele hatanın ve gerçek puanın toplamından oluşur.

Güvenilirliğin iki ana bileşeni Geçici istikrar ve iç tutarlılık . İlk kavram, farklı durumlarda ölçüldüğünde puanların çok az değiştiğini, iç tutarlılığın ise testi oluşturan maddelerin aynı psikolojik yapıyı ölçtüğünü ifade ettiğini gösterir.

Bu nedenle, yüksek güvenirlik katsayısı, bir testteki puanların içsel olarak ve zamanın bir fonksiyonu olarak çok az değiştiğini ve özet olarak, enstrüman ölçüm hataları yok .

Belki ilgileniyorsunuz: "Psikolojik test türleri: işlevleri ve özellikleri"

Geçerlilik tanımı

Geçerlilikten söz ettiğimizde, testin ölçmeyi planladığı yapıyı doğru bir şekilde ölçüp ölçmediğine bakacağız. Bu kavram, Bir testte elde edilen puan ile bir başka ilgili ölçüm arasındaki ilişki ; Her iki unsur arasındaki doğrusal korelasyon derecesi, geçerlilik katsayısını belirler.

Ayrıca, bilimsel araştırmalarda yüksek bir geçerlilik, belirli bir enstrüman veya bir çalışma ile elde edilen sonuçların genelleştirilebileceğini göstermektedir.

Hesaplanma şekline bağlı olarak farklı geçerlilik türleri vardır; Bu, çok farklı anlamlarda bir terimdir. Temel olarak birbirinden ayırt edebiliriz içerik geçerliliği, ölçüt (veya deneysel) geçerliliği ve yapı geçerliliği .

İçerik geçerliliği, bir psikometrik testin öğelerinin, değerlendirilmek üzere yapıyı oluşturan unsurların temsili bir örneği olduğunu tanımlar. Enstrüman, yapının tüm temel yönlerini içermelidir; Örneğin, depresyonu ölçmek için yeterli bir test yapmak istiyorsak, mutlaka ruh halini değerlendiren ve keyfi azaltan öğeleri de içermeliyiz.

Ölçüt geçerliliği, enstrümanın, özellik ya da ilgi alanı ile ilgili yönleri tahmin etme yeteneğini ölçer. Son olarak, yapı geçerliliği amaçlanmıştır testin ölçmeyi planladığı şeyi ölçüp önlemediğini belirlemek Örneğin benzer testlerde elde edilen puanlarla yakınsama.

Güvenilirlik ve geçerlilik arasındaki farklar

Her ne kadar bu iki psikometrik özellik birbiriyle yakından ilişkili olsa da, gerçek şu ki, açıkça farklılaşmış yönlere atıfta bulunmalarıdır. Bu farklılıkların neler olduğunu görelim .

1. Analizin amacı

Güvenilirlik, aleti oluşturan maddelerin özelliklerini ölçmesi anlamında, aracın bir özelliğidir. Öte yandan, geçerlilik tam olarak cihaza değil, sonuçlardan yapılan genellemelere onun aracılığıyla elde edilir.

2. Sağladıkları bilgiler

Her ne kadar bu konunun biraz basit olmasına rağmen, genel anlamda, geçerlilik, bir psikometrik aracın ölçmeyi planladığı yapıyı gerçekten ölçtüğünü, güvenilirliğin ise hata olmadan doğru bir şekilde ölçüp önlemediğini ifade ettiğini söyler.

3. Hesaplanma şekli

Güvenilirliği ölçmek için temel olarak üç prosedür kullanılmaktadır: İki yarının yöntemi, paralel formlardan biri ve test-tekrar test . En çok kullanılan, test cevaplandıktan sonra öğelerin iki gruba ayrıldığı iki yarının prosedürüdür; Daha sonra iki yarım arasındaki korelasyon analiz edilir.

Paralel veya alternatif formlar yöntemi, aralarındaki maddeleri ne ölçüde ilişkilendirdiklerini ölçmek için iki eşdeğer test oluşturulmasını içerir. Test-tekrar test, testi mümkün olduğunca benzer koşullarda iki kez geçirmeye dayanır.Her iki prosedür birleştirilebilir, testin tekrar test edilmesine yol açar, bu da testin ilk formu ile ikinci arasında bir zaman aralığı bırakmayı içeren paralel formlarla ortaya çıkar.

Onun parçası için geçerlilik tipe bağlı olarak farklı şekillerde hesaplanır. Ancak, genel olarak tüm yöntemler, objektif testteki puan ile benzer öznelerdeki benzer öznelerin diğer verileri arasındaki karşılaştırmaya dayanmaktadır; Amaç, testin özelliklerin bir yordayıcısı olarak hareket edebilmesidir.

Geçerliliğin değerlendirilmesinde kullanılan yöntemler arasında çok faktörlü çoklu-özellikli matrislerin faktör analizi ve tekniğini bulduk. Ayrıca, içerik geçerliliği genellikle rasyonel, istatistiksel olmayan analizlerle belirlenir; Örneğin, testin geçerliliği konusunda uzmanların öznel kararlarına atıfta bulunan görünür geçerliliği içerir.

4. Her iki kavram arasındaki ilişki

Bir psikometrik enstrümanın güvenilirliği geçerliliğini etkiler: ne kadar güvenilir olursa, geçerliliği o kadar büyüktür . Bu nedenle, bir aracın geçerliliğinin katsayıları her zaman güvenilirlikten daha düşüktür ve geçerlilik, dolaylı olarak bizi güvenilirlik hakkında bilgilendirir.