Varyans formülü, istatistikçilere bir veri kümesinin çeşitli yönleri hakkında bilgi verir. Tipik olarak, bir veri kümesinin tamamı için varyansı hesaplamak için veri kümesinin yalnızca bir örneği için varyansı hesaplamak için biraz farklı iki formül kullanırsınız. Ek olarak, varyans standart sapmaya bağlıdır ve her iki istatistiksel kavram da çeşitli ortamlarda faydalıdır.
Bu makalede, varyans formülünün ne olduğunu, neden önemli olduğunu, standart sapmadan nasıl farklı olduğunu ve her bir formülün bir popülasyonun ve küçük bir örneğin varyansını hesaplamak için nasıl kullanılacağını keşfedeceğiz.
Varyans, ortalamadan standart sapma olarak da bilinen farkların karesinin ortalamasıdır. Basitçe söylemek gerekirse, varyans, bir örnek veya veri kümesi içindeki veri noktalarının ne kadar yayılmış olduğunun istatistiksel bir ölçüsüdür. Ortalama ve standart sapmaya ek olarak, bir örneklem setinin varyansı, istatistikçilerin araştırma amacıyla topladıkları verileri anlamlandırmalarına, düzenlemelerine ve değerlendirmelerine olanak tanır.
Esasen, varyansın ölçtüğünüz veri grubuna bağlı olarak kullanabileceğiniz iki formülü vardır. Örneğin, tüm bir üniversite sınıfının notları gibi bir popülasyon kümesinin tamamının verilerini ölçüyorsanız, bu formülü kullanarak varyansı hesaplarsınız:
Varyans = (Her terimin toplamı - ortalama)^2 / n
İşte formülün unsurları:
Yalnızca bir popülasyon örneğinin varyansını hesaplarken şu formülü kullanacaksınız:
Varyans = (Her terimin toplamı - ortalama)^2 / n-1
İşte formülün unsurları:
Tüm popülasyonun kendisi yerine tüm popülasyonun bir örneği için varyansı hesapladığınız için n-1 kullanırsınız.
Basitçe söylemek gerekirse, standart sapma, bir popülasyon veya örneğin ortalamasından bir dizi veri noktasının ne kadar dağıldığının kesin değerlerine bakar. Ancak varyans, her bir veri noktasının ortalamadan farklı olduğu ortalama dereceyi ölçer. Bu, varyansın veri kümenizdeki tüm değerlerin ortalamasına baktığı, standart sapmanın ise verilerin yayılmasının tam değerine baktığı anlamına gelir.
Bu iki kavram arasında küçük bir fark olsa da varyans ve standart sapma birbirine bağlıdır. Bir örnek kümesinde veya tüm popülasyonda standart sapmayı bulduğunuzda, varyansı elde etmek için bu sonucun karesini alabilirsiniz. Bu, varyans ve standart sapma arasındaki en basit ilişki olsa da, incelediğiniz verilerin farklı yönlerine ilişkin içgörü sağlamak için bu iki hesaplamanın nasıl çalıştığını anlamanın gerekliliğini temsil eder.
Ek olarak, standart sapma, bir dizi verinin göreli aralığını temsil eder ve standart ortalamanın her iki yönüne ilişkin herhangi bir aykırı değeri hesaba katmaz. Varyans ise, tersine, ortalamanın her iki tarafındaki nispi aykırı değerler de dahil olmak üzere, veri seti içindeki tüm değişim veya fark değişkenlerini temsil eder. Bu iki istatistik faktörü olmadan, örnek setteki veri aralığında çeşitlilik olmazdı; bu, veri setindeki değerlerin, bir çan eğrisine benzer şekilde, yayılmak yerine ortalama etrafında kümeleneceği anlamına gelir.
İstatistiklerde, yıl boyunca her günün toplam net satışlarını listeleyen bir yıllık satış raporu gibi tüm veri setinin varyansını hesaplayabilirsiniz. Ayrıca tüm veri noktalarının yalnızca bir örneğini hesaplayabilirsiniz. Basit bir yıllık satış raporu örneğinde, bir örnek yaz satış toplamları olabilir. Bu durumda, istatistikçiler belirli bir tarih aralığında örnek setini ölçeceklerdir. Bu örneklerin her ikisinde de, iki formülden birini kullanarak varyansı hesaplayabilirsiniz:
Tüm veri setini ölçüyorsanız, tüm veri setleri için varyans formülü için aşağıdaki adımları kullanın:
Varyans = (Her terimin toplamı - ortalama)^2 / n
Tüm veri kümesinin yalnızca bir örneğini ölçüyorsanız, bunu n-1 terimiyle açıklayan formüle güveneceksiniz. Tüm popülasyon için varyans formülü gibi, bu formüle de aynı şekilde başlayacaksınız. Aşağıdaki adımları takip et:
Varyans = (Her terimin toplamı - ortalama)^2 / (n-1)
Varyans, genellikle popülasyon içindeki herhangi bir aykırı değeri hesaba katacağından, varyans, istatistikçilerin bir örneklemdeki veya tüm popülasyondaki çeşitliliğin genişliğini anlamalarına olanak tanır. Varyans formülü, satış rakamlarını ölçmek ve değerlendirmek, pazar araştırmasına dayalı ürünler geliştirmek ve işletmelere ve kuruluşlara fayda sağlayabilecek diğer birçok uygulanabilir kullanım dahil olmak üzere birçok iş durumunda yararlıdır.
İş amaçlı kullanımlara ek olarak, istatistikçiler bir veri aralığındaki farklı sayıları karşılaştırmak için varyansa güvenirler. Tüm bir veri seti içinde varyans, aykırı değerlerin, yani ortalamadan uzakta bulunan veri noktalarının izlenmesi için son derece önemlidir. Varyans sıfıra yaklaştıkça veri seti daha fazla kümelenir. Varyans daha yüksek bir değerle sonuçlandığında ve özellikle bir oran olarak ifade edildiğinde, veri noktaları o kadar fazla yayılır (ve dolayısıyla çeşitlidir).