0

BİZİ TAKİP EDİN

Varyans Nedir?Varyans Nasıl Hesaplanır?

Varyans formülü, istatistikçilere bir veri kümesinin çeşitli yönleri hakkında bilgi verir. Tipik olarak, bir veri kümesinin tamamı için varyansı hesaplamak için veri kümesinin yalnızca bir örneği için varyansı hesaplamak için biraz farklı iki formül kullanırsınız. Ek olarak, varyans standart sapmaya bağlıdır ve her iki istatistiksel kavram da çeşitli ortamlarda faydalıdır.

Bu makalede, varyans formülünün ne olduğunu, neden önemli olduğunu, standart sapmadan nasıl farklı olduğunu ve her bir formülün bir popülasyonun ve küçük bir örneğin varyansını hesaplamak için nasıl kullanılacağını keşfedeceğiz.

Varyans nedir?

Varyans, ortalamadan standart sapma olarak da bilinen farkların karesinin ortalamasıdır. Basitçe söylemek gerekirse, varyans, bir örnek veya veri kümesi içindeki veri noktalarının ne kadar yayılmış olduğunun istatistiksel bir ölçüsüdür. Ortalama ve standart sapmaya ek olarak, bir örneklem setinin varyansı, istatistikçilerin araştırma amacıyla topladıkları verileri anlamlandırmalarına, düzenlemelerine ve değerlendirmelerine olanak tanır.

Esasen, varyansın ölçtüğünüz veri grubuna bağlı olarak kullanabileceğiniz iki formülü vardır. Örneğin, tüm bir üniversite sınıfının notları gibi bir popülasyon kümesinin tamamının verilerini ölçüyorsanız, bu formülü kullanarak varyansı hesaplarsınız:

Varyans = (Her terimin toplamı - ortalama)^2 / n

İşte formülün unsurları:

  • Tüm popülasyonunuzun varyansı, standart sapmanın karesi olacaktır.
  • Her terim, veri kümenizdeki değerlerin veya sayıların her birini temsil eder.
  • Veri kümenizin ortalamasını bilmeniz gerekecek.
  • ^2 ifadesi , kare alma işlevini veya başka bir deyişle bir sayının kendisiyle çarpılmasını temsil eder.
  • n değişkeni , popülasyonunuzda sahip olduğunuz değerlerin sayısını temsil eder.

Yalnızca bir popülasyon örneğinin varyansını hesaplarken şu formülü kullanacaksınız:

Varyans = (Her terimin toplamı - ortalama)^2 / n-1

İşte formülün unsurları:

  • Varyans, örnek kümeniz için bulmak istediğiniz şeydir.
  • Her terim, ortalamayı çıkarmak için kullandığınız şeydir ve varyansı hesaplamadan önce de bilmeniz gerekir.
  • n değişkeni , sahip olduğunuz toplam örnek sayısını temsil eder.

Tüm popülasyonun kendisi yerine tüm popülasyonun bir örneği için varyansı hesapladığınız için n-1 kullanırsınız.

Varyans ve standart sapma

Basitçe söylemek gerekirse, standart sapma, bir popülasyon veya örneğin ortalamasından bir dizi veri noktasının ne kadar dağıldığının kesin değerlerine bakar. Ancak varyans, her bir veri noktasının ortalamadan farklı olduğu ortalama dereceyi ölçer. Bu, varyansın veri kümenizdeki tüm değerlerin ortalamasına baktığı, standart sapmanın ise verilerin yayılmasının tam değerine baktığı anlamına gelir.

Bu iki kavram arasında küçük bir fark olsa da varyans ve standart sapma birbirine bağlıdır. Bir örnek kümesinde veya tüm popülasyonda standart sapmayı bulduğunuzda, varyansı elde etmek için bu sonucun karesini alabilirsiniz. Bu, varyans ve standart sapma arasındaki en basit ilişki olsa da, incelediğiniz verilerin farklı yönlerine ilişkin içgörü sağlamak için bu iki hesaplamanın nasıl çalıştığını anlamanın gerekliliğini temsil eder.

Ek olarak, standart sapma, bir dizi verinin göreli aralığını temsil eder ve standart ortalamanın her iki yönüne ilişkin herhangi bir aykırı değeri hesaba katmaz. Varyans ise, tersine, ortalamanın her iki tarafındaki nispi aykırı değerler de dahil olmak üzere, veri seti içindeki tüm değişim veya fark değişkenlerini temsil eder. Bu iki istatistik faktörü olmadan, örnek setteki veri aralığında çeşitlilik olmazdı; bu, veri setindeki değerlerin, bir çan eğrisine benzer şekilde, yayılmak yerine ortalama etrafında kümeleneceği anlamına gelir.

Bir veri kümesinin varyansı nasıl hesaplanır

İstatistiklerde, yıl boyunca her günün toplam net satışlarını listeleyen bir yıllık satış raporu gibi tüm veri setinin varyansını hesaplayabilirsiniz. Ayrıca tüm veri noktalarının yalnızca bir örneğini hesaplayabilirsiniz. Basit bir yıllık satış raporu örneğinde, bir örnek yaz satış toplamları olabilir. Bu durumda, istatistikçiler belirli bir tarih aralığında örnek setini ölçeceklerdir. Bu örneklerin her ikisinde de, iki formülden birini kullanarak varyansı hesaplayabilirsiniz:

Tüm bir veri setinin varyansını hesaplama

Tüm veri setini ölçüyorsanız, tüm veri setleri için varyans formülü için aşağıdaki adımları kullanın:

Varyans = (Her terimin toplamı - ortalama)^2 / n

  1. Veri kümenizdeki her bir değerden ortalamayı çıkarın. İlk adımınız, kümenizdeki her bir terimden popülasyonunuzun ortalamasını çıkarmaktır. Örneğin, üç veri noktasından oluşan bir popülasyonunuz olduğunu varsayalım. Bu üç terimin her birinden ortalama değeri çıkaracaksınız. Bir popülasyonun ortalama değerinin 35 olduğunu varsayan bir örnek: (108-35, 100-35, 78-35) burada her terim 35 çıkarır.
  2. Bu farklılıkların her birinin karesini alın. Tüm terimlerinizden ortalamayı çıkardıktan sonra, değeri kendisiyle çarparak bu sonuçların her birinin karesini alın. Yukarıdaki örneği kullanarak, şu şekilde görünür: (73), (65), (43) ve bu terimlerin her birinin karesi sırasıyla (5.329), (4.225) ve (1.849) ile sonuçlanır.
  3. Ortaya çıkan tüm kareleri toplayın. Toplamı elde etmek için bu yeni değerleri toplayın, şöyle: (5,329) + (4,225) + (1,849) = 11,403.
  4. Elde edilen toplamı veri kümenizdeki değer sayısına bölün. Şimdi, üçüncü adımdaki toplamı, ölçtüğünüz popülasyonda sahip olduğunuz toplam değer sayısına bölebilirsiniz. Önceki adımlardaki örnek değerleri kullanarak, örnek popülasyonda yalnızca üç terim olduğundan, bölmek için kullandığınız toplam 11.403 ve n için kullandığınız değer üçtür. Şuna benzer: (11,403) / (3) = 3.801. Yani tüm popülasyonun varyansı 3.801'dir.

Bir veri örneğindeki varyansı hesaplama

Tüm veri kümesinin yalnızca bir örneğini ölçüyorsanız, bunu n-1 terimiyle açıklayan formüle güveneceksiniz. Tüm popülasyon için varyans formülü gibi, bu formüle de aynı şekilde başlayacaksınız. Aşağıdaki adımları takip et:

Varyans = (Her terimin toplamı - ortalama)^2 / (n-1)

  1. Örnek setinizdeki her bir değerden ortalamayı çıkarın. Tam bir veri setinde yaptığınız gibi, örneğinizdeki her bir terimden ortalamanızı çıkarın. Ortalamanın 25 olduğunu ve örneğinizde üç değeriniz olduğunu varsayan bir örnek: (33-25), (16-25), (45-25). Farklılıklarınız sırasıyla (8), (-9) ve (20) ile sonuçlanacaktır.
  2. Bu farklılıkların her birinin karesini alın. Her farkı aldıktan sonra, devam edin ve bu değerlerin her birinin karesini alın. Önceki adımdaki örnek değerleri kullanarak, ortaya çıkan ürünler şunlardır: (64), (81) ve (400). Bu örnekle, (-9) değerinin size nasıl pozitif bir değer verdiğini görebilirsiniz. Bu, varyans için önemlidir ve esastır, çünkü varyans daha çok noktaların ortalamadan yayılmasının bir ortalaması gibidir.
  3. Ortaya çıkan tüm kareleri toplayın. Önceki varyans formülü gibi, ikinci adımdan elde ettiğiniz tüm ürünleri toplayın: (64) + (81) + (400) = 545.
  4. Örnek setinizdeki toplam değer sayısından bir çıkarın. Bölmeden önce, örnek setinizdeki değer sayısından bir çıkarın. Önceki örneği kullanarak, yalnızca üç teriminiz var. Üçünü formülün n-1 kısmına takın: n-1 = (3) - 1. Sonuç ikidir.
  5. Toplamı, elde edilen n-1 farkına bölün. Son olarak, dördüncü adımda ulaştığınız sonuç farkı bu olduğundan, üçüncü adımdaki toplamı ikiye bölün. Bölmek için önceki örnek değerleri kullanın: (545) / (2) = 272.5. Yani örnek örnek kümesinin varyansı 272,5'e eşittir.

Varyansın önemi nedir?

Varyans, genellikle popülasyon içindeki herhangi bir aykırı değeri hesaba katacağından, varyans, istatistikçilerin bir örneklemdeki veya tüm popülasyondaki çeşitliliğin genişliğini anlamalarına olanak tanır. Varyans formülü, satış rakamlarını ölçmek ve değerlendirmek, pazar araştırmasına dayalı ürünler geliştirmek ve işletmelere ve kuruluşlara fayda sağlayabilecek diğer birçok uygulanabilir kullanım dahil olmak üzere birçok iş durumunda yararlıdır.

İş amaçlı kullanımlara ek olarak, istatistikçiler bir veri aralığındaki farklı sayıları karşılaştırmak için varyansa güvenirler. Tüm bir veri seti içinde varyans, aykırı değerlerin, yani ortalamadan uzakta bulunan veri noktalarının izlenmesi için son derece önemlidir. Varyans sıfıra yaklaştıkça veri seti daha fazla kümelenir. Varyans daha yüksek bir değerle sonuçlandığında ve özellikle bir oran olarak ifade edildiğinde, veri noktaları o kadar fazla yayılır (ve dolayısıyla çeşitlidir).

Kategoriler

Popüler Bloglar