Cihan Atıl Namlı MBA Cihan Atıl Namlı İktisadi ve İdari Konular Eğitim Sayfası Cihan Atıl Namlı MBA

Cihan Atıl Namlı Kişisel Web Sitesi > İktisadi ve İdari Konular Eğitim Sayfası > Bölüm 3: İstatistik
Bölüm 1: Stratejik Yönetim Bölüm 2: İnsan Yönetimi Bölüm 3: İstatistik Bölüm 4: Operasyonlar, Proje ve Süreç Yönetimi Bölüm 5: Pazarlama Bölüm 6: İktisat Bölüm 7: Finans

MBA Konuları - Bölüm 3: İstatistik

MBA Subjects - Chapter 3: Statistics

Cihan Atıl Namlı, 2010-2014

3.1 Kutu Grafikler (Box Plots; Boxplots)

1977'de John Tukey, beş sayılı bir veri özetini görüntülemek için verimlibir yöntem yayınlamıştır. Bu grafik kutu grafik (veya kutu-bıyık grafiği) olarak bilinir ve şu istatistiki ölçümleri özetler:

Aşağıda bir kutu grafik örneği yer almaktadır:

Kutu Grafik (Boxplot)

Kutu Grafik (Boxplot)

Grafik, hem yukarıdaki diyagramda olduğu gibi dikey olarak, hem de yatay olarak çizilebilir.

Kutu Grafiğin Yorumlanması (Interpreting a Boxplot)

Bir kutu grafik aşağıdaki gibi yorumlanır:

Kutu Grafik Geliştirmeleri (Boxplot Enhancements)

Temel bilgilerin ötesinde kutu grafikler, bazen ilave bilgiler taşıyabilecek şekilde genişletilirler:

Kutu Grafiklerin Üstünlükleri (Advantages of Boxplots)

Kutu grafiklerin şu kuvvetli yönleri mevcuttur:

Kutu grafiklerin bir kusuru, bir veri grubundaki en az kesinlikteki noktalar olan dağılım kuyruklarını vurgulama eğilimi göstermeleridir. Ayrıca dağılım hakkındaki pek çok ayrıntıyı saklarlar. Kutu grafik ile birlikte bir histogram göstermek bu hususta yardımcı olur ve her ikisi de keşfe yönelik veri analizinin önemli araçlarıdır.



3.2 Histogramlar (The Histogram)

Histogram, çeşitli aralıklara düşen veri noktalarının sayılarını gösteren özet bir grafiktir. Sonuç, verinin frekans dağılımın hakkında kaba bir yaklaşımdır.

Veri gruplarına sınıflar adı verilir ve konu histogram olduğunda bu gruplar kutular (bins) olarak bilinir, çünkü bunlar verileri biriktiren ve veri sınıfının frekansına eşit oranda dolan kaplar olarak düşünülebilir.

Bir öğrenci grubunun sınav puanlarını düşünün. Her biri 10 puan genişliğinde olan veri sınıfları belirleyerek ve her bir veri sınıfındaki puan sayısını sayarak aşağıdaki örnekte olduğu gibi bir frekans tablosu oluşturulabilir:

Frekans Tablosu (Frequency Table)

Grup Adet
0 - 9 1
10 - 19 2
20 - 29 3
30 - 39 4
40 - 49 5
50 - 59 4
60 - 69 3
70 - 79 2
80 - 89 2
90 - 99 1

Histogramı oluşturmak için, gruplar x ekseni üzerinde ve frekansları da y ekseni üzerinde çizilir. Aşağıda, üstteki veri tablosuna ilişkin histogram görülmektedir:

Histogram

Histogram

Histogramların Taşıdıkları Bilgiler (Informations Conveyed by Histograms)

Histogramlar, aşağıdaki bilgileri taşıyan faydalı veri özetleridir:

Frekans dağılımının histogramı, her bir grubun değerini toplam veri noktası sayısına bölerek, göreceli frekansı verecek biçimde olasılık dağılımına dönüştürülebilir.

Dağılımın şekli, verinin olasılık dağılımı gibi önemli bilgiler taşır. Dağılımın bilindiği durumlarda, dağılıma uymayan bir histogram bir süreç ve ölçüm sorunu hakkında ipucu verir. Örneğin bir uca yakın bir yerde normalden yüksek bir frekans belirten hemen ardından keskin bir düşüş gösteren bir histogram, gözlemcinin aşırılığı düşük bir grupta aşırı değer gösteren verileri sınıflandırarak yardım ettiğini belirtir.

Kutu (Bin) Genişliği (Bin Width)

Histogramın şekli bazen özellikle kutu sayısı konusunda hassastır. Eğer kutular çok geniş olurlarsa önemli bilgiler gözden kaçabilir. Örneğin veri bimodal olabilir ancak bu karakteristik özellik, kutular çok geniş olduğunda ortaya çıkmayabilir. Öte yandan kutular çok dar olduklarında, her bir kutuda az sayıda veri bulunduğundan asıl gözükmesi gereken anlamlı bilgi, rastgele değişimlerden ötürü gözden kaçabilir. Kullanılacak kutunun uygun bir boyutunu belirlemek için, farklı kutu genişlikleri kullanılmalı ve kutu genişliğine göre histogram şeklinin hassasiyetini belirlemek için sonuçlar karşılaştırılmalıdır. Kutu genişlikleri tipik olarak 5 ila 20 veri grubu olacak biçimde seçilir ancak uygun sayı duruma bağlıdır.

Histogramlar ve Kutu Grafikler (Historgrams and Boxplots)

Histogram veri dağılım şeklinin grafik özetini sağlar. Çoğunlukla, verinin ortalaması, çeyreklikleri ve aralığı bilgilerini taşıyan kutu grafik gibi diğer istatistiki özetler ile birlikte kullanılır.



3.3 Dal ve Yaprak Grafikler (Stem-and-Leaf Plots; Stemplots)

Veri grubundaki sayıların kendileri ile bir diyagram oluşturmak için dal ve yaprak grafiği, John Tukey tarafından geliştirilmiş histogram tarzı bir veri cetvelidir.

Aşağıdaki artan sırada dizilmiş veri grubunu düşünün:

3, 6, 12, 17, 19, 22, 28, 35, 37, 38, 41, 44, 47, 49, 51, 56, 63, 64, 66, 68, 71, 76, 78, 81, 88, 94

Bir dal ve yaprak grafiği, ilk sütunda bu sayıların ilk rakamını yazarak, geri kalan rakamları ise karşılık gelen sütunun sağ tarafında sıralayarak oluşturulur. Aşağıdaki grafik, yukarıda verilen veri grubuna ait dal ve yaprak grafiğidir:

Dal ve Yaprak Grafik (Stem and Leaf Plot)

Dal   Yaprak
0 | 3 6
1 | 2 7 9
2 | 2 8
3 | 5 7 8
4 | 1 4 7 9
5 | 1 6
6 | 3 4 6 8
7 | 1 6 8
8 | 1 8
9 | 4

Sonuç, verilerin rakamlarından oluşan ve yana döndürülmüş bir histogramdır. Solda bir dal ve sağ tarafta bir yaprağın ana hattı ile diyagram bir yaprağın sağ yarısına benzediği için "dal ve yaprak" terimi kullanılmıştır. Alternatif olarak kimileri, sıraları dallar ve rakamlarını da yapraklar olarak düşünür.

Eğer daha fazla sayıda kutu istenirse, büyük sayılar için dal 2 rakamdan oluşabilir, veya her bir ilk rakam için iki farklı dal olabilir: ilki 0'dan 4'e kadar olan ikinci rakamlar için, ikincisi ise 5'ten 9'a kadar olan ikinci rakamlar için.

Dal ve Yaprak Grafiğin Üstünlükleri (Stem and Leaf Plot Advantages)

dal ve yaprak grafiği, aşağıdaki ilave özellikler ile birlikte temelde histogram ile aynı bilgiyi taşır:

Dal ve yaprak grafiği histogram ile benzer bilgiyi sunar ve bir bilgisayar olmaksızın kolayca oluşturulabilir.



3.4 Saçılım Grafikleri (Scatter Plots; Scatterplots)

Saçılım grafikleri, iki boyutlu bir grafik üzerinde veri noktaları görüntüleyerek iki değişken arasındaki ilişkiyi gösterir. Açıklayıcı olarak düşünülen değişken x ekseni üzerine ve bağımlı değişken de y ekseni üzerine çizilir.

Saçılım grafikleri, özellikle çok sayıda veri noktası olduğunda faydalıdır. İki değişken arasındaki ilişki hakkında aşağıdaki bilgileri sağlarlar:

Değişkenler arasındaki bağıntı (korelasyon), bir çizgi boyunca kümeleşen veri noktaları sonucunu verir. Aşağıdaki örnek, artı yönde doğrusal ilişkiyi ima eden bir saçılım grafiğidir.

Örnek Bir Saçılım Grafiği (Example Scatterplot)

Saçılım Grafiği (Scatterplot)

Saçılım Grafiklerinin Yumuşatılması (Scatterplot Smoothing)

Saçılım grafikleri, veriye bir eğri uydurarak "yumuşatılabilir". Bu eğri, değişkenler arasındaki ilişkinin rastgele-olmayan öğesini gösterir.

Yumuşatma şu unsurlar kullanılarak yapılabilir:

En iyi eğri uydurma, çoğunlukla kareleri alınmış hataların en düşük toplamı verdiği uydurma olarak tanımlanır (en düşük kareler kriteri).

Rastgele değişimlerden rastgele olmayan bir öğenin çıkarılması, açıklayıcı değişkenin değerine bağlı olarak bağımlı değişkenin değerinin kestirilmesine olanak tanır.

Sebep Sonuç İlişkisi (Cause and Effect)

Bir saçılım grafiği ile iki değişken arasındaki ilişki gösterildiği zaman, mutlaka bir sebep-sonuç ilişkisi bulunması gerekmez. Her iki değişken de, bunların değişimini açıklayan başka bir üçüncü değişkene veya tamamen başka bir sebebe bağlı olabilir. Alternatif olarak, göze çarpan bir ilişki basit bir tesadüfün eseri de olabilir.

Saçılım Grafiklerinin Kullanılması (Use of the Scatterplot)

Saçılım grafiği, iki değişken arasındaki ilişkinin grafik gösterimini sağlar. Analizin ilk aşamalarında, bir bağıntı katsayısı hesaplamadan veya bir regresyon eğrisi uydurmadan önce, veriyi keşfederken faydalı olur. Örneğin bir saçılım grafiği, doğrusal bir regresyon modelinin uygun olup olmadığını belirlemede yardımcı olur.



3.5 Normal Dağılım (Çan Eğrisi; Gauss Dağılımı - Normal/Gauss Distribution - Bell Curve)

Pek çok doğal süreçte rastgele değişim, normal dağılım olarak bilinen belirli bir olasılık dağılımına uygundur ki bu en çok gözlemlenen olasılık dağılımıdır. Matematikçiler De Loivre ve Laplace bu dağılımı 1700'lerde kullanmışlardır. 1800'lerin başında Alman matematikçi ve fizikçi Karl Gauss, bunu astronomik verilerin analiz edilmesinde kullanmış, ve dolayısıyla bilim camiası genelinde Gauss Dağılımı olarak bilinir hale gelmiştir.

Normal dağılımın şekli çana benzer, dolayısıyla zaman zaman çan eğrisi olarak da anılır. Aşağıda bunun bir örneği yer almaktadır:

Normal Dağılım (Normal Distribution)

Normal Dağılım (Çan Eğrisi - Normal Distribution)

Yukarıdaki eğri, ortalama değeri sıfır (0) olan bir veri grubu içindir. Genel olarak, normal dağılım eğrisi şu olasılık yoğunluk fonksiyonu ile tanımlanır:

Gauss PDF (Olasılık Dağılım Fonksiyonu - Probability Density Function)

Çan Eğrisinin Özellikleri (Bell Curve Characteristics)

Çan eğrisi şu özelliklere sahiptir:

Parametreler (Completely Described by Two Parameters)

Bir normal dağılım, sadece şu iki parametre ile tamamen belirtilebilir:

Eğer ortalama değer ve standart sapma biliniyorsa, esasen veri grubundaki tüm noktalar biliniyormuşçasına çok bilgi sahibi olunur.

Deneysel Kural (The Empirical Rule)

Deneysel kural, ortalama değeri ve standart sapması verilen normal dağılımlı bir veri grubundaki verilerin dağılımına dair hızlı ve pratik bir kestirimdir.

Deneysel kural, bir normal dağılım hakkında şunları söyler:

Bu değerlerin yaklaşık oldukları unutulmamalıdır. Örneğin, normal dağılımlı olasılık yoğunluk fonksiyonuna göre, verilerin %95'i ortalamadan 1.96 standart sapma aralığına düşer; yukarıdaki 2 değeri uygun bir yaklaşımdır.

Normal Dağılım ve Merkezi Limit Kuramı (Normal Distribution and the Central Limit Theorem)

Normal dağılım, yaygın biçimde gözlemlenen bir dağılımdır. Dahası, verilerin çok değişik biçimde dağıldığı durumlarda dahi sıklıkla kullanılabilir. Bu genişletilmiş uygulanabilirlik merkezi limit kuramı sayesinde mümkündür. Merkezi limit kuramına göre, nüfusun dağılımından bağımsız olarak, rastgele örneklere ait ortalamaların dağılımı, büyük miktardaki örneklerin normal dağılımına yakınsar.

İşletme Yönetimine Yönelik Uygulamalar (Applications to Business Administration)

Normal dağılımın, işletme yönetiminin pek çok alanında uygulamaları vardır. Örneğin:

Normal dağılım, özellikle simetrik ve unimodal dağılımlı rastgele değişkenleri tanımlarken sıklıkla kullanılır. Ne var ki pek çok halde, normal dağılım gerçek dağılımın yalnızca kaba bir yaklaşımıdır. Örneğin, bir öğenin fiziksel uzunluğu eksi (-) işaretli olamaz, ancak normal dağılım her iki yönde de sonsuza dek uzar. Bununla birlikte, sonuçta meydana gelen hatalar, sorunların normal dağılım varsayımıyla yeterli doğrulukta çözülmesine imkan verecek ölçüde ihmal edilebilir veya kabul edilebilir sınırlar dahilindedir.



3.6 Kovaryans (Covariance; Ortak Değişinti)

İki rastgele değişkenin birlikte değişim gösterdiği kapsam, onların kovaryansı ile ölçülür. x ve y biçiminde iki rastgele değişken düşünün:

x1, y1
x2, y2
.   .
.   .
xn, yn

E{x} ve E{y} ortalamalarına sahip x ve y değişkenleri için kovaryans şu şekilde tanımlanır:

Cov(x, y) = E{ [ x - E{x} ] [ y - E{y} ] }

Kovaryans hesaplaması x ve y çiftleri ile başlar. Her iki değişkenin ortalama değerlerinden farkları bulunur ve birbiriyle çarpılır. Örnek bir x1 ve y1 için bu çarpım sıfırdan büyük çıkıyorsa, bu veri çifti için x ve y'nin her ikisi de ortalamalarına göre aynı yönde değişmiştir. Eğer çarpım sıfırdan küçükse farklı yönlerde değişmişlerdir. Çarpım ne kadar büyükse ilişki o kadar kuvvetlidir. Kovaryans, her bir (x,y) çifti için hesaplanan bu çarpımların ortalaması olarak tanımlanmaktadır. Eğer kovaryans sıfır (0) ise, çarpımın sıfırdan büyük çıktığı durumlar ile sıfırdan küçük çıktığı durumlar ortalamadan eşit miktarda mesafelidir ve bu iki rastgele değişken arasında doğrusal bir ilişki yoktur.

Hesaplama açısından, kovaryansı şu formül ile hesaplamak daha verimlidir:

Cov(x, y) = E{xy} - E{x}E{y}

Kovaryansın değeri aşağıdaki gibi yorumlanır:

Faydalı Özellikler (Useful Properties)

İki değişkenin toplamının değişintisi (varyansı) aşağıdaki gibi yazılabilir:

Var(x + y) = Var(x) + Var(y) + 2Cov(x, y)

Rastgele değişkenler a ve b sabit katsayıları ile çarpıldığında, kovaryans şu şekilde belirtilebilir:

Cov(ax, by) = abCov(x, y)

Kısıtlar (Limitations)

Kovaryansı gösteren sayının, incelenen verilerin birimlerine bağlı olmasından ötürü, farklı ölçekteki veri grupları genelinde kovaryansları karşılaştırmak güçtür. Bir veri grubu için kuvvetli bir ilişki gösteren bir değer, diğer bir veri grubu için zayıf bir ilişki gösterebilir.

Bağıntı (korelasyon) katsayısı bu soruna, kovaryansı değişkenlerin standart sapmalarının çarpımına normalize etmek suretiyle, farklı veri gruplarının karşılaştırılmasını kolaylaştıran boyutsuz bir miktar oluşturarak çözüm bulur.

İletişim

Bu form aracılığıyla bana göndereceğiniz mesajlar doğrudan e-posta kutuma ulaşmaktadır. E-posta kutumu sürekli olarak kontrol etmekteyim ve size mümkün olan en hızlı biçimde dönüş yaparım.

Adınız ve Soyadınız:
Telefon Numaranız:
E-posta Adresiniz:
Mesajınız:


Bölüm 1: Stratejik Yönetim Bölüm 2: İnsan Yönetimi Bölüm 3: İstatistik Bölüm 4: Operasyonlar ve Proje Yönetimi Bölüm 5: Pazarlama Bölüm 6: İktisat Bölüm 7: Finans