Microsoft Excel’de Sistematik Örnekleme Üzerine Bir Vaka Çalışması: A Case Study on Systematic Sampling in Microsoft Excel

Giriş

Daha önce basit tesadüfi örnekleme (simple random sampling) üzerine burada çalışmalar yapılmıştı. İlgilenecekler için aşağıda yararlanılan kaynaklar kısmında bu çalışmaların linklerine yer verilmiştir. Bu çalışmada ise örnek bir uygulama üzerinden ve olabildiğince yalın bir dille sistematik örnekleme yapılacaktır. Sistematik örnekleme, 1’den N’e kadar olan popülasyon birimlerinden ilk seçimin tesadüfi bir şekilde seçilmesinden sonra örneklem genişliği (k=N/n)’ne denk gelen popülasyon birimlerinin seçilmesidir. Basit tesadüfi örneklemeye göre daha kolay olan ve ona alternatif olarak kullanılan bu yöntem olasılıklı örneklem yöntemlerinden biridir. Olasılıklı örnekleme yöntemleri popülasyona ait çıkarımlar (inferences) açısından son derece önemlidir. Diğer bir deyişle, eğer örneklem çekilen popülasyon hakkında çıkarımlarda bulunmak isteniyorsa mutlaka olasılıklı örneklem yöntemlerinden biri veya bir kaçı kullanılmak zorundadır. Aslında bu yönteme sistematik tesadüfi örnekleme (systematic random sampling) de diyebiliriz. Bunun nedeni örneklem seçimi yapılan popülasyondan ilk (1.) seçimin tesadüfi bir şekilde belirlenmesidir. Genel olarak sistematik örneklemede örneklem birimlerinin seçiminin nasıl olduğuna ilişkin hazırlamış olduğum diyagram Şekil 1’de yer verilmiştir.

Şekil 1: Sistematik Örneklem Seçimi

Şekil 1’de örnekleme seçilen ilk örneklem birimine (sampling unit), ingilizce ifadeyle random start (RS) diyoruz. Sistematik örnekleme adımları ise Şekil 2’de şöyle özetlenebilir:

Şekil 2: Sistematik Örnekleme Adımları

Şekil 2’ye göre sistematik örnekleme adımlarını sırasıyla ele alalım:

  1. N popülasyon büyüklüğünü, n ise örneklem büyüklüğünü göstersin. Bu iki büyüklüğü kullanarak ilk olarak aralık genişliğini hesaplayalım. Aralık genişliğini k olarak gösterelim. k=N/n olmak üzere popülasyon büyüklüğünün örneklem büyüklüğüne oranını ifade etmektedir. Eşitliğinin çarpmaya göre tersi ise bize örneklem katsayısı dediğimiz sampling fraction (f=n/N)’i verir.
  2. 1 ile k arasında tesadüfi bir tamsayı belirlenir. Belirlenen bu sayı (RS)’ya denk gelen popülasyon birimi ilk örneklem birimini oluşturur.
  3. İlk örneklem biriminden sonra belirlenen örneklem büyüklüğüne ulaşıncaya kadar aşağıdaki işlemler yapılarak örneklem seçimi tamamlanır.
    1. İkinci örneklem birimi RS + k
    2. Üçüncü örneklem birimi için RS +2k
    3. Dörtüncü örneklem birimi için RS +3k
    4. Son örneklem birimi için ise RS + (n-1) x k

Popülasyon büyüklüğü (N) 81 olan Türkiye illeri içerisinden sistematik örnekleme yöntemiyle iki farklı büyüklükte sistematik örneklem yöntemi kullanılarak örneklem seçimi yapılacaktır. Örnek uygulamalar daha açık ve anlaşılır olması adına Microsoft Excel üzerinden yapalım. Bu amaçla ilk olarak popülasyon büyüklüğü belli olan 81 ilimizi, diğer bir deyişle popülasyon birimlerimizi alfabetik sıraya göre Tablo 1’de verelim.

Tablo 1: Popülasyon Listesi (N=81)

Sıraİl
1Adana
2Adıyaman
3Afyonkarahisar
4Ağrı
5Aksaray
6Amasya
7Ankara
8Antalya
9Ardahan
10Artvin
11Aydın
12Balıkesir
13Bartın
14Batman
15Bayburt
16Bilecik
17Bingöl
18Bitlis
19Bolu
20Burdur
21Bursa
22Çanakkale
23Çankırı
24Çorum
25Denizli
26Diyarbakır
27Düzce
28Edirne
29Elazığ
30Erzincan
31Erzurum
32Eskişehir
33Gaziantep
34Giresun
35Gümüşhane
36Hakkâri
37Hatay
38Iğdır
39Isparta
40İstanbul
41İzmir
42Kahramanmaraş
43Karabük
44Karaman
45Kars
46Kastamonu
47Kayseri
48Kilis
49Kırıkkale
50Kırklareli
51Kırşehir
52Kocaeli
53Konya
54Kütahya
55Malatya
56Manisa
57Mardin
58Mersin
59Muğla
60Muş
61Nevşehir
62Niğde
63Ordu
64Osmaniye
65Rize
66Sakarya
67Samsun
68Şanlıurfa
69Siirt
70Sinop
71Sivas
72Şırnak
73Tekirdağ
74Tokat
75Trabzon
76Tunceli
77Uşak
78Van
79Yalova
80Yozgat
81Zonguldak

Şimdi örneklem genişliği yada aralık genişliği olan k katsayımızı bulalım. k katsayımıza ilişkin iki durum önümüze çıkmaktadır. Birincisi k’nın tamsayı değeri alması, diğeri ise kesirli bir değer almasıdır. Birinci durum ikinci duruma göre kolaylıkla çözümlenmektedir.

Uygulama

a) k’nın tamsayı değeri alması durumunda sistematik örneklem seçimi

Konuyu kavramak adına ilk örnek uygulamamızı yapabiliriz. Popülasyon büyüklüğü (N) 81 olan Türkiye illeri içerisinden örneklem büyüklüğü (n) 27 olan ilimizi sistematik örnekleme yöntemiyle sırasıyla seçelim. Örnek uygulamamızı Microsoft Excel üzerinden yapalım.

  • 1. k=N/n, yani 81/27=3 olarak bulunur. k’yı belirledik. Sıra 1 ile k arasında tesadüfi bir tamsayı değeri hesaplamaya gelmiştir. Excelde bu işlemi =RASTGELEARADA(1; 3) fonksiyonu ile yapıyoruz. RASTGELEARADA() fonksiyonu dinamik bir fonksiyon olduğu için excel üzerinde EĞER() fonksiyonu ile sabitlenmiştir. Bu fonksiyon içerisindeki ilk sayı alt limiti, ikinci sayı ise üst limiti, diğer bir deyişle k’yı ifade eder. Bu fonksiyon belirlenen alt ve üst limit (bu limitler de dahil) arasında tamsayı değeri ürerir. Yukarıdaki fonksiyon çalıştırıldığında ilk örneklem birimimiz (RS) 2 olarak bulunur. Bu 2 sıra numarasına Tablo 1 satırında karşılık gelen il (Adıyaman) bizim ilk örneklem birimimizi oluşturur. Sıra numarasına göre eşleştirme işlemi excel üzerinde DÜŞEYARA() fonksiyonu ile yapılmıştır. =DÜŞEYARA(F2;A:B;2;YANLIŞ) fonksiyonu ile aşağıdaki tabloda F2 hücresindeki sıra numarasına A ve B sütunlarında karşılık gelen ili tam eşleştirme ile getir diyoruz.
  • 2. İkinci örneklem birimimiz ise RS+k, yani 2+3 eşitliğinden 5. sıradaki Adıyaman ilimizdir.
  • 3. Üçüncü örneklem birimimiz ise RS+2k, yani 2+2×3 eşitliğinden 8. sıradaki Aydın ilimizdir.
  • 4. Son örneklem birimimiz ise RS+(n-1)k, yani 2+26×3 eşitliğinden 80 sıradaki Yozgat ilimiz olarak belirlenir ve örneklem seçim işlemi tamamlanır.

Yapılan yukarıdaki örneğe ilişkin excel dokümanını aşağıdaki linkten indirebilirsiniz.

b) k’nın kesirli bir değer alması durumunda sistematik örneklem seçimi

İkinci örneğimizde popülasyon büyüklüğü (N) 81 olan Türkiye illeri içerisinden örneklem büyüklüğü (n) 45 olan ilimizi sistematik örnekleme yöntemiyle sırasıyla seçelim. Örnek uygulamamızı Microsoft Excel üzerinden yapalım.

  • 1. k=N/n, yani 81/45=1,8 olarak bulunur. k’yı belirledik. Ancak k katsayısı kesirli burada. Amacımız bizim k katsayısının tamsayı olmasıdır. Bu amaçla k katsayısını 10 (k x 10) ile çarparak 18 k katsayısını elde ediyoruz. Sıra 1 ile 18 (k) arasında tesadüfi bir tamsayı değeri buluyoruz. Excelde bu işlemi =RASTGELEARADA(1; 18) fonksiyonu ile yapıyoruz. Bu fonksiyon içerisindeki ilk sayı alt limiti, ikinci sayı ise üst limiti, diğer bir deyişle k’yı ifade eder. Bu fonksiyon belirlenen alt ve üst limit (bu limitler de dahil) arasında tamsayı değeri ürerir. Yukarıdaki fonksiyon çalıştırıldığında ilk örneklem birimimiz (RS) 10 olarak bulunur. RASTGELEARADA() fonksiyonu dinamik bir fonksiyon olduğu için excel üzerinde EĞER() fonksiyonu ile sabitlenmiştir. =EĞER(RASTGELEARADA(1;18)<>10;10;10) fonksiyonu yazarak 1 ile 18 arasında tesadüfi bir şekilde seçilen hangi tamsayı olursa olsun 10 sayısını bize getir diyerek RS’yi sabitliyoruz. RASTGELEARADA() fonksiyonunun dışındaki EĞER() fonksiyonu kaldırılırsa 10’nun dışında sayıların da geleceği görülecektir. Ancak henüz üretilen bu sayıya göre bir seçim yapamayız. Çünkü başlangıçta örneklem aralığı (k)’nı 10 ile çarptığımız için sağdan bir basamak çıkartılır. Yani bu durumda 10 yerine 1’i alarak ilk örneklem birimimizi oluştururuz. Bu 1 sıra numarasına Tablo 1 satırında karşılık gelen il (Adıyaman) bizim ilk örneklem birimimizi oluşturur. Sıra numarasına göre eşleştirme işlemi excel üzerinde DÜŞEYARA() fonksiyonu ile yapılmıştır. =DÜŞEYARA(G2;A:B;2;YANLIŞ) fonksiyonu ile aşağıdaki tabloda G2 hücresindeki sıra numarasına A ve B sütunlarında karşılık gelen ili tam eşleştirme ile getir diyoruz. Sağdan bir basamak çıkartma işlemi bütün örneklem birimleri seçilene kadar devam edecektir. “Revize edilmiş popülasyon sırası” sütunu (G sütunu)’nda sağdan bir basamak çıkarma işlemi kolaylık sağlaması açısından yazdığım şu fonksiyonla kolaylıkla yapılabilmektedir:
=SAYIYAÇEVİR(EĞER(VE(F2>9;F2<100);SOLDAN(F2;1);EĞER(VE(F2>99;F2<1000);SOLDAN(F2;2)))). 

Literatürde bu yapılan işlemin dışında hesaplanan örneklem genişliği (k)’nin kesirli olması durumunda, bu örnekte olduğu gibi, k katsayısını tam sayıya dönüştürmek için aşağı veya yukarı yuvarlandığı görülmektedir. Bu yöntem zaman zaman belirlenmiş olan örneklem büyüklüğünde örneklem birimlerin eksik veya fazla seçilmesine sebebiyet verebilmektedir. Bu hususu dikkate almakta fayda vardır. Bu nedenle k katsayının 10 ile çarpılması, ardından 1 ile k arasında tesadüfi bir şekilde belirlenen RS (ilk örneklem birimi) ve RS’ye k’nın ilave edilerek elde edilen 2. ve sonraki örneklem birimlerini temsil eden sıra sayılarının son basamağı çıkartılarak kalan sıra sayıları üzerinden gidilmesinin daha sağlıklı ve güvenilir bir yol olduğu düşünülmektedir.

  • 2. İkinci örneklem birimimiz ise RS+k, yani 10+18 eşitliğinden 28 bulunur. Ancak sağdan bir basamak çıkarılıp elde edilen 2. sıradaki Adıyaman ilimiz ikinci örneklem birimimiz olarak belirlenir.
  • 3. Üçüncü örneklem birimimiz ise RS+2k, yani 10+2×18 eşitliğinden 46 bulunur. Ancak sağdan bir basamak çıkarılıp elde edilen 4. sıradaki Ağrı ilimiz üçüncü örneklem birimimiz olarak belirlenir.
  • 4. Son örneklem birimimiz ise RS+(n-1)k, yani 10+ 44×18 eşitliğinden 802 bulunur. Ancak sağdan bir basamak çıkarılıp elde edilen 80. sıradaki Yozgat ilimiz son örneklem birimimiz olarak belirlenir ve örneklem seçim işlemi tamamlanır.

Yapılan yukarıdaki örneğe ilişkin excel dokümanını aşağıdaki linkten indirebilirsiniz.

Yapılan bu çalışma ile özellikle veri bilimi (data science) ile ilgilenen akademi ve saha çalışanlarına bir katkı sunulması amaçlanmıştır.

Faydalı olması ve farkındalık oluşturması dileğiyle.

Bilimle ve teknolojiyle kalınız.

Saygılarımla…

Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.

Note: It can not be cited or copied without referencing.

Yararlanılan Kaynaklar

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Google fotoğrafı

Google hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Connecting to %s