R ve Python’da Tekrarlı Basit Tesadüfi Örnekleme Üzerine Bir Vaka Çalışması: A Case Study on Simple Random Sampling (SRS) with Replacement in R and Python

Basit tesadüfi örnekleme, popülasyondaki birimlerinden örnekleme seçilme olasılığı bilinen ve seçilme olasılığı sıfır olmayan örnekleme türüdür. Bu örnekleme türü aynı zamanda olasılıklı örnekleme tekniklerinden biri olup, popülasyon hakkında çıkarımsal (inferential) istatistikler ortaya koymaya ve örneklemden elde edilen bulguların hedef popülasyona genellebilmesine olanak tanır.

Basit tesadüfi örnekleme, tekrarlı (popülasyondaki birimlerin eşit ve birden fazla seçilme olasılığı) ve varsayımsal bir örnek üzerinden uygulamalı olarak gösterilecektir. Tekrarlı seçilme olasılığı, topların olduğu torbadan seçilmiş bir topun tekrar torbanın içine atılarak tekrar seçilme olasılığının tanındığı bir olasılık tekniği olarak ele alınabilir. Benzer işlem burada örneklem seçiminde de yapılacaktır. Bu kapsamda Microsoft Excel kullanılacaktır. Aşağıdaki excel dokümanını ihtiyacınıza uygun uyarlayarak kolaylıkla uygulayabilirsiniz.

Örnek Olay (Example)

Popülasyon büyüklüğü (N) 850 firma arasından 120 firma (n: örneklem büyüklüğü) tekrarlı basit tesadüfi örnekleme yapılarak örnekleme seçilecektir. Daha sonra örnekleme seçilen bu firmalar üzerinde araştırma yapılacaktır. Bir kez seçilmiş firmalara 1. soru kağıdı, birden fazla seçilmiş firmalara cevaplarının tutarlılığını ölçümlemek için belirli zaman aralıklarıyla 1. soru kağıdı ile birlikte 2. ve 3. soru kağıtları firmaların cevaplaması için gönderilecektir.

Not 1: Örneklem seçimine geçmeden önce elde edilen firma listesinin mükerrer kayıtlardan arındırılması (firmaların benzersiz olması) ve her bir firmaya küçükten büyüğe doğru numara ataması yapılması gerekmektedir.

Not 2: Eğer tabakalı örnekleme yapılacaksa her bir tabaka için örneklem büyüklüğü belirlenmesi gerekir ve her bir tabaka için ayrı ayrı tekrarsız basit tesadüfi örnekleme yapılır. Eğer örneklemde tabaka yoksa 120 firma tekrarsız olarak seçilmesi yeterli olacaktır.

Örnek olayın çözümüne ilişkin ilk uygulama, R programlama dili kullanılarak yapılacaktır.

Çözüm 1: R Kod Bloğu (Solution 1)

#Aşağıda tamsayı bileşenli "sample" fonksiyonu kullanılmıştır. Bunun nedeni Firma sayısının tamsayı olmasıdır. Buna göre firma sayısı 850 olup, 1'den 850'ye kadar numaralandırılmıştır. Fonksiyon içindeki 120, örneklem büyüklüğü (sample size)'dür. Fonksiyon içerisindeki replace= TRUE ise örneklemin tekrarlı olacağı, diğer bir deyişle popülasyondaki firmalara birden fazla seçilme şansı verileceği anlamına gelir. İlaveden sort fonksiyonu ilave edilerek seçilen firmaların küçükten büyüğe doğru sıralanması sağlanmıştır. matrix fonksiyonu ise elde edilen firma numaralarının matris olarak 12 satır ve 10 sütun düzeninde verileceğini gösterir. İlk satırdaki set.seed (sabitleme) fonksiyonu ise her defasında örnekleme seçilen firmaların aynı kalacağı anlamına gelir. Bu fonksiyon duruma göre kullanılabilir de kullanılmayabilir de. Tamamen karar vericiye bağlıdır.

set.seed(123)
orneklem<- matrix(sort(sample.int(850, 120, replace=TRUE)), 12, 10)
orneklem

Çözüm 1‘e ait R kod bloğunun run edilmesiyle elde edilen sonuç aşağıda yer almaktadır.

        [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
 [1,]    1  109  188  279  353  411  518  603  689   767
 [2,]   21  112  197  283  355  416  521  604  691   778
 [3,]   36  118  199  292  370  435  535  613  693   796
 [4,]   39  121  208  300  374  449  545  641  730   800
 [5,]   39  122  210  314  376  463  556  642  751   806
 [6,]   52  126  227  319  382  467  558  645  754   811
 [7,]   80  126  234  323  386  469  559  665  757   812
 [8,]   81  130  245  327  389  477  566  670  757   812
 [9,]   88  149  246  344  397  487  568  671  759   814
[10,]   88  160  257  348  397  498  576  676  760   819
[11,]   95  176  271  350  405  506  588  677  761   838
[12,]  104  184  273  352  407  510  589  680  765   846

Örnek olayın Pyhton programlama dili kullanılarak çözümü aşağıdaki gibi olacaktır.

Çözüm 2: Python Kod Bloğu (Solution 2)

#Örneklemden tesadüfi ve tekrarsız olanı çağrılır.
from random import sample
#Aşağıdaki random.seed fonksiyonu ise her defasında örnekleme seçilen firmaların aynı kalacağı anlamına gelir. Bu fonksiyon duruma göre kullanılabilir de kullanılmayabilir de. Bu durum, tamamen karar vericiye bağlıdır.
import random
random.seed(123)
#Populasyon aralığı belirlenir (1'den 850'ye kadar olan firmalar) 
Populasyon = range(1,851)
#Popülasyondan örnekleme seçilen firmalar belirlenir.
print("Tekrarlı Basit Tesadüfi Örnekleme", random.choices(Populasyon, k=120))

Çözüm 2‘ye ait Python kod bloğunun run edilmesiyle elde edilen sonuç aşağıda yer almaktadır.

Tekrarlı Basit Tesadüfi Örnekleme [45, 75, 347, 92, 767, 33, 456, 283, 725, 136, 287, 284, 209, 2, 371, 75, 508, 60, 269, 382, 770, 79, 121, 672, 19, 775, 488, 226, 713, 654, 292, 682, 176, 518, 449, 688, 268, 339, 654, 436, 583, 543, 567, 757, 414, 569, 319, 28, 642, 155, 698, 777, 560, 145, 287, 333, 63, 389, 488, 286, 161, 75, 535, 11, 300, 195, 453, 616, 773, 543, 844, 820, 536, 199, 412, 151, 844, 378, 639, 38, 115, 165, 218, 300, 232, 370, 358, 93, 54, 302, 76, 369, 8, 456, 63, 591, 344, 838, 224, 402, 639, 285, 297, 544, 825, 752, 357, 611, 578, 317, 200, 67, 748, 49, 441, 457, 125, 558, 779, 660]

Sonuç olarak, yukarıda çözüm 1 veya çözüm 2’ye göre ortaya konulan çıktıdan (output) numaralara karşılık gelen firmalarla araştırmaya başlanır.

Faydalı olması dileğiyle.

Saygılarımla.

Not: Emeğe saygı adına, burda yapılan çalışmanın başka bir mecrada ya da ortamda paylaşılması halinde alındığı yer adının belirtilmesini rica ederim.

Note: In the name of respect for labor, I would kindly request that the name of the place where this work is taken if the work done on this web site is shared in another medium or environment.

Yararlanılan Kaynaklar

https://www.r-project.org/

https://www.python.org/

https://colab.research.google.com (Python)

https://rstudio.cloud/

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Google fotoğrafı

Google hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Connecting to %s