Tekrarlı Basit Tesadüfi Örnekleme ve Bootstrap Örnekleme Üzerine Vaka Çalışmaları: Case Studies on Simple Random Sampling with Replacement and Bootstrap Sampling

Bootstrap, istatistik dağılımlarını anlamaya yönelik 1979’da Stanford Üniversitesinden Amerikalı istatistikçi Bradley Efron tarafından geliştirilmiş parametrik ve non-parametrik versiyonları olan hem istatistiksel bir teknik hem de bir simülasyon yöntemidir. Bootstrap örnekleme duyarlılık analizleri, istatistiksel ve ekonometrik analizlerden makine öğrenme ve derin öğrenmeye kadar pek çok farklı alanda kendine uygulama alanı bulmaktadır. Kısacası bu yöntem bütün alanlarda…

Veri Madenciliği (Data Mining): Metin Verisinin Keşifsel Veri Analizi Üzerine Bir Vaka Çalışması (Text Mining)

Veriden desen çıkarma işlemi anlamına gelen veri madenciliği bütün alanlarda kendine uygulama alanı bulan ve büyük veri (big data)’den farklı olan bir kavramdır. Bu kavram aynı zamanda veriyi keşfetmek olarak da tanımlanabilir. Veri madenciliği, veriden desen veya örüntü çıkarırken yapay zekayı , istatistiksel metotları ve diğer pek çok metodu kullanır. Büyük veride ise genel olarak…

KOBİ’lerde Entegrasyonun ve Sinerjinin Önemi

Küçük ve Orta Ölçekli İşletmelerin (KOBİ) ülke ekonomisindeki payına dikkat çekmek ve KOBİ’lere ilişkin verilerin tek bir bülten altında derleyerek erişilmesini kolaylaştırmak amacıyla hazırlanan “Türkiye’nin KOBİ’leri Bülteni” Türkiye Odalar ve Borsalar Birliği (TOBB) tarafından 26 Aralık 2020 tarihinde yayımlanmıştır. Bu çalışma kapsamında Türkiye’nin KOBİ’leri Bülteni’ne geçmeden önce KOBİ ve KOBİ kategori tanımlarının verilmesi konu hakkında…

Küçük ve Orta Ölçekli İşletme (KOBİ) İstatistikleri

Küçük ve Orta Ölçekli İşletmelerin (KOBİ) ülke ekonomisindeki payına dikkat çekmek ve KOBİ’lere ilişkin verilerin tek bir bülten altında derleyerek erişilmesini kolaylaştırmak amacıyla hazırlanan “Türkiye’nin KOBİ’leri Bülteni” Türkiye Odalar ve Borsalar Birliği (TOBB) tarafından 26 Aralık 2020 tarihinde yayımlanmıştır. Bu çalışma kapsamında Türkiye’nin KOBİ’leri Bülteni’ne geçmeden önce KOBİ ve KOBİ kategori tanımlarının verilmesi konu hakkında…

Verinin Standartlaştırılması Üzerine Vaka Çalışmaları: Case Studies on Standardization of Data

Veri bilimciler ve veri mühendisleri çok değişkenli istatistiksel analizler üzerinde yoğun bir şekilde çalışmaktadır. Ancak bazı durumlarda seçilen analiz yönteminin ilk varsayımlarının yerine getirilmesi gerekmektedir. Bu varsayımlardan ve gerekliliklerden biri de veri setinin standartlaştırılmasıdır. Örnek vermek gerekirse küme analizleri başta olmak üzere yapay sinir ağları alanlarında da standartlaştırmanın kendine uygulama alanı bulduğu görülmektedir. Peki standartlaştırma…

Türkiye’nin İmalat Sanayi Teknoloji Düzeyi

Türkiye İstatistik Kurumu (TÜİK) tarafından 8 Eylül 2020 tarihinde Girişimcilik ve İş Demografisi istatistikleri yayınlanmıştır. İş Demografisi, temel yöntem ve yaklaşımları Avrupa Birliği İstatistik Ofisi (EUROSTAT) ve OECD tarafından belirlenmiş ve bu yönüyle de uluslararası karşılaştırılabilirliği olan bir çalışmadır. İş Demografisi göstergeleri, “Girişimcilik” konseptinin önemli bir bölümünü oluşturmaktadır. Temel veri kaynağı, Gelir İdaresi Başkanlığı (GİB)…

Makine Öğrenme Yöntemleri Kullanarak Eksik Verilere Atama Yapılması Üzerine Bir Vaka Çalışması: A Case Study on Assigning Missing Data Using Machine Learning (ML) Methods

Veri bilimcilerin ya da veri analizleriyle uğraşan akademi ve saha çalışanların karşılaştığı problemlerin başında veri setindeki değişkenlerde eksik gözlemlerle diğer bir deyişle missing data gelmektedir. Literatürde eksik veri atama yöntemleri arasında bir çok yöntem bulunmakla birlikte öne çıkan yöntemlerden bazıları şöyledir: Eksik gözlemlere ortalama değer atama Eksik gözlemlere 0 değeri atama Eksik gözlemlere median değeri…

COVID-19 ve Türkiye İmalat Sanayi Sektör Üretimlerinin Seyri

Birleşmiş Milletler Sınai Kalkınma Örgütü (UNIDO) tarafından 6 Ekim tarihinde Dünya İmalat Üretimi Temmuz 2020 dönem raporu yayınlanmıştır. Raporda küresel üretimde büyüme, Covid-19’un tetiklediği ekonomik bozulmaların ardından istikrar görüntüsü vermeye ve yukarı yönlü bir trend göstermeye başlamıştır. Çin’deki son üretim verileri, salgın öncesiyle benzer büyüme oranlarına işaret ederken, diğer ülkeler daha yavaş bir hızda toparlanma…

Büyük Veri Mi Kalın Veri Mi? : Big Data or Thick Data?

Yararlanılan Kaynak: Tarafımdan geliştirilen kelime bulutu oluşturucu (https://buluttevfik.shinyapps.io/kelimebulutuv2/) uygulaması ile yazdığım metin olduğu gibi analiz edilmiştir. Yapılandırılmış ve yapılandırılmamış veri ile bilgi ve belgelerin dijital ortama aktarılması ve dijital ortamda işlenmesi süreci anlamına gelen dijitalleşmenin küresel ölçekte Covid-19 salgının ortaya çıkmasıyla birlikte daha da ivme kazanmış olması üretilen verinin hacmini devasa boyutlara ulaştırmış,  çeşitliliğini ise…

R’da Kelime Bulutu Uygulaması Geliştirilmesi Üzerine Bir Vaka Çalışması: A Case Study on Developing a Word Cloud Application in R

Burada yapılan çalışmayla R programlama dili kullanılarak veri madenciliğinin bir dalı olan metin madenciliği (text mining) alanında bir uygulama geliştirilmiştir. Böylece kolay kullanım arayüzü sunan uygulama ile nitel araştırmalar yapan saha ve akademi çalışanlarına kolaylık sağlanması amaçlanmıştır. Çalışma kapsamında geliştirilen uygulamadan bir ekran kesiti aşağıda verilmiştir. Uygulamaya ise aşağıdaki linkten ulaşabilirsiniz. https://buluttevfik.shinyapps.io/kelimebulutuv2/ Faydalı olması dileğiyle….

APLOCO Metodunun Kompleks Ağlarda Düğüm Ağırlıklarının Belirlenmesinde Kullanımı Üzerine Bir Vaka Çalışması

Prof. Dr. Oğuz Fındık ve Emrah Özkaynak tarafından yapılan ve 19 Eylül 2020 tarihinde yayınlanan bir çalışmada kompleks ağ analizlerinde düğüm ağırlıklarının belirlenmesinde geliştirdiğim çok kriterli karar verme yöntemlerinden biri olan APLOCO uygulanmıştır. Çalışmanın adı, linki ve alıntı şekliyle birlikte aşağıda verilmiştir. Çalışmanın adı: Link prediction based on node weighting in complex networks Çalışmanın linki…

Küresel İnovasyon Endeksi’nde Türkiye Ne Durumda?

Dünya ekonomilerini inovasyon yeteneklerine göre sıralayan Küresel İnovasyon Endeksi, ingilizce ifadeyle Global Inovation Index (GII)’in 2020 yılı raporu 2 Eylül 2020 tarihinde Dünya Fikri Mülkiyet Hakları Örgütü (WIPO) tarafından yayınlanmıştır. Endeks her yıl düzenli olarak Dünya Fikri Mülkiyet Hakları Örgütü (WIPO), INSEAD ve Cornell Üniversitesi iş birliğinde hazırlanmaktadır. İnovasyon girdileri ve çıktıları olarak gruplandırılmış yaklaşık…