Tekrarlı Basit Tesadüfi Örnekleme ve Bootstrap Örnekleme Üzerine Vaka Çalışmaları: Case Studies on Simple Random Sampling with Replacement and Bootstrap Sampling

Bootstrap, istatistik dağılımlarını anlamaya yönelik 1979’da Stanford Üniversitesinden Amerikalı istatistikçi Bradley Efron tarafından geliştirilmiş parametrik ve non-parametrik versiyonları olan hem istatistiksel bir teknik hem de bir simülasyon yöntemidir. Bootstrap örnekleme duyarlılık analizleri, istatistiksel ve ekonometrik analizlerden makine öğrenme ve derin öğrenmeye kadar pek çok farklı alanda kendine uygulama alanı bulmaktadır. Kısacası bu yöntem bütün alanlarda…

Küçük ve Orta Ölçekli İşletme (KOBİ) İstatistikleri

Küçük ve Orta Ölçekli İşletmelerin (KOBİ) ülke ekonomisindeki payına dikkat çekmek ve KOBİ’lere ilişkin verilerin tek bir bülten altında derleyerek erişilmesini kolaylaştırmak amacıyla hazırlanan “Türkiye’nin KOBİ’leri Bülteni” Türkiye Odalar ve Borsalar Birliği (TOBB) tarafından 26 Aralık 2020 tarihinde yayımlanmıştır. Bu çalışma kapsamında Türkiye’nin KOBİ’leri Bülteni’ne geçmeden önce KOBİ ve KOBİ kategori tanımlarının verilmesi konu hakkında…

Verinin Standartlaştırılması Üzerine Vaka Çalışmaları: Case Studies on Standardization of Data

Veri bilimciler ve veri mühendisleri çok değişkenli istatistiksel analizler üzerinde yoğun bir şekilde çalışmaktadır. Ancak bazı durumlarda seçilen analiz yönteminin ilk varsayımlarının yerine getirilmesi gerekmektedir. Bu varsayımlardan ve gerekliliklerden biri de veri setinin standartlaştırılmasıdır. Örnek vermek gerekirse küme analizleri başta olmak üzere yapay sinir ağları alanlarında da standartlaştırmanın kendine uygulama alanı bulduğu görülmektedir. Peki standartlaştırma…

Türkiye’nin İmalat Sanayi Teknoloji Düzeyi

Türkiye İstatistik Kurumu (TÜİK) tarafından 8 Eylül 2020 tarihinde Girişimcilik ve İş Demografisi istatistikleri yayınlanmıştır. İş Demografisi, temel yöntem ve yaklaşımları Avrupa Birliği İstatistik Ofisi (EUROSTAT) ve OECD tarafından belirlenmiş ve bu yönüyle de uluslararası karşılaştırılabilirliği olan bir çalışmadır. İş Demografisi göstergeleri, “Girişimcilik” konseptinin önemli bir bölümünü oluşturmaktadır. Temel veri kaynağı, Gelir İdaresi Başkanlığı (GİB)…

Makine Öğrenme Yöntemleri Kullanarak Eksik Verilere Atama Yapılması Üzerine Bir Vaka Çalışması: A Case Study on Assigning Missing Data Using Machine Learning (ML) Methods

Veri bilimcilerin ya da veri analizleriyle uğraşan akademi ve saha çalışanların karşılaştığı problemlerin başında veri setindeki değişkenlerde eksik gözlemlerle diğer bir deyişle missing data gelmektedir. Literatürde eksik veri atama yöntemleri arasında bir çok yöntem bulunmakla birlikte öne çıkan yöntemlerden bazıları şöyledir: Eksik gözlemlere ortalama değer atama Eksik gözlemlere 0 değeri atama Eksik gözlemlere median değeri…

COVID-19 ve Türkiye İmalat Sanayi Sektör Üretimlerinin Seyri

Birleşmiş Milletler Sınai Kalkınma Örgütü (UNIDO) tarafından 6 Ekim tarihinde Dünya İmalat Üretimi Temmuz 2020 dönem raporu yayınlanmıştır. Raporda küresel üretimde büyüme, Covid-19’un tetiklediği ekonomik bozulmaların ardından istikrar görüntüsü vermeye ve yukarı yönlü bir trend göstermeye başlamıştır. Çin’deki son üretim verileri, salgın öncesiyle benzer büyüme oranlarına işaret ederken, diğer ülkeler daha yavaş bir hızda toparlanma…

Büyük Veri Mi Kalın Veri Mi? : Big Data or Thick Data?

Yararlanılan Kaynak: Tarafımdan geliştirilen kelime bulutu oluşturucu (https://buluttevfik.shinyapps.io/kelimebulutuv2/) uygulaması ile yazdığım metin olduğu gibi analiz edilmiştir. Yapılandırılmış ve yapılandırılmamış veri ile bilgi ve belgelerin dijital ortama aktarılması ve dijital ortamda işlenmesi süreci anlamına gelen dijitalleşmenin küresel ölçekte Covid-19 salgının ortaya çıkmasıyla birlikte daha da ivme kazanmış olması üretilen verinin hacmini devasa boyutlara ulaştırmış,  çeşitliliğini ise…

R’da Kelime Bulutu Uygulaması Geliştirilmesi Üzerine Bir Vaka Çalışması: A Case Study on Developing a Word Cloud Application in R

Burada yapılan çalışmayla R programlama dili kullanılarak veri madenciliğinin bir dalı olan metin madenciliği (text mining) alanında bir uygulama geliştirilmiştir. Böylece kolay kullanım arayüzü sunan uygulama ile nitel araştırmalar yapan saha ve akademi çalışanlarına kolaylık sağlanması amaçlanmıştır. Çalışma kapsamında geliştirilen uygulamadan bir ekran kesiti aşağıda verilmiştir. Uygulamaya ise aşağıdaki linkten ulaşabilirsiniz. https://buluttevfik.shinyapps.io/kelimebulutuv2/ Faydalı olması dileğiyle….

APLOCO Metodunun Kompleks Ağlarda Düğüm Ağırlıklarının Belirlenmesinde Kullanımı Üzerine Bir Vaka Çalışması

Prof. Dr. Oğuz Fındık ve Emrah Özkaynak tarafından yapılan ve 19 Eylül 2020 tarihinde yayınlanan bir çalışmada kompleks ağ analizlerinde düğüm ağırlıklarının belirlenmesinde geliştirdiğim çok kriterli karar verme yöntemlerinden biri olan APLOCO uygulanmıştır. Çalışmanın adı, linki ve alıntı şekliyle birlikte aşağıda verilmiştir. Çalışmanın adı: Link prediction based on node weighting in complex networks Çalışmanın linki…

Küresel İnovasyon Endeksi’nde Türkiye Ne Durumda?

Dünya ekonomilerini inovasyon yeteneklerine göre sıralayan Küresel İnovasyon Endeksi, ingilizce ifadeyle Global Inovation Index (GII)’in 2020 yılı raporu 2 Eylül 2020 tarihinde Dünya Fikri Mülkiyet Hakları Örgütü (WIPO) tarafından yayınlanmıştır. Endeks her yıl düzenli olarak Dünya Fikri Mülkiyet Hakları Örgütü (WIPO), INSEAD ve Cornell Üniversitesi iş birliğinde hazırlanmaktadır. İnovasyon girdileri ve çıktıları olarak gruplandırılmış yaklaşık…

Girişimcilik Eğitimlerinde Ne Durumdayız?

Küçük ve Orta Ölçekli İşletmeleri Geliştirme ve Destekleme İdaresi Başkanlığı (KOSGEB) tarafından 24 Temmuz 2019’da uygulamaya aldığı girişimcilik eğitimlerinin değerlendirilmesi amacıyla eğitim sonunda girişimcilerin katılım sağladığı “Girişimcilik Eğitimi Memnuniyet Anketi” gerçekleştirilmiştir. 2020 yılı temmuz sonu itibarıyla yaklaşık 72 bin geleneksel ve 28 bin ileri girişimcilik eğitimi alan katılımcı üzerinde gerçekleştirilen anketten öne çıkan bulgular şöyledir:…

Python’da Şans Oyunları Perspektifinden Olasılık : Probability from Perspective of the Chance Games in Python

Rastlantı ya da kesin olmayan olaylarla ilgilenen olasılık teorisi, rastlantı olaylarını belirli kurallara göre matematik disiplininde inceleyen bir bilim dalıdır. Burada, rastlantı olayından kasıt gerçekleşmesi şansa bağlı olan önceden kesin olarak bilinmeyen olaylardır. Burada olabildiğince yalın bir şekilde uygulamalı örneklerin şans oyunları üzerinden verilmesinin nedeni olasılık konusuna dikkat çekmek ve olasılık konusuyla ilgileneceklere katkıda bulunmaktır. Yoksa…

Pyhton’da Eşitliklerin Yazılması ve Çözümü Üzerine Bir Vaka Çalışması: A Case Study on Writing and Solving Equations in Python

Bilindiği üzere matematiksel ifadeleri göstermek için, diğer bir ifadeyle matematik diliyle konuşabilmek için yaygın bir şekilde matematik sembollerinden yararlanırız. Bu çalışmada Python’da matematik sembollerinin yazımı, basit, birinci, ikinci, üçüncü ve dördüncü dereceden eşitliklerin çözümü üzerine olabildiğince yalın bir dille uygulamalar yaparak konu alanında farkındalık oluşturmak istedim. İlk olarak matematiksel ifadelerin ve denklerim oluşturulmasına, ardından ise…

Şans Oyunları Perspektifinden Olasılık III: Probability from Perspective of the Chance Games III

Rastlantı ya da kesin olmayan olaylarla ilgilenen olasılık teorisi, rastlantı olaylarını belirli kurallara göre matematik disiplininde inceleyen bir bilim dalıdır. Burada, rastlantı olayından kasıt gerçekleşmesi şansa bağlı olan önceden bilinmeyen olaylardır. Burada olabildiğince yalın bir şekilde uygulamalı örneklerin şans oyunları üzerinden verilmesinin nedeni olasılık konusuna dikkat çekmek ve olasılık konusuyla ilgileneceklere katkıda bulunmaktır. Yoksa amaç bu…

Hipergeometrik Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Hypergeometric Probability Distribution

Birçok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılık dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (discrete) ve sürekli (continuous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Hipergeometrik dağılımı…

“crosstalk” Paketi İle Dinamik Tablo Oluşturma Üzerine Bir Vaka Çalışması II: A Case Study on Creating Dynamic Tables with Package “Crosstalk” II

R’da başta shiny olmak üzere flexboard ve crosstalk paketleri dinamik tablo oluşturmada kullanılan paketlerden bazılarıdır. Bu çalışmada ise bir önceki çalışmadan farklı olarak crosstalk ve datatable paketleri birlikte kullanılarak adım adım uygulama üzerinde gösterilecektir. Önceki çalışmamızda oluşturulan dinamik tabloya ek olarak bu çalışmada aynı zamanda farklı formatlarda verinin indirilmesine ve yazdırılmasına imkan tanınmıştır. Bu tür…

“crosstalk” Paketi İle Dinamik Tablo Oluşturma Üzerine Bir Vaka Çalışması: A Case Study on Creating Dynamic Tables with Package “Crosstalk”

R’da başta shiny olmak üzere flexboard ve crosstalk paketleri dinamik tablo oluşturmada kullanılan paketlerden bazılarıdır. Bu çalışmada ise crosstalk paketi kullanılarak adım adım özgün bir uygulama üzerinde gösterilecektir. Uygulamada R kod bloklarını R Studio arayüzünde yazdım. Çalışmada kullanılan veri seti TÜİK veri tabanından alınan 15 yaş üstü nüfusun yıllara ve illere göre dağılımını içermektedir. 15…

Geometrik Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Geometric Probability Distribution

Birçok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılık dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (discrete) ve sürekli (continuous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Geometrik dağılımı…

Negatif Binom Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Negative Binomial Probability Distribution

Bir çok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılık dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (discrete) ve sürekli (continuous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Negatif…

R’da Büyük Veri Analizi ve “sparklyr” Arayüzü : Big Data Analysis and Interface “sparklyr” in R

sparklyr, R ile Apache Spark arasında bir arayüz sağlayarak R’daki büyük verileri işlemek için kullanılan açık kaynaklı küme hesaplama mantığında çalışan bir kütüphanedir. Adı geçmişken biraz küme hesaplamadan bahsetmekte fayda var. 1967’de IBM’den Gene Amdahl tarafından yayınlanan bir makalede, paralel çalışma yapmanın bir yolu olarak küme hesaplamanın temelini adını taşıdığı Amdahl Yasası ile resmen ortaya…

Şans Oyunları Perspektifinden Olasılık II: Probability from Perspective of the Chance Games II

Rastlantı ya da kesin olmayan olaylarla ilgilenen olasılık teorisi, rastlantı olaylarını belirli kurallara göre matematik disiplininde inceleyen bir bilim dalıdır. Burada, rastlantı olayından kasıt gerçekleşmesi şansa bağlı olan önceden bilinmeyen olaylardır. Burada olabildiğince yalın bir şekilde uygulamalı örneklerin şans oyunları üzerinden verilmesinin nedeni olasılık konusuna dikkat çekmektir, yoksa amaç bu oyunları oynamaya özendirmek veya teşvik…

COVID-19 Pandemik Krizi ve Telekomünikasyon Sektörü Trendleri : COVID-19 Pandemic Crisis and Telecommunication Sector Trends

Doğrudan veya dolaylı olarak COVID-19 pandemisinden etkilenen küresel toplum eşi görülmemiş zamanlardan geçmektedir. Dünya Sağlık Örgütü  (WHO) COVID-19 salgınından pandemi olarak bahsetmesi ve salgının pandemi kavramıyla birlikte kullanılmasının nedeni bu salgının ülke sınırlarını aşıp diğer ülkelere yayılım göstermesidir.  Diğer bir ifadeyle salgına pandemi özelliğini kazandıran şey, salgının bulunduğu ülke sınırlarını aşmasıdır. Nitekim Dünya Sağlık Örgütü,…

Poisson Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Poisson Probability Distribution

Bir çok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılık dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (discrete) ve sürekli (continuous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Poisson…

Kesikli Uniform Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Discrete Uniform Probability Distribution

Bir çok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılıkları dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (disrete) ve sürekli (continous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Kesikli…

Binom Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Binomial Probability Distribution

Bir çok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılıkları dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (disrete) ve sürekli (continous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Binom…

Şans Oyunları Perspektifinden Olasılık : Probability from Perspective of the Chance Games

Rastlantı ya da kesin olmayan olaylarla ilgilenen olasılık teorisi, rastlantı olaylarını belirli kurallara göre matematik disiplininde inceleyen bir bilim dalıdır. Rastlantı olayından kasıt gerçekleşmesi şansa bağlı olan önceden kesin olarak bilinmeyen olaylardır. Burada olabildiğince yalın bir şekilde uygulamalı örneklerin şans oyunları üzerinden verilmesinin nedeni olasılık konusuna dikkat çekmek ve konunun öğrenilmesine katkıda bulunmaktır, yoksa amaç…

Bulut Bilişim Nereye Evriliyor? : Where is Cloud Computing Evolving into?

Bulut bilişim veya sanal bulut derken ne anlamalıyız? Atmosferde gözlemlediğimiz su damlacıkları ve buz taneciklerinin yoğunlaşmasıyla oluşan doğal bulut mu yoksa internet üzerinde oluşturulan sanal bir bulut mu? Hâlâ bulut bilişim veya sanal bulut kavramı kafa karışıklığı oluşturduğu için bu makalede hem sanal bulutu açıklamak hem de bulut bilişimin nereye doğru evrildiği ele alınarak farkındalık…

Bernoulli Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on the Bernoulli Probability Distribution

Olasılık konusu öteden beri ilgimi çekmiş ve ara ara üzerine yoğunlaşma fırsatım olmuştur. Çoğu analiz yönteminin temelini oluşturan olasılık dağılımları da böyledir. İşin esasında olasılıkları dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (disrete)…

R’da Poisson ve Negatif Binom Regresyon Yöntemleri Üzerine Bir Vaka Çalışması: A Case Study on Poisson and Negative Binomial Regression Methods in R

Giriş Regresyon analizi yöntemlerinden biri olan poisson regresyon analiz yöntemi, bağımlı değişkenin ya da cevap değişkenininnicel kesikli ve pozitif (sayma sayıları) olduğu bağımlı değişkenler (dependent variables) ile bağımsız değişken veya değişkenler (independent variables) arasındaki ilişkiyi ortaya koyan regresyon analiz yöntemidir. Genel olarak bağımlı değişkenin veri tipi yapılacak analiz yöntemlerinde belirleyici rol oynamaktadır. Dolayısıyla veri tiplerinin…

COVID-19 ve Dijital Dönüşüm: COVID-19 and Digital Transformation

Kaynak:https://www.cio.com Birleşmiş Milletler Sınai Kalkınma Örgütü (UNIDO) tarafından 10 Temmuz 2020 tarihinde içerisinde ağırlıklı olarak Covid-19 pandemisinin dijitalleşme üzerindeki etkisinin ele alındığı “Covid-19 Olası Sonuçlar ve Cevaplar: Dijital Dönüşüm ve Endüstriyel İyileşme” adlı rapor yayımlanmıştır. Pandemik kriz uluslararası topluma özellikle ileri üretim teknolojileri ve dijitalleşme yoluyla uluslararası kalkınma sorunlarına işbirliği çözümleri sunarak dijital dönüşümü hızlandırma…

R’da Çoklu Doğrusal Regresyon Üzerine Bir Vaka Çalışması: A Case Study on Multiple Linear Regression (MLR) in R

Giriş Regresyon analizi yöntemlerinden biri olan multiple (çoklu) regresyon analiz (MRA) yöntemi, bağımlı değişkenin ya da cevap değişkenininnicel sürekli veya kesikli olduğu bağımlı değişkenler (dependent variables) ile bağımsız değişken veya değişkenler (independent variables) arasındaki ilişkiyi ortaya koyan regresyon analiz yöntemidir. Veri tipleri kendi içerisinde 4 farklı alt sınıfta ele alınabilir. Bu veri tipleri Şekil 1’de…

R’da Multinominal Lojistik Regresyon Üzerine Bir Vaka Çalışması: A Case Study on Multinominal Logistic Regression in R

Lojistik regresyon analizi yöntemlerinden biri olan multinominal lojistik regresyon analiz yöntemi, bağımlı değişkenin ya da cevap değişkeninin 2’den fazla kategoriye sahip olduğu durumlarda bağımlı değişkenler (dependent variables) ile bağımsız değişken veya değişkenler (independent variables) arasındaki ilişkiyi ortaya koyan regresyon analiz yöntemidir. Burada bağımlı değişkenin multinominal olmasından kasıt kategorik değişkenin ikiden fazla cevap seçeneği olduğu anlaşılmalıdır….

Haziran 2020 Küresel Ekonomik Beklentiler Raporu

Dünya Bankası tarafından 8/6/2020 tarihinde 238 sayfalık Küresel Ekonomik Beklentiler (Global Economic Prospects) raporunun Haziran 2020 sayısı yayınlanmıştır. Raporun bu baskısında COVID-19 pandemisinin etkilerini değerlendirilmekte ve projeksiyonlar çizilerek sonuçları analiz edilmektedir. Aynı zamanda raporda küresel toplumun ihtiyaç duyduğu alınacak politika tedbirlerini ortaya koyarak önerilerde bulunulmaktadır. COVID-19 resesyonu, 1870’ten bu yana pandeminin neden olduğu ilk resesyondur….

R’da Binary Lojistik Regresyon Üzerine Bir Vaka Çalışması: A Case Study on Binary Logistic Regression in R

Lojistik regresyon analizi yöntemlerinden biri olan binary (ikili: binomial) lojistik regresyon analiz yöntemi, bağımlı değişkenin ya da cevap değişkeninin iki kategoriye sahip olduğu durumlarda bağımlı değişkenler (dependent variables) ile bağımsız değişken veya değişkenler (independent variables) arasındaki ilişkiyi ortaya koyan regresyon analiz yöntemidir. Burada bağımlı değişkenin binomial olmasından kasıt kategorik değişkenin iki cevap seçeneği olduğu anlaşılmalıdır….

İnsanın Dijital İkizi Oluşturulabilir Mi?: Can A Human’s Digital Twin Be Created?

Kaynak: https://www.imeche.org Dijital dönüşümde anahtar rol oynayan nesnelerin interneti (IoT) ve endüstriyel nesnelerin interneti (IIoT)’nin ortaya çıkmasıyla hız kazanan dijital ikiz, Endüstri 4.0 (Industry 4.0), Toplum 5.0 (Society 5.0) devrimlerinin ve Akıllı Ulus (Smart Nation) programının ön planında yer alan bir simülasyon teknolojisidir. Endüstri 4.0 devrimi 2011 yılında Almanya, Toplum 5.0 2015 yılında Japonya ve…

Topluluk Öğrenme Algoritmalarından Gradyan Yükseltme Algoritması İle Gögüs Kanserinin Tahmini Üzerine Bir Vaka Çalışması: A Case Study on the Prediction of Breast Cancer Using Gradient Boosting Algorithm from Ensemble Learning Algorithms

Giriş Topluluk (ensemble) öğrenme algoritmaları tahmine dayalı analitik çalışmalarda en başarılı yaklaşımlardan biridir. Bu algoritmalar somut bir problemi çözmek için bir araya gelen modeller setinden oluşmaktadır. Amaç modeller setinin ürettiği tahminleri birleştirerek doğruluğu (accuracy) artırmaktır. Topluluk algoritmaları kendi içerisinde üç grupta ele alınır. Torbalama (Bagging: Bootsrap Aggregating) Yükseltme (Boosting) AdaBoost Gradient Boosting XGBoost LightGBM İstif…

Topluluk Öğrenme Algoritmalarından Yükseltme Algoritması İle Gögüs Kanserinin Tahmini Üzerine Bir Vaka Çalışması: A Case Study on the Prediction of Breast Cancer Using Boosting Algorithm from Ensemble Learning Algorithms

Giriş Topluluk (ensemble) öğrenme algoritmaları tahmine dayalı analitik çalışmalarda en başarılı yaklaşımlardan biridir. Bu algoritmalar somut bir problemi çözmek için bir araya gelen modeller setinden oluşmaktadır. Amaç modeller setinin ürettiği tahminleri birleştirerek doğruluğu (accuracy) artırmaktır. Topluluk algoritmaları kendi içerisinde üç grupta ele alınır. Torbalama (Bagging: Bootsrap Aggregating) Yükseltme (Boosting) AdaBoost Gradient Boosting XGBoost LightGBM İstif…

Topluluk Öğrenme Algoritmalarından Torbalama Algoritması İle Konut Fiyatlarının Tahmini Üzerine Bir Vaka Çalışması: A Case Study on the Prediction of Housing Prices Using Bagging Algorithm from Ensemble Learning Algorithms

Giriş Topluluk (ensemble) öğrenme algoritmaları tahmine dayalı analitik çalışmalarda en başarılı yaklaşımlardan biridir. Bu algoritmalar somut bir problemi çözmek için bir araya gelen modeller setinden oluşmaktadır. Amaç modeller setinin ürettiği tahminleri birleştirerek doğruluğu (accuracy) artırmaktır. Topluluk algoritmaları kendi içerisinde üç grupta ele alınır. Torbalama (Bagging: Bootsrap Aggregating) Artırma (Boosting) İstif (Stacking) Topluluk (ensemble) öğrenme algoritmalarından…

Düşük Doğurganlık Türkiye İçin Tehdit Mi Oluşturuyor?

Bilindiği üzere Türkiye İstatistik Kurumu (TÜİK) yakın zamanda Türkiye için önemli nüfus göstergelerinden biri olan toplam doğurganlık hızlarını açıkladı. Bir kadının doğurganlık dönemini içine alan 15 ile 49 yaş arasında doğurabileceği ortalama çocuk sayısını gösteren toplam doğurganlık hızı ürkütücü seviyelere düştü. Gelişmiş ülkelerde bir neslin yenilenme düzeyi eşik değeri 2,10 seviyesi olarak görülmektedir. Diğer bir…

Prediction of Size of the COVID-19 Pandemic Using Wavelength Models: Cases of Turkey and World [Dalgaboyu Modelleri Kullanarak COVID-19 Pandemisinin Büyüklüğünün Tahmini: Türkiye ve Dünya Vakaları]

Başta Koronavirüs (COVID-19) olmak üzere diğer salgınların büyüklüğünü ortaya koymak için dalga boylarını ölçmeye yönelik geliştirdiğim sayısal modeller ön incelemeden geçerek Yale üniversitesi destekli medRxiv (Medical Archive)’de 11.4.2020 tarihinde yayınlanmıştı. Geliştirilen modellerin makalesine aşağıdaki linki tıklayarak ulaşabilirsiniz. https://www.medrxiv.org/content/10.1101/2020.04.07.20056432v1.article-info Makalenin adı: Bulut T. New Epidemiological Model Suggestions Revealing Size of Epidemics Based on the COVID-19 Pandemic Example: Wavelength…

Doğurganlık Hızı Fırsat Mı Tehdit Mi?

Bilindiği üzere Türkiye İstatistik Kurumu (TÜİK) yakın zamanda Türkiye için önemli nüfus göstergelerinden biri olan toplam doğurganlık hızlarını açıkladı. Bir kadının doğurganlık dönemini içine alan 15 ile 49 yaş arasında doğurabileceği ortalama çocuk sayısını gösteren toplam doğurganlık hızı ürkütücü seviyelere düştü. Gelişmiş ülkelerde bir neslin yenilenme düzeyi eşik değeri 2,10 seviyesi olarak görülmektedir. Diğer bir…

Topluluk Öğrenme Algoritmalarından Torbalama Algoritması İle Gögüs Kanserinin Tahmini Üzerine Bir Vaka Çalışması: A Case Study on the Prediction of Breast Cancer Using Bagging Algorithm from Ensemble Learning Algorithms

Giriş Topluluk (ensemble) öğrenme algoritmaları tahmine dayalı analitik çalışmalarda en başarılı yaklaşımlardan biridir. Bu algoritmalar somut bir problemi çözmek için bir araya gelen modeller setinden oluşmaktadır. Amaç modeller setinin ürettiği tahminleri birleştirerek doğruluğu (accuracy) artırmaktır. Topluluk algoritmaları kendi içerisinde üç grupta ele alınır. Torbalama (Bagging: Bootsrap Aggregating) Artırma (Boosting) İstif (Stacking) Topluluk (ensemble) öğrenme algoritmalarından…

Türkiye’deki COVID-19 Pandemisinin Büyüklüğü: Size of the Covid-19 Pandemics in Turkey

Dünyayı derinden etkileyen koronavirüs pandemisinin mevcut durumdaki büyüklüğünü ortaya koymaya yönelik geliştirdiğim epidemiyolojik dalga boyu modelleri Yale Üniversitesi destekli Uluslararası Tıp Arşivinde ön baskı olarak yayınlanmıştır. Bu modeller kullanılarak Türkiye’deki koronavirüs salgınının büyüklüğü dalga boyu uzunluğu olarak hesaplanmıştır. Analizde kullanılan vaka sayılarına ilişkin veri seti Sağlık Bakanlığı resmi web sitesinden edinilmiştir. Elde edilen bulgular Şekil…

Temel Bileşenler Analizi Üzerine Bir Vaka Çalışması: A Case Study on Principal Component Analysis (PCA)

Büyük veri setleri birçok disiplinde giderek yaygınlaşmaktadır. Bu tür veri kümelerini yorumlamak için, verilerdeki bilgilerin çoğu korunacak şekilde boyutsallıklarını yorumlanabilir bir şekilde önemli ölçüde azaltmak için yöntemlere ihtiyaç vardır. Bu amaç için birçok teknik geliştirilmiştir, ancak temel bileşenler analizi (PCA) en eski ve en yaygın kullanılanlardan biridir. Fikri basittir – mümkün olduğunca çok ‘değişkenliği’ korunurken…

R Programlama Diliyle Sınıflandırma Problemlerinin Çözümünde Karar Ağacı Algoritmaları Üzerine Bir Vaka Çalışması: A Case Study on Decision Tree Algorithms in Solving Classification Problems with R Programming Language

Giriş Günümüzde veri madenciliği uygulamalarının yaygınlaşması ve büyük veri kavramının öne çıkmasıyla birlikte analiz metotları da değişmiştir. Bugüne kadar genellikle bulut (cloud) veri tabanları üzerindeki veri setleri indirilerek analize konu ediliyordu. Ancak gelişen teknoloji veri madenciliği yöntemlerinde de önemli değişiklikler ve bazı soruları beraberinde getirmiştir. Bu sorulardan bazıları şöyledir: Online veya offline olarak dokümanlarda analize…

R Programlama Diliyle Sınıflandırma Problemlerinin Çözümünde Küme Algoritmaları Üzerine Bir Vaka Çalışması: A Case Study on Cluster Algorithms in Solving Classification Problems with R Programming Language

Giriş Küme geçmeden önce temel kavramları açıklamak konunun anlaşılması açısından önem taşıdığından ilk olarak kısaca bu kavramlara yer verilmiştir. Küme, benzer özellikleri içinde barındıran topluluk olarak tanımlanabilir. Bu topluluk insan, hayvan, bitki topluluğu olabileceği gibi nesnelerin oluşturduğu topluluk da olabilir. Benzer özellikler taşıyan bu topluluklar diğer kümelerden farklılaşır. Kümeleme (clustering) analizini ise benzer özelliklere sahip…

R Programlama Diliyle Regresyon Problemlerinin Çözümünde Rastgele Orman Algoritması Üzerine Bir Vaka Çalışması: A Case Study on Random Forest (RF) Algorithm in Solving Regression Problems with R Programming Language

Giriş Rastgele Orman (RF) algoritması , 2001 yılında Breiman tarafından karar ağaçlarının bir kombinasyonu olarak önerilmiştir. RF en iyi “her ağaç, bağımsız olarak örneklenen ve ormandaki tüm ağaçlar için aynı dağılıma sahip rastgele bir vektörün değerlerine bağlı olacak şekilde ağaç belirleyicilerinin kombinasyonu” olarak tanımlanan bir topluluk makine öğrenme algoritmasıdır. Topluluk algoritması gerek regresyon gerekse sınıflandırma…

R Programlama Diliyle Sistematik Örnekleme Üzerine Bir Vaka Çalışması: A Case Study on Systematic Sampling with R Programming Language

Giriş Daha önce basit tesadüfi örnekleme (simple random sampling) üzerine burada çalışmalar yapılmıştı. İlgilenecekler için aşağıda yararlanılan kaynaklar kısmında bu çalışmaların linklerine yer verilmiştir. Bu çalışmada ise örnek bir uygulama üzerinden ve olabildiğince yalın bir dille sistematik örnekleme yapılacak ve R programlama dili kullanılacaktır. Ancak R programlama dili bilmeyenler için Microsoft Excel kullanarak sistematik örnekleme…

Microsoft Excel’de Sistematik Örnekleme Üzerine Bir Vaka Çalışması: A Case Study on Systematic Sampling in Microsoft Excel

Giriş Daha önce basit tesadüfi örnekleme (simple random sampling) üzerine burada çalışmalar yapılmıştı. İlgilenecekler için aşağıda yararlanılan kaynaklar kısmında bu çalışmaların linklerine yer verilmiştir. Bu çalışmada ise örnek bir uygulama üzerinden ve olabildiğince yalın bir dille sistematik örnekleme yapılacaktır. Sistematik örnekleme, 1’den N’e kadar olan popülasyon birimlerinden ilk seçimin tesadüfi bir şekilde seçilmesinden sonra örneklem…

Tekrarsız Basit Tesadüfi Örnekleme Yöntemi Kullanılarak t Dağılım Tablosu Üzerinden Güven Aralığının Hesaplanmasına Yönelik Bir Simülasyon Çalışması: A Simulation Study for Calculation of Confidence Interval (CI) Based on t Distribution Table Using Simple Random Sampling Method without Replacement

Güven aralıkları ingilizce ifadeyle confidence interval (CI) hem sahadan veri toplama yöntemleriyle elde edilen birincil verilerin hem de veri tabanlarından elde edilen işlenmiş ikincil verilerin analizinde çok yoğun bir şekilde kullanılmaktadır. Peki nedir bu güven aralığı? Güven aralığının hesaplanması için hangi parametrelere ihtiyaç vardır? Güven aralığı nasıl hesaplanır? Güven aralığını etkileyen faktörler nelerdir? Bu çalışmada…

Veri Madenciliği (Data Mining): Metin Verisinin Keşifsel Veri Analizi Üzerine Bir Vaka Çalışması (Text Mining)

Veriden desen çıkarma işlemi anlamına gelen veri madenciliği bütün alanlarda kendine uygulama alanı bulan ve büyük veri (big data)’den farklı olan bir kavramdır. Bu kavram aynı zamanda veriyi keşfetmek olarak da tanımlanabilir. Veri madenciliği, veriden desen veya örüntü çıkarırken yapay zekayı , istatistiksel metotları ve diğer pek çok metodu kullanır. Büyük veride ise genel olarak…

KOBİ’lerde Entegrasyonun ve Sinerjinin Önemi

Küçük ve Orta Ölçekli İşletmelerin (KOBİ) ülke ekonomisindeki payına dikkat çekmek ve KOBİ’lere ilişkin verilerin tek bir bülten altında derleyerek erişilmesini kolaylaştırmak amacıyla hazırlanan “Türkiye’nin KOBİ’leri Bülteni” Türkiye Odalar ve Borsalar Birliği (TOBB) tarafından 26 Aralık 2020 tarihinde yayımlanmıştır. Bu çalışma kapsamında Türkiye’nin KOBİ’leri Bülteni’ne geçmeden önce KOBİ ve KOBİ kategori tanımlarının verilmesi konu hakkında…