Büyük Veri Mi Kalın Veri Mi? : Big Data or Thick Data?

Yararlanılan Kaynak: Tarafımdan geliştirilen kelime bulutu oluşturucu (https://buluttevfik.shinyapps.io/kelimebulutuv2/) uygulaması ile yazdığım metin olduğu gibi analiz edilmiştir. Yapılandırılmış ve yapılandırılmamış veri ile bilgi ve belgelerin dijital ortama aktarılması ve dijital ortamda işlenmesi süreci anlamına gelen dijitalleşmenin küresel ölçekte Covid-19 salgının ortaya çıkmasıyla birlikte daha da ivme kazanmış olması üretilen verinin hacmini devasa boyutlara ulaştırmış,  çeşitliliğini ise…

R’da Kelime Bulutu Uygulaması Geliştirilmesi Üzerine Bir Vaka Çalışması: A Case Study on Developing a Word Cloud Application in R

Burada yapılan çalışmayla R programlama dili kullanılarak veri madenciliğinin bir dalı olan metin madenciliği (text mining) alanında bir uygulama geliştirilmiştir. Böylece kolay kullanım arayüzü sunan uygulama ile nitel araştırmalar yapan saha ve akademi çalışanlarına kolaylık sağlanması amaçlanmıştır. Çalışma kapsamında geliştirilen uygulamadan bir ekran kesiti aşağıda verilmiştir. Uygulamaya ise aşağıdaki linkten ulaşabilirsiniz. https://buluttevfik.shinyapps.io/kelimebulutuv2/ Faydalı olması dileğiyle….

APLOCO Metodunun Kompleks Ağlarda Düğüm Ağırlıklarının Belirlenmesinde Kullanımı Üzerine Bir Vaka Çalışması

Prof. Dr. Oğuz Fındık ve Emrah Özkaynak tarafından yapılan ve 19 Eylül 2020 tarihinde yayınlanan bir çalışmada kompleks ağ analizlerinde düğüm ağırlıklarının belirlenmesinde geliştirdiğim çok kriterli karar verme yöntemlerinden biri olan APLOCO uygulanmıştır. Çalışmanın adı, linki ve alıntı şekliyle birlikte aşağıda verilmiştir. Çalışmanın adı: Link prediction based on node weighting in complex networks Çalışmanın linki…

Küresel İnovasyon Endeksi’nde Türkiye Ne Durumda?

Dünya ekonomilerini inovasyon yeteneklerine göre sıralayan Küresel İnovasyon Endeksi, ingilizce ifadeyle Global Inovation Index (GII)’in 2020 yılı raporu 2 Eylül 2020 tarihinde Dünya Fikri Mülkiyet Hakları Örgütü (WIPO) tarafından yayınlanmıştır. Endeks her yıl düzenli olarak Dünya Fikri Mülkiyet Hakları Örgütü (WIPO), INSEAD ve Cornell Üniversitesi iş birliğinde hazırlanmaktadır. İnovasyon girdileri ve çıktıları olarak gruplandırılmış yaklaşık…

Girişimcilik Eğitimlerinde Ne Durumdayız?

Küçük ve Orta Ölçekli İşletmeleri Geliştirme ve Destekleme İdaresi Başkanlığı (KOSGEB) tarafından 24 Temmuz 2019’da uygulamaya aldığı girişimcilik eğitimlerinin değerlendirilmesi amacıyla eğitim sonunda girişimcilerin katılım sağladığı “Girişimcilik Eğitimi Memnuniyet Anketi” gerçekleştirilmiştir. 2020 yılı temmuz sonu itibarıyla yaklaşık 72 bin geleneksel ve 28 bin ileri girişimcilik eğitimi alan katılımcı üzerinde gerçekleştirilen anketten öne çıkan bulgular şöyledir:…

Python’da Şans Oyunları Perspektifinden Olasılık : Probability from Perspective of the Chance Games in Python

Rastlantı ya da kesin olmayan olaylarla ilgilenen olasılık teorisi, rastlantı olaylarını belirli kurallara göre matematik disiplininde inceleyen bir bilim dalıdır. Burada, rastlantı olayından kasıt gerçekleşmesi şansa bağlı olan önceden kesin olarak bilinmeyen olaylardır. Burada olabildiğince yalın bir şekilde uygulamalı örneklerin şans oyunları üzerinden verilmesinin nedeni olasılık konusuna dikkat çekmek ve olasılık konusuyla ilgileneceklere katkıda bulunmaktır. Yoksa…

Pyhton’da Eşitliklerin Yazılması ve Çözümü Üzerine Bir Vaka Çalışması: A Case Study on Writing and Solving Equations in Python

Bilindiği üzere matematiksel ifadeleri göstermek için, diğer bir ifadeyle matematik diliyle konuşabilmek için yaygın bir şekilde matematik sembollerinden yararlanırız. Bu çalışmada Python’da matematik sembollerinin yazımı, basit, birinci, ikinci, üçüncü ve dördüncü dereceden eşitliklerin çözümü üzerine olabildiğince yalın bir dille uygulamalar yaparak konu alanında farkındalık oluşturmak istedim. İlk olarak matematiksel ifadelerin ve denklerim oluşturulmasına, ardından ise…

Şans Oyunları Perspektifinden Olasılık III: Probability from Perspective of the Chance Games III

Rastlantı ya da kesin olmayan olaylarla ilgilenen olasılık teorisi, rastlantı olaylarını belirli kurallara göre matematik disiplininde inceleyen bir bilim dalıdır. Burada, rastlantı olayından kasıt gerçekleşmesi şansa bağlı olan önceden bilinmeyen olaylardır. Burada olabildiğince yalın bir şekilde uygulamalı örneklerin şans oyunları üzerinden verilmesinin nedeni olasılık konusuna dikkat çekmek ve olasılık konusuyla ilgileneceklere katkıda bulunmaktır. Yoksa amaç bu…

Hipergeometrik Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Hypergeometric Probability Distribution

Birçok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılık dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (discrete) ve sürekli (continuous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Hipergeometrik dağılımı…

“crosstalk” Paketi İle Dinamik Tablo Oluşturma Üzerine Bir Vaka Çalışması II: A Case Study on Creating Dynamic Tables with Package “Crosstalk” II

R’da başta shiny olmak üzere flexboard ve crosstalk paketleri dinamik tablo oluşturmada kullanılan paketlerden bazılarıdır. Bu çalışmada ise bir önceki çalışmadan farklı olarak crosstalk ve datatable paketleri birlikte kullanılarak adım adım uygulama üzerinde gösterilecektir. Önceki çalışmamızda oluşturulan dinamik tabloya ek olarak bu çalışmada aynı zamanda farklı formatlarda verinin indirilmesine ve yazdırılmasına imkan tanınmıştır. Bu tür…

“crosstalk” Paketi İle Dinamik Tablo Oluşturma Üzerine Bir Vaka Çalışması: A Case Study on Creating Dynamic Tables with Package “Crosstalk”

R’da başta shiny olmak üzere flexboard ve crosstalk paketleri dinamik tablo oluşturmada kullanılan paketlerden bazılarıdır. Bu çalışmada ise crosstalk paketi kullanılarak adım adım özgün bir uygulama üzerinde gösterilecektir. Uygulamada R kod bloklarını R Studio arayüzünde yazdım. Çalışmada kullanılan veri seti TÜİK veri tabanından alınan 15 yaş üstü nüfusun yıllara ve illere göre dağılımını içermektedir. 15…

Geometrik Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Geometric Probability Distribution

Birçok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılık dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (discrete) ve sürekli (continuous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Geometrik dağılımı…

Negatif Binom Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Negative Binomial Probability Distribution

Bir çok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılık dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (discrete) ve sürekli (continuous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Negatif…

R’da Büyük Veri Analizi ve “sparklyr” Arayüzü : Big Data Analysis and Interface “sparklyr” in R

sparklyr, R ile Apache Spark arasında bir arayüz sağlayarak R’daki büyük verileri işlemek için kullanılan açık kaynaklı küme hesaplama mantığında çalışan bir kütüphanedir. Adı geçmişken biraz küme hesaplamadan bahsetmekte fayda var. 1967’de IBM’den Gene Amdahl tarafından yayınlanan bir makalede, paralel çalışma yapmanın bir yolu olarak küme hesaplamanın temelini adını taşıdığı Amdahl Yasası ile resmen ortaya…

Şans Oyunları Perspektifinden Olasılık II: Probability from Perspective of the Chance Games II

Rastlantı ya da kesin olmayan olaylarla ilgilenen olasılık teorisi, rastlantı olaylarını belirli kurallara göre matematik disiplininde inceleyen bir bilim dalıdır. Burada, rastlantı olayından kasıt gerçekleşmesi şansa bağlı olan önceden bilinmeyen olaylardır. Burada olabildiğince yalın bir şekilde uygulamalı örneklerin şans oyunları üzerinden verilmesinin nedeni olasılık konusuna dikkat çekmektir, yoksa amaç bu oyunları oynamaya özendirmek veya teşvik…

COVID-19 Pandemik Krizi ve Telekomünikasyon Sektörü Trendleri : COVID-19 Pandemic Crisis and Telecommunication Sector Trends

Doğrudan veya dolaylı olarak COVID-19 pandemisinden etkilenen küresel toplum eşi görülmemiş zamanlardan geçmektedir. Dünya Sağlık Örgütü  (WHO) COVID-19 salgınından pandemi olarak bahsetmesi ve salgının pandemi kavramıyla birlikte kullanılmasının nedeni bu salgının ülke sınırlarını aşıp diğer ülkelere yayılım göstermesidir.  Diğer bir ifadeyle salgına pandemi özelliğini kazandıran şey, salgının bulunduğu ülke sınırlarını aşmasıdır. Nitekim Dünya Sağlık Örgütü,…

Poisson Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Poisson Probability Distribution

Bir çok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılık dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (discrete) ve sürekli (continuous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Poisson…

Kesikli Uniform Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Discrete Uniform Probability Distribution

Bir çok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılıkları dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (disrete) ve sürekli (continous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Kesikli…

Binom Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on Binomial Probability Distribution

Bir çok analiz yönteminin temelini olasılık dağılımları oluşturmaktadır. İşin esasında olasılıkları dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (disrete) ve sürekli (continous) dağılımlar başlıklar halinde verildikten sonra kesikli dağılım türlerinden biri olan Binom…

Şans Oyunları Perspektifinden Olasılık : Probability from Perspective of the Chance Games

Rastlantı ya da kesin olmayan olaylarla ilgilenen olasılık teorisi, rastlantı olaylarını belirli kurallara göre matematik disiplininde inceleyen bir bilim dalıdır. Rastlantı olayından kasıt gerçekleşmesi şansa bağlı olan önceden kesin olarak bilinmeyen olaylardır. Burada olabildiğince yalın bir şekilde uygulamalı örneklerin şans oyunları üzerinden verilmesinin nedeni olasılık konusuna dikkat çekmektir, yoksa amaç bu oyunları oynamaya özendirmek veya…

Bulut Bilişim Nereye Evriliyor? : Where is Cloud Computing Evolving into?

Bulut bilişim veya sanal bulut derken ne anlamalıyız? Atmosferde gözlemlediğimiz su damlacıkları ve buz taneciklerinin yoğunlaşmasıyla oluşan doğal bulut mu yoksa internet üzerinde oluşturulan sanal bir bulut mu? Hâlâ bulut bilişim veya sanal bulut kavramı kafa karışıklığı oluşturduğu için bu makalede hem sanal bulutu açıklamak hem de bulut bilişimin nereye doğru evrildiği ele alınarak farkındalık…

Bernoulli Olasılık Dağılımı Üzerine Bir Vaka Çalışması: A Case Study on the Bernoulli Probability Distribution

Olasılık konusu öteden beri ilgimi çekmiş ve ara ara üzerine yoğunlaşma fırsatım olmuştur. Çoğu analiz yönteminin temelini oluşturan olasılık dağılımları da böyledir. İşin esasında olasılıkları dağılımları tam anlaşılmadan analiz yöntemleri ile istenilen sonuçların elde edilmesi tek başına bazıları için yeterli olsa da işin felsefesini anlamak açısından kesinlikle yetersizdir. Bu nedenle bu çalışmada öncelikle kesikli (disrete)…

R’da Poisson ve Negatif Binom Regresyon Yöntemleri Üzerine Bir Vaka Çalışması: A Case Study on Poisson and Negative Binomial Regression Methods in R

Giriş Regresyon analizi yöntemlerinden biri olan poisson regresyon analiz yöntemi, bağımlı değişkenin ya da cevap değişkenininnicel kesikli ve pozitif (sayma sayıları) olduğu bağımlı değişkenler (dependent variables) ile bağımsız değişken veya değişkenler (independent variables) arasındaki ilişkiyi ortaya koyan regresyon analiz yöntemidir. Genel olarak bağımlı değişkenin veri tipi yapılacak analiz yöntemlerinde belirleyici rol oynamaktadır. Dolayısıyla veri tiplerinin…

COVID-19 ve Dijital Dönüşüm: COVID-19 and Digital Transformation

Kaynak:https://www.cio.com Birleşmiş Milletler Sınai Kalkınma Örgütü (UNIDO) tarafından 10 Temmuz 2020 tarihinde içerisinde ağırlıklı olarak Covid-19 pandemisinin dijitalleşme üzerindeki etkisinin ele alındığı “Covid-19 Olası Sonuçlar ve Cevaplar: Dijital Dönüşüm ve Endüstriyel İyileşme” adlı rapor yayımlanmıştır. Pandemik kriz uluslararası topluma özellikle ileri üretim teknolojileri ve dijitalleşme yoluyla uluslararası kalkınma sorunlarına işbirliği çözümleri sunarak dijital dönüşümü hızlandırma…

R’da Çoklu Doğrusal Regresyon Üzerine Bir Vaka Çalışması: A Case Study on Multiple Linear Regression (MLR) in R

Giriş Regresyon analizi yöntemlerinden biri olan multiple (çoklu) regresyon analiz (MRA) yöntemi, bağımlı değişkenin ya da cevap değişkenininnicel sürekli veya kesikli olduğu bağımlı değişkenler (dependent variables) ile bağımsız değişken veya değişkenler (independent variables) arasındaki ilişkiyi ortaya koyan regresyon analiz yöntemidir. Veri tipleri kendi içerisinde 4 farklı alt sınıfta ele alınabilir. Bu veri tipleri Şekil 1’de…

R’da Multinominal Lojistik Regresyon Üzerine Bir Vaka Çalışması: A Case Study on Multinominal Logistic Regression in R

Lojistik regresyon analizi yöntemlerinden biri olan multinominal lojistik regresyon analiz yöntemi, bağımlı değişkenin ya da cevap değişkeninin 2’den fazla kategoriye sahip olduğu durumlarda bağımlı değişkenler (dependent variables) ile bağımsız değişken veya değişkenler (independent variables) arasındaki ilişkiyi ortaya koyan regresyon analiz yöntemidir. Burada bağımlı değişkenin multinominal olmasından kasıt kategorik değişkenin ikiden fazla cevap seçeneği olduğu anlaşılmalıdır….

Haziran 2020 Küresel Ekonomik Beklentiler Raporu

Dünya Bankası tarafından 8/6/2020 tarihinde 238 sayfalık Küresel Ekonomik Beklentiler (Global Economic Prospects) raporunun Haziran 2020 sayısı yayınlanmıştır. Raporun bu baskısında COVID-19 pandemisinin etkilerini değerlendirilmekte ve projeksiyonlar çizilerek sonuçları analiz edilmektedir. Aynı zamanda raporda küresel toplumun ihtiyaç duyduğu alınacak politika tedbirlerini ortaya koyarak önerilerde bulunulmaktadır. COVID-19 resesyonu, 1870’ten bu yana pandeminin neden olduğu ilk resesyondur….

R’da Binary Lojistik Regresyon Üzerine Bir Vaka Çalışması: A Case Study on Binary Logistic Regression in R

Lojistik regresyon analizi yöntemlerinden biri olan binary (ikili: binomial) lojistik regresyon analiz yöntemi, bağımlı değişkenin ya da cevap değişkeninin iki kategoriye sahip olduğu durumlarda bağımlı değişkenler (dependent variables) ile bağımsız değişken veya değişkenler (independent variables) arasındaki ilişkiyi ortaya koyan regresyon analiz yöntemidir. Burada bağımlı değişkenin binomial olmasından kasıt kategorik değişkenin iki cevap seçeneği olduğu anlaşılmalıdır….

İnsanın Dijital İkizi Oluşturulabilir Mi?: Can A Human’s Digital Twin Be Created?

Kaynak: https://www.imeche.org Dijital dönüşümde anahtar rol oynayan nesnelerin interneti (IoT) ve endüstriyel nesnelerin interneti (IIoT)’nin ortaya çıkmasıyla hız kazanan dijital ikiz, Endüstri 4.0 (Industry 4.0), Toplum 5.0 (Society 5.0) devrimlerinin ve Akıllı Ulus (Smart Nation) programının ön planında yer alan bir simülasyon teknolojisidir. Endüstri 4.0 devrimi 2011 yılında Almanya, Toplum 5.0 2015 yılında Japonya ve…

Topluluk Öğrenme Algoritmalarından Gradyan Yükseltme Algoritması İle Gögüs Kanserinin Tahmini Üzerine Bir Vaka Çalışması: A Case Study on the Prediction of Breast Cancer Using Gradient Boosting Algorithm from Ensemble Learning Algorithms

Giriş Topluluk (ensemble) öğrenme algoritmaları tahmine dayalı analitik çalışmalarda en başarılı yaklaşımlardan biridir. Bu algoritmalar somut bir problemi çözmek için bir araya gelen modeller setinden oluşmaktadır. Amaç modeller setinin ürettiği tahminleri birleştirerek doğruluğu (accuracy) artırmaktır. Topluluk algoritmaları kendi içerisinde üç grupta ele alınır. Torbalama (Bagging: Bootsrap Aggregating) Yükseltme (Boosting) AdaBoost Gradient Boosting XGBoost LightGBM İstif…

Topluluk Öğrenme Algoritmalarından Yükseltme Algoritması İle Gögüs Kanserinin Tahmini Üzerine Bir Vaka Çalışması: A Case Study on the Prediction of Breast Cancer Using Boosting Algorithm from Ensemble Learning Algorithms

Giriş Topluluk (ensemble) öğrenme algoritmaları tahmine dayalı analitik çalışmalarda en başarılı yaklaşımlardan biridir. Bu algoritmalar somut bir problemi çözmek için bir araya gelen modeller setinden oluşmaktadır. Amaç modeller setinin ürettiği tahminleri birleştirerek doğruluğu (accuracy) artırmaktır. Topluluk algoritmaları kendi içerisinde üç grupta ele alınır. Torbalama (Bagging: Bootsrap Aggregating) Yükseltme (Boosting) AdaBoost Gradient Boosting XGBoost LightGBM İstif…

Topluluk Öğrenme Algoritmalarından Torbalama Algoritması İle Konut Fiyatlarının Tahmini Üzerine Bir Vaka Çalışması: A Case Study on the Prediction of Housing Prices Using Bagging Algorithm from Ensemble Learning Algorithms

Giriş Topluluk (ensemble) öğrenme algoritmaları tahmine dayalı analitik çalışmalarda en başarılı yaklaşımlardan biridir. Bu algoritmalar somut bir problemi çözmek için bir araya gelen modeller setinden oluşmaktadır. Amaç modeller setinin ürettiği tahminleri birleştirerek doğruluğu (accuracy) artırmaktır. Topluluk algoritmaları kendi içerisinde üç grupta ele alınır. Torbalama (Bagging: Bootsrap Aggregating) Artırma (Boosting) İstif (Stacking) Topluluk (ensemble) öğrenme algoritmalarından…

Düşük Doğurganlık Türkiye İçin Tehdit Mi Oluşturuyor?

Bilindiği üzere Türkiye İstatistik Kurumu (TÜİK) yakın zamanda Türkiye için önemli nüfus göstergelerinden biri olan toplam doğurganlık hızlarını açıkladı. Bir kadının doğurganlık dönemini içine alan 15 ile 49 yaş arasında doğurabileceği ortalama çocuk sayısını gösteren toplam doğurganlık hızı ürkütücü seviyelere düştü. Gelişmiş ülkelerde bir neslin yenilenme düzeyi eşik değeri 2,10 seviyesi olarak görülmektedir. Diğer bir…

Prediction of Size of the COVID-19 Pandemic Using Wavelength Models: Cases of Turkey and World [Dalgaboyu Modelleri Kullanarak COVID-19 Pandemisinin Büyüklüğünün Tahmini: Türkiye ve Dünya Vakaları]

Başta Koronavirüs (COVID-19) olmak üzere diğer salgınların büyüklüğünü ortaya koymak için dalga boylarını ölçmeye yönelik geliştirdiğim sayısal modeller ön incelemeden geçerek Yale üniversitesi destekli medRxiv (Medical Archive)’de 11.4.2020 tarihinde yayınlanmıştı. Geliştirilen modellerin makalesine aşağıdaki linki tıklayarak ulaşabilirsiniz. https://www.medrxiv.org/content/10.1101/2020.04.07.20056432v1.article-info Makalenin adı: Bulut T. New Epidemiological Model Suggestions Revealing Size of Epidemics Based on the COVID-19 Pandemic Example: Wavelength…

Doğurganlık Hızı Fırsat Mı Tehdit Mi?

Bilindiği üzere Türkiye İstatistik Kurumu (TÜİK) yakın zamanda Türkiye için önemli nüfus göstergelerinden biri olan toplam doğurganlık hızlarını açıkladı. Bir kadının doğurganlık dönemini içine alan 15 ile 49 yaş arasında doğurabileceği ortalama çocuk sayısını gösteren toplam doğurganlık hızı ürkütücü seviyelere düştü. Gelişmiş ülkelerde bir neslin yenilenme düzeyi eşik değeri 2,10 seviyesi olarak görülmektedir. Diğer bir…

Topluluk Öğrenme Algoritmalarından Torbalama Algoritması İle Gögüs Kanserinin Tahmini Üzerine Bir Vaka Çalışması: A Case Study on the Prediction of Breast Cancer Using Bagging Algorithm from Ensemble Learning Algorithms

Giriş Topluluk (ensemble) öğrenme algoritmaları tahmine dayalı analitik çalışmalarda en başarılı yaklaşımlardan biridir. Bu algoritmalar somut bir problemi çözmek için bir araya gelen modeller setinden oluşmaktadır. Amaç modeller setinin ürettiği tahminleri birleştirerek doğruluğu (accuracy) artırmaktır. Topluluk algoritmaları kendi içerisinde üç grupta ele alınır. Torbalama (Bagging: Bootsrap Aggregating) Artırma (Boosting) İstif (Stacking) Topluluk (ensemble) öğrenme algoritmalarından…

Türkiye’deki COVID-19 Pandemisinin Büyüklüğü: Size of the Covid-19 Pandemics in Turkey

Dünyayı derinden etkileyen koronavirüs pandemisinin mevcut durumdaki büyüklüğünü ortaya koymaya yönelik geliştirdiğim epidemiyolojik dalga boyu modelleri Yale Üniversitesi destekli Uluslararası Tıp Arşivinde ön baskı olarak yayınlanmıştır. Bu modeller kullanılarak Türkiye’deki koronavirüs salgınının büyüklüğü dalga boyu uzunluğu olarak hesaplanmıştır. Analizde kullanılan vaka sayılarına ilişkin veri seti Sağlık Bakanlığı resmi web sitesinden edinilmiştir. Elde edilen bulgular Şekil…

Temel Bileşenler Analizi Üzerine Bir Vaka Çalışması: A Case Study on Principal Component Analysis (PCA)

Büyük veri setleri birçok disiplinde giderek yaygınlaşmaktadır. Bu tür veri kümelerini yorumlamak için, verilerdeki bilgilerin çoğu korunacak şekilde boyutsallıklarını yorumlanabilir bir şekilde önemli ölçüde azaltmak için yöntemlere ihtiyaç vardır. Bu amaç için birçok teknik geliştirilmiştir, ancak temel bileşenler analizi (PCA) en eski ve en yaygın kullanılanlardan biridir. Fikri basittir – mümkün olduğunca çok ‘değişkenliği’ korunurken…

R Programlama Diliyle Sınıflandırma Problemlerinin Çözümünde Karar Ağacı Algoritmaları Üzerine Bir Vaka Çalışması: A Case Study on Decision Tree Algorithms in Solving Classification Problems with R Programming Language

Giriş Günümüzde veri madenciliği uygulamalarının yaygınlaşması ve büyük veri kavramının öne çıkmasıyla birlikte analiz metotları da değişmiştir. Bugüne kadar genellikle bulut (cloud) veri tabanları üzerindeki veri setleri indirilerek analize konu ediliyordu. Ancak gelişen teknoloji veri madenciliği yöntemlerinde de önemli değişiklikler ve bazı soruları beraberinde getirmiştir. Bu sorulardan bazıları şöyledir: Online veya offline olarak dokümanlarda analize…

R Programlama Diliyle Sınıflandırma Problemlerinin Çözümünde Küme Algoritmaları Üzerine Bir Vaka Çalışması: A Case Study on Cluster Algorithms in Solving Classification Problems with R Programming Language

Giriş Küme geçmeden önce temel kavramları açıklamak konunun anlaşılması açısından önem taşıdığından ilk olarak kısaca bu kavramlara yer verilmiştir. Küme, benzer özellikleri içinde barındıran topluluk olarak tanımlanabilir. Bu topluluk insan, hayvan, bitki topluluğu olabileceği gibi nesnelerin oluşturduğu topluluk da olabilir. Benzer özellikler taşıyan bu topluluklar diğer kümelerden farklılaşır. Kümeleme (clustering) analizini ise benzer özelliklere sahip…

R Programlama Diliyle Regresyon Problemlerinin Çözümünde Rastgele Orman Algoritması Üzerine Bir Vaka Çalışması: A Case Study on Random Forest (RF) Algorithm in Solving Regression Problems with R Programming Language

Giriş Rastgele Orman (RF) algoritması , 2001 yılında Breiman tarafından karar ağaçlarının bir kombinasyonu olarak önerilmiştir. RF en iyi “her ağaç, bağımsız olarak örneklenen ve ormandaki tüm ağaçlar için aynı dağılıma sahip rastgele bir vektörün değerlerine bağlı olacak şekilde ağaç belirleyicilerinin kombinasyonu” olarak tanımlanan bir topluluk makine öğrenme algoritmasıdır. Topluluk algoritması gerek regresyon gerekse sınıflandırma…

R Programlama Diliyle Sistematik Örnekleme Üzerine Bir Vaka Çalışması: A Case Study on Systematic Sampling with R Programming Language

Giriş Daha önce basit tesadüfi örnekleme (simple random sampling) üzerine burada çalışmalar yapılmıştı. İlgilenecekler için aşağıda yararlanılan kaynaklar kısmında bu çalışmaların linklerine yer verilmiştir. Bu çalışmada ise örnek bir uygulama üzerinden ve olabildiğince yalın bir dille sistematik örnekleme yapılacak ve R programlama dili kullanılacaktır. Ancak R programlama dili bilmeyenler için Microsoft Excel kullanarak sistematik örnekleme…

Microsoft Excel’de Sistematik Örnekleme Üzerine Bir Vaka Çalışması: A Case Study on Systematic Sampling in Microsoft Excel

Giriş Daha önce basit tesadüfi örnekleme (simple random sampling) üzerine burada çalışmalar yapılmıştı. İlgilenecekler için aşağıda yararlanılan kaynaklar kısmında bu çalışmaların linklerine yer verilmiştir. Bu çalışmada ise örnek bir uygulama üzerinden ve olabildiğince yalın bir dille sistematik örnekleme yapılacaktır. Sistematik örnekleme, 1’den N’e kadar olan popülasyon birimlerinden ilk seçimin tesadüfi bir şekilde seçilmesinden sonra örneklem…

Tekrarsız Basit Tesadüfi Örnekleme Yöntemi Kullanılarak t Dağılım Tablosu Üzerinden Güven Aralığının Hesaplanmasına Yönelik Bir Simülasyon Çalışması: A Simulation Study for Calculation of Confidence Interval (CI) Based on t Distribution Table Using Simple Random Sampling Method without Replacement

Güven aralıkları ingilizce ifadeyle confidence interval (CI) hem sahadan veri toplama yöntemleriyle elde edilen birincil verilerin hem de veri tabanlarından elde edilen işlenmiş ikincil verilerin analizinde çok yoğun bir şekilde kullanılmaktadır. Peki nedir bu güven aralığı? Güven aralığının hesaplanması için hangi parametrelere ihtiyaç vardır? Güven aralığı nasıl hesaplanır? Güven aralığını etkileyen faktörler nelerdir? Bu çalışmada…

Tekrarsız Basit Tesadüfi Örnekleme Yöntemi Kullanılarak Z Tablosu Üzerinden Güven Aralığının Hesaplanmasına Yönelik Bir Simülasyon Çalışması: A Simulation Study for the Calculation of Confidence Interval (CI) Based on Z Table Using Simple Random Sampling Method without Replacement

Güven aralıkları ingilizce ifadeyle confidence interval (CI) hem sahadan veri toplama yöntemleriyle elde edilen birincil verilerin hem de veri tabanlarından elde edilen işlenmiş ikincil verilerin analizinde çok yoğun bir şekilde kullanılmaktadır. Peki nedir bu güven aralığı? Güven aralığının hesaplanması için hangi parametrelere ihtiyaç vardır? Güven aralığı nasıl hesaplanır? Güven aralığını etkileyen faktörler nelerdir? Bu çalışmada…

R Programlama Diliyle Sınıflandırma Problemlerinin Çözümünde Rastgele Orman Algoritması Üzerine Bir Vaka Çalışması: A Case Study on Random Forest (RF) Algorithm in Solving Classification Problems with R Programming Language

Giriş Rastgele Orman (RF) algoritması , 2001 yılında Breiman tarafından karar ağaçlarının bir kombinasyonu olarak önerilmiştir. RF en iyi “her ağaç, bağımsız olarak örneklenen ve ormandaki tüm ağaçlar için aynı dağılıma sahip rastgele bir vektörün değerlerine bağlı olacak şekilde ağaç belirleyicilerinin kombinasyonu” olarak tanımlanan bir topluluk makine öğrenme algoritmasıdır. Topluluk algoritması gerek regresyon gerekse sınılandırma…

Ordinal Lojistik Regresyon Üzerine Bir Vaka Çalışması: A Case Study on Ordinal Logistic Regression

Lojistik regresyon analizi yöntemlerinden biri olan ordinal (sıralı) regresyon analiz yöntemi, bağımlı değişkenin ya da cevap değişkeninin ordinal (sıralı) kategorik olduğu durumlarda bağımlı değişkenler (dependent variables) ile bağımsız değişken veya değişkenler (independent variables) arasındaki ilişkiyi ortaya koyan regresyon analiz yöntemidir. Burada bağımlı değişkenin ordinal olmasından kasıt kategorik değişkenin bir sıra veya derece belirtmesi anlaşılmalıdır. Ordinal…

Z Tablosuna Göre Güven Aralığının Hesaplanmasına Yönelik Bir Simülasyon Çalışması: A Simulation Study for Calculating Confidence Interval by Z Table

Güven aralıkları ingilizce ifadeyle confidence interval (CI) hem sahadan veri toplama yöntemleriyle elde edilen birincil verilerin hem de veri tabanlarından elde edilen işlenmiş ikincil verilerin analizinde çok yoğun bir şekilde kullanılmaktadır. Peki nedir bu güven aralığı? Güven aralığının hesaplanması için hangi parametrelere ihtiyaç vardır? Güven aralığı nasıl hesaplanır? Güven aralığını etkileyen faktörler nelerdir? Bu çalışmada…

14 Nisan 2020 Tarihi İtibariyle COVID-19 Pandemi Vakalarının Tahmini ve İnterpolasyonu: Türkiye Örneği (As of April 14, 2020, Prediction and Interpolation of COVID-19 Pandemic Cases)

Giriş / Introduction Coronavirüsler (CoV), soğuk algınlığından Orta Doğu Solunum Sendromu (MERS-CoV) ve Şiddetli Akut Solunum Sendromu (SARS-CoV) gibi daha ciddi hastalıklara kadar pek çok hastalığa neden olan büyük bir virüs ailesidir. Bu yeni virüse, yüzey çıkıntıları taç görünümünde olduğu için coronavirus adı verilmiş olup, bu virüs ailesi tek zincirli, pozitif polariteli, zarflı RNA virüsleridir….

New Epidemiological Model Suggestions Revealing Size of Epidemics Based on the COVID-19 Pandemic Example: Wavelength Models (COVID-19 Pandemi Örneğine Dayalı Salgınların Büyüklüğünü Ortaya Koyan Yeni Epidemiyolojik Model Önerileri: Dalgaboyu Modelleri)

Başta Koronavirüs (COVID-19) olmak üzere diğer salgınların dalga boylarını ölçmeye yönelik geliştirdiğim sayısal modeller ön incelemeden geçerek Yale üniversitesi destekli medRxiv (Medical Archive)’de 11.4.2020 tarihinde yayınlanmıştır. Geliştirilen modellerin makalesine aşağıdaki linki tıklayarak ulaşabilirsiniz. https://www.medrxiv.org/content/10.1101/2020.04.07.20056432v1.article-info Bulut T. New Epidemiological Model Suggestions Revealing Size of Epidemics Based on the COVID-19 Pandemic Example: Wavelength Models. medRxiv; 2020. DOI:…