Öne çıkan

Virüs, Kriz ve Yapay Zeka Arama Terimlerine Bağlı Olarak Google Trend Verilerinin Ülkeler Açısından Karşılaştırmalı Analizi: Comparative Analysis of Google Trend Data Based on Virus, Crisis and AI Search Terms by Countries

Bilindiği üzere Google Trends ile bir ülke veya bölgede öne çıkan içerikler ortaya konulabilmektedir. Google Trends, Google Arama’da en çok yapılan arama sorgularının çeşitli bölge ve dillerdeki popülerliğini analiz eden bir Google web sitesidir. Web sitesi, zaman içindeki farklı sorguların arama hacmini karşılaştırmalı olarak ortaya koyan grafikler sunmaktadır. Google Trendler ayrıca, kullanıcılara iki veya daha fazla arama terimi ile göreli arama hacmini karşılaştırmasına olanak da tanımaktadır.

Araştırma kapsamında ilk üç çalışma yapılarak ülkelere göre karşılaştırmalı olarak ortaya konulacaktır. İlk çalışmada “virüs” aramalarının seyri, ardından ise “kriz” ve “yapay zeka” arama terimlerinin ülkelere göre ve dünyadaki seyri incelenecektir. Son kısımda ise “Suriye” arama terimleri Türkiye özelinde ele alınacaktır.

Metodoloji ve Bulgular

a) İlk Çalışma

Çalışma kapsamında 01-01-2020 ile 31-01-2021 tarihleri arasında “virüs” arama terimine bağlı olarak başta COVID-19 olmak üzere bütün virüs kaynaklı aramaların Amerika, Türkiye, Kanada, Fransa özelinde ve Dünya ölçeğinde izlediği seyrin ortaya konulması amaçlanmıştır. Aynı zamanda bu arama verisinden yola çıkarak gelecek 1 yıl için tahmin yapılmıştır.

b) İkinci Çalışma

Çalışma kapsamında 01-01-2004 ile 27-10-2020 tarihleri arasında “kriz” arama terimine bağlı olarak başta ekonomik ve sağlık olmak üzere kriz aramalarının Amerika, Türkiye, Kanada, Fransa özelinde ve Dünya ölçeğinde izlediği seyrin ortaya konulması amaçlanmıştır.

c) Üçüncü Çalışma

Bu kısımda 01-01-2004 ile 31-01-2021 tarihleri arasında “yapay zeka” arama terimine bağlı olarak Amerika, Türkiye, Kanada, Fransa özelinde ve Dünya ölçeğinde yapay zeka arama teriminin hit sayıları üzerinden izlediği seyrin ortaya konulması amaçlanmıştır.

d) Dördüncü Çalışma

Bu bölümde 29-04-2011 ile 01-02-2021 tarihleri arasında “Suriye” arama terimine bağlı olarak Türkiye‘de Suriye arama teriminin hit sayıları üzerinden izlediği seyrin ortaya konulması amaçlanmıştır. Ayrıca Suriye arama terimiyle ilişkili diğer aramalar da bu çalışma kapsamında ortaya konulmuştur.

Uygulama ve Bulgular

Çalışma kapsamında R programlama dili kullanılmıştır. Veri gtrendsR paketi ile Google Trends veri tabanından eş zamanlı olarak alınacaktır. O zaman işe koyulma zamanı 🙂 . İlk olarak yüklenecek R paketlerini verelim. Arama terimleri karşılaştırılacak ülkenin kullandığı dile göre yapılmalıdır.

Yüklenecek kütüphaneler

Yüklenecek kütüphane konusunda her zamanki gibi bonkorüm galiba 🙂 ; daha az kütüphaneyle de aynı analizleri yapabilirsiniz. Ancak daha çok esneklik ve estetik tasarım tanıdığı için olması gerekenden fazla kütüphane ile çalışıyorum.

kutuphane<-c("dplyr","tibble","tidyr","ggplot2","formattable","ggthemes","readr","readxl","ggpubr","formattable", "ggstance","pander", "gtrendsR","explore", "lubridate", "writexl", "tidytext","prophet")
yukle<-sapply(kutuphane, require, character.only = TRUE)
yukle

a) İlk Çalışma

Bu kısımda 01-01-2020 ile 31-01-2021 tarihleri arasında “virüs” arama terimine bağlı olarak Amerika, Türkiye, Kanada ve Fransa özelinde izlediği seyir ortaya konulmuştur. Aynı zamanda bu arama verisinden yola çıkarak gelecek 1 yıl için tahmin yapılmıştır.

arama = gtrends(c("virus","virus","virüs", "virus"), geo = c("US","CA","TR", "FR"), gprop = "web", time = "2020-01-01 2021-01-31")[[1]]
arama=arama %>% mutate(geo = recode(geo, 
  "US" = "ABD",
  "CA" = "Kanada",
  "TR" = "Türkiye",
  "FR" = "Fransa"))

ggplot(data = arama, aes(x = date, y = hits, group = geo)) +
  geom_line(size = 1, alpha = 0.7, aes(color = geo), show.legend = FALSE) +
  geom_point(size = 0) +
  theme(legend.title=element_blank(), axis.title.x = element_blank()) +
  ylab("Hit Sayısı") + 
  xlab("Tarih")+
  ggtitle("Virüs Arama Terimine Göre Google Trendleri")+
  facet_wrap(~geo)+
  theme_hc()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra virüs arama terimine göre Google Trendleri karşılaştırmalı olarak aşağıdaki grafikte verilmiştir. Grafiğe göre virüs arama terimi hit sayısının bütün ülkelerde Mart 2020’de zirveye ulaştığı görülmektedir. Ancak bu ülkeler içerisinde en yüksek hit sayısı ABD’de görülürken en düşük hit sayısı Türkiye’de görülmüştür. 2021 yılının ocak ayında ise bütün ülkeler en düşük hit sayısına sahip olduğu görülmektedir.

Yukarıdaki arama trend verilerine bağlı olarak bir de Facebook tarafından geliştirilen prophet paketi kullanarak gelecek 1 yıla ilişkin ülkelere göre tahmin yapalım. Önceliği Türkiye’ye verelim 🙂 .

# 1 Yıllık Tahmin
TR<-filter(arama, geo=="Türkiye")

tahmin <- TR[,c("date","hits")]
colnames(tahmin) <-c("ds","y")

t1 <- prophet(tahmin)

gelecek <- make_future_dataframe(t1, periods = 365)
ongoru <- predict(t1, gelecek)
plot(t1, ongoru)

Yukarıdaki R kod bloğunun çalıştırılmasından Türkiye için gelecek 1 yıllık (2022 yılının 31 Ocağına kadar) virüs arama trendi aşağıdaki grafikte verilmiştir. Görüleceği üzere virüs arama trendinin %95 güven aralığı içerisinde azalan bir trend ortaya koyduğu görülmektedir.

Türkiye tahmin verilerini aşağıda yazdığım R kod bloğu ile xlsx uzantılı Microsoft Excel çalışma kitabına yazdırdım.

turkiye=forecast[c('ds', 'yhat',  'yhat_lower', 'yhat_upper')] 
write_xlsx(turkiye, "turkiyetahminleri.xlsx")

Yukarıdaki R kod bloğu çalıştırıldıktan sonra elde edilen Türkiye virüs arama 1 yıllık tahmin verilerini güven aralıklarıyla birlikte aşağıdan indirebilirsiniz.

Yukarıdaki arama trend verilerine bağlı olarak gelecek 1 yıla ilişkin ABD virüs arama tahminlerini ortaya koyalım.

ABD<-filter(arama, geo=="ABD")
tahmin <- ABD[,c("date","hits")]
colnames(tahmin) <-c("ds","y")

t1 <- prophet(tahmin)
gelecek <- make_future_dataframe(t1, periods = 365)
ongoru <- predict(t1, gelecek)
plot(t1, ongoru)

Yukarıdaki R kod bloğunun çalıştırılmasından ABD için gelecek 1 yıllık (2022 yılının 31 Ocağına kadar) virüs arama trendi aşağıdaki grafikte verilmiştir. Görüleceği üzere virüs arama trendinin %95 güven aralığı içerisinde azalan bir trend ortaya koyduğu görülmektedir. Ancak bu azalma trendi Türkiye’den daha hızlı ve keskindir. Bunu sol tarafta yer alan y (tahmin) değerlerinden rahatlıkla görüyoruz.

Yukarıdaki arama trend verilerine bağlı olarak şimdi de gelecek 1 yıla ilişkin Fransa virüs arama tahminlerini ortaya koyalım.

fr<-filter(arama, geo=="Fransa")
tahmin <- fr[,c("date","hits")]
colnames(tahmin) <-c("ds","y")

t1 <- prophet(tahmin)
gelecek <- make_future_dataframe(t1, periods = 365)
ongoru <- predict(t1, gelecek)
plot(t1, ongoru)

Yukarıdaki R kod bloğunun çalıştırılmasından Fransa için gelecek 1 yıllık (2022 yılının 31 Ocağına kadar) virüs arama trendi aşağıdaki grafikte verilmiştir. Görüleceği üzere virüs arama trendinin %95 güven aralığı içerisinde diğer ülkelerdekine benzer olarak azalan bir trend ortaya koyduğu görülmektedir. Ancak bu azalma trendi Türkiye’den ve ABD’den daha düşüktür. Bunu sol tarafta yer alan y (tahmin) değerlerinden rahatlıkla görüyoruz.

Yukarıdaki arama trend verilerine bağlı olarak son olarak gelecek 1 yıla ilişkin Kanada virüs arama tahminlerini ortaya koyalım.

kn<-filter(arama, geo=="Kanada")
tahmin <- kn[,c("date","hits")]
colnames(tahmin) <-c("ds","y")

t1 <- prophet(tahmin)
gelecek <- make_future_dataframe(t1, periods = 365)
ongoru <- predict(t1, gelecek)
plot(t1, ongoru)

Yukarıdaki R kod bloğunun çalıştırılmasından Kanada için gelecek 1 yıllık (2022 yılının 31 Ocağına kadar) virüs arama trendi aşağıdaki grafikte verilmiştir. Görüleceği üzere virüs arama trendinin %95 güven aralığı içerisinde diğer ülkelerdekine benzer olarak azalan bir trend ortaya koyduğu görülmektedir. Ancak bu azalma trendi Türkiye ve Fransa’dan daha yüksek iken ABD ile benzerdir. Bunu sol tarafta yer alan y (tahmin) değerlerinden rahatlıkla görüyoruz.

Virüs” arama terimine bağlı olarak Dünyadaki google trendlerine de elimiz değmişken aşağıda yazdığım R kod bloğu ile bakalım 🙂 .

virus = gtrends(c("virus","virus","virüs", "virus"), gprop = "web", time = "2020-01-01 2021-01-31")[[1]]

virus= virus  %>% mutate(hits=as.numeric(hits))

ggplot(data = virus, aes(x = date, y = hits)) +
  geom_line(size = 1, alpha = 0.7, aes(color = geo), show.legend = FALSE) +
  geom_point() +
  theme(legend.title=element_blank(), axis.title.x = element_blank()) +
  ylab("Hit Sayısı") + 
  xlab("Tarih")+
  ggtitle("Virüs Terimine Göre Dünyada Google Trendleri")+
  theme_economist_white()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra Dünyadaki “virüs” arama google trendleri aşağıdaki grafikte verilmiştir.

b) İkinci Çalışma

Bu bölümde 01-01-2004 ile 27-10-2020 tarihleri arasında “kriz” arama terimine bağlı olarak başta ekonomik ve sağlık olmak üzere kriz aramalarının Amerika, Türkiye, Kanada ve Fransa özelinde izlediği seyir aşağıda yazılan kod bloğu ile ortaya konulmuştur. Elde edilen bulgular ülkelere ve yıllara göre karşılaştırmalı olarak verilmiştir.

kriz = gtrends(c("crisis","crisis","kriz", "crise"), geo = c("US","CA","TR", "FR"), gprop = "web", time = "2004-01-01 2020-10-27")[[1]]

kriz=kriz %>% mutate(geo = recode(geo, 
  "US" = "ABD",
  "CA" = "Kanada",
  "TR" = "Türkiye",
  "FR" = "Fransa"))

ggplot(data = kriz, aes(x = date, y = hits, group = geo)) +
  geom_line(size = 1, alpha = 0.7, aes(color = geo), , show.legend = FALSE) +
  geom_point(size = 0) +
  theme(legend.title=element_blank(), axis.title.x = element_blank()) +
  ylab("Hit Sayısı") + 
  xlab("Tarih")+
  ggtitle("Kriz Arama Terimine Göre Google Trendleri")+
  facet_grid(~geo)+
  theme_hc()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra elde “kriz” arama terimine bağlı olarak elde edilen bulgular ülkelere ve yıllara göre karşılaştırmalı olarak aşağıdaki grafikte verilmiştir. Elde edilen bulgulara göre kriz terimi arama sayısının en yüksek olduğu ülke Fransa olup, en yüksek olduğu tarih ise 01.10.2008 tarihidir. Bu tarihte Fransa’da kriz arama terimindeki hit sayısı 100’dür. Genel olarak bakıldığında karşılaştırılan ülkeler içerisinde Fransa’da kriz arama terimine bağlı olarak ortaya çıkan hit sayıları ve bu hit sayılarının seyri diğer ülkelere göre daha yüksek olduğu söylenebilir. Türkiye özelinde bakıldığında ise kriz arama terimine bağlı olarak ortaya çıkan hit sayıları açısından en düşük ülkedir. Ancak Türkiye kendi içerisinde değerlendirildiğinde kriz arama teriminin sayısının en yüksek olduğu ilk 3 tarih hit sayısına göre şöyledir: 03.01.2004 (Hit sayısı: 24), 11.01.2008 (Hit sayısı: 23) ve 05.01.2004 (Hit sayısı: 22).

Türkiye için en yüksek ilk 10 kriz hit sayısının olduğu tarihler ise aşağıda yazılan kod bloğu ile verilmiştir.

kriz %>% filter(geo=="Türkiye") %>% select(date, hits) %>% arrange(desc(hits)) %>% head(10) %>% formattable()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra Türkiye için elde edilen en yüksek ilk 10 kriz hit sayısı tarihlere göre aşağıda verilmiştir.

Fransa için en yüksek ilk 10 kriz hit sayısının olduğu tarihler ise aşağıda yazılan kod bloğu ile verilmiştir.

kriz %>% filter(geo=="Fransa") %>% select(date, hits) %>% arrange(desc(hits)) %>% head(10) %>% formattable()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra Fransa için elde edilen en yüksek ilk 10 kriz hit sayısı tarihlere göre aşağıda verilmiştir.

Son olarak ABD için en yüksek ilk 10 kriz hit sayısının olduğu tarihler ise aşağıda yazılan kod bloğu ile verilmiştir.

kriz %>% filter(geo=="ABD") %>% select(date, hits) %>% arrange(desc(hits)) %>% head(10) %>% formattable()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra ABD için elde edilen en yüksek ilk 10 kriz hit sayısı tarihlere göre aşağıda verilmiştir.

“Kriz” arama terimine bağlı olarak elde edilen bulguların veri seti aşağıda yazılan R kod bloğu ile ülkelere ve tarihlere göre karşılaştırmalı olarak xlsx uzantılı Microsoft Excel çalışma kitabına yazdırdım.

write_xlsx(kriz, "ulkeverileri.xlsx")

Buradan bu veri setini indirebilirsiniz.

Kriz” arama terimine bağlı olarak Dünyadaki google trendlerine de elimiz değmişken aşağıda yazdığım R kod bloğu ile bakalım :).

crisis = gtrends(c("crisis","crisis","kriz", "crise"), gprop = "web", time = "2004-01-01 2020-10-27")[[1]]

crisis= crisis  %>% mutate(hits=as.numeric(hits))

ggplot(data = crisis, aes(x = date, y = hits)) +
  geom_line(size = 1, alpha = 0.7, aes(color = geo), show.legend = FALSE) +
  geom_point() +
  theme(legend.title=element_blank(), axis.title.x = element_blank()) +
  ylab("Hit Sayısı") + 
  xlab("Tarih")+
  ggtitle("Kriz Terimine Göre Dünyada Google Trendleri")+
  theme_economist_white()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra Dünyadaki “kriz” arama google trendleri aşağıdaki grafikte verilmiştir.

Dünyada en yüksek ilk 10 “kriz” arama terimi hit sayısının olduğu tarihler aşağıda yazılan kod bloğu ile verilmiştir.

crisis %>% mutate(hits=as.numeric(hits)) %>% select(date, hits) %>% arrange(desc(hits)) %>% head(10) %>% formattable()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra Dünyada en yüksek ilk “kriz” arama terimi hit sayısı tarihlere göre aşağıdaki tabloda verilmiştir. Zaten ortaya konulan bu bulgular hepimizin bildiği üzere 2008 yılının son aylarında ortaya çıkan ve dünyayı etkisi altına alan 2008 Dünya ekonomik krizini doğrular niteliktedir.

“Kriz” arama terimine bağlı olarak elde edilen bulguların veri seti aşağıda yazılan R kod bloğu ile tarihlere göre karşılaştırmalı olarak xlsx uzantılı Microsoft Excel çalışma kitabına yazdırdım.

veri=crisis %>% mutate(hits=as.numeric(hits))
write_xlsx(veri, "krizdunya.xlsx")

Buradan bu Dünya kriz veri setini indirebilirsiniz.

c) Üçüncü Çalışma

Bu bölümde 01-01-2004 ile 31-01-2021 tarihleri arasında “yapay zeka” arama terimine bağlı olarak Amerika, Türkiye, Kanada ve Fransa özelinde izlediği seyir aşağıda yazılan kod bloğu ile ortaya konulmuştur. Elde edilen bulgular ülkelere ve yıllara göre karşılaştırmalı olarak verilmiştir. Elde edilen bulgular ülkelere ve yıllara göre karşılaştırmalı olarak verilmiştir.

ai = gtrends(c("artificial intelligence","artificial intelligence","yapay zeka", "intelligence artificielle"), geo = c("US","CA","TR", "FR"), gprop = "web", time = "2004-01-01 2020-01-31")[[1]]

ai=ai %>% mutate(geo = recode(geo, 
  "US" = "ABD",
  "CA" = "Kanada",
  "TR" = "Türkiye",
  "FR" = "Fransa"))

ggplot(data = ai, aes(x = date, y = hits, group = geo)) +
  geom_line(size = 1, alpha = 0.7, aes(color = geo), , show.legend = FALSE) +
  geom_point(size = 0) +
  theme(legend.title=element_blank(), axis.title.x = element_blank()) +
  ylab("Hit Sayısı") + 
  xlab("Tarih")+
  ggtitle("Yapay Zeka Arama Terimine Göre Google Trendleri")+
  facet_grid(~geo)+
  theme_hc()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra elde “yapay zeka” arama terimine bağlı olarak elde edilen bulgular ülkelere ve yıllara göre karşılaştırmalı olarak aşağıdaki grafikte verilmiştir. Elde edilen bulgular yapay zeka arama trendlerinin dalgalı bir seyir izlediğini göstermektedir. Yapay zeka terimi arama sayısının en yüksek olduğu ülke Türkiye olup, en yüksek olduğu tarih ise 01.11. 2004 tarihidir. Bu tarihte Türkiye’de yapay zeka arama terimindeki hit sayısı 100’dür. Genel olarak bakıldığında karşılaştırılan ülkeler içerisinde Türkiye’de yapay zeka arama terimine bağlı olarak ortaya çıkan hit sayıları ve bu hit sayılarının seyri diğer ülkelere göre daha yüksek ve bu konunun daha popüler olduğu söylenebilir. Türkiye kendi içerisinde değerlendirildiğinde yapay zeka arama teriminin sayısının en yüksek olduğu ilk 3 tarih hit sayısına göre şöyledir: 01.11. 2004 (Hit sayısı: 100), 01.10.2004 (Hit sayısı: 98) ve 01.02.2004 (Hit sayısı: 95).

Türkiye için en yüksek ilk 10 yapay zeka hit sayısının olduğu tarihler aşağıda yazılan kod bloğu ile verilmiştir.

ai %>% filter(geo=="Türkiye") %>% select(date, hits) %>% arrange(desc(hits)) %>% head(10) %>% formattable()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra Türkiye için elde edilen en yüksek ilk 10 yapay zeka hit sayısı tarihlere göre aşağıda verilmiştir.

“Yapay zeka” arama terimine bağlı olarak elde edilen bulguların veri seti aşağıda yazılan R kod bloğu ile ülkelere ve tarihlere göre karşılaştırmalı olarak xlsx uzantılı Microsoft Excel çalışma kitabına yazdırdım.

write_xlsx(ai, "ulkeverileriai.xlsx")

Buradan bu veri setini indirebilirsiniz.

Yapay Zeka” arama terimine bağlı olarak Dünyadaki google trendlerine de elimiz değmişken aşağıda yazdığım R kod bloğu ile bakalım 🙂 .

ai = gtrends(c("artificial intelligence","artificial intelligence","yapay zeka", "intelligence artificielle"), gprop = "web", time = "2004-01-01 2020-01-31")[[1]]
ai= ai  %>% mutate(hits=as.numeric(hits))

ggplot(data = ai, aes(x = date, y = hits)) +
  geom_line(size = 1, alpha = 0.7, aes(color = geo), show.legend = FALSE) +
  geom_point() +
  theme(legend.title=element_blank(), axis.title.x = element_blank()) +
  ylab("Hit Sayısı") + 
  xlab("Tarih")+
  ggtitle("Yapay Zeka Terimine Göre Dünyada Google Trendleri")+
  theme_economist_white()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra Dünyadaki “yapay zeka” arama google trendleri aşağıdaki grafikte verilmiştir.

d) Dördüncü Çalışma

Bu bölümde 29-04-2011 ile 01-02-2021 tarihleri arasında “Suriye” arama terimine bağlı olarak Türkiye‘de Suriye arama teriminin hit sayıları üzerinden izlediği seyrin ortaya konulması amaçlanmıştır. Ayrıca Suriye arama terimiyle ilişkili diğer aramalar da bu çalışma kapsamında ortaya konulmuştur. Elde edilen bulgular yıllara göre karşılaştırmalı olarak verilmiştir.

TUR = gtrends("suriye", geo = "TR", gprop = "web", time = "2004-01-01 2020-02-01")
top<-filter(TUR$related_topics, related_topics=="top")
top<-top[,c(3,1)] %>%  as.tibble() %>% rename(word=value, freq=subject) %>% mutate(freq=as.numeric(freq))

top  %>% mutate(word = fct_reorder(word, freq)) %>% slice(1:10) %>% 
  ggplot( aes(x=word, y=freq)) +
    geom_bar(stat="identity", fill="#f68060", alpha=.6, width=.4) +
    coord_flip() +
    xlab("") +
    ylab("Frekans")+
   theme_economist()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra elde “Suriye” arama terimine bağlı olarak elde edilen bulgular ilişkili konularla birlikte aşağıdaki grafikte verilmiştir. Elde edilen bulgulara bakıldığında ilişkili top konularda da Suriye 1. sırada olduğu, bunu sırasıyla harita (map) ve savaş (war) izlediği görülmektedir. Diğer top konular ise sırasıyla şöyledir: Suriye savaşı, Irak, Rusya, Iran ve Özgür Suriye Ordusu’dur.

Suriye arama terimine bağlı olarak Türkiye’de yıllara göre arama trendlerinin sayısı aşağıda yazılan kod bloğu ile verilmiştir.

TUR = gtrends("suriye", geo = "TR", gprop = "web", time = "2011-04-29 2020-02-01")[[1]]
tur= TUR  %>% mutate(hits=as.numeric(hits))
ggplot(data = tur, aes(x = date, y = hits, group = geo)) +
  geom_line(size = 1, alpha = 0.7, aes(color = geo), , show.legend = FALSE) +
  geom_point(size = 0) +
  theme(legend.title=element_blank(), axis.title.x = element_blank()) +
  ylab("Hit Sayısı") + 
  xlab("Tarih")+
  ggtitle("Türkiye'de Suriye Arama Terimine Göre Google Trendleri")+
  facet_grid(~geo)+
  theme_hc()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra Suriye arama terimine göre Türkiye’de yıllara göre arama hit sayısı aşağıdaki grafikte verilmiştir.

Yapılan çalışma ile özellikle veri bilimi (data science) ile ilgilenen akademi ve saha çalışanlarına bir katkı sunulması amaçlanmıştır.

Faydalı olması ve farkındalık oluşturması dileğiyle.

Bilimle ve teknolojiyle kalınız.

Saygılarımla.

Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.

Note: It can not be cited or copied without referencing.

Yararlanılan Kaynaklar

Prediction of Size of the COVID-19 Pandemic Using Wavelength Models: Cases of Turkey and World [Dalgaboyu Modelleri Kullanarak COVID-19 Pandemisinin Büyüklüğünün Tahmini: Türkiye ve Dünya Vakaları]

Başta Koronavirüs (COVID-19) olmak üzere diğer salgınların büyüklüğünü ortaya koymak için dalga boylarını ölçmeye yönelik geliştirdiğim sayısal modeller ön incelemeden geçerek Yale üniversitesi destekli medRxiv (Medical Archive)’de 11.4.2020 tarihinde yayınlanmıştı. Geliştirilen modellerin makalesine aşağıdaki linki tıklayarak ulaşabilirsiniz.

https://www.medrxiv.org/content/10.1101/2020.04.07.20056432v1.article-info

Makalenin adı:

Bulut T. New Epidemiological Model Suggestions Revealing Size of Epidemics Based on the COVID-19 Pandemic Example: Wavelength Models. medRxiv; 2020. DOI: 10.1101/2020.04.07.20056432.

Yukarıdaki çalışmadan sonra Hacettepe Üniversitesi Tıp Fakültesi mezunu Konya Eğitim ve Araştırma Hastanesinde görevli Doktor arkadaşım Mustafa Çağrı Yıldız ile geliştirdiğim modelleri kullanarak çok daha detaylı çalışma yaptık. Bu çalışmanın makalesi ise Springer Nature destekli Research Square‘da ön baskı (preprint) olarak yayınlanmıştır. Makaleye aşağıdaki linkten ulaşabilirsiniz.

https://www.researchsquare.com/article/rs-34521/v1

Makalenin adı:

Tevfik Bulut, Mustafa Çağrı Yıldız. Prediction of Size of the COVID-19 Pandemic Using Wavelength Models: Cases of Turkey and World, 11 June 2020, PREPRINT (Version 1) available at Research Square [+https://doi.org/10.21203/rs.3.rs-34521/v1+]

Yapılan bu son çalışmayla;

  1. Türkiye’deki Covid-19 salgınının ilk 36 günlük dalga boyları gün bazında ortaya konulmuştur.
  2. Türkiye’de ve Dünyadaki ilk 36 günlük Covid-19 salgını dalga boyları kümülatif olarak incelenmiştir.
  3. İlk Covid-19 vakasının görüldüğü tarihten araştırmanın yapıldığı tarihe kadar olan zaman dilimindeki Dünya’daki Covid-19 salgınının dalga boyları kümülatif olarak ortaya konulmuştur.

Faydalı olması ve farkındalık oluşturması dileğiyle.

Bilimle ve teknolojiyle kalınız.

Saygılarımla.

Yararlanılan Kaynaklar

  • Bulut T. New Epidemiological Model Suggestions Revealing Size of Epidemics Based on the COVID-19 Pandemic Example: Wavelength Models. medRxiv; 2020. DOI: 10.1101/2020.04.07.20056432.
  • Tevfik Bulut, Mustafa Çağrı Yıldız. Prediction of Size of the COVID-19 Pandemic Using Wavelength Models: Cases of Turkey and World, 11 June 2020, PREPRINT (Version 1) available at Research Square [+https://doi.org/10.21203/rs.3.rs-34521/v1+]

Türkiye’deki COVID-19 Pandemisinin Büyüklüğü: Size of the Covid-19 Pandemics in Turkey

Dünyayı derinden etkileyen koronavirüs pandemisinin mevcut durumdaki büyüklüğünü ortaya koymaya yönelik geliştirdiğim epidemiyolojik dalga boyu modelleri Yale Üniversitesi destekli Uluslararası Tıp Arşivinde ön baskı olarak yayınlanmıştır. Bu modeller kullanılarak Türkiye’deki koronavirüs salgınının büyüklüğü dalga boyu uzunluğu olarak hesaplanmıştır. Analizde kullanılan vaka sayılarına ilişkin veri seti Sağlık Bakanlığı resmi web sitesinden edinilmiştir. Elde edilen bulgular Şekil 1’de verilmiştir. Şekil 1’e göre öne çıkan bulgular şöyledir.

  • Görülen koronavirüs vakalarının dalga boyu (Wc) 31. gün olan 11.04.2020 tarihinde zirveye ulaştığı, bu tarihten sonra vaka sayılarının düşmesine bağlı olarak ivme kaybettiği gözlenmiştir.
  • Koronavirüs hastalığından ölen vakaların dalga boyu (Wd) ise 36. gün olan 16.04.2020 tarihinde en yüksek seviyesine ulaşmıştır. Ölen vakaların dalga boyu ölüm vakalarındaki azalmayla doğru orantılı olarak az da olsa azalma yönünde bir eğilim sergilediği görülmüştür.
  • Koronavirüs hastalığından iyileşen vakaların dalga boyu (Wc) ise 37. gün olan 17.04.2020 tarihinde en yüksek seviyesine ulaşmıştır. İyileşen vakaların dalga boyu, bu tarihten sonra ise azalma trendinden sonra tekrar yükselişe geçmiştir. İyileşen dalga boyunun yükseliş trendi göstermesi olumlu yorumlanması gereken bir bulgudur.
  • Koronavirüs salgınındaki net dalga boyu (Wnet) ise vaka, ölüm ve iyileşen dalga boylarından oluşmakta ve salgının net büyüklüğünü ortaya koymaktadır. Elde edilen bulgulardan net dalga boyu uzunluğunun 15. gün olan 26.03.2020 tarihinde zirveye ulaştığı, bu tarihten sonra ise genel olarak istikrarlı bir şekilde azaldığı gözlemlenmiştir.

Not: Bu makale 20 Mayıs 2020 tarihinde Sanayi Gazetesi’nde yayınlanmıştır. Linki: http://www.sanayigazetesi.com.tr/turkiyedeki-covid-19-pandemisinin-buyuklugu-makale,1813.html.

Yararlanılan Kaynak

  • Bulut T. New Epidemiological Model Suggestions Revealing Size of Epidemics Based on the COVID-19 Pandemic Example: Wavelength Models. medRxiv; 2020. DOI: 10.1101/2020.04.07.20056432.          
  • Sağlık Bakanlığı, https://covid19.saglik.gov.tr/

14 Nisan 2020 Tarihi İtibariyle COVID-19 Pandemi Vakalarının Tahmini ve İnterpolasyonu: Türkiye Örneği (As of April 14, 2020, Prediction and Interpolation of COVID-19 Pandemic Cases)

Giriş / Introduction

Coronavirüsler (CoV), soğuk algınlığından Orta Doğu Solunum Sendromu (MERS-CoV) ve Şiddetli Akut Solunum Sendromu (SARS-CoV) gibi daha ciddi hastalıklara kadar pek çok hastalığa neden olan büyük bir virüs ailesidir. Bu yeni virüse, yüzey çıkıntıları taç görünümünde olduğu için coronavirus adı verilmiş olup, bu virüs ailesi tek zincirli, pozitif polariteli, zarflı RNA virüsleridir.

Koronavirüs hastalığı (COVID-19), 2019 yılında keşfedilen ve daha önce insanlarda tanımlanmamış yeni bir suştur. Suş, bir bakteri veya virüsün farklı alt türlerinin, aralarında genetik farklılıklar bulunan grupları olarak adlandırılır.

Bu Koronavirüsler zoonotiktir, yani hayvanlar ve insanlar arasında bulaşırlar. Ayrıntılı araştırmalar SARS-CoV’nin misk kedilerinden insanlara ve MERS-CoV’un tek hörgüçlü develerden insanlara bulaştığını göstermiştir. Bilinen birkaç koronavirüs henüz insanları enfekte etmeyen hayvanlarla taşınmaktadır.

Enfeksiyon belirtileri arasında solunum semptomları, ateş, öksürük, nefes darlığı ve solunum güçlüğü bulunur. Daha ciddi vakalarda, enfeksiyon pnömoniye, ciddi akut solunum sendromuna, böbrek yetmezliğine ve hatta ölüme neden olabilir. Solunum sistemi hastalıklarından biri olan pnömoni ya da halk arasında zatürre bakteriler başta olmak üzere mikroorganizmalara bağlı olarak ortaya çıkan akciğer dokusunun iltihaplanmasıdır. Grip gibi bu hastalık da bağışıklık (immun) sistemini baskılayan hastalıklardan biridir. Özellikle ileri yaşlardaki bireylerde hem bağışıklık sisteminin yaşla birlikte yavaşlaması hem de yaşa ve/veya diğer nedenlere bağlı olarak kronik ve diğer hastalıkların görülmesi bu yaşlardaki bireylerde ölüm oranlarını artırabilmektedir. Diğer bir deyişle, bu enfeksiyon komplikasyon yaratarak ve mevcut diğer hastalıkları tetikleyerek bu yaş gruplarında diğer yaş gruplarına göre daha öldürücü olabilir.

Enfeksiyonun yayılmasını önlemek için standart öneriler arasında düzenli el yıkama, öksürme ve hapşırma sırasında ağız ve burnun kapatılması, et ve yumurtaların iyice pişirilmesi yer alır. Öksürme ve hapşırma gibi solunum yolu rahatsızlığı belirtileri gösteren kişilerle yakın temastan kaçınmak bu hastalıktan korunmak için atılacak önemli koruyucu tedbirlerden biridir.

Hastalıktan nasıl korunulacağı hakkında bilgi verdikten sonra bu hastalığın teşhisinde kullanılan ve adı son zamanlarda sık sık duyulan PCR testi hakkında bilgi vermek faydalı olacaktır. PCR, ingilizce adıyla “Polymerase Chain Reaction” kelimelerinin bir araya gelmesinden oluşan ve moleküler biyoloji alanında kullanılan bir tekniktir.Türkçe ise ise polimeraz zincir reaksiyonu olarak adlandırılır. Bazen PCR moleküler fotokopi (molecular photocopying) olarak da adlandırılabilmektedir. DNA’nın küçük bölümlerini kopyalamak için kullanılan hızlı ve ucuz bir tekniktir. Moleküler ve genetik analizler için büyük miktarlarda DNA örneği gerekli olduğundan, izole edilmiş DNA parçaları üzerinde çalışmalar PCR amplifikasyonu olmadan neredeyse imkansızdır. PCR’ın kullanım alanları şöyle özetlenebilir:

  1. Amplifiye edildikten sonra PCR ile üretilen DNA, birçok farklı laboratuvar prosedüründe kullanılabilir. Örneğin, İnsan Genom Projesindeki (HGP) çoğu haritalama tekniği PCR’a dayanmaktadır.
  2. Parmak izi, bakteri veya virüslerin (özellikle AIDS) tespiti ve genetik bozuklukların teşhisi gibi bir dizi laboratuvar ve klinik teknikte de değerlidir.

PCR ( Polimeraz Zincir Reaksiyonu) tekniğinin çalışma şeması ise aşağıdaki şekilde verilmiştir.

polymerase chain reaction diagram
Kaynak: The National Human Genome Research Institute (NHGRI)

PCR tekniğini kullanarak koronavirüs teşhisinin nasıl konulduğuna ilişkin bir video aşağıda verilerek teşhis süreci hakkında bilgi verilmesi amaçlanmıştır.

Kaynak:
AMBOSS: Medical Knowledge Distilled

Bilindiği üzere koronavirüs hastalığının teşhis ve özellikle tedavisine yönelik olarak ilaç ve aşı geliştirme alanında Dünya’da ve ülkemizde yoğun bir mesai harcanmaktadır. Bunlardan biri ülkemizde 02.04.2020 tarihinde Sanayi ve Teknoloji Bakanlığı ve TÜBİTAK bünyesinde “Covid-19 Türkiye Platformu Aşı ve İlaç Geliştirme” bilim insanların katıldığı sanal bir konferans gerçekleştirilmiştir. Türkiye dışında da benzer çalışmalar sanal ortamda çalıştay ve konferans olarak yapılmaktadır. Dünyada yapılan ve benim de katılım sağladığım önde giden bu çalışmalardan biri de Avrupa Öğrenme ve Akıllı Sistemler Laboratuvarı ingilizce adıyla European Laboratory for Learning and Intelligent Systems (ELLIS)’ın 02.04.2020 tarihinde düzenlediği “ELLIS Against Covid-19” adlı çalıştaydır. Dünyanın farklı üniversitelerinden bilim insanlarının katılım sağladığı çalıştayda koranavirüs pandemisinin teşhisinde kullanılan yapay zeka teknolojilerinden koronavirüsün tedavisinde kullanılan ilaçların geliştirilmesinde kullanılan yapay zeka teknolojilerine kadar pek çok konu ele alınmıştır. Çalıştayda ağırlıklı olarak ele alınan konu yapay zekanın teşhis ve tedavide nasıl kullanıldığı ve kullanılacağı idi. Çalıştayda koronavirüs ile mücadele çok güzel uygulama örneklerine yer verilmiştir. Daha önce de dile getirdiğim gibi yapay zeka günümüzün ve geleceğin en kritik teknolojisidir. Bu gerek 4. Sanayi Devrimi gerekse Toplum 5.0 açısından olsun böyledir ve farklı ülkeler yapay zekayı teşhis ve tedavi (robotik cerrahi ve ilaç geliştirme) alanlarında kullanmak için çok ciddi adımlar atmıştır. Bu yapıların da ülkemizde kurulması ve yapay zeka enstitülerinin ülkemizde yaygınlaştırılması gerekmektedir. Aynı zamanda Türkiye Büyük Millet Meclisi bünyesinde Yapay Zeka Komisyonu kurulmalıdır. Yapay zeka özünde öğrenen sistemler olduğu ve sürekli gelişim gösterdiği için sektör ayrımı olmaksızın her alanda kendine uygulama alanı bulan bir teknolojidir.

Koronavirüs salgını Çin ile birlikte diğer ülkelere de yayıldığı için Dünya Sağlık Örgütü tarafından 30/01/2020 tarihinde uluslararası halk sağlığı açısından acil durum ilan edilmiştir. Bu hastalıktan bahsedilirken lise ve üniversite yıllarımda benim de ders olarak aldığım Epidemiyoloji biliminden bahsetmemek olmaz. Epidemiyoloji, toplumda sağlıkla ilgili durumların veya olayların (hastalık dahil) dağılımını, görülme sıklıklarını ve bunları etkileyen faktörleri inceleyen bir tıp bilimi dalıdır.

Epidemiyolojik araştırmalar yapmak için çeşitli yöntemler kullanılabilir. Bu yöntemler dağılımı incelemek için sürveyans, tanımlayıcı çalışmalar ve hastalık belirleyicilerini incelemek için analitik çalışmalar olabilir. Bilindiği üzere Koronavirüs hastalığı artık pandemik bir vaka olarak adlandırılmaktadır. Epidemiyolojinin konu alanına giren pandemi dünyada birden fazla ülkede veya kıtada, çok geniş bir alanda
yayılan ve etkisini gösteren salgın hastalıklara verilen genel isim
olarak ifade edilmektedir. Diğer bir deyişle, salgın (epidemi) durumundaki bir hastalığın ülke sınırlarını aşarak diğer ülkelere yayılım göstermesidir.

Avrupa Birliği kurumlarından biri olan “Avrupa Hastalık Önleme ve Kontrol Merkezi (European Centre for Disease Prevention and Control)”‘ne göre ön bulgular koronavirüs hastalığından vakalara dayalı ölüm oranı (fatalite hızı)’nın binde 20-30 olduğunu göstermektedir. Bu, 2003 SARS salgınından önemli ölçüde daha az. Bununla birlikte, mevsimsel gripin neden ölüm oranlarından çok daha yüksektir.

Çalışma kapsamında koronavirüs pandemi vakalarının epidemiyolojik hızlarla birlikte keşifsel veri analizi (EDA) yapılarak vakaların izlediği seyrin ortaya konulması amaçlanmıştır

Metodoloji / Methodology

Çalışmanın amacı, koronavirüs vakalarının epidemiyolojik düzlemde Türkiye’de ve diğer ülkelerde izlediği seyri detaylı bir şekilde keşifsel veri analiziyle ortaya konulara karar vericilere katkı sunmaktır.

Koronavirüs vakalarının analizinde Türkiye veri setinin oluşturulmasında Türkiye İstatistik Kurumu (TÜİK)’ndan ve Dünya Sağlık Örgütü (DSÖ) raporlarından ve Sağlık Bakanlığı basın açıklamalarından yararlanılmıştır. Bunun nedeni Türkiye veri setine daha derinlemesine bakılmak istenmesidir.

Analizlerde Microsoft Excel 2016 ve R programlama dili kullanılmıştır.

Keşifsel veri analizine geçilmeden önce vaka sayılarından yararlanarak epidemiyolojik hızlar hesaplanmıştır. Bu nedenle, çalışmada kullanılacak hızları açıklamanın faydalı olacağı düşünülmektedir.

Epidemiyoloji biliminde hız kavramı, bir sağlık olayının nüfus içindeki görülme frekansını hesaplamada kullanılan bir ölçüttür. Hızlar, belirli bir zaman diliminde meydana gelen olayların sayısının olayın meydana geldiği nüfusa bölünerek hesaplanır. Eşitliğin payı, sağlık olayı ile karşılaşanların sayısını (X), payda ise risk altındaki nüfusu (X+Y) göstermektedir. Risk altındaki nüfus hastalığa veya sağlık olaylarına karşı duyarlı olan nüfusu ifade etmektedir. Formülize edilirse;

Hız (Rate) = (X / X +Y) * k

Burada, k katsayıyı göstermektedir.

Analizde hızlardan girdi değişkeni olarak kullanılması düşünülen ilk gösterge ölüm veya mortalite ölçütlerinden biri olan Kaba Ölüm Hızı‘dır. Bu hız nüfusun sağlık düzeyini ortaya koymada duyarlı olmasa da bir fikir vermesi açısından önemlidir. Kaba ölüm hızı aşağıdaki eşitlikte gösterilmiştir.

Kaba Ölüm Hızı (Crude Death Rate) = (Bir toplumda belirli bir süre içinde meydana gelen ölüm sayısı / Aynı toplumun aynı süredeki
(yıl ortası) nüfusu) * 1000

Crude death rate = (Total number of deaths during a given time interval / Mid-interval population) * 1000

Girdi değişkeni olarak kullanılması düşünülen ikinci gösterge ölüm veya fatalite ölçütlerinden biri olan Fatalize Hızı‘dır. Bu gösterge kaba ölüm hızına göre daha duyarlı bir göstergedir. Diğer bir ifadeyle, hastalığa yakalananların ne kadarının öldüğünü gösterir. Fatalite hızı aşağıdaki eşitlik yardımıyla hesaplanmaktadır;

Fatalite Hızı (Fatality Rate) = (Nüfusta belirli bir süre içinde “X” hastalığından ölenlerin sayısı / Aynı nüfusun aynı süre içinde “X” hastalığına yakalananların sayısı) * 100

Fatality Rate = (Number of cause-specific deaths among the incident cases / Total number of incident cases) * 100

Morbitide veya hastalık hızları gelişmekte olan hastalığın ortaya çıkma hızını ortaya koymak için kullanılır. Bunlardan biri olan insidans,
bir hastalığın gelişme (yeni vakalar) olasılığını ortaya koymak için kullanılır. Diğer taraftan, bu hızlardan prevelans ise hastalığın görülme sıklığını (tüm vakalar) gösteren bir hızdır. İnsidans ve prevelans da analizde girdi değişkenleri olarak kullanılması düşünülmektedir. İnsidans aşağıdaki eşitlik yardımıyla hesaplanmaktadır.

İnsidans (Incidence) = (Bir nüfusta belirli bir sürede saptanan YENİ vaka sayısı / Aynı toplumun yıl ortası nüfusu) * k

Incidence = (Number of new cases of disease during specified time interval / Population at start of time interval) * k

İnsidans hızının kümülatif şekli ise atak hızlarını göstermektedir.

Prevelans ise aşağıdaki eşitlik yardımıyla hesaplanmaktadır.

Prevelans (Prevalence) = (Belirli bir sürede toplam (eski+yeni) vaka sayısı / Risk altındaki kişi sayısı) * k

Prevalence = (Number of cases of disease during specified time interval / Population at start of time interval) * k

Keşifsel Veri Analizi Bulguları / Exploratory Data Analysis Findings

Türkiye Örneği / The Case of Turkey

Bu kısımda bahsedilen epidemiyolojik hızların uygulama sonuçlarına yer verilmiştir. İlk olarak günlük onaylanmış vaka sayıları ile ölüm vaka sayıları Tablo 1’de verilmiştir. Tabloda test sayılarının olduğu sütunda kırmızı renkteki sayılar kesin olarak bilinmediğinden ortalama olarak verilmiştir. Tablo 1’e göre öne çıkan bulgular şöyledir:

Tablo 1. Koronavirüs Vaka Sayıları / Number of Coronavirus Cases, Turkey

Epidemiyolojik hızları gösteren bulgular ise Tablo 2’de sunulmuştur.

Tablo 2. Koronavirüs Vakalarının Epidemiyolojik Hızları / Epidemiological Rates of Coronavirus Cases, Turkey

Tahmin (Prediction)

Bu kısımda hareketli ortalama yöntemi kullanılarak vaka sayıları tahmin edilmiş ve Tablo 3’te verilmiştir. Hareketli ortalama yönteminin kısa vadeli tahminlerde, özellikle de borsa ve döviz kuru tahminlerde kullanıldığı görülmektedir. Hareketli ortalama eşitliği şöyledir:

m=2k+1 olup hareketli ortalama yönteminde sıra düzenini göstermektedir. Örneğin Tablo 3’teki m=4 düzeninde ilk tahmini vaka sayısını hesaplamak için izlenen yol şöyledir; (1+4+1+12)/4= 4,5, diğer bir deyişle tahmini ilk vaka sayısı yaklaşık 5’tir. Benzer işlemler diğer m=3 düzeni için de yapılır. m=3 düzeninde ise tahmini ilk vaka sayısı (1+4+1)/3 = 2 olarak hesaplanır.

Tablo 3: Gerçekleşen Vaka Sayıları ile Tahmini Vaka Sayıları

TarihVaka Sayısım=4 HO Sıra Düzenim=3 HO Sıra Düzeni Mutlak Hata (AE) m=4 Mutlak Hata (AE) m=3
10.03.20201    
13.03.20204    
14.03.20201523,51,0
15.03.2020121260,56,3
16.03.20202923145,815,0
17.03.20205146314,820,3
18.03.20209385587,835,3
19.03.202016815610412,364,0
20.03.202031121219198,8120,3
21.03.202027726125215,825,0
22.03.20202892932923,53,3
23.03.20202933012867,56,7
24.03.202034337230828,534,7
25.03.202056159839937,3162,0
26.03.202011961042700153,8496,0
27.03.2020206913831275686,5793,7
28.03.20201704169616568,047,7
29.03.202018151800186315,547,7
30.03.2020161019581710348,399,7
31.03.2020270420692043634,8661,0
1.04.202021482230215481,56,0
2.04.202024562524243667,520,0
3.04.2020278626012463185,3322,7
4.04.2020301328482752165,5261,3
5.04.2020313530212978114,5157,0
6.04.2020314832973099149,049,3
7.04.2020389235733392319,0500,3
8.04.2020411738033719313,8398,0
9.04.2020405642034022147,034,3
10.04.2020474745154307232,5440,3
11.04.2020513846834647455,5491,0
12.04.202047894692489197,3102,3
13.04.2020409345214673427,5580,3
14.04.20204062  Ortalama Mutlak Hata 155,8 193,6

Yukarıdaki tabloda ortalama mutlak hatası (MAE)’sı daha düşük çıkan m=4 düzenindeki hareketli ortalama (HO) tercih edilir. Şimdi sırasıyla m=4 düzenindeki tahmini vaka sayıları ile gerçekleşen vaka sayılarına ait grafiği çizelim.

m=4 düzenindeki hareketli ortalama verildikten sonra m=3 düzenindeki gerçekleşen ve tahmini vaka sayılarını verelim.

Yapılan işlemlerde kullanılan formülleri ve etkileşimleri görmek için aşağıdaki linkten xlsx uzantılı dosyayı indirebilirsiniz.

Bir diğer hareketli ortama yöntemlerinden biri üstel hareketli ortalama (Exponential Moving Average)’dır. Kısaca adlandırmak gerekirse Türkçe ÜHO, ingilizce olarak ise EMA’dır. Burda da aynı vaka sayıları üzerinden bir tahmin (prediction) yapılmış olup, Tablo 4’te verilmiştir. Burada farklı düzeltme faktörü katsayıları üzerinden 5 farklı üstel hareketli ortalama hesaplanmıştır.

Tablo 4: Gerçekleşen Vaka Sayıları ile Tahmini Vaka Sayıları (EMA)

5 farklı düzeltme faktörlü (damping factor) EMA yönteminden elde edilen mutlak hatalar ve ortalama mutlak hatalar Tablo 5’te verilmiştir.

Tablo 5. Üstel Hareketli Ortalama Mutlak Hata Değerleri

Tablo 5’in en alt satırında ortalama mutlak hatalar görülmektedir. Buna göre ortalama hatası en düşük olan 264,5 ortalama mutlak hata ile 3. üstel hareketli ortalama (EMA) yöntemi seçilir. Şimdi bu 3. yöntemin grafiğini çizelim.

Üstel hareketli ortalama yönteminde kullanılan 5 farklı düzeltme faktörü (df)’ne göre hesaplanan tahmini vaka sayıları, yapılan işlemlerde kullanılan formülleri ve etkileşimleri görmek adına aşağıdaki linkten xlsx uzantılı olarak paylaşılmıştır. EMA yöntemi de hareketli ortalama yöntemi (MA) gibi sıklıkla kısa vadeli borsa ve döviz kuru işlemlerinde kullanılmaktadır.

Öngörü ya da İnterpolasyon / Forecast

Bu kısımda tahmin çalışmasından farklı olarak interpolasyon (öngörü) yapılmıştır. Bu amaçla 6 günlük bir vaka tahmini yapılmıştır. Çalışma kullanılan R kod bloğu aşağıda verilmiştir.

sma <-forecast(round(SMA(data[,2],4)),h=6, level=99)
sma

x<-as.Date(seq(from = as.Date("2020-04-14"), to = as.Date("2020-04-19"), by = "days"))


sma<-as_tibble(sma)

sonuc<-as.vector(sma$`Point Forecast`)

z<-zoo(sonuc, x)
print(z)

formattable(tibble(Tarih=x, Tahmin=round(sonuc,0)))

plot(z,
  lty = "solid", col="red", main = "6 Günlük Koronavirüs Tahminleri"
)

Yukarıdaki R kod bloğunun çalıştırılmasından sonra elde edilen 6 günlük vaka öngörü sayıları Tablo 6’da verilmiştir.

Tablo 6: Hareketli Ortalama Öngörülen 6 Günlük Vaka Sayısı Tahminleri

Yukarıda R kod bloğunda tanımlanmış olan 6 günlük vaka öngörü grafiği ise aşağıda sunulmuştur. Hareketli ortalama (moving average) yöntemi bulgularına göre vaka sayılarında aşağı yönlü bir eğilim olduğu gözlenmiştir. Burada unutulmaması gereken konu bu çalışmanın deneysel bir çalışma olduğu, diğer tahmin yöntemlerinin de kullanılabileceğidir.

Holt yöntemini de kullanarak 6 günlük vaka sayısı öngörüsü yapalım. Buna ilişkin R kod bloğu ise aşağıdadır.

set<-ts(as.vector(data[,2]), as.vector(y10))
holty <-holt(set, h = 6)

x<-as.Date(seq(from = as.Date("2020-04-15"), to = as.Date("2020-04-20"), by = "days"))

holty<-as_tibble(holty)
holty<-holty %>% add_column(Date=x, .before='Point Forecast') %>% mutate_all(round, 0)


formattable(holty[,c(1,2,5,6)])

holty %>% ggplot(aes(x=Date, y=`Point Forecast`))+
          geom_line(size=1, color="blue")+
          theme(axis.text.x = element_text(face="bold", 
                           size=8, angle=0),
                axis.text.y = element_text(face="bold", 
                           size=8, angle=90))+
          ggtitle("Holt Yöntemi 6 Günlük Vaka Sayısı Tahminleri") +
          xlab("Tarih") + ylab("Tahmini Vaka Sayısı")+
          theme(plot.title = element_text(face="bold", size=10, hjust=1)) +
          theme(axis.title = element_text(face="bold", size=10))+
          scale_x_date(date_labels = "%Y %b %d")+
          ylim(min(holty$`Lo 95`),max(holty$`Hi 95`))+
          geom_line(aes(y = `Lo 95`, color = "darkred", linetype = "dotted"))+
          geom_line(aes(y = `Hi 95`, color="darkred", linetype="dotted"))+
  theme_economist()

Yukarıdaki R kod bloğunun çalıştırılmasından sonra Holt Yöntemine ait elde edilen 6 günlük vaka öngörü sayıları (nokta takminler) % 95 güven aralıklı olarak Tablo 7’de verilmiştir.

Tablo 7: Holt Yöntemi Öngörülen 6 Günlük Vaka Sayısı Tahminleri

Yukarıda R kod bloğunda tanımlanmış olan 6 günlük vaka öngörü grafiği ise aşağıda sunulmuştur. Hareketli ortalama yönteminin aksine Holt yöntemindeki bulgularına göre vaka sayılarında artış trendi olduğu gözlenmiştir. Ancak bu artış keskin bir artış değildir. Grafikteki ortadaki mavi eğri nokta tahminleri, üstündeki kırmızı eğriler ise % 95 güven aralığındaki alt ve üst limitleri göstermektedir.

Son olarak Holt’un yönteminin etkinliğini ölçmek için hata metriklerine bakalım.

summary(holty)

Yukarıdaki kod bloğu çalıştırıldıktan sonra elde edilen hata metrikleri aşağıdaki gibidir.

Forecast method: Holt's method

Model Information:
Holt's method 

Call:
 holt(y = set, h = 6) 

  Smoothing parameters:
    alpha = 0.8711 
    beta  = 1e-04 

  Initial states:
    l = -146.6496 
    b = 124.7065 

  sigma:  387.1822

     AIC     AICc      BIC 
530.8456 532.9885 538.4774 

Error measures:
                    ME     RMSE      MAE       MPE     MAPE     MASE
Training set 0.1261637 363.6944 265.6017 -499.5727 645.7179 1.011991
                   ACF1
Training set 0.01268338

Burada unutulmaması gereken konu bu çalışmanın deneysel bir çalışma olduğu, diğer tahmin yöntemlerinin de kullanılabileceğidir.

Sonuç / Conclusion

Yapılan çalışma ile Türkiye koronavirüs vakalarının epidemiyolojik keşifsel veri analizi yapılmasının yanında deneysel tahmin (prediction) ve öngörü (forecast) çalışması yapılarak farkındalık oluşturulması amaçlanmıştır.

Faydalı olması dileğiyle.

Sağlıkla ve bilimle kalınız.

Saygılarımla.

Note: It can not be cited or copied without referencing.

Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.

Yararlanılan Kaynaklar / Resources Utilized

New Epidemiological Model Suggestions Revealing Size of Epidemics Based on the COVID-19 Pandemic Example: Wavelength Models (COVID-19 Pandemi Örneğine Dayalı Salgınların Büyüklüğünü Ortaya Koyan Yeni Epidemiyolojik Model Önerileri: Dalgaboyu Modelleri)

Başta Koronavirüs (COVID-19) olmak üzere diğer salgınların dalga boylarını ölçmeye yönelik geliştirdiğim sayısal modeller ön incelemeden geçerek Yale üniversitesi destekli medRxiv (Medical Archive)’de 11.4.2020 tarihinde yayınlanmıştır. Geliştirilen modellerin makalesine aşağıdaki linki tıklayarak ulaşabilirsiniz.

https://www.medrxiv.org/content/10.1101/2020.04.07.20056432v1.article-info

Bulut T. New Epidemiological Model Suggestions Revealing Size of Epidemics Based on the COVID-19 Pandemic Example: Wavelength Models. medRxiv; 2020. DOI: 10.1101/2020.04.07.20056432.

Faydalı olması ve farkındalık oluşturması dileğiyle.

Saygılarımla.

10 Nisan 2020 Tarihi İtibariyle Koronavirüs Pandemisi Üzerine Vaka Çalışmaları: Türkiye ve Diğer Ülke Örnekleri (Case Studies on Coronavirus Pandemic: Cases of Turkey and Other Countries As of April 10, 2020)

Giriş / Introduction

Coronavirüsler (CoV), soğuk algınlığından Orta Doğu Solunum Sendromu (MERS-CoV) ve Şiddetli Akut Solunum Sendromu (SARS-CoV) gibi daha ciddi hastalıklara kadar pek çok hastalığa neden olan büyük bir virüs ailesidir. Bu yeni virüse, yüzey çıkıntıları taç görünümünde olduğu için coronavirus adı verilmiş olup, bu virüs ailesi tek zincirli, pozitif polariteli, zarflı RNA virüsleridir.

Koronavirüs hastalığı (COVID-19), 2019 yılında keşfedilen ve daha önce insanlarda tanımlanmamış yeni bir suştur. Suş, bir bakteri veya virüsün farklı alt türlerinin, aralarında genetik farklılıklar bulunan grupları olarak adlandırılır.

Bu Koronavirüsler zoonotiktir, yani hayvanlar ve insanlar arasında bulaşırlar. Ayrıntılı araştırmalar SARS-CoV’nin misk kedilerinden insanlara ve MERS-CoV’un tek hörgüçlü develerden insanlara bulaştığını göstermiştir. Bilinen birkaç koronavirüs henüz insanları enfekte etmeyen hayvanlarla taşınmaktadır.

Enfeksiyon belirtileri arasında solunum semptomları, ateş, öksürük, nefes darlığı ve solunum güçlüğü bulunur. Daha ciddi vakalarda, enfeksiyon pnömoniye, ciddi akut solunum sendromuna, böbrek yetmezliğine ve hatta ölüme neden olabilir. Solunum sistemi hastalıklarından biri olan pnömoni ya da halk arasında zatürre bakteriler başta olmak üzere mikroorganizmalara bağlı olarak ortaya çıkan akciğer dokusunun iltihaplanmasıdır. Grip gibi bu hastalık da bağışıklık (immun) sistemini baskılayan hastalıklardan biridir. Özellikle ileri yaşlardaki bireylerde hem bağışıklık sisteminin yaşla birlikte yavaşlaması hem de yaşa ve/veya diğer nedenlere bağlı olarak kronik ve diğer hastalıkların görülmesi bu yaşlardaki bireylerde ölüm oranlarını artırabilmektedir. Diğer bir deyişle, bu enfeksiyon komplikasyon yaratarak ve mevcut diğer hastalıkları tetikleyerek bu yaş gruplarında diğer yaş gruplarına göre daha öldürücü olabilir.

Enfeksiyonun yayılmasını önlemek için standart öneriler arasında düzenli el yıkama, öksürme ve hapşırma sırasında ağız ve burnun kapatılması, et ve yumurtaların iyice pişirilmesi yer alır. Öksürme ve hapşırma gibi solunum yolu rahatsızlığı belirtileri gösteren kişilerle yakın temastan kaçınmak bu hastalıktan korunmak için atılacak önemli koruyucu tedbirlerden biridir.

Hastalıktan nasıl korunulacağı hakkında bilgi verdikten sonra bu hastalığın teşhisinde kullanılan ve adı son zamanlarda sık sık duyulan PCR testi hakkında bilgi vermek faydalı olacaktır. PCR, ingilizce adıyla “Polymerase Chain Reaction” kelimelerinin bir araya gelmesinden oluşan ve moleküler biyoloji alanında kullanılan bir tekniktir.Türkçe ise ise polimeraz zincir reaksiyonu olarak adlandırılır. Bazen PCR moleküler fotokopi (molecular photocopying) olarak da adlandırılabilmektedir. DNA’nın küçük bölümlerini kopyalamak için kullanılan hızlı ve ucuz bir tekniktir. Moleküler ve genetik analizler için büyük miktarlarda DNA örneği gerekli olduğundan, izole edilmiş DNA parçaları üzerinde çalışmalar PCR amplifikasyonu olmadan neredeyse imkansızdır. PCR’ın kullanım alanları şöyle özetlenebilir:

  1. Amplifiye edildikten sonra PCR ile üretilen DNA, birçok farklı laboratuvar prosedüründe kullanılabilir. Örneğin, İnsan Genom Projesindeki (HGP) çoğu haritalama tekniği PCR’a dayanmaktadır.
  2. Parmak izi, bakteri veya virüslerin (özellikle AIDS) tespiti ve genetik bozuklukların teşhisi gibi bir dizi laboratuvar ve klinik teknikte de değerlidir.

PCR ( Polimeraz Zincir Reaksiyonu) tekniğinin çalışma şeması ise aşağıdaki şekilde verilmiştir.

polymerase chain reaction diagram
Kaynak: The National Human Genome Research Institute (NHGRI)

PCR tekniğini kullanarak koronavirüs teşhisinin nasıl konulduğuna ilişkin bir video aşağıda verilerek teşhis süreci hakkında bilgi verilmesi amaçlanmıştır.

Kaynak:
AMBOSS: Medical Knowledge Distilled

Bilindiği üzere koronavirüs hastalığının teşhis ve özellikle tedavisine yönelik olarak ilaç ve aşı geliştirme alanında Dünya’da ve ülkemizde yoğun bir mesai harcanmaktadır. Bunlardan biri ülkemizde 02.04.2020 tarihinde Sanayi ve Teknoloji Bakanlığı ve TÜBİTAK bünyesinde “Covid-19 Türkiye Platformu Aşı ve İlaç Geliştirme” bilim insanların katıldığı sanal bir konferans gerçekleştirilmiştir. Türkiye dışında da benzer çalışmalar sanal ortamda çalıştay ve konferans olarak yapılmaktadır. Dünyada yapılan ve benim de katılım sağladığım önde giden bu çalışmalardan biri de Avrupa Öğrenme ve Akıllı Sistemler Laboratuvarı ingilizce adıyla European Laboratory for Learning and Intelligent Systems (ELLIS)’ın 02.04.2020 tarihinde düzenlediği “ELLIS Against Covid-19” adlı çalıştaydır. Dünyanın farklı üniversitelerinden bilim insanlarının katılım sağladığı çalıştayda koranavirüs pandemisinin teşhisinde kullanılan yapay zeka teknolojilerinden koronavirüsün tedavisinde kullanılan ilaçların geliştirilmesinde kullanılan yapay zeka teknolojilerine kadar pek çok konu ele alınmıştır. Çalıştayda ağırlıklı olarak ele alınan konu yapay zekanın teşhis ve tedavide nasıl kullanıldığı ve kullanılacağı idi. Çalıştayda koronavirüs ile mücadele çok güzel uygulama örneklerine yer verilmiştir. Daha önce de dile getirdiğim gibi yapay zeka günümüzün ve geleceğin en kritik teknolojisidir. Bu gerek 4. Sanayi Devrimi gerekse Toplum 5.0 açısından olsun böyledir ve farklı ülkeler yapay zekayı teşhis ve tedavi (robotik cerrahi ve ilaç geliştirme) alanlarında kullanmak için çok ciddi adımlar atmıştır. Bu yapıların da ülkemizde kurulması ve yapay zeka enstitülerinin ülkemizde yaygınlaştırılması gerekmektedir. Aynı zamanda Türkiye Büyük Millet Meclisi bünyesinde Yapay Zeka Komisyonu kurulmalıdır. Yapay zeka özünde öğrenen sistemler olduğu ve sürekli gelişim gösterdiği için sektör ayrımı olmaksızın her alanda kendine uygulama alanı bulan bir teknolojidir.

Koronavirüs salgını Çin ile birlikte diğer ülkelere de yayıldığı için Dünya Sağlık Örgütü tarafından 30/01/2020 tarihinde uluslararası halk sağlığı açısından acil durum ilan edilmiştir. Bu hastalıktan bahsedilirken lise ve üniversite yıllarımda benim de ders olarak aldığım Epidemiyoloji biliminden bahsetmemek olmaz. Epidemiyoloji, toplumda sağlıkla ilgili durumların veya olayların (hastalık dahil) dağılımını, görülme sıklıklarını ve bunları etkileyen faktörleri inceleyen bir tıp bilimi dalıdır.

Epidemiyolojik araştırmalar yapmak için çeşitli yöntemler kullanılabilir. Bu yöntemler dağılımı incelemek için sürveyans, tanımlayıcı çalışmalar ve hastalık belirleyicilerini incelemek için analitik çalışmalar olabilir. Bilindiği üzere Koronavirüs hastalığı artık pandemik bir vaka olarak adlandırılmaktadır. Epidemiyolojinin konu alanına giren pandemi dünyada birden fazla ülkede veya kıtada, çok geniş bir alanda
yayılan ve etkisini gösteren salgın hastalıklara verilen genel isim
olarak ifade edilmektedir. Diğer bir deyişle, salgın (epidemi) durumundaki bir hastalığın ülke sınırlarını aşarak diğer ülkelere yayılım göstermesidir.

Avrupa Birliği kurumlarından biri olan “Avrupa Hastalık Önleme ve Kontrol Merkezi (European Centre for Disease Prevention and Control)”‘ne göre ön bulgular koronavirüs hastalığından vakalara dayalı ölüm oranı (fatalite hızı)’nın binde 20-30 olduğunu göstermektedir. Bu, 2003 SARS salgınından önemli ölçüde daha az. Bununla birlikte, mevsimsel gripin neden ölüm oranlarından çok daha yüksektir.

Çalışma kapsamında koronavirüs pandemi vakalarının epidemiyolojik hızlarla birlikte keşifsel veri analizi (EDA) yapılarak vakaların izlediği seyrin ortaya konulması amaçlanmıştır

Metodoloji / Methodology

Çalışmanın amacı, koronavirüs vakalarının epidemiyolojik düzlemde Türkiye’de ve diğer ülkelerde izlediği seyri detaylı bir şekilde keşifsel veri analiziyle ortaya konulara karar vericilere katkı sunmaktır.

Koronavirüs vakalarının analizinde Türkiye veri setinin oluşturulmasında Türkiye İstatistik Kurumu (TÜİK)’ndan ve Dünya Sağlık Örgütü (DSÖ) raporlarından ve Sağlık Bakanlığı basın açıklamalarından yararlanılmıştır. Bunun nedeni Türkiye veri setine daha derinlemesine bakılmak istenmesidir.

Çalışma kapsamında diğer ülkelere ilişkin koronavirüs vakaları ise Johns Hopkins Üniversitesi Sistem Bilimi ve Mühendisliği Merkezi (JHU CCSE) tarafından desteklenen “The Humanitarian Data Exchange (HDX) (İnsani Veri Alışverişi)” adlı platforma ait https://data.humdata.org web sitesinden alınmıştır. Önceki çalışmalardan faklı olarak bu platformdan veri alınmasının nedeni veri setleri içerisinde onaylanmış ve ölüm vakaları dışında iyileşen koronavirüs vakalarına da yer verilmiş olmasıdır.

Analizlerde Türkiye verisi için Microsoft Excel 2016 ve diğer ülke verileri için R programlama dili kullanılmıştır.

Keşifsel veri analizine geçilmeden önce vaka sayılarından yararlanarak epidemiyolojik hızlar hesaplanmıştır. Bu nedenle, çalışmada kullanılacak hızları açıklamanın faydalı olacağı düşünülmektedir.

Epidemiyoloji biliminde hız kavramı, bir sağlık olayının nüfus içindeki görülme frekansını hesaplamada kullanılan bir ölçüttür. Hızlar, belirli bir zaman diliminde meydana gelen olayların sayısının olayın meydana geldiği nüfusa bölünerek hesaplanır. Eşitliğin payı, sağlık olayı ile karşılaşanların sayısını (X), payda ise risk altındaki nüfusu (X+Y) göstermektedir. Risk altındaki nüfus hastalığa veya sağlık olaylarına karşı duyarlı olan nüfusu ifade etmektedir. Formülize edilirse;

Hız (Rate) = (X / X +Y) * k

Burada, k katsayıyı göstermektedir.

Analizde hızlardan girdi değişkeni olarak kullanılması düşünülen ilk gösterge ölüm veya mortalite ölçütlerinden biri olan Kaba Ölüm Hızı‘dır. Bu hız nüfusun sağlık düzeyini ortaya koymada duyarlı olmasa da bir fikir vermesi açısından önemlidir. Kaba ölüm hızı aşağıdaki eşitlikte gösterilmiştir.

Kaba Ölüm Hızı (Crude Death Rate) = (Bir toplumda belirli bir süre içinde meydana gelen ölüm sayısı / Aynı toplumun aynı süredeki
(yıl ortası) nüfusu) * 1000

Crude death rate = (Total number of deaths during a given time interval / Mid-interval population) * 1000

Girdi değişkeni olarak kullanılması düşünülen ikinci gösterge ölüm veya fatalite ölçütlerinden biri olan Fatalize Hızı‘dır. Bu gösterge kaba ölüm hızına göre daha duyarlı bir göstergedir. Diğer bir ifadeyle, hastalığa yakalananların ne kadarının öldüğünü gösterir. Fatalite hızı aşağıdaki eşitlik yardımıyla hesaplanmaktadır;

Fatalite Hızı (Fatality Rate) = (Nüfusta belirli bir süre içinde “X” hastalığından ölenlerin sayısı / Aynı nüfusun aynı süre içinde “X” hastalığına yakalananların sayısı) * 100

Fatality Rate = (Number of cause-specific deaths among the incident cases / Total number of incident cases) * 100

Türkiye ve Dünya Örnekleri / Cases of Turkey and World Countries

Analizde kullanılan veri Birleşmiş Milletler İnsani İşlerin Koordinasyon Bürosu (OCHA)‘nun web sitelerinden biri olan İnsani Veri Alışverişi (HDX) web sitesinden csv (Comma-seperated value) uzantılı olarak okutulan onaylanmış, ölen ve iyileşen koronavirüs vaka sayılarını içeren 3 farklı veri setinden oluşmaktadır.

Çalışmanın bu kısmında epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak Dünyada koronavirüs vakalarıyla ilgili olarak öne çıkan ülkeler verilmiştir.

Aşağıda yazdığım Python kod bloğu ile birlikte “İnsani Veri Alışverişi (HDX)veri tabanından güncel veri akışı sağlanabilecektir. Grafiklerde ise R programlama dili kullanılmıştır. Aşağıdaki kod bloğunda görüleceği üzere mevcut veri setlerinde olmayan 1 adet değişken hesaplanmıştır. Daha sonra bu değişkenler kod bloğu ile veri akışı sağlanmasından sonra birleştirilerek oluşturulan yeni veri setine ilave edilmiştir. İlave edilen değişkenler şöyledir:

  1. Fatali Fızı (Case Fatality Rate:CFR): Onaylanmış vaka sayılarının ölüm vaka sayılarına bölünmesiyle hesaplanmıştır. Çarpım katsayısı (k) ise 1000 olarak alınmıştır.
import numpy as np
import scipy as sp
import pandas as pd
import matplotlib as mpl
import seaborn as sns

case = pd.read_csv("https://data.humdata.org/hxlproxy/data/download/time_series_covid19_confirmed_global_narrow.csv?dest=data_edit&filter01=merge&merge-url01=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D1326629740%26single%3Dtrue%26output%3Dcsv&merge-keys01=%23country%2Bname&merge-tags01=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&filter02=merge&merge-url02=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D398158223%26single%3Dtrue%26output%3Dcsv&merge-keys02=%23adm1%2Bname&merge-tags02=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&merge-replace02=on&merge-overwrite02=on&filter03=explode&explode-header-att03=date&explode-value-att03=value&filter04=rename&rename-oldtag04=%23affected%2Bdate&rename-newtag04=%23date&rename-header04=Date&filter05=rename&rename-oldtag05=%23affected%2Bvalue&rename-newtag05=%23affected%2Binfected%2Bvalue%2Bnum&rename-header05=Value&filter06=clean&clean-date-tags06=%23date&filter07=sort&sort-tags07=%23date&sort-reverse07=on&filter08=sort&sort-tags08=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_confirmed_global.csv")
case = case.drop(case.index[[0]])
case = case.iloc[:,[1,2,3,4,5]]
case = case.rename(columns={"Country/Region": "Ulke","Date":"Tarih","Value": "Vaka", "Lat":"Lat","Long":"Long"})
case = case.astype({'Vaka': 'int64','Tarih': 'datetime64[ns]', 'Lat': 'float64', 'Long':'float64'})
case


url1="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_deaths_global_narrow.csv?dest=data_edit&filter01=merge&merge-url01=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D1326629740%26single%3Dtrue%26output%3Dcsv&merge-keys01=%23country%2Bname&merge-tags01=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&filter02=merge&merge-url02=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D398158223%26single%3Dtrue%26output%3Dcsv&merge-keys02=%23adm1%2Bname&merge-tags02=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&merge-replace02=on&merge-overwrite02=on&filter03=explode&explode-header-att03=date&explode-value-att03=value&filter04=rename&rename-oldtag04=%23affected%2Bdate&rename-newtag04=%23date&rename-header04=Date&filter05=rename&rename-oldtag05=%23affected%2Bvalue&rename-newtag05=%23affected%2Binfected%2Bvalue%2Bnum&rename-header05=Value&filter06=clean&clean-date-tags06=%23date&filter07=sort&sort-tags07=%23date&sort-reverse07=on&filter08=sort&sort-tags08=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_deaths_global.csv"
death= pd.read_csv(url1)
death = death.drop(death.index[[0]])
death = death.iloc[:,[1,2,3,4,5]]
death = death.rename(columns={"Country/Region": "Ulke","Date":"Tarih","Value": "Olen", "Lat":"Lat","Long":"Long"})
death = death.astype({'Olen': 'int32', 'Tarih': 'datetime64[ns]', 'Lat': 'float64', 'Long':'float64'})
death



url2="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_recovered_global_narrow.csv?dest=data_edit&filter01=merge&merge-url01=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D1326629740%26single%3Dtrue%26output%3Dcsv&merge-keys01=%23country%2Bname&merge-tags01=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&filter02=merge&merge-url02=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D398158223%26single%3Dtrue%26output%3Dcsv&merge-keys02=%23adm1%2Bname&merge-tags02=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&merge-replace02=on&merge-overwrite02=on&filter03=explode&explode-header-att03=date&explode-value-att03=value&filter04=rename&rename-oldtag04=%23affected%2Bdate&rename-newtag04=%23date&rename-header04=Date&filter05=rename&rename-oldtag05=%23affected%2Bvalue&rename-newtag05=%23affected%2Binfected%2Bvalue%2Bnum&rename-header05=Value&filter06=clean&clean-date-tags06=%23date&filter07=sort&sort-tags07=%23date&sort-reverse07=on&filter08=sort&sort-tags08=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_recovered_global.csv"
r = pd.read_csv(url2)
r = r.drop(r.index[[0]])
r = r.iloc[:,[1,2,3,4,5]]
r = r.rename(columns={"Country/Region": "Ulke","Date":"Tarih","Value": "Iyilesen", "Lat":"Lat","Long":"Long"})
r = r.astype({'Iyilesen': 'int32', 'Tarih': 'datetime64[ns]', 'Lat': 'float64', 'Long':'float64'})
r

#Veri Setlerinin Birleştirilmesi

x = case.merge(death, on=['Ulke','Lat','Long', 'Tarih'], how='left')
y = x.merge(r, on=['Ulke','Lat','Long', 'Tarih'], how='left')
result =result =y[(y.Vaka >0)]
result

result.isna().sum()# Variable: Iyilesen including  487 missing data 

result=result.fillna(0)#it is assigned to 0 in place of  NAN values
result

result.isna().sum()#Iyilesen: no missing data

result.info()#str gibi R'da olan: It give us idea about structure of data set 

Veri setindeki değişken sayısı 7, gözlem sayısı ise 20876’dir. Aşağıda mevcut değişkenler, değişkenlerin veri tipi ile birlikte gözlem sayısı görülmektedir. Daha sonra yedi olan değişken sayısı fatalite hızı ilave edilerek 8’e çıkarılmıştır. Ancak mükerrer tarihler benzersiz tarihlere düşürüldükten kalan gözlem sayısı 10734’tür.

<class 'pandas.core.frame.DataFrame'>
Int64Index: 10734 entries, 0 to 20876
Data columns (total 8 columns):
Ulke        10734 non-null object
Lat         10734 non-null float64
Long        10734 non-null float64
Tarih       10734 non-null datetime64[ns]
Vaka        10734 non-null int64
Olen        10734 non-null float64
Iyilesen    10734 non-null float64
CFR         10734 non-null float64
dtypes: datetime64[ns](1), float64(5), int64(1), object(1)
memory usage: 754.7+ KB

Veri setinde koronavirüs salgınının yaşandığı aşağıdaki listesi verilen 184 ülke ve/veya bölge bulunmaktadır.

['Afghanistan',
 'Albania',
 'Algeria',
 'Andorra',
 'Angola',
 'Antigua and Barbuda',
 'Argentina',
 'Armenia',
 'Australia',
 'Austria',
 'Azerbaijan',
 'Bahamas',
 'Bahrain',
 'Bangladesh',
 'Barbados',
 'Belarus',
 'Belgium',
 'Belize',
 'Benin',
 'Bhutan',
 'Bolivia',
 'Bosnia and Herzegovina',
 'Botswana',
 'Brazil',
 'Brunei',
 'Bulgaria',
 'Burkina Faso',
 'Burma',
 'Burundi',
 'Cabo Verde',
 'Cambodia',
 'Cameroon',
 'Canada',
 'Central African Republic',
 'Chad',
 'Chile',
 'China',
 'Colombia',
 'Congo (Brazzaville)',
 'Congo (Kinshasa)',
 'Costa Rica',
 "Cote d'Ivoire",
 'Croatia',
 'Cuba',
 'Cyprus',
 'Czechia',
 'Denmark',
 'Diamond Princess',
 'Djibouti',
 'Dominica',
 'Dominican Republic',
 'Ecuador',
 'Egypt',
 'El Salvador',
 'Equatorial Guinea',
 'Eritrea',
 'Estonia',
 'Eswatini',
 'Ethiopia',
 'Fiji',
 'Finland',
 'France',
 'Gabon',
 'Gambia',
 'Georgia',
 'Germany',
 'Ghana',
 'Greece',
 'Grenada',
 'Guatemala',
 'Guinea',
 'Guinea-Bissau',
 'Guyana',
 'Haiti',
 'Holy See',
 'Honduras',
 'Hungary',
 'Iceland',
 'India',
 'Indonesia',
 'Iran',
 'Iraq',
 'Ireland',
 'Israel',
 'Italy',
 'Jamaica',
 'Japan',
 'Jordan',
 'Kazakhstan',
 'Kenya',
 'Korea, South',
 'Kosovo',
 'Kuwait',
 'Kyrgyzstan',
 'Laos',
 'Latvia',
 'Lebanon',
 'Liberia',
 'Libya',
 'Liechtenstein',
 'Lithuania',
 'Luxembourg',
 'MS Zaandam',
 'Madagascar',
 'Malawi',
 'Malaysia',
 'Maldives',
 'Mali',
 'Malta',
 'Mauritania',
 'Mauritius',
 'Mexico',
 'Moldova',
 'Monaco',
 'Mongolia',
 'Montenegro',
 'Morocco',
 'Mozambique',
 'Namibia',
 'Nepal',
 'Netherlands',
 'New Zealand',
 'Nicaragua',
 'Niger',
 'Nigeria',
 'North Macedonia',
 'Norway',
 'Oman',
 'Pakistan',
 'Panama',
 'Papua New Guinea',
 'Paraguay',
 'Peru',
 'Philippines',
 'Poland',
 'Portugal',
 'Qatar',
 'Romania',
 'Russia',
 'Rwanda',
 'Saint Kitts and Nevis',
 'Saint Lucia',
 'Saint Vincent and the Grenadines',
 'San Marino',
 'Sao Tome and Principe',
 'Saudi Arabia',
 'Senegal',
 'Serbia',
 'Seychelles',
 'Sierra Leone',
 'Singapore',
 'Slovakia',
 'Slovenia',
 'Somalia',
 'South Africa',
 'South Sudan',
 'Spain',
 'Sri Lanka',
 'Sudan',
 'Suriname',
 'Sweden',
 'Switzerland',
 'Syria',
 'Taiwan*',
 'Tanzania',
 'Thailand',
 'Timor-Leste',
 'Togo',
 'Trinidad and Tobago',
 'Tunisia',
 'Turkey',
 'US',
 'Uganda',
 'Ukraine',
 'United Arab Emirates',
 'United Kingdom',
 'Uruguay',
 'Uzbekistan',
 'Venezuela',
 'Vietnam',
 'West Bank and Gaza',
 'Western Sahara',
 'Zambia',
 'Zimbabwe']

Dünya

Dünyada görülen koronavirüs vakalarının tanımlayıcı istatistikleri aşağıdaki tabloda verilmiştir. Veri setindeki vaka sayıları kümülatif olarak ilerlemektedir.

Dünyadaki Koronavirüs Vakalarının Tanımlayıcı İstatistikleri

Kümülatif vaka sayılarına göre en yüksek 10 ülke aşağıdaki tabloda karşılaştırmalı olarak verilmiştir.

En Yüksek Kümülatif Vaka Sayısına Sahip 10 Ülke

En Yüksek Kümülatif Ölüm Vaka Sayısına Sahip 10 Ülke

En Yüksek Kümülatif İyileşen Vaka Sayısına Sahip 10 Ülke

Vaka Sayısı En Yüksek 10 Ülkenin Gün Başına Vaka Sayıları

Vaka Sayısı En Yüksek 10 Ülkenin Gün Başına Ölüm Sayıları

Vaka Sayısı En Yüksek 10 Ülkenin Gün Başına İyileşen Sayıları

Dünya Ülkelerinin Gün Başına Vaka, Ölüm ve İyileşen İstatistikleri

Aşağıdaki linkten 184 ülkenin gün başına vaka, ölüm ve iyileşen istatistiklerini indirebilirsiniz. Burada hangi ülkenin kaç günde ne kadar vaka, ölüm ve iyileşen sayısına ulaştığı görülebilir.

Sonuç / Conclusion

Özetle, İnsani Veri Alışverişi (HDX) platformundan alınan 3 farklı koronavirüs hastalık veri setinin birleştirilmesinden sonra epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak koronavirüs pandemisinin trendi hakkında farkındalık oluşturulması amaçlanmıştır.

Faydalı olması dileğiyle.

Sağlıkla ve bilimle kalınız.

Saygılarımla.

Note: It can not be cited or copied without referencing.

Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.

Yararlanılan Kaynaklar / Resources Utilized

9 Nisan 2020 Tarihi İtibariyle Koronavirüs Pandemisi Üzerine Vaka Çalışmaları: Türkiye ve Diğer Ülke Örnekleri (Case Studies on Coronavirus Pandemic: Cases of Turkey and Other Countries As of April 9, 2020)

Giriş / Introduction

Coronavirüsler (CoV), soğuk algınlığından Orta Doğu Solunum Sendromu (MERS-CoV) ve Şiddetli Akut Solunum Sendromu (SARS-CoV) gibi daha ciddi hastalıklara kadar pek çok hastalığa neden olan büyük bir virüs ailesidir. Bu yeni virüse, yüzey çıkıntıları taç görünümünde olduğu için coronavirus adı verilmiş olup, bu virüs ailesi tek zincirli, pozitif polariteli, zarflı RNA virüsleridir.

Koronavirüs hastalığı (COVID-19), 2019 yılında keşfedilen ve daha önce insanlarda tanımlanmamış yeni bir suştur. Suş, bir bakteri veya virüsün farklı alt türlerinin, aralarında genetik farklılıklar bulunan grupları olarak adlandırılır.

Bu Koronavirüsler zoonotiktir, yani hayvanlar ve insanlar arasında bulaşırlar. Ayrıntılı araştırmalar SARS-CoV’nin misk kedilerinden insanlara ve MERS-CoV’un tek hörgüçlü develerden insanlara bulaştığını göstermiştir. Bilinen birkaç koronavirüs henüz insanları enfekte etmeyen hayvanlarla taşınmaktadır.

Enfeksiyon belirtileri arasında solunum semptomları, ateş, öksürük, nefes darlığı ve solunum güçlüğü bulunur. Daha ciddi vakalarda, enfeksiyon pnömoniye, ciddi akut solunum sendromuna, böbrek yetmezliğine ve hatta ölüme neden olabilir. Solunum sistemi hastalıklarından biri olan pnömoni ya da halk arasında zatürre bakteriler başta olmak üzere mikroorganizmalara bağlı olarak ortaya çıkan akciğer dokusunun iltihaplanmasıdır. Grip gibi bu hastalık da bağışıklık (immun) sistemini baskılayan hastalıklardan biridir. Özellikle ileri yaşlardaki bireylerde hem bağışıklık sisteminin yaşla birlikte yavaşlaması hem de yaşa ve/veya diğer nedenlere bağlı olarak kronik ve diğer hastalıkların görülmesi bu yaşlardaki bireylerde ölüm oranlarını artırabilmektedir. Diğer bir deyişle, bu enfeksiyon komplikasyon yaratarak ve mevcut diğer hastalıkları tetikleyerek bu yaş gruplarında diğer yaş gruplarına göre daha öldürücü olabilir.

Enfeksiyonun yayılmasını önlemek için standart öneriler arasında düzenli el yıkama, öksürme ve hapşırma sırasında ağız ve burnun kapatılması, et ve yumurtaların iyice pişirilmesi yer alır. Öksürme ve hapşırma gibi solunum yolu rahatsızlığı belirtileri gösteren kişilerle yakın temastan kaçınmak bu hastalıktan korunmak için atılacak önemli koruyucu tedbirlerden biridir.

Hastalıktan nasıl korunulacağı hakkında bilgi verdikten sonra bu hastalığın teşhisinde kullanılan ve adı son zamanlarda sık sık duyulan PCR testi hakkında bilgi vermek faydalı olacaktır. PCR, ingilizce adıyla “Polymerase Chain Reaction” kelimelerinin bir araya gelmesinden oluşan ve moleküler biyoloji alanında kullanılan bir tekniktir.Türkçe ise ise polimeraz zincir reaksiyonu olarak adlandırılır. Bazen PCR moleküler fotokopi (molecular photocopying) olarak da adlandırılabilmektedir. DNA’nın küçük bölümlerini kopyalamak için kullanılan hızlı ve ucuz bir tekniktir. Moleküler ve genetik analizler için büyük miktarlarda DNA örneği gerekli olduğundan, izole edilmiş DNA parçaları üzerinde çalışmalar PCR amplifikasyonu olmadan neredeyse imkansızdır. PCR’ın kullanım alanları şöyle özetlenebilir:

  1. Amplifiye edildikten sonra PCR ile üretilen DNA, birçok farklı laboratuvar prosedüründe kullanılabilir. Örneğin, İnsan Genom Projesindeki (HGP) çoğu haritalama tekniği PCR’a dayanmaktadır.
  2. Parmak izi, bakteri veya virüslerin (özellikle AIDS) tespiti ve genetik bozuklukların teşhisi gibi bir dizi laboratuvar ve klinik teknikte de değerlidir.

PCR ( Polimeraz Zincir Reaksiyonu) tekniğinin çalışma şeması ise aşağıdaki şekilde verilmiştir.

polymerase chain reaction diagram
Kaynak: The National Human Genome Research Institute (NHGRI)

PCR tekniğini kullanarak koronavirüs teşhisinin nasıl konulduğuna ilişkin bir video aşağıda verilerek teşhis süreci hakkında bilgi verilmesi amaçlanmıştır.

Kaynak:
AMBOSS: Medical Knowledge Distilled

Bilindiği üzere koronavirüs hastalığının teşhis ve özellikle tedavisine yönelik olarak ilaç ve aşı geliştirme alanında Dünya’da ve ülkemizde yoğun bir mesai harcanmaktadır. Bunlardan biri ülkemizde 02.04.2020 tarihinde Sanayi ve Teknoloji Bakanlığı ve TÜBİTAK bünyesinde “Covid-19 Türkiye Platformu Aşı ve İlaç Geliştirme” bilim insanların katıldığı sanal bir konferans gerçekleştirilmiştir. Türkiye dışında da benzer çalışmalar sanal ortamda çalıştay ve konferans olarak yapılmaktadır. Dünyada yapılan ve benim de katılım sağladığım önde giden bu çalışmalardan biri de Avrupa Öğrenme ve Akıllı Sistemler Laboratuvarı ingilizce adıyla European Laboratory for Learning and Intelligent Systems (ELLIS)’ın 02.04.2020 tarihinde düzenlediği “ELLIS Against Covid-19” adlı çalıştaydır. Dünyanın farklı üniversitelerinden bilim insanlarının katılım sağladığı çalıştayda koranavirüs pandemisinin teşhisinde kullanılan yapay zeka teknolojilerinden koronavirüsün tedavisinde kullanılan ilaçların geliştirilmesinde kullanılan yapay zeka teknolojilerine kadar pek çok konu ele alınmıştır. Çalıştayda ağırlıklı olarak ele alınan konu yapay zekanın teşhis ve tedavide nasıl kullanıldığı ve kullanılacağı idi. Çalıştayda koronavirüs ile mücadele çok güzel uygulama örneklerine yer verilmiştir. Daha önce de dile getirdiğim gibi yapay zeka günümüzün ve geleceğin en kritik teknolojisidir. Bu gerek 4. Sanayi Devrimi gerekse Toplum 5.0 açısından olsun böyledir ve farklı ülkeler yapay zekayı teşhis ve tedavi (robotik cerrahi ve ilaç geliştirme) alanlarında kullanmak için çok ciddi adımlar atmıştır. Bu yapıların da ülkemizde kurulması ve yapay zeka enstitülerinin ülkemizde yaygınlaştırılması gerekmektedir. Aynı zamanda Türkiye Büyük Millet Meclisi bünyesinde Yapay Zeka Komisyonu kurulmalıdır. Yapay zeka özünde öğrenen sistemler olduğu ve sürekli gelişim gösterdiği için sektör ayrımı olmaksızın her alanda kendine uygulama alanı bulan bir teknolojidir.

Koronavirüs salgını Çin ile birlikte diğer ülkelere de yayıldığı için Dünya Sağlık Örgütü tarafından 30/01/2020 tarihinde uluslararası halk sağlığı açısından acil durum ilan edilmiştir. Bu hastalıktan bahsedilirken lise ve üniversite yıllarımda benim de ders olarak aldığım Epidemiyoloji biliminden bahsetmemek olmaz. Epidemiyoloji, toplumda sağlıkla ilgili durumların veya olayların (hastalık dahil) dağılımını, görülme sıklıklarını ve bunları etkileyen faktörleri inceleyen bir tıp bilimi dalıdır.

Epidemiyolojik araştırmalar yapmak için çeşitli yöntemler kullanılabilir. Bu yöntemler dağılımı incelemek için sürveyans, tanımlayıcı çalışmalar ve hastalık belirleyicilerini incelemek için analitik çalışmalar olabilir. Bilindiği üzere Koronavirüs hastalığı artık pandemik bir vaka olarak adlandırılmaktadır. Epidemiyolojinin konu alanına giren pandemi dünyada birden fazla ülkede veya kıtada, çok geniş bir alanda
yayılan ve etkisini gösteren salgın hastalıklara verilen genel isim
olarak ifade edilmektedir. Diğer bir deyişle, salgın (epidemi) durumundaki bir hastalığın ülke sınırlarını aşarak diğer ülkelere yayılım göstermesidir.

Avrupa Birliği kurumlarından biri olan “Avrupa Hastalık Önleme ve Kontrol Merkezi (European Centre for Disease Prevention and Control)”‘ne göre ön bulgular koronavirüs hastalığından vakalara dayalı ölüm oranı (fatalite hızı)’nın binde 20-30 olduğunu göstermektedir. Bu, 2003 SARS salgınından önemli ölçüde daha az. Bununla birlikte, mevsimsel gripin neden ölüm oranlarından çok daha yüksektir.

Çalışma kapsamında koronavirüs pandemi vakalarının epidemiyolojik hızlarla birlikte keşifsel veri analizi (EDA) yapılarak vakaların izlediği seyrin ortaya konulması amaçlanmıştır

Metodoloji / Methodology

Çalışmanın amacı, koronavirüs vakalarının epidemiyolojik düzlemde Türkiye’de ve diğer ülkelerde izlediği seyri detaylı bir şekilde keşifsel veri analiziyle ortaya konulara karar vericilere katkı sunmaktır.

Koronavirüs vakalarının analizinde Türkiye veri setinin oluşturulmasında Türkiye İstatistik Kurumu (TÜİK)’ndan ve Dünya Sağlık Örgütü (DSÖ) raporlarından ve Sağlık Bakanlığı basın açıklamalarından yararlanılmıştır. Bunun nedeni Türkiye veri setine daha derinlemesine bakılmak istenmesidir.

Çalışma kapsamında diğer ülkelere ilişkin koronavirüs vakaları ise Johns Hopkins Üniversitesi Sistem Bilimi ve Mühendisliği Merkezi (JHU CCSE) tarafından desteklenen “The Humanitarian Data Exchange (HDX) (İnsani Veri Alışverişi)” adlı platforma ait https://data.humdata.org web sitesinden alınmıştır. Önceki çalışmalardan faklı olarak bu platformdan veri alınmasının nedeni veri setleri içerisinde onaylanmış ve ölüm vakaları dışında iyileşen koronavirüs vakalarına da yer verilmiş olmasıdır.

Analizlerde Türkiye verisi için Microsoft Excel 2016 ve diğer ülke verileri için R programlama dili kullanılmıştır.

Keşifsel veri analizine geçilmeden önce vaka sayılarından yararlanarak epidemiyolojik hızlar hesaplanmıştır. Bu nedenle, çalışmada kullanılacak hızları açıklamanın faydalı olacağı düşünülmektedir.

Epidemiyoloji biliminde hız kavramı, bir sağlık olayının nüfus içindeki görülme frekansını hesaplamada kullanılan bir ölçüttür. Hızlar, belirli bir zaman diliminde meydana gelen olayların sayısının olayın meydana geldiği nüfusa bölünerek hesaplanır. Eşitliğin payı, sağlık olayı ile karşılaşanların sayısını (X), payda ise risk altındaki nüfusu (X+Y) göstermektedir. Risk altındaki nüfus hastalığa veya sağlık olaylarına karşı duyarlı olan nüfusu ifade etmektedir. Formülize edilirse;

Hız (Rate) = (X / X +Y) * k

Burada, k katsayıyı göstermektedir.

Analizde hızlardan girdi değişkeni olarak kullanılması düşünülen ilk gösterge ölüm veya mortalite ölçütlerinden biri olan Kaba Ölüm Hızı‘dır. Bu hız nüfusun sağlık düzeyini ortaya koymada duyarlı olmasa da bir fikir vermesi açısından önemlidir. Kaba ölüm hızı aşağıdaki eşitlikte gösterilmiştir.

Kaba Ölüm Hızı (Crude Death Rate) = (Bir toplumda belirli bir süre içinde meydana gelen ölüm sayısı / Aynı toplumun aynı süredeki
(yıl ortası) nüfusu) * 1000

Crude death rate = (Total number of deaths during a given time interval / Mid-interval population) * 1000

Girdi değişkeni olarak kullanılması düşünülen ikinci gösterge ölüm veya fatalite ölçütlerinden biri olan Fatalize Hızı‘dır. Bu gösterge kaba ölüm hızına göre daha duyarlı bir göstergedir. Diğer bir ifadeyle, hastalığa yakalananların ne kadarının öldüğünü gösterir. Fatalite hızı aşağıdaki eşitlik yardımıyla hesaplanmaktadır;

Fatalite Hızı (Fatality Rate) = (Nüfusta belirli bir süre içinde “X” hastalığından ölenlerin sayısı / Aynı nüfusun aynı süre içinde “X” hastalığına yakalananların sayısı) * 100

Fatality Rate = (Number of cause-specific deaths among the incident cases / Total number of incident cases) * 100

Türkiye ve Dünya Örnekleri / Cases of Turkey and World Countries

Analizde kullanılan veri Birleşmiş Milletler İnsani İşlerin Koordinasyon Bürosu (OCHA)‘nun web sitelerinden biri olan İnsani Veri Alışverişi (HDX) web sitesinden csv (Comma-seperated value) uzantılı olarak okutulan onaylanmış, ölen ve iyileşen koronavirüs vaka sayılarını içeren 3 farklı veri setinden oluşmaktadır.

Çalışmanın bu kısmında epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak Dünyada koronavirüs vakalarıyla ilgili olarak öne çıkan ülkeler verilmiştir.

Aşağıda yazdığım Python kod bloğu ile birlikte “İnsani Veri Alışverişi (HDX)veri tabanından güncel veri akışı sağlanabilecektir. Aşağıdaki kod bloğunda görüleceği üzere mevcut veri setlerinde olmayan 1 adet değişken hesaplanmıştır. Daha sonra bu değişkenler kod bloğu ile veri akışı sağlanmasından sonra birleştirilerek oluşturulan yeni veri setine ilave edilmiştir. İlave edilen değişkenler şöyledir:

  1. Fatali Fızı (Case Fatality Rate:CFR): Onaylanmış vaka sayılarının ölüm vaka sayılarına bölünmesiyle hesaplanmıştır. Çarpım katsayısı (k) ise 1000 olarak alınmıştır.
import numpy as np
import scipy as sp
import pandas as pd
import matplotlib as mpl
import seaborn as sns

case = pd.read_csv("https://data.humdata.org/hxlproxy/data/download/time_series_covid19_confirmed_global_narrow.csv?dest=data_edit&filter01=merge&merge-url01=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D1326629740%26single%3Dtrue%26output%3Dcsv&merge-keys01=%23country%2Bname&merge-tags01=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&filter02=merge&merge-url02=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D398158223%26single%3Dtrue%26output%3Dcsv&merge-keys02=%23adm1%2Bname&merge-tags02=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&merge-replace02=on&merge-overwrite02=on&filter03=explode&explode-header-att03=date&explode-value-att03=value&filter04=rename&rename-oldtag04=%23affected%2Bdate&rename-newtag04=%23date&rename-header04=Date&filter05=rename&rename-oldtag05=%23affected%2Bvalue&rename-newtag05=%23affected%2Binfected%2Bvalue%2Bnum&rename-header05=Value&filter06=clean&clean-date-tags06=%23date&filter07=sort&sort-tags07=%23date&sort-reverse07=on&filter08=sort&sort-tags08=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_confirmed_global.csv")
case = case.drop(case.index[[0]])
case = case.iloc[:,[1,2,3,4,5]]
case = case.rename(columns={"Country/Region": "Ulke","Date":"Tarih","Value": "Vaka", "Lat":"Lat","Long":"Long"})
case = case.astype({'Vaka': 'int64','Tarih': 'datetime64[ns]', 'Lat': 'float64', 'Long':'float64'})
case


url1="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_deaths_global_narrow.csv?dest=data_edit&filter01=merge&merge-url01=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D1326629740%26single%3Dtrue%26output%3Dcsv&merge-keys01=%23country%2Bname&merge-tags01=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&filter02=merge&merge-url02=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D398158223%26single%3Dtrue%26output%3Dcsv&merge-keys02=%23adm1%2Bname&merge-tags02=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&merge-replace02=on&merge-overwrite02=on&filter03=explode&explode-header-att03=date&explode-value-att03=value&filter04=rename&rename-oldtag04=%23affected%2Bdate&rename-newtag04=%23date&rename-header04=Date&filter05=rename&rename-oldtag05=%23affected%2Bvalue&rename-newtag05=%23affected%2Binfected%2Bvalue%2Bnum&rename-header05=Value&filter06=clean&clean-date-tags06=%23date&filter07=sort&sort-tags07=%23date&sort-reverse07=on&filter08=sort&sort-tags08=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_deaths_global.csv"
death= pd.read_csv(url1)
death = death.drop(death.index[[0]])
death = death.iloc[:,[1,2,3,4,5]]
death = death.rename(columns={"Country/Region": "Ulke","Date":"Tarih","Value": "Olen", "Lat":"Lat","Long":"Long"})
death = death.astype({'Olen': 'int32', 'Tarih': 'datetime64[ns]', 'Lat': 'float64', 'Long':'float64'})
death



url2="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_recovered_global_narrow.csv?dest=data_edit&filter01=merge&merge-url01=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D1326629740%26single%3Dtrue%26output%3Dcsv&merge-keys01=%23country%2Bname&merge-tags01=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&filter02=merge&merge-url02=https%3A%2F%2Fdocs.google.com%2Fspreadsheets%2Fd%2Fe%2F2PACX-1vTglKQRXpkKSErDiWG6ycqEth32MY0reMuVGhaslImLjfuLU0EUgyyu2e-3vKDArjqGX7dXEBV8FJ4f%2Fpub%3Fgid%3D398158223%26single%3Dtrue%26output%3Dcsv&merge-keys02=%23adm1%2Bname&merge-tags02=%23country%2Bcode%2C%23region%2Bmain%2Bcode%2C%23region%2Bsub%2Bcode%2C%23region%2Bintermediate%2Bcode&merge-replace02=on&merge-overwrite02=on&filter03=explode&explode-header-att03=date&explode-value-att03=value&filter04=rename&rename-oldtag04=%23affected%2Bdate&rename-newtag04=%23date&rename-header04=Date&filter05=rename&rename-oldtag05=%23affected%2Bvalue&rename-newtag05=%23affected%2Binfected%2Bvalue%2Bnum&rename-header05=Value&filter06=clean&clean-date-tags06=%23date&filter07=sort&sort-tags07=%23date&sort-reverse07=on&filter08=sort&sort-tags08=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_recovered_global.csv"
r = pd.read_csv(url2)
r = r.drop(r.index[[0]])
r = r.iloc[:,[1,2,3,4,5]]
r = r.rename(columns={"Country/Region": "Ulke","Date":"Tarih","Value": "Iyilesen", "Lat":"Lat","Long":"Long"})
r = r.astype({'Iyilesen': 'int32', 'Tarih': 'datetime64[ns]', 'Lat': 'float64', 'Long':'float64'})
r

#Veri Setlerinin Birleştirilmesi

x = case.merge(death, on=['Ulke','Lat','Long', 'Tarih'], how='left')
y = x.merge(r, on=['Ulke','Lat','Long', 'Tarih'], how='left')
result =result =y[(y.Vaka >0)]
result

result.isna().sum()# Variable: Iyilesen including  487 missing data 

result=result.fillna(0)#it is assigned to 0 in place of  NAN values
result

result.isna().sum()#Iyilesen: no missing data

result.info()#str gibi R'da olan: It give us idea about structure of data set 

Veri setindeki değişken sayısı 7, gözlem sayısı ise 20611’dir. Aşağıda mevcut değişkenler, değişkenlerin veri tipi ile birlikte gözlem sayısı görülmektedir. Daha sonra yedi olan değişken sayısı fatalite hızı ilave edilerek 8’e çıkarılmıştır. Ancak mükerrer tarihler benzersiz tarihlere düşürüldükten kalan gözlem sayısı 10473’tür.

<class 'pandas.core.frame.DataFrame'>
Int64Index: 10473 entries, 0 to 20611
Data columns (total 7 columns):
Ulke        10473 non-null object
Lat         10473 non-null float64
Long        10473 non-null float64
Tarih       10473 non-null datetime64[ns]
Vaka        10473 non-null int64
Olen        10473 non-null int32
Iyilesen    10473 non-null float64
dtypes: datetime64[ns](1), float64(3), int32(1), int64(1), object(1)
memory usage: 613.7+ KB

Veri setinde koronavirüs salgınının yaşandığı aşağıdaki listesi verilen 184 ülke ve/veya bölge bulunmaktadır.

['Afghanistan',
 'Albania',
 'Algeria',
 'Andorra',
 'Angola',
 'Antigua and Barbuda',
 'Argentina',
 'Armenia',
 'Australia',
 'Austria',
 'Azerbaijan',
 'Bahamas',
 'Bahrain',
 'Bangladesh',
 'Barbados',
 'Belarus',
 'Belgium',
 'Belize',
 'Benin',
 'Bhutan',
 'Bolivia',
 'Bosnia and Herzegovina',
 'Botswana',
 'Brazil',
 'Brunei',
 'Bulgaria',
 'Burkina Faso',
 'Burma',
 'Burundi',
 'Cabo Verde',
 'Cambodia',
 'Cameroon',
 'Canada',
 'Central African Republic',
 'Chad',
 'Chile',
 'China',
 'Colombia',
 'Congo (Brazzaville)',
 'Congo (Kinshasa)',
 'Costa Rica',
 "Cote d'Ivoire",
 'Croatia',
 'Cuba',
 'Cyprus',
 'Czechia',
 'Denmark',
 'Diamond Princess',
 'Djibouti',
 'Dominica',
 'Dominican Republic',
 'Ecuador',
 'Egypt',
 'El Salvador',
 'Equatorial Guinea',
 'Eritrea',
 'Estonia',
 'Eswatini',
 'Ethiopia',
 'Fiji',
 'Finland',
 'France',
 'Gabon',
 'Gambia',
 'Georgia',
 'Germany',
 'Ghana',
 'Greece',
 'Grenada',
 'Guatemala',
 'Guinea',
 'Guinea-Bissau',
 'Guyana',
 'Haiti',
 'Holy See',
 'Honduras',
 'Hungary',
 'Iceland',
 'India',
 'Indonesia',
 'Iran',
 'Iraq',
 'Ireland',
 'Israel',
 'Italy',
 'Jamaica',
 'Japan',
 'Jordan',
 'Kazakhstan',
 'Kenya',
 'Korea, South',
 'Kosovo',
 'Kuwait',
 'Kyrgyzstan',
 'Laos',
 'Latvia',
 'Lebanon',
 'Liberia',
 'Libya',
 'Liechtenstein',
 'Lithuania',
 'Luxembourg',
 'MS Zaandam',
 'Madagascar',
 'Malawi',
 'Malaysia',
 'Maldives',
 'Mali',
 'Malta',
 'Mauritania',
 'Mauritius',
 'Mexico',
 'Moldova',
 'Monaco',
 'Mongolia',
 'Montenegro',
 'Morocco',
 'Mozambique',
 'Namibia',
 'Nepal',
 'Netherlands',
 'New Zealand',
 'Nicaragua',
 'Niger',
 'Nigeria',
 'North Macedonia',
 'Norway',
 'Oman',
 'Pakistan',
 'Panama',
 'Papua New Guinea',
 'Paraguay',
 'Peru',
 'Philippines',
 'Poland',
 'Portugal',
 'Qatar',
 'Romania',
 'Russia',
 'Rwanda',
 'Saint Kitts and Nevis',
 'Saint Lucia',
 'Saint Vincent and the Grenadines',
 'San Marino',
 'Sao Tome and Principe',
 'Saudi Arabia',
 'Senegal',
 'Serbia',
 'Seychelles',
 'Sierra Leone',
 'Singapore',
 'Slovakia',
 'Slovenia',
 'Somalia',
 'South Africa',
 'South Sudan',
 'Spain',
 'Sri Lanka',
 'Sudan',
 'Suriname',
 'Sweden',
 'Switzerland',
 'Syria',
 'Taiwan*',
 'Tanzania',
 'Thailand',
 'Timor-Leste',
 'Togo',
 'Trinidad and Tobago',
 'Tunisia',
 'Turkey',
 'US',
 'Uganda',
 'Ukraine',
 'United Arab Emirates',
 'United Kingdom',
 'Uruguay',
 'Uzbekistan',
 'Venezuela',
 'Vietnam',
 'West Bank and Gaza',
 'Western Sahara',
 'Zambia',
 'Zimbabwe']

Dünya

Dünyada görülen koronavirüs vakalarının tanımlayıcı istatistikleri aşağıdaki tabloda verilmiştir. Veri setindeki vaka sayıları kümülatif olarak ilerlemektedir.

Dünyadaki Koronavirüs Vakalarının Tanımlayıcı İstatistikleri

Kümülatif vaka sayılarına göre en yüksek 10 ülke aşağıdaki tabloda karşılaştırmalı olarak verilmiştir.

En Yüksek Kümülatif Vaka Sayısına Sahip 10 Ülke

Bu görselin boş bir alt özelliği var; dosya ismi: image-87.png

En Yüksek Kümülatif Ölüm Vaka Sayısına Sahip 10 Ülke

En Yüksek Kümülatif İyileşen Vaka Sayısına Sahip 10 Ülke

Sonuç / Conclusion

Özetle, İnsani Veri Alışverişi (HDX) platformundan alınan 3 farklı koronavirüs hastalık veri setinin birleştirilmesinden sonra epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak koronavirüs pandemisinin trendi hakkında farkındalık oluşturulması amaçlanmıştır.

Faydalı olması dileğiyle.

Sağlıkla ve bilimle kalınız.

Saygılarımla.

Note: It can not be cited or copied without referencing.

Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.

Yararlanılan Kaynaklar / Resources Utilized

5 Nisan 2020 Tarihi İtibariyle Koronavirüs Pandemisi Üzerine Vaka Çalışmaları: Türkiye ve Diğer Ülke Örnekleri (Case Studies on Coronavirus Pandemic: Cases of Turkey and Other Countries As of April 5, 2020)

Giriş / Introduction

Coronavirüsler (CoV), soğuk algınlığından Orta Doğu Solunum Sendromu (MERS-CoV) ve Şiddetli Akut Solunum Sendromu (SARS-CoV) gibi daha ciddi hastalıklara kadar pek çok hastalığa neden olan büyük bir virüs ailesidir. Bu yeni virüse, yüzey çıkıntıları taç görünümünde olduğu için coronavirus adı verilmiş olup, bu virüs ailesi tek zincirli, pozitif polariteli, zarflı RNA virüsleridir.

Koronavirüs hastalığı (COVID-19), 2019 yılında keşfedilen ve daha önce insanlarda tanımlanmamış yeni bir suştur. Suş, bir bakteri veya virüsün farklı alt türlerinin, aralarında genetik farklılıklar bulunan grupları olarak adlandırılır.

Bu Koronavirüsler zoonotiktir, yani hayvanlar ve insanlar arasında bulaşırlar. Ayrıntılı araştırmalar SARS-CoV’nin misk kedilerinden insanlara ve MERS-CoV’un tek hörgüçlü develerden insanlara bulaştığını göstermiştir. Bilinen birkaç koronavirüs henüz insanları enfekte etmeyen hayvanlarla taşınmaktadır.

Enfeksiyon belirtileri arasında solunum semptomları, ateş, öksürük, nefes darlığı ve solunum güçlüğü bulunur. Daha ciddi vakalarda, enfeksiyon pnömoniye, ciddi akut solunum sendromuna, böbrek yetmezliğine ve hatta ölüme neden olabilir. Solunum sistemi hastalıklarından biri olan pnömoni ya da halk arasında zatürre bakteriler başta olmak üzere mikroorganizmalara bağlı olarak ortaya çıkan akciğer dokusunun iltihaplanmasıdır. Grip gibi bu hastalık da bağışıklık (immun) sistemini baskılayan hastalıklardan biridir. Özellikle ileri yaşlardaki bireylerde hem bağışıklık sisteminin yaşla birlikte yavaşlaması hem de yaşa ve/veya diğer nedenlere bağlı olarak kronik ve diğer hastalıkların görülmesi bu yaşlardaki bireylerde ölüm oranlarını artırabilmektedir. Diğer bir deyişle, bu enfeksiyon komplikasyon yaratarak ve mevcut diğer hastalıkları tetikleyerek bu yaş gruplarında diğer yaş gruplarına göre daha öldürücü olabilir.

Enfeksiyonun yayılmasını önlemek için standart öneriler arasında düzenli el yıkama, öksürme ve hapşırma sırasında ağız ve burnun kapatılması, et ve yumurtaların iyice pişirilmesi yer alır. Öksürme ve hapşırma gibi solunum yolu rahatsızlığı belirtileri gösteren kişilerle yakın temastan kaçınmak bu hastalıktan korunmak için atılacak önemli koruyucu tedbirlerden biridir.

Hastalıktan nasıl korunulacağı hakkında bilgi verdikten sonra bu hastalığın teşhisinde kullanılan ve adı son zamanlarda sık sık duyulan PCR testi hakkında bilgi vermek faydalı olacaktır. PCR, ingilizce adıyla “Polymerase Chain Reaction” kelimelerinin bir araya gelmesinden oluşan ve moleküler biyoloji alanında kullanılan bir tekniktir.Türkçe ise ise polimeraz zincir reaksiyonu olarak adlandırılır. Bazen PCR moleküler fotokopi (molecular photocopying) olarak da adlandırılabilmektedir. DNA’nın küçük bölümlerini kopyalamak için kullanılan hızlı ve ucuz bir tekniktir. Moleküler ve genetik analizler için büyük miktarlarda DNA örneği gerekli olduğundan, izole edilmiş DNA parçaları üzerinde çalışmalar PCR amplifikasyonu olmadan neredeyse imkansızdır. PCR’ın kullanım alanları şöyle özetlenebilir:

  1. Amplifiye edildikten sonra PCR ile üretilen DNA, birçok farklı laboratuvar prosedüründe kullanılabilir. Örneğin, İnsan Genom Projesindeki (HGP) çoğu haritalama tekniği PCR’a dayanmaktadır.
  2. Parmak izi, bakteri veya virüslerin (özellikle AIDS) tespiti ve genetik bozuklukların teşhisi gibi bir dizi laboratuvar ve klinik teknikte de değerlidir.

PCR ( Polimeraz Zincir Reaksiyonu) tekniğinin çalışma şeması ise aşağıdaki şekilde verilmiştir.

polymerase chain reaction diagram
Kaynak: The National Human Genome Research Institute (NHGRI)

PCR tekniğini kullanarak koronavirüs teşhisinin nasıl konulduğuna ilişkin bir video aşağıda verilerek teşhis süreci hakkında bilgi verilmesi amaçlanmıştır.

Kaynak:
AMBOSS: Medical Knowledge Distilled

Bilindiği üzere koronavirüs hastalığının teşhis ve özellikle tedavisine yönelik olarak ilaç ve aşı geliştirme alanında Dünya’da ve ülkemizde yoğun bir mesai harcanmaktadır. Bunlardan biri ülkemizde 02.04.2020 tarihinde Sanayi ve Teknoloji Bakanlığı ve TÜBİTAK bünyesinde “Covid-19 Türkiye Platformu Aşı ve İlaç Geliştirme” bilim insanların katıldığı sanal bir konferans gerçekleştirilmiştir. Türkiye dışında da benzer çalışmalar sanal ortamda çalıştay ve konferans olarak yapılmaktadır. Dünyada yapılan ve benim de katılım sağladığım önde giden bu çalışmalardan biri de Avrupa Öğrenme ve Akıllı Sistemler Laboratuvarı ingilizce adıyla European Laboratory for Learning and Intelligent Systems (ELLIS)’ın 02.04.2020 tarihinde düzenlediği “ELLIS Against Covid-19” adlı çalıştaydır. Dünyanın farklı üniversitelerinden bilim insanlarının katılım sağladığı çalıştayda koranavirüs pandemisinin teşhisinde kullanılan yapay zeka teknolojilerinden koronavirüsün tedavisinde kullanılan ilaçların geliştirilmesinde kullanılan yapay zeka teknolojilerine kadar pek çok konu ele alınmıştır. Çalıştayda ağırlıklı olarak ele alınan konu yapay zekanın teşhis ve tedavide nasıl kullanıldığı ve kullanılacağı idi. Çalıştayda koronavirüs ile mücadele çok güzel uygulama örneklerine yer verilmiştir. Daha önce de dile getirdiğim gibi yapay zeka günümüzün ve geleceğin en kritik teknolojisidir. Bu gerek 4. Sanayi Devrimi gerekse Toplum 5.0 açısından olsun böyledir ve farklı ülkeler yapay zekayı teşhis ve tedavi (robotik cerrahi ve ilaç geliştirme) alanlarında kullanmak için çok ciddi adımlar atmıştır. Bu yapıların da ülkemizde kurulması ve yapay zeka enstitülerinin ülkemizde yaygınlaştırılması gerekmektedir. Aynı zamanda Türkiye Büyük Millet Meclisi bünyesinde Yapay Zeka Komisyonu kurulmalıdır. Yapay zeka özünde öğrenen sistemler olduğu ve sürekli gelişim gösterdiği için sektör ayrımı olmaksızın her alanda kendine uygulama alanı bulan bir teknolojidir.

Koronavirüs salgını Çin ile birlikte diğer ülkelere de yayıldığı için Dünya Sağlık Örgütü tarafından 30/01/2020 tarihinde uluslararası halk sağlığı açısından acil durum ilan edilmiştir. Bu hastalıktan bahsedilirken lise ve üniversite yıllarımda benim de ders olarak aldığım Epidemiyoloji biliminden bahsetmemek olmaz. Epidemiyoloji, toplumda sağlıkla ilgili durumların veya olayların (hastalık dahil) dağılımını, görülme sıklıklarını ve bunları etkileyen faktörleri inceleyen bir tıp bilimi dalıdır.

Epidemiyolojik araştırmalar yapmak için çeşitli yöntemler kullanılabilir. Bu yöntemler dağılımı incelemek için sürveyans, tanımlayıcı çalışmalar ve hastalık belirleyicilerini incelemek için analitik çalışmalar olabilir. Bilindiği üzere Koronavirüs hastalığı artık pandemik bir vaka olarak adlandırılmaktadır. Epidemiyolojinin konu alanına giren pandemi dünyada birden fazla ülkede veya kıtada, çok geniş bir alanda
yayılan ve etkisini gösteren salgın hastalıklara verilen genel isim
olarak ifade edilmektedir. Diğer bir deyişle, salgın (epidemi) durumundaki bir hastalığın ülke sınırlarını aşarak diğer ülkelere yayılım göstermesidir.

Avrupa Birliği kurumlarından biri olan “Avrupa Hastalık Önleme ve Kontrol Merkezi (European Centre for Disease Prevention and Control)”‘ne göre ön bulgular koronavirüs hastalığından vakalara dayalı ölüm oranı (fatalite hızı)’nın binde 20-30 olduğunu göstermektedir. Bu, 2003 SARS salgınından önemli ölçüde daha az. Bununla birlikte, mevsimsel gripin neden ölüm oranlarından çok daha yüksektir.

Çalışma kapsamında koronavirüs pandemi vakalarının epidemiyolojik hızlarla birlikte keşifsel veri analizi (EDA) yapılarak vakaların izlediği seyrin ortaya konulması amaçlanmıştır

Metodoloji / Methodology

Çalışmanın amacı, koronavirüs vakalarının epidemiyolojik düzlemde Türkiye’de ve diğer ülkelerde izlediği seyri detaylı bir şekilde keşifsel veri analiziyle ortaya konulara karar vericilere katkı sunmaktır.

Koronavirüs vakalarının analizinde Türkiye veri setinin oluşturulmasında Türkiye İstatistik Kurumu (TÜİK)’ndan ve Dünya Sağlık Örgütü (DSÖ) raporlarından ve Sağlık Bakanlığı basın açıklamalarından yararlanılmıştır. Bunun nedeni Türkiye veri setine daha derinlemesine bakılmak istenmesidir.

Çalışma kapsamında diğer ülkelere ilişkin koronavirüs vakaları ise Johns Hopkins Üniversitesi Sistem Bilimi ve Mühendisliği Merkezi (JHU CCSE) tarafından desteklenen “The Humanitarian Data Exchange (HDX) (İnsani Veri Alışverişi)” adlı platforma ait https://data.humdata.org web sitesinden alınmıştır. Önceki çalışmalardan faklı olarak bu platformdan veri alınmasının nedeni veri setleri içerisinde onaylanmış ve ölüm vakaları dışında iyileşen koronavirüs vakalarına da yer verilmiş olmasıdır.

Analizlerde Türkiye verisi için Microsoft Excel 2016 ve diğer ülke verileri için R programlama dili kullanılmıştır.

Keşifsel veri analizine geçilmeden önce vaka sayılarından yararlanarak epidemiyolojik hızlar hesaplanmıştır. Bu nedenle, çalışmada kullanılacak hızları açıklamanın faydalı olacağı düşünülmektedir.

Epidemiyoloji biliminde hız kavramı, bir sağlık olayının nüfus içindeki görülme frekansını hesaplamada kullanılan bir ölçüttür. Hızlar, belirli bir zaman diliminde meydana gelen olayların sayısının olayın meydana geldiği nüfusa bölünerek hesaplanır. Eşitliğin payı, sağlık olayı ile karşılaşanların sayısını (X), payda ise risk altındaki nüfusu (X+Y) göstermektedir. Risk altındaki nüfus hastalığa veya sağlık olaylarına karşı duyarlı olan nüfusu ifade etmektedir. Formülize edilirse;

Hız (Rate) = (X / X +Y) * k

Burada, k katsayıyı göstermektedir.

Analizde hızlardan girdi değişkeni olarak kullanılması düşünülen ilk gösterge ölüm veya mortalite ölçütlerinden biri olan Kaba Ölüm Hızı‘dır. Bu hız nüfusun sağlık düzeyini ortaya koymada duyarlı olmasa da bir fikir vermesi açısından önemlidir. Kaba ölüm hızı aşağıdaki eşitlikte gösterilmiştir.

Kaba Ölüm Hızı (Crude Death Rate) = (Bir toplumda belirli bir süre içinde meydana gelen ölüm sayısı / Aynı toplumun aynı süredeki
(yıl ortası) nüfusu) * 1000

Crude death rate = (Total number of deaths during a given time interval / Mid-interval population) * 1000

Girdi değişkeni olarak kullanılması düşünülen ikinci gösterge ölüm veya fatalite ölçütlerinden biri olan Fatalize Hızı‘dır. Bu gösterge kaba ölüm hızına göre daha duyarlı bir göstergedir. Diğer bir ifadeyle, hastalığa yakalananların ne kadarının öldüğünü gösterir. Fatalite hızı aşağıdaki eşitlik yardımıyla hesaplanmaktadır;

Fatalite Hızı (Fatality Rate) = (Nüfusta belirli bir süre içinde “X” hastalığından ölenlerin sayısı / Aynı nüfusun aynı süre içinde “X” hastalığına yakalananların sayısı) * 100

Fatality Rate = (Number of cause-specific deaths among the incident cases / Total number of incident cases) * 100

Morbitide veya hastalık hızları gelişmekte olan hastalığın ortaya çıkma hızını ortaya koymak için kullanılır. Bunlardan biri olan insidans,
bir hastalığın gelişme (yeni vakalar) olasılığını ortaya koymak için kullanılır. Diğer taraftan, bu hızlardan prevelans ise hastalığın görülme sıklığını (tüm vakalar) gösteren bir hızdır. İnsidans ve prevelans da analizde girdi değişkenleri olarak kullanılması düşünülmektedir. İnsidans aşağıdaki eşitlik yardımıyla hesaplanmaktadır.

İnsidans (Incidence) = (Bir nüfusta belirli bir sürede saptanan YENİ vaka sayısı / Aynı toplumun yıl ortası nüfusu) * k

Incidence = (Number of new cases of disease during specified time interval / Population at start of time interval) * k

İnsidans hızının kümülatif şekli ise atak hızlarını göstermektedir.

Prevelans ise aşağıdaki eşitlik yardımıyla hesaplanmaktadır.

Prevelans (Prevalence) = (Belirli bir sürede toplam (eski+yeni) vaka sayısı / Risk altındaki kişi sayısı) * k

Prevalence = (Number of cases of disease during specified time interval / Population at start of time interval) * k

Keşifsel Veri Analizi Bulguları / Exploratory Data Analysis Findings

Türkiye Örneği / The Case of Turkey

Bu kısımda bahsedilen epidemiyolojik hızların uygulama sonuçlarına yer verilmiştir. İlk olarak günlük onaylanmış vaka sayıları ile ölüm vaka sayıları Tablo 1’de verilmiştir. Tabloda test sayılarının olduğu sütunda kırmızı renkteki sayılar kesin olarak bilinmediğinden ortalama olarak verilmiştir. Tablo 1’e göre öne çıkan bulgular şöyledir:

  • 05.04.2020 tarihinde toplam vaka sayısı 279069’a yülselmiştir. Aynı günde gerçekleşen yeni vaka sayısı ise 3135 olup bir önceki güne göre % 4,05 artmıştır. Yeni vaka sayısının 3135 olduğu 05.04.2020 tarihi Türkiye’de salgının başladığı günden bugüne kadar vaka sayısının en yüksek olduğu tarihtir.
  • Kümülatif vaka sayısından kümülatif ölen kişi sayısı çıkarılmasından sonra kalan toplam aktif vaka sayısı 26495’tir.
  • Salgında ölen toplam kişi sayısı 574 olup, en yüksek ölüm vakalarının yaşandığı gün 79 kişi ile 02.04.2020 tarihidir.

Tablo 1. Koronavirüs Vaka Sayıları / Number of Coronavirus Cases, Turkey (Yayınlanması beklenmektedir, güncellenecektir)

Epidemiyolojik hızları gösteren bulgular ise Tablo 2’de sunulmuştur. Tablo 2’ye göre öne çıkan bulgular şöyledir:

  • Sağlık düzeyini belirlemede duyarlı bir gösterge olmasa da fikir vermesi açısından kaba ölüm hızı hesaplanmıştır. Buna göre kaba ölüm hızı en yüksek seviyesine ulaştığı 02.4.2020 tarihinde milyonda 0,95’dır. Katsayı bin yerine milyon alınmasının nedeni ortaya konulan bulgunun çok küçük değer almasından kaynaklanmaktadır. Toplam ölüm vaka sayına göre kaba ölüm hızı ise milyonda 6,02’ten 6,9’a yükselmiştir.
  • Fatalite hızının en yüksek olduğu tarih binde 43 ile 21.3.2020 tarihidir. Toplam vaka sayılarına göre fatalite hızı ise binde 21’dir. Bu bulgu şu anlama gelmektedir; bugüne kadar koronavirüs hastalığına yakalanan her 1000 kişiden yaklaşık 21’i hayatını kaybetmiştir.
  • Yapılan test sayıları ve vaka sayıları dikkate alınarak koronavirüs salgının insidansı ve prevelansı da hesaplanmıştır. Yapılan toplam test sayısı 181445’tir. Belirli bir zaman diliminde bir hastalığın bir nüfus grubunda görülme sıklığını ortaya koyan prevelans hızı yaklaşık % 15 olup bir önceki güne göre artış göstermemiştir. Buradan salgın meydana geldiği süre içerisinde test uygulanan her 100 vakadan 15’inde koronavirüs vakası tespit edildiği anlamı çıkmaktadır.
  • Belirli bir zaman diliminde bir hastalığın gelişme (yeni vakalar) olasılığını ortaya koyan insidans hızı % 15,3’ten % 15,6’ya yükselmiştir. Bu bulgudan koronavirüs testi (PCR) yapılan her 100 yeni vakadan yaklaşık 16’sında koronavirüs tespit edildiği anlaşılmaktadır. İnsidans hızı ne kadar çok düşerse salgının yeni vakalar ortaya çıkarma olasılığı o kadar düşer. Bu hız bu açıdan ayrı bir öneme sahiptir.

Tablo 2. Koronavirüs Vakalarının Epidemiyolojik Hızları / Epidemiological Rates of Coronavirus Cases, Turkey

Türkiye’deki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates in Turkey by Time

Koronavirüs vaka sayıları baz alınarak Türkiye ve İtalya’nın karşılaştırıldığı görülmektedir. Bu oldukça eksik bir bakış açısıdır. Zira vaka sayıları ve hatta ölüm sayıları bile tek başına değerlendirilmesi eksik ve hatalı yorumlara ve sonuçlara neden olabilir. Bu göstergelerden daha da önemli olan epidemiyolojik hızlardan ve aynı zamanda ölüm ölçütlerinden biri olan fatalite hızının dikkate alınmasının değerlendirme açısından daha sağlıklı olacağı düşünülmektedir. Aşağıdaki grafikte İtalya ve Türkiye fatalite hızları karşılaştırmalı olarak sunulmuştur. Aşağıdaki grafikte fatalite hızları açısından bakılırsa fatalite hızlarının görüldüğü y ekseninde İtalya’nın çok farklı bir seyir izlediği görülmektedir. Ancak en kötü senaryo olarak düşünülürse atılacak adımlar açısından faydalı olacağı düşünülmektedir. Grafikte X eksenine paralel olarak kesikli doğrular ortalama fatalite hızlarını göstermektedir. İtalya Türkiye’ye göre çok daha yüksek fatalite hızlarına sahip olmasının yanısıra aynı zamanda fatalite hızları ortalamasına yakın bir seyir izlemiştir.

Türkiye ve İtalya’daki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates in Turkey and Italy by Time

Ayrıca Türkiye, Avrupa Hastalık Önleme ve Kontrol Merkezi‘nden alınan koronavirüs ölüm vakaları açısından İtalya’nın yanısıra Fransa, İspanya ve İran ile de ilk 14 günlük seyir karşılaştırılmıştır. Aşağıdaki tabloda toplam ölüm vaka sayıları açısından Türkiye’nin İran ile benzerlik gösterdiği görülmektedir.

Türkiye, İtalya, Fransa, İspanya ve İran’ın Ölüm Vakalarının İlk 14 Günlük Seyri / First 14-Day Dealth Figures, Cases of Turkey, Italy, France, Spain and Iran

Yukarıdaki tabloda ilk 14 günlük zaman diliminde Türkiye’de koronavirüs ölüm vakaları açısından İspanya ve Fransa’ya göre daha yüksek olsa da aşağıdaki tabloda fatalite hızları açısından bu ülkelerin Türkiye’den daha yüksek olduğu olduğu görülmektedir. Diğer taraftan genel olarak Türkiye’nin fatalite hızları açısından ABD’ye benzer ancak ondan daha yüksek fatalite hızlarının olduğu görülmektedir. Tabloda İtalya’nın fatalite hızları açısından açık ara önde olduğu görülmektedir. Bu bulgu aynı zamanda koronavirüs hastalığına yakalananlar içerisinde ölenlerin İtalya’da daha yüksek olduğunu ortaya koymaktadır.

Ülkelere Göre Fatalite Hızlarının Karşılaştırılması / The Comparison of Fatality Rates by Countries

Dünya ve Diğer Ülke Örnekleri / Cases of World and Other Countries

İlk olarak adım adım uygulamaya geçilerek İnsani Veri Alışverişi (HDX) web sitesinden csv (Comma-seperated value) uzantılı olarak okutulan onaylanmış, ölen ve iyileşen koronavirüs vaka sayılarını içeren 3 farklı veri seti birleştirilerek tanıtılmıştır.

Çalışmanın bu kısmında epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak Dünyada koronavirüs vakalarıyla ilgili olarak öne çıkan ülkeler verilmiştir.

Aşağıda yazdığım R kod bloğu ile birlikte “İnsani Veri Alışverişi (HDX)veri tabanından güncel veri akışı sağlanabilecektir. Aşağıdaki kod bloğunda görüleceği üzere mevcut veri setlerinde olmayan 2 adet değişken hesaplanmıştır. Daha sonra bu değişkenler kod bloğu ile veri akışı sağlanmasından sonra birleştirilerek oluşturulan yeni veri setine ilave edilmiştir. İlave edilen değişkenler şöyledir:

  1. Aktif Vakalar (ActiveCases) : Onaylanmış vaka sayısından ölen ve iyileşen vakalar çıkarılması ile hesaplanmıştır.
  2. Fatali Fızı (FataliteRate): Onaylanmış vaka sayılarının ölüm vaka sayılarına bölünmesiyle hesaplanmıştır. Çarpım katsayısı (k) ise 1000’dir.
url1="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_confirmed_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_confirmed_global.csv"

url2="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_deaths_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_deaths_global.csv"

url3="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_recovered_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_recovered_global.csv"

case<-read_csv(url1)[-1,-1]
case<-case %>% rename(Country="Country/Region", Cases= "Value")

case

death<-read_csv(url2)[-1,-1]

d<-death %>% rename(Country="Country/Region", Deaths= "Value")

recovered<-read_csv(url3)[-1,-1]

r<-recovered%>% rename(Country="Country/Region", Recovered= "Value")

df<-left_join(case, d, by = c("Country","Lat", "Long","Date"))
df<-left_join(df, r, by = c("Country","Lat", "Long","Date"))
df<-tibble(Country=df$Country, Date=as.Date(df$Date), Month=month(as.Date(df$Date)), Lat=as.numeric(df$Lat), Long=as.numeric(df$Long),Cases=as.integer(df$Cases), Deaths=as.integer(df$Deaths), Recovered= as.integer(df$Recovered), ActiveCases=as.integer(as.numeric(df$Cases)-as.numeric(df$Deaths)-as.numeric(df$Recovered)), FatalityRate=round(as.numeric((as.integer(df$Deaths)/as.integer(df$Cases))*1000),1))
df

Veri setindeki değişken sayısı 8, gözlem sayısı ise 19314’dir. Aşağıda mevcut değişkenler, değişkenlerin veri tipi ile birlikte gözlem sayısı görülmektedir.

Classes ‘tbl_df’, ‘tbl’ and 'data.frame':	19314 obs. of  8 variables:
 $ Country     : chr  "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
 $ Date        : Date, format: "2020-04-04" "2020-04-03" ...
 $ Month       : num  4 4 4 4 3 3 3 3 3 3 ...
 $ Cases       : num  299 281 273 237 174 170 120 110 110 94 ...
 $ Deaths      : num  7 6 6 4 4 4 4 4 4 4 ...
 $ Recovered   : num  10 10 10 5 5 2 2 2 2 2 ...
 $ ActiveCases : num  282 265 257 228 165 164 114 104 104 88 ...
 $ FatalityRate: num  23.4 21.4 22 16.9 23 23.5 33.3 36.4 36.4 42.6 ...

Veri setinde koronavirüs salgınının yaşandığı aşağıdaki listesi verilen 181 ülke ve/veya bölge bulunmaktadır.

  [1] "Afghanistan"                      "Albania"                         
  [3] "Algeria"                          "Andorra"                         
  [5] "Angola"                           "Antigua and Barbuda"             
  [7] "Argentina"                        "Armenia"                         
  [9] "Australia"                        "Austria"                         
 [11] "Azerbaijan"                       "Bahamas"                         
 [13] "Bahrain"                          "Bangladesh"                      
 [15] "Barbados"                         "Belarus"                         
 [17] "Belgium"                          "Belize"                          
 [19] "Benin"                            "Bhutan"                          
 [21] "Bolivia"                          "Bosnia and Herzegovina"          
 [23] "Botswana"                         "Brazil"                          
 [25] "Brunei"                           "Bulgaria"                        
 [27] "Burkina Faso"                     "Burma"                           
 [29] "Burundi"                          "Cabo Verde"                      
 [31] "Cambodia"                         "Cameroon"                        
 [33] "Canada"                           "Central African Republic"        
 [35] "Chad"                             "Chile"                           
 [37] "China"                            "Colombia"                        
 [39] "Congo (Brazzaville)"              "Congo (Kinshasa)"                
 [41] "Costa Rica"                       "Cote d'Ivoire"                   
 [43] "Croatia"                          "Cuba"                            
 [45] "Cyprus"                           "Czechia"                         
 [47] "Denmark"                          "Diamond Princess"                
 [49] "Djibouti"                         "Dominica"                        
 [51] "Dominican Republic"               "Ecuador"                         
 [53] "Egypt"                            "El Salvador"                     
 [55] "Equatorial Guinea"                "Eritrea"                         
 [57] "Estonia"                          "Eswatini"                        
 [59] "Ethiopia"                         "Fiji"                            
 [61] "Finland"                          "France"                          
 [63] "Gabon"                            "Gambia"                          
 [65] "Georgia"                          "Germany"                         
 [67] "Ghana"                            "Greece"                          
 [69] "Grenada"                          "Guatemala"                       
 [71] "Guinea"                           "Guinea-Bissau"                   
 [73] "Guyana"                           "Haiti"                           
 [75] "Holy See"                         "Honduras"                        
 [77] "Hungary"                          "Iceland"                         
 [79] "India"                            "Indonesia"                       
 [81] "Iran"                             "Iraq"                            
 [83] "Ireland"                          "Israel"                          
 [85] "Italy"                            "Jamaica"                         
 [87] "Japan"                            "Jordan"                          
 [89] "Kazakhstan"                       "Kenya"                           
 [91] "Korea, South"                     "Kosovo"                          
 [93] "Kuwait"                           "Kyrgyzstan"                      
 [95] "Laos"                             "Latvia"                          
 [97] "Lebanon"                          "Liberia"                         
 [99] "Libya"                            "Liechtenstein"                   
[101] "Lithuania"                        "Luxembourg"                      
[103] "Madagascar"                       "Malawi"                          
[105] "Malaysia"                         "Maldives"                        
[107] "Mali"                             "Malta"                           
[109] "Mauritania"                       "Mauritius"                       
[111] "Mexico"                           "Moldova"                         
[113] "Monaco"                           "Mongolia"                        
[115] "Montenegro"                       "Morocco"                         
[117] "Mozambique"                       "MS Zaandam"                      
[119] "Namibia"                          "Nepal"                           
[121] "Netherlands"                      "New Zealand"                     
[123] "Nicaragua"                        "Niger"                           
[125] "Nigeria"                          "North Macedonia"                 
[127] "Norway"                           "Oman"                            
[129] "Pakistan"                         "Panama"                          
[131] "Papua New Guinea"                 "Paraguay"                        
[133] "Peru"                             "Philippines"                     
[135] "Poland"                           "Portugal"                        
[137] "Qatar"                            "Romania"                         
[139] "Russia"                           "Rwanda"                          
[141] "Saint Kitts and Nevis"            "Saint Lucia"                     
[143] "Saint Vincent and the Grenadines" "San Marino"                      
[145] "Saudi Arabia"                     "Senegal"                         
[147] "Serbia"                           "Seychelles"                      
[149] "Sierra Leone"                     "Singapore"                       
[151] "Slovakia"                         "Slovenia"                        
[153] "Somalia"                          "South Africa"                    
[155] "Spain"                            "Sri Lanka"                       
[157] "Sudan"                            "Suriname"                        
[159] "Sweden"                           "Switzerland"                     
[161] "Syria"                            "Taiwan*"                         
[163] "Tanzania"                         "Thailand"                        
[165] "Timor-Leste"                      "Togo"                            
[167] "Trinidad and Tobago"              "Tunisia"                         
[169] "Turkey"                           "Uganda"                          
[171] "Ukraine"                          "United Arab Emirates"            
[173] "United Kingdom"                   "Uruguay"                         
[175] "US"                               "Uzbekistan"                      
[177] "Venezuela"                        "Vietnam"                         
[179] "West Bank and Gaza"               "Zambia"                          
[181] "Zimbabwe"           

Dünya / World

Dünyada görülen koronavirüs vakalarının tanımlayıcı istatistikleri aşağıdaki tabloda verilmiştir. Veri setindeki vaka sayıları kümülatif olarak ilerlemektedir. Tabloda koronavirüs vakalarına ilişkin öne çıkan bulgular şöyledir:

  1. Günlük ortalama vaka sayısı yaklaşık 6055’ten yaklaşık 6616’ya, ortalama ölüm vaka sayısı ise yaklaşık 325’ten yaklaşık 357’ye yükselmiştir.
  2. Günlük ortalama iyileşen vaka sayısı 1236’dan yaklaşık 1346’ya, ortalama aktif vaka sayısı ise yaklaşık 5730’dan 6259’a yükselmiştir.
  3. Günlük ortalama fatalite hızı binde yaklaşık 37’dir. Bu bulgu koronavirüs hastalığına yakalanan her 1000 kişiden yaklaşık 37’sinin hayatını kaybettiğini göstermektedir.

Dünyadaki Koronavirüs Vakalarının Tanımlayıcı İstatistikleri / Descriptive Statistics of Coronavirus Cases in the World

Kümülatif Vaka Sayıları Baz Alınarak Dünya’daki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates by Time Based on Cumulative Cases in the World

Kümülatif vaka sayılarına göre en yüksek 10 ülke aşağıdaki tabloda karşılaştırmalı olarak verilmiştir.

En Yüksek Kümülatif Vaka Sayısına Sahip 10 Ülke / Top 10 Countries with the Highest Number of Cumulative Cases

En Yüksek Kümülatif Ölüm Vaka Sayısına Sahip 10 Ülke / Fatality Rates of Top 10 Countries with the Highest Cumulative Death Figures

Kümülatif Vaka Sayılarına Göre Dünyadaki Son 10 Günlük Fatalite (Ölüm) Hızları / Last 10-Day Fatality Rates Based by Cumulative Cases in the World

Sonuç / Conclusion

Özetle, İnsani Veri Alışverişi (HDX) platformundan alınan 3 farklı koronavirüs hastalık veri setinin birleştirilmesinden sonra epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak koronavirüs pandemisinin trendi hakkında farkındalık oluşturulması amaçlanmıştır.

Bu arada son 10 gündür üzerinde yoğun bir şekilde çalıştığım salgının dalga boyunun hesaplanmasına yönelik geliştirdiğim modelleri Avrupa Hastalık Önleme ve Kontrol Merkezi ile paylaştıktan sonra faydalı olması adına burada da paylaşılacaktır.

Faydalı olması ve farkındalık oluşturması dileğiyle.

Sağlıkla ve bilimle kalınız.

Saygılarımla.

Note: It can not be cited or copied without referencing.

Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.

Yararlanılan Kaynaklar / Resources Utilized

4 Nisan 2020 Tarihi İtibariyle Koronavirüs Pandemisi Üzerine Vaka Çalışmaları: Türkiye ve Diğer Ülke Örnekleri (Case Studies on Coronavirus Pandemic: Cases of Turkey and Other Countries As of April 4, 2020)

Giriş / Introduction

Coronavirüsler (CoV), soğuk algınlığından Orta Doğu Solunum Sendromu (MERS-CoV) ve Şiddetli Akut Solunum Sendromu (SARS-CoV) gibi daha ciddi hastalıklara kadar pek çok hastalığa neden olan büyük bir virüs ailesidir. Bu yeni virüse, yüzey çıkıntıları taç görünümünde olduğu için coronavirus adı verilmiş olup, bu virüs ailesi tek zincirli, pozitif polariteli, zarflı RNA virüsleridir.

Koronavirüs hastalığı (COVID-19), 2019 yılında keşfedilen ve daha önce insanlarda tanımlanmamış yeni bir suştur. Suş, bir bakteri veya virüsün farklı alt türlerinin, aralarında genetik farklılıklar bulunan grupları olarak adlandırılır.

Bu Koronavirüsler zoonotiktir, yani hayvanlar ve insanlar arasında bulaşırlar. Ayrıntılı araştırmalar SARS-CoV’nin misk kedilerinden insanlara ve MERS-CoV’un tek hörgüçlü develerden insanlara bulaştığını göstermiştir. Bilinen birkaç koronavirüs henüz insanları enfekte etmeyen hayvanlarla taşınmaktadır.

Enfeksiyon belirtileri arasında solunum semptomları, ateş, öksürük, nefes darlığı ve solunum güçlüğü bulunur. Daha ciddi vakalarda, enfeksiyon pnömoniye, ciddi akut solunum sendromuna, böbrek yetmezliğine ve hatta ölüme neden olabilir. Solunum sistemi hastalıklarından biri olan pnömoni ya da halk arasında zatürre bakteriler başta olmak üzere mikroorganizmalara bağlı olarak ortaya çıkan akciğer dokusunun iltihaplanmasıdır. Grip gibi bu hastalık da bağışıklık (immun) sistemini baskılayan hastalıklardan biridir. Özellikle ileri yaşlardaki bireylerde hem bağışıklık sisteminin yaşla birlikte yavaşlaması hem de yaşa ve/veya diğer nedenlere bağlı olarak kronik ve diğer hastalıkların görülmesi bu yaşlardaki bireylerde ölüm oranlarını artırabilmektedir. Diğer bir deyişle, bu enfeksiyon komplikasyon yaratarak ve mevcut diğer hastalıkları tetikleyerek bu yaş gruplarında diğer yaş gruplarına göre daha öldürücü olabilir.

Enfeksiyonun yayılmasını önlemek için standart öneriler arasında düzenli el yıkama, öksürme ve hapşırma sırasında ağız ve burnun kapatılması, et ve yumurtaların iyice pişirilmesi yer alır. Öksürme ve hapşırma gibi solunum yolu rahatsızlığı belirtileri gösteren kişilerle yakın temastan kaçınmak bu hastalıktan korunmak için atılacak önemli koruyucu tedbirlerden biridir.

Hastalıktan nasıl korunulacağı hakkında bilgi verdikten sonra bu hastalığın teşhisinde kullanılan ve adı son zamanlarda sık sık duyulan PCR testi hakkında bilgi vermek faydalı olacaktır. PCR, ingilizce adıyla “Polymerase Chain Reaction” kelimelerinin bir araya gelmesinden oluşan ve moleküler biyoloji alanında kullanılan bir tekniktir.Türkçe ise ise polimeraz zincir reaksiyonu olarak adlandırılır. Bazen PCR moleküler fotokopi (molecular photocopying) olarak da adlandırılabilmektedir. DNA’nın küçük bölümlerini kopyalamak için kullanılan hızlı ve ucuz bir tekniktir. Moleküler ve genetik analizler için büyük miktarlarda DNA örneği gerekli olduğundan, izole edilmiş DNA parçaları üzerinde çalışmalar PCR amplifikasyonu olmadan neredeyse imkansızdır. PCR’ın kullanım alanları şöyle özetlenebilir:

  1. Amplifiye edildikten sonra PCR ile üretilen DNA, birçok farklı laboratuvar prosedüründe kullanılabilir. Örneğin, İnsan Genom Projesindeki (HGP) çoğu haritalama tekniği PCR’a dayanmaktadır.
  2. Parmak izi, bakteri veya virüslerin (özellikle AIDS) tespiti ve genetik bozuklukların teşhisi gibi bir dizi laboratuvar ve klinik teknikte de değerlidir.

PCR ( Polimeraz Zincir Reaksiyonu) tekniğinin çalışma şeması ise aşağıdaki şekilde verilmiştir.

polymerase chain reaction diagram
Kaynak: The National Human Genome Research Institute (NHGRI)

PCR tekniğini kullanarak koronavirüs teşhisinin nasıl konulduğuna ilişkin bir video aşağıda verilerek teşhis süreci hakkında bilgi verilmesi amaçlanmıştır.

Kaynak:
AMBOSS: Medical Knowledge Distilled

Bilindiği üzere koronavirüs hastalığının teşhis ve özellikle tedavisine yönelik olarak ilaç ve aşı geliştirme alanında Dünya’da ve ülkemizde yoğun bir mesai harcanmaktadır. Bunlardan biri ülkemizde 02.04.2020 tarihinde Sanayi ve Teknoloji Bakanlığı ve TÜBİTAK bünyesinde “Covid-19 Türkiye Platformu Aşı ve İlaç Geliştirme” bilim insanların katıldığı sanal bir konferans gerçekleştirilmiştir. Türkiye dışında da benzer çalışmalar sanal ortamda çalıştay ve konferans olarak yapılmaktadır. Dünyada yapılan ve benim de katılım sağladığım önde giden bu çalışmalardan biri de Avrupa Öğrenme ve Akıllı Sistemler Laboratuvarı ingilizce adıyla European Laboratory for Learning and Intelligent Systems (ELLIS)’ın 02.04.2020 tarihinde düzenlediği “ELLIS Against Covid-19” adlı çalıştaydır. Dünyanın farklı üniversitelerinden bilim insanlarının katılım sağladığı çalıştayda koranavirüs pandemisinin teşhisinde kullanılan yapay zeka teknolojilerinden koronavirüsün tedavisinde kullanılan ilaçların geliştirilmesinde kullanılan yapay zeka teknolojilerine kadar pek çok konu ele alınmıştır. Çalıştayda ağırlıklı olarak ele alınan konu yapay zekanın teşhis ve tedavide nasıl kullanıldığı ve kullanılacağı idi. Çalıştayda koronavirüs ile mücadele çok güzel uygulama örneklerine yer verilmiştir. Daha önce de dile getirdiğim gibi yapay zeka günümüzün ve geleceğin en kritik teknolojisidir. Bu gerek 4. Sanayi Devrimi gerekse Toplum 5.0 açısından olsun böyledir ve farklı ülkeler yapay zekayı teşhis ve tedavi (robotik cerrahi ve ilaç geliştirme) alanlarında kullanmak için çok ciddi adımlar atmıştır. Bu yapıların da ülkemizde kurulması ve yapay zeka enstitülerinin ülkemizde yaygınlaştırılması gerekmektedir. Aynı zamanda Türkiye Büyük Millet Meclisi bünyesinde Yapay Zeka Komisyonu kurulmalıdır. Yapay zeka özünde öğrenen sistemler olduğu ve sürekli gelişim gösterdiği için sektör ayrımı olmaksızın her alanda kendine uygulama alanı bulan bir teknolojidir.

Koronavirüs salgını Çin ile birlikte diğer ülkelere de yayıldığı için Dünya Sağlık Örgütü tarafından 30/01/2020 tarihinde uluslararası halk sağlığı açısından acil durum ilan edilmiştir. Bu hastalıktan bahsedilirken lise ve üniversite yıllarımda benim de ders olarak aldığım Epidemiyoloji biliminden bahsetmemek olmaz. Epidemiyoloji, toplumda sağlıkla ilgili durumların veya olayların (hastalık dahil) dağılımını, görülme sıklıklarını ve bunları etkileyen faktörleri inceleyen bir tıp bilimi dalıdır.

Epidemiyolojik araştırmalar yapmak için çeşitli yöntemler kullanılabilir. Bu yöntemler dağılımı incelemek için sürveyans, tanımlayıcı çalışmalar ve hastalık belirleyicilerini incelemek için analitik çalışmalar olabilir. Bilindiği üzere Koronavirüs hastalığı artık pandemik bir vaka olarak adlandırılmaktadır. Epidemiyolojinin konu alanına giren pandemi dünyada birden fazla ülkede veya kıtada, çok geniş bir alanda
yayılan ve etkisini gösteren salgın hastalıklara verilen genel isim
olarak ifade edilmektedir. Diğer bir deyişle, salgın (epidemi) durumundaki bir hastalığın ülke sınırlarını aşarak diğer ülkelere yayılım göstermesidir.

Avrupa Birliği kurumlarından biri olan “Avrupa Hastalık Önleme ve Kontrol Merkezi (European Centre for Disease Prevention and Control)”‘ne göre ön bulgular koronavirüs hastalığından vakalara dayalı ölüm oranı (fatalite hızı)’nın binde 20-30 olduğunu göstermektedir. Bu, 2003 SARS salgınından önemli ölçüde daha az. Bununla birlikte, mevsimsel gripin neden ölüm oranlarından çok daha yüksektir.

Çalışma kapsamında koronavirüs pandemi vakalarının epidemiyolojik hızlarla birlikte keşifsel veri analizi (EDA) yapılarak vakaların izlediği seyrin ortaya konulması amaçlanmıştır

Metodoloji / Methodology

Çalışmanın amacı, koronavirüs vakalarının epidemiyolojik düzlemde Türkiye’de ve diğer ülkelerde izlediği seyri detaylı bir şekilde keşifsel veri analiziyle ortaya konulara karar vericilere katkı sunmaktır.

Koronavirüs vakalarının analizinde Türkiye veri setinin oluşturulmasında Türkiye İstatistik Kurumu (TÜİK)’ndan ve Dünya Sağlık Örgütü (DSÖ) raporlarından ve Sağlık Bakanlığı basın açıklamalarından yararlanılmıştır. Bunun nedeni Türkiye veri setine daha derinlemesine bakılmak istenmesidir.

Çalışma kapsamında diğer ülkelere ilişkin koronavirüs vakaları ise Johns Hopkins Üniversitesi Sistem Bilimi ve Mühendisliği Merkezi (JHU CCSE) tarafından desteklenen “The Humanitarian Data Exchange (HDX) (İnsani Veri Alışverişi)” adlı platforma ait https://data.humdata.org web sitesinden alınmıştır. Önceki çalışmalardan faklı olarak bu platformdan veri alınmasının nedeni veri setleri içerisinde onaylanmış ve ölüm vakaları dışında iyileşen koronavirüs vakalarına da yer verilmiş olmasıdır.

Analizlerde Türkiye verisi için Microsoft Excel 2016 ve diğer ülke verileri için R programlama dili kullanılmıştır.

Keşifsel veri analizine geçilmeden önce vaka sayılarından yararlanarak epidemiyolojik hızlar hesaplanmıştır. Bu nedenle, çalışmada kullanılacak hızları açıklamanın faydalı olacağı düşünülmektedir.

Epidemiyoloji biliminde hız kavramı, bir sağlık olayının nüfus içindeki görülme frekansını hesaplamada kullanılan bir ölçüttür. Hızlar, belirli bir zaman diliminde meydana gelen olayların sayısının olayın meydana geldiği nüfusa bölünerek hesaplanır. Eşitliğin payı, sağlık olayı ile karşılaşanların sayısını (X), payda ise risk altındaki nüfusu (X+Y) göstermektedir. Risk altındaki nüfus hastalığa veya sağlık olaylarına karşı duyarlı olan nüfusu ifade etmektedir. Formülize edilirse;

Hız (Rate) = (X / X +Y) * k

Burada, k katsayıyı göstermektedir.

Analizde hızlardan girdi değişkeni olarak kullanılması düşünülen ilk gösterge ölüm veya mortalite ölçütlerinden biri olan Kaba Ölüm Hızı‘dır. Bu hız nüfusun sağlık düzeyini ortaya koymada duyarlı olmasa da bir fikir vermesi açısından önemlidir. Kaba ölüm hızı aşağıdaki eşitlikte gösterilmiştir.

Kaba Ölüm Hızı (Crude Death Rate) = (Bir toplumda belirli bir süre içinde meydana gelen ölüm sayısı / Aynı toplumun aynı süredeki
(yıl ortası) nüfusu) * 1000

Crude death rate = (Total number of deaths during a given time interval / Mid-interval population) * 1000

Girdi değişkeni olarak kullanılması düşünülen ikinci gösterge ölüm veya fatalite ölçütlerinden biri olan Fatalize Hızı‘dır. Bu gösterge kaba ölüm hızına göre daha duyarlı bir göstergedir. Diğer bir ifadeyle, hastalığa yakalananların ne kadarının öldüğünü gösterir. Fatalite hızı aşağıdaki eşitlik yardımıyla hesaplanmaktadır;

Fatalite Hızı (Fatality Rate) = (Nüfusta belirli bir süre içinde “X” hastalığından ölenlerin sayısı / Aynı nüfusun aynı süre içinde “X” hastalığına yakalananların sayısı) * 100

Fatality Rate = (Number of cause-specific deaths among the incident cases / Total number of incident cases) * 100

Morbitide veya hastalık hızları gelişmekte olan hastalığın ortaya çıkma hızını ortaya koymak için kullanılır. Bunlardan biri olan insidans,
bir hastalığın gelişme (yeni vakalar) olasılığını ortaya koymak için kullanılır. Diğer taraftan, bu hızlardan prevelans ise hastalığın görülme sıklığını (tüm vakalar) gösteren bir hızdır. İnsidans ve prevelans da analizde girdi değişkenleri olarak kullanılması düşünülmektedir. İnsidans aşağıdaki eşitlik yardımıyla hesaplanmaktadır.

İnsidans (Incidence) = (Bir nüfusta belirli bir sürede saptanan YENİ vaka sayısı / Aynı toplumun yıl ortası nüfusu) * k

Incidence = (Number of new cases of disease during specified time interval / Population at start of time interval) * k

İnsidans hızının kümülatif şekli ise atak hızlarını göstermektedir.

Prevelans ise aşağıdaki eşitlik yardımıyla hesaplanmaktadır.

Prevelans (Prevalence) = (Belirli bir sürede toplam (eski+yeni) vaka sayısı / Risk altındaki kişi sayısı) * k

Prevalence = (Number of cases of disease during specified time interval / Population at start of time interval) * k

Keşifsel Veri Analizi Bulguları / Exploratory Data Analysis Findings

Türkiye Örneği / The Case of Turkey

Bu kısımda bahsedilen epidemiyolojik hızların uygulama sonuçlarına yer verilmiştir. İlk olarak günlük onaylanmış vaka sayıları ile ölüm vaka sayıları Tablo 1’de verilmiştir. Tabloda test sayılarının olduğu sütunda kırmızı renkteki sayılar kesin olarak bilinmediğinden ortalama olarak verilmiştir. Tablo 1’e göre öne çıkan bulgular şöyledir:

  • 04.04.2020 tarihinde toplam vaka sayısı 23934’e yülselmiştir. Aynı günde gerçekleşen yeni vaka sayısı ise 3013 olup bir önceki güne göre % 8,1 artmıştır. Yeni vaka sayısının 2786 olduğu 03.04.2020 tarihi Türkiye’de salgının başladığı günden bugüne kadar vaka sayısının en yüksek olduğu tarihtir.
  • Kümülatif vaka sayısından kümülatif ölen kişi sayısı çıkarılmasından sonra kalan toplam aktif vaka sayısı 23433’tür.
  • Salgında ölen toplam kişi sayısı 501 olup, en yüksek ölüm vakalarının yaşandığı gün 79 kişi ile 02.04.2020 tarihidir.

Tablo 1. Koronavirüs Vaka Sayıları / Number of Coronavirus Cases, Turkey

Epidemiyolojik hızları gösteren bulgular ise Tablo 2’de sunulmuştur. Tablo 2’ye göre öne çıkan bulgular şöyledir:

  • Sağlık düzeyini belirlemede duyarlı bir gösterge olmasa da fikir vermesi açısından kaba ölüm hızı hesaplanmıştır. Buna göre kaba ölüm hızı en yüksek seviyesine ulaştığı 02.4.2020 tarihinde milyonda 0,95’dır. Katsayı bin yerine milyon alınmasının nedeni ortaya konulan bulgunun çok küçük değer almasından kaynaklanmaktadır. Toplam ölüm vaka sayına göre kaba ölüm hızı ise milyonda 5,11’ten 6,02’ye yükselmiştir.
  • Fatalite hızının en yüksek olduğu tarih binde 43 ile 21.3.2020 tarihidir. Toplam vaka sayılarına göre fatalite hızı ise binde yaklaşık 21’dir. Bu bulgu şu anlama gelmektedir; bugüne kadar koronavirüs hastalığına yakalanan her 1000 kişiden yaklaşık 21’i hayatını kaybetmiştir.
  • Yapılan test sayıları ve vaka sayıları dikkate alınarak koronavirüs salgının insidansı ve prevelansı da hesaplanmıştır. Yapılan toplam test sayısı 161330’dur. Belirli bir zaman diliminde bir hastalığın bir nüfus grubunda görülme sıklığını ortaya koyan prevelans hızı yaklaşık % 15 olup bir önceki güne göre artış göstermemiştir. Buradan salgın meydana geldiği süre içerisinde test uygulanan her 100 vakadan 15’inde koronavirüs vakası tespit edildiği anlamı çıkmaktadır.
  • Belirli bir zaman diliminde bir hastalığın gelişme (yeni vakalar) olasılığını ortaya koyan insidans hızı % 17,3’ten % 15,3’e düşmüştür. Bu bulgudan koronavirüs testi (PCR) yapılan her 100 yeni vakadan yaklaşık 15’inde koronavirüs tespit edildiği anlaşılmaktadır. İnsidans hızı ne kadar çok düşerse salgının yeni vakalar ortaya çıkarma olasılığı o kadar düşer. Bu hız bu açıdan ayrı bir öneme sahiptir.

Tablo 2. Koronavirüs Vakalarının Epidemiyolojik Hızları / Epidemiological Rates of Coronavirus Cases, Turkey

Türkiye’deki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates in Turkey by Time

Koronavirüs vaka sayıları baz alınarak Türkiye ve İtalya’nın karşılaştırıldığı görülmektedir. Bu oldukça eksik bir bakış açısıdır. Zira vaka sayıları ve hatta ölüm sayıları bile tek başına değerlendirilmesi eksik ve hatalı yorumlara ve sonuçlara neden olabilir. Bu göstergelerden daha da önemli olan epidemiyolojik hızlardan ve aynı zamanda ölüm ölçütlerinden biri olan fatalite hızının dikkate alınmasının değerlendirme açısından daha sağlıklı olacağı düşünülmektedir. Aşağıdaki grafikte İtalya ve Türkiye fatalite hızları karşılaştırmalı olarak sunulmuştur. Aşağıdaki grafikte fatalite hızları açısından bakılırsa fatalite hızlarının görüldüğü y ekseninde İtalya’nın çok farklı bir seyir izlediği görülmektedir. Ancak en kötü senaryo olarak düşünülürse atılacak adımlar açısından faydalı olacağı düşünülmektedir. Grafikte X eksenine paralel olarak kesikli doğrular ortalama fatalite hızlarını göstermektedir. İtalya Türkiye’ye göre çok daha yüksek fatalite hızlarına sahip olmasının yanısıra aynı zamanda fatalite hızları ortalamasına yakın bir seyir izlemiştir.

Türkiye ve İtalya’daki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates in Turkey and Italy by Time

Ayrıca Türkiye, Avrupa Hastalık Önleme ve Kontrol Merkezi‘nden alınan koronavirüs ölüm vakaları açısından İtalya’nın yanısıra Fransa, İspanya ve İran ile de ilk 14 günlük seyir karşılaştırılmıştır. Aşağıdaki tabloda toplam ölüm vaka sayıları açısından Türkiye’nin İran ile benzerlik gösterdiği görülmektedir.

Türkiye, İtalya, Fransa, İspanya ve İran’ın Ölüm Vakalarının İlk 14 Günlük Seyri / First 14-Day Dealth Figures, Cases of Turkey, Italy, France, Spain and Iran

Yukarıdaki tabloda ilk 14 günlük zaman diliminde Türkiye’de koronavirüs ölüm vakaları açısından İspanya ve Fransa’ya göre daha yüksek olsa da aşağıdaki tabloda fatalite hızları açısından bu ülkelerin Türkiye’den daha yüksek olduğu olduğu görülmektedir. Diğer taraftan genel olarak Türkiye’nin fatalite hızları açısından ABD’ye benzer ancak ondan daha yüksek fatalite hızlarının olduğu görülmektedir. Tabloda İtalya’nın fatalite hızları açısından açık ara önde olduğu görülmektedir. Bu bulgu aynı zamanda koronavirüs hastalığına yakalananlar içerisinde ölenlerin İtalya’da daha yüksek olduğunu ortaya koymaktadır.

Ülkelere Göre Fatalite Hızlarının Karşılaştırılması / The Comparison of Fatality Rates by Countries

Dünya ve Diğer Ülke Örnekleri / Cases of World and Other Countries

İlk olarak adım adım uygulamaya geçilerek İnsani Veri Alışverişi (HDX) web sitesinden csv (Comma-seperated value) uzantılı olarak okutulan onaylanmış, ölen ve iyileşen koronavirüs vaka sayılarını içeren 3 farklı veri seti birleştirilerek tanıtılmıştır.

Çalışmanın bu kısmında epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak Dünyada koronavirüs vakalarıyla ilgili olarak öne çıkan ülkeler verilmiştir.

Aşağıda yazdığım R kod bloğu ile birlikte “İnsani Veri Alışverişi (HDX)veri tabanından güncel veri akışı sağlanabilecektir. Aşağıdaki kod bloğunda görüleceği üzere mevcut veri setlerinde olmayan 2 adet değişken hesaplanmıştır. Daha sonra bu değişkenler kod bloğu ile veri akışı sağlanmasından sonra birleştirilerek oluşturulan yeni veri setine ilave edilmiştir. İlave edilen değişkenler şöyledir:

  1. Aktif Vakalar (ActiveCases) : Onaylanmış vaka sayısından ölen ve iyileşen vakalar çıkarılması ile hesaplanmıştır.
  2. Fatali Fızı (FataliteRate): Onaylanmış vaka sayılarının ölüm vaka sayılarına bölünmesiyle hesaplanmıştır. Çarpım katsayısı (k) ise 1000’dir.
url1="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_confirmed_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_confirmed_global.csv"

url2="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_deaths_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_deaths_global.csv"

url3="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_recovered_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_recovered_global.csv"

case<-read_csv(url1)[-1,-1]
case<-case %>% rename(Country="Country/Region", Cases= "Value")

case

death<-read_csv(url2)[-1,-1]

d<-death %>% rename(Country="Country/Region", Deaths= "Value")

recovered<-read_csv(url3)[-1,-1]

r<-recovered%>% rename(Country="Country/Region", Recovered= "Value")

df<-left_join(case, d, by = c("Country","Lat", "Long","Date"))
df<-left_join(df, r, by = c("Country","Lat", "Long","Date"))
df<-tibble(Country=df$Country, Date=as.Date(df$Date), Month=month(as.Date(df$Date)), Lat=as.numeric(df$Lat), Long=as.numeric(df$Long),Cases=as.integer(df$Cases), Deaths=as.integer(df$Deaths), Recovered= as.integer(df$Recovered), ActiveCases=as.integer(as.numeric(df$Cases)-as.numeric(df$Deaths)-as.numeric(df$Recovered)), FatalityRate=round(as.numeric((as.integer(df$Deaths)/as.integer(df$Cases))*1000),1))
df

Veri setindeki değişken sayısı 8, gözlem sayısı ise 18980’dir. Aşağıda mevcut değişkenler, değişkenlerin veri tipi ile birlikte gözlem sayısı görülmektedir.

Classes ‘tbl_df’, ‘tbl’ and 'data.frame':	18980 obs. of  8 variables:
 $ Country     : chr  "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
 $ Date        : Date, format: "2020-04-03" "2020-04-02" ...
 $ Month       : num  4 4 4 3 3 3 3 3 3 3 ...
 $ Cases       : num  281 273 237 174 170 120 110 110 94 84 ...
 $ Deaths      : num  6 6 4 4 4 4 4 4 4 2 ...
 $ Recovered   : num  10 10 5 5 2 2 2 2 2 2 ...
 $ ActiveCases : num  265 257 228 165 164 114 104 104 88 80 ...
 $ FatalityRate: num  21.4 22 16.9 23 23.5 33.3 36.4 36.4 42.6 23.8 ...

Veri setinde koronavirüs salgınının yaşandığı aşağıdaki listesi verilen 181 ülke ve/veya bölge bulunmaktadır.

  [1] "Afghanistan"                      "Albania"                         
  [3] "Algeria"                          "Andorra"                         
  [5] "Angola"                           "Antigua and Barbuda"             
  [7] "Argentina"                        "Armenia"                         
  [9] "Australia"                        "Austria"                         
 [11] "Azerbaijan"                       "Bahamas"                         
 [13] "Bahrain"                          "Bangladesh"                      
 [15] "Barbados"                         "Belarus"                         
 [17] "Belgium"                          "Belize"                          
 [19] "Benin"                            "Bhutan"                          
 [21] "Bolivia"                          "Bosnia and Herzegovina"          
 [23] "Botswana"                         "Brazil"                          
 [25] "Brunei"                           "Bulgaria"                        
 [27] "Burkina Faso"                     "Burma"                           
 [29] "Burundi"                          "Cabo Verde"                      
 [31] "Cambodia"                         "Cameroon"                        
 [33] "Canada"                           "Central African Republic"        
 [35] "Chad"                             "Chile"                           
 [37] "China"                            "Colombia"                        
 [39] "Congo (Brazzaville)"              "Congo (Kinshasa)"                
 [41] "Costa Rica"                       "Cote d'Ivoire"                   
 [43] "Croatia"                          "Cuba"                            
 [45] "Cyprus"                           "Czechia"                         
 [47] "Denmark"                          "Diamond Princess"                
 [49] "Djibouti"                         "Dominica"                        
 [51] "Dominican Republic"               "Ecuador"                         
 [53] "Egypt"                            "El Salvador"                     
 [55] "Equatorial Guinea"                "Eritrea"                         
 [57] "Estonia"                          "Eswatini"                        
 [59] "Ethiopia"                         "Fiji"                            
 [61] "Finland"                          "France"                          
 [63] "Gabon"                            "Gambia"                          
 [65] "Georgia"                          "Germany"                         
 [67] "Ghana"                            "Greece"                          
 [69] "Grenada"                          "Guatemala"                       
 [71] "Guinea"                           "Guinea-Bissau"                   
 [73] "Guyana"                           "Haiti"                           
 [75] "Holy See"                         "Honduras"                        
 [77] "Hungary"                          "Iceland"                         
 [79] "India"                            "Indonesia"                       
 [81] "Iran"                             "Iraq"                            
 [83] "Ireland"                          "Israel"                          
 [85] "Italy"                            "Jamaica"                         
 [87] "Japan"                            "Jordan"                          
 [89] "Kazakhstan"                       "Kenya"                           
 [91] "Korea, South"                     "Kosovo"                          
 [93] "Kuwait"                           "Kyrgyzstan"                      
 [95] "Laos"                             "Latvia"                          
 [97] "Lebanon"                          "Liberia"                         
 [99] "Libya"                            "Liechtenstein"                   
[101] "Lithuania"                        "Luxembourg"                      
[103] "Madagascar"                       "Malawi"                          
[105] "Malaysia"                         "Maldives"                        
[107] "Mali"                             "Malta"                           
[109] "Mauritania"                       "Mauritius"                       
[111] "Mexico"                           "Moldova"                         
[113] "Monaco"                           "Mongolia"                        
[115] "Montenegro"                       "Morocco"                         
[117] "Mozambique"                       "MS Zaandam"                      
[119] "Namibia"                          "Nepal"                           
[121] "Netherlands"                      "New Zealand"                     
[123] "Nicaragua"                        "Niger"                           
[125] "Nigeria"                          "North Macedonia"                 
[127] "Norway"                           "Oman"                            
[129] "Pakistan"                         "Panama"                          
[131] "Papua New Guinea"                 "Paraguay"                        
[133] "Peru"                             "Philippines"                     
[135] "Poland"                           "Portugal"                        
[137] "Qatar"                            "Romania"                         
[139] "Russia"                           "Rwanda"                          
[141] "Saint Kitts and Nevis"            "Saint Lucia"                     
[143] "Saint Vincent and the Grenadines" "San Marino"                      
[145] "Saudi Arabia"                     "Senegal"                         
[147] "Serbia"                           "Seychelles"                      
[149] "Sierra Leone"                     "Singapore"                       
[151] "Slovakia"                         "Slovenia"                        
[153] "Somalia"                          "South Africa"                    
[155] "Spain"                            "Sri Lanka"                       
[157] "Sudan"                            "Suriname"                        
[159] "Sweden"                           "Switzerland"                     
[161] "Syria"                            "Taiwan*"                         
[163] "Tanzania"                         "Thailand"                        
[165] "Timor-Leste"                      "Togo"                            
[167] "Trinidad and Tobago"              "Tunisia"                         
[169] "Turkey"                           "Uganda"                          
[171] "Ukraine"                          "United Arab Emirates"            
[173] "United Kingdom"                   "Uruguay"                         
[175] "US"                               "Uzbekistan"                      
[177] "Venezuela"                        "Vietnam"                         
[179] "West Bank and Gaza"               "Zambia"                          
[181] "Zimbabwe"           

Dünya / World

Dünyada görülen koronavirüs vakalarının tanımlayıcı istatistikleri aşağıdaki tabloda verilmiştir. Veri setindeki vaka sayıları kümülatif olarak ilerlemektedir. Tabloda koronavirüs vakalarına ilişkin öne çıkan bulgular şöyledir:

  1. Günlük ortalama vaka sayısı yaklaşık 5598’ten yaklaşık 6055’e, ortalama ölüm vaka sayısı ise yaklaşık 293’ten yaklaşık 325’e yükselmiştir.
  2. Günlük ortalama iyileşen vaka sayısı 1152’ten yaklaşık 1236’ya, ortalama aktif vaka sayısı ise yaklaşık 5305’ten 5730’a yükselmiştir.
  3. Günlük ortalama fatalite hızı binde yaklaşık 35’tir. Bu bulgu koronavirüs hastalığına yakalanan her 1000 kişiden yaklaşık 35’inin hayatını kaybettiğini göstermektedir.

Dünyadaki Koronavirüs Vakalarının Tanımlayıcı İstatistikleri / Descriptive Statistics of Coronavirus Cases in the World

Kümülatif Vaka Sayıları Baz Alınarak Dünya’daki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates by Time Based on Cumulative Cases in the World

Kümülatif vaka sayılarına göre en yüksek 10 ülke aşağıdaki tabloda karşılaştırmalı olarak verilmiştir.

En Yüksek Kümülatif Vaka Sayısına Sahip 10 Ülke / Top 10 Countries with the Highest Number of Cumulative Cases

En Yüksek Kümülatif Ölüm Vaka Sayısına Sahip 10 Ülke / Fatality Rates of Top 10 Countries with the Highest Cumulative Death Figures

Kümülatif Vaka Sayılarına Göre Dünyadaki Son 10 Günlük Fatalite (Ölüm) Hızları / Last 10-Day Fatality Rates Based by Cumulative Cases in the World

Sonuç / Conclusion

Özetle, İnsani Veri Alışverişi (HDX) platformundan alınan 3 farklı koronavirüs hastalık veri setinin birleştirilmesinden sonra epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak koronavirüs pandemisinin trendi hakkında farkındalık oluşturulması amaçlanmıştır.

Bu arada son 10 gündür üzerinde yoğun bir şekilde çalıştığım salgının dalga boyunun hesaplanmasına yönelik geliştirdiğim modelleri Avrupa Hastalık Önleme ve Kontrol Merkezi ile paylaştıktan sonra faydalı olması adına burada da paylaşılacaktır.

Faydalı olması ve farkındalık oluşturması dileğiyle.

Sağlıkla ve bilimle kalınız.

Saygılarımla.

Note: It can not be cited or copied without referencing.

Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.

Yararlanılan Kaynaklar / Resources Utilized

3 Nisan 2020 Tarihi İtibariyle Koronavirüs Pandemisi Üzerine Vaka Çalışmaları: Türkiye ve Diğer Ülke Örnekleri (Case Studies on Coronavirus Pandemic: Cases of Turkey and Other Countries As of April 3, 2020)

Giriş / Introduction

Coronavirüsler (CoV), soğuk algınlığından Orta Doğu Solunum Sendromu (MERS-CoV) ve Şiddetli Akut Solunum Sendromu (SARS-CoV) gibi daha ciddi hastalıklara kadar pek çok hastalığa neden olan büyük bir virüs ailesidir. Bu yeni virüse, yüzey çıkıntıları taç görünümünde olduğu için coronavirus adı verilmiş olup, bu virüs ailesi tek zincirli, pozitif polariteli, zarflı RNA virüsleridir.

Koronavirüs hastalığı (COVID-19), 2019 yılında keşfedilen ve daha önce insanlarda tanımlanmamış yeni bir suştur. Suş, bir bakteri veya virüsün farklı alt türlerinin, aralarında genetik farklılıklar bulunan grupları olarak adlandırılır.

Bu Koronavirüsler zoonotiktir, yani hayvanlar ve insanlar arasında bulaşırlar. Ayrıntılı araştırmalar SARS-CoV’nin misk kedilerinden insanlara ve MERS-CoV’un tek hörgüçlü develerden insanlara bulaştığını göstermiştir. Bilinen birkaç koronavirüs henüz insanları enfekte etmeyen hayvanlarla taşınmaktadır.

Enfeksiyon belirtileri arasında solunum semptomları, ateş, öksürük, nefes darlığı ve solunum güçlüğü bulunur. Daha ciddi vakalarda, enfeksiyon pnömoniye, ciddi akut solunum sendromuna, böbrek yetmezliğine ve hatta ölüme neden olabilir. Solunum sistemi hastalıklarından biri olan pnömoni ya da halk arasında zatürre bakteriler başta olmak üzere mikroorganizmalara bağlı olarak ortaya çıkan akciğer dokusunun iltihaplanmasıdır. Grip gibi bu hastalık da bağışıklık (immun) sistemini baskılayan hastalıklardan biridir. Özellikle ileri yaşlardaki bireylerde hem bağışıklık sisteminin yaşla birlikte yavaşlaması hem de yaşa ve/veya diğer nedenlere bağlı olarak kronik ve diğer hastalıkların görülmesi bu yaşlardaki bireylerde ölüm oranlarını artırabilmektedir. Diğer bir deyişle, bu enfeksiyon komplikasyon yaratarak ve mevcut diğer hastalıkları tetikleyerek bu yaş gruplarında diğer yaş gruplarına göre daha öldürücü olabilir.

Enfeksiyonun yayılmasını önlemek için standart öneriler arasında düzenli el yıkama, öksürme ve hapşırma sırasında ağız ve burnun kapatılması, et ve yumurtaların iyice pişirilmesi yer alır. Öksürme ve hapşırma gibi solunum yolu rahatsızlığı belirtileri gösteren kişilerle yakın temastan kaçınmak bu hastalıktan korunmak için atılacak önemli koruyucu tedbirlerden biridir.

Hastalıktan nasıl korunulacağı hakkında bilgi verdikten sonra bu hastalığın teşhisinde kullanılan ve adı son zamanlarda sık sık duyulan PCR testi hakkında bilgi vermek faydalı olacaktır. PCR, ingilizce adıyla “Polymerase Chain Reaction” kelimelerinin bir araya gelmesinden oluşan ve moleküler biyoloji alanında kullanılan bir tekniktir.Türkçe ise ise polimeraz zincir reaksiyonu olarak adlandırılır. Bazen PCR moleküler fotokopi (molecular photocopying) olarak da adlandırılabilmektedir. DNA’nın küçük bölümlerini kopyalamak için kullanılan hızlı ve ucuz bir tekniktir. Moleküler ve genetik analizler için büyük miktarlarda DNA örneği gerekli olduğundan, izole edilmiş DNA parçaları üzerinde çalışmalar PCR amplifikasyonu olmadan neredeyse imkansızdır. PCR’ın kullanım alanları şöyle özetlenebilir:

  1. Amplifiye edildikten sonra PCR ile üretilen DNA, birçok farklı laboratuvar prosedüründe kullanılabilir. Örneğin, İnsan Genom Projesindeki (HGP) çoğu haritalama tekniği PCR’a dayanmaktadır.
  2. Parmak izi, bakteri veya virüslerin (özellikle AIDS) tespiti ve genetik bozuklukların teşhisi gibi bir dizi laboratuvar ve klinik teknikte de değerlidir.

PCR ( Polimeraz Zincir Reaksiyonu) tekniğinin çalışma şeması ise aşağıdaki şekilde verilmiştir.

polymerase chain reaction diagram
Kaynak: The National Human Genome Research Institute (NHGRI)

PCR tekniğini kullanarak koronavirüs teşhisinin nasıl konulduğuna ilişkin bir video aşağıda verilerek teşhis süreci hakkında bilgi verilmesi amaçlanmıştır.

Kaynak:
AMBOSS: Medical Knowledge Distilled

Bilindiği üzere koronavirüs hastalığının teşhis ve özellikle tedavisine yönelik olarak ilaç ve aşı geliştirme alanında Dünya’da ve ülkemizde yoğun bir mesai harcanmaktadır. Bunlardan biri ülkemizde 02.04.2020 tarihinde Sanayi ve Teknoloji Bakanlığı ve TÜBİTAK bünyesinde “Covid-19 Türkiye Platformu Aşı ve İlaç Geliştirme” bilim insanların katıldığı sanal bir konferans gerçekleştirilmiştir. Türkiye dışında da benzer çalışmalar sanal ortamda çalıştay ve konferans olarak yapılmaktadır. Dünyada yapılan ve benim de katılım sağladığım önde giden bu çalışmalardan biri de Avrupa Öğrenme ve Akıllı Sistemler Laboratuvarı ingilizce adıyla European Laboratory for Learning and Intelligent Systems (ELLIS)’ın 02.04.2020 tarihinde düzenlediği “ELLIS Against Covid-19” adlı çalıştaydır. Dünyanın farklı üniversitelerinden bilim insanlarının katılım sağladığı çalıştayda koranavirüs pandemisinin teşhisinde kullanılan yapay zeka teknolojilerinden koronavirüsün tedavisinde kullanılan ilaçların geliştirilmesinde kullanılan yapay zeka teknolojilerine kadar pek çok konu ele alınmıştır. Çalıştayda ağırlıklı olarak ele alınan konu yapay zekanın teşhis ve tedavide nasıl kullanıldığı ve kullanılacağı idi. Çalıştayda koronavirüs ile mücadele çok güzel uygulama örneklerine yer verilmiştir. Daha önce de dile getirdiğim gibi yapay zeka günümüzün ve geleceğin en kritik teknolojisidir. Bu gerek 4. Sanayi Devrimi gerekse Toplum 5.0 açısından olsun böyledir ve farklı ülkeler yapay zekayı teşhis ve tedavi (robotik cerrahi ve ilaç geliştirme) alanlarında kullanmak için çok ciddi adımlar atmıştır. Bu yapıların da ülkemizde kurulması ve yapay zeka enstitülerinin ülkemizde yaygınlaştırılması gerekmektedir. Aynı zamanda Türkiye Büyük Millet Meclisi bünyesinde Yapay Zeka Komisyonu kurulmalıdır. Yapay zeka özünde öğrenen sistemler olduğu ve sürekli gelişim gösterdiği için sektör ayrımı olmaksızın her alanda kendine uygulama alanı bulan bir teknolojidir.

Koronavirüs salgını Çin ile birlikte diğer ülkelere de yayıldığı için Dünya Sağlık Örgütü tarafından 30/01/2020 tarihinde uluslararası halk sağlığı açısından acil durum ilan edilmiştir. Bu hastalıktan bahsedilirken lise ve üniversite yıllarımda benim de ders olarak aldığım Epidemiyoloji biliminden bahsetmemek olmaz. Epidemiyoloji, toplumda sağlıkla ilgili durumların veya olayların (hastalık dahil) dağılımını, görülme sıklıklarını ve bunları etkileyen faktörleri inceleyen bir tıp bilimi dalıdır.

Epidemiyolojik araştırmalar yapmak için çeşitli yöntemler kullanılabilir. Bu yöntemler dağılımı incelemek için sürveyans, tanımlayıcı çalışmalar ve hastalık belirleyicilerini incelemek için analitik çalışmalar olabilir. Bilindiği üzere Koronavirüs hastalığı artık pandemik bir vaka olarak adlandırılmaktadır. Epidemiyolojinin konu alanına giren pandemi dünyada birden fazla ülkede veya kıtada, çok geniş bir alanda
yayılan ve etkisini gösteren salgın hastalıklara verilen genel isim
olarak ifade edilmektedir. Diğer bir deyişle, salgın (epidemi) durumundaki bir hastalığın ülke sınırlarını aşarak diğer ülkelere yayılım göstermesidir.

Avrupa Birliği kurumlarından biri olan “Avrupa Hastalık Önleme ve Kontrol Merkezi (European Centre for Disease Prevention and Control)”‘ne göre ön bulgular koronavirüs hastalığından vakalara dayalı ölüm oranı (fatalite hızı)’nın binde 20-30 olduğunu göstermektedir. Bu, 2003 SARS salgınından önemli ölçüde daha az. Bununla birlikte, mevsimsel gripin neden ölüm oranlarından çok daha yüksektir.

Çalışma kapsamında koronavirüs pandemi vakalarının epidemiyolojik hızlarla birlikte keşifsel veri analizi (EDA) yapılarak vakaların izlediği seyrin ortaya konulması amaçlanmıştır

Metodoloji / Methodology

Çalışmanın amacı, koronavirüs vakalarının epidemiyolojik düzlemde Türkiye’de ve diğer ülkelerde izlediği seyri detaylı bir şekilde keşifsel veri analiziyle ortaya konulara karar vericilere katkı sunmaktır.

Koronavirüs vakalarının analizinde Türkiye veri setinin oluşturulmasında Türkiye İstatistik Kurumu (TÜİK)’ndan ve Dünya Sağlık Örgütü (DSÖ) raporlarından ve Sağlık Bakanlığı basın açıklamalarından yararlanılmıştır. Bunun nedeni Türkiye veri setine daha derinlemesine bakılmak istenmesidir.

Çalışma kapsamında diğer ülkelere ilişkin koronavirüs vakaları ise Johns Hopkins Üniversitesi Sistem Bilimi ve Mühendisliği Merkezi (JHU CCSE) tarafından desteklenen “The Humanitarian Data Exchange (HDX) (İnsani Veri Alışverişi)” adlı platforma ait https://data.humdata.org web sitesinden alınmıştır. Önceki çalışmalardan faklı olarak bu platformdan veri alınmasının nedeni veri setleri içerisinde onaylanmış ve ölüm vakaları dışında iyileşen koronavirüs vakalarına da yer verilmiş olmasıdır.

Analizlerde Türkiye verisi için Microsoft Excel 2016 ve diğer ülke verileri için R programlama dili kullanılmıştır.

Keşifsel veri analizine geçilmeden önce vaka sayılarından yararlanarak epidemiyolojik hızlar hesaplanmıştır. Bu nedenle, çalışmada kullanılacak hızları açıklamanın faydalı olacağı düşünülmektedir.

Epidemiyoloji biliminde hız kavramı, bir sağlık olayının nüfus içindeki görülme frekansını hesaplamada kullanılan bir ölçüttür. Hızlar, belirli bir zaman diliminde meydana gelen olayların sayısının olayın meydana geldiği nüfusa bölünerek hesaplanır. Eşitliğin payı, sağlık olayı ile karşılaşanların sayısını (X), payda ise risk altındaki nüfusu (X+Y) göstermektedir. Risk altındaki nüfus hastalığa veya sağlık olaylarına karşı duyarlı olan nüfusu ifade etmektedir. Formülize edilirse;

Hız (Rate) = (X / X +Y) * k

Burada, k katsayıyı göstermektedir.

Analizde hızlardan girdi değişkeni olarak kullanılması düşünülen ilk gösterge ölüm veya mortalite ölçütlerinden biri olan Kaba Ölüm Hızı‘dır. Bu hız nüfusun sağlık düzeyini ortaya koymada duyarlı olmasa da bir fikir vermesi açısından önemlidir. Kaba ölüm hızı aşağıdaki eşitlikte gösterilmiştir.

Kaba Ölüm Hızı (Crude Death Rate) = (Bir toplumda belirli bir süre içinde meydana gelen ölüm sayısı / Aynı toplumun aynı süredeki
(yıl ortası) nüfusu) * 1000

Crude death rate = (Total number of deaths during a given time interval / Mid-interval population) * 1000

Girdi değişkeni olarak kullanılması düşünülen ikinci gösterge ölüm veya fatalite ölçütlerinden biri olan Fatalize Hızı‘dır. Bu gösterge kaba ölüm hızına göre daha duyarlı bir göstergedir. Diğer bir ifadeyle, hastalığa yakalananların ne kadarının öldüğünü gösterir. Fatalite hızı aşağıdaki eşitlik yardımıyla hesaplanmaktadır;

Fatalite Hızı (Fatality Rate) = (Nüfusta belirli bir süre içinde “X” hastalığından ölenlerin sayısı / Aynı nüfusun aynı süre içinde “X” hastalığına yakalananların sayısı) * 100

Fatality Rate = (Number of cause-specific deaths among the incident cases / Total number of incident cases) * 100

Morbitide veya hastalık hızları gelişmekte olan hastalığın ortaya çıkma hızını ortaya koymak için kullanılır. Bunlardan biri olan insidans,
bir hastalığın gelişme (yeni vakalar) olasılığını ortaya koymak için kullanılır. Diğer taraftan, bu hızlardan prevelans ise hastalığın görülme sıklığını (tüm vakalar) gösteren bir hızdır. İnsidans ve prevelans da analizde girdi değişkenleri olarak kullanılması düşünülmektedir. İnsidans aşağıdaki eşitlik yardımıyla hesaplanmaktadır.

İnsidans (Incidence) = (Bir nüfusta belirli bir sürede saptanan YENİ vaka sayısı / Aynı toplumun yıl ortası nüfusu) * k

Incidence = (Number of new cases of disease during specified time interval / Population at start of time interval) * k

İnsidans hızının kümülatif şekli ise atak hızlarını göstermektedir.

Prevelans ise aşağıdaki eşitlik yardımıyla hesaplanmaktadır.

Prevelans (Prevalence) = (Belirli bir sürede toplam (eski+yeni) vaka sayısı / Risk altındaki kişi sayısı) * k

Prevalence = (Number of cases of disease during specified time interval / Population at start of time interval) * k

Keşifsel Veri Analizi Bulguları / Exploratory Data Analysis Findings

Türkiye Örneği / The Case of Turkey

Bu kısımda bahsedilen epidemiyolojik hızların uygulama sonuçlarına yer verilmiştir. İlk olarak günlük onaylanmış vaka sayıları ile ölüm vaka sayıları Tablo 1’de verilmiştir. Tabloda test sayılarının olduğu sütunda kırmızı renkteki sayılar kesin olarak bilinmediğinden ortalama olarak verilmiştir. Tablo 1’e göre öne çıkan bulgular şöyledir:

  • 03.04.2020 tarihinde toplam vaka sayısı 20921’dir. Aynı günde gerçekleşen yeni vaka sayısı ise 2786 olup bir önceki güne göre % 11,8 artmıştır. Yeni vaka sayısının 2786 olduğu 03.04.2020 tarihi Türkiye’de salgının başladığı günden bugüne kadar vaka sayısının en yüksek olduğu tarihtir.
  • Kümülatif vaka sayısından kümülatif ölen kişi sayısı çıkarılmasından sonra kalan toplam aktif vaka sayısı 20496’dur.
  • Salgında ölen toplam kişi sayısı 425 olup, en yüksek ölüm vakalarının yaşandığı gün 79 kişi ile 02.04.2020 tarihidir.

Tablo 1. Koronavirüs Vaka Sayıları / Number of Coronavirus Cases, Turkey

Epidemiyolojik hızları gösteren bulgular ise Tablo 2’de sunulmuştur. Tablo 2’ye göre öne çıkan bulgular şöyledir:

  • Sağlık düzeyini belirlemede duyarlı bir gösterge olmasa da fikir vermesi açısından kaba ölüm hızı hesaplanmıştır. Buna göre kaba ölüm hızı en yüksek seviyesine ulaştığı 02.4.2020 tarihinde milyonda 0,95’dır. Katsayı bin yerine milyon alınmasının nedeni ortaya konulan bulgunun çok küçük değer almasından kaynaklanmaktadır. Toplam ölüm vaka sayına göre kaba ölüm hızı ise milyonda 4,28’ten 5,11’e yükselmiştir.
  • Fatalite hızının en yüksek olduğu tarih binde 43 ile 21.3.2020 tarihidir. Toplam vaka sayılarına göre fatalite hızı ise binde yaklaşık 20’dir. Bu bulgu şu anlama gelmektedir; bugüne kadar koronavirüs hastalığına yakalanan her 1000 kişiden yaklaşık 20’si hayatını kaybetmiştir.
  • Yapılan test sayıları ve vaka sayıları dikkate alınarak koronavirüs salgının insidansı ve prevelansı da hesaplanmıştır. Yapılan toplam test sayısı 141666, onaylanmış toplam vaka sayısı ise 20921’tir. Belirli bir zaman diliminde bir hastalığın bir nüfus grubunda görülme sıklığını ortaya koyan prevelans hızı yaklaşık % 15 olup bir önceki güne göre artış göstermiştir. Buradan salgın meydana geldiği süre içerisinde test uygulanan her 100 vakadan 15’inde koronavirüs vakası tespit edildiği anlamı çıkmaktadır.
  • Belirli bir zaman diliminde bir hastalığın gelişme (yeni vakalar) olasılığını ortaya koyan insidans hızı % 13,1’den % 17,3’e yükselmiştir. Bu bulgudan koronavirüs testi (PCR) yapılan her 100 yeni vakadan yaklaşık 17’sinde koronavirüs tespit edildiği anlaşılmaktadır. İnsidans hızı ne kadar çok düşerse salgının yeni vakalar ortaya çıkarma olasılığı o kadar düşer. Bu hız bu açıdan ayrı bir öneme sahiptir.

Tablo 2. Koronavirüs Vakalarının Epidemiyolojik Hızları / Epidemiological Rates of Coronavirus Cases, Turkey

Türkiye’deki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates in Turkey by Time

Koronavirüs vaka sayıları baz alınarak Türkiye ve İtalya’nın karşılaştırıldığı görülmektedir. Bu oldukça eksik bir bakış açısıdır. Zira vaka sayıları ve hatta ölüm sayıları bile tek başına değerlendirilmesi eksik ve hatalı yorumlara ve sonuçlara neden olabilir. Bu göstergelerden daha da önemli olan epidemiyolojik hızlardan ve aynı zamanda ölüm ölçütlerinden biri olan fatalite hızının dikkate alınmasının değerlendirme açısından daha sağlıklı olacağı düşünülmektedir. Aşağıdaki grafikte İtalya ve Türkiye fatalite hızları karşılaştırmalı olarak sunulmuştur. Aşağıdaki grafikte fatalite hızları açısından bakılırsa fatalite hızlarının görüldüğü y ekseninde İtalya’nın çok farklı bir seyir izlediği görülmektedir. Ancak en kötü senaryo olarak düşünülürse atılacak adımlar açısından faydalı olacağı düşünülmektedir. Grafikte X eksenine paralel olarak kesikli doğrular ortalama fatalite hızlarını göstermektedir. İtalya Türkiye’ye göre çok daha yüksek fatalite hızlarına sahip olmasının yanısıra aynı zamanda fatalite hızları ortalamasına yakın bir seyir izlemiştir.

Türkiye ve İtalya’daki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates in Turkey and Italy by Time

Ayrıca Türkiye, Avrupa Hastalık Önleme ve Kontrol Merkezi‘nden alınan koronavirüs ölüm vakaları açısından İtalya’nın yanısıra Fransa, İspanya ve İran ile de ilk 14 günlük seyir karşılaştırılmıştır. Aşağıdaki tabloda toplam ölüm vaka sayıları açısından Türkiye’nin İran ile benzerlik gösterdiği görülmektedir.

Türkiye, İtalya, Fransa, İspanya ve İran’ın Ölüm Vakalarının İlk 14 Günlük Seyri / First 14-Day Dealth Figures, Cases of Turkey, Italy, France, Spain and Iran

Yukarıdaki tabloda ilk 14 günlük zaman diliminde Türkiye’de koronavirüs ölüm vakaları açısından İspanya ve Fransa’ya göre daha yüksek olsa da aşağıdaki tabloda fatalite hızları açısından bu ülkelerin Türkiye’den daha yüksek olduğu olduğu görülmektedir. Diğer taraftan genel olarak Türkiye’nin fatalite hızları açısından ABD’ye benzer ancak ondan daha yüksek fatalite hızlarının olduğu görülmektedir. Tabloda İtalya’nın fatalite hızları açısından açık ara önde olduğu görülmektedir. Bu bulgu aynı zamanda koronavirüs hastalığına yakalananlar içerisinde ölenlerin İtalya’da daha yüksek olduğunu ortaya koymaktadır.

Ülkelere Göre Fatalite Hızlarının Karşılaştırılması / The Comparison of Fatality Rates by Countries

Dünya ve Diğer Ülke Örnekleri / Cases of World and Other Countries

İlk olarak adım adım uygulamaya geçilerek İnsani Veri Alışverişi (HDX) web sitesinden csv (Comma-seperated value) uzantılı olarak okutulan onaylanmış, ölen ve iyileşen koronavirüs vaka sayılarını içeren 3 farklı veri seti birleştirilerek tanıtılmıştır.

Çalışmanın bu kısmında epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak Dünyada koronavirüs vakalarıyla ilgili olarak öne çıkan ülkeler verilmiştir.

Aşağıda yazdığım R kod bloğu ile birlikte “İnsani Veri Alışverişi (HDX)veri tabanından güncel veri akışı sağlanabilecektir. Aşağıdaki kod bloğunda görüleceği üzere mevcut veri setlerinde olmayan 2 adet değişken hesaplanmıştır. Daha sonra bu değişkenler kod bloğu ile veri akışı sağlanmasından sonra birleştirilerek oluşturulan yeni veri setine ilave edilmiştir. İlave edilen değişkenler şöyledir:

  1. Aktif Vakalar (ActiveCases) : Onaylanmış vaka sayısından ölen ve iyileşen vakalar çıkarılması ile hesaplanmıştır.
  2. Fatali Fızı (FataliteRate): Onaylanmış vaka sayılarının ölüm vaka sayılarına bölünmesiyle hesaplanmıştır. Çarpım katsayısı (k) ise 1000’dir.
url1="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_confirmed_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_confirmed_global.csv"

url2="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_deaths_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_deaths_global.csv"

url3="https://data.humdata.org/hxlproxy/data/download/time_series_covid19_recovered_global_narrow.csv?dest=data_edit&filter01=explode&explode-header-att01=date&explode-value-att01=value&filter02=rename&rename-oldtag02=%23affected%2Bdate&rename-newtag02=%23date&rename-header02=Date&filter03=rename&rename-oldtag03=%23affected%2Bvalue&rename-newtag03=%23affected%2Binfected%2Bvalue%2Bnum&rename-header03=Value&filter04=clean&clean-date-tags04=%23date&filter05=sort&sort-tags05=%23date&sort-reverse05=on&filter06=sort&sort-tags06=%23country%2Bname%2C%23adm1%2Bname&tagger-match-all=on&tagger-default-tag=%23affected%2Blabel&tagger-01-header=province%2Fstate&tagger-01-tag=%23adm1%2Bname&tagger-02-header=country%2Fregion&tagger-02-tag=%23country%2Bname&tagger-03-header=lat&tagger-03-tag=%23geo%2Blat&tagger-04-header=long&tagger-04-tag=%23geo%2Blon&header-row=1&url=https%3A%2F%2Fraw.githubusercontent.com%2FCSSEGISandData%2FCOVID-19%2Fmaster%2Fcsse_covid_19_data%2Fcsse_covid_19_time_series%2Ftime_series_covid19_recovered_global.csv"

case<-read_csv(url1)[-1,-1]
case<-case %>% rename(Country="Country/Region", Cases= "Value")

case

death<-read_csv(url2)[-1,-1]

d<-death %>% rename(Country="Country/Region", Deaths= "Value")

recovered<-read_csv(url3)[-1,-1]

r<-recovered%>% rename(Country="Country/Region", Recovered= "Value")

df<-left_join(case, d, by = c("Country","Lat", "Long","Date"))
df<-left_join(df, r, by = c("Country","Lat", "Long","Date"))
df<-tibble(Country=df$Country, Date=as.Date(df$Date), Month=month(as.Date(df$Date)), Lat=as.numeric(df$Lat), Long=as.numeric(df$Long),Cases=as.integer(df$Cases), Deaths=as.integer(df$Deaths), Recovered= as.integer(df$Recovered), ActiveCases=as.integer(as.numeric(df$Cases)-as.numeric(df$Deaths)-as.numeric(df$Recovered)), FatalityRate=round(as.numeric((as.integer(df$Deaths)/as.integer(df$Cases))*1000),1))
df

Veri setindeki değişken sayısı 8, gözlem sayısı ise 18720’dir. Aşağıda mevcut değişkenler, değişkenlerin veri tipi ile birlikte gözlem sayısı görülmektedir.

Classes ‘tbl_df’, ‘tbl’ and 'data.frame':	18720 obs. of  8 variables:
 $ Country     : chr  "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
 $ Date        : Date, format: "2020-04-02" "2020-04-01" ...
 $ Month       : num  4 4 3 3 3 3 3 3 3 3 ...
 $ Cases       : num  273 237 174 170 120 110 110 94 84 74 ...
 $ Deaths      : num  6 4 4 4 4 4 4 4 2 1 ...
 $ Recovered   : num  10 5 5 2 2 2 2 2 2 1 ...
 $ ActiveCases : num  257 228 165 164 114 104 104 88 80 72 ...
 $ FatalityRate: num  22 16.9 23 23.5 33.3 36.4 36.4 42.6 23.8 13.5 ...

Veri setinde koronavirüs salgınının yaşandığı aşağıdaki listesi verilen 181 ülke ve/veya bölge bulunmaktadır.

  [1] "Afghanistan"                      "Albania"                         
  [3] "Algeria"                          "Andorra"                         
  [5] "Angola"                           "Antigua and Barbuda"             
  [7] "Argentina"                        "Armenia"                         
  [9] "Australia"                        "Austria"                         
 [11] "Azerbaijan"                       "Bahamas"                         
 [13] "Bahrain"                          "Bangladesh"                      
 [15] "Barbados"                         "Belarus"                         
 [17] "Belgium"                          "Belize"                          
 [19] "Benin"                            "Bhutan"                          
 [21] "Bolivia"                          "Bosnia and Herzegovina"          
 [23] "Botswana"                         "Brazil"                          
 [25] "Brunei"                           "Bulgaria"                        
 [27] "Burkina Faso"                     "Burma"                           
 [29] "Burundi"                          "Cabo Verde"                      
 [31] "Cambodia"                         "Cameroon"                        
 [33] "Canada"                           "Central African Republic"        
 [35] "Chad"                             "Chile"                           
 [37] "China"                            "Colombia"                        
 [39] "Congo (Brazzaville)"              "Congo (Kinshasa)"                
 [41] "Costa Rica"                       "Cote d'Ivoire"                   
 [43] "Croatia"                          "Cuba"                            
 [45] "Cyprus"                           "Czechia"                         
 [47] "Denmark"                          "Diamond Princess"                
 [49] "Djibouti"                         "Dominica"                        
 [51] "Dominican Republic"               "Ecuador"                         
 [53] "Egypt"                            "El Salvador"                     
 [55] "Equatorial Guinea"                "Eritrea"                         
 [57] "Estonia"                          "Eswatini"                        
 [59] "Ethiopia"                         "Fiji"                            
 [61] "Finland"                          "France"                          
 [63] "Gabon"                            "Gambia"                          
 [65] "Georgia"                          "Germany"                         
 [67] "Ghana"                            "Greece"                          
 [69] "Grenada"                          "Guatemala"                       
 [71] "Guinea"                           "Guinea-Bissau"                   
 [73] "Guyana"                           "Haiti"                           
 [75] "Holy See"                         "Honduras"                        
 [77] "Hungary"                          "Iceland"                         
 [79] "India"                            "Indonesia"                       
 [81] "Iran"                             "Iraq"                            
 [83] "Ireland"                          "Israel"                          
 [85] "Italy"                            "Jamaica"                         
 [87] "Japan"                            "Jordan"                          
 [89] "Kazakhstan"                       "Kenya"                           
 [91] "Korea, South"                     "Kosovo"                          
 [93] "Kuwait"                           "Kyrgyzstan"                      
 [95] "Laos"                             "Latvia"                          
 [97] "Lebanon"                          "Liberia"                         
 [99] "Libya"                            "Liechtenstein"                   
[101] "Lithuania"                        "Luxembourg"                      
[103] "Madagascar"                       "Malawi"                          
[105] "Malaysia"                         "Maldives"                        
[107] "Mali"                             "Malta"                           
[109] "Mauritania"                       "Mauritius"                       
[111] "Mexico"                           "Moldova"                         
[113] "Monaco"                           "Mongolia"                        
[115] "Montenegro"                       "Morocco"                         
[117] "Mozambique"                       "MS Zaandam"                      
[119] "Namibia"                          "Nepal"                           
[121] "Netherlands"                      "New Zealand"                     
[123] "Nicaragua"                        "Niger"                           
[125] "Nigeria"                          "North Macedonia"                 
[127] "Norway"                           "Oman"                            
[129] "Pakistan"                         "Panama"                          
[131] "Papua New Guinea"                 "Paraguay"                        
[133] "Peru"                             "Philippines"                     
[135] "Poland"                           "Portugal"                        
[137] "Qatar"                            "Romania"                         
[139] "Russia"                           "Rwanda"                          
[141] "Saint Kitts and Nevis"            "Saint Lucia"                     
[143] "Saint Vincent and the Grenadines" "San Marino"                      
[145] "Saudi Arabia"                     "Senegal"                         
[147] "Serbia"                           "Seychelles"                      
[149] "Sierra Leone"                     "Singapore"                       
[151] "Slovakia"                         "Slovenia"                        
[153] "Somalia"                          "South Africa"                    
[155] "Spain"                            "Sri Lanka"                       
[157] "Sudan"                            "Suriname"                        
[159] "Sweden"                           "Switzerland"                     
[161] "Syria"                            "Taiwan*"                         
[163] "Tanzania"                         "Thailand"                        
[165] "Timor-Leste"                      "Togo"                            
[167] "Trinidad and Tobago"              "Tunisia"                         
[169] "Turkey"                           "Uganda"                          
[171] "Ukraine"                          "United Arab Emirates"            
[173] "United Kingdom"                   "Uruguay"                         
[175] "US"                               "Uzbekistan"                      
[177] "Venezuela"                        "Vietnam"                         
[179] "West Bank and Gaza"               "Zambia"                          
[181] "Zimbabwe"           

Dünya / World

Dünyada görülen koronavirüs vakalarının tanımlayıcı istatistikleri aşağıdaki tabloda verilmiştir. Veri setindeki vaka sayıları kümülatif olarak ilerlemektedir. Tabloda koronavirüs vakalarına ilişkin öne çıkan bulgular şöyledir:

  1. Günlük ortalama vaka sayısı yaklaşık 5598, ortalama ölüm vaka sayısı ise yaklaşık 293’tür.
  2. Günlük ortalama iyileşen vaka sayısı 1152, ortalama aktif vaka sayısı ise yaklaşık 5305’tir.
  3. Günlük ortalama fatalite hızı binde yaklaşık 35’tir. Bu bulgu koronavirüs hastalığına yakalanan her 1000 kişiden yaklaşık 35’inin hayatını kaybettiğini göstermektedir.

Dünaydaki Koronavirüs Vakalarının Tanımlayıcı İstatistikleri / Descriptive Statistics of Coronavirus Cases in the World

Kümülatif Vaka Sayıları Baz Alınarak Dünya’daki Fatalite (Ölüm) Hızlarının Zamana Göre Dağılımı / Distribution of Fatality Rates by Time Based on Cumulative Cases in the World

Kümülatif vaka sayılarına göre en yüksek 10 ülke aşağıdaki tabloda karşılaştırmalı olarak verilmiştir.

En Yüksek Kümülatif Vaka Sayısına Sahip 10 Ülke / Top 10 Countries with the Highest Number of Cumulative Cases

En Yüksek Kümülatif Ölüm Vaka Sayısına Sahip 10 Ülke / Fatality Rates of Top 10 Countries with the Highest Cumulative Death Figures

Kümülatif Vaka Sayılarına Göre Dünyadaki Son 10 Günlük Fatalite (Ölüm) Hızları / Last 10-Day Fatality Rates Based by Cumulative Cases in the World

Sonuç / Conclusion

Özetle, İnsani Veri Alışverişi (HDX) platformundan alınan 3 farklı koronavirüs hastalık veri setinin birleştirilmesinden sonra epidemiyolojik hızlarla birlikte keşifsel veri analizi yapılarak koronavirüs pandemisinin trendi hakkında farkındalık oluşturulması amaçlanmıştır.

Faydalı olması ve farkındalık oluşturması dileğiyle.

Sağlıkla ve bilimle kalınız.

Saygılarımla.

Note: It can not be cited or copied without referencing.

Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.

Yararlanılan Kaynaklar / Resources Utilized