Biyomedikal Araştırmalarda Verinin Anlam ve Önemi

Farkındalık oluşturması adına bu yazımda İspanyol Farmaindustria kuruluşu Genel Müdür Yardımcısı Javier Urzay’ın İspanyol El Economista gazetesinin Sağlık dergisinin 10 Mayıs 2021 tarihli sayısında yayınlanan görüşlerine yer verilmiştir. Javier Urzay’ın görüşlerine geçmeden önce kısaca Farmaindustria kuruluşu hakkında bilgilere yer verelim. Farmaindustria, ispanya merkezli ilaç endüstrisi İspanyol Ulusal Ticaret Birliği (National Trade Association of the Spanish)’dir. İspanya’daki reçeteli ilaç satışlarının yaklaşık % 100’ünü gerçekleştiren kuruluş, Ar-Ge tabanlı ilaç şirketlerinin çoğunu bir araya getirmektedir. 141 Ar-Ge tabanlı şirket, Farmaindustria üyesidir. Orijinal ilaç pazarının % 99’u Farmaindustria’nın üye şirketleri tarafından karşılanmaktadır. İspanya’da Ar-Ge temelli ilaç endüstrisi tarafından 42.000 doğrudan iş yaratılmaktadır ve bunların 5.900’ü doğrudan Ar-Ge fonksiyonlarıyla bağlantılıdır. Kuruluşla ilgili çarpıcı olan bir gerçek ise İspanyol endüstrisinin Ar-Ge yatırımının % 20’sinin ilaç sektörü tarafından gerçekleştirilmesidir.

Verilerin toplanması, işlenmesi ve analizi, mevcut ekonomik ve sosyal dönüşümde kilit bir faktör haline gelmiştir. Bilgiyi elde etme ve ondan değer üretmenin yeni bir yolu olarak veri yönetimine dayalı toplumlarda yaşıyoruz. Biyomedikal araştırma alanı bu gerçekliğe yabancı değildir.

Yeni ilaçların Ar-Ge’sinde sağlık verilerinin kullanımı, hassas tıpta yaşanan gelişmeler ve hassas tıbbın katkıları sayesinde son yıllarda artmıştır.

Bu tür kişiselleştirilmiş tıp olan hassas tıp, daha fazla etkinlik elde etmek için hem klinik, hem genetik hem de moleküler düzeyde hasta bilgilerinin yönetilmesini gerektirir. Hassas tıbın gelişimi, hasta sağlığında bir paradigma değişimi anlamına gelmektedir. Artık uzak bir gelecekten bahsetmiyoruz.

Günümüzde sağlık hizmetlerinin mevcut durumu, hastalıkların anlaşılmasını iyileştirmek için kişiselleştirilmiş bilgiler üretmekte ve en iyi sağlık sonuçlarını elde etmek için tüm bu bilgileri bakım sürecinde elde edilen hastanın klinik verileriyle entegre etmektedir.

Bu bağlamda, sağlık profesyonelleri, yöneticiler, ilaç firmaları, hastalar ve bir bütün olarak toplum için kültürel ve örgütsel yapılarda ve aynı zamanda eğitimde ulusal sağlık sistemlerinde gerçek bir dijital dönüşüm gereklidir.

Multidisipliner çalışma ekipleri oluşturmak, dijital eksiklikleri azaltmak, altyapılara yatırım yapmak veya hastanın sağlık bilgilerini elektronik tıbbi kayıtlara dahil etmek ve benzersiz ve birlikte çalışabilir hale getirmek dönüşümü kolaylaştıracak önlemlerden bazılarıdır.

Pandemi, bu eksikliklerin bazılarını vurgulamıştır ancak aynı zamanda, örneğin klinik araştırma alanında gerekli olan bazı değişikliklere de ivme kazandırmıştır. Salgının en zor anlarında, Covid-19’un neden olduğu acil durumlara yanıt vermek için hastanelerdeki araştırma faaliyeti durduğunda, İspanya’da İspanyol İlaç ve Koruma kurumlarının dikkatli müdahalesi sayesinde devam edebilmiştir. Bu durum klinik deneylerin uzaktan izlenmesi gibi süreçlerin dijitalleştirilmesinde bir hızlanmaya yol açmıştır.

Bu gerçek, yeni ilaç araştırmalarının, klinik denemelerin yüz yüze ve sanal süreçleri birleştiren hibrit bir sürece bir geçiş döneminde olduğunu ortaya koymuştur.

Biyomedikal araştırmalarda dijitalleşme daha yeni başlamıştır ve yüz yüze faaliyetlerin çoğunu tamamlayıcı niteliktedir. Ancak, farklı teknolojiler geliştirildikçe aşamalı olarak gelişecek ve bu alanlara adapte edilecektir.

Tam dijital dönüşümde ve yapay zeka kullanımındaki ilerlemeleri uyumlu hale getirmek için Farmaindustria olarak sağlık hizmetleri ve klinik araştırmaların birlikte gelişim göstermesi gerektiğini savunuyoruz.

Ancak bunu mümkün kılmak için sağlık örgütlerinin, ilaç endüstrisinin ve toplumun katılımı olmadan bu asla mümkün olmayacaktır. Her seviyedeki tüm temsilcilerin işbirliğini gerektiren çok büyük bir fırsatla karşı karşıyayız. Ve dahası, klinik araştırmaların artık sadece bir ülke meselesi olmadığını, çoğunluğun Avrupa çapında ya da her halükarda uluslararası nitelikte olduğunu hesaba katmamız gerekir.

Benzer şekilde, sağlık verilerinin ve özellikle yeni tedavilerin araştırılması ve geliştirilmesinde hassas kabul edilen bilgilerin kullanımında sahipler ve yöneticiler olan hastalar için maksimum güvenlik garantileri olmadan biyomedikal araştırmalarda bu gelişmelere odaklanamaz. Bu yüzden her anlamda hasta güvenliği birinci öncelik olmalıdır. Diğer bir ifadeyle,  biyomedikal araştırmalar teşvik edilirken hasta verilerinin korunmasına saygı göstermelidir.

Aslında Farmaindustria, tasarımı ilaç şirketlerinin aktif sorumluluğunu içeren klinik araştırma ve farmakovijilansta verilerin doğru kullanımı için yeni bir Davranış Kuralları seti üzerinde çalışmaktadır.

Avrupalı ​​yetkililerin desteğini almak, kendi bakış açısından ileriye doğru bir adımdır. Bu noktada, diğer konuların yanı sıra, Avrupa Komisyonu tarafından önerildiği üzere bir Avrupa Sağlık Veri Alanı oluşturmak istiyorsak, aşılması gereken engeller de vardır.

Bu anlamda,  hastaların gizli verilerini korumak için AB’de klinik veri yönetimi düzenlemesinin uyumlaştırılmasını, yasal dağınıklığın ortadan kaldırılmasını ve kapsamlı bir güvenlik altyapısının, son teknoloji ve örgütsel güvenlik önlemleriyle benimsenmesini savunuyoruz. Ayrıca, UNESCO’nun Uluslararası Biyoetik Komitesi tarafından savunulduğu üzere, insanlığın ortak bir yararı olarak görülmesi gereken yasal, sorumlu ve etik bir veri yönetimi için yeterli garantiler sunan veri yönetişim mekanizmalarının uygulamaya konulması da gereklidir.

Faydalı olması ve farkındalık oluşturması dileğiyle…

Bilimle ve teknolojiyle kalınız.

Yararlanılan Kaynaklar

Las revistas digitales: Sanitad. Urzay, Javier. (2021). El valor de los datos en la investigación biomédica https://revistas.eleconomista.es/sanidad/2021/mayo/el-valor-de-los-datos-en-la-investigacion-biomedica-YC7523436. Fecha de acceso al recurso: 10 de mayo de 2021.

Farmaindustria: https://www.farmaindustria.es

Öne çıkan

Tabakalı Örnekleme Üzerine Bir Simülasyon Çalışması: A Simulation Study on Stratified Sampling

Öncelikle nicel araştırmalarda hedef popülasyon (target population) hakkında çıkarımlarda bulunmak istiyorsak mutlaka olasılıklı örnekleme yöntem veya yöntemlerinin kullanılması gerektiğini belirtelim. Çünkü yapılan tezlerde, yayınlanan bazı makalelerde ya da araştırma raporlarında bu konuya yeterince önem verilmediği ve yada konunun yeterince bilinmediği görülmektedir. Bu durum yapılan bilimsel çalışmanın niteliğinin sorgulanmasına neden olmaktadır.

Olasılıklı örneklemede temel felsefe popülasyonu oluşturan her popülasyon biriminin örnekleme seçilme şansının eşit olmasıdır. Olasılıklı örnekleme yöntemlerinden biri olan tabakalı örnekleme (stratified sampling)’de, popülasyon ya da evren, tabaka adı verilen üst üste binmeyen gruplara bölünür ve her tabaka içindeki bazı tasarımlarla bir örneklem seçilir. Tabakalı örnekleme tasarımları, popülasyondaki her örnekleme birimi için bilinen belirli bir özelliğe dayalı olarak bir popülasyonun tabakalara bölünmesini ve ardından her bir tabakadan bağımsız olarak örneklemlerin seçilmesini içerir. Bu tasarım, farklı tabakalarda örnekleme yöntemlerine esneklik kazandırır ve her tabaka göreceli olarak kendi içerisinde homojen birimlerden oluştuğunda, hedef parametrelerin tahminlerinde iyi kesinlik (precision) elde edilir.

Tabakalı örnekleme tasarımı, popülasyonun belirli bölümlerinin kolayca hedeflenmesini de sağlar. Örneğin, coğrafi bölgeler, habitat türü, yükseklik veya toprak türü gibi bilinen bazı değişkenler aracılığıyla benzer bölgelere ayrılabilir. Bir başka örnek, bir fabrikada monte edilen kusurlu ürünlerin oranlarını belirlemek olabilir. Bu durumda, örnekleme, üretim hatları, fabrika vb. faktörlere göre tabakalandırılabilir. Hatta COVID-19 pandemisinden örnek vermek gerekirse illeri COVID-19 vaka sayılarına göre 4 farklı şekilde tabakalandırabiliriz. Örneğin, mavi rengin az riskli, sarı rengin orta riskli, turuncu rengin yüksek riskli ve kırmızı rengin çok yüksek riskli iller olmak üzere Türkiye’yi 4 farklı tabakaya ayırabiliriz.

Tabakalı örnekleme genellikle tabakalar arasında eşit tahsis ile yapılır. Bu, örneklemdeki tabaka oranlarının popülasyondaki karşılık gelen oranları temsil etmediği anlamına gelir. Bu sorunu çözmek için, her tabaka için o tabaka büyüklüğünün toplam popülasyona oranı (sampling fraction (f)=n/N) olarak tanımlanan tabaka ağırlıkları dikkate alınarak örneklem büyüklüklerinin belirlenmesi gerekir. Bu yapıldığında, her tabaka için tahminler yanlılık (bias) içermez ve ilgili tabaka büyüklükleri ile çarpılan tabaka ağırlıkları (diğer bir ifadeyle f) tabaka büyüklükleri toplamına eşit olan popülasyon (N) tahminleri de yansız olur. Her tabaka için tarafsız bir tahmincinin varlığı, aynı tasarım için tabakadaki tüm olası örneklemler üzerindeki tahminlerin ortalamasının, tahmin edilen gerçek parametreye eşit olduğu anlamına gelir. Tabaka ağırlıkları doğru bir şekilde hesaplanmazsa, tahminde yanlılığa neden olur. Genel olarak, uygun tabakalı bir örneklemin ağırlıklı ortalaması, popülasyondan basit tekrarsız tesadüfi örnekleme (SRSWOR) ile çekilen örneklemin aritmetik ortalamasından daha az değişkenliğe yani varyansa sahiptir. Tabaka ağırlıkları, tabakalı veriler için varyans tahmininde de kullanılabilir.

Tabakalı örneklemenin mantıklı olacağı birkaç ek örnek düşünebilir misiniz? Tabakalı örneklemede amaç, tabakalar içinde homojenliği yani varyansı azaltmaktır. Tabakalar arasında ise heterojenlik söz konusudur. Tabakalı örnekleme çeşitli avantajları nedeniyle çoğu büyük ölçekli araştırmada kullanılmaktadır.

Tabakalı örneklemenin avantajları nelerdir?

  1. Alt popülasyonların tahmini: Nüfus özelliklerinin tahminlerinin sadece tüm popülasyon için değil, aynı zamanda farklı alt popülasyonları için gerekli olduğu durumlarda, bu tür alt popülasyonlar tabaka olarak ele alınmalıdır. Örneğin, ulusal bir işsizlik anketinde, hükümet tüm ülke için ve il düzeyinde işsizlik rakamlarını tahmin etmekle ilgilenebilir. Bu durumda her il bir tabaka olarak alınabilir.
  2. İdari uygunluk: Araştırmayı yürüten kurum, araştırmanın verimli bir şekilde denetlenebilmesi için nüfusu tabakalı hale getirebilir. Örneğin kurum, her tabaka için ayrı ayrı araştırma yapmak üzere ayrı denetmenler atayabilir.
  3. Örneklemin popülasyonu temsil kapasitesi: Tabakalı örneklemede, tabakaların oluşturulması ve örneklemlerin farklı tabakalara atanması, örneklemin çalışılan özelliklere göre popülasyonu temsil edebileceği şekilde yapılabilir. Örneğin, Türkiye’de farklı etnik grupları temsil eden bir okuldan öğrenci örneklemini seçmek istersek, okulun tamamından basit tesadüfi örnekleme (SRSWOR) ile seçilen örneklem temsil edici olmayabilir. Bu durumda, tabaka olarak farklı etnik gruplarını kullanan tabakalı bir örneklemenin, tüm okuldan alınan bir SRSWOR örnekleminden daha temsili bir örneklem olması beklenir.
  4. Etkinlik: Tabakalı örneklemede, her bir tabakanın çalışılan özelliğe göre homojen hale gelmesini sağlayacak şekilde tabakalar oluşturarak tahminlerin etkinliği artırılabilir. İlgili tabakalara uygun örnekleme şemaları, tahmin edicilerin etkinliklerini artırabilir.
  5. İyileştirilmiş veri kalitesi: Farklı tabakalarda farklı araştırmacılar kullanılarak iyileştirilmiş veri kalitesi elde edilebilir. Örneğin, yerel dilleri bilen araştırmacılar kırsal alanlarda görevlendirilebilirken, kentsel alanlarda İngilizce bilen araştırmacılar daha avantajlı olabilir.
  6. Maliyet: Araştırmada gözlem başına maliyet, popülasyon unsurlarının uygun tabakalara ayrılmasıyla azaltılabilir.

Tabakalı örneklemede notasyonlar şöyledir:

L = tabaka sayısı
Nh = her h. tabakadaki popülasyon büyüklüğü
nh = her h. tabakadan çekilen örneklem büyüklüğü
N = popülasyondaki toplam birim sayısı ya da popülasyon büyüklüğü, yani N1 + N2 + … + NL

Kafamızda canlanması adına tabakalı örnekleme yöntemi Şekil 1 üzerinde gösterilmiştir. Şekil 1’de SRSWOR ifadesi basit tesadüfi tekrarsız örnekleme anlamına gelmekte olup bu örnekleme tekniğinin literatürdeki kısaltılışıdır. Şekil 1 tabakalı örneklemeyi ortaya koysa da biraz bahsetmekte fayda vardır. Popülasyon veya evrenden belirlediğimiz birimlerden tabakalara atanmış popülasyon birimleri üzerinden seçim yaparız. Burada tabaka örneklem (n) büyüklükleri eşit tahsis şeklinde olabileceği gibi orantılı tahsis şeklinde de olabilir. Ancak bu iki yaklaşımdan orantılı olanı tabaka örneklemlerinin popülasyondaki tabakaları temsil etmesi açısından daha iyidir ve tabakalar içerisindeki varyansı eşit seçime göre daha da azaltırsınız. Tabaka örneklem büyüklüklerini belirledikten sonra sıra popülasyon tabakalarından örneklem tabakalarına örneklem birimlerinin seçiminde hangi olasılıklı örnekleme yöntemini benimseyeceğimize gelmektedir. Şekil 1’de görüleceği üzere burada araştırma tasarımına bağlı olarak basit tesadüfi tekrarsız örnekleme veya sistematik olasılıklı yöntemlerinden biri seçilebilir. Çalışmanın sonunda yararlanılan kaynaklar kısmında bu iki örnekleme yöntemleri üzerine R programla dili ve Microsoft Excel kullanarak uygulama olarak yaptığım örnek çalışmaların linklerine yer verilmiştir. Buradan bu iki olasılıklı örnekleme yöntemini uygulamalar üzerinden yakından inceleyebilirsiniz.

Şekil 1: Tabakalı Örnekleme Yöntemi

Örnek Uygulama

Tabakalı örneklemeden bahsettikten sonra şimdi uygulama aşamasına geçebiliriz. Uygulamada kullanılan popülasyon veri seti beden kitle endeksi (BKİ) değerlerini içeren ve 1000 (N) gözlemden oluşan sentetik veri setidir. Olasılıklı örneklem yöntemlerinden basit tekrarlı tesadüfi örnekleme yöntemiyle 7 ve 50 aralığında BKİ değerleri üretilmiştir. BKİ değerleri üretilirken Sağlık Bakanlığı resmi web sitesindeki BKİ alt ve üst referans değerlerinden yararlanılmıştır. Burada belirlenen BKİ alt ve üst limitleri şöyledir:

Parametre DeğeriKategori
18,5 kg/m2’nin altında isezayıf
18,5-24,9 kg/m2 arasında isenormal kilolu
25-29,9 kg/m2 arasında isefazla kilolu
30-34,9 kg/m2 arasında iseI.Derece obez
35-39,9 kg/m2 arasında iseII.Derece obez
40 kg/m2 üzerinde iseIII.Derece morbid obez
Kaynak: https://www.sbn.gov.tr/BKindeksi.aspx

Yukarıdaki tablodaki göstergelerden oluşturulan popülasyon (N) veri seti üzerinden tabakalı örnekleme yapılmıştır. Söz gelimi araştırma kapsamında bu tabakalarda yer alan bireylerle yüz yüze görüşme (face to face interview) yapılarak bu bireylerin beslenme ve sağlıklı yaşam alışkanlıkları araştırılsın. Çalışmanın sonunda tabakalı örnekleme çalışması simülasyonu paylaşılmıştır. Bu simülasyonda tabaka örneklem büyüklüğünün belirlenmesinden örneklem seçimine kadar pek çok konu bulunmaktadır. Zaten simülasyonu inceleyince konuyu çok yüksek ihtimalle ayrıntılı bir şekilde öğrenmiş olacaksınız. Tablo 1’de BKİ (Beden Kitle Endeksi) değerleri kategorize edilmiş ve tabaka olarak alınmıştır. Tabaka sayımız yani L=6, popülasyon büyüklüğü (N) ise 1000’dir.

Tablo 1: Tabakalar (L=6) ve Büyüklükleri

TabakaN
Zayıf257
Normal Kilolu161
Fazla Kilolu119
I.Derece Obez114
II.Derece Obez122
III.Derece Morbid Obez227
Toplam1000

Tabaka örneklemlerinin popülasyonu ve popülasyon tabakalarını daha iyi temsil etmesini istediğimiz için orantılı tahsis yöntem ile tabaka örneklem büyüklüklerini belirliyoruz. Ancak tabaka örneklem büyüklüğüne geçmeden önce popülasyon büyüklüğünün bilindiğinden hareketle popülasyondan çekilecek örneklem büyüklüğünü aşağıda yazılan eşitlikle hesaplayalım.

Aşağıdaki eşitlikte kullanılan parametreler içerisinde

N=Popülasyon büyüklüğünü

n=Örneklem büyüklüğünü

p= Olayın görülüş olasılığını

q= (1-p) = Olayın görülmeme olasılığını

t= t tablo değerini

d= Tolerans seviyesini

göstermektedir.

Örneklem büyüklüğünün hesaplanmasında bilinen parametreler aşağıdakiler olsun:

N=1000

p=0,05

q=0,05

t=1,96

d=0,05

Verilenlere göre popülasyondan çekilecek örneklem büyüklüğünü hesaplayalım.

Bu çalışmada söz gelimi popülasyondan çekeceğimiz örneklem büyüklüğü (n) yaklaşık 278’dir. Tabakaların örneklem büyüklüklerini hesaplamak için bu aşamada yapılacak ilk işlem tabaka ağırlığı (w)’nın hesaplanmasıdır. Tabaka ağırlığı, n/N eşitliği ile hesaplanmaktadır. Bu çalışmada belirlenen tabaka ağırlığı (w) = n/N=277,7/1000=0,2777‘dir.

Daha sonra bu ağırlık katsayısı ile tabaka büyüklüğü (Ni) çarpılarak tabaka örneklem büyüklükleri belirlenmektedir. Bu durumda tabakalara göre hesaplanan örneklem büyüklükleri Tablo 2’de verilmiştir. Burada somutlaştırmak adına Zayıf tabakasının örneklem büyüklüğünü hesaplayalım.

  • Zayıf tabakası (n1) için örneklem büyüklüğü n1=(257x 0,2777=71‘dir. Bu işlem diğer tabakalara da uygulanırsa Tablo 1’de en sağ sütundaki sonuçlar elde edilmiş olur.
  • Tabaka örneklem büyüklükleri belirlendikten sonra sıra tabaka örneklem (n) büyüklüklerine göre tabakalardan örneklem birimlerini seçmeye gelmiştir. Bu aşamada olasılıklı örnekleme yöntemlerinden biri olan basit tesadüfi tekrarsız örnekleme (SRSWOR) veya sistematik örnekleme yöntemini kullanabilirsiniz. Bu çalışmada kullanılan olasılıklı örnekleme yöntemi SRSWOR’dur. Bu örnekleme yönteminde tabakalardaki popülasyon birimlerinin her birine tabaka örneklemlerine eşit seçilme şansı veriyoruz.

Tablo 2: Tabakalar (L=6) ve Tabaka Örneklem (n) Büyüklükleri

TabakaNÖrneklem (n) Büyüklüğü
Zayıf25771,0
Normal Kilolu16145
Fazla Kilolu11933
I.Derece Obez11432
II.Derece Obez12234
III.Derece Morbid Obez22763
Toplam1000278

Bahsedilenler Şekil 2 üzerinde de özetlenmiştir.

Şekil 2: Tabakalı Örnekleme Uygulaması

Örnek uygulamadaki yapılanları ve tabaka örneklem birimlerinin seçimini göstermesi adına örneklem büyüklüğü (n) 278’de sabitlenmiş olup, aşağıda Microsoft Excel uzantılı (xlsx) olarak paylaşılmıştır. Buradan bu dokümanı indirebilirsiniz.

Örnek uygulama üzerinden hazırladığım simülasyon çalışması da aşağıda Microsoft Excel uzantılı (xlsx) olarak paylaşılmıştır. Burada örneklem büyüklüğü (n) tesadüfi bir şekilde belirlenmekte olup, çalışmalarınıza da uyarlayabilirsiniz. Bu simülasyonda örneklem büyüklüğünü sizin belirlemenize gerek bulunmamaktadır. =RASTGELEARADA(300;750) fonksiyonu ile 300 ile 750 arasında tesadüfi bir şekilde örneklem büyüklüğü belirlenmektedir. Aynı zamanda çalışma içerisinde F9 tuşuna basılı tutarak simulasyondan basit tekrarsız tesadüfi örnekleme yöntemiyle yeni örneklem birimleri seçebilirsiniz. Özellikle bu simülasyon çalışmasının sahada ve akademide faaliyet gösteren çalışanlara çok faydalı olacağı düşünülmektedir. Bu çalışmanın içerisinde olasılıklı örneklem seçiminden örneklem büyüklüğünün belirlenmesi kadar pek çok konu mevcuttur.

Buradan simülasyon çalışmasını indirebilirsiniz.

Simülasyon çalışmasında bazı sayfalardaki formüller şifre ile korunmuştur. Değişiklik yapılması istenmesi durumundan sayfa korumasının kaldırılması için şifre olarak “tevfik” girilmesi yeterlidir. Özellikle bu simülasyon çalışmasının sahada ve akademide faaliyet gösteren çalışanlara çok faydalı olacağı düşünülmektedir. Bu çalışmanın içerisinde olasılıklı örneklem seçiminden örneklem büyüklüğünün belirlenmesine kadar pek çok konu mevcuttur. Bu simülasyonda örneklem büyüklüğünü tesadüfi bir şekilde belirlendiğinden sizin belirlemenize gerek bulunmamaktadır.

Faydalı olması ve farkındalık oluşturması dileğiyle.

Bilimle ve teknolojiyle kalınız.

Saygılarımla…

Not: Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.

Note: It can not be cited or copied without referencing.

Yararlanılan Kaynaklar