Word Dokümanlarından Metin Çıkarma: Extracting Text from Word Documents

Intro

Within the scope of this study, it is aimed to ensure that text data is read in R environment without corruption, to be cleaned after reading, and to create word clouds based on frequencies by using the R programming language. For this purpose, mainly readtext, textread and textclean libraries are used.

Giriş

R ortamında veya başka ortamlarda metin verisine hızlı bir şekilde ulaşıp, doğal dil işleme araçlarıyla analize uygun hale getirmek gereklidir. Tabiri caizse veri madenciliği alt alanlarından biri olan metin madenciliği (text mining) işlemlerinin yapılması gereklidir. Esasen veri madenciliğinin temel amacı da verinin analize uygun hale getirilmesidir.Burada da bunu yapıyoruz. İyi bir veri madenciliği iyi bir analiz için birincil basamaktır.

Günlük hayatta karşılaştığımız doküman uzantı türleri oldukça fazladır. Ancak uygulamada çoğunlukla karşılaştığımız doküman uzantıları doc, docx, txt, pdf, ppt, html, rtf, csv şeklindedir. Tabi bu listenin genişletilmesi mümkündür.

Bu çalışma kapsamında R programlama dili kullanılarak metin verisi bozulmadan R ortamında okunmasının sağlanması, okunduktan sonra temizlenmesi ve frekanslara dayalı kelime bulutlarının oluşturulması amaçlanmıştır. Bu amaçla ağırlıklı olarak readtext, textread ve textclean kütüphaneleri kullanılmıştır.

Yüklenen kütüphaneler

kütüphane<-c("dplyr","tibble","tidyr","ggplot2","readxl","pander", "writexl","RColorBrewer","readr","citation","report", "purrr", "textreadr", "readtext", "tidytext", "stringr", "tokenizers", "wordcloud2", "textclean")
yükle<-sapply(kütüphane, require, character.only = TRUE, warn.conflicts = FALSE)
 
#Kütüphane yüklenme durumunu gösteren tablo
 
tibble(Sıra=1:length(kütüphane), Kütüphane=names(yükle), Durumu=as.logical(yükle)) %>%
mutate(Durumu=if_else(Durumu==TRUE, "Yüklendi", "Paket Kurulumu Gerekli")) %>%
pander()
SıraKütüphaneDurumu
1dplyrYüklendi
2tibbleYüklendi
3tidyrYüklendi
4ggplot2Yüklendi
5readxlYüklendi
6panderYüklendi
7writexlYüklendi
8RColorBrewerYüklendi
9readrYüklendi
10citationYüklendi
11reportYüklendi
12purrrYüklendi
13textreadrYüklendi
14readtextYüklendi
15tidytextYüklendi
16stringrYüklendi
17tokenizersYüklendi
18wordcloud2Yüklendi
19textcleanYüklendi

Türkçe Metinler

Bildiğiniz üzere Türkçe metinler doğrudan okunmaya çalışıldığında dilimize özgü harf karakterlerinde bozulmalar meydana gelmektedir. Bu nedenle aşağıdaki kod ile Türkçe dili tanımlanmıştır.

Sys.setlocale(category = "LC_ALL",locale = "Turkish")
[Sonuç] "LC_COLLATE=Turkish_Turkey.1254;LC_CTYPE=Turkish_Turkey.1254;LC_MONETARY=Turkish_Turkey.1254;LC_NUMERIC=C;LC_TIME=Turkish_Turkey.1254"

Docx Uzantılı Dokümanları Okuma I

Aşağıda anayasa metninin %20’si tekrarsız örneklem ile seçilmiştir.

Anayasa metnini aşağıdaki linkten indirebilirsiniz.

metin=read_document("anayasa.docx")

metin %>% sample(size = length(metin)*0.2) %>% cat() 

[Sonuç] 5735 Türkiye Büyük Millet Meclisi Başkanlık Divanı için, bir yasama döneminde iki seçim yapılır. (Değişik ikinci cümle: 7/5/2010-5982/10 md. ) İlk seçilenlerin görev süresi iki yıldır, ikinci devre için seçilenlerin görev süresi ise o yasama döneminin sonuna kadar devam eder. Türkiye Büyük Millet Meclisi üyelerine ödenecek ödenek ve yolluklar, kendilerine  T.C. Emekli Sandığı tarafından bağlanan emekli aylığı ve benzeri ödemelerin kesilmesini gerektirmez. D) Askerî Yargıtay ve Askerî Yüksek İdare Mahkemesinden Anayasa Mahkemesi üyeliğine seçilmiş bulunan kişilerin herhangi bir sebeple görevleri sona erene kadar üyelikleri devam eder. Madde 40 – Anayasa ile tanınmış hak ve hürriyetleri ihlal edilen herkes, yetkili makama geciktirilmeden başvurma imkanının sağlanmasını isteme hakkına sahiptir. Kanun, Cumhurbaşkanlığı kararnamesi veya Türkiye Büyük Millet Meclisi İçtüzüğü ya da bunların hükümleri, iptal kararlarının Resmî Gazetede yayımlandığı tarihte yürürlükten kalkar. Gereken hallerde Anayasa Mahkemesi iptal hükmünün yürürlüğe gireceği tarihi ayrıca kararlaştırabilir. Bu tarih, kararın Resmî Gazetede yayımlandığı günden başlayarak bir yılı geçemez. 2. Yönetmelikler (Mülga son fıkra : 23/7/1995-4121/15 md. ) Geçici Madde 10 – Mahalli İdare seçimleri en geç Türkiye Büyük Millet Meclisinin ilk toplantısını izleyen bir yıl içinde yapılır. Madde 136 – Genel idare içinde yer alan Diyanet İşleri Başkanlığı, laiklik ilkesi doğrultusunda, bütün siyasi görüş ve düşünüşlerin dışında kalarak ve milletçe dayanışma ve bütünleşmeyi amaç edinerek, özel kanununda gösterilen görevleri yerine getirir. Devlet, maddi imkanlardan yoksun başarılı öğrencilerin, öğrenimlerini sürdürebilmeleri amacı ile burslar ve başka yollarla gerekli yardımları yapar. Devlet, durumları sebebiyle özel eğitime ihtiyacı olanları topluma yararlı kılacak tedbirleri alır. III. Türkiye Büyük Millet Meclisinin faaliyetleri ile ilgili hükümler En az ilkokul mezunu olmayanlar, kısıtlılar, askerlikle ilişiği olanlar, kamu hizmetinden yasaklılar, taksirli suçlar hariç toplam bir yıl veya daha fazla hapis ile ağır hapis cezasına hüküm giymiş olanlar; zimmet, ihtilas, irtikap, rüşvet, hırsızlık, dolandırıcılık, sahtecilik, inancı kötüye kullanma, dolanlı iflas gibi yüz kızartıcı suçlarla, kaçakçılık, Resmî ihale ve alım satımlara fesat karıştırma, Devlet sırlarını açığa vurma, terör eylemlerine katılma ve bu gibi eylemleri tahrik ve teşvik suçlarından biriyle hüküm giymiş olanlar, affa uğramış olsalar bile milletvekili seçilemezler. Danıştay üyelerinin dörtte üçü, birinci sınıf idari yargı hakim ve savcıları ile bu meslekten sayılanlar arasından Hakimler ve Savcılar (…) Kurulu; dörtte biri, nitelikleri kanunda belirtilen görevliler arasından Cum hurbaşkanı; tarafından seçilir. Madde 57  – Devlet, şehirlerin özelliklerini ve çevre şartlarını gözeten bir planlama çerçevesinde, konut ihtiyacını karşılayacak tedbirleri alır, ayrıca toplu konut teşebbüslerini destekler. 4 üncü maddesi, Bir siyasi partinin temelli kapatılmasına beyan veya faaliyetleriyle sebep olan kurucuları dahil üyeleri, Anayasa Mahkemesinin temelli kapatmaya ilişkin kesin kararının Resmî Gazetede gerekçeli olarak yayımlanmasından başlayarak beş yıl süreyle bir başka partinin kurucusu, üyesi, yöneticisi ve deneticisi olamazlar. (Ek fıkra: 21/6/2005-5370/1 md. ) Radyo ve televizyon faaliyetlerini düzenlemek ve denetlemek amacıyla kurulan Radyo ve Televizyon Üst Kurulu dokuz üyeden oluşur. Üyeler, siyasi parti gruplarının üye sayısı oranında belirlenecek üye sayısının ikişer katı olarak gösterecekleri adaylar arasından, her siyasi parti grubuna düşen üye sayısı esas alınmak suretiyle Türkiye Büyük Millet Meclisi Genel Kurulunca seçilir. Radyo ve Televizyon Üst Kurulunun kuruluşu, görev ve yetkileri, üyelerinin nitelikleri, seçim usulleri ve görev süreleri kanunla düzenlenir. BAŞLANGIÇ hükmü, 33, 52, 53, 67, 68, 69, 84,85, 93, 127, 135,149, 171, İşlenemeyen Hüküm Birinci fıkranın (b) ve (c) bentleri uyarınca seçilen üyelerden, üçüncü fıkra uyarınca göreve başlayanların görev süresi, birinci fıkranın (a), (ç), (d) ve (e) bentleri uyarınca seçilen diğer Kurul üyelerinin görev süresinin bittiği tarihte sona erer. II. Piyasaların denetimi ve dış ticaretin düzenlenmesi Madde 127 – Mahalli idareler; il, belediye veya köy halkının mahalli müşterek ihtiyaçlarını karşılamak üzere kuruluş esasları kanunla belirtilen ve karar organları, gene kanunda gösterilen, seçmenler tarafından seçilerek oluşturulan kamu tüzelkişileridir. A. Kıyılardan yararlanma b) Cumhurbaşkanının istemi ve tespit edeceği süre içinde: I. İnkılap kanunlarının korunması (Değişik: 3/10/2001-4709/4 md. ) Bu esaslar dışında bir işleme tâbi tutulan kişilerin uğradıkları zarar, tazminat hukukunun genel prensiplerine göre, Devletçe ödenir. (Ek fıkra: 3/10/2001-4709/16 md. ) Devlet, işlemlerinde, ilgili kişilerin hangi kanun yolları ve mercilere başvuracağını ve sürelerini belirtmek zorundadır. b) 12 Aralık 1980 gün ve 2356 sayılı Milli Güvenlik Konseyi Hakkında Kanun, III. Hakimler ve Savcılar (…) Kurulu a) İKİNCİ KISIM II. Bölümdeki; kişi hürriyeti ve güvenliği, basın ve yayımla ilgili hükümler, toplantı hak ve hürriyetleri, K.: 2010/87 sayılı Kararı Kesinhesap kanunu teklifi, yeni yıl bütçe kanunu teklifiyle birlikte görüşülür ve karara bağlanır. Madde 115 – (Mülga: 21/1/2017-6771/16 md. ) Madde 60 – Herkes, sosyal güvenlik hakkına sahiptir. Kalkınma planlarının hazırlanmasına, Türkiye Büyük Millet Meclisince onaylanmasına, uygulanmasına, değiştirilmesine ve bütünlüğünü bozacak değişikliklerin önlenmesine ilişkin usul ve esaslar kanunla düzenlenir. Devlet, ailenin huzur ve refahı ile özellikle ananın ve çocukların korunması ve aile planlamasının öğretimi ile uygulanmasını sağlamak için gerekli tedbirleri alır, teşkilatı kurar. Madde 38 – Kimse, işlendiği zaman yürürlükte bulunan kanunun suç saymadığı bir fiilden dolayı cezalandırılamaz; kimseye suçu işlediği zaman kanunda o suç için konulmuş olan cezadan daha ağır bir ceza verilemez. 4. Yasama dokunulmazlığı Madde 64 – Devlet, sanat faaliyetlerini ve sanatçıyı korur. Sanat eserlerinin ve sanatçının korunması, değerlendirilmesi, desteklenmesi ve sanat sevgisinin yayılması için gereken tedbirleri alır. 5551 3. Görev ve yetkileri a) Anayasa hükümlerine aykırı olmamak kaydıyla, yürürlükteki kanun hükümlerine göre Kurul şeklinde çalışır. A.  Gençliğin korunması Madde 74 – Vatandaşlar ve karşılıklılık esası gözetilmek kaydıyla Türkiye’de ikamet eden yabancılar kendileriyle veya kamu ile ilgili dilek ve şikayetleri hakkında, yetkili makamlara ve Türkiye Büyük Millet Meclisine yazı ile başvurma hakkına sahiptir. 75, 77, 101 (Mevcut 101 inci maddenin son fıkrasında yer alan “Cumhurbaşkanı seçilenin, varsa partisi ile ilişiği kesilir” ibaresinin ilgası haricinde), 102 Ara verme veya tatil sırasında toplanan Türkiye Büyük Millet Meclisinde, öncelikle bu toplantıyı gerektiren konu görüşülmeden ara verme veya tatile devam edilemez. J. Kanunsuz emir Ekonomik, ticari veya teknik ilişkileri düzenleyen ve süresi bir yılı aşmayan andlaşmalar , Devlet Maliyesi bakımından bir yüklenme getirmemek, kişi hallerine ve Türklerin yabancı memleketlerdeki mülkiyet haklarına dokunmamak şartıyla, yayımlanma ile yürürlüğe konabilir. Bu takdirde bu andlaşmalar , yayımlarından başlayarak iki ay içinde Türkiye Büyük Millet Meclisinin bilgisine sunulur. Yargıtay Birinci Başkanı, birinci başkanvekilleri ve daire başkanları kendi üyeleri arasından Yargıtay Genel Kurulunca üye tamsayısının salt çoğunluğu ve gizli oyla dört yıl için seçilirler; süresi bitenler yeniden seçilebilirler. Madde 75 – (Değişik: 23/7/1995-4121/8 md. ) XII. Sanatın ve sanatçının korunması Madde 66 – Türk Devletine vatandaşlık bağı ile bağlı olan herkes Türktür . 1. Başkomutanlık ve Genelkurmay Başkanlığı Madde 4 – Anayasanın 1 inci maddesindeki Devletin şeklinin Cumhuriyet olduğu hakkındaki hüküm ile, 2 nci maddesindeki Cumhuriyetin nitelikleri ve 3 üncü maddesi hükümleri değiştirilemez ve değiştirilmesi teklif edilemez. 9, 76, 78, 101 inci maddenin son fıkrasında yer alan “Cumhurbaşkanı seçilenin, varsa partisi ile ilişiği kesilir” ibaresinin ilgası bakımından, 114 üncü maddenin birinci, dördüncü, beşinci, altıncı ve yedinci fıkralarının ilgası bakımından, 127 nci maddenin üçüncü fıkrası, 142, 145, 146, 148 inci maddenin altıncı fıkrasındaki “, Askerî Yargıtay, Askerî Yüksek İdare Mahkemesi” ve “Yüksek” ibarelerinin yürürlükten kaldırılmasına dair değişiklik ile yedinci fıkrasındaki değişiklik, 149, 154, 155 inci maddenin üçüncü fıkrası, 156, 157, 158, 159, Geçici 21 inci maddenin (F) ve (G) fıkraları haricindeki hükümleri Konusu suç teşkil eden emir, hiçbir suretle yerine getirilmez; yerine getiren kimse sorumluluktan kurtulamaz . Merkezî yönetim kesinhesap kanunu teklifi, ilgili olduğu malî yılın sonundan başlayarak en geç altı ay sonra Cumhurbaşkanı tarafından Türkiye Büyük Millet Meclisine sunulur. Sayıştay genel uygunluk bildirimini, ilişkin olduğu kesinhesap kanun teklifinin verilmesinden başlayarak en geç yetmişbeş gün içinde Meclise sunar. Madde 13 –  (Değişik: 3/10/2001-4709/2 md. ) Yasama ve yürütme organları ile idare, mahkeme kararlarına uymak zorundadır; bu organlar ve idare, mahkeme kararlarını hiçbir suretle değiştiremez ve bunların yerine getirilmesini geciktiremez. Herkes, önceden izin almaksızın dernek kurma ve bunlara üye olma ya da üyelikten çıkma hürriyetine sahiptir. c) ÜÇÜNCÜ KISIM'daki ; yasama ile ilgili hükümler; Ekonomik Hükümler 18/10/1982 TARİHLİ VE 2709 SAYILI KANUNA İŞLENEMEYEN HÜKÜMLER Meclisteki açık görüşmelerin, o oturumdaki Başkanlık Divanının teklifi üzerine Meclisce başkaca bir karar alınmadıkça, her türlü vasıta ile yayımı serbesttir. Devletçe kamu tüzelkişiliği olarak kurulan tek radyo ve televizyon kurumu ile kamu tüzelkişilerinden yardım gören haber ajanslarının özerkliği ve yayınlarının tarafsızlığı esastır. Siyasi partilerin tüzük ve programları ile eylemleri, Devletin bağımsızlığına, ülkesi ve milletiyle bölünmez bütünlüğüne, insan haklarına, eşitlik ve hukuk devleti ilkelerine, millet egemenliğine, demokratik ve laik Cumhuriyet ilkelerine aykırı olamaz; sınıf veya zümre diktatörlüğünü veya herhangi bir tür diktatörlüğü savunmayı ve yerleştirmeyi amaçlayamaz; suç işlenmesini teşvik edemez. İlgili kanunlarda gerekli düzenlemeler yapılıncaya kadar, Hâkimler ve Savcılar Yüksek Kuruluna seçilen asıl üyeler, Yargıtay daire başkanı için ilgili mevzuatında öngörülen tüm malî ve sosyal haklar ile emeklilik hakkından aynen yararlanırlar. Ayrıca, Kurulun Başkanı dışındaki asıl üyelerine, (30000) gösterge rakamının memur aylıklarına uygulanan katsayı ile çarpımı sonucu bulunacak miktarda aylık ek tazminat ödenir. Madde 152 – Bir davaya bakmakta olan mahkeme, uygulanacak bir kanun veya Cumhurbaşkanlığı kararnamesinin hükümlerini Anayasaya aykırı görürse veya taraflardan birinin ileri sürdüğü aykırılık iddiasının ciddi olduğu kanısına varırsa, Anayasa Mahkemesinin bu konuda vereceği karara kadar davayı geri bırakır. Bu haklar, ancak kamu yararı amacıyla, kanunla sınırlanabilir. Grev ve lokavtın yasaklanabileceği veya ertelenebileceği haller ve işyerleri kanunla düzenlenir. 17/10/2001 Madde 18 – Hiç kimse zorla çalıştırılamaz. Angarya yasaktır. Cumhurbaşkanı seçilen milletvekilinin Türkiye Büyük Millet Meclisi üyeliği sona erer. Kamu idarelerinin ve kamu iktisadî teşebbüsleri dışındaki kamu tüzel kişilerinin harcamaları yıllık bütçelerle yapılır. B. Göreve başlama ve güvenoyu Cumhurbaşkanı, ilk genel seçimler sonucu Türkiye Büyük Millet Meclisi toplanıp; Başkanlık Divanı oluşuncaya kadar, 12 Aralık 1980 gün ve 2356 sayılı Kanunla teşekkül etmiş olan Milli Güvenlik Konseyinin Başkanlığını da yürütür. Hakimler ve savcılar altmışbeş yaşını bitirinceye kadar hizmet görürler; askeri hakimlerin yaş haddi, yükselme ve emeklilikleri kanunda gösterilir. 3– 3/10/2001 tarih li ve 4709 sayılı Kanunun hükümleridir. I. Anayasanın değiştirilmesi, seçimlere ve halkoylamasına katılma: D. Sendikal faaliyet Cumhurbaşkanı, ayrıca Anayasada ve kanunlarda verilen seçme ve atama görevleri ile diğer görevleri yerine getirir ve yetkileri kullanır. IX. Bilim ve sanat hürriyeti (Ek fıkra: 3/10/2001-4709/15 md; Mülga fıkra: 7/5/2004-5170/5 md. ) E. Bakanlıkların kurulması ve bakanlar B. Sıkıyönetim, seferberlik ve savaş hali Başkenti Ankara'dır. B. Başkanlık Divanı Kararnameler ve yönetmelikler, yayımdan sonraki bir tarih belirlenmemişse, Resmî Gazetede yayımlandıkları gün yürürlüğe girer. Seçimlerinin birlikte yenilenmesine karar verilen Meclisin ve Cumhurbaşkanının yetki ve görevleri, yeni Meclisin ve Cumhurbaşkanının göreve başlamasına kadar devam eder. Yüksek öğretim öğrencilerinin siyasi partilere üye olabilmelerine ilişkin esaslar kanunla düzenlenir Madde 11 – Anayasa hükümleri, yasama, yürütme ve yargı organlarını, idare makamlarını ve diğer kuruluş ve kişileri bağlayan temel hukuk kurallarıdır. C. Görev sırasında güvenoyu Üniversitelerin hazırladığı bütçeler; Yükseköğretim Kurulunca tetkik ve onaylandıktan sonra Milli Eğitim Bakanlığına sunulur ve merkezi yönetim bütçesinin bağlı olduğu esaslara uygun olarak işleme tabi tutularak yürürlüğe konulur ve denetlenir. ç) Türkiye Adalet Akademisi Genel Kurulu, kendi üyeleri arasından, Hâkimler ve Savcılar Yüksek Kuruluna bir asıl ve bir yedek üye seçer. Bu Kanunun yürürlüğe girdiği tarihten itibaren yedi gün içinde Türkiye Adalet Akademisi Başkanı adaylık başvurusunu ilan eder. İlan tarihinden itibaren yedi gün içinde adaylar Başkanlığa başvurur. Başvuru tarihinin sona erdiği günden itibaren onbeş gün içinde Türkiye Adalet Akademisi Genel Kurulu seçim yapar. Her üyenin (…) oy kullanabileceği seçimde, en fazla oy alan adaylar sırasıyla asıl ve yedek üye seçilmiş olur. VII. Ücrette adalet sağlanması 9/11/2005 Orman olarak muhafazasında bilim ve fen bakımından hiçbir yarar görülmeyen, aksine tarım alanlarına dönüştürülmesinde kesin yarar olduğu tespit edilen yerler ile 31/12/1981 tarihinden önce bilim ve fen bakımından orman niteliğini tam olarak kaybetmiş olan tarla, bağ, meyvelik, zeytinlik gibi çeşitli tarım alanlarında veya hayvancılıkta kullanılmasında yarar olduğu tespit edilen araziler, şehir, kasaba ve köy yapılarının toplu olarak bulunduğu yerler dışında, orman sın ırlarında daraltma yapılamaz. FİKİR, İNANÇ VE KARARIYLA anlaşılmak, sözüne ve ruhuna bu yönde saygı ve mutlak sadakatle yorumlanıp uygulanmak üzere. Milletlerarası andlaşmaları onaylar ve yayımlar. Vergi, resim, harç ve benzeri mali yükümlülükler kanunla konulur, değiştirilir veya kaldırılır. 6, 7 ve 14 üncü maddeleri birlikte, Genel Kurulda kamu idare bütçeleri ile değişiklik önergeleri, üzerinde ayrıca görüşme yapılmaksızın okunur ve oylanır. "Devletin varlığı ve bağımsızlığını vatanın ve milletin bölünmez bütünlüğünü, milletin kayıtsız ve şartsız egemenliğini koruyacağıma; hukukun üstünlüğüne, demokratik ve laik Cumhuriyete ve Atatürk ilke ve inkılaplarına bağlı kalacağıma; toplumun huzur ve refahı, milli dayanışma ve adalet anlayışı içinde herkesin insan haklarından ve temel hürriyetlerden yararlanması ülküsünden ve Anayasaya sadakattan ayrılmayacağıma; büyük Türk milleti önünde namusum ve şerefim üzerine andiçerim ". F. Üyelikle ilgili hükümler Bayrağı, şekli kanununda belirtilen, beyaz ay yıldızlı al bayraktır. Madde 77 – (Değişik: 21/1/2017-6771/4 md. ) (Ek fıkra: 9/2/2008-5735/2 md. ; İptal: Anayasa Mahkemesinin 5/6/2008 tarihli ve E.: 2008/16, K.: 2008/116 sayılı Kararı ile. ) İkinci fıkrada öngörülen taksitlendirmelerde ve herhangi bir sebeple ödenmemiş kamulaştırma bedellerinde kamu alacakları için öngörülen en yüksek faiz uygulanır. Türk Silahlı Kuvvetlerinin kullanılmasına karar verir. 14 üncü madde hükümlerine aykırı olmamak şartıyla ibadet, dini ayin ve törenler serbesttir. (Değişik fıkra: 23/7/1995-4121/13 md. ) Bu meslek kuruluşları ve üst kuruluşları organlarının seçimlerinde siyasi partiler aday gösteremezler. Hakim ve savcıların nitelikleri, atanmaları, hakları ve ödevleri, aylık ve ödenekleri, meslekte ilerlemeleri, görevlerinin ve görev yerlerinin geçici veya sürekli olarak değiştirilmesi, haklarında disiplin kovuşturması açılması ve disiplin cezası verilmesi, görevleriyle ilgili veya görevleri sırasında işledikleri suçlarından dolayı soruşturma yapılması ve yargılanmalarına karar verilmesi, meslekten çıkarmayı gerektiren suçluluk veya yetersizlik halleri ve meslek içi eğitimleri ile diğer özlük işleri mahkemelerin bağımsızlığı ve hakimlik teminatı esaslarına göre kanunla düzenlenir. TÜRKİYE CUMHURİYETİ ANAYASASI Seçme ve seçilme hakkı ise yine bu hükümlere dayalı olarak hazırlanacak Seçim Kanununun; Madde 155 – Danıştay, idari mahkemelerce verilen ve kanunun başka bir idari yargı merciine bırakmadığı karar ve hükümlerin son inceleme merciidir. Kanunla gösterilen belli davalara da ilk ve son derece mahkemesi olarak bakar. Memurlar ve diğer kamu görevlileri ile kamu kurumu niteliğindeki meslek kuruluşları ve bunların üst kuruluşları mensuplarına savunma hakkı tanınmadıkça disiplin cezası verilemez. Seçimden önce veya sonra bir suç işlediği ileri sürülen bir milletvekili, Meclisin kararı olmadıkça tutulamaz, sorguya çekilemez, tutuklanamaz ve yargılanamaz. Ağır cezayı gerektiren suçüstü hali ve seçimden önce soruşturmasına başlanılmış olmak kaydıyla Anayasanın 14 üncü maddesindeki durumlar bu hükmün dışındadır. Ancak, bu halde yetkili makam durumu hemen ve doğrudan doğruya Türkiye Büyük Millet Meclisine bildirmek zorundadır. Bu hükümlere aykırı faaliyette bulunanlar hakkında uygulanacak müeyyideler, kanunla düzenlenir. A. Toplu iş sözleşmesi ve toplu sözleşme hakkı Sağlık hizmetlerinin yaygın bir şekilde yerine getirilmesi için kanunla genel sağlık sigortası kurulabilir. Devletleştirme gerçek karşılığı üzerinden yapılır. Gerçek karşılığın hesaplanma tarzı ve usulleri kanunla düzenlenir. b) 75, 77, 101 ve 102 nci maddelerinde yapılan değişiklikler, birlikte yapılacak ilk Türkiye Büyük Millet Meclisi ve Cumhurbaşkanlığı seçimlerine ilişkin takvimin başladığı tarihte, Kuvvetler ayrımının, Devlet organları arasında üstünlük sıralaması anlamına gelmeyip, belli Devlet yetki ve görevlerinin kullanılmasından ibaret ve bununla sınırlı medeni bir işbölümü ve işbirliği olduğu ve üstünlüğün ancak Anayasa ve kanunlarda bulunduğu; II. Yüksek mahkemeler Cumhurbaşkanının görevde bulunduğu sürede işlediği iddia edilen suçlar için görevi bittikten sonra da bu madde hükmü uygulanır. Geçici Madde 17 – (Ek: 10/5/2007-5659/1 md. ) E. Kanun hükmünde kararname çıkarma yetkisi verme A. Sosyal güvenlik hakkı Kişinin Hakları ve Ödevleri 5982 A. İdarenin esasları Madde 35 – Herkes, mülkiyet ve miras haklarına sahiptir. Yakalanan veya tutuklanan kişilere, yakalama veya tutuklama sebepleri ve haklarındaki iddialar herhalde yazılı ve bunun hemen mümkün olmaması halinde sözlü olarak derhal, toplu suçlarda en geç hakim huzuruna çıkarılıncaya kadar bildirilir. Madde 129 – Memurlar ve diğer kamu görevlileri Anayasa ve kanunlara sadık kalarak faaliyette bulunmakla yükümlüdürler. Türkiye Büyük Millet Meclisi Başkanı, Başkanvekilleri, üyesi bulundukları siyasi partinin veya parti grubunun Meclis içinde veya dışındaki faaliyetlerine; görevlerinin gereği olan haller dışında, Meclis tartışmalarına katılamazlar; Başkan ve oturumu yöneten Başkanvekili oy kullanamazlar. Ülkenin iç ve dış siyaseti hakkında Meclise mesaj verir. (Ek fıkra: 7/5/2010-5982/4 md. ) Devlet, her türlü istismara ve şiddete karşı çocukları koruyucu tedbirleri alır. Hangi yönetmeliklerin Resmî Gazetede yayımlanacağı kanunda belirtilir. İdari işlemlere karşı açılacak davalarda süre, yazılı bildirim tarihinden başlar. IX. Yargı yetkisi Kamu tüzelkişiliği, kanunla veya Cumhurbaşkanlığı kararnamesiyle kurulur. (Ek fıkra: 7/5/2010-5982/23 md. ) Ekonomik ve sosyal politikaların oluşturulmasında Cumhurbaşkanına istişarî nitelikte görüş bildirmek amacıyla Ekonomik ve Sosyal Konsey kurulur. Ekonomik ve Sosyal Konseyin kuruluş ve işleyişi kanunla düzenlenir. Madde 27 – Herkes, bilim ve sanatı serbestçe öğrenme ve öğretme, açıklama, yayma ve bu alanlarda her türlü araştırma hakkına sahiptir. Siyasi partiler, demokratik siyasi hayatın vazgeçilmez unsurlarıdır. XI. Anayasanın bağlayıcılığı ve üstünlüğü Vatandaş sınır dışı edilemez ve yurda girme hakkından yoksun bırakılamaz. Madde 44 – Devlet, toprağın verimli olarak işletilmesini korumak ve geliştirmek, erozyonla kaybedilmesini önlemek ve topraksız olan veya yeter toprağı bulunmayan çiftçilikle uğraşan köylüye toprak sağlamak amacıyla gerekli tedbirleri alır. Kanun, bu amaçla, değişik tarım bölgeleri ve çeşitlerine göre toprağın genişliğini tesbit edebilir. Topraksız olan veya yeter toprağı bulunmayan çiftçiye toprak sağlanması, üretimin düşürülmesi, ormanların küçülmesi ve diğer toprak ve yeraltı servetlerinin azalması sonucunu doğuramaz. Sayıştayın kuruluşu, işleyişi, denetim usulleri, mensuplarının nitelikleri, atanmaları, ödev ve yetkileri, hakları ve yükümlülükleri ve diğer özlük işleri, Başkan ve üyelerinin teminatı kanunla düzenlenir. 3361 Madde 43 – Kıyılar, Devletin hüküm ve tasarrufu altındadır. Hakimler ve savcılar, kanunda belirtilenlerden başka, Resmî ve özel hiçbir görev alamazlar. Madde 146 – (Değişik: 7/5/2010-5982/16 md. ) Madde 165 – Sermayesinin yarısından fazlası doğrudan doğruya veya dolaylı olarak Devlete ait olan kamu kuruluş ve ortaklıklarının Türkiye Büyük Millet Meclisince denetlenmesi esasları kanunla düzenlenir. B. Esnaf ve sanatkarların korunması Eğitim ve öğretim hürriyeti, Anayasaya sadakat borcunu ortadan kaldırmaz. (Değişik birinci cümle: 7/5/2010-5982/11 md. ) Yargı yetkisi, idarî eylem ve işlemlerin hukuka uygunluğunun denetimi ile sınırlı olup, hiçbir surette yerindelik denetimi şeklinde kullanılamaz. Yürütme görevinin kanunlarda gösterilen şekil ve esaslara uygun olarak yerine getirilmesini kısıtlayacak, idari eylem ve işlem niteliğinde veya takdir yetkisini kaldıracak biçimde yargı kararı verilemez. Madde 35- Bu Kanun yayımı tarihinde yürürlüğe girer ve halkoylamasına sunulması halinde tümüyle oylanır. Madde 139 – Hakimler ve savcılar azlolunamaz, kendileri istemedikçe Anayasada gösterilen yaştan önce emekliye ayrılamaz; bir mahkemenin veya kadronun kaldırılması sebebiyle de olsa, aylık, ödenek ve diğer özlük haklarından yoksun kılınamaz. Madde 167 – Devlet, para, kredi, sermaye, mal ve hizmet piyasalarının sağlıklı ve düzenli işlemelerini sağlayıcı ve geliştirici tedbirleri alır; piyasalarda fiili veya anlaşma sonucu doğacak tekelleşme ve kartelleşmeyi önler. Çevreyi geliştirmek, çevre sağlığını korumak ve çevre kirlenmesini önlemek Devletin ve vatandaşların ödevidir. 6. 1 Teşrinisani 1928 tarihli ve 1353 sayılı Türk Harflerinin Kabul ve Tatbiki hakkında Kanun; Madde 76 – Onsekiz yaşını dolduran her Türk milletvekili seçilebilir. Madde 113 – (Mülga: 21/1/2017-6771/16 md. ) Bu Kanunun yürürlüğe girdiği tarihten itibaren otuz gün içinde aşağıda belirtilen esas ve usuller dahilinde Hâkimler ve Savcılar Yüksek Kurulu üyeleri seçilir: Cumhurbaşkanı bütçe kanun teklifini, malî yılbaşından en az yetmişbeş gün önce, Türkiye Büyük Millet Meclisine sunar. Bütçe teklifi Bütçe Komisyonunda görüşülür. Komisyonun ellibeş gün içinde kabul edeceği metin Genel Kurulda görüşülür ve malî yılbaşına kadar karara bağlanır. Madde 99 – (Mülga: 21/1/2017-6771/16 md. ) Yayımlandığı Resmî Gazete : Tarih  : 9/11/1982  Sayı   :  17863 (Mükerrer) XI. Toplantı hak ve hürriyetleri G. Cumhurbaşkanı Genel Sekreterliği Genel Hükümler Yüce Divanda seçilmeye engel bir suçtan mahkûm edilen Cumhurbaşkanının görevi sona erer. Mülkiyet hakkının kullanılması toplum yararına aykırı olamaz. İlgili kanunlarda düzenleme yapılıncaya kadar, Hâkimler ve Savcılar Yüksek Kurulu; Madde 51 – (Değişik: 3/10/2001-4709/20 md. ) D. Kamulaştırma B. Çalışma şartları ve dinlenme hakkı 143 Memurlar ve diğer kamu görevlileri hakkında işledikleri iddia edilen suçlardan ötürü ceza kovuşturması açılması, kanunla belirlenen istisnalar dışında, kanunun gösterdiği idari merciin iznine bağlıdır. Cumhurbaşkanı yardımcıları ile bakanları atar ve görevlerine son verir. ANAYASA MAHKEMESİ KARARLARININ 67, 75, 175, Geçici Madde 4 ve İşlenemeyen Hükümler Madde 24 – Herkes, vicdan, dini inanç ve kanaat hürriyetine sahiptir. B. Yargı yolu Madde 171 – Devlet, milli ekonominin yararlarını dikkate alarak, öncelikle üretimin artırılmasını ve tüketicinin korunmasını amaçlayan kooperatifçiliğin gelişmesini sağlayacak tedbirleri alır. Siyasi partiler önceden izin almadan kurulurlar ve Anayasa ve kanun hükümleri içerisinde faaliyetlerini sürdürürler. Devlet başarılı sporcuyu korur. 1 inci maddesi, Anayasa Mahkemesi, iki bölüm ve Genel Kurul halinde çalışır. Bölümler, başkanvekili başkanlığında dört üyenin katılımıyla toplanır. Genel Kurul, Mahkeme Başkanının veya Başkanın belirleyeceği başkanvekilinin başkanlığında en az on üye ile toplanır. Bölümler ve Genel Kurul, kararlarını salt çoğunlukla alır. Bireysel başvuruların kabul edilebilirlik incelemesi için komisyonlar oluşturulabilir. Ödenek ve yollukların en çok üç aylığı önceden ödenebilir. Türkiye Büyük Millet Meclisi tatilde ise derhal toplantıya çağırılır; Meclis gerekli gördüğü takdirde olağanüstü halin süresini kısaltabilir, uzatabilir veya olağanüstü hali kaldırabilir. İdari işlemin uygulanması halinde telafisi güç veya imkansız zararların doğması ve idari işlemin açıkça hukuka aykırı olması şartlarının birlikte gerçekleşmesi durumunda gerekçe gösterilerek yürütmenin durdurulmasına karar verilebilir. (Ek üçüncü fıkra: 29/10/2005-5428/2 md. ) Mahallî idarelerin hesap ve işlemlerinin denetimi ve kesin hükme bağlanması Sayıştay tarafından yapılır. BİRİNCİ BÖLÜM (Ek fıkra: 17/3/2011-6214/1 md. ) Spor federasyonlarının spor faaliyetlerinin yönetimine ve disiplinine ilişkin kararlarına karşı ancak zorunlu tahkim yoluna başvurulabilir. Tahkim kurulu kararları kesin olup bu kararlara karşı hiçbir yargı merciine başvurulamaz. Ücretli hafta ve bayram tatili ile ücretli yıllık izin hakları ve şartları kanunla düzenlenir. I. Temel hak ve hürriyetlerin niteliği IV. Sayıştay Madde 73 – Herkes, kamu giderlerini karşılamak üzere, mali gücüne göre, vergi ödemekle yükümlüdür. Türkiye Büyük Millet Meclisi adına Türk Silahlı Kuvvetlerinin Başkomutanlığını temsil eder. Genel görüşme, toplumu ve Devlet faaliyetlerini ilgilendiren belli bir konunun Türkiye Büyük Millet Meclisi Genel Kurulunda görüşülmesidir. 2. Andiçme Madde 173 – Devlet, esnaf ve sanatkarı koruyucu ve destekleyici tedbirleri alır. B. Konut hakkı B) Bu Kanunun 28 inci maddesi ile Anayasanın 87 nci maddesinde yapılan değişiklik, bu Kanunun yürürlük tarihinden önce, Anayasanın 14 üncü maddesindeki fiilleri işleyenler hakkında uygulanmaz. Meclis araştırması, genel görüşme ve yazılı soru önergelerinin verilme şekli, içeriği ve kapsamı ile araştırma usulleri Meclis İçtüzüğü ile düzenlenir. Yazılı soru, yazılı olarak en geç onbeş gün içinde cevaplanmak üzere milletvekillerinin, Cumhurbaşkanı yardımcıları ve bakanlara yazılı olarak soru sormalarından ibarettir. Madde 39 – Kamu görev ve hizmetinde bulunanlara karşı, bu görev ve hizmetin yerine getirilmesiyle ilgili olarak yapılan isnatlardan dolayı açılan hakaret davalarında, sanık, isnadın doğruluğunu ispat hakkına sahiptir. Bunun dışındaki hallerde ispat isteminin kabulü, ancak isnat olunan fiilin doğru olup olmadığının anlaşılmasında kamu yararı bulunmasına veya şikayetçinin ispata razı olmasına bağlıdır. Türkiye Büyük Millet Meclisi; Meclis araştırması, genel görüşme, Meclis soruşturması ve yazılı soru yollarıyla bilgi edinme ve denetleme yetkisini kullanır. Hakim ve savcı olup da adalet hizmetindeki idari görevlerde çalışanlar, hakimler ve savcılar hakkındaki hükümlere tabidirler. Bunlar, hakimler ve savcılara ait esaslar dairesinde sınıflandırılır ve derecelendirilirler, hakimlere ve savcılara tanınan her türlü haklardan yararlanırlar. Madde 81 – Türkiye Büyük Millet Meclisi üyeleri, göreve başlarken aşağıdaki şekilde andiçerler : Türkiye Büyük Millet Meclisi üyesi hakkında, seçiminden önce veya sonra verilmiş bir ceza hükmünün yerine getirilmesi, üyelik sıfatının sona ermesine bırakılır; üyelik süresince zamanaşımı işlemez. 133 D. Duruşmaların açık ve kararların gerekçeli olması Ceza sorumluluğu şahsidir. ( Mülga son fıkra: 7/5/2010-5982/9 md. ) Madde 154 – Yargıtay, adliye mahkemelerince verilen ve kanunun başka bir adli yargı merciine bırakmadığı karar ve hükümlerin son inceleme merciidir. Kanunla gösterilen belli davalara da ilk ve son derece mahkemesi olarak bakar. E. Devletleştirme ve Özelleştirme Geçici Madde 2 – 12 Aralık 1980 gün ve 2356 sayılı Kanunla kuruluşu gösterilen Milli Güvenlik Konseyi, Anayasaya dayalı olarak hazırlanacak Siyasi Partiler Kanunu ile Seçim Kanununa göre yapılacak ilk genel seçimler sonucu Türkiye Büyük Millet Meclisi toplanıp Başkanlık Divanını oluşturuncaya kadar 2324 sayılı Anayasa Düzeni Hakkında Kanun ve 2485 sayılı Kurucu Meclis Hakkında Kanunlara göre görevlerini devam ettirir. Kanuna uygun şekilde basın işletmesi olarak kurulan basımevi ve eklentileri ile basın araçları, suç aleti olduğu gerekçesiyle zapt ve müsadere edilemez veya işletilmekten alıkonulamaz. Görülmekte olan bir dava hakkında Yasama Meclisinde yargı yetkisinin kullanılması ile ilgili soru sorulamaz, görüşme yapılamaz veya herhangi bir beyanda bulunulamaz. 130, 160, 161, 162, 163, İşlenemeyen Hüküm Kimsenin konutuna dokunulamaz. Millî güvenlik, kamu düzeni, suç işlenmesinin önlenmesi, genel sağlık ve genel ahlâkın korunması veya başkalarının hak ve özgürlüklerinin korunması sebeplerinden biri veya birkaçına bağlı olarak usulüne göre verilmiş hâkim kararı olmadıkça; yine bu sebeplere bağlı olarak gecikmesinde sakınca bulunan hallerde de kanunla yetkili kılınmış merciin yazılı emri bulunmadıkça; kimsenin konutuna girilemez, arama yapılamaz ve buradaki eşyaya el konulamaz. Yetkili merciin kararı yirmidört saat içinde görevli hâkimin onayına sunulur. Hâkim, kararını el koymadan itibaren kırksekiz saat içinde açıklar; aksi halde, el koyma kendiliğinden kalkar. (Değişik fıkra: 21/1/2017-6771/14 md. ) Kurul üyeliği seçimi, üyelerin görev süresinin dolmasından önceki otuz gün içinde yapılır. Seçilen üyelerin görev süreleri dolmadan Kurul üyeliğinin boşalması durumunda, boşalmayı takip eden otuz gün içinde, yeni üyelerin seçimi yapılır.

Docx Uzantılı Dokümanları Okuma II

Aşağıda yapılan işlemde alternaitf olarak anayasa, cümlelere çevrilmiş ve oluşturulmuş ilk iki cümle verilmiştir.

metin=readtext("anayasa.docx")

tokenize_sentences(metin$text)[[1]][1:2]

## [1] "TÜRKİYE CUMHURİYETİ ANAYASASI   Kanun Numarası: 2709 Kabul Tarihi: 18/10/1982 Yayımlandığı Resmî Gazete: Tarih : 9/11/1982 Sayı  : 17863 (Mükerrer) Yayımlandığı Düstur: Tertip : 5  Cilt : 22 Sayfa : 3 BAŞLANGIÇ Türk Vatanı ve Milletinin ebedi varlığını ve Yüce Türk Devletinin bölünmez bütünlüğünü belirleyen bu Anayasa, Türkiye Cumhuriyetinin kurucusu, ölümsüz önder ve eşsiz kahraman Atatürk’ün belirlediği milliyetçilik anlayışı ve onun inkılap ve ilkeleri doğrultusunda; Dünya milletleri ailesinin eşit haklara sahip şerefli bir üyesi olarak, Türkiye Cumhuriyetinin ebedi varlığı, refahı, maddi ve manevi mutluluğu ile çağdaş medeniyet düzeyine ulaşma azmi yönünde; Millet iradesinin mutlak üstünlüğü, egemenliğin kayıtsız şartsız Türk Milletine ait olduğu ve bunu millet adına kullanmaya yetkili kılınan hiçbir kişi ve kuruluşun, bu Anayasada gösterilen hürriyetçi demokrasi ve bunun icaplarıyla belirlenmiş hukuk düzeni dışına çıkamayacağı; Kuvvetler ayrımının, Devlet organları arasında üstünlük sıralaması anlamına gelmeyip, belli Devlet yetki ve görevlerinin kullanılmasından ibaret ve bununla sınırlı medeni bir işbölümü ve işbirliği olduğu ve üstünlüğün ancak Anayasa ve kanunlarda bulunduğu; Hiçbir faaliyetin Türk milli menfaatlerinin, Türk varlığının, Devleti ve ülkesiyle bölünmezliği esasının, Türklüğün tarihi ve manevi değerlerinin, Atatürk milliyetçiliği, ilke ve inkılapları ve medeniyetçiliğinin karşısında korunma göremeyeceği ve laiklik ilkesinin gereği olarak kutsal din duygularının, Devlet işlerine ve politikaya kesinlikle karıştırılamayacağı; Her Türk vatandaşının bu Anayasadaki temel hak ve hürriyetlerden eşitlik ve sosyal adalet gereklerince yararlanarak milli kültür, medeniyet ve hukuk düzeni içinde onurlu bir hayat sürdürme ve maddi ve manevi varlığını bu yönde geliştirme hak ve yetkisine doğuştan sahip olduğu; Topluca Türk vatandaşlarının milli gurur ve iftiharlarda, milli sevinç ve kederlerde, milli varlığa karşı hak ve ödevlerde, nimet ve külfetlerde ve millet hayatının her türlü tecellisinde ortak olduğu, birbirinin hak ve hürriyetlerine kesin saygı, karşılıklı içten sevgi ve kardeşlik duygularıyla ve \"Yurtta sulh, cihanda sulh\" arzu ve inancı içinde, huzurlu bir hayat talebine hakları bulunduğu; FİKİR, İNANÇ VE KARARIYLA anlaşılmak, sözüne ve ruhuna bu yönde saygı ve mutlak sadakatle yorumlanıp uygulanmak üzere."
## [2] "TÜRK MİLLETİ TARAFINDAN, demokrasiye aşık Türk evlatlarının vatan ve millet sevgisine emanet ve tevdi olunur."

Anayasa Metninin Temizlenmesi

Bu kısımda anayasa metninin tamamı noktalama, sayısal karakterler, bağlaç,edatlar ve pekiştirmelerden temizlenmiştir. Büyük harfler ise küçük harflere dönüştürülmüştür. Türkçe bağlaç ve edatlar stopwords(“tr”, source = “stopwords-iso”) fonksiyonu ile tanımlanmıştır. Bu fonksiyon çalıştırıldığında 471 adet edat ve bağlacın olduğu görülecektir. length(stopwords::stopwords(“tr”, source = “stopwords-iso”)) fonksiyonu ile bu sayıya ulaşabilirsiniz.

Türkçe Dilinde Tanımlanan Bağlaç ve Edatlar

Bu kısımda Türkçe dilinde tanımlanan bağlaç ve edatların tamamı aşağıdaki verilmiştir. İstersek tanımlanan bu bağlaç ve edatların olduğu vektöre çıkarılmasını istediğimiz, diğer bir deyişle tek başına anlam ifade etmeyen ilave bağlaç ve edatları da dahil edebiliriz.

baglac_ve_edat=stopwords::stopwords("tr", source = "stopwords-iso")
baglac_ve_edat

##  [1] "acaba"     "acep"      "açıkça"     "açıkçası"   
##  [5] "adamakıllı"   "adeta"     "ait"      "altı"     
##  [9] "altmış"     "ama"      "amma"      "anca"     
## [13] "ancak"     "arada"     "artık"     "aslında"    
## [17] "aynen"     "ayrıca"     "az"       "bana"     
## [21] "bari"      "başka"     "başkası"    "bazen"     
## [25] "bazı"      "belki"     "ben"      "benden"    
## [29] "beni"      "benim"     "beri"      "beriki"    
## [33] "beş"      "bilcümle"    "bile"      "bin"      
## [37] "binaen"     "binaenaleyh"  "bir"      "biraz"     
## [41] "birazdan"    "birbiri"    "birçoğu"    "birçok"    
## [45] "birden"     "birdenbire"   "biri"      "birice"    
## [49] "birileri"    "birisi"     "birkaç"     "birkaçı"    
## [53] "birkez"     "birlikte"    "birşey"     "birşeyi"    
## [57] "bitevi"     "biteviye"    "bittabi"    "biz"      
## [61] "bizatihi"    "bizce"     "bizcileyin"   "bizden"    
## [65] "bize"      "bizi"      "bizim"     "bizimki"    
## [69] "bizzat"     "boşuna"     "böyle"     "böylece"    
## [73] "böylecene"   "böylelikle"   "böylemesine"  "böylesine"   
## [77] "bu"       "buna"      "bunda"     "bundan"    
## [81] "bunlar"     "bunları"    "bunların"    "bunu"     
## [85] "bunun"     "buracıkta"   "burada"     "buradan"    
## [89] "burası"     "büsbütün"    "bütün"     "çabuk"     
## [93] "çabukça"    "çeşitli"    "çoğu"      "çoğun"     
## [97] "çoğunca"    "çoğunlukla"   "çok"      "çokça"     
## [101] "çokları"    "çoklarınca"   "çokluk"     "çoklukla"   
## [105] "cuk"      "cümlesi"    "çünkü"     "da"      
## [109] "daha"      "dahi"      "dahil"     "dahilen"    
## [113] "daima"     "dair"      "dayanarak"   "de"      
## [117] "defa"      "değil"     "değin"     "dek"      
## [121] "demin"     "demincek"    "deminden"    "denli"     
## [125] "derakap"    "derhal"     "derken"     "diğer"     
## [129] "diğeri"     "diye"      "doğru"     "doksan"    
## [133] "dokuz"     "dolayı"     "dolayısıyla"  "dört"     
## [137] "edecek"     "eden"      "eder"      "ederek"    
## [141] "edilecek"    "ediliyor"    "edilmesi"    "ediyor"    
## [145] "eğer"      "elbet"     "elbette"    "elli"     
## [149] "emme"      "en"       "enikonu"    "epey"     
## [153] "epeyce"     "epeyi"     "esasen"     "esnasında"   
## [157] "etmesi"     "etraflı"    "etraflıca"   "etti"     
## [161] "ettiği"     "ettiğini"    "evleviyetle"  "evvel"     
## [165] "evvela"     "evvelce"    "evvelden"    "evvelemirde"  
## [169] "evveli"     "fakat"     "filanca"    "gah"      
## [173] "gayet"     "gayetle"    "gayri"     "gayrı"     
## [177] "geçende"    "geçenlerde"   "gelgelelim"   "gene"     
## [181] "gerçi"     "gerek"     "gibi"      "gibilerden"  
## [185] "gibisinden"   "gine"      "gırla"     "göre"     
## [189] "hakeza"     "halbuki"    "halen"     "halihazırda"  
## [193] "haliyle"    "handiyse"    "hangi"     "hangisi"    
## [197] "hani"      "hariç"     "hasebiyle"   "hasılı"    
## [201] "hatta"     "hele"      "hem"      "henüz"     
## [205] "hep"      "hepsi"     "her"      "herhangi"   
## [209] "herkes"     "herkesin"    "hiç"      "hiçbir"    
## [213] "hiçbiri"    "hoş"      "hulasaten"   "için"     
## [217] "iken"      "iki"      "ila"      "ile"      
## [221] "ilen"      "ilgili"     "ilk"      "illa"     
## [225] "illaki"     "imdi"      "indinde"    "inen"     
## [229] "insermi"    "iş"       "ise"      "işte"     
## [233] "ister"     "itibaren"    "itibariyle"   "itibarıyla"  
## [237] "iyi"      "iyice"     "iyicene"    "kaçı"     
## [241] "kadar"     "kaffesi"    "kah"      "kala"     
## [245] "kanımca"    "karşın"     "katrilyon"   "kaynak"    
## [249] "kelli"     "kendi"     "kendilerine"  "kendini"    
## [253] "kendisi"    "kendisine"   "kendisini"   "kere"     
## [257] "keşke"     "kez"      "keza"      "kezalik"    
## [261] "ki"       "kim"      "kimden"     "kime"     
## [265] "kimi"      "kimisi"     "kimse"     "kimsecik"   
## [269] "kimsecikler"  "kırk"      "kısaca"     "külliyen"   
## [273] "lakin"     "leh"      "lütfen"     "maada"     
## [277] "madem"     "mademki"    "mamafih"    "mebni"     
## [281] "meğer"     "meğerki"    "meğerse"    "milyar"    
## [285] "milyon"     "mı"       "mu"       "mü"      
## [289] "naşi"      "nasıl"     "nasılsa"    "nazaran"    
## [293] "ne"       "neden"     "nedeniyle"   "nedenle"    
## [297] "nedense"    "nerde"     "nerden"     "nerdeyse"   
## [301] "nere"      "nerede"     "nereden"    "neredeyse"   
## [305] "neresi"     "nereye"     "netekim"    "neye"     
## [309] "neyi"      "neyse"     "nice"      "niçin"     
## [313] "nihayet"    "nihayetinde"  "nitekim"    "niye"     
## [317] "o"       "öbür"      "öbürkü"     "öbürü"     
## [321] "olan"      "olarak"     "oldu"      "olduğu"    
## [325] "olduğunu"    "oldukça"    "olduklarını"  "olmadı"    
## [329] "olmadığı"    "olmak"     "olması"     "olmayan"    
## [333] "olmaz"     "olsa"      "olsun"     "olup"     
## [337] "olur"      "olursa"     "oluyor"     "on"      
## [341] "ona"      "onca"      "önce"      "önceden"    
## [345] "önceleri"    "öncelikle"   "onculayın"   "onda"     
## [349] "ondan"     "onlar"     "onlardan"    "onları"    
## [353] "onların"    "onu"      "onun"      "oracık"    
## [357] "oracıkta"    "orada"     "oradan"     "oranca"    
## [361] "oranla"     "oraya"     "öteki"     "ötekisi"    
## [365] "otuz"      "öyle"      "öylece"     "öylelikle"   
## [369] "öylemesine"   "oysa"      "oysaki"     "öz"      
## [373] "pek"      "pekala"     "pekçe"     "peki"     
## [377] "peyderpey"   "rağmen"     "sadece"     "sahi"     
## [381] "sahiden"    "sana"      "sanki"     "şayet"     
## [385] "sekiz"     "seksen"     "sen"      "senden"    
## [389] "seni"      "senin"     "şey"      "şeyden"    
## [393] "şeyi"      "şeyler"     "şimdi"     "siz"      
## [397] "sizden"     "sizi"      "sizin"     "sonra"     
## [401] "sonradan"    "sonraları"   "sonunda"    "şöyle"     
## [405] "şu"       "şuna"      "şuncacık"    "şunda"     
## [409] "şundan"     "şunlar"     "şunları"    "şunu"     
## [413] "şunun"     "şura"      "şuracık"    "şuracıkta"   
## [417] "şurası"     "tabii"     "tam"      "tamam"     
## [421] "tamamen"    "tamamıyla"   "tarafından"   "tek"      
## [425] "trilyon"    "tüm"      "üç"       "üzere"     
## [429] "var"      "vardı"     "vasıtasıyla"  "ve"      
## [433] "velev"     "velhasıl"    "velhasılıkelam" "veya"     
## [437] "veyahut"    "ya"       "yahut"     "yakinen"    
## [441] "yakında"    "yakından"    "yakınlarda"   "yalnız"    
## [445] "yalnızca"    "yani"      "yapacak"    "yapılan"    
## [449] "yapılması"   "yapıyor"    "yapmak"     "yaptı"     
## [453] "yaptığı"    "yaptığını"   "yaptıkları"   "yedi"     
## [457] "yeniden"    "yenilerde"   "yerine"     "yetmiş"    
## [461] "yine"      "yirmi"     "yok"      "yoksa"     
## [465] "yoluyla"    "yüz"      "yüzünden"    "zarfında"   
## [469] "zaten"     "zati"      "zira"

Türkçe Dilinde Tanımlanan Bağlaç ve Edatların Sayısı

Bağlaç ve edatlar vektör içerisinde tanımlandığından length() fonskiyonu ile vektörün uzunluğunu aşağıdaki gibi hesaplayabiliriz. Aşağıda görüleceği üzere sonuç 471’dir.

length(baglac_ve_edat)
## [1] 471

Türkçe Dilinde Tanımlanan Bağlaç ve Edatlara ilave

Bu kısımda 12 adet bağlaç, edat ve kelime baglac_ve_edat vektörüne dahil edilerek 483’e yükseltilmiştir.

ilave=c("öyleyse", "nitekim", "fazla","ileri", "içinde", "ilişkin", "geçici", "fıkra", "madde", "genel", "sayılı", "kanun")

baglac_ve_edat=c(baglac_ve_edat,ilave)

length(baglac_ve_edat)#vektördeki eleman sayısı

## [1] 483

Metnin Temizlenmesi ve Kelimelere Dönüştürülmesi

Anayasa metni temizlendikten sonra yeni durumda kelimelerin sayısı length(kelimedonusum$anayasa.docx) fonksiyonu ile 15996 bulunmuştur.

metin=readtext("anayasa.docx")
kelimedonusum=tokenize_words(x = metin,
                 lowercase = TRUE,
                 stopwords = baglac_ve_edat,
                 strip_punct = TRUE,
                 strip_numeric = TRUE)


length(kelimedonusum$anayasa.docx)

## [1] 15996

Kelimelerin Frekansı

Bu kısımda kelimelerin metinde tekrarlanma sıklığı verilmiş, ardından ise kelimedeki karakter sayısı 3’ten büyük olan kelimeler getirilmiştir.

frekans=kelimedonusum$anayasa.docx %>% 
        as_tibble()%>% 
        rename(kelime=value)%>%
        count(kelime) %>%
        arrange(desc(n))%>%
        filter(nchar(kelime)>3)
frekans

## # A tibble: 4,284 x 2
##  kelime      n
##  <chr>     <int>
## 1 türkiye     171
## 2 millet     152
## 3 büyük      151
## 4 kamu      112
## 5 kanunla     109
## 6 anayasa     101
## 7 meclisi     97
## 8 devlet      78
## 9 cumhurbaşkanı  76
## 10 düzenlenir    73
## # ... with 4,274 more rows

Kelime Bulutu I

wordcloud2(frekans)

Kelime Bulutu II

wordcloud2(frekans, color = "random-light", backgroundColor = "grey")

Kelime Öbekleri

kelime_obek=metin$text %>% 
      as_tibble() %>% 
      rename(metin=value)%>%
      mutate(metin = tolower(metin) %>% # küçük harfe dönüştürme
      replace_contraction() %>% 
      replace_white() %>% # boşlukların çıkarılma
      str_remove_all(pattern = "[0-9]") %>% # rakamları çıkarma
      str_remove_all(pattern = "[()]") %>% # spesifik karakterleri çıkarma
      str_remove_all(pattern = "-") %>%
      str_replace_all(pattern = "/", replacement = "") %>% #/ sembollerinin kaldırılması
      str_remove(pattern = "[.]") %>% # remove first matched pattern
      str_remove(pattern = " "))

#3'lü kelime öbeklerinin sayısı
kelime_obek_sayi=tokenize_ngrams(x = kelime_obek$metin, n=3, stopwords = baglac_ve_edat) %>% 
         unlist()%>% 
         as_tibble()%>% 
         rename("Kelime Öbeği"=value) %>%
         count("Kelime Öbeği") %>%
         arrange(desc(n))
kelime_obek_sayi

## # A tibble: 1 x 2
##  `"Kelime Öbeği"`   n
##  <chr>      <int>
## 1 Kelime Öbeği   16332

Kelime Öbeklerinin Kelime Bulutu

Bu kısımda ikili kelime öbeklerinin kelime bulutu oluşturulmuştur.

kelime_obek_frekans=tokenize_ngrams(x = kelime_obek$metin, n=2, stopwords = c(baglac_ve_edat,"inci","içinde","md", "ek fıkra", "tarihli sayılı", "mülga md","ek", "md devlet")) %>% 
         unlist()%>% 
         as_tibble()%>% 
         rename(Obek=value) %>%
         count(Obek) %>%
         arrange(desc(n))

wordcloud2(head(kelime_obek_frekans, 100),color = "random-light", backgroundColor = "black")

URL’den Site İçeriklerini Okuma

Burada örnek olması adına haber sitesi CNNTÜRK’ün içeriği okunmuştur. 02.10.2021 tarihine ait sonuçlar aşağıda verilmiştir.

metin=read_document('https://www.cnnturk.com/turkiye')

metin %>% sample(size = length(metin)*0.2) %>% cat() 

## Spor Haberleri Otomobil TOGG tv.cnnturk.com TOGG KANAL D turkiye D-SMART turkiye Dünya Dünyadan en son haberler, Türkiye'den son dakika gelişmeleri, günün öne çıkan gündem haberleri, dünya ekonomi piyasalarından flaş haberler, en yeni spor haberleri ve magazin dünyasından son olaylar CNN Türk'te. haber arama 1 Bu videoyu izleyemiyorsanız, reklam engelleme Evinin önünde ayı saldırdı Hava Durumu sitemap sms Canlı Yayın 3 Cumhurbaşkanı Erdoğan Varlık Fonu toplantısına katıldı MD Canlı Yayın Yargıtay, alkollü sürücüye verilen cezayı az buldu 32 dakika önce Dizi İzle tümü ABD Başkanlık Seçimleri Milli Piyango Sonuçları Renk Taksicilere denetim! Ceza yağdı Film İzle Haberler... Deprem mi oldu? Kandilli ve AFAD son dakika depremler listesi 2 Ekim 2021 Demirören Tv Holding A.Ş. - CNN ™ CNN Inc. A WarnerMedia Company. video Yayın Akışı Korona Günlükleri KATEGORİLER turkiye Zonguldak, en fazla vaka artışının yaşandığı il oldu son dakika İndirim Kuponları Spor XS Türkiye Turistlere fırçalı tuzak {$ item.diff $} Teknoloji Roma dönemine ait! İznik'te bulundu Programlar

URL’den Site İçeriklerinin Kelime Bulutu

metin=read_document('https://www.cnnturk.com/turkiye')

temizmetin= metin %>% 
      as_tibble() %>% 
      rename(metin=value)%>%
      mutate(metin = tolower(metin) %>% # küçük harfe dönüştürme
      replace_contraction() %>%
      replace_white() %>% # boşlukların çıkarılma
      str_remove_all(pattern = "[0-9]") %>% # rakamları çıkarma
      str_remove_all(pattern = "[{$()}]") %>% # spesifik karakterleri çıkarma
      str_remove_all(pattern = "-") %>%
      str_replace_all(pattern = "/", replacement = "") %>% #/ sembollerinin kaldırılması
      str_remove(pattern = "[.]") %>% # remove first matched pattern
      str_remove(pattern = " "))


kelimedonusum=tokenize_words(x = temizmetin$metin,
                 lowercase = TRUE,
                 stopwords = c(baglac_ve_edat,NA, "sondakika","diziizle","dakika", "tümünügör", "canliyayin", "canlıyayın", "filmizle","haberler", "dakika", "katıldı"),
                 strip_punct = TRUE,
                 strip_numeric = TRUE)
frekans=kelimedonusum %>% 
    unlist()%>% 
    as_tibble() %>% 
    rename(kelime=value)%>%
    count(kelime) %>%
    arrange(desc(n))%>%
    filter(nchar(kelime)>3)


#kelime bulutu

wordcloud2(head(frekans, 100),color = "random-light", backgroundColor = "green")

Sonuç

Özetle, çalışma kapsamında R programlama dili kullanılarak metin verisi bozulmadan R ortamında okunması, okunduktan sonra temizlenmesi ve frekanslara dayalı kelime bulutlarının oluşturulması sağlanmıştır.

Faydalı olması dileğiyle.

Bilimle ve teknolojiyle kalınız.

Not:

 •  Kaynak gösterilmeden alıntı yapılamaz veya kopyalanamaz.
 •  It can not be cited or copied without referencing.

Yararlanılan Kaynaklar

IDReferanslar
[1]Dawei Lang and Guan-tin Chien (2018). wordcloud2: Create Word Cloud by ‘htmlwidget’. R package version 0.2.1. https://CRAN.R-project.org/package=wordcloud2
[2]Dietrich J (2020). citation: Software Citation Tools. R packageversion 0.4.1.
[3]Erich Neuwirth (2014). RColorBrewer: ColorBrewer Palettes. R package version 1.1-2. https://CRAN.R-project.org/package=RColorBrewer
[4]Gergely Daróczi and Roman Tsegelskyi (2021). pander: An R ‘Pandoc’ Writer. R package version 0.6.4. https://CRAN.R-project.org/package=pander
[5]H. Wickham. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2016.
[6]Hadley Wickham (2019). stringr: Simple, Consistent Wrappers for Common String Operations. R package version 1.4.0. https://CRAN.R-project.org/package=stringr
[7]Hadley Wickham (2021). tidyr: Tidy Messy Data. R package version 1.1.3. https://CRAN.R-project.org/package=tidyr
[8]Hadley Wickham and Jennifer Bryan (2019). readxl: Read Excel Files. R package version 1.3.1. https://CRAN.R-project.org/package=readxl
[9]Hadley Wickham and Jim Hester (2021). readr: Read Rectangular Text Data. R package version 2.0.0. https://CRAN.R-project.org/package=readr
[10]Hadley Wickham, Romain François, Lionel Henry and Kirill Müller (2021). dplyr: A Grammar of Data Manipulation. R package version 1.0.7. https://CRAN.R-project.org/package=dplyr
[11]Jeroen Ooms (2021). writexl: Export Data Frames to Excel ‘xlsx’ Format. R package version 1.4.0. https://CRAN.R-project.org/package=writexl
[12]Kenneth Benoit and Adam Obeng (2021). readtext: Import and Handling for Plain and Formatted Text Files. R package version 0.81. https://CRAN.R-project.org/package=readtext
[13]Kirill Müller and Hadley Wickham (2021). tibble: Simple Data Frames. R package version 3.1.3. https://CRAN.R-project.org/package=tibble
[14]Lincoln A. Mullen et al., “Fast, Consistent Tokenization of Natural Language Text,” Journal of Open Source Software 3, no. 23 (2018): 655, https://doi.org/10.21105/joss.00655.
[15]Lionel Henry and Hadley Wickham (2020). purrr: Functional Programming Tools. R package version 0.3.4. https://CRAN.R-project.org/package=purrr
[16]Makowski, D., Ben-Shachar, M.S., Patil, I. & Lüdecke, D. (2020). Automated Results Reporting as a Practical Tool to Improve Reproducibility and Methodological Best Practices Adoption. CRAN. Available from https://github.com/easystats/report. doi: .
[17]R Core Team (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.
[18]Rinker, T. W. (2018). textclean: Text Cleaning Tools version 0.9.3. Buffalo, New York. https://github.com/trinker/textclean
[19]Rinker, T. W. (2018). textreadr: Read Text Documents into R version 0.9.1. Buffalo, New York. http://github.com/trinker/textreadr
[20]Silge J, Robinson D (2016). “tidytext: Text Mining and Analysis UsingTidy Data Principles in R.” JOSS, 1(3). doi: 10.21105/joss.00037(URL: https://doi.org/10.21105/joss.00037), <URL:http://dx.doi.org/10.21105/joss.00037>.

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Google fotoğrafı

Google hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap /  Değiştir )

Connecting to %s