Show simple item record

dc.contributor.advisorAladağ, Çağdaş Hakan
dc.contributor.authorBaran Kılıçalan, Merve
dc.date.accessioned2018-07-13T08:15:13Z
dc.date.available2018-07-13T08:15:13Z
dc.date.issued2018
dc.date.submitted2018-06-08
dc.identifier.citation[1] Kara Ö.S., Lojistik Regresyon Analizi Ve Kadın İşgücü Üzerine Bir Uygulama, Yüksek Lisans Tezi, Uludağ Üniversitesi Sosyal Bilimler Enstitüsü İstatistik Bilim Dalı, Bursa, 2015 [2] Altunkaya H.İ., Ülkelerin Uzun Dönem Kredi Notlarının Derecelendirilmesinde Önemli Değişkenlerin Veri Madenciliği Teknikleri Kullanılarak Belirlenmesi, Yüksek Lisans Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü İstatistik Anabilim Dalı, Ankara, 2013 [3] Kocabaş F.M., Veri Madenciliği Süreci ve Gerçek Bir Veri Seti Üzerinde Uygulanması, Yüksek Lisans Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü İstatistik Anabilim Dalı, Ankara, 2010 [4] Yılmaz E., İstatiksel Analiz Yöntemi Olarak Veri Madenciliğinde CHAID Algoritması Ve Türkiye’de İşgücü Piyasasının Durumunun ve Bunun Nedenlerinin Belirlenmesine İlişkin Bir Uygulama, Yüksek Lisans Tezi, Yıldız Teknik Üniversitesi Sosyal Bilimler Enstitüsü İşletme Ana Bilim Dalı İşletme Yönetimi Yüksek Lisans Programı, İstanbul, 2012 [5] Yakut E., Veri Madenciliği Tekniklerinden C5.0 Algoritması ve Destek Vektör Makineleri ile Yapay Sinir Ağlarının Sınıflandırma Başarılarının Karşılaştırılması: İmalat Sektöründe Bir Uygulama, Doktora Tezi, Atatürk Üniversitesi Sosyal Bilimler Enstitüsü İşletme Anabilim Dalı, Erzurum, 2012 [6] Kuzey C., Veri Madenciliğinde Destek Vektör Makinaları ve Karar Ağaçları Yöntemlerini Kullanarak Bilgi Çalışanlarının Kurum Performansı Üzerine Etkisinin Ölçülmesi ve Bir Uygulama, Doktora Tezi, İstanbul Üniversitesi Sosyal Bilimler Enstitüsü İşletme Anabilim Dalı Sayısal Yöntemler Bilim Dalı, İstanbul, 2012 [7] Çakır Ö., Veri Madenciliğinde Sınıflandırma Yöntemlerinin Karşılaştırılması “Bankacılık Müşteri Veri Tabanı Üzerinde Bir Uygulama”, Doktora Tezi, Marmara Üniversitesi Sosyal Bilimler Enstitüsü İşletme Anabilim Dalı Sayısal Yöntemler Bilim Dalı, İstanbul, 2008 [8] Kıyak E., Crisp-Dm Yöntembilimi Kullanılarak Deniz Kuvvetleri Verisi Üzerinde Veri Madenciliği Sınıflandırma Tekniklerinin Karşılaştırılması, Yüksek Lisans Tezi, Kocaeli Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı, Kocaeli, 2006 [9] Özdemir A., Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği-Sağlık Sektöründe Uygulama, Doktora Tezi, Atatürk Üniversitesi Sosyal Bilimler Enstitüsü İşletme Anabilim Dalı, Erzurum, 2004 [10] Doğan K., Arslantekin S., Büyük Veri: Önemi, Yapısı ve Günümüzdeki Durum, DTCF Dergisi, 56.1, 15-36, 2016 [11] Dura C., Atik H. ,Bilgi Toplumu, Bilgi Ekonomisi ve Türkiye, İstanbul, Literatür Yayıncılık, 1.Baskı, 2002 [12] Han J., Kamber M., Data Mining: Concepts and Techniques, Second Edition, Morgan Kaufmann Publishers, 2nd Ed., San Francisco, USA, 2006 [13] Can M.B. vd., Veri kümelerinden bilgi keşfi: veri madenciliği, http://docplayer.biz.tr/14269227-Mehmet-berkay-can-eren-camur-mine-koru-omer-ozkan-zeynep-rzayeva.html (Şubat 2017) [14] Özkan Y., Veri Madenciliği Yöntemleri, Papatya Yayıncılık Eğitim, 2008) [15] Giudici P., Applied Data Mining, Statistical Methods for Business and Industry, Italy, 2003 [16] Karaca İ., Büyük Veri Analizlerinin Kurumsal Faaliyetlerde Kullanım Alanları, Lisans Tezi, Ankara Üniversitesi Dil ve Tarih-Coğrafya Fakültesi Bilgi ve Belge Yönetimi Bölümü Ankara, 2015 [17] Savaş S. vd., Veri Madenciliği ve Türkiye’deki Uygulama Örnekleri, Tarama makalesi, İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 11-2, 2012 [18] Olson D.L., Delen D., Advanced Data Mining Techniques, Springer-Verlag Berlin Heidelberg, 2008 [19] Öğüt S., Veri Madenciliği Kavramı ve Gelişim Süreci. Yeditepe Üniversitesi, İstanbul, 2002, http://www.sertacogut.com/blog/wp-content/uploads/2009/03/sertac_ogut_-_veri_madenciligi_kavrami_ve_gelisim_sureci.pdf (Şubat, 2017) [20] http://ugurozmen.com/crm/en-iyi-teklif-sss-3 (Şubat, 2017) [21] Atılgan E., Karayollarında Meydana Gelen Trafik Kazalarının Karar Ağaçları ve Birliktelik Analizi ile İncelenmesi, Yüksek Lisans Tezi, Hacettepe Üniversitesi, İstatistik Bölümü, Ankara, 2011 [22] Albayrak A.S., Yılmaz Koltan Ş., Veri Madenciliği: Karar Ağacı Algoritması ve İMKB Verileri Üzerine Bir Uygulama, Süleyman Demirel Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 14-1, 31-52, 2009 [23] Dolgun M.Ö., Büyük Alışveriş Merkezleri İçin Veri Madenciliği Uygulamaları, Yüksek Lisans Tezi, Hacettepe Üniversitesi İstatistik Anabilim Dalı, Ankara, 2006 [24] Gullo F., From Patterns in Data to Knowledge Discovery: What Data Mining Can Do, 3rd International Conference Frontiers in Diagnostic Technologies, ICFDT3 2013, Physics Procedia 62, 18-22, 2015 [25] Şentürk A., Veri Madenciliği Kavram ve Teknikler, Ekin Yayınevi, 2006 [26] Emel G.G., Taşkın Ç., Veri Madenciliğinde Karar Ağaçları ve Bir Satış Analizi Uygulaması, Eskişehir Osmangazi Üniversitesi Sosyal Bilimler Dergisi, 6-2, 221-239, 2005 [27] Ayık Y.Z. vd., Lise Türü ve Lise Mezuniyet Başarısının, Kazanılan Fakülte ile İlişkisinin Veri Madenciliği Tekniği ile Analizi”., Atatürk Üniversitesi , Sy.445, http://docplayer.biz.tr/3976459-Lise-turu-ve-lise-mezuniyet-basarisinin-kazanilan-fakulte-ile-iliskisinin-veri-madenciligi-teknigi-ile-analizi.html (Mayıs, 2018) [28] Witten I.A., Frank E., Data Mining Practical Machine LearningTools and Techniques, The Morgan Kaufmann Series in Data Management Systems, 2nd Ed., 2005 [29] Yohannes Y., Hoddinott J., Classıfıcatıon And Regressıon Trees: An Introductıon Technical Guide, International Food Policy Research Institute 2033 K Street, N.W. Washington, D.C. 2006 U.S.A., Mart 1999, S.2, https://www.researchgate.net/publication/242370834_Classification_and_Regression_Trees_An_Introduction (Nisan, 2018) [30] Michie D., Machine Learning, Neural and Statistical Classification, Cambridge, U.K., 1994 [31] Berry M.J.A. , Linoff G.S., Data Mining Techniques for Marketing, Sales and Customer Relationship Management, Wiley Publishing, 2nd Ed., Indiana, 2004 [32] Doğan N., Özdamar K., CHAID Analizi ve Aile Planlaması ile ilgili Bir Uygulama, T Klin Tıp Bilimleri, 23, 392-397, 2003 [33] Kass GV., An Exploratory Technique For İnvestigating Large Quantities Of Categorical Data, Applied Statistics, 29-2, 119-127 , 1980 [34] Diaz-Perez F.M., Bethencourt-Cejas M., Chaid Algorithm As An Appropriate Analytical Method For Tourism Market Segmentation, Journal of Destination Marketing & Management, 5-3, 275–282, 2016 [35] Ritschard G., CHAID and Earlier Supervised Tree Methods , Dept of Econometrics, University of Geneva, Switzerland, 2010-02, 1-28, 2010 [36] Karakoyun M., Hacıbeyoğlu M., Biyomedikal Veri Kümeleri ile Makine Öğrenmesi Sınıflandırma Algoritmalarının İstatistiksel Olarak Karşılaştırılması, Dokuz Eylül Üniversitesi Mühendislik Fakültesi Mühendislik Bilimleri Dergisi, 16-48, 30-41, 2014 [37] Siyah B., Spor Metinleri Sınıflama Projesi, MKÜ Bilgisayar Mühendisliği Bölümü, S.1, http://www.bulentsiyah.com/naive-bayes-ile-spor-metinleri-siniflandirma/, (Nisan, 2017) [38] Larose D.T., Data Mining Methods and Models, A John Wiley & Sons, Inc Publication, United States of America, 2006 [39] Murat N., Model Seçiminde Bayesci Yaklaşımların Kullanımı, Yüksek Lisans Tezi, Ondokuz Mayıs Üniversitesi Fen Bilimleri Enstitüsü İstatistik Ana Bilim Dalı, Samsun, 2007 [40] Aktaş C., Erkuş O., Lojistik Regresyon Analizi ile Eskişehir’in Sis Kestiriminin İncelenmesi, İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 8-16, 47-59, 2009 [41] Önder H., Cebeci Z., Lojistik Regresyonlarda Değişken Seçimi, Çukurova Üniversitesi Ziraat Fakültesi Dergisi, 17 (2), 105-114, 2002 [42] Tatlıdil, H., Uygulamalı Çok Değişkenli İstatistiksel Analiz, Ziraat Matbaacılık, Ankara, 2002 [43] Kıran Z.B., Lojistik Regresyon ve Cart Analizi Teknikleriyle Sosyal Güvenlik Kurumu İlaç Provizyon Sistemi Verileri Üzerinde Bir Uygulama, Yüksek Lisans Tezi, İstatistik Gazi Üniversitesi Fen Bilimleri Enstitüsü, Ankara, 2010 [44] Başarır G., Çok Değişkenli Verilerde Ayrımsama Sorunu ve Lojistik Regresyon Analizi, Doktora Tezi, Hacettepe Üniversitesi, İstatistik Bölümü, Ankara, 1990 [45] Hosmer D.W., Lemeshow S., Applied Logistics Regression, Wiley Series in Probability and Statistics, John Wiley & Sons, Inc. , 2nd Ed., 2000 [46] Ürük E., İstatistiksel Uygulamalarda Lojistik Regresyon Analizi, Yüksek Lisans Tezi, Marmara Üniversitesi Fen Bilimleri Enstitüsü, Matematik Anabilim Dalı Uygulamalı Matematik Programı, İstanbul, 2007 [47] Aladağ Ç.H. vd, Improving Weighted Information Criterion By Using Optimization, Journal of Computational and Applied Mathematics, 233-10, 2683-2687, 2010 [48] Bircan H., Lojistik Regresyon Analizi: Tıp Verileri Üzerine Bir Uygulama, Kocaeli Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 2, 185-208, 2004 [49] Aladağ Ç.H. vd., Forecasting Nonlinear Time Series With A Hybrid Methodology, Applied Mathematics Letters, 22-9, 1467-1470, 2009 [50] Coşkun C., Baykal A., Veri Madenciliğinde Sınıflandırma Algoritmalarının Bir Örnek Üzerinde Karşılaştırılması, Akademik Bilişim’11 - XIII. Akademik Bilişim Konferansı Bildirileri, Şubat 2011 İnönü Üniversitesi, Malatya, 51-58, 2011 [51] Dolgun M.Ö., Veri Madenciliği Sınıflama Yöntemlerinin Başarılarının; Bağımlı Değişken Prevelansı, Örneklem Büyüklüğü ve Bağımsız Değişkenler Arası İlişki Yapısına Göre Karşılaştırılması, Doktora Tezi, Hacettepe Üniversitesi Sağlık Bilimleri Enstitüsü, Ankara, 2014 [52] Akçayol M.A., Web Madenciliği (Web Mining) Ders Notları, Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü, http://w3.gazi.edu.tr/~akcayol/files/WM_L5ClassifierEvaulation.pdf (Nisan, 2018) [53] Powers D.M.W., Evaluation: From Precision, Recall and F-Factor to ROC, Informedness, Markedness & Correlation, Journal of Machine Learning Technologies, 2-1, 51-58, 2011 [54] Beliner E., Müşteri İlişkileri Yönetiminde İstatistiğin Yeri ve Bir Uygulama, Yüksek Lisans Tezi, Hacettepe Üniversitesi İstatistik Anabilim Dalı, Ankara, 2015 [55] TÜİK web sayfası, http://www.TÜİK.gov.tr/MicroVeri/HİA_2015/turkce/metaveri/tanim/index.html (Ocak, 2018) [56] TÜİK web sayfası, http://www.TÜİK.gov.tr/MicroVeri/HİA_2015/turkce/metaveri/tarihce/index.html (Ocak, 2018) [57] Taş B., AB Uyum Sürecinde Türkiye İçin Yeni Bir Bölge Kavramı: İstatistiki Bölge Birimleri Sınıflandırması (İbbs), Afyon Kocatepe Üniversitesi Fen-Edebiyat Fakültesi Coğrafya Bölümü, 03200 Afyonkarahisar, Sosyal Bilimler Dergisi, 8-2, 185-198, 2006 [58] IBM web sayfası, https://www.ibm.com/support/knowledgecenter/SS3RA7_15.0.0/com.ibm.spss.modeler.help/partition_settingstab.htm (Ocak, 2018)tr_TR
dc.identifier.urihttp://hdl.handle.net/11655/4669
dc.description.abstractIn today’ s conditions, increasing the need for such as assessing, analyzing and making forward estimates of data, has increased the demand for data mining methods. In this study, classification and regression estimating methods of data mining are discussed, C5.0 decision tree, CHAID decision tree, Logistic Regression and Bayesian Networks methods are examined and the modeling successes were compared by applying them on a real data set. Additionally, data on the Household Labor Force Survey compiled and implemented by Turkish Statistical Institute for 2014, 2015 and 2016 years. Also, within the scope of this study to determine the labor situation in Turkey, both the employed labor force status by making regarding the classification of individuals outside employment profile is intended to be an accurate estimate of the labor situation as a result of unknown individual models. When the study results were evaluated, it was calculated that the model obtained as a result of the C5.0 decision tree method had the most successful classification prediction even though the model successes were relatively close to each other in comparison with various criteria.tr_TR
dc.description.tableofcontentsÖZET.........................................................................................................................................i ABSTRACT..........................................................................................................................iii TEŞEKKÜR...........................................................................................................................v İÇİNDEKİLER......................................................................................................................vi ÇİZELGELER....................................................................................................................viii ŞEKİLLER............................................................................................................................ix KISALTMALAR...................................................................................................................x 1. GİRİŞ 1 1.1. Veri ve Bilgi 3 2. VERİ MADENCİLİĞİ 5 2.1. Veri Madenciliği Nedir? 5 2.2. Veri Madenciliği Tarihçesi 7 2.3. Veri Madenciliği Kullanım Alanları 8 2.4. Veri Madenciliği Süreci 9 2.5. Veri Madenciliği ve İstatistik 11 3. VERİ MADENCİLİĞİ YÖNTEMLERİ 13 3.1. Veri Madenciliği Stratejileri/Fonksiyonları 13 3.2. Veri Madenciliği Yöntemleri 13 3.2.1. Karar Ağaçları 15 3.2.2. Bayesyen Sınıflandırması 19 3.2.3. Lojistik Regresyon Yöntemi 21 3.3. Veri Madenciliği Yöntemlerinin Karşılaştırılması için Kriterler 23 4. UYGULAMA 26 4.1. Kullanılan Veri Setine İlişkin Tanım ve Kavramlar 26 4.2. Kullanılan Veri Seti ve Yöntemler 27 4.3. Veri Setinin Düzenlenmesi 28 4.4. Tanımlayıcı İstatistikler 32 4.5. Veri Madenciliği Yöntemlerinin Uygulanması 45 4.5.1. İşi Anlama 45 4.5.2. Veriyi Anlama 45 4.5.3. Veriyi Hazırlama 46 4.5.4. Modelleme 47 4.5.4.1. C5.0 Karar Ağacı Yönteminin Uygulanması 47 4.5.4.2. CHAID Karar Ağacı Yönteminin Uygulanması 53 4.5.4.3. Lojistik Regresyon Yönteminin Uygulanması 58 4.5.4.4. Bayes Ağları Yönteminin Uygulanması 67 4.5.5. Değerlendirme ve Uygulama 70 4.6. Yöntemlerin Karşılaştırılması 70 5. SONUÇ 75 KAYNAKÇA…………………………………………………………………….…….... 77 ÖZGEÇMİŞ…………………………………………………………………….…............81tr_TR
dc.language.isoturtr_TR
dc.publisherFen Bilimleri Enstitüsütr_TR
dc.rightsinfo:eu-repo/semantics/openAccesstr_TR
dc.subjectveri madenciliği
dc.subjectkarar ağaçları
dc.subjectlojistik regresyon yöntemi
dc.subjectbayes ağları
dc.subjecthanehalkı işgücü araştırması
dc.subjectistihdam
dc.titleHanehalkı İşgücü Araştırma Verileri İle Veri Madenciliği Yöntemlerinin Uygulanması Ve Modellerin Karşılaştırılmasıtr_TR
dc.typemasterThesistr_TR
dc.description.ozetGünümüz koşullarında büyüyen ve genişleyen veri hacmiyle birlikte verilerin değerlendirilmesi, analiz edilmesi ve ileriye yönelik tahminlerin yapılması gibi ihtiyaçların artması veri madenciliği yöntemlerine olan yönelimi artırmıştır. Bu çalışma kapsamında veri madenciliğinin tahmin edici yöntemlerinden sınıflama ve regresyon yöntemleri ele alınmış olup C5.0 karar ağacı, CHAID karar ağacı, Lojistik Regresyon ile Bayes Ağları yöntemleri incelenmiş ve gerçek bir veri seti üzerinde uygulanarak modelleme başarıları karşılaştırılmıştır. Çalışmada TÜİK tarafından derlenen ve uygulanan Hanehalkı İşgücü Araştırması (HİA)’ nın 2014, 2015 ve 2016 yıllarına ait verileri ele alınmıştır. Ayrıca bu çalışma kapsamında Türkiye’de işgücü durumunun belirlenmesi, hem istihdam kapsamında hem de istihdam dışında olan birey profiline ilişkin sınıflamaların yapılması ile işgücü durumu bilinmeyen bir bireyin model sonucunda işgücü durumunun doğru tahmin edilmesi amaçlanmıştır. Çalışma sonuçları değerlendirildiğinde, çeşitli ölçütlerle yapılan kıyaslamalarda model başarıları birbirine oldukça yakın olarak edilmiş olmasına karşın C5.0 karar ağacı yöntemi sonucunda elde edilen modelin en başarılı sınıflama tahminine sahip olduğu sonucuna ulaşılmıştır.tr_TR
dc.contributor.departmentİstatistiktr_TR


Files in this item

This item appears in the following Collection(s)

Show simple item record