Title: Çevrimiçi iş ilanlarının veri ve metin madenciliği yöntemleri ile analizi: Bilgi ve iletişim sektörü örneği
Other Titles: Analysis of online jobs postings with data and text mining methods: Example of İnformation and communication sector
Authors: Kaçaroğlu, Mustafa Onur
Advisors: Organ, Arzu
Keywords: Veri Madenciliği
Metin Madenciliği
Konu Modelleme
Karar Ağaçları
Çevrimiçi İş İlanları
Bilgi ve İletişim Sektörü İş İlanları
Data Mining
Text Mining
Topic Modelling
Decision Trees
Online Job Postings
Information and Communication Industry Job Postings
Abstract: Son yıllarda internetin hızla gelişmesi ve web tabanlı uygulamaların kullanılması ile veri miktarı hızlı bir şekilde artmaktadır. Artan verilerin iş dünyası için kullanışlı hale getirilmesi, veri ve metin madenciliği yöntemlerinin etkin kullanılması ile mümkündür. Veri madenciliği büyük veri yapıları içerisinden çeşitli algoritmalar yardımıyla anlamlı ve kullanışlı bilgiler elde etme sürecidir. Metin madenciliği, veri madenciliği ile ilişkili ya da veri madenciliğinin alt dalı olarak görülse de esasen ayrı bir disiplindir. Metin madenciliği, her türlü metin içeren ifadenin çeşitli algoritmalar yardımıyla işlenip analiz edilmesi ve sonucunda katma değer yaratacak çeşitli bilgilerin açığa çıkarılması sürecidir. İşletmeler metin ve veri madenciliği uygulamalarını kullanarak rekabetçi ortamda kendilerine avantajlar yaratabilirler. Bu çalışmada hem iş gören hem iş veren hem de eğitim kurumları için yararlı bilgilerin açığa çıkarılması amaçlanmıştır. Bunun için, veri ve metin madenciliği yöntemleri kullanılarak, Bilgi ve İletişim Sektörüne ait çevrim içi iş ilanları analiz edilip iş gücü piyasasına ilişkin tespitler yapılmıştır. Veriler, bir çevrimiçi iş ilanı sitesinden elde edilmiştir. Elde edilen veriler, Rastgele Orman (Random Forest) Karar Ağacı Algoritması ve Gizli Dirichlet Ayrımı yöntemleri ile analiz edilmiştir. Sonuç olarak iş ilanlarında yer alan nitelikler kullanılarak yapılan analizlere elde edilen konular için iş tanımları oluşturulmuştur. Bu iş tanımlarının yakın gelecekte iş ilanlarında yer alması muhtemeldir. Bununla birlikte teknik becerilerin son derece önemli olduğu bilgi ve iletişim sektörü için ikna, iletişim, motivasyon, liderlik, sorumluluk, esneklik, karar verme, tutarlılık gibi hassas becerilerin de baskın konular içerisinde ağırlıklı olarak yer aldığı saptanmıştır.
In recent years, the amount of data has been increasing rapidly with the rapid development of the internet and the use of web-based applications. It is possible to make the increasing data useful for the business world with the effective use of data and text mining methods. Data mining is the process of obtaining meaningful and useful information from large data structures with the help of various algorithms. Although text mining has been associated with data mining or seen as a sub-branch of data mining, it is essentially a separate discipline. Text mining is the process of processing and analysing all kinds of text-containing expressions with the help of various algorithms and revealing various information that will create added value as a result. Companies may create advantages for themselves in the competitive environment by using text and data mining applications. In this study, it has been aimed to reveal useful information for all employees, employers and educational institutions. To achieve this, online job postings belonging to the Information and Communication Sector have been analysed by using data and text mining methods and determinations have been made regarding the labour market. Data have been obtained from an online job posting site. The obtained data have been analysed by Random Forest Decision Tree Algorithm and Hidden Dirichlet Discrimination methods. As a result, job descriptions were created for the subjects obtained from the analyzes made using the qualifications in the job postings. These job descriptions are likely to appear in job postings in the near future. In addition, it is determined that sensitive skills such as persuasion, communication, motivation, leadership, responsibility, flexibility, decision-making and consistency are among the dominant subjects for the information and communication sector, where technical skills are extremely important.
