Proje Detayları

Hedef

Veri Uzmanları Anketi projesinin amacı, dünya çapında veri profesyonelleri hakkında toplanan anket verilerini analiz ederek önemli içgörüler elde etmektir. Çalışanların kariyer değişiklikleri, maaş aralıkları, sektör tercihleri, iş memnuniyeti ve teknik becerileri gibi faktörler analiz edilerek, veri dünyasındaki trendler ve fırsatlar incelenmektedir. Elde edilecek bilgiler, kurumların veri odaklı stratejik karar süreçlerine katkı sağlayarak genel performansı iyileştirmesine yardımcı olacaktır.

GitHub'dan indirin!

Arka Plan Bilgisi

Veri seti, dünya genelinden 630 veri uzmanının cevaplarından oluşan bir anket verisini içerir. Kayıtlarda katılımcının yaşı, cinsiyeti, ülkesi, eğitim durumu, iş unvanı, yıllık maaş aralığı, tercih ettiği programlama dilleri, iş tatmin derecesi ve iş-yaşam dengesi memnuniyeti gibi çeşitli bilgiler bulunur. Bu özellikler, veri uzmanlarının demografik profillerini ve mesleki eğilimlerini ayrıntılı olarak analiz etmemize imkân tanır. Veriler, analiz öncesinde Power BI üzerinde işlenmek üzere bir Excel dosyası (.xlsx) formatında temin edilmiştir. Bu sayede veri uzmanlarının demografik ve mesleki eğilimleri kapsamlı biçimde incelenebilmiştir.

GitHub'dan veri setini indirin!

Kurulum

Projeye başlamadan önce Power BI içindeki Power Query aracı kullanılarak kapsamlı bir veri temizleme ve hazırlık süreci gerçekleştirildi. Analiz için gerekli olmayan sütunlar (örneğin tarih, tarayıcı, işletim sistemi bilgileri) veri setinden kaldırıldı. Eksik veriler kontrol edildi ve veri tiplerinin uygunluğu sağlandı.

Verilerin daha anlamlı ve görselleştirilebilir hale gelmesi amacıyla şu düzenlemeler yapıldı:

  • Yaş Verileri: Yaş bilgileri gruplanarak kategorilere ayrıldı (örneğin 18–24, 25–34, 35–44, 45+.)
  • İş Unvanı Segmentasyonu: Katılımcıların iş unvanları farklı şekilde yazılmış olsa da (örneğin "Analyst", "Fianance Analyst", "Business Analyst" vb.), analiz kolaylığı sağlamak amacıyla benzer roller gruplandırıldı. "Other" seçeneği üzerinden girilen tüm farklı unvanlar da tek bir “Other” grubu altında birleştirildi.
  • Favori Program Dilleri: Katılımcıların en çok sevdikleri programlama dili veya araçları belirtmeleri için açık uçlu "Other" seçeneği mevcuttu. Ancak veri çeşitliliği yüksek olduğundan, bu girişler de tek bir "Other" grubu altında birleştirildi.
  • Maaş Aralıkları: Metinsel olarak belirtilen maaş aralıkları, ortalama sayısal değerlere dönüştürüldü.
  • Ülke Dağılımı: Katılımcılar, mevcut listede olmayan ülkeleri de "Other" seçeneğiyle manuel olarak girdi. Bu farklı ülke isimleri analiz açısından gruplanarak yine "Other" grubu altında birleştirildi.
HR Data after transformation

Resim 1. Temizlenmiş, dönüştürülmüş veri setinin görünümü

Bu adımlar, verinin analiz için uygun formatta olmasını sağlayarak elde edilen sonuçların güvenilirliğini artırmıştır.

Analiz

Veri temizlendikten sonra, keşifsel veri analizleri gerçekleştirmek ve iç görüler elde etmek amacıyla aşağıdaki iş sorularına odaklanılmıştır:

İş Soruları:

  1. Yaş, cinsiyet ve coğrafi bölge gibi demografik dağılımlar nasıldır?
  2. Hangi pozisyonlar sektörde daha fazla talep görüyor
  3. İş unvanlarına göre maaş farkları nasıl şekilleniyor?
  4. Maaş memnuniyeti, iş tatmini ile nasıl ilişkilidir?
  5. İş-yaşam dengesi katılımcıların iş memnuniyeti üzerinde nasıl bir etki yaratıyor?
  6. En popüler programlama dilleri hangileridir?
  7. Veri alanına giriş yapmak ne kadar zor?

Veri Keşfi (Data Exploration)

Keşifsel veri analizi aşamasında, verinin temel özelliklerini anlamak için çeşitli görselleştirmeler oluşturuldu. Yaş ve cinsiyet bilgisini gösteren görsellerle katılımcı profili analiz edildi. Ülkeler bazında katılımcı sayısı ve ortalama maaş karşılaştırmaları yapıldı. Tercih edilen programlama dilleri ve iş/yaşam dengesi gibi memnuniyet seviyeleri incelenerek örüntüler ortaya çıkarıldı. Ayrıca tercih edilen iş unvanları ve kariyer geçiş eğilimleri de bu aşamada incelendi.

Bu analiz sürecinde daha güçlü içgörüler üretebilmek için Power BI üzerinde özel ölçümler (measures) oluşturuldu:

  • Count of Takers: Anketi yanıtlayan toplam katılımcı sayısını ölçmek için kullanıldı.
  • % Age Group: Yaş gruplarının toplam içindeki yüzdesini göstermek için kullanıldı.
  • Female, Male: Cinsiyetlere göre katılımcı sayısını ayıran temel ölçüler olarak tanımlandı.
  • % Female, % Male: Cinsiyet dağılımını oransal olarak göstermek için hesaplandı.

Bu ölçümler sayesinde, dinamik görselleştirmelerle hem genel eğilimler hem de daha ince segmentlerdeki detaylar etkili şekilde analiz edilebildi. Elde edilen bu içgörüler, sonrasında pano (dashboard) tasarımında hangi metriklerin öne çıkarılması gerektiğine dair yol gösterici olmuştur.

Dasboard Tasarımı

İşlenen veriler kullanılarak Power BI ortamında etkileşimli bir dashboard hazırlandı. Bu dashboard, veri uzmanlarının profiline dair önemli göstergeleri içerir. Kullanılan görselleştirmeler arasında; katılımcı sayısını/yaşını vurgulayan kartlar, katılımcıların ülkelerini görselleştiren treemap, yaş gruplarının katılımcı sayısındaki dağılımını ve yüzdesini gösteren alan grafik (area chart), programlama dillerinin dağılımını gösteren kümeli sütun grafikler (Clustred columnn chart) ve iş/yaşam ile maaş memnuniyetini ölçen göstergeler (gauge) bulunmaktadır. Ayrıca kullanıcıların iş unvanına göre filtreleme yapmalarını sağlayan dilimleyiciler (slicer) eklenmiştir. Dashboard'da belirli ana göstergeleri vurgulamak için kartlar ve önemli alanlara dikkat çekmek amacıyla şekiller kullanılmıştır. Bu sayede kullanıcılar, ihtiyaç duydukları verilere kolayca odaklanabilir.

HR Analytics Dashboard

Resim 2. Veri Uzmanları Anketi dashboard'una ait bir görünüm.

Temel Bulgular (Key Findings)

Dashboard yardımıyla aşağıdaki önemli içgörülere ulaşılmıştır:

  • Katılımcı Profili: Bu anket çalışmasında toplam 630 katılımcı yer aldı. Cinsiyet dağılımına göre katılımcıların yaklaşık %74’ü erkek, %26’sı kadındır. Yaş dağılımında ise 25–34 yaş aralığı baskın olup katılımcıların yaklaşık %60’ı bu gruba girmektedir; 18–24 yaş arası %20, 35–44 yaş arası %16 civarındadır. Geriye kalan çok düşük oran 45+ yaş gruplarında toplanır. Veri uzmanlarının çoğu (%41; ~261 kişi) Kuzey Amerika'da bulunmaktadır; Kuzey Amerika, en yüksek katılımcı sayısına sahiptir.
  • İş Profili: Mevcut iş unvanlarında açık ara en yaygın olanı “Veri Analisti’dir ve katılımcıların yaklaşık %60’ı bu unvanı taşımaktadır (381 kişi). Bunu ikinci sırada “Veri Mühendisi” (~6%) ve “Veri Bilimci” (~4%) gibi unvanlar takip eder. Diğerleri veya Öğrenci/Fırsatlar Arıyorum pozisyonundakiler (~14%) listenin geri kalanını oluşturur.
  • Maaş Analizi: Veri sektöründeki unvanlar arasında maaş farklılıkları oldukça belirgindir. Data Scientist unvanı, ortalama 94,04 USD maaşla en yüksek gelire sahipken, Data Engineer ve Data Architect sırasıyla 65,29 USD ve 64,00 USD ile ikinci ve üçüncü sırada yer alıyor. Data Analyst ise ortalama 55,48 USD maaşıyla sektördeki en yaygın unvan olup, 249 kişi tarafından tercih edilmiştir. Katılımcılar maaşlarından ortalama ~ 4.3/10 puanla memnun olduklarını belirtmişlerdir.
  • İş Memnuniyeti ve Çalışma Koşulları: Katılımcılara mevcut işlerinde farklı faktörlerde ne kadar mutlu oldukları (0–10 arası) soruldu. Elde edilen ortalama memnuniyet puanının ~5.7 olduğu belirlendi. Bu bulgu, katılımcıların ücret konusuna daha düşük puan verdiğini ve ücret dışında çalışma şartlarından nispeten daha memnun olduklarını gösterir.
  • Programlama Dili Tercihleri: Katılımcıların en sevdiği programlama dili açık ara Python olup, yaklaşık %67’si (420 kişi) Python kullandığını belirtmiştir. Bunu %16 (101 kişi) ile R takip eder. Bu sonuç, dünya genelinde veri bilimi ve analizi alanında Python’ın domine ettiğine işaret etmektedir. Katılımcıların yanıtlarında ayrıca Excel veya veri tabanı (SQL) gibi araçları kullananlar “Diğer” kategorisinde yer almıştır, bu da Excel ve SQL’in de önemli teknik araçlar olduğuna işaret eder.
  • Veri Sektöründe Zorluklar ve Fırsatlar: Veri alanına girişin zorluklarıyla ilgili anket sorusu katılımcılar arasında orta düzeyde zorluk algısı ortaya koymaktadır. Katılımcıların %24’ü “zor” (156 kişi), %7’si “çok zor” (44 kişi) derken; %21’i “kolay” (134 kişi), %4’ü “çok kolay” (27 kişi) olarak işaretlemiştir. Geri kalan %43’ü (269 kişi) “ne kolay ne de zor” seçeneğini işaretlemiştir. Bu da genel olarak geçişte belirli bir bariyer olduğunu, ama herkes için aşılmaz olmadığını göstermektedir. Eğitim, deneyim veya sektör bilgisi eksikliği gibi faktörler bu zorluğun sebepleri olabilir.

Öneriler

Bu bulgular ışığında kurumlara aşağıdaki stratejiler önerilmektedir:

  • Veri bilimcilerin sektörde yüksek talep gördüğü ve yüksek maaş aldığı göz önünde bulundurularak, bu alanda uzman yetiştirmek için eğitim ve kariyer geliştirme programları düzenlenebilir.
  • Ortalama maaş memnuniyetinin düşük olması nedeniyle, rekabetçi maaş ve yan hak politikaları gözden geçirilebilir.
  • Python gibi popüler programlama dillerinde eğitim ve kurs imkânları sağlanarak çalışanların yetkinliği artırılabilir.
  • Hibrit veya esnek çalışma modelleriyle çalışanların iş/yaşam dengesi desteği sürdürülebilir.
  • Kapsayıcı işe alım stratejileri ile özellikle kadın veri uzmanlarının oranı ve motivasyonu desteklenebilir.
  • Katılımcıların büyük bir kısmı, veri sektörüne geçişte zorluklarla karşılaştığını belirtmiştir. Bu nedenle sektöre yeni girenlere yönelik eğitim programları ve mentorluk fırsatlar sağlanmalıdır.

Sonuç

Veri profesyonellerinin profillerini, beklentilerini ve sektörle ilgili deneyimlerini anlamak; hem işverenler hem de sektöre yeni adım atmak isteyenler için büyük önem taşımaktadır. Bu proje kapsamında yürütülen analizler sayesinde, katılımcıların demografik özelliklerinden maaş memnuniyetine, teknik becerilerinden kariyer değişim motivasyonlarına kadar birçok kritik bilgi elde edilmiştir. Power BI kullanılarak geliştirilen interaktif pano, kullanıcıların veriyle etkileşim kurarak derinlemesine analiz yapmalarını sağlamaktadır. Bu proje, veri analizi ve görselleştirme konusundaki yetkinliklerimi ortaya koymaktadır. Elde ettiğim bu deneyimler, çeşitli sektörlerdeki organizasyonların veriye dayalı karar almasına ve hedeflerine ulaşmasına katkı sağlayacak becerileri kapsamaktadır.

İletişim Bilgileri