Veri Görselleştirme

Blog gönderi açıklaması.

Reddithun

5/20/20253 min read

Veri görselleştirme (data visualization), verilerin grafik, tablo, harita gibi görsel öğelerle sunulmasıdır. Karmaşık verilerin daha kolay anlaşılmasını sağlar. 

Veri Görselleştirmenin Amacı

  • Verideki desenleri, eğilimleri ve anormallikleri ortaya çıkarmak

  • Karar vericilere net ve hızlı bilgi sunmak

  • Büyük veri setlerini daha erişilebilir hale getirmek

Popüler Araçlar

  • Microsoft Excel

  • Tableau

  • Power BI

  • Google Data Studio

  • Python (matplotlib, seaborn, plotly)

  • R (ggplot2)

Çok popüler kullanılan veri görselleştirme teknikleridir. Belirli veri görselleştirme teknikleri ve bu tekniklerin R ile Python kodları yer almaktadır.

Histogram

Veri dağılımını özetlemenin en çok kullanılan yoludur. Veri genişliğini eşit uzunluktaki aralıklara bölerek gösterilir. En sık kullanılan grafik türlerinden biridir ve birbirinden farklı kategoriler-gruplar için sayı, frekans vb. bilgileri göstermek ve kıyaslamak için kullanılır.

• Büyük veri kümelerinde kullanılır.

• Dağılım hakkında bilgi verir.

• Genellikle verini yoğunlaştığı konumları gösterir.

• Büyük veya küçük değerlere çarpık olması verilerde dönüşüm yapılabileceğini gösterir.

Box Plot

Verilerin çeyreklik değerlerine göre gösterimidir. Histogram ve nokta çizimleri farklı görünüme sahip olmakla birlikte veri ile ilgili yarıntılı bilgi verir. Konum, yayılım ve çarpıklık ile ilgili bilgi verir. Dağılımın kuyrukları ve bu kuyrukların yayılım ile ilgili bilgi verir. Uç değerleri görmek için olanaktır. Bu değerler aykırı değerde olabilir. Birden fazla veri kümesinin karşılaştırılmasına yararlıdır. Uç değerlere karşı dirençlidir. Grafiğin çizimi için ortanca, birinci ve üçüncü çeyrek değerleri hesaplanır ve

DAG(Çeyrekler Arası Uzaklık)=d=Q3−Q1DAG(Çeyrekler Arası Uzaklık)=d=Q3−Q1

Vfarkı bulunur. Q3 ve Q1 farkı arasında yatay veya dikey eksende kutu çizilir. Kutunun içine ortanca çizgisi çizilir ve her iki ucundan, A=Q1−1.5d ve B=Q3+1.5d Uzunlukları kuşkulu gözlem sınırları olarak tanımlar. Bunlara eşik değerleri denir.Uç değerler eşik değerlerinin dışında olur ve işaretler.

Saçılım Grafiği

İki ya da daha çok değişken arasındaki çizimler, aykırı değerlerin varlığı bakımından, değişkenlerin birliktelikleri ya da bağımsızlıkları değişkenlerin etkinlikleri ve işlevsel yapı bakımından önemli bilgi verirler. İki değişken arasındaki ilişkinin yapısını ve yönünü verir.

Pasta Grafiği

Kategorik verileri görsel bir şekilde betimleyip özetlemek için hazırlanan; içindeki kategori dilimlerini orantısal olarak gösteren bir daire şeklinde sunulan bir gösterim aracıdır.