Praktiki vizuallaşdırma, məlumatları və ideyaları daha aydın və anlaşılan şəkildə təqdim etmək üçün müxtəlif vizual vasitələrdən istifadə etmə prosesidir. Bu şəkillər, qrafiklər, diaqramlar, xəritələr, infografiklər və digər vizual elementlər vasitəsilə həyata keçirilir. Məqsəd, məlumatları daha effektiv və intuitiv şəkildə təqdim edərək, məlumatların daha yaxşı anlaşılmasını, datadakı trendləri, kənar komponentləri (outliers) görməyi və anlamağı təmin etməkdir.
Big Data dünyasında data vizualizasiya əməliyyatları və texnologiyaları böyük miqdarda olan informasiyanı analiz etməkdə və bu analizə əsasən qərar verməkdə əvəzolunmazdır.
Gözlərimiz rəngləri ayırd etməkdə və ümumi tendensiyanı yəni qrafiklərdəki əsas cərəyan oxunu müəyyən etməkdə daha sürətlidir.. Misal üçün, biz qırmızını göydən, kvadratı dairədən rahatlıqla ayıra bilirik. Bu fərqlilik diqqətimizi informasiya üzərinə daha tez topluyur. Big datanın son sürət inkişaf elədiyi bir vaxtda vizuallaşdırma trilyonlarla datanı daha rahat analiz etməyimiz üçün çox əlverişli bir sahədir. Yaxşı bir vizuallaşdırma lazımsız elementləri datadan xaric edir və lazımi olanları isə ön plana çəkir. Datanın yazıldığı cədvələ baxıb trendi və digər lazımi elementləri seçə bilməyəndə effektiv vizualizasiyanın nə qədər önəmli olduğunu anlamaq olur.
Effektiv data vizuallaşdırması həm qrafikin formasını, həm də onun oxucuya çatdıracağı məlumatı balanslaşdırır. Yəni çox bəzənmiş qrafik insanın gözünü yorar, az effektlər olan isə insana darıxdırıcı gələr. Data və vizual effektlər gərək bir yerdə işlənsinlər.
Data vizuallaşdırmada sadə bar qrafiklər (bar graphics) və ya pie qrafiklərlə (pie charts) yanaşı datanı effektiv və maraqlı yolla təqdim etmək üçün bir çox vizualizasiya formaları mövcuddur.
Ümumi data vizuallaşdırma tipləri:
1) Charts (qrafik)
2)Tables (cədvəl)
3)Graphs (qrafik)
4)Maps (xəritə)
5)Infographics (infoqrafiklər)
6)Dashboards (panel)
Praktiki vizuallaşdırma prosesini aşağıdakı şəkildə göstərmək olar:
1. Məlumatın İcmalı
Data analitikada, məlumatların vizuallaşdırılması ilk addım olaraq geniş və qarışıq məlumatların icmalını təqdim edir. Bu, istifadəçilərə məlumatların əsas xüsusiyyətlərini tez bir zamanda başa düşməkdə kömək edir. Məsələn, böyük məlumat dəstləri üçün qrafiklər, histogramlar və s. şəkilləri istifadə olunur.
Məs: Bir data yaradaq:
df = pd.DataFrame( {
'Kateqoriya': ['A', 'B', 'C', 'D', 'E'],
'Dəyər1': [10, 20, 15, 30, 25],
'Dəyər2': [5, 15, 10, 20, 30]
})
#Daha sonra bu datanı aşağıdakı kod vasitəsi ilə dioqram halına salaq:
plt.figure(figsize=(10, 6))
sns.barplot(data=df.melt(id_vars='Kateqoriya'), x='Kateqoriya', y='value', hue='variable')
plt.xlabel('Kateqoriya')
plt.ylabel('Dəyər')
plt.title('Kateqoriyalara Görə Dəyər1 və Dəyər2')
plt.show()
Dioqramda dəyərlər arasındakı fərqi asanlığla görmək olar.
2. Trendlərin Görüntülənməsi.
Vizuallaşdırma, məlumatlar arasında mövcud olan trendləri və əlaqələri aşkar etməyə kömək edir. Misal üçün, zaman seriyası qrafikləri, bir müddət ərzində baş verən dəyişiklikləri göstərmək üçün istifadə edilir, beləliklə analitiklər məlumatlardakı mövsümi və ya uzunmüddətli trendləri izləyə bilərlər.
Data yaradaq:
data = {
'Tarix': pd.date_range(start='2023–01–01', periods=12, freq='M'),
'Dəyər': [120, 130, 125, 140, 135, 150, 145, 155, 160, 165, 170, 175]
}
# Qrafikini quraq :
plt.figure(figsize=(12, 6))
plt.plot(df['Tarix'], df['Dəyər'], marker='o', linestyle='-', color='b')
plt.xlabel('Tarix')
plt.ylabel('Dəyər')
plt.title(' Dəyərin Zamanla Dəyişməsi')
plt.show()
3. Müxtəlif Kategoriyaların Təhlili
Piqmentlər, bar qrafikləri və pie qrafikləri kimi müxtəlif vizuallaşdırma vasitələri, məlumatları fərqli kateqoriyalara görə qruplaşdırmağa və müqayisə etməyə kömək edir. Bu, fərqli qrupların və ya müştəri seqmentlərinin performansını və ya payını tez bir zamanda görməyə imkan tanıyır.
Məlumat yaradaq:
data = {
'Cins': ['Qadın', 'Kişi'],
'Nümunə Sayı': [150, 200]
}
df = pd.DataFrame(data)
#Qrafik halına gətirək:
plt.figure(figsize=(8, 6))
plt.pie(df['Nümunə Sayı'], labels=df['Cins'], autopct='%1.1f%%')
plt.title('Qadın və Kişi Kateqoriyalarının Payı')
plt.show()
4. Məlumatlar Arasında Əlaqələrin Aşkar Edilməsi
Scatter qrafikləri və heatmap-lər məlumatlar arasında əlaqələri vizual şəkildə göstərə bilər. Məsələn, scatter qrafikləri iki dəyişkən arasındakı əlaqəni göstərir, heatmap-lər isə bir çox dəyişkən arasındakı münasibətləri və ya anomaliyaları asanlıqla ortaya çıxarır.
#Data yaradaq
age = [22, 25, 47, 52, 46, 35, 29, 41]
income = [30000, 35000, 65000, 70000, 68000, 55000, 42000, 60000]
#Qrafik
plt.scatter(age, income, color='blue')
plt.title('Yaş vs Gəlir')
plt.xlabel('Yaş')
plt.ylabel('Gəlir')
plt.grid(True)
plt.show()
5. Dəyişikliklərin və Anomaliyaların İzlənməsi
Vizuallaşdırma, məlumatlardakı dəyişiklikləri və ya anomaliyaları izləmək üçün istifadə olunur. Məsələn, bir məlumat dəstindəki kəskin dəyişikliklər və ya alışılmadıq vəziyyətlər tez bir zamanda fərqləndirilə bilər.
# Məlumatlar
np.random.seed(0)
X = np.random.randn(100, 1)
X[95:] = np.random.randn(5, 1) * 10 # Anomaliyalar əlavə et
# Anomaliya aşkarlanması
model = IsolationForest(contamination=0.05)
y_pred = model.fit_predict(X)
# Qrafik
plt.scatter(range(len(X)), X, c=y_pred, cmap='coolwarm', marker='o')
plt.title('Anomaliya Aşkarlanması')
plt.xlabel('Index')
plt.ylabel('Dəyər')
plt.show()
6. İnteraktiv Analizlər
İnteraktiv vizuallaşdırma vasitələri, istifadəçilərə məlumatlar arasında interaktiv şəkildə gəzməyə və müxtəlif aspektləri sınamağa imkan verir. Bu, məlumatların fərqli filtrasiya üsulları ilə nəzərdən keçirilməsini təmin edir.
import plotly.graph_objects as go
import pandas as pd
# Məlumatlar
data = pd.DataFrame({
'Ay': ['Yanvar', 'Fevral', 'Mart', 'Aprel', 'May', 'İyun'],
'Satış': [3000, 3200, 3100, 3300, 3500, 3400]
})
# İnteraktiv Bar Qrafiki
fig = go.Figure(data=[go.Bar(x=data['Ay'], y=data['Satış'])])
fig.update_layout(
title='Aylıq Satışların İnteraktiv İzlənməsi',
xaxis_title='Ay',
yaxis_title='Satış',
template='plotly_dark'
)
# İnteraktiv qrafiki göstər
fig.show()
7. Təqdimatlar və Raporlar
Vizuallaşdırma, analitik nəticələrin təsirli şəkildə təqdim edilməsi üçün geniş istifadə olunur. Qrafiklər, diaqramlar və infografiklər, təqdimatlarda və raporlarda məlumatların daha anlaşılır və cəlbedici şəkildə təqdim olunmasına kömək edir.
Bu cür vizuallaşdırma üsulları data analitikada məlumatların daha tez başa düşülməsi, qərarların daha sürətli və daha yaxşı əsaslandırılması üçün vacibdir.