Normallaşdırma faydalıdır verilənlər müxtəlif miqyaslara malik olduqda və istifadə etdiyiniz alqoritm məlumatlarınızın paylanması ilə bağlı fərziyyələr irəli sürmədikdə, məsələn, k-ən yaxın qonşular və süni sinir şəbəkələr. Standartlaşdırma məlumatınızın Qauss (zəng əyrisi) paylanmasına malik olduğunu güman edir.
Dataları nə vaxt normallaşdırmalıyıq?
Bütün dəyişənləri bir-biri ilə mütənasibləşdirmək üçün verilənlər normallaşdırılmalı və ya standartlaşdırılmalıdır. Məsələn, əgər bir dəyişən digərindən 100 dəfə böyükdürsə (orta hesabla), iki dəyişəni təxminən ekvivalent olmaq üçün normallaşdırsanız/standartlaşdırsanız, modeliniz daha yaxşı davrana bilər.
Normallaşdırma ilə standartlaşdırma arasında fərq nədir?
Normallaşdırma adətən dəyərləri [0, 1] diapazonuna yenidən ölçmək deməkdir. Standartlaşdırma adətən verilənlərin miqyasının ortası 0 və standart kənarlaşması 1 (vahid fərq) olacaq şəkildə yenidən ölçülməsi deməkdir.
Bizə məlumatların normallaşdırılması nə vaxt və nə üçün lazımdır?
Daha sadə dillə desək, normallaşdırma bütün datanızın bütün qeydlərdə eyni şəkildə göründüyünə və oxunduğuna əmin olur. Normallaşdırma şirkət adları, əlaqə adları, URL-lər, ünvan məlumatları (küçələr, ştatlar və şəhərlər), telefon nömrələri və iş adları daxil olmaqla sahələri standartlaşdıracaq.
Normallaşdırma və standartlaşdırmanı necə seçirsiniz?
İş dünyasında "normallaşdırma" adətən dəyərlər diapazonunun eyni olması deməkdir"0,0 ilə 1,0 olmaq üçün normallaşdırılıb". "Standartlaşdırma" adətən dəyərlər diapazonunun dəyərin ortadan neçə standart kənarlaşma olduğunu ölçmək üçün "standartlaşdırıldığını" bildirir.