Normalization är bra att använda när du vet att distributionen av dina data inte följer en Gaussisk distribution. … Standardisering, å andra sidan, kan vara till hjälp i de fall då data följer en gaussisk fördelning.
Ska jag använda normalisering eller standardisering?
Normalisering är användbar när din data har olika skalor och algoritmen du använder inte gör antaganden om distributionen av dina data, såsom k-närmaste grannar och artificiella neurala nätverk. Standardization förutsätter att din data har en Gaussisk (klockkurva) fördelning.
Är standardisering detsamma som normalisering?
I affärsvärlden betyder "normalisering" vanligtvis att värdeintervallet är "normaliserat till att vara från 0.0 till 1,0". "Standardisering" betyder vanligtvis att värdeintervallet är "standardiserat" för att mäta hur många standardavvikelser värdet är från dess medelvärde.
Är det alltid bra att normalisera data?
Genom att normalisera slänger du faktiskt en del information om data, såsom de absoluta max- och minivärdena. Så det finns ingen tumregel. Som andra sa, normalisering är inte alltid tillämplig; t.ex. ur praktisk synvinkel.
När ska du inte normalisera data?
Några bra skäl att inte normalisera
- Anslutningar är dyra. Normalisering av din databas innebär ofta att du skapar många tabeller. …
- Normaliserad design är svår. …
- Snabbt och smutsigt ska vara snabbt och smutsigt. …
- Om du använder en NoSQL-databas är traditionell normalisering inte önskvärd.