
Într-o distribuție a datelor, indicii de dispersie joacă un rol foarte important. Aceste măsurători le completează pe cele ale așa-numitei poziții centrale prin caracterizarea variabilității datelor.
The indici de dispersie le completează pe cele de tendinţă centrală. Ele sunt, de asemenea, esențiale într-o distribuție a datelor. Acest lucru se datorează faptului că ele caracterizează variabilitatea acestuia. Relevanța lor în pregătirea statistică a fost evidențiată de Wild și Pfannkuch (1999).
Percepția variabilității datelor este una dintre componentele de bază ale gândirii statistice, deoarece ne oferă informații despre dispersia datelor în raport cu o medie.
Interpretarea mediei
The medie aritmetică este utilizat pe scară largă în practică, dar poate fi adesea interpretat greșit. Acest lucru se întâmplă atunci când valorile variabilelor sunt foarte rare. În aceste ocazii este necesară însoțirea indicilor medii de dispersie (2).
Indicii de dispersie au trei componente importante legate de variabilitatea aleatorie (2):
- Percepția ubicuității sale în lumea din jurul nostru.
- Concursul pentru explicarea lui.
- Capacitatea de a o cuantifica (ceea ce presupune înțelegerea și cunoașterea modului de aplicare a conceptului de dispersie).

Pentru ce se folosesc indicii de dispersie?
Când este necesară generalizarea datelor unui eșantion dintr-o populație indicii de dispersie sunt foarte importanți deoarece influențează direct eroarea cu care lucrăm . Cu cât colectăm mai multă dispersie într-o probă, cu atât este mai mare dimensiunea de care avem nevoie pentru a lucra cu aceeași eroare.
Pe de altă parte, acești indici ne ajută să stabilim dacă datele noastre sunt departe de valoarea centrală. Ei ne spun dacă această valoare centrală este adecvată pentru a reprezenta populația studiată. Acest lucru este foarte util pentru compararea distribuțiilor și înţelege riscuri în procesul decizional (1).
Aceste rapoarte sunt foarte utile pentru compararea distribuțiilor și înțelegerea riscurilor în luarea deciziilor. Cu cât dispersia este mai mare, cu atât valoarea centrală este mai puțin reprezentativă .
Cele mai utilizate sunt:
- Gamă.
- Abaterea statistică .
- Varianta.
- Abatere standard sau tipică.
- Coeficientul de variație.
Funcţiile indicilor de dispersie
Gamă
Utilizarea rangului este pentru comparație primară. În acest fel, ia în considerare doar cele două observații extreme . Acesta este motivul pentru care este recomandat doar pentru mostre mici (1). Este definită ca diferența dintre ultima valoare a variabilei și prima (3).

Abaterea statistică
Abaterea medie indică unde ar fi concentrate datele dacă toată lumea ar fi la aceeași distanță de media aritmetică (1). Considerăm că abaterea unei valori variabile este diferența de valoare absolută dintre acea valoare variabilă și media aritmetică a seriei. Prin urmare, este considerată media aritmetică a abaterilor (3).
Varianta
Varianta este o funcție algebrică a tuturor valorilor adecvate sarcinilor statistice inferenţiale (1). Poate fi definită ca abatere pătratică (3).
Abatere standard sau tipică
Pentru probele prelevate din aceeași populație abaterea standard este una dintre cele mai utilizate (1). Este rădăcina pătrată a varianței (3).
Coeficientul de variație
Este o măsură folosită în primul rând pentru a compara schimbarea dintre două seturi de date măsurate în unități diferite Şi. De exemplu înălțime și greutate corp de studenți dintr-un eșantion. Este utilizat pentru a determina în ce distribuție datele sunt cel mai grupate și media este cea mai reprezentativă (1).

Coeficientul de variație este un indice de dispersie mai reprezentativ decât precedentul, deoarece este un număr abstract. Cu alte cuvinte este independent de unitățile în care apar valorile variabilelor. În general, acest coeficient de variație este exprimat în procente (3).
Concluzii asupra indicilor de dispersie
Indicii de dispersie indică pe de o parte gradul de variabilitate în eșantion. Pe de altă parte, reprezentativitatea valorii centrale deoarece dacă obțineți o valoare scăzută înseamnă că valorile sunt concentrate în jurul centrului respectiv. Acest lucru ar însemna că există o variabilitate redusă a datelor și că centrul reprezintă totul bine.
Dimpotrivă, dacă obțineți o valoare mare înseamnă că valorile nu sunt concentrate, ci împrăștiate. Aceasta înseamnă că există multă variabilitate și centrul nu va fi foarte reprezentativ. Pe de altă parte, atunci când facem inferențe, vom avea nevoie de un eșantion mai mare dacă dorim reduce eroarea crescut tocmai datorită creşterii variabilităţii.