Statistica descrittiva

Andiamo a descrivere una popolazione tramite un campione che assumiamo essere rappresentativo della popolazione, diciamo che N è la dimensione del campione dove N è il numero di osservazioni di cui è costituito il campione.

Frequenza assoluta:

 La frequenza assoluta di un osservazione w è il numero di volte che si è osservata nel campione e la indicheremo con N(w).

Frequenza relativa:

 La frequenza relativa di un osservazione w è il rapporto tra tra il numero di volte che si osserva w nel campione [N(w)] e la dimensione del campione [N].

Possiamo rappresentare la frequenza relativa e assoluta tramite dei grafici.

Esempio: lancio di un dado 24 volte

Frequenza assoluta di un esperimento con 24 lanci
Frequenza assoluta di un esperimento con 24 lanci
Istogramma
Istogramma
Box-plot
Box-plot
Frequenza relativa
Frequenza relativa

Frequenza cumulativa

 E' l'equivalente della funzione di distribuzione 

Percentili

Si dice n-essimo percentile l'osservazione w per cui F(w)=n/100 più in generale se viene chiesto l'n-esimo quartile ad esempio prenderemo w per cui F(w)= n/4 e cosi via in base alla frazione che viene richiesta. Da questo punto di vista possiamo definire la mediana come il 50-esimo percentile. La moda anche nella statistica descrittiva viene intesa come il valore più frequente. Per la media parleremo di media aritmetica e ponderata, la media aritmetica è la sommatoria dei valori osservati fratto il numero di campioni mentre la media ponderata vede i campioni pesati con dei coefficienti e poi la sommatoria suddivisa per la somma dei coefficienti.

Scarto assoluto medio 


E' una misura della dispersione in una popolazione, da non confondere con la varianza che viene detta invece scarto quadratico medio e si ottiene dividendo per n-1 e non per n.

Variabili aleatorie vettoriali

Ci si introduce facilmente considerando che tutte le integrazioni fatte andranno trasformate in integrali doppi, tripli, n-pli in base alla dimensione della variabile aleatoria. Introdurremo invece il nuovo concetto di distribuzione marginale, covarianza e di densità di probabilità condizionata.

Distribuzioni marginali:

Immaginate questa distribuzione di due variabili

Fissando y1 e integrando rispetto a y2 si ottiene la distribuzione marginale di y2 per quel valore di y1 e viceversa.

Covarianza;

 E'la media dei prodotti delle distanze dalla media dei valori di ciascuna variabile

Indice di correlazione 

E' un indice che ci da informazioni sul fatto che vi sia una relazione lineare tra le due variabili.


Densità di probabilità condizionata:

 La otteniamo muovendoci su una riga o su una colonna della matrice all'inizio

 2018 SolinasMakerShow
Creato con Webnode
Crea il tuo sito web gratis! Questo sito è stato creato con Webnode. Crea il tuo sito gratuito oggi stesso! Inizia