Cose la frequenza relativa cumulata
Contenuto
Formula di frequenza cumulativa
Dalla tabella precedente possiamo vedere che ci sono livelli errati nel fumo e nel sesso, per rimuoverli usiamo il seguente codice includendo nel parametro exclude un vettore con i livelli che NON vogliamo nella tabella.
Costruire tabelle di frequenza per variabili quantitative è necessario in molte procedure statistiche, la funzione hist è usata per ottenere questo tipo di tabella. La struttura della funzione è la seguente.
Genera 200 osservazioni casuali da una distribuzione normale con media \(\mu=170) e varianza \(\sigma=5), poi costruisci una tabella di frequenza per il campione ottenuto usando (a) la regola di Sturges e (b) tre intervalli con limiti 150, 170, 180 e 190.
Prima costruite il vettore x con le osservazioni dalla distribuzione normale per mezzo della funzione rnorm e specificate la media e la varianza richieste. Poi si applica la funzione hist con il parametro breaks=’Sturges’, ecco il codice utilizzato.
L’oggetto res1 è una lista dove si trovano le informazioni della tabella di frequenza per x. Questa lista ha nelle interruzioni degli elementi i limiti inferiori e superiori degli intervalli e nei conteggi degli elementi le frequenze di ciascuno degli intervalli.
Frequenza cumulativa relativa
Prima di imparare a costruire una tabella di frequenza, dobbiamo conoscere i tipi di frequenze che esistono e come si calcolano. Ci sono frequenze assolute e relative, così come frequenze cumulative assolute e relative.
La frequenza assoluta accumulata è la somma delle frequenze assolute che si accumulano fino a quel dato, cioè, la frequenza assoluta accumulata di un dato specifico si ottiene sommando la sua frequenza assoluta alle frequenze assolute dei dati che sono inferiori ad essa.
O anche, come la somma della frequenza relativa di un dato più la frequenza relativa del dato precedente. Quindi, la frequenza relativa cumulativa del primo dato coincide con la sua frequenza relativa e la frequenza relativa cumulativa è uguale a 1.
Se non volete leggere oltre, ecco i due esempi qui sotto (come fare una tabella di frequenza con dati isolati e con dati raggruppati) spiegati passo dopo passo in formato video se vi piace di più questo formato:
Come ottenere la frequenza relativa
Le tabelle di frequenza sono strumenti statistici in cui i dati sono disposti in colonne che rappresentano i diversi valori raccolti nel campione e le frequenze (le volte) in cui si verificano.
I dati non raggruppati sono quelle osservazioni fatte in uno studio statistico che sono presentate nella loro forma originale come sono state raccolte, al fine di ottenere informazioni direttamente da esse.
La tabella di frequenza dei dati raggruppati è quella distribuzione in cui i dati statistici sono organizzati in classi e con la frequenza di ogni classe; cioè, i dati originali di diversi valori adiacenti dell’insieme sono combinati per formare un intervallo di classe.
Il Run è il limite entro il quale sono contenuti tutti i valori della serie di dati. È la differenza tra il valore massimo di una variabile e il valore minimo che assume in una qualsiasi indagine.
Frequenza percentuale cumulativa
Diamo per scontato che la sezione precedente sia stata molto facile per voi. Soprattutto perché avete lavorato con elementi che vi ricorderanno cose già viste. Da un lato, avete già superato la proporzionalità e le percentuali nell’unità 1. Inoltre, avete già lavorato sulle tabelle dei numeri quando abbiamo guardato l’introduzione alle funzioni nell’unità 3. Si noti che le tabelle della sezione precedente possono anche essere considerate una relazione, anche se sarebbe casuale piuttosto che funzionale, cioè, in generale, non troveremo un’espressione algebrica che metta in relazione le colonne.
Come abbiamo detto nella sezione precedente, le frequenze che abbiamo definito possono essere utilizzate con qualsiasi tipo di variabile statistica. Ma ce ne sono altri, che completano quelli visti, che possono essere utilizzati solo quando la variabile studiata è quantitativa. Questo perché è necessario che la variabile sia ordinata. Per esempio, non ha senso chiedere chi ha un colore di capelli inferiore al biondo, ma ha senso chiedere quali assicurati hanno avuto meno di due incidenti, poi quelli che hanno avuto un solo incidente e quelli che non ne hanno avuto nessuno sarebbero considerati insieme. Questa idea di raggruppamento è ciò che lavoreremo con le frequenze accumulate.