Che cosa sono le statistiche non parametriche?
Le statistiche non parametriche si riferiscono a un metodo statistico in cui non si presume che i dati provengano da modelli prescritti determinati da un numero limitato di parametri; esempi di tali modelli includono il modello di distribuzione normale e il modello di regressione lineare. Le statistiche non parametriche a volte utilizzano dati ordinali, il che significa che non si basano sui numeri, ma piuttosto su una classifica o un ordine di sorta., Ad esempio, un sondaggio che trasmette le preferenze dei consumatori che vanno da like a dislike sarebbe considerato dati ordinali.
Le statistiche non parametriche includono statistiche descrittive non parametriche, modelli statistici, inferenza e test statistici. La struttura del modello dei modelli non parametrici non è specificata a priori ma è invece determinata dai dati. Il termine non parametrico non intende implicare che tali modelli mancano completamente di parametri, ma piuttosto che il numero e la natura dei parametri sono flessibili e non fissati in anticipo., Un istogramma è un esempio di stima non parametrica di una distribuzione di probabilità.
Key Takeaways
- Le statistiche non parametriche sono facili da usare ma non offrono la precisione millimetrica di altri modelli statistici.
- Questo tipo di analisi è spesso più adatto quando si considera l’ordine di qualcosa, dove anche se i dati numerici cambiano, i risultati rimarranno probabilmente gli stessi.,
Comprendere le statistiche non parametriche
Nelle statistiche, le statistiche parametriche includono parametri come la media, la deviazione standard, la correlazione di Pearson, la varianza, ecc. Questa forma di statistiche utilizza i dati osservati per stimare i parametri della distribuzione. Nelle statistiche parametriche, si presume spesso che i dati provengano da una distribuzione normale con parametri sconosciuti μ (media della popolazione) e σ2 (varianza della popolazione), che vengono poi stimati utilizzando la media del campione e la varianza del campione.,
Le statistiche non parametriche non presuppongono la dimensione del campione o se i dati osservati sono quantitativi.
Le statistiche non parametriche non presuppongono che i dati siano tratti da una distribuzione normale. Invece, la forma della distribuzione è stimata sotto questa forma di misurazione statistica. Mentre ci sono molte situazioni in cui si può presumere una distribuzione normale, ci sono anche alcuni scenari in cui il vero processo di generazione dei dati è ben lungi dall’essere distribuito normalmente.,
Esempi di statistiche non parametriche
Nel primo esempio, si consideri un analista finanziario che desidera stimare il valore a rischio (VaR) di un investimento. L’analista raccoglie i dati sugli utili da 100 di investimenti simili su un orizzonte temporale simile. Piuttosto che presumere che i guadagni seguano una distribuzione normale, usa l’istogramma per stimare la distribuzione in modo non parametrico. Il 5 ° percentile di questo istogramma fornisce quindi all’analista una stima non parametrica di VaR.,
Per un secondo esempio, considera un ricercatore diverso che vuole sapere se le ore medie di sonno sono legate alla frequenza con cui uno si ammala. Poiché molte persone si ammalano raramente, se non del tutto, e altri occasionali si ammalano molto più spesso della maggior parte degli altri, la distribuzione della frequenza della malattia è chiaramente non normale, essendo distorta e soggetta a valori anomali., Pertanto, piuttosto che utilizzare un metodo che presuppone una distribuzione normale per la frequenza della malattia, come avviene nell’analisi di regressione classica, ad esempio, il ricercatore decide di utilizzare un metodo non parametrico come l’analisi di regressione quantile.
Considerazioni speciali
Le statistiche non parametriche hanno guadagnato apprezzamento grazie alla loro facilità d’uso. Man mano che la necessità di parametri viene alleviata, i dati diventano più applicabili a una varietà più ampia di test., Questo tipo di statistiche può essere utilizzato senza la media, la dimensione del campione, la deviazione standard o la stima di altri parametri correlati quando nessuna di queste informazioni è disponibile.
Poiché le statistiche non parametriche fanno meno ipotesi sui dati di esempio, la sua applicazione è più ampia rispetto alle statistiche parametriche. Nei casi in cui il test parametrico è più appropriato, i metodi non parametrici saranno meno efficienti. Questo perché le statistiche non parametriche scartano alcune informazioni disponibili nei dati, a differenza delle statistiche parametriche.,