Nel corso vengono sviluppati la teoria dell’inferenza, dei modelli e delle loro applicazioni.
Obiettivi Formativi
CONOSCENZA E COMPRENSIONE
Il corso è dedicato alla trattazione dell’inferenza statistica, dei modelli statistici per l’analisi della dipendenza fra più variabili quantitative e qualitative. Al centro del corso sta la trattazione degli elementi fondamentali del modello di regressione lineare multipla. In particolare, verranno trattati per dati sperimentali e non sperimentali: i modelli di regressione per dati continui, includendo eventualmente fattori e interazioni, l'analisi dei residui e le tecniche di scelta del modello. L’analisi dei dati qualitativi, mediante modelli logistici.
CAPACITÀ DI APPLICARE CONOSCENZA E COMPRENSIONE
Parte integrante del corso è anche la discussione delle situazioni reali in cui sono appropriati i metodi e delle assunzioni sottostanti. Verranno trattati vari esempi e applicazioni in ambito scientifico, tecnologico, economico e sociale. A tal fine si utilizzerà il linguaggio statistico R. Al termine del corso lo studente è in grado di analizzare dati sviluppando i modelli appropriati, adattando tali modelli con i metodi più efficienti e valutando e presentando i risultati in termini critici. Lo studente assimilerà il linguaggio R con cui stimare modelli di relativa complessità.
OBIETTIVI FORMATIVI
• Sviluppare la capacità di specificare modelli statistici appropriati a seconda del problema
• Imparare e saper applicare la teoria matematica della statistica
• Sviluppare la capacità di interpretare le stime e la capacità di comunicare I risultati in modo rigoroso, discutendo criticamente le conclusioni.
Prerequisiti
Calcolo delle Probabilità
Metodi Didattici
Lezioni frontali. Assegnazione di Esercizi. Esercitazioni in classe al calcolatore anche usando il linguaggio R. Verifica degli esercizi.
Frequenza delle lezioni ed esercitazioni: Raccomandata.
Strumenti a supporto della didattica:
UniFi E-Learning: http://e-l.unifi.it
Altre Informazioni
Lavori di gruppo per l'analisi di dati reali con R.
Modalità di verifica apprendimento
L'esame è basato per gli studenti frequentanti sulla valutazione di esercizi del libro di testo assegnati durante il corso ogni settimana e valutati in classe la settimana successiva e su un colloquio al termine del corso sui concetti teorici e i metodi previsti dal programma.
Il voto finale è una media ponderata del voto agli esercizi (33%) e del colloquio finale (67%). Se Lo studente non ha frequentato, l’orale prevede anche lo svolgimento di problemi del libro di testo.
Programma del corso
Il corso si articola su 12 settimane.
Modelli statistici, campionamento i.i.d.
Modelli probabilistici di dipendenza
Stima frequentista: modelli, stimatori, errore quadratico medio, Proprietà, intervalli di confidenza
Verosimiglianza. Esempi per vari modelli univariati. I modelli one-sample e two-sample
Proprietà degli stimatori di massima verosimiglianza (MV).
Dimostrazioni delle proprietà asintotiche degli stimatori di MV
Test di significatività. Valori p.
Statistica test del rapporto di verosimiglianza. Verosimiglianza profilo. Applicazioni agli intervalli di confidenza.
Il modello di regressione lineare semplice. Metodo dei minimi quadrati. Errori standard. Intervalli di confidenza e test.
Il modello di regressione lineare multipla. Significato dei coefficienti di regressione parziale. Devianza. covariate e fattori. Interazioni.
Modello di regressione logistica. Stima di massima verosimiglianza. Devianza e test.
Scelta del modello. Metodi di penalizzazione. Cross-validation.
Modelli grafici di dipendenza. Grafi orientati. Rappresentazione delle indipendenze.
Test di indipendenza condizionata.