69703 - ANALISI STATISTICA DEI DATI NELLA FISICA NUCLEARE E SUBNUCLEARE

Scheda insegnamento

Anno Accademico 2017/2018

Conoscenze e abilità da conseguire

Al termine del corso, lo studente possiede una conoscenza approfondita degli strumenti statistici principalmente utilizzati nella fisica delle alte energie, con e senza acceleratori, acquisita mediante esercitazioni su problemi di comune applicazione in ambito probabilistico e statistico e laboratori in cui vengono utilizzati gli strumenti informatici adatti alla risoluzione delle problematiche affrontate nella parte teorica.

Programma/Contenuti

Il corso è strutturato in una parte di teoria, in un modulo di esercizi e in un modulo di laboratorio:

  1. Teoria e fondamenti (docente: M. Sioli)
  2. Complementi ed esercitazioni di statistica (docente: T. Chiarusi)
  3. Laboratorio di analisi statistica per la fisica delle alte energie (docente: G. Sirri)

Programma dettagliato:

Concetto di probabilità: definizione assiomatica, combinatoriale, frequentista e soggettivista. Probabilità condizionata. Indipendenza statistica. Teorema di Bayes.

Variabili aleatorie e densità di probabilità. Distribuzioni multivariate. Densità marginali e condizionali. Funzioni di variabili aleatorie. Caratteristiche numeriche: valore d'aspettazione, varianza, covarianza. Propagazione degli errori nel caso di variabili correlate. Esempi di distributioni: binomiale, multinomiale, poisson, esponenziale, normale, normale multivariata, chi-quadrato, Breit-Wigner, Landau.

Funzioni caratteristiche e loro utilizzo. Teorema del limite centrale.

Inferenza statistica. Informazione in ambito statistico. Informazione di Fisher. Statistiche test sufficienti.

Metodo Monte Carlo: criteri di convergenza, legge dei grandi numeri, stima di integrali e loro incertezze. Riduzione della varianza. Generatori di numeri random, uniformi e con distribuzione generica.

Caratteristiche generali degli estimatori statistici. Statistiche test ed estimatori. Estimatori per il valore di aspettazione, varianza e correlazione. Varianza degli estimatori. Metodo della massima verosimiglianza. Informazione di Fisher. Tecniche per la stima delle incertezze degli estimatori con un parametro. Tecniche per la stima delle incertezze degli estimatori nel caso multiparametrico in presenza di correlazioni. Extended Maximul Likelihood. Estimatori bayesiani, Jeffrey's priors. Metodo dei minimi quadrati, stima dei parametri e incertezze.

Test di ipotesi. Ipotesi semplici. Efficienza e potenza del test. Lemma di Neyman-Pearson. Test lineare, discriminante di Fisher. Metodi multivariati: reti neurali, Boosted Decision Tree, k-Nearest Neighbor. Significanza statistica. P-values. Look-Elsewhere Effect. Metodo chi-quadrato per i test di ipotesi.

Metodi esatti per la costruzione degli intervalli di confidenza. Caso gaussiano e poissoniano. Approccio unificato. Metodo bayesiano. Metodo CLs.

Errori sistematici e parametri di nuisance nel calcolo degli intervalli di confidenza. Metodo frequentista e bayesiano.
Proprietà asintotiche.

Parte di laboratorio: Richiami di C++ e ROOT. RooFit Workspace, Factory, modelli composti, modelli multi-dimensionali. Uso di RooStats per il calcolo di intervalli di confidenza, Profile Likelihood, Feldman-Cousins, intervalli bayesiani, con e senza parametri di nuisance. Utilizzo di TMVA come classificatore, descrizione di TMVAGui.

Testi/Bibliografia

Testi base:
  • Glen Cowan, Statistical Data Analysis, Oxford Univ. Press, 1998
  • Frederick James, Statistical Methods in Experimental Physics, World Scientific, 2007

Approfondimenti:

  • O. Behnke et al., Data Analysis in High Energy Physics: A Practical Guide to Statistical Methods, Wiley, 2013
  • A. G. Frodesen, O. Skjeggestad, H. Toft, Probability and Statistics in Particle Physics, Universitetforlaget, 1979

Statistica bayesiana:

  • G. D'Agostini, Bayesian reasoning in data analysis - A critical introduction, World Scientific Publishing, 2003

 Metodo Monte Carlo:

  •  A. Rotondi et al., Probabilità, Statistica e Simulazione, Springer, 2012

Metodi didattici

Lezioni frontali (lavagna e proiettore), esercizi alla lavagna e laboratorio con utilizzo di applicativi per la risoluzione di esercizi.

Modalità di verifica dell'apprendimento

L'esame è solo orale. Per poter sostenere l'orale è necessario aver completato e consegnato al docente le prove pratiche di laboratorio, che non influiscono comunque sul voto finale. L'esame è presieduto dai tre docenti e indicativamente vengono poste tre domande sui tre moduli: una domanda di teoria, una verifica sulla capacità di impostazione di un esercizio pratico, una verifica sulla capacità di utilizzo degli strumenti software.

Le date degli appelli sono da concordare con i docenti e vanno fissate all'interno delle sessioni d'esame. Per iscriversi è necessario spedire un'email a maximiliano.sioli@unibo.it.

Per gli studenti della laurea magistrale l'esame verterà sull'intero programma del corso. Per i dottorandi, invece, si richiede la preparazione di un seminario (della durata di circa 30 minuti), in cui vengano mostrati con chiarezza gli aspetti della loro attività che hanno tratto profitto dalle tecniche apprese a lezione.

Strumenti a supporto della didattica

Le slides presentate a lezione sono disponibili su AMS Campus.

Orario di ricevimento

Consulta il sito web di Maximiliano Sioli

Consulta il sito web di Tommaso Chiarusi

Consulta il sito web di Gabriele Sirri