venerdì 6 febbraio 2009

Analisi Econometrica sulle morti per tumore (6)

REGRESSIONE STATISTICA

L’obiettivo del presente lavoro è quello di sviluppare un modello econometrico che mi conduca a stimare la relazione intercorrente tra il numero di decessi per causa tumore, il reddito pro-capite, il numero di anziani e il dislocamento di materiale radioattivo sul territorio italiano. I dati che utilizzerò sono in parte riportati dalle banche dati Istat relative all’anno 2003 e in parte da me generati secondo una relazione riportata nel paragrafo precedente, sempre sulla base di dati statistici.
Il modello econometrico sviluppato è una regressione lineare multipla, la quale mi ha permesso di stimare l’effetto sulla variabile dipendente Y di un variazione di tre variabili indipendenti X1, X2 e X3 .

Pertanto a tali variabili ho associato:
Y N° di decessi per causa tumore su diecimila abitanti [Morti]
X1 Reddito pro-capite [Reddito]
X2 N° di over-65 su diecimila abitanti [Anziani]
X3 Coefficiente totale di radioattività derivante dalla
presenza sul territorio di centrali, depositi o reattori
più l’indice di radioattività in base alla distanza [Coeff. Totale]


Per effettuare la stima OLS dei coefficienti B1,B2 ,B3 ,B4 , degli errori e della bontà della regressione mi sono servito del pacchetto Stata/SE 10.0.



Pertanto la funzione di regressione stimata sarà:


L’R2 di regressione indica la frazione della varianza campionaria di Y spiegata dai repressori Xi , variando tra zero e uno. Dall’analisi della regressione si evince che, avendo un R2=0.7187, le variabili indipendenti spiegano gran parte della variabilità della Y. Inoltre, le tre variabili indipendenti partecipano congiuntamente alla determinazione della variabile dipendente, cosa che possiamo notare dai coefficienti regressione.
Per una più attenta analisi consideriamo il test t per la verifica delle ipotesi; in tal modo il valore della statistica t ci permetterà di rifiutare o meno l’ipotesi nulla. Pertanto, nell’analisi della regressione notiamo che il valore più consistente del test t è associato al numero di anziani presenti nella zona considerata, riportando un valore pari a 11.22. Anche il reddito ci permetterà di rifiutare l’ipotesi nulla poiché la statistica t è pari a 4.58; la stessa cosa non vale per la presenza di materiale radioattivo sul territorio italiano, che con un valore di 1.11 ci porterebbe a non rifiutare l’ipotesi nulla ad un livello minimo di 1.96. Può essere d’aiuto scomporre gli effetti di tale regressione in differenti analisi regressive combinando le variabili osservate precedentemente

Nessun commento: