Il tumore o meno comunemente neoplasia (dal greco neo, nuovo, e plasìa, formazione), o cancro se è maligno, appartiene ad una classe di malattie caratterizzate da una incontrollata riproduzione di alcune cellule dell'organismo, che smettono di rispondere ai meccanismi fisiologici di controllo cellulare a seguito di danni al loro patrimonio genetico. Una cellula per diventare tumorale deve impazzire, cioè deve esserci un errore nel sistema che controlla la sua riproduzione. Tutte le cellule cancerose e precancerose presentano infatti alterazioni molto estese del loro assetto cromosomico (cariotipo): il numero di cromosomi presenti nel loro nucleo è alterato e i cromosomi stessi sono danneggiati, multipli o mancanti
venerdì 6 febbraio 2009
Analisi Econometrica sulle morti per tumori (2)
LE FORME TUMORALI SUL TERRITORIO ITALIANO
Un’analisi effettuata dal giornale “L’Espresso” conferma la percezione comune: il continuo dilagare di leucemie e tumori sul territorio italiano. Negli ultimi venti anni le patologie tumorali sono cresciute del 40%. La stessa rivista afferma che “le cifre sono arrivate al livello da epidemia”: i tumori alla mammella sono aumentati del 27%, quelli al cervello del 10%, quelli al fegato del 20%. Dati impressionanti che non risparmiano i bambini, basti pensare che in Piemonte negli ultimi venti anni il tasso di incidenza dei tumori sui bambini è cresciuto del 1,3% all’anno. Ciononostante il cancro può colpire persone di ogni età, anche se da dati statistici affermano che le persone anziane sono colpite con maggiore frequenza, perché i danni genetici tendono ad accumularsi con il tempo. La crescita delle patologie è rilevata un po’ ovunque in Italia, poiché ancora non è stata riscontrata una reale e definita causa che è alla base dei dannosi effetti tumorali. Le zone più a rischio in Italia spesso corrispondono a zone adiacenti impianti industriali e nucleari oppure coincidono con le grandi zone metropolitane dove lo smog generato dal traffico automobilistico e dagli impianti di riscaldamento aumenta in particolar modo l'incidenza dei tumori al polmone. Chi vive in una città inquinata ha il 25% di rischio in più di contrarre questa forma tumorale. Ma la vita in campagna non sembra certamente salvare la popolazione dai rischi alla salute: l'inquinamento delle falde acquifere, lo smog trasportato dal vento e le discariche clandestine influiscono sul proliferare di tali malattie. Tra la popolazione sono le donne a perdere più punti in salute, a causa dei cambiamenti negli stili di vita; e sono proprio quest’ultimi che, secondo esperti, diversificano gli indici di mortalità per tumori anche tra il Nord e il Sud del paese.
Da ciò si evince che non c’è una definita causa del continuo proliferare delle forme tumorali in Italia, bensì si presenta come un mix di cause che crea non pochi danni sul territorio nazionale.
Per tale motivo ho deciso di effettuare un’analisi statistica che prendesse in considerazione il numero dei morti per tumori sul territorio italiano e paragonarlo con altri indici relativi a quelli che, secondo il mio avviso, possono sintetizzare in miglior modo le cause di tale fenomeno distruttivo.
Da ciò si evince che non c’è una definita causa del continuo proliferare delle forme tumorali in Italia, bensì si presenta come un mix di cause che crea non pochi danni sul territorio nazionale.
Per tale motivo ho deciso di effettuare un’analisi statistica che prendesse in considerazione il numero dei morti per tumori sul territorio italiano e paragonarlo con altri indici relativi a quelli che, secondo il mio avviso, possono sintetizzare in miglior modo le cause di tale fenomeno distruttivo.
Anlisi Econometrica sulle morti per tumore (3)
ANALISI DEI DATI
Tale lavoro si propone di analizzare la distribuzione della mortalità per tumore nelle regioni italiane per poi passare ad un’analisi più specifica per provincia. I dati relativi alla mortalità, alla popolazione e i dati relativi alle principali cause di morte sono stati ripresi dai database Istat online del 2003. Globalmente si nota una grande variabilità nella mortalità per tumori tra il Nord e il Sud del paese, che più dettagliatamente possiamo analizzare nei dati di ogni regione. Pertanto ho deciso di analizzare attraverso un’inferenza statistica quale potesse essere la causa di maggior rilievo che stesse alla base di una continua proliferazione tumorale. Di certo le cause non possono essere analizzate nella loro globalità poiché sarebbero talmente elevate le cause, note o meno, che potrebbero comportare la nascita di forme tumorali. Di conseguenza ho analizzato in prima istanza il numero di decessi sull’intero territorio nazionale, prima per regione, poi per provincia e successivamente ho analizzato tali dati comparandoli con le cause di maggior rilievo: reddito pro-capite, numerosità di individui anziani e posizionamento delle centrali nucleari.
3.1 La mortalità per tumore
La prima variabile che ho preso in considerazione, nonché quella attorno a cui si incentra l’analisi statistica è il numero di decessi per tumore. A tale scopo ho raccolto dei dati[1] riguardanti la popolazione residente e il numero dei decessi per tumore per ogni regione italiana e per paragonare i dati di ogni regione ho analizzato un coefficiente di mortalità per ogni diecimila abitanti: Morti per causa tumore/( Popolazione/10000). Si possono analizzare i dati ottenuti nella tabella seguente.
[1] Fonte Istat: banca dati del 2003.
Da una breve analisi dei dati si evince che la media nazionale di decessi per tumore (46), calcolata sul numero di morti ogni diecimila abitanti, è superata di gran lunga in regioni che si trovano nel settentrione del nostro paese: Lombardia (50), Piemonte (53.7), Friuli Venezia Giulia (55.9), Emilia Romagna (55.4), Liguria (60.4), ecc...3.1 La mortalità per tumore
La prima variabile che ho preso in considerazione, nonché quella attorno a cui si incentra l’analisi statistica è il numero di decessi per tumore. A tale scopo ho raccolto dei dati[1] riguardanti la popolazione residente e il numero dei decessi per tumore per ogni regione italiana e per paragonare i dati di ogni regione ho analizzato un coefficiente di mortalità per ogni diecimila abitanti: Morti per causa tumore/( Popolazione/10000). Si possono analizzare i dati ottenuti nella tabella seguente.
[1] Fonte Istat: banca dati del 2003.
Mentre nel meridione le stime relative alla mortalità sono notevolmente inferiori: Campania (37.9), Basilicata (36.6), Puglia (37.7), Sicilia (36.8), ecc…
Ciò avvalora la tesi iniziale e ci esorta a proseguire nell’analisi statistica in modo tale da far emergere le cause di queste anomalie geografiche.
In tale capitolo viene fatto riferimento ai dati regionali per rendere più evidente l’analisi dei valori. Successivamente, nel capitolo della regressione statistica, si prederanno in considerazione i dati su base provinciale, visionabili nelle tabelle riportate alla fine di tale lavoro, per rendere più precisa e specifica l’analisi statistica.
3.2 Reddito pro-capite
La seconda variabile presa in considerazione è il reddito pro-capite per ogni regione italiana. La scelta di tale variabile deriva da un’analisi pubblicata dal Corriere della sera[1], secondo cui i morti per tumore sono maggiori in regioni e paesi sviluppati che nelle zone in via di sviluppo. Ciò deriva dalla conseguenza che l’elevato tenore di vita può comportare eccessi sia nell’alimentazione sia nell’abuso di qualsiasi altro tipo di bene: alcool, sigarette, beni di lusso nocivi alla salute, ecc… oltre alle strutture meno adatte alla diagnosi e cura delle forme tumorali.
[1] Corriere della sera, 19 dicembre 2007.
Da una prima analisi si nota una certa analogia di dati tra il reddito delle regioni più sviluppate, poste nel Nord d’Italia, e il numero di decessi.
Come nel paragrafo precedente nel settentrione abbiamo un reddito medio che supera la media nazionale, pari a circa 19300€: Lombardia (22800), Trentino Alto Adige (26511), Veneto (22457), Friuli Venezia Giulia (22946), ecc… Mentre nel meridione i redditi sono di gran lunga inferiore: Puglia (13427), Calabria (12763), Sicilia (13647), Campania (13752), ecc…
3.3 Numero di anziani
Un’altra variabile presa in considerazione nell’analisi statistica è il numero di over-65 presenti all’interno del territorio preso in considerazione. Tale decisione deriva da una particolare propensione della popolazione anziana a contrarre malattie tumorali derivante dalle scarse difese immunitarie presenti nell’organismo e dall’accumularsi dei danni genetici con il passare degli anni.
Secondo un’analisi del Corriere della Sera fra gli anziani i tumori sono dieci volte più diffusi che nel resto della popolazione[1]. Pertanto come per la variabile della mortalità, ho considerato un indice oggettivo, indipendente dalla popolazione presente nella regione, cioè il numero di over-65 presenti ogni dieci mila abitanti: N. Over-65/(Popolazione/10000).
[1] Corriere della Sera, 9 maggio 2006.
3.4 Radioattività
L’ultima variabile presa in analisi è la radioattività proveniente dalle scorie residue ancora presenti sul territorio nazionale derivante dalla produzione di energia nucleare.
Nonostante le centrali nucleari in Italia sono chiuse dal referendum del 1987, sono ancora presenti sul territorio nazionale 53 mila metri cubi di rifiuti nucleari, quanto un intero palazzo sessanta piani. In realtà le centrali, più che chiuse, sono in stato di “custodia protettiva passiva” preservando, ancora, al loro interno materiale radioattivo. Gli effetti delle radiazioni sulla materia vivente sono prodotti attraverso lo stesso meccanismo della ionizzazione per la materia inanimata. I danni più gravi si hanno quando le radiazioni ionizzanti colpiscono la molecola di DNA, presente nel nucleo di ogni cellula. L’entità dei danni dipende, in primo luogo, dalla dose di radiazione; in secondo luogo, dall’organo colpito, che può essere vitale o non vitale ed infine dal tipo di danno cellulare: una cellula colpita può essere distrutta completamente, oppure può essere alterata senza essere distrutta; in quest’ultimo caso c’è la possibilità che si attivi il processo di proliferazione anomala che sta all’origine della carcinogenesi o di qualsiasi altra forma tumorale.
Il capitolo successivo è dedicato interamente all’analisi nucleare poiché non è una variabili statisticamente oggettiva come le precedenti ma ha bisogno di alcune analisi matematiche per la sua considerazione.
L’ultima variabile presa in analisi è la radioattività proveniente dalle scorie residue ancora presenti sul territorio nazionale derivante dalla produzione di energia nucleare.
Nonostante le centrali nucleari in Italia sono chiuse dal referendum del 1987, sono ancora presenti sul territorio nazionale 53 mila metri cubi di rifiuti nucleari, quanto un intero palazzo sessanta piani. In realtà le centrali, più che chiuse, sono in stato di “custodia protettiva passiva” preservando, ancora, al loro interno materiale radioattivo. Gli effetti delle radiazioni sulla materia vivente sono prodotti attraverso lo stesso meccanismo della ionizzazione per la materia inanimata. I danni più gravi si hanno quando le radiazioni ionizzanti colpiscono la molecola di DNA, presente nel nucleo di ogni cellula. L’entità dei danni dipende, in primo luogo, dalla dose di radiazione; in secondo luogo, dall’organo colpito, che può essere vitale o non vitale ed infine dal tipo di danno cellulare: una cellula colpita può essere distrutta completamente, oppure può essere alterata senza essere distrutta; in quest’ultimo caso c’è la possibilità che si attivi il processo di proliferazione anomala che sta all’origine della carcinogenesi o di qualsiasi altra forma tumorale.
Il capitolo successivo è dedicato interamente all’analisi nucleare poiché non è una variabili statisticamente oggettiva come le precedenti ma ha bisogno di alcune analisi matematiche per la sua considerazione.
Analisi Econometrica sulle morti per tumore (4)
IL NUCLEARE IN ITALIA
[1] Coefficiente di radioattività creato in base ai metri cubi di materiale radioattivo e combustibile irraggiato presente all’interno della centrale.
Sul territorio nazionale sono presenti cinque centrali nucleari, otto depositi di scorie radioattive e sei reattori, ognuno dei quali contiene ancora al suo interno del materiale radioattivo poiché in Italia ancora non è stato trovato un sito dove stoccare le scorie.
Le centrali nucleari che sono presenti sul territorio nazionale sono:
§ Caorso, (10)[1] vicino Piacenza, la più grande d’Italia. Fu spenta con il referendum del 1987, al suo interno ospita ancora tutto il materiale radioattivo (1880 di rifiuti radioattivi e 187t di combustibile irraggiato);
§ Garigliano, (10) in provincia di Caserta, chiusa dal 1978 quando un guasto ad un generatore di vapore non ne ha permesso più la riapertura poiché non più economicamente conveniente. Parte delle scorie sono state trasferite in Inghilterra (alla quale l’Italia tuttora continua a pagare un affitto per il loro deposito), altre sono state seppellite sotto terra in buste di plastica inconsciamente durante gli anni sessanta, creando un danno irreparabile alla flora e alla fauna locale; le rimanenti sono ancora presenti all’interno della centrale (2500 di scorie radioattive);
§ Trino, (7) in provincia di Vercelli, che ha funzionato solamente per tredici anni e ferma i restanti anni per le manutenzioni straordinarie. Essa presenta al suo interno ancora tutto il suo cuore radioattivo (780 di scorie radioattive e 15t di combustibile irraggiato);
§ Latina, (7) nel Lazio, fu la prima ad entrare in funzione nel 1962, con un reattore basato su una tecnologia a gas grafite e alimentato con un combustibile a uranio naturale. Tuttora ospita al suo interno 90 di scorie radioattive.
Nel restante territorio nazionale sono presenti depositi di scorie radioattive:
§ Saluggia, (7) in provincia di Vercelli;
§ Casaccia, (7) in provincia di Roma;
§ Guanzate, (5) in provincia di Como;
§ Udine, (5);
§ Forlì, (5);
§ Taranto, (5);
§ Termoli, (5) in provincia di Campobasso;
I prime due sono più critici dei restanti poiché contengono materiali radioattivi definiti di terza categoria, i più pericolosi da stoccare (necessitando centinaia di migliaia di anni); i restanti sono tutti depositi di seconda categoria, cioè generalmente di origine ospedaliera, meno pericolosi e con un tempo di decadenza radioattiva di poche centinaia di anni.
E infine ci sono dei reattori nucleari destinati ad attività di ricerca militare e civile:
§ Legnaro, (6) in provincia di Padova;
§ Ispra, (7) provincia di Varese;
§ Voghera, (5) provincia di Pavia;
§ Montecuccolino, (6) in provincia di Bologna;
§ Pisa, (5);
§ Palermo (5).
Le centrali nucleari che sono presenti sul territorio nazionale sono:
§ Caorso, (10)[1] vicino Piacenza, la più grande d’Italia. Fu spenta con il referendum del 1987, al suo interno ospita ancora tutto il materiale radioattivo (1880 di rifiuti radioattivi e 187t di combustibile irraggiato);
§ Garigliano, (10) in provincia di Caserta, chiusa dal 1978 quando un guasto ad un generatore di vapore non ne ha permesso più la riapertura poiché non più economicamente conveniente. Parte delle scorie sono state trasferite in Inghilterra (alla quale l’Italia tuttora continua a pagare un affitto per il loro deposito), altre sono state seppellite sotto terra in buste di plastica inconsciamente durante gli anni sessanta, creando un danno irreparabile alla flora e alla fauna locale; le rimanenti sono ancora presenti all’interno della centrale (2500 di scorie radioattive);
§ Trino, (7) in provincia di Vercelli, che ha funzionato solamente per tredici anni e ferma i restanti anni per le manutenzioni straordinarie. Essa presenta al suo interno ancora tutto il suo cuore radioattivo (780 di scorie radioattive e 15t di combustibile irraggiato);
§ Latina, (7) nel Lazio, fu la prima ad entrare in funzione nel 1962, con un reattore basato su una tecnologia a gas grafite e alimentato con un combustibile a uranio naturale. Tuttora ospita al suo interno 90 di scorie radioattive.
Nel restante territorio nazionale sono presenti depositi di scorie radioattive:
§ Saluggia, (7) in provincia di Vercelli;
§ Casaccia, (7) in provincia di Roma;
§ Guanzate, (5) in provincia di Como;
§ Udine, (5);
§ Forlì, (5);
§ Taranto, (5);
§ Termoli, (5) in provincia di Campobasso;
I prime due sono più critici dei restanti poiché contengono materiali radioattivi definiti di terza categoria, i più pericolosi da stoccare (necessitando centinaia di migliaia di anni); i restanti sono tutti depositi di seconda categoria, cioè generalmente di origine ospedaliera, meno pericolosi e con un tempo di decadenza radioattiva di poche centinaia di anni.
E infine ci sono dei reattori nucleari destinati ad attività di ricerca militare e civile:
§ Legnaro, (6) in provincia di Padova;
§ Ispra, (7) provincia di Varese;
§ Voghera, (5) provincia di Pavia;
§ Montecuccolino, (6) in provincia di Bologna;
§ Pisa, (5);
§ Palermo (5).
[1] Coefficiente di radioattività creato in base ai metri cubi di materiale radioattivo e combustibile irraggiato presente all’interno della centrale.
Analisi Econometrica sulle morti per tumore (5)
In base al contenuto radioattivo di ogni centrale, deposito o reattore (metri cubi di materiale radioattivo e tonnellate di combustibile irraggiato) ho fissato un indice di radioattività, che sulla tavola ho indicato con “Rad”[1] ed ho elencato precedentemente tra parentesi accanto ad ogni sito nucleare. Attraverso tale indice e la distanza del sito radioattivo più vicino ho trovato il coefficiente di radioattività della provincia, indicato con “Coeff. R” secondo la seguente formula: Coeff. R = (1 - Dist.Cent. / 400) * Rad.
La distanza dal sito radioattivo ha come denominatore 400 km come massima distanza possibile sul territorio italiano, e come massima distanza in cui possono svanire gli effetti della radioattività.
Un esempio può rendere più comprensibile la formula citata: consideriamo per tale analisi la prima provincia in elenco, Agrigento. Essa ha una distanza minima di 49,5 Km dal sito radioattivo più vicino: il reattore di Palermo, che ha un indice di radioattività di 5. Con la formula sopracitata il Coefficiente di Radioattività sarà: (1-49.5/400)*5= 4.38. Ciò significa che, nonostante la provincia di Agrigento non presenti sul suo territorio alcun tipo di materiale derivante dalla fissione nucleare, è contaminata dalla presenza di un reattore distante circa 50 Km dai suoi confini.
Nel secondo set di dati, invece, ho riportato le centrali, depositi o reattori presenti in ogni provincia moltiplicandoli per il loro indice di radioattività in modo tale da avere il coefficiente di radioattività presente all’interno dell’intera provincia.
Attraverso quest’ultimo e il coefficiente di radioattività trovato precedentemente ho generato un coefficiente totale di radioattività presente in ogni provincia e relativo alla presenza o meno di depositi radioattivi all’interno del territorio considerato più un coefficiente di radioattività derivante dalla distanza con il sito radioattivo più vicino. (Vedi Tavola 6).
Cito un esempio in relazione alla provincia di Vercelli, la quale ospita sul proprio territorio la centrale nucleare di Trino e un deposito di scorie radioattive entrambi con indice di radioattività pari a 7, oltre ciò essa dista solamente 82 Km dal reattore di Voghera, in provincia di Pavia. Per tale provincia indicare solamente un indice era approssimativo, pertanto al valore di entrambi i siti è stato aggiunto un coefficiente di radioattività, trovato con la formula relativa alla distanza indicata precedentemente, pari a 3.97. In tal modo tale provincia presenta un coefficiente totale pari a 17.97. Analizzando i dati della mortalità in tale provincia ho constatato che il suo indice di mortalità per decessi tumorali è pari a 52.4, ben oltre la media nazionale di 46. I dati ci inducono a procedere con un’analisi di regressione per captare le reali cause della mortalità per tumore.
[1] Vedi Tavola 4
La distanza dal sito radioattivo ha come denominatore 400 km come massima distanza possibile sul territorio italiano, e come massima distanza in cui possono svanire gli effetti della radioattività.
Un esempio può rendere più comprensibile la formula citata: consideriamo per tale analisi la prima provincia in elenco, Agrigento. Essa ha una distanza minima di 49,5 Km dal sito radioattivo più vicino: il reattore di Palermo, che ha un indice di radioattività di 5. Con la formula sopracitata il Coefficiente di Radioattività sarà: (1-49.5/400)*5= 4.38. Ciò significa che, nonostante la provincia di Agrigento non presenti sul suo territorio alcun tipo di materiale derivante dalla fissione nucleare, è contaminata dalla presenza di un reattore distante circa 50 Km dai suoi confini.
Nel secondo set di dati, invece, ho riportato le centrali, depositi o reattori presenti in ogni provincia moltiplicandoli per il loro indice di radioattività in modo tale da avere il coefficiente di radioattività presente all’interno dell’intera provincia.
Attraverso quest’ultimo e il coefficiente di radioattività trovato precedentemente ho generato un coefficiente totale di radioattività presente in ogni provincia e relativo alla presenza o meno di depositi radioattivi all’interno del territorio considerato più un coefficiente di radioattività derivante dalla distanza con il sito radioattivo più vicino. (Vedi Tavola 6).
Cito un esempio in relazione alla provincia di Vercelli, la quale ospita sul proprio territorio la centrale nucleare di Trino e un deposito di scorie radioattive entrambi con indice di radioattività pari a 7, oltre ciò essa dista solamente 82 Km dal reattore di Voghera, in provincia di Pavia. Per tale provincia indicare solamente un indice era approssimativo, pertanto al valore di entrambi i siti è stato aggiunto un coefficiente di radioattività, trovato con la formula relativa alla distanza indicata precedentemente, pari a 3.97. In tal modo tale provincia presenta un coefficiente totale pari a 17.97. Analizzando i dati della mortalità in tale provincia ho constatato che il suo indice di mortalità per decessi tumorali è pari a 52.4, ben oltre la media nazionale di 46. I dati ci inducono a procedere con un’analisi di regressione per captare le reali cause della mortalità per tumore.
[1] Vedi Tavola 4
Analisi Econometrica sulle morti per tumore (6)
REGRESSIONE STATISTICA
L’obiettivo del presente lavoro è quello di sviluppare un modello econometrico che mi conduca a stimare la relazione intercorrente tra il numero di decessi per causa tumore, il reddito pro-capite, il numero di anziani e il dislocamento di materiale radioattivo sul territorio italiano. I dati che utilizzerò sono in parte riportati dalle banche dati Istat relative all’anno 2003 e in parte da me generati secondo una relazione riportata nel paragrafo precedente, sempre sulla base di dati statistici.
Il modello econometrico sviluppato è una regressione lineare multipla, la quale mi ha permesso di stimare l’effetto sulla variabile dipendente Y di un variazione di tre variabili indipendenti X1, X2 e X3 .
Pertanto a tali variabili ho associato:
Y N° di decessi per causa tumore su diecimila abitanti [Morti]
X1 Reddito pro-capite [Reddito]
X2 N° di over-65 su diecimila abitanti [Anziani]
X3 Coefficiente totale di radioattività derivante dalla
presenza sul territorio di centrali, depositi o reattori
più l’indice di radioattività in base alla distanza [Coeff. Totale]
Per effettuare la stima OLS dei coefficienti B1,B2 ,B3 ,B4 , degli errori e della bontà della regressione mi sono servito del pacchetto Stata/SE 10.0.
L’obiettivo del presente lavoro è quello di sviluppare un modello econometrico che mi conduca a stimare la relazione intercorrente tra il numero di decessi per causa tumore, il reddito pro-capite, il numero di anziani e il dislocamento di materiale radioattivo sul territorio italiano. I dati che utilizzerò sono in parte riportati dalle banche dati Istat relative all’anno 2003 e in parte da me generati secondo una relazione riportata nel paragrafo precedente, sempre sulla base di dati statistici.
Il modello econometrico sviluppato è una regressione lineare multipla, la quale mi ha permesso di stimare l’effetto sulla variabile dipendente Y di un variazione di tre variabili indipendenti X1, X2 e X3 .
Pertanto a tali variabili ho associato:
Y N° di decessi per causa tumore su diecimila abitanti [Morti]
X1 Reddito pro-capite [Reddito]
X2 N° di over-65 su diecimila abitanti [Anziani]
X3 Coefficiente totale di radioattività derivante dalla
presenza sul territorio di centrali, depositi o reattori
più l’indice di radioattività in base alla distanza [Coeff. Totale]
Per effettuare la stima OLS dei coefficienti B1,B2 ,B3 ,B4 , degli errori e della bontà della regressione mi sono servito del pacchetto Stata/SE 10.0.
Pertanto la funzione di regressione stimata sarà:
L’R2 di regressione indica la frazione della varianza campionaria di Y spiegata dai repressori Xi , variando tra zero e uno. Dall’analisi della regressione si evince che, avendo un R2=0.7187, le variabili indipendenti spiegano gran parte della variabilità della Y. Inoltre, le tre variabili indipendenti partecipano congiuntamente alla determinazione della variabile dipendente, cosa che possiamo notare dai coefficienti regressione.
Per una più attenta analisi consideriamo il test t per la verifica delle ipotesi; in tal modo il valore della statistica t ci permetterà di rifiutare o meno l’ipotesi nulla. Pertanto, nell’analisi della regressione notiamo che il valore più consistente del test t è associato al numero di anziani presenti nella zona considerata, riportando un valore pari a 11.22. Anche il reddito ci permetterà di rifiutare l’ipotesi nulla poiché la statistica t è pari a 4.58; la stessa cosa non vale per la presenza di materiale radioattivo sul territorio italiano, che con un valore di 1.11 ci porterebbe a non rifiutare l’ipotesi nulla ad un livello minimo di 1.96. Può essere d’aiuto scomporre gli effetti di tale regressione in differenti analisi regressive combinando le variabili osservate precedentemente
Per una più attenta analisi consideriamo il test t per la verifica delle ipotesi; in tal modo il valore della statistica t ci permetterà di rifiutare o meno l’ipotesi nulla. Pertanto, nell’analisi della regressione notiamo che il valore più consistente del test t è associato al numero di anziani presenti nella zona considerata, riportando un valore pari a 11.22. Anche il reddito ci permetterà di rifiutare l’ipotesi nulla poiché la statistica t è pari a 4.58; la stessa cosa non vale per la presenza di materiale radioattivo sul territorio italiano, che con un valore di 1.11 ci porterebbe a non rifiutare l’ipotesi nulla ad un livello minimo di 1.96. Può essere d’aiuto scomporre gli effetti di tale regressione in differenti analisi regressive combinando le variabili osservate precedentemente
Analisi Econometrica sulle morti per tumore (7)
ALTRE REGRESSIONI
Per avere una panoramica globale dell’effetto che hanno le variabili riportate sulla mortalità per causa tumore, ho ritenuto opportuno impostare varie regressioni statistiche, per poter osservare come al variare delle variabili cambia l’output della regressione. Quindi, oltre le variabili citate nel capitolo precedente ho inserito due nuove variabili: “distanza” e “centrali”. Non sono delle vere e proprie “nuove” variabili poiché da queste ultime è stata originata la variabile considerata nel capitolo precedente “Coeff. Totale”. Ho ritenuto opportuno, pertanto, considerare sia la variabile riassuntiva che le due originarie separatamente.
Nella seguente tabella sono state riportate le regressioni più significative per una maggior comprensione dell’output finale.
Per avere una panoramica globale dell’effetto che hanno le variabili riportate sulla mortalità per causa tumore, ho ritenuto opportuno impostare varie regressioni statistiche, per poter osservare come al variare delle variabili cambia l’output della regressione. Quindi, oltre le variabili citate nel capitolo precedente ho inserito due nuove variabili: “distanza” e “centrali”. Non sono delle vere e proprie “nuove” variabili poiché da queste ultime è stata originata la variabile considerata nel capitolo precedente “Coeff. Totale”. Ho ritenuto opportuno, pertanto, considerare sia la variabile riassuntiva che le due originarie separatamente.
Nella seguente tabella sono state riportate le regressioni più significative per una maggior comprensione dell’output finale.
6.1 Prima regressione
Per la prima analisi ho considerato le due variabili principali degli effetti della radioattività per constatare come la presenza di centrali nucleari, depositi o reattori nella provincia e la distanza più vicina alla provincia adiacente possono influire sulla mortalità[1].
Da tale analisi si evince chiaramente, rilevando l’entità dell’ =0.1692, che tale variabili non spiegano bene la variabilità della variabile dipendente. Valutando i coefficienti della regressione certamente la distanza ha un segno negativo poiché essa è inversamente proporzionale all’impatto della radioattività sulla mortalità per tumore in quanto all’aumentare della distanza diminuisce l’effetto della radioattività sull’uomo.
La presenza delle centrali nella regione ha certamente una relazione con l’output ma non influisce in gran parte su di esso, lo dimostra la statistica t molto prossima allo zero.
6.2 Seconda regressione
Nella seconda analisi ho utilizzato come variabile indipendente il coefficiente totale derivante dalle due variabili elencate precedentemente, per avere un effetto reale in ogni provincia, poiché considerare due variabili separatamente potrebbe essere riduttivo.
Dall’output di tale regressione si constata che l’effetto della presenza di materiale radioattivo sul territorio italiano non è particolarmente rilevante per la determinazione dell’effetto sulla variabile dipendente. Essa in effetti presenta un poco superiore a quello evidenziato precedentemente, non esplicitando, quindi, una particolare dipendenza con la mortalità. Tale analisi aveva lo scopo di verificare se la sintesi delle variabili precedenti in un’unica variabile poteva eliminare eventuali effetti discorsivi derivanti da un’analisi separata delle due. Ma si è potuto constatare non è questa la ragione che ci porta a non accettare, come particolarmente affidabili, tale variabili come esplicative della mortalità per tumore.
6.3 Terza regressione
In tale analisi ho voluto analizzare, come nella principale regressione, tutte le variabili prese in considerazione, ma ho sostituito la variabile riassuntiva del coefficiente totale con le due generatrici, per verificare se la sintesi in un’unica variabile avesse creato delle distorsioni nell’output.
Dalla regressione non si evincono particolari differenze con la principale regressione, sinonimo di una buona sintesi in un’unica variabile ma anche di una non ottima dipendenza della variabile dipendente dalle due variabili (distanza e centrali). Analizzando la statistica t delle quattro variabili notiamo un leggero ridimensionamento per le variabili “reddito” e “anziani” a favore delle restanti variabili, ma certamente non così sostanziale da poter modificare il giudizio finale.
6.4 Quarta regressione
In tale regressione ho ritenuto opportuno analizzare gli effetti della radioattività, calcolata con un unico coefficiente, con la variabile del reddito, per constatare ulteriori effetti dell’accostamento delle variabili prese in considerazione.
Da tale analisi si evince una dipendenza elevata dal reddito, evidenziando un valore della statistica t ben elevato. Contrariamente il valore della statistica t, per la variabile del coefficiente totale, ci porterebbe a non rifiutare un’ipotesi nulla.
6.5 Quinta regressione
Nell’ultima analisi ho considerato quanto può modificare l’output l’analisi del coefficiente totale accostato alla variabile “anziani”, quindi quanto la presenza della radioattività e del numero di anziani sul territorio italiano influenzano l’output della regressione.
Da tale regressione finale possiamo confermare le risultanze derivanti dalla prima regressione: certamente il coefficiente di radioattività in tale analisi ha il valore della statistica t più elevato ma certamente la stessa statistica per il numero di anziani ha molta più rilevanza. Tale analisi, dalla rilevanza dell’ , è certamente la più significativa dopo l’analisi principale. Pertanto tali variabili riescono a spiegare gran parte dell’output della regressione totale e evidenziando la relativa importanza che ha la presenza degli anziani in ogni provincia come determinante della mortalità per tumore.
6.5 Sintesi regressioni
Al termine di tale lavoro ho ritenuto opportuno sintetizzare i dati ottenuti nelle precedenti regressioni in un'unica tabella utilizzando, dopo ogni regressione, i seguenti comandi di Stata:
estimates store first
estimates store second
estimates store third
estimates store fourth
estimates store fifth
ed infine racchiudendo i precedenti comandi in una tabella attraverso :
estimates table first second third fourth fifth
La tabella così ricavata è osservabile alla fine di tale lavoro nell’appendice 2.
[1] I risultati della regressione, come per le successive, sono stati elencati e sintetizzati alla fine di tale lavoro nell’appendice 1.
Per la prima analisi ho considerato le due variabili principali degli effetti della radioattività per constatare come la presenza di centrali nucleari, depositi o reattori nella provincia e la distanza più vicina alla provincia adiacente possono influire sulla mortalità[1].
Da tale analisi si evince chiaramente, rilevando l’entità dell’ =0.1692, che tale variabili non spiegano bene la variabilità della variabile dipendente. Valutando i coefficienti della regressione certamente la distanza ha un segno negativo poiché essa è inversamente proporzionale all’impatto della radioattività sulla mortalità per tumore in quanto all’aumentare della distanza diminuisce l’effetto della radioattività sull’uomo.
La presenza delle centrali nella regione ha certamente una relazione con l’output ma non influisce in gran parte su di esso, lo dimostra la statistica t molto prossima allo zero.
6.2 Seconda regressione
Nella seconda analisi ho utilizzato come variabile indipendente il coefficiente totale derivante dalle due variabili elencate precedentemente, per avere un effetto reale in ogni provincia, poiché considerare due variabili separatamente potrebbe essere riduttivo.
Dall’output di tale regressione si constata che l’effetto della presenza di materiale radioattivo sul territorio italiano non è particolarmente rilevante per la determinazione dell’effetto sulla variabile dipendente. Essa in effetti presenta un poco superiore a quello evidenziato precedentemente, non esplicitando, quindi, una particolare dipendenza con la mortalità. Tale analisi aveva lo scopo di verificare se la sintesi delle variabili precedenti in un’unica variabile poteva eliminare eventuali effetti discorsivi derivanti da un’analisi separata delle due. Ma si è potuto constatare non è questa la ragione che ci porta a non accettare, come particolarmente affidabili, tale variabili come esplicative della mortalità per tumore.
6.3 Terza regressione
In tale analisi ho voluto analizzare, come nella principale regressione, tutte le variabili prese in considerazione, ma ho sostituito la variabile riassuntiva del coefficiente totale con le due generatrici, per verificare se la sintesi in un’unica variabile avesse creato delle distorsioni nell’output.
Dalla regressione non si evincono particolari differenze con la principale regressione, sinonimo di una buona sintesi in un’unica variabile ma anche di una non ottima dipendenza della variabile dipendente dalle due variabili (distanza e centrali). Analizzando la statistica t delle quattro variabili notiamo un leggero ridimensionamento per le variabili “reddito” e “anziani” a favore delle restanti variabili, ma certamente non così sostanziale da poter modificare il giudizio finale.
6.4 Quarta regressione
In tale regressione ho ritenuto opportuno analizzare gli effetti della radioattività, calcolata con un unico coefficiente, con la variabile del reddito, per constatare ulteriori effetti dell’accostamento delle variabili prese in considerazione.
Da tale analisi si evince una dipendenza elevata dal reddito, evidenziando un valore della statistica t ben elevato. Contrariamente il valore della statistica t, per la variabile del coefficiente totale, ci porterebbe a non rifiutare un’ipotesi nulla.
6.5 Quinta regressione
Nell’ultima analisi ho considerato quanto può modificare l’output l’analisi del coefficiente totale accostato alla variabile “anziani”, quindi quanto la presenza della radioattività e del numero di anziani sul territorio italiano influenzano l’output della regressione.
Da tale regressione finale possiamo confermare le risultanze derivanti dalla prima regressione: certamente il coefficiente di radioattività in tale analisi ha il valore della statistica t più elevato ma certamente la stessa statistica per il numero di anziani ha molta più rilevanza. Tale analisi, dalla rilevanza dell’ , è certamente la più significativa dopo l’analisi principale. Pertanto tali variabili riescono a spiegare gran parte dell’output della regressione totale e evidenziando la relativa importanza che ha la presenza degli anziani in ogni provincia come determinante della mortalità per tumore.
6.5 Sintesi regressioni
Al termine di tale lavoro ho ritenuto opportuno sintetizzare i dati ottenuti nelle precedenti regressioni in un'unica tabella utilizzando, dopo ogni regressione, i seguenti comandi di Stata:
estimates store first
estimates store second
estimates store third
estimates store fourth
estimates store fifth
ed infine racchiudendo i precedenti comandi in una tabella attraverso :
estimates table first second third fourth fifth
La tabella così ricavata è osservabile alla fine di tale lavoro nell’appendice 2.
[1] I risultati della regressione, come per le successive, sono stati elencati e sintetizzati alla fine di tale lavoro nell’appendice 1.
Analisi Econometrica sulle morti per tumore (8)
CONCLUSIONI
Dall’analisi effettuata si nota che le tre variabili (numero di anziani, reddito pro-capite e coefficiente di radioattività) concorrono congiuntamente all’esplicazione dell’output finale.
La variabile di maggior significatività è il numero di persone anziani presenti nella zona selezionata, confermando quando affermato nell’analisi pubblicata del Corriere della sera. L’anzianità comporta un’alta esposizione allo sviluppo delle malattie tumorali, poiché i danni genetici tendono a proliferare nel corso degli anni. Non resta trascurabile, d’altro canto, la considerazione del tenore di vita degli individui, essendo anch’essa una variabile influente nella considerazione dell’output finale. Tale risultato è generato dall’eccessivo utilizzo di beni alimentari, sigarette, alcool, ecc.. e dal proliferare delle zone industriali in province ad alta densità di popolazione, il cui reddito è sicuramente maggiore rispetto alle zone rurali.
Terza variabile considerata è il coefficiente di radioattività presente per ogni provincia presa in analisi. Analogicamente alle prime due variabili essa concorre alla determinazione dell’output, ma facilmente non rifiuteremo l’ipotesi nulla determinata dai test statistici su menzionati. La complessità della sua determinazione di certo non può essere d’aiuto, in quanto potrebbe essere distorta dal calcolo effettuato per la sua esplicazione, non essendo un dato oggettivamente osservabile. Inoltre l’output dell’ analisi di tale variabile potrebbe derivare da una moltitudine di variabili che solamente attraverso uno studio specifico si potrebbe considerare come certo. Basti pensare che la variabilità deriva da un mix di elementi ulteriori quali lo spostamento dei venti, l’emigrazione, la sicurezza di ogni sito radioattivo, lo smistamento delle scorie radioattive, ecc…
Lo studio specifico della variabile osservata, potrebbe essere oggetto di un successivo lavoro, che consideri nella sua determinazione ogni sua caratteristica peculiare.
Dall’analisi effettuata si nota che le tre variabili (numero di anziani, reddito pro-capite e coefficiente di radioattività) concorrono congiuntamente all’esplicazione dell’output finale.
La variabile di maggior significatività è il numero di persone anziani presenti nella zona selezionata, confermando quando affermato nell’analisi pubblicata del Corriere della sera. L’anzianità comporta un’alta esposizione allo sviluppo delle malattie tumorali, poiché i danni genetici tendono a proliferare nel corso degli anni. Non resta trascurabile, d’altro canto, la considerazione del tenore di vita degli individui, essendo anch’essa una variabile influente nella considerazione dell’output finale. Tale risultato è generato dall’eccessivo utilizzo di beni alimentari, sigarette, alcool, ecc.. e dal proliferare delle zone industriali in province ad alta densità di popolazione, il cui reddito è sicuramente maggiore rispetto alle zone rurali.
Terza variabile considerata è il coefficiente di radioattività presente per ogni provincia presa in analisi. Analogicamente alle prime due variabili essa concorre alla determinazione dell’output, ma facilmente non rifiuteremo l’ipotesi nulla determinata dai test statistici su menzionati. La complessità della sua determinazione di certo non può essere d’aiuto, in quanto potrebbe essere distorta dal calcolo effettuato per la sua esplicazione, non essendo un dato oggettivamente osservabile. Inoltre l’output dell’ analisi di tale variabile potrebbe derivare da una moltitudine di variabili che solamente attraverso uno studio specifico si potrebbe considerare come certo. Basti pensare che la variabilità deriva da un mix di elementi ulteriori quali lo spostamento dei venti, l’emigrazione, la sicurezza di ogni sito radioattivo, lo smistamento delle scorie radioattive, ecc…
Lo studio specifico della variabile osservata, potrebbe essere oggetto di un successivo lavoro, che consideri nella sua determinazione ogni sua caratteristica peculiare.
Analisi Econometrica sulle morti per tumore (9)
APPENDICE 1 - REGRESSIONI STATA
Prima regressione
Seconda regressione
Terza regressione
Quarta regressione
Quinta regressione
Iscriviti a:
Post (Atom)