Esercitazioni ANOVA
Transcript
Esercitazioni ANOVA
Esercitazione n.5 Analisi della varianza (ANOVA) Esercizio 1 Si individua un insieme di appezzamenti di terreno che abbiano la stessa estensione ed il più possibile le stesse caratteristiche per quanto riguarda la umidità, la composizione , la giacitura e gli altri fattori che non facciamo entrare come tali nella sperimentazione. Ogni appezzamento sarà poi suddiviso in tre parti ad ognuna delle quali verrà applicato uno solo dei tre fertilizzanti. Di ogni appezzamento si calcolerà la produzione per unità di superficie. Supponiamo che si siano considerati 5 appezzamenti (repliche) con il fertilizzante A (1° campione), altrettanti con il fertilizzante B e C (2° e 3° campione). Di ognuno di questi gruppi di appezzamenti omogenei si calcolerà la produzione media (cioè la media della produzione ottenuta dai 5 appezzamenti trattati con il fertilizzante A, così per B e per C). I dati ottenuti sono riportati nella seguente tabella: fertilizzante 1 A 2 B 3 C 47,4 57,1 50,1 Valori campionari (produzione dei terreni) 48,5 49,2 46,8 55,9 56,3 55,6 52,1 51,6 50,9 47,9 58,2 51,2 Ogni campione costituito dalle cinque repliche relative ad ogni fertilizzante è da pensare come proveniente da una popolazione di appezzamenti di terreno similari. Il problema allora è: le medie campionarie Mi differiscono fra loro a causa della differenza delle medie µi delle popolazioni da cui provengono (cioè le popolazioni da cui provengono sono diverse, per cui ci sarebbe un'influenza del fertilizzante sulla produzione) oppure le medie campionarie provengono da un’unica popolazione e le loro differenze possono essere attribuite solo alle fluttuazioni casuali? Cioè le medie delle tre popolazioni sono o non sono uguali? Soluzione 1 Si tratta di applicare l’analisi della varianza. Quindi il sistema d’ipotesi è: : : è Le quantità necessarie per poter applicare l’analisi della varianza sono: • Le medie parziali • La media generale • Le devianze parziali @ ∑ ! " # ∑6 ! ∙" ∑6 ! " A $ @ @ ) ∑")*3 ) "6 ∑)* ) 239,8 5 ./, 01; 283,1 5 41, 15; 256,2 5 48, 5. :;,<=∙>?>=,= ∙>?> , :∙> > ∑")*! A B 1,2,3: ∑")*! A A B B ) C B # "! DA )* )* $ 1,2,3 ) C B E, .05 ) C B ., EFF "3 DA 48, 0. 1 Esercitazione n.5 Analisi della varianza (ANOVA) @ • Devianza tra i gruppi GGH ∑I* A C B 5 808, 81. • Devianza entro i gruppi A "6 B DA )* ) C B 5, 405 A47,96 C 51,94B ∙ 5 L A56,62 C 51,94B ∙ 5 L A51,24 C 51,94B ∙ GGM 3,492 L 4,388 L 2,592 D@ I* 8N, ./5 A questo punto possiamo utilizzare la tabella dell’ANOVA: Natura della variabilità Devianze Gradi di libertà Varianze Tra i gruppi 191,164 c-1=2 95,582 Entro i gruppi 10,472 n-c=12 0,873 Totale 106,052 n-1=14 F 95,582/0,873=109,53 Ne segue che la prova dell’ipotesi H0 si riconduce a verificare, tramite la distribuzione F di Fisher, se la varianza al numeratore è significativamente maggiore, ad un certo livello di significatività α, di quella al denominatore. Da un punto di vista operativo si fissa il livello di significatività α = 0,01 o α = 0,05, si calcola quindi F: se F calcolato è maggiore di F tabulato, si rifiuta l'ipotesi nulla H0, secondo la quale le medie sono uguali e si accetta l'ipotesi alternativa. Nel caso dell'esempio F= 95,58 0,873 = 109,53 Con 2 gradi di libertà al numeratore e 12 al denominatore il valore tabulato di F è 3,88 al livello di significatività α = 0,05 e 6,93 al livello α = 0,01. Per cui in entrambi i casi H0 viene rifiutata cioè si considera significativa la diversità delle medie campionarie e quindi l'influenza del fertilizzante sulla produzione. Esercizio 2 Per confrontare l’efficacia di tre diete (A, B, C) si sono scelti 30 individui con sovrappeso di almeno 20 Kg, sono stati divisi in tre gruppi il primo di 9, il secondo di 10 e il terzo di 11, ciascuno dei quali è stato sottoposto ad una delle diete. Dopo 10 settimane le diminuzioni di peso riscontrate sono state riportate nella tabella. Verifica se esiste una differenza tra le tre diete con un livello di significatività del 5%. A 12 15 12 13 10 12 14 10 10 B 8 7 7 7 10 9 9 9 9 8 C 10 6 8 16 6 6 7 15 7 7 11 Soluzione 2 Il sistema d’ipotesi è: : : è 2 Esercitazione n.5 Analisi della varianza (ANOVA) Le quantità necessarie per poter applicare l’analisi della varianza sono: • Le medie parziali • La media generale • Le devianze parziali @ ∑ ! " # $ ∑")*! ∑6 ! ∙" ∑6 ! " A ∑")*3 ) "6 ∑)* ) ∑")*! A A @ @ ) A @ Devianza tra i gruppi GGH ∑I* A C B /5, 4/ • Devianza entro i gruppi ) ∙<?P, ∙ B • 1,2,3: A B 108 9 F, E; 99 11 0, N 0, 1/ B # C "! DA ) )* DA )* B 83 10 ?<∙ "3 B 85, N; )* 1,2,3 B C 51 ) C B 5F, 8 ) C B 8EN "6 DA $ A12 C 9,67B ∙ 9 L A8,03 C 9,67B ∙ 10 L A9 C 9,67B ∙ 12 GGM D@ 58 L 10,1 L 130 I* 8F., 8 A questo punto possiamo utilizzare la tabella dell’ANOVA: Natura della variabilità Devianze Gradi di libertà Varianze Tra i gruppi 72,57 c-1=2 36,28 Entro i gruppi 198,1 n-c=27 6,82 Totale 106,052 n-1=29 F 36,28/6,82=5,321 Al livello di significatività α = 0,05, con 2 gradi di libertà al numeratore e 27 al denominatore il valore tabulato di F è 3,35, per cui H0 viene rifiutata cioè si considera significativa la diversità delle medie campionarie e quindi le diete hanno un effetto diverso. 3 Esercitazione n.5 Analisi della varianza (ANOVA) Esercizio 3 Un riabilitatore valuta le differenze nel tempo medio di apprendimento in un campione di 12 persone usando 4 metodi di training differenti. Sono simili (α =0.05)? METODO 1 METODO 2 METODO 3 METODO 4 10 11 13 18 9 16 8 23 5 9 9 25 Soluzione 3 Si tratta di applicare l’analisi della varianza. Quindi il sistema d’ipotesi è: : : : è Le quantità necessarie per poter applicare l’analisi della varianza sono: ∑ ! " medie parziali ∑")*! : • ∑")*3 ) ∑")*6 ) ∑")*Q La media generale • ) : :) 24 3 36 3 30 3 66 3 GGM A "! ∑")*! A B ) C F @ A B DA ) C B 8. 85 @ A B DA ) C B 51 8N @ A B DA ) C B 8. 55 @ A :B DA :) C :B 51 ∑Q ! ∙" ∑Q ! " Devianza tra i gruppi GGH ∑:I* A C B A22 C 13B ∙ 3 • Devianza entro i gruppi devianze parziali @ P∙ ? ∙ ? ∙ ? ∙ )* "3 )* "6 )* "Q )* B 8E A8 C 13B ∙ 3 L A12 C 13B ∙ 3 L A10 C 13B ∙ 3 L E.F > D@ I* 14 L 26 L 14 L 26 FN A questo punto possiamo utilizzare la tabella dell’ANOVA: Natura della variabilità Devianze Gradi di libertà Varianze Tra i gruppi 348 c-1=3 116 Entro i gruppi 80 n-c=8 10 Totale 464 n-1=11 F 116/10=11,6 4 Esercitazione n.5 Analisi della varianza (ANOVA) Al livello di significatività α = 0,05, con 3 gradi di libertà al numeratore e 8 al denominatore il valore tabulato di F è 4,07 il quale è inferiore al risultato del test (11,6) per cui H0 viene rifiutata cioè si considera significativa la diversità delle medie campionarie e quindi i metodi di training non sono simili. Esercizio 4 Un azienda che produce detersivi per lavatrice si rivolge ad un’agenzia pubblicitaria perché sviluppi una pubblicità per il proprio prodotto. Si decide di valutare l’effetto sui consumatori di cinque diversi messaggi pubblicitari, caratterizzati da una crescente veridicità nel presentare le caratteristiche del detersivo. Nella pubblicità A non si accenna minimamente alle caratteristiche del prodotto, nella pubblicità B si accenna vagamente a tali caratteristiche, nelle pubblicità C e D le caratteristiche sono rispettivamente abbastanza e molto enfatizzate, mentre nella pubblicità E si tenta di descrivere onestamente quali sono le caratteristiche del prodotto. Si estraggono a caso 30 consumatrici e si assegnano casualmente a 5 gruppi (ognuno costituito da 6 consumatrici). Ad ogni gruppo viene presentata una delle cinque pubblicità, in modo da creare un’”aspettativa” sul prodotto guidata dal diverso tipo di pubblicità presentata. Dopodiché a tutte le consumatrici viene fornito il detersivo pubblicizzato in modo che possano utilizzarlo e quindi ne possano valutare le caratteristiche. A questo punto, ad ogni consumatrice viene chiesto di assegnare al detersivo un punteggio da 1 a 7 con riferimento all’efficacia sui colorati, efficacia sulla biancheria, risparmio sulla quantità utilizzata. I risultati sono i seguenti: A B C D E 15 15 8 5 12 18 17 7 6 19 17 21 10 13 18 19 13 15 11 12 19 19 13 9 15 20 17 13 10 14 C’è evidenza di una differenza significativa tra i voti assegnati dalle consumatrici che hanno visto le diverse pubblicità ad un livello di significatività del 5%? Soluzione 4 Si tratta di applicare l’analisi della varianza. Quindi il sistema d’ipotesi è: : : > : è Le quantità necessarie per poter applicare l’analisi della varianza sono: ∑ ! " medie parziali ∑")*! ) ∑")*3 ) ∑")*6 : ∑")*Q ) : :) 108 6 102 6 66 6 54 6 devianze parziali @ A "! ∑")*! A B ) C 8F @ A B DA ) C B 81 8/ @ A B DA ) C B .N 88 @ A B DA ) C B 4N 0 @ A :B DA :) C :B .1 )* "3 )* "6 )* "Q )* B 5 Esercitazione n.5 Analisi della varianza (ANOVA) > • ∑")*R > La media generale • 90 6 >) ∑R ! ∙" ∑R ! " 84 @ P∙=? ;∙=? ∙=?<∙=? >∙= A >B "R DA )* >) C >B .. 8. Devianza tra i gruppi A18 C 14B ∙ 6 L A17 C 14B ∙ 6 L A11 C 14B ∙ 6 L GGH ∑>I* A C B A9 C 14B ∙ 6 L A15 C 14B ∙ 6 E1N • Devianza entro i gruppi GGM > D@ I* 16 L 40 L 50 L 46 L 44 801 A questo punto possiamo utilizzare la tabella dell’ANOVA: Natura della variabilità Devianze Gradi di libertà Varianze Tra i gruppi 360 c-1=4 90 Entro i gruppi 196 n-c=25 7,84 Totale 556 n-1=29 F 90/7,84=11,48 Al livello di significatività α = 0,05, con 4 gradi di libertà al numeratore e 25 al denominatore il valore tabulato di F è 2,76 il quale è inferiore al risultato del test (11,48) per cui H0 viene rifiutata cioè si considera significativa la diversità delle medie campionarie e quindi l'influenza della pubblicità sui punteggi assegnati. Esercizio 5 I sacchetti di platica vengono in genere prodotti attraverso filmatura per soffiaggio. La materia prima, costituita da materiale plastico, viene inizialmente estrusa a forma di tubo. In corrispondenza della filiera dell’estrusore viene insufflata dell’aria; il tubo aumenta così di diametro e, nel contempo, si riduce lo spessore della parete del tubo. Il film a forma di tubo viene poi stirato e chiuso attraverso termosaldatura. La temperatura del polimero fuso è un elemento critico in quanto, se non è adeguatamente alta, il polimero è troppo viscoso e quindi rigido, se è troppo alta il polimero diventa troppo molle. L’aggiunta di un particolare enzima che rende il polimero biodegradabile richiede l’aggiustamento della temperatura di lavorazione affinché si producano pezzi conformi alle specifiche. Lo spessore rappresenta la variabile risposta che viene misurata in micron. I limiti di specificazione sono: • LCL (Lower control limit) = 18 micron • UCL (Upper control limit) = 21 micron • Target = 19,5 Il fattore è la temperatura di lavorazione. Nell’esperimento, si stabiliscono tre livelli di temperatura: 190°C, 192°C e 194°C . L’azienda attualmente sta utilizzando la temperatura di 194°C. Lo staff tecnico ritiene che una contenuta riduzione della temperatura, a parità degli altri fattori, possa migliorare la prestazione del processo. Le domande alle quali vogliamo rispondere sono: a) le diverse temperature stabilite influenzano lo spessore medio del film, ad un livello di significatività del 5%? b) Se sì, quali livelli di temperatura determinano medie diverse fra loro, ad un livello di significatività del 5%? 6 Esercitazione n.5 Analisi della varianza (ANOVA) Per rispondere alle suddette domande è stato condotto un esperimento con 3 livelli di fattore ed eseguendo 5 prove per ogni livello: REPLICAZIONI TEMPERATURE 1 2 3 4 5 190 °C 19,29 19,92 19,78 20,07 19,51 192 °C 19,48 19,39 19,09 19,97 19,40 194°C 18,37 19,05 18,75 18,42 18,44 Soluzione 5 a) Si tratta di applicare l’analisi della varianza. Quindi il sistema d’ipotesi è: : : è Le quantità necessarie per poter applicare l’analisi della varianza sono: • ∑ ! " Le medie parziali # ∑6 ! ∙" ∑6 ! " • La media generale • Le devianze parziali @ A @ @ GGM ) ) "6 ∑)* ) 239,8 5 80, /8.; 283,1 5 80, .11; 256,2 5 8F, 1N1 <,; :∙>? <,:==∙>? P,= =∙> > @ Devianza tra i gruppi GGH ∑I* A C B 19,262B ∙ 5 E, EF8E • Devianza entro i gruppi 1,2,3: ∑")*3 ∑")*! A B • $ ∑")*! A A A B B B ) C B # "! DA )* )* C B N, E04N ) C B N, .N4/ ) C B N, EE4/ "6 DA )* 1,2,3 ) "3 DA $ 80, 515 A19,714 C 19,262B ∙ 5 L A19,466 C 19,262B ∙ 5 L A18,606 C D@ I* 0,3950 L 0,4057 L 0,3357 8, 8E1. A questo punto possiamo utilizzare la tabella dell’ANOVA: Natura della variabilità Devianze Gradi di libertà Varianze F 7 Esercitazione n.5 Analisi della varianza (ANOVA) Tra i gruppi 3,3813 c-1=2 1,6906 Entro i gruppi 1,1364 n-c=12 0,0947 Totale 4,5177 n-1=14 1,6906/0,0947=17,853 Al livello di significatività α = 0,05, con 2 gradi di libertà al numeratore e 12 al denominatore il valore tabulato di F è 3,88. Per cui H0 viene rifiutata: i livelli della temperatura scelti nell’esperimento influenzano lo spessore medio del film. b) Passiamo pertanto all’analisi del confronto delle singole coppie di medie. 1. Cominciamo con il confronto tra i dati relativi allo spessore del film con le temperature di 190°C e 192°C: ∶ Il sistema d’ipotesi è ∶ T ∑ !! ! "! ∑ 3! 3 "3 <,P > P , > G ∑ !!A ! U ! B3 "! U N,E04N . N, N0F/4 80, .11 G ∑3 !A 3 U 3 B3 "3 U N,.N4/ . N, 8N8.54 80, /8. Prima di effettuare il test sulle medie occorre stimare la varianza comune attraverso la media ponderata delle due varianze dei campioni: G A C 1B L G A C 1B 0,09875A4B L 0,101425A4B G N, 8NNNF/4 L C2 8 Quindi S = 0,31636609 Trattandosi di piccoli campioni, la statistica test da adottare per verificare l’ipotesi è C 19,714 C 19,466 V 8, 85E0 1 1 1 1 W L 0,31636609W L 5 5 Dalla tavola della T, in corrispondenza di 8 gradi di libertà e di un livello di significatività del 5%, troviamo i valori soglia – 2,306 e + 2,306. Decisione: poiché il valore empirico è interno ai valori soglia, si accetta l’ipotesi nulla. Tale decisione è supportata dal valore del p-value, il quale è compreso tra 0,20 e 0,30. Non vi è differenza significativa dello spessore del film alle temperature di 190°C e 192°C. 2. Procediamo con il confronto tra i dati relativi allo spessore del film con le temperature di 190°C e 194°C: ∶ Anche qui il sistema d’ipotesi è ∶ T ∑ !! ! "! ∑ 6! 3 "6 <,P > P , > 80, /8. G 8F, 1N1 G ∑ !!A ! U ! B3 "! U ∑6 !A 6 U 6 B3 "6 U N,E04N . N,EE4/ . N, N0F/4 N, NFE054 Prima di effettuare il test sulle medie occorre stimare la varianza comune attraverso la media ponderata delle due varianze dei campioni: G A C 1B L G A C 1B 0,09875A4B L 0,83925A4B N, N08EE/4 G L C2 8 8 Esercitazione n.5 Analisi della varianza (ANOVA) Quindi S = 0,30222095 Anche qui, trattandosi di piccoli campioni, la statistica test da adottare per verificare l’ipotesi è V W C 1 L 1 19,714 C 18,606 1 1 0,30222095W L 5 5 4, /0/ Dalla tavola della T, in corrispondenza di 8 gradi di libertà e di un livello di significatività del 5%, troviamo i valori soglia – 2,306 e + 2,306. Decisione: poiché il valore empirico è esterno ai valori soglia, si rifiuta l’ipotesi nulla. Tale decisione è supportata dal valore del p-value, il quale è inferiore a 0,001. Vi è differenza significativa dello spessore del film alle temperature di 190°C e 194°C. 3. Infine, concludiamo con il confronto tra i dati relativi allo spessore del film con le temperature di 192°C e 194°C: ∶ Anche qui il sistema d’ipotesi è ∶ T ∑ 3! 3 "3 ∑ 6! 3 P , > P , > "6 80, .11 G 8F, 1N1 G ∑3 !A 3 U 3 B3 "3 U ∑6 !A 6 U 6 B3 "6 U N,.N4/ . N,EE4/ . N, 8N8.5 N, NFE054 Prima di effettuare il test sulle medie occorre stimare la varianza comune attraverso la media ponderata delle due varianze dei campioni: G A C 1B L G A C 1B 0,09875A4B L 0,83925A4B G N, N051/4 L C2 8 Quindi S = 0,30442569 Anche qui, trattandosi di piccoli campioni, la statistica test da adottare per verificare l’ipotesi è V W C 1 L 1 19,714 C 18,606 1 1 0,30442569W L 5 5 ., .1/ Dalla tavola della T, in corrispondenza di 8 gradi di libertà e di un livello di significatività del 5%, troviamo i valori soglia – 2,306 e + 2,306. Decisione: poiché il valore empirico è esterno ai valori soglia, si rifiuta l’ipotesi nulla. Tale decisione è supportata dal valore del p-value, il quale è compreso tra 0,001. Vi è differenza significativa dello spessore del film alle temperature di 190°C e 194°C. CONCLUSIONE: Si tratterà di scegliere fra le due temperature 190°C e 192°C sulla base di altri criteri poiché, dal punto di vista statistico, essi risultano equivalenti. Potrà per esempio convenire il livello più basso (190°C) che implica minori costi di energia. 9
Documenti analoghi
Appunti 1 ANOVA
numero di gruppi meno 1 (p-1) per la varianza tra gruppi, e al numero totale
delle osservazioni meno il numero di gruppi per la varianza entro gruppi.
LE ASSUNZIONI DELL`ANOVA
ANOVA a due fattori porta al calcolo di tre statistiche F
Fino ad ora abbiamo visto come le medie per ciascuna combinazione possono essere utilizzate
graficamente per capire qualcosa sull’effett...