Il Teate Depression Inventory (TDI; Balsamo e Saggino, 2013) è un nuovo test di automisurazione della depressione nato e standardizzato per la popolazione italiana, costruito per garantire facilità e velocità di applicazione dal punto di vista clinico e, al tempo stesso, solidità e precisione misurativa dal punto di vista psicometrico. Esso si presta, dunque, ad arricchire lo strumentario dello psicologo clinico, dello psichiatra e del ricercatore, che abbiano l’esigenza di misurare uno dei più complessi e diffusi fenomeni psicopatologici e, al tempo stesso, di tenere in considerazione la crescente sofisticazione dei criteri scientifici impiegati nella ricerca. La costruzione di uno strumento clinico psicometricamente “solido” rappresenta una sfida al superamento della consolidata dicotomia tra l’esigenza pratica di misurare dimensioni cliniche con strumenti maneggevoli e l’esigenza teorica di basare la misurazione di dimensioni cliniche su teorie psicometriche avanzate al fine di raggiungere una sempre maggiore precisione ed affidabilità misurativa. L’obiettivo finale è, dunque, quello di tentare di integrare la significatività clinica con il rigore quantitativo. L’aspetto più innovativo del TDI risiede nel ricorso ad un nuovo modello matematico di misurazione, appartenente alla famiglia dell’Item Response Theory (IRT; Lord, 1952), che garantisce maggiore oggettività di misura ed è oggi considerato la migliore risposta al problema della misura della persona attraverso i questionari. Si tratta dell’Extended Logistic Model (Andrich, 1985a, 1985b, 1988), che si configura come l’estensione più ampia del modello di Rasch per item politomici. Questo modello (per la cui trattazione esauriente e precisa si rimanda alla lettura di Giampaglia, 2008) consente di superare alcune delle problematiche insite nel modello additivo di Likert e nel metodo dei punteggi sommati che di fatto producono distorsioni niente affatto trascurabili nella costruzione di uno strumento di misurazione della depressione. Per esempio, nelle scale cliniche costruite secondo la teoria classica dei test è di fatto impossibile affermare a priori che un paziente che in due rilevazioni successive, eseguite per valutare l’andamento clinico della terapia, risponda “spesso” piuttosto che “sempre” ad un item (il cui punteggio elevato indichi la presenza di depressione), abbia compiuto un progresso inferiore del 50% rispetto ad un soggetto che risponda “mai” invece che “qualche volta”. E questo nonostante il punteggio sia diminuito di 1 punto nel primo caso e di 2 punti nel secondo. Ciò che sarà consentito dire è solo che passare dalla categoria “sempre” alla categoria “spesso” può rappresentare un certo progresso e passare dalla categoria “qualche volta” alla categoria “mai” rappresenta un progresso verosimilmente maggiore, ma non necessariamente doppio (Bond e Fox, 2007). Al contrario, le scale costruite in base all’IRT consentono di operare misurazioni oggettive. Una misura oggettiva, così come è definita dall’Institute for Objective Measurement (IOM; www.rasch.org), deve rispondere a certi criteri quali l’unidimensionalità, la linearità, l’indipendenza locale e l’oggettività specifica. Prescindendo da aspetti troppo tecnici è possibile affermare che, nel quadro del modello di Rasch, il processo di misurazione non deve risultare influenzato da caratteristiche del soggetto diverse da quella di interesse, da altri soggetti e da particolarità dello strumento utilizzato a tale scopo, analogamente a quanto si verifica nelle scienze naturali. Quando si misura il peso di un individuo, infatti, il risultato non è influenzato dalla sua altezza (anche se questa è correlata con il peso), dal colore dei suoi occhi, né dal peso di altri soggetti e, a meno di errori casuali, esso non varia al variare del tipo di bilancia utilizzato. Analogamente, grazie alla proprietà definita come “separazione dei parametri delle persone e degli item”, le scale possono essere costruite in modo tale da produrre risultati indipendenti dall’età, dal sesso, dal gruppo etnico, dalla cultura, dalla lingua o dalla nazione, esattamente come un taglio di tessuto da un metro rappresenta una sola e la stessa lunghezza di stoffa ai quattro capi del pianeta. Dunque, misure generate con tale modello risultano teoricamente essere sample-free (anche se il test di depressione in questione venisse somministrato ad un altro campione di soggetti, i risultati attesi dovrebbero essere gli stessi) e test-free (gli stessi risultati sono attesi anche qualora un altro test di depressione venisse somministrato agli stessi soggetti). La costruzione del TDI in base ai principi del modello di Rasch ha permesso di ottenere una scala di cui è stato possibile indagare: il range della stima del valore affettivo degli item; la sequenza dei confini per ogni item, capace di rivelare se le categorie di risposta sono in grado di discriminare le posizioni dei soggetti sul tratto latente della depressione; la possibilità di calcolare un punteggio totale (attraverso la semplice somma delle opzioni di risposta agli item politomici) che è una statistica “sufficiente” della misura della depressione, ossia contiene tutta l’informazione necessaria per la stima del livello di depressione delle persone; l’eventuale influenza del bias del genere sessuale, presente in molte misure self-report di depressione; la capacità discriminativa tra soggetti normali e patologici. Gli item di cui si compone il TDI sono stati formulati a partire dallo spettro sintomatologico previsto dal Manuale Diagnostico e Statistico dei Disturbi Mentali nella sua quarta edizione riveduta (DSM-IV-TR; American Psychiatric Association, 2000) e sono stati sottoposti al controllo della desiderabilità sociale e dell’acquiescenza, response set capace di introdurre significative distorsioni nei self-report che misurano costrutti clinici (Arbisi, 2003; Beck, Steer e Garbin, 1988; Krug e Laughin, 1975) e, in particolare, gli inventari self-report di depressione (Cappaliez, 1989; Langevin e Stancer, 1979; Pichot, 1986; Tanaka-Matsumi e Kameoka, 1986). Il campione di standardizzazione del TDI è costituito da un campione clinico, composto di 1181 pazienti ambulatoriali Italiani con varie diagnosi psichiatriche, ed uno non clinico, costituito di 1807 soggetti. La coerenza interna del TDI è molto alta (.94 nel campione clinico, .92 nel campione non clinico). Il pattern di correlazioni con altri test di depressione, tra cui il Beck Depression Inventory-II (BDI; Beck e Steer, 1987), le scale D e Dep del Minnesota Multiphasic Personality Inventory 2 (MMPI-2; Hathaway e McKinley, 1989), lo State- Trait Anxiety Inventory Forma Y (STAI; Spielberger, Gorsuch, & Lushene, 1970) e il Beck Anxiety Inventory (BAI; Beck e Steer, 1990) indicano una buona validità convergente e divergente. La capacità di discriminazione diagnostica, calcolata in base all’ANOVA nei diversi gruppi diagnostici (disturbi dell’umore, disturbi d’ansia, disturbi dell’adattamento, altri disturbi) del campione clinico, appare molto buona. Viene fornito, inoltre, un set di punteggi soglia (cut-off) utili per la valutazione della severità della depressione, calcolati in base all’analisi delle curve ROC (Receiver Characteristic Curves; Gleitman, 1986) in una parte del campione clinico che è stata suddivisa in 4 gruppi in base alle diagnosi cliniche ottenute mediante la versione italiana della Structured Clinical Interview for DSM-IV (SCID-I; Mazzi, Morosini, De Girolamo, Lussetti e Guaraldi, 2000). Riferimenti American Psychiatric Association (2000). Diagnostic and statistical manual of mental disorders, fourth edition, text revision. Washington, D.C.:American Psychiatric Association (tr. it. Manuale diagnostico e statistico dei disturbi mentali, Milano, Masson, 2001). Arbisi, P. (2003). Review of the Beck Depression Inventory -II. In B. S. Plake e J.C. Impara (a cura di), The fourtheen mental measurements yearbook (pp.628-639). Lincoln, NE: Buros Institute of Mental Measurements. Andrich, D. (1985a). An elaboration of Guttman scaling with Rasch models for measurement. In N.B. Tuma (a cura di), Sociological methodology (pp. 33–80). San Francisco: Jossey-Bass. Andrich, D. (1985b). A latent trait model for items with response dependencies: Implications for test construction and analysis. In S. Embretson (a cura di), Test design: Contributions from psychology, education and psychometrics (pp. 245-273). New York, NY.: Academic Press. Andrich, D. (1988). A general form of Rasch’s extended logistic model for partial credit scoring. Applied Measurement in Education, 1, 363-378. Beck, A.T. e Steer, R.A. (1987). Beck Depression Inventory. Manual. San Antonio, TX: The Psychological Corporation. Beck, A.T., Steer, R.A. e Garbin, E. (1988). Psychometric properties of the Beck Depression Inventory: Twenty-five years of evaluation. Clinical Psychology Review, 8, 77-100. Beck, A.T. e Steer, R.A. (1990). Manual for the Beck Anxiety Inventory. San Antonio, TX: The Psychological Corporation. Cappaliez, P. (1989). Social desirability response set and self-report depression inventories in the elderly. Clinical Gerontologist, 9, 45-52. Giampaglia, G. (2008). Il modello di Rasch nella ricerca sociale. Napoli: Liguori editore. Gleitman, H. (1986). Psychology (seconda edizione). New York, NY: Norton. Krug S.E. e Laughlin J.E. (1975). Handbook for the IPAT Depression Scale. Champaign: Institute for Personality and Ability Testing. Lord, F. M. (1952). A theory of test scores. Psychometric Monograph. No.7 Hathaway, S.R. e McKinley, J.C. (1989). Minnesota Multiphasic Personality Inventory 2: Manuale (tr. it. Minnesota MultiphasicPersonality Inventory-2. Manuale, Firenze, Organizzazioni Speciali, 1995). Langevin, R. e Stancer, H. (1979). Evidence that depression rating scales primarily measure a social undesiderability response set. Acta Psychiatrica Scandinavica, 59, 70-79. Mazzi, F., Morosini, P. De Girolamo, G., Lussetti, M. e Guaraldi, G. (2000). SCID-I. Interviste Cliniche Strutturate per il DSM-IV. Firenze: Organizzazioni Speciali. Pichot, P. (1986). A self-report inventory on depressive symptomatology (QD2) and its abridged form (QD2A). In N. Sartorius e T.A. Ban (a cura di), Assessment of depression (pp. 108-122). New York, NY: Springer-Verlag. Spielberger, C.D. (1983). Manual for the State-Trait Anxiety Inventory (Form Y). Palo Alto, CA: Consulting Psychologists Press, Inc. (tr. it. Inventario per l' Ansia di “Stato” e di “Tratto”, Forma Y. Manuale, Firenze, Organizzazioni Speciali, 1989). Tanaka-Matsumi, J. e Kameoka, V.A. (1986). Reliabilities and concurrent validities of popular self-report measures of depression, anxiety, and social desirability. Journal of Consulting and Clinical Psychology, 54, 3, 328-333.
TEATE DEPRESSION INVENTORY. MANUALE
BALSAMO, MICHELA;SAGGINO, ARISTIDE
2013-01-01
Abstract
Il Teate Depression Inventory (TDI; Balsamo e Saggino, 2013) è un nuovo test di automisurazione della depressione nato e standardizzato per la popolazione italiana, costruito per garantire facilità e velocità di applicazione dal punto di vista clinico e, al tempo stesso, solidità e precisione misurativa dal punto di vista psicometrico. Esso si presta, dunque, ad arricchire lo strumentario dello psicologo clinico, dello psichiatra e del ricercatore, che abbiano l’esigenza di misurare uno dei più complessi e diffusi fenomeni psicopatologici e, al tempo stesso, di tenere in considerazione la crescente sofisticazione dei criteri scientifici impiegati nella ricerca. La costruzione di uno strumento clinico psicometricamente “solido” rappresenta una sfida al superamento della consolidata dicotomia tra l’esigenza pratica di misurare dimensioni cliniche con strumenti maneggevoli e l’esigenza teorica di basare la misurazione di dimensioni cliniche su teorie psicometriche avanzate al fine di raggiungere una sempre maggiore precisione ed affidabilità misurativa. L’obiettivo finale è, dunque, quello di tentare di integrare la significatività clinica con il rigore quantitativo. L’aspetto più innovativo del TDI risiede nel ricorso ad un nuovo modello matematico di misurazione, appartenente alla famiglia dell’Item Response Theory (IRT; Lord, 1952), che garantisce maggiore oggettività di misura ed è oggi considerato la migliore risposta al problema della misura della persona attraverso i questionari. Si tratta dell’Extended Logistic Model (Andrich, 1985a, 1985b, 1988), che si configura come l’estensione più ampia del modello di Rasch per item politomici. Questo modello (per la cui trattazione esauriente e precisa si rimanda alla lettura di Giampaglia, 2008) consente di superare alcune delle problematiche insite nel modello additivo di Likert e nel metodo dei punteggi sommati che di fatto producono distorsioni niente affatto trascurabili nella costruzione di uno strumento di misurazione della depressione. Per esempio, nelle scale cliniche costruite secondo la teoria classica dei test è di fatto impossibile affermare a priori che un paziente che in due rilevazioni successive, eseguite per valutare l’andamento clinico della terapia, risponda “spesso” piuttosto che “sempre” ad un item (il cui punteggio elevato indichi la presenza di depressione), abbia compiuto un progresso inferiore del 50% rispetto ad un soggetto che risponda “mai” invece che “qualche volta”. E questo nonostante il punteggio sia diminuito di 1 punto nel primo caso e di 2 punti nel secondo. Ciò che sarà consentito dire è solo che passare dalla categoria “sempre” alla categoria “spesso” può rappresentare un certo progresso e passare dalla categoria “qualche volta” alla categoria “mai” rappresenta un progresso verosimilmente maggiore, ma non necessariamente doppio (Bond e Fox, 2007). Al contrario, le scale costruite in base all’IRT consentono di operare misurazioni oggettive. Una misura oggettiva, così come è definita dall’Institute for Objective Measurement (IOM; www.rasch.org), deve rispondere a certi criteri quali l’unidimensionalità, la linearità, l’indipendenza locale e l’oggettività specifica. Prescindendo da aspetti troppo tecnici è possibile affermare che, nel quadro del modello di Rasch, il processo di misurazione non deve risultare influenzato da caratteristiche del soggetto diverse da quella di interesse, da altri soggetti e da particolarità dello strumento utilizzato a tale scopo, analogamente a quanto si verifica nelle scienze naturali. Quando si misura il peso di un individuo, infatti, il risultato non è influenzato dalla sua altezza (anche se questa è correlata con il peso), dal colore dei suoi occhi, né dal peso di altri soggetti e, a meno di errori casuali, esso non varia al variare del tipo di bilancia utilizzato. Analogamente, grazie alla proprietà definita come “separazione dei parametri delle persone e degli item”, le scale possono essere costruite in modo tale da produrre risultati indipendenti dall’età, dal sesso, dal gruppo etnico, dalla cultura, dalla lingua o dalla nazione, esattamente come un taglio di tessuto da un metro rappresenta una sola e la stessa lunghezza di stoffa ai quattro capi del pianeta. Dunque, misure generate con tale modello risultano teoricamente essere sample-free (anche se il test di depressione in questione venisse somministrato ad un altro campione di soggetti, i risultati attesi dovrebbero essere gli stessi) e test-free (gli stessi risultati sono attesi anche qualora un altro test di depressione venisse somministrato agli stessi soggetti). La costruzione del TDI in base ai principi del modello di Rasch ha permesso di ottenere una scala di cui è stato possibile indagare: il range della stima del valore affettivo degli item; la sequenza dei confini per ogni item, capace di rivelare se le categorie di risposta sono in grado di discriminare le posizioni dei soggetti sul tratto latente della depressione; la possibilità di calcolare un punteggio totale (attraverso la semplice somma delle opzioni di risposta agli item politomici) che è una statistica “sufficiente” della misura della depressione, ossia contiene tutta l’informazione necessaria per la stima del livello di depressione delle persone; l’eventuale influenza del bias del genere sessuale, presente in molte misure self-report di depressione; la capacità discriminativa tra soggetti normali e patologici. Gli item di cui si compone il TDI sono stati formulati a partire dallo spettro sintomatologico previsto dal Manuale Diagnostico e Statistico dei Disturbi Mentali nella sua quarta edizione riveduta (DSM-IV-TR; American Psychiatric Association, 2000) e sono stati sottoposti al controllo della desiderabilità sociale e dell’acquiescenza, response set capace di introdurre significative distorsioni nei self-report che misurano costrutti clinici (Arbisi, 2003; Beck, Steer e Garbin, 1988; Krug e Laughin, 1975) e, in particolare, gli inventari self-report di depressione (Cappaliez, 1989; Langevin e Stancer, 1979; Pichot, 1986; Tanaka-Matsumi e Kameoka, 1986). Il campione di standardizzazione del TDI è costituito da un campione clinico, composto di 1181 pazienti ambulatoriali Italiani con varie diagnosi psichiatriche, ed uno non clinico, costituito di 1807 soggetti. La coerenza interna del TDI è molto alta (.94 nel campione clinico, .92 nel campione non clinico). Il pattern di correlazioni con altri test di depressione, tra cui il Beck Depression Inventory-II (BDI; Beck e Steer, 1987), le scale D e Dep del Minnesota Multiphasic Personality Inventory 2 (MMPI-2; Hathaway e McKinley, 1989), lo State- Trait Anxiety Inventory Forma Y (STAI; Spielberger, Gorsuch, & Lushene, 1970) e il Beck Anxiety Inventory (BAI; Beck e Steer, 1990) indicano una buona validità convergente e divergente. La capacità di discriminazione diagnostica, calcolata in base all’ANOVA nei diversi gruppi diagnostici (disturbi dell’umore, disturbi d’ansia, disturbi dell’adattamento, altri disturbi) del campione clinico, appare molto buona. Viene fornito, inoltre, un set di punteggi soglia (cut-off) utili per la valutazione della severità della depressione, calcolati in base all’analisi delle curve ROC (Receiver Characteristic Curves; Gleitman, 1986) in una parte del campione clinico che è stata suddivisa in 4 gruppi in base alle diagnosi cliniche ottenute mediante la versione italiana della Structured Clinical Interview for DSM-IV (SCID-I; Mazzi, Morosini, De Girolamo, Lussetti e Guaraldi, 2000). Riferimenti American Psychiatric Association (2000). Diagnostic and statistical manual of mental disorders, fourth edition, text revision. Washington, D.C.:American Psychiatric Association (tr. it. Manuale diagnostico e statistico dei disturbi mentali, Milano, Masson, 2001). Arbisi, P. (2003). Review of the Beck Depression Inventory -II. In B. S. Plake e J.C. Impara (a cura di), The fourtheen mental measurements yearbook (pp.628-639). Lincoln, NE: Buros Institute of Mental Measurements. Andrich, D. (1985a). An elaboration of Guttman scaling with Rasch models for measurement. In N.B. Tuma (a cura di), Sociological methodology (pp. 33–80). San Francisco: Jossey-Bass. Andrich, D. (1985b). A latent trait model for items with response dependencies: Implications for test construction and analysis. In S. Embretson (a cura di), Test design: Contributions from psychology, education and psychometrics (pp. 245-273). New York, NY.: Academic Press. Andrich, D. (1988). A general form of Rasch’s extended logistic model for partial credit scoring. Applied Measurement in Education, 1, 363-378. Beck, A.T. e Steer, R.A. (1987). Beck Depression Inventory. Manual. San Antonio, TX: The Psychological Corporation. Beck, A.T., Steer, R.A. e Garbin, E. (1988). Psychometric properties of the Beck Depression Inventory: Twenty-five years of evaluation. Clinical Psychology Review, 8, 77-100. Beck, A.T. e Steer, R.A. (1990). Manual for the Beck Anxiety Inventory. San Antonio, TX: The Psychological Corporation. Cappaliez, P. (1989). Social desirability response set and self-report depression inventories in the elderly. Clinical Gerontologist, 9, 45-52. Giampaglia, G. (2008). Il modello di Rasch nella ricerca sociale. Napoli: Liguori editore. Gleitman, H. (1986). Psychology (seconda edizione). New York, NY: Norton. Krug S.E. e Laughlin J.E. (1975). Handbook for the IPAT Depression Scale. Champaign: Institute for Personality and Ability Testing. Lord, F. M. (1952). A theory of test scores. Psychometric Monograph. No.7 Hathaway, S.R. e McKinley, J.C. (1989). Minnesota Multiphasic Personality Inventory 2: Manuale (tr. it. Minnesota MultiphasicPersonality Inventory-2. Manuale, Firenze, Organizzazioni Speciali, 1995). Langevin, R. e Stancer, H. (1979). Evidence that depression rating scales primarily measure a social undesiderability response set. Acta Psychiatrica Scandinavica, 59, 70-79. Mazzi, F., Morosini, P. De Girolamo, G., Lussetti, M. e Guaraldi, G. (2000). SCID-I. Interviste Cliniche Strutturate per il DSM-IV. Firenze: Organizzazioni Speciali. Pichot, P. (1986). A self-report inventory on depressive symptomatology (QD2) and its abridged form (QD2A). In N. Sartorius e T.A. Ban (a cura di), Assessment of depression (pp. 108-122). New York, NY: Springer-Verlag. Spielberger, C.D. (1983). Manual for the State-Trait Anxiety Inventory (Form Y). Palo Alto, CA: Consulting Psychologists Press, Inc. (tr. it. Inventario per l' Ansia di “Stato” e di “Tratto”, Forma Y. Manuale, Firenze, Organizzazioni Speciali, 1989). Tanaka-Matsumi, J. e Kameoka, V.A. (1986). Reliabilities and concurrent validities of popular self-report measures of depression, anxiety, and social desirability. Journal of Consulting and Clinical Psychology, 54, 3, 328-333.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.