Analisi multivariata

Guarda anche: Metodi di ricerca

Le nostre pagine Analisi statistica semplice , Sviluppo e verifica di ipotesi e Significato e intervalli di confidenza spiegare alcune delle tecniche più semplici utilizzate per l'analisi statistica. Questa pagina discute alcune delle tecniche più avanzate, coinvolgendo diverse variabili e non solo una o due.

Nella vita reale, al contrario della ricerca di laboratorio, è probabile che scoprirai che i tuoi dati sono influenzati da molte cose diverse dalla variabile che desideri testare. Esistono correlazioni tra elementi che non hai mai considerato e il mondo è complesso.

Lo scopo dell'analisi statistica avanzata è semplificare alcune delle relazioni, creando un modello più efficace di ciò che stai vedendo.




Esistono quattro modi per semplificare l'analisi

  • Design
  • Utilizzo di sottocampioni
  • Utilizzo dei controlli statistici
  • Analisi multivariata

1. Progettazione



Puoi progettare la tua ricerca in modo che i fattori causali siano resi indipendenti l'uno dall'altro. Ad esempio, se pensi che possa esserci un legame tra età e stipendio, un campione casuale di dipendenti rischierà di combinare gli effetti di entrambi. Se, tuttavia, dividi la popolazione in gruppi in base all'età e poi campionate casualmente numeri uguali da ciascun gruppo, hai reso l'età e lo stipendio indipendenti.

2. Utilizzo di sottocampioni

Qui, selezioni il tuo campione in modo che sia uguale su tutti i fattori potenzialmente confondenti. Ad esempio, il tipo di lavoro può influire sulla retribuzione, quindi se desideri studiare gli effetti di un altro fattore sulla retribuzione, puoi selezionare solo persone che svolgono lo stesso lavoro.

3. Utilizzo dei controlli statistici

Se sospetti che tre variabili possano essere collegate, puoi farlo controllo per uno per verificare le correlazioni tra gli altri due. In effetti, si regola il valore statistico del controllo in modo che sia costante e si verifica se esiste ancora una relazione tra le altre due variabili. Potresti scoprire che la relazione osservata rimane alta (è reale) o si riduce notevolmente (probabilmente non esiste una relazione reale). C'è un terzo caso: dove non c'è relazione finché non controlli la terza variabile, il che significa che la variabile di controllo maschera la relazione tra le altre due.

4. Analisi multivariata

L'analisi multivariata include molti metodi statistici progettati per consentire di includere più variabili ed esaminare il contributo di ciascuna.

I fattori che includi nella tua analisi multivariata dipenderanno comunque da ciò che vuoi studiare. Alcuni studi vorranno esaminare il contributo di determinati fattori e altri studi per controllare questi fattori come (più o meno) un fastidio.

Due tipi di variabili

Nell'analisi multivariata, la prima cosa da decidere è il ruolo delle variabili.



Ci sono due possibilità:

dovrei prendere appunti durante la lettura?
  • La variabile cause un effetto: variabile predittore
  • La variabile è colpiti : variabile dipendente

Questa è una funzione del tuo modello, non delle variabili stesse, e la stessa variabile può essere presente in studi diversi.

Le relazioni tra le variabili sono solitamente rappresentate da un'immagine con frecce:

Diagramma per mostrare la relazione tra le variabili.

Puoi anche osservare le variabili direttamente o dedurle da ciò che sta accadendo. Questi sono conosciuti come variabili latenti .

come migliorare la grammatica e la scrittura inglese



Esempio: successo a scuola


È difficile misurare ' successo a scuola ': è un variabile latente .

Potresti decidere che ' successo a scuola 'consiste nel successo accademico, insieme a una certa misura del successo sociale (forse la durata media delle amicizie, o la dimensione del' gruppo di amicizia ') più uno dello sforzo messo in atto (che potresti misurare come percezione di studenti o insegnanti). Queste sono le tue variabili osservate.

Il modello di misurazione esamina la relazione tra le variabili osservate e latenti.


Variabili soggettive e oggettive


Ogni volta che si esegue una ricerca, è probabile che siano coinvolti diversi tipi di dati. Ad esempio, qui ci sono sia dati oggettivi (successo scolastico, durata media dell'amicizia) sia dati soggettivi (sforzo percepito). Il tipo di dati che scegli avrà un effetto sulla qualità della tua ricerca e anche sulle conclusioni che puoi trarre.

C'è di più su questo nella nostra pagina su Tipi di dati .

L'idea alla base di tali modelli è che ci sono correlazioni tra le variabili osservate e latenti (per capirne di più, ti potrebbe piacere leggere la nostra pagina su Correlazioni ).

Si presume che queste correlazioni siano causate da fattori comuni . Maggiore è l'influenza dei fattori comuni (il fattore di carico ), maggiori sono le correlazioni tra le variabili latenti e osservate. È quindi necessario misurare queste correlazioni per valutare l'affidabilità, operazione che è possibile eseguire in diversi modi. Uno dei più comuni è l'utilizzo di un costrutto chiamato Alpha di Cronbach (che la maggior parte dei pacchetti software statistici calcolerà per te). Questo valuta se la variabile osservata misura effettivamente la variabile latente di interesse, ovvero se la variabile osservata è un test affidabile per la variabile latente. Un valore di 0,70 o più fornisce un buon livello di affidabilità al modello.



Alpha di Cronbach viene utilizzato per misurare le correlazioni tra le variabili. Un valore di 0,70 o più fornisce un buon livello di affidabilità al modello.


Analisi dei modelli di misurazione nell'analisi multivariabile

Esistono diversi metodi di analisi per modelli di misurazione come questo. Loro includono Analisi fattoriale di conferma e Analisi fattoriale esplorativa , e di solito vengono eseguiti dal computer.

I dettagli su come eseguire ciascuno di essi esulano dallo scopo di questa pagina, ma l'idea di base è che misurano quanta parte della variazione vista nel costrutto generale è causata da ciascun fattore.

Modelli causali

I modelli causali esaminano il modo in cui le variabili si relazionano tra loro. Sebbene non sia possibile dimostrare la causalità oltre ogni dubbio, i modelli causali consentono di dire se la relazione suggerita si adatta ai dati e quanto bene.

superficie e volume delle forme

Il punto di forza o di debolezza di qualsiasi modello causale è la selezione delle variabili. Se perdi un fattore causale importante, le tue conclusioni saranno limitate o errate. Vale quindi la pena dedicare del tempo alla definizione del modello il più accuratamente possibile.

È necessario trovare un equilibrio tra la semplicità e l'inclusione di più variabili per ottenere un adattamento migliore. Ovviamente non vuoi perdere una delle principali variabili causali, e includere più variabili darà sempre un adattamento migliore. Ma è necessario considerare se la complessità aggiuntiva vale la pena per il guadagno in termini di qualità del modello.


Metodi di analisi adatti per i modelli causali tendono ad essere quelli che vengono chiamati modelli lineari generalizzati, che includono analisi di regressione logistica , analisi di regressione multipla , analisi multivariata della covarianza (MANCOVA) e analisi multivariata della varianza (MANOVA) .

Tutti questi metodi forniscono una misura di quanta variazione nelle variabili dipendenti è causata dai predittori e quindi se il modello è valido.

Ancora una volta, ci sono pacchetti per computer che possono eseguire queste analisi per te, ma assicurati di capire cosa stai facendo e di interpretare correttamente i risultati.

Modellazione di equazioni strutturali riunisce modelli di misurazione e modelli causali. È una tecnica di modellazione al computer che adatta un'equazione strutturale al modello. Questa tecnica è complicata, ma in sostanza confronta i possibili modelli e identifica quello che meglio si adatta ai dati.

Un'area complessa

Il mondo è un luogo complesso e, a volte, l'unico modo per capire cosa sta succedendo è utilizzare tecniche statistiche avanzate per la modellazione.

Tuttavia, anche questi sono complessi e non dovresti intraprenderli senza capirne le basi. Se non lo fai, allora è una buona idea consultare qualcuno che lo fa, di solito uno statistico. Anche se hai già utilizzato la tecnica in precedenza, è comunque una buona idea chiedere a uno statistico di dare un'occhiata a ciò che hai intenzione di fare e controllare i risultati in seguito in caso di errori evidenti.

Una cattiva analisi metterà a repentaglio una buona ricerca molto rapidamente.

Continuare a:
Campionamento e progettazione del campione
Comprensione delle correlazioni