Analisi statistica: tipi di dati

Guarda anche: Comprensione delle correlazioni

La nostra pagina su Ricerca osservativa e dati secondari ha descritto due principali fonti di dati (la tua ricerca e i dati che sono stati pubblicati in precedenza). Tuttavia, esistono anche molti diversi tipi di dati e i dati possono essere classificati in molti modi diversi. Il tipo di dati influirà sui modi in cui è possibile utilizzarli e su quale analisi statistica è possibile. Influirà anche sulle conclusioni e le inferenze che puoi trarre.

La scelta del tipo di dati è quindi molto importante. Questa pagina descrive alcune delle distinzioni nei tipi di dati e le implicazioni per i metodi e i risultati della ricerca.

Dati quantitativi e qualitativi

La prima e più ovvia distinzione è tra dati quantitativi e qualitativi:





  • Dati quantitativi sono numerici: possono essere raccolti e presentati come numeri; e

  • Dati qualitativi non sono numerici.

La nostra pagina su ricerca qualitativa e quantitativa spiega questa distinzione in modo più dettagliato e illustra i vantaggi e gli svantaggi di entrambi.

Dati oggettivi e soggettivi



I dati possono anche essere suddivisi in oggettivo e soggettivo.

  • I dati oggettivi sono osservabili e misurabili . Includono cose come altezza, peso o numero di elementi. Di solito vengono raccolti tramite osservazioni o misurazioni dirette.

  • I dati soggettivi sono raccolti da comunicazioni personali da individui . Questo può essere parlato o scritto, ma può anche assumere altre forme. Ad esempio, il linguaggio del corpo può fornire informazioni soggettive (' Giaceva immobile, con gli occhi chiusi e la bocca serrata [oggettiva], come se soffrisse [soggettiva] ').



Sia i dati oggettivi che quelli soggettivi possono essere sia qualitativi che quantitativi. Ad esempio, puoi osservare (oggettivo) un cambiamento di colore (qualitativo) e puoi chiedere alle persone di esprimere le loro opinioni su un problema (soggettivo) utilizzando una scala numerica (quantitativa).

come parte del processo di codifica, il mittente di un messaggio deve ________.

Entrambi i tipi hanno vantaggi e svantaggi. Ad esempio, i dati soggettivi possono fornire una gamma di informazioni molto più ampia, perché molte cose sono semplicemente non misurabili. Questi includono variabili come il livello di dolore, in cui ognuno ha la propria interpretazione. Anche l'utilizzo di una scala da 1 a 10, che rende i dati quantitativi, non significa che saranno direttamente confrontabili tra gli individui.

Tuttavia, i dati soggettivi dipendono anche dalle persone che ricordano e valutano le cose in modo accurato. È quindi probabile che i dati soggettivi siano più inaffidabili quando le persone devono ricordare eventi di molto tempo fa.



Laddove possibile, quindi, si preferiscono dati oggettivi, ma c'è una comprensione generale che a volte sono disponibili solo dati soggettivi.



Dati longitudinali e trasversali

La distinzione tra dati longitudinali e trasversali è in realtà più una distinzione in disegno dello studio rispetto al tipo di dati.

  • Studi longitudinali lavorare con lo stesso gruppo nel tempo. Possono quindi mostrare cambiamenti nel tempo e identificare la causa.

  • Studi trasversali può raccogliere dati in momenti diversi nel tempo, ma da gruppi diversi. Possono quindi mostrare solo un'istantanea o una serie di istantanee nel tempo.

La distinzione cruciale tra i due tipi di studio, e quindi i dati, è che i dati longitudinali possono dimostrare il nesso di causalità.

È generalmente considerato impossibile dimostrare il nesso di causalità dai dati trasversali, perché si dispone solo di informazioni su un momento nel tempo. Non è quindi possibile cambiare qualcosa e vedere che effetto ha (cioè, se c'è un file relazione causale ).

Tuttavia, gli studi trasversali sono molto più convenienti. Devi solo svolgere un singolo sondaggio o una ricerca, piuttosto che seguire una coorte nel tempo. Gli studi longitudinali possono fornire dati di altissima qualità e mostrare le cause, ma soffrono di problemi come l'abbandono della coorte. È anche difficile ottenere finanziamenti per studi longitudinali di alta qualità a lungo termine.

Esempio: combinazione di ricerca trasversale e longitudinale


Il Surrey Communication and Language in Education Study (SCALES ) è un buon esempio di uno studio longitudinale a lungo termine, che includeva anche alcuni elementi di sezione trasversale.

Il primo elemento dello studio è stata un'indagine su vasta scala dei bambini nell'anno di accoglienza in 180 scuole primarie nel Surrey. Tutti i bambini della popolazione sono stati sottoposti a screening per le abilità linguistiche all'ingresso della scuola, tramite un sondaggio completato dagli insegnanti di classe per ogni bambino. Sono stati interrogati sul comportamento, il linguaggio e le abilità sociali. Ciò ha fornito un'istantanea delle capacità linguistiche all'ingresso a scuola e ha consentito ai ricercatori di valutare se il curriculum corrispondeva alle capacità e di stabilire che i bambini più piccoli avevano maggiori probabilità di avere problemi linguistici.

La fase successiva ha selezionato un campione di 590 bambini tra quelli sottoposti a screening, stratificato utilizzando i risultati della prima fase per fornire una gamma di abilità linguistiche. Sono stati visti da un ricercatore nell'anno 1 e di nuovo nell'anno 3 e le loro abilità linguistiche sono state valutate. Ai genitori è stato anche chiesto di fornire informazioni sul linguaggio e sul comportamento in entrambi i punti.

La fase successiva ha seguito la coorte SCALES originale negli anni 6 e 8, per valutare i loro risultati di salute sociale, emotiva e mentale.

I ricercatori erano interessati al legame tra lo sviluppo del linguaggio nella prima infanzia e lo sviluppo sociale ed emotivo nell'adolescenza. Questo tipo di informazioni semplicemente non può essere raccolto da uno studio trasversale o da due studi separati di età diverse. Potresti chiedere ai partecipanti e ai genitori di ripensarci, ma l'intervallo di tempo è tale che è improbabile che il ricordo sia affidabile.

Dati categoriali, continui, discreti e classificati

Un'altra distinzione sono i dati categoriali, continui, discreti o classificati:

  • I dati categoriali sono suddivisi in gruppi o categorie distinti .

    Includono quindi, ad esempio, il sesso, se ti piace il gelato e se hai mai visitato un determinato paese. Possono anche includere l'età se è raggruppata in blocchi di dieci o cinque anni.

  • I dati continui sono definiti come quelli che possono assumere un numero infinito di valori tra due valori qualsiasi.

    Sembra complicato, ma in realtà è semplice. Si tratta di dati come peso o altezza, che può essere qualsiasi valore compreso nell'intervallo di pesi e altezze possibili, non valori fissi o percentuale di una classe a cui piace il gelato (qualsiasi valore compreso nell'intervallo 0-100%). Ogni punto dati è un numero distinto e separato e non rientra in un gruppo. L'età, ad esempio, verrebbe inclusa se la si misura in modo molto preciso in giorni o frazioni di anno, piuttosto che in anni interi.

  • I dati discreti sono definiti come quelli che hanno un numero definito di valori possibili tra due valori qualsiasi

    I dati discreti quindi includono il numero di reclami dei clienti, o il numero di persone a cui piace il gelato, cioè non puoi avere mezzo reclamo, o un terzo di una persona. Un altro esempio potrebbe essere l'età in anni interi. Ai fini dell'analisi, i dati discreti sono considerati molto simili ai dati continui.

  • I dati classificati sono stati ordinati e ordinati, quindi numerati in base al loro ordine di classificazione

    Ad esempio, se avessi quattro bit di dati con valori 4, 6, 3 e 7, potresti classificarli in ordine crescente come 3, 4, 6 e 7. Quindi prenderebbero il loro ordine di classificazione, quindi 3 sarebbe 1 (1 °), 4 sarebbe 2 (2 °) e così via. I dati sono generalmente classificati quando tutto ciò che ti interessa è l'ordine e non i valori assoluti. Questo di solito è il caso quando due variabili cambiano insieme, ma non hanno una relazione lineare (cioè, cambiano a velocità diverse). Ad esempio, il grafico seguente mostra questo tipo di relazione (in questo caso, esponenziale).

    come si fa a dimostrare di essere un ascoltatore attivo?
    Grafico che mostra la relazione esponenziale tra due variabili.

    Avvertimento!


    È importante ricordare che quando si classificano i dati si perdono le informazioni.

    Questo dovrebbe quindi essere fatto solo quando ne hai veramente bisogno.


Questi quattro tipi di dati sono adatti per diversi tipi di analisi e sarà necessario utilizzare diversi test statistici e forme di analisi per ciascuno.

Per ulteriori informazioni sull'utilizzo di diversi tipi di dati per l'analisi, potresti consultare la nostra pagina su Correlazioni .

Conclusione

Ci sono molti diversi tipi di dati che puoi raccogliere come parte della tua ricerca. La scelta del tipo di dati è solitamente guidata dai tuoi metodi di ricerca, che a loro volta sono guidati dalla tua domanda di ricerca e dal tuo approccio generale alla ricerca. Tuttavia, la scelta del tipo di dati ha anche implicazioni per il tipo di analisi e le conclusioni che è possibile trarre.


Continuare a:
Comprensione delle correlazioni
Analisi statistica semplice