MathematicsStatisticaA-Level
AQAIB

Correlazione (PMCC)

Coefficiente di Correlazione del Prodotto dei Momenti.

Understand the formulaSee the free derivationOpen the full walkthrough

This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.

Core idea

Overview

Il Coefficiente di Correlazione del Prodotto dei Momenti di Pearson (PMCC) serve come misura statistica per quantificare la forza e la direzione di una relazione lineare tra due variabili continue. Standardizza la covarianza delle variabili mediante il prodotto delle loro deviazioni standard, ottenendo un indice adimensionale che varia da -1 a +1.

When to use: Applicare questa formula quando si analizzano dati quantitativi accoppiati per vedere se una variazione in una variabile corrisponde a una variazione proporzionale in un'altra. È specificamente progettata per associazioni lineari e presuppone che i dati siano campionati da una distribuzione normale bivariata.

Why it matters: Questo coefficiente è una pietra angolare della modellazione predittiva, che consente agli scienziati di identificare pattern nei dati climatici, agli economisti di coprire i rischi nei mercati finanziari e ai sociologi di trovare collegamenti tra fattori demografici. Fornisce una base matematica oggettiva per concludere se due fenomeni sono statisticamente collegati o indipendenti.

Symbols

Variables

r = Correlation, = Covariance Sum, = Var Sum X, = Var Sum Y

Correlation
Variable
Covariance Sum
Variable
Var Sum X
Variable
Var Sum Y
Variable

Walkthrough

Derivation

Formula: Coefficiente di Correlazione del Momento Prodotto (PMCC)

Il PMCC r di Pearson misura la forza e la direzione dell'associazione lineare tra due variabili, variando da -1 a 1.

  • La relazione è approssimativamente lineare.
  • Gli outlier possono influenzare fortemente r.
1

Definisci le Quantità di Riepilogo:

Calcola la somma delle deviazioni incrociate e le somme dei quadrati per x e y.

2

Indica la Formula del PMCC:

Dividi la misura simile alla covarianza per il prodotto delle deviazioni per standardizzare il risultato.

Note: r=1 è correlazione lineare positiva perfetta, r=-1 perfetta negativa e r=0 nessuna correlazione lineare.

Result

Source: AQA A-Level Mathematics — Statistics (Bivariate Data)

Why it behaves this way

Intuition

Immagina un diagramma di dispersione dei punti dati; il PMCC quantifica quanto strettamente questi punti si raggruppano attorno a una retta e se tale retta ha pendenza positiva (correlazione positiva) o negativa (correlazione negativa).

Term
Una misura standardizzata della forza e della direzione di una relazione lineare tra due variabili.
Varia da -1 (correlazione lineare negativa perfetta) a +1 (correlazione lineare positiva perfetta), con 0 che indica assenza di correlazione lineare.
Term
Somma dei prodotti degli scarti di ciascuna variabile dalla propria media.
Indica se le variabili tendono ad aumentare o diminuire insieme (positivo) oppure in direzioni opposte (negativo).
Term
Somma degli scarti quadratici della variabile x dalla propria media.
Rappresenta la variabilita totale, o dispersione, dei dati della variabile x.
Term
Somma degli scarti quadratici della variabile y dalla propria media.
Rappresenta la variabilita totale, o dispersione, dei dati della variabile y.
Term
Un fattore di normalizzazione derivato dalle variabilita individuali di x e y.
Ridimensiona il termine simile alla covarianza (S_xy) in modo che il coefficiente di correlazione 'r' sia sempre compreso tra -1 e +1, rendendolo una misura adimensionale.

Signs and relationships

  • S_{xy}: Il segno di S_xy determina direttamente il segno di 'r'. Un S_xy positivo indica che, all'aumentare di una variabile, anche l'altra tende ad aumentare (correlazione positiva).
  • √(S_{xx)S_{yy}}: Questo termine e sempre positivo perche S_xx e S_yy sono somme di quadrati, quindi non negative. Agisce come fattore di scala, assicurando che il valore assoluto di 'r' non superi mai 1 e standardizzando cosi la misura della correlazione lineare.

Free study cues

Insight

Canonical usage

Uso canonico: The Pearson Product-Moment Correlation Coefficient (PMCC) is a dimensionless statistical measure, used to quantify the strength and direction of a linear relationship between two variables, and is reported as a value

Dimension note

Nota adimensionale: The Pearson Product-Moment Correlation Coefficient (PMCC) is a ratio of the covariance of two variables to the product of their standard deviations.

One free problem

Practice Problem

Un ricercatore sta studiando il legame tra ore di studio e punteggi d'esame. Dati la somma dei prodotti Sxy = 45, la somma dei quadrati per le ore di studio Sxx = 25 e la somma dei quadrati per i punteggi d'esame Syy = 100, calcolare il coefficiente di correlazione r.

Hint: Dividere la somma dei prodotti per la radice quadrata del prodotto delle singole somme dei quadrati.

The full worked solution stays in the interactive walkthrough.

Where it shows up

Real-World Context

Nel contesto di Correlazione tra altezza e taglia di scarpe, Correlazione (PMCC) serve a trasformare le misure in un valore interpretabile. Il risultato è importante perché aiuta a collegare il calcolo alla forma, al tasso di variazione, alla probabilità o al vincolo del modello.

Study smarter

Tips

  • Visualizzare sempre i dati con un grafico a dispersione prima per confermare l'esistenza di un trend lineare.
  • Fare attenzione ai valori anomali, poiché possono gonfiare o sgonfiare significativamente il valore di r.
  • Ricordare che una correlazione pari a zero implica alcuna relazione lineare, ma potrebbe comunque esistere una relazione non lineare.

Avoid these traps

Common Mistakes

  • Confondere correlazione con causalità.
  • r > 1 (errore di calcolo).

Common questions

Frequently Asked Questions

Il PMCC r di Pearson misura la forza e la direzione dell'associazione lineare tra due variabili, variando da -1 a 1.

Applicare questa formula quando si analizzano dati quantitativi accoppiati per vedere se una variazione in una variabile corrisponde a una variazione proporzionale in un'altra. È specificamente progettata per associazioni lineari e presuppone che i dati siano campionati da una distribuzione normale bivariata.

Questo coefficiente è una pietra angolare della modellazione predittiva, che consente agli scienziati di identificare pattern nei dati climatici, agli economisti di coprire i rischi nei mercati finanziari e ai sociologi di trovare collegamenti tra fattori demografici. Fornisce una base matematica oggettiva per concludere se due fenomeni sono statisticamente collegati o indipendenti.

Confondere correlazione con causalità. r > 1 (errore di calcolo).

Nel contesto di Correlazione tra altezza e taglia di scarpe, Correlazione (PMCC) serve a trasformare le misure in un valore interpretabile. Il risultato è importante perché aiuta a collegare il calcolo alla forma, al tasso di variazione, alla probabilità o al vincolo del modello.

Visualizzare sempre i dati con un grafico a dispersione prima per confermare l'esistenza di un trend lineare. Fare attenzione ai valori anomali, poiché possono gonfiare o sgonfiare significativamente il valore di r. Ricordare che una correlazione pari a zero implica alcuna relazione lineare, ma potrebbe comunque esistere una relazione non lineare.

References

Sources

  1. Wikipedia: Pearson product-moment correlation coefficient
  2. Probability and Statistics for Engineers and Scientists by Walpole, Myers, Myers, Ye (9th Edition)
  3. Moore, David S., and George P. McCabe. Introduction to the Practice of Statistics.
  4. Introduction to the Practice of Statistics by David S. Moore, George P. McCabe, Bruce A. Craig
  5. Statistical Methods for the Social Sciences by Alan Agresti
  6. Wikipedia article "Pearson correlation coefficient
  7. AQA A-Level Mathematics — Statistics (Bivariate Data)