18. Dispersió i covariància

Índex | Anterior | Següent | Taules

 

Descripcions mitjançant diverses variables

Molt sovint una població és descrita mitjançant dues o més variables.

Per exemple, un conjunt de persones pot ésser descrit mitjançant l'alçada i el pes de cada un dels individus.

En aquests casos podem analitzar les dades per separat: per exemple, la mitjana aritmètica i la desviació estàndard de les alçades, o els mateixos paràmetres dels pesos. Però molt sovint ens interessa a més analitzar si entre les dues variables hi ha alguna mena de relació.

 

Diagrames de dispersió

Una primera forma d'analitzar la relació entre dues variables quantitatives és l'ús d'un diagrama de dispersió. En un diagrama de dispersió cada individu és representat per un punt Pi, les coordenades del qual corresponen als valors que hi adquireixen les dues variables, que anomenem x i y.

El gràfic resultant pot presentar diversos aspectes:

diagrames de dispersió

 

Covariància

Quan considerem una sola variable, la variància estableix una mesura de la dispersió dels valors en relació a la mitjana aritmètica.

Quan considerem dues variables establim, d'una manera anàloga, el concepte de covariància. La covariància mesura doncs el grau de dispersió al voltant d'un punt central expressat per x, μy).

La covariància es defineix així:

σxy = Σ [(xix)(yiy)] / N

La covariància de la població (3, 5), (7, 9), (6, 4), (8, 6), (9, 7) es calcula així:

μx = ( 3+7+6+8+9 ) / 5 = 6,6
μy = ( 5+9+4+6+7 ) / 5 = 6,2

σxy = [ (-3,6) . (-1,2) + 0,4 . 2,8 + (-0,6) . (-2,2) + 1,4 . (-0,2) + 2,4 . 0,8 ] / 5 = 8,40 / 5 = 1,68

 

Línies d'ajustament i correlació

El fet que un diagrama de dispersió suggereixi d'una manera més o menys gran una línia ens porta a formular-nos immediatament dues preguntes: