Séries statistiques à deux variables

I. Série statistique à deux variables

Définition : Série Statistique
Une série statistique à deux variables est le résultat d’une étude simultanée de deux caractères sur un même échantillon d’individus extraits d’une population.

Exemple : on étudie le nombre de clients et le chiffre d’affaires d’une entreprise au cours des 6 derniers mois.

Définition : Nuage de points
Soit une série statistique à deux variables représentée par le tableau ci-contre. Dans un repère orthonormé, l’ensemble des points de coordonnées (x_i;y_i ) pour i variant de 1 à n, est le nuage de points de cette série statistique.

Exemple : Le nuage de points correspondant à la série statistique du nombres de clients et du chiffre d’affaires d’une entreprise.

Définition : Moyenne d’une série de valeurs
Soit la série de n nombres x_1, x_2,...,x_n. La moyenne de la série est : \bar{x} = \dfrac{x_1+x_2+...+x_n}{n}
Définition : Point moyen d’un nuage de points
Soit une série statistique à deux variables représentée par le tableau ci-contre. Soit \bar{x} la moyenne des valeurs prises par le premier caractère et soit \bar{y} la moyenne des valeurs prises par le deuxième caractère. On appelle point moyen du nuage de points de la série statistique, le point de coordonnées (\bar{x};\bar{y}).

Exemple : G est le point moyen du nuage de points correspondant à la série statistique du nombres de clients et du chiffre d’affaires d’une entreprise.

II. Ajustement affine d’une série statistique

On cherche s’il existe une relation, même approximative entre les deux variables x et y d’une série statistique à deux variables. La disposition des points du nuage peut parfois suggérer une courbe représentative d’une fonction f. Dans ce cas la relation recherchée est y=f(x).

Si les points du nuage sont proches de l’alignement, la courbe cherchée est une droite. On dit que cette droite réalise un ajustement affine du nuage.

Problème : il existe de nombreuses droites qui pourraient convenir. Laquelle choisir ?

Solution : la méthode des moindres carrés.
Elle consiste à déterminer la droite rendant la somme AA^{'2}+BB^{'2}+CC^{'2} la plus petite possible.

Propriété
La droite d’ajustement passe par le point moyen du nuage de points de la série statistique.

Droite d’ajustement, pourquoi ?
Avec l’équation de la droite y=ax+b, on va pouvoir faire des estimations de valeurs de y correspondant à des valeurs de x et vice versa.

Remarque : L’ajustement d’une série statistique à deux variables n’est pas toujours possible.

Print Friendly, PDF & Email