Stats a 2 variables
Hiérarchie des fichiers
Téléchargements | ||||||
Fichiers créés en ligne | (29613) | |||||
TI-Nspire | (20818) | |||||
mViewer GX Creator Ndless | (982) |
DownloadTélécharger
Actions
Vote :
ScreenshotAperçu
Informations
Catégorie :Category: mViewer GX Creator Ndless TI-Nspire
Auteur Author: Léo Recouvreux
Type : Image nécessitant un lecteur
Page(s) : 5
Taille Size: 330.49 Ko KB
Mis en ligne Uploaded: 12/03/2017 - 22:59:33
Uploadeur Uploader: Léo Recouvreux (Profil)
Téléchargements Downloads: 109
Visibilité Visibility: Archive publique
Shortlink : http://ti-pla.net/a868542
Type : Image nécessitant un lecteur
Page(s) : 5
Taille Size: 330.49 Ko KB
Mis en ligne Uploaded: 12/03/2017 - 22:59:33
Uploadeur Uploader: Léo Recouvreux (Profil)
Téléchargements Downloads: 109
Visibilité Visibility: Archive publique
Shortlink : http://ti-pla.net/a868542
Description
SÉRIES STATISTIQUES À DEUX VARIABLES
1 ) POSITION DU PROBLÈME - VOCABULAIRE
A ) DÉFINITION
Définition :
On considère deux variables statistiques numériques x et y observées sur une même population de n individus.
On note x 1 ; x 2 ; ; x n les valeurs relevées pour la première variable et y 1 ; y 2 ; ; y n les valeurs relevées pour la deuxième
variable.
Les couples x 1 ; y 1 ; x 2 ; y 2 ; ; x n ; y n forment une série statistique à deux variables.
Pour la suite du cours, on garde les notations ci-dessus et on considère l'exemple ci-dessous :
Exemple :
Le tableau suivant donne l’évolution du nombre d’adhérents d’un club de basket de 2008 à 2013.
Année 2008 2009 2010 2011 2012 2013
Rang x i 1 2 3 4 5 6
Nombre d’adhérents y i 70 90 115 140 170 220
Le but est d’étudier cette série statistique à deux variables (le rang et le nombre d’adhérents) afin de prévoir l’évolution du
nombre d’adhérents pour les années suivantes.
B ) NUAGE DE POINTS
La première étape consiste à réaliser un graphique qui traduise les deux séries statistiques.
Définition :
Dans le plan rapporté à un repère orthogonal, on appelle nuage de points associé à cette série statistique à deux variables,
l'ensemble des points M 1 x 1 ; y 1 ; M 2 x 2 ; y 2 ;...; M n x n ; y n .
Dans notre exemple, si on place le rang en abscisses, et le nombre d’adhérents en ordonnées, on peut représenter par un point chaque
valeur . On obtient ainsi une succession de points, dont les coordonnées (1; 70), (2; 90), ... (6; 220), forment un nuage de points.
Exemple - question 1 : Représenter le nuage de points associé à la série
- Séries statistiques à deux variables - auteur : Pierre Lux - cours prof -page 1 / 5
Avec une calculatrice :
Remarque :
Le nuage de points associé à une série statistique à deux variables donne donc immédiatement des informations de nature qualitative.
Pour en tirer des informations plus quantitatives, il nous faut poser le problème de l’ajustement.
Le tracé met en évidence la possibilité de "reconnaître" graphiquement la possibilité d’une relation fonctionnelle entre les deux
grandeurs observées (ici rang et nombre d’adhérents).
Le problème de l’établissement d’une relation fonctionnelle entre les deux séries est le problème de l’ajustement.
C ) POINT MOYEN
Définition :
On appelle point moyen de cette série le point G de coordonnées x ; y où x et y sont les moyennes respectives des séries
x 1 ; x 2 ; x n et y 1 ; y 2 ; y n .
Exemple - question 2 : Déterminer les coordonnées des points moyens suivants :
● G 1 des années allant de 2008 à 2010,
● G 2 des années allant de 2011 à 2013,
● G , point moyen du nuage de points tout entier.
On obtient G 1 2 ; 91,7 , G 2 5 ; 176,7 et G 3,5 ; 134,2
2 ) AJUSTEMENTS
A ) À LA RÈGLE
On se propose, à partir des résultats obtenus, de faire des prévisions pour les années à venir.
Un moyen d’y parvenir est de tracer au juger une droite d passant le plus près possible des points du nuage et d’en trouver l’équation
du type y = ax b .
B ) MÉTHODE DE MAYER
Cet ajustement consiste à déterminer la droite passant par deux points moyens du nuage de points.
Exemple - question 3 :
Déterminer l’équation de la droite d 1 qui passe par les points moyens G 1 et G 2 et la tracer sur le graphique précédent.
La droite d 1 n’est pas parallèle à l’axe des ordonnées, elle admet donc une équation de la forme y = ax b avec :
176,7− 91,7
a= = 28,3
5− 2
De plus, elle passe par le point G 1 2 ; 91,7 d’où :
y G = a x G b ⇔ 91,7= 28,3× 2 b ⇔ b = 35,1
1 1
Conclusion : 1d : y = 28,3 x 35,1 .
Pour tracer d 1 , il suffit de placer G 1 et G 2 puis de tracer la droite qui les relie.
- Séries statistiques à deux variables - auteur : Pierre Lux - cours prof -page 2 / 5
C ) MÉTHODE DES MOINDRES CARRÉS
Il s’agit d’obtenir une droite équidistante des points situés de part et d’autre d’elle-même.
Pour réaliser ceci, on cherche à minimiser la somme des distances des points à la droite au carré.
On considère une série statistique à deux variables représentée par un nuage justifiant un ajustement affine.
Définition :
d
Dans le plan muni d’un repère orthonormal, on considère un nuage de n
points de coordonnées x i ; y i .
La droite d d’équation y = ax b est appelée droite de régression de y en x
de la série statistique si et seulement si la quantité suivante est minimale :
n n
∑ M i Qi 2 =∑ y i − a x i b 2
i =1 i =1
Remarque :
n
Il serait tout aussi judicieux de s’intéresser à la droite d ′ qui minimise la quantité ∑ x i − a y i b 2
i =1
Cette droite est appelée droite de régression de x en y.
Définition :
On appelle covariance de la série statistique double de variables x et y le
Pour les calculs, on pourra aussi utiliser :
nombre réel :
n
1 n
cov x ; y = xy = ∑ x i − x y i − y 1
n∑
n i= 1 xy = xi yi − x y
i =1
2
Remarque : On a cov x ; x = x = V x = x 2
Propriété :
La droite de régression d de y en x a pour équation y = ax b où :
xy
a= et b vérifie y = a x b
x 2
Avec une calculatrice :
Propriété :
Le point moyen G du nuage appartient toujours à la droite de régression de y en x .
Exemple - question 4 : Déterminer avec la calculatrice une équation de la droite d’ajustement d 2 de y en x obtenue par la méthode
des moindres carrés et la tracer sur le graphique précédent.
La calculatrice donne d 2 : y = 29 x 32,7
Pour tracer la droite d 2 , il faut choisir deux points (au moins) sur cette droite.
x 0 8
Par exemple :
y 32,7 264,7
- Séries statistiques à deux variables - auteur : Pierre Lux - cours prof -page 3 / 5
D ) AJUSTEMENT EXPONENTIEL
On remarque qu’un ajustement affine ne semble pas très approprié pour ce nuage de points à partir de 2013,
On se propose de déterminer un ajustement plus juste.
Exemple - question 5 : On pose z = ln y . Compléter le tableau suivant en arrondissant les valeurs de z i au millième.
xi 1 2 3 4 5 6
zi 4,248 4,500 4,745 4,942 5,136 5,394
Avec une calculatrice :
Exemple - question 6 :
Déterminer une équation de la droite d’ajustement d 3 de z en x obtenue par la méthode des moindres carrés.
La manipulation à la calculatrice est la même que précédemment, en n'oubliant pas de changer les paramètres.
La calculatrice donne d 3 : z = 0,224 x 4,045
Exemple - question 7 : Dans ce cas, en déduire la relation qui lie y à x puis tracer la courbe représentative de la fonction y = f x .
On a {zz == 0,224
ln y
x 4,045
On a donc : ln y = 0,224 x 4,045
On obtient : eln y = e 0,224 x 4,045 = e 0,224 x ×e 4,045 ≈ 1,251x × 57,111
On en déduit que y = 57,111× 1,251x
Pour tracer la courbe, il suffit de placer des points, par exemple grâce au tableau de valeurs de la calculatrice.
E ) CO...
1 ) POSITION DU PROBLÈME - VOCABULAIRE
A ) DÉFINITION
Définition :
On considère deux variables statistiques numériques x et y observées sur une même population de n individus.
On note x 1 ; x 2 ; ; x n les valeurs relevées pour la première variable et y 1 ; y 2 ; ; y n les valeurs relevées pour la deuxième
variable.
Les couples x 1 ; y 1 ; x 2 ; y 2 ; ; x n ; y n forment une série statistique à deux variables.
Pour la suite du cours, on garde les notations ci-dessus et on considère l'exemple ci-dessous :
Exemple :
Le tableau suivant donne l’évolution du nombre d’adhérents d’un club de basket de 2008 à 2013.
Année 2008 2009 2010 2011 2012 2013
Rang x i 1 2 3 4 5 6
Nombre d’adhérents y i 70 90 115 140 170 220
Le but est d’étudier cette série statistique à deux variables (le rang et le nombre d’adhérents) afin de prévoir l’évolution du
nombre d’adhérents pour les années suivantes.
B ) NUAGE DE POINTS
La première étape consiste à réaliser un graphique qui traduise les deux séries statistiques.
Définition :
Dans le plan rapporté à un repère orthogonal, on appelle nuage de points associé à cette série statistique à deux variables,
l'ensemble des points M 1 x 1 ; y 1 ; M 2 x 2 ; y 2 ;...; M n x n ; y n .
Dans notre exemple, si on place le rang en abscisses, et le nombre d’adhérents en ordonnées, on peut représenter par un point chaque
valeur . On obtient ainsi une succession de points, dont les coordonnées (1; 70), (2; 90), ... (6; 220), forment un nuage de points.
Exemple - question 1 : Représenter le nuage de points associé à la série
- Séries statistiques à deux variables - auteur : Pierre Lux - cours prof -page 1 / 5
Avec une calculatrice :
Remarque :
Le nuage de points associé à une série statistique à deux variables donne donc immédiatement des informations de nature qualitative.
Pour en tirer des informations plus quantitatives, il nous faut poser le problème de l’ajustement.
Le tracé met en évidence la possibilité de "reconnaître" graphiquement la possibilité d’une relation fonctionnelle entre les deux
grandeurs observées (ici rang et nombre d’adhérents).
Le problème de l’établissement d’une relation fonctionnelle entre les deux séries est le problème de l’ajustement.
C ) POINT MOYEN
Définition :
On appelle point moyen de cette série le point G de coordonnées x ; y où x et y sont les moyennes respectives des séries
x 1 ; x 2 ; x n et y 1 ; y 2 ; y n .
Exemple - question 2 : Déterminer les coordonnées des points moyens suivants :
● G 1 des années allant de 2008 à 2010,
● G 2 des années allant de 2011 à 2013,
● G , point moyen du nuage de points tout entier.
On obtient G 1 2 ; 91,7 , G 2 5 ; 176,7 et G 3,5 ; 134,2
2 ) AJUSTEMENTS
A ) À LA RÈGLE
On se propose, à partir des résultats obtenus, de faire des prévisions pour les années à venir.
Un moyen d’y parvenir est de tracer au juger une droite d passant le plus près possible des points du nuage et d’en trouver l’équation
du type y = ax b .
B ) MÉTHODE DE MAYER
Cet ajustement consiste à déterminer la droite passant par deux points moyens du nuage de points.
Exemple - question 3 :
Déterminer l’équation de la droite d 1 qui passe par les points moyens G 1 et G 2 et la tracer sur le graphique précédent.
La droite d 1 n’est pas parallèle à l’axe des ordonnées, elle admet donc une équation de la forme y = ax b avec :
176,7− 91,7
a= = 28,3
5− 2
De plus, elle passe par le point G 1 2 ; 91,7 d’où :
y G = a x G b ⇔ 91,7= 28,3× 2 b ⇔ b = 35,1
1 1
Conclusion : 1d : y = 28,3 x 35,1 .
Pour tracer d 1 , il suffit de placer G 1 et G 2 puis de tracer la droite qui les relie.
- Séries statistiques à deux variables - auteur : Pierre Lux - cours prof -page 2 / 5
C ) MÉTHODE DES MOINDRES CARRÉS
Il s’agit d’obtenir une droite équidistante des points situés de part et d’autre d’elle-même.
Pour réaliser ceci, on cherche à minimiser la somme des distances des points à la droite au carré.
On considère une série statistique à deux variables représentée par un nuage justifiant un ajustement affine.
Définition :
d
Dans le plan muni d’un repère orthonormal, on considère un nuage de n
points de coordonnées x i ; y i .
La droite d d’équation y = ax b est appelée droite de régression de y en x
de la série statistique si et seulement si la quantité suivante est minimale :
n n
∑ M i Qi 2 =∑ y i − a x i b 2
i =1 i =1
Remarque :
n
Il serait tout aussi judicieux de s’intéresser à la droite d ′ qui minimise la quantité ∑ x i − a y i b 2
i =1
Cette droite est appelée droite de régression de x en y.
Définition :
On appelle covariance de la série statistique double de variables x et y le
Pour les calculs, on pourra aussi utiliser :
nombre réel :
n
1 n
cov x ; y = xy = ∑ x i − x y i − y 1
n∑
n i= 1 xy = xi yi − x y
i =1
2
Remarque : On a cov x ; x = x = V x = x 2
Propriété :
La droite de régression d de y en x a pour équation y = ax b où :
xy
a= et b vérifie y = a x b
x 2
Avec une calculatrice :
Propriété :
Le point moyen G du nuage appartient toujours à la droite de régression de y en x .
Exemple - question 4 : Déterminer avec la calculatrice une équation de la droite d’ajustement d 2 de y en x obtenue par la méthode
des moindres carrés et la tracer sur le graphique précédent.
La calculatrice donne d 2 : y = 29 x 32,7
Pour tracer la droite d 2 , il faut choisir deux points (au moins) sur cette droite.
x 0 8
Par exemple :
y 32,7 264,7
- Séries statistiques à deux variables - auteur : Pierre Lux - cours prof -page 3 / 5
D ) AJUSTEMENT EXPONENTIEL
On remarque qu’un ajustement affine ne semble pas très approprié pour ce nuage de points à partir de 2013,
On se propose de déterminer un ajustement plus juste.
Exemple - question 5 : On pose z = ln y . Compléter le tableau suivant en arrondissant les valeurs de z i au millième.
xi 1 2 3 4 5 6
zi 4,248 4,500 4,745 4,942 5,136 5,394
Avec une calculatrice :
Exemple - question 6 :
Déterminer une équation de la droite d’ajustement d 3 de z en x obtenue par la méthode des moindres carrés.
La manipulation à la calculatrice est la même que précédemment, en n'oubliant pas de changer les paramètres.
La calculatrice donne d 3 : z = 0,224 x 4,045
Exemple - question 7 : Dans ce cas, en déduire la relation qui lie y à x puis tracer la courbe représentative de la fonction y = f x .
On a {zz == 0,224
ln y
x 4,045
On a donc : ln y = 0,224 x 4,045
On obtient : eln y = e 0,224 x 4,045 = e 0,224 x ×e 4,045 ≈ 1,251x × 57,111
On en déduit que y = 57,111× 1,251x
Pour tracer la courbe, il suffit de placer des points, par exemple grâce au tableau de valeurs de la calculatrice.
E ) CO...