Vous avez reçu un message "Your GitLab account has been locked ..." ? Pas d'inquiétude : lisez cet article https://docs.gricad-pages.univ-grenoble-alpes.fr/help/unlock/

Commit 6cf93ffd authored by Laurence Viry's avatar Laurence Viry
Browse files

ajout cours + TP Multidim

parent 5ca56452
pages:
image: python:alpine
before_script:
- pip install mkdocs
- pip install https://github.com/mkdocs/mkdocs-bootswatch/archive/master.zip
script:
- mkdocs build
- mv site public
artifacts:
paths:
- public
only:
- master
File added
%\documentstyle[12pt,graphicx]{article}
\documentclass[11pt,twoside,openright]{report}
% Pour les documents rediges en Francais
% --------------------------------------
\usepackage{ucs}
\usepackage[utf8x]{inputenc}
% permet l'utilisation du soulignement
% ------------------------------------
\usepackage{ulem}
% Utilisation des commandes d'indentation
% ----------------------------------------
\usepackage{indentfirst}
%
\hyphenation{ca-vi-ta-tion}
\setlength{\textwidth}{16 cm}
\setlength{\textheight}{23 cm}
\topmargin -1 cm
\oddsidemargin 0 pt
\evensidemargin 0 pt
%
\begin{document}
% Titre
% ------
\begin{center}
{\Large Analyse en composantes principales}
\end{center}
% Objectif du TP
% --------------
\section*{Les objectifs}
Analyse en composantes principales sur un jeu de données qui contient les performances réalisées par des athlètes lors de deux compétitions d'athlétisme qui on eu lieu a un mois d'intervalle: les jeux Olympiques d'Athènes et le Décastar en 2004.\\
%\vspace{0.2cm}
Le tableau contient pour chaque athlète, ses performances à 10 épreuves, son classement final, son nombre de points final et la compétition à laquelle il a participé.\\
Les données sont dans le package datasets, on le récupère avec la commande {\bf data(decathlon)}.\\
L'objectif de l'ACP sur ce jeu de données est de déterminer des profils de performances similaires:
\begin{itemize}
\item \'Etude des individus: peut-on déterminer des profils d'athlètes? Peut-on opposer un groupe d'individus à un autre? \\
Est ce que certaines épreuves se ressemblent : si un athlète est performant pour une épreuve, est-il plutôt performant pour une autre?
\item \'Etude des variables : Peut-on résumer les performances des athlètes par un petit nombre de variables?
\item Lien entre les deux études: peut-on caractériser un groupe d'individus par un petit nombre de variables?
\end{itemize}
\vspace{0.2cm}
Les différents étapes que nous vous conseillons pour cette étude sont les suivantes:
\begin{itemize}
\item Importer le jeu de données.
\item Faire un traitement descriptif univarié et bivarié sur ces données. Une bonne connaissance des données sera une aide à l'interprétation de l'ACP.
\item Choisir les variables et les individus actifs.
\item Faut-il standardiser ou pas les variables actives?
\item A l'issue de ces choix, effectuer l'ACP.
\item Choisir le nombre d'axes à analyser : afficher les valeurs propres et construire le graphiques des valeurs propres.
\item Analyser les résultats :
\begin{itemize}
\item Construire le cercle de corrélations.
\item Observer les individus dans le premier plan factoriel.
\item Positionner des variables illustratives quantitatives dans le cercle des corrélations.
\item Positionner les modalités d’une variable illustrative qualitative.
\end{itemize}
\item Décrire les principales dimensions de variabilité
\item Revenir aux données brutes.
\end{itemize}
\vspace{0.2cm}
Vous pouvez également travailler sur vos propres données, les variables actives qui permettent la construction des axes devront être des variables quantitatives. Un exemple de script R pour lire les fichiers netcdf est fourni, le package RNetCDF devra être installé.\\
\end{document}
#
# Lecture d'un fichier netcdf avec le package RNetCDF
#
# Interface Netcdf - R
library(RNetCDF)
fich <- "096_SSH_T_y2005m06.nc"
# Ouverture du fichier
nc_fich <- open.nc(fich, write=TRUE)
# lecture du fichier
SSH_T_96 <- read.nc(nc_fich)
# Attributs de la list "nc_fich (noms)
attributes(SSH_T_096)
# recuperation des meta données
#print.nc(nc_fich)
# Type et profil des composants de la liste SSH_T_96
# ----
typeof(SSH_T_096$deptht)
dim(SSH_T_096$deptht)
typeof(SSH_T_096$nav_lat)
dim(SSH_T_096$nav_lat)
# on le sauvegarde dans le format qu'on veut...
# Changement de repertoire
setwd("~/formation/cours-stat-R-2017/Multidim/TP/tp1")
# Lecture des donnees
load("decathlon.RData")
ls()
# Statistiques descriptives
summary(decathlon)
# Scaterplot
pairs(decathlon[,1:12])
# Correlation
cor(decathlon[,1:12])
# Utilisation du package FactoMineR
library(FactoMineR)
help("PCA")
# Analyse en composantes principales
# seul le fichier de donnees est obligatoire
quartz()
decathlon.pca <- PCA(decathlon[,1:12])
# Utilisation de variables illustratives pour l'aide a l'interpretation
quartz()
decathlon.pca <- PCA(decathlon,quali.sup=13)
# decathlon.pca est un objet de type "PCA" et "list"
# on observe ses composantes
attributes(decathlon.pca)
# Choisir les axes
barplot(decathlon.pca$eig[,2])
round(decathlon.pca$eig[,2],2)
# Graphiques
# Individu sur les axes 1 et 2
plot(decathlon.pca, choix="ind", habillage=13,cex=0.8)
# Individu sur les axes 3 et 4
plot(decathlon.pca, choix="ind", habillage=13,cex=0.8,axes=3:4)
# Variables sur les axes 1 et 2
plot(decathlon.pca, choix="var",cex=0.8)
# Decrire les principales dimensions de variabilite
dimdesc(decathlon.pca)
\ No newline at end of file
This diff is collapsed.
;pain.céréales;viandes;poissons.fruits_de_mer;lait.fromages.oeufs;huiles.graisses;fruits;légumes;sucre.produits_a_base_de_sucre_ou_cacao;autres_produits_alimentaires;café.thé.cacao;eaux.boissons.jus;autres_dépenses_alimentation;boissons_alcoolisées;restauration;tabac;habillement.articles_chaussants;logement.eau.gaz.électricité;ameublement.équipement_ménager;santé;transports;communications;loisirs.culture;enseignement;services.hébergement;autres_biens.services;hors_champ_consommation_finale;total_produits_alimentaires;total_alimentation;total_non_alimentaire;dépense_totale;Restaurants;Cafés bars et assimilés;Cantines;Autres dépenses de restauration
Moins de 25 ans;545;405;64;297;34;84;177;139;108;39;137;103;188;1185;518;1618;5855;1239;415;3474;1042;1715;354;70;1856;2585;2321;3506;18156;21662;237;427;419;102
De 25 à 34 ans ;741;734;153;522;56;156;297;230;187;78;204;151;233;1663;463;2690;5693;2000;805;4750;1214;2452;76;135;3656;7548;3742;5404;23935;29339;458;470;609;125
De 35 à 44 ans ;1005;1079;231;691;88;223;410;319;163;110;248;202;322;1867;502;2950;4681;2309;987;5551;1134;2872;272;270;3694;10474;5091;6958;25223;32181;418;381;932;135
De 45 à 54 ans ;944;1199;291;662;96;279;430;297;130;118;241;235;487;1761;436;2668;4526;2243;1054;5505;1257;2985;456;317;3716;11365;5410;7171;25163;32334;496;362;742;161
De 55 à 64 ans ;769;1167;325;613;102;305;443;253;126;109;209;184;481;1102;249;2080;3982;2187;1155;4818;961;2775;112;190;3632;10667;5087;6189;22141;28331;438;234;283;147
De 65 à 74 ans ;668;1061;286;525;111;315;410;219;97;90;161;141;450;608;85;1234;3630;1697;981;2845;650;2131;11;138;3207;6942;4535;5143;16609;21752;291;175;34;107
75 ans et plus ;562;912;251;422;90;294;336;175;81;88;118;99;301;531;57;716;3493;1418;1015;1292;513;1311;6;73;2537;5486;3728;4259;12431;16690;263;154;39;76
Ensemble;795;1015;250;574;89;254;384;251;132;98;200;172;376;1320;328;2132;4428;1986;981;4285;989;2460;189;195;3384;8798;4590;5910;21357;27267;0;0;0;0
D1;581;687;132;382;67;169;272;171;91;62;148;73;225;532;299;1272;4072;875;486;1723;727;1019;118;61;1951;2175;3061;3593;12604;16197;0;0;0;0
D2;665;770;175;466;78;192;291;202;100;68;162;75;199;579;350;1256;4441;1051;537;2089;796;1279;134;69;2155;3056;3443;4023;14157;18180;0;0;0;0
D3;713;926;190;515;90;213;337;210;113;81;174;95;291;868;347;1517;4363;1188;959;3067;806;1469;138;115;2481;4261;3945;4813;16450;21263;0;0;0;0
D4;763;947;210;540;87;219;338;241;126;90;185;108;277;879;393;1638;4355;1618;879;3659;895;1803;136;118;2635;5020;4130;5008;18130;23138;0;0;0;0
D5;795;1040;223;556;89;237;367;243;136;91;197;143;366;1037;373;1867;4296;1677;865;3712;994;2076;125;139;3211;6169;4483;5520;19334;24853;0;0;0;0
D6;823;988;234;591;85;237;358;247;144;97;208;164;367;1201;329;2005;4270;1806;892;4651;966;2219;169;160;3222;7245;4543;5744;20687;26431;0;0;0;0
D7;887;1107;265;642;95;263;407;286;143;115;229;177;397;1444;349;2422;4366;2305;1028;4932;1132;2679;247;205;3740;9046;5014;6458;23405;29863;0;0;0;0
D8;913;1151;305;663;98;283;443;282;153;119;234;234;418;1736;315;2613;4501;2296;1086;5411;1147;3160;207;277;4028;10041;5296;7032;25041;32073;0;0;0;0
D9;892;1198;339;676;94;340;474;303;152;117;231;265;498;2155;294;2897;4466;2734;1306;6148;1199;3926;236;344;4684;14281;5579;7734;28234;35968;0;0;0;0
D10;913;1342;427;713;103;386;549;329;159;142;236;390;720;2768;232;3837;5147;4312;1776;7458;1230;4968;377;464;5737;26695;6409;9177;35538;44715;0;0;0;0
# Tp 2 ACP: Données dépenses des ménages
#
library(FactoMineR)
# lecture des donnees
don <- read.table("http://factominer.free.fr/livre/base_conso.csv",header=TRUE,
sep=";",row.names=1)
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment