%% LyX 2.1.2 created this file. For more info, see http://www.lyx.org/. \documentclass[10pt,xcolor=table]{beamer}\usepackage[]{graphicx}\usepackage[]{color} %% maxwidth is the original width if it is less than linewidth %% otherwise use linewidth (to make sure the graphics do not exceed the margin) \makeatletter \def\maxwidth{ % \ifdim\Gin@nat@width>\linewidth \linewidth \else \Gin@nat@width \fi } \makeatother \definecolor{fgcolor}{rgb}{0.345, 0.345, 0.345} \newcommand{\hlnum}[1]{\textcolor[rgb]{0.686,0.059,0.569}{#1}}% \newcommand{\hlstr}[1]{\textcolor[rgb]{0.192,0.494,0.8}{#1}}% \newcommand{\hlcom}[1]{\textcolor[rgb]{0.678,0.584,0.686}{\textit{#1}}}% \newcommand{\hlopt}[1]{\textcolor[rgb]{0,0,0}{#1}}% \newcommand{\hlstd}[1]{\textcolor[rgb]{0.345,0.345,0.345}{#1}}% \newcommand{\hlkwa}[1]{\textcolor[rgb]{0.161,0.373,0.58}{\textbf{#1}}}% \newcommand{\hlkwb}[1]{\textcolor[rgb]{0.69,0.353,0.396}{#1}}% \newcommand{\hlkwc}[1]{\textcolor[rgb]{0.333,0.667,0.333}{#1}}% \newcommand{\hlkwd}[1]{\textcolor[rgb]{0.737,0.353,0.396}{\textbf{#1}}}% \usepackage{framed} \makeatletter \newenvironment{kframe}{% \def\at@end@of@kframe{}% \ifinner\ifhmode% \def\at@end@of@kframe{\end{minipage}}% \begin{minipage}{\columnwidth}% \fi\fi% \def\FrameCommand##1{\hskip\@totalleftmargin \hskip-\fboxsep \colorbox{shadecolor}{##1}\hskip-\fboxsep % There is no \\@totalrightmargin, so: \hskip-\linewidth \hskip-\@totalleftmargin \hskip\columnwidth}% \MakeFramed {\advance\hsize-\width \@totalleftmargin\z@ \linewidth\hsize \@setminipage}}% {\par\unskip\endMakeFramed% \at@end@of@kframe} \makeatother \definecolor{shadecolor}{rgb}{.97, .97, .97} \definecolor{messagecolor}{rgb}{0, 0, 0} \definecolor{warningcolor}{rgb}{1, 0, 1} \definecolor{errorcolor}{rgb}{1, 0, 0} \newenvironment{knitrout}{}{} % an empty environment to be redefined in TeX \usepackage{alltt} \mode { \usetheme{MaiMoSiNE} } % % Chargement de quelques packages % ------------------------------------------------- %\usepackage{pgf,pgfarrows,pgfnodes,pgfautomata,pgfheaps,pgfshade} \usepackage{amsmath,amssymb} \usepackage{colortbl} \usepackage{ucs} \usepackage[utf8x]{inputenc} \usepackage{textcomp} \usepackage{pifont} \usepackage{xcolor} \usepackage{array} \usepackage{minted} \usepackage[T1]{fontenc} \setcounter{secnumdepth}{3} \setcounter{tocdepth}{3} \usepackage{url} \ifx\hypersetup\undefined \AtBeginDocument{% \hypersetup{unicode=true,pdfusetitle, bookmarks=true,bookmarksnumbered=false,bookmarksopen=false, breaklinks=false,pdfborder={0 0 0},backref=false,colorlinks=false} } \else \hypersetup{unicode=true,pdfusetitle, bookmarks=true,bookmarksnumbered=false,bookmarksopen=false, breaklinks=false,pdfborder={0 0 0},backref=false,colorlinks=false} \fi \makeatletter % Pour faire des sous figures \usepackage{subfigure} \usepackage{rotating} %packages de math \usepackage{amsmath} \usepackage{amsthm} \usepackage{amsfonts} \usepackage{amssymb} \usepackage{amsbsy} % Liens \usepackage{hyperref} \hypersetup{colorlinks=true,urlcolor=blue,hyperfigures=true} %pour faire pleins de colonnes \usepackage{multicol} %% En tetes et pieds de page \usepackage{fancyhdr} \usepackage{lastpage} \usepackage{textpos} % Nouvelles commandes \newcommand{\argmax}[2]{\smash{\mathop{{\rm argmax}}\limits_{#1}}\, #2 } % Pour vector graphics %\usepackage{tikz} \setbeamercovered{dynamic} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%% LyX specific LaTeX commands. \providecommand{\LyX}{\texorpdfstring% {L\kern-.1667em\lower.25em\hbox{Y}\kern-.125emX\@} {LyX}} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%% Textclass specific LaTeX commands. % this default might be overridden by plain title style \newcommand\makebeamertitle{\frame{\maketitle}}% % (ERT) argument for the TOC \AtBeginDocument{% \let\origtableofcontents=\tableofcontents \def\tableofcontents{\@ifnextchar[{\origtableofcontents}{\gobbletableofcontents}} \def\gobbletableofcontents#1{\origtableofcontents} } % Titre \title[Analyse en Composantes principales]{Analyse en Composantes principales } % Auteur(s) \author[Laurence Viry]{\small{Laurence Viry}} % Institut \institute[]{Collège des écoles doctorales Grenoble - MaiMoSiNE} % Date \date{10 Mars 2015} % Repertoire des graphes \graphicspath{{../../figures/}} \IfFileExists{upquote.sty}{\usepackage{upquote}}{} \begin{document} % <>= % # some setup % options(width=60) # make the printing fit on the page % set.seed(1121) # make the results repeatable % @ % <>= % library(knitr) % opts_chunk$set(fig.path='figure/beamer-',fig.align='center',fig.show='hold',size='footnotesize') % @ %============================= TITRE ==================================== % \makebeamertitle % ==========================Section/sous-section ========================= \AtBeginSection[]{ \begin{frame}%{\secname} % \tableofcontents[currentsection, hideallsections] \tableofcontents[currentsection] \end{frame} } % \AtBeginSubsection[]{ % \begin{frame}%{\secname \subsecname} % \tableofcontents[currentsection, currentsubsection] % \end{frame} % } % ====== Table des matières ====== \begin{frame}{Plan du cours} \tableofcontents[hideallsubsections] %\tableofcontents \end{frame} % ====== Chapitres ====== % ============= % Introducion % ============= \section{Introduction} \begin{frame} \frametitle{Les objectifs} Dans de nombreuses applications on observe {\bf p} variables sur {\bf n} individus, \textcolor{orange}{p et n pouvant être élevés.} \vspace{0.3cm} \begin{itemize} \item[$\succ$] \textcolor{bleu}{Les bases de données deviennent de plus en plus volumineuses} en terme d'individus et de variables mesurées sur ces individus. \vspace{0.2cm} \item[$\succ$] L'étude de \textcolor{bleu}{chaque variable} et celle \textcolor{bleu}{des couples de variables} par les méthodes classiques de statistiques descriptives \textcolor{bleu}{est indispensable mais insuffisante.} \vspace{0.2cm} \item[$\succ$] Les \textcolor{orange}{méthodes exploratoires multidimensionnelles} permettent : \vspace{0.2cm} \begin{itemize} \item de tenir compte \textcolor{bleu}{des variations simultanées} d'un plus grand nombre de variables, \vspace{0.1cm} \item de \textcolor{bleu}{synthétiser} et/ou simplifier les structures sous-jacentes. \end{itemize} \vspace{0.2cm} \item[$\succ$] \textcolor{orange}{L'analyse en composantes principales} (ACP) est l'une de ces méthodes. \vspace{0.2cm} \item[$\succ$] L'ACP détermine \textcolor{bleu}{les principales relations linéaires entre des variables} à partir des \textcolor{bleu}{coefficients de corrélation}. \end{itemize} \end{frame} % \begin{frame} \frametitle{ACP : type de données} \vspace{-0.2cm} On dispose de \textcolor{orange}{p variables } \textcolor{bleu}{$X^{1},X^{2},\ldots,X^{j},\ldots X^{p}$} observées sur \textcolor{orange}{n individus} %ou unités statistiques. \\ \vspace{0.2cm} En \textcolor{orange}{ACP}, on se limite aux \textcolor{orange}{variables quantitatives}, éventuellement binaires ou ordonnées. \\ \vspace{0.2cm} %% On note \textcolor{bleu}{$x^{j}_{i}$ }: l'observation de \textcolor{bleu}{$X^{j}$} sur le \textcolor{bleu}{i-ième individu}.\\ \vspace{0.2cm} {\bf Tableau de données }: % \begin{columns} %\begin{column}[C]{5cm} \begin{column}{5cm} \begin{align} X= \left[\begin{array}{ccc} x_{1}^{1} & \dots & x_{1}^{p}\\ \vdots & \ddots & \vdots\\ x_{n}^{1} & \dots & x_{n}^{p} \end{array}\right] & \quad n \quad \mbox{individus} \nonumber \\ p \quad \mbox{variables} \nonumber \end{align} % \end{column} % %\begin{column}[C]{5cm} \begin{column}{5cm} $$\bar{x^{j}}=\sum_{i=1}^{n} x^{j}_{i}$$ $$\sigma^{j}=\sqrt{\sum_{i=1}^{n} (x^{j}_{i}-\bar{x^{j}})^2}$$ %$$\sigma^{j}}=\sum_{i=1}^{n} x^{j}_{i}$$ \end{column} \end{columns} \vspace{0.2cm} Le tableau des données peut être analysé \textcolor{bleu}{à travers ses lignes} ({\bf individus}) ou \textcolor{bleu}{à travers ses colonnes} ({\bf variables}).\\ \vspace{0.2cm} % $ \textcolor{bleu}{X^{j}}\,= \quad (X^{j}_{1},\ldots,X^{j}_{n}) \quad \mbox{variable} \quad j, \quad \mbox{dans} \quad \mathcal{R}^{n}$ \\ \vspace{0.2cm} $ \textcolor{bleu}{X_{i}}\quad = \quad (X^{1}_{i},\ldots,X^{p}_{i}) \quad\mbox{individu} \quad i, \quad \mbox{dans} \quad \mathcal{R}^{p}$ \\ \vspace{0.2cm} \end{frame} \note{ } % \begin{frame}[fragile] \frametitle{Problèmes - Objectifs} Le tableau peut être vu comme un \textcolor{bleu}{ensemble de lignes} ({\bf individus}) ou un \textcolor{bleu}{ensemble de colonnes} ({\bf variables}). \vspace{0.1cm} \begin{itemize} % Individus \item[$\succ$]\textcolor{orange}{\'Etude des individus} \vspace{0.1cm} \begin{itemize} \item Quand dit-on que deux individus se ressemblent du point de vue de l'ensemble des variables. \vspace{0.1cm} \item Si il y a beaucoup d'individus, peut-on faire un bilan, déterminer des groupes, une partition? \end{itemize} % Variables \vspace{0.1cm} \item[$\succ$]\textcolor{orange}{\'Etude des variables} \vspace{0.1cm} \begin{itemize} \item La matrice de corrélation fournit une indication simple sur la liaison linéaire entre variables deux à deux. \vspace{0.1cm} \item Recherche des ressemblances entre l'ensemble des variables. \vspace{0.1cm} \item On recherche des indicateurs synthétiques permettant de résumer beaucoup de variables. \end{itemize} \vspace{0.1cm} \item[$\succ$]\textcolor{orange}{Relation entre les deux études} \vspace{0.1cm} \begin{itemize} \item Caractériser les groupes d'individus à l'aide des variables. \vspace{0.1cm} \item S'aider des individus types pour interpréter des groupes de variables. \end{itemize} \end{itemize} % \end{frame} \note{ } % \begin{frame}[fragile] \frametitle{{\large Les données de température - Climat des différents pays d' Europe}} %On s'intéresse au climat des différents pays d' Europe. \\ {\small {\bf Description des données} : %on observe sur les principales capitales et grandes villes d'Europe.\\ \begin{itemize} \item les températures moyennes mensuelles (sur 30 ans). \item la température moyenne annuelle, l'amplitude thermique. \item la longitude, la latitude de chaque ville \item Une variable qualitative d'appartenace à une région d'Europe: Europe du nord, du sud, de l'est et de l'ouest. \end{itemize} {\bf Extrait des données}\\ \vspace{0.2cm} \begin{tabular}{|c|ccccc|cccc|c|} \hline & Janv & Fév & ... &Nov & Déc & Moy & Amp & Lat & Lon & Rég \\ \hline Amsterdam & 2.9 & 2.5 & ... & 7.0 & 4.4 & 9.9 & 14.6 & 52.2 & 4.5 & Ouest \\ Athènes & 9.1 & 9.7 &... & 14.6&11.0&17.8 &18.3 & 37.6&23.5& Sud \\ Berlin & -0.2&0.1&...&4.2&1.2&9.1&18.5 &52.3 &13.2&Ouest \\ Bruxelles& 3.3&3.3&...&6.7&4.4&10.3&14.4&50.5&4.2&Ouest\\ Budapest & -1.1& 0.8&...&5.1 &0.7&10.9&23.1&47.3&19.0&Est\\ Copenhague& -0.4 &-0.4&...&4.1&1.3&7.8&17.5&55.4&12.3&Nord\\ Helsinki&-5.8&-5.0&...&0.1&-2.3&4.8&23.4&60.1&25.0&Nord\\ Kiev&-5.9&-5.0&...&1.2&-3.6&7.1&25.3&50.3&30.3&Est\\ ..& &&&&&&&&&\\ \hline \end{tabular} }%fin small \end{frame} \note{ } % \begin{frame}[fragile] \frametitle{Quelques exemples} % \begin{itemize} \item[$\succ$] Analyse sensorielle : note du \textcolor{bleu}{descripteur k} pour le \textcolor{orange}{produit i } \vspace{0.2cm} \item[$\succ$] \'Ecologie : concentration du \textcolor{bleu}{polluant k} sur la \textcolor{orange}{rivière i} \vspace{0.2cm} \item[$\succ$] \'Economie : valeur de l'\textcolor{bleu}{indicateur k} pour l'\textcolor{orange}{année i} \vspace{0.2cm} \item[$\succ$] Génétique : expression du \textcolor{bleu}{gène k} pour le \textcolor{orange}{patient i} \vspace{0.2cm} \item[$\succ$] Biologie : \textcolor{bleu}{mesure k} pour l'\textcolor{orange}{animal i} \vspace{0.2cm} \item[$\succ$] Marketing: valeur d'\textcolor{bleu}{indice de satisfaction k} pour la \textcolor{orange}{marque i} \vspace{0.2cm} \item[$\succ$] Sociologie : \textcolor{bleu}{temps passé à l'activité k} par les individus de la \textcolor{orange}{CSP i} \vspace{0.2cm} \item[$\succ$] $\ldots$ \end{itemize} Pour illustrer ce cours, on prendra \textcolor{bleu}{des données de température} \end{frame} \note{ - Le premier exemple provient de l'analyse sensorielle. Des produits sont décrits par différentes variables qu'on appelle souvent des descripteurs sensoriels comme par exemple l'acidité, l'amertume, la saveur sucrée, etc. Et donc on a un tableau avec différents produits. Par exemple des vins, et pour chaque vin on a sa note d'acidité, sa note d'amertume,sa note de saveur sucrée. L'objectif de l'ACP est d'étudier ce tableau, afin d'obtenir ce que l'on appelle un espace produit, c'est-à-dire une description sensorielle multidimensionnelle des vins. - En écologie, on a un exemple avec différentes rivières et les variables sont différents polluants donc on a un tableau qui croise des rivières en lignes des polluants en colonnes. - En économie, on peut avoir des années et on suit différents indicateurs économiques d'une année à l'autre, les individus statistiques peuvent être les années mais ce pourrait être des pays. - En génétique, très souvent, on a des patients et les variables qui décrivent les patients sont des gènes. Dans ce cas, le tableau de données contient de très nombreux gènes. - En marketing, on a différentes marques et des indices de satisfaction. - En sociologie on peut avoir des enquêtes budget-temps où les individus statistiques sont par exemple des regroupements d'individus de différentes CSP et les variables sont les différentes activités et la mesure est le temps moyen passé par des individus d'une CSP pour une activité donnée. Donc des tableaux de ce type qui croisent des individus en lignes et des variables en colonnes sont nombreux et issus de domaines très variés. Pour illustrer ce cours, nous allons prendre un exemple sur des données météorologique. } % \begin{frame}[fragile] % \frametitle{\'Etude descriptive des variables} % <>= % plot(1) # high-level plot % abline(0, 1) # low-level change % plot(rnorm(10)) # high-level plot % ## many low-level changes in a loop (a single R expression) % for(i in 1:10) { % abline(v = i, lty = 2) % } % @ % % <>= % # some setup % options(width=80) # make the printing fit on the page % @ % \textcolor{blue}{\large Lecture des donn\'ees} % \vspace{0.2cm} % %<>= % <>= % load("autos.RData") % % summary(autos) % # autos <- read.xlsx("autos-acp-diapos.xls",2,as.data.frame=TRUE) % # print(autos) % % @ % \vspace{0.2cm} % \textcolor{blue}{\large Statistiques descriptives} % \vspace{0.2cm} % <>= % # Statistiques descriptives % summary(autos) % @ %\end{frame} %\begin{frame} %\frametitle{\'Etude descriptive des variables (suite)} % %\noindent \textcolor{orange}{} \\ %\noindent \textcolor{orange}{Matrice de corrélation} \\ %\noindent \textcolor{orange}{Scaterplot}\\ % %Ces analyses fournissent des informations importantes sur les relations deux à deux entre les variables mais ne permettent pas de synthétiser de facon simple la structure globale des données. % %\end{frame} % \note{ %} \begin{frame} \frametitle{Problèmatique} {\large \textcolor{orange}{La problématique peut se décomposer en deux points }: \vspace{1.cm} \begin{itemize} \item[$\succ$] Comment visualiser \textcolor{bleu}{la forme du nuage des individus} dans \textcolor{bleu}{$\mathcal{R}^{p}$} \vspace{0.6cm} \item[$\succ$] Comment synthétiser \textcolor{bleu}{les relations entre les variables} dans \textcolor{bleu}{$\mathcal{R}^{n}$} \end{itemize} \vspace{0.6cm} Une solution consiste à \textcolor{orange}{projeter les points des nuages} dans des sous-espaces affines de dimension inférieure en \textcolor{orange}{minimisant la déformation du nuage}. } \end{frame} \note{ } % ==================== % Etude des individus % ==================== \section{\'Etude des individus} \begin{frame} \frametitle{Critère d'inertie} %$\bar{x^{j}}, \sigma^{j}$ sont respectivement la moyenne et l'écart-type de $X^{j}$ Les méthodes factorielles dont l'ACP réduisent la dimension de l'espace par projection orthogonale sur des sous-espaces affines.\\ \vspace{0.2cm} $\Longrightarrow$ \textcolor{orange}{On cherchera à minimiser la déformation du nuage par projection}. \vspace{0.2cm} \begin{itemize} \item[$\succ$] \textcolor{bleu}{Choix de le métrique} pour exprimer l'écart entre deux individus:\vspace{-0.2cm} $$ \|X_{i} - X_{i^{'}}\|^{2}=\sum_{j=1}^{p}(x^{j}_{i} - x^{j}_{i^{'}})^{2}$$ \vspace{-0.2cm} \item[$\succ$] \textcolor{bleu}{Données centrées} : $\tilde{x^{j}_{i}} = x^{j}_{i} -\bar{x^{j}}$ , ($\bar{x^{j}}$ est la moyenne de $X^{j}$) \vspace{0.2cm} \item[$\succ$] \textcolor{bleu}{Données réduites} : $\sigma^{j}$ est l'écart-type de $X^{j}$\\ %$\tilde{\tilde{x^{j}_{i}}} = \frac{x^{j}_{i} -\bar{x^{j}}}{\sigma^{j}}$ \vspace{0.2cm} \textcolor{orange}{l'ACP normée} est une ACP sur les \textcolor{orange}{données centrées réduites} ($\frac{x^{j}_{i} -\bar{x^{j}}}{\sigma^{j}}$). \vspace{0.2cm} \item[$\succ$] \textcolor{bleu}{Inertie du nuage des individus} $$ I = \sum_{i=1}^{n}m_{i} \|X_{i}\|^{2} $$ $m_{i}$ : poids associé à l'individu \i \end{itemize} %Les méthodes factorielles dont l'ACP réduisent la dimension de l'espace par projection orthogonale sur des sous-espaces affines.\\ \end{frame} \note{ } % \begin{frame} \frametitle{Moindre déformation du nuage} %\vspace{-0.5cm} La réduction du nuage d'individus se fait par \textcolor{orange}{projection orthogonale sur un sous-espace affine $\mathcal{H}$} \vspace{0.4cm} \begin{itemize} \item[$\succ$] \textcolor{bleu}{Choix du sous-espace affine $\mathcal{H}$ } : minimisation de la déformation du nuage par projection. \vspace{0.2cm} \item[$\succ$] \textcolor{bleu}{Inertie du nuage d'individus autour de $\mathcal{H}$ }: $$ J_{\mathcal{H}} = \sum_{i=1}^{n}m_{i} \|X_{i} - X_{i}^{*}\|^{2}\quad \mbox{mesure la déformation du nuage}$$ % \quad X_{i}^{*} \mbox{ : projeté orthogonal de } X_{i} \mbox{ sur }\mathcal{H}$ %\vspace{0.2cm} \begin{center} $\Longrightarrow$ \textcolor{orange}{Il faudra minimiser $ J_{\mathcal{H}}$} \end{center} \vspace{0.2cm} \item[$\succ$] \textcolor{bleu}{Inertie du nuage projeté} : $ I_{\mathcal{H}} = \sum_{i=1}^{n}m_{i} \|X_{i}^{*}\|^{2}$ $$ I = J_{\mathcal{H}} + I_{\mathcal{H}} \quad \mbox{(pythagore)}$$ \end{itemize} %\vspace{0.2cm} % \begin{block}{Déterminer $\mathcal{H}$} %\begin{block}{} \begin{center} \textcolor{orange}{Minimisation $J_{\mathcal{H}}$ $\Longleftrightarrow$ Maximiser $I_{\mathcal{H}}$ }\end{center} %\end{block} \end{frame} % \begin{frame} \frametitle{Détermination de $\mathcal{H}_{k}$} %\vspace{-1.cm} \textcolor{bleu}{$$\mathcal{H}_{k} = \min_{\mathcal{H} : dim(\mathcal{H})=k} J_{\mathcal{H}} = \max_{\mathcal{H} : dim(\mathcal{H})=k} I_{\mathcal{H}} $$} \vspace{0.2cm} La recherche de $\mathcal{H}_{k}$ peut se faire de fa\c{c}on séquentielle (axe par axe). \vspace{-0.2cm} $$ \Gamma=(X)^{t}.M.X\quad \mbox{matrice de variance covariance}$$ $\Gamma$ est symétrique, semi-définie positive, elle est diagonalisable. $\lambda_{1} \ge \ldots \ge \lambda_{p} \ge 0$ \\ \vspace{0.2cm} \textcolor{bleu}{$I_{u}=u^{t}\Gamma u$} : on montre facilement, en exprimant u dans la base des vecteurs propres. \begin{itemize} \item[$\succ$] \textcolor{bleu}{$\mathcal{H}_{1} = Vect(u_{1})$} est engendré par le premier vecteur propre de $\Gamma$. \vspace{0.2cm} \item[$\succ$] \textcolor{bleu}{$\mathcal{H}_{k} = Vect(u_{1},\ldots,u_{k})$} est engendré par les k premiers vecteurs propres de $\Gamma$ \vspace{0.2cm} \item[$\succ$] \textcolor{bleu}{$\lambda_{k}$} : k-ième valeur propre de \textcolor{bleu}{$\Gamma$} associé au k-ième vecteur propre \textcolor{bleu}{$u_{k}$}. \textcolor{orange}{$$I_{u_{k}} = \lambda_{k}$$} \vspace{-0.4cm} \item[$\succ$] \textcolor{bleu}{Inertie du nuage sur $\mathcal{H}_{k}$} : \textcolor{orange}{$$I_{\mathcal{H}_{k}} = \sum_{j=1}^{k} \lambda_{j}$$} \end{itemize} \end{frame} % % \begin{frame} \frametitle{Axes principaux de l'ACP - Qualité de représentation} % \begin{itemize} \item[$\succ$] \textcolor{bleu}{(G,$u_{k}$)} : k ième axe principal \vspace{0.2cm} \item[$\succ$] \textcolor{bleu}{ACP normée} (somme des variances) : \textcolor{orange}{$$I=p$$} \item[$\succ$] \textcolor{bleu}{ACP non normée} : \textcolor{orange}{$$I= \sum_{j=1}^{p} \lambda_{j}$$} \item[$\succ$] \textcolor{bleu}{Qualité globale de représentation} : part d'inertie expliquée \vspace{0.2cm} \begin{itemize} \item sur le k ième axe : \textcolor{orange}{$$\frac{\lambda_{k}}{I}$$} \item sur $\mathcal{H}_{k}$ : \textcolor{orange}{$$I_{\mathcal{H}_{k}} = \frac{\sum_{j=1}^{k} \lambda_{j}}{I}$$} \end{itemize} \end{itemize} \end{frame} % % Centrer et/ou reduire le nuage % \begin{frame} \frametitle{Centrer - Réduire le nuage} \begin{itemize} \item[$\succ$] \textcolor{orange}{Centrer les variables}: centrer le nuage ne déforme pas le nuage.\\ \vspace{0.3cm} $\Longrightarrow$ \textcolor{bleu}{On se placera toujours au centre de gravité du nuage} \vspace{0.3cm} \item[$\succ$] \textcolor{orange}{Réduire les variables} (ACP normée) : \begin{itemize} \vspace{0.2cm} \item Lorsque les variables ne sont pas exprimées avec les même unités. \vspace{0.2cm} \item Ne pas réduire les variables donne plus d'importance aux variables qui ont une grande variabilité. \end{itemize} \vspace{0.3cm} \item[$\succ$] \textcolor{orange}{Centrer et réduire la variable $k$} : $$X^{k} \longrightarrow \frac{x^{k}_{i} - \bar{x^{k}}}{\sigma^{k}}$$ \end{itemize} \end{frame} % % \begin{frame} \frametitle{L'analyse en composantes principales et R} \begin{itemize} \item[$\succ$] La fonction \textcolor{orange}{princomp} de R permet de faire une ACP, elle reste simpliste. \vspace{0.2cm} \item[$\succ$] Le package \textcolor{orange}{FactoMineR } fournit les méthodes les plus classiques d'analyse de données multidimensionnelles. % \vspace{0.2cm} \begin{itemize} \item L'\textcolor{bleu}{ACP} (fonction {\bf PCA}), \vspace{0.2cm} \item l'\textcolor{bleu}{analyse factorielle des correspondances} (fonction {\bf CA}), \vspace{0.2cm} \item \textcolor{bleu}{l'analyse des correspondances multiples} (fonction {\bf MCA}),... \vspace{0.2cm} \item Dans chaque méthode, on peut ajouter \textcolor{bleu}{des éléments illustratifs} (individus, variables), \textcolor{bleu}{des aides à l'interprétation} sont fournies. \vspace{0.2cm} \item Des \textcolor{bleu}{représentations graphiques} et \textcolor{bleu}{leurs options} sont associées à chaque méthode. \end{itemize} \item[$\succ$] Le package \textcolor{orange}{missMDA} permet de gérer les données manquantes en analyse des données (ACP, ACM ou AFM). \end{itemize} \href{http://math.agrocampus-ouest.fr/infoglueDeliverLive/membres/Francois.Husson/coinR}{Pour en savoir plus} \end{frame} % \begin{frame} \frametitle{ACP des données de températures} \textcolor{orange}{Tableau des données centrées - réduites}\\ \vspace{0.4cm} {\small \begin{tabular}{|c|ccccc|cccc|c|} \hline & Janv & Fév & ... &Nov & Déc & Moy & Amp & Lat & Lon & Rég \\ \hline Amsterdam & 0.28 & 0.05 & ... & 0.28 & 0.36 & 9.9 & 14.6 & 52.2 & 4.5 & Ouest \\ Athènes & 1.41 & 1.36 &... & 1.87 & 1.63 &17.8 &18.3 & 37.6 & 23.5 & Sud \\ Berlin & -0.28 &-0.38 &...& -0.41 & -0.34 & 9.1 & 18.5 & 52.3 & 13.2 & Ouest \\ Bruxelles& 0.35 & 0.20 &...& 0.14 & 0.36 & 10.3 & 14.4 & 50.5 & 4.2 & Ouest\\ Budapest & -0.44 & 0.26 &...& -0.21 & -0.44 & 10.9 & 23.1 & 47.3 & 19.0 & Est\\ Copenhague& -0.32 &-0.48 &...& -0.43 & -0.32 & 7.8 & 17.5 & 55.4 & 12.3 & Nord\\ Dublin& 0.63 & 0.51 &...& 0.14 & 0.51 & 9.3 & 10.2 & 53.2 & 6.1 & Nord\\ Helsinki& -1.30 & -1.53 &...& -1.31 & -1.04 & 4.8 & 23.4 & 60.1 & 25.0 & Nord\\ Kiev& -1.32 & -1.31 &...& -1.06 & -1.30 & 7.1 & 25.3 & 50.3 & 30.3 & Est\\ ...& ...&...&...&...&...&...&...&...&...&...\\ \hline \end{tabular} } \vspace{0.4cm} \end{frame} % \begin{frame} \frametitle{ACP des données de températures} \textcolor{orange}{Les variables actives} : variables prises en compte dans le calcul des distances.\\ \vspace{0.1cm} \begin{itemize} \item \textcolor{orange}{Variables actives}: variables des températures mensuelles (12 variables). \vspace{0.1cm} \item \textcolor{bleu}{Variables illustratives quantitatives}: moyenne annuelle, amplitude thermique. \vspace{0.1cm} \item \textcolor{bleu}{Variables illustratives qualitatives}: la variable région. \end{itemize} \vspace{0.1cm} \textcolor{orange}{Les individus actifs} sont les capitales des pays (1:23) pour éviter de donner plus de poids aux pays pour lesquels plusieurs villes sont renseignées.\\ \vspace{0.1cm} \textcolor{orange}{Les individus illustratifs} sont les villes associées aux lignes 24:35 du tableau de données.\\ \vspace{0.1cm} \textcolor{orange}{Questions}: \begin{itemize} \item Peut-on résumer les températures mensuelles par un petit nombre de composantes? \item Quels sont les plus grandes disparités entre les pays? \end{itemize} \end{frame} % \begin{frame} \frametitle{Visualisation des individus sur les axes 1 et 2} \vspace{-0.2cm} \includegraphics[scale=0.3]{indPCA12} \end{frame} % \begin{frame} \frametitle{Utilisation des variables pour l'interprétation} Une bonne connaissance des données peut aider à l'interprétation des projections mais lorsqu'il y a beaucoup d'individus, on s'aidera des variables.\\ \vspace{0.1cm} On considère les coordonnées des individus sur les axes comme des variables.\\ \vspace{0.1cm} \textcolor{bleu}{$F^{k}_{i}$} : coordonnée de l'individu i sur l'axe k. $$ F^{1}=\{ F^{1}_{i}, i=1 \ldots n\} \quad ; \quad F^{2}=\{ F^{2}_{i}, i=1 \ldots n\}$$ \vspace{0.2cm} \noindent \textcolor{orange}{Analyse des corrélations des variables actives avec les facteurs}\\ \textcolor{bleu}{Pour les variables fortement corrélées avec les facteurs}: \begin{itemize} \item $cor(X^{k},F^{1}) > O$ : les individus qui ont de fortes valeurs sur $X^{k}$ ont de fortes valeurs sur l'axe 1. \item $cor(X^{k},F^{1}) < O$ : les individus qui ont de fortes valeurs sur $X^{k}$ ont de faibles valeurs sur l'axe 1. \end{itemize} \vspace{0.2cm} \textcolor{orange}{Même raisonnement avec l'axe 2}.\\ \vspace{0.2cm} On construit \textcolor{bleu}{le cercle de corrélation} \end{frame} % % \begin{frame}[plain] % \includegraphics[scale=0.32]{indPCA12} % \end{frame} % \begin{frame}[plain] \includegraphics[scale=0.32]{cercleCor12} \end{frame} % ====================== % Etude des variables % ====================== \section{\'Etude des variables} % Nuage des variables \begin{frame} \frametitle{Nuage des variables} Une \textcolor{orange}{variable} est un point sur une \textcolor{orange}{hypersphère dans $\mathcal{R}^{n}$}\\ \vspace{0.2cm} \begin{columns} % \begin{column}{5cm} \includegraphics[scale=0.27]{NuageVarSphere} \end{column} % \begin{column}{5cm} \begin{align} \cos (\theta_{k,l}) & = \frac{}{\|X^{k}\| \|X^{l}\|} \nonumber \\ & = \frac{\sum_{i=1}^{n} x_{i}^{k} x_{i}^{l}}{\sqrt{\sum_{i=1}^{n} (x_{i}^{k})^{2} \sum_{i=1}^{n} (x_{i}^{l})^{2}}} \nonumber % & = cor(X^{k},X^{l}) \nonumber \end{align} \end{column} \end{columns} \vspace{0.2cm} Comme les variables sont centrées \\ \vspace{0.2cm} $\textcolor{bleu}{ \cos (\theta_{k,l}) = r(X^{k},X^{l}) }\quad \mbox{coefficient de corrélation entre} \quad X^{k} \; \mbox{et} \quad X^{l}$\\ \vspace{0.2cm} Les variables bien représentées seront voisines du cercle.\\ \vspace{0.2cm} \textcolor{orange}{Variables réduites} $\Longrightarrow$ l'hypersphère est de rayon 1 \\ \end{frame} % \begin{frame} \frametitle{Projection du nuage des variables} Quels sont les axes dans $\mathcal{R}^{n}$ qui représentent au mieux la matrice de corrélation? % \begin{itemize} \item Le premier axe est l'axe qui \textcolor{bleu}{maximise la somme des corrélations au carrés entre le facteur et l'ensemble des variables}. \textcolor{orange}{ $$ \argmax{V_{1} \in \mathcal{R}^{n}}{\sum_{k=1}^{p} r(X^{k},V^{1})^{2}}$$} Le facteur $V^{1}$ est le facteur qui est le plus lié à l'ensemble des variables au sens des corrélations au carré. \vspace{0.2cm} \item On cherche un \textcolor{bleu}{deuxième axe orthogonal au premier} (non corrélé) qui maximise la somme des corrélations avec l'ensemble des variables. \vspace{0.2cm} \item De façon séquentielle, on détermine le 3ième axe, $\ldots$ \end{itemize} \vspace{0.4cm} \textcolor{red}{La projection du nuage des variables est la même que la représentation du cercle de corrélation obtenue précédemment}. \end{frame} % \begin{frame} \frametitle{Projection des variables} \begin{columns} \begin{column}{6cm} \includegraphics[scale=0.2]{cercleCor12} \end{column} % \begin{column}{4.8cm} %\vspace{0.2cm} \begin{itemize} \item Toutes les variables ont une coordonnées positives sur l'axe 1 (effet taille). \vspace{0.1cm} \item On peut résumer l'axe 1 par la moyenne annuelle ce qui est conforté par la variable illustratriv e ''moyenne''. \vspace{0.1cm} \item la latitude est également liée au premier facteur. \item l'amplitude thermique est liée au deuxième axe. \end{itemize} \end{column} \end{columns} % % \vspace{0.2cm} \end{frame} % \begin{frame} \frametitle{Projection des variables sur le plan} $r(A,B) = \cos(\theta_{A,B})$\\ \vspace{0.1cm} \begin{tabular}{lcl} Si {\bf A} est proche du plan & $\Longrightarrow$ &{\bf A} est bien projeté \\ &$\Longrightarrow$ & $r(A,H_{A}) \approx 1$ \\ &$\Longrightarrow$ & \textcolor{bleu}{proche du cercle de corrélation} \end{tabular} \vspace{-0.1cm} \includegraphics[scale=0.28]{QualProjVar} $\Longrightarrow$ \textcolor{orange}{Seules les variables bien projetées peuvent être interprétées} \end{frame} % ======================== % Aide a l'interprétation % ======================== \section{Aide à l'interprétation} % \subsection{Indicateurs} % % \begin{frame} \frametitle{Pourcentage d'inertie - Choix du nombre d'axes} \begin{itemize} \item Pourcentage d'information expliquée par chaque axe (valeur propre) \item Les axes étant orthogonaux, on peut ajouter l'inertie expliquée de plusieurs axes. \end{itemize} \includegraphics[scale=0.26]{PourcentageInertieExpliquee} $\Longrightarrow$ \textcolor{orange}{Permet le choix du nombre d'axes à analyser} \end{frame} % \begin{frame} \frametitle{Aide à l'interprétation - 2 indicateurs} % Deux aides à l'interprétation. \begin{itemize} \item[$\succ$] \textcolor{orange}{Qualité de représentation} des variables et des individus sur l'axe k \vspace{0.2cm} \begin{columns} \begin{column}{5cm} \vspace{0.1cm} {\bf Variable}\\ \vspace{0.2cm} \textcolor{bleu}{$\cos^{2}(V,V_{k})$} \end{column} % \begin{column}{5cm} \vspace{0.2cm} {\bf Individu} \\ \vspace{0.2cm} \textcolor{bleu}{$\cos^{2}(GI,GH_{i}^{k})$} \\ $H_{i}^{k}$ est la projection de I sur l'axe. %\vspace{0.2cm} \end{column} \end{columns} \vspace{0.2cm} $\Longrightarrow$ Seuls les éléments bien projetés peuvent être interprétés % \begin{itemize} % \item \textcolor{bleu}{de la variable $V_{1}$} : $\cos^{2}(V,V_{1})$ % \item \textcolor{bleu}{de l'individu I} : $\cos^{2}(GI,GH_{i})$ où $H_{i}$ est la projection de I sur l'axe. % \end{itemize} % $\Longrightarrow$ \textcolor{orange}{Seuls les éléments bien projetés peuvent être interprétés} % \vspace{0.2cm} \item[$\succ$] \textcolor{orange}{Contribution à la construction de l'axe k} \begin{columns} \begin{column}{5cm} %\vspace{0.2cm} $$Ctr_k(j) = \frac{r(X^{j},V_{k})^{2}}{\sum_{l=1}^{p} r(X^{l},V_{k})^{2}}$$ \vspace{0.2cm} \includegraphics[scale=0.6]{cos2Var} \end{column} % \begin{column}{5cm} %\vspace{0.2cm} $$Ctr_k(i) = \frac{F^{k^2}_{i}}{\sum_{l=1}^{n} F^{k^2}_{l}}$$ \vspace{0.2cm} \includegraphics[scale=0.6]{cos2Ind} \end{column} \end{columns} % \begin{itemize} % \item \textcolor{bleu}{Contrinution d'un individu à l'inertie sur l'axe k} : $\frac{r(X^{k})} % \item \textcolor{bleu}{Contribution à l'inertie le long d'un axe $(O,u_{\alpha})$} % \item \textcolor{bleu}{Qualité de la projection sur l'axe $(O,u_{\alpha})$} % \end{itemize} \end{itemize} \end{frame} % % Element supplementaires % \begin{frame} \frametitle{\'Eléments supplémentaires ou illustratifs} Les éléments supplémentaires peuvent être \textcolor{bleu}{des individus} et/ou \textcolor{bleu}{des variables}. \vspace{0.2cm} \begin{itemize} \item[$\succ$] Ils ne servent pas au calcul des distances entre individus ou à la construction de la matrice de corrélation \\ $\Longrightarrow$ \textcolor{bleu}{ils ne participent pas à la construction des axes} \vspace{0.2cm} \item[$\succ$] Ils sont une aide à leur interprétation. \vspace{0.2cm} \item[$\succ$] \textcolor{orange}{Variables supplémentaires} \begin{itemize} \item \textcolor{bleu}{Variables quantitatives} : elles seront projetées sur le cercle de corrélation.\\ La coordonnée de la variable supplémentaire $X^{j}$ sur l'axe k est la corrélation entre cette variable et le facteur $F^{k}$. \vspace{0.2cm} \item \textcolor{bleu}{Variables qualitatives} : projection de chaque modalité \textcolor{bleu}{au barycentre des individus associés à cette modalité}, sur \textcolor{bleu}{le graphe des individus}.\\ \vspace{0.1cm} L'information peut être \textcolor{bleu}{représentatée sous la forme d'un code couleur}, les individus associés à une même modalité sont coloriés suivant une même couleur. \end{itemize} \vspace{0.2cm} \item[$\succ$] \textcolor{orange}{Individus supplémentaires}: ils sont projetés sur le graphe des individus. \end{itemize} \end{frame} % \begin{frame} %\frametitle{Données de température - éléments supplémentaires} \textcolor{orange}{Graphe des individus} \includegraphics[scale=0.3]{indPCA12} % \begin{itemize} % \item Pour les variables quantitatives % \item Pour les variables qualitatives % \end{itemize} \end{frame} % \begin{frame} %\frametitle{Données de température - éléments supplémenatires} \textcolor{orange}{Cercle des corrélations} \begin{columns} \begin{column}{6cm} \includegraphics[scale=0.2]{cercleCor12} \end{column} % \begin{column}{4.8cm} %\vspace{0.2cm} \begin{itemize} \item Aide pour interpréter les individus. \vspace{0.2cm} \item Représentation optimale pour représenter les variables. \vspace{0.2cm} \item Visualisation de la matrice de corrélation. \end{itemize} \end{column} \end{columns} % % \end{frame} % \begin{frame} \frametitle{Description automatique des axes} Ce type d'aide à l'interprétation est intéressant lorsque \textcolor{orange}{le nombre de variables est important}. \vspace{0.4cm} \begin{itemize} \item[$\succ$] \textcolor{bleu}{Variable quantitatives} : $(r(V^{j},F^{k}), j=1 \ldots p)$ \vspace{0.2cm} \begin{itemize} \item On conserve les variables qui ont un coefficient de corrélation avec le facteur significativement $\# 0$. \vspace{0.2cm} \item Pour chaque axe, on trie les variables du coefficient de corrélation le plus élévé au moins élévé. \end{itemize} \vspace{0.2cm} \item[$\succ$] \textcolor{bleu}{Variable qualitatives} : on effectue une analyse de variance pour chaque variable qualitative et chaque facteur (test de Fisher, test de Student) \end{itemize} \end{frame} % \section{Mise en oeuvre avec FactoMineR} \begin{frame} \frametitle{Les différentes étapes d'une ACP} \begin{itemize} \item[$\succ$] Quelles sont \textcolor{bleu}{les variables actives} et \textcolor{bleu}{les individus actifs} qui permettent la construction des axes?\\ \vspace{0.1cm} Quelles sont \textcolor{bleu}{les variables illustratives} et \textcolor{bleu}{les individus illustratifs} pour l'aide à l'interprétation? \vspace{0.2cm} \item[$\succ$] Faut-il \textcolor{bleu}{réduire les variables}? \vspace{0.2cm} \item[$\succ$] Effectuer l'\textcolor{bleu}{ACP}. \vspace{0.2cm} \item[$\succ$] Déterminer le \textcolor{bleu}{nombre de dimensions à conserver} (pourcentage d'inertie expliquée). \vspace{0.2cm} \item[$\succ$] \textcolor{bleu}{Sorties graphiques}: plans des individus, cercles des corrélations avec ou sans éléments supplémentaires. \vspace{0.2cm} \item[$\succ$] \textcolor{bleu}{Analyse simultanée} des deux nuages. \vspace{0.2cm} \item[$\succ$] Interprétation des résultats à l'aide \textcolor{bleu}{des indicateurs}: qualité de représentaion et contribution aux axes. \vspace{0.2cm} \item[$\succ$] \textcolor{bleu}{Revenir aux données brutes} pour valider les analyses. % \vspace{0.2cm} \end{itemize} \end{frame} % \begin{frame}[plain,fragile] %\frametitle{Mise en oeuvre avec FactoMineR} \textcolor{orange}{FactoMineR} est un package R qui propose des \textcolor{orange}{méthodes exploratoires multidimensionnelles} en particulier l'\textcolor{bleu}{analyse en composantes principales {\bf PCA}} \\ \vspace{0.1cm} \begin{minted}{r} # Importation des donnees load("temperat.RData") # Statistiques descriptives summary(temperat) # Liens 2 a 2 pairs(temperat[,1:12]) cor(temperat[,1:12]) # Analyse en composantes principales library(FactoMineR) temperat.pca <- PCA(temperat,ind.sup=24:35,quanti.sup=12:16,quali.sup=17) # temperat.PCA : objet de class ''PCA'' et ''list'' attributes(temperat.pca) # Choisir les axes temperat.pca$eig barplot(temperat.pca$eig[,2]) round(temperat.pca$eig[,2],2) \end{minted} \end{frame} % \begin{frame}[fragile] \frametitle{Mise en oeuvre avec FactoMineR (suite)} \begin{minted}{r} # Graphiques # Individu sur les axes 1 et 2 - coloriage des individus avec la variable Region plot(temperat.pca, choix="ind", habillage=17,cex=0.8) # Individu sur les axes 3 et 4 plot(temperat.pca, choix="ind", habillage=17,cex=0.8,axes=3:4) # Variables sur les axes 1 et 2 plot(temperat.pca, choix="var", habillage=17,cex=0.8) # Decrire les principales dimensions de variabilite dimdesc(temperat.pca) # Calculer les donnees actives centrees et reduites nbrows=dim(temperat[1:23,1:12])[1] scale(temperat[1:23,1:12])*sqrt((nbrows-1)/nbrows) \end{minted} \end{frame} % \begin{frame}[plain] %\frametitle{Démarches en ACP} % \begin{figure} \centering \href{http://math.agrocampus-ouest.fr/infoglueDeliverLive/digitalAssets/86400_d__marche_ACP.svg}{\includegraphics[scale=0.25]{demarcheACP}} \caption{\href{http://math.agrocampus-ouest.fr/infoglueDeliverLive/digitalAssets/86400_d__marche_ACP.svg}{Démarche ACP}} \end{figure} % %\begin{figure}%[2] % \centering % \href{http://www.google.de}{\includegraphics{image}} % \caption{Non linked caption.} %\end{figure} % % \end{frame} % % =========================================================== % Autres méthodes d'analyse de données multidimensionnelles % =========================================================== \section{Autres méthodes d'analyse de données multidimensionnelles} \begin{frame} \frametitle{Autres méthodes d'analyse de données multidimensionnelles} Utilisation du package FactoMineR \vspace{0.2cm} \begin{itemize} \item \textcolor{orange}{Analyse factorielle des correspondances} (fonction {\bf CA} du package FactoMineR) Le tableau analysé est un \textcolor{bleu}{ tableau de contingence} croisant deux variables qualitatives. Permet de prendre en compte simultanément les réponses à deux variables qualitatives. \vspace{0.2cm} \item \textcolor{orange}{Analyse factorielle des correspondances multiples} (fonction {\bf MCA} du package FactoMineR): permet de prendre en compte simultanément les réponses à plusieurs variables qualitatives. \vspace{0.2cm} \item La méthode {\bf AFDM }: méthode factorielle sur \textcolor{orange}{des variables sont mixtes} \vspace{0.2cm} \item \textcolor{orange}{Méthodes de classification}. \end{itemize} \vspace{0.2cm} Pour en savoir plus, voir \href{http://factominer.free.fr/index.html}{Site FactoMineR}, \href{https://www.youtube.com/playlist?list=PLnZgp6epRBbR4fUXx7KGLZQs8k7K6DsH5&feature=view_all}{Tutoriel sur le logiciel R (F. Husson)} \end{frame} % \begin{frame} \frametitle{Démarche en analyse multivariée} \textcolor{orange}{Quelles méthodes, quels paramétrages? Comment interpréter? Comment gérer les données manquantes} \vspace{0.2cm} \begin{enumerate} \item Y-a-t-il des \textcolor{bleu}{groupes de variables}? \vspace{0.1cm} %(données structurées avec différentes sources d'information). \item \textcolor{bleu}{Quel type de données} \vspace{0.1cm} \begin{itemize} \item Tableau de contingences (AFC) \item Plusieurs tableaux de contingences (AFMTC) \item Tableau individus x variables : ACP, ACM, AFDM ou AFM. \end{itemize} \vspace{0.1cm} %quels sont les éléments supplémentaires? ind.sup, quanti.sup, quali.sup, row.sup, col.sup, group.sup. \item Quelle est la \textcolor{bleu}{nature des variables actives}? quantitative, qualitatives, mixte. \vspace{0.1cm} %(ACP-PCA), qualitatives (AFC- MCA, ACM -), mixtes (AFDM - FAMD). \item Doit-on \textcolor{bleu}{réduire les variables }quantitatives? \vspace{0.1cm} %\begin{itemize} %\item Réduire : indispensable lorsque les unités sont différentes, lorsqu'on accorde la même importance à toutes les variables. %\item Ne pas réduire : l'importance d'une variable est proportionnelle à sa variabilité. %\end{itemize} \item Quels sont \textcolor{bleu}{les éléments actifs et supplémentaires}? \vspace{0.1cm} \item Y a-t-il des \textcolor{bleu}{données manquantes}? \vspace{0.1cm} % : utiliser la package missMDA. \item \textcolor{bleu}{Interpréter les axes} avec les éléments actifs et illustratifs. \vspace{0.1cm} \item Faire une \textcolor{bleu}{classification} des individus \textcolor{bleu}{sur les premiers axes factoriels}. \end{enumerate} \end{frame} \note{ Réduire : indispensable lorsque les unités sont différentes, lorsqu'on accorde la même importance à toutes les variables. Ne pas réduire : l'importance d'une variable est proportionnelle à sa variabilité. } % \begin{frame} \frametitle{Démarche avec le support de FactoMineR} \begin{enumerate} \item \textcolor{bleu}{Analyse sur tableau de contingences} (AFC) : \vspace{0.1cm} \item \textcolor{bleu}{Analyse sur tableau individus x variables} (ACP, ACM, ...) : \vspace{0.1cm} \item \textcolor{bleu}{Analyse sur plusieurs tableaux de contingences} (AFMTC) : \vspace{0.1cm} \item \textcolor{bleu}{\'Eléments supplémentaires} : options ind.sup, quanti.sup, quali.sup, row.sup, col.sup, group.sup. \vspace{0.1cm} \item \textcolor{bleu}{Nature des variables actives}? quantitative, qualitatives, mixte. \vspace{0.1cm} \begin{itemize} \item Quantitative : %(ACP-PCA) \item Qualitatives : %AFC- MCA, ACM \item Mixtes : %AFDM - FAMD \end{itemize} \item \textcolor{bleu}{Réduire les variables quantitatives} : \vspace{0.1cm} \item \textcolor{bleu}{\'Eléments actifs et supplémentaires} : \vspace{0.1cm} \item \textcolor{bleu}{Données manquantes} : utiliser la package missMDA. \vspace{0.1cm} \item \textcolor{bleu}{Interpréter les axes} avec les éléments actifs et illustratifs : \vspace{0.1cm} \item \textcolor{bleu}{Classification} des individus \textcolor{bleu}{sur les premiers axes factoriels} : \end{enumerate} \end{frame} \note{ } % \begin{frame} \frametitle{Démarche avec le support de FactoMineR} \href{http://math.agrocampus-ouest.fr/infoglueDeliverLive/membres/Francois.Husson/coinR}{Le coin R du site de François Husson} fournit: \vspace{0.2cm} \begin{itemize} \item[$\succ$] Des \textcolor{bleu}{tutoriels sur le logiciel R} \vspace{0.2cm} \item[$\succ$] Une \textcolor{bleu}{liste de packages} qui mettent à disposition \textcolor{bleu}{des méthodes et des outils} gratuits, développées par le laboratoire IRMAR (UMR 6625 du CNRS, Agrocampus Ouest de Rennes) pour \textcolor{bleu}{l'analyse des données}. \vspace{0.2cm} \item[$\succ$] Des \textcolor{bleu}{tutoriels en analyse de données} \vspace{0.2cm} \item[$\succ$] \href{http://math.agrocampus-ouest.fr/infoglueDeliverLive/digitalAssets/86397_carte_anado.svg}{Une démarche générale en analyse de données multidimensionnelles} avec un schéma qui renvoie vers les tutoriaux sur FactoMineR de la chaîne Youtube. \vspace{0.2cm} \item[$\succ$] Des \textcolor{bleu}{références bibliographiques}. \end{itemize} \end{frame} % %========================== Exemple KNITR =============================================== % % \section{First Test} % \begin{frame}[fragile]{First Test} % OK, let's get started with just some text: % <>= % # some setup % options(width=60) # make the printing fit on the page % set.seed(1121) # make the results repeatable % @ % <<>>= % # create some random numbers % (x=rnorm(20)) % mean(x);var(x) % @ % BTW, the first element of \texttt{x} is x[1]. (Did you notice % the use of\texttt{ \textbackslash{}Sexpr\{\}}?) % \end{frame} % % % % \section{Second Test} % \begin{frame}[fragile]{Second Test} % Text is nice but let's see what happens if we make a couple of plots % in our chunk: % <>= % par(las=1,mar=c(4,4,.1,.1)) # tick labels direction % % load("~/formation/cours-stat2015/testsR/temperat.RData") % library(FactoMineR) % temperat.pca <- PCA(temperat,quanti.sup=12:16,quali.sup=17) % # boxplot(x) % # hist(x,main='',col="blue",probability=TRUE) % # lines(density(x),col="red") % @ % \end{frame} % \section{The Big Question} % \begin{frame}{The Big Question} % Do the above chunks work? You should be able to compile the \LyX{} % document and get a nice-looking PDF slide presentation. If not, time % to double-check everything...\end{frame} \end{document}