Dans de nombreuses applications on observe {\bf p} variables sur {\bf n} individus, \textcolor{orange}{p et n pouvant être élevés.}
\vspace{0.3cm}
\begin{itemize}
\item[$\succ$]\textcolor{bleu}{Les bases de données deviennent de plus en plus volumineuses} en terme d'individus et de variables mesurées sur ces individus.
\vspace{0.2cm}
\item[$\succ$] L'étude de \textcolor{bleu}{chaque variable} et celle \textcolor{bleu}{des couples de variables} par les méthodes classiques de statistiques descriptives \textcolor{bleu}{est indispensable mais insuffisante.}
\vspace{0.2cm}
\item[$\succ$] Les \textcolor{orange}{méthodes exploratoires multidimensionnelles} permettent :
\vspace{0.2cm}
\begin{itemize}
\item de tenir compte \textcolor{bleu}{des variations simultanées} d'un plus grand nombre de variables,
\vspace{0.1cm}
\item de \textcolor{bleu}{synthétiser} et/ou simplifier les structures sous-jacentes.
\end{itemize}
\vspace{0.2cm}
\item[$\succ$]\textcolor{orange}{L'analyse en composantes principales} (ACP) est l'une de ces méthodes.
\vspace{0.2cm}
\item[$\succ$] L'ACP détermine \textcolor{bleu}{les principales relations linéaires entre des variables} à partir des \textcolor{bleu}{coefficients de corrélation}.
\end{itemize}
\end{frame}
%
\begin{frame}
\frametitle{Quelques exemples}
%
\begin{itemize}
\item[$\succ$]
\item[$\succ$]
\item[$\succ$]
\item[$\succ$]
\item[$\succ$]
\end{itemize}
\end{frame}
% %
\begin{frame}
\frametitle{L'analyse en composantes principales et R}
\begin{itemize}
\item[$\succ$] La fonction \textcolor{orange}{princomp} de R permet de faire une ACP, elle reste simpliste.
\vspace{0.2cm}
\item[$\succ$] Le package \textcolor{orange}{FactoMineR } fournit les méthodes les plus classiques d'analyse de données multidimensionnelles.
\item l'\textcolor{bleu}{analyse factorielle des correspondances} (fonction {\bf CA}),
\vspace{0.2cm}
\item\textcolor{bleu}{l'analyse des correspondances multiples} (fonction {\bf MCA}),...
\vspace{0.2cm}
\item Dans chaque méthode, on peut ajouter \textcolor{bleu}{des éléments illustratifs} (individus, variables), \textcolor{bleu}{des aides à l'interprétation} sont fournies.
\vspace{0.2cm}
\item Des \textcolor{bleu}{représentations graphiques} et \textcolor{bleu}{leurs options} sont associées à chaque méthode.
\end{itemize}
\item[$\succ$] Le package \textcolor{orange}{missMDA} permet de gérer les données manquantes en analyse des données (ACP, ACM ou AFM).
\end{itemize}
\href{http://math.agrocampus-ouest.fr/infoglueDeliverLive/membres/Francois.Husson/coinR}{Pour en savoir plus}
\frametitle{\'Etude descriptive des variables (suite)}
tableau de données \\
\noindent\textcolor{orange}{Matrice de corrélation}\\
\noindent\textcolor{orange}{Scaterplot}\\
Ces analyses fournissent des informations importantes sur les relations deux à deux entre les variables mais ne permettent pas de synthétiser de facon simple la structure globale des données.
\end{frame}
\note{
}
\begin{frame}
\frametitle{Problèmatique}
{\large
\textcolor{orange}{La problématique peut se décomposer en deux points }:
\vspace{1.cm}
\begin{itemize}
\item[$\succ$] Comment visualiser \textcolor{bleu}{la forme du nuage des individus} dans \textcolor{bleu}{$\mathcal{R}^{p}$}
\vspace{0.6cm}
\item[$\succ$] Comment synthétiser \textcolor{bleu}{les relations entre les variables} dans \textcolor{bleu}{$\mathcal{R}^{n}$}
\end{itemize}
}
\end{frame}
\note{
}
%
\section{\'Etude des individus}
\begin{frame}
\frametitle{Critère d'inertie}
%$\bar{x^{j}}, \sigma^{j}$ sont respectivement la moyenne et l'écart-type de $X^{j}$
Les méthodes factorielles dont l'ACP réduisent la dimension de l'espace par projection orthogonale sur des sous-espaces affines.
\vspace{0.2cm}
\begin{itemize}
\item[$\succ$]\textcolor{bleu}{Choix de le métrique} :\vspace{-0.2cm}
\item[$\succ$]\textcolor{bleu}{Données centrées} : $\tilde{x^{j}_{i}}= x^{j}_{i}-\bar{x^{j}}$ , ($\bar{x^{j}}$ est la moyenne de $X^{j}$)
\vspace{0.2cm}
\item[$\succ$]\textcolor{bleu}{Données réduites} : $\tilde{\tilde{x^{j}_{i}}}=\frac{x^{j}_{i}-\bar{x^{j}}}{\sigma^{j}}$ , ($\sigma^{j}$ est l'écart-type de $X^{j}$)\\
\vspace{0.2cm}
\textcolor{orange}{l'ACP normée} est une ACP sur les \textcolor{orange}{données réduites}.
\vspace{0.2cm}
\item[$\succ$]\textcolor{bleu}{Inertie du nuage des individus}
$$ I =\sum_{i=1}^{n}m_{i}\|X_{i}\|^{2}$$
$m_{i}$ : poids associé à l'individu \i
\end{itemize}
\vspace{0.2cm}
%Les méthodes factorielles dont l'ACP réduisent la dimension de l'espace par projection orthogonale sur des sous-espaces affines.\\
$\Longrightarrow$\textcolor{orange}{On cherchera à minimiser la déformation du nuage par projection}.
\end{frame}
\note{
}
%
\begin{frame}
\frametitle{Moindre déformation du nuage}
%\vspace{-0.5cm}
La réduction du nuage d'individus se fait par \textcolor{orange}{projection orthogonale sur un sous-espace affine $\mathcal{H}$}
\vspace{0.4cm}
\begin{itemize}
\item[$\succ$]\textcolor{bleu}{Choix du sous-espace affine $\mathcal{H}$} : minimisation de la déformation du nuage par projection.
\vspace{0.2cm}
\item[$\succ$]\textcolor{bleu}{Inertie du nuage d'individus autour de $\mathcal{H}$}: