Commit 8c227ba2 authored by Laurence Viry's avatar Laurence Viry
Browse files

Ajout infos pratiques + Consignes

parent 0a2e28da
Pour chacune de ces parties, vous aurez des fichiers notebooks que vous pourrez utiliser sur [le serveur de notebook de GRICAD](https://jupyterhub.u-ga.fr/hub/login?next=%2Fhub%2Fuser%2Fviryl%2Ftree%3F), une version statique du cours et un fichier [R notebook Markdown](http://rmarkdown.rstudio.com/r_notebooks.html) que vous pourrez utiliser sur votre portable sous RStudio. [Pour en savoir plus sur les notebooks
(jupyter, Rmarkdown)](https://www.datacamp.com/community/blog/jupyter-notebook-r#gs.6iMBYHw)
**L'ensemble de ces fichiers seront récupérés sur le serveur Gitlab de GRICAD** (projet [CED-IntroR](https://gricad-gitlab.univ-grenoble-alpes.fr/formations-statistiques-R/CED-IntroR)
**L'accès aux deux plate-formes se fait à l'aide de votre compte Agalan**
La première séance de ce cours sera en partie consacrée à la mise en place pour chaque participant de l'accès aux serveurs et l'apprentissage des utilisations de base et la mise à jour des installations de R et RStudio (attention!! ils devront être installés avant la première séance, quelques ajustements pourront être utiles ensuite.)
## La plate-forme gitlab de l'UMS GRICAD
[gricad-gitlab](https://gricad-gitlab.univ-grenoble-alpes.fr/) est une plate-forme de travail collaboratif destinée à l'ensemble de la communauté enseignement-recherche grenobloise. Elle est hébergée et administrée par l'UMS GRICAD.
Il s'agit d'une implémentation du logiciel gitlab community edition, installée sur les serveurs de l'université.
Cette plate-forme permet de créer et de partager des projets, tout en bénéficiant d'un certain nombre de fonctionnalités telles que:
- gestion de version et de dépots (git)
- intégration continue
- ...
Ce cours est associé au projet [CED-IntroR](https://gricad-gitlab.univ-grenoble-alpes.fr/formations-statistiques-R/CED-IntroR) de cette plate-forme. Pour récupérer l'ensemble des fichiers du cours:
- exécuter dans un terminal, dans un répertoire de travail à votre convenance, la commande:
**git clone https://gricad-gitlab.univ-grenoble-alpes.fr/formations-statistiques-R/CED-IntroR.git/**
- ou exécuter sur le serveur [jupyter-GRICAD](https://jupyterhub.u-ga.fr/) le notebook **IntroR-config.ipynb** qui vous sera fourni.
Vous récupérez un répertoire CED-IntroR dans lequel figurent tous les fichiers qui seront utilisés (notebooks, données, scripts R,...).
## Le serveur de notebooks de l'UMS GRICAD
- Connectez vous sur [le serveur de notebook de GRICAD](https://jupyterhub.u-ga.fr/) avec votre compte Agalan.
- Exemple d'utilisation, suivre le cours "Introduction", première partie de ce cours.
- Télécharger le fichier **IntroR.ipynb** figurant dans le répertoire CED-IntroR/notebooks que vous avez récupé sur le gitlab de GRICAD (bouton Upload en haut à droite de l'écran).
- Vous avez dans ce documents deux types de cellules, des cellules de type " Markdown" et des cellules de code R, pour interpréter ces cellules faire shift-return simultanément.
- Pour conaitre les quelques commandes d'utilisation d'un notebook, voir le tutorial "Getting started" figurant dans le projet gitlab. Pour en savoir plus, regarder le tutoriel "ipython-in-depth"
```python
```
# Informations pratqiues
## Responsable / Intervenante
Laurence Viry (AIRSEA/LJK - MaiMoSiNE) Laurence.Viry@univ-grenoble-alpes.fr
## Lieu de la formation
Salle de formation, RDC bâtiment IMAG (couloir à droite après les ascenseurs, face à l'accueil)
Campus universitaire - 700 av. centrale
38400 Saint Martin D’Hères.
[Plan d'accès](https://batiment.imag.fr/fr/contact-adresses-plan-dacces)
## Planning
[ADUM - catatlogue formation CED](https://www.adum.fr//script/formations.pl?mod=157505&menu_transparent=oui&site=CDUDG)
## Mise en oeuvre de la formation
* La formation se fera à l'aide de notebooks R en utilisant le serveur de notebooks de GRICAD et le serveurs Gitlab pour stocker/récupérer l'ensemble des informations nécessaires à la formation. Sur ce serveur seront installés R et les packages utiles à la formation.
Vous trouverez dans **Consignes.md**, les modalités d'accès à ces serveurs et quelques références à de la documentation.
* Il est conseillé aux participants d'apporter leur portable personnel sur lequel seront installés R et RStudio. Pour une aide à ces installations, voir ** install.md **.
* Des cas d'école seront fournis pour tous les exercices proposés, mais nous invitons également les participants à préparer un jeu de données personnelles pour les TPs. .
```python
```
# Présentation du cours
Ce cours s'adresse aux praticiens de la statistique, plus généralement aux personnes ayant à traiter des jeux de données dans des domaines variés (biologie, physique, sciences humaines,...) et ayant choisit R comme outil de traitement et d'analyse. Il a également pour objectif d'être un pré-requis à un cours avancé de développement avec R.
Le cours est centré principalement sur le logiciel R et son fonctionnement et même si on utilisera quelques procédures statistiques classiques au cours des manipulations, ça n'est pas un cours de statistiques.
Une première introduction aborde les raisons du choix de ce logiciel pour le traitement des données, son installation, la documentation, les packages, les interfaces utilisateurs disponibles (IDE) et une description de RStudio, l'IDE choisit pour ce cours. (IntroR.ipynb,IntroR.Rnw). On abordera quelques utilisations de bases.
Dans une deuxième partie on présente les concepts de bases : les objets, les fonctions,... (Objet.ipynb, Objet.Rnw).
Dans la troisième partie, on aborde les manipulations de données qui sont des opérations courantes dans la pratique statistique: importation de données, sauvegarde de données et de résultats, traitements des données manquantes, concaténation des niveaux de facteurs,... (ManipDon.ipynb, ManipDon.Rnw). On effectuera quelques traitements statistiques sur les données.
Le traitement statistique s'accompagne d'une visualisation claire et synthétique des résultats, nous décrivons dans la quatrième partie les nombreuses possibilités offertes par R dans ce domaine (GraphiqueR.ipynb, GraphiqueR.Rnw).
Enfin dans la cinquième partie, nous présentons quelques éléments de programmation, comment construire un script R implémentant un algorithme statistique ou une chaine de traitements sur des données. On aborde dans cette partie les capacités de déboguage et de profiling de R et rapidement comment utiliser les ressources multi-coeur actuellement disponibles sur les portables ou serveurs à notre disposition (ProgrammerR.ipynb, ProgrammerR.Rnw).
Pour chacune de ces parties, vous aurez des fichiers notebook que vous pourrez utiliser sur [le serveur de notebook de GRICAD](https://jupyterhub.u-ga.fr/hub/login?next=%2Fhub%2Fuser%2Fviryl%2Ftree%3F), une version statique du cours et un fichier [R notebook Markdown](http://rmarkdown.rstudio.com/r_notebooks.html) que vous pourrez utiliser sur votre portable sous RStudio. [Pour en savoir plus sur les notebooks
(jupyter, Rmarkdown)](https://www.datacamp.com/community/blog/jupyter-notebook-r#gs.6iMBYHw)
L'ensemble des consignes et des fichiers utiles à ce cours est stocké dans le projet \"CED-IntroR\" du serveur gitlab de GRICAD, vous avez accès à ce serveur avec votre <identifiant,mot de passe> AGALAN.
## La plate-forme gitlab de l'UMS GRICAD
[gricad-gitlab](https://gricad-gitlab.univ-grenoble-alpes.fr/) est une plate-forme de travail collaboratif destinée à l'ensemble de la communauté enseignement-recherche grenobloise. Elle est hébergée et administrée par l'UMS GRICAD .
Il s'agit d'une implémentation du logiciel gitlab community edition, installée sur les serveurs de l'université.
Cette plate-forme permet de créer et de partager des projets, tout en bénéficiant d'un certain nombre de fonctionnalités telles que:
- gestion de version et de dépots (git)
- intégration continue
- ...
Ce cours est associé au projet [CED-IntroR](https://gricad-gitlab.univ-grenoble-alpes.fr/formations-statistiques-R/CED-IntroR). Pour récupérer l'ensemble des fichiers du cours, exécuter dans un terminal, dans un répertoire de travail à votre convenance, la commande:
git clone https://gricad-gitlab.univ-grenoble-alpes.fr/formations-statistiques-R/CED-IntroR.git\n",
Vous récupérez un répertoire CED-IntroR dans lequel figurent, tous les fichiers qui seront utilisés (notebooks, données, scripts R,...).
## Le serveur de notebooks de l'UMS GRICAD
* Connectez vous sur [le serveur de notebook de GRICAD](https://jupyterhub.u-ga.fr/) avec votre compte Agalan.\n",
* Exemple d'utilisation, suivre le cours \"Introduction\", première partie de ce cours.\n",
- Télécharger le fichier \"IntroR.ipynb\" figurant dans le répertoire CED-IntroR/notebooks que vous avez récupé sur le gitlab de GRICAD (bouton Upload en haut à droite de l'écran)\n",
- Vous avez dans ce documents deux types de cellules, des cellules de type \" Markdown\" et des cellules de code R, pour interpréter ces cellules faire shift-return simultanément.\n",
- pour conaitre les quelques commandes d'utilisation d'un notebook, voir le tutorial \"Getting started\" figurant dans le projet gitlab.
## Installation de R sur votre portable
Pour un meilleur suivi du cours, nous vous conseillons d'installer R (Version 3.4.x au moins) et [RStudio](https://www.rstudio.com/products/RStudio/) sur votre ordinateur personnel , de préférence avant la première séance.
"Il s’agit de deux logiciels libres, gratuits, téléchargeables en ligne et fonctionnant sous Windows, Mac-OS et Linux.
Pour installer R, il suffit de se rendre sur une des pages suivantes 2 :
* [Installer R sous Windows](https://cloud.r-project.org/bin/windows/base)
* [Installer R sous Mac](https://cloud.r-project.org/bin/macosx)
[RStudio](https://www.rstudio.com/products/RStudio/) est un environnement de développement intégré, qui propose des outils et facilite l’écriture de scripts et l’usage de R au quotidien. C’est une interface bien supérieure à celles fournies par défaut lorsqu’on installe R sous Windows ou sous Mac-OS
[Installer RStudio](https://www.rstudio.com/products/rstudio/download/#download), téléchargez la version adaptée à votre système :\
Nous verrons comment installer de nouveaux package.\n",
## Travailler sur des données personnelles...de préférence
"Même si des exemples simples vous seront fournis pour faire quelques exercices, il est toujours plus efficace de s'éxercer sur des données personnelles. Ces données auront déjà été nettoyées en partie pour éviter de perdre du temps sur de la validation de saisie.
## Quelques tutoriaux ou MOOCS en compléùent\n",
Si vous avez des questions, n'hésitez pas à m'envoyer un mail laurence.viry@univ-grenoble-alpes.fr
```python
>>> # Présentation du cours
...
... Ce cours s'adresse aux praticiens de la statistique, plus généralement aux personnes ayant à traiter des jeux de données dans des domaines variés (biologie, physique, sciences humaines,...) et ayant choisit R comme outil de traitement et d'analyse. Il a également pour objectif d'être un pré-requis à un cours avancé de développement avec R.
...
... Le cours est centré principalement sur le logiciel R et son fonctionnement et même si on utilisera quelques procédures statistiques classiques au cours des manipulations, ça n'est pas un cours de statistiques.
...
... Une première introduction aborde les raisons du choix de ce logiciel pour le traitement des données, son installation, la documentation, les packages, les interfaces utilisateurs disponibles (IDE) et une description de RStudio, l'IDE choisit pour ce cours. (IntroR.ipynb,IntroR.Rnw). On abordera quelques utilisations de bases.
...
>>> Dans une deuxième partie on présente les concepts de bases : les objets, les fonctions,... (Objet.ipynb, Objet.Rnw).
...
...
>>> Dans la troisième partie, on aborde les manipulations de données qui sont des opérations courantes dans la pratique statistique: importation de données, sauvegarde de données et de résultats, traitements des données manquantes, concaténation des niveaux de facteurs,... (ManipDon.ipynb, ManipDon.Rnw). On effectuera quelques traitements statistiques sur les données.
...
>>> Le traitement statistique s'accompagne d'une visualisation claire et synthétique des résultats, nous décrivons dans la quatrième partie les nombreuses possibilités offertes par R dans ce domaine (GraphiqueR.ipynb, GraphiqueR.Rnw).
...
...
>>> Enfin dans la cinquième partie, nous présentons quelques éléments de programmation, comment construire un script R implémentant un algorithme statistique ou une chaine de traitements sur des données. On aborde dans cette partie les capacités de déboguage et de profiling de R et rapidement comment utiliser les ressources multi-coeur actuellement disponibles sur les portables ou serveurs à notre disposition (ProgrammerR.ipynb, ProgrammerR.Rnw).
...
>>> Pour chacune de ces parties, vous aurez des fichiers notebook que vous pourrez utiliser sur [le serveur de notebook de GRICAD](https://jupyterhub.u-ga.fr/hub/login?next=%2Fhub%2Fuser%2Fviryl%2Ftree%3F), une version statique du cours et un fichier [R notebook Markdown](http://rmarkdown.rstudio.com/r_notebooks.html) que vous pourrez utiliser sur votre portable sous RStudio. [Pour en savoir plus sur les notebooks
... (jupyter, Rmarkdown)](https://www.datacamp.com/community/blog/jupyter-notebook-r#gs.6iMBYHw)
...
>>> L'ensemble des consignes et des fichiers utiles à ce cours est stocké dans le projet \"CED-IntroR\" du serveur gitlab de GRICAD, vous avez accès à ce serveur avec votre <identifiant,mot de passe> AGALAN.
...
>>> ## La plate-forme gitlab de l'UMS GRICAD
... [gricad-gitlab](https://gricad-gitlab.univ-grenoble-alpes.fr/) est une plate-forme de travail collaboratif destinée à l'ensemble de la communauté enseignement-recherche grenobloise. Elle est hébergée et administrée par l'UMS GRICAD .
...
... Il s'agit d'une implémentation du logiciel gitlab community edition, installée sur les serveurs de l'université.
...
... Cette plate-forme permet de créer et de partager des projets, tout en bénéficiant d'un certain nombre de fonctionnalités telles que:
...
... - gestion de version et de dépots (git)
... - intégration continue
... - ...
...
... Ce cours est associé au projet [CED-IntroR](https://gricad-gitlab.univ-grenoble-alpes.fr/formations-statistiques-R/CED-IntroR). Pour récupérer l'ensemble des fichiers du cours, exécuter dans un terminal, dans un répertoire de travail à votre convenance, la commande:
...
... git clone https://gricad-gitlab.univ-grenoble-alpes.fr/formations-statistiques-R/CED-IntroR.git\n",
...
... Vous récupérez un répertoire CED-IntroR dans lequel figurent, tous les fichiers qui seront utilisés (notebooks, données, scripts R,...).
...
>>> ## Le serveur de notebooks de l'UMS GRICAD
...
... * Connectez vous sur [le serveur de notebook de GRICAD](https://jupyterhub.u-ga.fr/) avec votre compte Agalan.\n",
>>> * Exemple d'utilisation, suivre le cours \"Introduction\", première partie de ce cours.\n",
... - Télécharger le fichier \"IntroR.ipynb\" figurant dans le répertoire CED-IntroR/notebooks que vous avez récupé sur le gitlab de GRICAD (bouton Upload en haut à droite de l'écran)\n",
... - Vous avez dans ce documents deux types de cellules, des cellules de type \" Markdown\" et des cellules de code R, pour interpréter ces cellules faire shift-return simultanément.\n",
... - pour conaitre les quelques commandes d'utilisation d'un notebook, voir le tutorial \"Getting started\" figurant dans le projet gitlab.
...
>>> ## Installation de R sur votre portable
...
... Pour un meilleur suivi du cours, nous vous conseillons d'installer R (Version 3.4.x au moins) et [RStudio](https://www.rstudio.com/products/RStudio/) sur votre ordinateur personnel , de préférence avant la première séance.
... "Il sagit de deux logiciels libres, gratuits, téléchargeables en ligne et fonctionnant sous Windows, Mac-OS et Linux.
...
...
... Pour installer R, il suffit de se rendre sur une des pages suivantes 2 :
...
... * [Installer R sous Windows](https://cloud.r-project.org/bin/windows/base)
...
... * [Installer R sous Mac](https://cloud.r-project.org/bin/macosx)
...
... [RStudio](https://www.rstudio.com/products/RStudio/) est un environnement de développement intégré, qui propose des outils et facilite lécriture de scripts et lusage de R au quotidien. Cest une interface bien supérieure à celles fournies par défaut lorsquon installe R sous Windows ou sous Mac-OS
...
... [Installer RStudio](https://www.rstudio.com/products/rstudio/download/#download), téléchargez la version adaptée à votre système :\
...
... Nous verrons comment installer de nouveaux package.\n",
...
>>> ## Travailler sur des données personnelles...de préférence
...
... "Même si des exemples simples vous seront fournis pour faire quelques exercices, il est toujours plus efficace de s'éxercer sur des données personnelles. Ces données auront déjà été nettoyées en partie pour éviter de perdre du temps sur de la validation de saisie.
...
>>> ## Quelques tutoriaux ou MOOCS en compléùent\n",
...
... Si vous avez des questions, n'hésitez pas à m'envoyer un mail laurence.viry@univ-grenoble-alpes.fr
```
## Installation de R sur votre portable
Pour un meilleur suivi du cours, nous vous conseillons d'installer R (Version 3.4.x au moins) et [RStudio](https://www.rstudio.com/products/RStudio/) sur votre ordinateur personnel , de préférence avant la première séance.
"Il s’agit de deux logiciels libres, gratuits, téléchargeables en ligne et fonctionnant sous Windows, Mac-OS et Linux.
Pour installer R, il suffit de se rendre sur une des pages suivantes 2 :
* [Installer R sous Windows](https://cloud.r-project.org/bin/windows/base)
* [Installer R sous Mac](https://cloud.r-project.org/bin/macosx)
[RStudio](https://www.rstudio.com/products/RStudio/) est un environnement de développement intégré, qui propose des outils et facilite l’écriture de scripts et l’usage de R au quotidien. C’est une interface bien supérieure à celles fournies par défaut lorsqu’on installe R sous Windows ou sous Mac-OS
[Installer RStudio](https://www.rstudio.com/products/rstudio/download/#download), téléchargez la version adaptée à votre système :\
Nous verrons comment installer de nouveaux package.\n",
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment