diff --git a/0-collect-data/rdg.py b/0-collect-data/rdg.py index fc95b669b302ab1be584feac025e671b05ad642a..cd895c012d3716ab7fccc390a61ac393866dcada 100644 --- a/0-collect-data/rdg.py +++ b/0-collect-data/rdg.py @@ -1,16 +1,6 @@ -#!/usr/bin/env python -# coding: utf-8 - -# In[2]: - - # Récupérer les DOIs de l'UGA depuis Rechrche Data Gouv ## 2023-12-01, Elias Chetouane - -# In[3]: - - """ ## todo / @@ -25,15 +15,9 @@ - Adapter une fois mise en place du ROR """ - -# In[4]: - - import requests, json - -# In[5]: - +folder = "0-collect-data/" # requetes de base sur chaque champ qui nous intéresse : affiliation du contact, auteurs, producteur et contributeurs # dans chaque champ, recherche "UGA" ou "Grenoble" @@ -67,10 +51,6 @@ def get_results(url): page += 1 return results - -# In[6]: - - # on crée une fonction pour ajouter les DOIs dans une liste def get_dois(results): @@ -88,10 +68,6 @@ def get_dois(results): print("Nombre de résultats trouvés : " + str(nb_dois)) return dois - -# In[ ]: - - # on récupère les dois dois = [] @@ -107,12 +83,8 @@ for i in dois: print("Nombre de dois différents trouvés : " + str(len(dois))) - -# In[8]: - - # exporter la liste de DOI au format txt -with open("rdg-dois.txt", 'w') as f : +with open(folder+"rdg-dois.txt", 'w') as f : [f.write(f"{line[4:]}\n") for line in dois] # [4:] pour retirer "doi:" au début de chaque ligne