diff --git a/0-collect-data/datacite.py b/0-collect-data/datacite.py index cb5f3ca1b4a0e208a0b1928350c180006ff7fc5f..8e12466de081b47c44d66adc0d12c4b989c9badb 100644 --- a/0-collect-data/datacite.py +++ b/0-collect-data/datacite.py @@ -1,16 +1,6 @@ -#!/usr/bin/env python -# coding: utf-8 - -# In[1]: - - # récupérer les DOIs de l'UGA depuis Datacite ## 2023-12-01, Elias Chetouane - -# In[12]: - - """ ## todo - recherche par affiliation contributeurs ? @@ -21,15 +11,9 @@ * Pagination : https://support.datacite.org/docs/pagination """ - -# In[13]: - - import requests, json - -# In[14]: - +folder = "0-collect-data/" # requête url de base url = 'https://api.datacite.org/dois?affiliation=true&query=creators.affiliation.affiliationIdentifier:"https://ror.org/02rx3b187"&page[size]=100' @@ -47,10 +31,6 @@ while(page < nb_pages): results.append(req.json()) page += 1 - -# In[15]: - - # ajouter les DOIs dans une liste, sans ajouter les résultats qui ne sont pas des DOIs dois = [] @@ -72,12 +52,8 @@ for res in results: print("Nombre de résultats trouvés : " + str(nb_dois)) - -# In[43]: - - # exporter la liste de DOI au format txt -with open("datacite-dois.txt", 'w') as f : +with open(folder+"datacite-dois.txt", 'w') as f : [f.write(f"{line}\n") for line in dois]