Skip to content
Snippets Groups Projects
Commit e7cfa0e4 authored by Maxence Larrieu's avatar Maxence Larrieu
Browse files

improve doc readme

parent 07805c5b
No related branches found
No related tags found
No related merge requests found
......@@ -12,8 +12,8 @@ https://support.datacite.org/docs/can-i-see-more-detailed-affiliation-informatio
* mémo : pour descendre au niveau des auteurs , le filtre `?person-id=orcid-nb`
* nb 2024-01-13
retrait de l'AAU (jbru.aau) car tout est du PD de congrès
* note 2023-02
retrait de l'AAU (jbru.aau) car tout est du PDF de congrès
ajout de client.uid:inist.sshade et client.uid:inist.resif
"""
......
......@@ -5,7 +5,6 @@
"""
## todo
- v2 : rechercher UGA comme financeur `grants.funder.doi`
- v2 : passer par les ORCID des `creator.orcid` et `contributors.orcid`
## Documentation
* Liste des métadonnées obligatoires lors du dépôts (upload_type, sub_type, publication_date, titre, creators, ) https://developers.zenodo.org/#representation
......@@ -13,12 +12,9 @@
* Doc dev API champs de requêtes classsiques https://developers.zenodo.org/#records
* doc champs poussées pour la recherche https://help.zenodo.org/guides/search/
* typologie des dépôts possiblent : publication: Publication, poster: Poster, presentation: Presentation, Dataset: Dataset, image: Image, video: Video/Audio, software: Software, lesson: Lesson, physicalobject: Physical object, other: Other
* descendre au niveau des ORCID des `creator.orcid` et `contributors.orcid`
### Identifier les dépôts :
- utilisation du champs `creators.affiliation` et contributor.affiliation (multi affiliation)
- utilisation de la forme "grenoble" uniquement, possibilité de bruit
## Notes sur la récupération
- exemple résultats de requete : https://zenodo.org/api/records?q=creators.affiliation%3A*grenoble*&type=dataset&page=6&size=100&sort=mostrecent&all_version=False
- deux DOI identiques sont présents : un à la racine `[hits][doi]` et un autre dans `[hits][metadata][doi]`
......
......@@ -55,7 +55,13 @@ for doi in dois : #[:300]
## if new datasets has been founded
if temp_rows :
df_fresh = pd.DataFrame(temp_rows)
df_out = pd.concat([df_old, df_fresh], ignore_index=True)
df_concat = pd.concat([df_old, df_fresh], ignore_index=True)
## remove not wanted datacite type
type_to_explude = ["Book", "ConferencePaper", "ConferenceProceeding", "JournalArticle", "BookChapter", "Service", "Preprint"]
df_out = df_concat[ ~df_concat["resourceTypeGeneral"].isin(type_to_explude) ].copy()
## output main CSV
df_out.to_csv("../dois-uga.csv", index = False)
print(f"\n\nnb of doi exported \t{len(df_out)}")
......
......@@ -179,5 +179,3 @@ def from_files_load_dois(files_name) :
return all_dois
# Codes for the UGA Open research data monitor
view contextualized results on the website : [mlarrieu.gricad-pages.univ-grenoble-alpes.fr/open-research-data-monitor](https://mlarrieu.gricad-pages.univ-grenoble-alpes.fr/open-research-data-monitor)
View contextualized results on the website : [mlarrieu.gricad-pages.univ-grenoble-alpes.fr/open-research-data-monitor](https://mlarrieu.gricad-pages.univ-grenoble-alpes.fr/open-research-data-monitor)
<br />
<br />
## Sources
## Sources & identification methods
(so far)
### Recherche Data Gouv
| | UGA perimeter |
|-----------|---------------|
|RDG |contact, auteurs, producteur et contributeurs avec "UGA" OR "Grenoble" |
|DataCite |creator et contributor avec ROR + clients & publisher |
|Zenodo |creator et contributor avec "grenoble" |
|Nakala |UGA user identifiers |
|BSO via HAL|NA |
|... | |
Recherche en format texte de `UGA` et `Grenoble` dans les champs auteurs, contributeurs, `datasetContactAffiliation` et `producerAffiliation`
- memo 2024-02 : non possible de recherche avec AND
### DataCite
- directement depuis les clients Datacite qui relèvent de l'UGA : `inist.osug`, `client.uid:inist.sshade`, `client.uid:inist.resif`, `client_id:inist.persyval`
- sur les champs `creators` et `contributors` avec les ROR de l'université
- sur le champs `publisher` avec `grenoble AND alpes`
- instruire
- l'UGA comme financeur
- via les ORCID des auteurs
### Zenodo
- sur les champs creators & contributeurs avec les affiliations et `grenoble`
- @maxence regarder si on peut mettre un AND alpes
- demain : possibilité de requêter par ROR ?
### Nakala
- directement sur les auteurs de l'UGA obtenus via HumaNum
- instruire regarder côté `dcterms:publisher`
### BSO
extraction des DOI des jeux de données produits par l'université
<br />
<br />
## Credits
......
......@@ -30,11 +30,11 @@ collec_dois_prgm = [
#to depug : run only one script
collec_dois_prgm = ["rdg.py", "datacite.py", "nakala.py", "zenodo.py"]
[run_py_file(file, "0-collect-data") for file in collec_dois_prgm]
# exit()
# # ______1______ Concatenate and enrich DOIs w DataCite
## ______1______ Concatenate and enrich DOIs w DataCite
run_py_file("concatenate-enrich-dois.py", "1-enrich-with-datacite")
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment