Mesurer l’évolution de la science ouverte en France à partir de données fiables, ouvertes et maîtrisées sans recourir aux bases bibliométriques propriétaires
3 octobre 2022
Eric Jeangirard
Département des outils d'aide
à la décision - MESR
Les points clés
Le Baromètre de la Science Ouverte (BSO) accompagne la politique publique de science ouverte
📈 depuis 2018, + de 20 points d'accès ouvert en 4 ans. Objectif PP 100% en 2030.
sans recourir aux sources propriétaires (incompatibles avec le partage, la création de services ouvertes et non représentatives)
🤖 estimation par apprentissage automatique pour les métadonnées manquantes
📊 stratégie validée par l'étude de L. Chaignon et D. Egret (2022)
🔍 sensibilité du taux d'OA aux sources mais aussi à la date d'observation
🪆code, données et services ouverts, dizaines de déclinaisons locales
🧭 extension du périmètre d'analyse en fonction de la politique publique menée (notamment essais cliniques, codes et données de la recherche à venir)
Le BSO est une commande pour suivre et piloter la politique publique
📔 respectant plusieurs attendus, notamment
prise en compte de la bibliodiversité
partage et ouverture pour favoriser la transparence et la reproductibilité
⏳ qui s'adapte aux contraintes et évolutions de la politique publique
première photographie de la situation de l'accès ouvert fin 2018
extension progressive des indicateurs et du périmètre
🧗 Ces contraintes nous ont amené à choisir la voie difficile
au niveau méthodologique, notamment pour la détection des affiliations et des champs disciplinaires
au niveau opérationnel, avec une infrastructure informatique adaptée
Une approche modulaire ...
... qui capitalise et complète les sources ouvertes existantes
🏗️ : construit au MESR dans le cadre du BSO
🏛️ Métadonnées d'affiliations
PubMed, Crossref, HAL
🏗️ Crawling des pages web
🏗️ Détection automatique des pays
🔍 Caractérisation de l'accès ouvert
Détection de l'accès ouvert : Unpaywall
🏗️ Classification des types d'accès ouvert
🤖 Classification thématique
Données d'entrainement : Pascal et Francis, Field of Research (FoR)
🏗️ Modèles de classification automatique (fastText)
Comparaison avec des principales bases internationales
Lauranne Chaignon, Daniel Egret; Identifying scientific publications countrywide and measuring their open access: The case of the French Open Science Barometer (BSO). Quantitative Science Studies 2022; 3 (1): 18–36. doi: https://doi.org/10.1162/qss_a_00179
"The open-source strategy used by the BSO effectively identifies the vast majority of publications with a persistent identifier (DOI) for Open Science monitoring."
Sensibilité de la mesure du taux d'accès ouvert (1/3)
Lauranne Chaignon, Daniel Egret; Identifying scientific publications countrywide and measuring their open access: The case of the French Open Science Barometer (BSO). Quantitative Science Studies 2022; 3 (1): 18–36. doi: https://doi.org/10.1162/qss_a_00179
Le taux d'OA varie en fonction des sources, mais plus la source est diversifiée, moins la sensibilité est grande
Sensibilité de la mesure du taux d'accès ouvert (2/3)
Le taux d'OA varie en fonction de la date d'observation (pourtant rarement précisée)
Sensibilité de la mesure du taux d'accès ouvert (3/3)
Nombreuses dimensions analysées dans le BSO : discplines, type de publication, langues, plateforme de diffusion ...
Des services de partage de l'information pour plusieurs usages
Démultipliant : fournir les moyens pour construire un BSO local (niveau établissement, laboratoire ...) très facilement et avec le même rendu que le BSO national (cf. le BSO local de l'UL)