Über obenstehende Reiter können Auswertungen für Gold Open Access und Hybrid Open Access angezeigt werden.
Die Skripte ermöglichen ein automatisiertes Reporting über veröffentlichte Open-Access-Artikel und verausgabte Mittel im Rahmen von Open-Access-Publikationsfonds sowie Transformationsverträgen.
Grafisch ausgewertet werden für Gold und Hybrid Open Access:
Ergänzt wird die Auswertung um eine durchsuchbare Übersicht der Rohdaten.
Der Quellcode sowie fingierte Beispieldaten, auf denen die präsentierten Auswertungen basieren, sind über folgendes GitLab-Repository verfügbar: https://gitlab.com/LeaSat/open-access-reporting
Die Auswertungen basieren auf CSV-Dateien als Auflistung der einzelnen Open-Access-Artikel. Diese Daten können aus Förderanträgen im Rahmen des Publikationsfonds, aus den Dashboards und Reports der Anbieter sowie aus Rechnungen, die Listen veröffentlichter Artikel beinhalten, stammen.
Die Auswertung basiert auf dem openCost-Metadatenschema.
Angaben zu den einzelnen Open-Access-Artikeln sind in CSV-Dateien
hinterlegt (vgl. Dateien im Ordner src/data
im
GitLab-Repository). Für eine grafische Auswertung sind gewisse Variablen
verpflichtend zu befüllen.
Variable | Pflichtfeld | Beschreibung | Entsprechung im openCost-Metadatenschema |
---|---|---|---|
DOI | nein | DOI der Veröffentlichung | 2.1: doi |
yearInvoice | ja | Haushaltsjahr | 7.2.3.2: paid |
yearPublication | nein | Publikationsjahr | - |
corrAut | ja | corresponding author | - |
faculty | ja | Fakultät | - |
institute | ja | Institut | - |
title | nein | Titel der Veröffentlichung | 2.2.1: Title |
isPartOf | ja | übergeordnete Einheit | 2.2.3: isPartOf |
publisher | ja | Verlag | 2.2.2: Publisher |
publicationType | ja | Publikationsform (COAR-normiertes Vokabular) | 5: publication_type |
license | ja | Lizenz | - |
invoiceNumber | nein | Rechnungsnummer | 7.2.1: invoice_number |
amount | ja | Rechnungsbetrag in Originalwährung | 7.2.4.1: amount |
currency | ja | Originalwährung (ISO 4217) | 7.2.4.2: currency |
amountNet | ja | gezahlter Gesamtbetrag Netto | - |
tax | ja | Steuersatz | - |
amountGross | ja | gezahlter Gesamtbetrag Brutto | - |
amountPaid | ja | gezahlter Betrag (ggf. anteilig) Brutto | 7.2.5.1.1: amount |
currencyPaid | ja | Währung des gezahlten Betrags (ISO 4217) | 7.2.5.1.2: currency |
funding | ja | Fördertopf | - |
costType | ja | Gebührenart (openCost-Metadatenschema) | 7.2.5.1.3: cost_type |
contract | ja | Zuordnung zu einer Vereinbarung (Bezeichnung) | 7.1.1.2: value |
contractID | ja | Zuordnung zu einer Vereinbarung (ESAC-ID) | 7.1.1.1: type |
Um eine saubere Darstellung der Daten sicherzustellen, wurden die zusammengetragenen Daten bereinigt und z.B. Bezeichnungen der Verlage und Institute normiert. Zur Bereinigung wurde auf OpenRefine (v. 3.5.2) zurückgegriffen.
Die Auswertung und Präsentation der Daten sowie Erstellung der Webseite wurden mit R (v 4.2.0) sowie der IDE RStudio (v. 2022.02.2+485) vorgenommen.
Folgende R Pakete wurden in den Skripten genutzt und eingebunden:
Über rmarkdown (v. 2.14) wurde eine R Markdown Webseite zur Präsentation der Auswertungen erstellt.
Die Seite wird über den GitLab-Runner bzw. die
.gitlab-ci.yml
online gestellt. Zur eigenen Nachnutzung
muss hier gegebenenfalls angepasst werden. Die HTML-Seiten im
public
-Ordner können lokal ohne Nutzung eines Runners oder
einer CI geöffnet werden.
Die Skripte können nach Pull bzw. Download von GitLab lokal über
RStudio als Webseite gebaut werden. Hierzu kann nach Öffnen der Datei
Open-Access-Reporting.Rproj
in RStudio der Button “Build
Website” genutzt werden. Die benötigten Packages
(tidyverse
, highcharter
, DT
,
rmarkdown
) können über die IDE RStudio oder die
Kommandozeile installiert werden.
Dieses Projekt steht unter der MIT-Lizenz zur Verfügung.