Über obenstehende Reiter können Auswertungen für Gold Open Access und Hybrid Open Access angezeigt werden.
Die Skripte ermöglichen ein automatisiertes Reporting über veröffentlichte Open Access-Artikel und verausgabte Mittel im Rahmen von Open Access-Publikationsfonds sowie Transformationsverträgen.
Grafisch ausgewertet werden für Gold und Hybrid Open Access:
Ergänzt wird die Auswertung um eine durchsuchbare Übersicht der Rohdaten.
Der Quellcode sowie fingierte Beispieldaten, auf denen die präsentierten Auswertungen basieren, sind über folgendes GitLab-Repository verfügbar: https://gitlab.com/LeaSat/open-access-reporting
Die Auswertungen basieren auf CSV-Dateien als Auflistung der einzelnen Open Access-Artikel. Diese Daten können aus Förderanträgen im Rahmen des Publikationsfonds, aus den Dashboards und Reports der Anbieter sowie aus Rechnungen, die Listen veröffentlichter Artikel beinhalten, stammen.
Das Datenschema der CSV-Dateien umfasst zentrale Angaben zu den
einzelnen Open Access-Artikeln (vgl. Dateien im Ordner
src/data
im GitLab-Repository). Pro Artikel wird eine Zeile
genutzt, pro Variable eine Spalte, wobei einige Variablen für eine
grafische Auswertung verpflichtend zu befüllen sind. Ist für eine
obligatorische Variable kein Wert bekannt, kann das Feld mit “keine
Angabe” befüllt werden.
Pflichtfelder
year
— Haushaltsjahr, in dem die Rechnung beglichen
wurdecorrAut
— korrespondierende*r Autor*infaculty
— Fakultätinstitute
— Institutpublisher
— Verlagjournal
— Zeitschriftcost
— Kostenlicense
— Lizenzfunding
— Fördertopf (im Rahmen des
Publikationsfonds relevant)contractType
— Open Access-Status (im Rahmen von
Transformationsvereinbarungen mit goldener und hybrider Komponente
relevant)Optionale Felder
DOI
— DOI der Veröffentlichungchair
— Lehrstuhl/AGarticle
— Titel des ArtikelsarticleType
— Artikeltyp (im Rahmen der
DEAL-Verträge relevant)Um eine saubere Darstellung der Daten sicherzustellen, wurden die zusammengetragenen Daten bereinigt und z.B. Bezeichnungen der Verlage und Institute normiert. Zur Bereinigung wurde auf OpenRefine (v. 3.5.2) zurückgegriffen.
Die Auswertung und Präsentation der Daten sowie Erstellung der Webseite wurden mit R (v 4.2.0) sowie der IDE RStudio (v. 2022.02.2+485) vorgenommen.
Folgende R Pakete wurden in den Skripten genutzt und eingebunden:
Über rmarkdown (v. 2.14) wurde eine R Markdown Webseite zur Präsentation der Auswertungen erstellt.
Die Seite wird über den GitLab-Runner bzw. die
.gitlab-ci.yml
online gestellt. Zur eigenen Nachnutzung
muss hier gegebenenfalls angepasst werden. Die HTML-Seiten im
public
-Ordner können lokal ohne Nutzung eines Runners oder
einer CI geöffnet werden.
Die Skripte können nach Pull bzw. Download von GitLab lokal über
RStudio als Webseite gebaut werden. Hierzu kann nach Öffnen der Datei
Open-Access-Reporting.Rproj
in RStudio der Button “Build
Website” genutzt werden. Die benötigten Packages
(tidyverse
, highcharter
, DT
,
rmarkdown
) können über die IDE RStudio oder die
Kommandozeile installiert werden.
Dieses Projekt steht unter der MIT-Lizenz zur Verfügung.