Über obenstehende Reiter können Auswertungen für Gold Open Access und Hybrid Open Access angezeigt werden.


Open Access Reporting

Die Skripte ermöglichen ein automatisiertes Reporting über veröffentlichte Open Access-Artikel und verausgabte Mittel im Rahmen von Open Access-Publikationsfonds sowie Transformationsverträgen.

Grafisch ausgewertet werden für Gold und Hybrid Open Access:

  • die Entwicklung der Publikationszahlen über die Jahre,
  • das Publikationsaufkommen und die Kosten pro Jahr auf Fakultäts- und Institutsebene,
  • die Publikationsanteile der Fakultäten,
  • die Entwicklung der durchschnittlichen APC,
  • die Verausgabung von Mitteln aus zur Verfügung stehenden Fördertöpfen,
  • die Verlage und Zeitschriften, in denen Forschende bevorzugt publizieren, sowie
  • die publikationsstärksten Institute und Autor*innen.

Ergänzt wird die Auswertung um eine durchsuchbare Übersicht der Rohdaten.


Dokumentation

Der Quellcode sowie fingierte Beispieldaten, auf denen die präsentierten Auswertungen basieren, sind über folgendes GitLab-Repository verfügbar: https://gitlab.com/LeaSat/open-access-reporting

Datenerhebung und -grundlage

Die Auswertungen basieren auf CSV-Dateien als Auflistung der einzelnen Open Access-Artikel. Diese Daten können aus Förderanträgen im Rahmen des Publikationsfonds, aus den Dashboards und Reports der Anbieter sowie aus Rechnungen, die Listen veröffentlichter Artikel beinhalten, stammen.

Datenschema

Das Datenschema der CSV-Dateien umfasst zentrale Angaben zu den einzelnen Open Access-Artikeln (vgl. Dateien im Ordner src/data im GitLab-Repository). Pro Artikel wird eine Zeile genutzt, pro Variable eine Spalte, wobei einige Variablen für eine grafische Auswertung verpflichtend zu befüllen sind. Ist für eine obligatorische Variable kein Wert bekannt, kann das Feld mit “keine Angabe” befüllt werden.

Pflichtfelder

  • year — Haushaltsjahr, in dem die Rechnung beglichen wurde
  • corrAut — korrespondierende*r Autor*in
  • faculty — Fakultät
  • institute — Institut
  • publisher — Verlag
  • journal — Zeitschrift
  • cost — Kosten
  • license — Lizenz
  • funding — Fördertopf (im Rahmen des Publikationsfonds relevant)
  • contractType — Open Access-Status (im Rahmen von Transformationsvereinbarungen mit goldener und hybrider Komponente relevant)

Optionale Felder

  • DOI — DOI der Veröffentlichung
  • chair — Lehrstuhl/AG
  • article — Titel des Artikels
  • articleType — Artikeltyp (im Rahmen des Springer-DEALs relevant)

Datenbereinigung

Um eine saubere Darstellung der Daten sicherzustellen, wurden die zusammengetragenen Daten bereinigt und z.B. Bezeichnungen der Verlage und Institute normiert. Zur Bereinigung wurde auf OpenRefine (v. 3.5.2) zurückgegriffen.

Programmierung der Skripte

Die Auswertung und Präsentation der Daten sowie Erstellung der Webseite wurden mit R (v 4.2.0) sowie der IDE RStudio (v. 2022.02.2+485) vorgenommen.

Folgende R Pakete wurden in den Skripten genutzt und eingebunden:

  • tidyverse (v. 1.3.1): ein Set von kompatiblen Paketen, unter anderem zur Datenbereinigung und -transformation
  • highcharter (v. 0.9.4): ein R-Wrapper für die JavaScript-Bibliothek Highcharts zur Erstellung interaktiver HTML-Grafiken
  • DT (v. 0.23): ein Paket zur Erstellung interaktiver HTML-Tabellen basierend auf der JavaScript-Bibliothek DataTables

Über rmarkdown (v. 2.14) wurde eine R Markdown Webseite zur Präsentation der Auswertungen erstellt.

Lokale Nachnutzung

Die Seite wird über den GitLab-Runner bzw. die .gitlab-ci.yml online gestellt. Zur eigenen Nachnutzung muss hier gegebenenfalls angepasst werden. Die HTML-Seiten im public-Ordner können lokal ohne Nutzung eines Runners oder einer CI geöffnet werden.

Die Skripte können nach Pull bzw. Download von GitLab lokal über RStudio als Webseite gebaut werden. Hierzu kann nach Öffnen der Datei Open-Access-Reporting.Rproj in RStudio der Button “Build Website” genutzt werden. Die benötigten Packages (tidyverse, highcharter, DT, rmarkdown) können über die IDE RStudio oder die Kommandozeile installiert werden.

Lizenz

Dieses Projekt steht unter der MIT-Lizenz zur Verfügung.