Analyze your Zotero database with R

Why should someone be interested in analyzing her/his literature database? Actually, there are several good reasons to do so. You may also be interested, if you ask yourself one of the following questions:

  • Which journals should your local librarian add to the university bookshelves?
  • To which journal you should send you next ground-breaking manuscript?
  • Which journals are most interesting for me and should get an e-mail alert?

In all these instances, you want to find some data driven recommendations and answers. Here is how you can achieve this goal with just a few lines of R syntax. Before starting your R console you only have to export your library/folder/selected entries to a csv-file.

library(plyr)

setwd("c:/Dropbox/workspace/Bibliothek")
ebf.bib <- read.csv("ebf-jp.csv", encoding="UTF-8")

# my ebf-jp library
ebf.jour.freq <- count(ebf.bib[ebf.bib$Item.Type=="journalArticle" &
  as.Date(substring(ebf.bib$Date.Added,1,10)) - as.Date("2014-08-03") > 1, ], 
  "Publication.Title")
ebf.jour <- subset(ebf.jour.freq, freq > 10)
arrange(ebf.jour, freq, decreasing = TRUE)

In case you are interest what the output looks like. Here are the results of my last year reading:

Publication.Titlefreq
1Intelligence37
2Journal of Educational Psychology27
3Learning and Individual Differences27
4Zeitschrift für Pädagogische Psychologie19
5International Journal of Science Education12
6Educational Psychologist11
7Learning and Instruction11

If you have any recommendations or examples, then drop me a line in the comment box below.

Literaturstapel im ZuGriff – Paperpile

paperpile-logoWer hätte das gedacht? Neben den altbekannten Platzhirschen Endnote, Citavi und Zotero gibt es einen spannenden Newcomer im Wettstreit um die Krone unter den Referenzmanagern – Paperpile. Im September letzten Jahres gegründet ist es beachtlich, was das österreichisch-amerikanische Team in der kurzen Zeit auf die Beine gestellt haben. Derzeit läuft Paperpile nur unter Chrome, kann den ersten Monat kostenlos angetestet werden, danach kostet es 2.99 $/ Monat. Ich habe das Programm ausprobiert und die Ergebnisse in Form einer Vor- und Nachteileliste zusammengestellt, da ich gelesen habe, dass unser Gehirn Listen zu lieben scheint. 😉

Pro

1. Performanz, clevere Sortierung und Filter

Was mich an Paperpile direkt zu Beginn positiv überrascht hat ist die Performanz der Web App. Zotero wird ab einigen hundert Referenzen doch recht behäbig, insbesondere beim Drag & Drop Import neuer Publikationen; Paperpile hingegen kommt auch mit großen Literaturdatenbanken schön schnittig daher. Die Sortierkriterien sind gut ausgewählt: a) Datum des Hinzufügens, b) Datum der Publikation, c) Titel, d) Journal, e) Autor – mehr braucht man nicht. Darüberhinaus kann Filter setzen wie z.B. „Notizen vorhanden“ oder „kein pdf“ dabei. Praktisch sind v.a. die Filter Incomplete und Duplicate. So können fehlerhafte Literaturangaben sehr schnell korrigiert werden. Im Gegensatz dazu hat man bei Zotero unvollständige Literaturangaben meistens erst bei der Erstellung des Literaturverzeichnisses entdeckt.

2. Google Docs Integration

Die Integration in Google Docs ist das Killer-Feature der App schlechthin. Durch die Tastenkombination Strg + Alt + P können ganz leicht Referenzen aus dem Literaturbestand eingefügt werden. Präfix, Suffix zur Modifikation der Literaturangabe kein Problem. Wirklich clever ist aber die offene Websuche:
Integration von Paperpile in gdocs
Falls die Literatur in der Datenbank fehlt, einfach Schlagworte eingeben bis die gewünschte Literaturangabe im Web gefunden wurde, auswählen und einfügen. Die Referenz wird dann automatisch in der Datenbank ergänzt. Hier verschmelzen also Literaturverwaltung und Literaturrecherche – praktisch.

3. Übersichtliche GUI

GUI PaperpileWeiterhin positiv zu erwähnen, ist die klare, gut strukturierte GUI. Dazu gehören visuelle Labels, die ihren Namen wirklich verdienen, und das Ausblenden von nebensächlichen Informationen, die jedoch nur einen Klick entfernt sind. Klick auf „…“ zeigt die vollständigen bibliographischen Informationen. Klick auf den Klebezettel blendet das Abstract ein, falls hinterlegt. Klick auf „Cited By“ zeigt an, wer dieses paper zitiert hat, sehr informativ.

4. Work in progress

Es mag ein wenig überraschen, dass dieser Punkt auf der Positivseite aufgeführt ist. Aber work in progress heißt ja auch, dass an dem Programm weiter gearbeitet und es verbessert wird. Demgegenüber datiert das letzte Update von Zotero auf den April 2013, wobei auch nicht wirklich wichtiges hinzugekommen bzw. im Falle der farbigen Lables lieblos umgesetzt worden ist. Eine Sache die m.E. zu stark bei Zotero vernachlässigt wurde, ist die Literatursuche und -beschaffung. Mit den Funktionen „Cited By“, „Auto-Completion“ und der intelligenten Websuche ist man da bei Paperpile auf dem richtigen Weg.

5. Pdf-Files in google Drive im Klartext

Das ist zugegebener Maßen nur eine Kleinigkeit, aber was mich an Zotero immer ein wenig gestört hat, war die UNIX-Verzeichnisstruktur. Zwar kann man einfach per Drag & Drop die Literaturangabe in eine Email ziehen, aber außerhalb von Zotero war nicht zu erahnen, welche Referenz in Ordner 2BC7HH7P abgelegt wurde. Paperpile legt einen Ordner mit Unterordnern von A-Z in google Drive an und legt dort – nach Anfangsbuchstabe des Erstautors sortiert – die pdfs ab. Die Dateien werden sinnvoll umbennant, wobei auch Sonderzeichen kein Problem sind („Alderson 2009 – Test review – Test of English as a Foreign Language™ – Internet-based Test (TOEFL iBT®).pdf“). Das funktioniert also ähnlich dem Feature autorename aus Zotero, nur automatisch.

Contra

Neben diesen vielen Pluspunkten gibt es jedoch einige Schwachstellen, deren man sich bei Paperpile durchaus bewusst, weshalb auch daran gearbeitet wird. Ich freue mich schon darauf, in Aktualisierungen dieses Posts, die entsprechenden Punkte abhaken zu können. 🙂

1. Keine pdf-Kommentare

Derzeit kann man sich die pdfs nur anzeigen lassen, aber keine Hervorhebungen oder Kommentare abspeichern. Notizen können für jede Referenz gesondert angegeben werden, nur innerhalb des pdfs sind Anmerkungen derzeit nicht möglich.

2. Geteilte Ordner für die Zusammenarbeit mit Kollegen

Unter Zotero kann man mit Kollegen unkompliziert über gemeinsame Ordner Referenzen austauschen. Unter Paperpile ist das noch nicht möglich. Zwar funktioniert kollaboratives Schreiben unter google docs hervorragend, aber Zugriff auf einen gemeinsamen Literaturbestand fehlt noch. Ein must-have, damit die App produktiv in der Arbeitsgruppe eingesetzt werden kann.

Update 11.01.2014   Paperpile ist gut in das Jahr 2014 gestartet und hat sharing-Funktion nachgerüstet, siehe auch Pro-Punkt 4. Nun kann man problemlos Ordner oder einzelne paper mit den Kollegen teilen, dazu werden einfach die sharing-Funktionen von google Drive genutzt. Optisch ist das Ganze gut in die GUI integriert:
paperpile_sharing

3. Alles online

Hört sich erst einmal nach einem Pluspunkt an: Alles online bedeutet ja, Zugriff von allen Geräten (via Chrome) möglich. Aber die Kehrseite ist, dass sich bei Paperpile ohne Internetverbindung nichts tut. Das könnte für viele Nutzer ein Ausschlusskriterium sein, schließlich möchte man auch während der Zugfahrt noch gescheit arbeiten. Andererseits ist ein Computer ohne stabile Internetverbindung soundso recht nutzlos, was man immer dann erkennt, wenn das Netz mal einen Vormittag lang ausfällt.

4. Keine Volltext-Suche

Trotz Suche in den bibliographischen Angaben und der Verwendung von Tags/Labeln, kann es manchmal hilfreich sein, nach festen Ausdrücken zu suchen. Ich könnte mir sogar vorstellen, dass die Weblösung die Suchergebnisse ohne lange Wartezeiten bereitstellt, und zwar schneller als die anderen, eher schwerfälligen Literaturverwaltungsprogramme.

5. Quo vadis?

Es bleibt zu hoffen, dass Paperpile nicht dasselbe Schicksal ereilt wie Mendeley, das als offenes Projekt raketenmäßig startet, um schlussendlich so erfolgreich zu sein, dass es von Elsevier aufgekauft wurde. Zu den Beweggründen und den Reaktionen, die diese Übernahme auslösten, ein lesenswertes Interview mit Viktor Henning, einem der Gründer von Mendeley, nun Vice President of Strategy bei Elsevier. Solange offen ist, wie sich Paperpile weiter entwickelt, wird es sicherlich beim ein oder anderen Vorbehalte gegen einen Umstieg geben.

Update 31.12.2013   Ich hatte Bei Paperpile nachgefragt, was die Zukunftspläne anbetrifft, und umgehend folgende Antwort erhalten, die für mich recht vernünftig und beruhigend klingt:

For us it is important to have a working business model from day 1 and don’t grow faster than our revenues allow. That way we can stay independent and are only responsible to our customers. So far our subscription model seems to work well and we have big plans (and a sell-out is none of them).

Fazit

Für ein Fazit ist es noch ein wenig früh. Einem ganzen Bündel von tollen Featuren stehen ein paar Schwachstellen gegenüber, mit denen ich vorerst leben könnte. Probeweise habe ich meine Literatur nach Paperpile übertragen und werde es im täglichen Gebrauch weiter testen. Was ist eure Meinung? Startet ihr auch einen Versuch oder bleibt ihr eurem bisherigen Referenzmanager treu?

Zotero – Tipps

Nachdem ich in einem ersten Post das Literaturverwaltungsprogramm Zotero vorgestellt habe, hier drei Tipps, die die Arbeit mit Zotero vereinfachen können:

Tipp 1: DOIs entfernen

Zitationsstile
Zitationsstile
Zotero unterstützt verschiedene Zitationsstile (= Zitierregeln), die der American Medical Assoiciation, diverse Varianten des Chicago Manual of Style, und auch den Zitationsstil der American Psychological Association in der 6. Auflage. Über Actions » Preferences » Cite kann in der Karteikarte Styles der benötigte Stil festlegt werden. Die aktuellste Version solltet ihr vom Zotero Stilverzeichnis herunterladen und dann über den Plus-Button in den Style Manager laden. Das spart ’ne Menge Zeit… Einige Fehler in der Formatierung, die ich manuell korrigiert hatte, sind mittlerweile ausgebügelt worden. Nach dem Import findet ihr den xml-formatierten Style unter ..Zoterostylesapa.csl.
Seit der 6. Auflage des APA Publication Manuals können Referenzen über ihr DOI, den sog. Digital Object Identifier eindeutig benannt und wiedergefunden werden. DOIs besitzen folgenden Aufbau doi:10.ORGANISATION/ID und sind eigentlich eine praktische Sache. BTW steigern sie auch den Wert eines guten Literaturverwaltungsprogramms, da die kryptischen DOIs sich ohne nur schwer beherrschen lassen.
Offiziell empfiehlt die APA – wo vorhanden – DOIs zu verwenden und der APA Citation Style von Zotero folgt dieser Empfehlung. Aber das neue System hat sich noch nicht bei allen Verlagen durchgesetzt. Um nun beide Varianten (ohne Löschen von Informationen) bedienen zu können, reicht es, die entsprechenden Zeilen des csl-Files
[xml num = 130]


[/xml] auszukommentieren
[xml num = 130]
[/xml]

Continue reading

Zotero – Meistere das Literaturchaos

Zotero ist ein quelloffenes Literaturverwaltungsprogramm, das vom Center for History and New Media der George Mason University (GMU) entwickelt wurde. Das Wort „Zotero“ stammt aus dem Albanisch und bedeutet so viel wie „beherrschen“, „sich etw. aneignen“ oder „sehr gut lernen“. Genauso wie Ubuntu oder wikipedia wurde der Name aus einer exotischen Sprache entnommen, um so Namensrechtverletzungen vorzubeugen (die gesamte etymologische Geschichte findet sich hier). Im Gegensatz zu anderen Programmen, die viel versprechen und wenig halten (z.B. Quicktime oder Moviemaker), „beherrscht“ Zotero wirklich die unübersichtlichste Literatursammlung. 🙂

Eigentlich ist Zotero als Firefox plugin konzipiert. Aber weil ich nicht wegen eines Referenzmanagers den Browser wechseln wollte, benutze ich die standalone version, die sich im alpha-Stadium befindet, aber bisher noch nie ihren Dienst versagt hat.

Registriere dich auf zotero.org
Registriere dich auf zotero.org
Man kann sich auf zotero.org registrieren, was schnell und unkompliziert abläuft. Die Registrierung hat den Vorteil, dass man seine gesamte Bibliothek online synchronisieren kann. Dazu trägt man den gewählten Benutzernamen und das Passwort unter Actions (= Symbol mit dem kleinen Zahnrad) » Preferences » Sync ein. 100 MB Online-Speicher sind gratis und weil die schnell voll sind kann auch Speicher dazugekauft werden: 1 GB kostet bspw. im Jahr $20 und 5 GB $60 (Stand: August 2011). Wenn man nur die Referenzen (ohne pdf-Files) von überall im Zugrifft haben möchte und auf den Online-Speicher verzichtet, sollte die Option „Sync attachment files…“ nicht markiert sein. Continue reading