2.14. Verbreitungsgrad von Paketen

Wie bereits deutlich wurde, besteht die Distribution Debian GNU/Linux aus einer sehr großen Anzahl Paketen. In dieser Vielfalt spiegeln sich die Interessen der Benutzer sehr deutlich wieder.

Das Debian Quality Assurance Team (kurz QA Team) [DebianQA] sorgt dafür, dass eine möglichst hohe Softwarequalität in Debian gehalten wird. Neben den Werkzeugen zur Qualitätssicherung (siehe „Qualitätskontrolle“ in Kapitel 37, Qualitätskontrolle) gehören dazu die Trendforschung, die Bestandsaufnahme und eine Auswertung darüber, ob und vor allem wie häufig ein Paket installiert wird. Das sagt zwar nicht unbedingt etwas darüber aus, ob es tatsächlich verwendet wird, aber es zeigt, ob an einem Softwarepaket prinzipiell Interesse besteht. Dieser Aspekt fließt mit ein, um zu entscheiden, ob ein Paket weiterhin Bestandteil des Softwareumfangs von Debian bleibt.

Diese Analyse geht direkt auf den Ursprung von Debian zurück und versucht eine Antwort darauf zu geben, welche Software die Benutzer verwenden. Unmittelbare Ergebnisse sind die Auswahl der Softwarepakete, die in Debian bereitstehen und für diese Distribution gepflegt werden, weiterhin die Einordnung in die entsprechenden Kategorien (siehe Abschnitt 2.8, „Sortierung der Pakete nach Verwendungszweck“) und die Priorisierung (siehe Abschnitt 2.13, „Paket-Priorität und essentielle Pakete“). Für die Zusammenstellung von Installationsimages spielt der Nutzungsgrad eine große Rolle – Pakete, die häufiger genutzt werden, haben eine größere Chance, auf die ersten Installationsimages zu gelangen.

Grundlage für die erfassten Daten ist das Projekt Popcon – der Debian Popularity Contest [Debian-Popularity-Contest]. Die Benutzung ist freiwillig und über dessen Teilnahme entscheiden Sie als Benutzer selbst. Voraussetzung dafür ist die Installation des Pakets popularity-contest und dessen Aktivierung.

Danach wird in regelmäßigen Abständen — i.d.R. wöchentlich — der Softwarebestand (d.h. die installierten Pakete) erfasst, an das Popcon-Projekt übertragen und danach anonymisiert ausgewertet. Über die Projektwebseite erfolgt eine tabellarische Übersicht und eine graphische Auswertung. Abbildung 2.10, „Erfasster Verbreitungsgrad für das Paket nginx zeigt beispielhaft das Ergebnis für das Paket nginx.

Abbildung 2.10. Erfasster Verbreitungsgrad für das Paket nginx

konzepte/software-in-paketen-organisieren/popcon-nginx.png

2.14.1. Verschiedene Metriken

Neben der Architektur der Installation und welche Pakete installiert sind, erfasst Popcon anhand der Zeitstempel im Dateisystem außerdem noch folgende Daten für jedes installierte Paket:

  • Wann wurde das Paket zuletzt aktualisiert oder installiert? Dies wird für den Graphen recent (kürzlich) verwendet und anhand des Zeitstempels der Dateien des Pakets unter /var/lib/dpkg/info eruiert.
  • Wann wurde zuletzt auf ausführbare Dateien des Pakets zugegriffen? Dies wird für die Graphen vote (dafür stimmen) und old (alt) verwendet und anhand der Zeitstempel des Zugriffs (atime) von Programmdateien des Paketes eruiert.

Werden weder Änderungszeitstempel noch Zugriffszeitstempel beim Projekt mitgeliefert, wird das Paket im Graphen no-files (keine Dateien) aufgelistet.

2.14.2. Vergleichen von Paketen

Unter dem Debian Popcon Graph [Debian-Popcon-Graph] können Sie dies sogar benutzen, um den Verlauf der Beliebtheit von Paketen gegenüberzustellen. Abbildung 2.11, „Vergleich Installationen und Nutzung der Pakete screen und tmux zeigt beispielhaft einen Vergleich zwischen screen und tmux in den beiden Metriken installed und vote.

Abbildung 2.11. Vergleich Installationen und Nutzung der Pakete screen und tmux

konzepte/software-in-paketen-organisieren/popcon-screen-vs-tmux.png