Hinweise zu NTFS

<< Zum Inhaltsverzeichnis >>

Navigation:  Tipps & Anmerkungen >

Hinweise zu NTFS

Das Dateisystem NTFS, das unter dem Betriebssystem Windows NT und dessen Nachfolgern verwendet werden kann, bietet einige besondere Funktionen, die auch Auswirkungen auf TreeSize haben. Im Folgenden werden wir einige dieser speziellen Fähigkeiten und ihre Auswirkungen auf TreeSize beschreiben.

Access Control Lists (Zugriffskontrolllisten)

Die Zugriffsmöglichkeiten von Benutzer auf Dateien und Ordner können einschränkt werden, indem Benutzern oder Benutzergruppen bestimmte Rechte wie das Lesen, Schreiben, Löschen oder Ausführen gewährt oder verweigert wird. Auf diesem Weg kann man sogar Administratoren Zugriff auf Dateien und Ordner verwehren. Wenn ein Administrator im Windows Explorer versucht, auf eine solche Datei oder einen solchen Ordner zuzugreifen, wird eine Fehlermeldung "Zugriff verweigert" angezeigt. TreeSize kann solche Verzeichnisse dennoch untersuchen, wenn Sie als Administrator eingeloggt sind, oder als normaler Benutzer, der das Recht hat, Backups durchzuführen. (Diese Einstellung kann unter "Systemsteuerung > Verwaltung > Lokale Sicherheitsrichtlinie" und bei Windows in der Benutzerverwaltung eingestellt werden).

Dateibasierte Kompression

NTFS unterstützt die transparente Kompression einzelner Dateien. Derart komprimierte Dateien können gelesen oder geschrieben werden, ohne vorher mit einem externen Programm (de)komprimiert werden zu müssen. Die Dekompression geschieht vielmehr automatisch und transparent beim Lesen einer Datei, genauso wie die Kompression beim Schreiben.

Der Platz, den eine komprimierte Datei auf der Festplatte belegt, ist normalerweise geringer als ihre eigentliche Größe. Deshalb kann bei komprimierten Verzeichnissen der von TreeSize ermittelte belegte Platz wesentlich kleiner sein als die angezeigte Größe des Verzeichnisses. Der Kompressionsfaktor wird in einer eigenen Spalte der Details-Ansicht angezeigt. Außerdem können komprimierte Dateien und Ordner in einer anderen Farbe angezeigt werden (diese Funktion kann in den Einstellungen aktiviert werden).

TreeSize kann ganze Verzeichniszweige komprimieren oder dekomprimieren, indem die entsprechenden Funktionen aus dem Kontextmenü des jeweiligen Ordners ausgewählt werden.

In Windows 10 hat Microsoft neue transparente Kompressionsfunktionen in NTFS eingebaut, um den benötigten Platz der Dateien des Betriebssystems zu reduzieren (hauptsächlich DLL- und EXE-Dateien). Im Gegensatz zur alten dateibasierten Kompression werden diese in den Dateiattributen nicht als komprimiert gekennzeichnet.

Sparse Files

Große Dateien, die aber nur in Teilbereichen Daten enthalten, werden Sparse-Dateien (dünn besetzte Dateien) genannt. Da das Betriebssystem für die ungenutzten Teilbereiche keinen Platz auf der Festplatte reservieren muss, braucht die Datei weniger Platz auf der Festplatte, als sie eigentlich groß ist. TreeSize behandelt diese Art von Dateien analog zu komprimierten Dateien und berechnet für sie ebenfalls den Kompressionsfaktor.

Reparse-Punkte: Mountpoints und symbolische Links

Ein Mountpoint ist ein existierender Pfad, in den ein anderes Laufwerk "eingehängt" werden kann. Unterhalb dieses Mountpoints findet man die komplette Verzeichnisstruktur des eingehängten Laufwerks - ein Buchstabe muss dem eingehängten Laufwerk dabei nicht zugeordnet sein. Auf diese Weise lassen sich viele Laufwerke in einem einheitlichen Dateisystembaum zusammenführen. Symbolische Links, auch bekannt als Junction Points, funktionieren ähnlich: Existiert beispielsweise ein leeres Verzeichnis C:\Dokumente\Bilder, kann man für dieses Verzeichnis einen symbolischen Link zu E:\Pics erstellen. Anwendungen werden dann den Inhalt von E:\Pics unter C:\Dokumente\Bilder sehen. Im Gegensatz zu den älteren Junction Points können symbolische Links auch auf entfernte SMB-Datenträger verweisen.

Wenn die Einstellung Mountpoints und symbolischen Links folgen aktiviert ist, berücksichtigt  TreeSize den Inhalt dieser Ordner beim Scannen von Laufwerken. Da diese aber nicht physisch auf dem gescannten Laufwerk liegen, kann das zu Werten für den belegten Platz führen, die größer sind als die Gesamtgröße des gescannten Laufwerks.

Alternate Data Streams (ADS)

In einem NTFS Dateisystem besteht eine Datei aus mehreren Datenströmen (Data Streams). Ein Datenstrom beinhaltet Berechtigungsinformationen, ein anderer die eigentlichen Daten.
Zusätzlich können Dateien Alternate Data Streams (ADS) besitzen. Diese beinhalten Daten, genau wie der eigentliche Datenstrom.

Die ADS sind versteckt. Das bedeutet, dass eine Datei mit 1 Byte Daten im eigentlichen Datenstrom noch Hunderte von MB an Daten in ADS versteckt haben kann. Im Windows Explorer würde die Größe einer solchen Datei mit 1 Byte angegeben. Auch auf die Angabe der belegten Größe der Datei haben die ADS keinen Einfluss, obwohl die Datei real einen viel höheren Speicherbedarf auf der Festplatte hat.

TreeSize kann ADS in Dateien erkennen und deren Größe zum belegten Speicherplatz hinzu addieren. Die Systemaufrufe zum Auswerten von ADS benötigen eine gewisse Laufzeit, die die Geschwindigkeit der Scans reduzieren, daher ist diese Option standardmäßig deaktiviert. Sie kann in den Optionen aktiviert werden. Sie können nach Dateien mit Alternate Data Streams mit Hilfe der benutzerdefinierten Dateisuche von TreeSize suchen.

ADS speichern ihren Inhalt eventuell in den gleichen Blöcken wie der Main Data Stream. Wenn eine Datei einen oder mehrere ADS beinhaltet, heißt das also nicht automatisch, dass der belegte Speicherplatz der Datei anwächst.

Hardlinks

Ein Hardlink ist ein Verzeichniseintrag für eine Datei. Jede Datei weist mindestens einen Hardlink auf. Auf NTFS-Datenträgern kann jede Datei mehrere Hardlinks besitzen, und daher kann eine Datei in mehreren Verzeichnissen (oder im selben Verzeichnis mit verschiedenen Namen) angezeigt werden. Da alle diese Verbindungen auf dieselbe Datei verweisen, können Programme einen beliebigen Hardlink öffnen und die Datei ändern. Eine Datei wird nur dann aus dem Dateisystem gelöscht, wenn alle Hardlinks zu dieser Datei gelöscht wurden. Bitte beachten Sie auch, dass alle Hardlinks auf eine Datei sich die gleichen Zugriffsberechtigungen teilen.

Um einen Hardlink zu erzeugen, benötigt der Benutzer das Recht zum Schreiben von Attributen auf dem jeweiligen Ordner-Zweig sowie auf dem Share, falls es sich nicht um ein lokales Laufwerk sondern um eine Freigabe handelt.

Existiert mehr als ein Hardlink für eine Datei, so wird lediglich einmal Plattenplatz für diese Datei belegt, egal wie viele Hardlinks existieren. Sie können in den Optionen von TreeSize einstellen, ob Hardlinks bei einem Scan berücksichtigt werden sollen, um genauere Werte für den belegten Speicherplatz zu erhalten. Diese Option ist standardmäßig deaktiviert, da die Abfrage der Hardlinks einen Scan verlangsamt.

Die TreeSize Dateisuche nutzt Hardlinks, um den redundanten Dateiinhalt von doppelten Dateien von Ihrer Festplatte zu entfernen, was den belegten Speicherplatz reduziert. Mehr hierzu finden Sie unter "Deduplizieren".

Automatic Data Deduplication

Windows Server 2012 und höher bieten eine Funktion zum automatischen deduplizieren von Daten. Die NTFS-Deduplikation bündelt Dateien mit annähernd gleichen Inhalten in sogenannten "Chunks". Chunks werden in den Unterordner "Systeme Volume Information\Dedup\ChunkStore\" auf der entsprechenden NTFS-Partition verschoben. Nachdem die Deduplikation von Windows ausgeführt wurde, werden die Originaldateien durch Verknüpfungen mit den korrespondierenden Chunks im ChunkStore Ordner ersetzt. Zwei identische Dateien benötigen anders als zuvor, nach der Deduplikation nur noch die Hälfte des Speicherbedarfs. Da die Originaldateien nun lediglich noch eine Verknüpfung statt der Daten enthalten, liefert Windows für diese einen wesentlich kleineren Speicherplatz zurück als zuvor (Für zwei identische Dateien wird der benötigte Speicherplatz mit "0 Byte" angegeben). Um sich von TreeSize die Originaldatei- und -ordnergrößen anzeigen zu lassen, müssen Sie einfach den Anzeigemodus von "Belegter Speicher" zu "Größe" umstellen. Der "Belegte Speicher", der von TreeSize angezeigt wird, ist der Speicherplatz, den Sie durch Löschung der entsprechenden Datei erhalten würden.

Offline Files

Windows Server sowie Softwareprodukte und Appliances von Drittanbietern verfügen über ein Features namens "Offline Dateien": Dateien, die länger nicht mehr verwendet wurden, werden automatisch auf einen günstigen aber langsamen Storage verschoben, und es verbleibt eine kleine Stub-Datei am ursprünglichen Platz. Normalerweise zeigt TreeSize korrekte Werte für den belegten Platz von dieser Stub-Dateien an, was oftmals nur ein Block des Dateisystems ist.

Es gibt allerdings ein Szenario, in dem möglicherweise der belegte Platz für Stub-Dateien nicht korrekt ermittelt wird: Falls TreeSize "Zugriff verweigert" Fehler erkennt, verwendet es Windows API Funktionen, die für Backup-Programme gedacht sind, um dennoch für diese Verzeichniszweige eine Größe und den belegten Platz ermitteln zu können. Wir haben einige Appliances gesehen, die hierbei die volle Dateigröße der verschobenen Datei als belegten Platz zurückgemeldet haben, vermutlich weil dies die Größe wäre, die die Datei im Backup benötigen würde. Um dies zu vermeiden, stellen Sie sicher, das der Benutzer, unter dem die Scans durchgeführt werden, volle Leserechte auf das gesamte Dateisystem hat und lesen Sie diesen FAQ-Eintrag.