Archivismi: archiviamo Cassandra, parte seconda

Logo di Feddit Logo di Flarum Logo di Signal Logo di WhatsApp Logo di Telegram Logo di Matrix Logo di XMPP Logo di Discord

Archivismus: Archivieren wir Cassandra, Teil zwei

Dieser Beitrag wurde zuletzt aktualisiert von 6 Monaten tut

Dies ist ein automatisch aus dem Italienischen übersetzter Text. Wenn Sie unsere Arbeit schätzen und sie gerne in Ihrer Sprache lesen, denken Sie über eine Spende nach, damit wir sie weiterhin durchführen und verbessern können.

Die Artikel von Cassandra-Kreuzung Ich bin unter Lizenz CC BY-SA 4.0 | Cassandra-Kreuzung ist eine Spalte, die von erstellt wurde Marco Calamari mit dem „nom de plume“ von Kassandra, geboren 2005.

Zweiter Teil der Archivierung von Cassandra

Dieser Artikel wurde geschrieben am 1. Januar 2024 von Cassandra

Cassandra Crossing 565/ Archivismus: Wir archivieren Cassandra, Teil zwei

Nachdem wir die PDFs vorbereitet haben, gibt es keine Ausreden mehr, wir müssen unseren ersten Artikel von Cassandra Crossing archivieren.

In frühere Episoden von Archivare Wir haben die Hauptfunktionen von Internet Archive erklärt und ein einfaches Beispieldokument hochgeladen. Anschließend haben wir uns das ehrgeizige Ziel gesetzt, das hochzuladenKomplettes Werk von Cassandra, und wir haben das notwendige Material mühsam in den am besten geeigneten Formaten und Strukturen aufbereitet.

Es gibt keine Ausreden mehr; Es ist Zeit, mit dem Hochladen Ihres ersten Cassandra Crossing-Dokuments zu beginnen, mit all den kleinen Dingen und Metadaten am richtigen Ort!

Da müssen wir uns wirklich auseinandersetzen u.a Und da wir Hunderte von Dokumenten laden müssen, sollten Sie dies nicht direkt über die Befehlszeile tun, indem Sie jeweils eine Datei laden und alle Parameter und Metadaten in eine sehr lange Befehlszeile schreiben.

Es ist viel besser, gleich mit ihnen zu üben Massen-Upload, die durch die Bereitstellung von Werbung erreicht werden u.a ein einzelner Parameter, d. h. der Name einer Tabelle im CSV-Format, in die wir die erforderlichen Daten einfügen (und sie mehrmals ändern, um unvermeidliche Fehler zu beheben).

Der Befehl dazu lautet einfach

ia-Upload – spreadsheet=metadata.csv

Die eigentliche Arbeit wird darin bestehen, die endgültige Tabelle mit Tausenden von Datenzeilen zu füllen, aber gehen wir Schritt für Schritt vor und laden nur ein Objekt, sodass eine dreizeilige Datei ausreicht.

Unser erstes Dokument wird zwei Dateien enthalten, die zur Archivierung erstellt wurden, nämlich die pdf als Hauptdokument und diehtml im Inhalt als zweite Datei; Wir werden auch eine hinzufügen Mindestlohn von Metadaten, und der Bezeichner wird gleich dem Namen der Dateien, mit Ausnahme der Erweiterung, gewählt.

Kurz gesagt, nach vielen, vielen Versuchen ist hier das Papier...

Es scheint einfach zu sein, aber es hat einen halben Arbeitstag gedauert, bis die erste zufriedenstellende Einfügung gelungen ist. Scheinbar unbedeutende, aber tatsächlich teuflische Details erforderten viel Zeit für Beweise und Gegenbeweise. Einige davon erzähle ich Ihnen hier, in der Hoffnung, Ihnen wertvolle Zeit zu sparen.

eins – wenn Sie eine Tabelle im CSV-Format speichern, was bedeutet „Werte durch Kommas getrennt„Vertrauen Sie Ihrer Bewerbung nicht.“ In bestimmten Fällen kann es hier in Italien vorkommen, dass die Anwendung nicht das Komma, sondern das Semikolon verwendet, und Sie werden es nicht sofort bemerken. Ich schwöre, es ist passiert!

zwei — Deaktivieren Sie alle Selbstkorrekturtools in der Anwendung, mit der Sie die Tabelle verwalten. Andernfalls wird das Programm sicherlich entscheiden, etwas zu ersetzen dein Gut. In meinem Fall hat er beschlossen, zwei aufeinanderfolgende Minuszeichen, die in den Dateinamen vorhanden sind, durch ein „ zu ersetzen.langer Strich“, eine praktisch unsichtbare Änderung, selbst über die Befehlszeile. Dies führte zu der unerklärlichen Fehlermeldung Datei nicht gefunden, und erforderte einige Dutzend Tests mit dem damit verbundenen Klettern auf Spiegeln. Ich berichte hier nicht über die Worte, die gesprochen wurden, als das Problem endlich lokalisiert wurde!

Drei — Seien Sie sehr vorsichtig, wenn Sie Werte in Felder eingeben. Ein einzelnes Leerzeichen vor oder nach dem Wert wird möglicherweise nicht interpretiert und kann unerwartete Auswirkungen haben. Ein Leerzeichen am Anfang von „ test_collection” verhinderte beispielsweise die korrekte Zuordnung des Objekts zum Testsammlung, wie Sie bereits wissen, soll die automatische Löschung nach 30 Tagen ermöglichen. Bedenken Sie außerdem, dass es nicht möglich ist, das Objekt explizit öffentlichen Sammlungen zuzuordnen, z. B. „opendata“, aber Sie müssen die automatische Auswahl akzeptieren, die vom System vorgenommen wird.

vier — Fügen Sie die Spalte in das Blatt ein Medientyp, wenn es sich bei den Dokumenten um Text handelt (txt, html, pdf usw.), und verwenden Sie den Wert „Texte” andernfalls weist das System automatisch den Wert zu „Datum” und das wird heimtückische Nebenwirkungen haben. Zum Beispiel die Browser von Objekten Sie können keine Seiten durchsuchen, obwohl alle erforderlichen abgeleiteten Dateien korrekt erstellt wurden. Der MedientypIm Gegensatz zu den meisten Parametern kann es nicht mehr geändert werden, es ist jedoch erforderlich, das Objekt zu löschen und neu zu generieren.

fünf — Das Löschen eines Objekts ist kein sofortiger Vorgang, sondern dauert Minuten oder Dutzende von Minuten, bevor sich die Wirkung auf alle Teile der Site-Oberfläche ausbreitet. Es lohnt sich nicht, über die Befehlszeile zu löschen u.a; Es ist definitiv praktischer, dies von der Seite aus zu tun Mein Upload. Laden Sie die Seite häufig neu. Wenn Ihnen seltsame Dinge auffallen, versuchen Sie auch, den Cache zu leeren Browser.

sechs — das Erscheinen eines neu erstellten Objekts im Fenster Mein Upload es ist seltsamerweise ziemlich schnell, löst aber alle Operationen aus.“Derivat“, die wiederum die anderen Dateien in unterschiedlichen, aber recht langen Zeiten generieren. Das bedeutet zum Beispiel, dass die Browser von Objekten Sie können die Seiten erst nach einer halben Stunde durchsuchen und die interne Suchfunktion am Browser von Objekten es wird erst nach einigen Stunden aktiv.

Aber was für eine Genugtuung am Ende...

Und das ist auch alles für heute. Bleiben Sie dran für die nächste Folge von „Archivare“.

Marco Calamari

Schreiben Sie an Cassandra — Twitter — Mastodon
Videokolumne „Ein Gespräch mit Cassandra“
Cassandras Slog (Statischer Blog).
Cassandras Archiv: Schule, Ausbildung und Denken

Dieses Tag @treue Alternativen wird verwendet, um diesen Beitrag automatisch an zu senden Feddit und erlauben Sie jedem im Fediversum, dazu Stellung zu nehmen.

Treten Sie Communities bei

Logo di Feddit Logo di Flarum Logo di Signal Logo di WhatsApp Logo di Telegram Logo di Matrix Logo di XMPP Logo di Discord




Wenn Sie Fehler im Artikel gefunden haben, können Sie diese per Klick melden Hier, Danke schön!