Import aus Dateisystem

Beschreibung

Um Dokumente in CODING4 verarbeiten zu können, müssen diese in das Datenbanksystem importiert werden können. Der Rob „Import aus Dateisystem“ ist einer der Basis-Robs für diesen Zweck. Er muss als erster Rob nach einem Workflow-Start ausgewählt werden.
Unter Angabe von Quellordner, Dateityp und Verarbeitungsregel werden die Dateien eingelesen und im internen Datenbanksystem gespeichert.
Ab diesem Moment können Bearbeitungen auf dem Dokument in CODING4 vorgenommen werden.

Funktionsweise

Zunächst wird aus dem angegebenen Quellordner eine Liste aller infragekommender Dateien auf Basis der definierten Dateiendungen erstellt. Es wird dann nacheinander der Zugriff auf die Dateien geprüft (um evtl. gemeinsame Zugriffe mit anderen Anwendungen oder CODING4-Prozessen zu vermeiden.
Wird festgestellt, dass eine Datei „frei“ ist, so wird sie zunächst mit der Endung „.tmp“ versehen, um anderen Prozessen zu signalisieren, dass ein Zugriff hier bereits stattfindet.
Die Datei wird dann binär gelesen und in die interne Datenbank eingelesen.
War dieser Vorgang erfolgreich, so wird – falls so angegeben – die Datei in den Verarbeitet-Ordner verschoben. Existiert dort schon eine Datei mit dem gleichen Namen, so wird vor die Dateiendung ein fortlaufender Index eingeleitet mit „_“ eingefügt. Damit soll ein Überschreiben von Dateien verhindert werden.
Der Rob kann ebenfalls den Original-Dateinamen in einem Metafeldwert zur Verfügung stellen. Dazu muss das entsprechende Feld ausgewählt und die zugehörige Funktion eingeschaltet werden.
In manchen Umgebungen kann es sein, dass bereis ein CODING4-OCR-Ergebnis in XML-Form vorliegt (z.B. wenn die Daten vorher in einem anderen CODING-Workflow exportiert wurden). Um Doppelverarbeitungen zu vermeiden kann angegeben werden, ob das evtl. vorhandene OCR-Ergebnis mit eingelesen werden soll. In diesem Fall muss eine Datei mit gleichem Namen wie die Originaldatei, jedoch mit der Endung XML vorliegen.
Das OCR-Ergebnis wird ebenfalls mit in einen Verarbeitet-Unterordner exportiert, wenn die Option eingeschaltet ist.

Parameter

Kategorie Name Typ Beschreibung
Allgemein Quellordner Pfad Der Quellordner, aus welchem die Dateien eingelesen werden sollen
Allgemein Dateinamenserweiterung Text Die Erweiterungen der Dateien, welche eingelesen werden sollen. Mehrere Dateitypen müssen durch Semikolon-getrennt angegeben werden. Sollen z.B. TIF-Dateien und PDF-Dateien eingelesen werden, so muss der Wert für diesen Parameter wie folgt lauten: *.tif;*.pdf
Allgemein Verarbeitet-Ordner Pfad Gibt den Pfad an, in welchen die Dateien nach dem erfolgreichen Import verschoben werden sollen. Beim Verschieben wird das oben beschriebene Verfahren zur Suche nach einem eindeutigen Dateinamen verwendet.
Allgemein Verschiebe Dateien nach Verarbeitung Ja/Nein Gibt an, ob die Dateien nach erfolgreichem Import in den Verarbeitet-Ordner verschoben (Angabe „Ja“) oder ob sie aus dem Dateisystem gelöscht werden sollen (Angabe „Nein“).
Allgemein Datei-Prefix speichern Ja/Nein Gibt an, ob der Dateiname in einem Metadatenfeld gespeichert werden soll (Ja = Speicherung erfolgt, Nein = Speicherung erfolgt nicht).
Allgemein Datei-Prefix-Feld Feldauswahl Gibt das definierte Metadatenfeld an, in welches der Dateiname gespeichert werden soll, wenn die Option „Datei-Prefix speichern“ angewählt wurde.
Allgemein OCR-Leseergebnis speichern Ja/Nein Gibt an, ob ein evtl. vorhandenes OCR-Leseergebnis in Form einer XML-Datei mit importiert werden soll

Anschlüsse

Connector_Ok Wird gewählt, wenn die Verarbeitung erfolgreich ausgeführt wurde
Connector_Fault Im Falle eines Fehlers wird dieser Ausgang gewählt