Rob-Dokumentation
|
Beschreibung
Um Dokumente in CODING4 verarbeiten zu können, müssen diese in das Datenbanksystem importiert werden können. Der Rob „Import aus Dateisystem“ ist einer der Basis-Robs für diesen Zweck. Er muss als erster Rob nach einem Workflow-Start ausgewählt werden.
Unter Angabe von Quellordner, Dateityp und Verarbeitungsregel werden die Dateien eingelesen und im internen Datenbanksystem gespeichert.
Ab diesem Moment können Bearbeitungen auf dem Dokument in CODING4 vorgenommen werden.
Funktionsweise
Zunächst wird aus dem angegebenen Quellordner eine Liste aller infragekommender Dateien auf Basis der definierten Dateiendungen erstellt. Es wird dann nacheinander der Zugriff auf die Dateien geprüft (um evtl. gemeinsame Zugriffe mit anderen Anwendungen oder CODING4-Prozessen zu vermeiden.
Wird festgestellt, dass eine Datei „frei“ ist, so wird sie zunächst mit der Endung „.tmp“ versehen, um anderen Prozessen zu signalisieren, dass ein Zugriff hier bereits stattfindet.
Die Datei wird dann binär gelesen und in die interne Datenbank eingelesen.
War dieser Vorgang erfolgreich, so wird – falls so angegeben – die Datei in den Verarbeitet-Ordner verschoben. Existiert dort schon eine Datei mit dem gleichen Namen, so wird vor die Dateiendung ein fortlaufender Index eingeleitet mit „_“ eingefügt. Damit soll ein Überschreiben von Dateien verhindert werden.
Der Rob kann ebenfalls den Original-Dateinamen in einem Metafeldwert zur Verfügung stellen. Dazu muss das entsprechende Feld ausgewählt und die zugehörige Funktion eingeschaltet werden.
In manchen Umgebungen kann es sein, dass bereis ein CODING4-OCR-Ergebnis in XML-Form vorliegt (z.B. wenn die Daten vorher in einem anderen CODING-Workflow exportiert wurden). Um Doppelverarbeitungen zu vermeiden kann angegeben werden, ob das evtl. vorhandene OCR-Ergebnis mit eingelesen werden soll. In diesem Fall muss eine Datei mit gleichem Namen wie die Originaldatei, jedoch mit der Endung XML vorliegen.
Das OCR-Ergebnis wird ebenfalls mit in einen Verarbeitet-Unterordner exportiert, wenn die Option eingeschaltet ist.
Parameter
Kategorie |
Name |
Typ |
Beschreibung |
Allgemein |
Quellordner |
Pfad |
Der Quellordner, aus welchem die Dateien eingelesen werden sollen |
Allgemein |
Dateinamenserweiterung |
Text |
Die Erweiterungen der Dateien, welche eingelesen werden sollen. Mehrere Dateitypen müssen durch Semikolon-getrennt angegeben werden. Sollen z.B. TIF-Dateien und PDF-Dateien eingelesen werden, so muss der Wert für diesen Parameter wie folgt lauten: *.tif;*.pdf |
Allgemein |
Verarbeitet-Ordner |
Pfad |
Gibt den Pfad an, in welchen die Dateien nach dem erfolgreichen Import verschoben werden sollen. Beim Verschieben wird das oben beschriebene Verfahren zur Suche nach einem eindeutigen Dateinamen verwendet. |
Allgemein |
Verschiebe Dateien nach Verarbeitung |
Ja/Nein |
Gibt an, ob die Dateien nach erfolgreichem Import in den Verarbeitet-Ordner verschoben (Angabe „Ja“) oder ob sie aus dem Dateisystem gelöscht werden sollen (Angabe „Nein“). |
Allgemein |
Datei-Prefix speichern |
Ja/Nein |
Gibt an, ob der Dateiname in einem Metadatenfeld gespeichert werden soll (Ja = Speicherung erfolgt, Nein = Speicherung erfolgt nicht). |
Allgemein |
Datei-Prefix-Feld |
Feldauswahl |
Gibt das definierte Metadatenfeld an, in welches der Dateiname gespeichert werden soll, wenn die Option „Datei-Prefix speichern“ angewählt wurde. |
Allgemein |
OCR-Leseergebnis speichern |
Ja/Nein |
Gibt an, ob ein evtl. vorhandenes OCR-Leseergebnis in Form einer XML-Datei mit importiert werden soll |
Anschlüsse
|
Wird gewählt, wenn die Verarbeitung erfolgreich ausgeführt wurde |
|
Im Falle eines Fehlers wird dieser Ausgang gewählt |
|