FileLinx | Beheerdershandleiding
×
Menu
Index

16.3.2. Instellingen

 
 
Algemene instellingen
 
Een aantal algemene zaken van de FileLinx Conversion Service zijn instelbaar. Met uitzondering van het scan interval worden deze instellingen gezet tijdens de installatie. Het scan interval staat standaard op 60 seconden. De instellingen zijn te wijzigen in het bestand FileLinxConversionService.exe.config. Wijzigingen worden actief na een herstart van de service.
 
Error Mailserver
De email server welke gebruikt wordt voor het versturen van foutmeldingen.
 
FromAddress
De afzender (email adres) van de foutmelding.
 
ToAddress
De ontvanger (email adres) voor de foutmelding.
 
MailSubject
Het algemene onderwerp voor de foutmeldingsmail.
 
ErrorMailEnabled
Wanneer deze de waarde false heeft wordt geen mail verstuurt bij een foutmelding. Wanneer deze de waarde true heeft wel.
 
InstallationPath
Het pad waar de FileLinx Conversion Service is geïnstalleerd.
 
Scan Interval
De periode van rust nadat alle profielen zijn verwerkt. Na deze periode wordt gecontroleerd op nieuwe te verwerken bestanden naar aanleiding van de profielen. Het interval is in seconden.
 
 
 
Documentafhankelijke instellingen
 
De FileLinx Conversion Service kan een onbeperkt aantal verschillende documentsoorten verwerken. Denk hierbij aan facturen, recepten, inkomende en uitgaande post, etc. Ieder soort document krijgt een eigen profiel met document specifieke instellingen. Dit is naast de in- en uitvoer directory de informatie welke uit het document beschikbaar is voor indexatie binnen FileLinx.
 
Ieder profiel wordt opgeslagen als metadef bestand in de installatie directory van de FileLinx Conversion Service. Dit is een eenvoudig tekstbestand met de gewenste instellingen. De FileLinx Conversion Service herkent de profielbestanden aan de hand van de bestandsnaam. Hiervoor moet deze voldoen aan METADEF<n>.TXT met <n> een natuurlijk getal.
 
Ieder profiel zal resulteren in een eigen informatie bestand in de vorm van een csv (comma seperated values) bestand met een lijst van de verwerkte bestanden en bijbehorende metagegevens.
 
Een profiel bestaat uit een lijst van sleutelwoorden en bijkomende waarden. De mogelijke sleutelwoorden zijn naam, type, document in- en uitvoer directory, informatiebestand uitvoer directory, unieke bestandsnaam, aantal pagina’s, en label. Het label sleutelwoord kan meerdere malen voorkomen. Om de sleutelwoorden herkenbaar te laten zijn voor het programma zijn deze voorzien van de prefix META. Verder zijn ze in hoofdletters en in het Engels. Dit geeft de volgende lijst van actuele sleutelwoorden.
 
Naam
METANAME wordt opgenomen in de naam van het informatie bestand gevolgd door een datum/timestamp tot een tiende milliseconde nauwkeurig. Tevens wordt METANAME opgenomen als document type indicatie in het informatie bestand. Het betreft de waarde voor het eerste veld.
 
Type
METATYPE geeft het type inputbestand aan. Vooralsnog is alleen PDF ondersteund.
 
Document invoer directory
METASOURCEPATH wijst naar de directory waar de inputbestanden worden verwacht.
 
Document uitvoer directory
METADESTINATIONPATH wijst naar de directory waar de verwerkte invoer bestanden naar worden verplaatst. Het kan worden opgebouwd met informatie uit de labels bv. *1 voor het eerste label (METATAG1), *2 voor het tweede label, etc.
Kan geen waarde worden bepaald voor het betreffende label en is geen standaard waarde gedefinieerd dan wordt NO-VALUE-FOR-TAG-<n>, met <n> het label nummer, als waarde genomen bij het samenstellen van de document uitvoer directory.
 
Informatiebestand uitvoer directory
METACSVPATH wijst naar de directory waar de  informatie bestanden worden geplaatst.
 
Unieke bestandsnaam
METADESTINATIONUNIQUEFILE geeft aan of een unieke bestandsnaam gemaakt moet worden. Dit is voor het geval in de input directory verschillende files geplaatst kunnen worden met dezelfde bestandsnaam. Een voorbeeld hiervan is scannen middels de HP Digital Sending software met de OCRFILENAAM als optie. Wanneer geen bestanden aanwezig zijn in de scanlocatie dan kan de situatie voorkomen dat een bestandsnaam wordt gebruikt die tijdens een eerdere sessie ook al eens in gebruik was. De scanapplicatie houdt dit in het algemeen namelijk niet bij. Een dergelijke situatie geeft een probleem wanneer vervolgens de FileLinx Conversion Service dit bestand wil verplaatsen naar de FileLinx document folder (METADESTINATIONPATH). Om een dergelijke situatie op te vangen kan de FileLinx Conversion Server alle bestanden voorzien van een unieke code. Zet hiervoor de waarde op YES. Mogelijke waarden zijn YES en NO.
 
Aantal pagina’s
METAAANTALPAGINAS geeft aan over hoeveel pagina's gezocht moet worden. Is de waarde 0 dan worden alle pagina's doorzocht. Deze instelling wordt gebruikt in combinatie met de labels welke informatie uit het bestand zelf halen.
 
Labels
METATAG1..METATAG<n> geven aan hoe informatie uit het bestand of uit de bestandsnaam kan worden gehaald. Hierbij is <n> een volgnummer oplopend met 1 vanaf 1. Dit volgnummer is tevens het nummer waarnaar verwezen kan worden vanuit METADESTINATIONPATH middels *<n>.Er moet minimaal één label gedefinieerd zijn.
 
Een label kent de volgende mogelijkheden.
 
Mogelijkheid 1
 
De informatie voor het betreffende label wordt opgehaald uit de naam van het bestand.
 
METATAG<n>:SPLITCHAR:POSITIONS of
METATAG<n>:SPLITCHAR:POSITIONS:DEFAULT
 
Wanneer de lengte van de tekst tussen de eerste en tweede dubbelepunt na METATAG<n> 1 karakter lang is dan betreft het een SPLITCHAR en wordt de informatie opgehaald uit de bestandsnaam. SPLITCHAR is in dit geval het karakter dat de gegevens scheidt.
POSITIONS geeft aan om welk veld of velden het gaat. In het geval van METATAG<n>:_:3 en een bestandsnaam van a_b_c_4_5.pdf geeft dit de c. In het geval van METATAG<n>:_:2,4 geeft het voor dezelfde bestandsnaam de waarde b_4.
 
Mogelijkheid 2
 
De informatie voor het betreffende label wordt opgehaald uit het bestand op basis van een zoekstring.
 
METATAG<n>:SEARCHEXPRESSION:LENGTH
METATAG<n>:SEARCHEXPRESSION:LENGTH:DEFAULT
 
Wanneer de lengte van de tekst tussen de eerste en tweede dubbelepunt na METATAG<n> minimaal 2 karakters lang is dan betreft het een SEARCHEXPRESSION . In dit geval wordt de informatie niet uit de bestandsnaam gehaald maar uit de inhoud van het bestand. Het gaat nu om een letterlijke tekst waar op gezocht wordt.
 
LENGTH is de lengte van de waarde die wordt opgehaald gemeten vanaf het einde van de gevonden tekst volgens SEARCHEXPRESSION.
 
DEFAULT is de waarde die wordt genomen wanneer SEARCHEXPRESSION geen resultaat geeft. Dit geldt zowel als SEARCHEXPRESSION zelf niet voorkomt dan wel de gevonden waarde een lege string betreft.
 
DEFAULT is optioneel.
 
In het geval van een SEARCHSTRING label zijn niet alle combinaties eenduidig.  Neem bijvoorbeeld CODE:5:5 dit kan een zoekstring CODE met default 5 betekenen maar ook zoekstring CODE:5 zonder default. In dit geval zal de eerste optie gekozen worden dus zoekstring CODE en default 5. Een metatag met CODE:#:5 is wel weer eenduidig daar dit zal worden gezien als zoekstring CODE:# met lengte 5.
 
Mogelijkheid 3
 
De informatie voor het betreffende label wordt opgehaald uit het bestand op basis een positie. Dit kan ingezet worden wanneer de gewenste informatie altijd op dezelfde plek in het document staat. Het is hierbij wel zaak dat de documenten op een nette en gestructureerde wijze gescand worden. 
 
METATAG<n>:PAGE,ROW,COLUMN
 
METATAG<n>:PAGE,ROW,COLUMN:LENGTH
 
METATAG<n>:PAGE,ROW,COLUMN:LENGTH:DEFAULT
 
METATAG<n>:PAGE,ROW,COLUMN::DEFAULT
 
Wanneer de tekst tussen de eerste en tweede dubbelepunt twee komma's bevat, dan wordt het gezien als een positie op de pagina waar tekst gezocht moet worden. De tekst welke het dichtst bij de gegeven positie in de buurt ligt wordt genomen. De lengte en de standaard waarde zijn in dit geval optioneel. 
 
Het achterhalen van de rij en kolom posities kan aan de hand van het programma MetaExtractor.exe welke zich bevindt in de installatie directory van de FileLinx Conversion Service. Dit is een command line utility. Het verwacht een pdf file als parameter bv. MetaExtractor Invoice.pdf.