Forskjell mellom versjoner av «Optisk tegngjenkjenning»

Fra ithjelp
Hopp til: navigasjon, søk
(Opprettet side med info om OCR-tjenesten på UiB)
 
(Litt videreutvikling..)
Linje 1: Linje 1:
{{Under utvikling}}
+
[[en:Optical Character Recognition]]
 
{{WD}}
 
{{WD}}
 
{{BRA}}
 
{{BRA}}
  
'''Optisk tegngjenkjenning''', ofte omtalt med den engelske forkortelsen OCR, gjør det mulig å lese av skannede dokumenter og lagre innholdet som tekst i elektronisk form.
+
'''Optisk tegngjenkjenning''', ofte omtalt med den engelske forkortelsen OCR, gjør det mulig maskinelt å lese av innskannede dokumenter og lagre tekstlig innhold i elektronisk form.
  
Et spesielt program kan gjenkjenne bokstaver, tall og andre tegn i innskannede dokumenter og lagre resultatet som tekst i et pdf-dokument. Når det som faktisk er tekst også blir lagret som tekst, gjør det et innskannet dokument mye mer anvendelig. Det går an å søke i dokumentet og du kan klippe og lime. Viderebehandling av (deler av) teksten vil derimot være mer egnet i et tekstbehandlingsprogram, eller du kan lime rett inn i e-post eller annet.
+
Et spesielt program kan gjenkjenne bokstaver, tall og andre tegn i dokumenter og lagre resultatet som tekst. Når det som faktisk ''er'' tekst også blir ''lagret'' som tekst, gjør det et dokument mye mer anvendelig. Det går an å søke i dokumentet og du kan klippe og lime. UiBs OCR-tjeneste lagrer resultatet av tegngjenkjenningen som pdf. Dette er et dokumentformat som er uavhengig av om du bruker Windows, Mac eller Linux, men som i utgangspunktet er laget for å beholde utseende, heller enn å redigeres. Viderebehandling av (deler av) teksten vil derfor være mer egnet i et tekstbehandlingsprogram, eller du kan lime rett inn i e-post eller annet. Men husk du ikke nødvendigvis kan gjøre hva du vil med andres tekster.
  
Studenter og ansatte på UiB kan sende et allerede innskannet dokument som vedlegg til en e-post til adressen ocr@uib.no. Da vil du få tilbake en e-post med det bearbeidede resultatet vedlagt som et pdf-dokument. Dette kan gjøres både fra ditt e-postprogram, eller fra en PullPrint-maskin.
+
== Hvordan bruker jeg optisk tegngjenkjenning? ==
 +
Studenter og ansatte på UiB kan sende et innskannet dokument som vedlegg til en e-post til adressen ocr@uib.no. Da vil du få tilbake en e-post med det bearbeidede resultatet vedlagt som et pdf-dokument. Tekst på papir kan skannes og sendes til tekstgjenkjenning fra en PullPrint-maskin. Har du et allerede innskannet dokument, kan dette sendes som vedlegg fra ditt e-postprogram.
  
== Tekstgjenkjenning fra PullPrint-maskin ==
+
'''Merk:''' Kursiv, spesialtegn, redusert kontrast  og liten fontstørrelse og annet kan gi større feilprosent. En sjekk og eventuelt gjennomgang av resultatet kan derfor være nødvendig for best mulig sluttresultat. Dette gjelder både for dokumenter fra PullPrint og allerede innskannede dokumenter.
  
Fremgangsmåten for å lagre et innskannet dokument fra en PullPrint-maskin er ganske enkelt å skanne et dokument og sende det som vedlegg til ocr@uib.no.
+
=== Tekstgjenkjenning fra PullPrint-maskin ===
 +
 
 +
Fremgangsmåten for OCR-behandling av et innskannet dokument fra en PullPrint-maskin er ganske enkelt å skanne et dokument og sende det som vedlegg til ocr@uib.no.
 
# Legg dokumentet klart i øverset venstre hjørne på glassplaten. Pass på at det ikke ligger skjevt.
 
# Legg dokumentet klart i øverset venstre hjørne på glassplaten. Pass på at det ikke ligger skjevt.
 
# Logg på PullPrint ved å dra ditt student- eller ansattkort gjennom kortleseren.
 
# Logg på PullPrint ved å dra ditt student- eller ansattkort gjennom kortleseren.
 
# Velg E-mail på displayet.
 
# Velg E-mail på displayet.
# Trykk på knappen for mottakeradresse, og skriv inn ocr@uib.no (du trenger ikke sende til din egen e-postadresse)
+
# Trykk på knappen for mottakeradresse, og skriv inn ocr@uib.no (du trenger ikke sende til din egen e-postadresse).
 
# Velg emne for meldingen og skriv inn.
 
# Velg emne for meldingen og skriv inn.
 
# Klikk på Preferences og velg:
 
# Klikk på Preferences og velg:
Linje 22: Linje 25:
 
#* Oppløsning: Høyest tall gir mer detaljer og normalt lavest feilprosent. Men er det mange sider med god kvalitet, kan man spare tid og lagringsplass ved å velge lavere enn maks.
 
#* Oppløsning: Høyest tall gir mer detaljer og normalt lavest feilprosent. Men er det mange sider med god kvalitet, kan man spare tid og lagringsplass ved å velge lavere enn maks.
 
# Klikk Send, og vent til dokumentet er skannet inn.
 
# Klikk Send, og vent til dokumentet er skannet inn.
# Om ikke lenge skal en e-post merket <nowiki>[OCR]</nowiki> og innskrevet emne dukke opp i innboksen.
+
# Om ikke lenge skal det dukke opp en e-post i innboksen din merket <nowiki>[OCR]</nowiki> etterfulgt av det du skrev i emnefeltet.
 +
 
 +
Tips: Har du tilgang til en skanner med høyere oppløsning enn PullPrint-maskinen, kan du få bedre resultat om du skanner der og sender dokumentet som vedlegg fra pc-en.
 +
 
 +
=== Tekstgjenkjenning fra allerede innskannet dokument ===
 +
 
 +
Har du et innskannet dokument med tekst, men som ikke er lagret som tekst, kan du gjøre noe med dette.
 +
# Gå til e-postprogrammet ditt og åpne en ny melding.
 +
# Legg ved det innskannede dokumentet.
 +
# Skriv inn ønsket emne på e-posten.
 +
# Send e-posten til ocr@uib.no (du trenger ikke sende til din egen e-postadresse).
 +
# Det behandlede dokumentet skal havne i din innboks ikke lenge etter.
  
Merk at farget bakgrunn, kursiv, spesialtegn liten fontstørrelse (selvsagt) kan gi større feilprosent. En sjekk av resultatet kan derfor være nødvendig.
+
Grafikkformater som jpg og png kan sendes til ocr@uib.no, men pdf ser ut til å gi bedre resultat.
  
 
[[Kategori:Utskriftstjenester]]
 
[[Kategori:Utskriftstjenester]]
 
[[Kategori:Bruksanvisninger]]
 
[[Kategori:Bruksanvisninger]]
 
[[Kategori:Dokumentbehandling]]
 
[[Kategori:Dokumentbehandling]]

Revisjonen fra 17. mar. 2011 kl. 16:00


Optisk tegngjenkjenning, ofte omtalt med den engelske forkortelsen OCR, gjør det mulig maskinelt å lese av innskannede dokumenter og lagre tekstlig innhold i elektronisk form.

Et spesielt program kan gjenkjenne bokstaver, tall og andre tegn i dokumenter og lagre resultatet som tekst. Når det som faktisk er tekst også blir lagret som tekst, gjør det et dokument mye mer anvendelig. Det går an å søke i dokumentet og du kan klippe og lime. UiBs OCR-tjeneste lagrer resultatet av tegngjenkjenningen som pdf. Dette er et dokumentformat som er uavhengig av om du bruker Windows, Mac eller Linux, men som i utgangspunktet er laget for å beholde utseende, heller enn å redigeres. Viderebehandling av (deler av) teksten vil derfor være mer egnet i et tekstbehandlingsprogram, eller du kan lime rett inn i e-post eller annet. Men husk du ikke nødvendigvis kan gjøre hva du vil med andres tekster.

Hvordan bruker jeg optisk tegngjenkjenning?

Studenter og ansatte på UiB kan sende et innskannet dokument som vedlegg til en e-post til adressen ocr@uib.no. Da vil du få tilbake en e-post med det bearbeidede resultatet vedlagt som et pdf-dokument. Tekst på papir kan skannes og sendes til tekstgjenkjenning fra en PullPrint-maskin. Har du et allerede innskannet dokument, kan dette sendes som vedlegg fra ditt e-postprogram.

Merk: Kursiv, spesialtegn, redusert kontrast og liten fontstørrelse og annet kan gi større feilprosent. En sjekk og eventuelt gjennomgang av resultatet kan derfor være nødvendig for best mulig sluttresultat. Dette gjelder både for dokumenter fra PullPrint og allerede innskannede dokumenter.

Tekstgjenkjenning fra PullPrint-maskin

Fremgangsmåten for OCR-behandling av et innskannet dokument fra en PullPrint-maskin er ganske enkelt å skanne et dokument og sende det som vedlegg til ocr@uib.no.

  1. Legg dokumentet klart i øverset venstre hjørne på glassplaten. Pass på at det ikke ligger skjevt.
  2. Logg på PullPrint ved å dra ditt student- eller ansattkort gjennom kortleseren.
  3. Velg E-mail på displayet.
  4. Trykk på knappen for mottakeradresse, og skriv inn ocr@uib.no (du trenger ikke sende til din egen e-postadresse).
  5. Velg emne for meldingen og skriv inn.
  6. Klikk på Preferences og velg:
    • Svart/hvitt eller farger
    • Tekst, bilde eller blanding
    • Oppløsning: Høyest tall gir mer detaljer og normalt lavest feilprosent. Men er det mange sider med god kvalitet, kan man spare tid og lagringsplass ved å velge lavere enn maks.
  7. Klikk Send, og vent til dokumentet er skannet inn.
  8. Om ikke lenge skal det dukke opp en e-post i innboksen din merket [OCR] etterfulgt av det du skrev i emnefeltet.

Tips: Har du tilgang til en skanner med høyere oppløsning enn PullPrint-maskinen, kan du få bedre resultat om du skanner der og sender dokumentet som vedlegg fra pc-en.

Tekstgjenkjenning fra allerede innskannet dokument

Har du et innskannet dokument med tekst, men som ikke er lagret som tekst, kan du gjøre noe med dette.

  1. Gå til e-postprogrammet ditt og åpne en ny melding.
  2. Legg ved det innskannede dokumentet.
  3. Skriv inn ønsket emne på e-posten.
  4. Send e-posten til ocr@uib.no (du trenger ikke sende til din egen e-postadresse).
  5. Det behandlede dokumentet skal havne i din innboks ikke lenge etter.

Grafikkformater som jpg og png kan sendes til ocr@uib.no, men pdf ser ut til å gi bedre resultat.