Optisk tegngjenkjenning

Fra ithjelp
Hopp til: navigasjon, søk


Informasjon.gif Har du lyst til å gi oss en Tilbakemelding på denne siden?



Optisk tegngjenkjenning, ofte omtalt med den engelske forkortelsen OCR (Optical Character Recognition), gjør det mulig maskinelt å lese av innskannede dokumenter og lagre tekstlig innhold i elektronisk form.

Et spesielt program kan gjenkjenne bokstaver, tall og andre tegn i dokumenter og lagre resultatet som tekst. Når det som faktisk er tekst også blir lagret som tekst, gjør det et dokument mye mer anvendelig. Det går an å søke i dokumentet og du kan klippe og lime. UiBs OCR-tjeneste lagrer resultatet av tegngjenkjenningen som pdf. Dette er et dokumentformat som er uavhengig av om du bruker Windows, Mac eller Linux, men som i utgangspunktet er laget for å beholde utseende, heller enn å redigeres. Viderebehandling av (deler av) teksten vil derfor være mer egnet i et tekstbehandlingsprogram, eller du kan lime rett inn i e-post eller annet.

Hvordan bruker jeg optisk tegngjenkjenning ved UiB?

Skann og send til ocr@uib.no

Studenter og ansatte på UiB kan skanne inn et dokument og sende som vedlegg i en e-post til adressen ocr@uib.no. Da vil du få tilbake en e-post med det bearbeidede resultatet vedlagt som et pdf-dokument. Tekst på papir kan skannes og sendes til tekstgjenkjenning fra en maskin tilknyttet PullPrint.

Også for elektroniske pdf- og grafikkfiler

Har du en grafikkfil (som jpg, png eller gif) eller et pdf-dokument lagret som bilde (altså ikke tekst), kan det også tegngjenkjennes. Du sender filen(e) som vedlegg til ocr@uib.no fra ditt e-postprogram. Samme dokument skal da komme i retur som pdf, der det som blir gjenkjent som tekst er konvertert til tekst.

Merk: Kursiv, spesialtegn, redusert kontrast og liten fontstørrelse og annet kan gi større feilprosent. En sjekk og eventuelt gjennomgang av resultatet kan derfor være nødvendig for best mulig sluttresultat. Dette gjelder både for dokumenter fra PullPrint og allerede innskannede dokumenter.

OCR fra PullPrint skriver

Fremgangsmåten for OCR-behandling av et innskannet dokument fra en PullPrint-maskin er ganske enkelt å skanne et dokument og sende det som vedlegg til ocr@uib.no.

  1. Legg dokumentet klart i øverset venstre hjørne på glassplaten. Pass på at det ikke ligger skjevt.
  2. Logg på PullPrint ved å dra ditt student- eller ansattkort gjennom kortleseren.
  3. Velg E-mail på displayet.
  4. Trykk på knappen for mottakeradresse, og skriv inn ocr@uib.no (du trenger ikke sende til din egen e-postadresse).
  5. Velg emne for meldingen og skriv inn.
  6. Klikk på "Preferences" / "Configuration" (avhengig av modell) og velg:
    • Svart/hvitt eller farger
    • Tekst, bilde eller blanding
    • Oppløsning: Høyest tall gir mer detaljer og normalt lavest feilprosent. Men er det mange sider med god kvalitet, kan man spare tid og lagringsplass ved å velge lavere enn maks.
  7. Klikk Send, og vent til dokumentet er skannet inn.
  8. Om ikke lenge skal det dukke opp en e-post i innboksen din merket

[OCR] etterfulgt av det du skrev i emnefeltet.

Tips: Har du tilgang til en skanner med høyere oppløsning enn PullPrint-maskinen, kan du få bedre resultat om du skanner der og sender dokumentet som vedlegg fra pc-en.

OCR fra allerede innskannet dokument

Har du et innskannet dokument med tekst, men som ikke er lagret som tekst, kan du gjøre noe med dette.

  1. Gå til e-postprogrammet ditt og åpne en ny melding.
  2. Legg ved det innskannede dokumentet.
  3. Skriv inn ønsket emne på e-posten.
  4. Send e-posten til ocr@uib.no (du trenger ikke sende til din egen e-postadresse).
  5. Det behandlede dokumentet skal havne i din innboks ikke lenge etter.

Grafikkformater som jpg og png kan sendes til ocr@uib.no, men pdf ser ut til å gi bedre resultat.

OCR-programvare

Det er også mulig å kjøpe OCR-programvare med mer avansert funksjonalitet. Se programvaresidene eller kontakt BRITA for spørsmål om programvare. Men merk at IT-avdelingen ikke kan gi brukerstøtte på bruk av slik programvare.

Om bruk av andres tekster

Husk at:

"Når du henter fakta, tanker, idéer, synspunkter og korte eller lange sitater fra en eller flere kilder
og bruker disse i eget arbeid, skal det gå klart fram hvilke kilder du har benyttet deg av."

http://www.uib.no/utdanning/om-aa-studere/eksamen/bruk-av-kilder-i-skriftlige-arbeider-ved-universitetet-i-bergen

På sidene om bruk av kilder i skriftlige arbeider ved Universitetet i Bergen kan du også lese mer om blant annet kildehenvisninger og plagiat. Mer om etikk ved UiB finner du på sidene til Redelighetsutvalget.

Opphavsrett kan du også lese mer om i Store norske leksikon og på Wikipedia