Forskjell mellom versjoner av «Optisk tegngjenkjenning»

Fra ithjelp
Hopp til: navigasjon, søk
(La til info om kildehenvisninger, opphavsrett., etikk.)
(OCR-programvare)
Linje 43: Linje 43:
 
Grafikkformater som jpg og png kan sendes til ocr@uib.no, men pdf ser ut til å gi bedre resultat.
 
Grafikkformater som jpg og png kan sendes til ocr@uib.no, men pdf ser ut til å gi bedre resultat.
  
== OCR-programvare ==
+
=== OCR-programvare ===
  
Det er også mulig å kjøpe OCR-programvare med mer avansert funksjonalitet. Se [[Programvare|programvaresidene]] eller kontakt [[BRITA]] for spørsmål om programvare.
+
Det er også mulig å kjøpe OCR-programvare med mer avansert funksjonalitet. Se [[Programvare|programvaresidene]] eller kontakt [[BRITA]] for spørsmål om programvare. Men merk at IT-avdelingen ikke kan gi brukerstøtte på bruk av slik programvare.
  
 
== Om bruk av andres tekster ==
 
== Om bruk av andres tekster ==

Revisjonen fra 31. mar. 2011 kl. 10:45


Optisk tegngjenkjenning, ofte omtalt med den engelske forkortelsen OCR (Optical Character Recognition), gjør det mulig maskinelt å lese av innskannede dokumenter og lagre tekstlig innhold i elektronisk form.

Et spesielt program kan gjenkjenne bokstaver, tall og andre tegn i dokumenter og lagre resultatet som tekst. Når det som faktisk er tekst også blir lagret som tekst, gjør det et dokument mye mer anvendelig. Det går an å søke i dokumentet og du kan klippe og lime. UiBs OCR-tjeneste lagrer resultatet av tegngjenkjenningen som pdf. Dette er et dokumentformat som er uavhengig av om du bruker Windows, Mac eller Linux, men som i utgangspunktet er laget for å beholde utseende, heller enn å redigeres. Viderebehandling av (deler av) teksten vil derfor være mer egnet i et tekstbehandlingsprogram, eller du kan lime rett inn i e-post eller annet.

Hvordan bruker jeg optisk tegngjenkjenning ved UiB?

Studenter og ansatte på UiB kan sende et innskannet dokument som vedlegg til en e-post til adressen ocr@uib.no. Da vil du få tilbake en e-post med det bearbeidede resultatet vedlagt som et pdf-dokument. Tekst på papir kan skannes og sendes til tekstgjenkjenning fra en maskin tilknyttet PullPrint. Har du et allerede innskannet dokument, kan dette sendes som vedlegg fra ditt e-postprogram.

Merk: Kursiv, spesialtegn, redusert kontrast og liten fontstørrelse og annet kan gi større feilprosent. En sjekk og eventuelt gjennomgang av resultatet kan derfor være nødvendig for best mulig sluttresultat. Dette gjelder både for dokumenter fra PullPrint og allerede innskannede dokumenter.

OCR fra PullPrint-maskin

Fremgangsmåten for OCR-behandling av et innskannet dokument fra en PullPrint-maskin er ganske enkelt å skanne et dokument og sende det som vedlegg til ocr@uib.no.

  1. Legg dokumentet klart i øverset venstre hjørne på glassplaten. Pass på at det ikke ligger skjevt.
  2. Logg på PullPrint ved å dra ditt student- eller ansattkort gjennom kortleseren.
  3. Velg E-mail på displayet.
  4. Trykk på knappen for mottakeradresse, og skriv inn ocr@uib.no (du trenger ikke sende til din egen e-postadresse).
  5. Velg emne for meldingen og skriv inn.
  6. Klikk på Preferences og velg:
    • Svart/hvitt eller farger
    • Tekst, bilde eller blanding
    • Oppløsning: Høyest tall gir mer detaljer og normalt lavest feilprosent. Men er det mange sider med god kvalitet, kan man spare tid og lagringsplass ved å velge lavere enn maks.
  7. Klikk Send, og vent til dokumentet er skannet inn.
  8. Om ikke lenge skal det dukke opp en e-post i innboksen din merket


[OCR] etterfulgt av det du skrev i emnefeltet.

Tips: Har du tilgang til en skanner med høyere oppløsning enn PullPrint-maskinen, kan du få bedre resultat om du skanner der og sender dokumentet som vedlegg fra pc-en.

OCR fra allerede innskannet dokument

Har du et innskannet dokument med tekst, men som ikke er lagret som tekst, kan du gjøre noe med dette.

  1. Gå til e-postprogrammet ditt og åpne en ny melding.
  2. Legg ved det innskannede dokumentet.
  3. Skriv inn ønsket emne på e-posten.
  4. Send e-posten til ocr@uib.no (du trenger ikke sende til din egen e-postadresse).
  5. Det behandlede dokumentet skal havne i din innboks ikke lenge etter.

Grafikkformater som jpg og png kan sendes til ocr@uib.no, men pdf ser ut til å gi bedre resultat.

OCR-programvare

Det er også mulig å kjøpe OCR-programvare med mer avansert funksjonalitet. Se programvaresidene eller kontakt BRITA for spørsmål om programvare. Men merk at IT-avdelingen ikke kan gi brukerstøtte på bruk av slik programvare.

Om bruk av andres tekster

Husk at:

"Når du henter fakta, tanker, idéer, synspunkter og korte eller lange sitater fra en eller flere kilder
og bruker disse i eget arbeid, skal det gå klart fram hvilke kilder du har benyttet deg av."

http://www.uib.no/utdanning/om-aa-studere/eksamen/bruk-av-kilder-i-skriftlige-arbeider-ved-universitetet-i-bergen

På sidene om bruk av kilder i skriftlige arbeider ved Universitetet i Bergen kan du også lese mer om blant annet kildehenvisninger og plagiat. Mer om etikk ved UiB finner du på sidene til Redelighetsutvalget.

Opphavsrett kan du også lese mer om i Store norske leksikon og på Wikipedia