Norsk grammatikkontroll

Repetert ord

Introduksjon: Grammatikkontroll? Stavekontroll?

Alle språk har forskjellige behov når det kommer til grammatikkontroll.

Noen språk er svært regelrette og stavekontrollen gir god hjelp. Språk hvor bøyninger er viktig, som latinske språk, kan man til en stor grad sjekke med en god stavekontroll. Hvis en spanjol sier "haríamos", så mener han mange norske ord som må stå i en bestemt rekkefølge: "vi ville ha gjort".

Begrensningen til en stavekontroll ligger i at den sjekker ordene hver for seg. I språk som er rike på sammensetninger, som norsk, hvor "hage" + "slange" plutselig blir et nytt ord: "hageslange", har vi noen spesielle utfordringer. For selv om ordene er stavet rett hver for seg, er det for eksempel ikke riktig å skrive

Jeg har kjøpt en hage slange.

Slik feil særskriving er for mange irriterende (prøv et google-søk), og i mange tilfeller endrer det også betydningen av setningen:

Tunfisk biter i vann.

Det er jo sant. Tunfisk er svære fiskebeist og biter når de svømmer rundt i vannet og kommer over noe å bite i. Men meningen ble helt annerledes enn det som var tanken.

Og syntaks (ordrekkefølge, samsvarsbøyning osv) må uansett språk sjekkes med en grammatikkontroll.

Mål

Etter hvert kan vi legge til andre funksjoner, som:

En del feiltyper er felles for flere språk, og fungerer allerede i norsk også:

OK Jeg er med. Hvordan hjelper jeg?

Vi trenger

Foreløpig ønsker vi å fokusere ord delings syken (feil særskriving) [sic], men du kan føle deg fri til å sysle med løsninger på andre typer problemer hvis du synes det er mer interessant. Se under Mål over.

For å hjelpe til med å skrive disse sidene du leser nå, kan du registrere deg øverst på siden (gratis) og bare sette i gang.

Det kan være lurt å abonnere på maillisten for oversettelse av fri programvare, der kan du bare spørre om det er noe du lurer på.

Virkemiddel

Prosjektet LanguageTool er vel det mest brukte til openoffice, og vi ønsker å lage norske regler/skript til dette verktøyet. Diskusjon om hver enkelt feiltype og hvordan den blir nedkjempet av Languagetool, finner du ved å klikke linkene under Mål over. Det ferdige verktøyet kan lastes ned fra:

Hvordan virker LanguageTool?

?LanguageTool har for tiden en firedelt prosess:

  1. Dele dokumentet opp i hele setninger (ny linje/punktum)
  2. Dele setningen opp i ord
  3. Analysere ordene og finne ut hvilken ordklasse, tid, kjønn, funksjon de har i setningen osv.
  4. Sjekke ordsamlingene mot reglene for å sjekke at alt stemmer med disse.

Ressurser

http://sprakrad.no (Språkrådet)

http://no.ckan.net/package/oslo_bergen_taggeren (takk til Keld)

http://languagetool.wikidot.com/ (Hvordan ?LanguageTool virker)

http://languagetool.org/ (Teste norske wikipedia-sider med siste skrik av ?LanguageTool) (underveis)

http://www.ifi.uio.no/ (Informatikk: språk og kommunikasjon på UiO)

Lisens

Norsk grammatikkontroll blir utgitt under en GPL-lisens, som garanterer rettighetene dine. Du har rett til å laste ned verktøyet og bruke det til hva du vil, så lenge du gir samme rettigheter til de du gir det videre til. Se mer detaljer i lisensteksten (kommer)