Referat fra tidligere møter

Informasjon om IRC-møte i prosjektet Spell-Norwegian. Møtet skulle finne sted på IRC-kanalen #spell-norwegian på irc.debian.org, 2006-03-06 18:00-19:00 norsk tid (+0100). Men pga. for få deltakere er møtet flyttet til mandag 2006-03-13 18:00-19:00 norsk tid.

Informasjon om det forrige møtet ligger på SpellNorwegian/Møte/2006-02-06. Informasjon om det neste møtet ligger på SpellNorwegian/Møte/2006-03-27.

Formaliteter

Agenda

Referat

Deltakarar:

Status for bygging av pakker

Petter starta med å informere om statusen for bygging av pakkar. Bygging av kjeldekodepakkar og zip-fil for OpenOffice er klart. Stavekontroll og orddeling fungerer for OpenOffice, synonymordliste fungerer for 1.x men ikkje for 2.x. Ole Edvard Grov har testa bygging av det nye OOo synonymordformatet.

All bygging av ordlister baserer seg framleis på norsk.words og tek ikkje omsyn til eventuelle nye ord som er lagt til speling.org-databasen. Byggereglar der ein tar omsyn til speling.org-databasen bør prioriterast framover.

Petter har eit ynskje om å separere ut frekvensinformasjonen som ligg i norsk.words og leggje den inn i ei eiga fil. Petter har allereie eit skript for å gjere dette. Men reglar for å bruke frekvensinformasjon frå ei ekstern fil ved bygging ordlister er ikkje laga enno. Med dette i orden så har vi høve til å byte ut kjelda for frekvensinformasjon når ein byggjer ordlister.

Petter spurte etter ei avklaring på kor viktig vi synes det er å bygge aspell- og andre pakkar, og om vi bør bygge ein pakke for OOo 1.x og ein for OOo 2.x. Dette blei ikkje nærare diskutert under møtet.

Status for ordkorrekturen

Det var etter litt diskusjon brei semje om at speling.org-systemet ikkje er føremålsteneleg til å lage ein lingvistisk database. Problemet er både systemet i seg sjølv og at det vert for høg brukarterskel til at mange vil kunne bidra.

Forslaget er no å berre bruke felta WORD:, STATUS: og CORRECTION:. Eventuelt kan også SYNONYM-feltet brukast, men då kjem vi opp i problemet med synonymoppføringar for alle bøyingsformer. Dette må i so tilfelle utarbeidast klare retningsliner for. Eit anna problem er datakrava for bygging av synonymordlista for OOo 2.x, der ein truleg også treng ordklasseinformasjon for å bygge ho.

Håvard vil endre utsending av korrekturpost slik at berre felta WORD: STATUS: og CORRECTION: fylgjer med kvart ord.

Utkast til brev

Til Enheten for digital dokumentasjon ved Universitetet i Oslo, http://www.edd.uio.no/

Forespørsel om offentliggjøring av ordbøkene


Vi driver med et prosjekt for å forbedre de fritt tilgjengelige stavekontrollene myspell/ispell/aspell(1)(2). Disse ordlistene brukes bl.a. i programpakken OpenOffice.org som er fritt tilgjengelig for alle og tatt i bruk på skoler over hele landet(3). I den forbindelse ønsker vi tilgang til datagrunnlaget for Bokmålsordboka og Nynorskordboka som er publisert elektronisk av ILN. Med dette tilgjengelig kunne vi øket kvaliteten på ordlistene og stavekontrollene betraktelig til glede og nytte for alle brukere av disse datasystemene. Vi har tre direkte spørsmål vi ønsker svar på:

1. Hvilke parter har rettigheter knyttet til datagrunnlaget, og til hvilke deler av materialet har de det?

2. Hvilke deler av datagrunnlaget kan publiseres i dag, og på hvilke vilkår?

3. Hva kan gjøres for å eventuelt frigjøre eller frikjøpe de delene av datagrunnlaget som ikke kan offentliggjøres øyeblikkelig?

Vi ser for oss at datagrunnlaget publiseres i ett eller annet tagget format på verdensveven i tillegg til de søkbare ordbøkene. Vi tror fellesskapet er tjent med å gjøre dette fullt ut fritt tilgjengelig, bl.a. for å øke utvalget, kvaliteten og tilgjengeligheten av språkteknologi for norsk språk. Dette er også i tråd med myndighetenes formål om økt konkurranse i IT-markedet og mer bruk av fri programvare (referanse?).

Vi mener dagens situasjon hindrer fri bruk av det norske språk. Stavekontroll med datagrunnlag fra enheten for digital kommunikasjon ved Universitetet i Oslo er i dag bare lett tilgjengelig for Microsoftbrukere. Gode leksikalske ressurser bør vere tilgjengelig på all programvare på alle plattformer, slik at brukere som velger andre løsninger enn Microsoft også har tilgang til stavekontroller med best mulig datagrunnlag.

Vi ser på denne saken som helt sentral for framtiden til norsk språk i den digitale tidsalderen. Vi vil gjerne diskutere denne saken nærmere, hvis det er behov for det. Målet vårt er å bygge gode stavekontroller for fri programvare.

Med håp om snarlig svar

Lenker: (1) http://spell-norwegian.alioth.debian.org (2) http://nb.speling.org (3) http://no.openoffice.org

Kopi til:

Språkrådet v/Sylfest Lomheim Kulturdepartementet v/Trond Giske