Informasjon om IRC-møte i prosjektet Spell-Norwegian. Møtet skulle finne sted på IRC-kanalen #spell-norwegian på irc.debian.org, 2006-03-06 18:00-19:00 norsk tid (+0100). Men pga. for få deltakere er møtet flyttet til mandag 2006-03-13 18:00-19:00 norsk tid.

Informasjon om det forrige møtet ligger på ["SpellNorwegian/Meeting/20060206"].

Formaliteter

Agenda

Referat

Deltakarar:

Status for bygging av pakker

Petter starta med å informere om statusen for bygging av pakkar. Bygging av kjeldekodepakkar og zip-fil for OpenOffice er klart. Stavekontroll og orddeling fungerer for OpenOffice, synonymordliste fungerer for 1.x men ikkje for 2.x. Ole Edvard Grov har testa bygging av det nye OOo synonymordformatet.

All bygging av ordlister baserer seg framleis på norsk.words og tek ikkje omsyn til eventuelle nye ord som er lagt til speling.org-databasen. Byggereglar der ein tar omsyn til speling.org-databasen bør prioriterast framover.

Petter har eit ynskje om å separere ut frekvensinformasjonen som ligg i norsk.words og leggje den inn i ei eiga fil. Petter har allereie eit skript for å gjere dette. Men reglar for å bruke frekvensinformasjon frå ei ekstern fil ved bygging ordlister er ikkje laga enno. Med dette i orden så har vi høve til å byte ut kjelda for frekvensinformasjon når ein byggjer ordlister.

Petter spurte etter ei avklaring på kor viktig vi synes det er å bygge aspell- og andre pakkar, og om vi bør bygge ein pakke for OOo 1.x og ein for OOo 2.x. Dette blei ikkje nærare diskutert under møtet.

Status for ordkorrekturen

Det var etter litt diskusjon brei semje om at speling.org-systemet ikkje er føremålsteneleg til å lage ein lingvistisk database. Problemet er både systemet i seg sjølv og at det vert for høg brukarterskel til at mange vil kunne bidra.

Forslaget er no å berre bruke felta WORD:, STATUS: og CORRECTION:. Eventuelt kan også SYNONYM-feltet brukast, men då kjem vi opp i problemet med synonymoppføringar for alle bøyingsformer. Dette må i so tilfelle utarbeidast klare retningsliner for. Eit anna problem er datakrava for bygging av synonymordlista for OOo 2.x, der ein truleg også treng ordklasseinformasjon for å bygge ho.

Håvard vil endre utsending av korrekturpost slik at berre felta WORD: STATUS: og CORRECTION: fylgjer med kvart ord.

Utkast til brev

Til Enheten for digital dokumentasjon ved Universitetet i Oslo, http://www.edd.uio.no/

Forespørsel om offentliggjøring av ordbøkene


Vi driver med et prosjekt for å forbedre de fritt tilgjengelige stavekontrollene myspell/ispell/aspell(1)(2). Disse ordlistene brukes bl.a. i programpakken OpenOffice.org som er fritt tilgjengelig for alle og tatt i bruk på skoler over hele landet(3). I den forbindelse ønsker vi tilgang til datagrunnlaget for Bokmålsordboka og Nynorskordboka som er publisert elektronisk av ILN. Med dette tilgjengelig kunne vi øket kvaliteten på ordlistene og stavekontrollene betraktelig til glede og nytte for alle brukere av disse datasystemene. Vi har tre direkte spørsmål vi ønsker svar på:

1. Hvilke parter har rettigheter knyttet til datagrunnlaget, og til hvilke deler av materialet har de det?

2. Hvilke deler av datagrunnlaget kan publiseres i dag, og på hvilke vilkår?

3. Hva kan gjøres for å eventuelt frigjøre eller frikjøpe de delene av datagrunnlaget som ikke kan offentliggjøres øyeblikkelig?

Vi ser for oss at datagrunnlaget publiseres i ett eller annet tagget format på verdensveven i tillegg til de søkbare ordbøkene. Vi tror fellesskapet er tjent med å gjøre dette fullt ut fritt tilgjengelig, bl.a. for å øke utvalget, kvaliteten og tilgjengeligheten av språkteknologi for norsk språk. Dette er også i tråd med myndighetenes formål om økt konkurranse i IT-markedet og mer bruk av fri programvare (referanse?).

Situasjonen i dag er at Nynorsk- og Bokmålsordboka er tilgjengelig bare for Microsoft-brukere, i og med at Microsoft (via Lingsoft) for en relativt beskjeden sum har kjøpt rettigheter til å bruke disse leksikalske ressursene. I og med at ingen andre programvareprodusenter har penger til frikjøp, innebærer dette i praksis at Microsoft har monopol på disse ressursene, med de negative konsekvensene det får for norsk språk i dataalderen. Vi mener tvert i mot at disse leksikalske ressursene skal være fritt tilgjengelige for alle, slik at norskspråklige brukere kan få utført stavekontroll på all programvare på alle plattformer, ikke bare på Microsoft Office sine programmer.

Vi ser på denne saka som helt sentral for framtida til norsk språk i den digitale tidsalderen, og vi vil, hvis det er behov for det, gjerne diskutere den nærmere. Målet vårt er altså å bygge stavekontroller for andre programmer enn Microsofts, med det samme solide grunnlaget som Microsoft hadde.

Med håp om snarlig svar

Oversetterne og ordlistemedarbeiderne -> (trenger vi en mer forpliktende avsender, konkrete navn?? Ja, en person bør stå som avsender med navn og adresse, flere kan i tillegg signere.)

Lenker: (1) http://spell-norwegian.alioth.debian.org (2) http://nb.speling.org (3) http://no.openoffice.org

Kopi til:

Språkrådet v/Sylfest Lomheim Kulturdepartementet v/Trond Giske