Праверка беларускай арфаграфіі

Беларуская арфаграфія

На сёння існуе тры дзейныя правапісы беларускай мовы, якія адрозніваюцца шырынёй ужытку і гістарычным шляхам:

Камп'ютарная праверка беларускага правапісу

Існуе некалькі праектаў праверкі беларускай арфаграфіі. Усе гэтыя праекты - ispell, aspell, myspell, hunspell - працуюць вельмі проста. Яны спраўджваюць, ці існуе кожнае слова ў іх слоўніку. Спалучэнні словаў не правяраюцца.

Ispell

Для слоўніка не вызначаная нарматыўная база, няма сістэмнасці ў зборы слоў.

Ispell не падтрымлівае больш за 26 афіксаў і прэфіксаў (у апошніх версіях магчыма крыху болей). Гэтай колькасці мадэляў словазмянення не хапае для апісання граматыкі беларускай мовы. Праз гэта аўтар слоўніка быў вымушаны ўручную ўпісваць многія словаформы, што кепска паўплывала на якасць слоўнай базы.

Aspell

Слоўнік складаецца з трох частак: афіцыйная (у архіве - be_SU), класічная (у архіве - be_BY) і супольная (змяшчае словаформы, якія не адрозніваюцца напісаннем у абодвух правапісах). Слоўнік пералічвае з усіх магчымых словаформаў і не мае будзь-якога механізму аўтаматычнай генерацыі словаформаў паводле мадэляў словазмянення. Арфаграфія афіцыйнай часткі ўжо не адпавядае новым правілам беларускай арфаграфіі, прынятым у 2008 г. Некаторыя патрэбныя словаформы праз недагляд адсутнічаюць.

Hunspell

Акрамя модуляў, сканвертаваных з словаформаў Aspell-модуля (афіцыйны і класічны), ёсць праект стварэння паўнавартаснага Hunspell-модуля (з пераносамі, падстаноўкамі, словазмяняльнымі мадэлямі) для афіцыйнага правапісу.

Модуль складаецца з апісання мадэляў словаформаў, апорных слоў і адпаведных повязяў паміж імі. Нарматыўная слоўная база: Тлумачальны слоўнік беларускай літаратурнай мовы. Мн., Беларуская энцыклапедыя, 2005, з пэўнымі асобна вылучанымі дадаткамі. Граматыка: Кароткая граматыка беларускай мовы. Ч.1. Фаналогія. Марфаналогія. Марфалогія. Мн., Беларуская навука. 2007.

Граматычная база

Уладзімір Кошчанка і яшчэ некалькі чалавек складаюць граматычную базу беларускай мовы. У базе пазначаныя граматычныя уласцівасці кожнага слова, словаформы, націскі, афіцыйны/класічны правапіс. У адрозненні ад апісання мадэляў словаформаў праз прэфіксы/суфіксы, як hunspell, у базе улічаны асаблівасці беларускай мовы.

Праца гэтая выходзіць за межы праверкі правапісу і можа быць выкарыстана значна шырэй, нават для праверкі спалучэнняў асобных словаў у сказе праз трыграмы. Але, як адзін з вынікаў распрацоўкі такой базы можа быць слоўнік для ispell, aspell, myspell, hunspell.

(Папярэднія два абзацы ўзяты з старога архіва mounik.org на archive.org). Здаецца, зараз вынікі іх працы знаходзяцца тут:

Online праверка арфаграфіі

Пераносы

Правіла для пераносаў ёсьць ў слоўнікавых модулях LibreOffice. Таксама іх можна ўслаляваць у іншыя праграмы, накшталт Adobe InDesign: https://blogs.adobe.com/typblography/2011/11/how-to-enable-more-languages-in-indesign-cs5-5.html