Differences between revisions 2 and 3
Revision 2 as of 2018-01-24 08:47:56
Size: 6335
Editor: ?ViktarSiarheichyk
Comment:
Revision 3 as of 2018-01-24 08:57:47
Size: 6888
Editor: ?ViktarSiarheichyk
Comment:
Deletions are marked like this. Additions are marked like this.
Line 9: Line 9:
 * афіцыйны (апошняя рэдакцыя, 2008 г.);
 * класічны (мадэрнізаваная рэдакцыя, 2005 г.);
 * лацініца (некадыфікаваная, але выкарыстоўваюцца арфаграфічныя прынцыпы класічнага правапісу).
 * [[https://be.wikipedia.org/wiki/%D0%9F%D1%80%D0%B0%D0%B2%D1%96%D0%BB%D1%8B_%D0%B1%D0%B5%D0%BB%D0%B0%D1%80%D1%83%D1%81%D0%BA%D0%B0%D0%B9_%D0%B0%D1%80%D1%84%D0%B0%D0%B3%D1%80%D0%B0%D1%84%D1%96%D1%96_%D1%96_%D0%BF%D1%83%D0%BD%D0%BA%D1%82%D1%83%D0%B0%D1%86%D1%8B%D1%96_(2008)|афіцыйны]] (апошняя рэдакцыя, 2008 г.);
 * [[https://be-tarask.wikipedia.org/wiki/%D0%91%D0%B5%D0%BB%D0%B0%D1%80%D1%83%D1%81%D0%BA%D1%96_%D0%BA%D0%BB%D1%8F%D1%81%D1%8B%D1%87%D0%BD%D1%8B_%D0%BF%D1%80%D0%B0%D0%B2%D0%B0%D0%BF%D1%96%D1%81|класічны]] (мадэрнізаваная рэдакцыя, 2005 г.);
 * [[https://be-tarask.wikipedia.org/wiki/%D0%9B%D0%B0%D1%86%D1%96%D0%BD%D0%BA%D0%B0|лацініца]] (некадыфікаваная, але выкарыстоўваюцца арфаграфічныя прынцыпы класічнага правапісу).
Line 43: Line 43:
 * Ліцэнзія: Creative Commons Attribution-ShareAlike 3.0 Unported.  * Ліцэнзія: Creative Commons Attribution-!ShareAlike 3.0 Unported.

Праверка беларускай арфаграфіі

Беларуская арфаграфія

На сёння існуе тры дзейныя правапісы беларускай мовы, якія адрозніваюцца шырынёй ужытку і гістарычным шляхам:

  • афіцыйны (апошняя рэдакцыя, 2008 г.);

  • класічны (мадэрнізаваная рэдакцыя, 2005 г.);

  • лацініца (некадыфікаваная, але выкарыстоўваюцца арфаграфічныя прынцыпы класічнага правапісу).

Камп'ютарная праверка беларускага правапісу

Існуе некалькі праектаў праверкі беларускай арфаграфіі. Усе гэтыя праекты - ispell, aspell, myspell, hunspell - працуюць вельмі проста. Яны спраўджваюць, ці існуе кожнае слова ў іх слоўніку. Спалучэнні словаў не правяраюцца.

Ispell

  • Рухавік: Ispell.
  • Правапіс: класічны.
  • Аўтар: Аляксандр Міхайлян.

Для слоўніка не вызначаная нарматыўная база, няма сістэмнасці ў зборы слоў.

Ispell не падтрымлівае больш за 26 афіксаў і прэфіксаў (у апошніх версіях магчыма крыху болей). Гэтай колькасці мадэляў словазмянення не хапае для апісання граматыкі беларускай мовы. Праз гэта аўтар слоўніка быў вымушаны ўручную ўпісваць многія словаформы, што кепска паўплывала на якасць слоўнай базы.

Aspell

  • Рухавік: Aspell.
  • Правапіс: афіцыйны (1959acad), класічны.
  • Аўтары: Віталь Хілько, Уладзімір Кошчанка, Яўгенія Волкава, Валянціна Авілава.
  • Ліцэнзія: GPL.

Слоўнік складаецца з трох частак: афіцыйная (у архіве - be_SU), класічная (у архіве - be_BY) і супольная (змяшчае словаформы, якія не адрозніваюцца напісаннем у абодвух правапісах). Слоўнік пералічвае з усіх магчымых словаформаў і не мае будзь-якога механізму аўтаматычнай генерацыі словаформаў паводле мадэляў словазмянення. Арфаграфія афіцыйнай часткі ўжо не адпавядае новым правілам беларускай арфаграфіі, прынятым у 2008 г. Некаторыя патрэбныя словаформы праз недагляд адсутнічаюць.

Hunspell

Акрамя модуляў, сканвертаваных з словаформаў Aspell-модуля (афіцыйны і класічны), ёсць праект стварэння паўнавартаснага Hunspell-модуля (з пераносамі, падстаноўкамі, словазмяняльнымі мадэлямі) для афіцыйнага правапісу.

  • Рухавік: Hunspell.
  • Правапіс: афіцыйны.
  • Аўтар: Мікалай Удодаў.
  • Ліцэнзія: Creative Commons Attribution-ShareAlike 3.0 Unported.

  • Сайт: праект на Sourceforge.

Модуль складаецца з апісання мадэляў словаформаў, апорных слоў і адпаведных повязяў паміж імі. Нарматыўная слоўная база: Тлумачальны слоўнік беларускай літаратурнай мовы. Мн., Беларуская энцыклапедыя, 2005, з пэўнымі асобна вылучанымі дадаткамі. Граматыка: Кароткая граматыка беларускай мовы. Ч.1. Фаналогія. Марфаналогія. Марфалогія. Мн., Беларуская навука. 2007.

Граматычная база

Уладзімір Кошчанка і яшчэ некалькі чалавек складаюць граматычную базу беларускай мовы. У базе пазначаныя граматычныя уласцівасці кожнага слова, словаформы, націскі, афіцыйны/класічны правапіс. У адрозненні ад апісання мадэляў словаформаў праз прэфіксы/суфіксы, як hunspell, у базе улічаны асаблівасці беларускай мовы.

Праца гэтая выходзіць за межы праверкі правапісу і можа быць выкарыстана значна шырэй, нават для праверкі спалучэнняў асобных словаў у сказе праз трыграмы. Але, як адзін з вынікаў распрацоўкі такой базы можа быць слоўнік для ispell, aspell, myspell, hunspell.

Таксама, для праверкі некаторых простых правілаў, як "ў", можа быць выкарыстаны LanguageTool.

Пераносы

Правіла для пераносаў ёсьць ў слоўнікавых модулях LibreOffice. Таксама іх можна ўслаляваць у іншыя праграмы, накшталт Adobe InDesign: https://blogs.adobe.com/typblography/2011/11/how-to-enable-more-languages-in-indesign-cs5-5.html