@Михаил Балабанов „Накратко, според мен за нашата съвсем тясна и конкретна приложна задача – > формообразуване на конкретен, ограничен и предварително известен списък от > думи – подходът с правилата е много удобен (от човешка гледна точка) и > ефективен (от техническа гледна точка), а напротив, боравенето с „плосък“ > списък от милиони словоформи в един файл би било изключително неудобно и > тромаво.“
Да, съгласен съм с мнението ви, именно това имах предвид като казах „Но иначе за целите на „БГ Офис“ (които са основно в областта на проверката > на правописа и само донякъде и на граматиката), мнението ви е напълно > валидно, г-н Балабанов.“ > :) Все пак е възможно да има и второстепенна по важност версия, която да е като „плосък“ списък. :D „Не виждам пречка да обединя тази класификация със сегашната в БГ Офис, > защото вероятно моите промени са еквивалентни на тези, извършени от > останалите клонирали екипи.“ > Да, добра идея е. И аз имам няколко предложения за някои добавки към класификацията — от следния адрес можете да видите настоящите ми дейности по този въпрос: http://slovnik.chitanka.info/%D0%A1%D0%BB%D0%BE%D0%B2%D0%BD%D0%B8%D0%BA:%D0%91%D1%8A%D0%BB%D0%B3%D0%B0%D1%80%D1%81%D0%BA%D0%B8/%D0%A2%D0%B8%D0%BF%D0%BE%D0%B2%D0%B5_%D0%B4%D1%83%D0%BC%D0%B8 . „Например в моята класификация съм разделил правилата за глаголите на > такива от свършен и несвършен вид, защото първите не трябва да образуват > деепричастия, сегашни деятелни причастия и отглаголни съществителни > (*нарисувайки, *нарисуващ, *нарисуване).“ > Да, хубаво е да се разделят на такива от свършен и на такива от несвършен вид. „Може би може да се отделят и преходните глаголи от непреходните заради > страдателните причастия (за да няма неща като *постоян), но за целите на > правописната проверка те могат да се изнесат при прилагателните.“ > И в моята версия на класификацията съм разделил преходните и непреходните глаголи. Подкрепям това предложение. Най-добре е да са като нов (под)тип към прилагателните, да. Мисля, че ще е най-добре да съберем каквито промени са направени по класификацията (от теб (г-н Балабанов), от IDI в IDI Spellchecker, от мен — и ако има и други — и останалите) и да ги реализираме. „ПП Като лингвист, може ли да хвърлите един поглед на > https://sites.google.com/site/bglocalize/ ? Бих се радвал на всякакви > конструктивни коментари. :)“ > Благодаря за гласуваното доверие като лингвист, но съм по-скоро филолог, който още не е завършил университетското си образование. ;-))) Но се занимавам дейно с езикознание като хоби. :) От години ползвам BGlocalize. :) Много добър ресурс, през годините съм събрал някоя и друга дузина с допълнения към терминологичния ви речник (и даже направих и следната <http://slovnik.chitanka.info/CBASTILS> компилация на материали по темата, която засега е просто копие на BGlocalize), ако искате, мога да ви ги изпратя или направо да ги обсъдим насаме в отделна, частна кореспонденция по ел. поща. :) От над 1-2 години се влачи един мой проект, свързан с BGlocalize, пишите ми, за да обсъдим и него, ако се интересувате. ;) Също така приветствам и нови попълнения към екипа на моя проект „Бълогос <http://slovnik.chitanka.info/%D0%9D%D0%B0%D1%87%D0%B0%D0%BB%D0%BD%D0%B0_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0>“, разгледайте алфа-версията ( :D ) на уебсайта на част от проекта и ми пишете, ако се интересувате и от това. :) Поздрави, Sah War (sahwar) На 10 април 2015 г., 17:23, Mikhail Balabanov <[email protected]> написа: > @Sah War: > Занимавам се с компютърна лингвистика и машинен превод повече от 15 г., > макар и само като хоби, а освен това имам и добър поглед „от другата > страна“ като преводач, редактор и автор, така че разбирам напълно за какво > става дума. [1] :) Изобщо не говоря за цялостна формализация на естествен > език – прагматика, семантика, пък дори и синтаксис. Говоря само за > формообразуване, при това само в посока генериране на форми, без същински > морфологичен анализ, без парсинг и извличане на граматични признаци. > > Използваният конкретно от БГ Офис набор от правила е базиран доста тясно > на книга, издадена през 80-те години, която за времето си е била > революционен начин на представяне. Класификацията обаче не е била > предвидена за компютърна обработка, която изисква пълна прецизност (не > просто висока, а именно пълна). Т.е. _замисълът им_ наистина е да обхващат > абсолютно точно парадигмите на формообразуване _за всички думи, включени в > речника за проверка_ (не за всяка мислима българска дума!), за което в > текущия си вид се нуждаят от доработка, но става въпр > ос за сравнително проста работа. Например в моята класификация съм > разделил правилата за глаголите на такива от свършен и несвършен вид, > защото първите не трябва да образуват деепричастия, сегашни деятелни > причастия и отглаголни съществителни (*нарисувайки, *нарисуващ, > *нарисуване). [2] Имам и други допълнения и в крайна сметка съм получил > доста функционален набор от правила, който не допуска никакви грешки _за > думите, включени в речника_. Не виждам пречка да обединя тази класификация > със сегашната в БГ Офис, защото вероятно моите променÐ > ¸ са еквивалентни на тези, извършени от останалите клонирали екипи. > > Накратко, според мен за нашата съвсем тясна и конкретна приложна задача – > формообразуване на конкретен, ограничен и предварително известен списък от > думи – подходът с правилата е много удобен (от човешка гледна точка) и > ефективен (от техническа гледна точка), а напротив, боравенето с „плосък“ > списък от милиони словоформи в един файл би било изключително неудобно и > тромаво. > > Поздрави, > Михаил Балабанов > > ПП Като лингвист, може ли да хвърлите един поглед на > https://sites.google.com/site/bglocalize/ ? Бих се радвал на всякакви > конструктивни коментари. :) > > > [1] …и изобщо не бих противопоставял „традиционната“ и > компютърната/математическата лингвистика. Всеки компютърен лингвист би > трябвало да е наясно, че поставена в общия случай, задачата е нерешима, и > когато се разработва формализъм или се пише софтуер, винаги се търси > ефективно и прецизно решение за някакъв приложен частен случай. > > [2] Може би може да се отделят и преходните глаголи от непреходните > заради страдателните причастия (за да няма неща като *постоян), но за > целите на правописната проверка те могат да се изнесат при прилагателните. > При мен е необходимо да се смятат за форми на глагола за по-удобно > реализиране на машинния превод. > > _______________________________________________ > Dict mailing list > [email protected] > http://lists.ludost.net/cgi-bin/mailman/listinfo/dict > >
_______________________________________________ Dict mailing list [email protected] http://lists.ludost.net/cgi-bin/mailman/listinfo/dict
