Lex Kravetski (lex_kravetski) wrote,
Lex Kravetski
lex_kravetski

Categories:

Про автоматизированную филологию

Познал сиё посредством рассылки.

 

Группа исследователей-энтузиастов составляла частотный словарь произведений Михаила Шербакова: загнала в компьютер все доступные тексты и заставила умную программу подсчитать для каждого слова, сколько раз оно в этих текстах встречается. Программа была настолько умная, что сама определяла грамматическую принадлежность слова (существительное, глагол и т. п.) и распознавала потом это слово во всех его формах: падежах, лицах, числах и т. д. Когда работа была сделана, ее авторы, проверяя возможности своего детища, поинтересовался в частности, какой глагол у Щербакова самый употребительный. И получил ответ: глагол «мыть». Авторы переглянулись: они неплохо знали тексты Щербакова и что-то не замечали там обилия этого глагола. Тогда они спросили, какой глагол следующий по употребительности, и программа уверенно ответила: глагол «какать»... Только шок, пережитый авторами работы, заставил их вспомнить, что

а) программа считает деепричастия не самостоятельными словами, а формами соответствующих глаголов, и

б) никто не сказал ей о такой штуке, как ударение, которым и различаются «какАя»-- местоимение и «кАкая» – деепричастие. Тогда-то выяснилась и причина лидерства глагола «мыть» – у него кроме деепричастия есть еще и подходящая форма повелительного наклонения...

 

Дополнения уже от меня:

1. Щербаков – это бард такой, если кто не знает. На фоне большинства бардов весьма достойный.

2. Компьютеры не думают, думают люди.

3. В каждом законе, – природы ли, общества ли, абстрактной науки ли, – самое важное, это правильно учесть и описать исключения.

4. Да, я знаю, эти три пункта для вас не секрет.

Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 9 comments