Lex Kravetski (lex_kravetski) wrote,
Lex Kravetski
lex_kravetski

Categories:

Про автоматизированную филологию

Познал сиё посредством рассылки.

 

Группа исследователей-энтузиастов составляла частотный словарь произведений Михаила Шербакова: загнала в компьютер все доступные тексты и заставила умную программу подсчитать для каждого слова, сколько раз оно в этих текстах встречается. Программа была настолько умная, что сама определяла грамматическую принадлежность слова (существительное, глагол и т. п.) и распознавала потом это слово во всех его формах: падежах, лицах, числах и т. д. Когда работа была сделана, ее авторы, проверяя возможности своего детища, поинтересовался в частности, какой глагол у Щербакова самый употребительный. И получил ответ: глагол «мыть». Авторы переглянулись: они неплохо знали тексты Щербакова и что-то не замечали там обилия этого глагола. Тогда они спросили, какой глагол следующий по употребительности, и программа уверенно ответила: глагол «какать»... Только шок, пережитый авторами работы, заставил их вспомнить, что

а) программа считает деепричастия не самостоятельными словами, а формами соответствующих глаголов, и

б) никто не сказал ей о такой штуке, как ударение, которым и различаются «какАя»-- местоимение и «кАкая» – деепричастие. Тогда-то выяснилась и причина лидерства глагола «мыть» – у него кроме деепричастия есть еще и подходящая форма повелительного наклонения...

 

Дополнения уже от меня:

1. Щербаков – это бард такой, если кто не знает. На фоне большинства бардов весьма достойный.

2. Компьютеры не думают, думают люди.

3. В каждом законе, – природы ли, общества ли, абстрактной науки ли, – самое важное, это правильно учесть и описать исключения.

4. Да, я знаю, эти три пункта для вас не секрет.

Subscribe

  • Чем современные дети

    Хотелось бы прокомментировать статью «Чем современные дети отличаются от школьников 1980-х: 10 пунктов учителя истории», заодно объяснив, почему «не…

  • Ещё одно число зверя

    Бороться с числом зверя в ИНН теперь уже не модно. Однако сама идея-то отличная — жаль выбрасывать. Поэтому теперь люди борются со, сцуко, qr-кодами.…

  • Двусторониий статистический факап

    Наблюдая рассуждения части граждан по поводу вакцинации, я в полный рост вижу вторую сторону факапа, которая ранее была скрыта на фоне первой. Вот…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 9 comments