1

Этап 1

Парсинг идиом

2

Этап 2

Написание скрипта для поиска идиом в тексте

1

Этап 1

Парсинг идиом

2

Этап 2

Написание скрипта для поиска идиом в тексте

23 декабря 2025

Автор цели

Иностранные языки

Разработка инструмента для детального корпусного анализа текста

Что должен находить инструмент:

  • идиомы
  • фразовые глаголы
  • грамматические конструкции
  • сленг
  • (список дополняется)

Также инструмент должен определять уровни слов и выражений, классифицировать грамматические конструкции по сложности.

Со временем при наполнении базы данных он также должен будет определять различные культурные отсылки и упоминания. Например, в некоторых сериалах часто упоминаются отсылки на другие произведения или реальные культурные особенности (США в приоритете).

Инструмент не будет базироваться на использовании нейросети. Должен быть строгий, точный и предсказуемый результат, а также возможность за короткое время анализовать большие объемы текста.

 Критерий завершения

Инструмент с высокой точностью определяет идиомы, фразовые глаголы, уровень слов и сложность грамматических конструкций.

 Экологичность цели

Этот проект закрывает мою потребность в удовлетворении моих 4 любимых дел: английский язык, поиск, классификация, накопление.

  1. Парсинг идиом

    1. Непосредственно парсинг

    2. Проверка и нормализация получившихся таблиц

  2. Написание скрипта для поиска идиом в тексте

  • 51
  • 23 декабря 2025, 04:53
Регистрация

Регистрация

Уже зарегистрированы?
Быстрая регистрация через соцсети
Вход на сайт

Входите.
Открыто.

Еще не зарегистрированы?
 
Войти через соцсети
Забыли пароль?