День 2
Dmitry Freeman
28 квітня 2020, 22:07

Ну что же, пришло время первого поста, как полагается я делал всё что угодно, кроме чтения :)

Немного конечно почитал. Но перед этим собирался с мыслями обдумывал новый подход (люблю экспериментировать). Решил изменить подход к подсчёту слов которые я знаю и которые содержатся в тексте.

Я не лингвист, поэтому в этом абзаце может быть бредом сивой кобылы. Буду вести учёт морфем, например частица のеё можно разложить скажем на 3 морфемы の –показатель родительного падежа ,の –образование предметных понятий от глаголов и прилагательныхの – вопрос (в конце предложения, в женской речи). Поэтому «нельзя просто так взять и»(с) и записать в словарь это слово и указать кучу значений. Я решил использовать специальный аддон (MorphMan) для Anki, он берёт на себя всю работу с морфемами, с его помощью можно анализировать тексты, извлекать из них морфемы итд. По этому поводу есть хорошее видео https://youtu.be/h2xYKx76-9s P.S для Soyo и Варвары. Там есть поддержка китайского, но я с ней не разбирался и в инете особо инфы не встречал.

Так что как видно из примера выше, с обычным подходом я бы считал の за одно слово, а по факту это несколько морфем аддон говорит что 4 в в тексте который я ему скормил. Поэтому когда увидите у меня в табличке надпись уникальных слов в книге, не известных мне слов под «словом» я буду подразумевать морфемы. Из-за этого количество «уникальных слов» и «изученных слов» будет выше.

На скриншоте новая версия таблички, точнее старая осталась, а эта служит обложкой, но берёт данные из таблицы. В поле «Сложность» я указал насколько сложно читается произведение это очень субъективная оценка, но я думаю она отображает соотношение. Поле «Прогресс» отображает примерный прогресс, учёт веду грубо «Страниц реальных» это сколько всего файлов(сканов новеллы с текстом и без) например я читаю «Мир отомэ игр труден для мобов» последний файл в папке первого тома mob_01_388.png вот это и есть к-во страниц. Допустим я закончил читать mob_01_022.png в общем 100/388 * 22 = 5% просто округляю. Кстати на скриншоте видно, что в других новеллах «Время затрачено» небольшое, но «Прогресс» достаточно высокий, это вызвано тем, что я читал их до создания таблицы, и время прочтения не засекал как и прочитанные символы. «Полных страниц прочёл» это поле где рассчитываются страницы по этой цели. К-во символов делится на 580.

Немного сбивчивый рассказ вышел прощу прощения. Я до сих пор болею, это вызывает трудности в составлении грамотно написанного текста.

Прилагаю ссылку на таблицу мало ли кому будет интересно (папка «1»). В таблице 5 мест под добавление своих новелл. Формат файла LibreOffice и MS (в онлайн просмотре там всё перекошено, возможно оффлайн будет нормальной).

https://yadi.sk/d/94Mz5W6FuXpKS

Подобається? Розкажіть друзям!
Soyo29.04.2020

Интересно, надо будет разобраться с этим аддоном, а то на анализ слов я уже совсем забила : )

Ответить
Коментувати
Перейти до запису в стрічці
Мета

Вы тоже можете
опубликовать свою
цель здесь

Мы поможем вам ее достичь!

310 000

единомышленников

инструменты

для увлекательного достижения

Присоединиться
Реєстрація

Можливості
безмежні.
Настав час
відкрити свої.

Уже зарегистрированы?
Вхід на сайт

Заходьте.
Відкрито.

Ще не зареєстровані?
 
Підключіться до будь-якого з ваших акаунтів, ваші дані будуть взяті з акаунту.
Забули пароль?