Ну что же, пришло время первого поста, как полагается я делал всё что угодно, кроме чтения :)
Немного конечно почитал. Но перед этим собирался с мыслями обдумывал новый подход (люблю экспериментировать). Решил изменить подход к подсчёту слов которые я знаю и которые содержатся в тексте.
Я не лингвист, поэтому в этом абзаце может быть бредом сивой кобылы. Буду вести учёт морфем, например частица のеё можно разложить скажем на 3 морфемы の –показатель родительного падежа ,の –образование предметных понятий от глаголов и прилагательныхの – вопрос (в конце предложения, в женской речи). Поэтому «нельзя просто так взять и»(с) и записать в словарь это слово и указать кучу значений. Я решил использовать специальный аддон (MorphMan) для Anki, он берёт на себя всю работу с морфемами, с его помощью можно анализировать тексты, извлекать из них морфемы итд. По этому поводу есть хорошее видео https://youtu.be/h2xYKx76-9s P.S для Soyo и Варвары. Там есть поддержка китайского, но я с ней не разбирался и в инете особо инфы не встречал.
Так что как видно из примера выше, с обычным подходом я бы считал の за одно слово, а по факту это несколько морфем аддон говорит что 4 в в тексте который я ему скормил. Поэтому когда увидите у меня в табличке надпись уникальных слов в книге, не известных мне слов под «словом» я буду подразумевать морфемы. Из-за этого количество «уникальных слов» и «изученных слов» будет выше.
На скриншоте новая версия таблички, точнее старая осталась, а эта служит обложкой, но берёт данные из таблицы. В поле «Сложность» я указал насколько сложно читается произведение это очень субъективная оценка, но я думаю она отображает соотношение. Поле «Прогресс» отображает примерный прогресс, учёт веду грубо «Страниц реальных» это сколько всего файлов(сканов новеллы с текстом и без) например я читаю «Мир отомэ игр труден для мобов» последний файл в папке первого тома mob_01_388.png вот это и есть к-во страниц. Допустим я закончил читать mob_01_022.png в общем 100/388 * 22 = 5% просто округляю. Кстати на скриншоте видно, что в других новеллах «Время затрачено» небольшое, но «Прогресс» достаточно высокий, это вызвано тем, что я читал их до создания таблицы, и время прочтения не засекал как и прочитанные символы. «Полных страниц прочёл» это поле где рассчитываются страницы по этой цели. К-во символов делится на 580.
Немного сбивчивый рассказ вышел прощу прощения. Я до сих пор болею, это вызывает трудности в составлении грамотно написанного текста.
Прилагаю ссылку на таблицу мало ли кому будет интересно (папка «1»). В таблице 5 мест под добавление своих новелл. Формат файла LibreOffice и MS (в онлайн просмотре там всё перекошено, возможно оффлайн будет нормальной).
We can help you achieve it!
310 000
like-minded
tools
for an exciting achievement