ODS Course
Стартовал беспредельный и бесплатный практический курс по анализу данных от лучшего сообщества по DS на планете http://mlcourse.ai/
Хочу пройти этот марафон. В прошлый раз я сошел с дистанции т.к не выдержал темп и нагрузки. Знаний и навыков явно было недостаточно для первого забега. Пережив разочарование и поплакав в подушку, через некоторое время приступил к ботанию. Подготовился за это время по питону: самостоятельно+ занятия с репетитором, курсы на stepic, питоньютор, Codecombat. Есть базовые представление о МЛ, прошел краткий курс на Udacity и Coursera. Накопил некоторый запас теории, требующий структурирования и применения в жизни. Как заметил в процессе обучения, теория быстро забывается, если не привязана к решению практических задач.
Надеюсь время курса пройдет с пользой и оставит в памяти глубокий личный опыт. Предстоит много работы. Никто не говорит, что будет легко, но интересно- точно будет.
Всем участникам, кандидатам и просто неравнодушным желаю удачи и хорошо повеселиться! GG HF
Критерий завершения
Задачи сделаны, опыт получен, конспект, некое место kaggle
Личные ресурсы
Время, время, как жаль что в сутках всего 24 часа.
Экологичность цели
Практика- это то, что мне не хватает.
-
1 Homework
-
2 Homework
-
3 Homework
-
4 Homework
-
5 Homework
-
6 Homework
-
7 Homework
-
8 Homework
-
etc
-
Demo assignments, just for practice (completing these has no effect on rating):
-
Статьи на Хабре
Первичный анализ данных с PandasВизуальный анализ данных с PythonКлассификация, деревья решений и метод ближайших соседей- Линейные модели классификации и регрессии
- Композиции: бэггинг, случайный лес
- Построение и отбор признаков
- Обучение без учителя: PCA и кластеризация
- Обучаемся на гигабайтах с Vowpal Wabbit
- Анализ временных рядов с помощью Python
- Градиентный бустинг
Видеолекции
Первичный анализ данных с PandasВизуальный анализ данных с Seaborn и MatplotlibКлассификация. Деревья решений- Логистическая регрессия + обсуждение соревнования Kaggle
- Случайный лес
- Регрессия, регуляризация
- Обучение без учителя
- Признаки, SGD, Vowpal Wabbit
- Временные ряды
- Градиентный бустинг
Беседы о Data Science
- Александр Дьяконов
Константин Воронцов- Евгений Соколов
Дмитрий ВетровЭмели Драль и Виктор КанторСергей Николенко
Домашние задания
Актуальные задания будут объявляться раз в неделю при очередной сессии курса. Тут вы найдете демо-версии заданий:
Анализ данных по доходу населения UCI Adult, nbviewerВизуальный анализ данных о публикациях на Хабрахабре, nbviewer- Деревья решений в игрушечной задаче и на данных Adult репозитория UCI, nbviewer
- Прогнозирование популярности статей на TechMedia (Хабр) с помощью линейных моделей, nbviewer
- Логистическая регрессия и случайный лес в задаче кредитного скоринга, nbviewer
- Линейная регрессия, Lasso и RF-регрессия в задаче по определению качества вина, nbviewer
- Обучение без учителя: метод главных компонент и кластеризация, nbviewer
- Реализация алгоритмов онлайн-обучения, nbviewer
- Анализ временных рядов, nbviewer
- Прогнозирование задержек вылетов (соревнование Kaggle Inclass), nbviewer
Соревнования Kaggle Inclass
- Catch Me If You Can: Intruder Detection through Webpage Session Tracking. Kaggle Inclass
- How good is your Medium article? Kaggle Inclass
- Категоризация покупок. Kaggle Inclass, ссылка для участия
-
- 2383
- 03 октября 2018, 12:01
Не пропустите новые записи!
Подпишитесь на цель и следите за ее достижением