1

Step 1

неделя 1

2

Step 2

неделя 2

3

Step 3

неделя 3

4

Step 4

неделя 4

5

Step 5

неделя 5

6

Step 6

неделя 6

7

Step 7

неделя 7

1

Step 1

неделя 1

2

Step 2

неделя 2

3

Step 3

неделя 3

4

Step 4

неделя 4

5

Step 5

неделя 5

6

Step 6

неделя 6

7

Step 7

неделя 7

25 June 2016 01 December 2016
The goal is overdue by 2918 days

Goal frozen

Author of goal 29 June 2016 year froze this goal

Goal author

Александра

Russia, Зеленоград

37 years old

General

Введение в машинное обучение. Python

Не так давно получил распространение термин «большие данные», обозначивший новую прикладную область — поиск способов автоматического быстрого анализа огромных объёмов разнородной информации. Наука о больших данных ещё только оформляется, но уже сейчас она очень востребована — и в будущем будет востребована только больше. С её помощью можно решать невероятные задачи: оценивать состояние печени по кардиограмме, предсказывать зарплату по описанию вакансии, предлагать пользователю музыку на основании его анкеты в интернете.

Большими данными может оказаться что угодно: результаты научных экспериментов, логи банковских транзакций, метеорологические наблюдения, профили в социальных сетях — словом, всё, что может быть полезно проанализировать. Самым перспективным подходом к анализу больших данных считается применение машинного обучения — набора методов, благодаря которым компьютер может находить в массивах изначально неизвестные взаимосвязи и закономерности.

На факультете компьютерных наук ВШЭ и в Школе анализа данных есть люди, активно использующие машинное обучение и разрабатывающие новые подходы к нему. Именно они — преподаватели этого курса.

Вы изучите основные типы задач, решаемых с помощью машинного обучения — в основном речь пойдёт о классификации, регрессии и кластеризации. Узнаете об основных методах машинного обучения и их особенностях, научитесь оценивать качество моделей — и решать, подходит ли модель для решения конкретной задачи. Наконец, познакомитесь с современными библиотеками, в которых реализованы обсуждаемые модели и методы оценки их качества. Для работы мы будем использовать реальные данные из реальных задач.

Краткая программа курса: Неделя 1. Введение. Примеры задач. Логические методы: решающие деревья и решающие леса. Неделя 2. Метрические методы классификации. Линейные методы, стохастический градиент. Неделя 3. Метод опорных векторов (SVM). Логистическая регрессия. Метрики качества классификации. Неделя 4. Линейная регрессия. Понижение размерности, метод главных компонент. Неделя 5. Композиции алгоритмов, градиентный бустинг. Нейронные сети. Неделя 6. Кластеризация и визуализация. Частичное обучение. Неделя 7. Прикладные задачи анализа данных: постановки и методы решения.

Слушателю нужно знать об основных понятиях математики: функциях, производных, векторах, матрицах. Для выполнения практических заданий потребуются базовые навыки программирования. Очень желательно знать Python. Задания рассчитаны на использование этого языка и его библиотек numpy, pandas и scikit-learn.

Чтобы успешно завершить курс, нужно набрать проходную сумму баллов за тесты и практические задания, а также выполнить финальный проект, посвящённый решению прикладной задачи анализа данных.

Мы уверены, что этот курс будет полезен каждому, кто хочет постичь искусство предсказательного моделирования и освоить интеллектуальный анализ данных.

 Goal Accomplishment Criteria

получение сертификата

 Personal resources

время

  1. неделя 1

    1. вводное занятие

    2. Знакомство с инструментами

    3. Решающие деревья

    4. Задание 1

    5. Задание 2

  2. неделя 2

    1. Метрические методы

    2. Линейные методы

    3. Задание 1

    4. Задание 2

    5. Задание 3

  3. неделя 3

    1. Метод опорных векторов и логистическая регрессия

    2. Метрики качества классификации

    3. задание 1

    4. Задание 2

    5. Задание 3

    6. Задание 4

  4. неделя 4

    1. Линейная регрессия

    2. Понижение размерности и метод главных компонент

    3. Задание 1

    4. Задание 2

  5. неделя 5

    1. Композиции алгоритмов

    2. Нейронные сети

    3. Задание 1

    4. Задание 2

  6. неделя 6

    1. Кластеризация и визуализация

    2. Частичное обучение

  7. неделя 7

    1. Машинное обучение в прикладных задачах

    2. ПРОЕКТ

  • 953
  • 25 June 2016, 18:49
Sign up

Signup

Уже зарегистрированы?
Quick sign-up through social networks.
Sign in

Sign in.
Allowed.

Not registered yet?
 
Log in through social networks
Forgot your password?