Что нового

Скачать курсы бесплатно. Слив базы курсов. Все курсы online

Присоединяйтесь к нам! У нас тысячи отборного премиум курсов на любой вкус! Все платные курсы - БЕСПЛАТНО!

Новинки каждый день

Мы добавляем по 1.000 новых курсов ежедневно.

Обсуждение

Общайся с единомышленниками по интересующим тебя материалам

Гибкие тарифы

Мы гибки в ценообразовании. Тарифы на месяц и на год!

[Нетология] Data Scientist (Вячеслав Мурашкин)

admin

Administrator
Команда форума
Регистрация
13.03.2019
Сообщения
29 806
Реакции
1 047
Баллы
113

Курс состоит из более чем 180 часов видео и домашних заданий от ведущих специалистов по Data Scientist компаний Mail.ru, Ivi и Avito.

Первые два набора уже удачно состоялись, и студенты вовсю погрузились в базовые алгоритмы ML, feature engineering, машинное зрение, Data Scientist в e-commerce, временные ряды и прогнозирование стоимости акций и других товаров. Их преподавателями стали эксперты из Yandex Data Factory, Rambler&Co, Сбербанк Технологии и теперь у вас появится возможность получить все необходимые знания и навыки для работы в области больших данных.
Программа занятий

I
Подготовительный блок
12 часов
Экспресс-обучение основным инструментам: Python 3, git, библиотеки numpy, pandas. Обзор основного математического аппарата: матричные операции, введение в статистику и проверку гипотез.
II
Введение в data science, основные инструменты
12 часов
Что такое data science, big data, как это работает и где применяется. Эксплоративный анализ и библиотеки визуализации данных. Обзор методов машинного обучения в бибилотеке scikit-learn.
III
Базовые алгоритмы и понятия машинного обучения
18 часов
Разбор основных задач и алгоритмов машинного обучения: деревья решений, метод k ближайших соседей, линейный классификатор и логистическая регрессия, кластеризация. Проверка точности модели. Проблема переобучения и борьба с ней: регуляризация, ансамблирование.
IV
Feature engineering
9 часов
Проблемы качества и размерности данных. Уменьшение размерности данных. Методы декомпозиции. Cпрямляющие пространства.





Продолжение описания

V
Рекомендательные системы
21 ЧАС
Введение в рекомендательные системы. Неперсонализированные рекомендации. Персонализированные рекомендации. Развитие рекомендательных систем.
VI
Распознавание изображений, машинное зрение
27 часов
Базовая теория. Обзор кейсов применения. Нейросети. Разбор реальных задач: рукописный ввод, детекция и сегментация объектов на изображении.
VII
Обработка естественного языка (NLP)
24 часа
Введение в обработку текста. Обзор существующих библиотек, их использование и доработка. Использование внешних ресурсов. Грязные тексты: что это такое и как с ними работать. Дистрибутивная семантика. Чатботы: разбор генерации текстов. Нейросети для NLP.
VIII
Анализ временных рядов, прогнозирование
9 часов
Временные ряды, модели ARMA/ARIMA. Сложные модели прогнозирования. Эксплоративный анализ временных рядов.
IX
Общение с заказчиком
9 часов
Проекты машинного обучения: как выявить требования и оценить проект. Составление отчетов по исследованиям. Мастер-класс по презентации результатов.
X
Data Science в маркетинге и e-commerce
12 часов
Цели, задачи, решения и критерии успешности применения Data Science. Маркетинг Data-Driven vs интуиция. Типы данных и примеры датасетов. Методы сбора из разных источников. Подготовка и обработка данных, извлечение смысла и визуализация. Разбор атрибуции маркетинговых расходов для увеличения дохода интернет-магазина.
XI
Дополнительные инструменты, среды
12 часов
Экосистема Google: BigQuery, Dataflow, Dataproc, Datalab и др. Коммерческие решения HP: Vertica, Haven, IDOL, коннекторы данных. Решения от Amazon (AWS). Хранение и обработка данных в Clickhouse.
XII
Дипломная работа
60 часов
Разработка и внедрение собственного ML-решения/проекта либо разработка предложенного нами кейса













 
shape1
shape2
shape3
shape4
shape7
shape8
Верх