Что нового

Скачать курс: [TeachMeSkills] Data Scientist - 2021 (Богдан)

Administrator
Команда форума
Регистрация
13.03.2019
Сообщения
34 321
Научим Data Science с нуля за 7,5 месяцев.

Кем ты станешь:
С развитием технологий и повсеместным использованием гаджетов все легче становится собирать различные данные о том, что происходит в мире — от наших кликов в интернет-пространстве до структуры развития человеческого генома. Для того, чтобы уметь обращаться с этими данными, и существует Data Science. Какую песню предложить тебе для прослушивания? Как определить, где пешеход, а где встречная машина во время движения? Как спрогнозировать изменение цен на криптовалюту в будущем? На этом курсе ты сможешь понять, как работают все вышеперечисленные алгоритмы, а также научишься строить свои предиктивные модели, используя фреймворки TensorFlow и PyTorch.

Твой результат в конце курса:
1. Выучишь основные алгоритмы машинного обучения и натренируешь свои модели
2. Построишь и обучишь глубокие нейронные сети, определишь архитектурные параметры
3. Используешь лучшие методики для оценки качества моделей и их оптимизации
4. Научишься стратегиям end-to-end, транcфера и многозадачного машинного обучения
5. Построишь сверточные и рекурентные нейронные сети, используя фреймворки PyTorch и TensorFlow
6. Станешь востребованным специалистом в сфере Data Science





Содержание
Модуль 1 - Введение

Краткий обзор курса и задач Machine Learning

Что такое Machine Learning, Data Science, AI

Google Colab, Jupyter Notebook, настройка среды
Модуль 2 - Python для Data Science

Введение в Python

Основы работы с Python
Модуль 3 - Системы контроля версий - Git

Git - введение
Git Flow
Git - практика
Модуль 4 - Основы Python (типы и структуры данных)

Операторы, выражения
Числа с плавающей точкой (int/float)
float 2
Базовые коллекции 1 - list (списки)
Базовые коллекции: cтроки
Базовые коллекции: словари и множества
Базовые коллекции: кортежи
Модуль 5 - Основы Python (логические выражения и циклы)

Условный оператор if, ветвления
Условный оператор if: продолжение
Цикл while
For: циклы со счетчиком
For: циклы со счетчиком, часть 2. Функция range
Цикл for: работа со строками
Вложенные циклы
Модуль 6 - Основы Python (функции)

Функции
Методы для работы со списком
List comprehensions
Функции — Рекурсия
Модуль 7 - Основы Python (классы)

Классы
Модуль 8 - 9 - Манипуляции с данными. Базы данных и SQL

Изучить основные методы и структуры данных библиотеки Pandas
Извлечение данных, визуализация результатов
Группировка, подсчет метрик
Преобразование данных
Базы данных
SQLite
SQL запросы
ORM
Модуль 10 - PostgreSQL и SQLAlchemy

Сложные запросы
PostgreSQL
SQLAlchemy
Функции и триггеры
ORM
Модуль 11 - 12 - Базовый математический уровень для Data Science и реализация в Python

Линейная алгебра (Основы матричного исчисления), векторы, векторное пространство
Вычисления с помощью NumPy
Матрицы. Реализация матричных операций на языке Python
Основы теории вероятности и математической статистики. Основы мат. анализа
Распределения, доверительные интервалы
Корреляция
Базовый эксплоративный анализ и визуализация данных
Работа с данными в Pandas
Модуль 13 - Data Visualization

Визуализация данных в Matplotlib
Plotly
Модуль 14 -15 - Классические Machine Learning-алгоритмы

Обучение с учителем/без учителя/с подкреплением
Функция ошибок
Градиентный спуск
Линейная регрессия
Модуль 16 - 17 - Продолжаем с линейной регрессией

Множественная линейная регрессия
Классификация (логистическая регрессия)
Переобучение (регуляризация)
Недообучение
Другие алгоритмы (Метод опорных векторов)
Модуль 18 - Введение в нейронные сети

Понятие нейронных сетей. Нейрон. Многослойный персептрон
Функции активации
Learning (Forward, Backpropagation)
Смещение/разброс (Bias/Variance)
Кривые обучения (Learning curves)
Метрики оценки
Модуль 19 - 20 - Ансамблевые методы

Деревья решений
Ансамблевые методы Boosting/Bagging
Градиентный бустинг
Random Forest
Модуль 21 - Обучение без учителя (Кластеризация)

Метод k-средних
Иерархическая кластеризация
DBSCAN
Выявление аномалий
Модуль 22 - Снижение размерности

Метод главных компонент (PCA)
Стохастическое вложение соседей с t-распределением (T-SNE)
Модуль 23 - Рекомендательная система

Основанная на пользователях

Основанная на контенте

Коллаборационный фильтр

Модели прогнозирования временных рядов
Модуль 24 - Работа с большими данными

Large scale algo
Batching
Cross-Validation
Map reduce
Модуль 25 - 26 - Нейронные сети и Deep Learning

Классификация архитектур нейронных сетей
Виды слоёв (и классификация нейронов)
Обучение: функция потерь, обратное распространение ошибки, оптимизаторы, стохастический градиент
Регуляризация
Ознакомление с библиотеками для Deep Learning
Модуль 27 - 29 - Решение проблем с тренировкой глубоких нейросетей

Улучшаем глубокие нейросети
Оптимизация гиперпараметров, Регуляризция и Оптимизация
Gradient vanishing/explosion
Модуль 30 - 31 - Data Science project pipeline

Structuring Machine Learning Projects
Transfer Learning
Модуль 32 - 34 - Сверточные нейросети

Введение
Операция свертки
Слои в сверточных нейросетях
Базовая структура сверточной нейросети
Классификация объектов
Модуль 35 - 37 - Применение сверточных нейросетей

Object detection
Распознавание лиц
Перенос стилей
Модуль 38 - 42 - Sequence Models

Рекуррентная нейросеть (RNN)
Управляемый рекуррентный блок (GRU)
Долгая краткосрочная память (LSTM)
Двунаправленная RNN/LSTM
Механизм внимания
Модуль 43 - 44 - Основы Natural Language Processing (NLP)

Word2Vec, GloVe и Fastext
BERT
Модуль 45 - 46 - Основы Times Series Prediction

Классические подходы применения статистики
Предобработка временных рядов
Применение Deep Learning
Модуль 47 - 49 - Примеры решений задач СV, NLP, Time Series prediction

Сегментация объектов на изображении
Анализ эмоциональной окрашенности текста
Классификации текста
Модуль 50 - 52 - Основы Computer Science для Data Science

Основы Computer Science (OOП)
Базовые алгоритмы и структуры данных
Инкапсуляция, наследование и полиморфизм
Перегрузка операторов
MRO
Статические методы, методы класса, property
Метаклассы
Классы данных
Модуль 53 - Основы Web

Flask or Fast API
Модуль 54 - 55 - Основы работы в облачных сервисах

Знакомство с AWS
Базы данных на AWS -- RedShift
AWS SageMaker, S3
AWS Textract
Google Cloud Platform
Google Vision
Деплой своего проекта на GCP (App Engine)
Модуль 56 - 57 - Закрепление итогового материала и выбор дипломного проекта

Модуль 58 - Подготовка к техническому собеседованию

Модуль 59 - Онлайн-тренинг "Трудоустройство в IT"

Составление резюме (теория + практика)

Составление профиля на LinkedIn (теория + практика)

Прохождение интервью

Soft skills, которые важны в рамках интервью

Проведение пробного интервью
Модуль 60 - Защита дипломных проектов

Общая стоимость курса: 2800 (BYN)











 
Верх