Сливы курсов

Большая база курсов по честной ценe

Регистрация

[Нетология] Data Scientist: с нуля до middle (Алексей Кузьмин, Олег Булыгин)

Moderator

Administrator
Команда форума
Регистрация
24.09.2021
Сообщения
38 390

Чем занимается Data Scientist

Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.

Новые знания сделают вас востребованным специалистом в Data Science

Вы научитесь не только работать с аналитикой, нейронными сетями, Big Data и помогать компаниям и продуктам расти с помощью технологий, но и освоите ключевые «мягкие навыки»: коммуникацию в команде, целеполагание и эмоциональный интеллект.

Обучение на курсе поможет вам:

Перейти в профессию с высоким окладом, которая не устареет через 10 лет
Освоить ключевые технологии и опередить запрос рынка
Прожить опыт 2-3 лет самостоятельного изучения сферы Data Science
Кому будет полезен этот курс:

Новичкам в Data Science
Разработчикам
Аналитикам
Чему вы научитесь:

Работать с SQL
Использовать Python и библиотеки
Проверять данные и определять проблемы
Обучать многослойные нейронные сети и строить модели машинного обучения
Применять математику в алгоритмах
Лидировать Data-проекты, работать в команде и находить общий язык с заказчиком





Программа курса:
1 ступень. Погружение


Аналитическое мышление (Курсовой проект):


Что такое аналитическое мышление
Откуда берутся данные
Введение в Google-таблицы
Продвинутая визуализация данных
Продвинутые Google-таблицы
Python как инструмент анализа данных
Основы статистики
Машинное обучение для жизни


Основы визуализации данных (Курсовой проект):


Зачем нужна визуализация данных
Связи, потоки, процессы и карты
Инструменты, источники и предподготовка данных
Как рассказать историю с помощью данных
Основы статистики и способы сравнения метрик


2 ступень. SQL, Python и Big Data


SQL и получение данных (Курсовой проект):


Архитектура и структура баз данных (БД)
Функции SQL и их аналоги в pandas
Простые запросы, join`ы, агрегаты
Консоль (знакомство, основные операторы, утилита psql)
Базовые команды в SQL и встроеные аналитические функции
Архитектура и проектирование
Импорт и экспорт данных посредством SQL и ETL программ
Нормализация
Принципы работы с различными БД
Зависимости
Основные библиотеки для подключения к БД из Python
Подготовка и сдача итогового проекта


Аналитика больших данных (Курсовой проект):


Что такое большие данные
Основные характеристики больших данных и виды анализа данных. Продвинутые методы анализа больших данных
Монетизация больших данных
NoSQL-подход
Характеристики и источники данных
MapReduce-подход
Культура сбора данных
Введение в Hadoop
Основы реализации проектов больших данных. Кейс-стади
Практическое задание (лабораторная работа) по аналитике данных и его разбор


Python для анализа данных (Курсовой проект):


Базовые типы данных и циклы
Базовые понятия статистики
Функции и классы
Случайные события. Случайные величины
Продвинутые типы данных: массивы, множества, словари
Логистическая регрессия и дискриминационный анализ
Библиотеки для анализа данных: NumPy, Pandas, Matplotlib
Корреляция и корреляционный анализ
Визуализация в Python
Доверительные интервалы. Статистическая проверка гипотез


Математика для анализа данных (Курсовой проект):


Линейная алгебра. Вектора
Производная функции нескольких аргументов
Линейная алгебра. Матрицы
Теория оптимизации
Продвинутая линейная алгебра
Теория вероятности. Дискретные и непрерывные случайные величины
Математический анализ. Производная
Центральная предельная теорема и закон больших чисел


3 ступень. Машинное обучение, Deep Learning и нейронные сети


Машинное обучение:


Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
Оценка точности модели, переобучение, регуляризация
Классификация: логистическая регрессия и SVM
Проблема качества данных
Функции потерь и оптимизация
Работа с пропусками и переменными


Рекомендательные системы:


Неперсонализированные рекомендательные системы
Collaborative Filtering
Сontent-based-рекомендации
Гибридные алгоритмы


Временные ряды:


Знакомство с временными рядами
Сингулярный спектральный анализ
Элементарные методы анализа временных рядов
Случайные марковские процессы
Модели ARMA
Нейронные сети в анализе временных рядов
Модели авторегрессии условной гетероскедастичности
Поиск изменений во временном ряде


Нейронные сети:


Введение в нейронные сети и библиотеку Keras
Введение в рекуррентные сети
Углубление в нейронные сети и библиотеку Keras
Автокодировщики
Введение в свёрточные нейронные сети
Введение в генеративно-состязательные сети


Компьютерное зрение:


Выделение признаков и поиск похожих изображений
Задачи детекции и сегментации
Сегментация и детекция объектов
Рекуррентные нейронные сети в задачах компьютерного зрения (Image Captioning)
Свёрточные нейронные сети
Порождающие модели
Обучение свёрточной сети на практике


Обработка естественного языка:


Введение в автоматическую обработку текста
Тематическое моделирование
Структура слова. Морфология
Информационный поиск
Синтаксический анализ
Классификация в АОТ
Дистрибутивная семантика
Языковые модели
Извлечение ключевых слов
Извлечение информации
Словари. Подкрепление знаний


Deep Learning (Курсовой проект):


Регрессия и персептрон
Внимание: Dense Attention и Beam search
Многослойная нейронная сеть: регуляризация, градиентный спуск, ускорение обучения
Компьютерное зрение: SSD, Region Based CNN, Faster R-CNN, Masked R-CNN, UNet, перенос стиля и FCN
Свёрточные сети: свёрточные архитектуры, многомерные свертки, сегментация
Работа с текстом: языковые модели, Embeddings, Word2Wec, FastText, NER, Transformer, BERT и Elmo
Рекуррентные сети: RNN, GRU и LSTM, Encoder-Decoder архитектура
GAN'ы: дискриминатор, генератор, продвинутые архитектуры


4 ступень. Soft Skills и управление проектами


Менеджмент data-проектов:


Требования в data-проектах
Разработка отчётов по исследованию
Методология ведения data-проектов
Сохранение результатов эксперимента


Эффективные коммуникации:


Коммуникации: синхронизация картины мира
Эмоциональный интеллект в переговорах
Коммуникации: искусство убеждения и структура аргумента
Тренды в тестировании: за какими ресурсами следить
Эмоциональный интеллект в коммуникациях: этапы развития, распознавание и управление своими и чужими эмоциями
Резюме, сопроводительное письмо, портфолио


Взаимодействие в команде:


Как укрепить свой авторитет и позиции на работе
Налаживание вертикальных и горизонтальных связей в коллективе
Коммуникации на удалёнке и деловая переписка


Публичные выступления:


Как презентовать идею или отчёт
Подготовка презентации к публичному выступлению
Как начать получать удовольствие от выступлений и перестать их бояться


Финальный хакатон и Kaggle Competitions:

В составе мини-команды за ограниченное время и на основе датасетов крупных игроков рынка вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.

Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.



Итоговый проект — реальный кейс от Dodo Brands

В рамках дипломного проекта вы сможете построить ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста и т. д.

Если у вас нет идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний.

Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.





Ваше резюме после обучения













 

limitedonly41

New member
VIP
Регистрация
28.11.2023
Сообщения
1
Оплатил вип. Будьте добры скиньте, курс
 
Прием платежей для сайтов

Партнеры

Верх Низ