Введение

Порог вхождения

Для прохождения курса понадобятся базовые знания Python и SQL. Не нужен большой опыт: достаточно понимать самые простые вещи и уметь запускать код.

Что нужно знать на старте (минимум)

Python - минимальный набор для начала

Тема / КонструкцияПочему это критично для DE-новичка
1Переменные, типы данных (int, float, str, bool)Всё остальное строится на этом
2Списки, словари, кортежи, множества90 % данных в пайплайнах - это именно эти структуры
3Циклы for / while, if-elif-elseОсновной способ обработки строк в цикле
4Функции: def, аргументы, return, *args/**kwargsПочти весь код DE - это функции
5Работа с файлами: open(), with, read/writeЧтение csv/json/parquet - ежедневная задача
6Модули и импорт: import pandasБез этого ничего не запустишь
7Обработка исключений: try-exceptПайплайны падают постоянно - нужно уметь ловить ошибки
8Основы pandas: read_csv, head, info, loc/iloc, groupby, merge70-80 % первой работы junior DE - это именно pandas
9Базовый requests + jsonРабота с API - очень частая задача
10Виртуальные окружения (venv) + pip installБез этого не пройдёшь собеседование и не сможешь работать

SQL - минимальный набор для начала

КонструкцияПочему это обязательно
1SELECT, FROM, WHERE, ORDER BY, LIMITБаза базы
2DISTINCT, COUNT, SUM, AVG, MIN, MAXПростейшая аналитика
3GROUP BY + HAVINGАгрегация - 60 % типичных задач junior DE
4INNER JOIN, LEFT JOIN, RIGHT JOINСоединение таблиц - ежедневно
5Фильтрация по датам (BETWEEN, >=, <)Даты - везде в данных
6LIKE, ILIKE, IN, NOT IN, IS NULLПоиск и очистка данных
7CASE WHEN ... THEN ... ELSE ... ENDПростые бизнес-правила
8Подзапросы в WHERE и FROM (subquery)Очень часто встречаются на собеседованиях и в работе
9CTE (WITH ... AS ...)Делает сложные запросы читаемыми - любят все
10UNION / UNION ALLОбъединение наборов данных

Этого достаточно, чтобы начать курс. Все остальное будете осваивать по ходу.

Где быстро подтянуть базу

💡

Помните, что на этих курсах (по SQL и Python) не нужно проходить всё, достаточно освоить базовые конструкции из таблиц выше. Не нужно углубляться в сложные темы, которые там есть - это не нужно для начала. Иначе вы рискуете потратить много времени на изучение всего подряд, вместо того чтобы начать практиковаться с реальными данными и задачами, что гораздо эффективнее для обучения.