- 20.06.2022
- 27 974
- 234
- 36
- Награды
- 10
- Пол
- Муж.
Репутация:
- Автор темы
- Администратор
- Модератор
- Команда форума
- #1
![[Алексей Кожакин] [Stepik] Машинное обучение - Модуль 1 (Анализ данных) (2024).png [Алексей Кожакин] [Stepik] Машинное обучение - Модуль 1 (Анализ данных) (2024).png](https://wlux.net/data/attachments/38/38074-af7443a3112277a7c8ccfb5d59027917.jpg)
Данный курс является первым модулем из серии моих курсов по машинному обучению (ML). В этом курсе в качестве задачи будет рассматриваться прогнозирование в футбольной аналитике. Мы сосредоточимся на сборе данных, которые будут использоваться для прогнозирования в следующих модулях. Помимо сбора данных, мы также применим некоторые техники предобработки данных.
Программа курса
1. Введение
О курсе
Среда разработки
2. Сбор данных с использованием парсинга
Выбор источника данных
Выбор метода парсинга
Определение целевых данных
Разработка скрипта парсинга
Библиотека прасинга датасета
3. Обзор данных
Обзор датасета
Библиотеки для анализа данных
4. Очистка данных
Важность и цель очистки данных.
Устранение дубликатов
Методы заполнения пропущенных данных.
Целевая переменная
Входные параметры
5. Валидация данных
Проверка качества данных после очистки и обработки
Проверка точност на моделях
Анализ важности признаков
6. Кластерный анализ
Понижение размерности
Кластерный анализ
Добавление новых параметров
Оценка качества модели после применения кластеризации
7. Нормализация и стандартизация данных
Приведение данных к единообразному формату.
Преобразование категориальных признаков.
Оценка качества модели после нормализации модели
8. Балансировка данных
Статистический анализ
Балансировка данных
Автор: Алексей Кожакин
Мне очень нравится помогать ученикам, изучающим Python, разбираться в сложных моментах и показывать наилучший путь изучения программирования, чтобы они могли стать успешными разработчиками.
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.
Последние темы в этом разделе:
- [Максим Иванов] [Stepik] Основы написания bash-скриптов (2025)
- [Адиль Кудьяров, Константин Соболевский, Вера Жарова] [klerk] Аналитик 1C (2025)
- [Udemy] Освоение продвинутого Scrum - реальные сценарии и решения (2024)
- [Валерий Никаноров] [stepik] Нейронные сети: Основы глубокого обучения с нуля (2025)
- [Елена Кантонистова] [stepik] Временные ряды для прогноза криптовалют (2025)
- [Матвей Чудневцев, Михаил Новичихин] [Stepik] Docker простым языком (2025)
- [Udemy] [Bogdan Stashchuk] VS Code - Курс по Редактору Кода Visual Studio Code (2025)
- [Таня Румянцева] [Neirocoder] Готовые схемы автоматизации n8n.io и make.com (2025)
- [Udemy] [Андрей Кудлай] СУБД MySQL и язык запросов SQL. Теория и практика (2023)
- [Андрей Кобец] [kobezzza] IndexedDB в действии. Тариф Расширенный (2025)