Курс "Программирование на Python, часть 4. Pandas для Data Science. Высокопроизводительная обработка и анализ данных в Pandas."

Код: EDU-Python-18
Специализация: Авторские курсы: Свободное ПО/Open Source

Продолжительность - 5 дней

Расписание:
18 ноября 2024 года (Москва)        
23 декабря 2024 года (Москва)        

Стоимость:  49 500 руб.  

Pandas - популярная библиотека Python, применяющаяся для практического анализа данных в реальных проектах. Она предлагает воспользоваться эффективными, быстрыми и высокопроизводительными структурами данных, которые упрощают предварительную обработку и анализ информации.На курсе слушатели рассмотрят работу с данными в библиотеке Pandas и изучат внушительный набор инструментов, предлагаемых библиотекой Pandas для выполнения различных операций с данными и их анализа.

Прослушав данный курс, Вы научитесь:

  • Представлять одномерные данные с помощью объекта Series
  • Представлять табличные и многомерные данные с помощью объекта DataFrame
  • Выполнять операции над объектом DataFrame и его содержимым
  • Работать с индексами
  • Создавать и использовать категориальные данные
  • Применять численные методы к объектам библиотеки Pandas
  • Загружать и читать данные в различных форматах
  • Объединять, связывать и изменять формы данных
  • Агрегировать данные
  • Проводить анализ временных рядов с помощью Pandas
  • Создавать графики временных рядов

Узнаете:

  • Как создать объект Series и провести его модификацию
  • Как создать объект DataFrame
  • Как выполнить операции над объектом DataFrame
  • Какие есть типы индексов в библиотеке Pandas
  • Как вычислить описательные статистики для категориальной переменной
  • Как выполнить статистические операции с объектами библиотеки Pandas
  • Как читать и записывать в базу данных SQL
  • Как применить агрегирующие функции преобразований и фильтров
  • Как применить к временному ряду операции на основе скользящего окна
  • Как разместить несколько графиков на одном рисунке
Аудитория: начинающие специалисты в области программирования, рассматривающие предмет как ступень к изучению Data Science.

Предварительная подготовка: Уверенное знание основ языка Python или прохождение курсов «Программирование на Python, часть 1» и «Программирование на Python, часть 2».

Курсы, рекомендуемые для предварительного прохождения:

  • Программирование на Python, часть 1
  • Программирование на Python, часть 2
  • Программирование на Python, часть 3. Numpy для Data Science

Курсы, рекомендуемые для последующего прохождения:

  • Основы Data Science и Big Data, часть 1
  • Математика для Data Science, часть 1. Теория вероятностей и статистика

Программа курса

1 Установка и использование библиотеки Pandas

2 Основные объекты библиотеки Pandas

2.1 Объект Series библиотеки Pandas

2.2 Объект DataFrame библиотеки Pandas

2.3 Объект Index библиотеки Pandas

3 Индексация и выборка данных

3.1 Выборка данных из объекта Series

3.2 Выборка данных из объекта DataFrame

4 Операции над данными в библиотеке Pandas

4.1 Универсальные функции: сохранение индекса

4.2 Универсальные функции: выравнивание индексов

4.3 Универсальные функции: выполнение операции между объектами DataFrame и Series

5 Обработка отсутствующих данных

5.1 Компромиссы при обозначении отсутствующих данных

5.2 Отсутствующие данные в библиотеке Pandas !

5.3 Операции над пустыми значениями

6 Иерархическая индексация

6.1 Мультииндексированный объект Series

6.2 Методы создания мультииндексов

6.3 Индексация и срезы по мультииндексу

6.4 Перегруппировка мультииндексов

6.5 Агрегирование по мультииндексам

7 Объединение наборов данных: конкатенация и добавление в конец

7.1 Напоминание: конкатенация массивов NumPy

7.2 Простая конкатенация с помощью метода pd.concat

8 Объединение наборов данных: слияние и соединение

8.1 Реляционная алгебра

8.2 Виды соединений

8.3 Задание ключа слияния

8.4 Задание операций над множествами для соединений

8.5 Пересекающиеся названия столбцов: ключевое слово suffixes

9 Агрегирование и группировка

9.1 Данные о планетах

9.2 Простое агрегирование в библиотеке Pandas

9.3 GroupBy: разбиение, применение, объединение

10 Сводные таблицы

10.1 Данные для примеров работы со сводными таблицами

10.2 Сводные таблицы «вручную»

10.3 Синтаксис сводных таблиц

11 Векторизованные операции над строками

11.1 Знакомство со строковыми операциями библиотеки Pandas

11.2 Таблицы методов работы со строками библиотеки Pandas

12 Работа с временными рядами

12.1 Дата и время в языке Python

12.2 Временные ряды библиотеки Pandas: индексация по времени

12.3 Структуры данных для временных рядов библиотеки Pandas

12.4 Периодичность и смещения дат

12.5 Где найти дополнительную информацию

13 Увеличение производительности библиотеки Pandas: eval() и query()

13.1 Основания для использования функций query() и eval():

13.2 составные выражения

13.3 Использование функции pandas.eval() для эффективных операций.

13.4 Использование метода DataFrame.eval() для выполнения операций по столбцам

13.5 Метод DataFrame.query()

13.6 Производительность: когда следует использовать эти функции.

14 Загрузка данных

14.1 Работа с CSV-файлами и текстовыми/табличными данными.

14.2 Чтение и запись данных в формате Excel.

14.3 Чтение и запись JSON-файлов.

14.4 Чтение HTML-файлов из Интернета.

14.5 Чтение и запись HDF5-файлов.

14.6 Загрузка CSV-файлов из Интернета.

14.7 Чтение из базы данных SQL, и запись в базу данных SQL.

14.8 Загрузка данных с удаленных сервисов

В конце обучения на курсе проводится итоговая аттестация в виде теста или на основании оценок за практические работы, выполненных в процессе обучения.


Свободно распространяемое программное обеспечение популярно как среди частных лиц, так и среди организаций. Действительно, СПО позволяет серьезно экономить на приобретении лицензий для компаний, которые многократно тиражируют программное решение. Также благодаря тому, что СПО можно квалифицированно дорабатывать собственными силами под конкретные нужды организации, оно приобретает еще и дополнительную гибкость и удобство в использовании.

Открытое программное обеспечение — это программное обеспечение с открытым исходным кодом. Исходный код создаваемых программ открыт, то есть доступен для просмотра и изменения. Это позволяет использовать уже созданный код для создания новых версий программ, для исправления ошибок и, возможно, помочь в доработке открытой программы.

В конце обучения на курсах проводится итоговая аттестация в виде теста или на основании оценок за практические работы, выполненные в процессе обучения.

Учебный центр "Интерфейс" оказывает консалтинговые услуги по построению моделей бизнес-процессов, проектированию информационных систем, разработке структуры баз данных и т.д.

  • Нужна помощь в поиске курса?
    Наша цель заключается в обеспечении подготовки специалистов, когда и где им это необходимо. Возможна корректировка программ курсов по желанию заказчиков! Мы расскажем Вам о том, что интересует именно Вас, а не только о том, что жестко зафиксировано в программе курса. Если вам нужен курс, который вы не видите на графике или у нас на сайте, или если Вы хотите пройти курс в другое время и в другом месте, пожалуйста, сообщите нам, по адресу mail@interface.ru или shopadmin@itshop.ru
  • Поговорите со своим личным тренинг-менеджером!
    Мы предоставляет Вам индивидуальное обслуживание. Если у вас есть потребность обсудить, все вопросы касательно обучения, свяжитесь, пожалуйста c нами по телефонам: +7 (495) 925-0049, + 7 (495) 229-0436. Или любым другим удобным для Вас средствами связи, которые Вы можете найти на сайтах www.interface.ru или www.itshop.ru

Страница сайта http://185.71.96.61
Оригинал находится по адресу http://185.71.96.61/iservices/training.asp?iId=413450