Курс "Программирование на Python, часть 4. Pandas для Data Science. Высокопроизводительная обработка и анализ данных в Pandas."Код: EDU-Python-18
Продолжительность - 5 дней
Pandas - популярная библиотека Python, применяющаяся для практического анализа данных в реальных проектах. Она предлагает воспользоваться эффективными, быстрыми и высокопроизводительными структурами данных, которые упрощают предварительную обработку и анализ информации.На курсе слушатели рассмотрят работу с данными в библиотеке Pandas и изучат внушительный набор инструментов, предлагаемых библиотекой Pandas для выполнения различных операций с данными и их анализа. Прослушав данный курс, Вы научитесь:
Предварительная подготовка: Уверенное знание основ языка Python или прохождение курсов «Программирование на Python, часть 1» и «Программирование на Python, часть 2». Курсы, рекомендуемые для предварительного прохождения:
Курсы, рекомендуемые для последующего прохождения:
Программа курса1 Установка и использование библиотеки Pandas 2 Основные объекты библиотеки Pandas 2.1 Объект Series библиотеки Pandas 2.2 Объект DataFrame библиотеки Pandas 2.3 Объект Index библиотеки Pandas 3 Индексация и выборка данных 3.1 Выборка данных из объекта Series 3.2 Выборка данных из объекта DataFrame 4 Операции над данными в библиотеке Pandas 4.1 Универсальные функции: сохранение индекса 4.2 Универсальные функции: выравнивание индексов 4.3 Универсальные функции: выполнение операции между объектами DataFrame и Series 5 Обработка отсутствующих данных 5.1 Компромиссы при обозначении отсутствующих данных 5.2 Отсутствующие данные в библиотеке Pandas ! 5.3 Операции над пустыми значениями 6 Иерархическая индексация 6.1 Мультииндексированный объект Series 6.2 Методы создания мультииндексов 6.3 Индексация и срезы по мультииндексу 6.4 Перегруппировка мультииндексов 6.5 Агрегирование по мультииндексам 7 Объединение наборов данных: конкатенация и добавление в конец 7.1 Напоминание: конкатенация массивов NumPy 7.2 Простая конкатенация с помощью метода pd.concat 8 Объединение наборов данных: слияние и соединение 8.1 Реляционная алгебра 8.2 Виды соединений 8.3 Задание ключа слияния 8.4 Задание операций над множествами для соединений 8.5 Пересекающиеся названия столбцов: ключевое слово suffixes 9 Агрегирование и группировка 9.1 Данные о планетах 9.2 Простое агрегирование в библиотеке Pandas 9.3 GroupBy: разбиение, применение, объединение 10 Сводные таблицы 10.1 Данные для примеров работы со сводными таблицами 10.2 Сводные таблицы «вручную» 10.3 Синтаксис сводных таблиц 11 Векторизованные операции над строками 11.1 Знакомство со строковыми операциями библиотеки Pandas 11.2 Таблицы методов работы со строками библиотеки Pandas 12 Работа с временными рядами 12.1 Дата и время в языке Python 12.2 Временные ряды библиотеки Pandas: индексация по времени 12.3 Структуры данных для временных рядов библиотеки Pandas 12.4 Периодичность и смещения дат 12.5 Где найти дополнительную информацию 13 Увеличение производительности библиотеки Pandas: eval() и query() 13.1 Основания для использования функций query() и eval(): 13.2 составные выражения 13.3 Использование функции pandas.eval() для эффективных операций. 13.4 Использование метода DataFrame.eval() для выполнения операций по столбцам 13.5 Метод DataFrame.query() 13.6 Производительность: когда следует использовать эти функции. 14 Загрузка данных 14.1 Работа с CSV-файлами и текстовыми/табличными данными. 14.2 Чтение и запись данных в формате Excel. 14.3 Чтение и запись JSON-файлов. 14.4 Чтение HTML-файлов из Интернета. 14.5 Чтение и запись HDF5-файлов. 14.6 Загрузка CSV-файлов из Интернета. 14.7 Чтение из базы данных SQL, и запись в базу данных SQL. 14.8 Загрузка данных с удаленных сервисов В конце обучения на курсе проводится итоговая аттестация в виде теста или на основании оценок за практические работы, выполненных в процессе обучения.
Свободно распространяемое программное обеспечение популярно как среди частных лиц, так и среди организаций. Действительно, СПО позволяет серьезно экономить на приобретении лицензий для компаний, которые многократно тиражируют программное решение. Также благодаря тому, что СПО можно квалифицированно дорабатывать собственными силами под конкретные нужды организации, оно приобретает еще и дополнительную гибкость и удобство в использовании. Открытое программное обеспечение — это программное обеспечение с открытым исходным кодом. Исходный код создаваемых программ открыт, то есть доступен для просмотра и изменения. Это позволяет использовать уже созданный код для создания новых версий программ, для исправления ошибок и, возможно, помочь в доработке открытой программы. В конце обучения на курсах проводится итоговая аттестация в виде теста или на основании оценок за практические работы, выполненные в процессе обучения. Учебный центр "Интерфейс" оказывает консалтинговые услуги по построению моделей бизнес-процессов, проектированию информационных систем, разработке структуры баз данных и т.д.
|