Tagged: Анализ данных

15
Июн
2021

Курс «Python и инструменты машинного обучения»

Обучение работе с аналитическими инструментами в Python от Московского физико-технического института. 2 месяца практических онлайн-вебинаров и сертификат о повышении квалификации в финале.
— Читать дальше «Курс «Python и инструменты машинного обучения»…

10
Июн
2021

Конференция SECON 2021

В программе конференции доклады от экспертов, общение с коллегами, новые знакомства, выставка и развлечения в атмосфере летнего фестиваля.
— Читать дальше «Конференция SECON 2021»

04
Июн
2021

Интенсив «3 дня машинного обучения: Python, нейросети и биткоин»

Вы создадите свою первую модель машинного обучения и поймёте, как нейросети решают задачи бизнеса.
— Читать дальше «Интенсив «3 дня машинного обучения: Python, нейросети и биткоин»»

31
Май
2021

Стратифицированная выборка с заданным объемом и разбиением на test/control

Python, Jupyter notebook
Имеется таблица вида:
df = pd.DataFrame({‘id’: [‘1′,’2′,’3′,’4′,’5′,’6′,’7′,’8′,’9′,’10’,’11’,’12’,’13’,’14’,’15’,’16’,’17’,’18’,’19’,’20’],
‘segment’:[‘1′,’1′,’1′,’1′,’1′,’1′,’2′,’2′,’2’,’2…

31
Май
2021

Стратифицированная выборка с заданным объемом и разбиением на test/control

Python, Jupyter notebook
Имеется таблица вида:
df = pd.DataFrame({‘id’: [‘1′,’2′,’3′,’4′,’5′,’6′,’7′,’8′,’9′,’10’,’11’,’12’,’13’,’14’,’15’,’16’,’17’,’18’,’19’,’20’],
‘segment’:[‘1′,’1′,’1′,’1′,’1′,’1′,’2′,’2′,’2’,’2…

29
Май
2021

Модель прогнозирования потока поступающих. Временной ряд

Имеется такой набор данных

School- Номер школы;
ALL – Кол-во выпускников;
e(год) – количество
пришедших для поступления из этой школы

Необходимо обучить модель что бы она предсказывала сколько в 2021 году будет поступающих по каждой шко…

14
Май
2021

Как указать несколько условий внутри loc?

Имеется фрейм данных:
data= {‘фрукт’: [‘груша’,’огурец’,’вишня’, ‘абрикос’, ‘груша’,’арбуз’,’груша’,’банан’, ‘груша’, ‘вишня’,’яблоко’, ‘дыня’, ‘вишня’,’банан’, ‘киви’, ‘гуава’, ‘банан’],
‘страна’: [‘франция’,’россия’, ‘сша’,’россия’, …

11
Май
2021

отобрать группы строк по условию

Имеется фрейм данных
import pandas as pd
import numpy as np
data = {‘фрукт’: [‘груша’,’огурец’,’вишня’, ‘абрикос’, ‘груша’,’арбуз’,’груша’,’банан’, ‘груша’, ‘вишня’,’яблоко’, ‘груша’, ‘вишня’, ‘абрикос’, ‘груша’, ‘банан’],
‘страна’: [‘фран…

11
Май
2021

Как получить набор уникальных индексов из индексов двух фреймов?

Есть df1 и df2. У df1 индексы 1,2,3,4,5,6,7, у df2 – индексы 1,2,3,8.
Как из двух наборов индексов получить один, который включает в себя как индексы первого датафрейма, так и второго без дубликатов? Т.е., df0 с индексами 1,2,3,4,5,6,7,8?

07
Май
2021

Интенсив «Профессия Data Scientist: учимся обработке и анализу данных за 3 дня»

Попробуете себя в роли Data Scientist: с нуля подготовите данные, построите модель и научитесь анализу и визуализации с помощью Python.
— Читать дальше «Интенсив «Профессия Data Scientist: учимся обработке и анализу данных за 3 дня»»

05
Май
2021

Хакатон «Умные города, промышленность, ТЭК»

За 48 часов командам предстоит решить задачи по предиктивной аналитике, AI, AR, VR, робототехнике и сенсорике.
— Читать дальше «Хакатон «Умные города, промышленность, ТЭК»»

23
Апр
2021

pandas замена значений в столбце по условию

Имеем фрейм данных
import pandas as pd
import numpy as np
data = {‘фрукт’: [‘груша’,’огурец’,’вишня’, ‘абрикос’, ‘груша’,’арбуз’,’груша’,’банан’, ‘груша’, ‘вишня’,’яблоко’, ‘груша’, ‘вишня’, ‘абрикос’, ‘груша’, ‘банан’],
‘страна’: [‘россия…

21
Апр
2021

Как сортировать элементы списка по нескольким аттрибутам последовательно?

Есть список, который нужно отсортировать. Сперва по new_name, потом по nf, потом по no. Основная сложность это колонка no и nf. Я не могу привести их к типу int, поэтому приходится использовать натуральную сортировку. Как соединить оба зап…

21
Апр
2021

Как сортировать элементы списка по нескольким аттрибутам последовательно?

Есть список, который нужно отсортировать. Сперва по new_name, потом по nf, потом по no. Основная сложность это колонка no и nf. Я не могу привести их к типу int, поэтому приходится использовать натуральную сортировку. Как соединить оба зап…

19
Апр
2021

Обрезать dataframe по дате

Как обрезать data[‘Date’] чтобы датафрейм шел после 1959-07-28 ? data = data.loc[‘1959-07-27’:] не помогает.
Date
1959-07-21
1959-07-22
1959-07-23
1959-07-24
1959-07-27
1959-07-28
1959-07-29
1959-07-30
1959-07-31

17
Апр
2021

Площадь под графиком функции

Как можно посчитать площадь под графиком функций (2 функции в примере), для интервалов, когда функция больше 0 ?
from matplotlib import pyplot as plt
import numpy as np

x = np.linspace(0, 12, 100)
y = np.sin(x)*np.exp(-x/4)

plt.plot(x, y…

04
Апр
2021

Поиск ключей в файле 6ГБ на python

Есть файл с ключами. Структура файла такова:
ключ 1/n
ключ 2/n
ключ 3/n

ключ m

Я могу его прочитать в DataFrame. И мне надо потом проверять наличие ключей в этом фрейме.
Например, есть ли ключ q в это фрейме. Пробовал несколько вариан…

04
Апр
2021

Прогнозирование данных с помощью регрессии

Можно ли построить такую красную линию и продолжить её предсказание до определённой даты? Данные были взяты из https://github.com/owid/covid-19-data/tree/master/public/data (owid-covid-data.csv). Прошу не кидаться в меня камнями, если это …

01
Апр
2021

Как посчитать процентное соотношение для каждого объекта?

У меня есть огромный дата сет на миллион строк, в котором есть название товара (product_id) и номера заказов (order_id), в которых эти товары приобретаются. Также у меня есть столбец (reordered), который отвечает за то, перезаказывается ли…