Category: Статистика

07
Сен
2022

Подбор параметров для логистической регрессии

Подскажите, пожалуйста, как для доработать код ниже, чтобы для логистической регрессии подобрать два любых гиперпараметра в цикле?
model = LogisticRegression(random_state=12345, solver=’liblinear’, class_weight=’balanced’)
scores = cross_v…

25
Авг
2022

Как хранить статистические данные

Появилась проблема хранения статистических данных. Есть допустим касса интернет магазина, она меняется каждый день по много раз. И вот возникает вопрос, как хранить данные, чтобы можно было узнать размер кассы за определенный период времен…

08
Май
2022

Как у всех столбцов в DF Pandas увидеть значения min/max не являющихся выбросами

Есть набор DF. Подскажите, пожалуйста, как можно увидеть у всех столбцов минимальное и максимальное значение не являющиеся выбросами (обведены на скрине)? При вызове метода df.describe() эти данные не вижу.

14
Апр
2022

Высокий уровень статистической значимости на идентичных выборках

Я занимаюсь небольшим проектом для своего портфолио. При пересборке блокнота вылезла неожиданная проблема – статистические тесты дают очень низкий уровень p-value на практически идентичных (по моему мнению) выборках. На прошлой сборке он б…

04
Мар
2022

Задача пустых полок [закрыт]

Событие либо наступит либо нет и все это происходит во времени.
Допустим у нас есть продуктовые магазины
В каждом из них одинаковые товары
Какие способы есть чтобы определить пустая полка или нет?
Нужно определить допустим: достаточно ли 4…

01
Фев
2022

Сбор статистики[не DataScience]

Мне в моей программе, а именно в боте Telegram нужно собирать статистику разных данных. Допустим пользователь нажал на кнопку определенную и это нужно сохранить как действие. И вот есть моменты в которых нужно узнать: сколько раз в месяц,д…

28
Дек
2021

Самые интересные факты из веб-альманаха 2021

Интересные факты из ежегодного веб-альманаха. Узнайте, какая JS-библиотека самая популярная и сколько весит перегруженная CSS страница.
— Читать дальше «Самые интересные факты из веб-альманаха 2021»

19
Дек
2021

статистика телеграм бота на python

Помогите пожалуйста с решением проблемы. Пытаюсь сделать статистику телеграм-бота, счетчик пользователей реализовал, добавив в команду старт следующий код (занесение user_id в текстовый файл):
file = open(‘stat.txt’, ‘r+’)
database_id = fi…

13
Дек
2021

Как понять какое кол-во элементов нужно взять, чтобы получить 9000 рядов из 6 знаков (типа [1, 1, 1, 1, 1, 1]), чтобы отличались минимум на 4 знака?

Задача:
Нужно получить 9000 рядов шириной 6 элементов, которые отличаются друг от друга минимум на 4 элемента.
Например: есть массив из размещений с повторениями трех элементов (0, 1 и 2)
Из них получается 3^6 = 729 рядов отличающихся на 1…

28
Авг
2021

Как изменить оси (X, Y) на графике в модуле matplotlib python?

Иммется код, который генерирует график. Это соотношения ТОП1-10, и количество просмотров за которым они и сортировались в этот ТОП.
Какие данные на входе:
(Значения Y оси идут реверсно(с меньшего до большего, потому-что доставал их через ….

29
Июл
2021

Как нормализовать гистограмму pyplot?

Х​очу построить гистограмму распределения среднего выборки для экспоненциального распределения через pyplot hist.
Параметр density выставил на True. Согласно документации, именно он должен нормализовать гистограмму к 1. Однако, результат м…

21
Июл
2021

JetBrains выпустила исследование про разработчиков C++. Оказалось, треть из них не пишет юнит-тесты

JetBrains выложила результаты исследования по каждому популярному языку программирования. Вот, что выяснилось про программистов на C++.
— Читать дальше «JetBrains выпустила исследование про разработчиков C++. Оказалось, треть из них не пишет юнит-тесты…

29
Май
2021

Доверительный интервалы в python

Подскажите, почему в функции используется (1 + confidence) / 2. ? Можете привести формулу?
И как отличается данная функция для одно и двухсторонней гипотезы?
import numpy as np
import scipy.stats

def mean_confidence_interval(data, confid…

19
Май
2021

Доверительные интервалы для параметров регрессионной модели в Python

Есть 2 выборки X,Y, необходимо построить модель Y=aX+b+eps. Нужно для параметров a,b найти доверительные интервалы.
Я написал поиск интервалов самостоятельно, основываясь на соответствующих формулах из учениках.
(teta- матрица параметров, …

10
Мар
2021

Факультет игровой аналитики

Научитесь создавать игры, используя знания маркетинга, гейм-дизайна и статистики. Курс подойдёт начинающим аналитикам, гейм-дизайнерам и даже простым геймерам, которые хотят превратить хобби в работу мечты.
— Читать дальше «Факультет игровой аналитики»…

07
Фев
2021

Группировка (статистика) по Стерджессу

введите сюда описание ссылки
Всем привет… Выше ссылка с исходными данными. Хочу сделать группировку Стерджесса на python… никто не знает где можно про это почитать …. так и не поняла как сделать группировку data frame по определённом…

11
Янв
2021

Не вызывается функция на С

Реализую код, который генерирует одномерный массив случайных чисел, считает среднее арифметическое массива, а потом находит отклонения, возводит их в квадрат и суммирует. Часть кода я реализую через отдельную функцию (так надо). Сама пробл…

29
Дек
2020

Как узнать сколько было показов/переходов по картинке на сайте?

Коллеги приветствую. В разработке сервис с иллюстрациями . Задача собрать статистику для дальнейшей работы.
Необходимо узнать сколько было показов иллюстрации и сколько было переходов на страницу с иллюстрацией.
Не понимаю с какой стороны …

03
Дек
2020

GitHub назвал самый популярный язык программирования в 2020 году

Крупнейший сервис для хостинга IT-проектов подвёл собственные итоги года. Компания рассказала не только о своих собственных достижениях, но и поделилась более общей интересной статистикой.
— Читать дальше «GitHub назвал самый популярный язык программир…

16
Окт
2020

Каким образом разбивать на группы в случае распределения «с длинным хвостом»?

У меня есть данные по активности пользователей. Активность имеет распределение «с длинным хвостом», то есть большинство пользователей совершили одно – два действия, и один – два участника совершили несколько сотен действий. Гистограмма акт…

09
Окт
2020

Как правильно записать различные строки данных в одно поле?

На веб-сайте планируется сделать отслеживание входящего трафика. То есть PHP скрипт должен принимать GET параметры входящего трафика и записывать в БД. К примеру ссылка
https://example.com/?utm_source=youtube&utm_medium=video&utm_c…

22
Авг
2020

Permutation test (Пермутационный тест aka рандомизация aka точный тест). Условия применения?

Мой вопрос в большей степени вызван отсутствием русскоязычных источников.. 🙁
Недавно столкнулся с одним методом симуляции статистической гипотезы как пермутационное тестирование (также называется рандомизацией и точным тестом). В контекст…

22
Июн
2020

Как добавить нормальный закон распределения в координаты точки принадлежащей заданным значениям массива

Имеется круг (синий) , описанный сферическими координатами (x1=rcos(theta),x2=rsin(theta)) с координатам центра (0;0) и радиусом R. На некоторой точке круга (координаты X1[n],X2[n]) имеется точка B (красный круг) с координатам центра соотв…

17
Май
2020

Эксцесса не равна нулю при расчёте с помощи функции kurtosis

Было построено нормальное распределение через norm.pdf(). Эксцесса рассчитывалась (для полученного нормального распределения) при помощи функции kurtosis() (импортирована из scipy.stats).

Для любого нормального распределения эксцесса – н…

06
Апр
2020

Работа со строками, обработка статистических данных

Моя задача выглядит следующим образом:

Даны результаты забегов в формате “h|m|s, h|m|s, h|m|s” (h – часы, m – минуты, s – секунды).
Написать функцию stat, которая возвращает строку в формате:
“Range: hh|mm|ss Average: hh|mm|ss”