Tagged: классификация

12
Июл
2021

Классификация данных по нескольким условиям. (Python)

Всем привет!
Просьба помочь/ направить в какую сторону думать со следующей задачей: У меня есть исходные данные с геокординатами заказов и суммой заказов, их обычно более 20 тыс строк. Я пытаюсь распределить эти заказы между "Пунктами…

14
Май
2021

Python 3D распознавание лиц, классификатор

Делаю распознавание лиц с помощью 3D камеры, хотел бы узнать как лучше сделать.
Этап 1(готово):

Что имеем на выходе этого алгоритма – массив из 68 точек с координатами x y z.
Расположение точек:

Значения для каждой точки(для моего лица):…

14
Май
2021

Python 3D распознавание лиц, классификатор

Делаю распознавание лиц с помощью 3D камеры, хотел бы узнать как лучше сделать.
Этап 1(готово):

Что имеем на выходе этого алгоритма – массив из 68 точек с координатами x y z.
Расположение точек:

Значения для каждой точки(для моего лица):…

27
Мар
2021

Равномерно разделить строки на подстроки

Есть список строк, состоящий из цифр. Как распределить эти строки на достаточно равномерные классы/кластеры? Класс — это какая-то подстрока от начала строки. Чем "уже" класс, тем больше длина его подстроки.
Объясню на примере:
[…

19
Мар
2021

Как построить график для признаков xgboost?

Есть данные для задачи классификации, использовал xgboost classifier для того, чтобы воспользоваться feature_importance_, чтобы в дальнейшем получить признаки которые сильно влияют на выходные данные (в моей задачи это 0 и 1). Написал след…

05
Янв
2021

Как отобразить результат модели?

Есть обученная модель. Определяет где машина, где велосипед. Решил проверить на тестовых изображениях (их три, они расположены в директории, указанной в test_path).
Код срабатывает, никакой ошибки не выдает, но и результат отсутствует.
tes…

02
Дек
2020

Прогнозирование возможных срабатываний системы (детектирование аномалий)

Подскажите пожалуйста в какую сторону смотреть при решении следующей задачи.
Имеется физическая система, на ложное срабатывание которой теоретически могут влиять физические переключения смежных устройств. В составе есть устройства принимаю…

20
Ноя
2020

Классификация среди большого числа классов, образующих дерево

Как классифицировать текст при большом количестве классов, образующих древовидную структуру? Какое обучение тут подойдёт?
Пример: таксономия для животных, больше 100’000 классов, классы связаны деревом, в качестве текста описание вида или …

19
Ноя
2020

Классифицировать на основе нескольких входных изображений, а не по одному изображению

Необходима такая нейросеть, которая на основе произвольного количества фото выдает прогноз. То есть например по пяти определенным фото прогноз 1, по восьми другим фото прогноз 2. Все аналогично обычному использованию нейронных с той лишь р…

05
Сен
2020

Классификация фраз по схожести и очистка данных

У меня есть спарсенные данные вакансий с hh.ru: (здесь) df.shape – (884, 921)

первый столбец это названии вакансии,
второй и далее столбцы это ключевые навыки указанные работодателем,
и последний столбец это количество дублированных и сое…

23
Июн
2020

Методы классификации в машинном обучении

Существует некая задача классификации: на обучение классификатор получает массив строк в качестве класса и некоторые числа в качестве параметров.
Есть ли такие методы, не используя нейросетей, которые позволяют классифицировать подобные вы…

08
Июн
2020

Как запустить GridSearchCV на основе своей метрики оценки?

Двухклассовая классификация, y- цели, x – признаки, weights – веса.
Собственная метрика – сумма положительных значений весов при совпадении прогноза с реальностью.

Библиотеки:

import numpy as np
import pandas as pd
import talib as ta
im…

07
Июн
2020

Почему такая большая разница в точности при применении критерия Джини и энтропии?

Всем привет.
Продолжаю потихоньку изучать ML и добрался до известного дата-сета ‘Wine’. И упёрся в следующий момент: если я использую энтропию в качестве критерия вместо критерия Джини, то точность падает на 4-10%.
На примере кода

from sk…

03
Май
2020

xgboost.cv как сделать так, чтобы метки попадали в тестовые выборки?

xgboost.cv(params=params, dtrain=dtrain, num_boost_round=1000, nfold=8)

При большом количестве разбиений, например 8, метки перестают попадать в тестовые выборки, насколько я поняла из ошибки:

Check failed: !auc_error AUC: the datase…

29
Апр
2020

Как извлечь файлы с одинаковыми названиями, но из разных архивов, переименовывая

Есть 3 архива: Alex.zip, Toto.zip и Room.zip

В каждом из них одинаковый набор разных по содержанию изображений:

triangle_НОМЕР.png
square_НОМЕР.png
star_НОМЕР.png

Где НОМЕР – цифра от нуля до тысячи.

Проблема в том, что одинаковые по…

22
Мар
2020

Каким алгоритмом можно воспользоваться чтобы категоризировать назывние переменных к сущствующм ID?

Имеется набор данных о именах переменных и их ID. Стоит задача с помощью машинного обучения натренировать алгоритм категоризовывать новое имя переменной так, чтобы:
1) новому имени переменной присваивался ID той групы переменных, но котору…

22
Мар
2020

Каким алгоритмом можно воспользоваться чтобы категоризировать назывние переменных к сущствующм ID?

Имеется набор данных о именах переменных и их ID. Стоит задача с помощью машинного обучения натренировать алгоритм категоризовывать новое имя переменной так, чтобы:
1) новому имени переменной присваивался ID той групы переменных, но котору…

13
Фев
2020

Как решить проблему UndefinedMetricWarning при использовании GridSearchCV?

Для выбора лучших параметров модели использую GridSearchCV. Лучшие параметры модели хочу выбрать по метрике f1. Так же в процессе обучения хочу отслеживать метрики precision и recall.

Для этого делаю:

from sklearn.metrics import accura…

15
Фев
2018

Классификация предложений с помощью gensim(word2vec)

Как разбить модель word2vec на кластеры методом kmeans(k средних)? Оптимален ли kmeans для классификации предложений на 10-100, не заданных заранее, классов? Как выбрать оптимальное число кластеров при разбиении с помощью kmeans? Может ес…