Публикации по тегам dimension-reduction

Публикации по теме 'dimension-reduction'

Встраивание t-распределенного стохастического соседа [t-SNE]

Чтобы получить общее представление о снижении размерности, сначала прочтите эту статью: Снижение размерности. Почему t-SNE? : PCA сохраняет общую глобальную дисперсию набора данных. но он не сможет зафиксировать локальную дисперсию набора данных. t-SNE помогает фиксировать локальную дисперсию набора данных. t-SNE — метод нелинейного уменьшения размерности. Чтобы выбрать правильный набор методов для построения моделей, сначала мы должны визуализировать данные, а затем попытаться найти..

Как использовать методы случайной проекции для классификации текста

Методы уменьшения размера для классификации текста Введение Классификация текста — это фундаментальная задача обработки естественного языка (NLP), которая включает в себя категоризацию данного текстового документа в один или несколько предопределенных классов на основе его содержимого. Автоматическая классификация текста имеет решающее значение для различных приложений, таких как анализ настроений, обнаружение спама и моделирование тем. Одной из ключевых проблем при классификации..

Понимание методов уменьшения размера

Интуиция и математика в основе PCA, t-SNE и UMAP « При работе с многомерными данными часто бывает полезно уменьшить размерность, проецируя данные в подпространство более низкого измерения, которое фиксирует «сущность» данных. Это называется уменьшением размерности». При работе с моделями машинного обучения мы используем различные методы машинного обучения, чтобы уменьшить размеры или количество входных переменных в обучающих данных. Проклятие размерности, о чем они всегда..

Использование неотрицательной матричной факторизации для классификации компаний.

Извлечение ценной информации из дополнительных финансовых критериев. Вступление Компании - это сложные образования, которые со временем развиваются. Как специалист по анализу данных, занимающийся инвестициями, я давно задаю себе вопрос об оценке наиболее подходящего измерения для моделирования корпоративных данных: в каком пространстве живут эти вещи? Нет лучшего ответа, чем этот: «Слишком много!». Другая формулировка вопроса - спросить, сколько независимых критериев достаточно..

Вопросы по теме 'dimension-reduction'

Кластеризация двоичных данных Mahout

У меня есть баллы с бинарными функциями: id, feature 1, feature 2, .... 1, 0, 1, 0, 1, ... 2, 1, 1, 0, 1, ... а размер матрицы порядка 20к * 200к, но она скудная. Я использую Mahout для кластеризации данных по алгоритму kmeans и имею...

2298 просмотров

03.11.2022

Найдите соседей за пределами 2d-сетки, которая сводится к 1d-массиву

У меня есть двумерная сетка, где ширина и высота всегда одинаковы. [0][1][2] [3][4][5] [6][7][8] Я уменьшил его источник данных в одномерный массив. [0][1][2][3][4][5][6][7][8] Доступ к элементам работает, но здесь возникает сложная...

656 просмотров

arrays 2d dimension-reduction

20.03.2023