Публикации по теме 'word-embeddings'


Предсказание тренда фондового рынка с помощью заголовков новостей  — Часть 2 — найдите лучшую базовую модель
Эта статья является второй частью серии Предсказание тренда фондового рынка с помощью заголовков новостей . Другие статьи из этой серии вы найдете здесь: часть 1, часть 2, часть 4. В предыдущей статье мы подготовили данные для моделирования. В этой статье мы рассмотрим комбинацию различных методов встраивания слов и моделей классификации, чтобы найти наиболее эффективную базовую модель. Если вы хотите воспроизвести этот проект, вы можете найти все блокноты Jupyter и файлы..

Встраивание слов: методы их создания, использование на финансовых рынках и эксперименты в твиттере
В большом текстовом корпусе связанные слова (синонимы и т. Д.) Имеют хороший шанс встретиться с похожим набором слов, например - Правила 1 «короля» и правила «королевы». Здесь король и королева, хотя и не могут быть заменены напрямую, похоже, имеют отношение, а именно, оба относятся к правителю. Эта гипотеза о тексте, созданном человеком, называется гипотезой распределения . Возникает вопрос: как вы представите эту взаимосвязь и семантическое сходство в числовом виде? Enter, вложение..

Улучшение поиска информации за счет семантического сопоставления и соответствия релевантности
Введение Данные - это золото 21 века. Мы каждый день создаем квинтиллионы байтов данных. Информация - это обработанная и уточненная форма данных, имеющая логический смысл. Ищем ли мы в поисковых системах, ищем продукт на веб-сайтах электронной коммерции, любой другой поиск статей, продуктов, людей и т. Д., IR (поиск информации) присутствует повсюду и стал неотъемлемой частью нашей повседневной жизни. Понимание поиска информации Информационный поиск в области информатики..

Изучение вложения слов
Мы узнали здесь об основах встраивания слов и о том, как они могут помочь в различных приложениях НЛП. Давайте разберемся здесь, как мы можем выучить встраивание слов. Когда мы реализуем алгоритм для изучения встраивания слов, в конечном итоге мы узнаем матрицу встраивания. Допустим, мы используем словарь из 10 000 слов. Что мы собираемся сделать, так это изучить матрицу встраивания E, которая будет размерной матрицей 300 на 10 000, а столбцы этой матрицы будут различными..

Выравнивание временных вложений слов с помощью компаса
Вступление Вложения слов теперь используются повсюду для определения значения слов и изучения языка. Общая теория, лежащая в основе внедрения слов, - это распределительная семантика, которая примерно утверждает, что « похожие слова появляются в подобных контекстах ». На входе набор текстовых документов, вложения слов генерируют векторные представления слов. По сути, алгоритмы встраивания слов помещают слова, которые появляются в аналогичных контекстах, в близкие позиции в векторном..

Разговорный ИИ требует смысла, а не ключевых слов: часть 1
Как когнитивист, работающий над разговорным ИИ на человеческом уровне, я часто спрашиваю людей, почему они используют части речи в своей модели языка. Я имею в виду, что он дублирует определения, является частью концепции синтаксического анализа, которая никогда не была точно реализована ни для одного человеческого языка, и исключает смысл. Но вместо модели, основанной на значениях, учеников без устали преподают. Точно так же я спрашиваю людей, почему они используют встраивание слов в..

Основы использования предварительно обученных векторов GloVe в Python
Скачивание, загрузка и использование предварительно обученных векторов GloVe Содержание В этой статье будут рассмотрены следующие темы: * Загрузка и загрузка предварительно обученных векторов * Поиск векторов, похожих на заданный вектор * «Математика со словами» * Визуализация векторов В конце доступны дополнительные ресурсы для чтения, в том числе оригинальная газета GloVe. Краткое введение в GloVe Glo bal Ve ctors для представления слов или GloVe - это..