Публикации по теме 'word2vec'


Извлечение сходства слов с помощью машинного обучения Python
Машинное обучение, глубокое обучение и искусственный интеллект были рядом с вами в течение десяти лет, однако теперь они более заметны, чем любое другое прошлое, так как все используют продукты искусственного интеллекта из повседневной жизни, такие как фильтр IG, рекомендации фильмов Netflix, Junk- обнаружение почты и многое другое. В недавнем прошлом эта технология теперь используется в основном для маркетинга, чтобы привлечь, удержать и расширить своих клиентов. Раньше это заменяла..

Применение Word2Vec к данным нашего каталога
Мы живем в эпоху революции, принесенную недавними исследованиями в области глубокого обучения и доступности больших вычислительных мощностей. В Arvind Internet мы используем машинное обучение для различных данных для создания отличных продуктов. В этом посте я хочу поделиться некоторыми интересными результатами, которые мы обнаружили, когда применили word2vec к данным описания наших продуктов. Цель состояла в том, чтобы найти взаимосвязь между словами и найти похожие слова. Прежде чем я..

Использование вложений в базу R
Существуют различные форматы файлов для хранения распределенных представлений векторов или слов , также известных как встраивания . Однако одним из наиболее удобных способов является использование текстового формата, используемого в исходной реализации word2vec. В этом формате каждая строка начинается с метки (элемента словаря), за которой следуют компоненты вектора. Кроме того, каждое поле отделено обычным пробелом. Следующая функция обрабатывает такие *.vec-файлы и может..

50 оттенков текста - использование обработки естественного языка (NLP)
«На пути к человеческому пониманию текстов / языков компьютерами» 21 июня 2018 года в Buildo компания Data Science Milan организовала мероприятие на модную тему: Обработка естественного языка (NLP). В настоящее время мы нашли множество приложений НЛП, таких как машинный перевод (переводчик Google), ответы на вопросы (чат-бот), поиск в Интернете и приложениях (Amazon), лексическая семантика (Тезаурус), анализ настроений (Cambridge Analytica), генератор естественного языка (бот..

Определение биграмм, триграмм и четырех граммов с помощью Word2Vec
Ссылка на блокнот Colab: https://colab.research.google.com/drive/1nydGcRm_pn5uQ--ZHnithbcuVhJnTW7u Код Github: https://github.com/manjunathhiremath/Medium_Blogs/blob/master/Identifying_Bigrams%2CTrigrams_and_Fourgrams_Using_Word2Vec.ipynb Всегда было сложно определить фразы (биграммы, триграммы и четыре грамма). Как мы знаем, в gensim есть класс Phraser, который определяет фразы (биграммы, триграммы, четыреграммы…) из текста. from gensim.models import Phrases documents=[“I am a..

Учебное пособие по Word2Vec, часть 2 - Отрицательная выборка
Во второй части учебного пособия по word2vec (часть I ниже) я расскажу о нескольких дополнительных модификациях базовой модели скип-грамма, которые важны для того, чтобы на самом деле сделать ее возможным для обучения. Учебное пособие по Word2Vec - Модель Skip-Gram В этом руководстве рассматривается архитектура нейронной сети skip-gram для Word2Vec. Мое намерение в этом руководстве было… medium.com Когда вы читали руководство по..

Сходства карт в Clash Royal
выучил представление в стиле w2v Учитывая 2 объекта, A и B, что делает их похожими? Ответов может быть много, но один из самых элегантных ответов основан на подстановке: A и B похожи, если в большинстве случаев использования A вы можете заменить его на B, и вы не заметите большой разницы. Идея подстановки возникала несколько раз, из них я знаю лисков-принцип-подстановки и, конечно же, распределительную-семантику . Но вместо исследовательской литературы мы будем использовать..