Публикации по теме 'word2vec'


Информация на основе встраивания слов о чемпионате ICC Champions Trophy 2017
Игра в крикет известна своей неописуемой драматичностью, внезапными всплесками возбуждения и ожидания. Темп матча может варьироваться от медленного до захватывающего. По мере того, как сюжет сгущается, сложная игра демонстрируемых эмоций заставляет всех нервничать. Июнь 2017 года был действительно особенным месяцем для всех энтузиастов крикета во всем мире, поскольку это месяц чемпионов ICC Trophy . ICC Champions Trophy - это однодневный международный турнир по крикету (ODI),..

t-SNE и многое другое с набором данных The Simpsons
Мне было любопытно узнать, как связаны между собой персонажи Симпсонов. В чем разница между повторяющимся и второстепенным персонажем. И кто ДЕЙСТВИТЕЛЬНО стрелял в мистера Бернса. Я написал быстрый скрипт для анализа XML-дампа The Simpsons Wikia — он дает мне список персонажей в каждом эпизоде. Теперь я могу построить матрицу сочетаемости. Матрица совместного появления в основном подсчитывает, сколько раз два персонажа были замечены вместе. Из этого мы можем определить, что при..

Word2vec: как его тренировать и обновлять
В этом блоге я кратко расскажу о том, что такое word2vec, как обучить свой собственный word2vec, как загрузить предварительно обученный Google word2vec и как обновить предварительно обученную модель Google с помощью пакета gensim в Python. Что такое word2vec? Если вы когда-либо участвовали в создании любого текстового классификатора, вы наверняка слышали о word2vec. Word2vec был создан группой исследователей во главе с Томашем Миколовым из Google. Это алгоритм обучения без присмотра, и..

Эксперимент с Word2vec, чтобы получить похожие слова из контекста.
Обучение машины понимать человеческие языки было увлекательной областью в течение нескольких десятилетий, и она остается до сих пор. Обработка естественного языка с использованием python стала более продвинутой с момента появления таких технологий, как word2vec, Doc2vec, Gensim, библиотеки sumy и т. д. Одна из контрольных точек в этой области, Word2Vec, является важной концепцией для всех энтузиастов машинного обучения. . Подготовка данных: Начнем эксперимент с простого примера..

Код: Word2Vec в Spark
Вот фрагмент, который может быть вам полезен, если вы хотите реализовать Word2Vec и сохранить вложения обученной модели. Я добавил типы к переменным, а также к некоторым именам заполнителей, чтобы было легче понять, что ожидается в качестве входных данных для различных функций. Сначала вам нужно будет импортировать Word2Vec и Word2VecModel. import org.apache.spark.ml.feature.{Word2Vec, Word2VecModel} Затем вам нужно будет импортировать имплициты искрового сеанса, поскольку вы будете..

Как НЛП обучает компьютеры значению слов
Изучите область НЛП и то, как с ее помощью машины не только видят слова, но и понимают их с помощью представлений и встраиваний на основе нейронных сетей. Люди умеют разговаривать. Мы понимаем, что кто-то имеет в виду, когда что-то говорит, и можем понять, когда такое слово, как «банк», используется в контексте финансового института или берега реки. Мы используем силу логического, лингвистического, эмоционального рассуждения и понимания, чтобы отвечать во время разговора. Чтобы..

Мое впечатление о курсе Tensorflow в Стэнфорде: недели 1–3
Мое впечатление о курсе Tensorflow в Стэнфорде: недели 1–3 В моем предыдущем посте я дал краткое введение в эту новую серию постов, цель которых дать объяснение последнего Стэнфордского курса Tensorflow с января по февраль 2018 года. В этой части я расскажу о своих впечатлениях от первых трех. недель этого курса. Неделя 1: Обзор Tensorflow Эта неделя представляет собой лучшее объяснение Tensorflow, которое я когда-либо видел. Часто, когда кто-то получает мотивацию изучать..