Публикации по тегам language

Публикации по теме 'language'

Написание лингвистических правил для обработки естественного языка

С руководством по извлечению типов вопросов с помощью spaCy Оглавление Размышления лингвиста Решение: извлечение синтаксических признаков на основе правил Пример: извлечение типа вопроса с помощью spaCy 🌳 Размышления лингвиста Когда я впервые начал изучать науку о данных в конце своей докторской степени. программы по лингвистике, мне было приятно узнать о роли лингвистики - в частности, лингвистических функций - в разработке моделей НЛП. В то же время я был немного..

Встраивание слов и встраивание проектора TensorFlow

Теоретическое объяснение и практический пример. Встраивание слов — это метод представления слов (токенов) в словаре. Он считается одним из самых полезных и важных понятий в обработке естественного языка (NLP). В этом посте я расскажу об идее встраивания слов и о том, как это полезно в НЛП. Затем мы рассмотрим практический пример, чтобы понять концепцию, используя встраиваемый проектор TensorFlow. Вложение слов означает представление слова векторами в n-мерном векторном..

Учебник по нейронной сети с персонажами Деванагари с использованием PyTorch

Обучение искусственной нейронной сети распознаванию нарисованных от руки персонажей Деванагари с помощью PyTorch. Как следует из названия, нейронные сети во многом вдохновлены нейронами человеческого мозга. Но мы не будем здесь подробно останавливаться на аналогиях с мозгом. Скорее, мы поймем это с помощью математики и кодирования. Перцептрон Фрэнк Розенблатт предложил перцептрон в 1950-х годах, показав, что алгоритм может имитировать способность человеческого мозга принимать..

Умирающие языки и проклятие размерности

Может ли Natural Language Processing вытеснить исчезающие и незападные языки из науки? Обработка естественного языка резко выросла за последнее десятилетие. С ростом вычислительных мощностей и доступности данных рынок интеллектуального анализа человеческой речи стал сильным. Однако по мере распространения НЛП мы должны уделять пристальное внимание пространству, в которое оно распространяется. Создаем ли мы цикл обратной связи англоязычных стран с данными, которые мы собираем, и..

СЕНТИМЕНТАЛЬНЫЙ АНАЛИЗ С ИСПОЛЬЗОВАНИЕМ VADER

интерпретация и классификация эмоций Анализ тональности - это метод анализа текста, который определяет полярность (например, положительное или отрицательное мнение) в тексте, будь то весь документ, абзац, предложение или предложение. Анализ настроений направлен на измерение отношения, настроений, оценок, отношений и эмоций оратора / писателя на основе вычислительной обработки субъективности в тексте. Почему сложно выполнить анализ настроений? Хотя на бумаге это может..

Многоязычные модели предложений в НЛП

Обзор двух основных многоязычных моделей встраивания предложений Почему многоязычные модели Многоязычные модели - это тип модели машинного обучения, который может понимать разные языки. Одним из примеров может быть определение того, является ли фрагмент текста токсичным комментарием. Используя обычную модель машинного обучения, мы сможем выявлять токсичные комментарии только на английском языке, но не на испанском. Но если бы мы использовали многоязычную модель, мы смогли бы..

Влияние использования трансферного обучения в НЛП

Мы анализируем влияние классификации настроений обзоров фильмов на основе языковой модели, обученной с нуля, или предварительно обученной модели с использованием корпуса wikitext-103. Задний план В различных классификационных работах с НЛП мы использовали ULMFiT . Мы можем найти две отличные статьи по этой методологии в Передаточном обучении в НЛП для классификации позиции твита и Тонкая настройка универсальной языковой модели для классификации текста - ULMFiT . ULMFiT..