Публикации по теме 'text'


Машинное обучение с текстовыми данными — Обработка текста
Обработка естественного языка, или сокращенно НЛП, определяется как автоматическое манипулирование естественным языком, таким как речь и текст, с помощью программного обеспечения. Другими словами, это можно описать как машинное обучение с текстовыми данными. Модели машинного обучения работают только с четко определенными числовыми данными. Следовательно, первым шагом с текстовыми данными является преобразование их в числовой формат. Машинное обучение с текстовыми данными состоит из..

Бессмыслица в предложениях
В последние недели я изучал пересечение языков. С одной стороны, у нас есть английский язык, широко понимаемый людьми в этом мире. С другой стороны, у нас есть множество языков программирования с синтаксисом, подобным английскому, разработанных для понимания некоторыми людьми, прежде чем они будут скомпилированы в байты для понимания машинами. Контекст моего исследования был вызван моим желанием извлечь информацию из текста — формы неструктурированных данных, критически воспринимаемых..

Анализ тональности необработанного текста с помощью Amazon, IMDB и Yelp!
Этот пост является прямым продолжением моего предыдущего поста о Предварительной обработке текста . Это практическая реализация некоторых важных шагов предварительной обработки текста, которые используются перед подачей в модель машинного обучения. Вместо того, чтобы использовать обычные методы предварительной обработки и обучения с помощью сценариев кодирования, я использовал инструмент под названием Knime . Выбор и анализ данных Набор данных доступен в репозитории данных UCI под..

Что такое текст?
Из всего, что я могу научить других технологиям, единственное, чему я хотел бы научить всех, - это текст. Мало кто действительно понимает силу текста. Многие люди относятся к клавиатуре как к пишущей машинке, а Microsoft Word как к скевморфному виртуальному листу бумаги. Текст - это могущественное волшебное существо, о котором должен знать каждый. Что такое документ Microsoft Word? Получить документ Microsoft Word по электронной почте - все равно что получить от FedEx..

Классификатор Intellexer. Текстовый классификатор, который делает его быстрее
Текст является основным и самым большим типом данных в Интернете, что делает категоризацию текста (ТС) центром внимания исследователей и разработчиков. TC — одно из важных направлений в НЛП и искусственном интеллекте, которое играет важную роль в облегчении текстовой аналитики. Новый Categorizer, разработанный для ОС Windows 10, недавно был выпущен компанией Intellexer и теперь доступен в Microsoft Store . В чем его главное преимущество и какова роль категоризации текста сегодня?..

Машинное обучение на текстах и ​​генеративном моделировании в сравнении с дискриминационным
Вы когда-нибудь задумывались, как провести быстрый анализ машинного обучения с текстовыми данными? Например, анализ настроений или прогнозирование того, могут ли произойти определенные вещи на основе исторических текстовых описаний. Благодаря Mogady из Kaggle, он предоставил хороший (простой и чистый) набор данных, который может удовлетворить мой интерес, чтобы попробовать некоторую быструю аналитику машинного обучения Text. Я также использовал часть его кода :-P Если ваши данные..

LexNLP - Библиотека для автоматического извлечения текста и NER (с
LexNLP - Библиотека для автоматического извлечения текста и NER Использование LexPredict, будущей расширенной библиотеки для распознавания именованных сущностей (NER) для извлечения имен, адресов, дат и т. Д. Вступление Несколько недель назад мне приходилось извлекать определенные типы данных из набора документов, и я задавался вопросом, как лучше всего это сделать. Все документы представляли собой формы аренды с такими данными, как названия организаций, адреса, даты, суммы,..