Как извлечь даты / места в тексте?

Какие пакеты / программное обеспечение лучше всего для извлечения времени / даты / места в тексте?

Или есть какой-нибудь набор данных, который можно было бы использовать в качестве набора данных?

Например:

- ПОЖАЛУЙСТА, ПРИСОЕДИНЯЙТЕСЬ К НАМ ДЛЯ ПЕЧЕНЬЯ И КОФЕ В [14:30] ДО СЕМИНАРА В [ЗАЛ 154 КООРДИНИРОВАННАЯ НАУЧНАЯ ЛАБОРАТОРИЯ]

- Тогда встретимся [пятница, 18:00] ...

- Семинар на этой неделе перенесен на вторник, с [11:00 до 12:00].

Время: [11-12 вечера], [окт. 29 вторник]

Место: [SC 0216]

Заголовок Статистическая значимость комбинаторных свойств при частом поиске наборов элементов ....

Я могу обучить модель машинного обучения для такой задачи, но я не знаю ни одного помеченного набора данных для этого. Кто-нибудь знает о каких-либо помеченных наборах данных?


person Daniel    schedule 30.10.2013    source источник
comment
Существуют преобладающие системы, такие как Google-Calenders или i-Cal от Apple, которые выполняют эту аналогичную задачу (и поверьте мне, они достигли очень высокой точности), поэтому вы можете взять их в качестве примера и следовать некоторым исследовательским работам по нему. , какие алгоритмы они использовали, как повысили точность и т. д. Это вам обязательно поможет. Сначала вы можете попробовать просто использовать регулярное выражение, а затем включить некоторые подходы к машинному обучению.   -  person sumitb.mdi    schedule 03.11.2013
comment
Привет! Вы смотрели на такой вопрос: stackoverflow.com/questions/1003326/? он имеет дело с синтаксическим анализом времени, а не места, но я не уверен, что вы хотите только найти (и не обязательно анализировать) выражения времени / места в тексте.   -  person arturomp    schedule 05.11.2013