… Вы не поверите, что я узнал о Rust, node.js и React Native.

После использования нейронной сети LSTM (torch-rnn) для генерации британских топонимов (Hatlet Backlingham, Sattle Boslaw, Fuckley) и задавать вопросы метафильтру (Am I a Dog ?, Я библиотекарь, как мне это сделать? ? , Как мне перестать быть терапевтом? ), Я искал свой следующий проект.

Как и Златовласка, мне нужен был правильный корпус. Он должен был:

а) быть достаточно большим (не менее 5 МБ текста для обучения);

б) четко ограничиваться определенной областью; а также

c) достоверно генерировать интересные идеи (например, привлекать внимание к тенденциям или закономерностям или использоваться для легкого подшучивания над предметной областью).

🚕 Uber говорит, что не хочет, чтобы его открыли в 2017 году

Hacker News - это признание в Интернете следующей универсальной истины: молодые одинокие мужчины, которые знают, что есть правильный и неправильный способ создания программного обеспечения, не имеют возможности разрушить мир.

Возможно влиятельное онлайн-сообщество, Hacker News (запущенное в 2007 году серийным разрушителем Полом Грэмом с онлайн-именем pg) является эпицентром, или тем, что хакеры назвали бы гибсоном, на пересечении компьютерных наук и предпринимательство. Стартапы, состояния и репутация создаются и ломаются благодаря их приему на Hacker News.

🏅 Человек, который мог бы быть биткойном, никогда не заработает миллиард долларов в социальных сетях

Как и сайт основных СМИ Condé Nast Reddit (основан в 2005 году, за 2 года до Hacker News), Hacker News позволяет зарегистрированным пользователям публиковать сообщения на сайте. Сообщения привлекают голоса, которые благодаря применению алгоритма позволяют им отображаться в верхней части престижной первой страницы.

Итак: что может быть лучше, чем заголовки постов Hacker News?

Теория заключается в том, что нейронная сеть LSTM, обученная сообщениям Hacker News, будет отражать культуру этого влиятельного онлайн-сообщества. Это может помочь нам понять, что сообщество считает важным. Кроме того, мы можем различить некоторые подсказки относительно того, где хоккейная шайба может двигаться дальше.

💸 Show HN: Универсальный базовый доход в эликсире

С этим, вперед!

Метод

  1. Во-первых, вам нужен учебный корпус или набор данных. Я использовал скрипты Python get-all-hacker-news-submissions-comments из minimaxir на Github. Спасибо, minimaxir! Один из скриптов Python использует Hacker News algolia API для получения всех представленных материалов и сохранения их в локальной базе данных PostgreSQL.
  2. Подожди немного. Я подождал несколько часов и получил около 500 000 заявок. Если хочешь, можешь подождать дольше.
  3. Взгляните на таблицу hn_submissions базы данных hacker_news. Там будет много заявок!
  4. Теперь подумайте: вы хотите использовать все материалы? Может быть нет! Некоторые из них не годятся! Возможно, мы хотим использовать только те, у которых больше 1 балла. Или больше 10 баллов. Как бы то ни было, напишите какой-нибудь SQL, чтобы увидеть некоторые числа.
  5. Как только вы определились с типом материалов, которые вам нужны, используйте команду SQL COPY, чтобы выгрузить только заголовки в текстовый файл.
  6. Как обычно, используйте torch-rnn: предварительно обработайте данные и обучите некоторые модели. Вы захотите обучать модели на EC2 или на любом компьютере, кроме Mac, потому что к черту Apple и их глупый подход к графическим процессорам. Когда у вас есть несколько моделей, вы можете использовать любой компьютер, какой захотите, выборка не требует особой нагрузки на процессор.
  7. Поиграйте с параметрами выборки, создайте сотни тысяч символов и, чтобы убедить себя, что у вас еще будет работа в будущем, проявите человеческое творческое усмотрение в выборе тех, которые вам нравятся. Я разместил образцы вывода, модели и данные на Github, использую их на свой страх и риск и т. Д.

Вот и все!

Некоторые из моих любимых нейронных сетей, генерируемых хакерскими новостями

Собственные подборки эмодзи; даже Культура признала, что мешки с мясом должны чувствовать себя готовыми.

🎶 Show HN: простой блокчейн для всех Twitter

🛰 Представляем Google Space

⛈ Самостоятельная граница в облаке

🌋 React Native Conversation с помощью React Native

🤔 Спросите HN: Что вы используете для разработчиков?

💡 Протоколы дизайна мозга [видео]

💸 Show HN: Универсальный базовый доход в эликсире

🌍 Активная карта инженеров Hyperloop (2005)

💣 Спросите HN: На каких компьютерах можно изучать Rust?

💉 Расширения Питера Тиля для взлома вашей среды разработки в области компьютерных наук

💰 Дело в пользу всего с прибылью (2015)

🖥 Show HN: простое приложение для macOS для продажи ваших стартапов

👴🏻 Человек, который продолжает кодировать (2013)

🔥 Компьютерные науки об искусственном интеллекте считаются вредными

🐍 Emacs и глубокое обучение на Python

🌈 Создание Common Lisp в технологических компаниях

🎷 Алгоритмы Post HoloLens с Node.js

🎯 Концертная экономика охоты за продуктом

🤼‍♂️ Перевод на язык программирования мужчин

📰 Конец модели подписки

💰 Простой набор инструментов командной строки для денег

🇺🇸 Американская свобода Интернета

👔 Краткая история заявлений о сексуальных домогательствах

🏎 Tesla Model 3 выпущена с безопасными паролями (2015 г.)

🌯 Как построить диету в социальных сетях

🥑 Слабость может превышать 100 000 долларов

🏅 Человек, который мог бы быть биткойном, никогда не заработает миллиард долларов в социальных сетях

🍔 Спросите HN: Как лучше всего стать крупным разработчиком?

🍩 Разработка для человека-шпиона прекращена

❓ Спросите HN: Что вы думаете о стартапе?

⚠️ Большая Кремниевая долина - это таблеточный бизнес, основанный на исходном коде.

🚿 Марк Цукерберг - веб-разработчик, изучавший Интернет в колледже.

🔮 Исследуйте Холокост, прочтите мир как компанию ИИ

🌿 Искусство доступа к марихуане для поиска бота-мессенджера (2014)

🐙 Глубокое обучение для сервера Alexa с помощью Node.js

👊🏼 Почему так много миллионов стартапов хотят вас

👶🏾 Show HN: будущее программиста на Haskell

🇨🇦 Канада хочет быть в браузере

💶 Как начать получать базовый доход как услугу

💯 Спросите HN: Как лучше всего продать блокчейн в 2017 году?

📱 Приложение чата для стартапа изобрело Интернет будущего

🌀 Странная история школы стартапов

🤖 Роботы с ограниченным доступом и компания Apple Machine Learning

👔 Человек, создавший будущее Америки

🌿 Драйверы мозга - это реальность как услуга

💉 Питера Тиля можно использовать, чтобы поделиться своей жизнью

🎧 Спросите HN: Как вы управляете своими специалистами по данным?

🚛 Самоуправляемые автомобили с использованием компонентов Docker

👭 Как настроить вид разработчика программного обеспечения

🚕 Uber говорит, что не хочет, чтобы его открыли в 2017 году

🌮 Почему я основатель социальных сетей?

🍱 Секретная нейронная сеть - революция

🍑 Глубокое обучение для Hacker News (2015)

👔 Разговор с женой для инженеров-программистов

🌉 Как я победил Сан-Франциско

🎁 Dropbox - это продукт, который умер

‼ ️ Марк Цукерберг сломлен (2016)

💤 История инженеров-программистов

🤦🏻‍♂️ Будущее дискриминации

🤔 Глубокое обучение с помощью Node.js на C ++ на Python

🤷🏼‍♀️ Показать HN: React Native против Arctic Lisp

📈 Математики - множество причин технического долга

🎉 Технологии раскрывают лучший способ отказаться от использования Rust

⌨️ Машинное обучение для Electron

🔍 Regex с Node.js

👻 Анти-маркетинг вещей

🎈 React Native против React и React Native с Docker

💎 Как создать нейронную сеть для их захвата

🍺 Попивать в Haskell и аутентификация бесплатно

💉 Питер Тиль выпускает децентрализованные маршрутизаторы с нуля

⏱ Show HN: инструмент командной строки для создания стартапа за 100 минут

🔮 Show HN: я сделал веб-сервер в будущем

👨🏾‍💻 Язык программирования президента Обамы (2006)

🙋🏼‍♂️ Темный стартап для людей

💊 Состояние зависимости в Scala

🛒 Спросите HN: Как лучше всего продать свою жизнь? (2015)

🛡 Состояние атаки постнейронной сети

📉 Как начать ошибку (2012)

📬 Простой почтовый клиент для языков программирования

🚀 Показать HN: SpaceX и идея стартапа охватила весь мир

🇨🇳 Китай планирует направить вам универсальный базовый доход

🇺🇸 Илон Маск и контроль американской мечты (1999)

🌐 Илон Маск говорит, что посмотрит на Google и весь интернет-проект

💯 Илон Маск говорит, что он пост-правда о мозге

🎱 Илон Маск говорит, что он будет больше, чем секретный искусственный интеллект

🎯 Илон Маск говорит, что Марк Цукерберг хочет остановиться в первый раз

🕵🏻 Марк Цукерберг действительно должен знать обо всех

🔮 Марк Цукерберг, предсказывая будущее на все времена

🌎 Марк Цукерберг теперь наш мир

🌕 10 признаков того, что вы работаете на Луне

🏛 Компьютерная модель правительства

🗞 The New York Times of AI (2013)

🏎 Самое быстрое интервью с Elixir, часть 1

🇨🇳 Китай умер

🔦 Программирование квантовых вычислений на Python

🤼‍♂️ У Марка Цукерберга есть новый язык, который может изменить мир

🏌🏼 Победа Трампа для MongoDB

🙈 MailChimp заставит Трампа поддержать контейнерную интернет-архитектуру

💸 Метафизика распознавания биткойнов мозгом

🕹 Видеоигры на блокчейне

⛓ Show HN: непрерывная интеграция для блокчейна

💁🏼 Представляем Chelsea Manning: инструмент для разработчиков и женщин в большом компьютере

🤦🏿‍♀️ Какой ваш любимый эксперимент над чернокожей женщиной?

🙅🏻 Женщина, которая полностью лишила их безопасности

👨🏻‍🚀 Человек, который создал мир с помощью сверточных нейронных сетей

👨🏽‍🎨 Человек, который сделал это, создает свои устройства на Scala

👨🏾‍✈️ Человек, который стал автомобилем будущего

👨‍🏫 Человек, который не доставил подписчиков

👨🏻‍⚕️ Человек, создающий людей

👷🏾 Человек, который стал менеджером по продукту

👨🏽‍🎤 Show HN: Человек, перешедший на блокчейн

☠️ Интернет вещей и Черное зеркало теперь доступны

👨‍💻 Компания Computer Science - это новый Интернет белого Интернета

🎩 Контейнеры с эликсиром

🍜 Почему я до смерти учился на Clojure

📝 Марк Андреессен ищет технические списки

🤦🏻‍♀️ Show HN: Список сексуальных домогательств в мире

🤦🏽‍♀️ Show HN: веб-браузер для преследований в 2017 году

🦄 Slack - будущее мира