… Вы не поверите, что я узнал о Rust, node.js и React Native.
После использования нейронной сети LSTM (torch-rnn) для генерации британских топонимов (Hatlet Backlingham, Sattle Boslaw, Fuckley) и задавать вопросы метафильтру (Am I a Dog ?, Я библиотекарь, как мне это сделать? ? , Как мне перестать быть терапевтом? ), Я искал свой следующий проект.
Как и Златовласка, мне нужен был правильный корпус. Он должен был:
а) быть достаточно большим (не менее 5 МБ текста для обучения);
б) четко ограничиваться определенной областью; а также
c) достоверно генерировать интересные идеи (например, привлекать внимание к тенденциям или закономерностям или использоваться для легкого подшучивания над предметной областью).
🚕 Uber говорит, что не хочет, чтобы его открыли в 2017 году
Hacker News - это признание в Интернете следующей универсальной истины: молодые одинокие мужчины, которые знают, что есть правильный и неправильный способ создания программного обеспечения, не имеют возможности разрушить мир.
Возможно влиятельное онлайн-сообщество, Hacker News (запущенное в 2007 году серийным разрушителем Полом Грэмом с онлайн-именем pg) является эпицентром, или тем, что хакеры назвали бы гибсоном, на пересечении компьютерных наук и предпринимательство. Стартапы, состояния и репутация создаются и ломаются благодаря их приему на Hacker News.
🏅 Человек, который мог бы быть биткойном, никогда не заработает миллиард долларов в социальных сетях
Как и сайт основных СМИ Condé Nast Reddit (основан в 2005 году, за 2 года до Hacker News), Hacker News позволяет зарегистрированным пользователям публиковать сообщения на сайте. Сообщения привлекают голоса, которые благодаря применению алгоритма позволяют им отображаться в верхней части престижной первой страницы.
Итак: что может быть лучше, чем заголовки постов Hacker News?
Теория заключается в том, что нейронная сеть LSTM, обученная сообщениям Hacker News, будет отражать культуру этого влиятельного онлайн-сообщества. Это может помочь нам понять, что сообщество считает важным. Кроме того, мы можем различить некоторые подсказки относительно того, где хоккейная шайба может двигаться дальше.
💸 Show HN: Универсальный базовый доход в эликсире
С этим, вперед!
Метод
- Во-первых, вам нужен учебный корпус или набор данных. Я использовал скрипты Python get-all-hacker-news-submissions-comments из minimaxir на Github. Спасибо, minimaxir! Один из скриптов Python использует Hacker News algolia API для получения всех представленных материалов и сохранения их в локальной базе данных PostgreSQL.
- Подожди немного. Я подождал несколько часов и получил около 500 000 заявок. Если хочешь, можешь подождать дольше.
- Взгляните на таблицу hn_submissions базы данных hacker_news. Там будет много заявок!
- Теперь подумайте: вы хотите использовать все материалы? Может быть нет! Некоторые из них не годятся! Возможно, мы хотим использовать только те, у которых больше 1 балла. Или больше 10 баллов. Как бы то ни было, напишите какой-нибудь SQL, чтобы увидеть некоторые числа.
- Как только вы определились с типом материалов, которые вам нужны, используйте команду SQL COPY, чтобы выгрузить только заголовки в текстовый файл.
- Как обычно, используйте torch-rnn: предварительно обработайте данные и обучите некоторые модели. Вы захотите обучать модели на EC2 или на любом компьютере, кроме Mac, потому что к черту Apple и их глупый подход к графическим процессорам. Когда у вас есть несколько моделей, вы можете использовать любой компьютер, какой захотите, выборка не требует особой нагрузки на процессор.
- Поиграйте с параметрами выборки, создайте сотни тысяч символов и, чтобы убедить себя, что у вас еще будет работа в будущем, проявите человеческое творческое усмотрение в выборе тех, которые вам нравятся. Я разместил образцы вывода, модели и данные на Github, использую их на свой страх и риск и т. Д.
Вот и все!
Некоторые из моих любимых нейронных сетей, генерируемых хакерскими новостями
Собственные подборки эмодзи; даже Культура признала, что мешки с мясом должны чувствовать себя готовыми.
🎶 Show HN: простой блокчейн для всех Twitter
🛰 Представляем Google Space
⛈ Самостоятельная граница в облаке
🌋 React Native Conversation с помощью React Native
🤔 Спросите HN: Что вы используете для разработчиков?
💡 Протоколы дизайна мозга [видео]
💸 Show HN: Универсальный базовый доход в эликсире
🌍 Активная карта инженеров Hyperloop (2005)
💣 Спросите HN: На каких компьютерах можно изучать Rust?
💉 Расширения Питера Тиля для взлома вашей среды разработки в области компьютерных наук
💰 Дело в пользу всего с прибылью (2015)
🖥 Show HN: простое приложение для macOS для продажи ваших стартапов
👴🏻 Человек, который продолжает кодировать (2013)
🔥 Компьютерные науки об искусственном интеллекте считаются вредными
🐍 Emacs и глубокое обучение на Python
🌈 Создание Common Lisp в технологических компаниях
🎷 Алгоритмы Post HoloLens с Node.js
🎯 Концертная экономика охоты за продуктом
🤼♂️ Перевод на язык программирования мужчин
📰 Конец модели подписки
💰 Простой набор инструментов командной строки для денег
🇺🇸 Американская свобода Интернета
👔 Краткая история заявлений о сексуальных домогательствах
🏎 Tesla Model 3 выпущена с безопасными паролями (2015 г.)
🌯 Как построить диету в социальных сетях
🥑 Слабость может превышать 100 000 долларов
🏅 Человек, который мог бы быть биткойном, никогда не заработает миллиард долларов в социальных сетях
🍔 Спросите HN: Как лучше всего стать крупным разработчиком?
🍩 Разработка для человека-шпиона прекращена
❓ Спросите HN: Что вы думаете о стартапе?
⚠️ Большая Кремниевая долина - это таблеточный бизнес, основанный на исходном коде.
🚿 Марк Цукерберг - веб-разработчик, изучавший Интернет в колледже.
🔮 Исследуйте Холокост, прочтите мир как компанию ИИ
🌿 Искусство доступа к марихуане для поиска бота-мессенджера (2014)
🐙 Глубокое обучение для сервера Alexa с помощью Node.js
👊🏼 Почему так много миллионов стартапов хотят вас
👶🏾 Show HN: будущее программиста на Haskell
🇨🇦 Канада хочет быть в браузере
💶 Как начать получать базовый доход как услугу
💯 Спросите HN: Как лучше всего продать блокчейн в 2017 году?
📱 Приложение чата для стартапа изобрело Интернет будущего
🌀 Странная история школы стартапов
🤖 Роботы с ограниченным доступом и компания Apple Machine Learning
👔 Человек, создавший будущее Америки
🌿 Драйверы мозга - это реальность как услуга
💉 Питера Тиля можно использовать, чтобы поделиться своей жизнью
🎧 Спросите HN: Как вы управляете своими специалистами по данным?
🚛 Самоуправляемые автомобили с использованием компонентов Docker
👭 Как настроить вид разработчика программного обеспечения
🚕 Uber говорит, что не хочет, чтобы его открыли в 2017 году
🌮 Почему я основатель социальных сетей?
🍱 Секретная нейронная сеть - революция
🍑 Глубокое обучение для Hacker News (2015)
👔 Разговор с женой для инженеров-программистов
🌉 Как я победил Сан-Франциско
🎁 Dropbox - это продукт, который умер
‼ ️ Марк Цукерберг сломлен (2016)
💤 История инженеров-программистов
🤦🏻♂️ Будущее дискриминации
🤔 Глубокое обучение с помощью Node.js на C ++ на Python
🤷🏼♀️ Показать HN: React Native против Arctic Lisp
📈 Математики - множество причин технического долга
🎉 Технологии раскрывают лучший способ отказаться от использования Rust
⌨️ Машинное обучение для Electron
🔍 Regex с Node.js
👻 Анти-маркетинг вещей
🎈 React Native против React и React Native с Docker
💎 Как создать нейронную сеть для их захвата
🍺 Попивать в Haskell и аутентификация бесплатно
💉 Питер Тиль выпускает децентрализованные маршрутизаторы с нуля
⏱ Show HN: инструмент командной строки для создания стартапа за 100 минут
🔮 Show HN: я сделал веб-сервер в будущем
👨🏾💻 Язык программирования президента Обамы (2006)
🙋🏼♂️ Темный стартап для людей
💊 Состояние зависимости в Scala
🛒 Спросите HN: Как лучше всего продать свою жизнь? (2015)
🛡 Состояние атаки постнейронной сети
📉 Как начать ошибку (2012)
📬 Простой почтовый клиент для языков программирования
🚀 Показать HN: SpaceX и идея стартапа охватила весь мир
🇨🇳 Китай планирует направить вам универсальный базовый доход
🇺🇸 Илон Маск и контроль американской мечты (1999)
🌐 Илон Маск говорит, что посмотрит на Google и весь интернет-проект
💯 Илон Маск говорит, что он пост-правда о мозге
🎱 Илон Маск говорит, что он будет больше, чем секретный искусственный интеллект
🎯 Илон Маск говорит, что Марк Цукерберг хочет остановиться в первый раз
🕵🏻 Марк Цукерберг действительно должен знать обо всех
🔮 Марк Цукерберг, предсказывая будущее на все времена
🌎 Марк Цукерберг теперь наш мир
🌕 10 признаков того, что вы работаете на Луне
🏛 Компьютерная модель правительства
🗞 The New York Times of AI (2013)
🏎 Самое быстрое интервью с Elixir, часть 1
🇨🇳 Китай умер
🔦 Программирование квантовых вычислений на Python
🤼♂️ У Марка Цукерберга есть новый язык, который может изменить мир
🏌🏼 Победа Трампа для MongoDB
🙈 MailChimp заставит Трампа поддержать контейнерную интернет-архитектуру
💸 Метафизика распознавания биткойнов мозгом
🕹 Видеоигры на блокчейне
⛓ Show HN: непрерывная интеграция для блокчейна
💁🏼 Представляем Chelsea Manning: инструмент для разработчиков и женщин в большом компьютере
🤦🏿♀️ Какой ваш любимый эксперимент над чернокожей женщиной?
🙅🏻 Женщина, которая полностью лишила их безопасности
👨🏻🚀 Человек, который создал мир с помощью сверточных нейронных сетей
👨🏽🎨 Человек, который сделал это, создает свои устройства на Scala
👨🏾✈️ Человек, который стал автомобилем будущего
👨🏫 Человек, который не доставил подписчиков
👨🏻⚕️ Человек, создающий людей
👷🏾 Человек, который стал менеджером по продукту
👨🏽🎤 Show HN: Человек, перешедший на блокчейн
☠️ Интернет вещей и Черное зеркало теперь доступны
👨💻 Компания Computer Science - это новый Интернет белого Интернета
🎩 Контейнеры с эликсиром
🍜 Почему я до смерти учился на Clojure
📝 Марк Андреессен ищет технические списки
🤦🏻♀️ Show HN: Список сексуальных домогательств в мире
🤦🏽♀️ Show HN: веб-браузер для преследований в 2017 году
🦄 Slack - будущее мира