В условиях развития Интернета, который сейчас является огромным источником ценной информации для фирм, но с необходимостью сбора, анализа и агрегирования данных для получения информации, имеющей значение для принятия управленческих решений, больших данных и машинное обучение стали модным словом в деловых кругах.

Сбор, просеивание и агрегирование данных для получения ценной информации потребовало разработки новых алгоритмов, платформ и программного обеспечения, это , потому что данные, собранные из Интернета, имеют множество разнообразных форм. Комментарии клиентов, которые имеют нечисловые символы, и информация о покупках, которые по определению являются числовыми, являются примером.

Чтобы комментарии, написанные клиентами, можно было объединить с данными о покупках, необходимо собрать комментарии. Ясно, что алгоритмы, которые хорошо справляются со сбором комментариев, обязательно должны отличаться от алгоритмов, которые хорошо справляются со сбором цифр, но, в конце концов, должны иметь возможность преобразовывать «данные комментариев» в числовые данные, которые можно агрегировать с данными о покупках, которые уже представлены в числовой форме. Поскольку обычно не существует причинно-следственных связей между, скажем, комментариями клиента и покупками, ожидается, что большие данные не будут генерировать ничего, кроме корреляций - шаблонов, трендов. и т. д., которые позволяют более точно нацеливать продукты фирмы на клиентов. Объемный характер данных, собираемых из Интернета, и отсутствие какой-либо регулярной периодичности для таких данных (различия в скорости поступления, то есть различия в скорости) создают потребность в разработке. новых подходов к интеллектуальному анализу информации, что привело к появлению спроса на алгоритмы машинного обучения.

Для фирм применение алгоритмов машинного обучения для анализа больших данных облегчает то, что они всегда делали, а именно анализ данных для понимания того, как лучше максимизировать ценность компании.

Если фирмы приходят к выводу, что этические действия улучшат стоимость фирмы, то не существует никакой потребности в какой-либо другой рационализации их действий. Мотив прибыли - достаточное обоснование.

Однако предположим, что алгоритмы машинного обучения применяются к большим данным в контексте научных исследований. Учитывая, что алгоритмы машинного обучения по своей сути не обладают способностью задавать вопросы «почему», они способны генерировать только шаблоны, тенденции или корреляции , результаты алгоритмов машинного обучения не поступают с каким-либо руководством, которое упрощает рационализацию шаблонов, тенденций или корреляций. При наличии заявленного предостережения и в контексте научных исследований надежность интерпретации результатов приложений машинного обучения для анализа больших данных требует разработки руководств - требует разработки формальных теоретических (математических) моделей.

Повышенная потребность в разработке формальных теоретических моделей не нова. При правильном подходе результаты реализации регрессионного анализа всегда интерпретировались в контексте существования некоторой формальной математической рационализации для параметров, генерируемых регрессионными моделями. Там, где формальных теоретических моделей еще не существовало, спрос на такие модели возник. Между тем, эмпирические результаты получили некоторую предварительную правдоподобную интерпретацию.

В этом отношении следует учитывать, что с y в качестве переменной результата, x в качестве потенциально причинной переменной, a в качестве значения y , когда x = 0, e как то, что не объясняется x, и m как эффект от x по y, существуют контексты, в которых формальные теоретические модели установили, что регрессионная модель определяется как:

y=mx +e

является более надежным, чем альтернативная стандартная спецификация, а именно:

y=a+mx+e.

Возможность того, что y = mx + e более надежна, чем y = a + mx + e, могла быть получена только в контексте независимо построенной формальной теоретической модели, почти невозможно достичь просто путем реализации регрессии. модель.

Поскольку мир увлечен большими данными и машинным обучением, стоит помнить, что если результаты приложений алгоритмов машинного обучения для анализа 'больших данных ', которые связаны с наукой и техникой, не подчиняются независимо построенным формальным теоретическим (математическим) моделям, вполне возможно, что мы испытаем возврат к тем временам, в течение которых ' изменения цен на сигареты 'были объяснены' изменениями заработной платы учителей '.

Приведенные цены на сигареты - это нелипкие данные (данные, которые часто меняются по месяцам в году), но с фиксированными зарплатами учителей (зарплаты меняются максимум ежегодно) было признано, что любые отношения между ценами на сигареты и зарплатой учителей представляли, возможно, не более чем эффект инфляции, не более чем корреляцию.

Если мы хотим избежать ложной интерпретации результатов применения алгоритмов машинного обучения для анализа больших данных, должен существовать строгий спрос на разработку формальных теоретических (математических) моделей, которые служат ориентирами для интерпретации таких результатов.

Алгоритмы машинного обучения - это неаналитические алгоритмы, то есть асимптотически сходящиеся представления рядов желаемых, но эмпирически невозможных аналитических решений. Если формальные теоретические модели, предназначенные для рационализации результатов алгоритмов машинного обучения, сами по себе являются результатами формальных теоретических моделей, которые отсутствуют в аналитических внутренних решениях, такие модели не обладают какой-либо реальной независимостью от результатов алгоритмов машинного обучения.

Установление достоверности асимптотического решения (из алгоритмов машинного обучения) с еще одним асимптотическим решением (из формальных математических моделей, которые отсутствуют в аналитических внутренних решениях, которые сами по себе являются упражнениями в достижении асимптотических решений) не может считаться надежным или надежным.

Итак, мы видим, что не нужны доказательства того, что конвергентные алгоритмы, лежащие в основе алгоритмов машинного обучения, работают так, как ожидалось; скорее мы устанавливаем наличие спроса на «аналитические внутренние решения», которые служат лакмусовой бумажкой того, в какой степени результаты алгоритмов машинного обучения не противоречат свойствам равновесия в устойчивом состоянии исследуемого пространства (экосистемы).

Невозможно описать устойчивые состояния, существующие в пространстве (экосистеме), с помощью моделей, которым не хватает аналитических внутренних решений.

По определению, асимптотически сходящееся формальное теоретическое (математическое) решение является одним из многих возможных решений, поскольку оно неприменимо для установления устойчивых состояний (уникальных решений или равновесий), которые существуют в пространстве (экосистеме).

В этом отношении учтите, что хотя вы можете из Атланты, Джорджия поехать в Бостон, Массачусетс через штаты Южная Каролина, Северная Каролина, Вирджиния, Мэриленд, Нью-Йорк и Коннектикут ('Маршрут 1'), вы также можете прибыть в Бостон, путешествуя через Теннесси, Алабаму, Огайо, Нью-Джерси, Нью-Йорк и Коннектикут ('Route 2').

Маршруты 1 и 2 представляют собой альтернативные конвергентные алгоритмы, которые, начиная с Атланты, Джорджия, позволяют прибыть в Бостон, Массачусетс. Без аналитического решения для интерьера, которое точно (точно) определяет географические местоположения Атланты, Бостон и Соединенных Штатов Америки , однако предположение об эквивалентности двух конвергентных алгоритмов - Маршрут 1 или Маршрут 2 - не имело бы никаких оснований в действительности.

Если не показано, что выходные данные приложений алгоритмов машинного обучения оказывают аналогичное влияние на аналитически полученные внутренние аналитические решения с устойчивым состоянием, которые являются уникальными, надежность альтернативных алгоритмов не заметна, а выходные данные алгоритмов машинного обучения подвержены субъективным интерпретациям исследователей, поскольку такими можно манипулировать.

В отсутствие формальной теоретической (математической) параметризации пространств (экосистем), которые генерируют уникальные аналитические внутренние решения, невозможно различить эквивалентность различных конвергентных алгоритмов и надежность интерпретации результатов алгоритмов машинного обучения.

Искусство и наука прихода к формальным теоретическим (математическим) моделям, обладающим уникальными аналитическими внутренними решениями, - это умирающая форма. Нам всем будет хуже, если мы предположим, что появление алгоритмов машинного обучения устраняет потребность в формальных теоретических моделях, которые имеют аналитические внутренние решения.

В этом отношении важно отметить, что модели, построенные с использованием инструментов дифференциации (ODE, PDE и т. Д.) И интеграции (например, преобразования Фурье) , только могут генерировать асимптотически сходящиеся алгоритмы, по сути не имея возможности генерировать формальные теоретические модели, которые имеют внутренние аналитические решения.

Пора привлечь внимание к моделям, которые облегчают параметризацию всего пространства - моделям, которые позволяют формально теоретически параметризовать стабильные состояния и взаимодействия стабильных состояний, которые существуют между параметрами пространства. (экосистема). В Финансы весь рынок, например Фондовая биржа, является пространством. В Астрономии - это Галактика Млечный Путь, в которой все сущности связаны пространством и временем, или наша Солнечная система - это пространства. В технологиях, учитывая, что все компоненты автомобиля прямо или косвенно связаны с двигателем автомобиля, автомобиль квалифицируется как пространство.

Если когда-либо возникла потребность в возобновлении спроса на формальные инструменты абстрактной (чистой) математики - для инструментов, позволяющих моделировать целые пространства, - в конечном итоге существуют тесты для определения степени, в которой результаты машинного обучения Алгоритмы не противоречат независимо и аналитически полученным равновесиям устойчивого состояния, которые обладают свойствами уникальности, то время настало.