Построение аналогии с ИИ

Одна из вещей, с которыми я действительно боролся с точки зрения ИИ, — это рассматривать его с точки зрения чего-то, что я уже понял. Мне очень нравится иметь интуитивное представление о том, как все работает, и, кажется, не хватает аналогий того, что именно делает нейронная сеть. На данный момент лучшая аналогия, которую я придумал, — это офисное здание.

Имейте в виду, что я не претендую на точное техническое объяснение того, как работает ИИ. Я думаю, что общая картина того, что делает ИИ, достаточно проста, чтобы ее можно было объяснить, не прибегая к запутанным рассуждениям о стохастическом градиентном спуске. Лично я использую эту аналогию, чтобы найти проблемы, на которые я могу «подбросить» ИИ: если гипотетическое офисное здание, которое я собираюсь описать, может быть использовано для выполнения определенной функции, есть большая вероятность, что ИИ тоже сможет это сделать.

Я уже слышу разъяренные крики «Но как?», так что позвольте мне объяснить. Давайте представим, что наш ИИ представлен вот этим зданием:

Как и в любом другом офисном здании, на каждом этаже здания работает несколько человек. Каждый из них выполняет немного другую задачу, и все они способствуют общему функционированию здания. Учитывая, что этот блог посвящен ИИ, я думаю, нам следует придать нашему зданию больше функций, связанных с ИИ — скажем, оно просматривает ваши больничные записи и предсказывает вероятность того, что вы заболеете в течение данной недели. Ваши больничные записи — это, по сути, строка в таблице с подробным описанием того, когда вы в последний раз были в больнице, какое у вас тогда было заболевание, сколько раз вы были в больнице и другие данные в том же духе. В вашей больнице есть аналогичная строка в таблице для каждого пациента, который ее посещает.

Итак, одним солнечным утром ваша больница идет в это здание и отдает им ваши записи. На первом этаже каждый сотрудник просматривает одну-единственную часть данных из записей — скажем, дату вашего рождения или количество посещений скорой помощи за последний год — и определяет вероятность того, что вы заболеете. на той неделе, учитывая только эту часть данных. Допустим, у вас был особенно тяжелый год, и вы посещали отделение неотложной помощи девять раз в 2020 году. Вам не нужно быть машиной, способной анализировать миллионы точек данных, чтобы сказать, что вы скорее, чем больше всего заболеть в течение любой данной недели, чем большинство людей. Сотрудник, просматривающий количество посещений скорой помощи, на самом деле подсчитал, что ваша склонность к травмам означает, что у вас есть 70% шанс заболеть на этой неделе. Сотрудник, глядя на ваш вес тела, замечает, что он находится за пределами здорового диапазона, и говорит, что у вас есть 20%-й шанс заболеть на этой неделе. Остальные люди на первом этаже также придумают вероятности, основанные на каждом из оставшихся фрагментов данных.

Люди на первом этаже смотрят на вероятности, которые дают им люди на первом этаже. Люди на втором этаже следуют несколько иному набору правил, когда определяют вероятность вашего заболевания. Например, один из людей на первом этаже знает, что количество посещений больницы, которые вы совершили в недавней истории, является гораздо более важным фактором, влияющим на то, заболеете вы или нет, чем ваш вес, поэтому они решают, что в целом вы re 60% вероятность заболеть. Каждый из парней на первом этаже проводит аналогичный анализ, придумывая вероятности того, что вы заболеете, принимая во внимание различные вероятности, которые им давали люди на первом этаже.

На каждом этаже сотрудники делают одно и то же. Используя свои знания о все более сложных вероятностях — так сказать, о мета-паттернах вероятности — они понимают более простые вероятности этажом ниже. В конце концов, люди на верхнем этаже смотрят на все вероятности, которые они получают с нижних этажей, и решают, заболеете ли вы на этой неделе. На этой неделе, к счастью, они предсказывают, что с вами все будет в порядке.

Затем, в среду вечером, вы поскользнулись, упали в ванну и снова оказались в отделении неотложной помощи. Ваша больница, естественно, более чем расстроена нашим зданием — у них была одна работа, и они даже не могли сделать ее правильно. Они идут к людям на верхнем этаже и говорят им: «Послушайте, кучка дебилов, вы сказали мне, что мой клиент будет здоров, как лошадь, а теперь они застряли в постели с травмой бедра!» Люди на верхнем этаже, будучи более хладнокровными, чем люди из вашей больницы, решают еще раз посмотреть на вероятности, полученные ими этажом ниже. Они замечают, что три из полученных ими вероятностей оценивают вероятность вашего заболевания в 60%, 80% и 90%, в то время как все остальные оценки показывают вероятность вашего заболевания в 30% или ниже. Ясно, что некоторые из этих оценок ближе к истине, чем другие. Люди на верхнем этаже решили придать большее значение вероятности от трех человек, которые сказали, что вы заболеете, и немного меньшее значение для шести, которые сказали, что вы не заболеете. Вверху и внизу здания происходят аналогичные проверки, и люди на каждом этаже немного лучше используют вероятности с нижнего этажа.

ИИ работает примерно так же, за исключением того, что этажи здания называются «слоями», а люди — «нейронами». Нейроны в каждом слое вычисляют вероятности и передают их последовательным слоям в процессе, называемом «прямое распространение». Когда ИИ делает неточный прогноз, нейроны, как и люди в нашем здании, переоценивают то, как они используют данные из нижнего слоя, чтобы учесть эту неточность. Этот процесс переоценки называется «обратным распространением», и это то, что делает ИИ таким мощным, как он есть.

Что интересно в этом конкретном офисном здании, так это то, что оно не связано с выяснением того, как не дать вам упасть раз в месяц. На самом деле, скажем, больница со временем перестанет привозить в это здание свои обычаи. Вместо этого компания электронной коммерции предоставляет зданию таблицу с демографическими данными клиентов и просит их выяснить, купит ли этот клиент мобильный телефон на этой неделе. Поначалу люди в здании ужасно на это реагируют. В конце концов, они знают только, как определить, причинишь ли ты себе вред на этой неделе или нет. Однако со временем люди на каждом этаже начинают менять свой подход к анализу вероятностей. В конце концов, они справляются с этой новой задачей даже лучше, чем со старой. Люди, работающие в этом офисном здании, в высшей степени легко адаптируются. Они могут (теоретически) найти способ сопоставить любые два набора связанных чисел.

Вот что делает ИИ таким изящным. Чтобы перевести предложение с одного языка на другой, все, что вам нужно сделать, это присвоить номер каждому слову в языках, а затем сообщить номера в наше офисное здание, и они решат, как предоставить вам перевод. Вы можете дать им числа, описывающие изображение баскетбольного мяча, и они смогут вычислить его координаты на изображении.

Проблема с ИИ заключается в том, что для того, чтобы хорошо что-то предсказывать, нашему офисному зданию нужно увидеть множество примеров этого. Чтобы сказать вам, кошка это или нет, с точностью, сравнимой, например, с человеком, ему нужно будет просмотреть тысячи, а может быть, и миллионы изображений кошек, а также предметов, не являющихся кошками. За последние годы мы накопили достаточно данных, чтобы проводить подобный анализ. Например, реклама, которую вы видите в Интернете, которая, кажется, прислушивается к вашим мыслям… В каком-то смысле так оно и есть. Они смотрят на то, что вы недавно искали, и предсказывают, что может вас заинтересовать, и в результате миллиардов поисковых запросов, которые выполняются ежедневно, они невероятно хорошо справляются с этой задачей.

Как и любая аналогия, эта имеет ограничения в своей применимости. Ни в коем случае не соответствует математике. Тем не менее, я думаю, что это полезный способ придумать потенциальные варианты использования ИИ. Возможно, это также поможет вам придумать способы использования ИИ.

Построение аналогии с ИИ

Вопросы по теме