Зачем строить интеллектуальные машины?

Теперь к вопросу Что будут делать интеллектуальные машины?

Меня часто просят рассказать о будущем мобильных компьютеров. Организаторы конференций нередко просят меня описать, на что будут похожи наладонники или сотовые телефоны через пять или двадцать лет. Они хотят услышать мое видение будущего. Я не могу этого сделать. Я пытаюсь избежать того, что все вместе я называю одним словом «V». Чтобы убедить в этом, я однажды вышел на сцену в шляпе волшебника и с хрустальным шаром. Я объяснил, что никто не может видеть будущее детально. Хрустальный шар – это фикция, и любой, кто претендует на точное знание того, что произойдет в грядущие годы, обречен на провал. Самое лучшее, что мы можем сделать вместо этого – это понять общую тенденцию. Если вы понимаете общую идею, вы вполне сможете отследить ее, как бы она ни развивалась по мере выявления деталей.

Наиболее известный пример технологической тенденции это закон Мура. Гордон Мур верно предсказал, что количество элементов, которые могут быть размещены на кремниевом чипе, должно удваиваться каждые полтора года. Мур не сказал, относится ли это к чипам памяти, процессорам или чему-то еще. Он не сказал, в каком виде продукции эти чипы будут использованы. Он не предсказывал, будут ли чипы в пластиковых или керамических корпусах или наклеенные прямо на плату. Он не сказал ничего о различных процессах, используемых при производстве чипов. Он привязался к наиболее общей тенденции, какой мог, и оказался прав.

В настоящее время мы не можем предсказать окончательное использование интеллектуальных машин. Просто нет способа узнать конкретные детали. Если я, или кто-то еще, предсказывает в деталях, что будут делать эти машины, мы неизбежно будем обмануты. Однако, мы можем сделать нечто большее, чем просто пожимать плечами. Есть две линии идей, которые могут быть полезны. Одна – вообразить наиболее краткосрочное использование мозгоподобной системы памяти – очевидное, но менее интересная вещь, которую можно попробовать для начала. Второй подход – подумать о долгосрочных тенденциях, подобных закону Мура, которые могут помочь нам вообразить применения таких машин, которые, возможно, могли бы стать частью нашего будущего.

Давайте начнем с некоторых краткосрочных применений. Это вещи, кажущиеся очевидными, подобно замене радиоламп на транзисторы или построению калькуляторов на микропроцессорах. И мы сможем начать с обозрения некоторых областей, в которых пытались применить ИИ, но не смогли – распознавание речи, техническое зрение и умные автомобили.

* * *

Если вы когда-нибудь пытались использовать программы для распознавания речи для ввода текста в персональный компьютер, вы знаете, насколько они могут быть неуклюжими. Подобно Китайской Комнате Серла, у компьютера нет понимания того, что ему сказали. За время использования таких продуктов я был разочарован. Если в комнате есть хоть какой-нибудь шум, от упавшего карандаша до чьего-нибудь разговора, на экране появляются лишние слова. Процент ошибок распознавания очень высок. Часто слова, которые послышались программе, не имели смысла. «Remember to fell Mary that the bog is ready to be piqued up». Ребенок знает, что это неправильно, но не компьютер. Аналогично, так называемые естественно-языковые интерфейсы были целью для компьютерщиков многие годы. Идея в том, чтоб вы могли сказать компьютеру или другим устройствам сказать, чего вы хотите – и пусть машина делает свою работу. Персональному цифровому помощнику, или PDA, вы могли бы сказать «Перенести занятия баскетболом для моей дочери на десять часов утра в воскресенье». Такое невозможно сделать на приемлемом уровне с помощью традиционного ИИ. Даже если компьютер смог бы распознать каждое слово, для того, чтоб выполнить задачу ему потребовалось бы знать, в какую школу ходит ваша дочь, что, возможно, вы имели в виду ближайшее воскресенье, и, может быть, что такое «занятия баскетболом» потому что назначение могло бы только говорить «Menlo vs. St. Joe». Или, вероятно, вы хотели бы, чтоб компьютер слушал радиопередачу на предмет упоминания определенного продукта, даже если диктор описывает этот продукт не используя его название. Вы и я знали бы, о чем он говорит, но компьютер – нет.

Эти и многие другие приложения требуют, чтоб машина могла слышать и понимать устный язык. Но компьютеры не могут выполнять такую задачу, потому что они не понимают, что было сказано. Они сопоставляют звуковые паттерны со словарными шаблонами механически, не зная, что обозначают слова. Представьте себе, если бы вы научились звучание отдельных слов иностранного языка, но не значение слов, и я попросил бы вас перевести разговор с другого языка. В процессе перевода вы бы не понимали, о чем речь, но пытались бы ухватить отдельные слова. Однако, слова перекрываются и взаимодействуют, и частично звуки подавляются шумами. Вам бы показалось черезвычайно сложно отделить слова и узнать их. Именно с этим препятствием борются современные распознающие программы. Инженеры обнаружили, что используя вероятности перехода слов они могут улучшить качество программ в чем-то. Например, они используют правила грамматики для того, чтоб выбрать один из омонимов. Это очень простая форма предсказания, но системы все еще остаются слабо интеллектуальными. Современные программы распознавания речи успешно работают только в очень ограниченных ситуациях, в которых количество слов, которые вы можете сказать в любой момент, ограничено. Но люди очень легко выполняют множество задач, связанных с языком, потому что наш кортекс понимает не только слова, но предложения и контекста, в котором они произнесены. Мы предчувствуем мысли, фразы и отдельные слова. Наша кортикальная модель мира делает это автоматически.

Так что мы можем ожидать, что системы памяти, подобные кортексу, трансформируют ошибочное распознавание речи в надежное понимание речи. Вместо программирования вероятностей переходов отдельных слов, иерархическая память будет отслеживать ударения, слова, фразы, смысл и использовать их для интерпретации того, что было сказано. Подобно человеку, такая интеллектуальная машина могла бы отличать различные случаи применения речи – например, разговор между вами и вашим другом в комнате, телефонный разговор, команды редактирования для текстового редактора. Такие машина построить нелегко. Для полного понимания человеческого языка, машина должна иметь опыт и изучать, что делает человек. Так что даже если пройдет много лет, прежде чем мы сможем построить интеллектуальные машины, мы будем способны в ближайшем будущем улучшить производительность существующих систем распознавания речи, используя память, подобную кортексу.

Зрение предлагает другой набор приложений, которые ИИ не может решить, но которые интеллектуальные системы должны уметь решать. Сегодня нет машин, которые могут смотреть на естественное изображение – мир перед вашими глазами, или картинка с камеры – и описывать, что она видит. Есть несколько успешных применений машинного зрения, которое работает в очень ограниченных областях, такие как визуальное выравнивание чипов на печатной плате или сопоставление лиц по базе данных, но в настоящее время для компьютера невозможно идентифицировать различные объекты или анализировать изображение более общо. Для вас не составляет труда осмотреть комнату и найти место, где можно присесть, но не просите компьютер сделать это. Представьте, что вы смотрите на экран с изображением с камеры безопасности. Можете вы отличить человека, стучащего в дверь с подарком в руке от человека с монтировкой? Конечно можете, но такое различение за пределами способностей современных программ. Следовательно мы нанимаем человека, который следит за экраном камеры безопасности все время в поисках подозрительного. Для такого человека сложно все время оставаться начеку, тогда как интеллектуальная машина могла бы выполнять такую задачу неустанно.

В конце концов, давайте взглянем на транспортировку. Машины становятся все более сложными. У них есть GPS для отображения маршрута от A к B, сенсоры для включения фар, когда становится темно, акселерометры для срабатывания подушки безопасности, сенсоры предупреждающие о том, что вы можете наехать задним ходом на какой то предмет. Есть даже автомобили, которые ездят автономно по специальным путям или в идеальных условиях, хотя они коммерчески недоступны. Но чтобы эффективно и безопасно вести машину по любым типам дорог или в любых дорожных условиях, требуется большее, чем набор сенсоров и обратные связи контуров управления. Чтоб быть хорошим водителем, вы должны понимать дорожную обстановку, других водителей, принцип работы автомобиля, сигнальные огни и массу прочих вещей. Вы должны быть способны понимать предупреждающие знаки или отмечать, когда другая машина движется слишком опасно. Вы должны видеть поворотники другой машины и предвидеть, что она вероятно сменит полосу, или, если сигнал включен уже несколько минут, предположить, что водитель вероятно забыл, что сигнал включен и не будет менять полосу. Вы должны понять, что клубы дыма далеко впереди могут обозначать, что произошла авария и следовательно вы должны замедлить движение. Водитель видит мячик, катящийся по дороге и автоматически понимает, что за ним может выбежать ребенок, чтоб догнать его, и интуитивно жмет на тормоз.

Скажем, мы хотим построить действительно умную машину. Первое, что мы должны сделать – это выбрать набор сенсоров, которые позволили бы машине ощущать мир. Мы могли бы начать с камеры для зрения, возможно несколько камер, спереди и сзади, и микрофоны для слуха, но мы могли бы также обеспечить ее радаром или ультразвуковыми сенсорами, которые могли бы точно определять расстояние до других объектов и скорость и в светлых и в темных условиях. Суть в том, что мы не должны полагаться или ограничивать себя только теми чувствами, которые использует человек. Кортикальный алгоритм гибок, и, пока мы корректно применяем систему иерархической памяти, для нее не должно иметь значения, какие типы сенсоров мы инсталлируем. Наша машина могла бы, теоретически, быть лучше в ощущении мира дорожного движения, чем мы, потому что ее набор сенсоров может быть выбран в соответствии с задачей. Затем сенсоры были бы приделаны к достаточно большой системе иерархической памяти. Разработчики машины натренировали бы память умной машины путем демонстрации ей условий из реального мира, так чтоб она обучалась строить модель ее мира точно также, как делают люди – только более ограниченной области. (Например, машине нужно знать о дорогах, но не о лифтах или самолетах). Память машины изучила бы иерархическую структуру дорожного движения и дорог, так что она смогла бы понимать и предвидеть, что скорее всего должно произойти в ее мире движущихся автомобилей, дорожных знаков, препятствий или пересечений. Разработчики машины могли бы разработать систему памяти такую, чтоб она действительно вела машину или просто наблюдала за тем, что происходит, когда вы ведете. Он мог бы давать советы или наоборот принимать советы в сложных ситуациях, подобно советчику, который бы вас не раздражал. Как только память один раз полностью натренирована и машина может понимать и разбираться во всем, что может произойти, инженеры имели бы возможность постоянной настройки памяти, так что все машины, сходящие со сборочного конвейера вели бы себя одинаково, или они могли бы разработать память для продолжения обучения после того, как машина продана. И с помощью компьютера, но не человеком, память могла бы быть перепрограммирована обновленной версией, которая работала бы и в каких то новых ситуациях.

Я не говорю о том, что мы определенно построим умные автомобили или машины, которые будут понимать язык и обладать зрением. Но это хорошие примеры устройств, которые мы могли бы исследовать и разрабатывать, и кажется возможным построить их.

* * *

Лично меня меньше всего интересуют очевидные применения интеллектуальных машин. Для меня истинное преимущество и восхищение новыми технологиями – это найти для них применения, который были ранее невообразимыми. В каких случаях интеллектуальные машины могли бы удивить нас, и какие фантастические возможности возникли бы через некоторое время? Я уверен, что иерархическая память, подобно транзистору и микропроцессору, преобразует нашу жизнь к лучшему невероятным способом, но каким? Один способ, как мы могли бы мельком увидеть будущее интеллектуальных машин, заключается в том, чтоб подумать над аспектами хорошо масштабируемых технологий. ТО есть, какие атрибуты интеллектуальных машин будут становиться дешевле и дешевле, быстрее и быстрее, или меньше и меньше. Вещи, которые растут экспоненциально, моментально уходят за пределы нашего воображения и наиболее вероятно играют ключевую роль в наиболее радикальной эволюции технологии будущего.

Примеры технологий, которые росли экспоненциально многие годы, включают кремниевые чипы памяти, жесткие диски, технологии расшифровки ДНК, и оптоволоконные технологии. Эти моментально масштабирующиеся технологии были основой для многих новых продуктов и видов деятельности. В другой форме также хорошо масштабировалось программное обеспечение. Нужные программы, однажды написанные, могли быть скопированы множество раз и виртуально не имели стоимости.

В отличие от этого, некоторые технологии, такие как батарейки, моторы, и традиционная робототехника, плохо масштабируются. Несмотря на многочисленные усилия и неизменные улучшения, манипуляторы, построенные сегодня, не намного лучше чем построенные много лет назад. Развитие робототехники идет постепенно и скромно, ничего подобного экспоненциальным кривым роста разработки чипов или распространения программного обеспечения. Манипулятор, построенный в 1985 году за миллион долларов, не может быть построен сегодня за десять долларов. Подобным образом, сегодня батарейки не намного лучше чем они были десять лет назад. Вы могли бы сказать, что они в два или три раза лучше, но не в тысячи раз и прогресс идет очень медленно. Если бы емкость батареек возрастала с такой же скоростью, как емкость жестких дисков, то сотовые телефоны и другая электроника вообще не требовали бы зарядки, а легковесные электромобили, пробегающие тысячи миль за одну зарядку, были бы обыденностью.

Так что нам следует думать о том, какие аспекты мозгоподобной системы памяти будут масштабироваться значительно за пределы наших биологических мозгов. Эти атрибуты могут подсказать, куда в конечном счете придут технологии. Я вижу четыре атрибута, которые должны превысить наши собственные: скорость, емкость, возможность копирования и сенсорные системы.

Скорость

Тогда как нейроны работают с временами порядка миллисекунд, кремниевые чипы оперируют с временами порядка наносекунд (и также продолжают становиться быстрее). Эта разница в миллионы раз, на шесть порядков. В следствие этого между органическим и кремниевым мозгом должно быть отличие в скорости. Интеллектуальные машины будут способны думать в миллионы раз быстрее, чем человеческий мозг. Такой разум мог бы читать библиотеки целиком или изучать огромные, сложные массивы данных – задачи, которые могут занять у меня или у вас целые годы – за несколько минут, получая тот же самый результат. В этом нет ничего магического. Биологический мозг эволюционировал с двумя ограничениями по времени. Одно – это скорость, с которой нейроны могу работать, а другое – это скорость, с которой изменяется мир. Для биологического мозга было бы бесполезно думать в миллион раз быстрее, если окружающий мир изменяется медленно. Но в кортикальном алгоритме нет ничего, что заставляло бы его работать медленно. Если бы интеллектуальная машина общалась и взаимодействовала с человеком, она должна была бы замедлить свою работу до человеческой скорости. Если бы она читала книгу, переворачивая страницы, было бы ограничение на то, как быстро она могла бы читать. Но когда она взаимодействовала бы с электронным миром, она могла бы функционировать гораздо быстрее. Две интеллектуальные машины могли бы поддерживать общение в миллион раз быстрее, чем два человека. Вообразите прогресс интеллектуальных машин, которые решают математические или научные проблемы в миллион раз быстрее, чем человек. За десять секунд она могла бы выдать столько же идей по проблеме, сколько вы могли бы за месяц. Никогда не устающая, не поддающийся скуке разум на такой скорости однозначно был бы полезен в таких применениях, которые мы еще не можем вообразить.

Емкость

Несмотря на впечатляющую емкость памяти человеческого кортекса, интеллектуальные машины могу быть построены так, что превзойдут ее. Размер нашего мозга ограничен несколькими биологическими факторами, включая отношение черепа ребенка к диаметру таза матери, высокая метаболическая стоимость работающего мозга (ваш мозг всего 2 процента от вашего тела по весу, но использует около 20 процентов вдыхаемого кислорода), и низкая скорость нейронов. Но мы можем построить интеллектуальные системы памяти любого размера, и, в отличие от слепого, извилистого процесса эволюции, мы можем проявить предусмотрительность и специфические намерения к деталям дизайна. Может оказаться, что емкость человеческого неокортекса станет относительно скромной за десятилетие с текущего момента.

При построении интеллектуальных машин мы могли бы увеличить емкость их памяти несколькими способами. Увеличение глубины иерархии приведет к более глубокому пониманию – способности видеть высокоуровневые паттерны. Увеличение емкости областей позволит машине помнить больше деталей, или воспринимать с более высокой точностью, подобно тому, как у слепого человека гораздо лучше чувство осязания и слуха. Добавление новых чувств к сенсорной иерархии позволит устройству создавать лучшую модель мира, как я укажу далее.

Было бы интересно посмотреть, есть ли верхний предел того, насколько большой может стать интеллектуальная система памяти и в каких измерениях. Возможно, устройство может стать слишком хаотичным, чтоб его использовать, или оно могло бы перестать работать при достижении некоторого теоретического предела. Возможно человеческий мозг уже близок к максимальному теоретическому размеру, но мне это кажется слишком неправдоподобным. Человеческий мозг стал большим сравнительно недавно на по эволюционной временной шкале, и нет оснований полагать, что мы на некотором стабильном максимуме. Какой бы ни оказалась пиковая емкость интеллектуальной системы памяти, человеческий мозг определенно не достиг ее. Она, вероятно, не близко.

Один способ посмотреть, что такие системы могли бы сделать – это посмотреть на известные ограничения человеческой производительности. Эйнштейн несомненно был черезвычайно умным, но его мозг был все таки мозгом. Мы можем предположить, что его экстраординарная интеллектуальность была в основном следствием физических отличий его мозга и обычного человеческого мозга. Что сделало Эйнштейна таким необыкновенным, так это то, что человеческий геном не часто производит мозг, подобный его мозгу. Однако, когда мы будем разрабатывать кремниевый мозг, мы сможем его построить как захотим. Он мог бы быть уровня Эйнштейна, или даже умнее. Другой экстремальный пример – savants – могут показать нам другое возможное измерение интеллекта. Savants – это умственно отсталые люди, проявляющие замечательные способности, такие как фотографическая памяти или способность выполнять сложные математические вычисления с молниеносной скоростью. Их мозг, хотя не типичный, все еще мозг, работающие по тому же самому кортикальному алгоритму. Если нетипичный мозг может иметь ошеломляющие способности к запоминанию, то, теоретически, мы могли бы добавить эти способности нашему искусственному мозгу. Эти экстремальные ментальные человеческие способности не только показывают, что возможно воссоздать; они предоставляют направление, в котором мы могли бы превзойти наилучшие человеческие способности.

Наши рекомендации