Классические и квантовые вычисления

Тип работы:
Курсовая
Предмет:
Программирование


Узнать стоимость

Детальная информация о работе

Выдержка из работы

Столичный Бизнес Колледж

Факультет: «КОМПЬЮТЕРНЫХ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ»

Курсовая работа

По Операционным системам и средам

На тему:

«Классические и квантовые вычисления»

Выполнил: Студент 3 курса:

Михайлов М.А.

Москва

2013 г.

Раздел № 0. Введение. Предисловие

В последние годы интерес к тому, что называется «квантовые компьютеры», необычайно возрос. Идея использования возможностей квантовой механики при организации вычислений выглядит все более привлекательной, начаты экспериментальные работы в этой области.

Однако перспективы физической реализации квантовых компьютеров пока совершенно неясны. Скорее всего, это дело нескольких десятилетий. Основные достижения в этой области носят пока чисто математический характер.

Эта книга предназначена для первоначального знакомства с математической теорией квантовых вычислений. Для удобства читателя вначале дается краткое введение в классическую теорию сложности вычислений. Затем подробно излагаются основы теории квантовых вычислений, включая описание основных известных к настоящему времени эффективных квантовых алгоритмов.

Основу книги составили материалы курса «Классическое и квантовое вычисление», прочитанного А. Шенем (классические вычисления) и А. Китаевым (квантовые вычисления) в Высшем колледже математики Независимого Московского университета в весеннем семестре 1998 г. При подготовке книги также использовались материалы курса Physics 229 — Advanced Mathematical Methods of Physics (Quantum computation), который вели Дж. Прескилл (John Preskill) и А. Китаев (при участии А. Ландала (Andrew Landahl)) в Калифорнийском технологическом институте в 1998—1999 уч. г.

Необходимые для чтения этой книги знания невелики. В сущности, достаточно знания линейной алгебры в объеме стандартного университетского курса, элементарной теории вероятностей, элементарной теории чисел и минимальных представлений о теории алгоритмов (например, иметь навыки практического программирования нетривиальных алгоритмов).

Обозначения

дизъюнкция (логическое ИЛИ)

конъюнкция (логическое И)

отрицание

сложение по модулю 2 (а также прямая сумма линейных пространств)

импликация (логическое следование)

логическая эквивалентность

множество конечных слов в алфавите

пустой символ (пробел) в алфавите машины Тьюринга

функция переходов машины Тьюринга

сводимость предикатов по Карпу (сводится к) (лекция 2)

существует такое число, что

существует такое число, что

то же самое, что

конечное поле из элементов

кольцо вычетов по модулю

аддитивная группа кольца

мультипликативная группа обратимых элементов

() -- группа характеров абелевой группы

симплектическая группа над полем размерности (лекция 14)

расширенная симплектическая группа над полем размерности (лекция 14)

множество комплексных чисел

комплексное сопряжение

группа унитарных операторов на пространстве

специальная унитарная группа на пространстве

специальная ортогональная группа на евклидовом пространстве

пространство, порожденное векторами

пространство линейных функционалов на пространстве

-я тензорная степень

пространство линейных операторов на

пространство линейных отображений из в

классический бит (множество

квантовый бит (q-бит, пространство)

бра-вектор (лекция 5)

кет-вектор (лекция 5)

скалярное произведение

эрмитово сопряженный оператор

обратимое копирование бита (Controlled NOT) (лекция 6)

обратимая функция, соответствующая булевой функции (лекция 6)

тождественный оператор на пространстве

унитарный оператор, соответствующий перестановке (лекция 6)

оператор с квантовым управлением (лекция 7)

проектор (оператор проектирования) на подпространство

базисные операторы на пространстве (лекция 14)

преобразование матриц плотности (лекция 14)

оператор, действующий на квантовый регистр (множество q-битов) (лекция 5)

частичный след от оператора по пространству (лекция 9)

норма вектора (лекция 7) или операторная норма оператора (лекция 6)

следовая норма (лекция 14)

норма для преобразований матриц плотности (лекция 14)

мощность множества или модуль числа

символ Кронекера

характеристическая функция множества

наибольший общий делитель и

сравнение по модулю

остаток по модулю

представление рационального числа в виде несократимой дроби

вероятность события

условная вероятность (в различных контекстах)

квантовая вероятность (лекция 9)

Обозначения матриц

Обозначения сложностных классов

P (лекция 1)

MA (лекция 13)

BQNP (лекция 13)

P/poly (лекция 1)

(лекция 4)

PP (лекция 8)

BPP (лекция 3)

(лекция 4)

PSPACE (лекция 1)

NP (лекция 2)

BQP (лекция 8)

Введение

Все компьютеры, начиная от так и не построенной «аналитической машины» Чарльза Бэббиджа1) и кончая Cray’ем, основаны на одних и тех же принципах. С логической точки зрения компьютер состоит из битов (переменных, принимающих значения или), а программа -- это последовательность операций, каждая из которых использует небольшое число битов. Конечно, новые компьютеры работают быстрее старых, но прогресс в этом направлении имеет предел. Трудно предположить, что размер транзистора или аналогичного элемента будет меньше см (диаметр атома водорода), а рабочая частота -- больше ~Гц (частота атомных переходов). Так что даже суперкомпьютеры будущего не смогут решать вычислительные задачи, имеющие экспоненциальную сложность. Рассмотрим, например, задачу о разложении целого числа на простые множители. Очевидный способ -- это попробовать разделить на числа от до. Если число имеет знаков в двоичной записи, то придется перебрать вариантов. Существует хитроумный алгоритм, решающий ту же задачу примерно за шагов (). Даже в этом случае, чтобы разложить на множители число из миллиона знаков, не хватит времени жизни Вселенной. (Возможно, есть и более эффективные алгоритмы, но от экспоненты, по-видимому, избавиться не удастся.)

Существует, однако, другой способ ускорить процесс вычисления для некоторых специальных классов задач. Дело в том, что обычные компьютеры не используют всех возможностей, предоставляемых природой. Это утверждение может показаться слишком очевидным: в природе есть множество процессов, совершенно непохожих на операции с нулями и единицами. Можно попытаться использовать эти процессы для создания аналоговой вычислительной машины. Например, интерференция света может использоваться для вычисления преобразования Фурье. Однако в большинстве случаев выигрыш в скорости не является принципиальным, т. е. слабо зависит от размера устройства. Причина заключается в том, что уравнения классической физики (например, уравнения Максвелла) эффективно решаются на обычном цифровом компьютере. Что значит эффективно? Вычисление интерференционной картины может занять в миллионы раз больше времени, чем реальный эксперимент, потому что скорость света велика, а длина волны мала. Однако с увеличением размера моделируемой физической системы количество необходимых вычислительных операций растет не слишком быстро -- степенным, или, как принято говорить в теории сложности, полиномиальным образом. (Как правило, число операций пропорционально величине, где -- объем, а -- время.) Таким образом, классическая физика слишком «проста» с вычислительной точки зрения.

Квантовая механика устроена в этом смысле гораздо интереснее. Рассмотрим, например, систему из спинов. Каждый спин обладает двумя базисными состояниями (и), а вся система имеет базисных состояний (каждая из переменных принимает значение или). Согласно общим принципам квантовой механики, возможными состояниями системы являются также суперпозиции вида, где -- комплексные числа, называемые амплитудами. Знак суммы здесь нужно понимать чисто формально. Суперпозиция является новым математическим объектом -- вектором в -мерном комплексном пространстве. Квадрат модуля амплитуды,, равен вероятности обнаружить систему в базисном состоянии при измерении значений переменных. (Отметим, что такое измерение разрушает суперпозицию.) Следовательно, должно выполняться условие. Итак, общее состояние системы (т.е. суперпозиция) -- это вектор единичной длины в -мерном комплексном пространстве. Изменение состояния за определенный промежуток времени описывается унитарной матрицей размера. Если промежуток времени очень мал (, где -- энергия взаимодействия), то эта матрица устроена достаточно просто; каждый из ее элементов можно легко вычислить, зная взаимодействие между спинами. Если же мы хотим узнать изменение состояния системы за большой промежуток времени, то придется перемножать такие матрицы. Для этого требуется экспоненциально большое число операций. В настоящее время неизвестно никакого способа упростить данное вычисление, скорее всего, моделирование квантовой механики является экспоненциально сложной вычислительной задачей. Однако то же самое утверждение можно сформулировать иначе: квантовая система эффективно «решает» сложную вычислительную задачу -- моделирует саму себя.

Можно ли использовать квантовые системы для решения других вычислительных задач? Какова должна быть математическая модель квантового компьютера, в той же степени не зависящая от физической реализации, что и модели классических вычислений2)? Эти вопросы, по-видимому, впервые были поставлены в книге Ю. И. Манина «Вычислимое и невычислимое» (1980 г.). Они обсуждались также в работах Р. Фейнмана и других авторов. В 1985 году Д. Дойч [27] предложил конкретную математическую модель -- квантовую машину Тьюринга, а в 1989 году -- эквивалентную, но более удобную модель -- квантовые схемы [28, 47].

Что такое квантовая схема? Пусть в нашем распоряжении имеется спинов, каждый из которых находится в отдельном ящичке и идеально изолирован от окружающего мира. В каждый момент времени мы можем выбрать, по нашему усмотрению, любые два спина и подействовать на них любой унитарной матрицей. Последовательность таких операций называется квантовой схемой. Каждая операция определяется парой номеров спинов и шестнадцатью комплексными числами, поэтому квантовую схему можно записать на бумаге. Это своего рода программа для квантового компьютера.

Чтобы использовать квантовую схему для вычисления функции3), нужно уметь вводить входные данные, проделывать вычисления и считывать результат. Ввести в квантовый компьютер последовательность нулей и единиц -- значит приготовить начальное состояние. (Объем входных данных обычно меньше общего количества «ячеек памяти», т. е. спинов,. Оставшиеся ячейки заполняются нулями.) К начальному состоянию применяется квантовая схема, зависящая от решаемой задачи, но не от конкретных входных данных. В итоге возникает квантовое состояние

зависящее от. Теперь нужно считать результат. Предполагаем, что ответ должен содержаться в первых битах строки, т. е. мы ищем такие, что. Для получения ответа производится измерение значений всех спинов. Результатом измерения может быть любая последовательность нулей и единиц, вероятность получить ее равна. Таким образом, квантовый компьютер может, с некоторой вероятностью, дать любой ответ. Квантовая схема является «правильной» для данной функции, если правильный ответ получается с вероятностью, достаточно близкой к единице. Повторив все вычисление несколько раз и выбрав тот ответ, который встречается чаще, можно снизить вероятность ошибки до сколь угодно малой величины.

Мы только что сформулировали (опуская некоторые подробности) математическую модель квантового вычисления. Теперь естественно задать два вопроса.

Для каких задач квантовое вычисление дает выигрыш по сравнению с классическим?

Какую систему можно использовать для физической реализации квантового компьютера? (Это не обязательно должна быть система спинов.)

По поводу первого вопроса сейчас известно следующее. Во-первых, на квантовом компьютере можно моделировать любую квантовую систему за полиномиальное число шагов. Это позволит (при наличии квантового компьютера) предсказывать свойства молекул и кристаллов, проектировать микроскопические электронные устройства размером в несколько десятков ангстрем. (Сейчас такие устройства находятся на пределе технологических возможностей, но в будущем они, вероятно, будут применяться в обычных компьютерах.) Второй пример -- разложение на множители и аналогичные теоретико-числовые задачи, связанные с абелевыми группами. В 1994 году П. Шор (P. Shor) придумал квантовый алгоритм4), позволяющий разложить на простые множители число из знаков за шагов (). Этот красивый результат может иметь скорее вредное, чем полезное применение: разлагая числа на множители, можно подбирать ключи к шифрам, подделывать электронные подписи и т. д. (Впрочем, трудности на пути создания квантового компьютера столь велики, что в течение ближайших 10 лет пользователи шифров могут спать спокойно.) Третий пример -- это поиск нужной записи в неупорядоченной базе данных. Здесь выигрыш не столь значителен: для нахождения одной записи из требуется порядка операций на квантовом компьютере вместо операций на классическом. На этом список известных примеров заканчивается -- не потому что квантовые компьютеры бесполезны для других задач, а потому что теория квантовых вычислений пока не разработана. Будем надеяться, что скоро появятся новые математические идеи, которые позволят придумать новые примеры.

Физическая реализация квантового компьютера -- чрезвычайно интересная, но сложная задача. Еще несколько лет назад высказывались сомнения в ее принципиальной разрешимости. Дело в том, что любое унитарное преобразование можно реализовать лишь с некоторой точностью. Кроме того, систему спинов или аналогичную квантовую систему нельзя полностью защитить от возмущений со стороны окружающей среды. Все это должно приводить к погрешностям, которые будут накапливаться в процессе вычисления. Через шагов (где -- точность каждого унитарного преобразования) вероятность ошибки станет порядка единицы. К счастью, эту трудность можно преодолеть, используя квантовые коды, исправляющие ошибки. В 1996 году П. Шор предложил схему коррекции ошибок в процессе квантового вычисления (fault-tolerant quantum computation), которая была вскоре усовершенствована. Окончательный результат состоит в следующем. Существует некоторое пороговое значение точности, такое что при возможно сколь угодно длинное квантовое вычисление. Однако при ошибки накапливаются быстрее, чем их удается исправлять. По разным оценкам, лежит в интервале от до (точное значение зависит от характера возмущений и используемой схемы коррекции ошибок).

Итак, принципиальных препятствий для реализации квантового компьютера нет. Однако задача столь трудна, что ее можно сравнить с задачей об управляемом термоядерном синтезе. В самом деле, необходимо удовлетворить нескольким почти несовместимым требованиям.

Элементы квантового компьютера -- квантовые биты (спины или что-то подобное) -- должны быть изолированы друг от друга и от окружающей среды.

Необходимо иметь возможность избирательного воздействия на пару квантовых битов. (Возможно, потребуется несколько типов воздействия на одну и ту же пару, описываемых различными унитарными операторами.)

Каждый из унитарных операторов должен быть реализован с точностью (см. выше).

Реализуемые операторы должны быть достаточно нетривиальны. Точнее говоря, они должны образовывать полный базис, чтобы любой другой оператор в определенном смысле выражался через них.

В настоящее время существует несколько подходов к проблеме реализации квантового компьютера.

Отдельные атомы или ионы. Это первая и наиболее хорошо разработанная идея, она существует в нескольких вариантах. Для представления квантового бита можно использовать как обычные электронные уровни, так и уровни тонкой и сверхтонкой структуры. Имеется экспериментальная техника, позволяющая удерживать отдельный ион или атом в ловушке из постоянного магнитного или переменного электрического поля в течение длительного времени (порядка 1 часа). Ион можно «охладить» (т.е. погасить колебательное движение) при помощи лазерного луча. Подбирая длительность и частоту лазерных импульсов, можно приготовить произвольную суперпозицию основного и возбужденного состояний. Таким образом, управлять отдельным ионом достаточно легко. В ловушку можно также поместить два или большее число ионов на расстоянии несколько микрон друг от друга и управлять каждым из них в отдельности. Однако организовать взаимодействие между ионами достаточно трудно. Для этой цели предложено использовать коллективные колебательные моды ионов (обычные механические колебания с частотой в несколько мегагерц). Другой способ (для нейтральных атомов): поместить атомы в отдельные электромагнитные резонаторы, связанные друг с другом (пока непонятно, как это реализовать технически). Наконец, третий способ: при помощи нескольких лазерных лучей можно создать периодический потенциал («оптическую решетку»), удерживающий невозбужденные атомы. При этом возможна ситуация, когда возбужденные атомы могут свободно двигаться. Таким образом, возбуждая на короткое время один из атомов, мы заставляем его взаимодействовать с соседями. Это направление экспериментальной физики сейчас быстро развивается и, по-видимому, имеет большие перспективы.

Ядерный магнитный резонанс. В молекуле с несколькими различными ядерными спинами произвольное унитарное преобразование можно реализовать при помощи последовательности импульсов магнитного поля. Это было проверено экспериментально при комнатной температуре. Однако для приготовления начального состояния необходима температура < K. Помимо трудностей с охлаждением, при такой температуре возрастают нежелательные взаимодействия молекул друг с другом. Кроме того, непонятно, как избирательно воздействовать на данный спин, если в молекуле есть несколько одинаковых спинов.

Системы сверхпроводящих гранул. При сверхнизких температурах единственной степенью свободы микроскопической сверхпроводящей гранулы (диаметром в несколько сотен ангстрем) является ее заряд. Он может изменяться на величину, кратную двум зарядам электрона (поскольку электроны в сверхпроводнике связаны в пары). Меняя внешний электрический потенциал, можно добиться такой ситуации, когда два зарядовых состояния будут иметь почти одинаковую энергию. Эти два состояния можно использовать в качестве базисных состояний квантового бита. Гранулы взаимодействуют между собой посредством джозефсоновских контактов и взаимной электрической емкости. Этим взаимодействием можно управлять. Основная трудность состоит в том, что нужно управлять каждой гранулой в отдельности, причем с высокой точностью. По-видимому, этот подход перспективен, но для его реализации потребуется создание новой технологии.

Анионы. Анионы -- это особые возбуждения в двумерных квантовых системах, в частности, в двумерной электронной жидкости в магнитном поле. Один из авторов (А.К.) считает этот подход наиболее интересным (поскольку он же его и придумал [32]), поэтому опишем его более подробно.

Основной проблемой при создании квантового компьютера является необходимость реализации унитарных преобразований с точностью. Для этого, как правило, требуется контролировать параметры системы с еще большей точностью. Однако можно представить ситуацию, когда высокая точность достигается автоматически, т. е. исправление ошибок происходит на физическом уровне. Примером являются двумерные системы с анионными возбуждениями.

Все частицы в трехмерном пространстве являются либо бозонами, либо фермионами. Волновая функция бозонов не меняется при перестановке двух частиц, а волновая функция фермионов умножается на. В любом случае при возвращении каждой из частиц на прежнее место состояние системы не меняется. В двумерных системах возможно более сложное поведение. Прежде всего заметим, что речь пойдет не об элементарных частицах типа электрона, а о возбуждениях, или дефектах в двумерной электронной жидкости. Такие возбуждения похожи на «настоящие» (т.е. элементарные) частицы, но обладают некоторыми необычными свойствами. Возбуждение может иметь дробный электрический заряд (например, от заряда электрона). При движении одного возбуждения вокруг другого состояние окружающей их электронной жидкости меняется строго определенным образом, зависящим от типа возбуждений и от топологии пути, но не от конкретной траектории. В простейшем случае волновая функция домножается на число (для анионов в двумерной электронной жидкости в магнитном поле при факторе заполнения). Возбуждения с таким свойством называются абелевыми анионами. Другой пример абелевых анионов описан (на математическом языке) в разделе 14.1.

Более интересны неабелевы анионы, которые пока не наблюдались экспериментально. (Теория предсказывает существование неабелевых анионов в двумерной электронной жидкости в магнитном поле при факторе заполнения .) При наличии нескольких неабелевых анионов состояние электронной жидкости является вырожденным, причем кратность вырождения экспоненциально зависит от числа анионов. Другими словами, существует не одно, а много состояний, которые могут образовывать произвольные квантовые суперпозиции. На такую суперпозицию нельзя никак воздействовать, не перемещая анионы, поэтому она идеально защищена от возмущений. Если обвести один анион вокруг другого, суперпозиция подвергнется определенному унитарному преобразованию. Это преобразование является абсолютно точным. (Ошибка может возникнуть, только если анион «вырвется у нас из рук» вследствие квантового туннелирования).

На первый взгляд, проект с использованием анионов выглядит наименее реалистично. Прежде всего, абелевы анионы не годятся для квантовых вычислений, а неабелевы еще только предстоит найти в эксперименте. Для реализации квантового компьютера нужно контролировать каждую из частиц, которые будут двигаться на расстояниях порядка долей микрона друг от друга. Это чрезвычайно сложная техническая задача. Однако, с учетом высоких требований к точности, осуществить любой из перечисленных выше подходов ничуть не легче. Кроме того, идея топологического квантового вычисления, лежащая в основе подхода с анионами, может воплотиться каким-либо другим способом. Например, защищенная от возмущений квантовая степень свободы может возникнуть на конце «квантовой проволоки» (одномерного проводника с нечетным числом распространяющихся электронных мод, находящегося в контакте с трехмерным сверхповодником).

Итак, идея квантового компьютера выглядит столь же заманчиво, сколь нереалистично. Наверное, так же воспринимался проект обычного компьютера во времена Чарльза Бэббиджа, изобретение которого было реализовано лишь сто лет спустя. Будем надеяться, что в наше время научно-технический прогресс идет быстрее, поэтому не придется ждать так долго. Возможно, достаточно одной свежей идеи плюс несколько лет на разработку новой технологии

Раздел № 1. Алгоритм

Тема 1.1 Что такое алгоритм?

Неформально алгоритм -- это однозначно определенная совокупность инструкций по преобразованию исходных данных в результат, причем все инструкции элементарны, т. е. при их выполнении «нам придется только механически следовать предписаниям, как если бы мы были роботами: от нас не потребуется ни понимания, ни искусства, ни изобретательности» [5, с. 270]. Формализовать это понятие можно различными способами.

Обычно подразумевается, что каждый алгоритм решает какую-то вычислительную задачу. С формальной точки зрения, вычислительная задача — это функция

F: входные данные результат,

Что такое «входные данные» и «результат»? Рассмотрим, например, задачу об умножении двух многочленов с целыми коэффициентами. Тогда входные данные — это пара многочленов. Проблема в том, как записать эти многочлены, чтобы их можно было ввести в компьютер. Машины Тьюринга, которые мы рассматриваем ниже, понимают лишь конечные последовательности символов (слова) из некоторого конечного множества, называемого внешним алфавитом. Поэтому строгая формулировка вычислительной задачи должна включать в себя алфавит и способ кодировки входных данных. Например, можно записать пару многочленов с использованием 10 цифр, символа переменной, знаков +, -, * и скобок: (x**2−5)(-4*x+1). В другой кодировке коэффициенты записываются в двоичной системе счисления и перечисляются через запятую; два многочлена разделяются звездочкой: 1, 0, -101* -100, 1. Таким образом, мы имеем две различные вычислительные задачи. С практической точки зрения, обе задачи эквивалентны, поскольку перевод из одной кодировки в другую осуществляется с помощью полиномиального алгоритма. Пока определения полиномального алгоритма у нас нет, давайте будем формалистами: вычислительная задача — это частичная1) функция (где обозначает множество конечных слов в алфавите). Потом мы позволим себе некоторую вольность и будем говорить о задаче умножения многочленов или разложения целого числа на множители, имея ввиду, что все разумные кодировки эквивалентны (т.е. переводятся друг в друга при помощи полиномиальных алгоритмов). Однако нужно помнить, что не всякая кодировка является «разумной». Нехорошо, например, представлять натуральное число набором из звездочек, потому что длина такой записи экспоненциально велика по сравнению с двоичной или десятичной записью. Заметим также, что в некоторых задачах нет хорошего выбора «разумной» кодировки, в таких случаях (они нам не встретятся) необходимо указывать кодировку всякий раз, когда формулируется задача.

Теперь дадим формальное определение алгоритма.

Машины Тьюринга.

Машина Тьюринга (сокращенно МТ) однозначно задается указанием набора, где, , -- конечные множества, причем; -- некоторый элемент; -- некоторый элемент, а -- некоторая (частичная, вообще говоря) функция из в.

Составляющие части МТ называются так:

-- алфавит,

-- пустой символ (или пробел),

-- внешний алфавит,

-- множество состояний управляющего устройства,

-- начальное состояние,

-- функция переходов.

Состояние МТ задается тройкой, где -- бесконечное слово в алфавите, т. е. произвольная последовательность элементов; -- неотрицательное целое число;. Символы слова будем, как это принято, представлять записанными на ленте, разбитой на ячейки, по ячейке на символ. На ленте также имеется головка, которая расположена над ячейкой с номером. Наглядно это изображается так:

Рисунок 1. 1: Лента, разбитая на ячейки

Помимо ленты машина Тьюринга имеет управляющее устройство, состояние которого задается элементом множества.

Состояния МТ меняются дискретно. За один такт работы управляющее устройство выполняет следующие действия (полагаем, что МТ находится в состоянии):

читает символ, находящийся под головкой (т.е. определяет);

вычисляет значение функции переходов: (если функция переходов на паре не определена, то останавливает машину Тьюринга);

записывает на ленту в ячейку символ, сдвигает головку на и переходит в состояние (другими словами, новое состояние машины задается тройкой);

если, то останавливает машину.

Пожалуй, всякий согласится, что эти действия не требуют ни понимания, ни искусства, ни изобретательности.

Работа машины Тьюринга будет всегда начинаться из состояния, где за конечным словом, состоящим из символов внешнего алфавита (множество таких слов обозначается), следует бесконечное слово, целиком состоящее из пустых символов. Слово будем называть входом МТ. В любой момент времени слово, записанное на ленте, однозначно записывается в виде, где последний символ слова -- не пустой, а за ним идут только пустые символы. Будем называть слово используемой частью ленты.

Выполняя один такт работы за другим, машина Тьюринга порождает последовательность состояний

Если МТ останавливается, используемая часть ленты в достигнутом перед остановкой состоянии называется результатом работы МТ.

Тема 1.2 Вычислимые функции и разрешимые предикаты

Каждая машина Тьюринга вычисляет частичную функцию из в, отображающую вход в результат работы МТ на входе при условии, что результат работы является словом во внешнем алфавите. Для входов, на которых машина не останавливается или результат содержит символы из, функция не определена. Из определения ясно, что любая МТ вычисляет ровно одну функцию (быть может, нигде не определенную).

Определение 1.1 Частичная функция из в называется вычислимой, если существует машина Тьюринга, для которой. При этом будем говорить, что вычислима на.

Не все функции вычислимы. Это ясно из сравнения мощности множества функций (континуум) и мощности множества машин Тьюринга (счетное множество). Более интересные примеры см. в задачах 1. 3−1.5.

Под предикатом будем понимать некоторое условие, которое выполняется (предикат истинен) или не выполняется (предикат ложен) для каждого слова из. Определенные таким образом, предикаты легко отождествляются с языками (подмножествами слов в) -- предикату соответствует множество слов, на которых он истинен. Каждому предикату сопоставим характеристическую функцию, которая равна 1 на множестве слов, для которых предикат истинен, и равна 0 на множестве слов, для которых предикат ложен. Мы будем обозначать характеристическую функцию так же, как и сам предикат. Предикат разрешим, если его характеристическая функция вычислима. О машине Тьюринга, вычисляющей характеристическую функцию предиката, будем говорить, что она дает ответ («да» или «нет») на вопрос «истинно ли значение предиката на входе ?»

Понятия вычислимой функции и разрешимого предиката будут использоваться и для функций (предикатов) от многих переменных.

Пусть -- некоторый алфавит, а -- натуральное число. Пусть -- машина Тьюринга с внешним алфавитом. Построим частичную функцию из в так:, если результат работы машины на входе совпадает со словом. Если машина не останавливается или на ленте записано что-нибудь не то (например, символы не из алфавита и т. п.), то не определена.

Определение 1.2. Частичная функция из в называется вычислимой, если существует машина Тьюринга, для которой.

Предикат от нескольких переменных разрешим, если его характеристическая функция вычислима.

Нас будут интересовать ресурсы, требующиеся для вычислений. Два важнейших ресурса -- время и память. Будем говорить, что машина Тьюринга работает за время, если максимальное (по всем входам длины) количество тактов, которое проработает до остановки, равно. Аналогично, машина Тьюринга работает на памяти, если наиболее удаленное от начала ленты положение головки при вычислениях на входах длины равно.

Вычисления на машинах Тьюринга.

Очевидно, что МТ задает алгоритм в смысле приведенного выше неформального определения. Обратное утверждение называется тезисом Черча:

«любой алгоритм может быть реализован машиной Тьюринга»

Не вдаваясь в обсуждение тезиса Черча, заметим, что в настоящее время нет серьезных оснований подвергать его сомнению. Все известные в настоящее время алгоритмы реализуются машинами Тьюринга. Подробное изложение теории алгоритмов читатель может найти в книгах [1, 5, 6, 10, 13, 16, 17]. Мы же ограничимся краткими неформальными пояснениями приемов программирования на машинах Тьюринга.

Возможности машины Тьюринга при таком неформальном обсуждении -- это возможности человека с ограниченной памятью, карандашом и ластиком, которому вручили неограниченной (бесконечной) толщины тетрадь. Страницы тетради имеют ограниченный размер (все возможные варианты заполнения страницы образуют алфавит МТ при строгом описании). На первых страницах тетради записано входное слово -- по одному символу (из внешнего алфавита) на страницу. Человек может листать тетрадь, стирать символы, записывать новые. Заканчивается эта его деятельность тем, что он закрывает тетрадь (сдвиг головки влево в положении 0) и возвращает результат своей работы.

Представив себя в такой ситуации, легко сообразить, что можно, запоминая несколько символов, выполнять любые действия на ограниченном количестве подряд идущих страниц; можно ставить на страницах дополнительные пометки (ограниченное количество на каждой); можно листать тетрадь, пока не найдется нужная пометка; можно копировать символы на свободные страницы тетради. Свободные места на страницах можно также использовать для хранения вспомогательных слов произвольной длины (как и входное слово, они записываются по одному символу на страницу), над которыми может поработать другой человек (это называется «вызов подпрограммы»). В частности, эти вспомогательные слова позволяют поддерживать счетчики (целочисленные переменные). Используя счетчики, можно адресоваться к ячейкам памяти по их номеру.

Поскольку описание любой машины Тьюринга является конечным объектом, его можно закодировать словом в некотором алфавите. В нашей неформальной ситуации легко понять, что существует универсальная машина Тьюринга, которая, получая на вход пару, дает выход. Здесь через обозначено описание некоторой машины Тьюринга. Действительно, предположим, что тетрадь начинается со страниц, где записаны инструкции по работе. Тогда выполнять эти инструкции можно следующим образом: пометим текущую страницу; пролистаем тетрадь до начального раздела, содержащего инструкции; найдем нужную инструкцию; вернемся назад и выполним ее.

Сложностные классы.

Не для всякой вычислимой функции можно реально осуществить вычисление ее значения. Существование алгоритма не означает, что нам по силам проделать все предписанные действия. Препятствие может заключаться в том, что требуемые для этого вычисления ресурсы слишком велики. Поэтому нас интересует не столько существование алгоритма для решения задачи, сколько существование эффективного алгоритма.

Формализовать это понятие непросто. Принятый сейчас способ состоит в том, что выделяются классы тех функций или предикатов, вычисление которых возможно при задаваемых ограничениях на потребляемые ресурсы. Принадлежность функции тому или иному сложностному классу служит удобной характеристикой возможностей ее эффективного вычисления, не связанной с конкретными реализациями алгоритмов.

Наиболее важные классы получаются, если накладывать ограничения на рост времени работы и/или используемой памяти в зависимости от длины входного слова. А наиболее важное различие между эффективными и неэффективными вычислениями задается функциями полиномиального роста. Функция -- полиномиального роста, если для некоторой константы при достаточно больших выполняется неравенство. В этом случае будем использовать обозначение.

Определение 1.3. Предикат на множестве принадлежит классу (и называется полиномиально вычислимым), если его характеристическая функция вычислима на машине Тьюринга, для которой.

Определение 1.4. Предикат на множестве принадлежит классу, если его характеристическая функция вычислима на машине Тьюринга, для которой.

По аналогии с предикатами можно определить и функции, вычислимые за полиномиальное время, и функции, вычислимые на полиномиальной памяти. Для классов таких функций также используются обозначения и, так что точный смысл этих обозначений нужно восстанавливать из контекста.

Тема 1.3 Схемы

Схема (булева) -- это способ вычислить функцию. Помимо исходных переменных, для которых вычисляется значение, схема использует некоторое количество вспомогательных переменных и некоторый набор (базис) булевых (т.е. принимающих значения 0 или 1) функций. Схема в базисе определяется последовательностью присваиваний. Каждое присваивание имеет вид, где, а переменная () -- это либо одна из исходных переменных (), либо вспомогательная переменная с меньшим номером (). Таким образом, для каждого набора значений исходных переменных последовательное выполнение присваиваний, входящих в схему, однозначно определяет значения всех вспомогательных переменных. Результатом вычисления считаются значения последних переменных.

Схема вычисляет функцию, если для любых значений исходных переменных результатом вычисления является.

Схема называется формулой, если каждая вспомогательная переменная используется в правой части присваиваний только один раз. (Обычные математические формулы именно так задают последовательность присваиваний: «внутри» формул не принято использовать ссылки на их части или другие формулы.)

Схему можно также представлять в виде ориентированного ациклического графа, у которого вершины входной степени 0 (входы) помечены исходными переменными; остальные вершины (функциональные элементы) помечены функциями из базиса (при этом входная степень вершины должна совпадать с количеством аргументов ее пометки); ребра помечены числами, указывающими номера аргументов; вершины выходной степени 0 (выходы) помечены переменными, описывающими результат работы схемы. Вычисление на графе определяется индуктивно: как только известны значения всех вершин, из которых ведут ребра в данную вершину, вершина получает значение, где -- базисная функция, которой помечена вершина. При переходе к графу схемы мы опускаем несущественные присваивания, которые ни разу не используются на пути к выходным вершинам, так что они никак не влияют на результат вычисления.

Базис называется полным, если для любой булевой функции есть схема в этом базисе, вычисляющая. Ясно, что в полном базисе можно вычислить произвольную функцию (такую функцию можно представить как упорядоченный набор из булевых функций).

Булева функция может быть задана таблицей значений. Приведем таблицы значений для трех функций

(отрицание, дизъюнкция, конъюнкция), образующих полный базис, который будем считать стандартным. В дальнейшем имеются в виду схемы именно в этом базисе, если явно не указано что-либо иное.

Конъюнкция и дизъюнкция определяются для произвольного числа булевых переменных аналогичным образом: конъюнкция равна 1 только тогда, когда все аргументы равны 1, а дизъюнкция равна 0 только тогда, когда все аргументы равны 0. В стандартном базисе они очевидным образом вычисляются схемами (и даже формулами) размера.

Теорема 1.1. Базис -- полный.

Доказательство. Литералом будем называть переменную или ее отрицание. Конъюнкцией литералов (это схема и даже формула) легко представить функцию, которая принимает значение 1 ровно один раз: при. Если, включаем в конъюнкцию переменную, если, то включаем в конъюнкцию. Произвольная функция может быть представлена в виде

(1. 1)

В таком случае говорят, что представлена в дизъюнктивной нормальной форме (ДНФ), т. е. как дизъюнкция конъюнкций литералов1) Как уже говорилось, дизъюнкция нескольких переменных выражается формулой в стандартном базисе.

Размером схемы называется количество присваиваний в схеме. Минимальный размер схемы в базисе, вычисляющей функцию, называется схемной сложностью функции в базисе и обозначается. Переход от одного полного конечного базиса к другому полному конечному базису меняет схемную сложность функций на множитель. Так что в асимптотических оценках выбор конкретного полного базиса неважен и поэтому будем использовать обозначение для схемной сложности в конечном полном базисе.

Каждый предикат на множестве определяет последовательность булевых функций следующим образом:, где справа стоит характеристическая функция предиката.

Определение 1.5. Предикат принадлежит классу, если.

Теорема 1.2..

Если МТ работает за полиномиальное время, то и память, которую она использует, ограничена полиномом. Поэтому весь процесс вычисления на входном слове длины можно представить таблицей вычисления размера, где, .

Рисунок 1. 2: Процесс вычисления

Строка с номером таблицы задает состояние МТ после тактов работы. Символы, записанные в таблице, принадлежат алфавиту. Символ определяет пару (символ, записанный в -й ячейке после тактов работы; состояние управляющего устройства после тактов работы, если головка находится над -й ячейкой, в противном случае второй элемент пары --). Для простоты также считаем, что если вычисление заканчивается при некотором входе за тактов, то строки c номерами, большими, повторяют строку с номером.

Построить схему, вычисляющую значения предиката на словах длины, можно следующим образом. Состояние каждой клетки таблицы можно закодировать конечным (не зависящим от) числом булевых переменных. Имеются локальные правила согласования, т. е. состояние каждой клетки в строке ниже нулевой однозначно определяется состояниями клеток в предыдущей строке, лежащих непосредственно над данной (), левее данной () и правее данной (). Каждая переменная, кодирующая состояние клетки, есть функция от переменных, кодирующих состояния клеток, ,. Все эти функции могут быть вычислены схемами конечного размера. Объединяя эти схемы, получим схему, вычисляющую все переменные, кодирующие состояния клеток таблицы; размер этой схемы будет.

Осталось заметить, что переменные, кодирующие часть клеток нулевой строки, определяются входным словом, а переменные, кодирующие остальные клетки нулевой строки, являются константами. Чтобы узнать результат вычисления, нужно определить символ, записанный в нулевой ячейке ленты в конце вычисления. Без ограничения общности можно считать, что состояния клеток таблицы кодируются так, что одна из кодирующих переменных равна 1 только в том случае, когда в ячейке записана 1. Тогда значение этой переменной для кода и будет результатом вычисления.

Замечание 1.1. Класс шире класса. Любой функции от натурального аргумента со значениями в можно сопоставить предикат по правилу, где обозначает длину слова. Ограничение такого предиката на слова длины тождественно равно 0 или 1 (в зависимости от). Схемная сложность таких функций ограничена константой. Поэтому все такие предикаты по определению принадлежат P/poly, хотя среди них есть и неразрешимые предикаты.

Справедливо следующее усиление теоремы.

Теорема 1.3. принадлежит тогда и только тогда, когда

существует МТ, которая по числу за время строит схему вычисления.

Доказательство. Данное в доказательстве теоремы 1.2. описание нетрудно превратить в МТ, которая строит схему вычисления за полиномиальное по время (схема имеет простую структуру: каждая переменная связана с предыдущими одними и теми же правилами согласования).

Столь же просто. Вычисляем размер входного слова. Затем строим по этому размеру схему вычисления, используя указанную в условии 2 машину. После этого вычисляем на машине, которая по описанию схемы и значениям входных переменных вычисляет значение схемы за полиномиальное от длины входа время.

Задачи

Постройте машину Тьюринга, которая записывает входное двоичное слово в обратном порядке.

Постройте машину Тьюринга, которая складывает два числа, записанные в двоичной системе. Для определенности считайте, что записи чисел разделены специальным символом алфавита ««.

Докажите, что не существует алгоритма, который по машине Тьюринга и входу определяет, остановится ли она на этом входе.

Докажите, что не существует алгоритма, который выписывает одну за другой все машины Тьюринга, которые не останавливаются, будучи запущенными на пустой ленте.

Пусть -- максимальное время, которое может пройти до остановки машины Тьюринга с состояниями и символами алфавита, если ее запустить на пустой ленте. Докажите, что функция растет быстрее любой вычислимой всюду определенной функции, то есть.

Набор элементарных инструкций у описанных выше машин Тьюринга крайне беден. Имеются разнообразные их обобщения, например, многоленточные машины Тьюринга. В отличие от описанной выше, такая МТ имеет несколько (конечное множество) лент, каждая со своей головкой, управляющему устройству доступны символы, находящиеся в ячейках, на которых расположены головки лент. Выделены две ленты: входная, с которой разрешается только читать символы, и выходная, на которую разрешается только писать символы. Остальные ленты называются рабочими. Многоленточная машина называется -ленточной, если у нее рабочих лент. Действие за такт работы состоит в изменении состояния управляющего устройства, изменении символов в ячейках под головками и изменении положений головок на лентах (каждая головка сдвигается не более, чем на одну позицию). Это действие однозначно определяется состоянием управляющего устройства и набором символов в ячейках под головками. Если действие выполнить нельзя, машина останавливается.

В начале работы многоленточной машины Тьюринга все ленты пусты, кроме входной, на которой записан вход. Результат работы машины -- состояние выходной ленты в конце работы.

Если интересоваться сложностью алгоритмов с точностью до полиномиально ограниченного множителя, многоленточные машины ничего не добавляют по сравнению с описанными выше машинами с единственной лентой.

Докажите, что двухленточную машину Тьюринга, работающую за время на входах длины, можно моделировать на машине с единственной лентой за время.

Докажите, что трехленточную машину Тьюринга, работающую за время на входах длины, можно моделировать на двухленточной за время.

Пусть -- машина Тьюринга с единственной лентой, которая копирует входное слово (приписывая его копию справа от самого слова). Пусть -- максимальное время ее работы на входах длины. Докажите, что для некоторого и для всех. Что можно сказать про, которое есть минимальное время ее работы на входах длины ?

Рассмотрим язык программирования, в котором есть всего натуральных переменных, разрешенные операции -- прибавление и вычитание, разрешенная проверка -- не равна ли переменная нулю. Разрешено использовать if-then-else и while, но рекурсия не разрешена. Докажите, что с помощью программ на таком языке программирования можно вычислять любую вычислимую функцию.

Постройте алгоритм, определяющий, является ли данный базис полным. Базисные функции заданы таблицами значений.

Пусть есть максимум сложности по всем булевым функциям от переменных. Докажите, что при достаточно больших.

Глубиной схемы называется максимальное число элементов на пути от входов к выходу. Покажите, что любую функцию можно вычислить схемой глубины не более из элементов и из элементов и с произвольным числом входов.

Докажите, что если из схемы глубины, вычисляющей функцию, выбросить все несущественные присваивания, то полученная схема имеет полиномиальный по размер.

Постройте схему, которая сравнивает два -битовых числа и имеет размер, а глубину.

Постройте схему сложения двух -битовых чисел размера.

Тот же вопрос, если дополнительно потребовать, чтобы глубина схемы была.

Функция равна 1 на двоичных словах, в которых число единиц больше числа нулей, и 0 -- на остальных словах. Постройте схему, вычисляющую эту функцию, размер схемы должен быть линеен по, глубина --.

Постройте схему размера и глубины, которая проверяет, связаны ли путем две вершины в графе. Граф на вершинах, которые помечены числами от 1 до, задается булевыми переменными. Переменная, где, определяет, есть ли в графе ребро, соединяющее вершины и.

Пусть схема глубины из элементов и из элементов и с произвольным числом входов вычисляет сложение битов по модулю (функция). Покажите, что размер схемы не меньше для некоторого.

Пусть -- последовательность булевых функций от аргументов. Покажите, что следующие два свойства равносильны:

существует последовательность вычисляющих эти функции формул, размер которых не превосходит полинома от;

существует последовательность вычисляющих эти функции схем глубины из элементов, и (с двумя входами).

Докажите, что существует разрешимый предикат, который принадлежит, но не принадлежит.

Раздел № 2. Класс NP: сводимость и полнота

Тема 2.1 Класс NP

Термин «недетерминированный» неудачный, но он уже стал стандартным.

Класс NP определен только для предикатов. Говорят, например, что «свойство графа «иметь гамильтонов цикл1) «принадлежит NP».

Мы дадим несколько определений этого класса. Первое использует понятие недетерминированной машины Тьюринга. Устройство недетерминированной машины (НМТ) такое же, как и обычной (детерминированной), за одним исключением. У управляющего устройства НМТ есть особые недетерминированные состояния. Находясь в таком состоянии, НМТ может выполнить одно из нескольких действий. Поэтому у НМТ вместо функции переходов есть таблица, в которой для каждой пары (состояние управляющего устройства, текущий символ на ленте) вместо единственно возможного варианта действий (изменение состояния управляющего устройства, запись символа на ленту, сдвиг головки) указан набор возможных действий. Обычные, детерминированные, состояния становятся частным случаем, когда такой набор состоит ровно из одного варианта действий.

Путь вычисления НМТ определяется выбором одного из возможных переходов на каждом такте работы. Недетерминированность приводит к тому, что путей вычисления для НМТ, работающей на данном входном слове, оказывается много.

Определение 2.1. Предикат принадлежит классу, если существуют НМТ и полином такие, что

существует путь вычисления, дающий ответ «да» за время, не превосходящее;

(1 вариант определения) нет указанного выше пути; (2 вариант определения) на любом пути вычисления ответа «да» не получается.

Замечание 2.1. Приведенные варианты определения эквивалентны. Чтобы исключить возможность ответов «да» на длинных путях вычисления, достаточно взять НМТ, имитирующую исходную НМТ и подсчитывающую количество сделанных исходной НМТ шагов. Когда число шагов превышает, машина останавливается.

Замечание 2.2. В предыдущем рассуждении допущена одна тонкая ошибка. В определении ничего не сказано о полиноме, кроме факта его существования. Если коэффициенты полинома невычислимы, могут возникнуть проблемы с указанным выше способом сведения одного определения к другому (нужно вычислить значение полинома). Чтобы в дальнейшем избегать этой сложности, будем считать, что полином имеет целые коэффициенты.

Замечание 2.3. Непосредственно из определения 2.1 следует, что. Является ли это включение строгим? Довольно интенсивные, хотя и безуспешные, попытки ответить на этот вопрос продолжаются уже почти 30 лет. Недавно С. Смейл включил проблему в число трех важнейших математических проблем следующего столетия (две другие -- гипотеза Римана и гипотеза Пуанкаре).

Второе определение класса NP представляется более естественным. Оно использует понятие полиномиально вычислимого предиката от двух переменных. Определение такого предиката получается комбинацией определений 1.2 и 1.3. Под размером входа для предиката можно понимать также или, или -- получатся эквивалентные определения.

Определение 2.2. Предикат принадлежит классу NP, если он представим в форме, где -- полином, а.

Пример 2.1. Пусть «есть гамильтонов цикл в графе «. Более точно нужно сказать так: «есть двоичный код некоторого графа, а -- код гамильтонова цикла в этом графе (используем такое кодирование, при котором код цикла не длиннее кода графа), такие что «. Возьмем. Тогда будет в точности означать, что в графе найдется гамильтонов цикл.

Теорема 2.1. Определения 2.1 и 2.2 эквивалентны.

ПоказатьСвернуть
Заполнить форму текущей работой