Original on http://efgh.com/math/cayleyhamilton.htm
LOGO

Кэли-Гамильтона теорема

Philip J. Erdelsky

8 июня 2006
Переформатировано 7 июня 2012

Пожалуйста делайте по электронной почте комментарии, исправления и дополнения - на pje@efgh.com.

1. Теорема

Некоторые математические теоремы особенно красивы. Трудно сказать, что делает теорему красивой, но два свойства приходят на ум:

  1. Это просто состояние.
  2. Это трудно доказать.

На мой взгляд, одна очень красивая теорема Кэли-Гамильтона - это теорема алгебры матриц. В ней говорится, что если p(z) характеристический многочлен n✕n комплексной матрицы А, то р(А) нулевую матрицу, где сложение и умножение в его оценке обычные операции с матрицами, а также постоянный член р0 от р(z) заменяется матрицей р0 I.

Напомним , что характеристический многочлен А задается

p(z) = det(A-zI).

2. Простое, но не правильное доказательство

На данный момент, студенты иногда наивно заменяют для z в определении характеристического полинома и ложно делают заключение, что Кэли-Гамильтона теорема тривиальна:

Почему не p(A) = det(A-AI) = det(A-A) = det(O) = 0?

Есть два очевидных заблуждения. Прежде всего, zI в определении характеристического полинома представляет собой умножение матрицы на скаляр, но AI это умножение двух матриц. Более того, аргументы, приведенные выше, кажется, доказывают, что матрица равна скаляру.

На самом деле, этот аргумент справедлив в частном случае когда А представляет собой 11 матрицу, а не по существу, никакой разницы между матрицей и скалярными операциями; но в этом случае Кэли-Гамильтона теорема действительно тривиальна.

3. Аналитическое доказательство

Есть много доказательств Кэли-Гамильтона теоремы. Я должен признать, что у меня есть проблемы по большинству из них, поскольку они связаны с весьма продвинутыми - алгеброй или комбинаторикой. Более аналитический аргумент, как тот, что представлен здесь, больше подходит для моей собственной подготовки и таланта.

Это помогает выработать общий 22 случай:

    | a b |
A = |     |
    | c d |

Характеристический многочлен А :

        | a-z b   |
p(z) =  |         | = (a-z)(d-z) - bc = z2 - (a+d)z + ad - bc.
        | c   d-z |

Подставляя А для z дает:

p(A) = A2 - (a+d)*A + (ad-bc)*I =

       | a b |   | a b |           | a b |             | 1 0 |
       |     | * |     | - (a+d) * |     | + (ad-bc) * |     | =
       | c d |   | c d |           | c d |             | 0 1 |

       | a2+bc  ab+bd |     | a2+ad  ab+bd |   | ad-bc 0     |
       |              |  -  |              | + |             | =
       | ac+cd  bc+d2 |     | ac+cd  ad+d2 |   | 0     ad-bc |

       | a2+bc-a2-ad+ad-bc  ab+bd-ab-bd        |    | 0 0 |
       |                                      | =  |     |.
       | ac+cd-ac-cd        bc+d2-ad-d2+ad-bc  |    | 0 0 |

Для доказательства теоремы в общем случае, пусть λ является собственным значением А, и пусть х соответствующий собственный вектор (выраженный как вектор - столбец). затем

Ax = λx.

Используя элементарные свойства скалярных и матричных операций дает

A2x = (AA)x = A(Ax) = Ax) = λ(Ax) = λ(λx) = λ2x.

Можно показать, что в целом

[1] Akx = λkx, для k = 0, 1, 2, ... n,

где A0 = I

Пусть характеристический многочлен А

p(z) = pnzn + pn-1zn-1 + pn-2zn-2 + ... + p0.

Затем умножьте каждое уравнение в [1] выше по рк и добавить их , чтобы получить

p(A)x = p(λ)x.

Теперь р (λ) равна нулю , поскольку λ является собственным значением. Следовательно , р (А) х = 0 для каждого собственного вектора х от А.

Если А имеет п линейно независимых собственных векторов, отсюда следует , что р (А) должна быть нулевая матрица.

Если А не имеет n линейно независимых собственных векторов, то построим последовательность A 1, A 2, ... матриц, предел A, каждый из которых имеет п линейно независимых собственных векторов. Тогда, если ру(z) характеристический многочлен Ajpj(Aj) = O. Так как все коэффициенты в pj(Aj) являются непрерывными функциями матричных элементов, то же самое можно сказать и о пределе p(A).

Чтобы создать такую последовательность, достаточно построить матрицы сколь угодно близкие к А, каждая из которых имеет п линейно независимых собственных векторов.

Во-первых, нам нужна простая лемма. Матрица А, как и все комплексные матрицы, подобна верхней треугольной матрице, т.е. существует невырожденная матрица Q , для которых Q-1AQ является верхней треугольной матрицей. Этот результат хорошо известен, но простое доказательство приводится в Приложении А.

Собственные значения верхней треугольной матрицы появляются вдоль ее главной диагонали. Существует верхняя треугольная матрица Т сколь угодно близкая кQ-1AQ с п различными собственными значениями. Тогда QTQ-1 сколь угодно близко к А и имеет те же п различные собственные значения, как Т.

Матрица с п различных собственных значений имеет п различных собственных векторов. Если эти собственные векторы были линейно зависимы, они будут охватывать пространство размерности меньше п. Отображение определяется матрицей, ограничены этим пространством, будут по-прежнему иметь те же п различные собственные значений, что невозможно. Следовательно, собственные векторы линейно независимы.

4. Доказательство для коммутативных колец

Это доказывает Кэли-Гамильтона теоремы для комплексных матриц, но это также верно и для матриц для более общих коммутативных колец.

Доказательство это на самом деле довольно просто. Наш опыт доказывает случай 22 когда матрица показывает путь. Выражение для каждой записи в р(А) является многочленом от п2, которые являются записями А. Это не просто любой многочлен, но тот, который берет на себя нулевое значение для всех значений переменных. Это может произойти только тогда, когда все коэффициенты равны нулю, когда подобные выражения объединены. (Это кажется очевидным результатом, но это требует доказательства, так что это дается в приложении Б.) Следовательно, Полином вычисляется как ноль в любой другой алгебраической сущности, которая имеет все необходимые операции.

Может показаться, что кольцо должно иметь единицу. Однако, если мы воздерживаемся от подобных членов, мы будем иметь сумму одночленов, каждый из которых предваряется знаком плюс или минус. Даже в сложной области, отмена возможно только тогда, когда каждый положительный мономиал имеет соответствующий отрицательный одночлен. Они отменяются в кольце, также, даже если кольцо не имеет единицы.

Приложение A. Каждый комплекс Матрицы похож на верхнюю треугольную матрица.

Пусть А пп комплексная матрица. Покажем, индукцией по п, что она похожа на верхнюю треугольную матрицу.

При п=1 утверждение тривиально , поскольку А уже верхняя треугольная матрица.

В других случаях, пусть λ является собственным значением А и пусть х1 будет соответствующий собственный вектор. Мы можем продлить это набор х 1, х 2, ..., х п линейно независимых векторов, и пусть Q матрица, столбцы которой равны х 1, х 2, ..., х п.

Тогда , если е1 есть вектор - столбец с 1 в первой строке и нули в других местах, М е1 является первым столбцом М для любого пп матрицы М. следовательно

Q-1AQe1 = Q-1Ax1 = Q-1λx1 = λQ-1x1 = λe1,

и первый столбец Q -1AQ является Ае1. Следовательно, она может быть разделена следующим образом:

| λ  v |
|      |
| 0  B |,

где v является (п-1)-элементный вектор - строка, B является (п-1)(п-1) матрицей, а 0 все нули. По предположению индукции, R -1BR является верхней треугольной матрицей для некоторой невырожденной матрицы R, так что следующая матрица является искомой верхней треугольной матрицей , похожей на:

| 1  0  |           | 1  0 |
|       | * Q-1AQ *  |      | .
| 0  R-1 |           | 0  R |

ПРИЛОЖЕНИЕ B. Сложное полиномиальное тождество равное нулю, только если все коэффициенты равны нулю

Если полином тождественно равен нулю, то все его коэффициенты равны нулю, когда подобные выражения объединены, конечно же.

Доказательство проведем индукцией по числу независимых переменных.

Для полинома р(z) в одной переменной, мы просто заметим , чтоp(k)(0) есть k!  раз превышает коэффициент  zk. Если многочлен тождественно равен нулю, то все его производные также тождественно равна нулю, и все его коэффициенты должны быть равны нулю.

Полином п переменных могут быть перестроены, так что бы этот многочлен от одной переменной, и каждый из его коэффициентов являлся многочленом остальных переменных п-1.

В результате для одной переменной, каждый такой коэффициент равен нулю для всех значений своих независимых переменных. Следовательно, по предположению индукции все его коэффициенты равны нулю.

Хотя коэффициенты тождественно нулю комплексного полинома равен нулю, это не верно над конечными полями. Если N есть число элементов в конечном поле, то zN - z = 0 для любого элемента z поля. (Доказательство , приведенное выше ломается в этом случае. Хотя формальные производные могут быть определены, N! равен нулю, так как она появляется в формальной производной.)

линки