В этом параграфе мы остановимся на специальном, но важном классе положительных квадратичных форм.
Определение 3. Вещественная квадратичная форма называется неотрицательной (неположительной), если при любых вещественных значениях переменных
. (35)
В этом случае симметрическая матрица коэффициентов называется положительно полуопределенной (отрицательно полуопределенной).
Определение 4. Вещественная квадратичная форма называется положительно определенной (отрицательно определенной), если при любых не равных одновременно нулю вещественных значениях переменных
. (36)
В этом случае матрица также называется положительно определенной (отрицательно определенной).
Класс положительно определенных (отрицательно определенных) форм является частью класса неотрицательных (соответственно неположительных) форм.
Пусть дана неотрицательная форма . Представим ее в виде суммы независимых квадратов:
. (37)
В этом представлении все квадраты должны быть положительными:
. (38)
Действительно, если бы какое-либо было , то можно было бы подобрать такие значения , при которых
Но тогда при этих значениях переменных форма имела бы отрицательное значение, что по условию невозможно. Очевидно, что и обратно, из (37) и (38) следует положительность формы .
Таким образом, неотрицательная квадратичная форма характеризуется равенствами .
Пусть теперь – положительно определенная форма. Тогда и неотрицательная форма. Поэтому она представима в виде (37), где все положительны. Из положительной определенности формы следует, что . Действительно, в случае можно подобрать такие не равные одновременно нулю значения , при которых все обращались бы в нуль. Но тогда в силу (37) при , что противоречит условию (36).
Легко видеть, что и обратно, если в (37) и все положительны, то – положительно определенная форма.
Другими словами, неотрицательная форма тогда и только тогда является положительно определенной, когда она не сингулярна.
Следующая теорема дает критерий положительной определенности формы в виде неравенств, которым должны удовлетворять коэффициенты формы. При этом используются уже встречавшиеся в предыдущих параграфах обозначения для последовательных главных миноров матрицы :
.
Теорема 3. Для того чтобы квадратичная форма была положительно определенной, необходимо и достаточно, чтобы выполнялись неравенства
Доказательство. Достаточность условий (39) следует непосредственно из формулы Якоби (28). Необходимость условий (39) устанавливается следующим образом. Из положительной определенности формы следует положительная определенность «урезанных» форм
.
Но тогда все эти формы должны быть несингулярны, т. е.
Теперь мы имеем возможность воспользоваться формулой Якоби (28) (при ). Поскольку в правой части этой формулы все квадраты должны быть положительными, то
Отсюда следуют неравенства (39). Теорема доказана.
Поскольку любой главный минор матрицы при надлежащей перенумерации переменных можно поместить в левый верхний угол, то имеет место
Следствие. В положительно определенной квадратичной форме все главные миноры матрицы коэффициентов положительны:
Замечание. Из неотрицательности последовательных главных миноров
не следует неотрицательность формы . Действительно, форма
,
в которой , удовлетворяет условиям , но не является неотрицательной.
Однако имеет место следующая
Теорема 4. Для того чтобы квадратичная форма была неотрицательной, необходимо и достаточно, чтобы все главные миноры ее матрицы коэффициентов были неотрицательны:
Доказательство. Введем вспомогательную форму была неположительной, необходимо и достаточно, чтобы имели место неравенства
Назначение сервиса . Онлайн-калькулятор используется для нахождения матрицы Гессе и определения вида функции (выпуклая или вогнутая) (см. пример). Решение оформляется в формате Word . Для функции одной переменной f(x) определяются интервалы выпуклости и вогнутости .Правила ввода функций :
Дважды непрерывно дифференцируемая функция f(x) является выпуклой (вогнутой) тогда и только тогда, когда матрица Гессе функции f(x) по x положительно (отрицательно) полуопределена для всех x (см. точки локальных экстремумов функции многих переменных).
Критические точки функции:
- если гессиан положительно определён, то x 0 - точка локального минимума функции f(x) ,
- если гессиан отрицательно определён, то x 0 - точка локального максимума функции f(x) ,
- если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден (det G(f) ≠ 0), то x 0 - седловая точка функции f(x).
Критерии определенности матрицы (теорема Сильвестра)
Положительная определенность :- все диагональные элементы матрицы должны быть положительны;
- все ведущие главные определители должны быть положительны.
Положительная полуопределенность:
- все диагональные элементы неотрицательны;
- все главные определители неотрицательны.
Квадратная симметрическая матрица порядка n , элементами которой являются частные производные целевой функции второго порядка, называется матрицей Гессе и обозначается:
Для того, чтобы симметрическая матрица была положительно определена, необходимо и достаточно, чтобы все ее диагональные миноры были положительны, т.е.
для матрицы A = (a ij) положительные.
Отрицательная определенность
.
Для того чтобы симметрическая матрица была отрицательно определена, необходимо и достаточно, чтобы имели место неравенства:
(-1) k D k > 0, k
=1,.., n.
Другими словами, для того, чтобы квадратичная форма была отрицательно определённой
, необходимо и достаточно, чтобы знаки угловых миноров матрицы квадратичной формы чередовались, начиная со знака минус. Например, для двух переменных, D 1 < 0, D 2 > 0.
Если гессиан полуопределен, то это может быть и точка перегиба. Нужны дополнительные исследования, которые могут быть проведены по одному из следующих вариантов:
- Понижение порядка . Делается замена переменных. Например, для функции двух переменных это y=x , в итоге получаем функцию одного переменного x . Далее исследуется поведение функции на прямых y=x и y=-x . Если в первом случае функция в исследуемой точке будет иметь минимум, а в другом случае максимум (или наоборот), то исследуемая точка представляет собой седловую точку .
- Нахождение собственных значений гессиана. Если все значения положительные, функция в исследуемой точке имеет минимум, если все отрицательные – имеется максимум.
- Исследование функции f(x) в окрестности точки ε. Переменные x заменяются на x 0 +ε. Далее необходимо доказать, что функция f(x 0 +ε) от одной переменной ε, либо больше нуля (тогда x 0 точка минимума), либо меньше нуля (тогда x 0 точка максимума).
Примечание . Чтобы найти обратный гессиан достаточно найти обратную матрицу .
Пример №1
. Какие из следующих функций являются выпуклыми или вогнутыми: f(x) = 8x 1 2 +4x 1 x 2 +5x 2 2 .
Решение
. 1. Найдем частные производные.
2. Решим систему уравнений.
-4x 1 +4x 2 +2 = 0
4x 1 -6x 2 +6 = 0
Получим:
а) Из первого уравнения выражаем x 1 и подставляем во второе уравнение:
x 2 = x 2 + 1 / 2
-2x 2 +8 = 0
Откуда x 2 = 4
Данные значения x 2 подставляем в выражение для x 1 . Получаем: x 1 = 9 / 2
Количество критических точек равно 1.
M 1 (9 / 2 ;4)
3. Найдем частные производные второго порядка.
4. Вычислим значение этих частных производных второго порядка в критических точках M(x 0 ;y 0).
Вычисляем значения для точки M 1 (9 / 2 ;4)
Строим матрицу Гессе:
D 1 = a 11 < 0, D 2 = 8 > 0
Поскольку диагональные миноры имеют различные знаки, то о выпуклости или вогнутости функции ничего сказать нельзя.
Квадратичные формы
Квадратичной формой f(х 1 , х 2 ,...,х n) от n переменных называют сумму, каждый член которой является либо квадратом одной из переменных, либо произведением двух разных переменных, взятым с некоторым коэффициентом: f(х 1 , х 2 ,...,х n) = (a ij = a ji).
Матрицу А, составленную из этих коэффициентов, называют матрицей квадратичной формы. Это всегда симметрическая матрица (т.е. матрица, симметричная относительно главной диагонали, a ij = a ji).
В матричной записи квадратичная форма имеет вид f(Х) = Х Т AX, где
В самом деле
Например, запишем в матричном виде квадратичную форму .
Для этого найдем матрицу квадратичной формы. Ее диагональные элементы равны коэффициентам при квадратах переменных, а остальные элементы - половинам соответствующих коэффициентов квадратичной формы. Поэтому
Пусть матрица-столбец переменных X получена невырожденным линейным преобразовании матрицы-столбца Y, т.е. X = CY, где С - невырожденная матрица n-го порядка. Тогда квадратичная форма
f(X) = Х T АХ = (CY) T A(CY) = (Y T C T)A(CY) = Y T (C T AC)Y.
Таким образом, при невырожденном линейном преобразовании С матрица квадратичной формы принимает вид: А * = C T AC.
Например, найдем квадратичную форму f(y 1 , y 2), полученную из квадратичной формы f(х 1 , х 2) = 2x 1 2 + 4х 1 х 2 - 3х 2 2 линейным преобразованием .
Квадратичная форма называется канонической
(имеет канонический вид
), если все ее коэффициенты a ij = 0 при i ≠ j, т.е.
f(х 1 , х 2 ,...,х n) = a 11 x 1 2 + a 22 x 2 2 + … + a nn x n 2 = .
Ее матрица является диагональной.
Теорема (доказательство здесь не приводится). Любая квадратичная форма может быть приведена к каноническому виду с помощью невырожденного линейного преобразования.
Например, приведем к каноническому виду квадратичную форму
f(х 1 , х 2 , х 3) = 2x 1 2 + 4х 1 х 2 - 3х 2 2 – х 2 х 3 .
Для этого вначале выделим полный квадрат при переменной х 1:
f(х 1 , х 2 , х 3) = 2(x 1 2 + 2х 1 х 2 + х 2 2) - 2х 2 2 - 3х 2 2 – х 2 х 3 = 2(x 1 + х 2) 2 - 5х 2 2 – х 2 х 3 .
Теперь выделяем полный квадрат при переменной х 2:
f(х 1 , х 2 , х 3) = 2(x 1 + х 2) 2 – 5(х 2 2 – 2* х 2 *(1/10)х 3 + (1/100)х 3 2) - (5/100)х 3 2 =
= 2(x 1 + х 2) 2 – 5(х 2 – (1/10)х 3) 2 - (1/20)х 3 2 .
Тогда невырожденное линейное преобразование y 1 = x 1 + х 2 , y 2 = х 2 – (1/10)х 3 и y 3 = x 3 приводит данную квадратичную форму к каноническому виду f(y 1 , y 2 , y 3) = 2y 1 2 - 5y 2 2 - (1/20)y 3 2 .
Отметим, что канонический вид квадратичной формы определяется неоднозначно (одна и та же квадратичная форма может быть приведена к каноническому виду разными способами). Однако полученные различными способами канонические формы обладают рядом общих свойств. В частности, число слагаемых с положительными (отрицательными) коэффициентами квадратичной формы не зависит от способа приведения формы к этому виду (например, в рассмотренном примере всегда будет два отрицательных и один положительный коэффициент). Это свойство называют законом инерции квадратичных форм .
Убедимся в этом, по-другому приведя ту же квадратичную форму к каноническому виду. Начнем преобразование с переменной х 2:
f(х 1 , х 2 , х 3) = 2x 1 2 + 4х 1 х 2 - 3х 2 2 – х 2 х 3 = -3х 2 2 – х 2 х 3 + 4х 1 х 2 + 2x 1 2 = -3(х 2 2 –
- 2* х 2 ((1/6) х 3 + (2/3)х 1) +((1/6) х 3 + (2/3)х 1) 2) – 3((1/6) х 3 + (2/3)х 1) 2 + 2x 1 2 =
= -3(х 2 – (1/6) х 3 - (2/3)х 1) 2 – 3((1/6) х 3 + (2/3)х 1) 2 + 2x 1 2 = f(y 1 , y 2 , y 3) = -3y 1 2 -
-3y 2 2 + 2y 3 2 , где y 1 = - (2/3)х 1 + х 2 – (1/6) х 3 , y 2 = (2/3)х 1 + (1/6) х 3 и y 3 = x 1 . Здесь положительный коэффициент 2 при y 3 и два отрицательных коэффициента (-3) при y 1 и y 2 (а при использовании другого способа мы получили положительный коэффициент 2 при y 1 и два отрицательных – (-5) при y 2 и (-1/20) при y 3).
Также следует отметить, что ранг матрицы квадратичной формы, называемый рангом квадратичной формы , равен числу отличных от нуля коэффициентов канонической формы и не меняется при линейных преобразованиях.
Квадратичную форму f(X) называют положительно
(отрицательно
) определенной
, если при всех значениях переменных, не равных одновременно нулю, она положительна, т.е. f(X) > 0 (отрицательна, т.е.
f(X) < 0).
Например, квадратичная форма f 1 (X) = x 1 2 + х 2 2 - положительно определенная, т.к. представляет собой сумму квадратов, а квадратичная форма f 2 (X) = -x 1 2 + 2x 1 х 2 - х 2 2 - отрицательно определенная, т.к. представляет ее можно представить в виде f 2 (X) = -(x 1 - х 2) 2 .
В большинстве практических ситуации установить знакоопределенность квадратичной формы несколько сложнее, поэтому для этого используют одну из следующих теорем (сформулируем их без доказательств).
Теорема . Квадратичная форма является положительно (отрицательно) определенной тогда и только тогда, когда все собственные значения ее матрицы положительны (отрицательны).
Теорема (критерий Сильвестра) . Квадратичная форма является положительно определенной тогда и только тогда, когда все главные миноры матрицы этой формы положительны.
Главным (угловым) минором k-го порядка матрицы А n-го порядка называют определитель матрицы, составленный из первых k строк и столбцов матрицы А ().
Отметим, что для отрицательно определенных квадратичных форм знаки главных миноров чередуются, причем минор первого порядка должен быть отрицательным.
Например, исследуем на знакоопределенность квадратичную форму f(х 1 , х 2) = 2x 1 2 + 4х 1 х 2 + 3х 2 2 .
= (2 - l)*
*(3 - l) – 4 = (6 - 2l - 3l + l 2) – 4 = l 2 - 5l + 2 = 0; D = 25 – 8 = 17;
. Следовательно, квадратичная форма – положительно определенная.
Способ 2. Главный минор первого порядка матрицы А D 1 = a 11 = 2 > 0. Главный минор второго порядка D 2 = = 6 – 4 = 2 > 0. Следовательно, по критерию Сильвестра квадратичная форма – положительно определенная.
Исследуем на знакоопределенность другую квадратичную форму, f(х 1 , х 2) = -2x 1 2 + 4х 1 х 2 - 3х 2 2 .
Способ 1. Построим матрицу квадратичной формы А = . Характеристическое уравнение будет иметь вид = (-2 - l)*
*(-3 - l) – 4 = (6 + 2l + 3l + l 2) – 4 = l 2 + 5l + 2 = 0; D = 25 – 8 = 17;
. Следовательно, квадратичная форма – отрицательно определенная.
Квадратичные формы.
Знакоопределённость форм. Критерий Сильвестра
Прилагательное «квадратичный» сразу наталкивает на мысль, что что-то здесь связано с квадратом (второй степенью), и очень скоро мы узнаем это «что-то» и что такое форма. Прямо скороговоркой получилась:)
Приветствую вас на своём новом уроке, и в качестве незамедлительной разминки мы рассмотрим форму в полосочку линейную . Линейной формой переменных называют однородный многочлен 1-й степени:
– какие-то конкретные числа* (предполагаем, что хотя бы одно из них отлично от нуля) , а – переменные, которые могут принимать произвольные значения.
* В рамках данной темы будем рассматривать только действительные числа .
С термином «однородный» мы уже сталкивались на уроке об однородных системах линейных уравнений , и в данном случае он подразумевает, что у многочлена нет приплюсованной константы .
Например: – линейная форма двух переменных
Теперь форма квадратичная. Квадратичной формой переменных называют однородный многочлен 2-й степени, каждое слагаемое которого содержит либо квадрат переменной, либо парное произведение переменных. Так, например, квадратичная форма двух переменных имеет следующий вид:
Внимание!
Это стандартная запись, и что-то менять в ней не нужно! Несмотря на «страшный» вид, тут всё просто – двойные подстрочные индексы констант сигнализируют о том, какие переменные входят в то или иное слагаемое:
– в этом слагаемом находится произведение и (квадрат);
– здесь произведение ;
– и здесь произведение .
– сразу упреждаю грубую ошибку, когда теряют «минус» у коэффициента, не понимая, что он относится к слагаемому:
Иногда встречается «школьный» вариант оформления в духе , но то лишь иногда. Кстати, заметьте, что константы нам тут вообще ни о чем не говорят, и поэтому запомнить «лёгкую запись» труднее. Особенно, когда переменных больше.
И квадратичная форма трёх переменных содержит уже шесть членов:
…почему в «смешанных» слагаемых ставятся множители-«двойки»? Это удобно, и скоро станет понятно, почему.
Однако общую формулу запишем, её удобно оформить «простынёй»:
– внимательно изучаем каждую строчку – ничего страшного тут нет!
Квадратичная форма содержит слагаемых с квадратами переменных и слагаемых с их парными произведениями (см. комбинаторную формулу сочетаний ) . Больше ничего – никаких «одиноких иксов» и никакой приплюсованной константы (тогда уже получится не квадратичная форма, а неоднородный многочлен 2-й степени).
Матричная запись квадратичной формы
В зависимости от значений рассматриваемая форма может принимать как положительные, так и отрицательные значения, и то же самое касается любой линейной формы – если хотя бы один из её коэффициентов отличен от нуля, то она может оказаться как положительной, так и отрицательной (в зависимости от значений ).
Такая форма называется знакопеременной . И если с линейной формой всё прозрачно, то с формой квадратичной дела обстоят куда более интересно:
Совершенно понятно, что данная форма может принимать значения любого знака, таким образом, квадратичная форма тоже может быть знакопеременной .
А может и не быть:
– всегда, если только одновременно не равны нулю.
– для любого вектора , кроме нулевого .
И вообще, если для любого ненулевого вектора , , то квадратичную форму называют положительно определённой ; если же – то отрицательно определённой .
И всё бы было хорошо, но определённость квадратичной формы виднА лишь в простых примерах, и эта видимость теряется уже при небольшом усложнении:
– ?
Можно предположить, что форма определена положительно, но так ли это на самом деле? Вдруг существуют значения , при которых она меньше нуля?
На этот счёт существует теорема : если ВСЕ собственные числа матрицы квадратичной формы положительны* , то она определена положительно. Если все отрицательны – то отрицательно.
* В теории доказано, что все собственные числа действительной симметрической матрицы действительны
Запишем матрицу вышеприведённой формы:
и из уравнения найдём её собственные значения
:
Решаем старое доброе квадратное уравнение
:
, значит, форма определена положительно, т.е. при любых ненулевых значениях она больше нуля.
Рассмотренный метод вроде бы рабочий, но есть одно большое НО. Уже для матрицы «три на три» искать собственные числа – есть занятие долгое и неприятное; с высокой вероятностью получится многочлен 3-й степени с иррациональными корнями.
Как быть? Существует более простой путь!
Критерий Сильвестра
Нет, не Сильвестра Сталлоне:) Сначала напомню, что такое угловые миноры
матрицы. Это определители
которые «разрастаются» из её левого верхнего угла:
и последний из них в точности равен определителю матрицы.
Теперь, собственно, критерий :
1) Квадратичная форма определена положительно тогда и только тогда, когда ВСЕ её угловые миноры больше нуля: .
2) Квадратичная форма определена отрицательно тогда и только тогда, когда её угловые миноры знакочередуются, при этом 1-й минор меньше нуля: , , если – чётное или , если – нечётное.
Если хотя бы один угловой минор противоположного знака, то форма знакопеременна . Если угловые миноры «того» знака, но среди них есть нулевые, то это особый случай, который я разберу чуть позже, после того, как мы перещёлкаем более распространённые примеры.
Проанализируем угловые миноры матрицы :
И это сразу говорит нам о том, что форма не определена отрицательно.
Вывод : все угловые миноры больше нуля, значит, форма определена положительно.
Есть разница с методом собственных чисел? ;)
Запишем матрицу формы из Примера 1
:
первый её угловой минор , а второй , откуда следует, что форма знакопеременна, т.е. в зависимости от значений , может принимать как положительные, так и отрицательные значения. Впрочем, это и так очевидно.
Возьмём форму и её матрицу из Примера 2
:
тут вообще без озарения не разобраться. Но с критерием Сильвестра нам всё нипочём:
, следовательно, форма точно не отрицательна.
, и точно не положительна (т.к. все угловые миноры должны быть положительными) .
Вывод : форма знакопеременна.
Разминочные примеры для самостоятельного решения:
Пример 4
Исследовать квадратичные формы на знакоопределенность
а)
В этих примерах всё гладко (см. конец урока), но на самом деле для выполнения такого задания критерия Сильвестра может оказаться не достаточно .
Дело в том, что существуют «краевые» случаи, а именно: если для любого ненулевого вектора , то форма определена неотрицательно , если – то неположительно . У этих форм существует ненулевые векторы , при которых .
Здесь можно привести такой «баян»:
Выделяя полный квадрат , сразу видим неотрицательность формы: , причём, она равна нулю и при любом векторе с равными координатами, например: .
«Зеркальный» пример неположительно
определённой формы:
и ещё более тривиальный пример:
– здесь форма равна нулю при любом векторе , где – произвольное число.
Как выявить неотрицательность или неположительнось формы?
Для этого нам потребуется понятие главных миноров
матрицы. Главный минор – это минор, составленный из элементов, которые стоят на пересечении строк и столбцов с одинаковыми номерами. Так, у матрицы существуют два главных минора 1-го порядка:
(элемент находится на пересечении 1-й строки и 1-го столбца);
(элемент находится на пересечении 2-й строки и 2-го столбца),
и один главный минор 2-го порядка:
– составлен из элементов 1-й, 2-й строки и 1-го, 2-го столбца.
У матрицы «три на три» главных миноров семь, и тут уже придётся помахать бицепсами:
– три минора 1-го порядка,
три минора 2-го порядка:
– составлен из элементов 1-й, 2-й строки и 1-го, 2-го столбца;
– составлен из элементов 1-й, 3-й строки и 1-го, 3-го столбца;
– составлен из элементов 2-й, 3-й строки и 2-го, 3-го столбца,
и один минор 3-го порядка:
– составлен из элементов 1-й, 2-й, 3-й строки и 1-го, 2-го и 3-го столбца.
Задание
на понимание: записать все главные миноры матрицы .
Сверяемся в конце урока и продолжаем.
Критерий Шварценеггера :
1) Ненулевая* квадратичная форма определена неотрицательно тогда и только тогда, когда ВСЕ её главные миноры неотрицательны (больше либо равны нулю).
* У нулевой (вырожденной) квадратичной формы все коэффициенты равны нулю .
2) Ненулевая квадратичная форма с матрицей определена неположительно
тогда и только тогда, когда её:
– главные миноры 1-го порядка неположительны
(меньше либо равны нулю);
– главные миноры 2-го порядка неотрицательны
;
– главные миноры 3-го порядка неположительны
(пошло чередование);
…
– главный минор -го порядка неположителен
, если – нечётное либо неотрицателен
, если – чётное.
Если хотя бы один минор противоположного знака, то форма знакопеременна.
Посмотрим, как работает критерий в вышеприведённых примерах:
Составим матрицу формы, и в первую очередь
вычислим угловые миноры – а вдруг она определена положительно или отрицательно?
Полученные значения не удовлетворяют критерию Сильвестра, однако второй минор не отрицателен , и это вызывает надобность проверить 2-й критерий (в случае 2-й критерий будет не выполнен автоматически, т.е. сразу делается вывод о знакопеременности формы) .
Главные миноры 1-го порядка:
– положительны,
главный минор 2-го порядка:
– не отрицателен.
Таким образом, ВСЕ главные миноры не отрицательны, значит, форма неотрицательна .
Запишем матрицу формы , для которой, очевидно, не выполнен критерий Сильвестра. Но и противоположных знаков мы тоже не получили (т.к. оба угловых минора равны нулю). Поэтому проверяем выполнение критерия неотрицательности / неположительности. Главные миноры 1-го порядка:
– не положительны,
главный минор 2-го порядка:
– не отрицателен.
Таким образом, по критерию Шварценеггера (пункт 2), форма определена неположительно.
Теперь во всеоружии разберём более занятную задачку:
Пример 5
Исследовать квадратичную форму на знакоопределенность
Данную форму украшает орден «альфа», который может равняться любому действительному числу. Но это ж только веселее будет, решаем .
Сначала запишем матрицу формы, наверное, многие уже приноровились это делать устно: на главную диагональ
ставим коэффициенты при квадратах, а на симметричные места – споловиненные коэффициенты соответствующих «смешанных» произведений:
Вычислим угловые миноры:
третий определитель я раскрою по 3-й строке: