Свойства логической энтропии

Аннотация

Исследуются свойства логической энтропии, служащей мерой сложности информационных моделей. Демонстрируется отличие логической энтропии от энтропии Теории информации. Доказывается ряд соотношений, позволяющих оценивать энтропию информационных моделей в зависимости от энтропии предметных областей.

Abstract

There are researched the characteristic of logical entropy, described the measure of complicity information models. It is demonstrated difference of logical entropy from entropy of the Theories of information. It is proved correlation between entropy of the information model and entropy of the application domain.

Введение. Содержательное обоснование меры неопределенности информационных моделей было введено в [1]. В [2] приводится формальное определение логической энтропии, и обсуждаются некоторые ее свойства и их содержательные интерпретации. В этой работе продолжено исследование логической энтропии, как меры сложности информационных моделей.

1. О логической энтропии. Сформулируем и докажем ряд свойств логической энтропии.

Теорема 1. Если для функции f(y, z) доли p_y(i) классов y-эквивалентности равны, то энтропия H_y равна логарифму от числа классов эквивалентности (или, что аналогично, от величины y-сечения).

Поэтому, если имеются только два класса с одинаковыми долями, то энтропия равна 1; если один класс, то энтропия равна 0.

Основные свойства энтропии формулируются следующим образом.

Теорема 2. При фиксированном числе всех путей бинарной программы из истока в y-сечение, которое имеет k узлов, энтропия H_y максимальна, когда все доли p_y(i) одинаковы и равны k^-¹.

Доказательство этого свойства вытекает из того, что математическое ожидание М[log | t_y(i)|] минимально при равных значениях p_y(i).

Теорема 3. Если H_y = k, то число узлов y-сечения бинарной программы не менее 2^k.

Доказательство. Пусть в y-сечении бинарной программы имеется h = 2ⁿ < 2^k узлов. При фиксированном числе путей из истока в y-сечение энтропия H_y максимальна при равных долях p_y(i). Поэтому энтропия H_y не превосходит величины - å _i ₌_1,_h h^-¹ log h^-¹ = log h < k . Противоречие.

Следствие. Чтобы функция f(y, z) обладала энтропией H_y = k, число переменных у должно быть не менее k.

Пример 1. Пусть y-сечение бинарной программы для функции f(y, z) имеет k узлов, а для функции g(y, z) – h узлов. Верхняя граница энтропии H^f_y равна log k, а H^g_y - log h. Эти значения достигаются в случае, когда p_y(i) = k^-¹ для функции f и p_y(i) = h^-¹ для g. Потому функция, обладающая большим y-сечением, имеет большую верхнюю границу энтропии. Это согласуется с содержательной интерпретацией логической энтропии как меры неопределенности вычислительного процесса. Действительно, чем больше сечение бинарной программы, тем больше неопределенность того, какой вычислитель осуществит вычисление при заданных входных значениях.

Пусть разложения функции f(y, z) по переменным y выглядят следующим образом: Ú_i₌_1,_k [y^sⁱ] f(sⁱ₁, z), а по переменным z так Ú_j₌_1,_h [z^l^j] f(y, l^j₁), где в квадратных скобках приведены дизъюнкты, определяемые одним классом эквивалентности, и sⁱ = {s₁ⁱ, s₂ⁱ, …, s_mⁱ}, l^j = {l₁^j, l₂^j, …, l_n^j}, i = 1, 2, …, k, j = 1, 2, …, h.

f(y, z) = Ú_i=_1,k _j=_1,h [y^sⁱz^l^j] f(sⁱ₁, l^j₁) = Ú_i=_1,k _j=_1,h [y^sⁱz^l^j] f_ij.

Здесь квадратными скобками [y^sⁱz^l^j] обозначена конъюнкция дизъюнктов, соответствующих i-му y-классу и j-му z-классу, f_ij получена из f подстановкой y-набора sⁱ₁ и z-набора l^j₁. Если f представляет всюду определенную вычислимую функцию, то среди f_ij, i = 1, 2, …, k, j = 1,2, .., h нет тождественно нулевых функций.

Теорема 4. Если логическая функция f(y, z) представляет всюду определенную вычислимую функцию, то верно неравенство

Доказательство. Обозначим p_y(i) долю y-наборов из i-го класса y-эквивалентности, p_z(j) – долю z-наборов из j-го класса z-эквивалентности, p(i, j) – долю yz-наборов, y-компоненты которых принадлежат i-му классу y-эквивалентности, а z-компоненты - j-му классу z-эквивалентности. Так как f представляет всюду определенную функцию, то для всех пар (i, j) справедливы равенства p(i, j) = p_y(i) p_z(j) и å₍_i_,_j₎ p(i, j) = 1, где суммирование ведется по всем i = 1, 2, …, k, и j = 1, 2, …, h.

Пусть yz-сечение бинарной программы содержит m узлов и к множеству yz-наборов из q-го yz-класса A_q, q = 1, 2, …, m, относятся yz-наборы, характеризующиеся определенными значениями пар (i, j). Тогда p_yz(q) есть доля yz-наборов, определяемых q-м yz-классом, и эта доля вычисляется как сумма

-å_i_{, j} p(i, j) log p(i, j) = -å_i_{, j} p_y(i) p_z(j)log p_y(i) - å_i_{, j} p_y(i) p_z(j)log p_z(j) =

Рассмотрим условную случайную величину x|A_q, которая принимает значения (i, j) из класса A_q с вероятностью P[x = (i, j)|(i, j) Î A_q]. По формуле условной вероятности имеем P[x = (i, j)|(i, j) Î A_q] = P[x = (i, j)]/P[(i, j)ÎA_q] = p(i, j)/p_yz(q). Энтропия этой случайной равна

Так как энтропия любой случайной величины не отрицательная, то

В силу того, что p_yz(q) > 0 последнее неравенство можно переписать так:

-å_{(i,
j)|(i, j)}_Î_Aq p(i, j) log p(i, j) ³ -å_{(i,
j)|(i, j)}_Î_Aq p(i, j) log p_yz(q) = - p_yz(q) log p_yz(q)

Суммируя обе части неравенства по всем классам yz-эквивалентности, получаем, что

Докажем теперь утверждение, анонсированное в [2]. Оно касается соотношения между суммой H₁ + H₂ неопределенностей, характеризующих состояние уже спроектированной информационной системы и неопределенности H₀ предметной области. В терминах бинарной программы и логической энтропии это выглядит следующим образом.

Пусть для логической функции f(y, z) переменные y определяют логическую энтропию H_y= -å_i₌_1,_k p_y(i) log p_y(i), и H₀ есть двоичный логарифм от мощности множества T ее единичных означиваний. Введем для y-сечения бинарной программы новую величину H₂, которую назовем остаточной энтропией: H₂ = å_i₌_1,_k p_y(i) log T_i, где T_i есть мощность множества единичных означиваний функции, соответствующей i-му узлу y-сечения.

Лемма 5. Пусть a = b + c. Тогда верно неравенство

Доказательство. Пусть b £ c, и b = c – x для некоторого не отрицательного x. Искомое неравенство следует из неравенства 1+(log (c - x) + log c) £ 2 log (2c – x), которое вытекает из log 2(c - x) c £ log (2c – x)². Последнее неравенство следует из легко проверяемого неравенства 2(c - x)c £ (2c – x)².

Теорема 6. Для логической функции f(y, z) имеет место неравенство

Доказательство проведем индукцией по h - мощности множества переменных y.

Базис индукции, когда h = 0, элементарен, так как в этом случае H_y = 0 и H₂ = H₀.

Индукционный переход. Пусть для y-сечения, когда множество y содержит h переменных, теорема верна, и мы продолжаем построение бинарной программы для f(y, z), означивая новую переменную z. Допустим, что в yz-сечении имеется в точности m узлов и T_j есть мощность множества единичных означиваний функции, приписанной его j-му узлу.

Допустим вначале, что такое продолжение не приводит к склейке узлов в yz-сечении. В этом случае для каждого узла j yz-сечения доля p_y_z(j) путей, ведущих из истока в этот узел, равна либо (1/2)p_y(i) либо p_y(i) для определенного узла i y-сечения. Это следует из определения бинарной программы.

p_y_z(j)(- log p_y_z(j) + log T_j) и p_y_z(j)(- log p_y_z(j) + log T_j).

Здесь первое суммирование осуществляется по тем узлам yz-сечения, для которых доли путей, ведущих в эти узлы, представляют собой половину от долей путей, ведущих в соответствующие узлы y-сечения. Второе - по тем узлам, для которых доли путей, ведущих в них, совпадают с долями путей, ведущих в соответствующие узлы y-сечения. Это позволяет перейти к суммированию по узлам y-сечения.

p_y(i) - log (p_y(i)/2) + ½ p_y(i) log T_j₁+ ½ p_y(i) log T_j₂

Здесь j₁ и j₂ это те узлы yz-сечения, которые образованы из одного i-го узла y-сечения. Преобразуя эту сумму, получаем

По Лемме 5, 1 + ½(log T_j₁+ log T_j₂) £ log T_i, где T_i есть мощность множества единичных означиваний функции, приписанной i-узлу y-сечения. Следовательно, эта сумма не превосходит величины

В силу того, что во второй сумме каждому узлу yz-сечения соответствует в точности один узел y-сечения, сумму

Здесь суммирование ведется по соответствующим узлам y-сечения, для каждого узла yz-сечения указывается в точности один соответствующий узел y-сечения.

Складывая p_y(i) (- log p_y(i) + log T_i) + p_y(i)(- log p_y(i) + log T_i), получим, что суммирование ведется по всем узлам y-сечения. Следовательно, эта сумма не превосходит величины H₀. В частном случае теорема доказана.

Приведем теперь доказательство для общего случая.

Пусть при переходе к yz-сечению два различных узла i₁ и i₂ y-сечения порождают эквивалентные функции. В результате можно считать, что в yz-сечении склеились два узла j₁ и j₂, которые в итоге превратились в один узел j. Тогда соответствующая доля выглядит так: p_y_z(j) = p_y_z(j₁) + p_y_z(j₂). Мощности множеств единичных означиваний функций, соответствующих трем узлам j, j₁ и j₂, совпадают и пусть равны T_j.

p_y_z(j₁)(-logp_y_z(j₁)+logT_j)+p_y_z(j₂))(-log(p_y_z(j₂)+logT_j).

Следовательно, склейка узлов yz-сечения не приводит к увеличению левой части искомого неравенства.

В итоге на промежуточном этапе построения информационной модели наши знания, по сравнению с исходными, увеличились на величину

Введем следующее обозначение для логической функции f(y, z).

При построении бинарной программы увеличение множества означиваемых переменных не всегда приводит к увеличению энтропии. Чтобы это показать, приведем следующие рассуждения.

Пусть q(i, j) – доля yz-наборов, таких, что одновременно их y-наборы принадлежат i-му классу y-эквивалентности, а сами они принадлежат j-му классу уz-эквивалентности. В терминах бинарной программы q(i, j) есть доля путей, проходящих из истока в j-й узел уz-сечения, одновременно проходя через i-й узел у-сечения. Справедливы равенства:

-å_i=_1,kp_y(i) log p_y(i) =-å_i=_1,k(å_j=_1,h q(i, j)) log p_y(i) = -å_i=_1,k(å_j=_1,h q(i, j)log p_y(i))=

= -å_i=_1,kå_j=_1,h q(i, j) log p_y(i) = -å_i=_{1,k j=1,h} q(i, j) log p_y(i).

-å_j=_1,hp_yz(j)log p_yz(j)=-å_j=_1,h(å_i=_1,k q(i, j))log p_yz(j)=-å_j=_1,h(å_i=_1,k q(i, j)log p_yz(j)) =

= -å_i=_1,kå_j=_1,h q(i, j) log p_yz(j) = -å_i=_{1,k j=1,h} q(i, j) log p_yz(j).

å_i=_{1,k j=1,h} q(i, j) log p_y(i) -å_i=_{1,k j=1,h} q(i, j) log p_yz(j) =

= å_i=_{1,k j=1,h} q(i, j) (log p_y(i) - log p_yz(j)) = å_i=_{1,k j=1,h} q(i, j) log (p_y(i) / p_yz(j)).

Величину log (p_y(i)/p_yz(j)) можно рассматривать как случайную с распределением q(i, j). Тогда разность H_yz - H_y. есть ее среднее значение. Если она больше нуля, то эффективное yz-сечение больше эффективного y-сечения. Так как ширина эффективного сечения определяет сложность представления исходной функции через ее подфункции, то положительная разность обозначает, что функция выражается сложнее через переменные yz, чем от y.

2. Не зависимые переменные. В теории информации доказывается, что если система состоит из независимых подсистем, то ее энтропия представляет собой сумму энтропий ее подсистем. Аналогичным свойством обладает логическая энтропия: если логическая функция зависит от независимых аргументов, то суммарная энтропия этих аргументов равна сумме энтропий каждого из них.

Чтобы уточнить понятия независимости переменных логической функции, введем ряд определений и докажем несколько утверждений.

Будем говорить, что у функции f(y, z) переменные z не зависят от переменных y, если в разложении f(y, z) = Ú_i₌_1,_k _j₌_1,_h [y^sⁱz^l^j] каждая функция f_ij = u_i Ù v_j, i = 1, 2, …, k, j = 1, 2, …, h. В терминах матрицы M_f (см. рис.1) независимость переменных z от y обозначает, что для каждого ее столбца (каждой строки) зафиксирована одна функция u_i (v_j), входящая в конъюнкцию на пересечении этой строки (столбца) со всеми другими столбцами (строками).

Лемма 7. Если функция f(y, z) = f₁(y) Ù f₂(z), где f₁(y) не содержит переменных z, а f₂(z) - переменных y, то переменные z не зависят от y, и наоборот, переменные y не зависят от z.

Лемма 8. Если у функции f(y, z) переменные z не зависят от y, то она представима в виде конъюнкции f₁(y) Ù f₂(z), где f₁(y) не содержит переменных z, а f₂(z) - переменных y.

Доказательство. Представим функцию f(y, z) в таком виде:

В силу независимости переменных z от y получаем равенства:

= Ú_i=_1,k [y^sⁱ] Ù u_i Ù(Ú_j=_1,h[z^l^j] v_j) = Ú_i=_1,k [y^sⁱ] Ù u_i Ù f₂(z) =

Следствие. Если у функции f(y, z) переменные z не зависят от y, то переменные y также не зависят от z.

Основываясь на этом, будем говорить просто о независимых переменных.

Теорема 9. Если у функции f(y, z) переменные y, z не зависимы, то ее нельзя представить в виде дизъюнкции g(y) Ú h(z), где g(y) не содержит переменных z, и h(z) - переменных y.

Доказательство. Так как переменные y и z не зависимы, то функция f(y, z) определяет матрицу M_f, как на рис. 1. Функция f(y, z) не тождественная константа. Поэтому все функции в клетках матрицы M_f попарно не эквивалентны. Пусть f(y, z) = g(y) Ú h(z), и g(y) не содержит переменных z, а h(z) - переменных y. Допустим, что функция g(y) истинна при некотором означивании s_у ее переменных. Но тогда все yz–наборы вида s_уs_z, где s_z все возможные z–наборы, принадлежат одному классу эквивалентности. Это обозначает, что в матрице M_f все функции в строке, характеризующейся одним y–набором s_у, эквивалентны. Противоречие с условием о независимости переменных y и z.

Отметим, что если функция f(y, z) представлена в к.н.ф., то независимые переменные y, z могут принадлежать одному дизъюнкту, но таких дизъюнктов должно быть, по меньшей мере, два.

Теорема 10. Если у функции f(y, z) переменные y и z не зависимы, то H_yz = H_y + H_z.

Доказательство. Величина p_yz_|_y(j| i) одинакова для каждого фиксированного i и всех узлов j, достижимых из i. Более того, p_yz_|_y(j| i) = p_z(j¢), j, j¢ = 1, 2, …, k при определенном соответствии узлов j и j¢ yz-сечения и z-сечения. Но тогда p_yz(j) = p_z(j¢) p_y(i). Следовательно,

H_yz = å_j p_yz(j) log p_yz(j) = å_j_,i p_y(i) p_z(j¢) log p_y(i) p_z(j¢) = H_y+ H_z_.

Содержательная трактовка аддитивности энтропии достаточно понятна. Если два множества аргументов независимы, то они не влияют друг на друга, так как разложение по одному множеству аргументов никак не сказывается на наших знаниях о разложении по другому. Понятно, что в общем случае аддитивность энтропии места не имеет, так как не каждая пара (i, j) индексов матрицы M_f определяет в точности один класс yz-эквивалентности.

3. Условная энтропия. В этом разделе введем определение и рассмотрим свойства условной энтропии, которая определяется так же, как это делается в Теории информации.

Напомним обозначения, введенные при определении логической энтропии для функции f(y, z):

p_yz_|_y(j½ i) есть доля путей, ведущих из i-го узла у-сечения в j-й узел уz-сечения среди всех путей из i-го узла у-сечения в уz-сечение;

p_y(i) – доля путей из истока в i-й узел у-сечения среди всех путей из истока в у-сечение;

p_z(i) - доля путей из истока в i-й узел z-сечения среди всех путей из истока в z-сечение;

p_yz(i) –доля путей из истока в i-й узел уz-сечения среди всех путей из истока в уz-сечение.

Пусть p_yz(i, j) = p_yz_|y(j½ i) p_y(i). Это есть доля путей, проходящих из истока через i-й узел у-сечения, которые ведут в j-й узел уz-сечения.

Из этого определения следует равенство p_y(i) = å_j p_yz(i, j).

Аналогично вводятся соответствующие обозначения, когда рассматривается не бинарная программа, а означивания переменных.

Пусть для функции f(y, z) необходимо установить класс yz-эквивалентности, которому принадлежит некоторый yz-набор. Если не пользоваться никакой дополнительной информацией, то неопределенность этого события вычисляется как энтропия аргументов yz. Допустим, теперь известно, каким y-классом порождается этот yz-набор. Поэтому при известном y-классе доли порождаемых им yz-классов отличаются от долей yz-классов всей функции. Эти доли могут рассматриваться как условные доли p(yz|y) yz-классов, когда известно, каким y-классом они определяются. Эти рассуждения приводят к понятию условной энтропии:

Н_yz_|y = - S_i_{, j} p_y(i) p_yz_|y(j | i) logp_yz_|y(j | i) = - S_i_{, j} p_yz(i, j) logp_yz_|y(j | i).

Условная энтропия обладает такими свойствами.

Доказательство. Пусть i-ый класс y-эквивалентности порождает h классов yz-эквивалентности, которые занумеруем 1, 2, …, h. Очевидно, что h не больше числа H классов z-эквивалентности. В терминах матрицы M_f в ее i-ой строке одному классу yz-эквивалентности соответствует несколько клеток, в то время как одному классу z-эквивалентности соответствует в точности одна клетка. Но тогда энтропия Н_yz_|_x₍_y_{) =}_i меньше, чем энтропия Н_z, так как для некоторых классов j = 1, 2, …, h доли p_yz_|_y(j | i) представляют собой суммарные доли нескольких классов z-эквивалентности.

Теорема 12. Если аргументы y и z независимы, то Н_yz_|_y = Н_z.

Доказательство. При независимых аргументах y и z верны следующие равенства p_yz_|_y(1| i) = p_yz_|_y(2| i) = … = p_yz_|_y(h| i), i = 1, 2, …, k, так как доли путей в yz-сечение, проходящие через фиксированный i-ый узел y-сечения, не зависят от i. Поэтому p_yz_|_y(j| i) = p_z(j¢) при определенном соответствии между узлами yz-сечения и z-сечения. В этом случае

Н_yz_|_x₍_y_{) =}_i = - S_j p_yz_|_y(j | i) logp_yz_|_y(j | i) = Н_zи Н_yz_|_y = S_i p_y(i) Н_z = Н_z.

Таким образом, в случае независимых аргументов y и z условная энтропия Н_zy_|_y совпадает с безусловной Н_z. Поэтому знание о порождении набора определенным у-классом не влияет на наши знания о принадлежности yz-набора тому или иному yz-классу.

Лемма 13. Если r_i, q_i , i = 1, 2, …, n, – дискретные распределения случайных величин, то справедливо неравенство

Доказательство. Искомое неравенство преобразуется в следующее

Для его доказательством воспользуемся неравенством из Леммы 11, положив

r_j= p_yz_|y(j | i), q_j = p_yz(j). Тогда неравенство из Леммы 11 превращается в такое:

S_{j =}_{1, n} p_yz_|y(j | i) log p_yz_|y(j | i) ³ S_{j =}_{1, n} p_yz_|y(j | i) log p_yz(j)).

Так как неравенство справедливо для каждого i, то умножая на p_y(i) и суммируя по i, получаем неравенство

S_j_,i p_yz_|y(j | i) p_y(i) log p_yz_|y(j | i) ³ S_j_,i p_yz_|y(j | i) p_y(i) log p_yz(j)).

Используя равенство p_yz(i, j) = p_yz_|y(j½ i) p_y(i), преобразуем левую часть неравенства в S_j_,i p_yz(i, j) log p_yz_|y(j | i). Используя равенство S_i p_yz_|y(j | i) p_y(i) = p_yz(j), правую часть неравенства преобразуем в S_j p_yz(j) log p_yz(j)). Из этого следует искомое неравенство.

Пример 2. Верхняя граница энтропии Н_yz_|_x₍_y_{) =}_i достижима и равна log k, если p_yz_|_y(j | i) = k^-1 при всех значениях j. Поэтому, если сравнивать верхние границы частной энтропии при одинаковых значениях долей p_yz_|_y(j | i), то она тем больше, чем больше число узлов yz-сечения достижимо из i-го узла y-сечения. Это согласуется с содержательным представлением о неопределенности вычислительного процесса, представляемого бинарной программой. Действительно, число возможных продолжений вычисления из i-го узла y-сечения будет больше при большем числе достижимых вычислителей (т.е. узлов yz-сечения) из i-го узла y-сечения.

Пример 3. Из того, что математическое ожидание случайной величины увеличивается при увеличении ее значений и при одинаковом распределении следует, что условная энтропия Н_yz_|_y возрастает при возрастании частных условных энтропий Н_yz_|_x₍_y_{) =}_i. Это согласуется с содержательным представлением о неопределенности вычислительного процесса. Действительно, если число достижимых узлов yz-сечения из каждого узла y-сечения увеличивается, то при прочих равных условиях возрастает и усредненное значение

Теорема 15. Верно неравенство Н_yz ≤ Н_y + Н_yz_|_y.

Доказательство. Используя равенство p_yz(i, j) = p_yz_|_y(j| i) p_y(i), получаем

Н_yz_|y = - S_i_{, j} p_yz (i, j) log p_yz (i, j) + S_i p_y (i) log p_y(i) =

Так как S_i p_yz(i, j) = S_i p_yz_|y(j½ i) p_y(i) = p_yz(j), то -S_i p_yz(i, j) logp_yz(i, j) ³ - p_yz(j) logp_yz(j). Поэтому верно такое соотношение

4. Зависимые переменные. Следующим исследуемым классом функций будут так называемые функции с сильной зависимостью между переменными. Введем такое определение.

Назовем f(y, z) функцией с сильной зависимостью между переменными y и z (обозначим y ßà z), если в матрице M_f не константные функции встречаются в точности по одной в каждой строке и в каждом столбце. Из этого вытекает, что для функции f(y, z) совпадают мощности фактор-множеств, определяемых у-эквивалентностью, z-эквивалентностью и yz-эквивалентностью. Кроме того, для каждого yz-класса, для которого результирующая функция не константа, его y-проекции однозначно определяют соответствующие z-проекции. В терминах матрицы M_f имеем, что все пары (i, j), где i – фиксированный номер столбца и j пробегает по всем номерам строк, определяют единственный класс yz-эквивалентности. Аналогично, если зафиксировать номер строки этой матрицы, то все ее столбцы также определяют единственный класс эквивалентности. Из этих рассуждений видно, что матрица M_f квадратная.

Содержательно сильная зависимость трактуется, как взаимно-однозначная зависимость в следующем смысле. Каждый класс у-эквивалентности соответствует в точности одному классу z-эквивалентности и наоборот. Следовательно, каждый класс y-эквивалентности единственным образом определяет вычислитель, который перечисляет z-наборы лишь из одного класса z-эквивалентности. Очевидно, что верно и обратное.

Если f(y, z) есть функция с сильной зависимостью между переменными y и z, то ее разложение по переменным yz имеет вид Ú_i₌_1,_k _j₌_1,_h [y^sⁱz^l^j] f_ij, k = h и существует взаимно однозначное отображение j:{1, 2, ..., k} ® {1, 2, ..., h} такое, что для всякого i Î {1, 2, ..., k} не константа лишь функция f_i_j₍_i₎. Разложив функцию f(y, z) по переменным y, получим Ú_i₌_1,_k [y^sⁱ] f(s₁ⁱ, z). В этом случае означивающие наборы для функции f(s₁ⁱ, z) обладают таким свойством: лишь наборы, порожденные z-классом с номером j(i) не превращают f(s₁ⁱ, z) в константу. Аналогично, разложив функцию f(y, z) по переменным z, получим Ú_i₌_1,_h [z^l^j] f(y, l₁^j). И имеет место аналогичный факт: лишь наборы, порожденные y-классом с номером j^-1(j) не превращают f(y, l₁^j) в константу.

Следовательно, функция f(y, z) представима в виде Ú_i₌_1,_k [y^sⁱz^l^j⁽^j⁾] f_i_j₍_j₎ или Ú_j₌_1,_h [y^s^j^-1(^j⁾z^l^j] f_j^-1₍_j₎_j.

Теорема 16. Если f(y, z) есть функция с сильной зависимостью y ßà z, то Н_yz_|_y = 0.

Доказательство. Если p_yz(i, j) есть доля путей из истока в уz-сечение, одновременно проходящие через i-й узел у-сечения и j-й узел уz-сечения, то p_yz(i, j(i)) = p_y(i), а для остальных значений j p_yz(i, j) = 0. Отсюда следует, что p_yz_|_y(j(i) | i) = 1 и p_yz_|_y(j | i) = 0 для остальных значений j. Теперь Н_yz_|_y = - S_i_,_j p_y(i) p_yz_|_y(j | i) logp_yz_|_y(j | i) = 0.

Следствие. Для функции f(y, z) с сильной зависимостью y ßà z, Н_yz= Н_y.

Можно несколько перефразировать отношение сильной зависимости следующим образом. Говорим, что два множества y и z переменных логической функции f(y, z) обладают одинаковым распределением, если,

во-первых, существует взаимно-однозначное соответствие фактор-множеств, определяемых этими множествами переменных и,

во-вторых, доли наборов, порождаемых соответствующими классами, совпадают.

Это обозначает, что если y-эквивалентность известна, то дополнительное знание z-эквивалентности не увеличивает наших знаний о функции. Понятно, что для функции f(y, z) переменные y и z обладают одинаковым распределением тогда и только тогда, когда эти множества переменных сильно зависимы.

Будем говорить просто о зависимости переменных z от переменных y (обозначается y à z), если в каждой строке матрицы M_f в точности одна клетка не константная функция.

Из этого определения вытекает, что если f(y, z) есть функция с зависимостью y à z переменных, то для матрицы M_f выполняется неравенство h £ k.

В этом случае между фактор-множествами, порождаемыми y-эквивалентностью и z-эквивалентностью, можно установить однозначное отображение j:{1, 2, ..., k} ® {1, 2, ..., h} такое, что для всякого i Î {1, 2, ..., k} не тождественная константа лишь функция f_i_j₍_i₎. И наоборот, для каждого значения j Î {1, 2, ..., h} не тождественные константы лишь функции f_j^-1₍_j_),_j. Обратное отображение j^-1 не однозначно, так как одному z-классу в общем случае соответствует несколько y-классов.

Зависимость y à z трактуется как функциональная в следующем смысле: каждый класс y-эквивалентности определяет в точности один класс z-эквивалентности. Обратное соотношение, в общем случае, неверно – несколько классов z-эквивалентности могут определяться одним классом y-эквивалентности.

Пусть f(y, z) есть логическая функция с зависимостью y à z ее аргументов, и ее разложение по y имеет вид f(y, z) = Ú_i₌_1,_k [y^sⁱ] f(sⁱ₁, z). В этом случае лишь z-наборы, образующие z-класс с номером j(i) не обращают функцию f(sⁱ₁, z) в константу. Разложив функцию f(y, z) по переменным z, получим выражение f(y, z) = Ú_j₌_1,_h [z^l^j] f(y, l^j₁). В этом случае лишь y-наборы, образующие y-классы с номерами j^-1(j), не обращают функцию f(z, l^j₁) в константу. Следовательно, f(y, z) = Ú_i₌_1,_k [y^sⁱ y^l^j⁽ⁱ⁾] f_i_,_j₍_i₎ и f(y, z) = Ú_j₌_1,_h [y^s^j^-1(^j⁾z^l^j] f_j^-1₍_j_),_j .

Теорема 17. Пусть f(y, z) есть логическая функция с зависимостью y à z ее аргументов. Тогда Н_yz_|_y= 0.

Доказательство. Пусть p_yz(i, j) есть доля путей из истока в yz-сечение, одновременно проходя через i-ый узел y-сечения и j-ый узел yz-сечения. Отсюда следует, что p_yz(i, j(i)) = p_y(i), а для остальных значений p_yz(i, j) = 0. Отсюда следует, что p_yz_|_y(j(i)|i) = 1 и p_yz_|_y(j(i)|i) = 0 для остальных значений. Но тогда Н_yz|y= å_i_,j p_y(i) p_yz_|y(j| i) log p_yz_|y(j| i) = 0.

Следствие. Пусть f(y, z) есть логическая функция с зависимостью y à z ее аргументов. Тогда Н_yz= Н_y.

С другой стороны, если для функции f(y, z) имеется зависимость y à z, но отсутствует зависимость z à y, то Н_zy_|_z > 0. Этот факт следует из того, что одному классу z-эквивалентности в общем случае соответствуют несколько классов y-эквивалентности. Поэтому доля путей из i-го узла y-сечения в j-ый узел yz-сечения при некоторых значениях i, j отлична от 1 и нуля, так как из одного i-го узла могут вести пути в несколько узлов yz-сечения.

5. Свойства логической энтропии. Пусть функция f(y, z) представима в виде конъюнкции F(y) G(y, z) L(z), где функция F(y) не содержит переменных z, L(z) - переменных y и G(y, z) содержит оба множества y, z переменных. Для простоты пусть G(y, z) не содержит иных переменных, кроме y, z. Назовем функцию G(y, z) сечением функции f(y, z). Разложим функции F(y), G(y, z) и L(z) по переменным соответственно y , yz и z. Результирующее выражение выглядит так:

Ú_i=_1,k [y^sⁱ] Ù u_i Ù (Ú_i_{, j} y^aⁱz^b^j)Ù(Ú_j=_1,h[z^l^j] v_j).

В разложении функции G(y, z) фигурируют конъюнкты y^aⁱz^b^j, определенные бинарными кортежами aⁱ и b^j, а не дизъюнкты, определяемые классами yz-эквивалентности.

Набор aⁱb^j из разложения функции G(y, z) является мостиком между классами sⁱ = {s₁ⁱ, s₂ⁱ, …, s_mⁱ}, l^j = {l₁^j, l₂^j, …, l_n^j} соответственно y-эквивалентности и z-эквивалентности для функций соответственно F(y) и L(z), если aⁱ не ортогонален хотя бы одному набору из множества {s₁ⁱ, s₂ⁱ, …, s_mⁱ}, а b^j – хотя бы одному набору из множества {l₁^j, l₂^j, …, l_n^j}.

Теорема 18. Если yz-набор aⁱb^j является мостиком между классами эквивалентности sⁱ и l^j, то все наборы из sⁱ ´ l^j не ортогональные набору aⁱb^j определяют один класс эквивалентности для функции f(y, z).

Доказательство. Означивание функции G(y, z) yz-набором aⁱb^j превращает ее в единицу. С другой стороны, каждый y-набор s₁ⁱ, s₂ⁱ, …, s_mⁱ превращает функцию F(y) в u_i , а z-набор l₁^j, l₂^j, …, l_n^j - функцию L(z) в v_j. Отсюда вытекает, что каждый yz-набор из sⁱ ´ l^j не ортогональный набору aⁱb^j превращает конъюнкцию F(y) G(y, z) L(z) в конъюнкцию u_i Ù v_j.

С другой стороны, если yz-набор aⁱb^j не является мостиком между классами эквивалентности sⁱ и l^j, то конъюнкция u_i Ù v_j не участвует в разложении функции f(y, z) по переменным y и z.

Таким образом, число классов yz-эквивалентности для функции f(y, z), определяется числом мостиков, соединяющих классы y-эквивалентности для функции F(y) и z-эквивалентности для L(z). Чем больше таких мостиков, тем ближе мощность фактор-множества yz-эквивалентности к kh. Если число мостиков меньше, то число классов yz-эквивалентности также уменьшается. В соответствии с этим меняется энтропия Н^f_yz по сравнению с суммой Н^f_y + Н^f_z. Содержательно это значит, что увеличение числа мостиков увеличивает независимость переменных y и z, уменьшение – приводит к их сильной зависимости.

Рассмотрим конъюнкцию F(y) L(z). Ее аргументы y и z не зависимые, поэтому H^FL_yz = H^FL_y+ H^FL_z. Так как переменные z не встречаются в F(y), а переменные y – в L(z), то получаем равенства H^FL_y= H^F_yиH^FL_z= H^L_z. Отсюда H^FL_yz = H^F_y+ H^L_z.

В общем случае для функции F(y) G(y, z) L(z) не каждая пара (i, j) определяет класс эквивалентности с той же долей, что и для функции F(y) L(z), так как некоторые функции u_i Ù v_j не встречаются в разложении в силу того, что i-ый и j–ый классы не соединяются ни одним мостиком. Поэтому в общем случае энтропия H^f_yz не превосходит суммы H^f_y + H^f_z.

Теорема 19. Пусть функция f(y, z) = F(y) G(y, z) L(z) и число переменных yz равно m. Тогда H^f_yz £ m.

Доказательство. Энтропия H^f_yz максимальная, когда доли наборов, определяемых каждым классом yz-эквивалентности одинаковы. Пусть d есть число путей бинарной программы, определяемой функцией f(y, z), проходящих из истока в один узел yz-сечения. Тогда справедливо неравенство

где N есть число всех путей из истока в yz-сечение, и суммирование ведется по всем узлам yz-сечения.

Число узлов yz-сечения не более 2^m. Так как d есть число путей, проходящих из истока в один узел yz-сечения, то N £ d 2^m. Поэтому H^f_yz £ m.

Содержательно понятно, что если сечение функции содержит небольшое число переменных, то, означив эти переменные, мы получим небольшое сечение бинарной программы и энтропия, определяемая этими переменными, не велика.

Теорема 20. Пусть у функции f(y, z) число переменных z равно m. Тогда H_yz - H_y £ m.

Доказательство. Каждый узел у-сечения бинарной программы, определяемой функцией f(y, z), соединен путями не более, чем с 2^m различными узлами yz-сечении. В результате вся совокупность N_y(i) путей, проходящих через i-ый узел у-сечения разбивается на не более, чем 2^m не пересекающихся множеств путей, проходящих из истока в yz-сечение. Энтропия H^f_yz будет максимальна, когда все доли путей, проходящих из истока в yz-сечение, одинаковы. Поэтому для любого i-го узла у-сечения имеем N_y(i) £ 2^m N_yz(j), где N_yz(j) – это число путей, проходящих через j-ый узел yz-сечения. Но тогда N_y(i) / N_yz(j) £ 2^m. Отсюда следует утверждение теоремы.

Исследование логической энтропии приводит к вопросу можно ли из функций с небольшой энтропией построить функцию с большой энтропией? Чтобы на него ответить докажем следующие теоремы.

Теорема 21. Для логических функций f(x, y) и g(x, y) имеет место неравенство

Доказательство. Построим для функции f(x, y) g(x, y) бинарную программу . Узлы ее x-сечения, соответствующие не константным функциям, делятся на три типа, для которых выполняются условия соответственно: .

Рассмотрим бинарную программу для функции f(x, y), в которой порядок означивания переменных совпадает с порядком в . Узлы ее x-сечения, которые соответствуют не константным функциям, в программе разделяются на два типа, в соответствии с выполнением условий: . Поэтому, каждому узлу из x-сечения программы , для которого доля путей из истока составляет p_x(i) в x-сечении программы соответствуют два узла и в той части x-сечения, для которой выполняется условие .

Оставив в программе только пути, ведущие в эту часть x-сечения, получим подграф бинарной программы . Если обозначить для доли путей, ведущих в и , соответственно и , то получим равенство p_x(i) = + . Отсюда вытекает неравенство , где есть энтропия x-сечения в выделенной из части . Теперь сравним доли путей, ведущих в x-сечение, в графе и всей программы . В графе доли возрастают за счет исключения путей, ведущих в программе в узлы x-сечения, которые удовлетворяют условию . Но так как доли в графе возрастают по сравнению с долями аналогичных путей в , то энтропия меньше, чем энтропия . Отсюда следует неравенство .

Аналогично показывается, что имеют место неравенства , где есть энтропия x-сечения в части бинарной программы, которая включает пути ведущие в узлы x-сечения, выделяемые условиями . Следовательно, имеем неравенство .

Теорема 22. Для логических функций f(x, y) и g(x, y) имеет место неравенство

Доказательство. Построим для функции f(x, y) g(x, y) бинарную программу , в которой начальные отрезки всех путей из истока в сток получены означиванием переменных x, и программу , в которой порядок означивания переменных x совпадает с порядком в . Пусть пути, ведущие из истока в x-сечение программы (), образуют множество . Легко увидеть, что . Более того, все пути из , ведущие в один узел x-сечения, также ведут в один узел x-сечения программы . Назовем такие узлы соответствующими.

Отсюда следует, что число узлов x-сечения программы не более числа узлов x-сечения программы , а доли путей, ведущих в один узел x-сечения программы не меньше долей путей, ведущих в соответствующие узлы программы . Отсюда следует, что . Аналогично доказывается неравенство . Отсюда вытекает заключение теоремы.

Последние два утверждения согласуются с содержательными представлениями. Объединение множеств событий влечет, по меньшей мере, не уменьшение неопределенности наших знаний об этих событиях (или фактах). С другой стороны, пересечение множеств подразумевает уточнение некоторых свойств или значений и поэтому – уменьшение неопределенности. Доказать аналогичные соотношения для дополнения множеств относительно простыми средствами не удается.

6. Энтропия суперпозиции функций. В этом разделе исследуем поведение энтропии логических функций, представляющих двоичные вычислимые функции. В частности рассмотрим, как зависит энтропия суперпозиции функций от энтропий образующих ее функций. Приведем сейчас лишь общие результаты. Более конкретно этот вопрос будет исследован на примере переписывающих алгоритмов.

Пусть логические функции f(x, y) и g(y, z) представляют вычислимые функции соответственно y =(x) и z = (y). Суперпозиция z = ((x)) представима конъюнкцией h(x, z) = f(x, y) g(y, z).

Рассмотрим xy-сечение бинарной программы функции f при полном множестве N_x означиваний переменных x одинаковой длины. Пусть оно характеризуется энтропией Особенность построения бинарной программы состоит в том, что значения неподвижных переменных y однозначно определяются значениями аргумента x. Они не меняются при увеличении длины определяющего их x-набора. Каждый путь из истока в xy-сечение характеризуется некоторым x-набором и определяемым им набором значений неподвижных компонент y.

Рассмотрим xy-сечение бинарной программы функции h, для которого означивания переменных x и y совпадают с означиваниями из бинарной программы . Число узлов xy-сечения программы совпадает с числом узлов xy-сечения программы и доли путей, ведущих в соответствующие узлы этих программ, также совпадают.

Продолжим построение бинарной программы ниже i-го узла путем означивания переменных z. Так как g(y, z) представляет вычислимую функцию , неподвижные компоненты z однозначно определяются неподвижными компонентами y. Именно эти значения переменных z выберем в качестве z-наборов при продолжении построения программы . Если сравнить с бинарной программой для функции g(y, z), которая получается означиванием переменных y и z, как это сделано в , то имеет место следующее отношение включения.

Пусть в программе из истока в i-ый узел xy-сечения ведет некоторое множество путей. Каждый из них характеризуется единственным x-набором и единственным значением неподвижных компонент y. Поэтому в i-ый узел xy-сечения мы попадаем из истока по путям, характеризующимся как различными, так и совпадающими y-наборами потому, что разные начальные x-наборы могут определять одинаковые значения неподвижных компонент y. При дальнейшем построении программы ниже i-го узла означивания переменных z определяются неподвижными компонентами y, которые фиксируются функцией f(x, y). Поэтому число путей, ведущих из i-го узла xy-сечения в xyz-сечение, не превосходит числа различных y-наборов, которые встречаются в путях из истока в i-ый узел.

Часть программы , расположенная ниже i-го узла xy-сечения, представляет собой фрагмент программы , так как все пути программы из истока в xyz-сечение проходящие через i-ый узел xy-сечения характеризуются множеством пар <,> y- и z-наборов, совпадающими с метками части путей из истока в yz-сечение программы . Если же рассматривать все пути программы из истока в xyz-сечение, то они определяют все пары y- и z-означиваний, определяемые всеми путями программы .

Пусть M_x – некоторое множество начальных x-означиваний. Каждый x-набор определяет единственный начальный y-набор неподвижных компонент. Множество {(,)| M_x} разбивается функцией f на классы эквивалентности, пусть K₁, K₂, …, K_l. Выделим из произвольного класса K_i все первые компоненты пар, обозначим это множество Kⁱ_x и назовем x-проекцией класса K_i. Из того, что f представляет вычислимую функцию, вытекает, что |Kⁱ_x| = |K_i| и Kⁱ_x K^j_x = при i j. В этом случае говорим, что функция f разбивает множество M_x на классы K¹_x, K²_x, …, K^l_x и это разбиение порождает эквивалентность: тогда и только тогда, когда оба набора и принадлежат одному классу из семейства K¹_x, K²_x, …, K^l_x.

В точности так же можно выделить и y-проекцию Kⁱ_y класса K_i. Для нее выполняется неравенство |Kⁱ_y| | K_i |.

Пусть теперь M_x = N_x и мы имеем совокупность y-проекций K¹_y, K²_y, …, K^l_y. По каждому y-набору Kⁱ_yфункция g(y, z) определяет единственный z-набор значений неподвижных компонент. Множество {(, ): Kⁱ_y} таких пар функцией g(y, z) разбивается на классы эквивалентности. Таким образом, функция h разбивает множество {(,,)| N_x, - значения неподвижных компонент, определяемых по , и - значения неподвижных компонент, определяемых по } на классы. В свою очередь функция f(x, y) разбивает множество {(,)| N_x, - значения неподвижных компонент, определяемых по } на классы. И распределения этих разбиений могут существенно различаться. В силу этого отличаются энтропии H^f_xy и H^h_xyz. Более конкретно значение энтропии функции h зависит от вида функций f и g.

Из этих рассуждений вытекают следующие утверждения.

Лемма 23. Число различных путей из xy-сечения в xyz-сечение программы не превосходит числа путей из истока в xy-сечение.

Доказательство. Каждый путь из истока в xy-сечение определяет единственную y-проекцию, которая, в свою очередь, определяет единственное z-означивание. Следовательно, ниже всякого узла xy-сечения располагается не большее число путей, чем ведет в него из истока.

Следовательно, все пути из истока в xyz-сечение задаются путями из истока в xy-сечение.

Лемма 24. Число путей из i-го узла xy-сечения в j-ый xyz-сечения программы совпадает с числом путей из истока, проходящих через i-ый и j-ый узлы.

Доказательство. Пути из i-го узла xy-сечения в j-ый xyz-сечения представляют собой продолжение части путей из истока в i-ый узел. Но тогда путей из истока, проходящих через i-ый узел xy-сечения и j-ый xyz-сечения? будет столько же, сколько путей из i-го узла в j-ый.

Отсюда вытекает, что число путей программы , выходящих из i-го узла xy-сечения и ведущих в xyz-сечение, не больше числа путей из истока в i-ый узел xy-сечения.

Действительно, все пути ниже i-го узла xy-сечения определяются y-проекциями, которые формируются путями из истока в i-ый узел.

Пусть p_z(j | i) есть доля путей программы , ведущих из i-го узла xy-сечения в j-ый узел xyz-сечения среди всех путей из i-го узла в xyz-сечение. Тогда частной условной энтропией, определяемой этим xyz-сечением относительно i-го узла, называется величина Просто условной энтропией функции g относительно f назовем среднее частных условных энтропий .

Содержательно условная энтропия характеризует сложность функции , где Kⁱ_y есть y-проекция i-го класса K_i эквивалентности, определяемой функцией f(x, y). Энтропия описывает усредненную сложность функций , когда усредняющими коэффициентами выступают доли p_xy(i) путей бинарной программы из истока в xy-сечение.

(Энтропия конъюнкции логических функций, представляющей суперпозицию двух вычислимых функций, не превосходит суммы энтропий функции f и условной энтропии функции g относительно функции f).

=- =. . есть доля путей бинарной программы, проходящих одновременно через i-ый узел xy-сечения и j-ый узел xyz-сечения. Но тогда последняя сумма равна -.

Искомое неравенство переписывается следующим образом: -. Это неравенство выполняется в случае, когда

Лемма 26. Если {p_i} и {q_i}, i = 1, 2, …, k, два множества не отрицательных чисел и , то верно неравенство

Доказательство вытекает из неравенства между средними арифметическим и геометрическим , при условии q_i >0 и =1.

Лемма 27. Пусть h есть число узлов xyz-сечения, соединенных путями с i-м узлом xy-сечения. Тогда имеет место неравенство

Доказательство. Искомое неравенство эквивалентно следующему

Обозначим 1/h = p₁ = p₂ =…=p_h, p(i, 1) = q₁, p(i, 2) = q₂, …, p(i, h) = q_h. Очевидно, что . Тогда последнее неравенство переписывается так

Теорема 28. Пусть h_i есть число узлов xyz-сечения, в которые ведут пути из i-го узла xy-сечения. Тогда верно неравенство

Доказательство. Имеют место следующие равенства.

Таким образом, условная энтропия не превосходит среднего от логарифма мощности y-проекций классов эквивалентности, задаваемых функцией f при полном множестве N_x означиваний.

Исследуем, при каких условиях энтропия суперпозиции больше энтропии образующих их функций. Для этого введем следующее определение.

Функция g называется расширителем функции f, если выполняется неравенство , где x-означивания образуют полное множество N_x означиваний одинаковой длины, а y- и z-означивания определяются как при построении программы .

То, что g является расширителем для f, содержательно понимается следующим образом: функция устроена сложнее, чем функция . Вопрос нахождения расширителей имеет существенное значение, так как именно к нему сводится задача построения сложных вычислимых функций из простых.

Теорема 29. Пусть для всякой пары i-го узла xy-сечения и j-го узла xyz-сечения программы , соединенных хотя бы одним путем, выполняется соотношение

(Содержательно это обозначает, что доли путей, ведущих в i-ый узел xy-сечения, превосходит долю путей, ведущих в j-ый узел xyz-сечения. Следовательно, число путей, ведущих в i-ый узел больше числа путей, ведущих в j-ый узел.)

Имеет место равенство =1. Поэтому последнее неравенство эквивалентно

1. Брошкова Н.Л., Попов С.В. Логическая энтропия. Препринт ИПМ им. М.В.Келдыше РАН, 2005.

2. Брошкова Н.Л., Попов С.В. О проектировании информационных систем. Препринт ИПМ им. М.В.Келдыша РАН, 2005.

Т.25. Пусть и суть два начальных y-набора такие, что и определяет неподвижные z-компоненты и - компоненты . Тогда выполняется включение .

Доказательство. Набор определяет функцию |, значения которой характеризуются неподвижными двоичными компонентами , которые присутствуют в каждом ее значении, в том числе когда аргумент имеет значение, начинающееся с . Следовательно, неподвижные компоненты функции | включают неподвижные компоненты функции |.

Для дальнейшего нам требуется ввести обобщение понятия логической энтропии. Напомним, что при ее определении мы рассматривали так называемые бинарные программы, характеризующиеся линейным порядком означиваемых переменных. Говоря об y-сечении бинарной программы, где y = {y₁, y₂, …, y_m} есть множество логических переменных, мы имели в виду, что порождение путей бинарных программ происходит означивания этих переменных в соответствии с определенным порядком. Поэтому, если в метках дуг путей, ведущих в y-сечение, рассматривать только индексы переменных, то все пути из истока в y-сечение характеризуются одинаковыми последовательностями.

Значение логической энтропии зависит лишь от долей путей из истока в y-сечение и при построении бинарной программы выше y-сечения не учитывает собственно способа означивания переменных. Поэтому можно расширить определение логической энтропии, рассматривая не однородные программы, а программы с произвольным порядком означивания переменных в путях из истока в y-сечение программы, сохраняя требование, чтобы каждый путь из истока в y-сечение определял означивания всех переменных y. Легко проверить, что при таком обобщении логической энтропии все полученные выше результаты остаются верными.

Наконец, ослабим последнее требование относительно означивания всех переменных y, задаваемых каждым путем.

По-прежнему будем рассматривать бинарную программу и ее сечение назовем y-сечением, где y = {y₁, y₂, …, y_m} есть множество логических переменных, если имеется хотя бы один путь из истока в узел этого сечения, который определяет означивания всех переменных из y. Из определения бинарной программы вытекает справедливость следующего утверждения.

Лемма 23. Если i₁, i₂ суть узлы y-сечения и два пути, ведущие из истока в эти узлы определяют означивания соответственно и , где y_i₁, …, y_i_h, y_j₁, …, y_j_m переменные из y и h m, то при любом упорядочении первой последовательности путем перестановки ее членов она не может быть префиксом второй.

Доказательство вытекает из определения бинарной программы и того, что оба пути начинаются в истоке.

После этого определение логической энтропии формулируется, как и прежде.

Будем характеризовать каждый путь t, ведущий в y-сечение, множеством Var(t) переменных, для которых он определяет означивания. Каждый путь определяет свое множество означиваемых переменных и их означиваний. Но тогда y-сечение характеризуется парой <Max, Min> соответственно наибольшим и наименьшим множествами переменных, означивания которых приводит в y-сечение. Разность Max – Min назовем интервалом, порождаемым данным y-сечением бинарной программы. Очевидно, что пара <Max, Min> зависит от конкретного способа построения бинарной программы.

Инкрементом интервала = Max - Min (обозначается in()) назовем число всех означиваний переменных из интервала, которые принимают участие в построении y-сечения.

Рассмотрим классы так называемых локальных функций. А именно, локальной будем называть логическую функцию f(y, z), если все y-означивания порождают ограниченное число классов эквивалентности, определяемых лишь последними k компонентами этих означиваний.

Рассмотрим y-сечение бинарной программы для локальной функции.

Теорема 24. Пусть f(x, y) обобщенная функция и H_x– энтропия, определяемая переменными x , порядок означивания которых совпадает с естественным порядком переменные. Тогда определяющая окрестность для этих переменных имеет длину не менее H_x.

Свойства логической энтропии

( Properties of logic entropy
Preprint, Inst. Appl. Math., the Russian Academy of Science)

Брошкова Н.Л., Попов С.В.
(N.L.Broshkova, S.V.Popov)

ИПМ им. М.В.Келдыша РАН

Москва, 2005

Аннотация

Abstract

Свойства логической энтропии ( Properties of logic entropy Preprint, Inst. Appl. Math., the Russian Academy of Science)

Брошкова Н.Л., Попов С.В. (N.L.Broshkova, S.V.Popov) ИПМ им. М.В.Келдыша РАН

Москва, 2005

Аннотация

Abstract

Свойства логической энтропии

( Properties of logic entropy
Preprint, Inst. Appl. Math., the Russian Academy of Science)

Брошкова Н.Л., Попов С.В.
(N.L.Broshkova, S.V.Popov)

ИПМ им. М.В.Келдыша РАН