Разрезание торта согласно полезности: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[отпатрулированная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
м Удаление шаблонов: {{нп5}}×2
м checkwiki fixes (1, 2, 9, 17, 22, 26, 38, 48, 50, 52, 54, 64, 65, 66, 76, 81, 86, 88, 89, 101)
 
(не показано 19 промежуточных версий 18 участников)
Строка 1: Строка 1:
'''Разрезание торта согласно полезности''' (или '''разрезание торта по maxsum''') — это правило дележа неоднородных ресурсов, таких как торт или земельная недвижимость, между несколькими участниками с различными функциями [[Кардиналистская теория полезности|количественной полезности]] так, что ''сумма'' полезности для участников будет как можно больше. Такое разрезание было вдохновлено философией [[утилитаризм]]а. Разрезание торта согласно полезности часто бывает «несправедливым». Следовательно, утилитаризм конфликтует со [[Задача справедливого разрезания торта|справедливым разрезанием торта]].
'''Разрезание торта согласно полезности''' (или '''разрезание торта по maxsum''') — это правило дележа неоднородных [[ресурс]]ов, таких как [[торт]] или земельная [[недвижимость]], между несколькими участниками с различными функциями [[Кардиналистская теория полезности|количественной полезности]] так, что ''сумма'' полезности для участников будет как можно больше. Такое разрезание было вдохновлено философией [[утилитаризм]]а. Разрезание торта согласно полезности часто бывает «несправедливым». Следовательно, утилитаризм конфликтует со [[Задача справедливого разрезания торта|справедливым разрезанием торта]].


== Пример ==
== Пример ==
Представим торт, состоящий из двух частей — шоколадной и ванильной. Пусть имеется два участника — Алиса и Джордж со следующими оценками
Представим торт, состоящий из двух частей — шоколадной и ванильной. Пусть имеется два участника — Алиса и Джордж со следующими оценками


{| class="wikitable"
{| class="wikitable"
Строка 13: Строка 13:
|}
|}


Правило полезности отдаёт каждую часть участнику с наивысшей оценкой полезности. В данном случае правило полезности отдаст всю шоколадную часть Алисе, а всю ванильную — Джорджу. Значение maxsum будет равно 13.
Правило полезности отдаёт каждую часть участнику с наивысшей [http://www.rriai.org.ru/shkalyi-poleznosti-i-otsenka-poleznosti-3.html оценкой полезности]. В данном случае по правилу полезности вся шоколадная часть достанется Алисе, а всю ванильная — Джорджу. Значение maxsum будет равно 13.


Разрезание согласно полезности несправедливо — оно не [[Задача пропорционального разрезания торта|пропорционально]], поскольку Джордж получает менее половины полной оценки. Оно также не [[Завистливое разрезание торта|свободно от зависти]], поскольку Джордж завидует Алисе.
Разрезание согласно полезности несправедливо — оно не [[Задача пропорционального разрезания торта|пропорционально]], поскольку Джордж получает менее половины полной оценки. Оно также не [[Завистливое разрезание торта|свободно от зависти]], поскольку Джордж завидует Алисе.


== Обозначения ==
== Обозначения ==
Обозначим торт буквой <math>C</math>. Обычно предполагается, что это либо конечный одномерный отрезок, двумерный многоугольник, или конечное подмножество многомерного Евклидова пространства <math>\mathbb{R}^d</math>.
Обозначим торт буквой <math>C</math>. Обычно предполагается, что это либо конечный одномерный отрезок, двумерный [[многоугольник]], или конечное [[подмножество]] многомерного евклидова пространства <math>\mathbb{R}^d</math>.


Имеется <math>n</math> участников. Каждый участник <math>i</math> имеет личную функцию оценок <math>V_i</math>, которая отображает подмножества <math>C</math> («куски торта») в числа.
Имеется <math>n</math> участников. Каждый участник <math>i</math> имеет личную функцию оценок <math>V_i</math>, которая отображает подмножества <math>C</math> («куски торта») в числа.


<math>C</math> нужно разделить на <math>n</math> непересекающихся частей, по одному на участника. Часть, передаваемая участнику <math>i</math> обозначается как <math>X_i</math> и <math>C = X_1 \sqcup ... \sqcup X_n</math>.
<math>C</math> нужно разделить на <math>n</math> непересекающихся частей, по одному на участника. Часть, передаваемая участнику <math>i</math>, обозначается как <math>X_i</math> и <math>C = X_1 \sqcup ... \sqcup X_n</math>.


Разбиение <math>X</math> называется разбиением по ''полезности'', или ''максимально полезным'' (МП), или ''maxsum'', если оно максимизирует следующее выражение:
Разбиение <math>X</math> называется разбиением по ''полезности'', или ''максимально полезным'' (МП), или ''maxsum'', если оно максимизирует следующее выражение:


:<math>\sum_{i=1}^{n}{V_i(X_i)}</math>
: <math>\sum_{i=1}^{n}{V_i(X_i)}</math>


Концепция часто обобщается путём назначения различных весов каждому участнику. Разбиение <math>X</math> называется ''максимально взвешено полезным'' (МВП, {{lang-en|weighted-utilitarian-maximal}}, WUM), если оно максимизирует следующее выражение:
Концепция часто обобщается путём назначения различных весов каждому участнику. Разбиение <math>X</math> называется ''максимально взвешенно полезным'' (МВП, {{lang-en|weighted-utilitarian-maximal}}, WUM), если оно максимизирует следующее выражение:


:<math>\sum_{i=1}^{n}\frac{V_i(X_i)}{w_i}</math>
: <math>\sum_{i=1}^{n}\frac{V_i(X_i)}{w_i}</math>,


где <math>w_i</math> являются заданными положительными константами.
где <math>w_i</math> являются заданными положительными константами.


== Maxsum и эффективность по Парето ==
== Maxsum и эффективность по Парето ==
Любое МВП разбиение с положительными весами очевидно [[Эффективность по Парето|эффективно по Парето]]. Это потому, что если разбиение <math>Y</math> доминирует по Парето разбиение <math>X</math>, то взвешенная сумма полезностей в <math>Y</math> строго больше, чем в <math>X</math>, так что <math>X</math> не может быть МВП разбиением.
Любое МВП разбиение с положительными весами очевидно [[Эффективность по Парето|эффективно по Парето]]. Если разбиение <math>Y</math> доминирует по Парето разбиение <math>X</math>, то [[Весовая функция|взвешенная сумма]] полезностей в <math>Y</math> строго больше, чем в <math>X</math>, так что <math>X</math> не может быть МВП разбиением.


Что более удивительно, это то, что ''любое'' эффективное по Парето разбиения является МВП при некотором выборе весов{{sfn|Barbanel, Zwicker|1997|с=203}}{{r|WV}}.
Что более удивительно: ''любое'' эффективное по Парето разбиения является МВП при некотором выборе весов{{sfn|Barbanel, Zwicker|1997|с=203}}{{r|WV}}.


== Характерные признаки правила maxsum ==
== Характерные признаки правила maxsum ==
Христофер П. Чамберс предложил характерные признаки правила МВП{{sfn|Chambers|2005|с=236–258}}. Признаки основаны на следующем свойстве правила разбиения ''R'':
Христофер П. Чамберс предложил характерные признаки правила МВП{{sfn|Chambers|2005|с=236–258}}. Признаки основаны на следующем свойстве правила разбиения ''R'':
* '''Эффективность по Парето''' (ПЭ, {{lang-en|Pareto-efficiency}}, PE): правило ''R'' возвращает только разбиения, которые эффективны по Парето.
* '''Эффективность по Парето''' (ПЭ, {{lang-en|Pareto-efficiency}}, PE): правило ''R'' возвращает только разбиения, которые эффективны по Парето.
* '''Независимость от деления''' (НД, {{lang-en|Division independence}}, DI)''': если торт разделён на несколько кусков и каждый из них разрезан согласно правилу ''R'', результат будет тем же самым, как если бы исходный торт был разрезан по правилу ''R''.
* '''Независимость от деления''' (НД, {{lang-en|Division independence}}, DI)''': если торт разделён на несколько кусков и каждый из них разрезан согласно правилу ''R'', результат будет тем же самым, как если бы исходный торт был разрезан по правилу ''R''.
Строка 49: Строка 49:


Следующие факты доказаны для участников, которые назначают положительную полезность любому куску торта с положительным размером:
Следующие факты доказаны для участников, которые назначают положительную полезность любому куску торта с положительным размером:
* Если правило ''R'' обладает свойствами ПЭ, НД и ННС, то существует последовательность весов <math>w_1,\dots,w_n</math>, такое что все разбиения, рекомендованные правилом ''R'' являются МВП с этими весами (было показано, что любое ПЭ разбиение является МВП с ''некоторыми'' весами. Новым является то, что все разбиения, рекомендованные правилом ''R'' являются МВП с ''теми же'' весами. Это следует из НД свойствами).
* Если правило ''R'' обладает свойствами ПЭ, НД и ННС, то существует последовательность весов <math>w_1,\dots,w_n</math>, такая, что все разбиения, рекомендованные правилом ''R'', являются МВП с этими весами (было показано, что любое ПЭ разбиение является МВП с ''некоторыми'' весами. Новым является то, что все разбиения, рекомендованные правилом ''R'', являются МВП с ''теми же'' весами. Это следует из НД свойствами).
* Если правило ''R'' обладает свойствами ПЭ, НД, ННС и ПОР, то все разбиения, рекомендованные правилом ''R'' являются максимально полезными (другими словами, все дележи должны быть МВП и все агенты должны иметь равные веса. Это следует из свойства ПОР).
* Если правило ''R'' обладает свойствами ПЭ, НД, ННС и ПОР, то все разбиения, рекомендованные правилом ''R'', являются максимально полезными (другими словами, все дележи должны быть МВП и все агенты должны иметь равные веса. Это следует из свойства ПОР).
* Если правило ''R'' обладает свойствами ПЭ, НД, ННС и НШ, то правило ''R'' является диктаторским правилом — оно отдаёт весь торт одному участнику.
* Если правило ''R'' обладает свойствами ПЭ, НД, ННС и НШ, то правило ''R'' является диктаторским правилом — оно отдаёт весь торт одному участнику.
* Если правило ''R'' обладает свойствами ПЭ, НД, ННС и НП, то существует последовательность весов <math>w_1,\dots,w_n</math>, такая что правило ''R'' является МВП правилом с этими весами (то есть ''R'' рекомендует только МВП дележи с этими весами).
* Если правило ''R'' обладает свойствами ПЭ, НД, ННС и НП, то существует последовательность весов <math>w_1,\dots,w_n</math>, такая, что правило ''R'' является МВП правилом с этими весами (то есть ''R'' рекомендует только МВП дележи с этими весами).


== Нахождение maxsum разбиений ==
== Нахождение maxsum разбиений ==


=== Несвязные куски ===
=== Несвязные куски ===
Если функции оценок аддитивны, maxsum дележи всегда существуют. Интуитивно мы можем дать каждую часть торта участнику, который оценивает его максимально, как в [[#Пример|примере выше]]. Аналогично, МВП делёж может быть найден путём передачи каждой части торта партнёру, для которого значение отношения <math>V_i / w_i</math> самое большое.
Если функции оценок [[Аддитивность (математика)|аддитивны]], maxsum дележи всегда существуют. Интуитивно мы можем дать каждую часть торта участнику, который оценивает его максимально, как в [[#Пример|примере выше]]. Аналогично, МВП делёж может быть найден путём передачи каждой части торта партнёру, для которого значение отношения <math>V_i / w_i</math> самое большое.


Этот процесс легко осуществить, если торт ''кусочно-однороден'', то есть его можно разбить на конечное число кусков, для которых плотность функций значений для всех участников постоянна.
Этот процесс легко осуществить, если торт ''кусочно-однороден'', то есть его можно разбить на конечное число кусков, для которых плотность функций значений для всех участников постоянна.
Строка 63: Строка 63:
Если торт не является кусочно-однородным, алгоритм выше не работает, поскольку имеется бесконечное число различных «кусков» для рассмотрения.
Если торт не является кусочно-однородным, алгоритм выше не работает, поскольку имеется бесконечное число различных «кусков» для рассмотрения.


Хорошей новостью является то, что maxsum разбиение всё же существует. Это следствие [[Теоремы Дубинса — Спеньера|теоремы компактности Дубинса — Спеньера]] и это может быть доказано с помощью [[Множество Радона — Никодима|множества Радона — Никодима]].
В этом случае maxsum разбиение всё же существует. Это следствие [[Теоремы Дубинса — Спеньера|теоремы компактности Дубинса — Спеньера]] и это может быть доказано с помощью [[Множество Радона — Никодима|множества Радона — Никодима]].


Плохой новостью является то, что никакой конечный алгоритм не может найти maxsum разбиение. '''Доказательство'''{{sfn|Brams, Taylor|1996|с=48}}. Конечный алгоритм имеет данные о ценности конечного числа кусков. То есть имеется только конечное число подмножеств торта, для которых алгоритм знает оценки участников. Предположим, что алгоритм остановился после получения данных о <math>k</math> подмножеств. Теперь возможен случай, что все участники ответили, что они имеют ''те же самые'' оценки кусков. В этом случае наибольшее возможное значение полезности, которое может быть достигнуто алгоритмом, равно 1. Однако возможно, что глубоко внутри одного из <math>k</math> кусков имеется подмножество, которое два участника оценивают по-разному. В этом случае существует [[суперпропроциональный делёж]], в котором каждый участник получает значение, большее <math>1/n</math>, так что сумма полезностей строго больше 1. Следовательно, деление, возвращаемое конечным алгоритмом не будет maxsum.
Однако никакой конечный алгоритм не может найти maxsum разбиение. '''Доказательство'''{{sfn|Brams, Taylor|1996|с=48}}. Конечный [[алгоритм]] имеет данные о ценности конечного числа кусков. То есть имеется только конечное число подмножеств торта, для которых алгоритм знает оценки участников. Предположим, что алгоритм остановился после получения данных о <math>k</math> подмножеств. Теперь возможен случай, когда все участники ответили, что они имеют ''те же самые'' оценки кусков. В этом случае наибольшее возможное значение полезности, которое может быть достигнуто алгоритмом, равно 1. Однако возможно, что глубоко внутри одного из <math>k</math> кусков имеется подмножество, которое два участника оценивают по-разному. В этом случае существует [[суперпропорциональный делёж]], в котором каждый участник получает значение, большее <math>1/n</math>, так что сумма полезностей строго больше 1. Следовательно, деление, возвращаемое конечным алгоритмом, не будет maxsum.


=== Связные куски ===
=== Связные куски ===
Если торт одномерен и куски должны быть связными, простой алгоритм назначения каждого наиболее ценного куска агенту больше не работает даже если куски кусочно-постоянны. В этом случае задача нахождения МП дележа [[NP-трудная задача|NP-трудна]], и более того, никакой схемы [[Приближённая схема полиномиального времени|FPTAS]] невозможно, если только не P=NP.
Если торт одномерен и куски должны быть связными, простой алгоритм назначения каждого наиболее ценного куска агенту больше не работает, даже если куски кусочно-постоянны. В этом случае задача нахождения МП дележа [[NP-трудная задача|NP-трудна]], и более того, никакой схемы [[Приближённая схема полиномиального времени|FPTAS]] невозможно, если только не P=NP.


Существует 8-кратный аппроксимационный алгоритм и {{не переведено 5|Параметризованная сложность|фиксированно-параметрически разрешимый||fixed-parameter tractable}} алгоритм, который экспоненциален от числа игроков{{sfn|Aumann, Dombb, Hassidim|2013}}.
Существует 8-кратный аппроксимационный алгоритм и {{не переведено 5|Параметризованная сложность|фиксированно-параметрически разрешимый||fixed-parameter tractable}} алгоритм, который экспоненциален от числа игроков{{sfn|Aumann, Dombb, Hassidim|2013}}.
Строка 77: Строка 77:
Делёж maxsum не всегда справедлив, см. [[#Пример|пример выше]]. Аналогично, справедливый делёж не всегда maxsum.
Делёж maxsum не всегда справедлив, см. [[#Пример|пример выше]]. Аналогично, справедливый делёж не всегда maxsum.


Одним из подходов разрешения конфликта является ограничение «цены справедливости» — вычисляем верхнюю и нижнюю границы уменьшения суммы полезности, чтобы получить справедливое разбиение. Для деталей см. статью «[[Цена справедливости]]».
Одним из подходов разрешения конфликта является ограничение «цены справедливости» — вычисляем верхнюю и нижнюю границы уменьшения суммы полезности, чтобы получить справедливое разбиение. Для деталей см. статью «[[Цена справедливости]]».


Другим подходом комбинации эффективности и справедливости является поиск среди всех возможных справедливых дележей дележа с максимальной суммой полезности:
Другим подходом комбинации эффективности и справедливости является поиск среди всех возможных справедливых дележей дележа с максимальной суммой полезности:
Строка 84: Строка 84:
Следующие алгоритмы можно использовать для поиска [[Завистливое разрезание торта|свободного от зависти разрезания]] с максимальной суммарной полезностью для торта в виде одномерного интервала, если каждый участник может получить разрозненные (несвязные) куски торта и функции оценок аддитивны{{sfn|Cohler, Lai, Parkes, Procaccia|2011}}:
Следующие алгоритмы можно использовать для поиска [[Завистливое разрезание торта|свободного от зависти разрезания]] с максимальной суммарной полезностью для торта в виде одномерного интервала, если каждый участник может получить разрозненные (несвязные) куски торта и функции оценок аддитивны{{sfn|Cohler, Lai, Parkes, Procaccia|2011}}:


# Для <math>n</math> участников с ''кусочно-постоянными'' оценками: делим торт на ''m'' полностью константных областей (). Решаем задачу [[Линейное программирование|линейного программирования]] с ''nm'' переменными — каждая пара (агент,область) имеет переменную, которая определяет долю области, передаваемую агенту. Для каждой области имеется ограничение, утверждающее, что сумма всех частей области равна 1. Для каждой пары (агент,агент) имеется ограничение, утверждающее, что первый агент не завидует второму агенту. Заметим, что разбиение торта, получаемое такой процедурой, может оказаться крайне мелким.
# Для <math>n</math> участников с ''кусочно-постоянными'' оценками: делим торт на ''m'' полностью константных областей (). Решаем задачу [[Линейное программирование|линейного программирования]] с ''nm'' переменными — каждая пара (агент, область) имеет переменную, которая определяет долю области, передаваемую агенту. Для каждой области имеется ограничение, утверждающее, что сумма всех частей области равна 1. Для каждой пары (агент, агент) имеется ограничение, утверждающее, что первый агент не завидует второму агенту. Заметим, что разбиение торта, получаемое такой процедурой, может оказаться крайне мелким.
# Для <math>2</math> участников с ''кусочно-линейными'' оценками: для каждой точки торта вычисляем отношение между полезностями: <math>r=u_1/u_2</math>. Отдаём участнику 1 точки с <math>r\geqslant r^*</math>, а участнику 2 точки с <math>r<r^*</math>, где <math>r^*</math> является порогом, вычисленным так, что делёж будет свободным от зависти. В общем случае <math>r^*</math> не может быть вычислен, поскольку может быть иррациональным, но на практике, когда оценки кусочно-линейны, <math>r^*</math> можно аппроксимировать аппроксимационным алгоритмом «иррационального поиска». Для любого <math>\epsilon > 0</math> алгоритм находит распределение, которое является <math>\epsilon</math>-СЗ (значение для каждого агента не меньше значения для любого другого агента ''минус'' <math>\epsilon</math>) и сумма достигает как минимум максимальной суммы СЗ распределений. Время работы алгоритма полиномиально зависит от входных данных и от <math>\log(1/\epsilon)</math>.
# Для <math>2</math> участников с ''кусочно-линейными'' оценками: для каждой точки торта вычисляем отношение между полезностями: <math>r=u_1/u_2</math>. Отдаём участнику 1 точки с <math>r\geqslant r^*</math>, а участнику 2 точки с <math>r<r^*</math>, где <math>r^*</math> является порогом, вычисленным так, что делёж будет свободным от зависти. В общем случае <math>r^*</math> не может быть вычислен, поскольку может быть [[Иррациональное число|иррациональным]], но на практике, когда оценки кусочно-линейны, <math>r^*</math> можно аппроксимировать аппроксимационным алгоритмом «иррационального поиска». Для любого <math>\epsilon > 0</math> алгоритм находит распределение, которое является <math>\epsilon</math>-СЗ (значение для каждого агента не меньше значения для любого другого агента ''минус'' <math>\epsilon</math>) и сумма достигает как минимум максимальной суммы СЗ распределений. Время работы алгоритма полиномиально зависит от входных данных и от <math>\log(1/\epsilon)</math>.
# Для <math>n</math> участников с оценками общего вида: аддитивная аппроксимация для получения свободного от зависти и эффективного распределения, основываясь на алгоритме кусочно-линейной оценки.
# Для <math>n</math> участников с оценками общего вида: аддитивная аппроксимация для получения свободного от зависти и эффективного распределения, основываясь на алгоритме кусочно-линейной оценки.


=== Свойства maxsum-справедливых распределений ===
=== Свойства maxsum-справедливых распределений ===
В статье Брамса с соавторами{{sfn|Brams, Feldman и др.|2012|с=1285–1291}} изучаются как свободный от зависти (СЗ,{{lang-en|envy-free}}, EF), так и [[беспристрастный делёж|беспристрастный]] (БД, {{lang-en|equitable}}, EQ) дележи торта и устанавливается связь их с maxsum и оптимальными по Парето (ОП, {{lang-en|Pareto-optimality}}, PO) дележам. Как было объяснено выше, maxsum распределения всегда ОП. Однако, когда maxsum ограничено условием справедливости, это не обязательно верно. Они доказали следующее
В статье Брамса с соавторами{{sfn|Brams, Feldman и др.|2012|с=1285–1291}} изучаются как свободный от зависти (СЗ, {{lang-en|envy-free}}, EF), так и [[беспристрастный делёж|беспристрастный]] (БД, {{lang-en|equitable}}, EQ) дележи торта, и устанавливается их связь с maxsum и оптимальными по Парето (ОП, {{lang-en|Pareto-optimality}}, PO) дележами. Как было объяснено выше, maxsum распределения всегда ОП. Однако, когда maxsum ограничено условием справедливости, это не обязательно верно. Брамс с соавторами доказали следующее


* Когда имеется два агента, СЗ максимальное, БД максимальное и СЗ-БД максимальное распределение всегда будут ОП.
* Когда имеется два агента, СЗ максимальное, БД максимальное и СЗ-БД максимальное распределение всегда будут ОП.
* Когда имеется три и более агентов с ''кусочно-однородными'' оценками, СЗ максимальные распределения всегда ОП (поскольку СЗ эквивалентно [[Задача пропорционального разрезания торта|пропорциональности]], что сохраняется при улучшениях по Парето). Однако может ''не быть'' БД максимального и БД-СЗ максимального распределений, которые были бы ОП.
* Когда имеется три и более агентов с ''кусочно-однородными'' оценками, СЗ максимальные распределения всегда ОП (поскольку СЗ эквивалентно [[Задача пропорционального разрезания торта|пропорциональности]], что сохраняется при улучшениях по Парето). Однако может ''не быть'' БД максимального и БД-СЗ максимального распределений, которые были бы ОП.
* Если имеется три или более агентов с ''кусочно-константными'' функциями оценок (то есть имеющими кусочно-константные плотности), может не быть СЗ максимального распределения, являющегося ОП. Например, рассмотрим торт с тремя областями и тремя агентами со значениями: '''Алиса''': 51/101, 50/101, 0 '''Боб''': 50/101, 51/101, 0 '''Карл''': 51/111, 10/111, 50/111. Правило maxsum даёт область i агенту i, но такой делёж не без зависти, поскольку Карл завидует Алисе. Используя линейное программирование можно найти единственное СЗ максимальное распределение и показать, что оно должно дать паи в регионе 1 и регионе 2 и Алисе и Бобу. Однако такое распределение не может быть ОП, поскольку Алиса и Боб могли бы выиграть от обмена паёв в этих регионах.
* Если имеется три или более агентов с ''кусочно-константными'' функциями оценок (то есть имеющими кусочно-константные плотности), может не быть СЗ максимального распределения, являющегося ОП. Например, рассмотрим торт с тремя областями и тремя агентами со значениями: '''Алиса''': 51/101, 50/101, 0 '''Боб''': 50/101, 51/101, 0 '''Карл''': 51/111, 10/111, 50/111. Правило maxsum даёт область i агенту i, но такой делёж не без зависти, поскольку Карл завидует Алисе. Используя линейное программирование, можно найти единственное СЗ максимальное распределение и показать, что оно должно дать паи в регионе 1 и регионе 2 и Алисе и Бобу. Однако такое распределение не может быть ОП, поскольку Алиса и Боб могли бы выиграть от обмена паёв в этих регионах.
* Если все агенты имеют ''кусочно-линейные'' функции оценок, сумма полезностей СЗ максимального распределения не меньше полезностей БД максимального распределения. Этот результат расширяется до общих оценок для аддитивных аппроксимаций (то есть, <math>\epsilon</math>-СЗ распределения имеют сумму полезностей не меньшую полезностей БД распределений минус <math>\epsilon</math>).<br />
* Если все агенты имеют ''кусочно-линейные'' функции оценок, сумма полезностей СЗ максимального распределения не меньше полезностей БД максимального распределения. Этот результат расширяется до общих оценок для аддитивных [[Аппроксимация|аппроксимаций]] (то есть <math>\epsilon</math>-СЗ распределения имеют сумму полезностей, не меньшую полезностей БД распределений минус <math>\epsilon</math>).


== См. также ==
== См. также ==
* {{не переведено 5|Подсчёт удовольствия|||Felicific calculus}} — попытка определить полезности с помощью математических формул.
* {{не переведено 5|Подсчёт удовольствия|||Felicific calculus}} — попытка определить полезности с помощью математических формул.
* [[Эффективное разрезание торта]]
* [[Эффективное разрезание торта]]
* [[Задача справедливого разрезания торта]]
* [[Задача справедливого разрезания торта]]
* [[Теорема Веллера]]
* [[Теорема Веллера]]
* {{не переведено 5|Эффективное по Парето свободное от зависти распределение|||Pareto-efficient envy-free division}}
* [[Эффективное по Парето распределение без зависти]]
* {{не переведено 5|Максимальное по рангам распределение|||Rank-maximal allocation}}
* [[Максимальное по рангу распределение]]


== Примечания ==
== Примечания ==
{{примечания|2|refs=
{{примечания|refs=
<ref name=WV>See also [[Теорема Веллера]]. О похожих результатах, связанных с задачей неоднородного распределения ресурса, см. {{не переведено 5|Эффективное по Парето свободное от зависти распределение|Теоремы Вариана||Pareto-efficient envy-free division}}.</ref>}}
<ref name=WV>See also [[Теорема Веллера]]. О похожих результатах, связанных с задачей неоднородного распределения ресурса, см. [[Эффективное по Парето распределение без зависти|теоремы Вариана]].</ref>}}


== Литература ==
== Литература ==
Строка 163: Строка 163:
}}
}}
{{refend}}
{{refend}}

{{rq|checktranslate|style}}


[[Категория:Утилитаризм]]
[[Категория:Утилитаризм]]
[[Категория:Справедливый делёж]]
[[Категория:Справедливый делёж]]
{{rq|checktranslate|style|grammar}}

Текущая версия от 06:10, 15 сентября 2024

Разрезание торта согласно полезности (или разрезание торта по maxsum) — это правило дележа неоднородных ресурсов, таких как торт или земельная недвижимость, между несколькими участниками с различными функциями количественной полезности так, что сумма полезности для участников будет как можно больше. Такое разрезание было вдохновлено философией утилитаризма. Разрезание торта согласно полезности часто бывает «несправедливым». Следовательно, утилитаризм конфликтует со справедливым разрезанием торта.

Представим торт, состоящий из двух частей — шоколадной и ванильной. Пусть имеется два участника — Алиса и Джордж со следующими оценками

Участник Шоколад Ваниль
Алиса 9 1
Джордж 6 4

Правило полезности отдаёт каждую часть участнику с наивысшей оценкой полезности. В данном случае по правилу полезности вся шоколадная часть достанется Алисе, а всю ванильная — Джорджу. Значение maxsum будет равно 13.

Разрезание согласно полезности несправедливо — оно не пропорционально, поскольку Джордж получает менее половины полной оценки. Оно также не свободно от зависти, поскольку Джордж завидует Алисе.

Обозначения

[править | править код]

Обозначим торт буквой . Обычно предполагается, что это либо конечный одномерный отрезок, двумерный многоугольник, или конечное подмножество многомерного евклидова пространства .

Имеется участников. Каждый участник имеет личную функцию оценок , которая отображает подмножества («куски торта») в числа.

нужно разделить на непересекающихся частей, по одному на участника. Часть, передаваемая участнику , обозначается как и .

Разбиение называется разбиением по полезности, или максимально полезным (МП), или maxsum, если оно максимизирует следующее выражение:

Концепция часто обобщается путём назначения различных весов каждому участнику. Разбиение называется максимально взвешенно полезным (МВП, англ. weighted-utilitarian-maximal, WUM), если оно максимизирует следующее выражение:

,

где являются заданными положительными константами.

Maxsum и эффективность по Парето

[править | править код]

Любое МВП разбиение с положительными весами очевидно эффективно по Парето. Если разбиение доминирует по Парето разбиение , то взвешенная сумма полезностей в строго больше, чем в , так что не может быть МВП разбиением.

Что более удивительно: любое эффективное по Парето разбиения является МВП при некотором выборе весов[1][2].

Характерные признаки правила maxsum

[править | править код]

Христофер П. Чамберс предложил характерные признаки правила МВП[3]. Признаки основаны на следующем свойстве правила разбиения R:

  • Эффективность по Парето (ПЭ, англ. Pareto-efficiency, PE): правило R возвращает только разбиения, которые эффективны по Парето.
  • Независимость от деления (НД, англ. Division independence, DI): если торт разделён на несколько кусков и каждый из них разрезан согласно правилу R, результат будет тем же самым, как если бы исходный торт был разрезан по правилу R.
  • Независимость недостижимой страны (ННС, англ. Independence of infeasible land, IIL): когда подторт разделён согласно правилу R, результат не зависит от пользы участников в других подтортах.
  • Положительная обработка равных (ПОР, англ. Positive treatment of equals, PTE): если все участники имеют одинаковые функции полезности, правило R рекомендует по меньшей мере одно разбиение, которое даёт положительную полезность каждому участнику.
  • Независимость от масштаба (НШ, англ. Scale-invariance, SI): когда функции оценки участников умножаются на постоянную величину (для разных участников допустимы различные константы), рекомендации, задаваемые правилом R, не меняются.
  • Непрерывность (НП, рунди Continuity, CO): для фиксированного куска торта множество схем полезности, которые отображают в специфичное распределение, является замкнутым множеством по поточечной сходимости.

Следующие факты доказаны для участников, которые назначают положительную полезность любому куску торта с положительным размером:

  • Если правило R обладает свойствами ПЭ, НД и ННС, то существует последовательность весов , такая, что все разбиения, рекомендованные правилом R, являются МВП с этими весами (было показано, что любое ПЭ разбиение является МВП с некоторыми весами. Новым является то, что все разбиения, рекомендованные правилом R, являются МВП с теми же весами. Это следует из НД свойствами).
  • Если правило R обладает свойствами ПЭ, НД, ННС и ПОР, то все разбиения, рекомендованные правилом R, являются максимально полезными (другими словами, все дележи должны быть МВП и все агенты должны иметь равные веса. Это следует из свойства ПОР).
  • Если правило R обладает свойствами ПЭ, НД, ННС и НШ, то правило R является диктаторским правилом — оно отдаёт весь торт одному участнику.
  • Если правило R обладает свойствами ПЭ, НД, ННС и НП, то существует последовательность весов , такая, что правило R является МВП правилом с этими весами (то есть R рекомендует только МВП дележи с этими весами).

Нахождение maxsum разбиений

[править | править код]

Несвязные куски

[править | править код]

Если функции оценок аддитивны, maxsum дележи всегда существуют. Интуитивно мы можем дать каждую часть торта участнику, который оценивает его максимально, как в примере выше. Аналогично, МВП делёж может быть найден путём передачи каждой части торта партнёру, для которого значение отношения самое большое.

Этот процесс легко осуществить, если торт кусочно-однороден, то есть его можно разбить на конечное число кусков, для которых плотность функций значений для всех участников постоянна.

Если торт не является кусочно-однородным, алгоритм выше не работает, поскольку имеется бесконечное число различных «кусков» для рассмотрения.

В этом случае maxsum разбиение всё же существует. Это следствие теоремы компактности Дубинса — Спеньера и это может быть доказано с помощью множества Радона — Никодима.

Однако никакой конечный алгоритм не может найти maxsum разбиение. Доказательство[4]. Конечный алгоритм имеет данные о ценности конечного числа кусков. То есть имеется только конечное число подмножеств торта, для которых алгоритм знает оценки участников. Предположим, что алгоритм остановился после получения данных о подмножеств. Теперь возможен случай, когда все участники ответили, что они имеют те же самые оценки кусков. В этом случае наибольшее возможное значение полезности, которое может быть достигнуто алгоритмом, равно 1. Однако возможно, что глубоко внутри одного из кусков имеется подмножество, которое два участника оценивают по-разному. В этом случае существует суперпропорциональный делёж, в котором каждый участник получает значение, большее , так что сумма полезностей строго больше 1. Следовательно, деление, возвращаемое конечным алгоритмом, не будет maxsum.

Связные куски

[править | править код]

Если торт одномерен и куски должны быть связными, простой алгоритм назначения каждого наиболее ценного куска агенту больше не работает, даже если куски кусочно-постоянны. В этом случае задача нахождения МП дележа NP-трудна, и более того, никакой схемы FPTAS невозможно, если только не P=NP.

Существует 8-кратный аппроксимационный алгоритм и фиксированно-параметрически разрешимый[англ.] алгоритм, который экспоненциален от числа игроков[5].

Для любого множества положительных весов существует МВП разбиение и оно может быть найдено аналогичным образом.

Maxsum и справедливость

[править | править код]

Делёж maxsum не всегда справедлив, см. пример выше. Аналогично, справедливый делёж не всегда maxsum.

Одним из подходов разрешения конфликта является ограничение «цены справедливости» — вычисляем верхнюю и нижнюю границы уменьшения суммы полезности, чтобы получить справедливое разбиение. Для деталей см. статью «Цена справедливости».

Другим подходом комбинации эффективности и справедливости является поиск среди всех возможных справедливых дележей дележа с максимальной суммой полезности:

Нахождение справедливых maxsum распределений

[править | править код]

Следующие алгоритмы можно использовать для поиска свободного от зависти разрезания с максимальной суммарной полезностью для торта в виде одномерного интервала, если каждый участник может получить разрозненные (несвязные) куски торта и функции оценок аддитивны[6]:

  1. Для участников с кусочно-постоянными оценками: делим торт на m полностью константных областей (). Решаем задачу линейного программирования с nm переменными — каждая пара (агент, область) имеет переменную, которая определяет долю области, передаваемую агенту. Для каждой области имеется ограничение, утверждающее, что сумма всех частей области равна 1. Для каждой пары (агент, агент) имеется ограничение, утверждающее, что первый агент не завидует второму агенту. Заметим, что разбиение торта, получаемое такой процедурой, может оказаться крайне мелким.
  2. Для участников с кусочно-линейными оценками: для каждой точки торта вычисляем отношение между полезностями: . Отдаём участнику 1 точки с , а участнику 2 точки с , где является порогом, вычисленным так, что делёж будет свободным от зависти. В общем случае не может быть вычислен, поскольку может быть иррациональным, но на практике, когда оценки кусочно-линейны, можно аппроксимировать аппроксимационным алгоритмом «иррационального поиска». Для любого алгоритм находит распределение, которое является -СЗ (значение для каждого агента не меньше значения для любого другого агента минус ) и сумма достигает как минимум максимальной суммы СЗ распределений. Время работы алгоритма полиномиально зависит от входных данных и от .
  3. Для участников с оценками общего вида: аддитивная аппроксимация для получения свободного от зависти и эффективного распределения, основываясь на алгоритме кусочно-линейной оценки.

Свойства maxsum-справедливых распределений

[править | править код]

В статье Брамса с соавторами[7] изучаются как свободный от зависти (СЗ, англ. envy-free, EF), так и беспристрастный (БД, англ. equitable, EQ) дележи торта, и устанавливается их связь с maxsum и оптимальными по Парето (ОП, англ. Pareto-optimality, PO) дележами. Как было объяснено выше, maxsum распределения всегда ОП. Однако, когда maxsum ограничено условием справедливости, это не обязательно верно. Брамс с соавторами доказали следующее

  • Когда имеется два агента, СЗ максимальное, БД максимальное и СЗ-БД максимальное распределение всегда будут ОП.
  • Когда имеется три и более агентов с кусочно-однородными оценками, СЗ максимальные распределения всегда ОП (поскольку СЗ эквивалентно пропорциональности, что сохраняется при улучшениях по Парето). Однако может не быть БД максимального и БД-СЗ максимального распределений, которые были бы ОП.
  • Если имеется три или более агентов с кусочно-константными функциями оценок (то есть имеющими кусочно-константные плотности), может не быть СЗ максимального распределения, являющегося ОП. Например, рассмотрим торт с тремя областями и тремя агентами со значениями: Алиса: 51/101, 50/101, 0 Боб: 50/101, 51/101, 0 Карл: 51/111, 10/111, 50/111. Правило maxsum даёт область i агенту i, но такой делёж не без зависти, поскольку Карл завидует Алисе. Используя линейное программирование, можно найти единственное СЗ максимальное распределение и показать, что оно должно дать паи в регионе 1 и регионе 2 и Алисе и Бобу. Однако такое распределение не может быть ОП, поскольку Алиса и Боб могли бы выиграть от обмена паёв в этих регионах.
  • Если все агенты имеют кусочно-линейные функции оценок, сумма полезностей СЗ максимального распределения не меньше полезностей БД максимального распределения. Этот результат расширяется до общих оценок для аддитивных аппроксимаций (то есть -СЗ распределения имеют сумму полезностей, не меньшую полезностей БД распределений минус ).

Примечания

[править | править код]
  1. Barbanel, Zwicker, 1997, с. 203.
  2. See also Теорема Веллера. О похожих результатах, связанных с задачей неоднородного распределения ресурса, см. теоремы Вариана.
  3. Chambers, 2005, с. 236–258.
  4. Brams, Taylor, 1996, с. 48.
  5. Aumann, Dombb, Hassidim, 2013.
  6. Cohler, Lai, Parkes, Procaccia, 2011.
  7. Brams, Feldman и др., 2012, с. 1285–1291.

Литература

[править | править код]
  • Julius B. Barbanel, William S. Zwicker. Two applications of a theorem of Dvoretsky, Wald, and Wolfovitz to cake division // Theory and Decision. — 1997. — Т. 43, вып. 2. — doi:10.1023/a:1004966624893.
  • Christopher P. Chambers. Allocation rules for land division // Journal of Economic Theory. — 2005. — Т. 121, вып. 2. — doi:10.1016/j.jet.2004.04.008.
  • Steven J. Brams, Alan D. Taylor. Fair Division; From cake-cutting to dispute resolution. — 1996. — ISBN 978-0521556446.
  • Yonatan Aumann, Yair Dombb, Avinatan Hassidim. Computing Socially-Efficient Cake Divisions // AAMAS. — 2013.
  • Yuga Julian Cohler, John Kwang Lai, David C. Parkes, Ariel Procaccia. Optimal Envy-Free Cake Cutting // AAAI. — 2011.
  • Steven J. Brams, Michal Feldman, John K. Lai, Jamie Morgenstern, Ariel D. Procaccia. On Maxsum Fair Cake Divisions // Proceedings of the 26th AAAI Conference on Artificial Intelligence (AAAI-12). — 2012.